以一作拿下顶会大奖!他读博期间单篇论文引用超2500次
2022/8/22 18:07:52 科学网

     文 | 《中国科学报》 记者 赵广立

     一项国际学术顶会,自开办近30年来,中国企业从未获得过“最佳论文奖”(谷歌、亚马逊等海外科技公司曾拿过)。最近,这个尴尬被打破了。

     8月18日,全球数据科学领域顶级会议KDD2022大奖公布,阿里巴巴达摩院团队获应用科学方向“最佳论文奖”,这是中国企业首次获得该重磅奖项。

     “KDD年会”始于1995年,由国际计算机学会知识发现与数据挖掘专委会(ACM SIGKDD)发起,是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,同时也是全球论文接收率最低的计算机顶会之一。2022年,KDD会议共收到2448篇投稿,最终收录449篇,接收率不到1/5。

     获奖论文的第一作者王桢,2017年博士毕业于中山大学数据科学与计算机学院,现任阿里巴巴达摩院智能计算实验室算法专家。读博期间,他曾以一作身份发表知识图谱补全算法TransH,单篇论文引用量已超2500次。

    

     登台领奖的阿里巴巴达摩院团队(左三至右二分别为团队成员王桢、李雅亮、丁博麟)

     “想帮到更多人”的研究,获大奖认可

     “非常兴奋,但我觉得也比较水到渠成。”

     谈及论文获奖,论文通讯作者、阿里巴巴达摩院智能计算实验室高级算法专家李雅亮对记者表示,王桢多年在图学习方向上深耕,“总会有一些奖项承认的”。

     《中国科学报》了解到,获奖论文《FederatedScopeGNN:迈向统一、全面和高效的联邦图学习库》来源于今年5月阿里巴巴达摩院发布的新型联邦学习框架“FederatedScope”开源项目的一部分,它致力于大幅降低相关技术的开发部署难度。

     这是一项“想真正帮助到更多人”的研究。尽管代码能力一流,但王桢并非只关心技术,他还有着很强的社会责任感。“我觉得联邦图学习符合大家对技术要求的潮流,并且真的能满足社会对这项技术的需要。这可能是我们做出来的工作能够得到大奖认可最大的原因。”

     联邦学习是隐私保护计算主流技术之一。王桢介绍说,联邦学习通过用户数据不离开本地的方式完成全局模型训练,能实现“数据不动模型动”,具有广阔应用前景。但是,现有联邦学习框架越来越难以满足复杂多样的计算需要。

     比如,现有框架更多关注视觉和自然语言领域,对图(graph)的支持相对有限。而图在表征复杂关系方面,具有很大优势。

     王桢举例说,现在比较热门的AI forScience就是一个很典型的场景:“不同的研究机构可能在研究不同的分子,或研究分子不同方面的性质。通过联邦图学习可以将不同机构的知识和数据间接地汇聚起来,大家能够合作训练一个模型。”

     在药物研发、银行反洗钱等场景下,存在同样的诉求。

    

    论文截图,基于事件驱动的底层框架来实现联邦图学习算法示例

     “我们主要就是针对当前的联邦学习框架和算法库对图数据的支持还比较欠缺和薄弱,设计和开源了这样一个专门支持联邦图学习的联邦平台。”王桢告诉记者,Federated Scope框架提供了丰富的联邦数据集、开箱即用的GNN模型以及最新的联邦图算法。

     李雅亮补充说:“在这个节点上,这些工作对后续整个领域的发展奠定了很坚实的基础。”

     博士期间引用超2500的论文,“是奠基作之一”

     在采访中,同事们提到王桢,都绕不开他曾在博士期间就发表了单篇引用量超过2500次的论文。

     在中山大学读博期间,王桢参与了微软亚洲研究院联合培养项目。期间,他以一作身份发表知识图谱补全算法TransH,单篇引用量超2500次。

     “我在学生时期还引用过他的这篇文章,可以认为这篇文章是知识图谱的嵌入表示的奠基性作品之一。”王桢在达摩院的同事谢悦湘告诉记者:“超过2500次引用就已经说明了问题,这是一篇非常顶级的文章,是一个细分领域内的里程碑。”

     谢悦湘解释说,如果一篇文章前一两年被很多人引用,后面慢慢没人引了,说明这篇文章可能过时了;但如果一篇文章的引用量不断在增长,说明这个工作的意义一直在,一直有人去跟踪、再创新。TransH 就是这样的,“这是一个非常了不起的事情。”

     不过,他也表示,这并不是说王桢那篇论文不会过时:“现在肯定有很多超越他的工作,但现在来看他当时的突破,就是‘黑白电视’那种感觉,很多人受他启发做了很多创新。”

     无论如何,谢悦湘都认为这是一篇有地位的论文:“不管是对比的研究,还是作为后来者研究的基础,这篇文章不断地被涉及,这就说明它在业界是一个有地位的工作。”

     尤为难得的是,这篇单引超 2500 的论文还是王桢博士期间的成果。在王桢另一位同事、也是KDD最佳论文作者之一的姚柳佚看来,这是普通人难以实现的成就:“非常硬气”“普通博士根本达不到”。

     让记者惊讶的是,王桢非常低调。除了同事们对他这一成就的夸赞,在网络上竟很难看到算法TransH与王桢这个名字的联系。

    

     王桢在阿里西溪园区

     同事眼中的王桢:低调、务实、勤奋、纯粹

     王桢的同事对此并不觉得意外。他们眼中的王桢,低调、务实、勤奋、纯粹。

     姚柳佚告诉记者,王桢平时关注很多小方向(topic),而且他不是那种浅尝辄止的关注,而是在每个topic上都愿意花费大量时间去了解。

     “王桢知识储备很多,而且很耐心、非常靠谱,解答别人提出来的疑问游刃有余。”姚柳佚说:“跟他讨论问题,你能明显感觉出来,他是非常钻研这个问题的,能感受到他对于钻研的热爱。”

     据她观察,王桢经常能够从不同的角度去解读论文,而且他能找出一些论文的不足之处,“就很小的一个点,他都能找到”。

     王桢由于“topic很多”,所以他会跟不同的团队或个人合作。如此一来,许多论文都要从他手中“过一下”,同时他也需要花费很多时间去修改论文。但是,同事们从未见他拖延手中的工作:“我们一块写论文,然后说什么时候改完他就肯定给你改完。”

     有时候,同事们也会看到王桢有段时间“真的非常非常累”:“在实验室旁边有一张行军床,他会在那躺着休息一会儿。”

     “我跟王桢合作非常久了,他是一个非常负责任的人。”谢悦湘说,王桢知识面广,但又不是泛泛而谈;热爱深入钻研,能在了解的多个领域都作出一定贡献,“这很难”。

     据了解,毕业加入阿里巴巴后,王桢在阿里云做过工程师,曾作为主要开发者参与PAI平台强化学习组件研发,并开源为EasyRL项目;同期他还参与了伯克利大学Ray RLLib项目共建,被社区认可为项目committer。这两项都是强化学习领域的优秀工作。

    

    王桢(左一)和同事与伯克利Ray RLLib开源团队合影谢悦湘觉得,王桢有着与他年龄不相符的求知欲。“十几岁的孩子有求知欲我觉得很正常,人过而立、在工作以后遇到各色的压力下,还能保持着这份好奇心,愿意花很多时间把它搞清楚,并且不断地思考‘我们能做什么’,这其实是做研究非常重要的一个品质。”

     同事们眼里,王桢就是这样一个自我驱动、以工作为中心的一个人,就好像他的生活当中就是搞研究、搞工作。但王桢不是那种“文痴”,他其实很有感染力。

     比如,一个项目或任务,大家各司其职的基础上,王桢能从技术整体上进行考虑,勇于不断地和每个人去讨论,碰撞出更好的研究思路,进而从不同角度去建言献策、推进研究的深度,让项目成果不是“几个部分的拼凑”、而是具有1+1>2的成效。

     “他比较好玩的一点是,比如他要问我们问题时,他喜欢说‘请教你一个问题’,就很谦虚。”姚柳佚告诉记者。

     “很低调,对吧?”

     “对,他从来不讲自己以前做过什么、取得过什么成就,他是个很低调的人。”姚柳佚说。

     王桢:搞研究就是我的兴趣

     作为获奖论文的第一作者和通讯作者,王桢和李雅亮接受了记者的采访。采访中,王桢大方分享了自己的一些心得。

     他觉得,自己的学习和研究算不上顺利,但他觉得能取得一些成就,跟两方面因素不无关系:一个是注重基础,另一个是着眼长远,且要有恒心去坚持。

     “在坚持的过程中,不总是处处都能顺利,很多时候需要对小方向做一些调整,个人要积极地适应。”王桢说。

     作为主管,李雅亮“爆料”:王桢的数学基础和工程能力非常好,而且本人“常学习”,把研究当成兴趣,因此也“坚持得很好”。

     “互联网公司的人喜欢自嘲 996,很辛苦。但我了解到高校院所一些在科研岗位上的老师,每天的工作是超过12小时的。”王桢觉得,无论在哪个领域,要想走在前面、拓展人类认知的边界,“都要付出特别多”。

     李雅亮开玩笑般地总结:“如果有人坚持做的事情正好是兴趣驱动,就会变得相对容易一些。”

     尽管已博士毕业多年,李雅亮和王桢以及团队的一些“大佬”在达摩院仍保留着定期研读专业书的习惯。他们觉得,读书是一个更能让知识系统化、引起深入思考的过程。

     “论文的点或许比较新,但很多只是重复的发现而已,那些重要的思想,都蕴含在书里面。”李雅亮和王桢说。

     采访的最后,记者问及王桢认为自己在研究中最重要的特质是什么。王桢坦言,“我觉得我是一个相对比较有好奇心、比较较真的人。”

     “这个对科研有一定好处。有好奇心,对新的话题、方向能保持敏感;喜欢较真,就会刨根问底,喜欢搞清楚不仅how,还有why。”王桢说。

     编辑 | 方圆

     排版 | 郭刚

    

    

     合作事宜:hezuo@stimes.cn

     投稿事宜:tougao@stimes.cn

    

     喜欢本文?点赞 + 在看 支持一下!

    

    

    

    源网页  http://weixin.100md.com
返回 科学网 返回首页 返回百拇医药