整理 | 刘冰一
在6月2日举办的智源大会青源学术年会举办的一个圆桌“青年科研人员成长之路与经验分享”上,清华大学计算机系副教授刘知远、中国人民大学高瓴人工智能学院长聘副教授赵鑫、北京大学计算机系研究员施柏鑫分别分享了自己的研究故事,并基于自己的经验,讨论了选择做研究的契机、如何确定方向、研究方法论、如何定研究方向、如何做创新等话题,为众AI学子指路。本次圆桌由清华大学智能产业研究院研究员兰艳艳主持。
AI科技评论整理了讨论内容,希望对各位有志于AI学术研究的年轻学子有所启发。
印象深刻的事
兰艳艳:先以一个故事分享开场,请各位老师分享一个在自己整个科研经历当中最难忘的一件事,比如进步很大、写出得意之作或遭遇重大挫折等等,不局限于一点。请刘知远老师先分享。
图注:刘知远
刘知远:给我印象特别深刻的一件事是,刚读研究生那会儿,我写了第一篇关于语言网络的文章,准备投到中文信息学报。当时我的导师孙茂松老师平时特别忙,但没办法论文还是要改的,于是我就在孙老师上课的课间请他帮我改论文,最后他真的就利用课间和课下这些时间帮我改了这篇论文。
我做了老师以后深有体会,老师会越来越忙。可能刚入职的时候没有那么多事,有较多时间和学生交流,随着承担工作的量越来越多,跟学生的交流时间会被压缩。所以我觉得,做一个合格的研究生,比较关键的一点是跟老师配合好。
不是说哪位老师是不是热心肠、会不会主动关心学生。从老师的角度,他之所以在那么多职业里面选择了做老师,自然是对教育事业和学生有情怀和爱心的。在座的听众中,以及在线的也有非常多学生,与其抱怨或者嫌弃你的导师太忙了、不管自己,倒不如抓住一切机会去积极联络导师,堵他的门,盯着他,让他帮你指导方向、改论文。
我经常跟我的学生说,你要主动来占据我的时间。你把我的时间占了,我分给其他事情的时间就少了。所以很多时候,主动非常关键,这是我读博时感受颇深的一件事情。
兰艳艳:深有同感,希望同学多主动,不要害羞。
施柏鑫:我在北大读硕士的时候写了我的第一篇CVPR论文。对我来说当时是第一次接触一个全新的课题,从对概念尚不清楚到最后做出来历时4个月,当时这篇论文拿到了Oral论文,运气非常好,这期间离不开导师对我的指导和帮助。
临近截稿,我在实验和写作处于“一地鸡毛”的状态,当时提前一个月开始拍摄真实数据,由于经验不足,遇到了各种各样的问题,跟我之前理论上推算的结果总是有差异,经过了无数的夜晚不停调试实验设备才完成。因此,(尤其是计算摄像这类需要)做真实数据实验的项目,需要合理的规划,留足提前量。
另外就是,如果是第一次写文章,一定要和老师多沟通。老师和学生看问题角度不一样,负责任的老师可能会给你“兜底”,把论文会改的“面目全非”,但可以保证不因为一些常识性的写作问题导致文章被easy reject(被秒拒)。
所以,我负责“兜底”的第一篇学生的论文发表的时候,我感觉比第一次中自己中论文还要开心。在这个过程中也经历了刘老师说的“主动沟通”的问题,学生不仅要主动,还要给老师预留充足的时间,尤其是随着ddl临近老师越来越忙的时候。
兰艳艳:谢谢施老师。我说一点不同的,我不希望所有的学生都让老师兜底,因为老师兜底很辛苦,我希望你们都独立完成文章,这样才能有更好的成长。
图注:赵鑫
赵鑫:前段时间在知乎刷到一些抱怨读研、读博压力特别大的帖子,我属于读博还算顺利的,当然也有一年时间我非常焦虑。
当时我的情况是,研一还在学习中,基础一般:没有写论文经验,没有认真学习机器学习和相关数学知识,实验做得不多......所以回过头来看,研一没有发出来论文也比较正常。
我想说的是,博士的心理压力往往是自己暗示的。为了做好科研,很多环节都是可以按照流程认真进行学习和提升。例如,学好机器学习基础、练习写作、尝试投稿。如果按照标准的学习方式来读博士,正常情况下是容易慢慢出成果的,除非自己放弃了,所以不用过于焦虑。很多时候细节决定成败,把每件小事都做好了,最后一定能读好博士的。
兰艳艳:非常感谢三位老师的分享,都是肺腑之言,太真实了。接下来把时间留给线上线下的同学,大家有什么问题可以尽情的提问。
Q&A环节
提问 1:老师们在什么时候发现自己有搞科研的天赋,或者觉得自己可以把科研作为自己的职业呢?另一方面,老师们在职业生涯的过程中有没有想放弃科研的时刻?
赵鑫:我觉得这是知乎上另外一个话题:“要读博士还是要读硕士?”其实我当时没有别的选项,想去清北只能直博。发觉自己可能喜欢科研的情节是,大四的时候我在图书馆看了一些关于机器学习的英文书,当时很少有人去借英文书,而我觉得特别有意思,经常去看。通过阅读,感觉自己很喜欢安静下来读书、推公式以及思考。于是,我慢慢意识到自己可能还是适合做涉及思考、逻辑推理的科研问题。能否沉下心来做事情可能是博士需要的一个重要特征。
施柏鑫:我希望学生要想清楚自己是否感兴趣,博士培养的过程中一定是对研究感兴趣才能坚持下去的。我也不记得自己什么时候想清楚对科研感兴趣,但是我很确定上学时候我感觉我对解决工程问题不感兴趣,相反觉得看论文则很有趣,希望去思考一些常规问题是否有其他的空白需要填补,或者更巧妙的方法。
刘知远:我在推研的时候被很多老师拒过:我去找网络方向的导师,跟他的博士生说自己特别喜欢这个方向,那位博士生问我是否清楚他们在做什么,我一时语塞,就这样被拒了。后来我又找了另外一个招生物信息学方向的导师,我坦诚自己不太擅长记公式和术语,他说这个是基本功就把我给拒了。后来阴差阳错到了孙茂松老师这里,开始做自然语言处理研究。
做研究的过程,我感受到很多同辈的压力。同龄同学比我优秀很多,比如当时赵鑫发了ECIR ,引用就超级高。
我一直怀疑自己适不适合做这个方向。非常幸运的是,我被孙老师派到谷歌学习,知道公司的工作情况大概是什么样子。当时谷歌在IT届还是比较理想的工作环境,但我觉得在大公司里面工作,有非常强的“个人是螺丝钉”的感觉。个人只能在团队里面负责一个特别具体细微的事情,越是完备的企业越呈现这样的特点。如此一来,去企业界跟做研究、发论文相比,我觉得后者成就感更大一些。
另外,我觉得自己的选择其实都是在回归初心。小的时候我特别想做老师,用自己的经验帮助后辈成长得更顺利,很有成就感。所以我博士毕业时,很坚定地想去做博士后,看看有没有做教职的可能性,没有考虑去企业界的想法。
当然,我也不觉得任何一个方向存在高低之分,更多的还是看哪个更适合自己,哪个更能激发自己的热情和潜力。一路走过来,我觉得我一定不是同龄人里面或选择这个方向的人里面最优秀的,但是我觉得我能做我喜欢做的事情,至少能够做到把我最好的一面发挥出来,这让我觉得很开心。所以我觉得对于这个问题,就是看哪个方向更适合自己。
提问2:各位老师是如何确定自己方向的?一个优秀的人工智能博士应该是怎么样的?
刘知远:我研究生期间花了很长时间才确定研究方向。最开始是有一次孙老师刚从香港访问回来,他说碰到一个挺有意思的新名词“复杂网络”,如果我感兴趣不妨调查一下。我真的去看了一下,发现统计物理方向搞复杂网络的特别多,于是在我读研究生的前两年就在做语言复杂网络特性——比如小世界网络、scale-free等。
我在这期间参加了一些复杂网络的学术会议,也有做报告,但是现场没什么反应。大家可能觉得在语言网络上重新验证这些复杂网络的统计特性并没什么新意,不认为提供了什么新的东西。
我是做自然语言处理的,当然希望这些发现也能应用到自然语言处理。而复杂网络的统计特性对于实际用处没有那么明显,所以后面我反思怎么做一些符合自然语言处理实用取向的选题。
但我当时也不太清楚该做什么,还在到处找选题。机缘巧合,那几年孙老师带领国内一批学者探讨自然语言处理的新路径,我就参与了这个过程,听老师们讨论关于深度学习有可能是未来发展的方向的判断,觉得这件事情应该很有价值,所以2013年之后就在这个方向开展工作。
从我自己的选题过程来看,其实这是一个慢慢成熟,慢慢了解发展态势的过程。一开始对研究领域没有全面的了解,对于一个各方面没有太多经验的博士生来说很正常。但是我觉得最重要的是要开始探索和行动,只有探索才有反思,只有反思才能不断地更新知识。一开始选择哪个题目没有那么重要,而选了题目后能接受别人的建议不断地调整方向,这个可能是比较重要的。
施柏鑫:我同意刘老师的观点,采取行动比较重要。当时,我的老板给学生的自主空间很大。我去日本读博之前给他写了很长的邮件表明我的研究计划,他的回复是希望我能做自己感兴趣的事情。首先确定一个自己感兴趣、不排斥的方向;其次是行动起来,当然也需要跟老师保持交流,做出一个雏形,再根据一些模型问题做具体的调整。
关于第二个问题,不仅仅是AI研究,怎么样的博士生才是合格的呢?正如网上流传广泛的那张图,一个圈最后突出来的点就是博士为推动科研边界拓展所做的贡献。博士毕业,意味着你在自己从事的这个小方向上的理解应该比导师还细致。
赵鑫:前面两位老师已经说得很好了,我补充一点:博士生一定要把眼界放开。我最初是做主题模型,深度学习刚出来的时候我非常抵触,因为自己所擅长的技术要面临“淘汰”。中间经历了三四年的心理挣扎,后来发现这是时代的技术潮流,需要深入其中再次学习。所以,博士生一定要开放眼界,不要给自己设限。如果你发现已经不喜欢现在的选题,或者觉得它不能给你带来新的研究冲动,已经不打算再去投入,你就要考虑找一些真正感兴趣且有意义的方向。
兰艳艳:在这个问题上我挺有感触的,我也分享一下。
第一,我特别同意赵鑫刚才说到的趋势问题,这个“势”是科技发展的大势。我希望大家打开眼界去看看整个世界的发展,包括经济的发展,会跟你选择的方向产生非常大的关系。举一个实际的例子,我是学数学的,本科大三的时候我们选专业——决定读纯理论数学、应用数学,还是统计学。我当时其实蛮挣扎的,因为对我来讲每门课程差不多,纠结之后选择了统计学,为什么选择统计学?就是基于自己天然的认知,以及和老师的交流,觉得在未来数据会特别重要,这就是一个势。当你看到这个势的时候就可以坚定地做出选择。这个选择对我个人的影响非常大,正是因为我选择了这个方向,后来才会做一系列的机器学习的工作。
第二,我不建议选择热门的方向,一方面它会特别卷,另一方面一个东西很热门的时候,其实它已经处在比较“顶”的状态。你应该去想,你能给这个世界带来什么额外的东西?举一个我自己的例子,我硕二在中科院的数学所实习,我的导师马院士是一个非常Open的人,他鼓励我们大胆选择各种各样的专业。我跟马院士说自己对机器学习很感兴趣,马老师特别支持。当时学数学的学生接触机器学习非常少,这个领域在那个时候也比较冷门,但是到了今天,很多学统计学的都在做机器学习。
看到“势”,选择一个自己感兴趣且有前景的方向,再加上你坚持执著地做下去,我觉得一定会做出一个很好的结果。
提问3:一个很多青年学者困惑的问题:面对诸如“学生擅长、老师不一定感兴趣的课题;或学生感兴趣却并不擅长的课题”,作为青年教师,如何给组里的学生找合适的课题?三位老师有什么办法?
刘知远:可以结合刚才艳艳说的回答这个问题。第一,的确不要做热门话题。对于热门话题的一个基本判断原则是,如果你的课题要跟10个以上的基线比就不要做了,你前面的人该试的肯定都试过了,你要比他们都强,这太难了。此时我比较倾向于自己定义一个新的问题,说不定会更好。还有就是,你需要预测这个课题两三年后能有什么重要突破,有前景就可以做。
第二,具体到实验室。我的解决方案是在实验室长期访问的学生里选择我潜在的博士生、研究生,实际上我期望学生大二结束就来实验室,这样我们至少有一年双向选择的时间。如果你真正决定来我们实验室读博,首先要认可实验室正在开展的研究方向;同时,老师也认可同学的未来潜力,基于此,刚才所说的这些问题就不存在了。
我个人觉得现在存在很多错配:老师不太了解学生,学生对实验室也不是特别的了解。其实在确定课题时,会存在错配的问题。为了减少这种情况,我倾向于选择组里有过经验接触的同学。
施柏鑫:不能说有什么见解,因为我自己也是青年老师,还是说一下自己浅显的看法。其实要看自己的学术发展阶段,阶段不同应对策略不同。我读博士生时期,学生的竞争没有现在那么卷,没有那么多AI顶会,研一、研二没有文章很正常。我现在实验室,进组较早的同学大四之前有一篇文章是比较正常的。所以我会采用一个分阶段的策略,先建立成就感,有一个比较愉快的开始,允许学生做一个自己认为出东西比较快的方向。当对问题有一些深入研究时,实验数据、baseline代码都有,此时就需要挑战自己,提高论文的质量而不是数量。
就北大的环境而言,我们并没有明确规定学生要发多少文章才能毕业,还是要探索真正感兴趣的学术问题。但毕竟答辩的时候没有文章是“不好看”的,所以存在心态和阶段状态的问题,前期适当做一些短平快的研究,达到“温饱”,后面要踏踏实实深入工作,奔向“小康”。
赵鑫:对于青年教师来说,比较关键的是要把整个组的发展方向定下来,这要看个人品味和研究喜好。对学生来说,要逐步学会判断某项工作是不是有意义的。博士生对于科研判断力的培养非常关键。一旦研究方向确定了之后,要能够坚持自己的想法,明确自己研究方向的意义,坚定信念,找到自己持续发力的点。
兰艳艳:有好几位同学都在问,写论文如何找创新点。其实这个问题应该是你在做工作前就要想到:创新点是什么,用什么方法,能给领域提供什么。不要等到写论文时才开始想,这样下来多半不会有特别高的质量。另有一个问题,我觉得现场的老师可以快速给大家解答一下:在一个方向上怎么找到好的想法和创新点。
赵鑫:读博士期间,我比较喜欢看真实的数据。其实看大量的真实数据就能找到一些实际生活中有价值的问题,并且进一步升级成学术问题可供研究。现在有同学找问题喜欢拍脑袋想,或者完全凭借看论文想,因此容易碰到模型不工作的情况,其实最好的解决方案往往是根据实际情况发现的。
施柏鑫:以我在北大的计算摄像学本科生课程为例。我在期中的时候会布置一篇难度不小的作业,基本要求是让大家用CVPR的模版,用英文和latex写一篇8页正文的小论文,要求有20篇以上的参考文献,有5篇是精读的,如果想要拿到加分项,还要做很多细致的补充和整理工作,提出自己的见解,对于大二、大三的本科生,在这个过程中任务量是非常大的。这个作业一来劝退一部分不是真正对这门课感兴趣的同学。二来希望同学们通过大量的阅读比较,来发现问题,进而在期末时候尝试解决问题,培养一个初步的对科研探索(想idea、实验到写作)的过程。
刘知远:我也觉得创新是有套路的,一些特别大的创新当然没有套路,但是稍微小一点的创新是有章可循的。博士生的第一、二篇文章可以模仿。
总结而言,就是要厚积薄发。比如说跟我同龄的博士生相比,我的优点可能是读的论文比较多,不止NLP方向的,我也会把别的方向的文献过一遍,至少能知道别人研究到了什么程度。这是一种类比,我觉得类比是人类非常重要的智能体现,创新也是一种类比。很多创新可以从历史的论文里面找到规律和线索。我个人最大的建议是:如果你没有想法就去读论文,我不相信读了半年论文一点想法都没有。