年纪最小90后,他们在北大教AI

黄善清 AI科技评论 今天


作者 | 黄善清

编辑 | 陈彩娴

董豪与北大的结缘,可以追溯到 2018 年的夏天。
当时正忙着在北京写博士论文的董豪,受到在北大访问的朋友邀请,前往北大游玩顺带一聚。原本只是一场朋友间的日常聚会,却在阴差阳错下通过朋友了解到北大信息科学技术学院-前沿计算研究中心正在招人,且欢迎像他这种即将毕业的博士生。
当时正在英国帝国理工学院跟随郭毅可院士读博的董豪,将在隔年秋季毕业,脑海正好也在思考就业的事情,于是他毫不犹豫递交了申请,且很快收到了中心的面试邀请。
前沿计算研究中心看中了董豪过往在开源方面的活跃背景——由董豪开源的深度学习开发库 TensorLayer 曾获得 ACM Multimedia 2017 颁发的最佳开源软件奖,以及在生成模型方面的研究成果;董豪也对前沿计算研究中心“培养新一代的计算机领域人才”的定位(图灵班)很是感兴趣。一拍即合下,董豪在 2019 年 9 月正式加入北大信息科学技术学院-前沿计算研究中心,成为其中一名新体制研究员。
与董豪一样选择“主动出击”的还有施柏鑫。
施柏鑫是北大校友,他曾在 2007 年至 2010 年间师从北大信息科学技术学院智能科学系的许超教授,完成硕士学位,后又前往日本东京大学留学。
2015 年 ,正在美国麻省理工学院媒体实验室从事博士后研究的施柏鑫,无意间发现到北大信息科学技术学院计算机系数字媒体研究所的一份招聘广告,广告明确提出有意招聘计算摄像学方向的老师——这与施柏鑫从事的专业研究不谋而合。
结合相机研究的计算摄像学在计算机视觉领域属于小众研究,因此数字媒体研究所的招聘广告给他留下深刻的印象,不久他便投递简历,与数字媒体研究所的老师取得了联系。
由于当时在新加坡的工作尚未结束,施柏鑫入职北大之前先到与北大建立有联合研究所的新加坡南洋理工大学继续下一阶段的博士后研究;后来在日本国立产业技术综合研究所-人工智能研究中心当研究员的期间,也和北大和南洋理工大学一起联合培养学生。
在这期间,施柏鑫在学术上颇有建树,不但成功夺得 2015 年国际计算摄像会议(ICCP)的Best Paper Runner-Up奖,还在 2016 年发布了 DiLiGenT 光度立体数据集——是目前业界唯一一套光度立体实拍 benchmark 数据集,之后几乎所有从事光度立体方向的研究人员,都使用过这份数据集。
经过一系列紧密的合作关系后,施柏鑫在 2017 年 11 月份正式入职北大数字媒体研究所,成为一名新体制研究员,同时获评 “北京大学博雅青年学者”——这是北大为进一步加大对优秀学术人才的支持和激励而建立的“博雅人才体系”中的一种称号。
跟董豪、施柏鑫主动投递简历不同的是,许辰人是被“爬虫”主动找上门来的。
2010 年,北大信息科学技术学院新成立高能效计算与应用中心,其目标是研发与高能效(兼顾高性能和低能耗)计算相关的新型和关键技术及其应用。2013 年底,为了更高效地找到当时中心所需要的物联网无线网络领域的年轻老师,中心写了一个爬虫软件,对全世界相关领域的年轻博士进行搜罗,最终筛选出那些曾以第一作者身份在顶会发表至少 3 篇论文的人选。
就这样,活跃于 ACM SenSys、ACM UbiComp 等顶会的许辰人便收到这封来自高能效计算与应用中心的邀请邮件。
当时刚从美国罗格斯大学毕业的许辰人正忙着寻找美国的工作机会,而这封邮件让他第一次开始动了回国的念头。
回国面试的过程非常顺利,因为负责面试许辰人的都是中心相关领域的资深兼职教授,对于候选人在这个领域的学术做得如何都知根究底。就在此时,许辰人提出了暂缓入职的要求:他希望先到卡耐基梅隆大学计算机系先做一年博士后,拓宽研究方向和视野并积累更多学术界人脉后再入职北大。
没想到这项要求被高能效计算与应用中心的老师们欣然应允了。
在完成一年卡耐基梅隆大学的博士后研究后,许辰人在 2015 年 8 月正式入职北大高能效计算与应用中心,顺利成为其中一名新体制助理教授。
就这样,在主动或被动接触的情况下,这批青年才俊在燕园开启了自己全新阶段的学术生涯。

1

北大式Tenure Track

“不清楚。”
当被问及北大对自己的考核标准时,三位老师的回答都惊人的一致。
三位受访者当中,最早“投奔”北大的许辰人,坦言这是北大“新体制”给予青年教师的支持。
北大所谓“新体制”,追随的是国外大学推行已久的  tenure track,6 年聘任期内,只要教师本身实力过硬,便不会遭到学校的无故解聘。因此,教师可以自由开展自身感兴趣的科研工作,一旦在这期间做出高水平的研究成果,通过同行评审后,便有机会获得终身教职。
北大是在 2005 年前后开始推行 “新体制”,算是国内最早践行 tenure track 的高校之一。综合受访者的回答,我们将北大“新体制”特点总结如下:
  • 没有明确的考核指标,只要求每年上满 96 学时/ 6 个学分/两门课;

  • 入职后直接授予博导资格;

  • 在教学/科研方向上不受限制;

  • 薪酬条件可以抵消很大程度的经济压力。

刚入职满一年的董豪坦言,当时被北大教职吸引的原因之一,便是“北大的制度跟国外较相近,且自由度较大。”

图注:董豪拍摄的北大静园五院一角。这里也是前沿计算研究中心的所在地,他认为在喧闹城市中能有一个传统中式院子供自己工作,这种机会非常难得。
“科学研究是在探索未知,很难给出确定的规划,比如指定今年一定要发表多少篇论文。新体制的存在,让人相信到北大来当老师能有空间去追求更为挑战的研究课题。”入职北大近三年时间的施柏鑫也很是认可这套制度。
入职北大已满五年时间的许辰人认为“新体制”能让一名年轻教师敢于“坐冷板凳”。
“对我们这些年轻老师来说,具备这些条件最大的好处是可以安心做自己感兴趣的研究,而未必要因为论文数量指标去跟风追热点。对高校而言,这种学术产出的价值和意义也是最大的。”

2

对北大学子的第一印象
北大向来重视本科教育,除了需要带领研究生做出更好的研究成果之外,青年老师还需要在教学上通过这批在全国数一数二的本科生源的验收。
北大学生的思想比较活跃,对老师的教学质量要求也高。许辰人对于北大学子有深刻的认知。
刚到北大上课时,施柏鑫曾经担心过自己安排的课程或任务会不会对本科生来说过于有难度,当时有一名经验丰富的北大老师提点他,北大的学生经得起挑战,身为老师不必限制自己对于学生能力的想象力。
施柏鑫后来在北大独立开设《计算摄像学:成像模型理论与深度学习实践》并参与《算法分析与设计(研讨型小班)》两门课程的教学,在《计算摄像学:成像模型理论与深度学习实践》这门课中,其中一项作业的要求是按照 CVPR 顶会格式(8页双栏)写一份融入自己思想的英文论文综述。
“选我这门课的同学大部分是本科大二、大三的同学,不管你之前有没有用tex写过英文报告,都是统一这么要求的。”施柏鑫坦言如果不是在北大,2 学分的选选修课配这样的工作量,恐怕会“劝退”大部分选课的学生。

图注:施柏鑫以《计算摄像学:成像模型理论与深度学习实践》一课参加北京大学青年教师教学基本功比赛,获得理工组一等奖。
刚开始施柏鑫还考虑过“手下留情”,他想过要是出现没法进行英文写作的同学,可以允许他们通过中文输出4页的报告内容,然后他再给8页英文写作的同学额外加分。结果两年多的实践表明,多数同学都获得了额外加分,他后来也就取消了加分选项,将英文8页报告作为统一要求。
“如果用更高的标准去要求,相信他们也能完成。”施柏鑫总结道。

图注:某匿名学生对《计算摄像学:成像模型理论与深度学习实践》一课的评价,源自“课程测评分享@PKU”。
同样不“惯着”北大学生的还有许辰人,他默认北大生源既然经过高考选拔,必然具备较高的自学能力,因此他按照做科研的学习强度去要求自己的学生。
许辰人在北大主讲《计算机网络(实验班)》——所谓“实验班”,即是鼓励任课老师在教学上做出变革的实验性课程,其中没有考试等硬性规定是其标志。
许辰人结合慕课的方式,让学生在课前提前将课本上的知识掌握好,课上他不会照本宣科,而是着重从历史脉络和前沿动态的角度帮学生建立学科的宏观认知。“我希望能从高屋建瓴的角度去给学生补充课本上没有的知识,这种方式能够让他们对课程产生更大的兴趣。”许辰人解释道。
此外,许辰人也鼓励学生通过读论文、编程实践去掌握知识,而已完成的项目实践,许辰人要求他们通过严谨的科研写作去表达自己的思考。
“我会要求他们写一些具备 critical thinking 的报告或海报,包括喜欢或不喜欢什么。”
许辰人甚至鼓励他们课后直接给原作者发邮件提问。

图注:某匿名学生对《计算机网络(实验班)》一课的评价,源自“课程测评分享@PKU”。
董豪面向北大“图灵班”开设《生成模型》与《计算概论》两门偏应用性质的课程,大部分时间里,他会鼓励学生通过手动编程去实践项目。
由于“图灵班”鼓励学生跟随指定导师从事科研工作,董豪今年带着班里的几名本科生接连发表了两篇论文,都与生成模型相关。
在教学过程中,他还遇到不少对开源感兴趣的同学,基于共同兴趣,大家一起合作开发了TensorLayer 新版本,这些学生后来在 TensorLayer 开源社区中扮演着核心角色。
许辰人今年带着之前上过他课的本科生在 SIGCOMM上发表了一篇论文,该会为全球计算机网络顶级会议,属于公认难度最高的系统会议之一。据悉,该论文是1970年以来第十一篇以中国大陆高校为第一单位的入选论文,同时也是首篇以中国大陆本科生为第一作者的入选论文。
我目前教学与科研时间的比例大概是 20% 对 80%,这让我想到很有意思的二八定律,即是其中 20% 的投入是最关键的,对应到我的现实情况,即是只要把教学工作做好,就会有助于我吸引到最适合和我一起工作的学生,进而反哺我的科研工作。许辰人笑言道。

3

北大教师也有经济烦恼

选择学术这条路,意味着经济上的妥协。换言之,这批青年教师的成就,拿到工业界其实可以换取更好的待遇。
“如果选择到工业界,家里人的生活条件会比现在好上许多。”许辰人坦言道。
施柏鑫分享了一件让他记忆尤深的事情:读博期间还是单身的他获得了东京大学的全额奖学金,由于奖金丰厚,当时他的“收入”甚至比在国内当大厂软件工程师的收入要高,一个人的生活质量很有保障;但一切从他组建家庭后开始后变得紧张起来——施柏鑫16年在东京工作时候的生活成本基本没变,但北京的生活成本却发生了天翻地覆的变化。
“16年那会,如果大家知道北京当时房价以一个多么疯狂的程度在上涨时,就会明白要拿学术这条路的工资去面对很多现实问题的话,压力是很大的,所以能够走到今天真的离不开家人的支持。”施柏鑫笑言道。
这批青年教师不是没有收到过硅谷级别的工业界 offer,但他们很清楚鱼与熊掌不可兼得,他们还是更享受可以自由自在探索科研“无人区”的畅快感。
“很多时候在工业界的一个 team 里,要做什么哪些研究你自己是没有任何选择的,而且还有可能因为一个不可控的因素,一夜之间整个项目或者整个 team 直接被取消。”许辰人过去在业界的一些经历,让他更早洞悉在业界做科研的局限性。

图注:许辰人与学生在赶寒假论文Deadline之前的实验室聚餐。
更重要的是,他们清楚自己要些什么。
“读博期间我有一位同实验室的同学,他的乐趣是写程序解决现实问题和帮别人找bug,而我则更享受看看新发表的论文,去思考可能出现什么样的一些科研新思路。”施柏鑫坦言兴趣导向是让他坚定学术这条道路的原因之一。

4

进高校不等于没有野心

曾经跟许辰人一起做研究的两名学生,有一名去了斯坦福读博,有一名获得了 MIT 的PhD offer,这都让他感到自豪。
获得 MIT offer 的那位最终因为研究兴趣的原因最终选择了华盛顿大学,我不为他觉得遗憾,反而为自己能够培养出这么一位具有独立思考能力的学生而感到开心。
施柏鑫准备等自己的研究组规模稳定后,要进一步在计算摄像学领域开发一些更实际的成品,比如相机原型系统或者成像芯片,他希望通过落地新型的成像设备,给手机或相机用户全新的摄像体验、给视觉计算系统更丰富的输入信息。
董豪近期带领一批本科生与博士生继续深耕生成模型方面的工作,并开拓了化学机器人相关领域的工作,这些成果会在不久的将来会陆续与大家见面。此外,在本科生的协同开发下,董豪的 TensorLayer 悄悄更新了 2.0 版本,并在此基础上支持了大量应用,比如全套的强化学算法,而深圳鹏城实验室的大力支持,也让这个开源社区有了更多可能性。
一场由下至上的变革,正在燕园酝酿着。

       

推荐阅读

 



点击阅读原文,直达NeurIPS小组~