贾扬清正式担纲阿里开源领头人!AI架构大神是怎样炼成的?





新智元报道

编辑:小芹、张佳
刚刚,贾扬清正式成为阿里巴巴开源技术委员会负责人,开源升级成为阿里技术战略之一。


今天登台的贾扬清,有了一个新的身份:阿里巴巴开源技术委员会负责人。

开源这件事,由贾扬清带领,更显得意义重大。因为他是当今最流行的三大开源深度学习框架Caffe、TensorFlow和PyTorch的核心作者之一。


贾扬清介绍了阿里在开源方面做的事情,阿里正从“拥抱开源”走向下一个阶段——贡献开源


  • 一是现有项目的深度贡献。

  • 二是阿里当前的许多自主项目,将逐渐放到开源社区。



阿里不仅积极拥抱开源,而且主动反哺开源,在 Linux、MySQL、JVM等国际开源项目领域拥有多位核心贡献者。


近年来,阿里更率先投入到自主开源中,持续性输出自研工具产品。目前开源项目数已有超过1000个,获得标星超过66万,阿里有超过10000名技术人员在为这些项目贡献代码。


这些项目覆盖中间件、移动、数据库、容器、AI大数据等多个领域,包括已从 Apache 基金会毕业的Apache Dubbo ™ 、Apache RocketMQ ™,广泛应用的UI组件库Ant Design,知名JSON解析库FastJson等。

贾扬清领头阿里开源,重磅发布开发者云


贾扬清用“3+1”概述了阿里开源技术委员会的方向:


3是“云原生、操作系统和前端”,1是“工具”。


云原生:当前,有非常多的技术是在云上设计的,阿里开源将为开发者提供更好、更方便获取的云原生环境。


操作系统操作系统是整个计算机技术的底座,阿里有飞天操作系统底座,同时也应用过很多类似 Linux 这样本身就开源的系统。


前端:前端是和用户交互的重要媒介,做好前端能够迅速将技术交到用户手里。蚂蚁金服的 Ant Design 是其中做得非常好的一个代表项目。


那么,为开源社区自身要做什么事情呢?贾扬清说,必须把工具做好,向大家提供更加详细、经过测试的方法论,帮助开发者更容易推进自己的开源项目。如何利用开源项目和解决方案提高开发效率,包括测试部署工具,源代码管理工具,项目交流平台等。



谈到自己在伯克利开发caffe、参与TensorFlow、pytorch等开源框架的核心开发,贾扬清说这一切都是“机缘巧合”。caffe用得很开心,于是把它开源出去,让社区所有人都能用到。



全球开源社区蓬勃发展,2018年一年,它的发展超越了前面很多年的总和。


“很幸运的是,在AI领域,开源的想法是大家共通的、默认就应该这样。”贾扬清说。



开源是从0到1,但开源项目的一个障碍是落地:怎样实际找到一个落地场景,支持进一步的开发,让开源项目实现从1到100。


阿里提供了一个技术试验场。



深度学习框架为例,最早是Caffe、Torch、Theano这些实验室里出来的框架,后来由于越来越多工业界的应用,开发出TensorFlow、Pytorch这些更加成熟的框架,今天开源软件则跟业务有更加紧密的结合。

回头去看,像TensorFlow和Pytorch这样的软件在实际建模中有点像汇编语言。但人工智能大数据领域的高级语言是什么,是不是还要停留在汇编语言上呢。贾扬清认为不是,有很多建模框架、和大数据结合的框架是进一步往前推动的方向。



贾扬清表示,随着行业数据智能化的加速到来,阿里云大规模计算能力、丰富的实践场景将有助于降低开源成本、推动项目的成熟完善。以Apache Flink为例,通过双11、搜索推荐等多个核心场景的实战检验,在流计算和批处理上积累了大量新功能,实现性能快速提升。如今,Apache Flink已成为CCTV、新浪微博、千寻位置等知名公司建设流处理平台的首要选择。
 


今天,阿里还带来了一个重磅发布:开发者云。将为开发者提供零门槛的云上体验、最佳硬件、云上生态等。

从拥抱开源到贡献开源、自主开源,再到如今的赋能开源,开源已升级为阿里技术战略之一,将为开发者带来更多切实可见的深远价值。

从Caffe、TensorFlow到PyTorch,贾扬清的AI架构大神之路


贾扬清

提到贾扬清,就不能不提Caffe和TensorFlow

贾扬清在硅谷奠定自己AI大神的地位,是因为两个世界级的框架Caffe和TensorFlow

Caffe是史上第一个通用深度学习框架,也是目前全球最普遍使用的深度学习框架之一,微软、雅虎、英伟达、Adobe等世界级大公司都在用。

TensorFlow,不得不提到因围棋一战成名的机器人AlphaGo(阿尔法狗),TensorFlow就是阿尔法狗背后的强大支撑,被称为“谷歌大脑”。

贾扬清,就是这两个世界级框架的作者之一。

贾扬清LinkedIn主页

清华本硕毕业后,贾扬清在加州大学伯克利分校取得计算机科学博士学位。贾扬清在伯克利读博期间开发了深度学习框架Caffe,全称“Convolutional Architecture for Fast Feature Embedding”,以优异的结构、性能和代码质量成为迄今最受欢迎、最成功的开源深度学习框架之一,对领域发展起到了极大的推动和影响。
博士毕业后,贾扬清加入了之前就已实习了2年的Google,在Google首席构架师Jeff Dean麾下任职,期间参与了TensorFlow平台的开发。Jeff Dean被称为目前整个谷歌甚至整个硅谷、整个计算机科学界的顶尖人物。

2014年到2016年是贾扬清的学术爆发期。根据谷歌学术的统计,贾扬清的论文引用高达48560次,其中“Going deeper with convolutions”(深入卷积架构)这篇引用次数达15668次,排名第一。
(论文地址:https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf)


第二篇高引论文是关于Caffe的一篇:Caffe: Convolutional architecture for fast feature embedding,引用次数达11598次。
(论文地址:https://arxiv.org/pdf/1408.5093.pdf)


第三篇高引论文是Tensorflow相关的:Tensorflow: A system for large-scale machine learning,引用次数达9266次。
(论文地址:http://download.tensorflow.org/paper/whitepaper2015.pdf)


贾扬清谷歌学术页面


2016年2月,贾扬清加入Facebook,当时这一消息也在圈内引发了广泛讨论。详见新智元报道Caffe作者贾扬清:我为什么离开Google,加入Facebook?



此后,贾扬清在AI架构的大道上一路进击:


  • 2016年11月Facebook推出轻量级模块化的深度学习框架Caffe2Go,能在手机上运行深度神经网络模型。贾扬清代表团队在FB官网发文,“我们在移动设备上开发了一个新的深度学习平台,首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。……Caffe2Go 与Torch等研究工具链一起,构成了Facebook机器学习产品的核心。”



  • 2018年5月Facebook正式公布PyTorch 1.0,这是基于PyTorch 0.4与Caffe2合并而成的框架,还整合了ONNX格式,旨在一个框架中统一研究和生产的能力。

深度学习开源框架群雄割据,到现如今TensorFlow和PyTorch分庭抗礼,贾扬清也从Caffe作者走到了Facebook AI架构总监。


他担任了PyTorch 1.0项目的共同负责人,2017年创建了首个开放模型格式的原型,后来成了FB、微软、亚马逊和许多硬件供应商一起发布的ONNX


今年3月,贾扬清被曝从Facebook离职加入阿里巴巴,现任阿里巴巴副总裁、阿里云智能计算平台事业部总经理、阿里巴巴开源技术委员会负责人。

成绩一骑绝尘,语速超过Rapper的科学家是如何成长起来的?


在阿里内部,大家称贾扬清是“语速超过Rapper的科学家”,那么这位科学家是如何成长起来的呢?


贾扬清出生在绍兴上虞,他的母亲和父亲都是上虞春晖中学的语文老师。

前几年,《绍兴日报》曾这样报道家乡天才少年的成长经历:


1岁多的时候,贾扬清喜欢听故事,母亲就拿着图画书给他讲故事。在三四岁时,贾扬清已经识字两三百,最喜欢捧着书一个人安静地读。


有一次,一家三口去逛新华书店,5岁的贾扬清挑了一本文字版的《安徒生童话》。母亲问:“你看得懂?”贾扬清点了点头。后来母亲总结出一个识字的方法:教孩子识字,摊开一本小人书,给孩子讲故事。


上小学的时候,由于交通不便,夫妻二人思忖再三,决定把儿子送进学校附近的一所村小。这所村小实行复式教育,即一二年级的孩子一起上课。


上小学前,贾扬清母亲通过家书的方式,认真向儿子交待几件事:
“一是,每个人都要做好自己的事情,父母亲要教好书,你读好书,求得真知识;二是,所有教你的老师都是优秀的,教育学生绰绰有余;三是,每次考试不必第一,加入第一方阵就可以了。”

中考时,贾扬清以上虞区中考第三名的成绩进入春晖中学。到了高中,成绩一骑绝尘,获得过全国物理、化学竞赛一等奖,数学联赛二等奖,英语综合能力二等奖等等。


作为学霸,贾扬清有一套自己的学习套路。比如对于老师布置的题目,会了就不做,但不会的题目,会买一整本练习题练习,直到熟悉运用为止。


高考时,因为大意,贾扬清做错了一道27分的理综考试试题,一度非常沮丧,不过最后以高考686分的成绩顺利进入清华大学自动化系自动化专业


对于儿子的成功,母亲总是这样提醒他:“你有今天的名望,有技术不是唯一原因,而是缘于共享。”


作为图像识别开源软件Caffe的研发者,贾扬清向全球免费共享了这一成果,所以,他的大名在业内人人皆知。

最后,看懂阿里开源,请看这张信息量很大的图:
一图看懂阿里巴巴开源

推荐阅读
GitHub趋势榜第一 | 微软Python入门课,刷个B站的功夫就能把Python学了
10招!看骨灰级Pythoner如何玩转Python
30段极简Python代码:这些小技巧你都Get了么
恺明大神 Mask R-CNN 超实用教程
    已同步到看一看