贾扬清正式担纲阿里开源领头人！AI架构大神是怎样炼成的？

机器学习算法与Python学习今天

新智元报道

编辑：小芹、张佳

刚刚，贾扬清正式成为阿里巴巴开源技术委员会负责人，开源升级成为阿里技术战略之一。

今天登台的贾扬清，有了一个新的身份：阿里巴巴开源技术委员会负责人。

开源这件事，由贾扬清带领，更显得意义重大。因为他是当今最流行的三大开源深度学习框架Caffe、TensorFlow和PyTorch的核心作者之一。

贾扬清介绍了阿里在开源方面做的事情，阿里正从“拥抱开源”走向下一个阶段——贡献开源。

一是现有项目的深度贡献。
二是阿里当前的许多自主项目，将逐渐放到开源社区。

阿里不仅积极拥抱开源，而且主动反哺开源，在 Linux、MySQL、JVM等国际开源项目领域拥有多位核心贡献者。

近年来，阿里更率先投入到自主开源中，持续性输出自研工具产品。目前开源项目数已有超过1000个，获得标星超过66万，阿里有超过10000名技术人员在为这些项目贡献代码。

这些项目覆盖中间件、移动、数据库、容器、AI、大数据等多个领域，包括已从 Apache 基金会毕业的Apache Dubbo ™ 、Apache RocketMQ ™，广泛应用的UI组件库Ant Design，知名JSON解析库FastJson等。

贾扬清领头阿里开源，重磅发布开发者云

贾扬清用“3+1”概述了阿里开源技术委员会的方向：

3是“云原生、操作系统和前端”，1是“工具”。

云原生：当前，有非常多的技术是在云上设计的，阿里开源将为开发者提供更好、更方便获取的云原生环境。

操作系统：操作系统是整个计算机技术的底座，阿里有飞天操作系统底座，同时也应用过很多类似 Linux 这样本身就开源的系统。

前端：前端是和用户交互的重要媒介，做好前端能够迅速将技术交到用户手里。蚂蚁金服的 Ant Design 是其中做得非常好的一个代表项目。

那么，为开源社区自身要做什么事情呢？贾扬清说，必须把工具做好，向大家提供更加详细、经过测试的方法论，帮助开发者更容易推进自己的开源项目。如何利用开源项目和解决方案提高开发效率，包括测试部署工具，源代码管理工具，项目交流平台等。

谈到自己在伯克利开发caffe、参与TensorFlow、pytorch等开源框架的核心开发，贾扬清说这一切都是“机缘巧合”。caffe用得很开心，于是把它开源出去，让社区所有人都能用到。

全球开源社区蓬勃发展，2018年一年，它的发展超越了前面很多年的总和。

“很幸运的是，在AI领域，开源的想法是大家共通的、默认就应该这样。”贾扬清说。

开源是从0到1，但开源项目的一个障碍是落地：怎样实际找到一个落地场景，支持进一步的开发，让开源项目实现从1到100。

阿里提供了一个技术试验场。

以深度学习框架为例，最早是Caffe、Torch、Theano这些实验室里出来的框架，后来由于越来越多工业界的应用，开发出TensorFlow、Pytorch这些更加成熟的框架，今天开源软件则跟业务有更加紧密的结合。

回头去看，像TensorFlow和Pytorch这样的软件在实际建模中有点像汇编语言。但人工智能和大数据领域的高级语言是什么，是不是还要停留在汇编语言上呢。贾扬清认为不是，有很多建模框架、和大数据结合的框架是进一步往前推动的方向。

贾扬清表示，随着行业数据智能化的加速到来，阿里云大规模计算能力、丰富的实践场景将有助于降低开源成本、推动项目的成熟完善。以Apache Flink为例，通过双11、搜索推荐等多个核心场景的实战检验，在流计算和批处理上积累了大量新功能，实现性能快速提升。如今，Apache Flink已成为CCTV、新浪微博、千寻位置等知名公司建设流处理平台的首要选择。

今天，阿里还带来了一个重磅发布：开发者云。将为开发者提供零门槛的云上体验、最佳硬件、云上生态等。

从拥抱开源到贡献开源、自主开源，再到如今的赋能开源，开源已升级为阿里技术战略之一，将为开发者带来更多切实可见的深远价值。

从Caffe、TensorFlow到PyTorch，贾扬清的AI架构大神之路

贾扬清

提到贾扬清，就不能不提Caffe和TensorFlow。

贾扬清在硅谷奠定自己AI大神的地位，是因为两个世界级的框架Caffe和TensorFlow。

Caffe是史上第一个通用深度学习框架，也是目前全球最普遍使用的深度学习框架之一，微软、雅虎、英伟达、Adobe等世界级大公司都在用。

而TensorFlow，不得不提到因围棋一战成名的机器人AlphaGo（阿尔法狗），TensorFlow就是阿尔法狗背后的强大支撑，被称为“谷歌大脑”。

贾扬清，就是这两个世界级框架的作者之一。

贾扬清LinkedIn主页

清华本硕毕业后，贾扬清在加州大学伯克利分校取得计算机科学博士学位。贾扬清在伯克利读博期间开发了深度学习框架Caffe，全称“Convolutional Architecture for Fast Feature Embedding”，以优异的结构、性能和代码质量成为迄今最受欢迎、最成功的开源深度学习框架之一，对领域发展起到了极大的推动和影响。

博士毕业后，贾扬清加入了之前就已实习了2年的Google，在Google首席构架师Jeff Dean麾下任职，期间参与了TensorFlow平台的开发。Jeff Dean被称为目前整个谷歌甚至整个硅谷、整个计算机科学界的顶尖人物。

2014年到2016年是贾扬清的学术爆发期。根据谷歌学术的统计，贾扬清的论文引用高达48560次，其中“Going deeper with convolutions”（深入卷积架构）这篇引用次数达15668次，排名第一。

（论文地址：https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf）

第二篇高引论文是关于Caffe的一篇：Caffe: Convolutional architecture for fast feature embedding，引用次数达11598次。

（论文地址：https://arxiv.org/pdf/1408.5093.pdf）

第三篇高引论文是Tensorflow相关的：Tensorflow: A system for large-scale machine learning，引用次数达9266次。

（论文地址：http://download.tensorflow.org/paper/whitepaper2015.pdf）

贾扬清谷歌学术页面

2016年2月，贾扬清加入Facebook，当时这一消息也在圈内引发了广泛讨论。详见新智元报道Caffe作者贾扬清：我为什么离开Google，加入Facebook？

此后，贾扬清在AI架构的大道上一路进击：

2016年11月，Facebook推出轻量级模块化的深度学习框架Caffe2Go，能在手机上运行深度神经网络模型。贾扬清代表团队在FB官网发文，“我们在移动设备上开发了一个新的深度学习平台，首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。……Caffe2Go 与Torch等研究工具链一起，构成了Facebook机器学习产品的核心。”

2017年4月，Facebook宣布开源产品级深度学习框架Caffe2，带来跨平台机器学习工具。Caffe2是 Caffe实验性的再造，制作时重点考虑了表现力、速度和模块化等特性。在2017年9月的一次测评中，Caffe2以79%的精度和149秒的运算时间，在TensorFlow、PyTorch、MXNet、CNTK等框架中排名第一。