刚刚,贾扬清正式成为阿里巴巴开源技术委员会负责人,开源升级成为阿里技术战略之一。
今天登台的贾扬清,有了一个新的身份:阿里巴巴开源技术委员会负责人。开源这件事,由贾扬清带领,更显得意义重大。因为他是当今最流行的三大开源深度学习框架Caffe、TensorFlow和PyTorch的核心作者之一。
贾扬清介绍了阿里在开源方面做的事情,阿里正从“拥抱开源”走向下一个阶段——贡献开源。
一是现有项目的深度贡献。
二是阿里当前的许多自主项目,将逐渐放到开源社区。
阿里不仅积极拥抱开源,而且主动反哺开源,在 Linux、MySQL、JVM等国际开源项目领域拥有多位核心贡献者。
近年来,阿里更率先投入到自主开源中,持续性输出自研工具产品。目前开源项目数已有超过1000个,获得标星超过66万,阿里有超过10000名技术人员在为这些项目贡献代码。
这些项目覆盖中间件、移动、数据库、容器、AI、大数据等多个领域,包括已从 Apache 基金会毕业的Apache Dubbo ™ 、Apache RocketMQ ™,广泛应用的UI组件库Ant Design,知名JSON解析库FastJson等。
贾扬清用“3+1”概述了阿里开源技术委员会的方向:
云原生:当前,有非常多的技术是在云上设计的,阿里开源将为开发者提供更好、更方便获取的云原生环境。
操作系统:操作系统是整个计算机技术的底座,阿里有飞天操作系统底座,同时也应用过很多类似 Linux 这样本身就开源的系统。
前端:前端是和用户交互的重要媒介,做好前端能够迅速将技术交到用户手里。蚂蚁金服的 Ant Design 是其中做得非常好的一个代表项目。
那么,为开源社区自身要做什么事情呢?贾扬清说,必须把工具做好,向大家提供更加详细、经过测试的方法论,帮助开发者更容易推进自己的开源项目。如何利用开源项目和解决方案提高开发效率,包括测试部署工具,源代码管理工具,项目交流平台等。
谈到自己在伯克利开发caffe、参与TensorFlow、pytorch等开源框架的核心开发,贾扬清说这一切都是“机缘巧合”。caffe用得很开心,于是把它开源出去,让社区所有人都能用到。
全球开源社区蓬勃发展,2018年一年,它的发展超越了前面很多年的总和。
“很幸运的是,在AI领域,开源的想法是大家共通的、默认就应该这样。”贾扬清说。
开源是从0到1,但开源项目的一个障碍是落地:怎样实际找到一个落地场景,支持进一步的开发,让开源项目实现从1到100。
以深度学习框架为例,最早是Caffe、Torch、Theano这些实验室里出来的框架,后来由于越来越多工业界的应用,开发出TensorFlow、Pytorch这些更加成熟的框架,今天开源软件则跟业务有更加紧密的结合。
回头去看,像TensorFlow和Pytorch这样的软件在实际建模中有点像汇编语言。但人工智能和大数据领域的高级语言是什么,是不是还要停留在汇编语言上呢。贾扬清认为不是,有很多建模框架、和大数据结合的框架是进一步往前推动的方向。
贾扬清表示,随着行业数据智能化的加速到来,阿里云大规模计算能力、丰富的实践场景将有助于降低开源成本、推动项目的成熟完善。以Apache Flink为例,通过双11、搜索推荐等多个核心场景的实战检验,在流计算和批处理上积累了大量新功能,实现性能快速提升。如今,Apache Flink已成为CCTV、新浪微博、千寻位置等知名公司建设流处理平台的首要选择。
今天,阿里还带来了一个重磅发布:开发者云。将为开发者提供零门槛的云上体验、最佳硬件、云上生态等。从拥抱开源到贡献开源、自主开源,再到如今的赋能开源,开源已升级为阿里技术战略之一,将为开发者带来更多切实可见的深远价值。从Caffe、TensorFlow到PyTorch,贾扬清的AI架构大神之路
提到贾扬清,就不能不提Caffe和TensorFlow。贾扬清在硅谷奠定自己AI大神的地位,是因为两个世界级的框架Caffe和TensorFlow。Caffe是史上第一个通用深度学习框架,也是目前全球最普遍使用的深度学习框架之一,微软、雅虎、英伟达、Adobe等世界级大公司都在用。而TensorFlow,不得不提到因围棋一战成名的机器人AlphaGo(阿尔法狗),TensorFlow就是阿尔法狗背后的强大支撑,被称为“谷歌大脑”。清华本硕毕业后,贾扬清在加州大学伯克利分校取得计算机科学博士学位。贾扬清在伯克利读博期间开发了深度学习框架Caffe,全称“Convolutional Architecture for Fast Feature Embedding”,以优异的结构、性能和代码质量成为迄今最受欢迎、最成功的开源深度学习框架之一,对领域发展起到了极大的推动和影响。博士毕业后,贾扬清加入了之前就已实习了2年的Google,在Google首席构架师Jeff Dean麾下任职,期间参与了TensorFlow平台的开发。Jeff Dean被称为目前整个谷歌甚至整个硅谷、整个计算机科学界的顶尖人物。2014年到2016年是贾扬清的学术爆发期。根据谷歌学术的统计,贾扬清的论文引用高达48560次,其中“Going deeper with convolutions”(深入卷积架构)这篇引用次数达15668次,排名第一。(论文地址:https://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf)
第二篇高引论文是关于Caffe的一篇:Caffe: Convolutional architecture for fast feature embedding,引用次数达11598次。
(论文地址:https://arxiv.org/pdf/1408.5093.pdf)
第三篇高引论文是Tensorflow相关的:Tensorflow: A system for large-scale machine learning,引用次数达9266次。(论文地址:http://download.tensorflow.org/paper/whitepaper2015.pdf)
- 2016年11月,Facebook推出轻量级模块化的深度学习框架Caffe2Go,能在手机上运行深度神经网络模型。贾扬清代表团队在FB官网发文,“我们在移动设备上开发了一个新的深度学习平台,首次实现了实时的捕获、分析和像素处理——这一最先进的技术仅在手上就能实现。……Caffe2Go 与Torch等研究工具链一起,构成了Facebook机器学习产品的核心。”
从深度学习开源框架群雄割据,到现如今TensorFlow和PyTorch分庭抗礼,贾扬清也从Caffe作者走到了Facebook AI架构总监。
他担任了PyTorch 1.0项目的共同负责人,2017年创建了首个开放模型格式的原型,后来成了FB、微软、亚马逊和许多硬件供应商一起发布的ONNX。
成绩一骑绝尘,语速超过Rapper的科学家是如何成长起来的?
在阿里内部,大家称贾扬清是“语速超过Rapper的科学家”,那么这位科学家是如何成长起来的呢?贾扬清出生在绍兴上虞,他的母亲和父亲都是上虞春晖中学的语文老师。前几年,《绍兴日报》曾这样报道家乡天才少年的成长经历:
1岁多的时候,贾扬清喜欢听故事,母亲就拿着图画书给他讲故事。在三四岁时,贾扬清已经识字两三百,最喜欢捧着书一个人安静地读。
有一次,一家三口去逛新华书店,5岁的贾扬清挑了一本文字版的《安徒生童话》。母亲问:“你看得懂?”贾扬清点了点头。后来母亲总结出一个识字的方法:教孩子识字,摊开一本小人书,给孩子讲故事。
上小学的时候,由于交通不便,夫妻二人思忖再三,决定把儿子送进学校附近的一所村小。这所村小实行复式教育,即一二年级的孩子一起上课。
上小学前,贾扬清母亲通过家书的方式,认真向儿子交待几件事:“一是,每个人都要做好自己的事情,父母亲要教好书,你读好书,求得真知识;二是,所有教你的老师都是优秀的,教育学生绰绰有余;三是,每次考试不必第一,加入第一方阵就可以了。”
中考时,贾扬清以上虞区中考第三名的成绩进入春晖中学。到了高中,成绩一骑绝尘,获得过全国物理、化学竞赛一等奖,数学联赛二等奖,英语综合能力二等奖等等。
作为学霸,贾扬清有一套自己的学习套路。比如对于老师布置的题目,会了就不做,但不会的题目,会买一整本练习题练习,直到熟悉运用为止。
高考时,因为大意,贾扬清做错了一道27分的理综考试试题,一度非常沮丧,不过最后以高考686分的成绩顺利进入清华大学自动化系自动化专业。
对于儿子的成功,母亲总是这样提醒他:“你有今天的名望,有技术不是唯一原因,而是缘于共享。”
作为图像识别开源软件Caffe的研发者,贾扬清向全球免费共享了这一成果,所以,他的大名在业内人人皆知。 扫一扫下载订阅号助手,用手机发文章 赞赏
长按二维码向我转账
受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
朋友会在“发现-看一看”看到你“在看”的内容