从CS小白到侯世达高徒、CS教授、《复杂》作者,她这次再向世界展现 AI 十年思考 | 赠书(王飞跃力荐)

AI科技评论 AI科技评论 昨天
图片

《GEB》启蒙了人工智能的发展热潮,《生命3.0》重构了人工智能的进化框架,《AI 3.0》将开启新一轮人工智能爆发的大戏。

作者 | AI科技评论
AI 3.0》是畅销书《复杂》的作者、《GEB》作者侯世达的高徒、波特兰州立大学计算机科学教授、复杂系统前沿科学家梅拉妮•米歇尔耗时10年思考,厘清人工智能与人类智能的全新力作。侯世达曾逐章审读本书,并为每一页都写满意见。
图片
本次,AI科技评论联合湛庐文化,为同学们带来这本新书的赠书活动!
 

1

结缘GEB

米歇尔的学术生涯颇为有趣。她本科是数学专业,毕业后在纽约市的一所预科学校教数学。但她过的并不开心,并一直在苦苦思索内心所爱。
直到有一天,她在《科学美国人》上阅读到了一篇关于《GEB》的热情洋溢的评论文章之后,立刻被买来这本书,如饥似渴地阅读。在阅读过程中,她越来越坚信,自己不但想成为一名人工智能研究人员,并想与侯世达共事。“我从来没有对其他任何一本书或一种职业有过如此强烈的渴望。”
Douglas Richard Hofstadter,中文名侯世达,美国学者、作家。他的主要研究领域包括意识、类比、艺术创造、文学翻译以及数学物理学探索。
图片
侯世达因其著作《哥德尔、埃舍尔、巴赫》(GEB)获得普利策奖(非小说类别)和美国国家图书奖(科学类别),这本书在人工智能界特别有名,并在豆瓣上获得了9.4高分。
侯世达从数学、逻辑学、生命遗传、大脑思维、人工智能、甚至音乐、绘画等许多不同领域对莫比乌斯带进行了讨论,使人们发现怪圈有着丰富的内蕴,它与自然、科学、人类、艺术都有着深刻的联系。此书也被计算机科学界和人工智能界很多科学家所推荐,影响了一大批研究学者。据说,TensorFlow的logo也参照了这本书的封面设计
图片
但是,要当侯世达学生就意味着,从未上过哪怕一门计算机科学课程的米歇尔,要去申请印第安纳大学计算机科学系教授侯世达的计算机科学博士学位。
听起来真是异想天开,然而,米歇尔从小对计算机非常熟悉。她父亲是20世纪60年代一家科技创业公司的硬件工程师,作为一项业余爱好,他在家里的书房里组装了一台大型计算机——一台像冰箱一样大的“Sigma 2”机器,上面有一个磁性按钮,写着“我用FORTRAN祈祷”。

图片

“Sigma 2”机器
当米歇尔还是个孩子的时候,她半信半疑地以为它确实是在祈祷,尤其在夜深人静,家人都睡着的时候。20世纪六七十年代,随着成长,米歇尔对当时流行的各种编程语言都略有了解:先是FORTRAN,然后是BASIC,再然后是Pascal,但她对规范的编程技术几乎一无所知,更不用说那些对即将入学的计算机系研究生来说必须知道的知识了。
为了加快计划,米歇尔在学年末辞去了教职,搬到波士顿,开始学习计算机科学的入门课程,来为新职业做准备。
开始新生活几个月后的某一天,她在麻省理工学院(MIT)的校园里等着上课,无意间瞄到了一张关于侯世达讲座的海报,而且举行时间就在两天后。米歇尔相当激动,“我简直不敢相信自己的好运。”
她去听了这场讲座,在一大群崇拜者中排了很长时间的队后,终于和侯世达说上话了。原来他正在麻省理工学院度过他为期一年的学术假期,在这之后他会从印第安纳州搬到密歇根州安娜堡的密歇根大学。
经过不懈的努力,米歇尔成功说服侯世达,成为他的研究助理。先是一个暑假,然后在接下来的6年里,米歇尔又成了他的硕士生、博士生,并最终作为密歇根大学的计算机科学博士毕业(论迷妹的正确追星姿势)。这些年来,米歇尔和侯世达一直保持着密切联系,并曾多次就人工智能进行讨论。米歇尔和侯世达共同创建了Copycat程序,该程序可以在理想化的情境里进行创造性的类比。
如今,米歇尔已成为颇有影响力的人工智能学者。她现在是波特兰州立大学计算机科学教授,主要的研究领域为类比推理、复杂系统、遗传算法等。
图片
在圣塔菲研究所时,米歇尔主导了复杂系统领域的研究工作,并教授了相关的在线课程。她的在线课程《复杂性入门》已经被近30 000名学生选修,成为Coursera排名前50位的在线课程之一。
米歇尔还是知名畅销书作家,著有《复杂》(Complexity: A Guided Tour)(豆瓣评分9.0)、《遗传算法导论》(Genetic Algorithms)等。
图片
 

2

AI 3.0

有些读者可能读过《复杂》,并且可能会想知道《复杂》和《AI 3.0》之间的关系。米歇尔解释道:《复杂》这本书是对复杂系统科学的一个概述,复杂系统科学研究的是复杂行为如何从相对简单的组成部分之间的相互作用中产生;而《AI 3.0》则是深度聚焦于复杂系统科学中的一些最难的问题,比如智能的本质是什么?研究者是如何创建智能机器的?我们如何评判这一领域目前所取得的成就?今天的机器距离真正像人一样来理解世界还有多远?
在《AI 3.0》中,作者首先从人工智能的发展历程讲起,然后从视觉识别、游戏与推理、自然语言处理、常识判断等人工智能的4个主要应用领域来详细阐述人工智能的原理、当下的能力边界,及其正在面临的关键挑战,书中关于人脸识别、无人驾驶、机器翻译等方面的案例分析都充满了含义丰富的启示。
AI 3.0》的英文版全名为《Artificial Intelligence:A Guide for Thinking Humans》,2019年,这本书甫一出版,就跻身亚马逊“计算机与技术”畅销书行列。
图片
中文版由中国自动化学会监事长王飞跃领衔翻译,并得到众多名人推荐,包括Robust.AI首席执行官Gary Marcus、财讯传媒集团首席战略官段永朝、联想集团高级副总裁芮勇以及理论物理学家、畅销书《规模》作者杰弗里·韦斯特等。

图片

译者王飞跃教授与梅拉妮 · 米歇尔
图片
段永朝表示,人工智能类的图书可谓汗牛充栋,大致可分为两类:一类是给专业的工程师看的,另一类是给大众的普及读物,米歇尔的这部书介乎两者之间。“它既有专业的技术阐释,更有深刻的思想洞察。”
AI 3.0》所要传达的观点是:我们人类倾向于高估人工智能的进步,而低估人类自身智能的复杂性。目前的人工智能与通用的、人类水平的智能还相距甚远。我们应该感到害怕的不是智能机器,而是“愚笨”的机器,即那些没有能力独立做决策的机器。相比于机器的“智能”,我们更应关注如何规避“愚笨”机器的潜在风险。
这一观点基于“侯世达的恐惧”。AlphaGo让全世界炒作起了人工智能,并进一步夸张化为“奇点爆炸”、“超级智能”、“数字永生”等概念。侯世达对此不以为然,并直言“很讨厌‘人工智能’这个词汇”,他认为目前的人工智能技术毫无智能可言。
米歇尔的这部《AI 3.0》也以侯世达作为开篇和结语的思想经纬,为侯世达对人工智能的万般忧虑,做了一次深度的技术解析。
人工智能的种种讨论,特别涉及到技术伦理、社会价值和发展前景的时候,一般总会停留在“悲观”或者“乐观”的选边站队层面,无法进一步深入下去。这不奇怪。技术专家们擅长的话语是数据、算法、模型,社会学者和新闻记者们只能从技术的外部性、代码的背后之手、人性之善恶的角度,捍卫或者反对某种价值主张。对绝大多数非专业人士而言,由于搞不懂隐藏在反向传播算法、卷积神经网络、马尔可夫过程、熵原理这些硬核知识背后的“思想内涵”,对人工智能的理解和评判,就只能以“好与坏”、“善与恶”的视角进行。
讲述技术视角的思想基础,弥合理科生与文科生之间看待人工智能的思想鸿沟,正是米歇尔这部书的价值所在。
米歇尔的论述,有这样一个清晰的线条,她细致分析了人工智能在视觉、游戏、机器翻译等领域最新的进展后指出,迄今为止令人眼花缭乱的智能突破,其实尚未触及智能问题的核心——自然语言理解和意义问题。

内容简介

AI 3.0》第一部分回顾了人工智能超过半个世界的发展历史。与一般人工智能书籍不同的是,在概要讲述“人工智能的冬天”这一背景之后,米歇尔将注意力集中在“何以如此”这个关键问题上。
第二部分对分析了视觉领域的技术进展,这部分可用来理解人工智能核心算法演变的心路历程。视觉领域广泛使用的专业工具,是所谓“卷积神经网络”,这一领域的创立者包括日本学者福岛邦彦,以及法国计算机科学Yann LeCun(中文名字杨立昆)。对外行人来说,繁复的算法过程遮蔽了其中包含的技术思想。米歇尔将其“拎出来”展现给读者:所谓视觉识别,无非是训练出某种算法,使得机器可以“识别和命名它所‘看到’的世界”的过程。Geoffrey Hinton开发出的AlexNet在ImageNet竞赛中的强势胜出让深度学习一夜之间成为AI社区的大明星。然而,尽管有着巨大的成功,ConvNets距离真正的视觉智能还很遥远,比如依赖于大数据,受限于长尾效应,缺乏真正的视觉理解能力,存在偏见,容易被愚弄等。
第三部分的讨论主题是游戏人工智能,用人工智能算法练习打游戏,是挖掘算法潜能、理解算法机理的有效途径。米歇尔为我们分析了著名的AI围棋程序AlphaGo,并指出很多人工智能应用的智能表象的背后是强大算力和大数据的支撑,而游戏AI在解决问题时,仍然缺乏对世界的完整理解,转而依赖于目标函数本身。在第四部分讨论的自然语言处理中,尽管语言AI或许更具有智能的表象欺骗性,但AI的语言理解依然逃不出同样的魔咒。
第五部分落到了“意义问题”上。米歇尔指出,理解的背后是意义。意义,是AI的真正障碍。至于是不是不可逾越的障碍,这可以成为激烈争论的话题。但我感觉,米歇尔所阐述的意义问题,并不是说AI无法理解意义,也不是说AI无法创造出新的意义(当然这取决于你怎么定义“意义”),而是说,AI对意义的理解是否在安全边界之内——这其实是全书开篇“侯世达恐惧”的核心。
婴幼儿理解这个世界的过程,是不断地将自己的新奇感受,装入成人的词语世界的过程。这个过程也是绝大多数真实的认知历程。当然也有“漏网之鱼”。比如日益流行的网络用语,就突破了附着在传统词语上面的固有含义。意义的产生,既有漫长、深厚、难以细数的生活积淀,和约定俗成的“能指-所指”的任意配对儿,也有突破词语边界的“类比”和“象征”——按米歇尔的导师侯世达的观点,后者是“思考之源和思想之火”。(参见侯世达《表象与本质》)
借用Gian-Carlo Rota的话,米歇尔提出了这一根本性的问题:“我想知道AI是否以及何时将会打破意义的障碍”。
米歇尔并未直接了当地回答这个艰难的硬核问题。但她毕竟是侯世达的弟子。她从侯世达的思想中汲取营养:这个世界是隐喻式的。我们并非确凿无疑地生活在符号世界中,我们生活在色彩斑斓的隐喻中。
侯世达在40多年前写作伟大的作品《GEB》的时候,针对人工智能自问自答了10个问题,侯世达对这10个问题的思考,更多地指向形式逻辑、符号演算和线性思维天然的不足之处:这一不足之处正在于,符号思维难以超越其内生的逻辑悖论。没办法,这是天生的。
米歇尔从侯世达的10个问题中提取了6个问题——看上去都是迫在眉睫的问题——并尝试给出了自己的回答。米歇尔的回答只是多种意见中的一种。但勇敢面对这些基本问题,并持续展开深入思考和交流的时代,才刚刚开始。

目录

引言 创造具有人类智能的机器,是一场重大的智力冒险
第一部分 若想对未来下注,先要厘清人工智能为何仍然无法超越人类智能
01 从起源到遭遇寒冬,心智是人工智能一直无法攻克的堡垒
  • 达特茅斯的两个月和十个人

  • 定义,然后必须继续下去

  • 任何方法都有可能让我们取得进展

  • 符号人工智能,力图用数学逻辑解决通用问题

  • 感知机,依托DNN的亚符号人工智能

  • 感知学习算法,无法重现人脑的涌现机制

  • 学习感知机的权重和阈值

  • 感知机是一条死胡同

  • 泡沫破碎,进入人工智能的寒冬

  • 看似容易的事情其实很难

02 从神经网络机器学习,谁都不是最后的解药
  • 多层神经网络,识别编码中的简单特征

  • 无论有多少输入与输出,反向传播学习都行得通

  • 联结主义:智能的关键在于构建一个合适的计算结构

  • 亚符号系统的本质:不擅长逻辑,擅长接飞盘

  • 机器学习,下一个智能大变革的舞台已经就绪

03 从图灵测试到奇点之争, 我们无法预测智能将带领我们去往何处
  • “猫识别机”掀起的春日狂潮

  • 人工智能:狭义和通用,弱和强

  • 人工智能是在模拟思考,还是真的在思考

  • 图灵测试:如果一台计算机足够像人

  • 奇点 2045,非生物智能将比今天所有人类智能强大10亿倍

  • 一个“指数级”寓言

  • 摩尔定律:计算机领域的指数增长

  • 神经工程,对大脑进行逆向工程

  • 奇点的怀疑论者和拥趸者

  • 对图灵测试下注

第二部分 视觉识别:始终是“看”起来容易“做”起来难
04 何人,何物,何时,何地,为何
  • 看与做

  • 深度学习革命:不是复杂性,而是层深

  • 模拟大脑,从神经认知机到ConvNets

  • ConvNets如何不将狗识别为猫

  • 激活对象特征,通过分类模块进行预测

  • 不断从训练样本中学习,而非预先内置正确答案

05 ConvNets和ImageNet,现代人工智能的基石
  • 构建ImageNet,解决目标识别任务的时间困境

  • 土耳其机器人,一个需要人类智慧的工作市场

  • 赢得ImageNet竞赛,神经网络的极大成功

  • ConvNets淘金热,以一套技术解决一个又一个问题

  • 在目标识别方面,ConvNets超越人类了吗

  • 我们离真正的视觉智能还非常遥远

06 人类与机器学习的关键差距
  • 人工智能仍然无法学会自主学习

  • 深度学习仍然离不开“你”的大数据

  • 长尾效应常常会让机器犯错

  • 机器“观察”到的东西有时与我们截然不同

  • 有偏见的人工智能

  • 人工智能内心的黑暗秘密以及我们如何愚弄它

07 确保价值观一致,构建值得信赖、有道德的人工智能
  • 有益的人工智能,不断改善人类的生活

  • 人工智能大权衡:我们是该拥抱,还是谨慎

  • 人脸识别的伦理困境

  • 人工智能如何监管以及自我监管

  • 创建有道德的机器

第三部分 游戏与推理:开发具有更接近人类水平的学习和推理能力的机器
08 化学,最重要的是学会给机器人奖励
  • 训练你的机器狗

  • 现实世界中的两大绊脚石

  • 09 学会玩游戏,智能究竟从何而来

  • 深度Q学习,从更好的猜测中学习猜测

  • 价值6.5亿美元的智能体

  • 西洋跳棋和国际象棋

  • 不智能的“智能赢家”深蓝

  • 围棋,规则简单却能产生无穷的复杂性

  • AlphaGo对战李世石:精妙,精妙,精妙

  • 从随机选择到倾向选择,AlphaGo这样工作

  • 10  游戏只是手段,通用人工智能才是目标

  • 理解为什么错误至关重要

  • 无须人类的任何指导

  • 人工智能而言,人类的很多游戏都很具挑战性

  • 它并不真正理解什么是一条隧道,什么是墙

  • 除去思考“围棋”,AlphaGo没有“思考”

  • 从游戏到真实世界,从规则到没有规则

第四部分 自然语言:让计算机理解它所“阅读”的内容
11 词语,以及与它一同出现的词
  • 语言的微妙之处

  • 语音识别和最后的10%

  • 分类情感

  • 递归神经网络

  • “我欣赏其中的幽默”

  • “憎恶”总与“讨厌”相关,“笑”也从来伴随着“幽默”

  • word2vec神经网络:口渴之于喝水,就像疲倦之于喝醉

12 机器翻译,仍然不能从人类理解的角度来理解图像与文字
  • 编码器遇见解码器

  • 机器翻译,正在弥补人机翻译之间的差距

  • 迷失在翻译之中

  • 把图像翻译成句子

13 虚拟助理——随便问我任何事情
  • 沃森的故事

  • 如何判定一台计算机是否会做阅读理解

  • “它”是指什么?

  • 自然语言处理系统中的对抗式攻击

第五部分 常识——人工智能打破意义障碍的关键
14 正在学会“理解”的人工智能
  • 理解的基石

  • 预测可能的未来

  • 理解即模拟

  • 我们赖以生存的隐喻

  • 抽象与类比,构建和使用我们的心智模型

15 知识、抽象和类比,赋予人工智能核心常识
  • 让计算机具备核心直觉知识

  • 形成抽象,理想化的愿景

  • 活跃的符号和做类比

  • 字符串世界中的元认知

  • 识别整个情境比识别单个物体要困难得多

  • “我们真的,真的相距甚远”

结语 思考6个关键问题,激发人工智能的终极潜力
  • 问题1:自动驾驶汽车还要多久才能普及?

  • 问题2:人工智能会导致人类大规模失业吗?

  • 问题3:计算机能够具有创造性吗?

  • 问题4:我们距离创建通用的人类水平AI还有多远?

  • 问题5:我们应该对人工智能感到多恐惧?

  • 问题6:人工智能中有哪些激动人心的问题还尚未解决?


3

精彩样章

第二部分

图片
图片
图片
图片
图片

第五部分

图片
图片
图片
图片
图片
图片
图片
图片
AI科技评论
AI科技评论
聚焦AI前沿研究,关注AI青年成长
1750篇原创内容
公众号

[赠书福利]

AI科技评论本次联合湛庐文化为大家带来8本AI 3.0》正版新书。

在本文留言区留言,欢迎大家畅所欲言,谈一谈你对人工智能近年发展、当前困境的看法,或对人工智能未来趋势的看法。(仅限微信公众号)

AI科技评论将会在留言区选出 5 名读者,每人送出AI 3.0》一本。

另外,读者可以从3月8号开始,到AI研习社的本书活动区留言,AI科技评论将会在留言区选出 3 读者,每人送出AI 3.0》一本。AI科技评论后续将公布活动相关链接,敬请关注。

活动规则:

1. 在本文留言区留言,在综合留言质量(留言是敷衍还是走心)和留言点赞最高的读者中选出5位读者获得赠书。获得赠书的读者请联系 AI科技评论客服(aitechreview)。

2. 留言内容会有筛选,例如“选我上去”、“这书写的很棒(仅仅几个字)”等内容将不会被筛选,亦不会中奖。

3. 本活动时间为2021年3月7日 - 2020年3月13日(23:00),活动推送时间内仅允许赠书福利中奖一次。

由于微信公众号试行乱序推送,您可能不再能准时收到AI科技评论的推送。为了第一时间收到AI科技评论的报道, 请将“AI科技评论”设为星标账号,以及常点文末右下角的“在看”。