首页 » AI·未来 » AI·未来全文在线阅读

《AI·未来》01 中国的“斯普特尼克时刻”

关灯直达底部

2017年5月27日的下午,戴着黑框眼镜的柯洁全神贯注地看着眼前的棋局,整个身体陷进了座位里,显得局促不安。截至2017年5月,19岁的柯洁已经连续32个月在人类围棋排行榜上排名世界第一。但在这一天,这位平时自信满满、骄傲到近乎自负的世界冠军,一边揉着太阳穴,一边思考着眼前的棋局,这时的他怎么看都不像是为人类背水一战的英雄,倒更像是个冥思苦想、正在解答一道几何难题的高中生。

逼他使出浑身解数的,是世界上最智能的机器之一AlphaGo——一款由全球顶尖科技公司谷歌开发的人工智能应用。柯洁与AlphaGo的战场是19×19的棋盘,上边摆满了黑色与白色的小圆棋子。这就是看似简单,实则玄机无限的围棋:对弈双方要轮流把黑子与白子下到棋盘上,试图包围、消灭对手的棋子。当时,世界上还没有一个人的战绩能超过柯洁,但在这一天他受到了前所未有的挑战。

围棋发明于几千年前,在现存棋类运动中历史最为悠久。在古代中国,围棋是文人必须熟练掌握的四种技艺(琴棋书画)之一,中国人相信下围棋能够孕育禅思智慧。国际象棋等其他棋类非常依赖战术,而围棋不仅需要战术,还要耐心布局、慢慢包围,这些特质使它升华为了一门艺术、一种心境。

围棋不但历史悠久,棋局本身也极其复杂。围棋的基本规则九句话就能说清,但棋局本身的变数比可以观测到的宇宙原子总数还要多。如此多的可能性导致每步棋的着法选择组合起来极其复杂,远超人类的想象。于是在人工智能领域,战胜人类围棋冠军成了高不可攀的珠穆朗玛峰,让众多挑战者望而却步。有些骨子里带有浪漫诗意的人说,在围棋上人工智能战胜人类是无法做到的,因为机器缺少人性,这进一步给围棋增添了一种近乎神秘的感觉。而工程师的看法直截了当:围棋棋盘上的可能性太多了,计算机无法评估。

但这一天,AlphaGo不仅击败了柯洁,还取得了压倒性胜利。三局漫长的对抗,每局都超过了三小时,柯洁绞尽脑汁,交替用不同的战术对付AlphaGo,保守、激进、防御、出其不意……遗憾的是这些战术全都无效。AlphaGo令柯洁无机可乘,在迈向胜利的过程中,一步步收紧着它的铁钳。

北京视角

从这场对抗赛中能看到什么取决于我们的视角。在美国的一些观察家看来,AlphaGo的胜利不仅代表着机器战胜人类,也展示了西方科技公司睥睨全球的科技力量。过去20年,硅谷的科技公司征服了全球的科技市场,Facebook、谷歌等公司成了最热门的互联网社交与搜索平台。在征服全球的过程中,它们势如破竹般碾压了从法国到印度尼西亚等国家的本土创业公司。这些互联网巨头让美国在数字世界的实力能够媲美其在现实世界的军事与经济实力。AlphaGo原为英国人工智能创业公司DeepMind的产品,DeepMind在2014年被谷歌收购。如今,AlphaGo在棋坛所向披靡,而西方国家似乎想让人工智能进一步发展,推动人类进入人工智能时代。

在柯洁与AlphaGo对弈时,我从自己中国办公室的窗户向外望去,看到的却是一幅完全不同的景象。我创立的创业投资与服务公司创新工场位于北京的中关村,这里被称为“中国硅谷”,现在的中关村是中国人工智能发展的核心地带。在这里,人们认为AlphaGo的胜利既是挑战,又是激励。这一天成了中国人工智能的“斯普特尼克时刻”。

斯普特尼克一号是苏联于1957年10月发射的世界第一颗人造卫星。它的成功升空并进入地球轨道,对美国人民的心理和美国政府的政策都产生了深远影响,该事件引发了美国大众对苏联科技领先的焦虑。当时美国人在夜晚追寻这颗卫星,并试图接收它向地球发送的无线电信号。这也促使美国政府设立了国家航空航天局(NASA),加大了对数学及科学教育的补贴,从而推动美、苏两国进入了“太空竞赛”。如此规模的全民科技动员,在12年后收获了巨大的成果——美国的尼尔·阿姆斯特朗(Neil Armstrong)成为首位踏上月球的人类。

AlphaGo的第一次重大胜利是在2016年3月,它和韩国传奇棋手李世石展开对抗,对弈五局四胜一负。这场没几个美国人感兴趣的比赛,却吸引了超过两亿八千万中国人观战。(1)几乎在一夜之间,中国陷入了人工智能热潮。这一事件没能像斯普特尼克卫星那样引发美国的军事竞赛,却在中国科技界点燃了一把火,至今仍未熄灭。

当中国的投资人、创业者及政府官员聚焦某个产业时,他们能集结撼动世界的力量。现在的中国掀起了对人工智能领域投资、研究及创业的空前热潮,创业投资人、科技巨擘及中国政府都在人工智能领域注入了大笔资金。中国的学生也加入了人工智能热潮,他们选修前沿科技的课程,使用智能手机观看国际知名研究人员授课。创业者为追赶人工智能浪潮,专心改造、转型,甚至重新命名自己的公司。

柯洁向AlphaGo投子认输后不到两个月,国务院公布了《新一代人工智能发展规划》(2)。这是中国国家发展人工智能的远景规划,明确提出未来将要对人工智能发展给予更多资金、政策支持,以及国家级的统筹规划。该计划明确提出了2020年及2025年的发展目标,并希望到2030年中国能成为人工智能领域的全球创新中心,在理论、技术及应用等方面领先全球。嗅觉灵敏的中国风险投资人积极响应号召,2017年一年,他们给予人工智能创业公司的风险投资占到全球人工智能投资的48%,中国在这一数据上首次超越了美国。(3)

一场赛局和赛局的改变者

中国政府的大力支持,源于人工智能与经济之间新的化学反应。人工智能科学虽已持续发展了数十年,但最近才从学术成果落地为应用实例。

我对机器在围棋赛中击败人类所涉及的技术性挑战非常熟悉。1986年,我在卡内基·梅隆大学攻读人工智能方向的博士学位,那年我设计了第一款击败黑白棋(Othello,又称为奥赛罗棋,一种简化版围棋,使用8×8棋盘)世界冠军队成员的计算机软件。(4)这在当时是了不起的成就,但核心技术其实只能应付简单的棋类游戏。

1986年,我设计的黑白棋(又称奥赛罗棋)计算机程序界面与发表的论文。

使用与我设计黑白棋软件差不多的方法,IBM到达了下一个里程碑——他们创造的“深蓝”(Deep Blue),一举击败国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)。这场1997年的“人脑背水一战”一度引发了世人的焦虑,担心机器人在未来随时会统治人类。但最终深蓝计算机的胜利只不过是推升了IBM的股价,对真实的人类生活并未产生什么重大影响,人工智能在真实世界的应用仍然很少。研究人员数十年的努力并未能产生根本性突破。

“深蓝”基本上是以“蛮力”取胜——使用定制的硬件,飞快计算当前局势下每一步棋可能产生的影响。它也需要真正的国际象棋手进行指导。从工程角度来说,“深蓝”的胜利是很了不起,但它背后的技术只能应用在有限的问题上。离开了8×8的国际象棋棋盘,“深蓝”就不是很聪明了,说到底,它只能对国际象棋选手产生威胁。

但与此不同的是,柯洁对弈AlphaGo虽是棋盘上的战事,却和真实世界中的巨变密不可分。这些改变包括AlphaGo对抗赛在中国激起的人工智能热,以及让AlphaGo制胜的核心技术的应用。驱动AlphaGo的核心技术深度学习,是人工智能领域的突破性技术,大大增强了机器的认知能力。使用深度学习的程序如今已经在人脸识别、语音识别、核发贷款等工作上超越了人类。在过去长达数十年间,人工智能革命总像是“再过5年”才会到来,5年复5年,直到深度学习在过去几年里有了长足发展,这场革命才终于到来。生产力会因此爆发式增长,人工智能也会在各个领域取代人工,颠覆劳动力市场,对人们产生深刻的社会心理影响。

柯洁对弈AlphaGo期间,真正让我担心害怕的不是其他知名科技界人士都惧怕的人工智能杀手机器人,而是真实世界里大规模失业可能引发的严重冲击,以及伴随而来的社会动乱。人工智能对就业构成的威胁来势之快,远远超过多数专家的预期。而且无论是蓝领、白领,无论劳动者受教育程度的高低,都可能被卷入人工智能革命的大潮中,受到被人工智能替代的威胁。柯洁对弈AlphaGo的那天,深度学习摘下了人类棋王的桂冠,很快这项技术就将进入工厂和办公室,端走人们的饭碗。

围棋机器里的幽灵

不过,在柯洁与AlphaGo的对弈中,我也看到了希望。其中一局比赛进行到2小时51分时,柯洁遇到了瓶颈。他已经竭尽全力,但他也知道这还不足以对抗强大的AlphaGo。他的头低垂在棋盘上方,皱着眉头,噘起嘴唇……他取下眼镜,再也无法克制自己的情绪,用手背轻拭双眼泛出的泪水。这些动作转瞬即逝,但所有人都能看出他的情绪。

柯洁输给AlphaGo后落泪(图片来源:达志)

那些泪水引发了人们对柯洁的同情与支持。在这三局比赛中,柯洁流露出了人类起伏的真实情绪——自信、焦虑、害怕、希望和心碎。这展现了他的拼搏精神,我也看到了真正的爱——出于对围棋、围棋历史,以及对这项游戏纯粹的爱,他愿意与无法战胜的对手缠斗。看了柯洁比赛的人,也对他报以同样的爱意。AlphaGo获得了比赛的胜利,落败的柯洁却成了人们心目中的斗士。在人们相互之间的爱意中,我窥见了人工智能时代寻找工作与生命意义的希望。

我相信,如果能用好人工智能技术,中国就有赶上甚至超越美国的机会。更重要的是,这还会让人们有机会看清身为人类的真正意义。

首先得从了解这项技术的基本原理,以及它将如何改变世界开始讲起。

深度学习发展简史

机器学习(machine learning,涵盖深度学习的一个人工智能技术领域)是一项改变历史的技术。这项技术历经了半个世纪纷乱无章的探索研究,最终幸存下来。自问世以来人工智能几经兴衰,每当人们以为看到了希望,紧接着就会迎来“人工智能寒冬”——由于缺乏落地的应用成果,导致研究经费大减。要了解深度学习为何能带来不同于以往的发展,就要回顾人工智能是如何走到今天的。

20世纪50年代中期,人工智能的先驱者们为自己制订了一个极其宏大且定义明确的使命:在机器上搭建人类智能。这项结合了明确目标与复杂任务的使命,吸引了新兴的计算机科学领域中最杰出的人士如马文·明斯基(Marvin Minsky)、约翰·麦卡锡(John McCarthy)、赫伯特·西蒙(Herbert Simon)。关于人工智能的这一切使一个1979年年初进入哥伦比亚大学计算机科学系的学生大开眼界,引发了这名学生对人工智能未来的无限遐想。

我在1961年出生于中国台湾,11岁时移居美国田纳西州,在那里完成了初中及高中学业。在哥伦比亚大学取得学士学位后,我决定开始钻研人工智能,同时申请了卡内基·梅隆大学计算机科学系的博士,那里是世界人工智能尖端研究的温床。1983年,我在博士生研究计划中针对这个领域写下了一段初生牛犊般的宣言:

人工智能是人类学习过程的阐明,人类思考过程的量化,人类行为的解释,以及对智能原理的了解。它是人类了解自身的最后一步,我希望投身这门新的、有前景的科学。

这段让我得以进入计算机系攻读博士的文字,显示了当时我对这个领域天真的理解:既高估了我们人类了解自身的能力,也低估了人工智能在特定领域产生超人智能的能力。

我开始攻读博士时,人工智能领域已经分化为两个阵营:其一是规则式(rule-based)方法,其二是神经网络(neural network)方法。规则式人工智能系统有时也称为符号式系统(symbolic systems)或专家系统(expert systems)。之所以称“专家系统”,是由于该阵营的研究人员认为,要使人工智能软件更好地适应现实世界,必须将相关领域的人类专家的智慧编写进软件。他们用一系列写好的逻辑规则来教导计算机如何思考,如“若X,则Y”。这种方法很适用于简单且定义明确的游戏(所谓的“玩具问题”——toy problems),但是当可能的选择或操作数目大增时,这种方法就行不通了。

“神经网络”阵营则另辟蹊径,他们不把人脑熟稔的逻辑规则传授给计算机,而是干脆在机器上重建人脑。科学研究结果已经得知,动物的智能只有一个源头——动物脑部错综复杂的神经元网络,于是这个阵营的研究人员决定从根源做起,模仿人脑结构,构建类似生物神经元网络的结构来收发信息。不同于规则式方法,人工神经元网络的建造者通常不会给人工智能系统设定决策规则,而只是把某一现象(图片、国际象棋赛、人声等)的大量例子输入人工神经元网络,让网络从这些数据中学习、识别规律。换言之,神经网络的原则是来自人的干预越少越好。

用这两种方法处理某个简单问题如“辨识一张图片里是否有猫”,就可以看出它们的差别。规则式方法确定以“若X,则Y”的逻辑规则来帮助程序做出决策:“若一个圆形物体上方有两块三角形,那么,这张图片中可能有一只猫。”神经网络方法则是把数百万张标示了“有猫”或“没有猫”的样本图片“喂”给计算机系统,让它自行从这数百万张图片中去辨察哪些特征和“猫”的标签最密切相关。

20世纪50年代到60年代,早期的人工神经网络获得了乐观且让人振奋的成果。但到了1969年时,规则式阵营予以还击,使得很多研究人员认为神经网络法不可靠且用途有限。神经网络方法很快“退烧”,人工智能随之在20世纪70年代陷入了早期的寒冬。

接下来数十年,神经网络方法在短暂的时间内恢复了一些声望,但后来又几乎被完全放弃。1986年,我使用一种近似神经网络、名为“隐马尔可夫模型”(Hidden Markov Models)的方法,建造出世界上第一套非指定语者连续性大词汇语音识别系统Sphinx。(5)这项成就使我登上了《纽约时报》(The New York Times)(6),该系统也被《商业周刊》(Business Week)评为年度最重要创新产品,但这并没有改变神经网络法再度失宠的命运,几乎在整个20世纪90年代,人工智能再度陷入了冗长的寒冬期。

1988年《纽约时报》专文报道:《和机器对话》(Talking to Machines

最终使神经网络法复活,并让人工智能再次复兴的,是神经网络系统赖以存在的两项要素出现的变化,再加上一项重大的技术性突破。神经网络需要大量的计算机运算力及数据:大量的样本数据输入系统,以“训练”程序去辨识形态,计算机运算力则让程序得以高速分析样本数据。

人工智能问世的20世纪50年代,数据来源不多,运算力也不强。互联网的崛起带来了海量的数据:文本、图像、视频和点击、购买的数据等。如此多的数据,成了研究人员手中源源不绝的试验材料,用来训练他们构建的人工神经网络。同时,他们可以使用的运算力也变得又强大又便宜。例如你手中智能手机的运算力,甚至比美国国家航空航天局1969年登月计划中最先进计算机的运算力还高出几百万倍。这两项变化结合起来,为神经网络法的发展提供了优良条件。

不过,人工神经网络能做的事仍然非常有限。复杂问题若要得出准确的结果,必须构建很多层的人工神经元,但神经元层数增加后,研究人员当时还未找到针对新增神经元有效的训练方法。在21世纪头10年的中期,深度学习这项重大的技术性突破终于到来,知名研究人员杰弗里·辛顿找到了有效训练人工神经网络中新增神经元层的方法。这就像是给旧的神经网络打了一针兴奋剂,使它们的能力倍增,可以执行更多、更复杂的工作,例如语音及物体识别。

性能大增的人工神经网络——现在有了新的名字“深度学习”——开始把旧的系统远远甩在身后。多年来对神经网络根深蒂固的成见让人工智能的许多研究人员忽略了这个已经取得出色成果的“边缘群体”,但2012年杰弗里·辛顿的团队在一场国际计算机视觉竞赛中的胜出(7),让人工神经网络和深度学习重新回到聚光灯下。

在边缘地带煎熬了数十年后,以深度学习的形式再次回到公众视野中的神经网络法不仅成功地让人工智能回暖,也第一次把人工智能真正地应用在现实世界中。研究人员、未来学家、科技公司CEO都开始讨论人工智能的巨大潜力:识别人类语言、翻译文件、识别图像、预测消费者行为、辨别欺诈行为、批准贷款、帮助机器人“看”,甚至开车。

揭开深度学习的面纱

深度学习是怎么做到的呢?本质上来说,深度学习的算法使用了大量来自特定领域的数据,为想要的结果做出最佳决策。其方法是让系统使用这些输入的数据,训练自己识别数据和期望结果之间的关联性。当数据与期望结果直接相关(“猫”vs“非猫”,“点选”vs“未点选”,“赢了赛局”vs“输了赛局”)时,这个流程就容易多了。然后,算法可以运用找到的这些关联性所累积的庞大知识(其中很多是人类看不到或觉得无关的),做出比人类更好的决策。

这么做需要大量的相关数据、强大的算法、足够细化的领域以及明确的目标,欠缺任何一个都无法成功。数据太少则样本不够,算法无法发现有意义的联系;但如果目标太广泛,算法则缺乏衡量最优解的明确标准。

深度学习是所谓的“狭义人工智能”(narrow AI,或译作“弱人工智能”)——仅用于在特定领域能做出决策、预测和分类的人工智能应用。这已经能产生巨大价值,但仍远远未成为科幻片里的“通用人工智能”(general AI,或译作“强人工智能”)——人类能做的,人工智能都可以做。

深度学习最自然的应用领域是保险、贷款之类的金融业务,因为借款人的相关数据非常多(信用评分、收入、信用卡近期使用情况等),而最优的目标(降低还款违约率)很明确。更进一步的话,深度学习还可以进行自动驾驶,帮助车辆“看”到行驶的路况,如识别像素组成的形状(比如红色圆形),判断它和什么有关(比如红灯“禁行”),以此信息来做出决策(刹车并停车),以达到期望的结果(用最少的时间把我安全送到家)。

人们听到深度学习就兴奋,是因为它的核心能力——识别规律、得出最优解、做出决策可应用在很多日常问题上。所以,包括谷歌、Facebook在内的许多公司争相出高薪聘请为数不多的深度学习专家,开展它们雄心勃勃的研究计划。谷歌在2013年收购了杰弗里·辛顿的创业公司,翌年又斥资超过5亿美元,买下英国的人工智能创业公司DeepMind,运用其技术开发出了AlphaGo。(8)这些行动无不让众人惊叹,同时也成了媒体的焦点。它们改变了当代文化思潮,让我们意识到人类正站在一个新时代的边缘:在这个新时代,机器的能力将赋予人类更强大的能力,但也可能会大规模取代人力。

人工智能新时代,谁能保持领先

在这一切变化之中,中国处在什么位置?深度学习这项技术从诞生到婴儿期的发展,几乎全都发生在美国、加拿大和英国。之后,有一小部分中国创业者和创投基金(包括创新工场在内)开始投资这个领域,但直到2016年中国的“斯普特尼克时刻”到来之前,绝大多数的中国科技界人士都尚未察觉深度学习革命的到来,这整整比该领域突破性学术论文的发表落后了10年,也比这项技术在国际计算机视觉竞赛中得到证明晚了4年。

美国的大学和科技公司由于数十年来都能够吸引到全球各地的人才,从而获取了巨额利润。人工智能的发展似乎也不例外,美国好像又要遥遥领先,尤其是聚集在硅谷的顶尖研究人员,可以利用硅谷丰沛的融资环境、独特的文化和群聚的产业龙头来发展和研究人工智能。在华尔街分析师眼里,中国科技业在未来的全球人工智能发展与应用中,注定要继续扮演数十年来一直保持的角色:一群被尖端领导者远远甩在身后的模仿者大军。

在后边各章我会说明这样的看法是错误的。这是基于对中国科技环境的过时假设,也在根本上误解了人工智能革命背后的主要动力。西方国家点燃了深度学习的火炬,但最大的受益者将会是中国,这种全球性的变化是由两方面转变引起的:从发明的年代转变为实干的年代;从专家的年代转变为数据的年代。

许多人之所以误认为美国在人工智能领域具有重大优势,主要是因为他们还停留在我们生活在“发明的年代”的印象中:在发明的年代,人工智能的顶尖研究人员不断打破旧有典范,最终破解存在已久的谜题,媒体不断报道人工智能的最新成就,更是助长了这种印象。例如在某些癌症的诊断上,人工智能做得比医生更好;在德州扑克的人机大赛中,人工智能击败了人类冠军;不用人为干预,人工智能就自己学会并精通新技能等。媒体如此关注报道人工智能的每一项新成就,也难怪一般观察者甚至是专业分析师会认为人工智能研究将不断获得突破性的新发现。

我认为,这种现象有误导作用,因为在这些“新里程碑”中,很多成就其实只是把过去10年的技术性突破应用到新问题上,其中主要是深度学习,但还有一些互补的技术,例如强化学习(reinforcement learning)和迁移学习(transfer learning)。研究人员做这些事,需要卓越的技能和深度的专业知识,不仅要有能力思考、撰写复杂的数学算法,还要能够处理巨量数据,针对不同问题调整人工神经网络。这往往需要博士级的专业知识技能,但这些发展都不过是依赖着深度学习这项科技的大发展所做的渐进式改善和优化。

实干的年代

这些渐进式的改善和优化,其实是把深度学习在模式识别与预测上的强大能力应用到种种不同的领域上,如疾病诊断、核发保单、开车、中英翻译等。但这些改善和优化并不代表我们正在朝着“通用人工智能”的方向快速前进,或是出现了类似深度学习的重大技术性突破。简单来说,人工智能正式进入了实干的年代,想要利用这个时期赚钱的公司,需要拥有有远见和才干的创业者、工程师和产品经理。

深度学习的先驱吴恩达认为,人工智能类似于第二次工业革命中电力的发明(9),本身是一项突破性的技术,一旦被大幅采用,就能革新许多不同的产业。就像19世纪的创业者很快学会运用电力烹饪食物、照亮房间、启动工业设备,今天的人工智能创业者也运用深度学习来落实各种创新应用。人工智能许多抽象的研究工作大都已经完成,研究中遇到的困难大都也已解决,现在是创业者“撸起袖子加油干”,把深度学习算法转换为持续经营的事业的时候了。

当然我绝对没有对基础研究泼冷水的意思。唯有真正落地应用于生产生活中,学术研究才能变得有意义,才能真正改变我们的日常生活。实干的年代指的是在历经数十年看似前景不错的研究之后,我们终于能看到人工智能在真实世界中开始运用,这是我在成年后一直期盼看到的场景。

我要表达的是只有分辨清楚发明的年代与实干的年代,才能理解人工智能将如何影响我们的生活,以及什么力量(或哪个国家)将主导人工智能的发展。在发明的年代,所有重要的成就主要是由少数几个顶尖思想家所驱动的,他们几乎全部聚集在美国和加拿大,他们的研究洞察力和独特的知识创新,引领电脑科学与人工智能产生了重大的突破。自从深度学习出现以后,目前还没有其他领域的研究人员或工程师达到过类似规模的创新。

数据的年代

数据量越大,研究人员的算法就越精准。

这就把我们带到了第二项重要转变的讨论上:从专家的年代转变为数据的年代。现今,成功的人工智能算法需要三样东西:大数据、强大的电脑运算能力,以及优秀(但未必顶尖)的人工智能算法工程师。想在新领域善用深度学习的能力,这三者都是必要的。但在实干的年代,这三者当中最重要的还是数据,因为当电脑的运算能力和工程师的能力达到一定门槛水准之后,数据量的多寡就成为决定算法整体效能与精准度的关键所在。

就深度学习而言,数据量越多越好。人工神经网络获得的样本数据越多,就越能够正确识别出形态,准确辨认真实世界里的东西。如果“喂”入的数据量更多,即使是由一群中等水准的人工智能工程师设计出来的算法,表现也会比世界级顶尖深度学习研究人员设计出来的算法更好。情况已经不同,现在已经不再像以往那样,独家拥有顶尖的人才就能享有绝对的压倒性优势了。

不过,顶尖的人工智能研究人员,仍然有强大潜力把人工智能的发展推升至全新水平,但这类重大进展几十年才会出现一次。在我们等待下一项重大突破出现时,数据的快速成长和可取得性的提升,将是深度学习深刻影响世界各地无数产业的主要动力。

中国的优势

一个世纪以前,想妥善利用新发现的电力,需要四项要素:用来发电的化石燃料、电力领域的创业者、电力工程师,以及致力于发展公共基础设施的政府。今天,若想妥善利用人工智能的能力(即21世纪的电力),也需要四项要素:大量的数据、热切的创业者、人工智能科学家,以及对人工智能友善的政策环境。比较各国在这四项要素上的优劣,可以预测未来人工智能新世界的发展情况以及权力天平向哪边倾斜。

前述的两项转变——从发明的年代转变为实干的年代,以及从专业知识技能的年代转变为数据的年代,使得现在人工智能发展的竞争情况对中国有利,因为这两项转变弱化了中国的不足之处,强化了中国的优势所在。从发明的年代转变为实干的年代,弱化了中国最大的不足之一——研究问题采用脱离框架思考的方法,但强化了中国最重要的优势之一——国内有很多极具抱负、有敏锐头脑的创业者有机会创立强大的企业。从专业知识技能的年代转变为数据的年代,也为中国带来同样的好处:降低顶尖研究人员的重要性,这是中国所欠缺的;增强数据的重要性,这是中国所拥有的——中国有大量翔实的数据。

硅谷创业者被封为全美最卖力的工作者。年轻、热情的创业者召集了一群同样疯狂的有志之士,加夜班赶制出产品,然后不断地进行修正、迭代,同时关注下一波重要趋势的来临。我在硅谷和中国科技圈都待过几年的时间,曾经任职过苹果、微软、谷歌等公司,后来回到中国,致力于培育、投资中国的创新公司。硅谷创业者确实在非常卖力地工作,但我可以负责任地说,和太平洋彼岸的中国创业者比起来,硅谷创业者可以说是十分懒散的。

中国成功的互联网创业者,几乎都是从世界上最残酷的竞争中脱颖而出的,在他们的世界里,速度是创业者必备的特质,模仿与借鉴是可以接受的做法,竞争者为了赢得新市场的份额会想尽各种办法。在中国创业圈,每天都是血与火的试炼,就像古罗马竞技场上的斗士,不是你死就是我亡,竞争者之间毫不留情。

想在这种竞争中存活下来,唯一的方法就是不断地改良产品、革新商业模式,同时采取必要的保护措施。如果你唯一的优势只是一个创新点子,那么这个点子最后可能会被剽窃,你最重要的员工也可能会被挖墙脚,最后因为比不过其他获得了创投资金的同行而惨遭淘汰出局。如此激烈辛苦的竞争环境,和硅谷完全不同。在硅谷,模仿和借鉴别人的作品简直就是耻辱,很多公司崛起靠的就是一个原创的点子,或者刚好红运当头,在众多竞争者中顺利脱颖而出。在硅谷,缺乏竞争也许导致了相当程度的自满,创业者没有对初始创新进行所有可能的修正与迭代。中国在早期的模仿年代,确实产生了一些不体面的公司,但也培育出世界上新一代最敏捷、能干、吃苦耐劳的创业者。这些创业者将帮助中国成为第一个在实干的年代利用人工智能赚钱的国家。

这些创业者可以很容易获得中国科技界的另一项“天然资源”——多到爆炸的数据。中国已经超越美国,成为数据产量最多的国家,拥有的数据量多到惊人。同时由于中国独特的科技生态系统,这些数据似乎先天就是为了打造赚钱的人工智能公司而产生的。

5年前,直接比较中、美两国的发展很合理,网络公司的竞争就像赛跑一样,大致处于相邻的跑道上,美国稍微领先中国。但是到了2013年左右,中国互联网产业奋起直追,中国的创业者不再跟着美国公司的脚步前进,也不再一味模仿,而是开始研发硅谷没有的产品与服务。以往分析师常用类比形容词来描述中国的公司如“中国的Facebook”“中国的Twitter(美国社交网站)”等,但在过去几年,这样的类比不再适用,因为中国互联网产业已经成为一个平行宇宙。

中国的城市居民开始流行在真实世界用移动支付消费,刷手机条码付费,这样的移动支付革新在全球各地罕见。中国到处都可以看到外卖送餐员,或是其他上门服务人员(例如随叫随到的按摩师、打扫卫生的保洁员)骑着电动摩托车穿梭在大街小巷。这一批批的上门服务大军,代表的是“从线上到线下”(Online To Offline, O2O)的创新商业模式,将电子商务的便利性与真实世界的服务业串联在一起,从餐饮服务到微小的美甲服务一应俱全。在许多大城市街头还有几百万辆涂着鲜艳色彩的共享单车停在路边,供用户通过手机扫码使用。

中国有上百座城市可见共享单车(图片来源:视觉中国)

把这些服务串联在一起的是中国的超级移动应用程序——微信(WeChat)。对现代中国人的日常生活来说,微信像瑞士军刀一样用途繁多,非常便利。微信用户可以用手机发送短信息或语音信息给朋友,也可以购物付费、预约门诊、报税、租借共享单车、订机票等。微信已经成为全中国通用的社群app,用户可以建立不同的群组如工作群组、亲友群组、团购群组,或是其他兴趣组群。无论是工作管理、办生日派对还是讨论当代艺术等,一个app就可以搞定。在美国和世界上的其他国家,不同app通常有不同用途,微信则是把十几种功能统一在了一个app里。

用户通过微信app做财务规划

中国快速迭代的互联网王国,如今创造、搜集了真实世界的海量新数据,拥有非常丰富、详细的用户信息,如每天用户在何时身处何处、通勤的方式、喜欢的食物、什么时候会在哪里购物或喝啤酒等。这些丰富的数据在实干的年代是宝贵的资源,可以让各家人工智能公司详细了解用户的日常习惯,结合深度学习算法,为用户量身打造出从财务审核到旅行规划等各种不同的服务。这些深度学习算法得出的结果,会比硅谷顶尖公司从用户的搜索结果、用户点过的“赞”,或用户在各个平台上不定时消费所得出的用户习惯的总结更为精准。在不久的将来,这些巨无霸一般的真实世界数据,将会是中国公司发展人工智能服务的重要优势。

天平一端的重要推手

近年来,上文提到的强大优势让天平自然地倒向中国这一方。同时,中国政府也尽其所能,推动人工智能的发展。国务院发布的人工智能国家规划,承诺对人工智能研究提供全方位的支持,同时也会投入大量资金。但更重要的是,这项规划为各地方政府提供了明确指导,使得各个地方政府纷纷跟进,推出了支持人工智能发展的相关举措。中国的国家治理组织架构,远比多数美国人想象的更复杂,中央政府不仅会发出短期的全国性指令,也会设定长期的国家目标,并且大范围地动员人力物力来完成目标,如闪电般兴建的高铁网络就是一个很好的例子。

得到了国家规划的指示后,各地方政府领导人对人工智能热潮的反应,就好像田径运动员听到比赛枪响一般,铆足了力量全力竞争,颁布各种补助和优惠政策,争取更多的人工智能公司和创业者来本地发展。这场比赛才刚刚开始,对中国的人工智能发展将产生多大的影响,目前尚不确定,但不管结果如何,有一件事非常明确,那就是中国当前的人工智能发展势头明显和美国不同,美国政府对创业界刻意采取不干预的做法,而且正在削减人工智能基础研究的经费。

前面讨论的这两项转变——当今世界转变为了实干的年代和数据的年代,再加上中国如今拥有世界级的创业者和主动、积极支持人工智能发展的政府,这一切结合起来,使我相信中国在人工智能的发展与应用方面很快就会与美国匹敌,甚至超越美国。我认为,在人工智能应用上的领先,将转换为生产力的大幅提升,而且是工业革命之后最大幅度的提升。普华永道估计,到2030年人工智能的应用部署将为全球GDP增加15.7万亿美元,预估中国将囊括其中的7万亿美元,几乎是北美(囊括3.7万亿美元)的两倍。(10)随着经济的天平向中国倾斜,政治影响力和软实力的天平也将出现同样的情形,中国文化将伴随着人工智能的发展推广到世界各个角落。

面对新世界秩序的变革,最感到震惊的将是一路顺风顺水成长至今、对“美国主宰全球科技”这个印象习以为常的美国人。过去,我们大多数人的印象是美国科技公司推出一流的顶尖产品,向全球各地的用户传扬它们的价值。久而久之,美国的公司、一般大众和政府官员,自然会忘记被动接收那一方,也可以说是“科技的被殖民者”的感受。当然,中国无意运用当前所拥有的优势,成为人工智能时代的“科技殖民者”,但人工智能未来对世界政治、经济秩序的影响,将使世界各国体验到数字全球化产生的重大改变。

人工智能时代真正的危机

人工智能引起的中、美两国的科技发展变化固然引人关注,但是比起全球各地将产生的严重失业问题,以及分配不均的加剧(国内与国家之间),就不足为道了。随着深度学习应用的普及,人工智能势必会冲击全球经济,整个经济体系上上下下数十亿的就业机会如会计师、流水线作业员、仓储作业员、股市分析师、质检员、货车司机、律师助理、放射科医生等,都会受到冲击,上述工作只是其中的一部分。

人类文明过去曾经成功地消弭了科技对经济造成的冲击,例如在19世纪和20世纪,有数亿的农民成功地转为了工厂员工。但是,先前的那些重大科技变迁,从诞生到发展的速度没有人工智能这么快。照目前科技发展和应用的趋势来看,我预估在未来15年内,人工智能将会减少美国40%到50%的就业机会,但实际的就业损失还会延迟若干年,因为必须考虑到很多现实因素,例如雇主相信人工智能的程度、法规限制等。但我预测,人工智能对就业市场的冲击将会非常大,而且冲击很快就会到来。

我们必须担心的不只是严重的失业问题,还有未来庞大财富将落入新崛起的人工智能巨擘手中,导致财富分配严重不均衡的问题。Uber(优步)是当今世界上最有价值的创新公司之一,虽然它将每趟载客收入的约75%分给司机。如果再过几年,Uber可以用自动驾驶技术取代所有的人类司机,那么该公司的价值将会变得多么惊人?再比如在核发贷款时,由于算法核贷的能力更高明、贷款的违约率更低,而且完全不用人类干预,如果银行能用算法取代所有的贷款专员,又会发生什么事呢?这不是想象中的情节,类似的转变很快就会大规模发生在货运业、保险业、制造业、零售业等各种产业中,有些变化已经在小范围进行当中了。

还有一点值得注意,人工智能产业倾向于“赢家通吃”,这种倾向将会加剧获利与财富集中的问题。深度学习与庞大数据量的密切关系,会自动形成一种良性循环,不断增强最好的商品与公司的力量——数据量越多,就会产生越好的商品;商品越好,就会吸引到更多用户;用户越多,就会产生越多的数据;更多的数据又能进一步改善商品。顶尖的公司把充足的数据量与资本结合起来,就能吸引到顶尖的人工智能人才,进一步扩大产业领先者与落后者之间的差距。

良性循环的人工智能生态系统

过去,实体商品是主流,再加上地理上的限制,都有助于抑制厂商在消费市场中的垄断能力(美国的反托拉斯法当然也有助益)。但在未来,数字产品与服务占消费市场份额的比例将会持续扩大,自动驾驶车辆和无人机将使送货成本大幅降低,产业营收获利分散在不同公司和区域的情况将会改变,我们开始看到营收和获利会越来越集中在少数几家公司,同时失业人群的长龙将会排得更长。

人工智能时代的新世界秩序

财富分配不均的问题不会局限在各国国内,中、美两国在人工智能领域的发展,已经领先其他国家一大截,形成了新一代的两极世界科技秩序。其他国家如英国、法国和加拿大等,也有顶尖的人工智能研究实验室以及非常优秀的人工智能人才,但它们没有创投生态系统和足够庞大的用户群,无法产生实干的年代所需要的庞大数据。随着中、美两国的人工智能公司聚集更多的数据和人才,由庞大数据所带动的良性循环逐渐成形,这些公司的领先幅度会持续扩大到无法超越的地步。中、美两国正致力孵化日后将称霸全球市场的人工智能龙头企业,而这些龙头企业将会把全球消费者的财富揽入怀中。

与此同时,工厂内的人工智能自动化,将会大量破坏发展中国家具有的优势——大量廉价劳动力的存在。由机器人操作的工厂,可能会搬到更靠近大型市场所在的地点,让日本和新加坡发展高收入、科技导向经济体的路径消失无踪。结果就是全球的贫富不均持续扩大,而且目前没有任何已知的方法可以消弭这种落差。

人工智能时代的世界秩序,将会结合下列因素进一步发展:“赢家通吃”的经济,财富空前集中在中、美少数几家公司。我认为,这才是人工智能造成的最大的潜在威胁,因为严重的失业和财富分配不均问题将会造成社会不稳定。

就业市场和整个社会的不稳定,背后是更加个体性质的人性危机——个体丧失了人生目的。许多年以来,人类以工作度日,用时间和汗水换得温饱、居有定所,由此建立了根深蒂固的文化价值观。很多人已经习惯从日常工作中找到自我存在的价值,人工智能的普及将会挑战这些人类价值,有可能在很短的时间内摧毁很多人的人生目的,让他们短时间内失去依靠。

这些挑战非常严峻,但并非无法克服。这几年,我自己就在生死关头走了一回,对生命的意义产生许多省思。罹癌的经验改变了我,打开了我的视野,让我预见到解决人工智能带来的失业危机的潜在方法。想要解决这些问题,需要清醒地分析,了解到对个体的生命而言,什么事情最重要,而这需要一些深层的哲学思考,对身心而言都是一项修炼功课。在本书最后的章节里,我会分享对人类如何在人工智能时代与机器和平共处,甚至借助人工智能发展得更好的看法。

想要在科技发展、社会进步和人类的生活水平提高上取得成功,我们得先了解我们是如何走到今天这一步的。首先,必须回到15年前,那个硅谷睥睨全球,自豪地站在科技的最前沿,而中国则刚刚起步,处于模仿和借鉴阶段的年代。


(1) Cade Metz, “What the AI Behind AlphaGo Can Teach us About Being Human”, Wired,May 19, 2016, https://www.wired.com/2016/05/google-alpha-go-ai/.

(2) 《国务院关于印发新一代人工智能发展规划的通知》,中国政府网,2017年7月8日,https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm。

(3) 数据源自知名大数据调查机构CB Insights《2018年人工智能趋势报告》,报告下载地址:https://www.199it.com/archives/693759.html?from=groupmessage。

(4) Kaifu Lee, Sanjoy Mahajan, “The Development of a World Class Othello Program”, Artificial Intelligence 43, no. 1 (1990-04): 21—36.

(5) Kaifu Lee, “On Large-Vocabulary Speaker-Independent Continuous Speech Recognition”, Speech Communication 7, no. 4 (1988-12): 375—379.

(6) John Markoff, “Talking to Machines: Progress Is Speeded”, New York Times, July 6,1988,https://www.nytimes.com/1988/07/06/business/business-technology-talking-tomachines-progress-is-speeded.html?mcubz=1.

(7) “ImageNet Large Scale Visual Recognition Challenge 2012”, Full Results, https://imagenet.org/challenges/LSVRC/2012/results.html.

(8) Catherine Shu, “Google Acquires Artificial Intelligence Startup for Over $500 million”,TechCrunch, January 26, 2014, https://techcrunch.com/2014/01/26/google-deepmind/.

(9) 吴恩达:《AI是新的电力》,2017年8月8日,https://bbs.pinggu.org/thread-5998776-1-1.html。

(10) Dr. Anand S. Rao, Gerard Verweij, “Sizing the Prize”, PricewaterhouseCoopers, June 27, 2017, https://www.pwc.com/gx/en/issues/analytics/assets/pwc-ai-analysis-sizing-the-prizereport.pdf.