陆氏猜想
20世纪80年代是所有亲历者难以忘怀的理想主义年代,那时候中国全体人民追求科学进步,对知识如饥似渴。尤其在校园里,大学生读书如痴如狂。陈景润[1]一类的科学家成为很多人的偶像。
1987年,在复旦大学的校园里,有一个和陈景润一样瘦削、戴着大框眼镜的青年,每天背着一个很大的书包行走在校园里,精神抖擞,喜欢思考在外人看来很玄奥的问题,同学们都喊他“陈景润”。
毕业的时候,他在毕业纪念册上写下了临别赠言:
谨献上本人最新研究成果,与列位同窗惜别。
“陆氏猜想”:HI=>C∪HB
(式中:H:Human I:Intellectualized
C:Computer B:Brain)
其意:人类终将使电脑智能化且使其远胜人脑。诸公不妨一效景润,或许,这颗电脑科学皇冠上的明珠非君莫属。
他是陆奇,后来的雅虎、微软领导者,今天的百度集团总裁。
“陆氏猜想”当然不是一个“陈式猜想”那样的科学定理,却也不是一句戏言,今天来看,更像是一句超前的顿悟。30年前就写下这样的话,信心来自哪里?
图2-1 陆奇于复旦大学1984届计算机科学系毕业纪念册上的临别赠言
那时的陆奇只有一个朦胧的感觉:“计算机给我们带来非凡的知识和体验。当时我们在计算机系写下棋程序,虽然是很简单的棋,给我的直觉就是,只要给我们足够的时间,以后一定可以做得比人更聪明,我当时有这样的直觉,所以我就这样写了。之后不久,我遇到一个难得的机会去卡内基梅隆大学计算机系深造。”
陆奇的个人信念是:知道更多,做到更多,体验更多。
从卡内基梅隆大学毕业时他写的是“Know more,Do more”。后来加了一句,变成“Know more,Do more,Be more”。因为他觉得“Be more”更重要,只是当时没有意识到。“Be more”也可以翻译成“成为更多”。人就是“在路上”,不断成为更丰富的存在。
就是这三个需求有机联系在一起,推动人类向前进步。人类的历史就是不断地去发现新东西,我们知道越多,就可以做到越多,我们做到越多,就可以体验越多,生活就会越来越丰富充实。正因为体验更多,我们才会知道更多,这是一个正循环,是人类进步的主旋律。
计算机让我们“Know more,Do more,Be more”,而人工智能就是这个旋律的最新回响。从这个角度去思考,我们可以比较清楚地洞察人工智能从哪里来,往哪里去,它的本质和标准究竟是什么,有志于人工智能事业的人和组织到底应该做什么。
下一个浪潮
我们正在见证的是一个计算机和数字化崛起的时代,这是人类历史大潮中持久的、必经的一个过程。而人工智能是将大潮推向下一个高点的动力。它将开辟一个新时代,给我们的社会带来持久的、长远的革命性影响。这样的影响涉及产业、技术等经济、社会各个层面。但是说到底,这一次人工智能革命将让我们人类整体用完全不同的方式往前走,书写崭新的历史。
首先,我们需要了解“人类进步”的本质——我们为那些能让我们认知更多,实现更多,获得更多经验的事情充满热情地奋斗。
而计算能力的不断发展,正是遵循着上述人类进步的方向,成为人类进步的本质表现。尤其是在计算机编程出现后,人类的进步开始前所未有地加速。其核心模式包括以下关键步骤:人类捕捉宇宙中的各种现象,特别是通过有意地观察获得经验;然后通过计算,将信息有效地组织、处理、提炼,使人类对某个现象进行更深入和抽象的理解,形成知识;人类利用产生的知识认知来采取行动,与现象进行交互,最终实现我们预期的结果。
可以看出,以现代数字计算系统为基础,IT(信息技术)行业在创造数以万亿元计的价值时,正是从组织信息(Information Organization,IO,帮助人类认知更多)、完成任务(Task Completion,TC,帮助人类实现更多)、丰富经验(Experience Enrichment,EE,帮助人类获得更多经验)三个核心维度上使人类取得长足的进步。
而人工智能作为人类计算能力的又一次全新升级,仍然是从上述三个纬度推动人类进步。而且,由于人工智能是一种革命性的、更高级别的智能计算系统(Intelligent Computing System,ICS),它对人类进步的推动作用也是前所未有的、革命性的。
决定现代数字计算系统主要结构的是资源的组织形式。而人工智能计算的本质,简单来说,非常不同于冯·诺依曼的控制流结构,后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算,其特征在于分布式的表示和激活模式。在这里,变量由叠加在共享物理资源(如神经元)上的向量表示,并且通过神经元的激活来进行计算。网络的拓扑架构和激活模式提供了巨大的计算空间,可以有效并且自然地捕获丰富的知识(通过拓扑的超参数、权重、激活函数)。相对于冯·诺依曼架构中的本地化表示(其中变量由诸如寄存器的专用或局部化物理资源表示)和符号计算,神经网络计算在学习和表示物理世界以及社会的丰富的语义知识方面更加自然和强大。
通过神经网络计算的力量,下一波的人工智能技术可以在以下两个维度提升目前的计算系统:
一是自动分层特征/表示学习。这是机器学习容量的实质性提升,因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已经拥有万亿级的参数、千亿级的样本和千亿级的特征训练。
二是高级认知,特别是感知能力。这是下一代设备(如无人驾驶汽车)和下一代平台(如自然语言会话)产生的巨大催化剂。
人工智能计算的强大能力将有助于产生许多新品种的智能系统,如机器律师、机器分析师、医疗机器人、智能客服人员等。
人工智能计算的另一个发展方向是组织各种服务于特定物理架构和物理要素的系统,如家、办公室、工厂等的智能系统。其基本模式是通过使用物联网传感器的各种原始信号,人工智能的“感知系统”会对物理架构进行识别和感知;而“认知系统”需要组织信息和学习更多关于物理架构的知识,并去预测、判断和决策,以使各类物理系统更加智能。
目前,在科研领域,人工智能计算可以提供更先进的建模能力,成为多领域和新一波科研浪潮的催化剂。
在商业方面,人工智能可以提供额外的机会,为企业组织创建集成的业务计算系统(Business Computing System,BCS)平台。如记录业务对象(如系统设计模型、交易记录)和业务流程[如ERP(企业资源计划)、CRM(客户关系管理)];或者系统设计并模仿人类工作活动,如沟通、协作、阅读、写作、寻求信息等。
目前来说,人工智能的“感知系统”有更广泛、更新的商业机会:一方面,可以构建和部署更多的“传感系统”的子系统,针对的是物理环境或物理系统,如装配线、工厂等。这使得未来人力密集的制造业、商业服务业等,可以采用更先进的信息工具和更强的自动化。另一方面,自然语言处理技术的迅速进步使得我们可以扫描和分析文本文档和信息,并从中提取各种高价值的业务知识,而构建和部署专用的“文本理解子系统”可以得到很多高价值的知识和商业回报。
人工智能“认知系统”的成熟代表了智能时代更长远的未来,所有的行业、职业、社会系统、生活方式都将被重塑。如果数字化社会可以概括为“信息就在指尖”,那么,人工智能时代的本质可以概括为“知识无处不在,任何交互都是智能的。”
这个浪潮对大多数人来说无疑是巨大的机遇。
对商业机构来说:好消息是它们将有许多提升、转化和进入新的增长领域的机会;坏消息是当大浪潮席卷时,没有谁可以岿然不动,如果你没有抓住前进的机会,你就会落后,甚至被时代抛弃。
对企业家来说,仅看一看“巨大市场机遇”的列表,就可以发现许多创造未来商业巨头的机会,彰显企业家精神的智能创业的历史机遇就在眼前。同时,属于智能时代的新的企业领袖也将由此诞生。
对投资人来说,睁大眼睛去发现一个属于智能时代的种子企业,支持它成长为未来的企业帝国,并获取巨额回报的机遇真的来了。
对于国家或政府来说,每一次巨大的技术革命,总是伴随着国家命运的兴衰交替。总有一些国家或政府能抓住历史赐予的机会,一跃而上,赢得一个相当长时期的昌盛国运。要想抓住这样的历史机遇,国家或政府层面决策、政策的前瞻,战略投入的坚决,路线执行的科学有效,都至关重要。
当然,当越来越多的人感知到了人工智能的浪潮,越来越多的创业者投身于这个浪潮时,也难免会有浪潮将起阶段的困惑。
在硅谷,大家都说以后要投资的都是AI+X。比如有一家专投人工智能的投资公司,纽约市前市长布隆伯格是其合伙人(LP),看了几百家公司,看得有点晕了,因为所有的创业公司都在宣称自己是人工智能的公司。对这家投资公司来说,首要的问题就是,如何来进行鉴别,以便有针对性地投资。这促使我们开始深入思考,人工智能企业的标准是什么?哪些是真正的人工智能公司,哪些不是。
衡量人工智能的现实标准
人类历史上,每一项新技术的出现,必然会伴随着各种探讨、反思甚至针锋相对的争论。面对人工智能这一带有全局性、革命性的技术浪潮的逐步兴起,人们的兴奋、质疑以及顾虑就更加多元化。其中有的比较感性,比如讨论人工智能会不会代替人类。这其实是在用人工智能与自然智能(Natural Intelligence)进行比较。
对于自然智能,有各种各样的研究和著作,包括有人提出人脑内部的机理其实是量子计算。对于人工智能,目前还没有一个大家都能够接受的定义。在这个阶段,没有必要去过分追求哪个标准定义比较正确。我们不妨务实地来讨论:现在的技术能允许我们做出什么样的智能体系。
有两种类型的计算系统被人类叫作人工智能。
第一种,本质上相当于“智能计算系统”(ICS)的子系统框架。它将数据作为输入,从数据中提取信息并建立模型,将我们关心的某些现象转化为知识。我们称这种类型的人工智能系统为“通用智能系统”(General AI),并定义“通用智能”的意思是一台机器获取知识和实现目标的能力。
第二种,指具有类似人类的认知能力,能感知(“看”“听”“感觉”),它们可以越来越多地推理和计划,它们可以用感觉运动控制移动。我们称这种类型的人工智能系统为“认知智能系统”(Cognitive AI),是具有感知、推理、规划和感觉运动控制能力的机器。
人工智能系统的另一个二分法是“狭义AI”(Narrow AI)和“广义AI”(Strong AI)。“广义AI”是使用相同的算法来解决一大类问题的系统。原则上,“广义AI”系统可以学习和适应以解决新的问题,而无须人为干预。“狭义AI”系统使用特定算法来解决特定问题,如下棋、识图等。
总而言之,表2-1是对人工智能系统状态的概述,并且是一个务实和可行的定义。
表2-1 人工智能系统状态
智能计算系统与大数据是直接相关的。任何数据都有产生的缘由,都有产生数据的体系和系统,这就是为什么数据会产生,数据的核心是知识。
通用人工智能系统的核心能力就是通过运用算法、计算体系,把知识从数据里提取出来。一旦有了知识,我们就可以做很多事情。我们可以预测,可以解决自动化问题,可以解决任何需要解决的问题。因为知识告诉我们人有什么需求,社会有什么要求,有了知识我们就可以找到答案。所以,人工智能发展的第一个层次就是通用人工智能。
最近几年深度学习的突破主要是在感知层面,特别是视觉和语音识别,还有自然语言的理解。但这只是起步,接下来要做的是认知上的,因为感知只是把外部世界通过光感、声音的振动,或者语言的交流,变成可以被系统识别的符号。最重要的还是理解它的意义是什么。系统看到一幅图片,可以知道有什么样的物体或人在里面,他们在做什么事情。
目前几乎所有能见到的做人工智能的公司可以分别放在四个象限里面。大部分公司做的其实是“狭义AI”。“狭义AI”只解决一个问题,或者解决一个到两个比较窄的问题,下围棋、打牌或者开汽车都是“狭义AI”。与之相对应,“广义AI”用同样一个系统,可以解决所有的问题,那就与人的智能类似了。“广义AI”是人工智能发展的长期目标,其真正实现至少还需要二三十年的时间。
现在,百度、谷歌、微软、脸书等公司都在朝着“广义AI”的方向努力。判断人工智能的能力,或者判别是否真正是人工智能的标准仍然是,人类是否因此知道更多,做到更多,体验更多。比如,百度基于海量的搜索数据做的很多技术分析,以前靠人去做几乎不可能,而现在通过人工智能计算技术,我们得出了许许多多前所未有的知识和结论,人类因此而知道更多,也能因此去做很多前所未有的判断,去实现更多不可能的功业。如具有代表性的无人驾驶技术、自然语言交互技术,使得人类的运动方式、感官方式都在逐渐发生变化。以前人类用眼睛来看、用耳朵来听,以后我们可能不需要眼睛也可以看到,不需要耳朵也能听到,人类将逐步拥有新的感知方式,也将体验崭新的世界。
因此,一切做人工智能的公司是否名副其实,都可以从以上角度来衡量:它属于四个象限中的哪一块?有没有实力让人类和机器一起知道更多,做到更多,体验更多?
美国和中国都有很多公司说自己是人工智能公司。有的公司说云计算是人工智能,有的说大数据是人工智能,但这些都只是人工智能系统的一部分,最终判断人工智能实力的是大数据、云计算、算法、训练时间及其总投入以及软硬件综合实力等。
这种实力不是一蹴而就的,也无法一概而论。地上本没有路,在披荆斩棘的道路上有不同的角色,也有不同的站点,每个人、每个企业达到的程度都不一样。有人刚起步,有人身后已经留下大片果实。
百度大脑可以看作人工智能综合实力的一个典型,对它的能力分解,能使我们更明晰人工智能行业的入门门槛及基本标准。如果一家号称人工智能的公司以下能力皆不具备,那只能说这家公司还没准备好真正进入这个领域。
百度大脑是硬件基础、数据基础和算法能力的紧密结合,是云计算、大数据和人工智能的三位一体,是百度技术战略的核心。云计算是基础设施、大数据是燃料、人工智能是发动机,联合驱动着“互联网的物理化”,将数字世界的互联网技术和商业模式又送回到物理世界,全面改变社会。
云计算,名字在云端,却是百度大脑最底层、最实体的部分,是IaaS(Infrastructure as a Service,基础设施服务)。
百度大脑的超强计算能力就来源于这一层,是高性能计算硬件的集团军。这个集团军拥有数十万台服务器,并且采用先进的集群操作系统来统一管理,堪称人工智能超级计算机。
为了深度学习训练的需要,百度自主研发了GPU和FPGA(现场可编程门陈列)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;百度开创性地研制了基于FPGA的人工智能处理器,提供10Tops的计算性能,相对主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可以达到普通服务器4~8倍的性能。
但百度的优势不只是单台机器的优秀,更在于优良的系统,优秀个体的集成形成强大的总体作战能力。针对GPU集群的智能调度和资源管理系统,可以实现计算、存储和网络资源的池化管理和动态调度,计算集群整体效率和平均使用率达到80%。将异构硬件用于线上产品,用户请求时延降至1/5,计算效率提升数十倍。
这个系统涵盖了国内最大的GPU/FPGA集群(全新的芯片技术),最大的HADOOP/SPARK集群(全新的并发数据处理技术)和运营效率最高的数据中心[全新的异构计算技术、整机柜服务器技术、100G RDMA(远程直接数据存取)通信技术和运维技术],可谓马力十足,提供了开发人工智能所需的计算能力。
它同样燃料充足。基于多年服务于大规模业务,比如通过搜索和视频技术,百度积累了大量的数据:万亿级网页数据,数十亿次搜索数据,百亿级视频、图像和语音数据,百亿级定位数据等。数据就是人工智能算法的燃料,是发展人工智能的又一基础条件。
让硬件与燃料结合的是优秀的算法和模型。百度汇聚了全球顶级科学家和工程师,在理论和实践方面持续创新,搭建了全球最大的深度神经网络,支持万亿级参数、千亿级样本、千亿级特征训练,神经网络层数远远突破100层。
硬件动力、数据燃料和算法灵魂的结合,才产生出百度的PaaS(Platform as a Service,平台服务)。百度PaaS与众不同之处在于,人工智能作为一种横向的服务贯穿全平台。通过深度学习和机器学习技术,结合超强计算、海量数据和优秀算法,在语音、图像、自然语言处理等方面拥有杰出的能力,打造出独特的知识图谱、用户画像和商业逻辑,并且向用户全面开放。用户可以非常方便地使用各种算法模块、开发工具、数据引擎为自身的商业目的服务。我们形象地把不同的平台称作天算、天像和天工,分别针对智能大数据、智能多媒体和智能物联网这三个领域提供服务。
在最上层的SaaS(Software as a Service,软件服务),百度的人工智能很容易凝结成许多垂直行业解决方案,渗透到各行各业。但我们更追求与合作伙伴一起打造智能产业生态,例如教育云、金融云、交通云、物流云等。我们认为,对智能产业生态的构建能力也是判定人工智能价值的重要标准。
在硬件、数据、算法之上还有一个重要的衡量标准,那就是人工智能企业的文化,即人工智能企业的“软实力”。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。所以陆奇在微软的做法是,培养人才先从Bing开始。你做过Bing,你到其他什么部门都可以做,那些技术在搜索看来都是很简单的技术。这个文化当然并不完美,但正如神经网络一样,可以在正确的方法指引下不断发展完善。
人工智能+世界
和前几年讨论“互联网+”一样,人们现在开始讨论“人工智能+”,“+”商业、工业、医疗、教育等。如果从“知道更多,做到更多,体验更多”的角度来看,人工智能对世界的改变是根本性的,也就是说,这是一个“人工智能+世界”的问题。
首先,智能革命对于每个人的日常生活都会起到非常深远的影响。举一个简单的例子,由于人工智能突破性的发展,我们与计算器件的交互形式会更进一层。
以前的人机交互都是通过鼠标和键盘,微软发展到今天的规模,也是通过鼠标、键盘和GUI(Graphic User Interface,图形用户界面)这个人机交互的创新。苹果和乔布斯对这个世界最大的贡献是改为用手指来交互,从而改变了世界。而人工智能时代的改变更大,人类将可以用自然语言跟任何器件交流。
自然语言是最有效、最普遍的一种交流形式。人和人之间就是用语言交流,最自然,应用也最广泛。人机之间自然语言交互的实现,意味着人类将不需要了解每一项应用,每一个产品也都不需要学习该怎么去用,直接操作就好。因为,未来汽车是可以跟我们直接交流的,房子也是可以跟我们顺畅对话的。
我们已经看到了这种智能交互的雏形,比如一些智能助手系统的逐步落地。在美国,人们通过亚马逊智能音箱,把房子变成智能系统。在中国,百度的度秘团队也在这个领域做了很多前沿探索,我们有机会彻底改变日常生活中的人机交互方式。
人工智能将极大地加速人类的创新步伐和创造社会价值的效率,改变社会的规模也会和过去完全不一样。人类进步的每一次革命性进程,都是从发现新的知识开始。无线电是这样,互联网也是这样。而未来知识的发现模式会发生根本性改变。以前,人类去思考、去发现现实世界的规则。数字化世界到来后,借助人工智能的数据处理方式,人和机器将共同发现新的知识。这就意味着,人类创造新的企业,创造新的社会进程,改变世界的速度将焕然一新。因为人类“知道更多,做到更多,体验更多”的进程大大加速了。
最后,人工智能将带来一场新的工业革命。为什么很多人认为工业4.0以后,人类将进入数字化社会的新阶段?就是因为,智能系统将有能力在现实世界里提取数据,抓取知识,进而更好地帮助人类感知和认知现实世界,也将从经济、社会、文化等层面广泛而深刻地改变现实世界。我们确实处在一个非常振奋人心的时代,跟早期工业革命非常类似,但是人工智能比工业革命对社会的影响更广、更大。
传统的制造业基本上以器械、电器和电力为主,其生产流水线基本上要用很大规模的投资来建立,后续很难调整。比如一家汽车制造厂,要重新建立一条生产流水线,成本很高,花的时间很多。当数据智能、自动化、精准预测对制造业的改造完成之后,后者的面貌将焕然一新。未来的制造业生产流程将是模块式的,全部是数字控制。当一家汽车制造厂要调整生产,制造另外一种样式的汽车,它不再需要重建生产线,而只需要把新产品模块的接口(API)调过来就可以了。这将彻底改变制造业基础,制造业效率也将会极大地提升。
这个改变的核心是数据和知识,即制造的流程、制造的工艺、制造的设计,制造的每一步都会用数字来控制。
再比如制药行业。以前一款新药的诞生要经历长期的研发过程,去发现某种方式对某种病症有效。未来借助人工智能计算技术,将庞大的基因数据与海量的健康信息结合起来分析,人类可以很快发现规律,找到个性化的基因药物。
从国家层面,人工智能给中国带来的不光是整体竞争力的提升,还是一个超越他国的天赐良机。中国是制造业大国,数据量的庞大规模无出其右,也就意味着我们有机会提取比别人多得多的“知识”。你懂的比别人多,看的比别人多,能做到的就比别人多,你就比别人强大。智能时代,在国家竞争、产业竞争中,掌握更多“知识”也就可能使自己立于不败之地。单从制造业来讲,如果中国能把握住这个机会,完成真正的智能化升级,其他国家是没有办法跟我们竞争的。但是智能制造具体怎么去实现,需要整体的战略考量。
图2-2 DNA测序猛增[2]
资料来源:nature.com
中国的优势与我们的责任
目前,美国和中国是在人工智能方面发力最大的两个国家。
人们习惯于把百度和谷歌放在一起比较,这也可以看作中美比较的一个缩影。我觉得两家公司有很多类似的地方,因为起源都一样,公司层文化有很多类似的地方,百度在中国的优势跟谷歌在美国的优势也类似。
两家公司也有不同,百度的创新空间和在某些领域的创新速度可能比谷歌更大、更快,这源于中国的国情与美国的国情不一样。
移动互联网在中国的创新程度在很多层面已经超过了美国。
比如,手机百度在信息流方面的创新,用人工智能核心技术可以把信息找人做得非常精致。在移动互联网上做这个事情,百度创新的机会比谷歌在美国要多,因为两国IT工业的格局不一样。还有金融业,百度金融可以依托中国市场和数据的优势,用人工智能技术对金融业做一个革命性的提升。但在美国,金融业相对“壁垒森严”,谷歌要切入金融领域就很难。
再比如,在无人驾驶汽车方面,谷歌、百度都是世界第一梯队,现在谷歌在这个领域稍稍领先于百度,但未来不一定。因为,中国的汽车制造厂家很多,拥有更开放的合作环境,与百度这样的人工智能企业联合起来,创新的机会就非常多,创新的速度也就会更快。反观美国,汽车制造商就集中在底特律那么几家企业,人工智能企业找上门去跟它们合作就很难。
总之,无论是无人驾驶汽车、金融、医疗,还是整体制造业,中美都面临智能升级的节点。但是,中国的宏观环境给百度这样的智能企业的机会和空间要比谷歌在美国获得的更大一点。
那么,在这场波及世界的浪潮中,百度应该承担什么样的责任?
在美国,IT工业体系一般就靠五家公司:苹果、谷歌、脸书、亚马逊、微软。支撑企业不是一家,而是带动了一波企业,扮演的是一个生态系统的领军者的角色。
在人工智能时代的背景下,百度是一家支撑企业,有这样一个机会,因此要争取对中国乃至世界的智能革命做出更大贡献。
具体来讲,战略上我们要以“赋能”来定位。百度首先是中国的,百度大脑要做探路者和奠基者。百度的智能云是提供给所有行业的,对任何行业都将起到促进、赋能、带动的作用。
作为国内人工智能的先行者,百度已经在多个维度上创新开拓,同时逐步形成自身智能生态的雏形。
比如,医疗和教育是人工智能应用潜力非常大的领域,因为其本质都是数据问题,高级教师和老医生一样,能力来自经验(数据)积累,未来我们可以让机器自动分析数据,辅助医生对症下药,辅助教师个性化施教。医疗或者保健能让人的生活更健康,教育能给人更多的知识,因此,人工智能在这两个领域的社会应用价值巨大。
另外,还有无人驾驶领域。无人驾驶也是通过感知、认知、知识获取来实现。目前,无人驾驶汽车真正商用还需要一点时间,但是一旦商用普及成功,对于整个社会的改造会非常大。因为这不光是汽车和交通问题,一旦有了无人驾驶机器,它可以自己行动,自己联网,就会带来很多不同行业的改变。
人工智能的实践范围如此之广,人类很少有这样一个机会,可以彻底改变、改造当下的一切。当然战略落实要一步一步走,方向要坚定,步伐要稳健。
企业挑战:如何落地
在工作态度上,陆奇常说:“Head above cloud,Feet on ground”,就是脑袋要在云端之上,才能看得远,看得清,但是你的脚必须要踩在坚实的大地上,一步一步向前迈进。
做人工智能事业要跨越的第一个障碍就是如何落地。人工智能意味着一个非常大的改变,时间会很长。要落地的话,首先必须找到非常好的、实际的用户体验,就是能给用户带来实际效益;其次,场景必须清楚,智能助手也好,无人驾驶汽车也好,信息找人也好,一定要有实际的用户体验价值;最后,还要找到商业模式,不然就没有可持续性。
所以重要的挑战在于,是否能够找到落地的用户体验和实现用户价值的场景,然后找到适合的商业模式,建立一个创新的循环。即数据—知识—用户体验—新的数据。找到这样一个循环往复的流,人工智能事业就可以像滚雪球一样往前滚。
图2-3 人工智能创新“飞轮”示意图
最重要的是每个公司的CEO(首席执行官)一定要重视人工智能,这是起步。然后必须投入一定的资源,包括雇用真正懂人工智能的人和能帮助做决策的人。公司可能是做零售业的,可能是做制造业的,也可能是做旅游业的,要按照自身业务的情况制定有效的智能化战略,然后坚决执行。要赋予执行者足够的权力,通过有效的战略分解,把智能化落实到具体业务上。
我们不妨以“工作引擎”模式来分解人工智能战略的落实步骤。
首先,要根据人工智能浪潮的推进方向,重新梳理企业的定位,根据企业要在人工智能时代抓住的机会,设置新的发展方向,确定崭新的使命和愿景。
其次,根据企业新的定位制定智能化战略蓝图。这就需要企业领导层对公司在即将到来的人工智能浪潮中的愿景进行定位,对“进入什么”和“退出什么”做出取舍,进行投注。
在制定“进出”决策时要遵循一定的原则。硅谷咨询专家Geoffrey Moore(杰弗里·摩尔)的层次结构框架是评估人工智能浪潮的一个很好的例子,其中的关键是进入高增长的类别,跳出低增长的类别。人工智能浪潮将创造新的、有巨大增长潜力的类别,如无人驾驶汽车、机器人、回声设备、对话系统;同时,人工智能也可能给某些行业带来阻碍,因为新的人工智能驱动产品可以用某些方式取代原来的在位者,如新的人工智能硬件+软件堆栈可以使基于旧的HW堆栈的投资受损。一个好的做法是制定包含新的高增长类别、重新增长类别和逆风类别的完整列表,以便领导层可以做出系统性和原则性的决定。
接下来是对产品的出发点做出区分,如产品是否“拥有价值和无与伦比”。需要强调的是,在人工智能时代,企业能否保持差异化,关键在于是否拥有独特的数据资产(它带来独特的知识)。
下一步是理解不确定性、风险/回报和时间表,以进行投注和管理进程。“地平线模型”是一个良好的框架,可以用于制定决策和组织投资组合。大致做法如下:H1时段(未来18个月)围绕目前的核心业务展开;H2时段(未来18~36个月)投资于创造盈利引擎;H3时段(未来36个月+)致力于具有更大潜力但风险更高的长期投注。人工智能浪潮提供了一个非常丰富的H2时段和H3时段的机会,一些人工智能投资甚至可以帮助提升H1时段。总的来说,人工智能处于非常早期的阶段,有很多未知数和不确定性。要想真正深入理解人工智能,有原则性和务实地做出决定非常重要。
在企业人工智能战略的执行阶段,首先要坚持“结构完整性”原则,即在产品体验、技术架构以及商业模式上要连贯一致。如果你正朝ICS(服务器/客户端架构)方向改变,或者投资于“自治系统”,那么技术决策需要与产品和商业决策同步。
其次是企业要紧跟人工智能浪潮的技术路线图,与当前飞速发展的深度学习技术同步是必不可少的。
对于人工智能行业的领军企业而言,就需要可以改变世界的愿景、世界级的技术远见、强大的科研团队和研究议程,这些需要与我们的企业愿景智能技术的呈现和产品开发相一致。DeepMind、谷歌、百度以及一些积极进取的先驱企业都表现出这个共同模式。
在这个阶段,更新研究机制也是必不可少的步骤。因为,传统上,IT行业以及学术界并不擅长将研究成果商业化。最近的OtherLab或OpenAI以及其他一些人工智能的初创企业正在积极招聘研究团队,这是一个新的趋势。有许多工作需要各类组织(大学、早期生态系统、大型企业、培训和研发机构)协同制定出结构化的和可持续的解决方案。
投资力度是企业亟须考量的重要因素。随着智能革命的不断深入,人才争夺战不断升级,导致发展人工智能的成本不断提高。一些初创企业能够筹集大量资金,是因为长期的投资回报是非常巨大的(高风险/高回报)。制定投资规划的关键在于排列资源的优先次序以及一个能够反映人工智能风险的深思熟虑的决策过程。
所有客观条件逐渐汇聚之后,人就成为决定性因素,其中领导才能是一个深远且难得的要素。鉴于人工智能浪潮基于与以往完全不同的核心技术(以神经计算为核心),它需要高层管理团队的高级管理能力。同时,人工智能驱动的新兴行业是如此多样化和跨学科(从基因学到机器人,凡是你可以想到的),因此企业需要一个具备创新精神的人(虽然这并不容易,因为今天的社会生活在很多领域都是非常专业化的)。微软研究院首席研究员Bill Buxton(比尔·巴克斯顿)提供了解决方案,即为高级管理层建立一个充满创新精神的团队。
值得指出的是,人工智能创新飞轮的核心是数据—知识—用户体验—新的数据的反馈循环。对这个反馈循环的容量和速度进行优化是规划中非常重要的一环。
最后要强调的是,居于战略核心的是基于当前的现状和推断积极设定目标,以及展开可以实现目标的行动。
需要什么样的宏观环境
企业与科研机构的工作离不开良好的宏观环境,正如中国大脑计划是对国家整体层面智能基础设施的呼唤。迎接人工智能时代的到来,也需要政府通过宏观规划创造适宜的土壤。
第一,要确保数据的获取途径畅通。数据越来越成为很多组织的战略资产,可被视为一种新型的“自然资源”。特别是对政府而言,可以通过政策的制定获取数据并公开,以此激励更多的创新。
第二,要有开源的工具和平台。人工智能浪潮需要一个新的硅+软件堆栈,在早期,这类似PaddlePaddle这样的开源工具和平台,其能被开发者和创新者使用是非常重要的。展望未来,我们需要不断降低参与的障碍,并系统使用更多的工具和更多的模块。就像AWS(亚马逊云服务)使计算更容易一样,一些AI-as-a-service(人工智能服务)也可以让人工智能技术更容易被获取。
第三,创新者可以迅速将产品的市场条件和政策体系培育给用户,这也是非常重要的,因为创新的飞轮需要“数据—知识—用户体验—新的数据”的快速反馈循环。
第四,鼓励持续的应用性研究。在人工智能浪潮初起阶段,持续的应用研究特别是开发可以从数据中获取知识,创造智能体验的ML(机器学习)算法是这个变革飞轮的核心。在这个阶段,所有人工智能企业努力的重要组成部分就是拥有持续的应用研究。
第五,上述几点势必会引出人才的问题,教育和培训出更多可以设计、实现机器学习算法并成为数据科学家的人才是一个关键因素。
最后,通过新的结构化方法,把公共世界的信息和知识变成有组织的素材,并可获取,这对于许多企业的人工智能创新至关重要。
智能社会的文化和长期管理
这一波人工智能浪潮需要几十年才能充分发挥作用。雄心壮志和改变世界的投注需要足够长期的投资。所以,有目的的长期管理在人工智能浪潮中扮演了一个重要角色。这将是一种遍及全社会的商业和管理文化的变革。
具体而言,这需要执政者建立并获取一个更大的“许可信封”,使管理团队有较长的时间跨度来培育大赌注(通常是从0到1的赌注类型),这也日益成为高层领导任期职权的一个重要组成部分。马斯克就说过:“如果创新失败,不应该受到惩罚。”
对那些受人工智能浪潮影响而需要进入新格局的公司,整个组织的更新和改造非常关键,而高层领导团队需要面对和管理这种变革。
与长期管理相关的一个因素是创造新的组织结构,使其成熟,以便容易适应人工智能带来的改变。Alphabet(谷歌重组后的“伞形公司”的名字)便是其中一个最早的尝试。在这方面,中国企业的管理创新做得比美国更多。
另外,文化是一个组织的持久力量,它是可以超越几代的领导力和商业活动。对于许多成熟的企业(如谷歌、百度),进入人工智能浪潮代表着一个重大的挑战——需要获取新的人才、新的技术专利以及创造与之相应的新文化。保持积极主动,有耐心,并且执着是极为重要的,因为文化转型是一个成熟企业最具挑战性的工作之一。另外,需要一提的是,相比学习人工智能的新方法,更困难的在于忘却旧模式下的工作方法。
由于我们正处于人工智能浪潮发展的初级阶段,招聘并维护人工智能领域的专家对管理者来说是非常重要的。
总体上,有目的地进行长期管理是抓住任何重要机会而不仅仅是人工智能浪潮的关键。如何调整结构来吸引更多的资金和人才以及放置更多的改变游戏格局的赌注,对企业领袖而言都是一个有趣且极具挑战性的工作。面对更深刻、更有趣、更具挑战性的问题本身就是人类进步的标志。
人工智能技术目前的发展状态
人工智能、深度学习方面每天都有新研究、新文章出来。今天有点像文艺复兴时代,所有的科学都在变。因为科学的真谛就是观察世界、总结知识。我们现在观察世界的能力越来越强,一旦选好观察角度,把深度学习的算法用上去,很快崭新的知识就出来了。
现在不光是物理学、生物学、材料学……每一个科学领域都在拼命往前走,走的速度很快。所以总体来讲,人类是处在一个突飞猛进的状态。让我们再次把头脑放到云端,以量子计算作为本章的结尾。
我们注意到人工智能和神经计算框架之间非常有趣的联系,这两个框架都采用分布式表示超大向量,其基本运算都是线性代数而不是布尔代数。它告诉我们人类的大脑和物理性质的计算方式相似。甚至有科学家提出,人类的大脑运作原理与量子物理、量子计算理论、量子计算算法类似。
关于量子计算和人工智能的结合,我们看到微软、谷歌建立了量子人工智能实验室,国内也有这方面的项目。量子计算不是一个该不该有的问题,而是一个什么时候有的问题,它一定会发生。至于什么时候发生大家有不同的想法,可能是5年,甚至是5年之内就会出现早期的量子机器。
为什么量子计算这么重要?因为量子计算跟人工智能有本质上的关系。量子计算的核心就是利用量子的叠加状态。量子有一个能力状态的变化,就是加一定的能量以后会改变状态。不同于现在的计算机数位,0或者1,一个时间只有一个状态。量子的叠加态特性可以在同一时间有四个状态,计算能力呈指数上升。
好处就是通过量子计算可以解决很多数据问题。以前的办法就是数字分解。比如数据加密和解密,统统要用素数分解。素数分解是非常难的,给你一个很大的数字,用一般的算法,算到地球毁灭可能也算不出来,但是用量子算法以后,可以很快算出来。未来用量子算法做机器学习是很自然的。
与此相关,硬件也一定要革新。因为现在的硬件都是以布尔代数为主,而深度学习的核心计算是不同的,是矩阵和张量的计算,不是0和1的计算,而且一定要进行微分运算。量子计算也是一模一样的,每个量子改变能级的时候,就是一个矩阵和张量的计算关系。大自然其实就是这样计算的,人脑也是一样。Matthew Fisher(马修·菲舍尔)、潘建伟、朱清时等科学家都认为,意识的本质就是量子纠缠。
2007年Nature(《自然》)杂志发表了加州大学伯克利分校Graham Fleming(格雷厄姆·弗莱明)领导的实验室的成果,他们利用飞秒激光技术,在极短的时间内向光合作用复合物上照射激光,结果发现了复合物上仿佛鼓点般的光回波,这意味着光子的能量不是通过单一路径传入反应中心的,而是利用量子相干性同时从所有可能的路径进行传递,从而证明了量子效应在叶绿素光合作用中起到不可替代的作用。这鼓点般的量子回波,正是大自然与人类智慧之光的映射。量子效应在生物体上的发现极大地鼓舞了人类对量子计算和人机结合的新探索。
虽然量子计算机还没有实现,但很多人已经在思考,假定有了量子计算机该如何来做机器学习?这个领域已经有了很多前沿文章和研究成果出来。假定10年之后量子计算机出来了,它会对人工智能行业带来一个根本性的改变,因为量子计算跟人工智能、深度学习的核心计算是彻底吻合的。我们现在实际上是走了一条弯路:任何算法都要把它变成是布尔代数,用0、1来模拟一个微分方程。
图2-4 经典计算机和量子计算机
资料来源:http://www.zwzyzx.com/show-336-227290-1.html
量子计算和DNA(脱氧核糖核酸)计算的规模和能量将远远超出今天的基于硅的计算能力。随着工程技术的进步,我们将迎来全新的计算体验(如量子化学和量子材料)。
其应用也无比广泛。首先落地的可能就在最古老的农业,参考上面光合作用的例子,就会知道植物也在计算。以后农作物都可能用计算机来计算和设计。所以量子计算对于整个社会可能是一波超级改变,很可能就此引领人类文明的长河走向彻底数字化。
总之,量子计算不是玄学,而正是“知道更多,做到更多,体验更多”这个人类进步规律的未来。在这方面,无论多大的想象力都不够。我们要敢于想象,同时坚持立足大地。30年前,陆奇在毕业纪念册上写下了“这颗电脑科学皇冠上的明珠非君莫属”,我们这一代人做不到,下一代人继续努力,这是“大写的人类”不变的梦想。
[1] 陈景润因证明哥德巴赫猜想“1+2”定理而享誉世界。徐迟的报告文学《哥德巴赫猜想》以陈景润为主人公,发表于1978年1月的《人民文学》第1期,在当时家喻户晓。
[2] 英国2014年启动了“10万人基因组计划”,美国和中国则宣布要完成多达100万人的基因组数据收集工作。世界知名的基因测序公司Illumina仪器测序所得的数据,每12个月就能翻一番。这是一个巨大的“数据黑洞”,也是一个亟待发掘的数据金矿。