特稿 >

深度洞察 >

对话微软人工智能首席科学家邓力:AI浪潮下 弄潮者能做什么?

对话微软人工智能首席科学家邓力:AI浪潮下 弄潮者能做什么?

Xtecher 丨 深度洞察

10591
965

2016-11-03

大琳

Xtecher特稿作者

关注

本文来源:网易科技

作者:小羿 碧怡


如果2015年科技最热词汇是“VR”的话,“人工智能”已经成为2016年最热的科技词汇之一。


说到人工智能,就不得不提到微软的研究院。在微软的七大研究院中,成立最早的雷德蒙研究院已经有25年的历史,而在当时,人工智能就已经成为这个研究院的研究领域之一。早在1999年底,身为加拿大滑铁卢大学正教授的邓力就加入了微软总部雷德蒙研究院,并凭借自己深厚的学术功底在2014年初成为该研究院深度学习技术中心研发部门负责人,随后在2016年初出任微软人工智能首席科学家。


undefined

微软雷德蒙研究院总部大楼一角


早在2009年开始,邓力和他的团队就同多伦多大学Geoff Hinton教授及两位学生并肩合作,在微软雷德蒙研究院开始将深度学习各种不同的方法用在语音识别上,并在2010年夏研究成功。之后发表了一系列论文并多次应邀演讲,引起除了微软之外还有科大讯飞,谷歌、亚马逊、IBM的一系列语音识别的产品化。随后,邓力凭借在“深度学习与自动语音识别方面的杰出贡献”,荣获2013年IEEE SPS最佳论文奖和2015年IEEE SPS技术成就奖。邓力首次提出并解决将深层神经网络应用到大规模语音识别中,这一实践显著提高了机器对语音的识别率,重新点燃了(由深层次带来的)神经网络在当前这个大数据、大计算时代的复苏,极大的推进了人机交互的发展。


那么,在当年的时代,微软在人工智能领域的布局如何?邓力博士又是如何看待明年人工智能的发展趋势呢?且听智能菌慢慢道来。


深度学习助推弱人工智能成熟,全靠这三样东西


随着深度学习在语音、语义、图像上的不断出现的巨大成功的应用,已诞生60周年的人工智能再次发酵,掀起了第三轮热潮。这一次,被互联网教育的人们对AI的未来充满幻想和好奇,而实际上我们已经发展到哪个阶段呢?邓力向智能菌表示,目前在弱人工智能方面,我们已经取得了很多好的成绩。


所谓的弱人工智能包括我们日常用到的语音识别、图像识别、机器翻译甚至机器问答等。邓力认为这方面每一个局限任务的研究和应用已经相对成功了,这是因为引入了深度学习,语音与图像识别以及机器翻译的准确率得到了巨大幅度的提升。“要是没有深度学习的话,语音识别,图像识别和机器翻译的准确率将远远低于现在的水平。”邓力说道。


而未来的应用领域亦不止于普通的图像识别以及语音识别和机器翻译这样简单,邓力告诉智能菌,深度学习在应用到复杂功能包括阅读理解和自动对话上的显著效果没有那么快,但仍然能有效提升它的准确率和应用的可能性,并终将达到像在语音识别和机器翻译上一样大的进展。


正因如此,深度学习已渐渐成为当下讨论AI的新“代言词”。但它的出现并非只靠AlphaGo等现象催生,背后更有着六十年来不断迭代的技术作为发展的强大后盾。


undefined


“现在有三个要素,一个是大数据,二是大计算,就是计算速度非常快(计算能力的提高),第三个就是新的算法和新的模型结构。这三个因素使得现在这个技术得到一个爆破点。”邓力表示,在计算速度不够快,数据不够多的以前,复杂的模型,多层的神经网络相当于异想天开。邓力称,现在的计算速度跟20年前相比极大地增快一天能训练出来的神经网络以前需要三个礼拜。而现在伴随着新的算法和模型结构,大数据的涌现,再加上计算机的快速计算能力,不仅能快速出结果还能帮助实验人员反复验证。邓力也提出,因为每个公司,每个行业,无论规模大小都可能拥有自己不同的或特有的数据,这些差异化的数据会给不同的应用带来价值。


邓力也提出了自己对深度学习的建议,他认为目前的技术能够很成功地去认知图像和语音及翻译语言,但缺乏解释和真正推理的功能。


“在图像识别上解释性会很重要,比如说反恐,你用监视器摄相,说这个人很可疑,这里危险很大。如果识别的可靠性不高,要问为什么会有这样的识别结果。比如因为以前在其他地方有类似这种表现,知道了以后更有信心说应该帮助你做什么样的决策。” 邓力解释道: 深度学习在助力人工决策行动时,行动代价越大,对解释性要求越高。而对于商业应用来说,这种解释性将尤为重要。


大规模用户数据支撑 ,中国AI企业应该做什么?


日前,美国白宫推出了人工智能研究和发展国家战略计划的相关报告,其中指出在研究AI和影响力贡献上中国超过了美国。据了解,报告评估所引用的指标描述是发布深度学习研究刊物的数量以及被其他研究人员引用发布的刊物数量。然而,这是否就代表中国在人工智能领域的发展已经开始超越美国呢?


邓力表示:“在某些领域我觉得是对的,比如中文的语音识别。”但同时邓力也认为单从发表论文的数目本身上看,并不能作为最终的衡量目标,应该更着重看其影响有多大。“中国学生和研究人员的人口基数大,写的文章肯定也多,从这个角度来讲,至少说中国已经发展非常快。中国比美国迟了一点,但是后面会发展比较快,这很正常。”邓力说道。


尽管报告所权衡的指标有所争议,但是中国近年来在人工智能领域上的耕耘也有目共睹。市场上一批批智能化的机器人、产品等现身各个行业。


undefined


“中国方面的优势之一是数据量非常大,用户反馈力强,应用场景广阔。而美国在研究走的还是比较前一点。”邓力告诉智能菌。邓力认为目前国际交流频繁,中国发展的速度非常快。中国的优势非常大,这对人工智能非常重要。


天然的庞大人口基数实际上也为人工智能落地市场提供了更多的数据反馈,而另一方面,群居文化也为AI应用服务提供便利。邓力也举了中国O2O行业的例子: “中国应该做的比美国好,服务对象就在这附近,同座大楼,给他递东西就很方便。美国一般住的距离比较远远,应用上就不那么好做。人工智能的发展需要很多数据,数据自动采集比较快是一个很大的优势。”


因此,邓力亦建议中国AI发展可以以大规模用户为特色,利用此优势挖掘不同的数据。尽管美国人工智能技术很好,但是数据强度可能不如中国大,效果也未必能比一般的人工智能好。


强人工智能至少需要十几年,大脑机制研究很关键


第三次人工智能热潮不仅只是投资界、产业界的关注,影视界大片《西部世界》也正在诠释AI的火热。剧中有意识,有感情的机器人相当引人注目,也让人开始思考到底未来的人工智能将怎样发展。


曾有演讲者称未来想要一个通用的人工智能产物出现,对此,邓力表示“没那么快,那么乐观”。邓力坦言要达到通用的人工智能至少还需要十年、二十年,或更长。这个过程中有各种各样的问题需要解决,包括常识嵌入的问题,人工智能每个思考的步骤、思维、创造性等都需要考虑。


邓力向智能菌解释道:“常识的问题是局部的问题,你要是把常识加到人工智能,这个10年之内可能做到。完全要做到广义的人工智能,相当于说你写一个通用程序就可以解决所有的问题,这是没有那么快的。”


邓力的言下之意正表明,目前的人工智能水平仍离强人工智能很远。


强人工智能的实现要基于对脑机制进行大量的探索,对脑的机制了解足够深入,能让我们从中学会脑是怎样做管理,泛化你的学习能力。“就像你要是数学学的非常好,它也会帮助你物理学的好。但现在的人工智能远远没达到这个水平。”邓力认为这是十分重要的基础研究,并鼓励政府、大公司投资也放在这些基础研究上。他也表示除了加大脑机制的研究,相应的硬件与算法也要同步跟上,在这些环节都能突破了以后,强人工智能才有可能实现。


尽管高水平发展时间漫长,但有不少应用已经落地影响着我们的生活。但同时也有人担心,未来人工智能的发展会不会也如《西部世界》剧中会反抗人类的机器人一样威胁到人类的存在。


undefined

电影《西部世界》海报


“我自己感觉威胁论是比较远的事情,我看大家现在也有一些讨论,早一点制定一些政策,这是应该的,早一点预防。”邓力认为AI领域做语音和图像识别,做感知方面并不会很危险。但AI的自学习和自动推理会使得认知机器自己越来越强,从长远来讲可能会有一些威胁。但作为努力研究AI技术的研究员,邓力也表示一般研究过程中只会去思考怎么样让AI自学习,让它聪明,让它更有智慧,让它如何可以更有效地帮助人类。真正做研究和实验的人一般并不会对这些威胁论看得那么严重。


深度学习博士年薪300万美元?AI跨学科人才更受青睐


此前有媒体报道,人工智能深度学习专业的博士年薪高达200万到300万美元。计算机工程学科的人才在AI界有多吃香也从此可见一斑,但这是否代表AI行业就不需要其他学科的人才呢?


而邓力认为跨学科人才正倍受青睐。“比如说认知科学、脑科学。你要真正得到强人工智能,除了计算机科学(机器学习、数理逻辑,自然语言处理, 等等),这两块也不能少。再就是信息论和控制论,在美国一般是属于电子工程学科,这个也非常重要。”邓力告诉记者在AI研究中,不同领域的知识跟研究方法会越来越渗透到AI和深度学习领域里面。


此点也在网易科技、网易智能与乌镇智库联合发布的《乌镇指数:全球人工智能发展报告2016》中的学术与研究篇得到了验证。报告显示,人工智能研究的四大细分领域,机器学习、自然语言处理、计算机视觉以及机器人均与逻辑学、数学等其他学科产生联系。


undefined

《乌镇指数:全球人工智能发展报告2016》封面


“我们有在招,但竞争很厉害。我们也做了很多努力,其中的一个努力就是找有不同背景的人,如果做强人工智能就要不同学科互相合作。”


人才竞争虽然激烈,但微软仍下足本钱。近年来,微软在中国的研究中心不断扩大,同时也加大了研究员的力量投入。邓力认为中国有很多人才,曾有不少人说,微软亚洲研究院为中国培养那么多人才,记得我的校友张亚勤对我说这就是一个“黄埔军校”。但无可否认的是,这些中国的人才确实对微软甚至整个业界各种各样的事业都产生了非常大的影响。


微软的整合布局,组建5000人的AI部门地毯式推


在微软最有权势的华人高管陆奇卸任之后,邓力所在的微软雷德蒙研究院发生了较大的人事变动。


9月底,微软宣布组建人工智能及研究事业部(Microsoft AI and Research Group),专注人工智能。据悉,这是一个具备5000人规模的工程和研发团队,由微软全球执行副总裁沈向洋领军。这一部门将包括微软研究院(Microsoft Research)、微软信息平台部门(Information Platform Group)、必应(Bing)和小娜(Cortana)产品部门,以及环境计算(Ambient Computing)和机器人团队。自此,微软所有人工智能相关人员及产品都将统一到新建团队下进行管理。


undefined

微软公司


沈向洋在一篇博客中说道,“(新的团队)将使微软具备创造真正智能系统和产品的能力,我相信我们拥有这个地球上许多顶尖的人工智能人才,我们将继续吸引更多的人才加入”。


在人工智能大团队组建之际,微软CEO萨提亚·纳德拉说,微软要把AI注入全球所有的计算平台和所有产品,最终目标是要在全世界普及人工智能。概括起来,微软在人工智能领域的重点布局有四个方面。


一是个人助理领域,如小娜(Cortana)、小冰这样的语音助手和聊天机器人,致力于彻底改变人机交互方式。据微软透露,小娜收到的指令和问题已经超过120亿条,拥有1.33亿活跃用户,可以在多个设备上运行。


二是将人工智能技术加入所有的微软应用中,比如图片编辑工具Microsoft Pix、Skype、Office365、智能键盘SwiftKey、Bing等等。


undefined

Skype Translator演示图


三是将微软的人工智能技术服务,如在语音、视觉上的认知能力和机器分析能力等,开放给全球的应用开发者,目前微软已经在Bot Framework平台上使用AI技术建立智能工具包。


四是在基础设施上,微软投入更多。例如,微软在云中投入大量FPGA(现场可编程门阵列),它能直接与网络对话;微软搭建了全球性的、超大规模的云基础框架,利用Azure开发出全球最强大的AI超级计算机并开放给每个人。另外,微软的CNTK(现已更名为微软认知工具包)是最快的分布式运算神经网络框架,也成为唯一开源的可扩展的深度学习工具包。


科技界巨头们起起伏伏,算下历史也不过二三十年,而在人工智能领域,微软始终是走在前列的弄潮者。对于不远的将来,邓力认为,人机对话的应用会更广泛。“另外医学的应用我觉得前景非常大。还有计算机视觉上的应用,这些技术相对比较成熟。”邓力说道,如果技术成熟的话,你可以找到一大堆的应用。



打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机