特稿 >

行业洞察 >

北大 AI 公开课第10讲 胡郁:人工智能+,共创新时代

北大 AI 公开课第10讲 胡郁:人工智能+,共创新时代

Xtecher原创 丨 行业洞察

20937
1388

2017-05-03

赵逸禅

Xtecher特稿作者

关注

“北大AI公开课”第十讲于本周二晚结束,科大讯飞联合创始人、执行总裁、消费者事业群总裁胡郁为我们做了题为《人工智能+,共创新时代》的演讲。以下由Xtecher整理,为不能亲临现场的读者带来本次课程最完整实录。


编辑整理|Xtecher 赵心源、又田

网址|www.xtecher.com

微信公众号ID|Xtecher


胡郁,分管主持科大讯飞核心研发平台,总体牵头科大讯飞人工智能前瞻项目——讯飞超脑计划。荣获国家信息产业重大技术发明奖、国家科学技术进步二等奖两次,并多次荣获安徽省、部级,合肥市级科技奖励,其在国内外核心期刊和重要国际会议上发表学术论文60篇。

 

以下是Xtecher为您整理的本期演讲内容干货:


时间不断向前,人类对某种事物的理解也随时间不断进步。谈到人工智能可以从What、Where、How、When、Who 5W分别认识。

 

人工智能是什么?(What)

 

前几年的人工智能,被人认为等于深度神经网络、等于大数据、等于智能设备、等于机器人。但其实这些是与人工智能完全不同的概念,若想在将来人工智能进一步运用,必须对其基本了解。

 

在探讨人工智能这个概念之前先来看一下人类科技发展进程:从能源时代到电子时代到互联网时代再到人工智能时代。19世纪至今,科技在不断向前发展,而前一个时期的科技发展为下一个时期的科技发展做铺垫。


图片1.png

 

比如在能源时代,能源的问题即蒸汽动力和电力问题没有解决,将不能解决电子问题。而如果没有电子时代的线电和非线电的模拟电路,就不会出现数字电路,进入互联网时代。

 

最近,人类进入了人工智能时代,其建立在前面三个科技时代的基础上,人工智能到底是什么?

 

这一问题可以从原点开始探究,即智能是什么?智能的环境是什么?

 

人类的智能是建立在130亿年宇宙大爆炸,并逐步发展得到人类,标志着自然宇宙的诞生。地球的寿命是40亿年,人类出现在300-400万年之前。恐龙统治地球几千万年,但没有演化出人类的文明,这是由于恐龙的脑结构远比不上人类。

 

人工智能产生是在1946年,美国军方研制了一台名为ENIAC的计算机,这台计算机出现后有了数字宇宙的概念。按时间倒推,真正的数字宇宙产生到现在仅仅71年。

 

当年对数字宇宙中可能孕育生命或者智能讨论最早的有冯诺依曼、图灵、哥德尔、毕格罗。

 

1956年美国达特茅斯会议,一些年轻学者探讨在数字宇宙中人工智能的未来发展。这个会议留下两个遗产,一个是AI这个名词,另一个是参加会议的人。这些人在1956年到2016年陆续去世,而在他们去世后,人工智能在产业上得到了真正的发展。

 

人工智能一词有多种不同的解释,一种是研究人工智能的学者眼中的“强”人工智能,这些人希望能真正破解人类产生智能的奥秘,比如做一个类似人类大脑的机器,可以完成所有的事情。而实际情况是,60年来人工智能相关理论并不少见,但其真正进展不是很大。

 

另外一种在计算机领域或应用计算领域的人更希望用计算机的方法模拟人的智能的某个方面。在这一方面内的问题可以用机器解决,但不能做用机器做决策。目前工业界上普遍使用的人工智能是“弱”人工智能,比如不同形态的机器人只能完成人的一项任务,甚至是一项任务中的一个环节。


图片2.png

 

曾任华为诺亚方舟实验室主任,现任香港科技大学计算机系系主任杨强老师提到,计算机真正可以思维的“强”人工智能其实是想实现从0到1的突破,而目前包括工业界和计算机应用学科等领域其实只是想让计算机的行为表现像智能一样,这可以称为从1到N。

 

而整个人工智能领域的发展并非一帆风顺。


图片3.png

 

这个曲线示意了人工智能从应用角度发展的不同阶段。1956年人工智能被提出后许多人认为其很快能满足人的要求,对它期望很高,随之而来1957年提出的神经网络以及第一款人工智能软件问世,人工智能迎来第一次黄金期。

 

但是在此过程人们逐渐发现,计算器速度慢,存储小,人类许多智能思维不能用符号表示。故人工智能很快满足人的要求是不现实的。在这个时段中国没有任何参与。

 

80年代新的浪潮崛起——个人电脑兴起,乔布斯和比尔盖茨的时代来临。另一个大背景是当时美国提出星球大战计划,日本提出第五代计算机,其认为可以研发出像人一样交互和思考的计算机。

 

而当时的中国发起863计划,第一次对信息技术领域内科研人员进行培养和补充。遗憾的是,当时的机器处理智能能力较差,因此90年代末,恰逢互联网大火时人工智能萧条起来。

 

但这一时间点结束时中国已经储备了做人工智能科学研究的人才。863计划中有有一些研究分枝,包括超算、视觉、图像语音、自然语言理解等,为我国的人工智能发展奠定了基础。

 

互联网和移动互联网的发展为人工智能第三次浪潮奠定基础,而这一次人工智能的兴起十分依赖大数据,没有互联网和移动互联网就不会产生大数据,这次浪潮对中国很有好处,中美是世界上仅有的拥有核心技术设备和庞大的科研人员队伍以及互联网和移动互联网基础设施及产业构成的两个国家,因此目前人工智能在全球的竞争就是中美之间的竞争。

 

这是过去60年逐步积累的情况,在这一过程中人类对人工智能有很多不同的看法。比如霍金认为人工智能会威胁人类,比尔盖茨也说对此担忧。而真正做人工智能研究的人认为人工智能还远不会威胁人类,还有很多的技术探索工作。

 

实际上,人工智能威胁派所想的是“强”人工智能,而在工业界考虑的是“弱”人工智能。

 

最近有一本书叫《未来简史》,书中提到一个观点:将来的人工智能会不会有意识?

 

在自然界中智能与意识是强相关,例如动物越智能越有自我意识。但在数字宇宙中是不一定的,此时创造出的人工智能可能很聪明,但不一定有自我意识。未来如果能将智能和意识分开,无意识的智能体一定不会灭绝人类。而目前更值得严肃考虑的是智能机器人将取代大量人类工作。

 

那人工智能的现状怎么样?(Where)

 

当前“强”人工智能还未突破,“弱”人工智能发展较好。

 

研制计算机的目的是什么?美国军方希望用计算机来计算弹道轨迹,可以把这种智能称为运算智能,机器在运算和存储能力方面远超人类。


图片4.png

 

另外,动物和人类有感知智能和运动智能。感知智能包括能听会说、能看会认,运动智能包括能抓会握、能走会跑。目前机器的感知能力进步很快,运动智能通过自动控制,也取得很大进展,但目前还不能制造出非常灵活的机器人。

 

而人类独有的,智能的奇点是语言,没有语言人类不能组成大量团队,没有语言人类没办法维持社会结构,没有语言就不能产生虚构的概念。因此,语言是智能的主要表现,人类成为宇宙霸主的原因是历经了认知革命。

 

认知智能是人工智能最大的挑战,特别在知识表达,逻辑推理方面。

 

人工智能要怎样实现?(How)

 

未来人工智能想要变得与人类一样聪明,就必须有认知智能。这存在两条路,一条路是“强”人工智能,即一个智能体或者架构可实现大脑所做的所有事情。而目前工业界所用的人工智能,普遍的智能算法是“弱”人工智能。其用互联网和移动互联网的大数据和深度神经网络等一系列方法可实现。

 

目前在脑科学方面,美国推出大脑活动图谱计划,是美国继基因工程学之后,第二个信息学和生物学重大工程,希望把人脑认识清楚。另外,欧盟提出蓝脑计划,中国也提出中国脑计划。

 

钱学森的导师冯卡门专攻于空气动力学,如果目前科学能研究智能动力学,研究出大脑奥秘,将智能和意识分开。将智能单独剥离做出超脑,不再受神经的物理限制。而对智能动力学的研究可能要10年、20年、30年。

 

目前在业界,关于人工智能为什么能工作有三大法宝,即深度神经网络,大数据,涟漪效应。


图片5.png

 

深度神经网络非常好的一个特点是随着数据量的增加,其性能也在往上提升。但现在深度神经网络有用不代表未来没有其他算法超越,目前也已有很多科学家研究非深度神经网络。

 

另外,互联网和移动互联网的存在使获得真实数据的能力比以前强了很多。

 

最重要的一点是涟漪效应,这其实是一种互联网思维在核心技术研究中的一个过程。为什么现在实验室不能将最好的人工智能算法进行提升?是由于涟漪效应。

 

在互联网情景中,因为软件是免费的,一部分人愿意花时间去体验这些软件。就像水滴滴到水面,不是所有人会用到,只会有一小波人用到。而一些早期用户使用之后察觉这个系统并不好用,但在其使用期间,性能和用户数据会被送到云计算服务器并得到更新。

 

当波纹扩到更大时,这个系统已经开始提高了,此时这个系统可能仍不完善,但更多的数据和经验会被构建,当扩散到较大部分水面后,随后使用的人会认为这个系统很好。

 

因此,利用互联网的涟漪效应,可以把一个不成熟的、需要在真实的用户数据中培养的系统培养起来。目前的人工智能,如果没有经过这套系统,而仅存在于实验室,是不可行的。

 

正是有了以上对人工智能的分析定义,2014年讯飞推出讯飞超脑系统,期望这个系统能够突破感知智能和认知智能,不仅能听会说,也能理解会思考。

 

讯飞超脑的构建可以参考人脑。人脑皮层不同部分是处理不一样的信息,比如一部分处理视觉、听觉、触觉,最终汇集到概念层面。


图片6.png

 

讯飞超脑分为感知智能和认知智能两个层面,并采用深度学习的路线。目前深度神经网络有很多开源的工具可以使用,但深度神经网络内部网络结构、构型对性能十分重要。而其中的层数、层数反馈以及节点间协调关系是诀窍,与脑科学连接起来才能获得最佳效果。

 

图片7.png

 

人工智能什么时候会到来?(When)

 

人工智能主要用在两个方面,第一,人工智能会通过机器与人的自然交互改变人类生活,另一方面,由于机器学习,则会颠覆很多需要专业人士的领域,如医疗、教育等领域,人工智能可以替代其某些技能。

 

计算机每发展十年,与人的交互会发生变化。键盘和字符形成第一代人机交互,鼠标和图形显示则构成第二代人机交互,而第三代人机交互则是以语音交互为主,触摸交互为辅的方式。

 

目前,讯飞AIUI可以实现与机器自由对话。其在语音云上有10亿个设备,每天使用次数可以超过35亿次,有30万个第三方创业团队使用。


图片8.png

 

人工智能在行业的作用和交互是不一样的。各行各业最稀缺的是专家,而人工智能要学习专家能力,并用机器学习替代专家。因此人工智能应用到各行各业可以改变各个行业的思维方式。

 

人工智能服务形态也分为三类,Information-Complet,Information-Incomplete,Information-Free,层层递进。

 

图片9.png 


谁将弄潮人工智能时代?(Who)

 

在人工智能领域,美国公司的发展是从爱迪生创立的通用电气到IBM再到微软,都属于技术创新型公司,也就是互联网是一种手段,而不是一个终结性产业。

 

技术创新公司可以概括成以下四个特点:


图片10.png

 

实际上技术创新公司可以分为两类,一类是登山型公司,比如中国的航空航天、军工、高铁公司,山就在那里,需要脚踏实地一步步攀登。另外一类是冲浪型公司,在风口来的时候抓住机遇。若能将两者结合在一起才属最优。

 

而在学校创业时,会面临很多压力。此时应该抱着小时候玩耍的心态,放松心情。在玩耍的过程中过程比结果更重要,如果在此过程中你全心尽力投入并努力,反而会获得最后的成功。

 

不管创业是否成功,过程中的经历以及得到的培养才是有价值的,这也是学校里学不到的。

 

最后,我也非常希望大家能用自己的技术创新,参与到人工智能的大方向中来。


问答部分:


雷鸣:非常感谢胡郁教授,胡宇教授把人工智能的发展和各个方向讲的蛮透彻的,对5个W进行了全面的梳理,很容易理解,最后和创业相结合,讲得非常好。我们结合刚才所讲的内容,探讨几个小问题。

 

讯飞赢了很多比赛的国际冠军,在这个过程中,你认为对于“弱”人工智能而言,数据和算法在做出很好的结果上,它们的重要程度是什么样的?

 

胡郁:我认为数据和算法同样重要,是分阶段的。如果没有数据,达到基本的门槛都很难;没有数据,假设是不存在的,再好的算法,在残缺的数据面前也是没有用的。数据量到了门槛以后,真正发挥作用的是算法,不同算法间的差异会越来越明显。

 

雷鸣:超脑计划刚开始的时候,大家认为很荒唐,现在的进展还不错。按照中国高考制度,它什么时候能考上北大清华。

 

胡郁:没有十年很难。

 

雷鸣:图灵测试很多问答里面用trip,后来测试方不干了,提供更严格的测试。严格测试中,我们只有55%的正确率,正确率还是蛮低的。你认为这方面达到十岁小孩水平要多久,关键点是什么,会不会是需要更多知识,甚至是发展到“强”人工智能和通用人工智能,才能达到这个突破。

 

胡郁:这个要反过来看,人类0到6岁无忧无虑,人工智能最难的是0到6岁阶段。人类的认知,常识、逻辑的建立都在这个阶段,但这个阶段人是不用学的,在人类社会中慢慢就会了,这是个很神奇的事情。

 

从6岁开始到大学,要经历学习和考试,对人来说是最痛苦的事情,对机器来讲是反的,计算和记忆对机器不是难事。机器一旦掌握人类0到6岁的能力,后面对机器来说都很简单。现在科学家在努力的是用“弱”人工智能(大数据、神经网络和涟漪效应方法),来突破0到6岁的认知智能的问题,我认为这条路是有可能性的。

 

我们对神经网络大数据很多威力还没摸透,这其中还有很多空间,在5到10年内会看到结果。而“强”人工智能需要解决另外一个问题,0到6岁的认知智能是一个结果,通过“弱”人工智能达到这个结果是有可能的,但过程中给机器塞的东西可能和人完全不一样。“强”人工智能不仅要达到结果,过程还要和人一样,当遇到了新的内容,它还能不能学的那么快,这是“强”人工智能(通用人工智能)要达到的目标。

 

雷鸣:知识型问答,常识背后对应的量是非常巨大的。这个问题一定程度上等价于开放对话问题,后者是个极难问题。它对知识库要求非常高。人类一段时间尝试建立非常大的知识库系统,现在看来建立完备的几乎不可能,还有很长的路要走。

 

我们探讨一个问题,脑计划中关于意识有很多探讨。意识和智能真的是割裂的吗,回顾AlphaGo比赛,人类认为机器下围棋只会算,人类有大局观、灵感,后来证明大局观也是算出来的。

 

胡郁:机器的大局观是算出来的,人类没计算能力,大局观是想出来的。

 

雷鸣:意识是不是某种函数呢?这是人类在某种环境下进行生存的结果,以及让人类在环境中得到更好发展。有一本书叫《自己的基因》,其中观点很有意思:人类和物种的进步本身是基因为了遗传自己,我们只是一个载体。书中提到,成年动物会被保护小动物,甚至不惜生命,看起来非理性,后来美化成母爱。动物经过变异有这个特点,种群越来越大,下一代有更多机会繁衍。如果不救下一代自己活着,过去种群,尤其是人类,寿命就三十多岁,后面没生育可能性,或者生育能力下降,保护小动物更像是一种结果,不是原因。

 

回过来想,自我意识会不会是一种函数,只不过人类目前没有搞清楚。

 

胡郁:这是完全可能的。美国有个脑科学专家,写了一本书叫联结主义,联结主义取名模仿自基因主义,这个主义认为,人的意识和智能完全取决于人脑一千亿个神经元连接的突触,甚至和动态放电没有直接关系。脑科学第一个要搞清楚的问题是智能是什么,意识又是什么他们到底是诞生的,还是人获动物的神经系统的里面可以产生的一个东西。在科学探究里面有三个东西,已知的科学道理、合理的推测、以及被证明的真理。我认为脑科学是合理推测的一部分,并没有讲到哪些是被推测的真理。科学研究领域是确定的过程,在这个方面可以学习到一点,我们要看对我们实际的应用,以及产生的效果,它可以帮助我们现在做的事情带来哪些作用,这是有意义的。

 

雷鸣:我们对未知事物应该保持开放态度。

 

人工智能后面转向机器学习,机器学习的一个分支深度神经网络,这个分支现在一枝独秀。很多认为人工智能和深度神经网络等价。你刚才谈到,深度神经网络未来不一定很火,可能有其他的东西大放异彩。你认为人工智能未来发展会有哪些方向。

 

胡郁:有很多学者在探索。我们最近在和澳大利亚的一个教授合作,他做的是应用符号系统,这是人工智能最早的系统之一,可以把符号和统计深层学习的东西结合起来,深度学习不一定只用在神经网络上,也能用在符号推理等其他领域。

 

教授和我讲,研究的人不能做工业界热门的东西,要做工业界上还没看到的。大数据让研究有了更好的条件,试验比较方便,国内也有教授在进行探索。我觉得充满信心。我还看好,现在不管是什么东西,数据还是要变成模型里面的参数,但是其实原来,机器学习理论里面有基于样本方法,KNN是基于记忆的学习,找到决策点和样本点间的距离,非常像人类的记忆系统。如果一个真正系统,和人脑一样工作,记忆要经过某种方式处理,不只只存在权重上,样本可以进行遗忘,这些东西都在尝试过程中。

 

我认为大脑的记忆能力是一个强大的机制,怎么辅助我们进行人工智能的判决、进行决策,还需要很多研究,我认为这方面应该有突破。把抽象的模型进行总结归纳,还有基于样本进行决策,综合起来是一个很好的方向,这些方向都还在探索。

 

雷鸣:其实在产业里面,人工智能对产业影响有很多,医疗教育都在往前发展。对于AI+产业来讲,你认为在未来五年,最有落地机会的,变成真实产业的机会有哪些?

 

胡郁:大的方面,和行业有关。教育前几年有比较热的内容,教育以外医疗有可能产生巨大产业价值。人工智能替代的人工不是简单的人工。人工分两种,一种是脑力劳动,脑力劳动里面很多东西集中在教育、医疗、法律、金融这些方面,这些脑力劳动里面,得信咨询专门做过分析报告,把人类职业分分析了一遍,教育、医生、老师、律师、法官、管理者各个方面。每个职业都有很多技能,老师有10项技能,分析哪些能被人工智能代替。我认为脑力劳动的一部分会被人工智能代替,哪些被代替创造价值,我不认为节省能力是一个方向,这个方向是没有被激发的需求,比如每个学生都需要一个老师,有些事原来想干没法干,用人工智能可以把幻想激发出来。以前有种需求叫0增长需求,以前增长不了,在现在可以增长。

 

第二个部分是体力方面,举个例子,家庭服务机器人,现在只有用扫地机器人,因为动作最简单,在运动智能没突破之前,体力方面能替代的只发生在工厂里面。运动智能发展后,把园丁,家庭看护,老人看护替代。

 

第三部分是人机交互。人机交互能用在非常多的领域,有一部分来自人机交互本身。还有一部分是搜索,当交互发生变化,获取信息方式发生变化,信息发生变化不一定是智能本身,而是交互方式带来的,硬件、服务的变化,很多东西会被重整,重整方式可能和键盘鼠标都不一样。这里面我认为很多交互和交互衍生带来的机会,不一定是交互本身。这是一个中间的环节,引发带来的变革,比如玩具新的形态。

 

雷鸣:移动互联网早期,有一场讨论,移动互联网是否会替代掉互联网,产生移动搜索巨头。不能否认移动的事情带来的新的巨头,比如头条、美团、滴滴、Airbnb等,我觉得每一次变革都有机会,交互方式变了,很多都变了。苹果从键盘到触摸,背后游戏玩法变了,产生新的有意思的东西。

 

有同学提问,像语音图像这些,是不是现在更像取代了人类的眼睛和耳朵,信息获取IO化,但大脑的研究落后一些。马斯克提出脑机接口,人工智能只是说在人类IO上机器有些进展,真正特定能力的还需要很久。你怎样看待马斯克做的事情,未来很火或者确实有很大实用前景,还是说比较难。

 

胡郁:IO人脑和眼睛这些感官系统,人是不分开的,感知和认知是在一起的,人有个特点是视而不见,带着目的去看是不一样的。人脑里面有个关注度模型,带着去看和泛泛看,机理是不一样的,IO是简化到机器感觉去,从人脑感觉来看是分不开的。认知驱动的感知是高度融合在一起的,而不是简单的分割。我们以前不够深度不够清晰。

 

第二个关于脑机接口,我们刚才讲的人工智能是数字宇宙规律,虚拟世界和数字世界,和真实世界是接口的,计算机里面叫ADDA,人接口是电脑鼠标,传递很慢,人幻想生物接口和机器能否直接共享信息。世界上有很多连体婴儿,两个人的大脑连载一起,生物体连在一起,他们能感到人的大脑想什么东西,如果生物和大脑直接打通,但其实是有可能做到的。很多科幻小说都有辅助系统存在,帮助人弥补运算智能,这块非常有前景,但不像现在控制,脑电波受制于人大脑特性,是由延迟的,实时控制不可能的,这点上方向有前途。我们要分清马斯克真正要做的和PR的区别。

 

雷鸣:我们总能发现,大部分的新闻是坏的新闻,为什么呢?因为人大脑对极端问题,有强预警,不受控制,是生物学上人不受适应。所以认为飞机不安全,其实是被车撞死的可能性更大,因为新闻不对等轰炸。

 

提到说软硬件有互相促进作用,语音识别来看,我们依赖哪种架构GPU、FPGA还是其他,哪种硬件架构会是一个方向。

 

胡郁:我们要分开来看,人工智能分两块,学习和执行,对人来说,看书是在学,展示是在执行,学习系统是高并发系统,不断来优化,这要用GPU处理集群,把模型训练好。 实际执行体执行,不是高并发,同时为大量用户服务。以前不需要高并发,可以分成很多小份。执行时候要效率高,在将来因为要云计算,人工智能云计算还是FPGA,它可以定制,服务效率非常高,终端上可能是神经网络芯片,兼容不同种类的神经网络,不同地方用不一样的体系来进行。

 

雷鸣:回答比较透彻,各有所长,搜索建索引非常庞大,算时候一定要好,生成一个索引结构,这个结构到搜索上非常快。最后一个问题,自动编程,你觉得这块进展怎么样。

 

胡郁:了解不多,编程这个事情,编程是个逻辑性,为什么不是自然语言而是逻辑语言,编程目的是为了完成在计算机里面可执行逻辑功能,自动编程这是一个方向,编程语言是规范性的,我认为如果编程为了解决一般性问题,从原有问题到确定性问题,人对于一个问题相处解决方案,去创造性解决问题。但是人工智能对他来讲是个工具,现在自动编程解决不了后者问题,这是人的想法。如果创造性想法有了,转写更高效的方式,确定性任务,这种自动编程是很快的,是可以实现的。

 

雷鸣:这块再梳理一下,整体来讲,一个编程可以分成两部分,设计完了,流程图都有了,设计和民工,程序里面设计师和码农,美国打击代码工人,以前外包到印度那些,如果知道设计流程图,代码化是不存在的,设计问题转成计算机问题,还有很多问题在。

 

我还有另外一个想法,编程本身是主函数main,这不就是深度学习干的事情吗,训练出来就行了。百度最开始的排序是我主导设计的,当时因为运算能力,特征只有10个量级,用于决策排第几。原来是个左右,人拍脑袋定,几年前扩展到一万个,每个参数怎么用他们也不知道,是机器学习学出来的。未来凡是大数据,数据量充足,模型可能是被训练出来的。

 

让我们再次感谢胡郁的精彩演讲。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机