特稿 >

行业洞察 >

黄李超:让算法成为一种生活方式

黄李超:让算法成为一种生活方式

地平线 丨 行业洞察

21179
1395

2016-12-14

tuni

Xtecher特稿作者

关注

黄李超,地平线核心算法工程师。2014年毕业于英国帝国理工。回国后任职于百度深度学习研究院,实习期间独立开发出基于全卷积网络的物体检测算法DenseBox,一举成为百度IDL核心算法,2015年在权威检测数据集FDDB、KITTI排行中稳踞榜首,成为当年算法界的一匹黑马。在地平线,黄李超先后负责算法研发与优化,以及平台搭建与改良。目前在地平线负责物体检测和图像分割方向“算法可以帮助我们实现很多想法,比如网络爬虫、实时监控,这些会提升我们的生活质感和效率。”于他而言,算法不是脱离日常的空中花园,而是一种移步可达的生活方式

探索物体检测前沿算法


工程师对自己设计的算法总是怀有某种特殊的情感,正如Alphago之父哈萨比斯在Alphago战胜围棋高手李世石时兴奋不已一样,谈及在物体检测领域颇有名气的DenseBox算法的开发,黄李超似乎也有说不完的想法和故事。

166.jpg

黄李超,负责目标检测和图像分割方向


设计DenseBox最初的目的,是用深度学习做物体检测,这在当时是十分具有前瞻性的想法。虽然深度学习在2013年左右就被应用于物体检测领域,但其代表性的算法架构却一直不够直接和高效:早期基于CNN的物体检测方法OverFeat,由于性能和效率问题一直没有得到很好的应用。后来Ross Girshick等人开发的R-CNN算法,虽然在一些数据集上有了更好的表现,但它的缺点也显而易见的——region-proposal通常很多,直接用CNN分类非常耗时;同时,训练需要多个步骤,不够直接。


在大家仍选择沿用R-CNN方法亦步亦趋时候,2014年冬天,还在百度IDL实习的黄李超不满足于跟随其后,决定开发一套新的物体检测算法。更早的OverFeat检测方法给了他启发:既然在图像上卷积等价于使用滑动窗口分类,为什么不直接使用全卷积网络做整图的物体检测呢?因此,富有创造力的他基于自己的理解,开始了这项前人少有的探索,并为之一往无前。


创造之神果然没有辜负这个年轻人的努力,他做到了,并不断完善原初的设计。抛开固有的束缚,他以先行者的敏捷,首先设计出一套端对端的多任务全卷积模型,直接回归物体出现的置信度以及它的相对位置。同时为了能够更好地处理遮挡严重的物体,提高小物体的召回率,他在检测的网络中引入了上采样层,并融合浅层网络得到的特征,得到更大尺寸的输出层。为了对训练样本进行筛选,降低误检,他还率先使用了Online Hard Negative Mining的策略,这在后来的一些论文中被证实卓有成效。


640.jpg


目标检测示意图:输入多尺度图像,经过CNN处理,输出目标框  引自:DenseBox: Unifying Landmark Localization with End to End Object Detection

后来,追求完美的他还对DenseBox进行了一次关键性的优化,让原来的检测网络引出多个分支,大大降低了图像金字塔的规模。这一优化,使得在相同计算量的模型下,原本在GPU上耗时数秒的720P图像的人脸检测,不到一秒即可完成。如果用更小的模型,在CPU也可以做到每秒好几帧的速度。在算法的计算中,时间就是生命,一秒的进步都凝结着无数的心血,而数秒的前进则意味着质的飞越。这一改变成为推动DenseBox落地的“临门一脚”,让它真正在产品线上能够可用。


DenseBox最先应用在人脸检测上,表现出了很好的性能,后来开始逐步应用于车辆检测等方向。而优化后的DenseBox更是被广泛应用到IDL的相关项目组,如人脸和OCR(光学字符识别)项目,极大提高了检测的准确率,至今仍是百度无人车的重要算法之一。加入地平线后,DenseBox在各个平台上衍生出了多种不同性能和速度的模型,也成为了地平线的核心算法。


来到地平线之后,黄李超延续其朗逸有为的风格,在工程方面也做出了建设性的成绩。一个月内,他独立搭建了一个跨平台的轻量级CNN预测库,性能达到开源深度学习平台Caffe的两倍。同一个月内,他在ARM平台上进行的定制性优化,较Caffe速度提升了2-6倍。同时,地平线初期落地的所有模型,包括人脸检测模型、人脸属性和关键点定位模型、以及ADAS方向的车辆和行人检测模型,也都由他一手训练。由于经验丰富、工作高效,他用短短一个月的时间实现了别人几个月都难以达成的目标。今年在地平线嵌入式人工智能战略的关键一环中,黄李超作为核心成员参与了地平线第一款芯片CNN模块的设计和算法验证。


640-1.jpg


纵观黄李超在人工智能领域的探索历程,DenseBox开发、FDDB/KITTI榜首、深度学习预测库、业界顶尖、地平线芯片,这些似乎都可以成为他身上亮闪闪的标签,却都无法简单地定义这个一直活跃在物体检测领域前沿的探索者,因为这个眼睛里带着光亮的人,有太多的想法和探索的能量,有太多的努力和锐利的锋芒,因而让华丽的辞藻黯然失色。


科技剑客,随性与执着


采访黄李超最大的感触就是他的随和与坦然,讲起自己的经历,他时常低头一笑,又闲闲道来。他坦言自己的随性,当年DenseBox虽在2015年初就被早早地开发出来,这一成果比同一时期的Fast(er)-R-CNN系列提前数月,但相关的论文直到9月才在arxiv上发布,究其原因竟是他懒于动笔!


“当时懒得写,就没有写,直到不得不写了,才写了一篇。”虽然DenseBox落地之始就在权威检测数据集FDDB、KITTI中排列榜首,这一荣誉一直是国内多家公司如百度、小米等争相炫耀的筹码,但性情淡泊的黄李超却显然并不想多谈。“这不过是个测试性能的数据集而已,证明算法性能好就够了,盲目的刷榜并没有意义。”


DenseBox在KITTI上名列榜首,性能远超faster-RCNN和Regrionlets


但是,他的随性仅仅适用于他的人生观,他对工作的热情恰恰相反,以执着勤奋而著称。在开发DenseBox的时候,同期几乎没有可以参考借鉴的工作,因而所有的内容和算法都需要根据自己的直觉去判断,“需要不断的尝试,如果效果不好,就要分析它的原因。只要认定了这个方法可行,就绝对不能放弃。”正是他的坚持让DenseBox在检测算法领域立稳了脚跟,通过不断的更新和改进,它仍傲踞地平线的核心算法之首。


他的随性和执着构成了他剑客般的性格,对人生随性而坦然,对技艺执着又精益求精。在科技的时代,他就是挥舞锋芒、披荆斩棘的剑客。


算法,应当是一种生活方式


“未来的目标嘛,我希望做出更好的算法,也让自己的算法能够在更大的平台上使用,让自己的成果惠及更多的人。”谈及未来的愿景,黄李超如是说。最近二十年来,我们分别经历了PC互联网、移动互联网的热潮,如今这些热潮已接近尾声,而下一次热潮已紧随而来——人工智能。随着万物互联时代的到来,端上的人工智能将带来巨大的市场机会。尤其是在自动驾驶和智能生活领域,存在于每一个智能设备里的AI芯片会是重中之重。


640-2.jpg

在万物互联的人工智能时代,生活将与算法密不可分


而算法在其中扮演的角色就是,和芯片完美结合,提供软硬结合的嵌入式人工智能解决方案,也以此获得重生和更广阔的应用。这也预示着算法将在不久的未来,潜移默化地成为我们的一种生活方式。


采访后记


虽然访谈的过程涉及了一些专业领域的内容,但由于黄李超简洁耐心地科普,作为文科生的我第一次近距离地感受到算法的魅力。在和他的接触中,我也越发觉得他在工作和生活中,简直是“两幅面孔”——生活中的他其实是一个非常“萌”的人。比如他给自己起了一个非常奇怪的微信昵称,叫“烫烫烫”,后来我才了解到这是编程C++过程中出现的乱码汉字编译,也反映出他在生活中有趣的一面。


0.gif


对于自己加入地平线的选择,他直言:“我喜欢挑战,简单的事情对我而言没有意思。”正是秉持着这样的精神,他选择在物体检测和图像分割领域进行进一步的探索,将算法与芯片结合,让理想的灵魂落地。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机