特稿 >

行业洞察 >

【首发】千万级融资创业,中科院研究员山世光首发声:我们瞄准的不仅是人脸识别|Xtecher人物特稿

【首发】千万级融资创业,中科院研究员山世光首发声:我们瞄准的不仅是人脸识别|Xtecher人物特稿

Xtecher 丨 行业洞察

68145
9087

2016-10-10

甲小姐

Xtecher特稿作者

关注

上篇|山世光出发:“四十而惑”

 

几天前,山世光还未公开宣布此消息时,媒体的匿名“爆料”就出来了。不仅媒体着急,投资人拼的也很着急。毕竟,他的“出发”,意味着这位在人脸识别领域深耕近20年的著名人物、“国家队选手”走向了市场,成为“搅局者”——而这么掐指一算,CV领域还停留在学术圈子的大牛们,真的所剩无几了。

 

这件事携带着三个“第一次”走入Xtecher的视野:

 

深耕人脸识别二十载的专家山世光第一次创业;中科院计算所五六十年来第一次和市场化VC合作;专注高智能领域的一线投资机构线性资本第一次把钱投向纯粹的学者。

 

而事实上,此番创业决定,对山世光而言,是一场艰难而决绝的出发。

 

“世光不是一个轻易做出大幅度转变的人,他一直在观察。他相对慢热,可当他一旦热了起来,他是很难退烧的。”山世光的老朋友、领投机构线性资本创始合伙人王淮这么说。

 

学者山世光

 

去年3月,山世光40岁了。

 

虽在学术领域已颇有威望,他却反倒迎来了“四十而惑”。

 

“四十岁的时候,反而会去反思,走了这么久的一条路,是不是自己一生全部的维度?”

 

他本、硕就读于哈工大计算机系,又在中科院获计算机博士学位。自1997年本科毕业设计开始接触,在“人脸识别”领域已深耕将近20年。

 

他的业界地位毋庸置疑:

 

在国际/国内期刊、国际会议上发表/录用学术论文200余篇,顶级国际期刊论文40余篇,计算机视觉领域一流国际会议(CVPR, ICCV, ECCV)论文40余篇;论文被Google Scholar引用9000余次;曾获CVPR2008 Best Student Poster Award Runner-up奖;获2015年度国家自然科学二等奖,2005年度国家科技进步二等奖;2008年度中国科学院卢嘉锡青年人才奖;2009年获北京市科技新星;2012年获国家自然科学基金委员会优秀青年科学基金;现任知名国际学术刊物IEEE Trans. on Image Processing, Computer Vision and Image Understanding, Neurocomputing, Pattern Recognition Letters的编委,曾担任著名国际会议ICCV,ICPR,ACCV,ICASSP等国际会议的Area Chair(领域主席)。

 

人工智能创业者虽遍地花开,但真正的学术大牛还是“稀有物种”。二十年来,山世光恪守着“科学家”身份,一贯的学者风范,温文尔雅,思维严谨,说话声儿不大。

 

“人身体里有一个猴子,一个怪物,那个猴子是‘本我’,随心所欲;那个怪物是‘超我’,理性克制。”


二十年来,他“找不到那只猴子”,当他评价自己、描绘事物时,宁愿降低对方预期,也不会说出任何有失准确的话。

 

“毛泽东有句话说,与天斗其乐无穷,与地斗其乐无穷,与人斗其乐无穷。我感觉不到与人斗其乐无穷,只能感觉与天斗、与地斗其乐无穷。”

 

从进入大学开始,他已做好了迎接一生艰苦学术时光的准备。

 

他在哈工大本硕连读。大三时,对“图像”燃起兴趣,老师推荐他去高文院士的实验室做计算机视觉。高文是位大牛,中国工程院院士,现在是北京大学教授,国家自然科学基金委员会副主任。

 

师从高文,山世光开始了在人脸识别领域的探索,这一探索就是近20年。

 

20年聚焦于一物,除了学术上的造诣,山世光团队研发的人脸识别核心算法被合作伙伴应用于公安部出入境系统、多省公安厅的人脸识别系统等项目,技术实力也因此成为可圈可点的“国家队”,初出茅庐的山世光也逐渐成长为在CV领域毫无争议的“老炮儿”角色。

 

伴随着斐然业绩的,却是自己接踵而来的“四十而惑”,“挺吓人,发现自己就像一个螺丝钉,只能干这个,好像不太全面。”

 

他开始思考:是否终其一生,除了学术这一个维度,真的再无其他可能?

 

仿佛一场迟来的叛逆期,心里的石头开始滚动:“就像《三体》里有个降维攻击,反过来讲,人的维度需要多一些,才会看到这个世界更深刻的观点。”

 

这个念头无疑将打破过去20年的平静。

 

决定出发

 

尽管和余凯、赵勇、王淮等科技创投圈红人们早已相识,劝他创业的声音早已不绝于耳,但山世光“以前压根儿没打算创业”。

 

毕竟一直以来,他在中科院计算所的工作离工业界并不远。“计算机学科,总体来说是一个工程学科,它得关注用在哪里。”

 

从2000年开始,山世光所在团队先后和银晨、华为、中国移动、百度、三星、诺基亚、日本的NEC、欧姆龙、松下等十几个公司合作,扮演企业研发部的角色。他们完成系统和核心算法,交给企业完成工程化和产业化。

 

虽然企业项目源源不断,山世光却逐渐感受到“合作局限性”:

 

“AI会成为未来大量产品里必备的一个成分,企业要不就买,要不就自己建一个小团队。大企业都开始建研究院,可即使是很多大企业,目前都暂时没有办法完全自包自揽,大量中小企业怎么办?”

 

山世光团队立足算法研发,人才都是算法工程师,靠近研究端,需要合作的企业自己具备工程开发的能力——但小企业期待的合作方式却是“一揽子全包了”。

 

可立足学校,学术才是至上的纲,不可能让学生们抛掉研发的桂冠只做工程开发服务。

 

“学术价值”和“应用价值”之间存在着难填的鸿沟,目睹着来自市场的大量需求和供需之间的矛盾,久而久之,一个想法终于浮上水面:

 

完全呆在研究所内无法突破这个局限,只有创业才能解决。

 

他开始在自己的学生之中物色合适的搭档。等了几年,终于“找到了一个合适的人。”

 

这个“合适的人”,是他的一个博士生,刘昕。

 

去年年底,刘昕和另两个博士生一起参加了阿里图像搜索大赛,拿了第一名。山世光在朋友圈发了这个消息,张泉灵看到了,立刻问:有没有想法出来创业?

 

此前,张泉灵参加活动认识了山世光,此后,便经常向他咨询技术问题。得知山世光团队确有此意,张泉灵立刻过来聊。

 

聊完走了5分钟,她电话打过来:“我们要投你。”

 

投资人逐一抛来橄榄枝。随着与投资人王淮、余凯、张泉灵、黄明明等的反复沟通,山世光的创业之路终于清晰。

 

山世光出发,公司刚刚成立,叫中科视拓,英文叫Seeta,已获得线性资本、紫牛基金、地平线和明势资本等千万元级别的天使投资。

 

师生搭档

 

创业圈的“师生组合”,比较出名的有大疆无人机的师生搭档李泽湘、汪滔;香港中文大学汤晓鸥教授和其弟子做出的商汤科技、Linkface(两者已合并);还有Xtecher早期报道过的北大、普林斯顿教授鄂维南院士和他的弟子田昊枢、王储等创办的普林科技。

 

中科视拓的组合也很有意思,师生搭档:

 

75年生的山世光担任董事长、CTO,公司大股东,90年的刘昕担任CEO。


2.jpg

山世光(左)与刘昕(右)


 “师生组合”创业,业界颇有争议,很多投资人不敢投,一怕教授权威感太重无法和学生平等合伙,二怕老学究太谨慎,缺乏冒险精神。

 

山世光对此颇为清醒:“我是崇尚严谨和踏实的人,想的会比较多一些,而做企业还需要更多冲劲和冒险精神。”他说,正因为对自己有这样的判断,才选择和学生一起干。

 

选择刘昕做CEO,山世光说,是因为“他本身有创业的想法,有原动力”,此外,“他相对年轻,条条框框少一些。”

 

Xtecher为此专门采访了刘昕。

 


中篇|另一种声音:山老师的90后学生搭档刘昕


“呆在学术圈的优势减弱了”

 

90年生的刘昕,一直以来的人生理想就是“开公司”,喜欢向前冲,和山世光的温文尔雅相得益彰。

 

他本科在重庆大学读软件工程,博士到了中科院,跟着导师山世光已经五年。

 

读博5年,刘昕没有周末,醒了就工作。他不打游戏,不打篮球,不常用社交网络,基本不上知乎,也不用电话,微信好友400人,QQ好友100人都不到。他并不关心市面上的90后创业者们都在干什么。

 

他读书很多,70%历史,20%文学,10%财经。此外,娱乐生活只看文艺片,很喜欢《钢的琴》。

 

他的微信头像是“一只弹钢琴的狐狸”,这也是他的自我比喻:“狐狸是狡猾的,但也是狂野热情的,它在弹钢琴,是它的一种艺术表达。”

 

他身上有一种混杂气质,理工科博士,却当过8年文学青年,写散文,写小说,喜欢苏轼、王小波和冯唐,喜欢他们身上“亦正亦邪”的气质。

 

“文学青年本身就是很拧巴,苏轼就是一个很拧巴的人,他有两首《江城子》,第一个是《密州出猎》,非常豪放,‘西北望,射天狼’;另一首悼念他的妻子,‘小轩窗,正梳妆。相顾无言,惟有泪千行。’”

 

一次聚会,山世光对刘昕说:“我一直没有招一个文学青年,比较遗憾,看到你是,就招你了。”


刘昕相信,是因为自己身上有其他专注于工科人身上没有的东西,才会被选中,“山老师应该了解我所有的多面性,否则他不会选择我当CEO。”

 

在刘昕眼中,他们从中科院走出创业的核心原因是:“外部环境的变化,使得呆在学术圈的优势减弱了。”

 

一方面是技术变化。深度学习带给了人脸识别革命性的变化,Facebook的DeepFace,香港中文大学的DeepID,Google的FaceNet,人脸识别领域迎来“方法大变革”。

 

另一方面是数据量变化。过去研究者能拿几万的数据就很了不起了,但2015年Google用了两亿人脸数据。更好的机器、更大规模的数据、更多的钱,使得工业界开始赶超学术界。

 

刘昕说,大家越来越认识到“数据”才是最核心的竞争力,而在学术界只能用公开的数据闭门造车,真实的数据掌握在工业界手中。如果不做公司,做技术服务别人不倾向于把数据给你。如果要花钱买数据,一次就要花费近百万,资本带来的数据量将大大反哺到技术。

 

“学术大牛压阵极其重要”

 

作为一个90年出生CEO,面对市场上其他人工智能公司的一众担纲大牛,刘昕却“没有太大的压力,后面还有一位大佬在压阵,董事长在压阵。”

 

虽然刘昕曾收到若干人工智能公司的CTO offer,但他说,毫无疑问,山老师是自己最理想的合伙人。

 

“大牛是一个不可再生的资源,大牛的成长需要时间。这个领域大牛已经所剩无几了,既然我的老师是一个大牛并且要创业,我为什么要去别的公司呢?”

 

刘昕强调,在人工智能领域创业,“学术大牛压阵”是一件极其重要的事。看得更远,做战略层面的思考,在趋势不明确时,提前指出该走哪条路——这是学术大牛不可替代的意义。

 

“你的领域知识不足时,根本没法意识到人脸识别还存在什么问题。媒体上铺天盖地的宣传告诉你人脸识别的精度已经超过人类了,哪些是忽悠?现在这么多的新闻、八卦,这么多所谓的商业情报,你怎么判断其中的真伪?每年涌现上千篇的文章,你看哪一篇?主要往哪个方面突破?这都需要大牛在这儿给你坐镇做出判断。”

 

刘昕读过很多历史,深知重大历史事件来临时往往前兆不显著,所以需要大牛来扮演判断者的角色,“春江水暖鸭先知,我们要当那只鸭子,知道技术的变革要来了,我们要准备了。这是我们一定要压大牛的原因。深度学习这个技术,可能会被另外一种技术替代,我们也在等待下一轮技术革命的到来,等待下一次的弯道超车。现在我们是追赶者的姿态,我们希望有一天我们能成为引领者。”

 

他说,公司不仅要赌今天,还要赌明天,现在在深度学习这个赛道上他们并非率先起跑者,但这并不妨碍占领下一次的先机。如何在5年后、10年后、20年后公司仍能存在?必须要对未来前瞻性判断,对技术有前瞻性投入。

 

“我们正在建立现代公司制度”

 

当Xtecher表现出对“师生组合”的兴趣时,刘昕强调,“不要刻意考虑这个组合,我们正在建立现代公司制度。我们会按照《公司法》制定每个人的职权范围,我们有CEO向董事长日常汇报的制度,有总裁办的会议制度,并不是大家想象中的是老师在那儿讲,我们在下面做,不是那样子。”

 

虽然公司现在只有几个人,但是刘昕认为“制度建设应该从一开始开始”,他正在起草这些制度,“我们其实也要不断回应外界的质疑,比如人家会说你作为CEO和董事长的职权如何划分?”

 

“我不希望被当作是一个纯粹的理工男,但我也不想被当成一个文学青年,我现在更希望是做一个接受了现代企业管理理念的CEO,跟我的董事长如何进行配合。”

 

如今,相对于山世光,刘昕有更多精力做一些具体的事。他的工作涉及写融资BP、企业战略设计、招人,也协助山世光管理一部分技术。此外,他还在做微信公众号“深度学习大讲堂”,推送高质量的原创文章,不断与同行们深度交流。

 

“君子和而不同”,是刘昕谈及自己和山世光关系时的形容——山世光给出重大原则问题的决定,而在具体事情处理上,大家可以持不同意见,充分讨论。

 

刘昕说,山老师对学术的追求和坚持很打动他。当他决定做这个公司CEO之前,已经把可能发生所有的关系全都考虑好了,也在不断学习一些公关课程、管理课程。

 

“我已经跳到战壕里面来。山老师的理想是做一家百年老店,我的理想是为山老师工作50年。”

 


下篇|中科视拓之路:知人识面辨万物

 

相比于“指纹识别”,人眼可以看脸,机器判断不准时,人眼可以二次确认,所以“人脸识别”作为一个识别方式更加自然。识别之外,还有很多延伸:识别情绪,辅助驾驶,服务机器人对人更好地“察言观色”,AR、VR设备对人进行观察——未来,人脸识别会成为很多智能设备的基本能力。

 

人脸识别领域不乏明星公司:Face++、商汤,还有海鑫高科,以及山世光曾经长期合作的“上海银晨科技”。

 

为什么市场已有这么多玩家,山世光还会义无反顾跳进来?

 

山世光答:“我们瞄准的不仅仅是人脸识别,AI系统必须要能‘看’这个世界,而未来AI会无处不在。即使退一步只是考虑人脸感知相关的应用,也还远未饱和,还有很多值得做的新业务。”

 

市场的确很大。公安、金融、考生身份验证、社保查验都有应用。山世光认为,人脸识别大家现在水平都差不多,因为用的方法都差不多,“深度学习没有秘密,大家手里的武器差不多,只是积累的数据不太一样,以及针对特定场景经验积累的多少,剩下的就是你怎么找到应用、怎么做商务、怎么运营这些事。”

 

目前,中科视拓积累了数百万量级的人脸图像数据。如今资金已到位,但山世光并不打算盲目扩张,到今年年底,将建立20人左右的团队。

 

中科视拓希望以人脸识别作为切入点,逐渐拓宽业务,最终走向“深度学习的技术服务”,为更多企业,尤其是中小型企业,提供人工智能的研发能力。

 

目前中科视拓有几步棋在走:

 

第一,深度服务几个典型客户,更加深入的理解行业;

第二,做一件“开创性”的事。(这个具体计划暂不方便透露,日后我们再详述。)

第三,未来将推出可批量生产销售的产品。


回顾从事人脸识别的这近二十年,山世光说,如果说最初十几年技术一直是“绿皮火车”,这几年的确加速度很快,已颇有坐“高铁”之感。

 

23年前,山世光乘坐近30个小时的火车,第一次离开老家,奔赴大学,做好了迎接漫长学术生涯的准备;23年后,新的征程又开始了,而这一仗也注定漫长艰苦,压力丝毫不减当年。

 

“天天发愁,最大的问题在于,我们作为一个起步于科研院所的创业团队,商务能力存在短板,所以我们正在寻找一些有经验的商务人士加入。”

 

这半年,他一直在看书“补课”,《从0到1》、《创业维艰》、《精益创业》、《Google是如何工作的》、《打造Facebook》、《长尾理论》;除了创业的书,也看关于心理学方面的书,《乌合之众》、《思考,快与慢》,心理治疗书《在生命最深处与人相遇》……

 

这位过去感受不到“与人斗其乐无穷”的教授,在迈过40岁的第二个年头,正期待着自己完成从技术大牛向一位“管理人”的企业家的蜕变。

 

“知人、识面、辨万物”,他教给机器这么做,也在教着自己这么做。

 

毕竟,火车仍在加速,新的维度终于翻折展开。来路平静深远,前路仍是未知,风景呼啸而过,此刻的山世光业已置身于滚滚轰鸣声中。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机