特稿 >

行业洞察 >

机器之眼看世界

机器之眼看世界

线性资本 丨 行业洞察

19126
1335

2017-01-18

地雷

Xtecher特稿作者

关注

文/刘童


你如果看过美剧《疑犯追踪》,那么对于“You’re being watched”这句台词绝不会陌生,剧中Finch所创造的machine能够通过全美的摄像头观测每个人的动态,预判他的行为,从而预测即将被卷入凶杀案的人。


QQ20170118-1@2x.jpg


现实生活中,人工智能与计算机视觉的发展虽然还达不到这种黑科技的程度,但让机器“看懂”世界已经不再新奇。


根据有关专家的实验结果显示,人类所能了解的信息有83%来自与视觉。计算机视觉作为计算机的眼睛,是机器认识世界、看懂世界的一种方式。目前计算机视觉主要应用于图像识别方面(包括静态、动态两类信息)。


QQ20170118-2@2x.jpg


静态内容识别


近几年,计算机视觉技术早已步入应用早期阶段。静态内容识别主要应用包括以图搜图、电商搜图购物等,这些应用不仅体现在基础服务层面,更旨在提升产品体验,将人类生活丰富化、娱乐化。


  • 搜索变革


图片识别技术的发展给搜索引擎带来了巨大的变革,传统的文字检索已经不能满足人类生活的需求。这件衣服看上去很好看,可是我不知道它是什么牌子的;这株花草我从来没见过,可我想知道它是什么品种;又或者我并不能准确描述我要达到的目标,只是想搜索到和我风格类似的内容,在这些情况下,以图搜图、搜图购物的形式应运而生,而图像识别技术则为其提供了技术支撑。


QQ20170118-3@2x.jpg


谷歌的图片搜索,淘宝的拍照识别,“衣+”的以图搜衣,“特赞”的设计师自动匹配,都是搜索变革下的优秀示例。


  • 照片管理


Facebook研发了根据相片进行人脸匹配的DeepFace;微软的How Old Do I look?能够根据照片判断年龄,去年成为网上红极一时的话题;雅虎收购的图像识别公司IQ Engine开发的Glow可以通过图像识别自动生成照片的标签以帮助用户管理手机上的照片。照片管理是图像识别中最接地气最日常的发展方向之一,而在其中,美颜技术又最为突出。


QQ20170118-4@2x.jpg


随着整容式美颜技术大行其道,现在哪怕跳广场舞的阿姨都懂得所谓的“一键美颜”,很少还有人将自己未处理的照片发在社交平台上。在美颜P图成为常态的情况下,我们也很容易忽略其背后的技术层面。


美颜的基础是人脸识别,同样也属于静态内容识别。一张图片经过图像采集、检测定位、特征提取等过程可以识别出脸部缺陷,再经过深度学习建立的模型可以定量的通过数据对图片进行修改完善,从而达到美白、磨皮、亮眼等效果。虽不能消除“照骗”的存在,但图像识别技术的确让人们见到了更美好的自己。


  • OCR技术


OCR技术即光学字符文本识别技术。计算机通过光学设备检查纸上打印的字符,通过检测亮暗的模式确定其形状,然后用字符识别方法将形状翻译成计算机识别的文字,完成计算机对文字的阅读。


QQ20170118-5@2x.jpg


在实际应用中,虽然OCR技术还有很多难点,如光线影响,图片分辨率低,文字排版不一等,但其应用场景却非常广泛,它适用于各类信息录入场景。对于身份证识别、单据识别这种大量、常规、重复的行为,采用OCR技术即提高效率节省时间,又降低了欺诈行为发生的可能性。


目前,OCR技术在金融、保险、物流等行业的应用已经较为广泛成熟,将来会逐渐扩展到医疗和O2O。


动态内容识别


在动态内容识别层面,人类的能力非常突出。图像识别作用于感官,人们辨认出它是见过的某一图形,甚至能意识到这个图像距离或形状的改变,这一过程被称为图像再认。


人类对图像再认有自然地感知,而在机器图像识别中,既需要记录当时进入感官的信息,又需要记录记忆中存储的信息,只有通过对存储的信息和当前信息的比较加工,才能实现对图像的再认,因此动态内容识别的难度和要求会比静态内容识别更高。


  • 智能安防


智能安防在公安、交通、司法、教育等多方面都有积极地应用。监控在过去的实际应用中,最大的问题在于需要人工查看图片和视频,费时费力有效性低,而智能安防正是让机器通过学习自己对图像和视频进行智能分析,针对重点场所、人群、车辆等进行有效的监控以降低事故及诈骗行为的发生概率。


以中科视拓为例,中科视拓的技术源自VIPL研究组过去十几年积累形成的Seeta技术。其人脸检测技术检测精度达国际先进水平,企业版在100个虚警条件下,检测率超过92%,开源版本在100个虚警条件下,检测率超过84%;其基于深度学习的Seeta人脸识别算法在LFW人脸识别评测集上达到了99.5%的平均准确率,并曾在FG 2015视频人脸识别国际竞赛中获得冠军。


QQ20170118-6@2x.jpg


依托数年来积累的千万量级人脸大数据,中科视拓可针对证件照比对、人证合一、刷脸认证、黑名单监控等不同的应用场景提供精准、高效的人脸识别技术。


近20年来,VIPL研究组先后以联合实验室或委托开发等方式,为包括银晨科技、华为、百度、三星、高通、Intel等在内的十余家合作伙伴提供相关技术服务。通过这些合作伙伴,团队研发的人脸识别技术被成功应用于上海世博会、护照人脸比对、公安部出入境系统、十余省公安厅人脸识别、百度寻人等重要应用以及多款智能终端设备中。


  • 直播监管


若说现在哪个行业门槛低又挣钱快,网络主播绝对可以算其中翘楚。此前就有新闻爆出,一个普通的网络主播可以月收入30万,也正是由于这种高收入的吸引,一时间涌入大量直播平台和网络主播。


当一个行业出现不需要什么硬性指标就可以赚取暴利的情况,其对人性的考验就会大大提升。为吸引眼球获取更多的利益,网络直播内容往往很容易倾向于色情、暴力等方向,这时直播监管、有效鉴别小黄图就成为社交、直播以及云平台的刚需。


但作为新型的社交互动平台,网络直播和传统的视频网站不同,其实时播出、互动性强的特点使得人工监管力不从心,难以做到及时有效。在这种情况下,机器图像识别、深度学习智能审核就成为了一条必经之路。


QQ20170118-7@2x.jpg


直播监管可以主要分为两种服务类别:


标准审核服务:包括鉴黄、暴恐识别、广告识别、敏感人脸过滤等。

个性化定制服务:根据客户的实际需求,定制专属的图像识别整体解决方案。


目前,国内能够为网络直播企业的违规内容过滤提供这种模式的主要有图普科技的“智能审核机器人”,阿里的“阿里绿网”、腾讯的“万象优图”等。这些应用虽然在一定程度上是“反人性”的,但我们不能不承认它们有着巨大的作用和广泛的市场。


图像识别的前景


目前,图像识别技术正逐步从初级阶段向高级阶段过渡。它不再满足于简单的娱乐化、工具化,而逐步向AI视觉发展,即机器利用视觉去思考。机器视觉之于人工智能的意义就是视觉之于人类的意义,而决定着机器视觉的就是图像识别技术。


苹果公司日前发布的其公司首份关于AI的学术论文“Learning from Simulated and Unsupervised Images throughAdversarial Training”也瞄准了计算机视觉领域,其中主要描述了在计算机视觉系统中提高图像识别的方法,这或许标志着苹果公司研究的新方向,从中我们也能看出图像识别的重要意义。


QQ20170118-8@2x.jpg


随着人工智能的深入发展,机器图像识别的准确率普遍可达90%以上,远远超过人类自身。各大科技巨头纷纷在图像识别和人工智能领域有所布局并取得进展,我们有理由相信未来计算机视觉会像水电一样走进千家万户,渗透进各行各业,并重塑未来商业格局。


来源:微信公众号“线性资本”

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机