特稿 >

科技快讯 >

搜狗发布高效速记工具“搜狗听写”加速人工智能产业化落地

搜狗发布高效速记工具“搜狗听写”加速人工智能产业化落地

Xtecher原创 丨 科技快讯

12485
1784

2017-08-09

tuni

Xtecher特稿作者

关注

语音记录,是记者,编辑,作家等文字工作者们常用的记录方式。但对于记者来说,语音不方便后期的整理、分享和追溯,这也是导致听语音记录的过程费时费力,影响信息的沟通。今日,搜狗推出语音实时变蚊子的速记工具“搜狗听写”,解决会议、采访、写稿等场景下长语音内容转换文字难题。

 

为了保证在各种复杂场景下都能精准转换文字,搜狗听写采用了大量的前沿科技,在转换方面,搜狗听写使用了搜狗知音独家研发的长时语音转换技术,并与业内领先的端到端深度神经网络技术深度整合,是的语音识别准确率保持在较高水平。


据Xtecher了解,搜狗听写的功能相当强大,可以支持写文章、采访录音、会议记录、笔迹整理、日常记事场景,帮助用户实现高效记录和信息输入。而且针对不同场景和需求,搜狗听写可以支持“听写”和“转写”两种模式,在“听写”模式下则可离线录音,录音完成后一次性获取文字结构。同时,为了提高文字整理效率,搜狗听写还贴心的加入了边听边改,无线标重点、多端同步、信息分享等人性化功能,大幅度提升记录效率,让文字编辑更轻松。此外,在针对图书馆、咖啡厅等不变大声说话而又有使用语音的场景,搜狗听写提供耳语识别技术,在人的说话音量低于30分贝时,依然可以准确识别。


搜狗公司语音交互技术中心总经理王砚峰表示:“搜狗听写作为一款多场景语音听写工具,其产品在关键在语音识别准确率,而通过大规模的优质语音训练数据和深度学习的技术能力积累,搜狗也将这种语音识别的技术化优势转化到了更多的适用场景。


目前,搜狗已经建立了强大的语音自研团队,拥有互联网规模最大的语音数据。每天超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断学习,识别准确率越来越高,可应用的场景也越来越广泛,此次推出搜狗听写产品,是搜狗语音深入用户垂直长青下的有一个全新探索,通过更加专注于特定的场景和人群,去理解用户需求,解决实际困难,从而让语音技术为更多人所用。综合搜狗在人工智能上的产品布局,可以清晰的发现,让人工智能更“接地气“,已经成为搜狗在人工智能领域的独特标志。


5e43f0d5b8a4c547.jpg

 搜狗语音交互技术中心总经理 王砚峰

 

发布会后,搜狗语音交互技术中心总经理王砚峰接受了现场媒体的采访:

Q:请问市场上的同类产品相比,搜狗听写的优势在哪?

A:我觉得是两方面,长时间的录音和免费转写方面搜狗领先,搜狗产品会更加面向具体场景。很多小功能都能体现出在应用及用户体验上的优势。


Q:为什么会选择现在这个时间点发布?

A:本来应该更早发布,之所以放在这个时间点,首先是为了呼应之前的发布,我们知道目前存在各种问题,后面会有更多的产品发布,向雨后春笋一样,产品是上半年做出了,但我们为了推出更成熟版本做了很多验证。

 

Q:今天发布的产品未来会不会收费?

A:目前产品是全免费的,未来是否收费尚未确定,产品收费不是搜狗的盈利模式。


Q:技术如何提高到更高识别率?

A:用户更多的时候是需要产品提供方便整理和查找,而不是技术上100%的识别率。我们并非是做技术导向,而是做产品导向。在我们做到90分的时候更需要做的是提供更多的便利。


Q:我感觉准确率并没有我想象的那么高,请问识别率到底有多高,能识别几种方言?

A:97%的识别准确率是在标准情况下测试得到的,在非标准环境下无法达到这一级别。未来我们提高的目标就是在面对各种极端环境下提高识别率。目前我们支持全国各地的重口音,但方言很多时候是要面对语法的不同,解决重口音的问题目前是重要问题。


Q:下半年还会推出什么产品?

A:语音交互产品、可穿戴产品、车载产品等,非巨头垄断的领域会做一些有竞争力的产品。


Q:您提到了非垄断领域,那么非垄断领域是指什么?如何规避巨头竞争?

A:在手机、电视机等领域巨头品牌已经相当稳固,在车载、智能音箱领域我们认为市场上玩家很多,但尚未成熟,在这些领域,我们有信心拿出爆款产品抢夺市场份额。在可穿戴领域目前我们已经有一定的斩获。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机