特稿 >

前沿热点 >

思必驰DUI开发者实战营“第二期”在北京举行

思必驰DUI开发者实战营“第二期”在北京举行

Xtecher原创 丨 前沿热点

17088
2461

2017-07-23

tuni

Xtecher特稿作者

关注

7月22日,思必驰DUI开发者实战营第二场——北京站,在北京富力湾酒店召开。思必驰DUI平台是为物联网、移动互联网和互联网开发者提供超高、更自由的对话定制的工具平台,思必驰表示,DUI平台前期将完全免费提供给开发者使用,后期将拨出两亿元基金用于扶持平台优秀开发案例和技能。

 

思必驰的副总裁赵恒艺首先分享了思必驰DUI平台的开发理念。


WechatIMG46.jpeg

 

赵恒艺:大家下午好,特别荣幸邀请到各位尊敬的开发者到我们的会场。7月7号我们在深圳喜来登大酒店举行了思必驰DUI的首秀,当时也是我们特别荣幸邀请了很多老板、总裁、总经理、CEO到会。本次Workshop是为产品经理人以及开发者准备的,我们将为大家展示更多设计细节。

 

在过去的几十年里,鼠标、键盘开辟了PC时代非常大的浪潮,随着智能手机的出现,一系列通过触屏衍生的交互手段随之产生,现在世界上有超过80亿台相关设备,联网设备已到百亿量级,超过地球人口总和,我们认为自然语言交互将是未来一个非常有力的交互手段。

 

我们能够看到语音交互在下一个时代的入口,非常多的巨头开始做相关的布局,但思必驰认为语音只是其中一部分,真正能成为下一代设备交互入口的,是对话。所谓的对话就是通过语音去获取信息,做到信息流的交互,通过语音可以方便的去操控设备,同时可以从语音上获取更多内容和服务,人们可以通过语音去打开一个更大的入口。

 

所以思必驰认为,对话将成为下一代语音交互的入口。

 

在设计DUI平台的过程中,我们搜遍了几乎所有对话定制平台,包括facebook、谷歌、亚马逊、微软这些巨头的产品,通过全行业调研我们发现,国内有40多家企业做对话平台,这些平台大致可分为四类,在底层识别、文字处理、语义理解以及后端技能等方面均有所不同,后端技能就是语音衍生后,不仅以文字及细节的呈现,更能连接第三方内容以及操控设备,这一整套链条构成了一个真正的语音交互。

 

在纵观整个行业,思必驰DUI现在要去做的是要达到全流程可控及高度定制化的产品。我们在7月7号之后,对开发者进行了调研,非常多的开发者对此持观望态度,并未真正去尝试,所以我们接下来会举办多次Workshop,跟大家密切沟通;很多开发者不了解DUI平台相关技术细节,我们会向整个行业开发者提供比较详细的介绍。

 

能自主定制,几乎是全行业的共同期待,但产品需求的差异化很强,有人需要SDK形式去呈现,有人需要一揽子的解决方案,有人需要简单的设计并快速推进市场,有人侧重对话技能,他们从各种各样的技能出发可以非常好的去完成他们的一些需求,我们需要把方方面面的需求都考虑到。

 

思必驰侧重于多轮的以任务为驱动的对话,根据知识的复杂程度以及交互轮次结果,对话的复杂程度可分为四个象限,第一个象限是任务式对话,任务式对话体现在几个方面,侧重垂直场景诉求,也会兼顾相关的问答,比如相关的对话场景,思必驰的能力都可以覆盖到,对话交互最难的部分是任务驱动型,有非常多的知识结构、信息、网络、格式化的数据,在多轮的形式呈现给用户,交互过程中非常多的细节都需要考虑到。

 

有关对话,直观的感觉是你说一句,机器回答一句,但我们认为不仅仅是这样的,对话的本质就是信息来源,信息是人与人之间的对话,可以察言观色,可以看肢体的语言,实际上对话是信息的传递与互通,针对人机交互,文本及图像仍然是对话这一整个信息流不可或缺的,非常方便的途径。

 

所以说我们在设计整个对话流程的时候,不仅仅是需要关注到怎么设计对话,一来一回我们的言语应该怎么去说,同样这个结果怎么去呈现,以及我们以怎样的模态进行更合适的交互,都是我们做对话设计的过程中所要考虑到的因素,这不仅需要交互设计师的来做,还需要将很多相关的设计都需考虑进去,才能有更完美的用户体验。

 

所以GUI+VUI+Dialog就等于思必驰DUI对话定制平台,为什么叫DUI,我们希望随着对话式人工智能的推进,我们也能够推动对话交互的形式,能够在无屏的设备、有屏的设备以及各种各样的设备都能够有非常好的定制化的用户体验。

 

思必驰一直是致力于端到端非配合的自然口语交互系统,端到端不仅仅是做自然语言处理,从前面的感知到后面的输出的环节,从语音识别到语音合成,还包括在中间的包括对话管理、自然语言处理、自然语言生成等等这样一系列系统,我们都做了很好的技术储备。思必驰从2007年创建之初推出了自己的基于人机对话的口语对话的系统,2013年在行业里面首次推出了“思必驰对话工场”对话平台,到现在我们的DUI系统实际上一直在持续的为这样一个非配合式的口语交互系统做了相关的技术积累,到现在来讲,随着我们在车载领域的纵深发展,我们跟合作伙伴进行各种场景的打磨,我们有了更多更宝贵的经验,现在会把所有的技术模块都提供一些定制化能力的输出,开发者可能在一个星期内就能够做出来一个真正能够面世很成熟的一个产品。

 

我们前面也讲到我们所有的相关的技术积累,实际上从识别、合成,到识别++,再到自然语言处理再到语义理解,思必驰已经做了完整的技术储备,我们现在差不多有两三百人经年累月的进行技术的积累,我们很多相关的工作已经达到行业前沿的水平。

 

我们跟行业非常多的合作伙伴们一起,进行了非常多产品和技术细节的打磨,思必驰一直是一个To B的公司,我们需要让自己的技术跟终端的厂商,一起深入地去打磨To C的产品,才能够打造非常好的用户体验,同样,因为有非常多的需求都给到思必驰,那思必驰在打磨针对To C产品过程中,在用户体验优化的环节中,又必须考虑到怎么样去很快的、很迅速的以一个很高的效率去满足定制化的需求,怎么样把这个事情做得更加简单,在这个中间我们工程师需要做非常复杂的工作,给到我们合作方,有非常多的用户痛点,我们也希望通过DUI平台的升级能够赋予到我们合作厂商非常大的便利。

 

有的用户比如说做车载后视镜的厂商,很多硬件的设备给到用户后会难以识别,实际上不仅仅是产品体验的升级,有的是硬件的修复,我们需要给用户一个负责的态度去呈现,但是这毕竟是耗流量的,如果升级一个系统花几十兆,很多时候我们的用户是体验不到这样一个感觉的。我们希望能够给他们做一个非常快非常便利的升级的过程,实际上在DUI的设计过程中,我们都会把这些需求方方面面考虑到。

 

有的客户他们自己有一个相关可以运营的需求,实际上我们现在不仅仅需要把我们的技术提供给我们的开发者,提供给我们的合作伙伴,很多时候我们数据是不是能够分享给我们的客户,我们是不是可以跟他们一块进行一个特别好的用户运营,这个也是我们在做DUI的过程中去思考的问题。

 

有很多我们在座的非常多的甲方,甲方是需要给领导汇报的,相关的一个产品输出一个周报,给老板看一看我们的数据是怎么样,我们有多少用户反馈,这个实际上是我们需要考虑的关于产品经理的诉求,我们可以输出一个特别好的很好合适的数据周报,以及我们用户反馈的报表给到我们的开发者,使我们非常快的去做到这样一个分析,以及把这个能力很快的输出给我们的开发者,很多相关的一些思考我们在后续都会给大家讲到,去看一看我们整个DUI,除了对话设计做了非常好的功能开发外,我们是如何很好的去满足开发者在自己产品研发中的一些诉求,这样一些痛点我们应该是都可以方方面面给他们介绍到。

 

OK,我们讲到整个语音对话的流程体验,大家可以看一看,实际上我们除了语音、声音输入、声音输出之外,看到下面实际上是DUI操作的工作,也有很多时候比如说我们的手机、平板电脑、智能后视镜、车机等都是带屏的设备,所有的用户操作都是在DUI上进行展示,以及相关界面跟动作的输出,比如说,我说我要导航到某个地方,实际上这个导航类的界面是需要跳出,而且在这个过程中需要给用户一个实时的感知,这样一系列的交互流程我们都需要考虑到,DUI可以飞快把这些事情给做好。

 

同时,一些Skills是需要连接非常多的用户和服务的,我们有很多内容的用户和服务商也到了现场,非常感谢大家对思必驰的支持,我们实际上是客户端,比如说安卓、IOS上面他们提供客户端的SDK,我们有一个接口的平台,大家可以把我们的接口打通,在设计技能过程中,比如语音定制各种各样的对话管理,我们通过接口资源都可以很好的把这一流程走下去,而且是考虑到设计这个流程很多是我们产品经理在做的事情。在这个过程中,我们不需要IP地址等等东西,或者写一大串代码,大家使用亚马逊会有很多这种的挑战,包括我们有一些国内的同行,还没有进入技能开发,先把这个做出来,你得先输入一个IP地址把这个资源给对上去,这是很崩溃的事情,因为我们很多时候会卡在这个上面,没有办法进步,我们更希望的是有一些想法,通过我们的UI界面可以把它快速实现,我们加一个搜索框,有高德的朋友在,输入高德,高德导航SDK出来了,那是一个很好的便利的客户体验。同时我们可以进行一个很好的参数及对话流程的设计。

 

另外,我们各种Skill是对外开放的,思必驰会自己做出来非常多满足我们用户体验的Skill,另外我们也建立Skill平台,我们希望非常多的开发者Skill的出现和分享,也期待非常多的内容服务能够通过Skill,能够通过对话交互的方式能够呈现给我们的用户,带给我们用户特别丰富的内容,特别丰富的服务,以及连接各种各样第三方的设备,实际上在各种各样的平台里,我们都可以把这个体验给打通,这个也是我们DUI平台上可以呈现给开发者以及最终给我们终端用户创造的价值。

 

实时更新,这实际上是我们在非常多的开发过程中遇到的用户痛点,因为很多时候一个开发包,一个APP,几十兆,如果是一个在没有网的情况下走流量这还是很心痛的,很多跟我们用户体验相关的,比如说凉凉,这是最近刚出来一个比较有名的歌曲,《楚乔传》一个新剧,这是很简单的数据,但是它的更新会变得很漫长,思必驰也经过非常多客户的反馈,我们也在积极的想怎么样把更新的权利赋予我们的开发者,让开发者可以进行定制,实时以及跨版本在后台可以直接更新,我们在前端客户端不需要进行相关的操作,在云端就可以实现。

 

另外,在UI层我们也可以给到相关的更新,我们创造了差不多是五类空间,有非常多的衍生出来的空间我们都可以进行实时的更新,我们在客户端上创造了一个玲珑系统,它是一个非常小巧很敏捷变化很多的系统,但是我们通过玲珑系统的构建可以把我们实时更新做到很方便。

 

这是我们思必驰整个核心技术的展现,在识别上我们不仅仅是做到了在云端的通用的识别,实际上在本地也做了识别,我们通过CTC的模型,可以降低80%的搜索空间,以及我们在远距离语音识别,以及我们唤醒上也有一个很扎实的技术呈现。

 

我们在语义问答上面也有很多的合作。

 

同时需要提到语音是我们的一个基础能力,DUI平台是基于语音的系统级的服务,怎么样在这种整个服务性的平台上面构成一个高可用的能力,也对我们整个团队提出了非常高的要求,现在我们不仅支持每天最少10次的自动化的部署,同时我们通过我们各种云计算架构的更新,能够达成很高的可用性以及很好的用户解决方案。

 

另外大家都知道思必驰是做语音的,语音就是我们的命,针对我们对话交互时代的来临,我们首先不会掉队,然后保持着思必驰的领先优势,接着向行业老大看齐,还好有非常多的资本以及我们整个全行业各种各样的支持。我们思必驰设立两亿的基金,对平台优秀的开发者以及在DUI平台上或者上游下游我们在内容服务端或者我们前端等等对我们的用户体验提升帮助作用的合作伙伴们,我们会给予资金的支持,这两亿的基金已经注册了,大家都可以看到。

 

另外我们会有开发者计划,针对开发者,我们希望他们在DUI平台上能够有更多开发工作,能够输出更多的内容和更多的服务,以及能够在各个层面给予我们很好的用户体验,通过这样一个开发者计划,能够更具针对性的对我们整个开发者用户平台做更好的提升。


另外,现在思必驰DUI的铁军团队已经有110人的规模,放眼国内应该是一个非常大的团队,团队战斗力是非常强的。

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机