思必驰CMO龙梦竹:AI浪潮下,万物皆可echo

思必驰CMO龙梦竹:AI浪潮下,万物皆可echo

2017-10-25 17:22Newseeders 合作伙伴
整个对话技术会给行业带来什么?带来更多的行业融合,包括现在的传统的智能处理,跟医疗结合,做成智能诊疗的助手,包括带来很多新的大数据,新的用户维度划分,对广告行业用户数据跟踪带来影响,带来很多行业重构。

10月25日-26日,由清科集团、投资界、新芽NewSeed举办的“2017V武林大会”在北京召开。 从“少有人做的事”,到“全民创业”,V50陪伴创业者们跋涉了十二年。2017 V计划,汇聚最具代表性的创客及投资大佬,解读最尖端的技术、分享最前瞻商业模式、展示最摩登的产品,最具投资价值企业巅峰对决,探讨浪潮之中与浪潮之外的创业、投资机会。

会上,思必驰CMO龙梦竹女士发表了《AI浪潮下 万物皆可echo》主题演讲。

以下为演讲实录,经新芽NewSeed(www.NewSeed.cn)编辑整理:

大家好!标题很有意思“AI浪潮下 万物皆可echo”,echo是这两年智能硬件物联网行业非常出众的爆款,对全世界来说都是。

echo是亚马逊2014年推的一个智能音箱,除了echo之外,在物联网方向下的智能家居设备,其他互联网巨头比如微软、谷歌、苹果都有产出类似的智能硬件,比如2014年亚马逊echo,微软的Button,谷歌的Home,苹果的Hmoe Pod,看上去是智能音箱,像echo这样的爆款产品,国内国外到底有多少可能?

我们把时间线和目光放长远,不看现在,看以后,与其说是智能音箱,不如说是智能处理的终端设备,只是恰好偶然以智能音箱的外形呈现,如果做成中空的,能够插上一只花,就是带echo功能的智能花瓶,如果做成路由器,就是带echo功能的智能路由。

大家耳熟能详的科大讯飞的叮咚音箱,阿里的天猫精灵,小米AI音箱小爱同学,包括蓝天科技都在做智能音箱。现在在音箱里面品牌覆盖是第一的。

至于今年下半年和明年,我们还会力推智能家居物联网以音箱和电视为代表的诸多产品类目合作。所有产品合作里面,在语音技术来看,反映的是一个需求。认知型的自然口语对话,不再是简单的语音识别,不再是简单的语义理解。整个语音交互是非常长的链条,合成到理解、内容服务,echo带火这一些智能处理设备终端来看,反映自然口语对话的趋势。

什么叫做对话?大家第一印象会觉得对话就是语音,思必驰就是一个做语音的公司,从技术剖析来看,所谓语音交互第一拨链条,语音综合信号进行采集、处理,转化成其他信息,比如文字或者其他格式,用计算机语言进行编译和理解,对话不仅包括语义,包括文本、图像信息,打开手机微信,任何一个朋友的整个沟通的记录,称之为完整的对话,发送歌曲、地图位置、某个小程序,这些都是在对话的范畴里。

对话的类型根据次数、结构层次,大概分成四大类:最简单的是命令式对话,开灯、关灯,空调调到26度,我要去中山公园,只有一句话,单轮的,并且语义结构相对简单。这两年跟语音、语义相关的创业公司,超过一百家。绝大部分都在做跟语义相关的,而其中以闲聊式对话的创业公司最多,闲聊式对话跟问答式对话刚好有比较明显的区别,问答式对话比较多地介于专业的相关技术竞赛里面、比赛上面,在某个特定的领域下,对信息搜索、识别、挖掘、回答进行一个判定。

在问答式对话里,有非常明确的主题,用户想说什么,想知道什么非常明确,有正确、错误的区别,而闲聊式对话,在整个交互过程里,用户可能不知道自己想问什么,也可能不知道自己想要什么答案,纯粹的设置希望通过多轮交互,获得一种聊天乐趣。这种闲聊式的对话交互,这两年的机器人里面比较常见。

最近同学给我讲一个小花絮,带着我们的合作产品小乐出去做参展的时候,常常遇到消费者跟小乐互动,我们小乐有唤醒词“你好小乐”。用户会问:“你好小乐,你叫什么名字?”这种交互不在乎获得什么答案,在乎作为机器人跟我聊天的时候,是否给我一个好玩的结果。真正的人机对话交互里,能够真正去帮助用户解决一些问题,去处理一些任务的这种对话,其实是最上面的任务型对话,通过多轮的一种交互方式,通过后端的内容服务和语音信号处理和对话内容的一个解析,帮助用户最终完成某一项工作。

我们现在最好的类似人与人之间的任务式交互,中间站的位置比较宽的对话框,比如附近有人均一百元的川菜馆吗?这句话正常的解析和语音识别里,这句话的识别率一般都能够达到99%或者100%的正确。当你再把这句话解析出来以后,需要对用户说话的意图和需求的内容服务进行进一步理解,以及采取什么样的一个反馈,是跟他说,我找到了川菜馆,有这么多,还是直接给他一个选择的导航界面,让用户快速选择。这种对话是现在在实际的应用落地场景里面会做得比较多的一种复杂的多层次的一个任务型对话。

思必驰的特点就是我们其实成立了有十年,在2007年的时候,我们的中文名字源于音译AISPEBCH,云技术体系专注对话交互方向,我们的对话特点专注任务型对话,同时保证有效的人机交互,也会做协调和问答,保证整个人机交互的体验有序性和整个体验的更好。

整个echo是只能助理设备终端,只是偶然以音箱的外形呈现,真正让大家觉得好用,背后是Alexa平台,可能做出不同款的echo,联想智能音箱国外的海外版用的Alexa技术,整个体验跟echo保持一致。完全做智能音箱,不如想产品用户需要什么,有什么外形的智能处理设备终端什么更符合产品设备需要。

不同的场景下,所谓个人助理设备终端,就是能够解决这个环境下用户的所有核心刚需,比如我们的客户车萝卜HUD,可以称为车里的echo,联想的音箱可以称为带屏幕的echo,能够联动所有的联动设备,做个人日程的设定。比如机器人,陪护版的机器人,可以叫做儿童版的echo,解决儿童那个年龄段所需要的内容服务。包括很多投资人也在看,未来得一个趋势,我们在猜除了echo智能音箱以外,下一个火的类目是什么,智能蓝牙耳机是新方向,因为轻巧、轻便,我们可以叫做轻量版的个人随身echo,只要产品切合场景,跟用户需求达成一个一致都OK。

Alexa平台是国外的,是亚马逊的,要出海的用Alexa很合适,国内将近50来家以对话平台、语音平台为teamwork的公司,我们对50家公司进行分类,基本上从它是否有前端的感知能力,就是识别跟合成,包括背后的语义理解NOP能力,背后是否有内容服务,真正拥有全套能力平台不算特别多。

思必驰今年9月推出了DUI全链路的对话定制平台,我们拥有所有底层技术包括识别、合成、理解各种技术能力。思必驰在《机智过人》中有两节目的参与,一个是我们的声文识别,一个是语音歌曲合成技术。《机智过人》还是比较有趣的,大家可以看一下。

我们推的DUI平台,除了把单纯的语音识别技术出来以后,还对整个工程化项目的支持做了深度定制和服务,我们以前专注在物联网,现在DUI平台,泛物联网化合作。以前的合作方案里,比如新上的一部电影《三生三世十里桃花》,把这个电影解析出来以后,定位到合适的内容,可能根据客户的需求,需要升级提供方案的版本。

现在客户可以在后台自己快速去定制本地的固定词,命中率会更高,能够用秒级直接传到客户端,用户直接体验,整个人机对话由客户定制。

我们现在所有平台公司考察三个能力,第一,核心的底层的技术实力,就是所有语音技术对话解析能力是否可以?第二,工程化落地的能力,包括大数据运维团队,一些线上的跟踪功能等等。第三,接地气的服务能力。

整个DUI平台,9月份刚刚推出,思必驰最大的特点是做赋能公司,我们不会做任何C端硬件产品,而是希望把我们的最好的技术公平、公开提供给所有的合作客户,包括我们现在已经跟行业内,包括海知、三角兽、盛世科技达成全面战略合作,希望把最好的技术做成集成,让客户做更多的可流通的对话智能,不是采用以前的打包式的封闭方案。

以前方案推出去以后,十个产品有九个产品企业是一样的,现在希望把更多的定制功能,做更多的智能处理设备终端,把这样的技术实力提供给客户。

整个对话技术会给行业带来什么?带来更多的行业融合,包括现在的传统的智能处理,跟医疗结合,做成智能诊疗的助手,包括带来很多新的大数据,新的用户维度划分,对广告行业对用户数据跟踪带来影响,带来很多行业的重构,比如二次元的社交,比如新型行业,都基于语音交互、人工智能的发展而起来的。

今天分享到这里。谢谢

*本文作者Newseeders,由新芽NewSeed合作伙伴新芽NewSeed授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。