在语音交互领域,出门问问是家特殊的公司。它没有选择技术公司常见的2B路线,而是面向2C市场,转型软硬结合,创业5年推出了8款产品。每次业界都质疑它的硬件如何“烧钱”时,它的每一步却都得到了巨头的支持:与谷歌合作,并获得了谷歌的C轮融资;拿到大众汽车投资的1.8亿美元D轮融资。一家AI公司为何做起硬件来了?
“百箱大战,我们起了个大早,但是却晚到了。”出门问问创始人李志飞对记者说。
8月24日,出门问问的智能家居产品问问音箱Tichome正式面世。出门问问正式投入了当前国内智能音箱大战之中。
而在此之前,出门问问已经成为国内上半年最受瞩目的人工智能公司之一。几个月前,李志飞也一反他推崇的谷歌“工程师文化”的常态,脱下T恤,换上西装,宣布获得大众汽车(中国)集团D轮1.8亿美元融资,同时,双方成立合资公司,研发并应用车载人工智能(AI)技术。在这一轮融资后,据李志飞透露,出门问问“只说估值应该可以说迈进了独角兽的行列”,也即是说,跨过了10亿美元的门槛。
创业5年,出门问问终于等来了最好的时代,人工智能从沉寂站上了风口。出门问问从一家做自然语言技术的公司,却跑去做了“烧钱”的硬件,经历了智能硬件行业的起伏,面对了业界多年的疑问,而今,语音助手和智能音箱掀起浪潮,“软硬结合”的模式仿佛得到了验证。
但这同样也是最没有确定性的时代。智能音箱同样也是个硝烟满布的市场,这到底是不是短暂的狂欢,行业的讨论也从未停歇。人工智能技术在不断发展,但人工智能公司仍在面临商业模式的探索。
经历了国内人工智能创业发展的不同阶段,也跨过语音领域几乎所有产品形态的坎儿,李志飞承认,出门问问也仍在模式的探索之中。不断变化的“折腾”就是他应对瞬息万变的科技时代的法宝,而语音交互则是他为公司确定的核心。从“最像谷歌的公司”,到怼小米,到牵手大车厂,出门问问正在形成自己的一套商业逻辑。
五年前,李志飞辞去谷歌总部科学家工作,成为谷歌研究院归国创业的第一人。
在此之前,李志飞在谷歌待了三年,是谷歌翻译团队的主要成员。作为NLP(自然语言处理)专家,他曾开发了世界两大主流机器翻译软件之一的Joshua。而在谷歌的那段时间,“人机交互”成为李志飞关注的重点。
2011年,Siri以iPhone4S内置应用的身份面世,谷歌也对语音技术投入了极大的精力,想要让语音搜索变得更加准确,语音输入变得无处不在。
当时同样在谷歌任职的格灵深瞳创始人赵勇曾向记者回忆,某天李志飞向他展示了自己做的一个demo应用。“他跟我说,要把语音识别跟生活助理放在一起。我问怎么用?他让我说‘要去上海’,就跳出转换成文字的一句话我要去上海,然后跳出一个购买去上海火车票的链接。”
几个月后,李志飞辞职回国创业,目标就是“下一代人机交互”。当年,国内还很少有人对人工智能技术有所了解,但只凭一个demo,李志飞还是获得了红杉资本和真格基金的认可,拿到了数百万元天使轮融资。“我对他是一见钟情。虽然不懂他做什么,但我懂得他的理想与决心。”徐小平后来如是写道。
最初的出门问问也并没有想做硬件。它当年推出的第一代产品是中文语音搜索服务,并在2013年建立了微信语音搜索服务平台。当时,微信“出门问问”APP后台还有一名用户,ID为“Allen Zhang”——对,正是张小龙本人。2014年5月,出门问问在Google Glass上架“出门问问on Google Glass”中文智能语音搜索应用。后来,随着Google Glass项目失利,这款产品也停止了更新。
经过了几番摸索后,出门问问陷入了短暂的迷茫和思考。当时国内的用户,对语音交互并没有认知和使用习惯。而做软件和APP,依托第三方,合作的效果又有限。“我们曾经总用户激活量到达已经几百万规模,但是真正用户的留存率非常低。我们花了各种各样的资源获得了大量用户,但是这些用户用了一次两次之后不再用了。”出门问问CTO雷欣说。
语音交互必须寻找新的落地场景。几乎没花多少时间,李志飞就决定,公司转型做硬件。把语音交互集成到消费级硬件操作系统中,让用户可以直接调用。那时,李志飞并没有把产品目标放在2B端。当时,在他看来,“人机交互”做B2B2C是很难做好的。用户的习惯不在那里,也不知道有什么产品形态可以应用和形成黏性。而对C端市场而言,做软硬结合,当时在李志飞看来,基本上是唯一一条路:首先,硬件贴近用户;其次,它可以获得营收。雷欣表示,恰好在2014年Google I/O上,Google发布了Android Wear智能手表操作系统,因此,出门问问决定,将手表作为语音交互落地的第一个场景。
因此,这个从没有做过任何一款硬件的公司,开始在智能硬件领域从零起步摸索。2014年底,出门问问推出智能手表操作系统Ticwear,翌年,智能手表TicWatch问世。
对于大众而言,手表并没有就此激发语音交互在智能硬件中的爆发。但在李志飞看来,这次转型最大的价值是,它让出门问问成为一家全栈式软硬结合的公司:“从算法、硬件,再到供应链、销售、品牌、电商、售后……自己形成了一个所谓的商业闭环。”这样,就摆脱了做单一的技术服务提供商的桎梏。
把语音搜索放进可穿戴设备中,这也是当时和谷歌类似的打法。而在其后,出门问问这次转变的成果得到了验证。2015年9月,谷歌和出门问问达成战略合作,在中国大陆发行的Android Wear智能手表,用出门问问的语音搜索和应用服务替代谷歌服务。当年10 月,谷歌出资约5000万美元参与了出门问问的C轮融资。
出门问问开始寻找更大的语音交互的场景。下一个被李志飞看好的是车载。在车载占用双手的环境下,语音交互无疑能够发挥更大的价值。2016 年,出门问问进军汽车后装市场,推出智能后视镜问问魔镜Ticmirror和后装ADAS产品Ticeye等。
李志飞的“折腾”再次带来了效果。当外界还在猜测谷歌的融资什么时候被出门问问的硬件“烧完”时,出门问问进入了大众汽车集团的视线。
“大众要在中国打造移动出行‘生态圈’。”大众汽车全球副总裁苏伟铭表示。随着车联网的发展,大众也不再满足于汽车制造商的身份,而在车内环境中,无论是出于安全还是应用方便的理由,语音都成为被寄予期望的交互入口。而要满足大众汽车在车内实现智能应用的前提下,李志飞认为,出门问问能够与其牵手的原因在于,在语音识别、语义分析、搜索等方面,出门问问具备综合技术实力,而且,连硬件产品都有,并且还通过了国家3C验证。通过语音助手,出门问问的手表和后视镜、以及大众汽车内其他可联网的智能产品,可以实现云端互通,语音控制。
现在,随着问问音箱推向市场,家居场景也即将被出门问问打开。
从一个微信公众号到转型做硬件,创业5年来,出门问问的硬件产品覆盖智能可穿戴、车载和家居三个领域,共推出了智能手表、耳机、后视镜、音箱等8款产品,出门问问的战场也仿佛一再变换。
语音交互的未来仍在探索,李志飞的求胜之道,就是求快、求变,一条一条赛道的冲下去,快速试错,提升能力。“现在整个世界都发展太快了”李志飞说,“即使是腾讯或者阿里,今天的业务和5年前相比,也发生了很大的变化。”他给公司的“折腾”定下的目标是“提升我们的能力。车载也好,家居也好,我们做了,那么它对于我们对2C市场的了解,对我们的技术、算法、整个团队的能力,都是向前推动了一步,让我们能够更快冲进下一个阶段、下一个赛道。”而获取谷歌和大众汽车的合作,他认为,也是这种能力提升的结果。
李志飞给出门问问总结了三个重大节点,一是转型软硬结合,另外两个则是获得谷歌与大众的融资。软硬结合是公司业务的基础,而获得巨头的背书和资金支持,让公司能够继续拓展不同场景,则是他相当重视的。
“一个互联网公司的心态,就应该是拥抱变化,不要怕折腾。”李志飞总结。
出门问问仍然要把消费电子做下去,但是,这并不是公司圈定的核心业务。李志飞说,也许到某天,硬件能力也不重要了,进入了另外一个阶段,比如公司核心能力是AI,这也是有可能的。“但是今天你不往下走,可能就会死掉。如果大家每天都在考虑硬件靠不靠谱、被不被看好,但不行动,就会一直在原地打转。”
“人工智能创业公司最缺乏的还是商业模式。我们都在探索未来。”李志飞说,“如果未来三五年内,是其他公司探索出了更好的模式而不是我们,那才是我的失败。”
但是,出门问问的“折腾”并不是茫无目的的“撞大运”。“从始至终,语音交互始终是我们的核心。”李志飞说。
在获得D轮融资后,出门问问的产品路径和布局也大致可以为外界所判断了。
出门问问在今年4月,回归“初心”推出了虚拟个人助理VPA。但是李志飞提出,出门问问的虚拟个人助理,已经和四年前的语音助手有了根本的不同。它不仅是语音交互,是“主动”帮助用户完成工作,为用户做个性化的服务和智能推荐。
虚拟个人助理基于出门问问NLP技术的自然对话交互,拥有第三方应用服务的内容、基于用户个人识别与习惯记忆积累的个性服务;通过VPA平台,出门问问开发的手表、车载、家居的多场景产品,能够实现全覆盖的联动能力。
“我们重新提起它,因为它是我们整个公司接下来的核心服务。”李志飞兴奋地说。
最初,出门问问希冀通过把语音搭载到智能硬件上,获取大量的用户,打造新时代的“入口”。而近两年,随着一个以AI为核心的消费电子时代即将来临,语音交互的应用实现在不同场景中的落地,尤为重要。出门问问计划虚拟个人助理为核心,打通已有的应用场景,再扩展到汽车、金融、企业管理服务等等。
这很容易就让我们联想到,出门问问要用类似于亚马逊Alexa的平台,串联起出门问问在算法、软件和硬件上的能力,实现多场景联动,全线切入中国用户AI消费端市场。
这是一个宏大的愿景。但同样,要实现它,也还需要更多的时间,和更大的投入。
2017年,以智能音箱为代表的家用语音交互智能终端市场,开始引爆。“百箱大战”在国内打响。
从去年8月开始,出门问问开始筹备智能音箱项目。4月时,随着虚拟个人助理VPA的发布,问问音箱在业内露了一面,但李志飞也没有想到,在接下来的时间里,智能音箱就以爆裂的架势,迅速卷入了从大型互联网公司到传统音箱厂商、AI创业公司、内容提供商等各类玩家。从天猫、京东到小米,不排除有越来越多巨头的入场。“深圳南山区一公里以内就有112家公司做语音智能。”喜马拉雅硬件总经理兼副总裁李海波说。用户的习惯还没培养起来,智能音箱却已经以199元、499元进入了“拼价格”的阶段。
在暴风集团CEO冯鑫看来,做音箱是个更加“烧钱”的事儿。“要想占有这个市场,首先要准备好3年烧掉15亿的钱。”他在《三声》的一次采访时说,“我觉得我们的实力在这些巨头的主战场里干不了什么,所以就没做。”
“这个领域早已是一片红海了。”李志飞说,“但是,我们不得不做。”
他把百箱大战引起业界质疑的原因归结为两点:慢AI和快市场的矛盾;小市场和大玩家的矛盾。
李志飞说,很多时候,他也问过自己:你觉得在中国智能音箱能重复亚马逊Echo这样的故事吗?“然后我告诉自己,基本不太可能。我们能因为这个登上人生或者公司的巅峰?我没这种期望。”
但智能音箱对出门问问而言,非常重要。在李志飞看来,智能音箱是语音交互应用非常重要的场景之一。“如果我们的目标是要推动语音交互在消费场景下的落地,那么,我认为,这是一个不可缺失的场景。”
和传统音箱厂商不同,智能音箱对于AI公司而言,在使用场景里,音箱包含了远场识别、多轮对话等,是语音交互技术的最好练兵场。对于要覆盖多场景联动的出门问问来说,家庭空间是个不能放弃的战场。
现有的智能语音终端为何难以上量?李志飞把智能硬件终端做了个分类,在他看来,目前讨论的智能硬件产品,更偏“重智能”,即有交互、有AI,甚至有屏幕。这类智能硬件产品的研发和制造,对资源和公司能力要求太高,也成为众多创业公司难以跨越的门槛。同时,国内用户对此的认知度还远远不足,市场存在太多的不确定性。
但智能音箱,又会不会只是一个属于巨头的游戏?
“对于重交互的硬件产品来说,几个要素是必须具备的:软件开发的能力、算法能力、硬件能力。然后才是它承载的内容和服务。对于出门问问而言,前三项能力现在都是具备的。”李志飞说,“至于内容和服务,我们可以和第三方合作。实际上,四项能力都具备的厂商,可能国内也没有。”
Echo在美国的成功,推动了在家居场景中下一代交互入口的争夺。李志飞看来,对于大型公司而言,这件事的意义更多在于布局。“但是做硬件是需要时间的。BAT的问题是需要时间。”
据李志飞的透露,问问音箱也是业内为数不多已经量产的产品。在去年,智能可穿戴手表Ticwatch海内外总共销售了30万台左右,问问魔镜销量大约在1万台左右,“对AI公司而言,这已经很不错了。”
在用户和业务规模上,李志飞认为出门问问严格来说,还不能称为独角兽。“在国内AI领域里,做到几十亿美金的公司,未来一定会有,而且不会少。但是否能够成为下一个BAT,还是需要一点运气。要看它是不是有自我颠覆和自我扩张的能力。”李志飞说,“但是我认为,我们未来应该可以做到。”