上世纪 60 年代,全球首盘盒式磁带由英国飞利浦公司研制成功;70 年代,声音记录迈入到数字化记录时代;90 年代,迷你录音笔握在了寻常百姓的手中。然而,再之后的 20 多年,产品创新陷入了停滞。
「录音笔产品一致缺乏对用户需求更深层的思考和解决」。在搜狗看来,以语言为核心的 AI 创新能力,或许能够为这类产品指明一条新的进化路径。于是,搜狗迈出果敢尝试的第一步。
2019 年 3 月,搜狗发布了首款 AI 录音笔 C1。在这个「小市场」初试牛刀后,团队没有浅尝辄止。时隔一年,王小川又带来了两款新品:搜狗 AI 录音笔 E1 和搜狗 AI 录音笔 S1。
通常,互联网公司不具备涉足硬件的先天条件。外界对于搜狗这样一家以软件技术起家的企业,去触碰硬件的不解,也是合乎情理的。尽管越来越多的目光投射到这家公司的 AI 能力上,但其凭借自研的 AI 硬件赢得一亩三分地,确实出乎很多人的意料。
其实,搜狗做硬件的动机并不难理解。对于 C 端用户来说,搜狗的核心产品——搜狗搜索和搜狗输入法,前者是先理解用户的需求再挖掘内容,后者是帮助用户表达,传递内容,二者的共性都是着力解决语言的问题。
「通过这两例产品,搜狗积累了以语言为核心的人工智能相关技术,」搜狗首席技术官杨洪涛解释,AI 录音笔不单单是纯硬件层面的操作,还包括 AI 技术能力持续创新迭代的速度,以及产品对用户需求的进一步满足,这都是传统录音笔无法提供的。
当然,搜狗 AI to C 的硬件计划不只靠录音笔这一种品类去支撑。尽管目前尚未透露其他品类的消息,但按照王小川的想法,这些产品 AI 赋能的范畴,要把人的生活、工作、学习、个人效率、乐趣培养等实现全部覆盖,为产品迭代提供更多的想象空间。
录音笔的创新性从 C1 开始便集中显现。相较于传统录音笔,其通过对互联网方式的理解,升级了用户的体验。录音是基本功能,除此之外,研发团队主要做了三件事:第一是让录音笔有更好的拾音能力,用 AI 能力做好人声增强,智能降噪;第二是把录制的声音准确地转成文字,并实现语音一小时,5 分钟转文字的效率;第三是提供云端服务,便于用户做在线的编辑,存储录音资产。
2 款新品支持中英日韩德等10 种语言、川粤津陕贵等 10 种方言的录音和转写,转写准确率达到 98%
关于创新功能对应的使用场景,杨洪涛举例:「比如在企业会议的场景下,大家录音是为了怕忘事。用户担心弄丢录音,这时候就需要优化存储能力和安全性;媒体采访的时候,怎么能够帮助记者快速出稿、快速编辑,甚至前台记者采访完以后,后端的编辑团队可以同步去工作;在学习培训的时候,可能用户想要在大段录音里,逐句逐段地找到内容重点;在个人写作记事的时候,用户希望怎么快速成稿,内容一键导出。」
最新发布的 AI 录音笔 S1 和 E1,在 C1 的基础上,参数和功能方面得到了进一步升级。其主要在拾音效果、转写准确度、智能摘要和翻译功能这四个维度,提升用户的使用体验,满足会议、定向听讲、翻译等场景需求。
「在这些场景下,我们有针对性地进行了特定的优化。」从用户使用 C1 录音笔的频次来看,每周大于三次的超过 60%,录音时长超过 10 分钟的用户占 40%,超过 1 小时的用户占 20%。其中,有 44% 的用户在做会议的记录,24% 的用户做企业内部培训和听课,21% 用于媒体的采访。
杨洪涛补充:「从 B 端到 C 端以后,原有的 AI 技术和硬件设计能力能发挥更大的主导作用,像录音笔就能与搜狗输入法体系有更好的贴合,用户在使用这样录音笔的时候,转写的成功率,包括后面的存储、分享能力也会有一体化的进展。」
「在 AI 关键路径上,E 系列减配了一些不那么重要的参数,比如屏幕缩小,材质由铝合金变成塑料,去掉了部分用户用不到的 4G 联网模块,但是总体的 AI 能力不受影响。」杨洪涛比较了两款新品的区别。
与此同时,S1 和 E1 两款产品的发布,意味着搜狗 AI 录音笔产品矩阵的形成,即定位于旗舰产品的 S 系列和追求性价比的 E 系列,以及主打便携轻巧的 C 系列。这三条产品线能够解决不同用户、不同场景的使用需求,产品迭代周期以年为单位,每次推出一到两款产品。
产品形态的升级促使行业方向正在发生着变化。当然,变化之快与行业伙伴不可分割。2019 年 8 月,搜狗联合爱国者、Newmine 纽曼、索尼录音笔、万城集团四家企业成立了「AI 创新联盟」,并宣布面向全行业开放听写服务,利用自身 AI 技术优势,为合作伙伴赋能。软件、硬件、厂商这种「三位一体」的打法,可以让搜狗收获更广阔的市场空间。眼下,AI 录音笔已经占据了三分之一左右的市场份额,
「合作之前,整个录音笔市场都是传统的录音笔。而在搜狗和全行业产品 AI 化的发展下,这是第一次以 AI 赋能带动行业的变革。在主流电商平台上对比 2019 年和 2018 年的数据,可以看到 2019 年从 3 月份搜狗产品发布之后,这条线开始上扬,这是大家合作促成的结果。」杨洪涛表示,如果说搜狗定义了 AI 录音笔这一新品类,这其中要归功于和全行业一起驱动而来的品类升级和市场变化。
王小川坦言,AI 录音笔「的确是一个小众市场」,但从趋势来看,AI 技术的注入到产品中,行业存在被重新定义和焕发生机的机会。「以前由于录音笔本身能力有限,现在除了语音实时转写,专业性体现在我们能做的关键点,以及支持后面的语音转写、在线的实时编辑、语音存储能力的全线打通,并且提高拾音的灵敏性、降噪能力,这些都远远超越了传统录音笔,并把硬件发挥到最大价值,跟手机产生了新的区隔。」
无论是这次录音笔的发布,还是今年其他新硬件的推出,可以遇见的是,搜狗的硬件收入占比会得到明显提升,官方预期在 10% 以内。从定价来看,最新发布的 AI 录音笔 S1 定价为 2698 元,E1 是 1298 元,录音笔的确是搜狗的盈利型项目,并且比传统录音笔具备更明显的竞争力。
搜狗通过对录音笔产品形态的迭代和升级,整个录音笔行业已经进入了「AI时代」
不过,「盈利不是搜狗『AI+硬件』的战略目标。」王小川明确道。和追求提高毛利,卖硬件赚钱的方式相比,搜狗更希望探索出一种「服务化的模式」,即通过 AI 能力向用户提供增值服务,在传统硬件单薄的毛利之外,获得一部分增值的商业模式空间。
王小川还判断,虽然诸如讯飞这样的企业占据了行业的一席之地,但搜狗正在凭借 AI to C 形成独有的竞争优势。特别是在天猫和京东,搜狗 AI 录音笔 C1 在过去一年拿下了多次录音笔品类的销冠,让团队在 AI to C 的硬件道路上,更加笃定。
目前,虽然有很多用户选择传统录音笔,但录音笔市场已经处在被颠覆、重新定义的状态,新兵进来以后,将在市场中间获得更大的空间,甚至取得 No.1 的位置,这都是 AI 赋能的优势。这种优势不光作用于语音处理这一细分市场,未来还会有新的辅助设备和配件,向软硬件一体化的方向迭代,并打开新的消费市场。