深度学习的下一个重大突破在哪儿?AI资深专家和投资人竟然都押宝这个领域

深度学习的下一个重大突破在哪儿?AI资深专家和投资人竟然都押宝这个领域

2016-09-19 09:48
人工智能的下一个重大突破将在哪个领域发生?爱特曼科技马磊和北极光创投杨磊不约而同瞄向了“机器翻译”。于是,这家成立仅三个月,产品还没上线的年轻公司,获得了来自北极光创投千万级天使投资。

尽管AI概念早在上世纪60年代出现,但直至2006年Geoffery Hinton 提出“深度学习”,才逐渐被科技巨头重视。十年后,一场围棋人机世纪大战和一届百度世界大会拉开的“第三幕”争夺战,又将AI创业推向了风口浪尖。

好莱坞科幻电影描绘的人工智能统治世界,带来的不仅是威胁论,更能一窥AI技术巨大的发展空间。无论是科技巨头还是创业者,在AI领域,人类还处于起点。

第一个取得重大技术突破的领域是语音识别,讯飞在这一市场中一家独大,语音机器识别在办公室环境下准确率可达95%以上;百度紧随其后,李彦宏在今年百度世界大会宣称其语音识别准确度达到97%。第二个取得重大突破的领域来自图像识别,比如人脸识别技术通过安防、支付等工具已经深入生活的方方面面。关于第三个领域,科技巨头押宝对话,比如百度“度秘”和微软双生花“小冰”、“小娜”,目前仍在技术完善和使用场景构建阶段。未来三到五年,对话领域是否能取得重大突破?别的领域是否还有胜算?

思考这一问题的是创业者马磊,AI语音语义领域的专家,曾就职于微软研究院和微软搜索技术中心。Winphone自带的中(简繁)日韩手写字体识别是他从零开始写的代码;Techfest上大放异彩的基于运动传感器和视觉识别“空中手书”由他主导研发;同时他也曾是微软“小娜”及相关产品的架构师。

和马磊一样在探寻AI下一个重大技术突破的,还有北极光创投董事总经理杨磊。在已经过热的AI创业中,他希望找到一种更直接的技术转化,以及一个更靠谱的创业团队。

二者相遇,这个问题有了答案。于是,2016年6月18日,马磊成立了AI创业公司爱特曼(ATMAN),两个月内,北极光创投千万级天使投资随即到账。

机器翻译,便是他们从彼此身上得到的答案。

十年技术荒漠

“如果未来三到五年,AI将在哪个领域取得重大技术突破,那一定是翻译。”马磊说,因为距上一次谷歌机器翻译取得的技术突破,以逾十年。

机器翻译的第一个阶段,是事先在机器中灌输大量语法和词汇,然后按照句子进行对照翻译,即所谓的“分词算法”,这与语音识别早期切分音节较为类似。2004年,谷歌开发了“语义相似度算法”,先往机器里输入大量文本文字,再比对平行语句库找出无数相互关系,通过穷举得出最佳翻译结果。这一次技术突破,使得谷歌翻译的准确性得到大幅提升,大多数中国大学生都有过用谷歌翻译毕业论文的经历。

然而,中文作为世界上难度最高的语言,无论是分词算法还是语义相似度算法,都无法得出另人满意的翻译结果。直到深度学习的出现,才让机器翻译的准确性有了飞跃式提升的可能。

2006年,人工神经元网络的出现,让人们明白了不是喂给计算机的数据越多越好,而是要挑选“资优生”进行数据学习,这个“资优生”便是拥有模拟人脑神经元网络的计算机模型。

自从确认了机器翻译这一创业领域,马磊就着手初始模型的搭建,从100万句的数据量开始训练,三个月来已经取得了不俗的成果。依据国际通用的机器翻译质量指标BLEU评测,ATMAN的翻译技术在垂直领域(如新闻政治)已经能超越主要的翻译服务提供商。

“如果说目前机器翻译准确度是50%,剩下50%需要人工修改来完成,我们只要把人工修改的工作减少到10%,就是价值。”马磊说。

负责浇水的机器人教师

有了天生丽质的学生,马磊开始有计划地训练,三个月内做了十多项技术改进。他给这些训练起了各种有趣的名字。

比如“小抄本”(external memory),让ATMAN在应对长句时可以首先形成如人脑般的一个印象,筛选语义核心做出翻译,而较为复杂的专名和修辞可先记录在小抄本上,然后经词库搜索后再填回核心句中。又比如“给罢工的神经元做思想工作”(saturation),在某个神经元达到饱和状态,不再做出响应,就需要任务重新分配,使神经元再次激活。

每天,马磊都沉浸在发掘问题和解决问题的兴奋中。“要知道,人工智能的成长并非线性增长,每一个技术改进都会让模型有一次飞跃式提升。”

机器人教师的概念是马磊两年前的一个预测,如今他正乐此不疲地从事着这项工作,为ATMAN选择垂直领域的知识,编排课程,审核学习成果。“就好像种了一粒种子,你只需每天浇浇水,就会得到意想不到的结果。”

马磊戏称,公司的CTO便是他浇水浇来的。在经历了第一次创业因人才匮乏的失败后,加入微软搜索技术中心的马磊就经常给同事刘炜灌输创业的想法,如今他们成了创业伙伴。目前,马磊所有的开发团队都来自于微软,让公司也具有了微软的气质。

“微软有一个文化,就是人可以随时停下工作自由发想,但机器不能停。所以从技术选型开始,我们就主张零人工成本,在学习过程中也自行迭代。”正如ATMAN的本意是人类的自我意识,马磊希望成就机器的自我意识。 

产品没上线也能拿投资

至于未来产品将是个什么形态,马磊坦言:“三个月时间如果我说真就看清了商业模式,说了你也不信。”不过对于ATMAN的应用场景,马磊已经有了初步构想。

对于B端客户,ATMAN对特定垂直领域的进入周期是两周时间,可以为媒体、科研院所、工程院,以及对海外资讯有高频需求的企业提供高速翻译服务。同时,他们计划开发智能的CAT软件,以辅助B端客户做最终的人工校对。

对于C端客户,马磊推出了一个“量子镜”计划,以portal形式想用户推送国外精选内容网站。“按照我们目前单机的翻译速度,镜像一个百万文章级别的内容网站,需要一个月时间。”马磊希望通过翻译技术,先满足用户的信息获取需求。

而对于这样一家还没有产品的创业公司,从创立之初就一直陪伴的北极光杨磊给予了极大的肯定和希望。一项人工智能技术的成熟通常需要三到五年,杨磊说他愿意等。“就冲他(马磊)读了4000多篇AI领域学术论文,现在还在不断学习的劲儿,别说三五年,陪他10年都没问题!”

对话投资人

杨磊 北极光创投董事总经理

新芽NewSeed:押宝机器翻译领域的原因是什么?

杨磊:我们也考虑过其他的一些领域,比如AI教育,但总感觉中间环节太多。翻译是我们一直在看的领域之一。原因有几点:首先翻译比较容易做出相对客观的标准,BLEU指数可以算出来;其次翻译本身是一个非常非常巨大的市场,不论2B还是2C;再次,尽管有些巨头在做,但都是通用翻译器,而且马磊的团队是一个个垂直领域去做,做出了差异化;第四,翻译是相对来说风险较低的领域,而其他AI应用领域像无人驾驶,容错率极低。

新芽NewSeed:当前AI创业是否过热?

杨磊:我觉得肯定是过热的。我自己的感触是好的团队和好的方向很难找。其实真正要把AI和某个领域结合好是一个很不容易的事情。小公司要跑出来只能靠两个东西,一个是速度,一个是创新。马磊他们选的方向和路径跟别人有很大的不同,在没有人关注这个领域的时候,他们去做。而在此之前,他和团队自己本身的基因,也是非常匹配,尤其是2B的创业公司,自身功底一定要非常扎实,壁垒一定要足够深。

*本文为新芽NewSeed原创,网页转载须在文首注明新芽NewSeed(微信公众号ID:pelink)及作者名字。微信转载须在文章评论区联系授权。如不遵守,新芽NewSeed将向其追究法律责任。