微软小冰发布诗集 人工智能由模仿到创造

微软小冰发布诗集 人工智能由模仿到创造

2017-05-23 10:18Newseeders 合作伙伴
从用户数量、活跃度和交互流量来看,微软小冰均是目前全球最大规模流量的对话式人工智能产品。截至 4 月,微软小冰已拥有超过 1 亿用户,累计对话量超过 300 亿,平均单次对话轮数达到 23.]。

AI 人工智能似乎正处于最好的时代,但它距离理想中的形态,恐怕还有很长的路要走。

有关人工智能,摆在研究人员面前一个非常重要的问题是:如何使人工智能能够模拟人类,进行独创性的内容生产,并不断通过学习提高自身创造水平。

正如微软工智能及微软研究事业部负责人沈向洋博士提出的关于「人工智能创造」的三原则:人工智能创造的主体,须是兼具 IQ 与 EQ 的综合体,而不仅仅是具有 IQ;人工智能创造的产物,须能成为具有独立知识产权的作品,而不仅仅是某种技术中间状态的成果;人工智能创造的过程,须对应人类某种富有创造力的行为,而不是对人类劳动的简单替代。

而现在我们所能看到的人工智能,更多处于「简单替代人类劳动」阶段。即便是在 Google Home 或者亚马逊 Echo 这样已经相对成熟的落地产品身上,依旧很难看到独立创造力的展现。

当然,虽然各大科技巨头都在布局人工智能,但大家的发力方向各不相同,产品形态也有所差异。不同于「小娜」的工作定位,小冰一向给人的印象是娱乐陪伴型助手。而这次率先让我们看到有一些「不同」的,正是后者。

它是第一个发表诗集的「非人类」作者

5 月 16 日,微软举办媒体沟通会,展示了小冰在写作、歌唱、财经评论能力等方面的进展。三天之后的 5 月 19 日,微软联合湛庐文化发布全球首部由人工智能独立完成的诗集《阳光失了玻璃窗》,而这部诗集的作者正是小冰。

借用湛庐文化副总编董寰对于小冰发表诗集的看法:我们都在想,如果说有一天机器具有了情感,它会思考,它具有了创造力会是什么样子呢?没有想到的是,这个时间来临的比我想象中的要快。

实际上机器替代人类写文章,并不是一件特别新奇的事情。早在 2012 年就有报道称,美国出现了写稿机器人,每天都在各大网络媒体上产出报道,尤其在体育报道上表现抢眼,机器人在比赛结束「那一刻」写出来的总结性报道很快就成了各个网络媒体体育板块上拥有最高点击量的文章。

最近有关机器人写作的报道,是之前企鹅财经发布了一篇由写作机器人基于算法自动生成的的文章《8 月 CPI 同比上涨 2.0% 创 12 个月新高》,一时间引发了媒体的热议。不少编辑/记者也发出了「要丢饭碗」的感慨。

但以往机器人写出的文章,更多的是以单篇新闻报道类为主。能够形成合集并且正式出版,此次的《阳光失了玻璃窗》尚属首次。而微软小冰,也成为了第一个发表诗集的「非人类」作者。

文章存有瑕疵,但不再冷冰冰

就产出结果来看,之前的写稿机器人和微软小冰作诗都是以文字作为呈现形式。不同的地方在于,前者的文章更像是单纯的词语堆叠,给人感觉「冷冰冰」,后者让人欣喜的地方是为文章赋予了简单的「情感」。

以微软小冰创作的《是你的声音啊》为例:

微明的灯影里

我知道她的可爱的土壤

使我的心灵成为俘虏了

我不在我的世界里

街上没有一只灯儿舞了

是最可爱的

你睁开眼睛做起的梦

是你的声音啊

对于以上这首《是你的声音啊》,歌手创作人朱婧汐(曾参与鹿晗首张专辑创作)用「理性」和「感性」这两个词来形容。在她看来,大部分的情况下艺术创作是一个非常感性的事情。而小冰的创作完全是运用了另外一个逻辑,是基于得到的数据和信息来完成。并且速度非常快,打破了关于艺术创作到底是理性还是感性的界限。

另外如微软市场公共关系部的徐元春所言,小冰的很多诗句中,都会出现诸如太阳、小鸟、沙滩等词语。而这些颇具带入感的词语,正是模仿了人类在诗词创作过程中经常用到的「借物抒情」的手法。至于如何在数据库中调用这些词语,微软显然有着自己一套独特的逻辑算法。

当然,阅读过微软小冰的诗集之后,实际上它的创作依旧存在诸多问题,处理一些读音相近的字词,会有偏差。比如「在」和「再」两个字的运用上,经常出现错误。

有意思的一点是,在《阳光失了玻璃窗》这本诗集中,并没有对以上提到的这些错误进行人工修正,只是在出现错误的地方用括号的方式给予了注释。对此,微软的说法是希望能够保证这本诗集的完全自主性。个人而言,能够认识到发展中的错误并且正面面对,对于未来的发展一定是有好处的。

写诗这件事情,小冰是如何做到的

之前采访「云知声」CTO 梁家恩先生的时候,他也曾说过,实际上 AI 人工智能走到今天,算法没有太多的秘密,可能有不同,但要想实现大幅领先,并不是一件容易地事情。而除算法之外,背后作为支撑的大数据库无疑是颇为重要的一环。

就算法而言,微软小冰基于微软提出的情感计算框架,以 EQ(情商)为主攻方向,打造具备完整感官和知识图谱的对话式人工智能。

另外据微软给出的数据显示,无论从用户数量、活跃度和交互流量来看,微软小冰均是目前全球最大规模流量的对话式人工智能产品。截至 2017 年 4 月,微软小冰已拥有超过 1 亿用户,累计对话量超过 300 亿,平均单次对话轮数(CPS)达到 23。

微软小冰团队部署于四个国家,在 14 个平台上与用户进行交互,包括中国大陆地区的微信、QQ、微博,美国地区的 Facebook Messenger,以及日本地区的 LINE 等。除上述第三方平台外,微软小冰亦已全面内置于中文版 Windows 10 操作系统中。在数据采集上,微软小冰无疑颇具优势。

具体到作诗这件事情上,微软小冰师从 1920 年以来 519 位中国现代诗人。经过对几千首诗 10000 次的(迭代)学习,从而获得现代诗的创造力,并逐渐形成了自己的风格、偏好和行文技巧。

而小冰的写作风格,很大程度上来自于某段时间内,它所接触到的数据风格。比如给小冰学习我国 1920 年到 1940 年代的诗,它的作品会偏向于悲壮、非常伤感。

它留给了我们更多的想象空间

人工智能小冰写诗这件事情,让我联想到之前的谷歌 AlphaGo 大战李世石事件。从某种角度而言,事件本身可能并非最大的价值,更大的意义在于对整套逻辑算法以及背后大数据调用方式的探索,这也是为未来人工智能的发展作铺垫。

而微软小冰此次能够独立作诗的特殊性在于,它正在尝试由单纯模仿进入到创造阶段,并且通过一些典型词语,来使得其产出的文章能够富有情感。

需要说明的是,这依旧并不意味着微软小冰已经拥有了类似于人类一样独立的「情感」。从实现角度来看,它还是依靠模仿人类使用语言的表达规则,来完成抒情这件事情。只能说,通过微软小冰发表诗集这件事情,证明了它已经一只脚踏进了创造阶段,并没有进化完全。

但从目前小冰所取得的成绩来看,微软的这次尝试非常成功。而且厉害的是,未来通过不断地学习不同领域知识,不难现象,它将拥有更加强大且丰富的独立创造能力,也留给了我们更多的想象空间。

当微软小冰拥有足够多的知识储备,配合日趋缜密的逻辑算法,也许就是我们理想中的人工智能。当然,可以预见的是,这个过程是漫长且困难的。但起码目前证明,微软选择的这条路是正确的。

*本文由新芽NewSeed合作伙伴新芽NewSeed授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。