12月29日,国家互联网信息办公室指导北京市互联网信息办公室,针对今日头条、凤凰新闻手机客户端持续传播色情低俗信息、违规提供互联网新闻信息服务等问题,分别约谈两家企业负责人,责令企业立即停止违法违规行为。其中今日头条手机客户端“推荐”“热点”“社会”“图片”“问答”“财经”等6个频道自2017年12月29日18时至12月30日18时暂停更新24小时。这是头条史上第一次遭到封禁,“印象中,也是新闻类APP第一次遭到网信办全面封禁。”
而据微博里@金口娱言说“据金口娱言了解,一次停更6个频道,在今日头条发展史上尚属首次。不过,这并非今日头条第一次被网信部门约谈。公开信息显示,2016年至今,今日头条已被网信部门约谈了5次”。
事实上,前不久人民网连发《不能让算法决定内容》、《别被算法困在“信息茧房”》、《警惕算法走向创新的反面》三篇评论文章,指出以今日头条为代表,单纯依靠算法推荐的平台存在价值观缺失、制造信息茧房、竞争手段屡破底线三大问题。
那么以AI为基础的智能算法推荐到底是什么?于今日头条意味着什么?今日头条的“屡叫屡改,屡改屡犯”真是因为控制不住“AI”?
一、智能算法推荐是什么?
所谓智能算法推荐,是把合适的内容推送给合适的人,平台相当于流量分发机器。推荐算法大致分为三类:基于内容的推荐算法、协同过滤算法、基于知识的推荐算法,此外还有以加权、串联、并联等方式融合以上算法的方法。
相比人工推荐,智能算法推荐投入产出比更高、覆盖面更广、个性化程度更高,但风险把控能力相对较低。
近来年,智能推荐算法在信息分发市场中的地位越来越重要,甚至已呈现出算法推荐超过人工推荐的趋势。
尽管智能推荐算法五花八门,在内容分发市场发挥的作用也越来越大,但是算法没有思维,有思维的是隐藏在算法背后的人,算法的呈现形式由人的价值观决定,由人的利益驱使。人工智能技术与服务提供商第四范式的互联网业务负责人周开拓在接受记者采访时表示,“算法推送出的内容是企业自己在其中进行权衡的结果”,“人工智能,其实先有人工,后有智能,算法本身是没有倾向的。我们在推行的时候会把用户体验拆成两小块,一个是短期体验,另一个是长期体验。所以长期和短期体验的权衡,不是算法决定,而是人为决定。”
二、智能算法推荐于今日头条意味着什么?
2012年,移动资讯平台领域仍是腾讯新闻、搜狐新闻等传统PC端媒体的天下,其内容提供手段沿袭传统媒体模式:优质内容+编辑精选。然而随着泛娱乐化、社交化时代的到来,用户已不满足于被动接收信息,他们渴望生产内容、渴望创造影响力,传统移动资讯平台难以满足用户的个性化需求。
张一鸣紧紧抓住这一机遇,于2012年3月创立今日头条,致力于为用户提供个性化、社会化的移动资讯平台,基于数据挖掘,为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务。诞生仅一年多时间,今日头条便已在中国手机新闻客户端活跃用户分布榜单中占据一席之地,并高居用户满意度榜单榜首。
(图片来源:艾媒咨询2013年中国手机新闻客户端活跃用户分布)
(图片来源:艾媒咨询2013年中国手机新闻客户端用户满意度)
2014年6月,今日头条估值为5亿美元,截至目前,经过三轮融资,估计已近200亿,其估值在三年内增长约40倍。据公开数据显示,2017年5月,今日头条激活用户数已经超过7亿,月活跃用户数超过1.5亿,单用户日均使用时长超过Facebook,达到76分钟,日均启动次数约9次。
智能算法推荐在今日头条的个性化服务及快速崛起中扮演着至关重要的角色。据了解,今日头条共有4万台服务器进行运算,来保证以秒级速度收集信息,对用户特征作出反应并推送信息,2016年更是成立人工智能实验室,主要研究自然语言理解,计算机视觉, 机器学习(算法与系统),人机交互等AI技术。
凭借着智能算法,今日头条快速抓取用户数据,精准分析用户需求,高效把关内容质量、进而实现个性化推荐,这也是今日头条能够杀出重围,在移动资讯领域站稳脚跟的核心优势。
三、智能算法推荐带来了哪些问题?
智能算法推荐于今日头条的发展功不可没,然而由于根据阅读量、阅读时长、转发量、过往阅读行业实施推荐,缺少必要的内容审核机制,容易导致为抓住用户眼球而牺牲文章质量问题的出现。正如人民网《不能让算法决定内容》一文所说,”内容能否推送、推送给谁,由机器说了算,依据的标准就一条:能不能抓眼球、能不能吸引用户。单一的标准不仅容易忽视优质内容更为丰富的面向和维度,也增加了把关内容产品的难度和成本。这也就不难理解,为什么即使事后不断处罚违规的内容账号,却无法停止劣质内容的再次生长“。
今日头条质量低下问题已多次引起官方关注。2017年以来,今日头条三度遭约谈,成为低俗内容重灾区。1月6日,北京市网信办发现今日头条”头条问答“栏目多次登载”庸俗讨论话题“,对今日头条提出严肃批评,并责令其整改;4月,央视曝光了今日头条向用户推送”艳俗“直播平台:火山直播,4月18日,北京网信办、市公安局、市文化市场行政执法部队联合约谈今日头条、火山直播等平台,责令限期整改。7月,北京市网信办约谈今日头条、微博等网络信息平台,并永久”封杀“了一批”内容低俗“的违规自媒体帐号。
今日头条自己不生产内容,依靠智能算法抓取别人的内容,容易导致侵权问题的发生。智能相对论(ID:aixdlun)粗略统计,近半年来,今日头条涉及的版权纠纷就有近10起。
今日头条内容质量低下、版权纠纷等问题的出现,真的是智能算法推荐的错吗?
这里我们需要弄清楚的是今日头条的内容抓取后分发逻辑是如何建立的。微信公众号“大黑的温度观察 ”评论到:如果用阅读习惯思考今日头条的算法,可能是先通过AI不断的抓取全网的内容,然后将内容汇聚一起,筛选清洗分级后再将筛选的关键词匹配用户的喜好分发出去。这在正常的抓取分发的范围内来说,控制输出内容可以通过中间的筛选时做整体把控,露出内容全部由今日头条控制。
当然在这个抓取的内容过程里包括内容创作者内容的审核、推荐。对于创作内容在发布前做完色情等违规内容的筛选,再通过其他规则做筛选。
而如果将AI加入到整个流程中后,AI所处理的数据是否准确判别,在既不能分别又有大量的筛选工作后,整体内容表现出的可能会不可控。
AI加入内容的选择和分发,主要源于通过用户的浏览习惯不断识别学习后定义出谁喜欢什么内容,而如果内容的推荐也会因此而对固定用户多推荐相应内容。
AI的抓取和创作者也会因为推荐增加而去增加相应内容的抓取和创作,如果用户在平台发现一部分色情、低俗内容,点击次数增加后,平台的AI会不断判别出这个内容数据需求值高,而因此增加推荐和创作。
在今日头条的内容数量非常庞大后,AI处理的内容量级远远超过以人力操作的传统网站,巨大的点击量会让处于阅读优势的色情、低俗内容加速生成和分发。
不过,在之前人民网《今日头条如何用算法打击“标题党”》一文中提到,”很多“标题党”常用的内容元素其实都是可以在文本层面进行总结的,交由机器处理的效率会更高“,实则间接为智能算法推荐正名。
正如周开拓所说,”人工智能,其实先有人工,后有智能,算法本身是没有倾向的“,”算法推送出的内容是企业自己在其中进行权衡的结果”。内容质量低下,源于平台的利益目的及部分用户对“低俗”内容的需求。今日头条的算法推荐与内容识别大部分是依靠用户的行为,会在用户浏览信息时智能抓取关键词,并给用户画像,对用户进行归类,进而根据关键词匹配出相关内容,最后将这些内容推荐给用户,若用户阅读的低俗内容多,则相应推荐的低俗内容也会多。
智能算法推荐是技术发展的产物,技术本身并没有错,只是在高速发展的背景下,承担了平台利益属性及部分用户“低俗“需求的罪过。
四、今日头条智能算法推荐的出路在哪?
人民网的一评、二评、三评,根源直指内容质量低下,为走出困境,今日头条需提高内容质量,重视人工编辑的作用。
1、今日头条迟迟不愿在提升内容质量上发力,源于其两难选择
今日头条的内容质量问题自成立之日起,便为大众所诟病,然而直至今日,仍是漏洞重重。2017年4月,经过北京市网信办、北京市公安局、北京市文化市场行政执法总队联合调查,今日头条并未能有效履行主体责任,在信息审核、应急处置、技术保障等方面存在制度缺失,在直播内容、用户分类管理、真实身份信息认证、处理公众举报等方面存在重大管理漏洞。
究其原因,在于剔除较为低俗的内容和作者会导致大量用户流失,而用户的流失又可能会使优质原创作者将重心转移到到其他自媒体平台。对今日头条而言,主动严格监管广告内容势必会影响其商业利益,但放松监管又会对平台信誉产生影响,两难境地必将经过一番博弈。
2、时至今日,面对官媒的连续实捶,今日头条不得不直面问题
9月21日,今日头条对人民网的三评做出回应称将“正视不足,勉力前行”,并指出,“机器学习和人工编辑,在现阶段,是相辅相成的。未来也是如此。再聪明的人工智能,也只是一个需要不断升级的工具,而人是不可替代的。这是一个不断磨合和优化的过程。这也是人民网三篇评论的价值所在。”
3、今日头条欲走出困境,提高内容质量、重视人工编辑的作用是关键,算法推荐+人工编辑是大势所趋
信息爆炸时代,如果沿用过去的人工推送的形式,显然会面临效率低下、难以满足“千人千面”的个性化需求等问题,而算法推送则大幅提升了推送效率和推送针对性,使用户从海量信息中解放出来。但是由于无法准确判断内容价值,单纯依赖算法进行个性化推荐容易导致内容质量低下,需要人工编辑修正对机器进行干预,降低点击率对算法推荐的影响,加强对高价值内容的人工干预,算法推荐与人工干预相结合将是大势所趋。
面对普遍存在的内容质量困局,已有平台开始实践算法推荐+人工编辑的优化路径。2016年10月,一点资讯请来原新浪网总编辑陈彤做总编辑,CEO李亚在也毫不掩饰的说:陈彤加入一点资讯,就是因为机器算法有缺陷。2016年12月16日,Facebook上线Fact-Checking(事实审核)机制,将用户举报过多的信息交付机构记者来判断,如果记者判断这则内容是假新闻,就会将内容标记为存在争议,一方面会在前端页面提示给用户此内容可能失实,另一方面会从分发量的角度进行控制。2017年5月,扎克伯格发帖称Facebook会再招聘3000名内容审查员,在此次招聘后将会达到7500人。审查员会过滤社交媒体上的不适当内容,如恋童癖、身体暴露、种族仇恨等内容。
面对官媒的压力、大众的舆论,今日头条需及早完成流量与质量博弈,找到一条算法推荐和人工编辑的平衡之路。