大数据时代的AB面

大数据时代的AB面

当你发现,自己的一举一动,正在被商业计算机和商业互联网偷偷记录,其目的只是为了有一天创造出一个比你更强大的“自我”,这会不会让你有点担忧呢?

在过去几十年,人类一直想通过编程语言把自己输入到计算机里;而在另一端,智能计算机正在构建超越人脑的新物种,并期待有一天走向现实。虚拟和现实正像《奇异博士》里面的镜像空间,在互联网技术应用的时代找到连接点。可笑的是,正如同乔治?奥威尔对人类无情嘲讽的那般——“我们将毁于我们热爱的东西”——不仅仅是“娱乐至死”,人类制造的智能计算机正在现实世界里战胜人类,这一切都得益于人类疯狂得向虚拟世界投射自己。

当你发现,自己的一举一动,正在被商业计算机和商业互联网偷偷记录,其目的只是为了有一天创造出一个比你更强大的“自我”,这会不会让你有点担忧呢? 


有“人”比你还懂你

珊珊是一家外企的主管。在下班途中,她走进一家无人超市。门口的摄像头会迅速识别她的身份。“珊珊您好,我是您的管家。”大门开启后,一个机器人管家手里举着平板电脑走了过来。

“您最常买的芝士饼干,在左手第三排。您上个月买的蛋糕,目前有买一送一活动。” 珊珊感觉亲切而舒服。

“管家”继续说:“上月您在网上买的唇膏,出了最新的颜色,您是否考虑?前天您买的白色毛衣,有一款帽子搭配很好,颜色是您最喜欢的红色。上个月,您在网上买的化妆棉预计快用完了,是否考虑买呢?您曾经在朋友圈点赞过的裙子,最近刚刚到店。您搜索里出现最多的电影,目前店里有纪念人偶,上周您犹豫没有买下的粉底,现在是特价……”

珊珊可能并不知道,这位“管家”的大脑里正在飞速运转并调取《珊珊女士的用户档案》。档案里面列举了她的很多特点,密密麻麻,珊珊的兴趣爱好、朋友圈互动好友、经常谈论话题、最爱买的东西、搜索关键词……一一展现。用户档案里的信息,很多珊珊自己都忘记了。

一个从未谋面的“陌生人”,竟然如此了解自己。

“数字化”争夺

这是天方夜谭?当然不是。

一切都是源于数据。珊珊的数据被计算机捕捉,归根结底是因为其工作、生活的各个场景正在迅速被互联网化,被数据化。基于互联网、移动互联网、大数据和人工智能技术,勾勒出珊珊的轮廓,形成数字化的用户画像,并通过智能算法,预判她的行为。

新时代的企业家素来都有收集用户信息的癖好。

“大数据指导下的按需供给的计划经济是最好的经济模式。”刚刚拿到新一轮融资的汽车电商大搜车创始人姚军红认为,整套商业模式支撑企业发展的核心,就是车商使用其所提供的在线化软件过程中所产生的大数据。“大搜车其实就是一个汽车零售渠道的数字化整合平台,同时也是一个渠道共享平台,然后提供给主机厂、银行金融机构、消费者等各类主体共享。”

大搜车所采用的数字化整合,也是目前很多介入流通环节“互联网+”类公司最钟爱的策略。用阿里巴巴研究院院长曾鸣教授的时髦说法,就是S2b2C,即用网络协同实现对传统商业多场景的数字化改造和连接,从而取代了原来电商来势汹汹的革命气焰。

这只是数字化的一部分。

经历过电商的洗礼,企业家已经越来越意识到数字化的重要性。不少企业已经开始建立自己的私有云和数据池,他们按图索骥,成为互联网教主们的信徒,深信数据是未来资产,也是未来估值的重要参考。随着混合云的出现,企业与企业之间开始有意无意地探索彼此的数据,试图通过用户在不同场景下的数字化行为,拼凑出最完整最精准的用户画像。

今年早些时候,国内口碑颇佳的快递服务商顺丰,就曾因为涉及最后一公里最为敏感的用户数据问题,与互联万巨头阿里巴巴旗下大数据物流公司菜鸟展开一场“捉对厮杀”。在商务部介入调停之前,双方曾一度互相拉黑,斩断了通往彼此的数据接口。

珊珊也许并不清楚,为何巨头们会为何对数据如此乐此不疲乃至撕破脸皮;一个车商也只会只关心自己的订单能不能一天比一天多……但在他们的视线死角,数据采集、挖掘、处理技术却真实存在。智能识别、智能算法、大数据,一个个熟悉的词汇,时常出现。珊珊的遭遇正发生在我们每人身上。

升级的数据争夺战

实际上,直至上个世纪70年代,美国科学家们对人工智能的理解还存在分歧,试图依靠模仿人类的“鸟飞派”研究者们在图像识别、语音识别、机器翻译等方面力求在数十万人造编程中探索出规律。直至20世纪90年代末互联网的诞生,坚信大数据可以驱动机器学习的流派才得以发挥,并逐渐成为主流。

“以用户体验为中心。”玖悦数码是一家致力于数字化精准营销的公司,创始人兼CEO邢科春对市场的变化理解很深。他告诉亿邦动力网,由于近些年消费市场变化太大,逼着商家重视用户数据,重视用户画像,重视精准营销。

新零售恰如其时的出现,正在加剧消费人群精准画像的采集和应用,用户数据已经逐渐成为核心竞争力。邢科春认为,这背后主要有四方面原因:



  • 首先,互联网上的信息总量正以每年50%的增速不断膨胀,商品、购物行为以数字形式出现。

  • 其次,互联网用户由增量变成存量。经历了互联网和移动互联网的浪潮之后,人口红利逐渐缩小。商家由“价格”竞争,过渡到体验和情感的竞争。

  • 再者,80后、90后逐渐成为消费中流砥柱。年轻人群消费升级需求增加,商家需要提升优质的数字化内容营销,吸引用户。

  • 最后,人力、仓储、零售需要耗费的资源巨大,进行精准营销降低成本,是未来零售业的唯一出路。


“今天,争夺用户已经到了白热化地步。” 邢科春感慨道,“品牌商、零售商、卖场在数字化营销方面各显神通,从存量市场里尽可能深的挖掘用户价值,其过程可以说是你死我活!” 

(根据2017新零售时代的用户画像报告)

不仅仅是前文提到的顺丰和菜鸟,亚马逊、微软、facebook、阿里巴巴、腾讯等互联网巨头都在毫无忌惮地收集用户的数据,并试图让用户数字化。

“增速超过200%!”金蝶集团的产品总监郭宇鹏告诉亿邦动力网,“从去年到今年,其公司新零售客户增长迅猛。”

金蝶集团从2016年开始,为新零售的线上线下和物流融合的管理系统提供解决方案。“快消品牌需求大。” 郭宇鹏分析,因为快消品牌门店,如快时尚、化妆品、商超,用户进入频繁高,经常来买必需品,用户就会关心品牌口碑和销量,数字化程度就高。反之,大家电、家具家居等门店,会员购物频率低,用户画像的构建还不健全。

为了讨好用户,商家们拼尽力气。一方面通过海量用户数据挖掘背后的故事。另一方面,竭尽一切办法提供更为精准制导的“个性化”服务。

“为了争夺流量。” 第四范式方面分析,数字化分析能让电商的用户数量成倍增加!”这家由创新工场投资孵化的人工智能技术与服务提供商,对行业情况有十分敏锐的判断。

几年前,因为技术门槛高,用户画像和精准营销主要是金融方面的客户。但随着新零售的爆发,电子商务逐渐成为成公司核心业务之一。

“想赢得用户,就要比别人做得好。” 第四范式方面介绍。以电商网站为例,AI推荐系统相当于给用户“一对一”私人化服务。

AI将定义新的未来。假如用户喜欢做饭,且爱吃西红柿炒蛋。AI推测到这个逻辑,首先通过电商平台,在用户手机上把番茄、鸡蛋、糖、葱、盐之类商品推荐过来。其次,推送做菜妙招,搭配什么菜品好,如何吃更健康等内容。为每人配一个私人专家。和以前冷冰冰的页面相比,哪种更有“温度”呢?

这一轮人工智能热潮的爆发引发资本注意,尤其是在中国,外部投资总额已经超过80亿美金,红杉资本创始人沈南鹏认为,大数据是AI的前提和基础,中国企业在过去10年中迅速“数据化”,一方面,公有云计算平台积累了大量数据;另一方面,许多领先的企业意识到数据的重要性,纷纷建立了统一的数据中心。“许多业务型公司其实也是数据公司”,数据已经成为企业最有价值的资产。

数据正在出卖你

大脑在每天早上起床后发起的第一项指令就是打开手机,查看微信,刷朋友圈,阅读光怪陆离的资讯,以及顺便处理下与客户洽谈业务的邮件……

碎片化的数字化场景中产生了大量的数据。计算机正悄悄地记录每一个轨迹,而且永不消失。

“数据的本质就是还原……企业在收集数据的时候,一定要明确自己是否有能力辨别用户,是否有能力去收集其在网站中发生的所有行为?企业有多大能力看到具体的场景?有多大能力还原用户的真实需求?”红杉资本合伙人、前阿里巴巴集团副总裁、数据委员会会长车品觉在《决战大数据》一书中把数据采集比喻成“瞄准镜”。

对于那些还会介意个人隐私的人群,未来数字化生存的方式有两种:①为了不让你的数据公开而选择付费的互联网服务而不再是免费;②活在不在线的世界里。

但即便是远离互联网和电商,也依然无法摆脱被数字化的命运。

2016年底,Amazon Go推出的实体新零售购物新模式让人赞叹。在实体店融合了计算机视觉、深度学习算法、图像分析和感测融合等技术。当顾客进入杂货店后,监控系统就会认出顾客是谁并一路“跟踪”,当站在货架前准备购物时,货架上的相机系统便会启动,它会拍下顾客拿取了什么商品和离开货架时手中有什么商品。

这次超前的尝试在中国旋即刮起了无人零售的旋风。大量采用智能视觉识别技术和深度学习算法的公司开始进入到快消品、便利店和超市领域。即使消费者并没有通过手机连接移动互联网,其店中的行为依然会被记录。

“我们正在研发基于人脸识别技术的CRM(客户管理系统),从而将线下零售门店的客户和在线用户匹配起来,从而实现用户画像的闭环。”金蝶方面透露。

即使是在户外,密布的摄像头中,即有一些有智能识别能力。这一类似科幻电影的“天眼”装备正在将我们的城市武装成为拥有智慧的大脑。

更有意思的是,我们时常会责怪电商平台上个性化智能推荐的是那些已经买过的商品,却忽视了数据在背后起到的作用。

“如果你在中国某大型电商网站上发现,某些人总是买到假货,而另外一些人则以同样价格买到真货。这或许并不是因为前者比后者的运气差,而是商家掌握了太多的个人数据,或者说我们的隐私。当商家知道前者是买了假货也不会吭声的软柿子,后者是睚眦必报的刺头的时候,欺软怕硬的行为一定能够给他们带来最多的利益。在利用大数据方面,个人用户相比商家永远是弱势群体,一旦他们的秘密被商家知道,他们的利益就难免受到损害。吴军在他的著作《智能时代》中举过这样一个例子。

智能技术的出现正在接近先知的寓言,你无法躲避。“凡是走过,必留下痕迹。”

虚实融合的个性化时代

不断被计算机收集、量化、分析,被打了无数标签的用户画像让“数据人”成为全新的人类,但你必须正确看待每个数字影子背后隐含的力量。

如果把“数据人”看成一个嗷嗷待哺的婴儿,数据就是“奶粉”。奶粉的供给决定婴儿是否能快速长大,“奶粉”的质量则决定了婴儿后续的智力水平。 

有趣的是,现实世界和数字世界两扇窗之间影射出不同的自我现实世界是由原子和物理法则组成的。常人透过感官和思维来做决策,通过经验、感觉来进行推理,判断。

数字世界是由数据组成的。透过计算机算法,通过人的大数据化行为形成“用户画像”。数字婴儿尽管还很小且智力低下,但天生拥有各种逻辑,且计算能力强大,学习能力强大,它还能记住一切。

“数字世界正在不断深入实体世界。”在邢科春看来,实际上大部分人都有自己的数字身份,比如网站会员、搜索记录、购买记录。

“当万物皆数据的时代到来,当下(过去),我们要学会人机分工,让人做人擅长的事情,让机器做机器擅长的事情;未来,我们要相信人机结合,人机的界限已经模糊,无人驾驶已经变成可能。未来人类的身上流动着的是血液以及数据。”车品觉感叹道。

这些数字化身份,正在通过商家推送,慢慢影响和干预人们的正常决策。而我们不断产生的数据,也反馈回数字世界,通过数据闭环,让数字世界的形象得到进化。

吴军在《智能时代》一书中提到,智能时代的大数据思维同传统工业时代的机械思维最大的差别在于,世界充满不确定性,类似瓦特蒸汽机这样的通用型解决方案已经不能在信息爆炸的时代匹配到海量的个体。

从千人一面,到千人千面,再到如今的一人一面,每个数字婴儿都有自己特征。如今,人们已不必不厌其烦地每天看版面一样的报纸、费尽心思地避免和别人撞衫,以及不知道约会时该和心仪的女孩去附近什么样的餐厅。

美图美妆不久前新推出皮肤检测功能,“讨好”爱美的女性用户。“拍一张照片,就能让大家知道皮肤的情况。” 据美图高级副总裁张君透露,根据自拍照片产生用户数字化模型,再利用AI算法,让模型生成出测肤报告。

美图这家从自拍起家的网站,已经上市成功,现在它希望通过体验式服务,让更多爱美的女生,避免试用化妆品“踩到坑”。另外,它也试图通过新增服务的粘性,拉动女性消费者在保养品、化妆品购买欲。“要让亿万用户实现从‘虚拟美’到‘现实美’的蜕变。”美图高级副总裁张君说。

“数字化后营业收入大幅增加” 母婴店品牌孩子王CTO何辉介绍。“和去年同期相比,门店销售同比增长40%以上,单客的产值增长也是40%左右,这是很厉害的数字。”

从2015年,孩子王就开始用户数据的数字化,在母婴零售方面启动非常早,现在也尝到“甜头”。截止目前,孩子王在全国18个省市布局了185家门店。很多门店是智慧店和体验中心,能很快了解顾客喜好,并提供个性化服务。

据何辉介绍,孩子王的门店有很多和顾客的“接触点”,如果一个妈妈进入门店,通过扫会员卡,很多场景植入个性服务。例如,门口大屏幕显示会员照片和欢迎词,手机也会收到个性化信息推荐。育儿顾问会根据顾客的等级,怀孕期还是育儿期,购物偏好,已购产品等信息,精准推荐适合的商品和服务,如果会员临近预产期或临近生日之类,系统也会自动提醒工作人员优先照顾。

“抓住线下大数据,即便是阿里巴巴也可能会‘眼红’。”早在2013年,作为实体零售代表之一——银泰百货,就认识到线下零售数据对于用户画像的重要性。开始参与数据之争。

尽管彼时还停留在以WIFI、iBeacon、LBS以及智能手机等移动互联网技术基础上,但银泰百货已经可以通过收集用户数据,将用户和商品数字化。当用户出现在银泰时,过往的所有在互联网上产生的交互记录、喜好,门店都能知道。

“目前,每个平台的数据是封闭的,形成数据孤岛。”第四范式负责人指出,每人都有很多账户,商家依据自己平台信息进行画像,这样造成用户画像不准确。但是,这个数据孤岛也在悄悄被打破。

“一个会员号打通所有产品。”美图高级副总裁张君介绍,美图有21款产品矩阵。美图在国内还拥有8亿激活用户。通过账户打通,可以方便每个人登录所有的美图产品,也可以根据用户画像,更好地为用户服务。

据亿邦动力网了解,美图的用户中70%是女性用户,通过美图实验室,通过对用户面部数据分析,可以确定新的产品方向。最新推出的美图美妆很多功能,都是基于大数据和算法做成。

“打造生态会员。” 苏宁易购品牌相关人士告诉亿邦动力网,“以前不同业务块会员和数据相对封闭,围绕用户去推进业务过程总难免会有阻力。因此,集团决定将各大产业会员打通。”

苏宁集团旗下的聚力体育拥有会员2-3亿,苏宁易购拥有会员2.8亿,苏宁置业、苏宁金融也有着大量的会员。当全产业会员数据打通之后,平台可以刻画更加立体的用户画像和标签。

典型的场景是,一位苏宁酒店的会员,他同时也是西班牙皇家马德里一名球迷,平时喜欢在PPTV观看的直播比赛,他还有苏宁电商购买零食的习惯。当这些数据打通之后,在下次皇马比赛开打之前,苏宁平台就可以为他推送啤酒和食品的打折信息。

“这一切都基于会员打通。” 苏宁方面称,目前苏宁已经开发包括鹰眼、数据金矿、数据超市、千里传音等多款数据产品。“通过会员打通,对顾客的购物意图有了更清晰的预判,让用户感觉到苏宁门店更懂你。”

AI让数据人“活”了

美剧的《西部世界》一推出就非常火爆,这部电视剧几乎展示了当今乃至未来很多“黑科技”和“黑场景”:人工智能、3D打印、机器人、虚拟现实……以及,人工智能“干掉”人。

以西部世界为背景的高科技乐园,充当导游的智能机器人提供给游客们任意做在人类世界做不了的事情。乐园里机器人与人类高度相似,,一样的外貌皮肤,自己的个性,还拥有独特的记忆。唯一区别是,机器人的记忆只有一天, 日复一日的完成制造者安排好的剧情。最终剧集结尾,机器人自己学习、自己进化,掌握了这个乐园,顺带让人类狗带。

《西部世界》反应出编剧们对人工智能的一种担忧。但这种担忧不无道理。

谷歌推出的AlphaGo,依靠深度学习技术,最终打败人类世界围棋冠军柯洁。最新的AlphaGo Zero的横空出世,这个程序可以从空白状态学起,在无任何人类输入的条件下,迅速自学围棋,并以100:0的战绩击败老版 AlphaGo。“人类太多余了。”曾与AlphaGo有过交战的围棋世界冠军柯洁感慨道。

虚拟世界正在向人类发起挑战,取代人类的言论甚嚣尘上。让机器人有类人思维,只是让大数据挖掘和处理水平提升并产生效益的必经之路。2012年Google在安迪?鲁宾的主导下,以5亿美元的巨资收购了只有 100人左右的小公司DeepMind。这家公司对外宣传其所做的事情是让计算机有思维,其核心技术就是研究通用的机器学习算法,而AlphaGo就是DeepMind 团队为了证明他们机器学习算法有效性而开发的一款智能程序。

“大数据和AI人工智能是相互依存的。” 百融金服董事长、CEO张韶峰介绍,人工智能很早就有,之所以目前呼声高涨,本质是大数据的突破。用户信息为人工智能提供了丰富的“原材料”。

百融金融信息服务股份有限公司(简称:百融金服)是一家致力于利用大数据+人工智能技术,为金融行业提供客户全生命周期管理产品和服务的公司。

“大数据+人工智能应用越来越广泛。”张韶峰介绍,不仅在金融领域,在智能识别领域,安全防护、无人驾驶技术、零售等多个场景都将基于大数据+人工智能,用户画像也将更加完美,更加强大,而且更加理性。

第四范式负责人告诉亿邦动力网,今日头条的算法在移动互联网端火爆之后,整个AI推荐引擎算法带来的精细化营销都会火起来。 

数据分成用户数据和用户的反馈数据。第四范式基于“先知”机器学习平台,收集到这些数据,然后通过深度学习算法,相当于制作上亿条规则,机器自动学习。目前,类似小红书这样每天有大量UGC内容产生的导购类社区电商,正在运用第四范式的智能算法来对用户进行智能匹配,精准推荐。

AI+大数据满足商家想要链接消费者的一切。现今我们不光“买买买”,还有复杂的心理的诉求。大数据可以形成一个虚拟人像,AI通过算法为人像赋予“生命”,猜你所想。

最近的一份报告预测显示,全球情感计算市场总额将从2016年的122亿美元增长到2021年的539.8亿美元。

Affectiva是一家在波士顿成立的开发情感识别软件的公司,其首席营销官Zijderveld透露,其公司已经分析了75个国家的470万多张面孔。这个庞大的数据库已经用文化洞察力揭示了人们如何表达自己情感。Zijderveld解释说:“显然每个人都知道,女人比男人表现力更强。但我们的数据证实了这一点,但不仅如此,它还能表明女性的微笑时间更长。她们往往更频繁地微笑。地区差异带来的不同也是一个方面。”

今年双11预热期间,互联网品牌韩都衣舍打造的客服机器人“店小蜜”已经创造了1秒钟接待1500名买家的记录。在此前的几次大促中,店小蜜在在线客服这个岗位上承担了60%~70%的工作量。为了“训练”这款软件,韩都客服成立了“店小蜜训练师团队”,利用海量的数据去不断对店小蜜进行强化学习,精准度逐渐提高。

这些基于用户画像的数据开始学习人类的情绪和心理状态,在手机等各种智能终端,无孔不入地推送各种广告或商品,想尽一切办法揣测你,满足你。

换句话说,装逼没用,数据比你自己更了解你。

数据永生

英剧《黑镜》第二季《马上回来》这集中描述这样一幕:

女主人公Martha,她的男友在一次意外中死去。她孤苦无助的在黑暗的房间里默默流泪。一个高科技的测试项目拯救了Martha。这个项目通过其男友在的大量数据,分析之后生成一个虚拟人,这个“复活”了的男朋友,模仿逝者生前的语调、语气,以及思维模式,和女主角聊天,声音语气一模一样。变成了一个真正的“人”。面对这样的“人”,你该怎么办?

(英剧《黑镜》第二季《马上回来》截图)

整个过程运用了大数据+AI技术。一切基于这位男友在社交网络Facebook、Youtube、Instagram上的视频、照片等虚拟世界留下的大量个人信息和行为轨迹。科研人员对这些个人大数据进行分析,获得用户模型,并通过AI算法,推测出逝者所可能做到的反应和情绪,最终实现了数字化的“死而复生”。

《黑镜》里的场景是虚构的。但现在正有人尝试把它变为现实。

“这个世纪生的人,已经不可能逝去了。” 从事丧葬电商的天福寿园创始人刘杨向亿邦动力网坦承。目前,刘杨正在考虑通过个人的数据采集上传,最终达到在网络上“生存”的概念。天福寿园的计划现在只是处于最初级阶段。

“但一切变化将会非常快。” 刘杨分析,虽然“死而复生”看似很遥远,但是人向往生命这种欲望是最强的,这将极大推动这领域的进展。另外,各种科技出现,包括AI人工智能技术,将不可能变成可能。

同样有类似想法的还包括深兰这样的智能零售解决方案服务商。深兰科技CEO曾不止一次提到过其团队一直在关注智能化记忆存储和“永生技术”,并致力于率先在中国实现。

在中国将人工智能提上国家发展战略层面,无论科技大佬、投资人,还是创业者,似乎都开始专注于押宝中美智能竞赛。中国的优势是互联网红利期所积攒的大量数据,特别是基于数据人的数据;而美国虽然商业的数字化程度不高,但在科技层面略胜一筹。

此前,谷歌的首席未来科学家兼首席工程师Ray kurzweil表示,到了2029年,人类将开始正式走上永生之旅。这不是痴人说梦,他是基于已经实现了一些计算机和医药领域的惊人成就作出判断,还运用多重科学理论作支撑。

“这一天,很快就要到来了。” Ray kurzweil说。

20年前就预测AlphaGo出现、而名声大噪的作家雷.库兹韦尔,在畅销书《机器之心》中作出大胆的预测:未来,人类和AI机器的界限将更加模糊,人将会数字化存在,并有可能长生不老。

《黑镜》第三季《圣朱尼佩洛的两个过客》一集中,编剧就这个话题,进行了描绘。

(《黑镜》第三季《圣朱尼佩洛的两个过客》截图)

剧集中,机器能够直接将人类大脑中的意识提取出来,直接数字化,存储在云服务器中。躺在病床上丧失一切行为能力的植物人,能够在虚拟世界中继续自己的人生。甚至当肉体走向生命尽头,仍然有一个自由开放的意识世界依旧可以延续生命。

数据没有终点,这不就是永生吗?

*本文由新芽NewSeed合作伙伴亿邦动力网授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。