数据造假、私下买卖、上百平台混战,“金融数据共享”为何一地鸡毛

数据造假、私下买卖、上百平台混战,“金融数据共享”为何一地鸡毛

“我一直相信六度空间理论,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”她说,这个圈子很小,纸是包不住火的。

12月,金融强监管到来,行业逾期全面爆发。这背后的深层次原因,无疑是“多头借贷”太过严重。

“经历过这次下行周期,市场被教育了一次,意识到了共享的重要性。”多位业内人士称。中国共享意识,全面觉醒。目前,市面上已出现上百家数据共享平台,未来,这个数字将呈几何级增长。一个真正的共享时代,已徐徐而来。

共享觉醒

12月是金融行业风雨飘摇的一个月。

行业强监管袭来,此前对自己风控能力充满信心的公司,发现自己的逾期率和入催率在嗖嗖上涨。

“此前我们去和公司谈,参与数据共享,大多人并不理会。”某个人征信试点的商务负责人程烨发现,最近这些公司对于“共享”积极了很多,甚至很多公司主动来敲门。

共享平台们,已感知到共享意识的觉醒。

目前,市面上有上百家数据共享平台,这其中分为几大类别。

最早入场的是官方系。

早在2009年,央行征信就正式控股上海资信有限公司。

“业内都认为,上海资信是央行征信的补充,专门用来收集央行征信之外的借贷数据。”监管人士林海峰称。

此外,还有一些有官方背景的协会,也成立过数据共享平台。

比如中国支付清算协会下的,小微金融风险信息共享平台。

第二派,是企业系,是各大公司自建的平台。

比如中诚信、中智诚、京东金融、宜信旗下致诚信用的阿福平台、算话征信、同盾、91征信等平台。

除此之外,还有一些有数据的支付公司、短信平台都纷纷做起了数据共享平台。

“知名平台有30多家,大大小小的平台都算上得有100多家。”林海峰预估,这一切才是刚刚开始,未来将出现更多细分垂直的数据共享平台。

而这一轮新的爆发,偶尔中也带有必然。

中国的征信体系,在曲折中盘桓多年。

2015年,国家正式开放了民间个人征信市场,号令枪一响,第一批试点的8家机构,开始撒丫狂奔。

大家望穿秋水,等待着牌照,最终等来了却是监管的“全盘否定”。

“8家进行个人征信开业准备的机构,目前没有一家合格。”中国人民银行征信管理局局长万存知在会议上称。

两年探索,一夜归零。

无疑,征信建设是一个漫长而风雪交加的征途,急不得。

但互联网金融等不了。

对于金融行业来说,征信太过重要,可节约大量风控成本。

行业开始自救,市面陆续出现一批数据共享平台。

在最早期,数据共享平台都喜欢收集“黑名单”,就是逾期数据。

随着消费金融的普及,很多用户开始多头借贷,借新还旧,以贷养贷。

黑名单数据开始“失效”。

“2015年,网贷很火,平台几千家,导致行业的共债已非常严重。”致诚信用总经理赵卉称,过度负债的结局,有太多前车之鉴,比如韩国的信用卡危机、台湾的卡债风暴等。

“债务会累积,像雪球一样越滚越大,等支撑不住崩盘的时候,债务危机才会集中爆发,一个好用户,也会突然间崩盘而不还钱。”林海峰称。

说到底,借贷需要评判两个要素:还款能力和还款意愿。如果共债严重,就很难正确判断一个人的还款能力。

不久,整个行业调转船头,从只收集“逾期数据”的黑名单,转到了收集借贷的“全周期数据”,以此缓解“多头借贷”严重的现状。

“征信的精髓,就是共享。”林海峰称,因此,行业共享平台的建立,是必然,也是趋势。

困难重重

2016年下半年开始,数据共享平台大量出现,一时间行业百舸争流。

但总体来说,发展不尽人意。

先来说说官方派。

因为是官方机构或半官方机构,吓得部分存在问题的公司不敢来共享。

“谁能说自己是一张白纸,没有一点问题?”林海峰笑称。

另一方面,因为官方派缺乏互联网基因,服务和运营意识并不太好,“前期共享完了,后期的服务体验不好”。

而企业派,则是问题重重。

林海峰注意到,大家做共享平台的出发目的,不太相同。

“有一些是为了利益而来。”林海峰发现,一些平台的规则是,共享了数据的,查询不收费,但是其他公司要想来查,就得收费,“几毛到几块不等”。

还有一部分,是为了数据而来。

林海峰就曾经调查到,一家数据平台收集到数据后,再偷偷拿到各地的大数据交易中心去买卖。

或者直接成立一家“关联公司”,在市面卖数据。

还有一些玩家,当了裁判员,还同时当运动员。

“一家头部的数据共享平台,公司负责人的直系亲属,又成立了一家贷款公司,拿着各家的金融数据再去放款。”程烨称,这在圈内,早就成为了公开秘密。

因此,在最早期,金融公司并不太愿意共享数据。

第一,他们也无法判断平台动机是否纯良;第二,数据是他们的“核心机密”,他们也不愿意拿出来。

“谈一个共享用户太难,反反复复去磕。”程烨一度认为,共享在中国不太可能做起来,大家“自扫门前雪”的心态太严重,相互敌视,不信任。

在如此利益交集的江湖,“相互不信任”,成为数据共享最大阻力。

为了消除金融公司的顾虑,各家公司都打出了新的底牌。

第一种方式,就是不需要金融公司上交数据,只要提供一个接口,每次有人查询时,直接反馈一个脱敏结果。

但这依旧没有消除金融公司的顾虑,“这个接口是否安全?共享平台是否能以此为抓手,伸进底层数据库?谁都不敢保证。”程烨称。

市面上有人提出了,用技术来解决。

林海峰最近参加了很多大数据峰会,发现很多数据共享平台都在宣称用“区块链”的技术。

他要求去看底层架构的时候,对方却变得支支吾吾。

“很多都是噱头,区块链在共享平台运营还比较早期,真正走出模式来的,没几家。”林海峰对此也不乐观。

“我们也加入了很多数据共享平台,但是调取平台数据的时候,发现效果很差。”某公司的数据模型负责人坦言。

此后,他们再也没有加入过任何数据共享平台。

数据的表现,为何不尽人意?

“数据掺沙子的问题,一直存在。”致诚信用总经理赵卉称,很多金融公司的想法是,把一些好用户,杂糅到黑名单里,“他们以为,如此别人就无法抢走自己的用户”。

“这就导致,很多平台的数据被污染,真假难辨,失效失真。”程烨称。

建造平台目的不纯、相互不信任、数据造假等多种问题,整个数据共享行业都尚在迷雾中摸索。

前路漫漫

行业诸多问题叠加,实际上,无非就是要解决一个“公信力”问题。

要建立公信力,出发的目的,就不能太功利。

多位共享平台的负责人认为,数据共享,应该用“纯公益”的操作思路。

“带有私心和目的,行业内的人都不会认。”小微金融风险信息共享平台的负责人透露。

赵卉持有同样的观点,所以致诚阿福的数据共享,并不收费。

“宜信的创始人、CEO唐宁在内部会议上,说要进行数据共享,大家都颇为反对,觉得这个事情吃力不讨好,很难做起来。”赵卉称,但唐宁很坚持,说这是对整个行业都有益处的事情,能够帮助整个行业降低风险。

唐宁提出方案后的2016一年,都是“让行业机构免费来查宜信的数据”。直到2016年年底,致诚阿福的共享平台才成立。

也就是说,他们花了一年多来教育市场,培育信任。

“我一直相信六度空间理论,也就是说,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”赵卉称,这个圈子很小,纸是包不住火的。

“因此,永远不要作恶。”

她在圈内听说一些大公司会数据“掺沙”,至今她都拒绝合作。

同时,加强数据的交叉验证和审核,这一步也不可少。

“我们对数据进行反查抽样,机器和人工交叉验证,一旦发现异常,就会深入查验。”赵卉认为,要爱惜羽毛,才能飞得更高更远。

“现在已有数据查验模型,容易发现数据中掺的沙子。”赵卉称,她已清退了3家数据存在问题的公司。

除了技术之外,还可通过制度来防止“数据造假”。

一家加入信联的征信机构数据共享平台称,他们将在明年开放C端用户的数据查询。

这个逻辑和查询央行征信很像。

用户本人,可以去央行申请查询个人征信,如果发现逾期等负面记录有误,可以提出异议。

这个方式可以让用户自行发现数据真伪。

共享要用“公益”思维,但这件事情并非毫无想象力。

一家金融公司不是光有数据,就可做好风控,还需要技术和经验。

比如致诚阿福,就在共享平台后已布局了“群星”和“天迹”两套系统,给金融公司提供全业务流程的风控解决方案。

前端,共享平台聚合行业,后端,又将宜信多年的经验输出。

这样的商业模式,才足够智慧

美国征信的建立,花了近百年的时间。

中国征信出发才几年,前路漫漫。

“数据共享必须沉下心来,重运营重服务重质量,才可能成。”林海峰称,因为数据是敏感资产,尚有不慎,就可能“走偏”。

这里同样只欢迎深耕者,拒绝投机取巧的“揩油者”。

*本文作者零和 米格,由新芽NewSeed合作伙伴微信公众号:一本财经授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。