AI 面对信用卡欺诈,能做些什么?

AI 面对信用卡欺诈,能做些什么?

2018-02-13 09:24雷锋网 合作伙伴
虽然目前在保险公司或者是运营商中,都有用机器学习的算法来做用户流失风险预警,交叉推荐等数据挖掘的工作,但目前这在国内,却面临很多困境。

老实巴交的农民林建国怎么也想不到,他有天竟会成为别人眼中的“老赖”,被追债公司逼着还钱。

这还要从前段时间有人来村里招工说起,他和一些村民被要求填一张包含姓名、身份证号、家庭住址等信息的表格,当时为了能快点上工挣钱,大家都没犹豫就填了。

后来他们才知道,这就是一个陷阱,所谓的招工只是幌子,诈骗团伙要的可不是他们廉价的劳动力,而是上面所填的真实信息,通过这些信息来申请信用卡,然后刷卡透支,从而让这些信息就变为真金白银。

但从未跟信用卡打过交道的林建国们,却从此进入了各大银行的黑名单,背负债务不说,还被抹上了信用污点,连整个村子都被银行归为了欺诈地址。以后在申请信用卡、贷款的过程中,如果出现了这个地址,就会很麻烦。

上面这个故事改编自天云大数据 CEO 雷涛雷锋网所讲的一个真实案例,这其实暴露出银行在传统的信用审核中所遇到的难题,即银行虽然拥有上亿万级的信息数据库,掌握着身份、联系方式、设备信息和资产信息等数据,但这种识别已经无法应对日益演进的欺诈技术和模式,而雷涛带领团队正在做的,就是希望能用人工智能的技术,解决这个问题。

面对信用卡欺诈,传统的信用审核有哪些短板?

大家在申请信用卡时,其实是把自己的数据都提交给银行,以证明我是一个有偿还能力并且守信用的人,银行多年来会有一套自己的辨别系统。

在传统的银行系统里,这些数据库更多的呈现为一种二维的结构,叫关系型数据库。如何理解?我们先来看这样一个例子。

张和老王两个人准备相互担保进行骗贷,然后一起跑路,在银行传统的风控架构下,这种行为很容易被发现,因为维度很小,可以迅速的通过数据库来查询。

但目前真实的骗贷状况是,老张、老王、老李、老赵、老周的企业形成了一个担保圈,打算集体跑路,当银行现在要做一个5度甚至是6度的查询时,依据传统的计算方式,已经无法解决这个问题了。

在防止信用卡欺诈方面,国内目前的风控都是 rule base(规则驱动)的,更多的是根据经验来,抽象出系列规则,每一条规则触发一种欺诈场景,交叉组合相应的业务逻辑来进行判断,由此来做出风控模型。(下图)

但目前,这种方式在效率、有效性、全面性以及成本上都面临问题。与此同时,随着互联网金融的兴起,非现场交易的增多,这种模型会加剧银行风险防控的难度。

雷涛曾接触过很多金融行业的客户,以前,他们看一个进件(信用卡申请资料)时,会注重本身是否健康真实,即有没有违约记录,姓名、身份证号、电话号码等信息是否真实,但这还是会出现问题。

比如刚刚讲的案例,村民的信息确实是真的,人也没有出现过违约记录,还是出事了。金融业的风控发展到今天的趋势,其实会把不同的进件连接起来看深层次的关系,看从中能否发现潜在的风险。

简单来说,就是要在申请和进件之间建立关联,骗子手里的资源有限,他填的电话、地址、推荐人等信息,或多或少会在每天十几万个进建中重复。

我们会把不同的进件连接起来进行识别,在这个过程中增加新的维度,如果有其中一个欺诈电话号码,和他有关系的有好几个进件,那我就会认为它有问题。

雷涛所说的短板,其实就是现有的风控模型对于数据处理能力的不足,这次,他想借力人工智能来解决这个问题。

人工智能做些什么?

对于金融业而言,在信息、数据大爆炸的今天,会面临以下两个问题:


  1. 数据来源多,且存储在不同系统,缺乏数据同步机制、数据无法共享。

  2. 数据利用不充分,致使行销、审批、风险、策略研究、催收部等业务部门系统形成信息孤岛。


那主打“人工智能”的天云,是如何应对这些难题的?

这跟信用卡反欺诈又有何关系?

其实在金融行业,多年来积累了一定的数据,无论是人行的个人征信数据,还是部分银行间可以相互流通的数据。(后者的意思是,如果你建行的信用卡逾期了,再申请工行的信用卡,就会遇到麻烦)

将这些数据通过特征表达的方式转化到数据模型后,机器就可以借此来表达以往很难描述的金融现象,因此特别适合处理风险、欺诈以及金融产品的营销,这些依靠过往经验难以准确定量的事件。

具体到信用卡申请场景,这些数据包括申请人的社交数据、联合推广人信息数据、申请人信息数据、单位联系数据等。

雷涛告诉雷锋网,这么做有3点好处,一是融合了信用卡申请环节的各个业务数据,解决了数据孤岛的问题;其次,这个过程中会引入第三方数据,比如银联数据等,扩展了数据的维度;第三,通过构建申卡客户的社交复杂网络提供客户的社交数据,在拓展覆盖维度的同时,以弱变量来体现强变量,并且实现了社交数据的高频率更新,提高了数据的准确有效性。

未来的打算

将 AI 赋能金融反欺诈,其实在国外早已开始,雷涛坦言,目前在银行反欺诈方面中国与北美的差距还是很大的,硅谷的金融科技创业公司很早就将这一技术应用起来了。

比如,京东和百度同时投资的美国金融科技公司Zest Finance,便是一家明星公司。

它们利用机器的深度学习,从大量的数据中提取变量,并采用多个预测分析模型,其中就包括欺诈模型。

除了反欺诈,其在预付能力模型等方面也用来帮助用户降低信贷成本,它的核心竞争力就是数据挖掘能力和模型开发能力。

虽然目前在保险公司或者是运营商中,都有用机器学习的算法来做用户流失风险预警,交叉推荐等数据挖掘的工作,但目前这在国内,却面临很多困境。

雷涛告诉雷锋网,一个很大的问题是人才的不足,很多做数据科学的人,一般对编程领域较为陌生,而熟悉编程的人又不懂算法。

天云正在做的就是将数据科学家的算法能力,与懂业务的编程人员相结合,目前已经通过人工智能算法建立现金分期响应模型,预测筛选办理此业务的高概率客户,在信用卡反欺诈方面,也建立可循环授信模型,对客户行为特征进行分类,并确立客户对循环授信响应评分。对于一些评分高的客户,他们可以有效推送循环贷服务,从而提高银行利润。

为何国际上基本成熟的业务天云要亲自再来做?在采访中,雷涛提到“后IOE”时代。

“IOE” 其实是对IBM、Oracle、EMC的简称,其中 IBM 代表硬件以及整体解决方案服务商,Oracle 代表数据库,EMC 则代表数据存储。

随着国内去IOE浪潮的兴起,大量企业开始在X86服务器、开源数据库产品、分布式存储解决方案等方面开展研究和探索,而天云正是其中之一。

就如同虽然 Windows 操作系统虽然可以用,但我们依然要研发国产自主可控的操作系统,尤其是金融等关乎国计民生的重要领域。

而这,也是目前为何国内有很多公司纷纷投入有关数据库的研发和应用的重要原因之一。在外企工作过多年的雷涛透露,他们目前有很多员工就是来自于IBM、Oracle、EMC等。“正是因为我们这些人见过最好的产品是什么样,我们才有信心把它做出来,甚至做的更好。”

*本文作者郭佳,由新芽NewSeed合作伙伴微信公众号:雷锋网授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。