大数据乘:在信贷风控、欺诈识别、精准营销中的应用

2018/04/20 13:58
文 | 普林科技

在普林科技和大成基金联合举办的2016中国大数据应用大会“大数据与金融创新”论坛上,普林科技金融事业部总经理王冉冉跟各位专家分享了普林科技通过大数据分析与金融业结合做出的案例。

1 商业银行的新挑战

自从银行存贷款利率放开以后,对于银行业来说,“躺着挣钱的时代已经一去不复返了”。银行的业务模式也受到互联网金融的冲击,同时还有由于经济下行的原因造成的不良账户率的升高。

银行传统的业务模式是从零散客户处吸收存款,然后再贷款给公司,通过赚取利差来盈利。 而目前对公客户状况的不良促使我们把目光转向零售客户。很多银行都在做零售化的转型,那么另外一方面,我们怎么去面对我们的互联网客户,一些“低头族”、年轻人、或者是以前银行不做业务,风险比较大的像三农、小微企业。

2大数据应用现状

新的技术如,大数据、云计算、机器学习、人工智能技术对整个银行业的冲击。但是,这些新技术如何在银行业落地呢?具体点说,现在在商业银行,在业务部门的风险控制中很多时候还是依赖人工流程。更多的是通过事后的审查和手段,比如推出一个产品一段时间后,产生了多少坏账,然后再反过头来看这些人是如何形成了坏账,然后采取手段。

也就是说,目前国内的征信还处于比较薄弱的阶段,我们无法通过有效地途径来获取征信信息;另外从客户的角度来说,目前银行沉积了很多客户的数据但对于这些数据缺乏深入的挖掘和分析,也没有把各个业务的客户信息关联起来,捕捉他们的行为模式。

这就造成了客户的活跃度非常低,产品的同质化现象比较严重,获客渠道比较单一。

另外一方面我们所说机器学习、人工智能的方法或者说算法,他们的优势在于可以自学习、增强学习但是对于银行业务来说,他们的频率或者说数据的频率是不如股票交易市场的,那这样的快速资讯迭代方面如何落地,在应用层方面也面临上述问题。

那么作为大数据业务本身,又面临什么样的现状呢?我们作为大数据公司,有时候跟客户交流的时候会被问到:“你们是大数据公司,那你们有什么数据啊?”可能对于大数据的理解还停留在数据源、数据获取的基础上。同时对于我们来说,如何保证数据的真实性、合法性、对于业务的有效性也是一个重点。

另外,很多银行也再做大数据的技术建设,建设了大数据平台。但是很多银行包括一些大型商业银行的大数据平台并没有对数据进行一些有效地利用,仅仅是把各个业务的数据汇集到一个分布式系统里,并没有有效地分析和应用模块,就连一些历史查询的功能也不能实现。

大数据平台如果只是这样的话那只是一个摆设吗?

3商业银行的大数据应用

那么,回到大数据的应用,这个话题自从去年十三五提出已经成为一个火热的话题。那么对于大数据,我们的基本路径是:获取数据、存储数据、分析数据和应用数据。

我们换一个思路来想,比如说我们面对银行,我们的问题是什么,我们要解决什么样的场景,我们有什么样的模型、算法、手段可以帮我们解决这样的问题,在这个问题之上是我们需要什么样的存储资源,什么样的传输组件,什么样的运算环境。

以解决问题为出发点的方式适合于银行这样非常庞大的业务系统。那我们也来说一下普林科技通过大数据的服务,了解到银行业所面临的、问题和我们应该怎么去解决它。

新知图谱, 大数据乘:在信贷风控、欺诈识别、精准营销中的应用

1风险控制

总结商业银行面临的几个问题,一个是风险控制,因为风控对于金融业来说是一个核心,我们是否可以通过征信数据、信用历史和外部数据源的获取和技术上模型机器学习算法形成一个自动化的申贷审批系统,在贷款业务中辅助决策。

另外一个就是在运营商,我们可不可以通过运营数据的整合、监控和分析了解到客户的行为习惯,提供生命周期的客户管理,可以把互联网行业已经成熟的方法适用于银行业,帮助银行业上,通过调整产品,调整业务实现优化运营。也就是说我们需要多维的用户的画像、产品的画像交叉分析、关联分析实现更大程度的价值挖掘、精准营销达到获客的目的。

具体的一些做法,像在风控这个领域,我们可以通过对数据的分析处理,提供数据模块实现到贷前审批、催收等贷款的各个环节中。

更多的是零售的业务,我们的数据源通过信用历史、央行的征信报告、资产啊、关联关系、消费能力的辅助,帮助我们做整体的坏账预测和个人的风险评分,通过历史数据对个人做出“好人”和“坏人”的区分和评分,帮助我们在新的样本中对个人进行预测和风险评分。

2建模流程

在建模过程中,我们把原始数据分成训练集和测试集,通过风险变量的计算同时把预测模型、评分模型进行训练后,在对模型进行验证后再进行优化和迭代。

在对模型进行评估的时候我们就更关注其准确性,比如说这个“好人”,还款是否还清等来看模型的区分度是否准确;其次是模型是否表现稳定,比如在半年或一年的时间内模型表现的准确度和区分度。以及最终我们需要关注模型的解释性,因为模型要起到辅助决策的作用,如果是一个黑盒子的话并不能为业务人员提供很高的参考作用,所以模型要有比较好的解释性。

3风险变量

在建模的时候我们要考虑风险变量是什么,比如说用到的最基础的是征信的信息,你的刷卡记录,透支的额度,你的坏账,逾期和基本信息如教育程度等以及一些互联网信息,网购记录、社交网络信息等都可以作为风险变量。

在非常多的维度的数据里,我们通过算法分析提取出风险变量以及各个变量在判定一个人会不会还钱的时候的权重是怎样的最后我们还可以构建不同的贷款模型,那么这个场景就是说在风控的环境里谁是会还钱的人,谁是不会还钱的人,我们通过我们的建模的手段以及我们可以采集到的数据。

4基于大数据的反欺诈模型

大数据还可以帮助我们在风控中做什么?反欺诈是其中之一。

我们可以通过通讯数据、上网行为、活跃度、是一个稳定的移动手机号还是一个刚注册的虚拟手机号,是不是频繁的联系一些小贷公司判断出是否有隐形负债的风险等。

通过非常多的维度提炼出身份的验证,对违约度的风险进行预测。这也是通过大数据和和分析手段来做的分析。

5基于大数据的产业链分析

对于大数据在整体的产业链上面的分析,我们也做过一些尝试,我们可以通过获取外界,互联网的数据从主流媒体、财经论坛、社交媒体上搜集针对产业链的报告,评论解读和网民的讨论。最后通过自然语言的处理,机器学习的模型然后输出热度指数,方向指数、政策指数和风险指数。

这其实也是可以服务于产业的投资、企业风险风控、量化选股等应用的。

我们想在这里分享一下我们的一个尝试,我们爬取了2006到2016年的在国内各大平台,新闻门上股市风险和宏观经济风险的关键词,然后进行自然语言处理、机器学习后发现我们成功地预测了股票的风险。

那么这个就是在整体的风险控制上我们利用信用预测,评分以及数据源的丰富和大数据手段来帮助银行业、金融业做到风险控制。

6运营优化

再说一下我们的运营优化,刚刚也有说到我们帮客户进行全生命周期的管理。

我们可以把客户分成考察期,在这样的阶段我们获取新的客户,客户的形成期如何实现用户交易提升,稳定定期产生交叉营销,以及在退化期如何预测客户流失的情况。

我们通过客户价值模型、潜力值分析、流失预测模型进行客户的全生命周期管理,从而实现运营优化。

7精准营销

另外,在精准营销方面,其实我们从行业内获取了很多的用户数据,比如说他的基本信息、投资、购买产品的情况、交易、流水、以及消费的情况。

这些都是可以帮助我们对客户进行价值高中低的划分,我们可以优先对高价值的用户进行营销,同时利用外部数据定义这个客户有消费还是投资的偏好,对他进行定制化的营销。那么也是通过银行内部数据的梳理和外部信息的结合做到整体的精准营销。

8成功案例

那么下面给大家介绍一下我们在做的案例,我们给中国人民银行征信中心做了算法优化,构建了一家基于大数据新算法的信用评分模型。

因为征信中心之前的模型更多的是基于美国FICO的体系,通过强风险变量的提取对用户的违约率做一个评分,但是这个模型的稳定度还有待提升,区分度也出现了比较集中的情况。由于美国的信贷状况更国内有很大的差异,所以我们需要对模型进行很大的改变。

我们对模型的变量设计也进行了优化,其中用到了机器学习的算法,包括决策树、随机森林。我们也做了很多的尝试,这些算法在大规模的数据集上的表现,同时对准确性、有效性等评价指标也做了很多工作。

另外我们跟金融业包括银行也有很多合作,其中就有基于小微贷对客户的评分模型,对流水、财务需求结合征信报告做一个客户风险评级模型。最后,通过这些风险模型,实现小微企业在贷款中的监控,并且真正地实践普惠金融。

商业银行对大数据的应用现状来说,就像是商业银行有一个非常漂亮的鱼缸放在那里但是里面没有鱼。那么我们是不是就可以通过技术手段,通过整合行内的各种业务数据,交易系统、征信数据然后做一个数据挖掘和智能分析的平台?这个平台可以做到自动化的决策辅助,并服务于银行的很多业务,比如运营、营销、风控等方面。

比如说我的目标是提高储蓄率或者我想购买一个固定的理财产品或者我这次营销目的是怎样的,那我可以定制个性化的模型帮助实现业务的提升。

其中通过机器学习算法进行有效地人群识别,在银行的信息中其实是有上千维度的信息,那么什么样的变量指标相对来说他的权重、重要性是更高的,通过非常多的算法来实现,我们发现客户的转账频率是一个非常重要的指标。另外,我们可以通过数据整合做用户画像,我们发现人群被区分开来,比如说:一个经常使用电子支付的年轻女性。

在建立模型前,我们并不能知道客户被被分成怎样的不同人群,通过数据挖掘把客户有效地区分出来后,我们就能更有效地知道一个客户群有怎样的特征,应该给他推荐怎样的理财产品,或者什么样的功能产品,或者通过怎么样的额渠道实现更好的营销。

9普林科技 做什么

那么最后我想介绍一下普林科技,我们是一家创业公司,有非常多的技术人才,有很多算法模型的积累。基于大数据对于行业规划和咨询,提供大数据分析建模服务、软件开发和集成、大数据建模的培训。目前,我们也已经与很多的金融机构有过合作。

+ 关注

更多新知

知识库

已收录新知