大数据对于传统评分卡开发技术的影响

2019/01/23 13:59
新知图谱, 大数据对于传统评分卡开发技术的影响

来源:《中国征信》2015年第8期。


作者:姚奕,上海交通大学理学硕士,金融风险管理师(FRM),现任上海安硕信息技术股份有限公司风险咨询与服务部总经理。


商业银行基于传统信贷审批模式开发出用于客户风险评估的评分卡,这种评分卡因其理论完善,结构简单,易于沟通,被银行广泛使用。但随着大数据和互联网金融时代的到来,传统的评分卡技术越来越暴露出明显的缺陷和局限性,笔者总结分析了传统评分卡技术的优劣势,提出了大数据对传统评分卡技术和银行传统授信模式的改变建议。


传统评分卡开发技术概述及优劣势分析


金融业是经营数据的行业,传统的商业银行要基于对客户大量数据收集分析的基础,做出信贷审批决策,把资金借给客户。银行由此逐渐开发完善了基于大样本数据的统计评分模型开发技术,总结来说,传统的评分卡技术具有如下的优点。


首先,模型理论基础完善,在客户群体较为庞大的情况下,基于大数法则,在经济环境保持平稳的前提下,往往能够再现历史发生的统计规律,模型的预测能力会比较理想。


其次,模型的组成结构比较简单透明,风险因素的构成和作用一目了然,便于和模型使用人员进行沟通,这也是大部分银行愿意使用这种评分卡技术的主要原因之一。


最后,大多数银行的评分卡开发主要基于银行自身的内部信贷历史数据,相比于外部数据,这些数据的针对性强、范围小,能够大大提高评分卡的风险预测能力。


当然,这种传统的评分卡技术也存在着明显的缺陷和现实使用上的局限性。


首先,模型所要求的数据数量有局限性。相比于大数据而言,单家银行机构的体量即便再大,其所掌握的数据量也是有限的,特别是对于众多中小银行金融机构,其拥有的数据量更是微乎其微,很多情况下往往达不到统计分析的最低数据要求,这极大地限制了传统评分技术在中小银行的使用范围和使用效果,导致广大中小银行只能被迫使用基于专家经验的评分卡,预测的准确性大打折扣。中国人民银行征信系统收集了3亿多有借贷历史的人群数据,占了全国总人口的30%多,对于其他近70%的人群来说,传统的评分卡技术因为缺少历史数据基础,其刻画客户风险的角度是否合理仍有待验证。


其次,传统数据范围的有偏性。这包括两方面:一是银行往往侧重于收集与信用风险分析最为相关的资料信息,比如客户的财务及资产信息、婚姻状况、家庭信息和以往的借贷行为类数据等。相应地,银行传统的评分卡模型构成就比较简单,一般也就包含10多个变量;而对于其他更广范围的信息,比如社交、消费行为等第三方数据,限于数据收集存在着较大的难度和较高的成本,是以往银行金融机构没有积累的,这使得银行的传统评分模型无法全面刻画借款人的信用全貌。二是银行对于被拒绝授信的借款人往往没有保存完整的申请资料信息,而这部分人群恰恰是银行普遍认为风险较高的群体,这使得银行开发的评分卡所基于的历史数据样本存在着天生的群体偏差问题,从而间接地影响到评分卡的预测能力。


大数据和互联网金融时代呼唤银行传统业务模式的改变


近5年是中国银行业快速发展的黄金时期,我国银行业金融机构境内外本外币资产总额从62.4万亿元增长到151.4万亿元,年复合增长率达到19.39%;不良贷款率也从2.42%下降为1%。银行业的经营能力和风控能力有了长足的进步。但我们应该清晰地看到,银行业的经营环境正发生着深刻的改变,尤其是利率市场化趋势和互联网金融竞争这两大标志性变化起到了关键影响。一方面,在利率市场化的大环境下,银行(特别是中小银行)的融资成本被迫抬高,导致息差空间被压缩;另一方面,互联网金融加入竞争,使得银行的资金、客户都面临着被分流的威胁,特别是对于银行传统信贷业务没有覆盖的小微企业和接近总人口70%的个人客户群,为互联网金融行业的发展提供了巨大的市场空间。


从具体金融业务范围来看,目前互联网金融对传统银行业带来的最大冲击是结算支付、理财产品销售等中间业务;但随着金融准入门槛的进一步放松和互联网金融的竞争加剧,银行最核心的信用资产业务也必将面临猛烈冲击,利润空间将被进一步压缩。


由此,笔者认为,银行传统的信贷业务模式和思维需要进行较大的变革才能适应新的经营环境和新型金融机构的竞争。


首先是传统的客户信息调查模式的改变。一切的风险评估源于对客户信息的全面收集,银行传统的客户信息调查模式采用定向调查模式,要求客户填写特定的调查表,并要求客户自行收集和提供所需要的各种信息资料,比如婚姻状况、职业信息、家庭情况、收入水平等。这种传统的信息调查模式存在着较为明显的缺点:一是耗时较长,收集成本高,效率低下;二是因为信息的定向性和有限性,相关资料容易被客户造假,数据的真实性难以完全保证,容易发生欺诈和操作风险。


其次是传统的信贷审批模式的改变。银行传统的信贷审批,为了防范信用风险,往往设计复杂的审批环节,流程繁琐冗长,效率低下,从贷款申请到客户最终拿到贷款,往往长达数周甚至超过一个月,客户体验非常差,也使得银行的信贷无法与客户的资金需求时间期限有效匹配。究其原因,是银行对借款人的信用风险评价心里没底,且缺乏相应的技术手段做支撑,势必拉长流程。如果采用多人模式反复甄别风险,又必然以丧失较高效率为代价。


最后是传统的风险缓释模式的改变。由于存在上述信息收集的有偏性和风险评估的局限性,银行往往对借款人的信用风险状况“很不放心”,最后只能简单粗暴地要求第二还款来源的落实,这种要求必须有抵押的做法,使得银行更不关心借款人本身信用质量的好坏,从而导致评分卡的应用效果大打折扣,模型的准确性也受到很大影响。


大数据时代传统评分卡开发技术的变革探索


首先,充分利用大数据的优势,整合多种来源的数据进行交叉验证,在提高模型预测能力的同时,有效降低客户造假的几率。比如,借款人不可能为了获得银行数十万元的信贷资金,而系统化地在淘宝上伪造数年的买卖记录或者以往多年的消费旅游记录,可见,这种过往的消费记录可以有效地应用于风险评估。又比如,银行可以系统化地采集各城市的房产交易/评估数据,从而对借款人提供的房产进行自动化估价,有效降低高估的可能性,基于对房产价值的判断,银行可以利用统计模型反推借款人大致的收入和还款能力,与客户所提供的资料进行有效比对验证,还可以快速给出借款人预授信额度。


其次,采用多种建模方法结合。比如采用费雪(Fisher)判别法,基于群体特征指标对客户群体进行划分,找到银行潜在的目标客户群,或者区分高风险客户群和低风险客户群,进一步提高客户风险的预测能力,从而可以设计更有针对性的授信策略。


最后,基于上述风险评估手段,积极推动改变银行现行的审批模式,着力提高审批自动化程度,采用预授信模式尽可能缩短审批时间,提高效率,使得银行的资金供给能够快速响应客户的时间要求,从而营造良好的客户体验。

+ 关注

更多新知

知识库

已收录新知