互联网金融做大数据风控的九种维度

来源:转载

在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场。那么,大数据风控到底是怎么一回事呢?与传统风控相比,它又是怎样来进行风险识别的呢?本文对此进行了探讨。

大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。

金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、P2P、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。


传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个纬度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据纬度为十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等,金融企业参考用户提交的数据进行打分,最后得到申请人的信用评分,依据评分来决定是否贷款以及贷款额度。其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等。


互联网金融的大数据风控并不是完全改变传统风控,实际是丰富传统风控的数据纬度。互联网风控中,首先还是利用信用属性强的金融数据,判断借款人的还款能力和还款意愿,然后在利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断借款人的信用情况,借助数据模型来揭示某些行为特征和信用风险之间的关系。

互联网金融公司利用大数据进行风控时,都是利用多维度数据来识别借款人风险。同信用相关的数据越多地被用于借款人风险评估,借款人的信用风险就被揭示的更充分,信用评分就会更加客观,接近借款人实际风险。常用的互联网金融大数据风控方式有以下几种:

1验证借款人身份


验证借款人身份的五因素认证是姓名、手机号、身份证号、银行卡号、家庭地址。企业可以借助国政通的数据来验证姓名、身份证号,借助银联数据来验证银行卡号和姓名,利用运营商数据来验证手机号、姓名、身份证号、家庭住址。

如果借款人是欺诈用户,这五个信息都可以买到。这个时候就需要进行人脸识别了,人脸识别等原理是调用国政通/公安局API接口,将申请人实时拍摄的照片/视频同客户预留在公安的身份证进行识别,通过人脸识别技术验证申请人是否是借款人本人。

其他的验证客户的方式包括让客户出示其他银行的信用卡及刷卡记录,或者验证客户的学历证书和身份认证。

2分析提交的信息来识别欺诈


大部分的贷款申请都从线下移到了线上,特别是在互联网金融领域,消费贷和学生贷都是以线上申请为主的。


线上申请时,申请人会按照贷款公司的要求填写多维度信息例如户籍地址,居住地址,工作单位,单位电话,单位名称等。如果是欺诈用户,其填写的信息往往会出现一些规律,企业可根据异常填写记录来识别欺诈。例如填写不同城市居住小区名字相同、填写的不同城市,不同单位的电话相同、不同单位的地址街道相同、单位名称相同、甚至居住的楼层和号码都相同。还有一些填写假的小区、地址和单位名称以及电话等。


如果企业发现一些重复的信息和电话号码,申请人欺诈的可能性就会很高。


3分析客户线上申请行为来识别欺诈


欺诈用户往往事先准备好用户基本信息,在申请过程中,快速进行填写,批量作业,在多家网站进行申请,通过提高申请量来获得更多的贷款。


企业可以借助于SDK或JS来采集申请人在各个环节的行为,计算客户阅读条款的时间,填写信息的时间,申请贷款的时间等,如果这些申请时间大大小于正常


客户申请时间,例如填写地址信息小于2秒,阅读条款少于3秒钟,申请贷款低于20秒等。用户申请的时间也很关键,一般晚上11点以后申请贷款的申请人,欺诈比例和违约比例较高。


这些异常申请行为可能揭示申请人具有欺诈倾向,企业可以结合其他的信息来判断客户是否为欺诈用户。

4利用黑名单和灰名单识别风险


互联网金融公司面临的主要风险为恶意欺诈,70%左右的信贷损失来源于申请人的恶意欺诈。客户逾期或者违约贷款中至少有30%左右可以收回,另外的一些可以通过催收公司进行催收,M2逾期的回收率在20%左右。

市场上有近百家的公司从事个人征信相关工作,其主要的商业模式是反欺诈识别,灰名单识别,以及客户征信评分。反欺诈识别中,重要的一个参考就是黑名单,市场上领先的大数据风控公司拥有将近1000万左右的黑名单,大部分黑名单是过去十多年积累下来的老赖名单,真正有价值的黑名单在两百万左右。

黑名单来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,其中很大一部分不再有借贷行为,参考价值有限。另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),会产生很多黑名单。

灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。

黑名单和灰名单是很好的风控方式,但是各个征信公司所拥有的名单仅仅是市场总量的一部分,很多互联网金融公司不得不接入多个风控公司,来获得更多的黑名单来提高查得率。央行和上海经信委正在联合多家互联网金融公司建立统一的黑名单平台,但是很多互联网金融公司都不太愿意贡献自家的黑名单,这些黑名单是用真金白银换来的教训。另外如果让外界知道了自家平台黑名单的数量,会影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。

5利用移动设备数据识别欺诈


行为数据中一个比较特殊的就是移动设备数据反欺诈,公司可以利用移动设备的位置信息来验证客户提交的工作地和生活地是否真实,另外来可以根据设备安装的应用活跃来识别多头借贷风险。

欺诈用户一般会使用模拟器进行贷款申请,移动大数据可以识别出贷款人是否使用模拟器。欺诈用户也有一些典型特征,例如很多设备聚集在一个区域,一起申请贷款。欺诈设备不安装生活和工具用App,仅仅安装和贷款有关的App,可能还安装了一些密码破译软件或者其他的恶意软件。


欺诈用户还有可能不停更换SIM卡和手机,利用SI;6利用消费记录来进行评分;大数据风控除了可以识别出坏人,还可以评估贷款人的;按照传统金融的做法,在家不工作照顾家庭的主妇可能;常用的消费记录由银行卡消费、电商购物、公共事业费;互联网金融的主要客户是屌丝,其电商消费记录、旅游;据分析,只要客户授权其登陆电商网站,其可以借助于;7参考社会关系来评估信用情况;物以类聚,人与群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低,

欺诈用户还有可能不停更换SIM卡和手机,利用SIM卡和手机绑定时间和频次可以识别出部分欺诈用户。另外欺诈用户也会购买一些已经淘汰的手机,其机器上面的操作系统已经过时很久,所安装的App版本都很旧。这些特征可以识别出一些欺诈用户。

6利用消费记录来进行评分


大数据风控除了可以识别出坏人,还可以评估贷款人的还款能力。过去传统金融依据借款人的收入来判断其还款能力,但是有些客户拥有工资以外的收入,例如投资收入、顾问咨询收入等。另外一些客户可能从父母、伴侣、朋友那里获得其他的财政支持,拥有较高的支付能力。


按照传统金融的做法,在家不工作照顾家庭的主妇可能还款能力较弱。无法给其提供贷款,但是其丈夫收入很高,家庭日常支出由其太太做主。这种情况,就需要消费数据来证明其还款能力了。


常用的消费记录由银行卡消费、电商购物、公共事业费记录、大宗商品消费等。还可以参考航空记录、手机话费、特殊会员消费等方式。例如头等舱乘坐次数,物业费高低、高尔夫球俱乐部消费,游艇俱乐部会员费用,奢侈品会员,豪车4S店消费记录等消费数据可以作为其信用评分重要参考。


互联网金融的主要客户是屌丝,其电商消费记录、旅游消费记录、以及加油消费记录都可以作为评估其信用的依据。有的互联金融公司专门从事个人电商消费数据分析,只要客户授权其登陆电商网站,其可以借助于工具将客户历史消费数据全部抓取并进行汇总和评分。

7参考社会关系来评估信用情况


物以类聚,人与群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低,


参考借款人常联系的朋友信用评分可以评价借款人的信用情况,一般会采用经常打电话的朋友作为样本,评估经常联系的几个人(不超过6六个人)的信用评分,去掉一个最高分,去掉一个最低分,取其中的平均值来判断借款人的信用。这种方式挑战很大,只是依靠手机号码来判断个人信用可信度不高。一般仅仅用于反欺诈识别,利用其经常通话的手机号在黑名单库里面进行匹配,如果命中,则此申请人的风险较高,需要进一步进行调查。

8参考借款人社会属性和行为来评估信用


参考过去互联网金融风控的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低;


年龄大的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违约率最高,


30岁左右的人违约率最低。贷款用于家庭消费和教育的贷款人,其贷款违约率低;


声明月收入超过3万的人比声明月收入低于1万5千的人贷款违约率高;


贷款次数多的人,其贷款违约率低于第一次贷款的人。


经常不交公共事业费和物业费的人,其贷款违约率较高。


经常换工作,收入不稳定的人贷款违约率较高。


经常参加社会公益活动的人,成为各种组织会员的人,其贷款违约率低。


经常更换手机号码的人贷款违约率比一直使用一个电话号码的人高很多。


午夜经常上网,很晚发微博,生活不规律,经常在各个城市跑的申请人,其带贷款违约率比其他人高30%。


刻意隐瞒自己过去经历和联系方式,填写简单信息的人,比信息填写丰富的人违约概率高20%。


借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。


9利用司法信息评估风险


涉毒涉赌以及涉嫌治安处罚的人,其信用情况不是太好,特别是涉赌和涉毒人员,这些人是高风险人群,一旦获得贷款,其贷款用途不可控,贷款有可能不会得到偿还。


寻找这些涉毒涉赌的嫌疑人,可以利用当地的公安数据,但是难度较大。也可以采用移动设备的位置信息来进行一定程度的识别。如果设备经常在半夜出现在赌博场所或赌博区域例如澳门,其申请人涉赌的风险就较高。另外中国有些特定的地区,当地的有一部分人群从事涉赌或涉赌行业,一旦申请人填写的居住地址或者移动设备位置信息涉及这些区域,也要引起重视。涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有收入,这种情况需要引起重视。涉赌和涉毒的人活动规律比较特殊,经常半夜在外面活动,另外也经常住本地宾馆,这些信息都可以参考移动大数据进行识别。


总之,互联网金融的大数据风控采用了用户社会行为和社会属性数据,在一定程度上补充了传统风控数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。互联网金融企业通过分析申请人的社会行为数据来控制信用风险,将资金借给合格贷款人,保证资金的安全。


转自:http://www.360doc.com/content/16/0608/11/8507568_566017106.shtml


大数据风控案例(总结他人)

转自于:http://blog.csdn.net/liberty_xm/article/details/53185252


一、行业背景


1.1风控行业背景


当前,经济下行导致中小企业经营成本不断增加吗,产品销售价格因结构原因和市场原因相对走低,企业利润空间被进一步压缩,许多中小企业陷入经营困境,导致企业经营风险加大、连锁性风险陡增、潜在信用风险上升、企业主的道德风险聚升。一些重点领域的银行等金融机构信贷风险进入了一个暴露期,一些地区的金融机构已经出现不良贷款回升苗头,不良贷款高危行业中,钢铁与建材等行业信用风险快速上升,制造业领域新增的不良资产已占到整体不良资产的七成以上,与此同时经济下行也使得个人信贷中的逾期率陡增,不良贷款率上升,如何防控信贷风险,已成为商业银行等金融机构扼待解决的课题。


1.2国内外风控技术现状


序数衡量法:只能反映企业间信用风险的高低顺序,如BBB级高于BB级,但其间的级差无法进行客观量化。


Creditmetrics;Credit Risk+Credit PortofolioView+:是组合投资的分析方法,注重直接分析企业间信用状况变化的相关关系,但是它局限于投资组合分析。


KMV:从单个授信企业在股票市场上的价格变化信息入手,着重分析该企业体现在股价变化信息中的自身信用状况,但对企业信用变化的想关心没有给予足够的分析。


FICO:FICO在方法上通常采取逻辑回归和决策树。然而,这两类方法是存在很大缺陷的。例如,逻辑回归一般只能包含至多10-15个风险因子,且各变量必须服从正态分布;决策树要求对所有申请者的分类是完全互斥的。显然,这些要求是难以满足的,由此产生的结果是“偏误”还是“错误”也很难评价。


ZestFinance: ZestFinance包含70000个变量,利用10个预测分析模型进行集成学习或者多角度学习,并得到最终的消费者信用评分。然而,ZestFinance进行信用评估时,传统征信数据要占到至少30%清晰的用户定位,完善的征信体系支撑,是ZestFinance在美国生存的土壤。中国没有集中的征信所,金融体系也尚不完善。很难适应中国目前的信贷业务。


国内大部分中小银行信用风险管理仍停留依靠经验判断传统阶段,以感觉、经验、关系决策;缺乏对客户信用评级、统一授信风险量化信息系统;缺乏对公司类客户、个人客户优劣的判别统一标准 [缺乏对客户风险量及授信边界系统科学的模型]。


1.3风控行业发展趋势


随着近年来国 内大数据互联网 金融的蓬勃发展, 顶尖的数据机构开始从事各种信用维度的数据收集、 分类、 查询服务, 这为在线征信与量化风险提供了 技术、 数据基础。


多维度数据分析、数学建模、机器学习算法、云计算。


二、YUNRISK风控在线介绍


2.1数据来源:华中大数据交易中心、万德数据库、金融界、中国人民银行、世界银行等。


2.2基于大数据进行分析


多渠道获取数据,对宏观经济,行业数据,企业数据及个人数据进行分析,多角度,全方位进行风险量化。


企业指标:宏观指标,行业指标,企业指标,财务指标


个人指标:宏观,行业,个人。


指标频率:日,月,季,年


技术特点:


物理学的布朗运动理论:分子运动无规则性、永不停歇性、温度越性。


市场是随机波动的,随机波动是市场最根本的特性。变量过去的历史和变量从过去到现在的演变方式则与未来的预测不相关。也就是说一种现价已经包含了所有信息,包括所有过去的价格记录。同时,价格与粒子运动一样,具有“温度”越高,运动越明显的特性。


蒙特卡罗模拟


基于大数据分析,由于涉及指标众多,如何构建少而精的指标体系是一个极为重要的问题。


Peason和Searman相关性检验法


通过适时检测和监控风控指的相关性来优化指标体系。


主成分分析法


主要用于统计和筛选主要相关的因素。


Probit-logit方法


(probit模型是一种广义的线性模型。服从正态分布;Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logistic regression,“逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、市场营销等统计实证分析的常用方法。)


主要致力于分析所选因素的动态变化,预测其运行轨迹。

2.3系统介绍


个人版风控系统查询:


A个人收入


B银行流水


C负债


D汽车折旧系数


E房产折现系数


企业版风控系统查询


绝对指标


A资产总计


B负债总计


C营业总成本/营业总收入


D销售毛利率


现金收益


E净资产收益率ROE


F经营活动净收益/利润总额(TTM)


G经营性现金净流量/营业总收入


H筹资活动产生的现金流量净额占比


I投资活动产生的现金流量净额占比


偿债能力


J资产负债率


K有形资产/总资产


L权益乘数


M流动比率


N速动比率


营运能力


O存货周转率


P应收账款周转率


Q应付账款周转率


R净资产(同比增长率)


S固定资产投资扩张率


T利润总额/息税前利润


U股东权益合计/负债总计


V. EBITDA率%

三、风控流程


3.1业务流程


1.借款人进行咨询;


2.填写申请表和有关资料,提交给业务员;


3.业务员添加客户至客户室;


4.业务员为客户发起授信申请,进入授信审核,审核成功后,借款人获得授信额度。


5.业务员为借款人发起借款申请,进入借款审核,审核成功后,财务放款,借款成功.


3.2授信审核流程(贷前流程)


1.业务员为自己客户发起授信申请;


2.业务主管进行初审,审核通过进入风控委员初审,驳回返回上级,拒绝的授信失败;


3.风控委员进行初审;


4.风控主管进行复审;


5.贷审会进行审核;


6.总经理进行终审,审核通过,授信成功,借款人获得授信额度。


3.3


借款审核流程(贷中流程)


1.借款人拥有一定的授信额度,业务员为借款人发起借款申请;


2.业务主管进行初审,审核通过进入风控委员初审,驳回返回上级,拒绝的授信失败;


3.风控委员进行初审;


4.风控主管进行复审;


5.总经理进行终审;


6.审核通过的,财务放款,借款人借款成功。


3.4贷后流程


贷款到期,借款人还款。其中借款人可以提前还款,若到期未能还款,则有展期申请、强制结清、押品结清、押品处置、违约金法系处理。


借款人还清贷款,即可拿回抵押物品。


四。风险管理全面解决方案

分享给朋友:
您可能感兴趣的文章:
随机阅读: