可复制、接地气,大数据——华瑞银行的利矛、坚盾

可复制、接地气,大数据——华瑞银行的利矛、坚盾

导读

在上海华瑞银行和神州信息金融软件业务板块联合主办的“科技驱动普惠金融——中小银行Fintech实践高峰论坛”上,上海华瑞银行大数据中心副总经理张鲲就华瑞银行如何在风控、反欺诈和精准营销方面有效利用大数据进行精彩演讲。

主题演讲



《大数据下的风控、反欺诈与精准精准营销》

上海华瑞银行

大数据中心副总经理 张鲲

可复制、接地气,大数据——华瑞银行的利矛、坚盾

大数据下的风控、反欺诈和精准营销的基础是用户体系,首先要做好用户画像,这要提到用户ID归一化,即一切ID都要关联,比如把微博、微信、QQ开放平台提供的ID关联后做用户标签,再通过用户标签做顶层数据应用。 

在SDK模式下如何做用户画像?除了前面提到的传统银行都会有的客户资金资产、金融属性,还有客户在各种平台上的兴趣爱好分析。如果某用户今天在合作的电商平台买了尿不湿,两年以后可以为他推安全座椅。银行推什么呢?银行可以推儿童牙齿保险,原来不知道客户有什么属性,处在人生哪个阶段,现在通过用户画像可以做更精准的推荐。

有了用户画像后就可以建模。人的兴趣会改变,所以要考虑衰减因子。通过基本用户分群,获取客户属性,就可以分客户进行推荐。

反欺诈风控是大数据应用的主要场景之一,风控分贷前、贷中和贷后,反欺诈是贷前的上一步。反欺诈有很多种手段,每种手段都要不停迭代。从黑名单开始,除了网贷名单,还要做IP黑名单、手机号黑名单等等。IP、设备、WIFI都有高度关联性,这些黑名单一边收集一边共享。

筛过黑名单后再做数据比对,数据比对是将客户申请贷款时填写的信息,包括家庭、住址、工作单位、配偶、紧急联系人等,与其他渠道的数据做验证。

通过这一关卡后,再看行为数据,比如黑中介批量做贷款申请时,很多信息批量复制粘贴,当你捕获一个客户提交速度毫秒级,那肯定是有问题的。反欺诈的规则匹配比较多,主要是针对客户连续的异常操作设立一系列规则。识别客户异常点主要是指通过聚类等算法来识别隐私欺诈客户。

前面提到的反欺诈手段主要是识别真实客户身份,除此之外还要识别客户是否有真实贷款意愿,最常用的手段有电核,人脸识别还有电子签名。这些手段加起来,我们认为等同于面签。

在SDK展业模式下如何做大数据风控?人行征信加上融入场景的数据。以车贷为例,要提供车辆相关信息;装修贷可把房屋楼层、小区均价作为模型变量;消费贷使用消费记录、产品价格等。延伸场景,车贷可推广到物流贷,装修贷之后可以做实施工程装修队的商户贷,消费贷向后延伸可以知道电商流量,做电商贷。SDK植入各个场景后,从每个场景获取特色数据,为每个场景分别建模。

即便没有数据损失,还款意愿还是比较难识别。在大数据里,很多弱变量可筛选出强变量,作为还款意愿的辅助识别。比如车贷,会从保险出险情况、GPS轨迹,车辆安全状况进行识别;装修贷,会参考手机定位,是否在装修小区,如果申请贷款装修房子,却从来没在小区周围出现过,这就有风险;消费分期,可以看手机是否停机、收货地址是否经常变化等。

如何防范贷后风险?还是要基于用户场景数据的收集,包括经常出现的位置、常用设备,当客户的行为发生异常时,比如突然换一个地方登陆,就要对他进行动态安全策略验证,原来提现需要短信验证码,现在就要语音验证码。这个思路是不让黑产摸透你的模式,他可能认为就是一条短信验证,突然使用语音他就无法获取。

风控离不开信用评估。信用评估分两类,一是有监督的机器学习、另一种是无监督的机器学习。目前还有的说法叫做半监督机器学习,这其实是有监督和无监督机器学习的混合,此外还有迁移学习和强化学习。举例说明,如果训练出一个AI能做一般图象识别,应用到医疗上用做病理图片识别,这就是迁移学习。大家比较熟悉的阿尔法狗,自己和自己下了几千盘棋后逐渐学习,就是强化学习。无监督机器学习,是完全不告诉AI什么好、什么不好,让他自己发现,最后对结果进行评价。金融行业用的比较多的是有监督和无监督学习。

不管是什么模型,我们讲到场景数据的建模一定要把场景数据加入模型里。不同场景相对独立,当内部数据结合了外部场景数据,变量更加丰富,每一个产品模型可分客群迭代,最终的目标是让模型更加精准。

点击下列 关键词 即可查看往期内容



ESB丨ESC丨IT架构丨IT治理

核心系统丨分布式丨民营银行丨大数据

互联网金融创新丨互联网金融平台

金融IT圈 微信ID:JinrongIT

可复制、接地气,大数据——华瑞银行的利矛、坚盾
 可复制、接地气,大数据——华瑞银行的利矛、坚盾


长按识别二维码即可关注