精准反欺诈 洋钱罐风控进化的“三驾马车”

『在正常情况下,借贷逾期或者坏账产生的原因,除了借款人的疏忽大意,无非就是没有还款能力和没有还款意愿 。针对这两方面问题,洋钱罐的风控基本原则是,保证借款人有还款能力,挡住无还款意愿借款人 。』

精准反欺诈 洋钱罐风控进化的“三驾马车”

文章插图
随着监管的深入,网贷行业再度掀起洗牌热潮 。线下理财平台转型失败、小平台不堪重压纷纷退出市场竞争,网贷行业竞争进入了更纯粹的阶段 。
“824”网贷监管方案提出,“直接或变相向出借人提供担保或者承诺保本保息”;“57号文”明确提出,“禁止辖内机构继续提取、新增风险备付金 。”这些都意味着,监管的原则非常明确,用户要有风险意识,平台不会帮你兜底 。
但用户自身难以把控风险,即便能够看到借款人的信息,也无法得出客观真实的评价 。在这个背景下,平台的风控实力成为判断风险的近乎是唯一的标准,也是用户选择平台的核心要素 。
与此同时,网贷机构服务的用户往往是银行没有或者无法覆盖的群体 。有数据显示,在央行征信记录里面能查到征信报告的人只占中国14亿人口的25%左右 。
那在美国同期对标的数字大概是60-70%左右 。这个比例之间差了大概5-6亿人口 。既然银行无法授信,网贷机构就需要自行搭建有效的风控模型 。
何为有效的风控模型?怎样才能剔除有潜在的欺诈群体,保证平台的健康稳健 。我们以洋钱罐为例,来说一说风控的那些事儿 。
之所以选择洋钱罐,主要在于这家平台可以做到三分钟完成审核而不需要庞大的审核团队 。在三年多时间里,累计交易额已经达到了近550亿,出借用户超130万,累计借款笔数2646万笔,平台保持稳健运营 。这表明,平台有一套强大的风控体系做支撑,并且已经得到了充分的印证,其做法有着重要的借鉴作用 。
那么,洋钱罐风控的秘诀在哪里?我们主要从征信评估、反欺诈服务和监控预警三个方面探讨 。
大数据与借款人高维度弱变量分析建模
在借贷发生前,平台首先要对借款人进行征信评估 。传统金融机构往往是查询工资流水、社保记录、工作、家庭背景等等,但一方面,网贷平台覆盖的群体,这些信息并非完全清晰可见 。
另一方面,即便用户提供这些信息,也不足以完全勾勒出一个清晰的借款人画像,造假的成本也不高 。在移动互联网时代,数据维度和处理计算模型就变得极其重要 。
洋钱罐的做法是,在业界通行的互联网爬虫技术及在线身份认证技术之外,还与线上数十家数据合作方建立合作,通过纯线上的方式便能够抽取数千维度的变量 。
据洋钱罐CTO耿博介绍,依托用户在移动互联网上的信息,洋钱罐可以将弱关系、碎片化的内容形成一个高维度、细颗粒化的描绘 。基于这个描绘,机器学习算法可以进一步对用户进行分类 。
也就是说,洋钱罐的大数据风控不只看“大”,重点是看机器能否很好地处理这些数据 。洋钱罐依托海量的数据,针对诚信、失联、关联聚类、信用等多个维度构建了若干个机器学习模型,能够精确判别用户的欺诈和信用风险等级 。
据耿博透露,机器学习算法可以对借款人形成一个细颗粒度的分类,并通过高维度的弱变量进行建模分析,对信用不满足要求的借款人,平台能够及时剔除 。
借款人的信用是概率性的,反应借款人在某一个概率下的置信度 。信息维度越广、数据变量越多、机器学习越精确,对借款人描绘的颗粒度就越细,造假的成本就越高,对借款人授信的置信度就越高 。这项基础工作做好了,反欺诈的工作就变得水到渠成 。
欺诈个体与群体的动态甄别
在正常情况下,借贷逾期或者坏账产生的原因,除了借款人的疏忽大意,无非就是没有还款能力和没有还款意愿 。针对这两方面问题,洋钱罐的风控基本原则是,保证借款人有还款能力,挡住无还款意愿借款人 。
在还款能力上,洋钱罐的资产主要来自小额消费类资产,小额信贷一般都是几百、几千块的小额借款,这个从平台数据可以看出 。
洋钱罐的运营数据显示,平台人均累计借款额只有5000多元(划重点:累计),前十大借款人待还金额占比仅有0.014% 。最大单一借款人待还金额占比仅有0.001%,很好地体现了小额分散的特点 。小额分散的借款方式可以保证,只要是正常的借款需要,借款人基本都可以保证有还款能力 。
那么,核心问题集中在还款意愿的评估上,其实就是检测欺诈用户 。欺诈用户分为组团欺诈和个体欺诈 。