数据源|小贷公司的风控问题

编辑导语:如今市场变化多端,做好风控对于公司来说是非常重要的。本篇文章中作者结合实际经验,探讨了很多小贷公司风控总搞不好这个问题。希望对你有所帮助,感兴趣的小伙伴们快一起来看看吧。

数据源|小贷公司的风控问题
文章插图
风控本身的逻辑、技巧、心得我已经说了不少了,如果你没有什么感受,要么是你没好好看,要么是你接触的还不够多,要么是我说的不够好。最后一个要么发生的概率肯定是极低的。
我们这次聊聊行业内的一些事情。主要是想探讨下很多小贷公司风控总搞不好这个问题。
大的消金机构,背靠大厂有海量数据的,用自有的数据建模,模型随时迭代都行,一般不会有什么问题。当然这些机构也是要用外部数据的,分开用就行。
而几乎所有的小贷公司,除了在app端搜集一些信息,没有什么数据可用,只能接入三方数据。
怎么评估一个三方数据的效果呢?
最方便的办法当然是,圈定一个样本,一个数据源一个数据源往里面加去计算增益,简单说就是去算加入一个数据源KS提升了多少。
这个做法本身没有什么问题。
但事实是,绝大多数小贷公司都会陷入一个困境,就是引入一个新的数据源,测试效果好好的,一上线对通过率、坏账率一点提升都没有,甚至常常出现负面影响。
那是什么地方出问题了呢?
这种做法是只知其一不知其二。不得不说,这个领域虽很成熟,但大家都在一成不变地套用经验和办法。终局是死局。
01我们都知道,投资理财有三种策略,保守型、冒险型和组合型,所有人都告诉你组合型的回报是最高的。
数据源|小贷公司的风控问题】大家有没有想过,这是为什么呢?
如果组合型只是一半保守型+一半冒险型,为什么最终收益不是两者平均?
因为策略是分两步走的,一步是资产组合,一步是再平衡。
一定周期后例如半年或一年,要把资产再平衡,重新组合,如此往复,最后才能带来远高于单个策略的回报。再平衡背后是低买高卖的行动。
跟组合投资分两步一样,上面说的建模过程顶多就是其中一半的工作,而不是全部。
我知道很多小贷公司,为了测试三方数据的效果,就是会去圈定一个样本,才好明确新增一个数据的价值。
这样做最大的好处是,计算过程很清楚,数据指标很明确,花这个钱去接入这个数据源的决策是很好给老板汇报的。
但是这是打头的策略,就这一条你觉得能做好风控?
我们不说模型重要还是策略重要,这两者都很重要,没有必要分什么高下。
但如果说模型思维和策略思维呢?一定是策略思维更重要,因为策略是更贴近业务的。
你拿着一个固定的样本,这个数据测一下,那个数据测一下,这个月测一下,下个月测一下,希望把这个样本测试效果提升到最优,这就是模型思维。
天天盯着这个样本集,跟业务一点关系都没有,不把风控做死才奇了怪了。
线上模型在跑的效果不好,你不去找原因吗?
怎么找?拆分呗。
背后每个数据源的效果要去看看吧,数据源有子模型就先去看子模型,没有子模型看重要变量也行啊。
尤其是,现在监管合规原因,三方数据越来越多地只提供评分,不提供底层特征变量了。
这对追求效果来说是不利了,但对排查原因很有利啊,毕竟简化了。
是每个数据源效果都下降了,还是某个数据源下降了,时间上能不能对得上,空间上这个下降幅度说不说的过去。
其他数据源稳定,就某个数据源KS下降很大,那问题是不是大概率就是它了?
它都有问题了,你还拿原来的样本,在已用的数据源上,找新的三方数据去提升效果,你说是不是自嗨?
如果数据源效果波动跟最终模型效果波动趋势都一致,那是不是可能就是你们客群结构变动太大了?
客群都换了,还去优化原来的样本,前朝的剑还能斩本朝的官?
即使找原因你什么都没找出来,对小贷公司来说最重要的是什么?
用户啊,模型上线跑了大半年甚至一两年了,这些最新的用户你藏着不用?更别说这个「即使」本身就很小概率。
上面的问题想清楚了之后,你还会采用最开始的做法吗?
02市面上可能几乎所有的小贷公司,都是满脑子想着做模型的,没有别的原因,就是不专业。
我提供一个办法,一个策略思维的办法。