数据源|小贷公司的风控问题竞争力|世界第一|洪楠基|财政

编辑导语：如今市场变化多端，做好风控对于公司来说是非常重要的。本篇文章中作者结合实际经验，探讨了很多小贷公司风控总搞不好这个问题。希望对你有所帮助，感兴趣的小伙伴们快一起来看看吧。

文章插图
风控本身的逻辑、技巧、心得我已经说了不少了，如果你没有什么感受，要么是你没好好看，要么是你接触的还不够多，要么是我说的不够好。最后一个要么发生的概率肯定是极低的。
我们这次聊聊行业内的一些事情。主要是想探讨下很多小贷公司风控总搞不好这个问题。
大的消金机构，背靠大厂有海量数据的，用自有的数据建模，模型随时迭代都行，一般不会有什么问题。当然这些机构也是要用外部数据的，分开用就行。
而几乎所有的小贷公司，除了在app端搜集一些信息，没有什么数据可用，只能接入三方数据。
怎么评估一个三方数据的效果呢？
最方便的办法当然是，圈定一个样本，一个数据源一个数据源往里面加去计算增益，简单说就是去算加入一个数据源KS提升了多少。
这个做法本身没有什么问题。
但事实是，绝大多数小贷公司都会陷入一个困境，就是引入一个新的数据源，测试效果好好的，一上线对通过率、坏账率一点提升都没有，甚至常常出现负面影响。
那是什么地方出问题了呢？
这种做法是只知其一不知其二。不得不说，这个领域虽很成熟，但大家都在一成不变地套用经验和办法。终局是死局。
01我们都知道，投资理财有三种策略，保守型、冒险型和组合型，所有人都告诉你组合型的回报是最高的。
【 数据源|小贷公司的风控问题】大家有没有想过，这是为什么呢？
如果组合型只是一半保守型+一半冒险型，为什么最终收益不是两者平均？
因为策略是分两步走的，一步是资产组合，一步是再平衡。
一定周期后例如半年或一年，要把资产再平衡，重新组合，如此往复，最后才能带来远高于单个策略的回报。再平衡背后是低买高卖的行动。
跟组合投资分两步一样，上面说的建模过程顶多就是其中一半的工作，而不是全部。
我知道很多小贷公司，为了测试三方数据的效果，就是会去圈定一个样本，才好明确新增一个数据的价值。
这样做最大的好处是，计算过程很清楚，数据指标很明确，花这个钱去接入这个数据源的决策是很好给老板汇报的。
但是这是打头的策略，就这一条你觉得能做好风控？
我们不说模型重要还是策略重要，这两者都很重要，没有必要分什么高下。
但如果说模型思维和策略思维呢？一定是策略思维更重要，因为策略是更贴近业务的。
你拿着一个固定的样本，这个数据测一下，那个数据测一下，这个月测一下，下个月测一下，希望把这个样本测试效果提升到最优，这就是模型思维。
天天盯着这个样本集，跟业务一点关系都没有，不把风控做死才奇了怪了。
线上模型在跑的效果不好，你不去找原因吗？
怎么找？拆分呗。
背后每个数据源的效果要去看看吧，数据源有子模型就先去看子模型，没有子模型看重要变量也行啊。
尤其是，现在监管合规原因，三方数据越来越多地只提供评分，不提供底层特征变量了。
这对追求效果来说是不利了，但对排查原因很有利啊，毕竟简化了。
是每个数据源效果都下降了，还是某个数据源下降了，时间上能不能对得上，空间上这个下降幅度说不说的过去。
其他数据源稳定，就某个数据源KS下降很大，那问题是不是大概率就是它了？
它都有问题了，你还拿原来的样本，在已用的数据源上，找新的三方数据去提升效果，你说是不是自嗨？
如果数据源效果波动跟最终模型效果波动趋势都一致，那是不是可能就是你们客群结构变动太大了？
客群都换了，还去优化原来的样本，前朝的剑还能斩本朝的官？
即使找原因你什么都没找出来，对小贷公司来说最重要的是什么？
用户啊，模型上线跑了大半年甚至一两年了，这些最新的用户你藏着不用？更别说这个「即使」本身就很小概率。
上面的问题想清楚了之后，你还会采用最开始的做法吗？
02市面上可能几乎所有的小贷公司，都是满脑子想着做模型的，没有别的原因，就是不专业。
我提供一个办法，一个策略思维的办法。