干货 |信用评分模型在消费金融业务中的应用 "

信用评分模型是评估贷款申请人的资信状况来预测申请人未来验证拖欠或坏账概率的模型。信用评分模型在信贷风险管理中有着非常重要的作用，因为该评分往往是信贷审批的关键依据。

最有效的风险管理莫过于把风险过高而收益不能对称的申请者拒之门外，因为一旦高风险的申请人获得信贷，其他管理手段只能减少损失而不能避免损失。有研究表明，80%的风险来自申请阶段，而申请后（贷中、贷后）风险管理只能管理到20%的风险。

如何客观地评估贷款申请者的风险，尽可能地避免、减少、控制贷款的坏账损失？信用评分模型的应用使信贷机构有了科学的风险管理手段。

信用评分模型的含义

信用评分模型实际上是一种用于个人信用风险控制的数学模型，它利用数据挖掘技术，对金融机构大量客户的历史数据进行分析，寻找有关客户信用风险的特征和规律，建立相应的数学模型，对新申请者或已有客户评估风险。如申请风险评分模型、行为评分模型、催收评分模型、欺诈风险评分模型等。

信用评分模型的类型

信用评分模型的类型有很多，根据模型的实证化程度可以分为以下三种类型：

专家风险评分模型

从专家经验出发，采用了典型评分模型中常见的特征和属性而开发的模型，适用于没有数据或者数据量极其有限的情况。

半客户化评分模型

在专家模型的基础上，利用金融机构的现有数据对模型进行验证，并根据验证结果对该模型进行调整。数据验证的内容包括评分卡是否能够正确按照实际的账户表现对申请者排序，各种属性间的分数间隔是否符合实际好坏表现情况等等。适用于有一定业务历史、具备一定业务规模，但数据尚不充分的情况。

完全客户化评分模型

完全依据金融机构的实际数据、利用先进的模型技术和标准流程开发出来的评分模型。特征项的筛选、属性的划分、评分的权重分配等都是根据金融机构的数据特征来制定的。适用于数据充分的情况。

信用评分卡的开发流程

模型样本

选取好的样本是开发模型的首要环节。建立预测模型的前提是客户未来的行为模式与过去相似，而且这种行为模式可以用恰当的统计技术提炼和总结出来，所以可以用过去的数据来预测未来。

随机抽样：是在确定样本规模后从总体中完全随机的抽取，每种类型的个体在样本中的比例与在总体中的比例是一样的。

分类抽样：首先根据模型的需要确定样本的类别，对每一类别的样本分别确定其抽样个数，然后在每一类别内部随机抽取所需的样本。由于每一类别的抽样比例可能不一样，所以必须给每个样本类别设置相应的样本加权数。例如：有100万个账户，“坏”的账户占2%（98万个好账户，2万个坏账户），从中分类抽样“好”账户7000个作样本，样本加权数为980000/7000=140（每个“好”的样本个体代表总体中140个同样的好个体）；从“坏”账户里抽取3000个作样本，样本加权数为20000/3000=6.67（每个“坏”的样本个体代表总体中6.67个同样的坏个体）。

在绝大多数的模型开发中，所用的方法都是分类抽样。为了使样本量充足，一般“好”的样本在2000-3000个以上，“坏”的样本在1000-1500个以上。

模型变量

评分模型的变量主要有两种：表现变量（因变量Y）和预测变量（自变量X）。

表现变量是模型所要预测的结果。预测变量体现着与目标变量的相关性和逻辑因果关系，来源于申请表中的原始数据及征信记录。

以申请评分模型的为例：

表现变量

3期拖欠以上、呆账、破产的账户定义为“坏”；

未拖欠或1期拖欠的账户定义为“好”；

2期拖欠的账户定义为“不确定”，被排除于模型之外；

具体

预测变量

反映申请者未来还款能力、还款意愿及稳定性。

一是申请表上申请人信息，如年龄、性别、学历、职业、收入、是否拥有房产等信息；

二是关于汽车贷款本身的信息，如首期付款额、贷款价值比、贷款期限长短等；

三是申请人在征信机构的信用历史记录信息。

模型分组

分组是把总体数据分成几个具备同质性的群体，群体内部的账户具备相似的行为特征，群体之间的行为特征差别较大，最终从候选变量中以数理统计方法选择若干变量组成完整评分卡。

模型制定

在确定了样本、界定了表现变量、提炼了预测变量、决定了模型分组之后，下一步就是以适当的统计方法制定具体的评分模型了。

1）分析单个变量的预测能力

分析单个变量的预测能力，其目的是发现具备强大预测能力的变量作为模型的候选变量，剔除不具备预测力或预测力极其微弱的变量，以缩小候选变量的范围。

表分析单个变量的预测能力

把过去6个月的平均付款比例划分成8个栏位，每个栏位都有一定数量的好账户和坏账户，从“坏”的比例上看，0%付款比例的坏账率最高，达14%，随着付款比例的提高，坏账率逐步下降，付款率达100%的账户群，其坏账率最低，不到1%。我们看到这个变量能有效地分辨表现变量，其预测力强。如果反过来，各个栏位的坏账率大体相同，或无规律可循，则说明没有多少预测力，可以删除。

2）减少候选变量的数量

通过分析保留下来的具备较强预测力的候选变量数目往往还是很庞大，必须把候选变量进一步分组，每一组之内变量间的相关性很高，组与组之间变量的相关性很低。然后从每一组变量中选择预测力最强、信息最有效的一个变量作为模型候选之用，这样可以大大减少候选变量的数目。

可以用来进行变量分组的常用统计方法有相关系数分析、变量类聚分析、因子分析、主成分分析等；

3）选择适当的模型方法

具体模型方法的选择必须根据模型的性质、分析人员的经验和技能、系统实施的方便程度来决定。例如，对于申请评分模型，最流行的是逻辑回归模型，对于欺诈风险评分模型应用神经网络模型较多，对于催收评分策略应用决策树模型较多。

4）确定模型的变量组合和权重

不管运用何种统计方法，最终从候选变量中选择一定组合（通常8-15个变量），进入最终的模型，并且根据统计原理分配相应的评分权重。例如行为评分中从反映历史拖欠行为、消费行为、欠款行为、付款行为等各方面选择一些预测变量强、相关性低的变量构成一个信息量丰富的变量组合。

模型校验

在完成模型的制定以后，如何衡量模型预测能力的强弱呢？一般来说，在模型的开发阶段，模型的检验有两种方式：样本内检验和样本外检验。

利用模型开发所用的样本来对比预测情况与实际情况的差别，属于样本内检验；

利用事先预留的、不用于模型开发而只用于模型检验的样本来对比预测情况与实际情况的差别，属于样本外检验；一般来说，预留的样本占总样本的20%-30%。

常用的模型检验方法有：

- 交换曲线

- K-S指标

- 区分度

- 拟合度曲线

前三者主要检测模型对好账户和坏账户排队区分的效果，即随着评分的上升，好的比例也上升，低分和高分有效地把坏账户和好账户区分开来。拟合度曲线则对比预测坏账率与实际的坏账率之间的准确程度。通常信用评分模型的首要目标是好坏的区分效果，其次才是预测的精确程度，因为哪怕模型预测坏的概率不够精确，但如果能有效地把好账户和坏账户区分开来，瞄准和开拓好账户、拒绝坏账户，也能达到利用模型进行风险管理的首要目的。

模型的实施与跟踪

实施评分模型不仅是一个操作性步骤，它涉及分析人员、业务人员和IT人员的合作；涉及业务流程的整合；涉及业务管理策略的调整；涉及对模型持续性的跟踪；涉及与模型相关的系统的设置和监控，是一个系统性的工程。一般来说，正确的实施需要对相关实施人员进行培训，提前在测试系统中模拟实施，持续跟踪模型在实践中的表现，及时发现潜在的问题。