多年做ABF(基于资产的融资,包括资产证券化和其他类似业务)让我习惯于把注意力集中放在对资产的考察,而这往往集中体现在对关键指标“违约率”的考察。那时进入数据分析阶段,第一件事就是让对方提供违约率表。但是跟各类小微信贷机构打交道一年多,现在我的口头禅是“我不看你的违约率”……
千奇百怪的违约率
违约(Default)是信贷的一个主要风险,特别是在次贷市场,违约风险远大于利率风险和早偿风险,可说是首要风险。但是要客观全面的刻画违约表现,计算一个"违约率",却不是一个容易的事情。国内的小微信贷机构近年来发展很快,大部分市场玩家都是最近几年成立的新机构,内部的风险监控体系还在逐步建立中;加上从业人员本身的来源多样,看问题的角度方法不同,造成了各种机构之间使用的风险指标定义千差万别,几乎不具有任何可比性。
上图中玩具哪个大一些?
简单的视错觉,可以成倍的放大或者缩小感官上的尺寸。而违约率的各种口径之间的差别甚至可以别这个更大。在若干次掉入坑里又艰难的爬出来以后,我终于决定:不再使用任何资产方计算的违约率,而全部根据我自己的定义从底层数据自己生成这个数据,力图能以统一的标准描述和比较不同资产池的表现。所以我在数据分析的第一句话往往是“我不看你的违约率……(此时来个大喘气,资产方常表现出放松)……给我原始数据自己算(对方瀑布汗)”。
今天就来稍微吐槽一下那些不同的定义们...
限于篇幅,这里不会提到所有的那些坑。另外,不同的指标定义方法也没有严格意义上的对与错,所以我不会试着在这里给出一个标准定义。
1. 违约定义
严格意义上说,借款人违反合同的任何条款,就是违约。所以逾期一天,理论上就是合同违约。但是在实务操作中,很少有放款机构会对刚刚逾期一天的客户就做极端处理。大部分机构只会把进入严重逾期的借款才作为“坏账”认为是发生了违约。那么什么算是“严重逾期”呢,不同的业务下情况又非常不同,比如借款期限本来就很短的产品,如果逾期30-60天还无法收回,未来就非常难收回了,应该确认为坏账;但是对于有抵押的产品,比如房贷,逾期较长时间以后还可能全额收回——借款人可能只是在努力的设法寻找买家。
总之,给出违约的标准定义,并不是个容易的事儿。所以也有些时候,大家直接讨论“N个月逾期率”(一般叫做"mN")。由于明确的给出逾期长度,这个定义是更明确一些,但它依然还藏着暗坑:有些机构的m1表示1天到30天逾期(少于或等于一个月),而另外一些机构表示30天到59天逾期(满一个月但不到两个月),此后各档类推。可以看到,这两种定义方式几乎相差一个月,特别是在m1指标上,会对结果造成非常大的影响:逾期不满一个月的借款很多是临时性违约,大部分都可以催回。第一种口径下包含这些“预警但一般可以催回的借款”,而第二种不包含,两者的结果差距可达2-3倍。
2. 分子定义
任何的比率,一定是有一个分子,一个分母的,所以我们来看看这部分的选择。违约率的分子,那当然是违约(或者逾期)借款的某种指标。这个指标选择就非常有讲究了,分子方面,最主流的两种选择是“余额”和“应还未还”。
余额表示这笔借款当前剩余的未还本金,使用余额这个口径的逻辑是:这个借款一旦进入mN逾期,我们就认为他未来的剩余本金未来的回收都具有不确定性。
应还未还表示该笔借款已经到期的还款日应该偿付,但是尚未偿付的金额(而不包含尚未到期的金额)。这种口径无疑更乐观:已经到期但是没收回的那部分是个问题,但是未来的那些还没到期,现在不着急做判断。
上图给出了两个借款,为了简化,都没有考虑利息。b借款一直正常还款,a借款在第三期发生了逾期。假设一个资产包只有这两笔借款,不难计算,按照余额口径,这个资产包计算逾期率时的分子是1000,而按照应还未还口径,分子只有100——相差了10倍!
3. 分母定义
说了分子,我们再来说分母。常见的有两种口径,"初始放款额"和"余额":初始放款额就是借款一开始的合同金额,这个当然大于等于余额,余额与初始放款额之间的差距主要看借款存续期限:一开始这两个数差异不大,但是借款快到期时,他们就能差非常多。
还是上面的例子,在第三个月时,用初始放款额做口径,分母是2400,用余额最口径,分母是1900。分子分母组合一下:余额/余额=1000/1900=52.6%。粗一看可能有些人觉得奇怪:两个借款,一个逾期一个正常,为啥逾期率高于50%呢。但是仔细一想还是有道理的:在当前剩下的这些余额中,确实有超过一半的金额都是出现了预警信号的。
余额/初始放款=1000/2400=41.6%。需要注意这么一个问题,这个口径下就算两个借款都逾期了,逾期率是低于100%的(2000/2400=83%),他的逻辑是:你已经收回来了400元(17%),所以就算剩下的全违约了,也只占你投资的83%。
应还未还/余额=100/1900=5%,顺便说一句,就算两个借款都逾期了,这样计算的结果也只是10%。
应还未还/初始放款=4%,就算两个借款都逾期了,这个口径的结果也只是8%。
几乎我在行业中看到的所有小于1%的逾期率,都是按照后两种口径计算的。所以当你发现自己的资产逾期率是10%而其他人说只有0.5%的时候,千万别被吓住。
分子分母都讨论完了,是不是我们的讨论就结束了?那只说明你从来没自己算过违约率,好坑还多的是,我们继续往后看。
4. 样本定义
假设我们已经决定好了逾期的定义,也选好了分子和分母,现在还需要决定用什么数据来计算。两种常见的选择是动态池(managed pool)和静态池(vintage)——这方面的一些更多内容可以参考《中国资产证券化操作手册》里面关于美国abs投资那一章(那一章是我写的,不过书的销售情况跟我收入没任何关系;其他人写的章节都很不错,值得一读)。
简单来说,动态池一个最大的问题是,如果有大量的新资产,会扩大分母,从而低估逾期率。
5. 核销的影响
在传统金融机构中,在上报坏账比例时,会去处那些已经核销掉的借款。这种做法是完全合理的:核销的借款已经反映在利润表里了,那已经是过去的事儿了,在考虑存量债权的时候不需要再考虑了。
但是我们拿消费信贷的坏账数据往往是为了做预测使用,预测未来做类似的业务时会发生多少坏账。这时候就需要把那些已经核销掉的借款全部加回去。因为既然这些坏账过去发生过(虽然现在核销掉了),但是未来做类似业务时,很可能也会出现类似的坏账。
6. 代偿的影响
目前很多消费信贷业务都由于合规等原因加入了一个提供担保代偿责任的参与方,在底层借款人停止还款时,由这个担保方做代偿(或其他名义的还款)。所以在出借人看来的数据中,可能还款其实并不是来自于借款人,一些极端的情况下,代偿以后的数据中,违约率几乎接近0。这时候就需要分析师根据业务特点来具体判断了:他到底希望知道底层借款人的违约率,还是希望分析代偿以后的违约率,甚至在有多个代偿方的情况下,哪些类型的代偿应该被包含在还款数据中,哪些应该被"穿透"。这显然会需要更多的经验和主观判断。
7. 适用性
一方面,不同定义下算出来的风险指标使得两个资产包的表现难以比较;但是另外一方面,不同的资产类别,可能本身又需要使用不同的指标。比如,对期限很短的借款讨论迁徙率可能意义并不大;前N期不需要还款的借款(例如助学贷款),在这个阶段逾期率不说明问题(永远是0);对循环使用的信贷(比如信用卡),按照每笔借款的放款时间计算vintage,可能不如按照账户建立的时间计算vintage;等等。
这些问题使得做分析时需要在标准化与适应性之间做取舍,而这使得分析工作从精确的"科学"变成了带有个人风格的"手艺"。
挑战背后
上面总结的这些也许算比较常见的问题,但是显然还有更多难以归纳的,更具有迷惑性的花样。而其中很多问题,即使通过自己计算违约率,也是无法绕过的——比如核销、代偿和适应性。有时我在与这些数据的斗争中也会感到挠头,也有好多无论如何都猜不透"神奇"数据,也会有很多挫败感。
但也正是在目前这样的市场条件下,才有更多寻宝的机会,当用纷繁的数据挑出尚未被人发现的好资产,或者险之又险的躲过一个看上去很美的烂坑,这样的时候就觉得这些额外的功课是值得的。而我也乐观的相信当有更多人愿意来深究这些事的时候,也就会推动整个市场的有效性和透明度。
开通金融 | 未央网
原文阅读请点击https://www.weiyangx.com/215848.html
喜欢这篇文章?请猛戳下方【+订阅】
∞未央网由清华大学五道口金融学院互联网金融实验室创办
∞订阅微信号:iefinance 致力于互联网金融知识研究与分享