個人網(wǎng)絡(luò)信貸平臺在為投融資者提供便捷的渠道與服務,為個人投資者將閑置資金通過互聯(lián)網(wǎng)平臺借給資金短缺者提供了新的途徑。但是,近年來由于信貸平臺不規(guī)范、個人信用體系不健全等原因,網(wǎng)貸平臺市場出現(xiàn)了巨大的違約風險。本文采取定性與定量相結(jié)合的方法,從借款人信用信息入手,通過信息價值和共線性診斷篩選出適當?shù)闹笜俗兞?,將原始?shù)據(jù)以WOE替代代入Logistic回歸模型,根據(jù)回歸結(jié)果評判其信用風險的大小。通過構(gòu)建模型對個人網(wǎng)絡(luò)信貸平臺的借款者信用信息風險進行量化評估,為網(wǎng)絡(luò)信貸平臺的參與者提供有效的信用風險評估方法。
在眾多的評級模型中,邏輯回歸使用率占絕對優(yōu)勢。然而,該模型在實際運用中存在著諸多缺陷,由于真實數(shù)據(jù)的采集質(zhì)量比較差導致模型偏差較大,需要新的方法來解決。信息論中相對熵的運用,使得違約樣本分布與正常樣本分布之間的距離的刻畫更為精確,恰好解決邏輯回歸運用中的問題,即將證據(jù)權(quán)重(weight of evidence,簡稱WOE)和邏輯回歸結(jié)合起來。
WOE反映的是債務人正常還款概率與債務人違約概率自然對數(shù)之比,WOE的增加意味著違約風險的降低。
根據(jù)國內(nèi)著名個人網(wǎng)絡(luò)信貸平臺紅嶺創(chuàng)投網(wǎng)站公布的2012年—2016年的借款信息,其中違約借款信息選擇2012—2016年公布的信貸黑名單。將收集的樣本經(jīng)過重復剔除和完整性篩選后,保留1382筆貸款數(shù)據(jù)作為進入模型回歸擬合的總樣本,其中1152筆貸款數(shù)據(jù)為訓練樣本,348筆貸款數(shù)據(jù)作為測試樣本。
(1)首先計算IV值與WOE值,并對指標進行分組
本文抓取了借貸信息包括借款金額、年利率、借款期限、借款類型、還款方式、投標筆數(shù)、會員等級、借入信用、借出信用、還款狀態(tài)以及各項資料的審核認證等19個變量。由于指標較多,以借款金額為例。采集1152條數(shù)據(jù),其中好客戶960個,壞客戶192個。Good表示好客戶個數(shù),Bad表示壞客戶個數(shù),P1=Gi/G表示第i區(qū)間好客戶與總體好客戶的比重,P0=Bi/B表示第i區(qū)間壞客戶與總體壞客戶的比重。具體分組如下:
表1 借款金額4組
通過對比發(fā)現(xiàn),將借款金額分為4組時,IV值最大,因此借款金額的合理分組為4組。
(2)通過IV值與共線性診斷剔除指標變量
IV值即為信息價值,借鑒FICO等機構(gòu)的使用經(jīng)驗,取舍閥值設(shè)為0.03,當IV值大于0.03且小于0.18時,該指標變量區(qū)分度有限,可排除該指標;當IV值大于0.18時,則認為指標變量是有區(qū)分度的。經(jīng)過數(shù)據(jù)處理以及可操作性計算,共有以下9種指標變量被選出來,其總IV值如下表2所示。
表2 初選指標變量及總IV值
將經(jīng)過IV值剔除的指標變量進行共線性診斷。經(jīng)過多重共線性回歸分析結(jié)果可知,這些指標之間存在多重共線性。經(jīng)過逐步回歸法分析,年利率、借款金額、逾期未還筆數(shù)、準時還款筆數(shù)、借款筆數(shù)以及是否有收入證明6個變量通過檢測。
(3)模型系數(shù)的綜合檢驗
將各組的WOE值代替原值代入Logistic模型中,反復比較各模型之間的運行結(jié)果,最終利用向前——LR的方法確定最終的模型版本,其結(jié)果顯示,參數(shù)整體是顯著不為0的,p值都低于0.05的顯著性水平,參數(shù)估計效果較好;而經(jīng)修正的R方等于0.875,數(shù)據(jù)較高,可以接受該模型擬合性;以0.05作為置信水平,6個指標變量都通過了wald假設(shè)檢驗,被保留在模型之中。即該模型同時通過了參數(shù)整體檢驗、擬合優(yōu)度的檢驗和wald假設(shè)檢驗。通過數(shù)據(jù)處理和模型檢驗得到的回歸結(jié)果,6個變量對能否成功借款均有顯著的影響。得到的樣本模型為:
從上述模型中可以看出,借款準時還款筆數(shù)對借款人的信用風險影響最大,借款金額、年利率、投標筆數(shù)、逾期未還筆數(shù)以及是否有收入證明對借款人的信用風險影響較大。
(4)對訓練樣本進行檢驗
本文確定最優(yōu)分割點的方法是通過ROC曲線偏離度最大的一點來確定的,即在此概率下,所抓取的好客戶的比例與壞客戶比例的差值達到最大,此時是最優(yōu)的切割點。
訓練樣本ROC曲線下方的面積為0.948,擬合效果非常好,其顯著性較為明顯,通過檢驗,能夠顯著區(qū)分好壞客戶。
擬合過程太多,中間過程的靈敏度與特異度使用省略號省略,根據(jù)靈敏度與特異度的乘積最大的原則,計算得出0.872*(1-0.052)=0.82557,其對應的概率值為0.802433,即為最佳分割點。因此,當返回概率大于0.802433時,客戶將被模型預測為好客戶,當返回概率小于0.802433時,則被預測為壞客戶。
圖1 訓練樣本的ROC曲線
(5)對模型進行檢驗
由表3可知,該模型對訓練樣本的總體預測準確率達到86.45%,其中192個壞客戶中,只有8個壞客戶被誤判為好客戶,正確識別率達到95.83%;960個好客戶中,有162個好客戶被誤判為壞客戶,正確識別率為84.58%。
表3 訓練樣本回帶檢驗預測準確性
(6)模型預測準確度測試
為進一步說明模型的區(qū)分能力,選取348個測試樣本,經(jīng)過上述數(shù)據(jù)處理過程,代入模型,得到的ROC曲線下方的面積為0.972,擬合效果較好,其顯著性也通過相關(guān)檢驗.
同時,該模型對測試樣本的總體預測準確率達到94.25%,如下表4所示。
表4 測試樣本回帶檢驗預測準確性
測試樣本的判斷結(jié)果與訓練樣本的預測準確率基本一致,預測準確度高,模型穩(wěn)定,證據(jù)權(quán)重邏輯回歸模型具有推廣應用的價值。
經(jīng)檢驗模型有很好的預測效果,同時得到以下一些結(jié)論:
(1)在所有影響較大的變量中,有借款金額、年利率、投標筆數(shù)、否有收入證明以及準時還款筆數(shù)都與借款成功率成正比,且準時還款筆數(shù)對借款成功率的影響最大,僅逾期還款筆數(shù)呈負相關(guān)。
(2)由于其客觀不可獲得性而被剔除的部分變量,可能是借款成功率較有影響的因素,信貸平臺應加強信用信息的審核與完善,模型預測應進行動態(tài)更新,以提高其實用價值。
(3)對模型進行測試需要更多的樣本數(shù)據(jù)支持,對模型也需要不斷測試和調(diào)整,在正確率有所保障的前提下再代入測試樣本做回帶檢驗,以達到更好的預測效果。
基于上述結(jié)論,本文針對性的對網(wǎng)貸平臺的發(fā)展提出下列相關(guān)建議。
(1)建設(shè)平臺信息核實制度
首先是網(wǎng)貸平臺對個人信用信息的真實性核實與驗證,應建立和完善個人網(wǎng)貸平臺的個人信息登記與管理制度。其次是審核借款者的信用信息,理性分析借款金額、年利率等因素,正確處理借款者的借款行為。最后是平臺應建立信用信息動態(tài)監(jiān)控機制,定期要求借款者更新相關(guān)信用信息,掌控違約風險。
(2)成立行業(yè)協(xié)會規(guī)范平臺運營
成立個人網(wǎng)絡(luò)信貸行業(yè)協(xié)會,制定相關(guān)行業(yè)準則,并將制定好的行業(yè)準則與有關(guān)金融機構(gòu)溝通,促使機構(gòu)立法保證行業(yè)監(jiān)管;個人網(wǎng)貸平臺管理機構(gòu)應該建立信息共享平臺,對外公布的數(shù)據(jù)應統(tǒng)一全面,結(jié)構(gòu)體系完整。
(3)完善政府監(jiān)管體系
完善政府監(jiān)管體系應當從以下幾個方面入手:第一,政府推動第三方機構(gòu)成立,對個人網(wǎng)貸平臺資金進行托管與監(jiān)督,對個人網(wǎng)貸平臺的賬務及借款者資料進行獨立審計,保障平臺運作流程的合法合理性。第二,完善社會征信系統(tǒng)。加快政府各部門信息化,采集完整的個人信息、住房公積金、社保等公共事業(yè)單位記錄,實現(xiàn)借款者信用信息聯(lián)網(wǎng)化,控制平臺信用風險。第三,目前個人網(wǎng)貸平臺尚未接入央行征信系統(tǒng),應促使人民銀行、銀監(jiān)會、證監(jiān)會等部門建立個人評級體系,高等級平臺可優(yōu)先接入央行征信系統(tǒng)。第四,政府應主導制定相關(guān)法律措施對違約行為進行處罰并公示,解決個人網(wǎng)貸平臺借款者違約成本低的難題,降低違約率。
(南京航空航天大學經(jīng)濟與管理學院,江蘇 南京 210016)
[1] 張婧婕. P2P網(wǎng)貸成功率影響因素實證研究 [D].陜西師范大學,2015.
[2] 李孟來. 我國個人信用評分模型的應用探討 [J]. 金融管理與研究:杭州金融研修學院學報,2009,2):52-4.
[3] 甘信軍,楊維強. 證據(jù)權(quán)重方法與信用風險控制 [J]. 山東大學學報(理學版),2014,49(12):55-9.
[4] 史小康,何曉群. 有偏logistic回歸模型及其在個人信用評級中的應用研究 [J]. 數(shù)理統(tǒng)計與管理,2015,34(6):1048-56.