霍江林 劉素榮
摘 要:借款人信用風險評估缺失是造成P2P網貸問題平臺頻出的重要原因之一。本文從分析網貸平臺借款人的信用風險著手,篩選網貸平臺借款人信用風險的影響因素,建立網貸平臺借款人信用風險評估指標體系,并構建基于人工神經網絡的信用風險評估模型,進而選取部分P2P網貸平臺所披露的137組借款人信息進行實證測試,發(fā)現(xiàn)測試結果與實際情形基本一致,借款人信用風險評估指標和模型能滿足網貸平臺對借款人信用風險評估的需要。
關鍵詞:信用風險評估;網絡信貸;借款人信用;人工神經網絡
中圖分類號:F832.5 文獻標識碼:B 文章編號:1674-2265(2016)12-0043-05
一、引言
P2P網絡信貸平臺憑借方便快捷、低門檻的優(yōu)勢,自2006年在中國首次出現(xiàn)后,數(shù)量呈幾何模式快速增長。然而由于風險管控能力不足,導致問題平臺不斷出現(xiàn)。《中國P2P網貸風險指數(shù)快報》顯示,2016年3月末中國P2P網貸問題平臺1824家,占全國P2P網貸平臺5326家的34.25 %。究其原因,在于中國的網貸平臺規(guī)模普遍較小、發(fā)展時間較短,并不具備完善的風險防范與管理能力。網貸平臺所面臨的最大風險是借款人的信用風險,然而國內眾多平臺為搶占市場、快速上市,并沒有在風控方面做好充分準備。大多數(shù)網貸平臺缺乏完善的借款人信用風險評估體系,無法對借款人信用等級做出有效評估,導致平臺出現(xiàn)運營危機。2015年,中國政府開始對國內網絡信貸行業(yè)進行整改,風險控制成為網貸平臺整改的核心內容。如何準確評估借款人的信用風險,成為提升網貸平臺風險管控能力亟須解決的問題。
P2P網貸平臺信用風險問題引起了國內外學者的廣泛關注。網貸平臺信用風險揭示方面,封延會、賈曉燕(2012)認為P2P網貸是影子銀行的一種形式,暴露了中國金融風險監(jiān)管的不完備。馬運全(2012)認為,將P2P網貸平臺數(shù)據接入征信系統(tǒng)可以最大限度地減少借款人信用風險發(fā)生的可能性。Klafft(2008)分析美國網貸平臺Prosper的數(shù)據,發(fā)現(xiàn)借款人信用評級越高越容易獲得貸款,逾期還款率也越低。信用風險影響因素研究方面,Herzenstein等(2008)認為借款人的債務收入比是影響信用風險的重要因素。Iyer等(2010) 提出了評估借款人信用風險的數(shù)據包括標準的銀行數(shù)據和性別、年齡等非標準數(shù)據。Barasinska(2009)認為借款人年齡、性別、種族也是影響信用風險的重要因素。Duarte等(2012)認為外貌特征都會影響借貸行為。王會娟等(2014)基于“人人貸”的數(shù)據發(fā)現(xiàn),對借貸行為影響較大的是工作認證、收入認證、視頻認證和車產、房產認證等認證指標。溫小霓等(2014)以拍拍貸為例,發(fā)現(xiàn)借款人信用積分、性別、住宅情況也對借款結果有影響;信用風險評估方法研究方面,張墨(2015)總結了 P2P 網貸個人信用評價的方法——層次分析法、主成分分析法、因子分析法、神經網絡模型法等。張巧良(2015)應用層次分析法對網貸平臺風險進行了評價。王保乾和王婷(2016)運用基于層次分析的模糊綜合評價分析了大數(shù)據對網貸信用評估的影響。于曉虹和樓文高(2016)認為層次分析法、主成分分析法、因子分析法等方法均不太適合于P2P網貸個人信用評價與預警建模研究。Angelini等人(2008)開發(fā)了兩個神經網絡系統(tǒng)來進行信用風險評估,通過對意大利某小型企業(yè)的實證研究,表明神經網絡適用于評估借款人違約風險。朱毅峰(2008)認為神經網絡方法的優(yōu)勢在于對樣本數(shù)據的分布沒有要求,并降低了對差企業(yè)的誤判率。
綜上所述,網絡信貸的信用風險評估在國內外的研究均取得了一定的進展。但已有研究往往將關注的焦點放在對信貸平臺的風險評估,對借款人信用風險的關注度不夠,對P2P網貸平臺借款人信用風險的分析也大多采用定性分析法、層次分析法等帶有一定主觀性的方法,難以客觀、全面地反映借款人信用的真實情況?;诖?,本文從P2P網貸平臺借款人信用角度出發(fā),分析網貸平臺借款人信用同個人基本信息的關系,篩選影響借款人信用等級評估的指標因素,選擇在信用風險評估中可以解決非線性、不確定性變量關系的人工神經網絡模型,對網貸平臺的借款人信用風險評估進行實證分析。
二、網貸平臺借款人信用風險評估指標的選取
P2P網絡信貸的特點之一是網貸平臺要求借款人提供的個人信息較為簡單,一般包括身份信息、基本資產狀況、年齡、學歷等個人基礎情況。通過第三方認證平臺對借款人提供的信息進行認證,根據認證后的信息對借款人的信用等級進行評定,并將信息及評級結果公布在網站上,供貸款人參考。
根據國內目前各大網貸平臺對借款人的審核要求,一般需要借款人提供身份證、是否購車、基本資產情況、收入情況、婚姻狀況、文化程度、住房條件等資料信息,國外一些平臺對借款人審核的條件還包括種族、性別、外貌長相、體重等信息。借鑒國內外P2P網貸平臺信用評價指標的選取情況,考慮P2P網貸平臺借款人的特點及平臺業(yè)務需求,本文選取借款人年齡、住房、購車、收入、婚姻、文化程度、歷史信用記錄、性別、上傳照片(代替外貌特征)、居住區(qū)域等信息指標,作為網貸平臺借款人信用風險評估指標。由于所選指標部分是非數(shù)值變量,為了能準確地分析這些變量對借款人信用風險的影響,將性別、住房、地區(qū)等設為虛擬變量,將部分指標進行虛擬量化,量化結果如表1所示。
(一)年齡
網絡信貸借款人的年齡主要集中在20—60歲之間,年齡較小的借款人儲蓄能力較低,缺少良好的消費習慣,其違約風險較高;年齡較大的借款人收入水平較低、突發(fā)消費較多,其違約風險也相對偏高。因此年齡在34—45歲之間、擁有穩(wěn)定工作收入的借款人信用較好,違約風險低。
(二)性別
根據國外研究者的觀點,性別成為影響網絡信貸信用風險的因素之一。數(shù)據表明,女性平均違約金額高于男性,因此假設男性在網貸中的違約風險較低、信用風險小,女性則相對較大。
(三)文化程度
國內外研究均表明,學歷對網貸借款人的信用風險有重要影響。一般學歷越高,借款人的違約可能性越小,信用越好;反之則違約可能性較大,風險較大。
(四)住房條件
一般情況下,擁有固定住房,且沒有房貸的借款人擁有更強的償債能力,違約動機較?。环粗幱谫彿窟€房貸、租房期間的借款人償債壓力較大,違約可能性更高。
(五)收入情況
相對于借款人的工作情況,借款人的收入情況更能反映該借款人的償債能力。收入穩(wěn)定且收入越高,違約概率越??;反之則違約概率越高。
(六)婚姻狀況
國內外研究認為借款人的婚姻狀況也是影響網貸行為的重要因素之一。一般情況下,已婚借款人出于對家庭的考慮,責任感更強、違約率更小,其家庭成員的收入亦增加了借款人的償債能力,而未婚和離婚借款人的違約概率相較偏高。
(七)購車情況
作為借款人資產的一部分,同住房情況類似,有車且無車貸的借款人信用較高,違約風險越?。粺o車和有車且正在還車貸的借款人違約風險相對較高。
(八)歷史信用記錄
根據各網貸平臺中公布的借款人信息,可查詢各借款人的歷史借款次數(shù)和逾期次數(shù),其中一筆借款會對應多次還貸和逾期,本文所選的逾期次數(shù)直接選取逾期所對應的借款筆數(shù)。
(九)外貌特征
國外研究者將外貌也列入網貸違約的影響因素之一。本文用借款人上傳照片的正式與否代替外貌特征,上傳照片正式的借款人相對違約風險較小,未上傳照片或不是本人照片的借款人違約風險較高。
(十)居住區(qū)域
一般而言,東部沿海地區(qū)經濟較為發(fā)達,借款人償債能力較強、違約風險較小,中部次之,西部違約風險最高。
三、借款人信用風險評估神經網絡的建立
理論上已經證明,一個隱含層的人工神經網絡可以實現(xiàn)任意非線性映射,因此本文采用包括輸入層、單個隱含層和輸出層的三層人工神經網絡作為評估模型。其中,輸入層節(jié)點數(shù)為10,分別為網貸平臺借款人信用風險評估選取的10個指標:年齡、住房、購車、收入、婚姻、文化程度、歷史信用記錄、性別、上傳照片(代替外貌特征)、居住區(qū)域;隱含層節(jié)點數(shù)通過模型進行迭代計算后選取最佳值;由于目標輸出為誠信借款人(值為1)和不誠信借款人(值為2),輸出層節(jié)點數(shù)為1,為模型測試輸出值。
網絡結構確定后,使用train函數(shù)來訓練創(chuàng)建人工神經網絡。網絡中間層的神經元傳遞函數(shù)選取tansig函數(shù),輸出層的神經元傳遞函數(shù)采用purelin函數(shù),學習函數(shù)選取learngdm,訓練函數(shù)采用trainlm。
四、網絡信貸信用風險評估的實證分析
(一)數(shù)據獲取
本文從拍拍貸、人人貸、365易貸、你我貸四家不同運作模式P2P網貸平臺2015年披露的數(shù)據中,選取78個誠信借款人信息和59個不誠信借款人信息,共計137組信息作為本次網絡信貸信用風險評估的樣本。各平臺所公布借款人交易信息的時間由近至遠依次取得,其中在拍拍貸中取得32個誠信和20個不誠信借款人信息,在365易貸取得15個誠信和23個不誠信借款人信息,在人人貸取得13個誠信和6個不誠信借款人信息,在你我貸取得17個誠信和13個不誠信借款人信息。由于借款人的違約概率(歷史違約金額同借款總額之比)數(shù)值太小,且不同借款人之間違約概率差距過于巨大,不便于模型輸出結果的比較,因此將137個借款人違約概率重新定義,將不同違約概率劃分為從0到1六個不同的信用等級。0表示信用情況最差,信用評級最低;反之信用評級越大。具體劃分結果如表2所示。
由表2可知,違約概率越大,則相應信用評級越低、所對應數(shù)字越??;違約概率越小,則相應信用評級越高、所對應數(shù)字越大。
(二)訓練過程及結果
在模型的訓練過程中,從137組數(shù)據中選取122組數(shù)據作為訓練數(shù)據,并進行擬合,其中含有68個誠信借款人和54個不誠信借款人信息;隨機選取15組數(shù)據作為驗證數(shù)據,其中誠信借款人樣本為10個,不誠信借款人樣本為5個。訓練過程如下:
1. 確定網絡結構。將年齡、性別、文化程度、住房條件、收入情況、婚姻狀況、購車情況、歷史信用記錄、上傳照片、居住區(qū)域作為神經網絡的輸入變量,信用評級作為神經網絡的輸出變量。其中,訓練樣本為107個,測試樣本為15個。
網絡結構輸入層為10個神經元,輸出層為1個神經元,中間層神經元按照[n+m+a]選擇。其中[n]為輸入層神經元個數(shù),[m]為輸出層神經元的個數(shù),[a∈[1,10]]之間的整數(shù)。計算可得,中間層神經元個數(shù)可取4到13個。為確定最佳網絡結構,對中間神經元的節(jié)點數(shù)進行多次擬合,最終以擬合平方誤差為準則確定中間層神經元個數(shù)。通過擬合發(fā)現(xiàn),當中間神經元節(jié)點數(shù)為10個時,網絡經過61次迭代運算,網絡擬合誤差達到最小0.0895,網絡性能達到穩(wěn)定。
2. 訓練與檢驗。確定網絡結構之后,使用train函數(shù)來訓練創(chuàng)建人工神經網絡,將學習速率設為0.01,最大訓練次數(shù)設為1000,訓練目標設為0.03,創(chuàng)建人工神經網絡的代碼,并運用Matlab 2014軟件編程。
3. 訓練結果。利用訓練好的神經網絡模型對訓練樣本和檢驗樣本進行預測,訓練結果如圖1和圖2所示。
從圖1、圖2可以看出,神經網絡模型所訓練的樣本實際值和模型輸出值基本吻合,線性擬合系數(shù)基本一致,圖形相似度較高,擬合情況較好。其訓練樣本的擬合誤差(如圖3所示)除81號樣本訓練誤差較大外(0.6129),其他樣本基本服從正態(tài)分布,因此可將81號樣本作為特殊個體忽略,不影響樣本總體訓練結果。這證明了神經網絡模型的擬合程度高,模型預測結果可信度較高。
4. 訓練結果對比。在122組樣本數(shù)據訓練結束后,輸入15組測試數(shù)據,對測試樣本輸出結果進行驗證,如表3所示。
5. 訓練結果分析。由以上實證結果可以看出,模型根據122個借款人數(shù)據進行訓練和學習后,除去誤差最大的第81號樣本,其他121組樣本誤差均在可接受范圍內。其中有59個樣本誤差集中在0.01左右,誤差在0.02—0.05之間的樣本有46組,誤差在0.05—0.1之間的有28組,誤差大于0.1的樣本有3組。測試樣本中誤差最大為0.0956,所有測試誤差均小于0.1??傮w上,模型測試的輸出結果和實際結果基本一致。
五、結論與建議
研究發(fā)現(xiàn),借款人信用風險評估的缺失是造成問題平臺頻出的重要原因之一。本文選取的借款人年齡、住房、購車、收入、婚姻、文化程度、歷史信用記錄、性別、上傳照片(代替外貌特征)、居住區(qū)域等評估指標,能夠滿足網貸平臺對借款人信用風險評估的要求。通過對拍拍貸、人人貸、365易貸等四家網貸平臺137個借款人信用數(shù)據的訓練和學習,構建的基于人工神經網絡的網貸平臺借款人信用風險評估模型具備了對網貸平臺借款人信用風險評估的能力,且評估的準確率較高。
通過對網貸平臺借款人信用風險的評估,結合中國網絡信貸發(fā)展實際,本文提出以下建議:
第一,完善個人征信體系建設。借款人信用信息的不透明,造成國內各網貸平臺對于借款人信用風險無法準確評定。網絡信貸行業(yè)的發(fā)展需要對借款人信用進行審核。僅對借款客戶自己提供的信息進行評定,信息真實性無法準確識別,增加了借款人信用風險。因此完善個人征信體系建設,對于網絡信貸行業(yè)的健康發(fā)展、降低網絡信貸中借款人的信用風險具有重要意義。
第二,建立多樣化的風險分散機制。網貸平臺可以按照不同信用等級和借款期限,對借款人每月或每期需償還的金額和利息做出規(guī)定,分散違約風險集中發(fā)生的可能性、降低借款人發(fā)生違約或逾期的風險。如英國Zopa平臺就通過強制約束借款人每月必須償還的金額,分散了借款人違約風險發(fā)生的可能性。
第三,加強政府監(jiān)管。中國網貸平臺起步較晚,發(fā)展經驗不足,平臺的管理水平普遍較低,需要政府的支持和監(jiān)管。政府需要對網貸平臺制定詳細的監(jiān)管準則,鼓勵和引導網貸平臺構建一套完善的風險評估體系。
參考文獻:
[1]Klafft, M. 2008. Peer to Peer Lending: Auctioning Mirco Credits over the Internet[R].Proceedings of the 2008 International Conference on Information Systems,Technology and Management(ICISTM 08).
[2]Herzenstein , M. , R. L. Andrews, U. M. Dholakia, and E. Lyandres. 2008. The Democratization of Personal Consumer Loans? Determinants of Success in Online Peer-to-Peer Lending Communities[R].
[3]Iyer, R.,A. I. Khwaja, E. F, P. Luttmer, and K. Shue. 2010. Screening in New Credit Market: Can Individual Lenders Infer Borrower Credit Worthiness in Peer-to-Peer Lending[R].
[4]李鑫.金融監(jiān)管與中國P2P網貸的發(fā)展及異化[J].財經科學,2016,(5).
[5]李淵琦,陳芳.我國P2P 網貸的風險分析及監(jiān)管對策[J].上海金融,2015,(7).
[6]封延會,賈曉燕.“人人貸”的法律監(jiān)管分析——兼談中國的影子銀行問題[J].華東經濟管理,2012 ,(9).
[7]馬運全.P2P網絡借貸的發(fā)展、風險與行為矯正[J].新金融,2012,(2).