舒方媛 趙公民 武勇杰
摘要:P2P網(wǎng)貸在爆發(fā)式增長的同時,也面臨著重大的信用風險,對借款人違約風險的預測是降低信用風險的重要方法。以“人人貸”平臺上采取的數(shù)據(jù)為研究樣本,構建借款人信用評價指標體系,采用二元Logistic回歸模型建立借款人信用風險評估模型。結果表明,借款期限、借款人年齡、信用評級、逾期次數(shù)對借款人信用風險影響最為顯著,其次是學歷、成功借款次數(shù)、借款利率和房產(chǎn)。
關鍵詞:P2P網(wǎng)貸;信用風險評估;二元Logistic回歸模型
中圖分類號:F830.39? ? ? ? ?文獻標識碼:A
文章編號:0439-8114(2019)04-0103-05
Abstract: While P2P is experiencing explosive growth, it also faces significant credit risks. The prediction of borrower default risk is an important method to reduce credit risk. Taking the data taken on the platform of "Everyone's Loan" as the research sample, the credit evaluation index system of borrowers is constructed, and the dual-logistic regression model is used to establish the credit risk assessment model of borrowers. The results show that the borrowing period, the borrower's age, credit rating and overdue times have the most significant impact on the borrower's credit risk, followed by education, successful borrowings, borrowing rates, and real estate.
Key words: P2P; credit risk assessment; dual-logistic regression model
2013年是中國的互聯(lián)網(wǎng)金融元年,互聯(lián)網(wǎng)技術與金融行業(yè)的深度融合促進了互聯(lián)網(wǎng)金融的迅猛發(fā)展?;ヂ?lián)網(wǎng)金融的出現(xiàn)影響了傳統(tǒng)金融業(yè)的格局且催生了新的支付方式和融資模式,大大促進了中國經(jīng)濟的發(fā)展。其中,P2P(Peer-to-Peer Lending)網(wǎng)絡借貸是互聯(lián)網(wǎng)金融模式的主要代表之一。
P2P網(wǎng)絡借貸作為金融行業(yè)的新興產(chǎn)業(yè),將民間借貸與互聯(lián)網(wǎng)金融的特點結合起來,這種新的業(yè)務模式相較于傳統(tǒng)的金融模式,具有操作便捷、效率更高等優(yōu)點,縮短了交易距離,提高了交易效率,節(jié)省了交易時間,滿足了不同層次的金融需求,彌補了傳統(tǒng)金融業(yè)的短板,因而在中國蓬勃發(fā)展起來。根據(jù)“網(wǎng)貸之家”的數(shù)據(jù)顯示,截至2016年11月30日,中國的P2P網(wǎng)貸平臺已達5 879家,相比2015年新增744家;年成交額為2.8萬億元,相較于2015年增長137.59%。但是,行業(yè)呈現(xiàn)爆發(fā)式增長的同時也面臨諸多問題,非法集資、借款人“跑路”現(xiàn)象層出不窮。截至2016年年底,停業(yè)及問題平臺數(shù)量累計達到1 478家,網(wǎng)貸平臺普遍存在10%~20%的壞賬率,顯著高于傳統(tǒng)的金融借貸。網(wǎng)貸平臺的高風險主要來自兩個方面,一方面是政府加強了對信用監(jiān)管方面的力度,外在的壓力導致許多網(wǎng)貸平臺難以發(fā)展;另一方面,由于網(wǎng)貸屬于無抵押貸款,借款人違約成本較低,若大量客戶違約,將會導致賬款無法催收,平臺資金流停滯、無法正常提取資金,威脅平臺持續(xù)穩(wěn)定經(jīng)營。因此,個人信用風險已經(jīng)成為網(wǎng)絡借貸平臺面臨的主要風險之一。在此背景下,對平臺上借款人違約風險的影響因素進行研究顯得格外重要。
本研究采取爬蟲技術從“人人貸”平臺上選取了2014年4月至2017年10月的借款人相關數(shù)據(jù)作為研究樣本,引入二元Logistic回歸模型作為研究方法,從借款人基本情況、借款產(chǎn)品信息、歷史信用3個方面構建指標體系;為了提高模型準確性,使用WOE值對變量進行處理,將WOE值替代原值代入模型進行回歸,力求找出影響借款人違約風險的主要因素,以提高網(wǎng)貸平臺和投資人通過借款人信息來辨識其違約概率的能力,降低網(wǎng)絡借貸的信用風險。
1? 文獻綜述
網(wǎng)絡借貸的迅速發(fā)展,引起了學術界的廣泛關注,國內(nèi)外學者進行了不少關于網(wǎng)絡借貸信用風險的研究。
關于信用風險揭示的研究,Michels[1]以Prosper網(wǎng)站上的數(shù)據(jù)為基礎,研究發(fā)現(xiàn)網(wǎng)絡借貸平臺責任的確認會導致網(wǎng)絡市場運行有效性下降,進而會帶來較大的風險。Lee等[2]通過韓國最大的網(wǎng)貸平臺上出現(xiàn)的“從眾行為”發(fā)現(xiàn),該行為會導致網(wǎng)絡借貸信用風險加大,網(wǎng)絡借貸市場上的信息不對稱現(xiàn)象非常嚴重,進一步還會導致道德風險。楊宇焰等[3]通過對四川省的11家網(wǎng)貸平臺進行調研,提出網(wǎng)貸中主要風險來自于缺少相關立法和部門監(jiān)管、借款人違約、操作風險和流動性風險、平臺自身資本實力和管理風險。盧馨等[4]認為網(wǎng)貸平臺上存在的主要風險是因法律和監(jiān)管缺失而導致的政策法律風險和監(jiān)管風險,操作上的不規(guī)范和技術投入不足而導致的操作風險和網(wǎng)絡風險以及由于借款人道德缺失而引發(fā)的信用風險。
關于信用風險影響因素的研究,Lin等[5]研究發(fā)現(xiàn),若借款人P2P平臺上有好友,則容易獲得借款,且借款利率也更低,同時違約率也更低,說明關系網(wǎng)絡能在一定程度上起到識別借款質量的作用。Gonzalez等[6]從借款人的個人特征入手,研究其對網(wǎng)貸決策的影響,研究結果表明,借款人性別、年齡和外貌影響其借款成功率。Emekter等[7]通過研究信用等級對于網(wǎng)貸借貸信用風險的影響,發(fā)現(xiàn)借款人信用等級與違約風險發(fā)生率呈反比,信用等級越高違約率越低,信用等級越低則違約率越高。董梁等[8]通過分析“人人貸”上的數(shù)據(jù),建立新進借款人信用風險評估模型,認為年齡、性別、崗位職位、工作認證、借款用途和實地認證指標應該作為評價個人信用風險的主要根據(jù)。肖曼君等[9]采取排序選擇模型從多個P2P網(wǎng)站上截取數(shù)據(jù),從借款信息、歷史表現(xiàn)、信用變量以及人口特征4個方面選取影響信用風險的變量,研究發(fā)現(xiàn)這4個因素分別對網(wǎng)絡借貸信用風險存在正向影響。王會娟等[10]通過研究描述性信息對網(wǎng)貸行為的影響發(fā)現(xiàn),借款人信用等級越低,越傾向添加描述性信息;另一方面,若借款描述展示的人格數(shù)量越多,則更容易獲得借款且借款人違約率越低。
關于信用風險評估方法的研究,主要方法有Logistic回歸模型、BP神經(jīng)網(wǎng)絡、決策樹、層次分析等方法。Bekhet等[11]分別使用Logistic回歸模型和徑向基函數(shù)模型構建信用評分模型,結果表明,Logistic回歸模型比徑向基函數(shù)模型更為準確,但徑向基函數(shù)模型更能準確地識別出潛在違約者。Oreski等[12]提出了將遺傳算法和神經(jīng)網(wǎng)絡的混合算法(HGA-NN)相結合來進行信用風險評估,結果發(fā)現(xiàn),HGA-NN算法相較于遺傳算法在信用風險評估中的特征選擇和分類方面具有較大優(yōu)勢。宋麗平等[13]以平臺借款人個人信用等級作為預測輸出目標,運用BP神經(jīng)網(wǎng)絡模型研究發(fā)現(xiàn),借款人自身的客觀條件、還款能力、歷史表現(xiàn)都會對P2P網(wǎng)絡借貸個人信用風險產(chǎn)生重要影響。姚鳳閣等[14]采用“拍拍貸”平臺上的經(jīng)驗數(shù)據(jù),聯(lián)合采用Logit和Probit回歸模型研究借款人信息與信用風險之間的關系,認為信用等級、投標成功次數(shù)、投標失敗次數(shù)、借款利率對借款人的信用風險有顯著影響,而借款期限、性別、年齡則對借款人信用風險無顯著影響。
通過對現(xiàn)有文獻的梳理和總結可以發(fā)現(xiàn),由于國外網(wǎng)貸發(fā)展相比國內(nèi)較為成熟,征信體系比較完善,且數(shù)據(jù)也對外公開,關于網(wǎng)貸的研究成果較為豐富。國外學者不僅進行了如平臺監(jiān)管、平臺發(fā)展模式、平臺面臨風險等定性分析,也有如借款成功率、P2P網(wǎng)貸平臺違約風險影響因素等定量分析。國外學者的研究成果對中國網(wǎng)貸信用風險的研究有重要的參考意義。然而,國內(nèi)P2P網(wǎng)貸行業(yè)目前處于初級階段,關于網(wǎng)貸的研究起步比較晚,沒有完善的征信體系,監(jiān)管比較滯后,缺少法律約束,學者對網(wǎng)貸行業(yè)的研究以定性分析為主,主要集中在網(wǎng)貸平臺的監(jiān)管、風險控制、平臺運營模式等方面,很少從定量的角度研究網(wǎng)貸的信用風險。基于此,本研究從定量的角度出發(fā),利用“人人貸”平臺上的真實數(shù)據(jù),建立借款人信用風險評估模型,力求找出影響借款人違約風險的主要因素,以幫助網(wǎng)貸平臺和投資者更好地識別借款人的信用風險。
2? 研究方法與指標選取
2.1? 研究方法
選取經(jīng)典的二元Logistic回歸模型,研究借款人信息與其違約行為之間的關系,因變量為借款人是否違約,為典型的二分變量,定義為“違約=1,未違約=0”,且為非連續(xù)變量,因此需要使用非線性回歸。Logistic回歸模型是一種研究二分類被解釋變量與一些影響因素之間關系的一種多變量分析方法,模型中的自變量可以是定性的也可以是定量的。
2.2? 數(shù)據(jù)來源及說明
“人人貸”作為中國互聯(lián)網(wǎng)金融業(yè)的領軍企業(yè),對借款人和借款標的的審批比較嚴格,對每一組貸款有詳細的記錄,因此數(shù)據(jù)的完整性比較好。本研究采取爬蟲技術從“人人貸”平臺中的“散標投資”和“債權轉讓”隨機抽取了2014年4月至2017年10月的相關數(shù)據(jù)。抽取到的原始樣本數(shù)據(jù)含有大量與個人信用風險無關的數(shù)據(jù),如借款人編號、借款人昵稱等,若加入模型,會干擾模型的準確程度;另外,原始數(shù)據(jù)有些是字符型格式,回歸模型只能識別數(shù)值型格式,需要把數(shù)據(jù)統(tǒng)一設置為數(shù)值型格式。
借款人列表中借款人信息包括借款信息(借款用途、標的總額、借款利率、借款期限、借款性質、還款方式、標的狀態(tài)、借款人來源、對借款的描述、墊付金額);借款人個人信息(出生年月、性別、學歷、用戶名、婚姻狀況、戶籍、工作情況、公司情況、房車產(chǎn)情況);借款人信用信息(信用評級、信用分數(shù)、信用額度、逾期情況);借款擔保信息(擔保方式)。為了得到干凈且完整的數(shù)據(jù),刪除了部分借款人信息缺失和信息無效部分,共獲得有效完整的數(shù)據(jù)10 863條。需要說明的是,“人人貸”平臺中“墊付金額”表示借款人未還清貸款,平臺為其墊付,表示借款人違約,有墊付金額記錄的為違約客戶。10 863條數(shù)據(jù)中,有9 270條是未違約客戶,即“好客戶”;有1 593條是違約客戶,即“壞客戶”。
2.3? 變量選取與處理
目前網(wǎng)貸平臺對于個人信用風險評估的指標并沒有統(tǒng)一的標準和規(guī)范,指標的選取直接關系到模型預測的準確性。綜合考慮影響信用風險的各項因素,選取借鑒了傳統(tǒng)信用風險評估體系和網(wǎng)貸平臺的特征信息及其實際的業(yè)務需求,參考國內(nèi)外相關文獻所選取的指標,遵循指標能容易獲得、能夠反映借款人的還款能力和意愿,從借款人基本情況、借款產(chǎn)品信息、歷史信用3個方面,構建了定性和定量指標相結合的網(wǎng)貸平臺個人信用評價指標體系。選取13項指標作為借款人信用風險評估的具體指標,具體分組見表1。
選取的樣本數(shù)據(jù)中,既有序數(shù)型(如信用等級)變量,又有區(qū)間型(如收入)變量,且每個變量的取值區(qū)間和量綱存在較大差別,為了降低變量屬性、平滑變量變化趨勢、提高模型的評估水平,應對變量的取值進行分箱計算證據(jù)權重WOE(Weight of Evidence)值。WOE值是對原始自變量的一種編碼形式,用來衡量變量某個屬性的風險指標,WOE值越高,代表著該分組中客戶是“壞客戶”的風險越低。其計算公式如下:
3? 結果與分析
3.1? 多重共線性分析
本研究選取的變量比較多,若不考慮變量之間的線性相關性,盲目地進行回歸分析,往往達不到理想的結果,甚至會導致錯誤的結論。為了判斷變量之間是否線性相關,先用SPSS 17.0軟件進行共線性診斷,結果見表3。
由檢驗結果可知,方差膨脹因子VIF值均小于10,表明變量之間不存在高度多重共線性問題。另外,容差在0.1的標準下,若有變量容差小于0.1,則表明存在多重共線性,結果中的變量無小于0.1的值,也說明了變量之間不存在多重共線性問題。說明選取的指標直接相互獨立,可以用于回歸模型。
3.2? 實證檢驗
由回歸結果可知,在a=0.05的顯著水平下,P≤0.05的變量有借款利率、信用評級、房產(chǎn)、成功借款次數(shù)、借款期限、年齡、學歷、逾期次數(shù),說明這8項指標都顯著影響借款人的違約率,其中,借款期限、年齡、信用評級、逾期次數(shù)4項指標對借款人違約率影響最為顯著;房產(chǎn)、借款利率、成功借款次數(shù)、學歷次之。其他5項指標即工作時間、車產(chǎn)、收入、婚姻、性別則對借款人違約率影響不顯著。
1)借款人基本情況(年齡、學歷、房產(chǎn))對違約率有顯著影響。年齡與借款人違約率呈顯著正相關關系,借款人年齡越大違約率越大,這可能與年長者相對于年輕人來說工作效率降低,收入不如年輕人;學歷與借款人違約率呈顯著負相關關系,借款人學歷越高違約率越低,可能是學歷較高者工資起點高,且受到的道德約束力相對較強;有房產(chǎn)與借款人違約率呈顯著負相關關系,借款人有房產(chǎn)違約率會降低,這可能與借款人無房貸壓力,經(jīng)濟較為寬裕,還款能力更強有關。
2)借款產(chǎn)品信息(借款利率、借款期限)對違約率影響顯著。借款利率與違約率呈顯著負相關關系,借款利率越高違約率越高,較高的利息會給借款人帶來更大的壓力,使其不能如期還款;借款期限與違約率呈顯著負相關關系,借款期限越長違約率越低,可能是由于借款期限越長,每月所需還款金額越小,借款人還款壓力越小。
3)歷史信用(信用評級、成功借款次數(shù)、逾期次數(shù))對違約率影響顯著。借款人信用評級與違約率呈顯著負相關關系,借款人信用等級越高違約率越低,較高的信用評級說明借款人信用資質較好,違約概率比較小,信用評級可以作為貸款人貸款給借款人的一項重要參考指標;成功借款次數(shù)與違約率呈顯著負相關關系,在平臺上借款成功次數(shù)越多借款人違約率越低,借款人多次在平臺上借款成功說明個人信用資質較好,平臺愿意貸款,故違約可能性較低;逾期次數(shù)與違約率呈顯著負相關關系,借款人違約次數(shù)越多違約概率越大,借款人多次違約說明個人信用資質較差,貸款人對這類借款人應持有謹慎態(tài)度。
4? 結論與建議
本研究基于“人人貸”網(wǎng)貸平臺上借款人真實數(shù)據(jù),根據(jù)中國P2P網(wǎng)貸平臺特征,從借款人基本情況、借款產(chǎn)品信息、歷史信用3個方面建立了適合P2P網(wǎng)貸平臺的借款人信用風險評估體系。引入了穩(wěn)定性較高的Logistic回歸模型,得出影響借款人違約風險的主要因素是借款期限、年齡、信用評級、逾期次數(shù);其次是學歷、成功借款次數(shù)、借款利率、房產(chǎn),可以為P2P網(wǎng)貸平臺和投資人識別借款人違約風險提供一定參考。但研究選取樣本數(shù)據(jù)及驗證數(shù)據(jù)規(guī)模有限,可能會導致試驗結果有一定的偏差;P2P行業(yè)體系本身正在不斷發(fā)展,本研究的指標選取僅借鑒了前人的研究成果,存在一定的滯后性,且嚴謹性不足?;谏鲜鼋Y論,結合中國P2P網(wǎng)絡借貸發(fā)展實際,分別從P2P網(wǎng)貸平臺內(nèi)部、之間和外部層面提出以下幾點建議。
1)平臺內(nèi)部。信用評級對貸款人有重要的參考意義,平臺內(nèi)部可以建立統(tǒng)一規(guī)范的信用評分系統(tǒng),幫助投資者有效測評借款人的信用信息,更好地規(guī)避風險。平臺可以加大線下審核力度,線上信息可能存在造假因素,平臺可以從內(nèi)部將線上線下審核相結合,派專員進行線下走訪,實地調查借款人經(jīng)濟情況,力求借款人上傳資料的真實性、有效性。平臺應重視網(wǎng)絡安全的維護,聘請高水平的信息技術人才,確保平臺系統(tǒng)內(nèi)部網(wǎng)絡不受侵害,保證客戶信息資料不被泄露。平臺可以建立資金池保證投資者資金安全,足夠的資金是P2P平臺得以生存和發(fā)展的前提,當貸款人獲得一定收益時,平臺可收取部分資金填充自身資金池,當借款人出現(xiàn)違約情況,平臺能及時補給投資者,保障投資者收益。
2)平臺之間。P2P平臺可以建立信息共享平臺,實現(xiàn)平臺之間的征信信息共享,實現(xiàn)透明公開和黑名單公示機制,互通有無。可以共同研發(fā)建立高規(guī)格的平臺運營技術、防御技術,發(fā)展P2P行業(yè)的統(tǒng)一網(wǎng)絡金融服務體系或統(tǒng)一的操作平臺和數(shù)據(jù)庫,管理和推廣P2P信息技術,實現(xiàn)平臺之間信息數(shù)據(jù)的交流和信息共享。
3)平臺外部。一方面商業(yè)銀行可以加強數(shù)據(jù)庫的建設力度,作為與公眾接觸最多的社會機構,銀行所掌握的信用信息量最多。銀行可以憑借這種優(yōu)勢積累借款人的歷史信用數(shù)據(jù),加快建設信用信息數(shù)據(jù)庫,這些數(shù)據(jù)可以與P2P平臺共享,實現(xiàn)P2P網(wǎng)貸和商業(yè)銀行的交互,力求覆蓋更多層次的客戶群體,共同為中國經(jīng)濟發(fā)展作出貢獻。政府方面,應充分發(fā)揮政府的規(guī)范和引導作用,加快推動對民間借貸的立法規(guī)范,盡可能消除P2P平臺中非法集資等亂像,使P2P平臺朝著合理合法合規(guī)的方向發(fā)展。
參考文獻:
[1] MICHELS J. Do unverifiable disclosures matters?Evidence from peer-to-peer lending[J].Accounting Review,2012,87(4):36-41.
[2] LEE E,LEE B. Herding behaviorin online P2P lending:An empirical investigation[J].Electronic Commerce Research and Applications,2012,11(5):495-503.
[3] 楊宇焰,陳? 倩,田忠成.P2P網(wǎng)絡信貸平臺的主要模式、風險及政策建議[J].西南金融,2014(1):29-31.
[4] 盧? 馨,李慧敏.P2P網(wǎng)絡借貸的運行模式與風險管控[J].改革,2015(2):60-68.
[5] LIN M,NAGPURNANAND R P,VISWANATHAN S. Judging borrowers by the company they keep:Friendship Net-works and information asymmetry in online peer-to-peer lending[J].Management Science,2013,59(1):17-35.
[6] GONZALEZ L,LOUREIRO Y K. When can a photo increasecredit? The impact of lender and borrower profiles online peer-to-peer Loans[J].Journal of Behavioral & Ex-perimental Finance,2014(2):44-58.
[7] EMEKTER R,TU Y,JIRASAKULDECH B. Evaluating credit riskand loan performance in online peer-to-peer(P2P)Lending[J].Applied Economics,2015,47(1):54-70.
[8] 董? 梁,胡明雅.基于Logistic回歸模型的網(wǎng)貸平臺新進借款人信用風險研究[J].江蘇科技大學學報(社會科學版),2016,16(3):102-108.
[9] 肖曼君,歐緣媛,李? 穎.我國P2P網(wǎng)絡借貸信用風險影響因素研究——基于排序選擇模型的實證分析[J].財經(jīng)理論與實踐,2015(1):2-6.
[10] 王會娟,廖? 理.中國P2P網(wǎng)絡借貸平臺信用認證機制研究——來自“人人貸”的經(jīng)驗證據(jù)[J].中國工業(yè)經(jīng)濟,2014(4):136-147.
[11] BEKHET H A,ELETTER S F K. Credit risk assessment modelfor jordanian commercial banks:Neural scoring approach[J].Review of Development Finance,2014,4(1):20-28.
[12] ORESKI S,ORESKI G. Genetic algorithm-based heuristic for feature selection in credit risk assessment[J].Expert Systems With Applications,2014,41(4):2052-2064.
[13] 宋麗平,張利坤,徐? 瑋.P2P網(wǎng)絡借貸個人信用風險評估[J].財會月刊,2015(35):94-96.
[14] 姚鳳閣,隋? 昕.P2P網(wǎng)絡借貸平臺借款人信用風險影響因素研究——來自“拍拍貸”的經(jīng)驗依據(jù)[J].哈爾濱商業(yè)大學學報(社會科學版),2016(1):3-10.