【摘要】本文選用隨機(jī)森林模型研究個(gè)人信貸風(fēng)險(xiǎn),該模型較傳統(tǒng)風(fēng)險(xiǎn)評(píng)估模型具有抗噪聲能力強(qiáng)、防止過(guò)擬合、運(yùn)算快速等特點(diǎn)。本文選取Lending Club平臺(tái)2020年Q1耀Q3的5551條樣本數(shù)據(jù)構(gòu)建基礎(chǔ)數(shù)據(jù)集以訓(xùn)練模型,建立個(gè)人信用體系和評(píng)估模型。本文在預(yù)處理數(shù)據(jù)并篩選特征變量后,基于隨機(jī)森林算法建立了個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型,并對(duì)比Logistic回歸模型,得到隨機(jī)森林模型的個(gè)人信用風(fēng)險(xiǎn)評(píng)估能力明顯優(yōu)于Logistic回歸模型的結(jié)果,進(jìn)一步證實(shí)隨機(jī)森林模型高度適用于個(gè)人信用風(fēng)險(xiǎn)評(píng)估并具備較強(qiáng)有效性。
【關(guān)鍵詞】個(gè)人信貸風(fēng)險(xiǎn);風(fēng)險(xiǎn)評(píng)估;機(jī)器學(xué)習(xí);隨機(jī)森林
一、研究背景和意義
二十世紀(jì)后,個(gè)人信貸逐漸融入生活并蓬勃發(fā)展,成為我國(guó)經(jīng)濟(jì)體系內(nèi)不可或缺的組成部分,它因巨大潛在市場(chǎng)價(jià)值和吸引力在當(dāng)今金融市場(chǎng)極受關(guān)注,在此基礎(chǔ)上,推動(dòng)個(gè)人信貸業(yè)務(wù)增長(zhǎng)優(yōu)化被視為金融機(jī)構(gòu)長(zhǎng)期發(fā)展的戰(zhàn)略環(huán)節(jié)。隨經(jīng)濟(jì)發(fā)展與金融市場(chǎng)深化,個(gè)人借貸需求持續(xù)上升,個(gè)人信貸業(yè)務(wù)規(guī)模穩(wěn)步擴(kuò)大,但貸款拖欠及壞賬現(xiàn)象也屢見(jiàn)不鮮,金融機(jī)構(gòu)面臨越來(lái)越高的貸款風(fēng)險(xiǎn),個(gè)人信貸管理亟需高效化,需對(duì)金融機(jī)構(gòu)進(jìn)行業(yè)務(wù)優(yōu)化升級(jí),提升信貸業(yè)務(wù)穩(wěn)健性,建立準(zhǔn)確的個(gè)人信貸風(fēng)險(xiǎn)評(píng)估模型。
隨著國(guó)內(nèi)金融機(jī)構(gòu)日益完善,一些機(jī)構(gòu)已初步搭建較成熟的操作系統(tǒng)和信息管理平臺(tái),儲(chǔ)存與處理的的數(shù)據(jù)量爆發(fā)式增長(zhǎng)。為順應(yīng)大數(shù)據(jù)時(shí)代需求,機(jī)器學(xué)習(xí)技術(shù)高速發(fā)展,幫助我們探究各類型數(shù)據(jù)和個(gè)人信貸風(fēng)險(xiǎn)間的聯(lián)系。個(gè)人信貸風(fēng)險(xiǎn)評(píng)估涉及分類和預(yù)測(cè),需將借款人據(jù)其特征劃分到合適類別,預(yù)測(cè)個(gè)體未來(lái)信用表現(xiàn),并深入研究對(duì)違約風(fēng)險(xiǎn)影響較大的因素,構(gòu)建更有效的風(fēng)險(xiǎn)量化指標(biāo)。而隨機(jī)森林作為成熟的機(jī)器學(xué)習(xí)算法,在解決分類和預(yù)測(cè)任務(wù)方面表現(xiàn)出色,可挖掘大量數(shù)據(jù),適于建立個(gè)人信用評(píng)估模型。
然而,國(guó)內(nèi)網(wǎng)貸平臺(tái)信息披露不充分,而國(guó)外平臺(tái)交易數(shù)據(jù)更易獲取,所以本文計(jì)劃采用美國(guó)在線借貸平臺(tái)Lending Club開(kāi)放的借貸數(shù)據(jù)集,通過(guò)隨機(jī)森林算法建立信用風(fēng)險(xiǎn)評(píng)估模型。模型目的是精準(zhǔn)識(shí)別潛在高風(fēng)險(xiǎn)違約客戶,提取關(guān)鍵數(shù)據(jù),量化借款人信用狀況,以有效降低風(fēng)險(xiǎn)、盡可能規(guī)避損失,在此前提下追求更大投資回報(bào)。
二、國(guó)內(nèi)外研究現(xiàn)狀
現(xiàn)階段,國(guó)內(nèi)外信用風(fēng)險(xiǎn)評(píng)估研究都已經(jīng)歷一段時(shí)間發(fā)展,眾多學(xué)者應(yīng)用各種機(jī)器學(xué)習(xí)方法于該領(lǐng)域,大大提升信用風(fēng)險(xiǎn)評(píng)估效率。
Martin采用Logistic回歸模型構(gòu)建用于銀行風(fēng)險(xiǎn)評(píng)估與預(yù)警的系統(tǒng)。Crook J.等應(yīng)用SVM技術(shù),結(jié)合大規(guī)模信用卡數(shù)據(jù)評(píng)估客戶信用。Stjepan等結(jié)合遺傳算法和神經(jīng)網(wǎng)絡(luò)技術(shù),基于克羅地亞信用數(shù)據(jù)分析風(fēng)險(xiǎn)。Tong等開(kāi)發(fā)了利用Spark分布式計(jì)算框架構(gòu)建的優(yōu)化版C4.5決策樹(shù)混合模型,應(yīng)用價(jià)值顯著。隨機(jī)森林模型理論提出以來(lái)已成為機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)最經(jīng)典的算法之一,被廣泛應(yīng)用于各領(lǐng)域。Aksakalli、Malekipirbazari協(xié)助借貸平臺(tái)建立用于借方客戶信用打分的隨機(jī)森林模型,證實(shí)它在高信用借款人辨識(shí)上表現(xiàn)出色。
我國(guó)在該領(lǐng)域起步較晚,但新世紀(jì)以來(lái)國(guó)內(nèi)學(xué)者在基于機(jī)器學(xué)習(xí)方法對(duì)信用風(fēng)險(xiǎn)的研究上也取得了一定進(jìn)展。王春峰等以判別分析為基礎(chǔ)融合統(tǒng)計(jì)學(xué)與神經(jīng)網(wǎng)絡(luò)綜合預(yù)測(cè)風(fēng)險(xiǎn)并展開(kāi)實(shí)證分析。馬威采用決策樹(shù)CHAID和C5.0算法構(gòu)建模型分析小額貸款公司信用風(fēng)險(xiǎn),認(rèn)為CHAID算法更適合預(yù)測(cè)個(gè)人客戶,C5.0算法更適合公司客戶。閆靜用SMOTE算法解決數(shù)據(jù)集不平衡問(wèn)題,并用卷積神經(jīng)網(wǎng)絡(luò)模型評(píng)估信用風(fēng)險(xiǎn),證明其準(zhǔn)確性高于Logistic回歸模型。何姿嬌等用C5.0決策樹(shù)和XGBoost模型分別分析UCI德國(guó)信用數(shù)據(jù)集和金融詐騙數(shù)據(jù),構(gòu)建個(gè)人信用評(píng)估模型和風(fēng)險(xiǎn)控制模型。
隨機(jī)森林隨技術(shù)發(fā)展逐漸也被應(yīng)用到我國(guó)信用風(fēng)險(xiǎn)研究中。徐婷婷運(yùn)用加權(quán)隨機(jī)森林算法構(gòu)建P2P網(wǎng)絡(luò)借貸平臺(tái)借款公司風(fēng)險(xiǎn)模型,成效顯著。梁佩用隨機(jī)森林方法分析銀行信貸數(shù)據(jù),得到模型預(yù)測(cè)精度高、泛化能力強(qiáng)。何靜建立了基于SMOTE均衡化改進(jìn)數(shù)據(jù)集的隨機(jī)森林模型,并對(duì)比得出其分類性能優(yōu)于Logistic回歸模型和SVM模型。
綜上,國(guó)內(nèi)外對(duì)個(gè)人信貸風(fēng)險(xiǎn)評(píng)估均已進(jìn)行大量研究,評(píng)估方法多樣且仍不斷發(fā)展。作為一種優(yōu)秀的機(jī)器學(xué)習(xí)方法,隨機(jī)森林算法已被廣泛應(yīng)用且成效顯著。然而個(gè)人信用評(píng)估領(lǐng)域使用隨機(jī)森林算法的學(xué)者仍較少,因此本文借鑒相關(guān)文獻(xiàn)及研究成果,基于Lending Club平臺(tái)公開(kāi)數(shù)據(jù),采用隨機(jī)森林算法評(píng)估個(gè)人信貸風(fēng)險(xiǎn),旨在建立全面的個(gè)人信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系并建立模型。
三、基本理論概述
1.個(gè)人信用風(fēng)險(xiǎn)概述
個(gè)人信用是構(gòu)成社會(huì)信用體系的核心要素。市場(chǎng)參與者本質(zhì)是個(gè)體的集合,所有市場(chǎng)交易和經(jīng)濟(jì)活動(dòng)都與個(gè)人信用狀況聯(lián)系密切。若個(gè)人行為缺乏必要約束導(dǎo)致失信,不僅影響個(gè)人聲譽(yù),還可能觸發(fā)集體信用危機(jī)。
信用風(fēng)險(xiǎn)成因多種多樣,最常見(jiàn)的是交易對(duì)手履約能力或履約意愿存在問(wèn)題。度量個(gè)人信用風(fēng)險(xiǎn)時(shí)往往依據(jù)這兩種成因。其中,對(duì)前者的度量一般有充足數(shù)據(jù)支撐,而履約意愿的評(píng)估更為困難,通常只能依賴違約次數(shù)等過(guò)往交易記錄。量化相關(guān)數(shù)據(jù)并從經(jīng)驗(yàn)概率角度評(píng)估,是信用風(fēng)險(xiǎn)評(píng)估的重難點(diǎn)。因此,除基礎(chǔ)信息外,借款人歷史違約記錄等也與個(gè)人信貸風(fēng)險(xiǎn)評(píng)估密切相關(guān)。同時(shí),貸款用途和真實(shí)性、市場(chǎng)狀況、政策變化等也應(yīng)納入分析考量。
2.隨機(jī)森林基本理論
隨機(jī)森林模型由Leo Breiman(2001)提出,屬于集成學(xué)習(xí),由多個(gè)獨(dú)立并行的決策樹(shù)模型組合而成。這些決策樹(shù)為隨機(jī)森林基分類器,它利用Bagging生成一系列相異的訓(xùn)練數(shù)據(jù)集,本質(zhì)是對(duì)標(biāo)準(zhǔn)決策樹(shù)的優(yōu)化,通過(guò)集成眾多決策樹(shù)增強(qiáng)整體預(yù)測(cè)力。
隨機(jī)森林模型中每棵決策樹(shù)的構(gòu)建都遵循最小基尼指數(shù)標(biāo)準(zhǔn),通過(guò)遞歸的從根節(jié)點(diǎn)向下分裂的方法實(shí)現(xiàn)。具體流程包括:(1)通過(guò)Bootstrap重抽樣,從原始訓(xùn)練集中有放回地隨機(jī)抽取n個(gè)樣本,同一樣本可多次選中;(2)隨機(jī)選取k個(gè)特征變量,基于這些特征對(duì)①中樣本構(gòu)建單棵決策樹(shù)模型;(3)M次迭代上述兩步驟,構(gòu)建M棵獨(dú)立決策樹(shù)并集合建立完整的隨機(jī)森林模型;(4)每棵樹(shù)給出樣本分類結(jié)果,最終分類基于所有預(yù)測(cè)結(jié)果投票得出。這種評(píng)估方式綜合多個(gè)決策樹(shù)決策結(jié)果,大大增強(qiáng)模型穩(wěn)定性和準(zhǔn)確性。
其中[p(j | t)]為在節(jié)點(diǎn)t上時(shí)類別j的概率。若節(jié)點(diǎn)t上的樣本均屬同一類別,概率[p(j | t)]取值為1,基尼指數(shù)為最小值0;若節(jié)點(diǎn)t上樣本類別均勻分布,概率[p(j | t)]降至最小,此時(shí)基尼指數(shù)最大。
個(gè)人信用風(fēng)險(xiǎn)評(píng)估實(shí)質(zhì)是一項(xiàng)二分類任務(wù),它將客戶依償還貸款可能性分為履約者和違約者。評(píng)估時(shí)需分析的特征變量同時(shí)包括連續(xù)型和離散型,所用數(shù)據(jù)集往往規(guī)模龐大,包含大量噪聲。隨機(jī)森林作為一種先進(jìn)的二分類技術(shù)展現(xiàn)出強(qiáng)大的數(shù)據(jù)處理能力,能有效適應(yīng)不同數(shù)據(jù)特性處理復(fù)雜數(shù)據(jù)集,并具有出色的抗噪聲性能,在處理大規(guī)模數(shù)據(jù)集時(shí)特別有效,分類精度高,且具備高自動(dòng)化水平和快速計(jì)算能力,在理論和實(shí)際中都顯示出對(duì)個(gè)人信貸風(fēng)險(xiǎn)評(píng)估的高適用性,能幫助金融機(jī)構(gòu)做出更適宜的信貸決策。
四、數(shù)據(jù)準(zhǔn)備與個(gè)人信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系構(gòu)建
本文數(shù)據(jù)來(lái)自Lending Club官網(wǎng)公開(kāi)的經(jīng)過(guò)脫敏的數(shù)據(jù),數(shù)據(jù)集包括2020年Q1~Q3的貸款數(shù)據(jù)(因2020年底Lending Club關(guān)閉其個(gè)人對(duì)個(gè)人信貸平臺(tái),無(wú)后續(xù)更新的數(shù)據(jù)),已完成數(shù)據(jù)共5551條,進(jìn)行中的貸款記錄不予考慮。
首先通過(guò)數(shù)據(jù)清洗將冗余變量、低信息量變量及高比例數(shù)據(jù)缺失變量清除,并經(jīng)數(shù)據(jù)轉(zhuǎn)換將用文本分類的特征變量的類別屬性轉(zhuǎn)化為數(shù)值。據(jù)此對(duì)個(gè)人信用風(fēng)險(xiǎn)評(píng)估的特征變量初步篩選得出24個(gè)變量,其中變量loan_status表示當(dāng)前貸款狀況,為本文目標(biāo)變量。
經(jīng)初步選取后涉及變量仍較多,若所有變量納入分析,可能引入大量無(wú)關(guān)噪聲,造成誤差。本文采用Spearman相關(guān)性檢驗(yàn)初步評(píng)估解釋變量與目標(biāo)變量間的相關(guān)性,選擇與目標(biāo)變量顯著相關(guān)的變量進(jìn)行后續(xù)分析。根據(jù)結(jié)果剔除不相關(guān)變量后仍剩余19個(gè)特征變量。但直接將這19個(gè)變量用于模型構(gòu)建仍會(huì)導(dǎo)致過(guò)擬合,因此需進(jìn)一步篩選特征。
參照皮爾遜相關(guān)性熱力圖,除去相關(guān)系數(shù)絕對(duì)值高、相關(guān)性極強(qiáng)的部分特征,修正解釋變量間的高相關(guān)性。最終選出變量如下表:
五、實(shí)證分析
本文基于Lending Club平臺(tái)2020年Q1~Q3借款人數(shù)據(jù)中已完成貸款記錄5551條,其中違約記錄1323條,履約記錄4228條,均用于訓(xùn)練樣本。用上述篩選出的特征變量訓(xùn)練模型,通過(guò)IBM SPSS Modeler 18.0可視化建模,實(shí)現(xiàn)隨機(jī)森林算法預(yù)測(cè)。
1.隨機(jī)森林模型實(shí)證分析
在IBM SPSS Modeler中,隨機(jī)森林構(gòu)建每棵決策樹(shù)使用的算法是C&RT。在SPSS Modeler創(chuàng)建數(shù)據(jù)流文件,導(dǎo)入預(yù)處理后的信貸數(shù)據(jù)集,基于此建立隨機(jī)森林模型以對(duì)目標(biāo)變量貸款狀況分類,并輸出建模結(jié)果與分析。
生成結(jié)果后可得到各解釋變量的重要性排序,其中“delinq_2yrs”“home_ownership_rent”“term”重要性程度最低,與生活常識(shí)基本相符。刪去這三個(gè)特征變量,最終選擇“l(fā)oan_amnt”“int_rate”“purpose_debt”“emp_length”“annual_inc”“verification_status”“dti”“total_acc”“revol_util”“revol_bal”這10個(gè)解釋變量,通過(guò)SPSSModeler建立隨機(jī)森林模型,得出模型訓(xùn)練結(jié)果。
2.Logistic回歸模型實(shí)證分析
在SPSS Modeler中創(chuàng)建數(shù)據(jù)流文件,導(dǎo)入信貸數(shù)據(jù),選用表1中的13個(gè)解釋變量,基于數(shù)據(jù)集建立Logistic回歸模型,對(duì)客戶貸款狀況采用向前步進(jìn)法進(jìn)行二元分類,輸出得到分類預(yù)測(cè)結(jié)果與分析。
3.實(shí)證結(jié)果
根據(jù)隨機(jī)森林模型預(yù)測(cè)結(jié)果,其總體準(zhǔn)確率達(dá)80.89%,其中違約樣本分類準(zhǔn)確率約80.65%,未違約樣本分類準(zhǔn)確率約80.96%,均達(dá)較高水平。其召回率約57.00%,F(xiàn)-mean值約0.67,G-mean值約0.68,AUC值約0.89,可見(jiàn)該模型分類性能較強(qiáng),穩(wěn)健性也較高。
在使用Logistic回歸模型時(shí),個(gè)案中一旦存在缺失值,將輸出為“$null$”,無(wú)法得出預(yù)測(cè)結(jié)果。其總體準(zhǔn)確率為71.27%,對(duì)未違約樣本分類準(zhǔn)確率高達(dá)98.43%,對(duì)違約樣本分類準(zhǔn)確率卻僅有約6.00%。其召回率約53.38%,F(xiàn)-mean值約0.11,G-mean值約0.18,AUC值約0.67,均低于隨機(jī)森林模型,據(jù)此認(rèn)為該模型分類性能較弱。
對(duì)比顯示,隨機(jī)森林模型整體分類效果更佳,且它在預(yù)測(cè)正負(fù)類樣本時(shí)無(wú)明顯偏差,分類精度相近。雖然Logistic回歸模型總的以及正類樣本的預(yù)測(cè)準(zhǔn)確率較高,但負(fù)類樣本準(zhǔn)確率低至6%,這種結(jié)果是數(shù)據(jù)不平衡導(dǎo)致的預(yù)測(cè)誤差,可見(jiàn)Logistic回歸模型受不平衡數(shù)據(jù)影響大。對(duì)信貸機(jī)構(gòu)來(lái)說(shuō),對(duì)違約借款人的預(yù)測(cè)不夠準(zhǔn)確將導(dǎo)致難以通過(guò)收取利息盈利甚至難以收回本金,會(huì)增加壞賬率和相關(guān)成本,使信貸機(jī)構(gòu)承擔(dān)巨大損失。因此,無(wú)論從準(zhǔn)確率還是對(duì)抗不平衡數(shù)據(jù)與缺失值的能力上來(lái)看,隨機(jī)森林模型預(yù)測(cè)個(gè)人信貸風(fēng)險(xiǎn)的表現(xiàn)都更勝一籌。
六、政策建議
1.建立科學(xué)全面的個(gè)人信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系
當(dāng)前,我國(guó)尚未建立統(tǒng)一標(biāo)準(zhǔn)的個(gè)人信貸評(píng)估指標(biāo)體系。各金融機(jī)構(gòu)依各自需求和數(shù)據(jù)庫(kù)信息,用機(jī)構(gòu)內(nèi)部標(biāo)準(zhǔn)評(píng)價(jià)借款者信用風(fēng)險(xiǎn)狀態(tài)。構(gòu)建完善、規(guī)范的個(gè)人信貸風(fēng)險(xiǎn)評(píng)估指標(biāo)體系尤為緊迫。構(gòu)建統(tǒng)一指標(biāo)體系時(shí),應(yīng)確保涵蓋的領(lǐng)域廣泛且科學(xué),便于公共數(shù)據(jù)庫(kù)信息存儲(chǔ)和使用,包括財(cái)務(wù)狀況、歷史記錄、流動(dòng)性狀況等。同時(shí),可通過(guò)隨機(jī)森林算法建立模型,篩選顯著影響分類結(jié)果的關(guān)鍵指標(biāo)整合納入模型。
2.搭建完整的個(gè)人信用風(fēng)險(xiǎn)管理數(shù)據(jù)庫(kù)
我國(guó)個(gè)人信貸市場(chǎng)信息存在高度不對(duì)稱,妨礙了我國(guó)個(gè)人信用風(fēng)險(xiǎn)研究進(jìn)展,帶來(lái)重大挑戰(zhàn)。創(chuàng)建標(biāo)準(zhǔn)化、集中化的個(gè)人信用信息數(shù)據(jù)系統(tǒng)將是解決該問(wèn)題的有效方案。系統(tǒng)可收集、整理和儲(chǔ)存?zhèn)€人信用信息,向大眾開(kāi)放,協(xié)助大眾掌握個(gè)人信用情況。我國(guó)商業(yè)銀行雖然會(huì)搜集部分客戶個(gè)人數(shù)據(jù),但往往不愿公開(kāi)共享以維護(hù)數(shù)據(jù)價(jià)值與自身利益。因此,建立國(guó)家級(jí)銀行間信用數(shù)據(jù)庫(kù)以實(shí)現(xiàn)信息共享能有效削弱信息不對(duì)稱。各信用機(jī)構(gòu)也需建立個(gè)人信用數(shù)據(jù)庫(kù),并確保其能接入互聯(lián)網(wǎng),以方便用戶查詢信息。另外,還應(yīng)制定相應(yīng)制度并完善相關(guān)條例,要求相關(guān)機(jī)構(gòu)部門(mén)定期供給數(shù)據(jù),以構(gòu)建健全的個(gè)人信用風(fēng)險(xiǎn)管理數(shù)據(jù)庫(kù),逐步消除信息不對(duì)稱。
3.建立健全信用風(fēng)險(xiǎn)管理體系
信息技術(shù)在信用領(lǐng)域中應(yīng)用愈加廣泛,為保信用風(fēng)險(xiǎn)管理體系健康運(yùn)行,行業(yè)規(guī)則的制定至關(guān)重要。在個(gè)人信貸行業(yè)中,信息共享有著迫切需求。其實(shí)現(xiàn)能大幅減少借款人審核成本,各機(jī)構(gòu)應(yīng)定期報(bào)告,促進(jìn)機(jī)構(gòu)間信息互通。機(jī)構(gòu)內(nèi)部需制定相應(yīng)規(guī)范、加強(qiáng)規(guī)章制度建設(shè)、加大行業(yè)自律監(jiān)管力度,以處理潛在風(fēng)險(xiǎn),促進(jìn)個(gè)人信貸業(yè)務(wù)健康發(fā)展,共同構(gòu)建個(gè)人信貸安全環(huán)境。
政府對(duì)行業(yè)的外部監(jiān)管是管理架構(gòu)的基石。目前我國(guó)針對(duì)個(gè)人借貸的法律法規(guī)尚未成熟,全面性和監(jiān)管強(qiáng)度仍有不足,政府應(yīng)增強(qiáng)監(jiān)管力度。首要任務(wù)包括完善法律法規(guī),清晰界定監(jiān)管機(jī)構(gòu)和責(zé)任主體,并注意保持平衡,確保既能有效防范風(fēng)險(xiǎn),又不過(guò)度制約發(fā)展。另外,個(gè)人信用評(píng)估不止屬于社會(huì)經(jīng)濟(jì)活動(dòng),它觸及人權(quán)和個(gè)人隱私等敏感領(lǐng)域。因此,這一過(guò)程應(yīng)嚴(yán)格遵循法律法規(guī),需要明確的法律條文區(qū)分涉及個(gè)人隱私的與合法的數(shù)據(jù)信息,尊重個(gè)人合法權(quán)益。
4.進(jìn)一步挖掘更適用的模型
本文通過(guò)比較隨機(jī)森林、Logistic回歸兩個(gè)模型,得出隨機(jī)森林模型分類性能更優(yōu)越。在個(gè)人信用評(píng)估時(shí),選擇不同模型會(huì)使預(yù)測(cè)準(zhǔn)確度和穩(wěn)定性不同,我們?cè)u(píng)估個(gè)人信貸風(fēng)險(xiǎn)時(shí),挑選合適的模型是關(guān)鍵一環(huán)。在未來(lái)個(gè)人信用風(fēng)險(xiǎn)評(píng)估研究中,應(yīng)努力探索更多適用性較高的模型,例如采用組合模型等。相信,機(jī)器學(xué)習(xí)技術(shù)及其在個(gè)人信貸風(fēng)險(xiǎn)管理中的應(yīng)用也必將成為該領(lǐng)域深入挖掘和進(jìn)一步發(fā)展的重要未來(lái)。
········參考文獻(xiàn)·····················
[1]Martin Daniel.Early warning of bank failure:A log it regressionapproach[J].Journal of Banking &Finance,1977,1(3):249-276.
[2]Tong Z,Chen X.P2P net loan default risk based on Sparkandcomplexnetworkanalysisbasedonwireless network element data environment[J].EURASIP Journal on Wireless Communications and Networking,2019(1):1-7.
[3]王春峰,萬(wàn)海暉,張維.基于神經(jīng)網(wǎng)絡(luò)技術(shù)的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估[J].系統(tǒng)工程理論與實(shí)踐,1999(9):24-32.
(作者單位:東北大學(xué)秦皇島分校)