□文/雍 華
(東北財經(jīng)大學(xué)管理科學(xué)與工程學(xué)院 遼寧·大連)
[提要] 神經(jīng)網(wǎng)絡(luò)模型一直是信用風(fēng)險評估方法中的研究熱點,本文歸納總結(jié)我國學(xué)者針對神經(jīng)網(wǎng)絡(luò)在信用風(fēng)險評估中應(yīng)用的研究文獻,為今后信用風(fēng)險評估方法的研究提供借鑒。
金融信用風(fēng)險是指交易對方?jīng)]有意愿或沒有能力履行既定合同條件造成違約,致使債權(quán)人遭受經(jīng)濟損失的可能性。信用風(fēng)險的評級是金融信貸領(lǐng)域風(fēng)險管理的基礎(chǔ),尤其是在利率市場化的大背景下,對信用風(fēng)險的精準評估是金融機構(gòu)盈利的關(guān)鍵。最早的信用風(fēng)險評級依賴評級人員的經(jīng)驗和能力對信用狀況作出判斷。后來以財務(wù)數(shù)據(jù)為基礎(chǔ),以判別分析模型為代表的統(tǒng)計方法逐漸開始流行。進入20世紀90年代以來,各種新技術(shù)不斷涌現(xiàn),大多是針對統(tǒng)計方法的不足提出的。在眾多新方法中,神經(jīng)網(wǎng)絡(luò)方法作為一種具有自組織、自適應(yīng)、自學(xué)習(xí)特點的非參數(shù)方法,對樣本數(shù)據(jù)的分布要求不嚴格,不僅具有非線性映射能力和泛化能力,而且還有較強的“魯棒性”和較高的預(yù)測精度,這些優(yōu)異的特性,使神經(jīng)網(wǎng)絡(luò)在信用風(fēng)險評級領(lǐng)域取得了長足的發(fā)展。本文從文獻分析的角度,歸納總結(jié)了神經(jīng)網(wǎng)絡(luò)在我國信用風(fēng)險評估中應(yīng)用的發(fā)展情況。
(一)驗證型。為了驗證神經(jīng)網(wǎng)絡(luò)在信用風(fēng)險評估中應(yīng)用的可行性及較傳統(tǒng)方法的優(yōu)越性,學(xué)者主要從以下兩個方面展開研究:一是直接驗證型,指通過實證研究,檢驗神經(jīng)網(wǎng)絡(luò)針對信用風(fēng)險評估中的適用性。楊保安(2001)將神經(jīng)網(wǎng)絡(luò)用于貸款企業(yè)的財務(wù)風(fēng)險評估,顯示出神經(jīng)網(wǎng)絡(luò)是進行財務(wù)評估的一種比較好的方法,能為銀行貸款授信、預(yù)警提供有效決策。二是通過將神經(jīng)網(wǎng)絡(luò)同傳統(tǒng)信用評估方法進行對比,驗證神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。王春峰(1999)將神經(jīng)網(wǎng)絡(luò)與判別分析法進行了對比,認為前者具有更高的預(yù)測精度和更強的魯棒性。楊淑娥(2005)采用BP神經(jīng)網(wǎng)絡(luò)和主成分分析方法分別對上市公司財務(wù)危機預(yù)警進行建模,實證研究得到了神經(jīng)網(wǎng)絡(luò)的預(yù)測精度較主成分分析方法高的結(jié)論。胡海青(2012)建立支持向量機和BP神經(jīng)網(wǎng)絡(luò)分別對企業(yè)信用風(fēng)險進行評估,結(jié)果表明在小樣本下基于支持向量機的信用風(fēng)險評估模型更具有有效性和優(yōu)越性。周駟華(2015)構(gòu)建了多層感知器神經(jīng)網(wǎng)絡(luò)進行信用風(fēng)險評估,并將其與決策向量機、線性判別和邏輯回歸等方法進行了比較,認為多層感知器神經(jīng)網(wǎng)絡(luò)更勝一籌。可以看出,在信用風(fēng)險評估領(lǐng)域,神經(jīng)網(wǎng)絡(luò)較傳統(tǒng)的判別分析、回歸分析更有優(yōu)勢,但在小樣本的情況下,神經(jīng)網(wǎng)絡(luò)略遜于支持向量機,主要是因為神經(jīng)網(wǎng)絡(luò)往往需要大量的訓(xùn)練數(shù)據(jù)來提高模型的準確性。
(二)改進優(yōu)化型。在信用風(fēng)險評估領(lǐng)域,應(yīng)用較多的是經(jīng)典的BP神經(jīng)網(wǎng)絡(luò),但BP網(wǎng)絡(luò)存在容易陷入局部最優(yōu)、效率低下等問題,部分學(xué)者提出采用其他類型的神經(jīng)網(wǎng)絡(luò),試圖彌補這些不足。RBF網(wǎng)絡(luò)是一種性能良好的前饋網(wǎng)絡(luò),具有全局逼近性質(zhì)。方先明(2005)建立了基于RBF神經(jīng)網(wǎng)絡(luò)的信用風(fēng)險預(yù)測模型,從理論上探尋了信用風(fēng)險非線性智能控制的可行性。龍?zhí)鞜樀龋?017)將RBF神經(jīng)網(wǎng)絡(luò)同Logistic回歸進行對比,實證研究表明,在進行信用風(fēng)險評估時,前者的預(yù)測結(jié)果準確性要優(yōu)于后者,但后者的解釋能力絕對占優(yōu)。
近年來,深度學(xué)習(xí)在處理維度高、數(shù)據(jù)量大、結(jié)構(gòu)多樣的數(shù)據(jù)問題時展現(xiàn)出良好的性能,同時也避免了嚴重過擬合及梯度爆炸等缺陷,在各領(lǐng)域得到廣泛應(yīng)用。有研究者也嘗試了深度學(xué)習(xí)在信用風(fēng)險評估中的應(yīng)用可能性。王重仁(2017)提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的客戶違約風(fēng)險預(yù)測模型,結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)模型的客戶違約風(fēng)險預(yù)測性能要優(yōu)于其他傳統(tǒng)機器學(xué)習(xí)模型,同時卷積神經(jīng)網(wǎng)絡(luò)模型能夠從數(shù)據(jù)中自動學(xué)習(xí)特征比人工設(shè)計特征節(jié)約了大量時間。熊志斌(2019)將深度信念網(wǎng)絡(luò)(DBN)方法引入信用評估的實踐中,構(gòu)建了基于DBN方法的信用評估模型。
由于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)存在解釋性差、摒棄相關(guān)專業(yè)知識經(jīng)驗等問題,研究人員又將模糊理論引入到神經(jīng)網(wǎng)絡(luò)中,借助于模糊規(guī)則推理,增加神經(jīng)網(wǎng)絡(luò)的直觀性、靈活性和全面性。吳沖(2004)最早提出將模糊理論和神經(jīng)網(wǎng)絡(luò)結(jié)合到一起進行信用風(fēng)險評估,取得了較為滿意的效果,能夠在一定程度上解決神經(jīng)網(wǎng)絡(luò)完全黑箱的問題,可以由風(fēng)險評估人員根據(jù)經(jīng)驗針對不同情況進行調(diào)節(jié),說明模糊神經(jīng)網(wǎng)絡(luò)非常適合應(yīng)用于信用風(fēng)險的評估中。
為了提高分類的準確性及收斂速度,常采用啟發(fā)式算法對分類器進行優(yōu)化,如遺傳算法、群體智能等技術(shù)。王憲全(2006)利用改進的遺傳算法對BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,對上市公司信用風(fēng)險進行計量,取得了較BP神經(jīng)網(wǎng)絡(luò)更好的效果。群體智能算法是受生物進化規(guī)律的啟迪,模擬自然界中的昆蟲、鳥群、獸群等群體行為,通過群體智慧進行協(xié)同搜索,從而在解空間尋找到最優(yōu)解。吳斌(2017)提出了基于混合果蠅神經(jīng)網(wǎng)絡(luò)的個人信用風(fēng)險評估模型。胡賢德(2017)提出一種基于改進離散型螢火蟲(IDGSO)算法的BP神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)算法的小微企業(yè)信用風(fēng)險評估模型。
(三)組合型。組合信用評估方法是將2~3個基學(xué)習(xí)器通過運用組合加權(quán)均衡的運算規(guī)則進行組合,以提高單一模型性能,增強方法的適用性。
有學(xué)者認為將決策樹和神經(jīng)網(wǎng)絡(luò)進行組合,用以增強神經(jīng)網(wǎng)絡(luò)的可解釋性,同時改善模型的穩(wěn)定性和精準度。趙靜嫻(2009)采用RBF神經(jīng)網(wǎng)絡(luò)對貸款企業(yè)財務(wù)指標進行裁減,選擇出對數(shù)據(jù)分類最有效的一些屬性建立決策樹,對企業(yè)的信用風(fēng)險進行評估。結(jié)果表明,模型能夠顯著提高預(yù)測精度,說明神經(jīng)網(wǎng)絡(luò)模型具有較好的特征抽取能力。楊勝剛(2013)則采用決策樹方法篩選個人信用指標,再將篩選出的重要指標輸入BP神經(jīng)網(wǎng)絡(luò)模型進行信用風(fēng)險評估。
Logistic回歸是二分類任務(wù)中最常用的機器學(xué)習(xí)算法之一,其優(yōu)缺點剛好和神經(jīng)網(wǎng)絡(luò)模型互補,把他們組合起來成為必然的趨勢。石慶焱(2005)構(gòu)建了一種BP神經(jīng)網(wǎng)絡(luò)和Logistic回歸的組合模型,以神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果和其他特征變量一起作為Logistic的輸入變量,使用因子分析法解決多重共線性問題。結(jié)果表明,該組合模型預(yù)測精度比Logistic回歸模型高、穩(wěn)健性比神經(jīng)網(wǎng)絡(luò)模型強,且具有可解釋性。仝凌云(2019)用Logistic回歸識別出顯著影響P2P網(wǎng)貸平臺信用風(fēng)險的因子,根據(jù)這些因子構(gòu)建BP神經(jīng)網(wǎng)絡(luò),為出借人選擇平臺提供了借鑒。
KMV模型是一種用來估計借款企業(yè)違約概率的方法。張婧婧(2009)將神經(jīng)網(wǎng)絡(luò)與KMV模型的優(yōu)缺點進行了分析,提出了一種先用神經(jīng)網(wǎng)絡(luò)進行粗分類,再用KMV進行修正的思想。針對非上市公司無法確定市場價值的問題,曾玲玲(2017)提出了一種策略:采用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)上市公司的市場價值和公司財務(wù)指標之間的映射關(guān)系,收集非上市公司財務(wù)指標,然后采用學(xué)習(xí)好的映射關(guān)系估測非上市公司的市場價值,再運用KMV模型計算非上市公司的違約距離和違約率。
(四)集成型。集成學(xué)習(xí)由于可以集成多個基學(xué)習(xí)器且具有更高的適用性特征,得到越來越多的關(guān)注。在集成學(xué)習(xí)中,基學(xué)習(xí)器之間必須要有一定的差異,才能獲得良好的分類效果,學(xué)者主要通過學(xué)習(xí)算法和學(xué)習(xí)數(shù)據(jù)兩個方面來獲得這種差異。
算法方面的差異,可以通過采用不同學(xué)習(xí)算法生成不同的基學(xué)習(xí)器來體現(xiàn),本質(zhì)上屬于異質(zhì)集成。根據(jù)集成方法的不同可以分為以下幾類:第一類是基于平均法的集成分類器,該類方法通常用于回歸,有算術(shù)平均法和加權(quán)平均法。姜明輝(2007)等人用RBF神經(jīng)網(wǎng)絡(luò)與Logistic回歸進行預(yù)測,然后將得出的結(jié)果進行加權(quán)平均,對個人信用風(fēng)險做出評估,結(jié)果表明,該集成模型在總體預(yù)測精度和第二類誤判率上具有優(yōu)勢。第二類是基于投票法的多數(shù)票機制的集成分類器。向暉(2011)等把這種思想應(yīng)用于個人信用評估,將多元判別分析、神經(jīng)網(wǎng)絡(luò)、支持向量機等七種模型的預(yù)測結(jié)果采用加權(quán)投票的方法確定最終的預(yù)測結(jié)果。第三類是基于Stacking法的分層模型集成框架。曹再輝等(2019)基于Stacking集成算法框架,構(gòu)建了兩層集成學(xué)習(xí)器用以評估個人信用。第四類是基于其他融合理論的集成分類器。郭英見(2009)結(jié)合BP神經(jīng)網(wǎng)絡(luò)、SVM分類的優(yōu)勢,同時利用DS證據(jù)理論易于處理不確定性問題的優(yōu)點,建立了一個新的信息融合評估模型。王重仁(2019)提出了一種基于長短期記憶神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的融合深度神經(jīng)網(wǎng)絡(luò)個人信用風(fēng)險評分方法。第五類是基于群決策思想的集成分類器。姜雪瑩(2019)提出了基于群決策思想將神經(jīng)網(wǎng)絡(luò)、隨機森林、梯度提升樹集成的P2P借貸信用風(fēng)險評估模型。
訓(xùn)練數(shù)據(jù)方面的差異,主要通過采用不同的抽樣方法從訓(xùn)練數(shù)據(jù)中抽取不同的訓(xùn)練樣本集來體現(xiàn),通常都是基于相同的學(xué)習(xí)算法生成基學(xué)習(xí)器,屬于同質(zhì)集成。根據(jù)抽樣規(guī)則的不同主要有Bagging方法和Boosting方法?;贐agging方法的集成技術(shù),也是基于多數(shù)投票確定最終的結(jié)果,但這種思想采用等概率、有放回的抽樣規(guī)則來得到若干訓(xùn)練樣本集,然后用這些不同的訓(xùn)練樣本集訓(xùn)練出一系列基分類器,代表性的算法為隨機森林。陳云(2014)使用PSO-BP神經(jīng)網(wǎng)絡(luò)作為成員分類器,然后使用Bagging策略進行建模,對國內(nèi)外企業(yè)信用風(fēng)險做出評估?;贐oosting思想的集成技術(shù),類似于Bagging策略,但每次采樣會對之前預(yù)測錯誤的樣本增加抽樣權(quán)重,代表性的算法是梯度提升樹(GBDT)。李佳佳(2018)提出了一種基于BP-Adaboost模型對企業(yè)的信用風(fēng)險進行評估。
神經(jīng)網(wǎng)絡(luò)技術(shù)思想在信用評估領(lǐng)域的研究經(jīng)歷了多次突破性的優(yōu)化改進。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)雖然具有很多優(yōu)異的特性,但已經(jīng)很難滿足現(xiàn)實社會對于信用評估的需求,針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的改進優(yōu)化取得了較好的效果,但隨著技術(shù)的進步,組合化、集成化思想的出現(xiàn)為提高信用評估的精準性和穩(wěn)定性帶來了新的可能。