劉翔鵬
商業(yè)銀行信用風(fēng)險管理一直是全面風(fēng)險管理( ERM)的重要組成部分,對于地方法人銀行機構(gòu)而言,不良貸款預(yù)測分類是信用風(fēng)險管理的重點和難點。針對我國中小法人銀行面臨的不良貸款信用風(fēng)險問題,引入樸素貝葉斯模型對不良資產(chǎn)信用風(fēng)險進行識別分類,并選取湖南S農(nóng)商行和B農(nóng)商行2017年末全部信貸數(shù)據(jù)進行實證。
金融是現(xiàn)代經(jīng)濟的核心,銀行市現(xiàn)代金融的核心,現(xiàn)代商業(yè)銀行在經(jīng)營和發(fā)展過程中,因為籌集融通資金,中間環(huán)節(jié)會積累大量不良資產(chǎn)。由于歷史上和現(xiàn)實上的原因,我國農(nóng)信系統(tǒng)的地方法人金融機構(gòu)累積了大量的不良資產(chǎn),雖然經(jīng)過央行票據(jù)置換和農(nóng)商行改革已經(jīng)置換、清收了大量的不良資產(chǎn),但是由于地方法人銀行機構(gòu)信用風(fēng)險管理能力較差,人才隊伍培養(yǎng)滯后,故對不良資產(chǎn)的事前識別能力極弱。
目前國內(nèi)銀行業(yè)對不良資產(chǎn)信用風(fēng)險評估方法主要是采用古典分析法和多元統(tǒng)計法。古典分析法是指銀行經(jīng)營者依賴一批訓(xùn)練有素的專家主觀判斷,對信貸項目進行判斷打分,審貸會以此決策。多元統(tǒng)計分析的基本思路是根據(jù)歷史積累的樣本建立統(tǒng)計模型,對新樣本發(fā)生的某種事件的可能性進行預(yù)測的方法,包括線性概率和判別分析法等。
以上所述方法雖然被廣泛應(yīng)用,但是他們只是針對某一方面如財務(wù)進行分析和統(tǒng)計,不能充分利用銀行搜集的全面信息,尤其是一些邊緣信息。大量的數(shù)據(jù)挖掘研究結(jié)果表明,很多邊緣信息和側(cè)面指標可以很好地補充單一財務(wù)指標的缺陷,使借款項目的特征更加鮮明,故本文引入樸素貝葉斯模型,試圖用新辦法解決信用風(fēng)險識別、評估的舊問題。
一、模型設(shè)計
樸素貝葉斯分類的基礎(chǔ)是對于給出的待分類項,求解在此項出現(xiàn)條件下各個類別出現(xiàn)的概率,哪個概率最大,就認為此待分類項屬于哪個類別。該模型以簡單的結(jié)構(gòu)和良好的性能受到人們的關(guān)注,模型建立在類條件獨立性假設(shè)的基礎(chǔ)上:給定類結(jié)點后,個屬性結(jié)點之間相互獨立。根據(jù)樸素貝葉斯的類條件獨立假設(shè)則有:P=(X|Ci)= (P(XKCi)
條件概率P(X1|Ci),P(X2Ci),…P(XKCi)可以從訓(xùn)練數(shù)據(jù)集中求得。根據(jù)此方法,對一個未知類別的樣本X,可以先分別計算出X屬于每一個類別Ci 概率P(X|Ci)P(Ci),然后選擇其中概率最大的類別作為其類別。
樸素貝葉斯的正確步驟如下:
(1)設(shè)x={a1,a2,…,am)為一個待分類項,而a為該待分類項的每一個特征值。
(2)有類別集合C={y1,y2,…,ym}。
(3)計算P(y1|x.)P(y1x.)…,P(yn|x)。
(4)如果P(yK|x)=max{P(y1|x.)P(y2|x)…,P(yn|x},則x∈yk。
那么,現(xiàn)在的關(guān)鍵就是如何計算第三步驟的各個條件概率,可以按如下步驟計算:
(1)找到一個已知分類的待分類項集合,這個集合叫做訓(xùn)練樣本集。
(2)統(tǒng)計得到各個類別下各個特征屬性的條件概率估計,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…P(am|y2)…
(3)如果得到在各個特征屬性是條件獨立的,則根據(jù)貝葉斯定理有如下推導(dǎo)。
P(yi|x)=P(x|yi)P(yi)/P(x)
分母對于所有類別為常數(shù),因此只要將分子最大化即可,因為各特征屬性是條件獨立的,所以有:P(am|yi)P(yi)=P(yi)mΠj=1P(aj|yi)
二、實證分析
本文選取湖南永州境內(nèi)S農(nóng)商行和B農(nóng)商行全部信貸數(shù)據(jù)作為實證樣本。首先對數(shù)據(jù)進行處理,對缺損數(shù)據(jù)和重復(fù)數(shù)據(jù)進行了清洗,選取12450個樣本,13個特征值作為有效數(shù)據(jù)。將數(shù)據(jù)庫的英文字符和中文字符全部轉(zhuǎn)化為雙精度浮點型數(shù)據(jù),然后利用虛擬變量函數(shù)對雙精度浮點型數(shù)據(jù)全部進行編碼,樣本屬性標簽正常貸款和不良貸款分別用0和1表示。
在實證環(huán)節(jié),隨機選取40%的樣本作為測試樣本,共進行40次交叉驗證。40次交叉驗證預(yù)測標簽為1的不良貸款結(jié)果如下表1:
全部40次隨機交叉驗證的準確率均值為0.777,標準誤差為0.069。由模型結(jié)果可以看出樸素貝葉斯分類器是健壯的,因為在從數(shù)據(jù)中估計條件概率時,這些點被平均。另外樸素貝葉斯模型可以處理屬性值的遺漏問題,面對無關(guān)屬性,該分類器依然是簡單的,因為如果Xi是無關(guān)屬性,那么P(Xi|Y)幾乎要變成均勻分布,Xi的類條件概率不會對總的后驗概率計算產(chǎn)生影響。屬性如果相關(guān)可能會降低樸素貝葉斯分類器的性能,因為對這些屬性,條件獨立的假設(shè)已經(jīng)不成立。
三、結(jié)論和建議
樸素貝葉斯模型的準確率很高,穩(wěn)定性很強,在多次交叉驗證后,得到較為穩(wěn)定的準確率和較小的標準誤差,故模型實用價值很高。但法人銀行機構(gòu)的關(guān)聯(lián)交易和流動性狀況是該模型不能識別的,股東的高額關(guān)聯(lián)貸款給法人銀行帶來的信用風(fēng)險是極大的,極端情況的流動性短缺會讓法人銀行機構(gòu)經(jīng)營困難,結(jié)合聲譽風(fēng)險,可能會被處置當局警告、早糾甚至接管。