劉倡 吳周震 李金香 韋明虎 吳英瑤
摘 要:本文通過SPSS、MATLAB軟件對需貸款企業(yè)大量發(fā)票信息進(jìn)行定量分析研究,使其轉(zhuǎn)化為更加合理有效的可行性風(fēng)險評價指標(biāo),再結(jié)合企業(yè)信譽(yù)信息,形成了信貸評價指標(biāo)系統(tǒng)和決策樹數(shù)據(jù)集,并建立了基于ID3算法的決策樹初步模型。隨著問題的深入,應(yīng)考慮到信貸決策時存在的最優(yōu)選擇:一是在降低風(fēng)險系數(shù)的同時,應(yīng)盡量提高銀行的利潤,同時防止客戶流失;二是研究不同突發(fā)因素對不同類別企業(yè)的影響程度。對此,模型引入了總利潤檢驗、客戶流失率指標(biāo)以及AHP下的信貸調(diào)整策略,對決策樹模型做進(jìn)一步的優(yōu)化處理。
關(guān)鍵詞:風(fēng)險指標(biāo)系統(tǒng);決策樹;ID3算法
一、問題背景
2020年末,全國中小微企業(yè)貸款余額15.3萬億元,增速超過30%,其中5家大型銀行增長54.8%。信貸業(yè)務(wù)是銀行的基礎(chǔ)業(yè)務(wù)與主要盈利業(yè)務(wù),銀行通過前后貸出與收回資金之差獲得利潤。而處于起步階段的中小微企業(yè)是放貸主要對象,如果中小微企業(yè)由于某些因素不能履行信貸約定且無相應(yīng)的抵押資產(chǎn),將導(dǎo)致銀行資金不能收回,出現(xiàn)爛賬與虧損。
二、問題分析
銀行在進(jìn)行貸款時,審批的第一要素是風(fēng)險,而不是所能獲得的利潤。當(dāng)然在風(fēng)險系數(shù)較低的前提下,使得所獲的利益最大,便是最優(yōu)決策。然而評價風(fēng)險系數(shù)的指標(biāo)較多,且有些企業(yè)相關(guān)數(shù)據(jù)需要進(jìn)行合理的量化分析才能轉(zhuǎn)化為具有可行性的風(fēng)險評價指標(biāo),所以如何對需要貸款中小微企業(yè)的相關(guān)數(shù)據(jù)信息進(jìn)行量化分析,得到合理的評價系統(tǒng)指標(biāo),建立相匹配的決策模型對信貸策略研究尤為重要。
三、模型建立
3.1模型的建立
通過對指標(biāo)以及目標(biāo)決策的分析,采用決策樹模型??紤]到企業(yè)信貸風(fēng)險指標(biāo)的數(shù)量,以及最終目標(biāo)對中小微企業(yè)的信貸策略,如何整合并定量分析企業(yè)信貸風(fēng)險指標(biāo),從而做出可視化的決策樹信貸策略是研究的關(guān)鍵。
于是,確立了以下建模步驟(如圖3-1所示):
3.2 相關(guān)數(shù)據(jù)的處理
對于需要信貸企業(yè)提供的進(jìn)項發(fā)票、銷項發(fā)票、作廢發(fā)票以及負(fù)數(shù)發(fā)票等不能直接反映企業(yè)信貸風(fēng)險的信息進(jìn)行量化處理,使其轉(zhuǎn)化為可以直接反映企業(yè)信貸風(fēng)險的指標(biāo)。
3.2.1 引入供求變異系數(shù)CV評價指標(biāo)
變異系數(shù)CV沒有量綱,可以較為真實反映離散程度。例如,通過SPSS軟件對樣本企業(yè)E1和E10發(fā)票信息進(jìn)行處理與分析,可以得到大數(shù)據(jù)下的CV1和CV10。
另一方面,通過MATLAB軟件,建立了樣本企業(yè)E1,E10近三年進(jìn)項發(fā)票、銷項發(fā)票分別和開具時間的可視化聚集程度圖,進(jìn)而可視化反映了樣本企業(yè)E1、E10的供求關(guān)系穩(wěn)定狀況,從而印證了供求變異系數(shù)CV的真實性和可行性(如圖3-2所示)。
3.2.2 引入無效發(fā)票比率系數(shù)WV指標(biāo)
WV(作廢發(fā)票的數(shù)量加上負(fù)數(shù)發(fā)票的數(shù)量之和與總發(fā)票數(shù)之比),WV數(shù)值越大則企業(yè)信譽(yù)值越低,反之越高。
3.3 宏觀評價指標(biāo)定量調(diào)整
由于相關(guān)信息的模糊性,會影響決策樹分支,導(dǎo)致錯誤率會大大上升。為此,首先應(yīng)對評價指標(biāo)進(jìn)行調(diào)整,劃分區(qū)域,確定數(shù)值。
3.4 建立決策樹模型
決策樹ID3算法根據(jù)信息增益大小,對相關(guān)屬性進(jìn)行分層,并且通過運算可以得到在不同屬性指標(biāo)的組合下的判斷結(jié)果。
3.4.1 引入特征屬性分層指標(biāo)
設(shè)有隨機(jī)變量(X,Y),其聯(lián)合概率分布以及條件熵H(Y|X)分別表示為:
(3-1)
信息增益表示為:
(3-2)
通過分別對三類指標(biāo)的計算,且比較相應(yīng)風(fēng)險評價指標(biāo)屬性的信息增益大小可以對風(fēng)險指標(biāo)屬性進(jìn)行分層,從而形成決策樹模型。
3.4.2對指標(biāo)屬性進(jìn)行分層
運用MATLAB軟件進(jìn)行計算信息增益Gai(β)>Gai(α)>Gai(γ),于是應(yīng)該優(yōu)先對供求關(guān)系變異系數(shù)進(jìn)行分支,其次再對企業(yè)信譽(yù)等級指標(biāo)和無效發(fā)票率系數(shù)進(jìn)行分支。
3.4.3 形成決策樹模型
輸入:訓(xùn)練數(shù)據(jù)集U(見附件)、特征集A(見附件)、閾值ε
輸出:決策樹模型
3.5模型結(jié)果
3.6模型優(yōu)化
當(dāng)缺少企業(yè)評級與是否違約等信息時,充分利用兩類信息在上述已經(jīng)建立的基于ID3算法決策樹模型中充當(dāng)一個因變量和自變量這一條件,首先通過稅額建立起與信用評級的關(guān)系,解決了缺少因變量信息問題,同時可求出相應(yīng)自變量。其次,考慮到信貸策略的最優(yōu)選擇,引入了總利潤檢驗、客戶流失率指標(biāo)對模型進(jìn)行進(jìn)一步優(yōu)化。
鑒于各種突發(fā)因素對不同類別企業(yè)影響不盡相同,首先對企業(yè)進(jìn)行分類,從而得到主要突發(fā)因素對不同類型企業(yè)的影響程度表,再利用AHP,與決策樹模型相結(jié)合,形成優(yōu)化后的信貸策略。
參考文獻(xiàn):
[1]王華.互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下的銀行信貸風(fēng)控研究[D].華北電力大學(xué)(北京),2019.
[2]賴春廷.決策樹分類算法研究[J].信息與電腦(理論版),2020,32(14):59-62.