劉倡 吳周震 李金香 韋明虎 吳英瑤
摘 要:本文通過(guò)SPSS、MATLAB軟件對(duì)需貸款企業(yè)大量發(fā)票信息進(jìn)行定量分析研究,使其轉(zhuǎn)化為更加合理有效的可行性風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo),再結(jié)合企業(yè)信譽(yù)信息,形成了信貸評(píng)價(jià)指標(biāo)系統(tǒng)和決策樹(shù)數(shù)據(jù)集,并建立了基于ID3算法的決策樹(shù)初步模型。隨著問(wèn)題的深入,應(yīng)考慮到信貸決策時(shí)存在的最優(yōu)選擇:一是在降低風(fēng)險(xiǎn)系數(shù)的同時(shí),應(yīng)盡量提高銀行的利潤(rùn),同時(shí)防止客戶流失;二是研究不同突發(fā)因素對(duì)不同類別企業(yè)的影響程度。對(duì)此,模型引入了總利潤(rùn)檢驗(yàn)、客戶流失率指標(biāo)以及AHP下的信貸調(diào)整策略,對(duì)決策樹(shù)模型做進(jìn)一步的優(yōu)化處理。
關(guān)鍵詞:風(fēng)險(xiǎn)指標(biāo)系統(tǒng);決策樹(shù);ID3算法
一、問(wèn)題背景
2020年末,全國(guó)中小微企業(yè)貸款余額15.3萬(wàn)億元,增速超過(guò)30%,其中5家大型銀行增長(zhǎng)54.8%。信貸業(yè)務(wù)是銀行的基礎(chǔ)業(yè)務(wù)與主要盈利業(yè)務(wù),銀行通過(guò)前后貸出與收回資金之差獲得利潤(rùn)。而處于起步階段的中小微企業(yè)是放貸主要對(duì)象,如果中小微企業(yè)由于某些因素不能履行信貸約定且無(wú)相應(yīng)的抵押資產(chǎn),將導(dǎo)致銀行資金不能收回,出現(xiàn)爛賬與虧損。
二、問(wèn)題分析
銀行在進(jìn)行貸款時(shí),審批的第一要素是風(fēng)險(xiǎn),而不是所能獲得的利潤(rùn)。當(dāng)然在風(fēng)險(xiǎn)系數(shù)較低的前提下,使得所獲的利益最大,便是最優(yōu)決策。然而評(píng)價(jià)風(fēng)險(xiǎn)系數(shù)的指標(biāo)較多,且有些企業(yè)相關(guān)數(shù)據(jù)需要進(jìn)行合理的量化分析才能轉(zhuǎn)化為具有可行性的風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo),所以如何對(duì)需要貸款中小微企業(yè)的相關(guān)數(shù)據(jù)信息進(jìn)行量化分析,得到合理的評(píng)價(jià)系統(tǒng)指標(biāo),建立相匹配的決策模型對(duì)信貸策略研究尤為重要。
三、模型建立
3.1模型的建立
通過(guò)對(duì)指標(biāo)以及目標(biāo)決策的分析,采用決策樹(shù)模型??紤]到企業(yè)信貸風(fēng)險(xiǎn)指標(biāo)的數(shù)量,以及最終目標(biāo)對(duì)中小微企業(yè)的信貸策略,如何整合并定量分析企業(yè)信貸風(fēng)險(xiǎn)指標(biāo),從而做出可視化的決策樹(shù)信貸策略是研究的關(guān)鍵。
于是,確立了以下建模步驟(如圖3-1所示):
3.2 相關(guān)數(shù)據(jù)的處理
對(duì)于需要信貸企業(yè)提供的進(jìn)項(xiàng)發(fā)票、銷項(xiàng)發(fā)票、作廢發(fā)票以及負(fù)數(shù)發(fā)票等不能直接反映企業(yè)信貸風(fēng)險(xiǎn)的信息進(jìn)行量化處理,使其轉(zhuǎn)化為可以直接反映企業(yè)信貸風(fēng)險(xiǎn)的指標(biāo)。
3.2.1 引入供求變異系數(shù)CV評(píng)價(jià)指標(biāo)
變異系數(shù)CV沒(méi)有量綱,可以較為真實(shí)反映離散程度。例如,通過(guò)SPSS軟件對(duì)樣本企業(yè)E1和E10發(fā)票信息進(jìn)行處理與分析,可以得到大數(shù)據(jù)下的CV1和CV10。
另一方面,通過(guò)MATLAB軟件,建立了樣本企業(yè)E1,E10近三年進(jìn)項(xiàng)發(fā)票、銷項(xiàng)發(fā)票分別和開(kāi)具時(shí)間的可視化聚集程度圖,進(jìn)而可視化反映了樣本企業(yè)E1、E10的供求關(guān)系穩(wěn)定狀況,從而印證了供求變異系數(shù)CV的真實(shí)性和可行性(如圖3-2所示)。
3.2.2 引入無(wú)效發(fā)票比率系數(shù)WV指標(biāo)
WV(作廢發(fā)票的數(shù)量加上負(fù)數(shù)發(fā)票的數(shù)量之和與總發(fā)票數(shù)之比),WV數(shù)值越大則企業(yè)信譽(yù)值越低,反之越高。
3.3 宏觀評(píng)價(jià)指標(biāo)定量調(diào)整
由于相關(guān)信息的模糊性,會(huì)影響決策樹(shù)分支,導(dǎo)致錯(cuò)誤率會(huì)大大上升。為此,首先應(yīng)對(duì)評(píng)價(jià)指標(biāo)進(jìn)行調(diào)整,劃分區(qū)域,確定數(shù)值。
3.4 建立決策樹(shù)模型
決策樹(shù)ID3算法根據(jù)信息增益大小,對(duì)相關(guān)屬性進(jìn)行分層,并且通過(guò)運(yùn)算可以得到在不同屬性指標(biāo)的組合下的判斷結(jié)果。
3.4.1 引入特征屬性分層指標(biāo)
設(shè)有隨機(jī)變量(X,Y),其聯(lián)合概率分布以及條件熵H(Y|X)分別表示為:
(3-1)
信息增益表示為:
(3-2)
通過(guò)分別對(duì)三類指標(biāo)的計(jì)算,且比較相應(yīng)風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)屬性的信息增益大小可以對(duì)風(fēng)險(xiǎn)指標(biāo)屬性進(jìn)行分層,從而形成決策樹(shù)模型。
3.4.2對(duì)指標(biāo)屬性進(jìn)行分層
運(yùn)用MATLAB軟件進(jìn)行計(jì)算信息增益Gai(β)>Gai(α)>Gai(γ),于是應(yīng)該優(yōu)先對(duì)供求關(guān)系變異系數(shù)進(jìn)行分支,其次再對(duì)企業(yè)信譽(yù)等級(jí)指標(biāo)和無(wú)效發(fā)票率系數(shù)進(jìn)行分支。
3.4.3 形成決策樹(shù)模型
輸入:訓(xùn)練數(shù)據(jù)集U(見(jiàn)附件)、特征集A(見(jiàn)附件)、閾值ε
輸出:決策樹(shù)模型
3.5模型結(jié)果
3.6模型優(yōu)化
當(dāng)缺少企業(yè)評(píng)級(jí)與是否違約等信息時(shí),充分利用兩類信息在上述已經(jīng)建立的基于ID3算法決策樹(shù)模型中充當(dāng)一個(gè)因變量和自變量這一條件,首先通過(guò)稅額建立起與信用評(píng)級(jí)的關(guān)系,解決了缺少因變量信息問(wèn)題,同時(shí)可求出相應(yīng)自變量。其次,考慮到信貸策略的最優(yōu)選擇,引入了總利潤(rùn)檢驗(yàn)、客戶流失率指標(biāo)對(duì)模型進(jìn)行進(jìn)一步優(yōu)化。
鑒于各種突發(fā)因素對(duì)不同類別企業(yè)影響不盡相同,首先對(duì)企業(yè)進(jìn)行分類,從而得到主要突發(fā)因素對(duì)不同類型企業(yè)的影響程度表,再利用AHP,與決策樹(shù)模型相結(jié)合,形成優(yōu)化后的信貸策略。
參考文獻(xiàn):
[1]王華.互聯(lián)網(wǎng)大數(shù)據(jù)環(huán)境下的銀行信貸風(fēng)控研究[D].華北電力大學(xué)(北京),2019.
[2]賴春廷.決策樹(shù)分類算法研究[J].信息與電腦(理論版),2020,32(14):59-62.