盧悅?cè)? 芮英健 袁芳 徐晨恒 何永海
[摘 要]中小企業(yè)為我國經(jīng)濟發(fā)展做出了巨大貢獻,但在資金籌集方面,商業(yè)銀行對其存在“惜貸”“拒貸”的現(xiàn)象。目前,銀行通常是依據(jù)信貸政策、企業(yè)的交易票據(jù)信息和上下游企業(yè)的影響力,根據(jù)中小微企業(yè)的實力、信譽對其信貸風(fēng)險做出評估,向?qū)嵙?、供求關(guān)系穩(wěn)定的企業(yè)提供貸款。然后依據(jù)信貸風(fēng)險等因素來確定是否放貸及貸款額度、利率和期限等信貸策略。
[關(guān)鍵詞]Logistic;信用評分卡;雙目標規(guī)劃;隨機森林;熵權(quán)法
[DOI]10.13939/j.cnki.zgsc.2021.27.053
1 引言
中小企業(yè)為我國經(jīng)濟發(fā)展做出了巨大貢獻,但在資金籌集方面,商業(yè)銀行對其存在“惜貸”“拒貸”的現(xiàn)象。主要原因是無法對中小微企業(yè)做出精準的風(fēng)險評估。因此,銀行通常是依據(jù)信貸政策、企業(yè)的交易票據(jù)信息和上下游企業(yè)的影響力,根據(jù)中小微企業(yè)的實力、信譽對其信貸風(fēng)險做出評估,向?qū)嵙?、供求關(guān)系穩(wěn)定的企業(yè)提供貸款,其中信譽度高、信貸風(fēng)險小的企業(yè)提供利率優(yōu)惠。依據(jù)信貸風(fēng)險等因素來確定是否放貸及貸款額度、利率和期限等信貸策略。
2 背景分析
分析:該問題是典型的通過數(shù)據(jù)對每個企業(yè)制定一套相同的評分模型,先采用等頻分箱把卡方值比較接近的企業(yè)都分在一個箱子里,通過對數(shù)據(jù)間的相關(guān)性進行分析發(fā)現(xiàn)各個變量間相關(guān)性比較小,初步判斷符合 Logistic 回歸的要求,因此通過建立 Logistic的評分卡模型來對每個企業(yè)進行打分和計算違約率,以此來劃分每個企業(yè)的好壞。通過對好壞企業(yè)劃分后,對好企業(yè)應(yīng)用信貸策略模型對每個企業(yè)貸款額度和貸款年利率進行制定。具體思路:通過等頻分箱將相同的客戶分為一類,對變量進行spearman相關(guān)性分析,建立Logistic的評分卡模型來甄別好企業(yè)和壞企業(yè),利用貸款策略和利率策略對信貸策略進行制定。
3? 評分卡模型的建立與求解
3.1 評分卡模型
3.1.1 變量相關(guān)性檢驗
通過對變量之間的相關(guān)性檢驗來判斷在評分卡模型中使用邏輯回歸模型作為子模型是否合適。通過對 5個變量之間進行相關(guān)性分析,結(jié)果如表1所示。
發(fā)現(xiàn)各個變量間相關(guān)性比較小,初步判斷符合 Logistic 回歸的要求。
3.1.2 基于懲罰邏輯回歸模型
(1)原理。邏輯回歸監(jiān)督學(xué)習(xí),可很好的解決二分類問題。其本質(zhì)是通過Sigmoid函數(shù)映射到(0,1) 之間,然后根據(jù)預(yù)測的結(jié)果確定其屬于“好”還是“壞”。
(2) Sigmoid 函數(shù)是 Logistic 函數(shù)(logistic function),也稱為 Sigmoid 函數(shù)。
(z)=11+e-z
Sigmoid 函數(shù)的圖像如圖1所示。
(3)評分卡模型。指定評分卡刻度,這里采用金融行業(yè)最常用的評分卡刻度。評分卡的主要工作就是給當(dāng)前客戶進行打分,以此判斷該客戶違約的可能性,并以此為依據(jù)來決定是否為該客戶辦理業(yè)務(wù)。兩個重要假定:①指定某個特定比率的預(yù)期分值。②指定翻倍比率的分值(PDO)。
假定會違約的客戶的概率為p,不會違約的客戶的概率為1-p,可以得到對數(shù)概率為Odds,會違約的客戶的概率就為:
P=OddsOdds+1
評分卡刻度就用比率對數(shù)的線性表達式來定義:
Score=A-B×log(Odds)
(4)評分卡模型結(jié)果分析:主要關(guān)注的是找到客戶中會違約的客戶,因為違約的客戶畢竟是少數(shù)的,因此通過召回率和 ROC 曲線來判斷模型的好壞。
從圖2中得到,判斷對一個壞客戶的情況下只會判錯 0.08 個好客戶,說明評分卡模型有著很好的召回率(從所有客戶中預(yù)測出本來是壞客戶的概率),能夠讓銀行更好地在一開始就找到可能會違約的客戶。
s.t.ω=∑rji+pi1-pi? j∈(1,2,3)
rAi=7.5341xAi-0.0979
rBi=7.3511xBi-0.1178
rCi=7.4684xCi-0.1379
L=∑xAi+∑xBi+∑xCi
rAi,rBi,rCi∈(0.04,0.15)
xAi,xBi,xCi∈(0,1)
3.2 分類結(jié)果分析
首先利用隨機森林分類模型來找到查找的數(shù)據(jù)中每個企業(yè)所對應(yīng)的信譽等級和是否違約的值,然后利用第一問的評分卡模型對每個企業(yè)打分,并且計算它們所對應(yīng)的違約率,最后第一問所建立的信貸策略模型來找到查找的數(shù)據(jù) 2 中的信貸策略。
3.2.1 隨機森林分類模型
隨機森林是在一片森林中建立很多棵決策樹(弱評估器),然后集成得到一個強評估器。
首先利用隨機森林分類模型對查找的數(shù)據(jù)中的企業(yè)進行一個分類訓(xùn)練,做法是采用隨機抽樣的策略把其中的數(shù)據(jù)分為訓(xùn)練集和測試集,然后讓信譽等級和是否違約分別作為這些企業(yè)的標簽,對其進行分類訓(xùn)練后找到一個比較好的分類模型,然后得到的最佳分類準確度是 91.8%,這時候?qū)⒉檎业臄?shù)據(jù)中的數(shù)據(jù)代入其中就可以得到對應(yīng)的信譽評級和是否違約的數(shù)據(jù)。
3.2.2 計算企業(yè)得分和違約率
這里借用第一問的評分卡模型計算企業(yè)的得分和違約率,可以得到每個企業(yè)所對應(yīng)的得分和違約率,展示前 15 個企業(yè)的得分和違約率,如表2所示。
3.2.3 策略的修正
首先進行額度策略的修正,根據(jù)年貸款總額度為一億元,因此每個企業(yè)的貸款之和,即貸款總額度C為:
C≤c1+c2+c3+…+c302
同時結(jié)合建立的額度策略得到各企業(yè)對應(yīng)信貸額度表達式,其中K0=0.5,A1=10,A2=332,最后修正額度表達式為:
A=322x+10
4 結(jié)論
因為該模型為雙目標規(guī)劃模型,所以沒有辦法直接用軟件進行求解,這里采用貪心策略來對其進行求解,貪心策略就是保證當(dāng)前最優(yōu)解成立。首先利用網(wǎng)上的數(shù)據(jù)給出的貸款年利率表可以找到銀行在貸款10萬~100萬元的最小收益和最大收益,并且獲得在該利率下客戶流失率的最小值,先固定一個收益然后讓所有的流失率最小值帶入雙目標規(guī)劃模型中進行計算,得到最大的貸款年利率,找到最大的貸款年利率下最小的客戶流失率,將最小的客戶流失率帶入模型。
參考文獻:
[1]陳超,王楠,于海洋,等.基于卡方分箱法和邏輯回歸算法的轉(zhuǎn)爐操作工藝評價模型[J].材料與冶金學(xué)報,2019,18(2):87-91.
[2]朱麗云 . 基于Logistic模型的商業(yè)銀行信用風(fēng)險分析[J].品牌研究,2019(19):17-18.
[3]劉倩.基于數(shù)據(jù)挖掘技術(shù)的信用評分卡模型研究[D].武漢:華中科技大學(xué),2019.
[4]夏晨琦 . 局部最優(yōu)分箱及其在評分卡模型中的應(yīng)用[J].統(tǒng)計與決策,2019,33(7):63-67.
[作者簡介]盧悅?cè)剑?,漢族,安徽財經(jīng)大學(xué),本科,研究方向:數(shù)字金融。