鄭建國(guó) 李新
【摘 要】近年來(lái),我國(guó)企業(yè)信用風(fēng)險(xiǎn)上升。文章結(jié)合傳統(tǒng)的財(cái)務(wù)指標(biāo),加入非財(cái)務(wù)指標(biāo),以構(gòu)建更為全面的企業(yè)信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系。以2015—2017年的A股上市公司為樣本,將PCA、SMOTE與通過(guò)網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu)后的SVM結(jié)合,構(gòu)建PCA-SMOTE-GS-SVM模型評(píng)估企業(yè)信用風(fēng)險(xiǎn),并對(duì)比其他模型,結(jié)果表明,所構(gòu)建模型具有較高的穩(wěn)定性和預(yù)測(cè)能力。
【關(guān)鍵詞】支撐向量機(jī);企業(yè)信用風(fēng)險(xiǎn)評(píng)估;PCA;SMOTE;網(wǎng)格搜索法
【中圖分類(lèi)號(hào)】F832.4 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-0688(2020)05-0220-03
1 概述
1.1 研究背景
目前,在經(jīng)濟(jì)增長(zhǎng)放緩、生產(chǎn)能力下降、庫(kù)存減少、去杠桿化加劇等多種因素的影響下,我國(guó)信用貸款的風(fēng)險(xiǎn)頻繁發(fā)生,不良貸款不斷增加,所以我國(guó)建立相對(duì)完善的銀行及其他金融機(jī)構(gòu)信用風(fēng)險(xiǎn)評(píng)估體系刻不容緩。支持向量機(jī)(SVM)廣泛應(yīng)用于模型的分類(lèi)和回歸中,在用于信用風(fēng)險(xiǎn)評(píng)估中,可以實(shí)現(xiàn)將不良貸款與優(yōu)良貸款的主體進(jìn)行分類(lèi)。
1.2 國(guó)內(nèi)外研究綜述
從近幾年的研究來(lái)看,方匡南等人[1]將基于網(wǎng)絡(luò)結(jié)構(gòu)的Logit模型用于企業(yè)信用風(fēng)險(xiǎn)評(píng)估中。蔣翠霞等人[2]基于 Lasso二元選擇分量回歸,建立了一個(gè)評(píng)價(jià)模型,并將其應(yīng)用于中國(guó)上市公司的信用評(píng)價(jià)中,結(jié)論表明所提模型較于Lasso-logit 模型和支持向量機(jī)等具有更好的評(píng)價(jià)效果和變量選擇能力。吳金旺等人[3]建立了Logistic模型以分析A商業(yè)銀行海量客戶(hù)信貸數(shù)據(jù)。肖會(huì)敏等人[4]將神經(jīng)網(wǎng)絡(luò)模型用于對(duì)P2P網(wǎng)絡(luò)借款人的信用評(píng)估研究。Guangrong Tong and Siwei Li[5]提出了lsomap-RVM模型,并用它來(lái)對(duì)中國(guó)上市公司信用進(jìn)行評(píng)估。Ye Tian等人[6]提出一種新的模糊集和最先進(jìn)的無(wú)內(nèi)核QSSVM模型用于信用風(fēng)險(xiǎn)評(píng)估。趙亞等人[7]選取股東、企業(yè)誠(chéng)信情況等構(gòu)建非財(cái)務(wù)指標(biāo)并進(jìn)行研究。
2 企業(yè)信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系的構(gòu)建
2.1 數(shù)據(jù)來(lái)源
本文數(shù)據(jù)來(lái)自國(guó)泰安金融數(shù)據(jù)庫(kù),樣本選自2015—2017在A股上市的公司,根據(jù)證監(jiān)會(huì)對(duì)企業(yè)信用風(fēng)險(xiǎn)的標(biāo)準(zhǔn),ST的公司為信用差的公司,未被認(rèn)定為信用好的公司。樣本數(shù)據(jù)總共有9 060條,因變量表示公司是否違約,賦值0和1,其中0表示良好企業(yè);1表示壞企業(yè)。
2.2 體系構(gòu)建
結(jié)合國(guó)內(nèi)外學(xué)者的研究,我們構(gòu)建了企業(yè)信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,其中財(cái)務(wù)指標(biāo)共17個(gè),非財(cái)務(wù)指標(biāo)共4個(gè)(見(jiàn)表1)。
(1)財(cái)務(wù)指標(biāo)。償債能力是衡量企業(yè)的經(jīng)營(yíng)狀況和財(cái)務(wù)能力的重要表現(xiàn);而現(xiàn)金流量可以判斷企業(yè)經(jīng)營(yíng)狀況是否良好,是否有足夠的現(xiàn)金流進(jìn)行周轉(zhuǎn);盈利能力可以看出企業(yè)是否可以創(chuàng)造價(jià)值;經(jīng)營(yíng)能力衡量企業(yè)的經(jīng)營(yíng)狀況,企業(yè)利用各種資源來(lái)經(jīng)營(yíng)企業(yè);成長(zhǎng)能力反映企業(yè)在生存的同時(shí)不斷擴(kuò)大規(guī)模和發(fā)展實(shí)力。
(2)非財(cái)務(wù)指標(biāo)。通常,我們認(rèn)為企業(yè)規(guī)模越大,說(shuō)明企業(yè)承擔(dān)風(fēng)險(xiǎn)的能力越強(qiáng),更有資金還貸;管理者特征表明了企業(yè)的組織結(jié)構(gòu),一個(gè)具備強(qiáng)大的組織者和領(lǐng)導(dǎo)人的企業(yè)更會(huì)長(zhǎng)期穩(wěn)定地發(fā)展下去。
3 實(shí)證分析
3.1 主成分分析
通過(guò)計(jì)算可得特征值和方差累計(jì)貢獻(xiàn)率(見(jiàn)表2)。
根據(jù)表2,我們提取了10個(gè)主成分,且方差累計(jì)貢獻(xiàn)率74%。
3.2 實(shí)驗(yàn)與模型效果對(duì)比
我們選取樣本的40%為測(cè)試集,將沒(méi)有經(jīng)過(guò)主成分分析降維和SMOTE平衡數(shù)據(jù)的Logistic模型與不同內(nèi)核函數(shù)的SVM模型進(jìn)行對(duì)比試驗(yàn),其中s表示訓(xùn)練集,t表示測(cè)試集,最終分類(lèi)效果見(jiàn)表3。
從表3中我們可以看出,不論是訓(xùn)練集還是測(cè)試集,每個(gè)模型的分類(lèi)準(zhǔn)確率都很高,很大一部分原因是由于數(shù)據(jù)的不平衡導(dǎo)致的,因?yàn)榧词箤⑺械臉颖绢A(yù)測(cè)成0,即違約風(fēng)險(xiǎn)低的企業(yè),預(yù)測(cè)準(zhǔn)確率都有97%,所以我們不能根據(jù)準(zhǔn)確率進(jìn)行判斷。同時(shí),大部分模型的精準(zhǔn)率和召回率、F1_score指標(biāo)較低,說(shuō)明正確判斷正類(lèi)樣本效果不好,對(duì)比AUC指標(biāo)我們發(fā)現(xiàn),SVM選擇徑向基核函數(shù)RBF的分類(lèi)性能較其他內(nèi)核函數(shù)更好。所以,后面我們選擇內(nèi)核函數(shù)為RBF的SVM進(jìn)行訓(xùn)練。
很明顯,不平衡數(shù)據(jù)和特征抽取之后的模型對(duì)企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估的效果不好,于是我們先做主成分分析,然后用SMOTE算法過(guò)采樣平衡樣本,對(duì)比模型進(jìn)行實(shí)驗(yàn),分類(lèi)評(píng)價(jià)指標(biāo)見(jiàn)表4。
我們從表4中可以看出,進(jìn)行主成分降維和平衡數(shù)據(jù)之后,分類(lèi)評(píng)價(jià)指標(biāo)相較于之前大部分都提高了,并且可以看出PCA-SMOTE-SVM模型比PCA-SMOTE-Logistic模型具備更好的分類(lèi)性能,訓(xùn)練集和測(cè)試集各個(gè)指標(biāo)都高5%左右,說(shuō)明分類(lèi)器的效果較好。
支持向量機(jī)模型具有兩個(gè)非常重要的參數(shù),即C和gamma。C表示懲罰系數(shù),C越小,模型越容易欠擬合,反之,就會(huì)過(guò)擬合。gamma是內(nèi)核函數(shù)的參數(shù),gamma越大,支持向量越少,反之越多。我們采用傳網(wǎng)格搜索法尋求最優(yōu)的參數(shù)組合,以達(dá)到模型更優(yōu)的預(yù)測(cè)效果。設(shè)置5折交叉驗(yàn)證的網(wǎng)格參數(shù)尋優(yōu),最后得到最優(yōu)參數(shù):C=1 000,gamma=1,此時(shí)的最優(yōu)性能為0.948。最后各個(gè)分類(lèi)指標(biāo)都上升且很高,AUC值高達(dá)97%,準(zhǔn)確率高達(dá)95%,表明所提模型的分類(lèi)效果很好。
4 結(jié)論和不足
為了研究企業(yè)的信用風(fēng)險(xiǎn)評(píng)估問(wèn)題,構(gòu)建了具有21個(gè)指標(biāo)的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)體系,選取2015—2017年3年A股上市公司為樣本,構(gòu)建了PCA-SMOTE-GS-SVM模型,并進(jìn)行對(duì)比實(shí)驗(yàn),所提模型的分類(lèi)評(píng)價(jià)指標(biāo)較高,研究的不足之處有以下兩點(diǎn):①對(duì)于參數(shù)尋優(yōu),文章僅僅采用網(wǎng)格搜索法尋找最優(yōu)參數(shù),可以尋找最佳分類(lèi)模型。②本文所提模型,只適用于二分類(lèi)信用風(fēng)險(xiǎn)分級(jí)的樣本,可以嘗試對(duì)企業(yè)信用風(fēng)險(xiǎn)評(píng)估進(jìn)行多分類(lèi)的研究。
參 考 文 獻(xiàn)
[1]方匡南,范新妍,馬雙鴿.基于網(wǎng)絡(luò)結(jié)構(gòu)Logistic模型的企業(yè)信用風(fēng)險(xiǎn)預(yù)警[J].統(tǒng)計(jì)研究,2016,33(4):50-55.
[2]蔣翠俠,黃韻華,許啟發(fā).基于Lasso二元選擇分位數(shù)回歸的上市公司信用評(píng)估[J].系統(tǒng)工程,2017,35(2):16-24.
[3]吳金旺,顧洲一.基于非平衡樣本的商業(yè)銀行客戶(hù)信用風(fēng)險(xiǎn)評(píng)估——以A銀行為例[J].金融理論與實(shí)踐,2018(7):51-57.
[4]肖會(huì)敏,侯宇,崔春生.基于BP神經(jīng)網(wǎng)絡(luò)的P2P網(wǎng)貸借款人信用評(píng)估[J].運(yùn)籌與管理,2018,27(9):112-118.
[5]Tong Guangrong,Li Siwei.Construction and App-lication Research of Isomap-RVM Credit AssessmentModel[J].Mathematical Problems In Engineering,2015(9):1135-1143.
[6]Tian Ye,Sun,Miao,Deng Zhibin.A New Fuzzy Set and Nonkernel SVM Approach for Mislabeled Binary Classification With Applications[J].IEEE Tra-nsactions On Fuzzy Systems,2017(10):1536-1545.
[7]趙亞,李田,苑澤明.基于隨機(jī)森林的企業(yè)信用風(fēng)險(xiǎn)評(píng)估模型研究[J].財(cái)會(huì)通訊,2017(29):110-114,129.