滕樹軍 楊馥臨 劉柏森
上市公司是市場經(jīng)濟(jì)的重要組成部分,其信用評價(jià)研究逐漸受到人們的重視。本文就高維數(shù)據(jù)下上市公司的風(fēng)險(xiǎn)評價(jià)問題提出了一種新的方法,首先運(yùn)用主成分分析方法對影響上市公司信用風(fēng)險(xiǎn)的眾多因素進(jìn)行降維,提取出若干個(gè)主成分變量;然后基于這些主成分變量,再運(yùn)用支持向量機(jī)方法對上市公司的信用風(fēng)險(xiǎn)進(jìn)行綜合測評。實(shí)證結(jié)果表明,與基于主成分分析和logistic回歸分析的方法,以及傳統(tǒng)的支持向量機(jī)方法相比較,基于主成分分析+支持向量機(jī)的方法的預(yù)測更加準(zhǔn)確。
隨著市場經(jīng)濟(jì)的不斷發(fā)展,信用問題日益深刻地影響著市場經(jīng)濟(jì)的發(fā)展,如何對企業(yè)進(jìn)行客觀準(zhǔn)確的評價(jià)逐漸成為人們研究的重點(diǎn)。信用風(fēng)險(xiǎn)又稱違約風(fēng)險(xiǎn),是指借款人、證券發(fā)行人或交易對方因種種原因,不愿或無力履行合同條件而構(gòu)成違約,致使銀行、投資者或交易對方遭受損失的可能性。信用在整個(gè)社會(huì)經(jīng)濟(jì)運(yùn)行中起著非常重要的作用,在資本市場上,信用風(fēng)險(xiǎn)也是投資者最為關(guān)注的主要風(fēng)險(xiǎn)之一,上市公司的信用風(fēng)險(xiǎn)大小直接影響著股票、債券等有價(jià)值證券的價(jià)值。
近幾年我國有一大批研究學(xué)者投入到對信用風(fēng)險(xiǎn)的研究中,并且取得了一定成果,所采用的方法主要有神經(jīng)網(wǎng)絡(luò)、判別分析、因子分析和logistic回歸分析等。韓靜(2005)運(yùn)用概率神經(jīng)網(wǎng)絡(luò)的方法對企業(yè)信用進(jìn)行了評定。張玲(2000)采用判別模型對我國上市公司的財(cái)務(wù)預(yù)警進(jìn)行了分析。油永華(2006)首先運(yùn)用主成分分析,提取出若干個(gè)主成分,然后基于主成分建立logistic回歸模型,對100家公司的8個(gè)財(cái)務(wù)指標(biāo)進(jìn)行了分析。張愛民,祝春山,許丹健(2010)運(yùn)用主成分分析方法,提取主成分,最終得到主成分預(yù)測函數(shù)。謝春巖(2014)利用逐步回歸法在單變量logistic模型中剔除掉不顯著的變量,以及存在高度線性相關(guān)性的自變量后,對剩下的變量做多變量logistic回歸,最終得出信用風(fēng)險(xiǎn)評價(jià)模型。葛美玲,張為(2015)進(jìn)行Mann-Whitney(M-W)檢驗(yàn)以得到對信用良好的公司以及信用不好公司有顯著影響的指標(biāo),并建立logistic回歸模型。
本文的創(chuàng)新點(diǎn)在于:當(dāng)財(cái)務(wù)指標(biāo)個(gè)數(shù)較多且存在嚴(yán)重的多重共線性時(shí),首先對原始數(shù)據(jù)進(jìn)行主成分分析,提取出若干個(gè)互不相關(guān)的主成分,然后基于這些主成分,再借助于支持向量機(jī)在解決小樣本、非線性及高維度模式識(shí)別中所表現(xiàn)出的眾多優(yōu)勢.來對上市公司的信用風(fēng)險(xiǎn)進(jìn)行預(yù)測。實(shí)證結(jié)果表明:本文提出的主成分分析+支持向量機(jī)(PCA-SVM)的方法,其預(yù)測效果要高于傳統(tǒng)的主成分分析+logistic回歸方法(PCA-logistic),以及傳統(tǒng)的支持向量機(jī)方法( SVM)。
主成分分析及支持向量機(jī)方法
主成分分析方法。在回歸分析中,當(dāng)解釋變量個(gè)數(shù)較多且存在多重共線性時(shí),傳統(tǒng)的回歸方法的擬合優(yōu)度會(huì)比較低。一種常用的方法是主成分分析(PCA),將多個(gè)原始變量進(jìn)行旋轉(zhuǎn)壓縮,提取出幾個(gè)彼此不相關(guān)的主成分作為新變量,從而起到降維的作用,并能充分利用數(shù)據(jù)的信息。
支持向量機(jī)方法。支持向量機(jī)(SVM)是一種專門解決小樣本統(tǒng)計(jì)學(xué)習(xí)規(guī)律的方法,它的核心是引入核映射的思想與結(jié)構(gòu)風(fēng)險(xiǎn)的概念,其基本模型是定義在特征空間上的間隔最大的線性分類器。支持向量機(jī)的學(xué)習(xí)策略就是間隔最大化,其學(xué)習(xí)方法包含建構(gòu)由簡至繁的模型:線性可分支持向量機(jī),線性支持向量機(jī)及非線性支持向量機(jī)。目前,該方法已經(jīng)廣泛應(yīng)用于經(jīng)濟(jì)、金融、物理、工程等領(lǐng)域。
實(shí)證分析
數(shù)據(jù)的采集
本文選擇上市公司財(cái)務(wù)指標(biāo)來研究企業(yè)信用風(fēng)險(xiǎn),并用被特殊處理(ST)的公司作為信用不良的公司,未被特殊處理(非ST)的公司作為信用良好的公司。本文搜集到的數(shù)據(jù)來自國泰安數(shù)據(jù)庫,為2016年1月至12月我國滬市和深市中所有上市公司的財(cái)務(wù)比率數(shù)據(jù),經(jīng)處理缺失值、刪除無記錄公司等處理之后的數(shù)據(jù)集有2664家信用良好的公司,有113家信用不好的公司,為了保證數(shù)據(jù)的平衡性,本文按照1:1的比例隨機(jī)抽選信用良好和信用不好的上市公司,共選擇226家公司,其中,隨機(jī)選取了80家信用良好的公司與80家信用不好的公司作為訓(xùn)練集,用以建立模型;剩下的33個(gè)ST公司及33個(gè)非ST公司作為測試集,用來檢驗(yàn)?zāi)P托Ч?/p>
本文從上市公司的眾多財(cái)務(wù)指標(biāo)中,從七個(gè)方面共選取了31個(gè)財(cái)務(wù)指標(biāo)進(jìn)行研究,從而對上市公司的信用評定進(jìn)行預(yù)測。這31個(gè)財(cái)務(wù)指標(biāo)分別為:償債能力(流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率、利息保障倍數(shù)、資產(chǎn)負(fù)債率、長期資本負(fù)債率),比率結(jié)構(gòu)(流動(dòng)資產(chǎn)比率、固定資產(chǎn)比率、流動(dòng)負(fù)債比率、金融負(fù)債比率),公司的盈利能力(資產(chǎn)報(bào)酬率、投資收益率、總資產(chǎn)凈利潤率、投入資本回報(bào)率、長期資本收益率、營業(yè)毛利率),經(jīng)營能力(應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率),現(xiàn)金流量(營業(yè)收入現(xiàn)金比率、現(xiàn)金適合比率、營運(yùn)指數(shù)),公司發(fā)展能力(可持續(xù)增長率、資本積累率、固定資產(chǎn)增長率、利潤總額增長率、總資產(chǎn)增長率),相對價(jià)值(市盈率、市銷率、市現(xiàn)率)。
基于主成分分析+支持向量機(jī)(PCA-SVM)的信用評定
(1)主成分分析
首先,利用R軟件的cor()函數(shù)查看原始數(shù)據(jù)的相關(guān)系數(shù)矩陣(見表1)。從表1中可以看出,有些變量之間存在很強(qiáng)的相關(guān)關(guān)系,因此,我們需要通過主成分分析對原始數(shù)據(jù)做線性組合,提取主成分,可以在盡量損失較少原始數(shù)據(jù)信息的情況下,有效地對原始數(shù)據(jù)進(jìn)行降維,且所得各個(gè)主成分之間互不相關(guān)。
對訓(xùn)練集數(shù)據(jù)運(yùn)用主成分分析法提取主成分,首先對數(shù)據(jù)做標(biāo)準(zhǔn)化處理,剔除量綱對方差計(jì)算的影響,然后通過主成分旋轉(zhuǎn)使得成分載荷矩陣變得容易解釋,同時(shí)也達(dá)到對成分去噪的效果。本文選擇最通用的方差極大旋轉(zhuǎn)方法,該方法可以對載荷矩陣的列進(jìn)行去噪,使得每個(gè)成分只是由一組有限的變量來解釋。
圖1中展示了基于觀測特征值的碎石檢驗(yàn)(由線段和x符號(hào)組成),根據(jù)100個(gè)隨機(jī)數(shù)據(jù)矩陣推導(dǎo)出來的特征值均值(虛線),以及大于1的特征值準(zhǔn)則(y=l的水平線)。我們提取特征值大于1的主成分,最終選擇提取16個(gè)主成分,其累積解釋程度達(dá)到90.74%,可以很好的代表原始數(shù)據(jù)。
(2)支持向量機(jī)模型的建立
本文借助于R軟件的e1071程序包中的svm()函數(shù),來建立支持向量機(jī)模型,并使用predict()函數(shù)及fitted()函數(shù)來依據(jù)所建立的支持向量機(jī)模型對數(shù)據(jù)進(jìn)行分類。在支持向量機(jī)模型中,核函數(shù)的選擇和分類方式直接影響著支持向量機(jī)的回歸性能的好壞,本文采用C-classification分類方式和徑向基核函數(shù),因?yàn)槭褂肅-classification分類方式和徑向基核函數(shù)的支持向量機(jī),其性能優(yōu)于基于其它分類方式和其它核函數(shù)的支持向量機(jī)。
本文通過tune.svm()函數(shù)來擬合訓(xùn)練集數(shù)據(jù),對模型參數(shù)進(jìn)行自動(dòng)尋優(yōu),找出模型中的最優(yōu)gamma和cost參數(shù):bestgamma=0.25,best cost=4,并建立SVM模型。為檢驗(yàn)所提出的方法的有效性,我們利用所建立的模型對測試集數(shù)據(jù)進(jìn)行預(yù)測和判別,并將預(yù)測結(jié)果和真實(shí)結(jié)果相比較(見表2)。
為衡量不同的方法對上市公司信用評定的判別效果和預(yù)測效果,我們采用下述評價(jià)準(zhǔn)則:
由此可以算出,PCA-SVM方法的預(yù)測精度為0.7879。
基于原始數(shù)據(jù)的支持向量機(jī)(SVM)的信用評定
作為對比,我們基于原始數(shù)據(jù)建立傳統(tǒng)的支持向量機(jī)模型,選用C-classification分類方式和徑向基核函數(shù),采用tune.svm()函數(shù)來對模型參數(shù)進(jìn)行自動(dòng)尋優(yōu),得到模型中的最優(yōu)gamma和cost參數(shù)為:bestgamma=0.5,best cost=4。利用所建立的模型對測試集數(shù)據(jù)進(jìn)行預(yù)測和判別,并將判別結(jié)果亦列于表2,同時(shí)可算得SVM方法的預(yù)測精度為0.6667。
基于主成分分析+logistic( PCA-logistic)的信用評定
作為對比,我們還建立了基于主成分分析與logistic回歸分析的模型來對上市公司的信用評價(jià)進(jìn)行了判別和預(yù)測,其結(jié)果亦列于表2中,并計(jì)算出該方法的預(yù)測精度為0.6212.
從表2可以看出:(1)基于原始數(shù)據(jù)的支持向量機(jī)方法,與基于主成分分析的支持向量機(jī)方法相比,后者的判別效果更好,預(yù)測精度更高。這是由于影響上市公司信用的31個(gè)財(cái)務(wù)指標(biāo)存在多重共線性和高度相關(guān),我們先采用主成分分析,可以有效地減少多重共線性對分析結(jié)果的影響;(2)采用主成分分析后.支持向量機(jī)模型的判別效果比logistic回歸模型的判別效果好,這說明在上市公司的信用風(fēng)險(xiǎn)評價(jià)問題上,使用主成分分析進(jìn)行降維后,再利用支持向量機(jī)的方法進(jìn)行預(yù)測有一定的優(yōu)勢,能夠提高預(yù)測精度,擁有更好的預(yù)測性能。
由于影響上市公司信用評價(jià)的財(cái)務(wù)指標(biāo)較多,且存在嚴(yán)重的多重共線性,我們利用主成分分析方法,對原始數(shù)據(jù)進(jìn)行降維處理,選取了16個(gè)主成分,其對原數(shù)據(jù)累積方差解釋性達(dá)到90.74%。作為對比,我們分別采用了三種方法對上市公司的信用風(fēng)險(xiǎn)進(jìn)行預(yù)測:基于主成分的支持向量機(jī)方法、基于主成分的logistic回歸分析方法、基于原始數(shù)據(jù)的支持向量機(jī)方法。實(shí)證結(jié)果表明:以上三種方法中,PCA-SVM的方法更具備有效性和優(yōu)越性,其預(yù)測精度要明顯高于SVM和PCA-logistic方法。由此可以預(yù)期:PCA-SVM方法在諸如上市公司、企業(yè)、個(gè)人、銀行等對象的信用風(fēng)險(xiǎn)測評方面會(huì)有良好的應(yīng)用前景。