◎黃詩(shī)蘊(yùn)
基于支持向量機(jī)的上市公司投資回報(bào)預(yù)測(cè)
◎黃詩(shī)蘊(yùn)
該文先利用SPSS因子分析確定影響較大的財(cái)務(wù)指標(biāo),然后采用支持向量機(jī)(SVM)來(lái)處理上市公司財(cái)務(wù)指標(biāo)數(shù)據(jù),較客觀地預(yù)測(cè)上市公司的投入資本回報(bào)率(ROIC),為投資人的決策提供支持。
支持向量機(jī)(SVM)是在高位特征空間使用線性函數(shù)假設(shè)空間的學(xué)習(xí)系統(tǒng),它由一個(gè)來(lái)自最優(yōu)化理論的學(xué)習(xí)算法訓(xùn)練,該算法實(shí)現(xiàn)了一個(gè)由統(tǒng)計(jì)學(xué)習(xí)理論導(dǎo)出的學(xué)習(xí)偏置。此學(xué)習(xí)策略由Vapnik和他的合作者提出,是一個(gè)準(zhǔn)則性的并且強(qiáng)有力的方法。
風(fēng)險(xiǎn)度量是風(fēng)險(xiǎn)投資中的重要組成部分,能否對(duì)投資回報(bào)率進(jìn)行準(zhǔn)確估計(jì)關(guān)系到整個(gè)風(fēng)險(xiǎn)管理體系的成敗。我們可以將上市公司的投資回報(bào)率劃分為若干檔,如0%~5%檔、5%~10%檔、10%以上檔。利用支持向量機(jī)預(yù)測(cè)上市公司投資回報(bào)率的所屬檔位,從而進(jìn)行風(fēng)險(xiǎn)控制。
樣本的選擇。本文選擇了2013年年報(bào)4386家上市公司的財(cái)務(wù)指標(biāo),去除缺失部分指標(biāo)的公司后剩余798家上市公司作為樣本。之所以選擇2013披露的年度報(bào)告是因?yàn)樵摃r(shí)間段股市相對(duì)比較平穩(wěn),能夠較好地避免極端因素對(duì)預(yù)測(cè)結(jié)果的影響。以上數(shù)據(jù)全部從銳思數(shù)據(jù)庫(kù)獲得。
變量的選擇。本文首先將全部財(cái)務(wù)指標(biāo)(共50個(gè))導(dǎo)入SPSS中進(jìn)行因子分析。結(jié)果顯示14個(gè)因子可解釋76.11%的方差。通過(guò)旋轉(zhuǎn)成分矩陣,本文選取了每個(gè)因子中載荷較高的指標(biāo)作為預(yù)測(cè)模型中的變量,其中因變量選取了載荷最高的投入資產(chǎn)回報(bào)率(ROIC),其余13個(gè)成分為自變量因子。成分1為產(chǎn)權(quán)比率(%)_Dbequrt;成分2為經(jīng)營(yíng)活動(dòng)盈利能力指標(biāo)(包括銷(xiāo)售凈利率(TTM)(%)_NetprfrtTTM,成本費(fèi)用利潤(rùn)率(%)_Totprfcostrt);成分3為現(xiàn)金流與償還短期負(fù)債能力指標(biāo)(包括經(jīng)營(yíng)凈現(xiàn)金流量/負(fù)債合計(jì)_NOCFtotlia,成本費(fèi)用利潤(rùn)率(%)_Totprfcostrt);成分4為總資產(chǎn)周轉(zhuǎn)率(次)_Totassrat;成分5為流動(dòng)比率(%)_ Currt;成分6為股利支付率(%)_Divprt;成分7為扣除非經(jīng)常損益后的凈利潤(rùn)/凈利潤(rùn)_Nprfcutnprf;成分8為歸屬母公司股東的凈利潤(rùn)/凈利潤(rùn)_NPPCNPDP;成分9為凈利潤(rùn)/利潤(rùn)總額_NPTPDP;成分10為賒銷(xiāo)管理能力指標(biāo)(包括長(zhǎng)期負(fù)債與營(yíng)運(yùn)資金比率(%)_Ldbwrkcap,應(yīng)收賬款周轉(zhuǎn)率(次)_ARTrat,流動(dòng)資產(chǎn)/總資產(chǎn)_Curtotast)成分11為年換手率YrFulTurnR;成分12為營(yíng)業(yè)利潤(rùn)增長(zhǎng)率(%)_Opeprfgrrt;成分13為利息保障倍數(shù)_Intcvr。
基本原理。通過(guò)使用Matlab關(guān)于向量機(jī)的核心函數(shù)SVMTRAIN與SVMCLASSIFY,對(duì)數(shù)據(jù)進(jìn)行分析。先使用SVMTRAIN函數(shù),它可以使用訓(xùn)練矩陣數(shù)據(jù)樣本進(jìn)行函數(shù)擬合。然后用SVMCLASSIFY函數(shù)對(duì)測(cè)試樣本進(jìn)行分類(lèi),預(yù)測(cè)結(jié)果。測(cè)試結(jié)果分為三類(lèi),0%~5%(不含)的標(biāo)記為1,5%~10%(不含)的標(biāo)記為2,10%以上的標(biāo)記為3。
操作方法。本文首先選取了3.4%的樣本(共27個(gè))作為測(cè)試樣本,其余作為訓(xùn)練樣本進(jìn)行實(shí)驗(yàn)。核函數(shù)分別選取了多項(xiàng)式核函數(shù)(Polynomial)、徑向基核函數(shù)(RBF)、Quadratic核函數(shù)與線性核函數(shù)(linear)進(jìn)行訓(xùn)練,得到如下結(jié)果(表1)。使用polynomial核函數(shù)的準(zhǔn)確率為85.19%,RBF核函數(shù)準(zhǔn)確率為62.96%,使用quadratic核函數(shù)的準(zhǔn)確率為81.48%,而使用線性核函數(shù)的預(yù)測(cè)準(zhǔn)確度最高,為96.29%。
表1:選取不同核函數(shù)的向量機(jī)方法下的預(yù)測(cè)結(jié)果(部分)
復(fù)核。重新隨機(jī)選取12%的數(shù)據(jù)為測(cè)試樣本,其余為訓(xùn)練樣本,用線性核函數(shù)進(jìn)行訓(xùn)練。結(jié)果表明,在增大了測(cè)試樣本減少了訓(xùn)練樣本的情況下,使用線性核函數(shù)的準(zhǔn)確率依然很高,為98.0%。因此選用線性核函數(shù)為SVMTRAIN中Kernal Funtion參數(shù)的值。
支持向量機(jī)技術(shù)可對(duì)上市公司投入資產(chǎn)回報(bào)率進(jìn)行有效的識(shí)別與分類(lèi)。以各方面的財(cái)務(wù)指標(biāo)作為自變量,以投資回報(bào)率作為因變量進(jìn)行預(yù)測(cè)。選用線性核函數(shù)訓(xùn)練的準(zhǔn)確度在90%以上,表現(xiàn)出向量機(jī)對(duì)有限樣本的良好泛化能力。我們可以在已知上市公司部分財(cái)務(wù)指標(biāo)的情況下,應(yīng)用這個(gè)方法判斷企業(yè)的投資回報(bào)率,從而為投資決策提供參考,一定程度上減小了投資風(fēng)險(xiǎn)。
行業(yè)間財(cái)務(wù)指標(biāo)的數(shù)據(jù)是存在差異的,不同行業(yè)間,理想的存貨周轉(zhuǎn)率、流動(dòng)比率等的理想值是不同的。要提高預(yù)測(cè)精度,可以分開(kāi)行業(yè)進(jìn)行預(yù)測(cè)。每個(gè)行業(yè)的前景也不一樣,應(yīng)該結(jié)合政策等具體分析。
本方法也存在一定缺陷。首先我們難以獲知公司每時(shí)每刻的財(cái)務(wù)指標(biāo),只有等到期末才有正式的披露。同時(shí),數(shù)據(jù)可能存在一定程度的粉飾和虛假,誤導(dǎo)投資決策行為。在預(yù)測(cè)結(jié)果中,存在一些誤差很大的異常值,可能和公司經(jīng)營(yíng)的微觀因素有關(guān)。因此,決策時(shí)需要多方面考慮,不要局限于對(duì)外披露數(shù)據(jù)的分析,而要深入調(diào)查公司情況。
(作者單位:北京科技大學(xué))