吳慶賀 唐曉華 林宇
【摘要】以我國(guó)創(chuàng)業(yè)板上市公司為研究對(duì)象,針對(duì)公司不同財(cái)務(wù)狀況構(gòu)成的非均衡樣本特性,運(yùn)用Twin-SVM來(lái)構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型。實(shí)證結(jié)果表明:在Twin-SVM模型的構(gòu)建過(guò)程中,RBF核函數(shù)展示出比Linear、Polynomial、Sigmoid、Wavelet核函數(shù)更為優(yōu)異的預(yù)測(cè)性能;與改進(jìn)的ODR-ADASYNSVM、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法和K近鄰法相比,Twin-SVM不僅在預(yù)測(cè)精度上高于其他模型,而且在預(yù)測(cè)穩(wěn)健性上也顯著更為優(yōu)越,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)的泛化性能也顯著優(yōu)越于其余模型。
【關(guān)鍵詞】財(cái)務(wù)危機(jī)預(yù)警;Twin-SVM;創(chuàng)業(yè)板;上市公司;非均衡樣本
【中圖分類(lèi)號(hào)】F275【文獻(xiàn)標(biāo)識(shí)碼】A【文章編號(hào)】1004-0994(2020)02-0056-9
【基金項(xiàng)目】國(guó)家自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào):71771032);四川省應(yīng)用基礎(chǔ)研究項(xiàng)目(項(xiàng)目編號(hào):2017JY0158)
一、引言
上市公司作為實(shí)體經(jīng)濟(jì)的典型代表,一旦發(fā)生財(cái)務(wù)危機(jī),不僅自身會(huì)遭受巨大損失,讓投資者利益嚴(yán)重受損,甚至可能對(duì)整個(gè)平穩(wěn)發(fā)展的經(jīng)濟(jì)社會(huì)造成巨大沖擊[1,2]。只有科學(xué)地展開(kāi)對(duì)我國(guó)上市公司財(cái)務(wù)危機(jī)識(shí)別和預(yù)警的研究,才能及時(shí)發(fā)現(xiàn)財(cái)務(wù)危機(jī)的誘因并采取有效的防范措施,避免造成不可挽回的損失。因此,探討并建立一個(gè)合理有效的財(cái)務(wù)危機(jī)預(yù)警機(jī)制,無(wú)論是對(duì)我國(guó)經(jīng)濟(jì)還是對(duì)上市公司發(fā)展而言,都意義重大。
特別是對(duì)我國(guó)創(chuàng)業(yè)板上市公司而言,創(chuàng)業(yè)板是專(zhuān)門(mén)向高科技、高成長(zhǎng)企業(yè)提供融資途徑和成長(zhǎng)空間的證券交易市場(chǎng),但是由于我國(guó)創(chuàng)業(yè)板存在著上市門(mén)檻低、企業(yè)股本小、抵御風(fēng)險(xiǎn)能力弱等問(wèn)題,加上創(chuàng)業(yè)板市場(chǎng)成立時(shí)間較短,相應(yīng)的法律法規(guī)以及政策制度還不夠完善,公司上市后業(yè)績(jī)嚴(yán)重下滑的現(xiàn)象頻頻發(fā)生[3]?;谝陨弦蛩兀覈?guó)創(chuàng)業(yè)板上市公司面臨較大的財(cái)務(wù)風(fēng)險(xiǎn)且較易發(fā)生財(cái)務(wù)危機(jī)。為使我國(guó)創(chuàng)業(yè)板健康穩(wěn)定地成長(zhǎng)并有效地輔助公司經(jīng)營(yíng)者及監(jiān)管層防范和化解風(fēng)險(xiǎn)與危機(jī),建立科學(xué)的創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警模型,是一個(gè)值得關(guān)注的問(wèn)題。
財(cái)務(wù)危機(jī)預(yù)警長(zhǎng)期以來(lái)都是學(xué)術(shù)界關(guān)注的焦點(diǎn)與熱點(diǎn),相關(guān)文獻(xiàn)比較多見(jiàn)。有學(xué)者運(yùn)用單變量模型對(duì)財(cái)務(wù)危機(jī)預(yù)警展開(kāi)研究[4],但一家企業(yè)的財(cái)務(wù)狀況不是僅用一個(gè)指標(biāo)就可以評(píng)判的,因此這類(lèi)模型逐漸被其他模型所取代;其后有學(xué)者引入多元變量模型[5],但多元變量模型的前提條件過(guò)于嚴(yán)格,要求解釋變量與被解釋變量呈線(xiàn)性關(guān)系,各變量間相互獨(dú)立,且要求殘差服從正態(tài)分布;也有學(xué)者采用Logistic回歸模型進(jìn)行財(cái)務(wù)危機(jī)預(yù)警研究[6-8],但Logistic回歸模型一般用于解決二分類(lèi)問(wèn)題,也要求解釋變量與被解釋變量存在線(xiàn)性關(guān)系;而后有學(xué)者采用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行財(cái)務(wù)危機(jī)預(yù)警研究[9],該類(lèi)模型采用的是局部搜索的優(yōu)化方法,容易造成局部極小的問(wèn)題。令人欣慰的是,Vapnik[10]提出的支持向量機(jī)(Support Vector Machine,SVM)恰好具有解決以上模型存在問(wèn)題的突出優(yōu)勢(shì),具有更為優(yōu)異的學(xué)習(xí)能力和泛化推廣性能,其一經(jīng)提出便受到學(xué)術(shù)界眾多學(xué)者青睞并被廣泛運(yùn)用于風(fēng)險(xiǎn)預(yù)警等研究中[11,12]。
必須指出的是,無(wú)論是在醫(yī)學(xué)領(lǐng)域、信息領(lǐng)域還是金融領(lǐng)域,樣本集往往呈現(xiàn)偏態(tài)的特征,即兩類(lèi)樣本數(shù)目往往是不等的。這種非均衡樣本所訓(xùn)練出的模型得到的分類(lèi)結(jié)果會(huì)具有明顯的偏向性,即對(duì)多數(shù)類(lèi)樣本預(yù)測(cè)準(zhǔn)確率高,對(duì)少數(shù)類(lèi)樣本預(yù)測(cè)準(zhǔn)確率較低。而傳統(tǒng)SVM的良好預(yù)測(cè)性能往往要求兩類(lèi)樣本是均衡的[12,13],但是發(fā)生財(cái)務(wù)危機(jī)的上市公司畢竟只是少數(shù),財(cái)務(wù)正常的上市公司占多數(shù),這就必然導(dǎo)致兩類(lèi)樣本不均衡,從而使得SVM所構(gòu)建的分類(lèi)超平面會(huì)偏向財(cái)務(wù)危機(jī)樣本一邊,進(jìn)而導(dǎo)致模型的預(yù)測(cè)效果不盡人意。
于是,有學(xué)者從數(shù)據(jù)層面和算法層面對(duì)非均衡樣本進(jìn)行了研究。欠采樣(Under-sampling)和過(guò)采樣(Over-sampling)是常用的將非均衡樣本處理為均衡樣本的方法,但是欠采樣方法在刪除多數(shù)類(lèi)樣本時(shí)可能會(huì)將影響分類(lèi)的有效信息誤刪,最終造成預(yù)測(cè)效果不理想。過(guò)采樣則是通過(guò)增加少數(shù)類(lèi)的樣本使兩類(lèi)樣本數(shù)目達(dá)到均衡,但增加的樣本可能造成少數(shù)類(lèi)樣本的相互重疊,也未必能進(jìn)一步提升模型預(yù)測(cè)結(jié)果的準(zhǔn)確性[13]。而后有學(xué)者將處理非均衡樣本的方法與SVM相結(jié)合進(jìn)行研究,如衣柏衡等[14]提出了改進(jìn)的SMOTE與SVM相結(jié)合的方法,在面對(duì)非均衡樣本時(shí),生成一定數(shù)量的少數(shù)類(lèi)樣本來(lái)進(jìn)行平衡處理,但令人遺憾的是,利用SMOTE對(duì)少數(shù)類(lèi)樣本進(jìn)行處理,無(wú)法消除多數(shù)類(lèi)樣本中的噪聲信息,容易造成新生成樣本重疊的問(wèn)題[15]。林宇等[12]將自適應(yīng)合成抽樣方法(ADASYN)和逐級(jí)優(yōu)化遞減欠采樣方法(ODR)與SVM相結(jié)合,構(gòu)建ODRADASYN-SVM模型對(duì)極端金融風(fēng)險(xiǎn)進(jìn)行了預(yù)警研究,但這種做法可能會(huì)破壞原始數(shù)據(jù)的結(jié)構(gòu)且違背研究的可重復(fù)性原則,特別地,由于該方法的訓(xùn)練樣本與原始數(shù)據(jù)有偏,其模型的解釋性也容易受到質(zhì)疑[16]。
令人驚喜的是,Twin-SVM[17]的提出從根本上解決了非均衡樣本的問(wèn)題,Twin-SVM不必增加或減少原始樣本,而是為上市公司財(cái)務(wù)正常樣本與財(cái)務(wù)危機(jī)樣本分別構(gòu)造一個(gè)分類(lèi)超平面,使每個(gè)分類(lèi)超平面離本類(lèi)樣本點(diǎn)盡可能近而離另一類(lèi)樣本點(diǎn)盡可能遠(yuǎn),將一個(gè)大的分類(lèi)問(wèn)題轉(zhuǎn)換成求解兩個(gè)小的分類(lèi)問(wèn)題,從而約束條件數(shù)目將減少,模型訓(xùn)練時(shí)間縮短,Twin-SVM的分類(lèi)靈活性及計(jì)算性能將大大提高,從而行之有效地克服了傳統(tǒng)SVM的根本缺陷[11,18]。因此,本文引入Twin-SVM對(duì)創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)進(jìn)行預(yù)警研究。
從目前所掌握的文獻(xiàn)來(lái)看,對(duì)于Twin-SVM的研究主要集中在算法的優(yōu)化改進(jìn)、圖像識(shí)別以及金融風(fēng)險(xiǎn)的預(yù)警等方面,并未發(fā)現(xiàn)將其應(yīng)用于財(cái)務(wù)危機(jī)預(yù)警的實(shí)證研究;在Twin-SVM的核函數(shù)選擇上,以往學(xué)者大多是選擇RBF,而未對(duì)不同核函數(shù)下Twin-SVM模型的預(yù)測(cè)性能進(jìn)行探討;以往的文獻(xiàn)在對(duì)創(chuàng)業(yè)板上市公司進(jìn)行財(cái)務(wù)預(yù)測(cè)時(shí),并沒(méi)有針對(duì)創(chuàng)業(yè)板中的分行業(yè)進(jìn)行模型的泛化性能探討。
基于以上分析,本文以我國(guó)創(chuàng)業(yè)板上市公司為研究對(duì)象,基于扣除非經(jīng)常性損益后的凈利潤(rùn)和凈資產(chǎn)增長(zhǎng)率構(gòu)建財(cái)務(wù)危機(jī)的識(shí)別方法,從而確定了財(cái)務(wù)正常和財(cái)務(wù)危機(jī)樣本。對(duì)所選取的31個(gè)財(cái)務(wù)指標(biāo),運(yùn)用顯著性檢驗(yàn)、相關(guān)性分析、共線(xiàn)性診斷和逐步回歸提取出最具解釋能力的財(cái)務(wù)指標(biāo)作為模型的最終輸入變量,以此避免維數(shù)災(zāi)難和過(guò)擬合的問(wèn)題。首先,對(duì)不同核函數(shù)下的Twin-SVM模型進(jìn)行預(yù)測(cè)性能對(duì)比來(lái)確定最優(yōu)的核函數(shù);然后采用分類(lèi)準(zhǔn)確率、幾何平均正確率G、少數(shù)類(lèi)的度量值F對(duì)在不同樣本劃分比例下的Twin-SVM、ODR-ADASYNSVM、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法以及K近鄰法的預(yù)測(cè)精度及穩(wěn)健性進(jìn)行對(duì)比,運(yùn)用配對(duì)樣本T檢驗(yàn)對(duì)各模型預(yù)測(cè)精度的差異性進(jìn)行顯著性檢驗(yàn);最后,對(duì)制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)下不同預(yù)警模型的泛化性能進(jìn)行對(duì)比研究。希望能為公司經(jīng)營(yíng)者以及監(jiān)管層防范和化解風(fēng)險(xiǎn)與危機(jī)提供良好的借鑒,為投資者減小損失提供合適的操作工具。
二、研究方法
2.財(cái)務(wù)危機(jī)識(shí)別方法。構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型的關(guān)鍵之一在于如何識(shí)別上市公司是否發(fā)生財(cái)務(wù)危機(jī)。從主板和中小板來(lái)看,Geng等[19]、Chu等[20]將被ST和非ST作為是否陷入財(cái)務(wù)危機(jī)的識(shí)別標(biāo)志,但是創(chuàng)業(yè)板不同于主板和中小板存在“ST”和“ST”這樣的過(guò)渡階段,對(duì)于存在財(cái)務(wù)危機(jī)的企業(yè)直接作暫停上市處理。因此,在對(duì)創(chuàng)業(yè)板上市公司進(jìn)行財(cái)務(wù)危機(jī)預(yù)警研究時(shí),不能繼續(xù)沿用以往的標(biāo)準(zhǔn)。從已有的研究創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警的文獻(xiàn)來(lái)看,岑慧[21]以四種情況作為界定標(biāo)準(zhǔn):一是凈利潤(rùn)為負(fù),二是凈資產(chǎn)為負(fù),三是審計(jì)報(bào)告為非標(biāo)意見(jiàn),四是營(yíng)業(yè)利潤(rùn)增長(zhǎng)率為負(fù);宋寶珠[8]以?xún)煞N情況作為界定標(biāo)準(zhǔn):一是連續(xù)兩個(gè)年度凈利潤(rùn)為負(fù),二是凈資產(chǎn)在最近一個(gè)會(huì)計(jì)年度為負(fù)。
由此,本文發(fā)現(xiàn)以往學(xué)者在識(shí)別創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)時(shí)往往以?xún)衾麧?rùn)和凈資產(chǎn)作為標(biāo)準(zhǔn),但是僅將凈利潤(rùn)為負(fù)作為界定標(biāo)準(zhǔn),缺少一定合理性。因?yàn)橐恍┢髽I(yè)雖然經(jīng)營(yíng)困難、陷入財(cái)務(wù)危機(jī),但是因獲得政府或者銀行補(bǔ)助而得以繼續(xù)生存,因此,本文將扣除非經(jīng)常性損益后的凈利潤(rùn)作為凈利潤(rùn)的替代標(biāo)準(zhǔn)。最終本文將陷入財(cái)務(wù)危機(jī)的識(shí)別標(biāo)準(zhǔn)界定為:一是最近一個(gè)會(huì)計(jì)年度扣除非經(jīng)常性損益的凈利潤(rùn)為負(fù);二是最近一個(gè)會(huì)計(jì)年度期末凈資產(chǎn)增長(zhǎng)率為負(fù)。
對(duì)于一家上市公司,一旦同時(shí)達(dá)到上述兩個(gè)門(mén)檻,則被識(shí)別為財(cái)務(wù)危機(jī)樣本;反之,則被識(shí)別為財(cái)務(wù)正常樣本。
3.財(cái)務(wù)危機(jī)預(yù)警模型的性能評(píng)估方法。為了更全面地評(píng)估Twin-SVM財(cái)務(wù)危機(jī)預(yù)警模型的綜合性能,不僅要評(píng)估模型的預(yù)測(cè)性能是否優(yōu)越,還要對(duì)模型的穩(wěn)健性進(jìn)行研究,考察其在樣本劃分比例不同的情況下是否依然能保持優(yōu)越的預(yù)測(cè)性能。本文首先運(yùn)用傳統(tǒng)的分類(lèi)正確率對(duì)總體的分類(lèi)準(zhǔn)確率進(jìn)行考察,再進(jìn)一步借鑒相關(guān)文獻(xiàn)[15],運(yùn)用針對(duì)非均衡樣本的評(píng)估指標(biāo)對(duì)Twin-SVM財(cái)務(wù)危機(jī)預(yù)警模型進(jìn)行預(yù)測(cè)精度的評(píng)估。分類(lèi)正確率即總的預(yù)測(cè)正確的樣本數(shù)占總體樣本數(shù)的比例,針對(duì)非均衡樣本分類(lèi)的評(píng)估指標(biāo)則是幾何平均正確率Gmean和少數(shù)類(lèi)的度量值Fmeasure(以下用G和F分別代替Gmean和Fmeasure)。G和F評(píng)估指標(biāo)的構(gòu)建過(guò)程具體闡述如下:
設(shè)TP和TN分別表示將財(cái)務(wù)危機(jī)樣本和財(cái)務(wù)正常樣本預(yù)測(cè)正確的數(shù)量,F(xiàn)N和FP分別表示將財(cái)務(wù)危機(jī)樣本和財(cái)務(wù)正常樣本預(yù)測(cè)錯(cuò)誤的數(shù)量?;煜仃嚤硎緦?duì)測(cè)試集進(jìn)行預(yù)測(cè)分類(lèi)的結(jié)果(見(jiàn)表1)。
于是,通過(guò)計(jì)算式(20)、(21)和(22)中的分類(lèi)準(zhǔn)確率、幾何平均正確率G及少數(shù)類(lèi)的度量值F,本文就能對(duì)所構(gòu)建的Twin-SVM模型的預(yù)測(cè)性能進(jìn)行準(zhǔn)確的評(píng)價(jià)。G值越大,表示對(duì)財(cái)務(wù)正常和財(cái)務(wù)危機(jī)兩類(lèi)樣本的綜合預(yù)測(cè)性能越優(yōu)異;F值越大,表示對(duì)財(cái)務(wù)危機(jī)樣本的預(yù)測(cè)精度越高,反之亦然。
三、實(shí)證結(jié)果與分析
1.樣本選擇及數(shù)據(jù)處理。由于本文在設(shè)計(jì)創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警模型時(shí),選擇滯后狀態(tài)指標(biāo)一個(gè)警度時(shí)差,且根據(jù)創(chuàng)業(yè)板股票上市規(guī)則,最近連續(xù)虧損三年的公司會(huì)被進(jìn)行退市處理,因此早期的預(yù)測(cè)就能夠保證企業(yè)在應(yīng)對(duì)危機(jī)時(shí)抓住有利時(shí)機(jī),采取有效措施,最大限度地減少相關(guān)損失。為保證對(duì)上市公司財(cái)務(wù)危機(jī)預(yù)警的前瞻性與時(shí)效性,本文對(duì)2018年前三年即2016 ~ 2018年的警度進(jìn)行研究,從而應(yīng)選擇2015 ~ 2017年的數(shù)據(jù)。在剔除了數(shù)據(jù)存在缺失的樣本后,共得到655家樣本公司。從三年的數(shù)據(jù)樣本中分別隨機(jī)抽取等比例的數(shù)據(jù)組成訓(xùn)練集和測(cè)試集,經(jīng)統(tǒng)計(jì)發(fā)現(xiàn)三年樣本中財(cái)務(wù)正常樣本和財(cái)務(wù)危機(jī)樣本的比例超過(guò)10∶1,構(gòu)成嚴(yán)重的非均衡樣本。本文所有數(shù)據(jù)都來(lái)源于Wind數(shù)據(jù)庫(kù)。
2.特征指標(biāo)的篩選。對(duì)引發(fā)財(cái)務(wù)危機(jī)的特征指標(biāo)進(jìn)行準(zhǔn)確提取,是構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型的重要步驟。由于在對(duì)模型的輸入變量即財(cái)務(wù)指標(biāo)的選取上暫未得到定論[22],因此本文借鑒以往研究文獻(xiàn)[19,23]并參考公司業(yè)績(jī)綜合評(píng)價(jià)指標(biāo)體系,從盈利能力、現(xiàn)金流量、營(yíng)運(yùn)能力、成長(zhǎng)能力和償債能力五個(gè)方面挑選出31個(gè)財(cái)務(wù)指標(biāo)(模型的特征指標(biāo)見(jiàn)表2)。
為篩選出能顯著區(qū)分危機(jī)狀態(tài)的財(cái)務(wù)指標(biāo),本文借鑒相關(guān)文獻(xiàn)[12,23,24],分別對(duì)符合正態(tài)分布和非正態(tài)分布的變量采用T檢驗(yàn)和U檢驗(yàn),將未能通過(guò)顯著性檢驗(yàn)的指標(biāo)(X12)予以剔除。進(jìn)一步,為避免指標(biāo)間的共線(xiàn)性問(wèn)題對(duì)模型的擬合效果產(chǎn)生影響,本文借鑒相關(guān)研究[23,25],運(yùn)用相關(guān)性分析和共線(xiàn)性診斷對(duì)30個(gè)留存變量進(jìn)行分析,最終剔除了6個(gè)指標(biāo)(X2、X3、X7、X8、X27和X28)。為更近一步提取出對(duì)狀態(tài)指標(biāo)變量有更強(qiáng)解釋力的特征變量,借鑒以往學(xué)者的研究[22],采用逐步回歸(Stepwise Regression)對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的處理,最終將24個(gè)特征指標(biāo)約簡(jiǎn)為7個(gè)特征指標(biāo),分別為:X1(平均凈資產(chǎn)收益率)、X11(全部資產(chǎn)現(xiàn)金回收率)、X16(非流動(dòng)資產(chǎn)周轉(zhuǎn)率)、X17(固定資產(chǎn)周轉(zhuǎn)率)、X18(應(yīng)收賬款周轉(zhuǎn)率)、X21(營(yíng)業(yè)總收入)和X26(流動(dòng)比率)。至此,已完成對(duì)創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警模型特征指標(biāo)的篩選。
3.不同核函數(shù)下Twin-SVM模型的預(yù)測(cè)性能對(duì)比?;诓煌撕瘮?shù)的Twin-SVM財(cái)務(wù)危機(jī)預(yù)警模型具有不同的預(yù)測(cè)性能,倘若無(wú)法確定最優(yōu)的核函數(shù),就無(wú)法獲得性能優(yōu)越的預(yù)警模型。本文采用5折交叉驗(yàn)證法(Cross Validation,CV)下G值、F值以及分類(lèi)準(zhǔn)確率對(duì)Twin-SVM創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警模型的最優(yōu)核函數(shù)進(jìn)行確定。實(shí)驗(yàn)結(jié)果見(jiàn)表3。
從表3可看出,依次將5種核函數(shù)與Twin-SVM模型結(jié)合后,RBF核函數(shù)的G值(0.6681)和F值(0.3586)顯著高于其余4種核函數(shù)。雖然RBF核函數(shù)的分類(lèi)準(zhǔn)確率(0.8616)略低于其余核函數(shù),但是究其原因是其余核函數(shù)所構(gòu)成的模型將大量財(cái)務(wù)危機(jī)樣本錯(cuò)誤預(yù)測(cè)為財(cái)務(wù)正常樣本,財(cái)務(wù)危機(jī)樣本僅占總體樣本的一小部分。而把財(cái)務(wù)危機(jī)樣本錯(cuò)誤預(yù)測(cè)為財(cái)務(wù)正常樣本所產(chǎn)生的危害是遠(yuǎn)大于把財(cái)務(wù)正常樣本錯(cuò)誤預(yù)測(cè)為財(cái)務(wù)危機(jī)樣本的。因此,將RBF核函數(shù)與Twin-SVM結(jié)合后的預(yù)測(cè)性能是顯著優(yōu)于其余核函數(shù)的,本文采用RBF作為T(mén)win-SVM的核函數(shù)。
同時(shí),為了直觀(guān)地展現(xiàn)在創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警研究中最優(yōu)核函數(shù)RBF下Twin-SVM預(yù)警模型的參數(shù)效果圖,本文在將RBF核參數(shù)設(shè)定為0.8的基礎(chǔ)上,讓Twin-SVM模型本身的參數(shù)c1在{0.001,0.01,0.1,1,10}區(qū)間取值、c2在{0.005,0.05,0.5,5,50}區(qū)間取值,來(lái)研究不同參數(shù)下預(yù)警模型的預(yù)測(cè)性能。實(shí)驗(yàn)結(jié)果如圖1所示。
從圖1中可看出,RBF核函數(shù)下Twin-SVM預(yù)警模型在不同的參數(shù)下取得了差異較大的預(yù)測(cè)效果。從更為綜合的評(píng)價(jià)指標(biāo)G值和F值來(lái)看,大多數(shù)情況下,Twin-SVM模型的預(yù)測(cè)效果隨c1和c2的變動(dòng)呈現(xiàn)同增或同減的變動(dòng)趨勢(shì);而從分類(lèi)準(zhǔn)確率來(lái)看,大多數(shù)情況下,c1取值較小且c2取值較大時(shí),整體的分類(lèi)準(zhǔn)確率都較低,這是因?yàn)楫?dāng)c1取值較小時(shí),對(duì)財(cái)務(wù)危機(jī)樣本進(jìn)行預(yù)測(cè)的容錯(cuò)率較低,會(huì)將大量的財(cái)務(wù)正常樣本錯(cuò)誤劃分,導(dǎo)致對(duì)財(cái)務(wù)危機(jī)樣本預(yù)測(cè)準(zhǔn)確率較高,而整體的分類(lèi)準(zhǔn)確率都較低。倘若c1取值較大而c2取值較小時(shí),分類(lèi)準(zhǔn)確率提高,但是此時(shí)G值和F值較低,即將大量財(cái)務(wù)危機(jī)樣本錯(cuò)誤劃分。因此,在參數(shù)選取上不僅要考慮財(cái)務(wù)危機(jī)樣本的分類(lèi)準(zhǔn)確率,也要關(guān)注整體樣本的分類(lèi)準(zhǔn)確率。進(jìn)一步發(fā)現(xiàn),在c1和c2分別取0.01和0.5時(shí),無(wú)論是G值、F值還是分類(lèi)準(zhǔn)確率都取得了較好的效果。由此,本文所使用的RBF核函數(shù)下Twin-SVM模型的參數(shù)設(shè)置是準(zhǔn)確且可靠的。
4.不同預(yù)警模型的預(yù)測(cè)性能對(duì)比。在確定了Twin-SVM預(yù)警模型的最優(yōu)核函數(shù)以及模型參數(shù)之后,就要對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)估。為了避免數(shù)據(jù)的隨機(jī)選取造成偶然性結(jié)果,也為了避免模型過(guò)擬合和欠擬合的問(wèn)題,本文借鑒相關(guān)文獻(xiàn)[19],采用不同劃分比例(6∶4、7∶3、8∶2、9∶1)的訓(xùn)練集和測(cè)試集分別進(jìn)行訓(xùn)練和預(yù)測(cè)。在將經(jīng)篩選后的特征指標(biāo)作為輸入指標(biāo)后,首先對(duì)Twin-SVM預(yù)警模型的分類(lèi)準(zhǔn)確率進(jìn)行計(jì)算,進(jìn)一步計(jì)算在最優(yōu)參數(shù)下Twin-SVM預(yù)警模型的幾何平均正確率G和少數(shù)類(lèi)的度量值F。為了展示Twin-SVM模型優(yōu)越的預(yù)測(cè)性能,將其與改進(jìn)的ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法(Bayes模型)和K近鄰法(KNN模型)進(jìn)行比較,結(jié)果如表4所示。
從表4中可以看出,無(wú)論是在6∶4、7∶3、8∶2還是9∶1的數(shù)據(jù)劃分比例下,Twin-SVM模型的分類(lèi)準(zhǔn)確率都略低于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,但是略高于改進(jìn)的ODR-ADASYN-SVM模型且顯著高于Bayes分類(lèi)法。究其原因,是BP神經(jīng)網(wǎng)絡(luò)和K近鄰法沒(méi)有考慮到財(cái)務(wù)正常和財(cái)務(wù)危機(jī)公司構(gòu)成的嚴(yán)重非均衡樣本的特性,將大量財(cái)務(wù)危機(jī)公司錯(cuò)誤預(yù)判為財(cái)務(wù)正常公司,而財(cái)務(wù)正常樣本的數(shù)量?jī)H占總體樣本很小的比例,所以最后導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)和K近鄰法的總體分類(lèi)準(zhǔn)確率會(huì)略高于Twin-SVM模型。而ODR-ADASYN-SVM和Bayes分類(lèi)法的分類(lèi)準(zhǔn)確率較低的原因可能在于,這兩個(gè)模型對(duì)兩類(lèi)樣本的擬合效果和預(yù)測(cè)性能不及Twin-SVM模型優(yōu)異。
值得注意的是,將財(cái)務(wù)危機(jī)公司預(yù)測(cè)為財(cái)務(wù)正常公司所帶來(lái)的危害是遠(yuǎn)遠(yuǎn)大于將財(cái)務(wù)正常公司預(yù)測(cè)為財(cái)務(wù)危機(jī)公司的。因此,為了進(jìn)一步體現(xiàn)TwinSVM模型對(duì)少數(shù)類(lèi)的財(cái)務(wù)危機(jī)樣本的優(yōu)越預(yù)測(cè)性能,將針對(duì)非均衡樣本的評(píng)價(jià)指標(biāo)幾何平均正確率G和少數(shù)類(lèi)的度量值F進(jìn)一步用于Twin-SVM與其他模型的對(duì)比研究。為更直觀(guān)地展現(xiàn)預(yù)測(cè)結(jié)果,將結(jié)果繪制在折線(xiàn)圖中,見(jiàn)圖2。
由圖2可直觀(guān)看出,從幾何平均正確率G來(lái)看,四種數(shù)據(jù)劃分比例下Twin-SVM模型的G值都在0.7上下波動(dòng),顯著大于ODR-ADASYN-SVM模型(0.6左右)、BP神經(jīng)網(wǎng)絡(luò)(0.3左右)、Baye分類(lèi)法(0.5左右)和K近鄰法(0.3左右)。表明無(wú)論是對(duì)財(cái)務(wù)正常還是財(cái)務(wù)危機(jī)樣本,ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法和K近鄰法的預(yù)測(cè)效果都不如Twin-SVM模型;從少數(shù)類(lèi)的度量值F來(lái)看,ODR-ADASYN-SVM模型(0.3左右)、BP神經(jīng)網(wǎng)絡(luò)(0.15左右)、Bayes分類(lèi)法(0.18左右)和K近鄰法(0.2左右)也是遠(yuǎn)小于Twin-SVM模型(0.38左右),表明非均衡樣本數(shù)據(jù)集對(duì)其他四種模型的預(yù)測(cè)能力都有較為嚴(yán)重的影響。進(jìn)一步從不同數(shù)據(jù)劃分比例下預(yù)測(cè)精度的G值或者F值的標(biāo)準(zhǔn)差來(lái)看,除Twin-SVM模型預(yù)測(cè)精度G值和F值的標(biāo)準(zhǔn)差(0.0218,0.0112)大于Bayes分類(lèi)法(0.0215,0.006)以外,Twin-SVM模型預(yù)測(cè)精度G值和F值的標(biāo)準(zhǔn)差均小于其余模型。由此,綜合來(lái)看,Twin-SVM模型的預(yù)測(cè)性能和穩(wěn)健性都是顯著優(yōu)于ODRADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Baye分類(lèi)法和K近鄰法的。
進(jìn)一步地,如果僅將結(jié)論建立在評(píng)價(jià)指標(biāo)數(shù)值上,則缺少了類(lèi)似數(shù)理統(tǒng)計(jì)上的嚴(yán)謹(jǐn)性與可靠性。因此,為增強(qiáng)所得結(jié)果的科學(xué)性與客觀(guān)性,本文繼續(xù)采用配對(duì)樣本T檢驗(yàn)對(duì)預(yù)測(cè)結(jié)果進(jìn)行顯著性檢驗(yàn)以判斷不同模型的預(yù)測(cè)性能是否存在顯著性差異。檢驗(yàn)結(jié)果如表5所示。
從表5可以看出,Twin-SVM模型與BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法和K近鄰法在分類(lèi)準(zhǔn)確率上的配對(duì)樣本T檢驗(yàn)統(tǒng)計(jì)量在1%的顯著性水平上拒絕零假設(shè)(null hypothesis),即Twin-SVM模型與其他三個(gè)模型的預(yù)測(cè)效果有顯著性差異,Twin-SVM模型在分類(lèi)準(zhǔn)確率上顯著優(yōu)于Bayes分類(lèi)法,但略低于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,這與前文的結(jié)論一致。進(jìn)一步地,從更為綜合的針對(duì)非均衡樣本的評(píng)價(jià)指標(biāo)幾何平均正確率G及少數(shù)類(lèi)的度量值F來(lái)看,在5%的顯著性水平上,Twin-SVM模型與ODR-ADASYNSVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法和K近鄰法的G值和F值有顯著性差異。由此,從預(yù)測(cè)精度上來(lái)看,Twin-SVM模型是顯著優(yōu)越于其他四個(gè)模型的。
5.分行業(yè)下Twin-SVM預(yù)警模型的預(yù)測(cè)結(jié)果。評(píng)價(jià)模型的預(yù)測(cè)性能不僅要基于整體行業(yè)進(jìn)行實(shí)證研究,而且應(yīng)在不同行業(yè)不同特點(diǎn)下論證模型的泛化性能。本文在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)創(chuàng)業(yè)板發(fā)生財(cái)務(wù)危機(jī)的公司大多數(shù)集中在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)行業(yè),2015年發(fā)生財(cái)務(wù)危機(jī)的公司共15家,其中12家屬于制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè);2016年發(fā)生財(cái)務(wù)危機(jī)的公司共38家,其中30家集中在上述兩個(gè)行業(yè);2017年發(fā)生財(cái)務(wù)危機(jī)的公司共98家,其中81家集中在上述兩個(gè)行業(yè)。而制造業(yè)是創(chuàng)業(yè)板板塊中規(guī)模最大的行業(yè),也是我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展的支柱性產(chǎn)業(yè)。在當(dāng)今信息高速發(fā)展以及大數(shù)據(jù)時(shí)代下,信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)對(duì)于國(guó)家經(jīng)濟(jì)發(fā)展的重要性不言而喻。由此,本文進(jìn)一步在這兩大行業(yè)中對(duì)Twin-SVM模型與其余模型展開(kāi)預(yù)測(cè)精度對(duì)比,以考察該模型的泛化性能。實(shí)驗(yàn)結(jié)果見(jiàn)表6。
通過(guò)表6可看出,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)中Twin-SVM模型均獲得了最為優(yōu)異的預(yù)測(cè)效果。在制造業(yè)中,TwinSVM模型明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,雖然ODR-ADASYN-SVM模型和Bayes分類(lèi)法的G值略大于Twin-SVM模型,但是綜合分類(lèi)準(zhǔn)確率和F值來(lái)看,ODR-ADASYN-SVM模型和Bayes分類(lèi)法總體分類(lèi)準(zhǔn)確率較低,且對(duì)財(cái)務(wù)危機(jī)樣本的預(yù)測(cè)精度也低,因此在制造業(yè)的預(yù)測(cè)中,Twin-SVM模型是優(yōu)于其他模型的。而從信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)來(lái)看,Twin-SVM模型的G值(0.6298)和F值(0.2920)明顯大于其他模型,表明Twin-SVM模型無(wú)論是對(duì)財(cái)務(wù)正常樣本還是財(cái)務(wù)危機(jī)樣本都有著優(yōu)越的預(yù)測(cè)能力。
綜合以上分析,無(wú)論是從預(yù)測(cè)精度來(lái)說(shuō),還是從預(yù)測(cè)穩(wěn)健性來(lái)說(shuō),就整個(gè)創(chuàng)業(yè)板來(lái)看,Twin-SVM模型都是顯著優(yōu)越于其他預(yù)警模型的。而在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)中,Twin-SVM模型也具有更為優(yōu)異的學(xué)習(xí)能力和推廣泛化能力。因此,Twin-SVM模型有著更為優(yōu)越的綜合性能,能有效地識(shí)別并預(yù)測(cè)我國(guó)創(chuàng)業(yè)板上市公司的財(cái)務(wù)危機(jī),為公司經(jīng)營(yíng)者和監(jiān)管層防范與化解風(fēng)險(xiǎn)、投資者減少投資損失提供合適的操作工具。
四、結(jié)論
本文將篩選后的我國(guó)創(chuàng)業(yè)板655家上市公司作為研究樣本,基于扣除非經(jīng)常性損益后的凈利潤(rùn)和凈資產(chǎn)增長(zhǎng)率構(gòu)建財(cái)務(wù)危機(jī)的識(shí)別方法,從而確定了財(cái)務(wù)正常和財(cái)務(wù)危機(jī)樣本。在Twin-SVM模型的構(gòu)建過(guò)程中,運(yùn)用5折交叉驗(yàn)證法下的三個(gè)評(píng)價(jià)指標(biāo)即分類(lèi)準(zhǔn)確率、幾何平均正確率G和少數(shù)類(lèi)的度量值F來(lái)確定最優(yōu)的Twin-SVM核函數(shù)。然后對(duì)在不同樣本劃分比例下的Twin-SVM模型與ODRADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法以及K近鄰法的預(yù)測(cè)精度和穩(wěn)健性進(jìn)行對(duì)比,運(yùn)用配對(duì)T檢驗(yàn)對(duì)各模型預(yù)測(cè)精度的差異性進(jìn)行顯著性檢驗(yàn)。最后在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)中對(duì)Twin-SVM模型與其余模型的泛化性能進(jìn)行了對(duì)比。
實(shí)證結(jié)果表明:在Twin-SVM模型的構(gòu)建過(guò)程中,RBF核函數(shù)展示出比Linear、Polynomial、Sigmoid、Wavelet核函數(shù)更為優(yōu)異的預(yù)測(cè)性能;與改進(jìn)的ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類(lèi)法和K近鄰法相比,Twin-SVM模型不僅在預(yù)測(cè)精度上高于其他模型,而且在預(yù)測(cè)穩(wěn)健性上顯著更為優(yōu)越,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個(gè)分行業(yè)的泛化性能也顯著優(yōu)越于其余幾個(gè)模型。
根據(jù)以上實(shí)證研究結(jié)果,基于Twin-SVM的財(cái)務(wù)危機(jī)預(yù)警模型能夠有效地識(shí)別并預(yù)測(cè)我國(guó)創(chuàng)業(yè)板上市公司是否會(huì)發(fā)生財(cái)務(wù)危機(jī)。對(duì)政府管理決策部門(mén)而言,能根據(jù)預(yù)測(cè)結(jié)果及時(shí)準(zhǔn)確地評(píng)估上市公司發(fā)生財(cái)務(wù)危機(jī)的可能性,并制定和實(shí)施相應(yīng)的措施,避免對(duì)經(jīng)濟(jì)社會(huì)的平穩(wěn)運(yùn)行產(chǎn)生大的影響;對(duì)公司經(jīng)營(yíng)者來(lái)說(shuō),可審時(shí)度勢(shì),及時(shí)調(diào)整經(jīng)營(yíng)戰(zhàn)略,積極防范和化解風(fēng)險(xiǎn)與危機(jī);對(duì)投資者而言,可及時(shí)掌握上市公司的經(jīng)營(yíng)狀況和盈利狀況,進(jìn)而調(diào)整投資策略,優(yōu)化投資組合,減少相關(guān)投資損失。
【主要參考文獻(xiàn)】
[1]John Nkwoma Inekwe,Yi Jin,Ma. Rebecca Valenzuela. The effects of financial distress:Evidence from US GDP growth[J].Economic Modelling,2018(72):8~21.
[2]Geng R.,Bose I.,Chen X. Prediction of financial distress:An empirical study of listed Chinese companies using data mining[J].European Journal of Operational Research,2015(1):236~247.
[3]逯東,萬(wàn)麗梅,楊丹.創(chuàng)業(yè)板公司上市后為何業(yè)績(jī)變臉?[J].經(jīng)濟(jì)研究,2015(2):132~144.
[4]William H. Beaver. Financial ratios as predictors of failure[J].Journal of Accounting Research,1964(1):71~111.
[5]Edward I. Altman. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J].Journal of Finance,1968(4):189~209.
[6]Hanmei Sun,Thuan Nguyen,Yihui Luan,et al. Classified mixed logistic model prediction[J].Journal of Multivariate Analysis,2018(168):63~74.
[7]James A. Ohlson. Financial ratios and the probabilistic prediction of bankruptcy[J].Journal of Accounting Research,1980(1):109~131.
[8]宋寶珠.創(chuàng)業(yè)板上市公司財(cái)務(wù)預(yù)警模型研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014.
[9]Le H. H.,Viviani J. L. Predicting bank failure:An improvement by implementing machine learning approach on classical financial ratios[J]. Post-Print,2017(44):16~25.
[10]Vapnik V. N. The nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995:100~200.
[11]Huang H.,Wei X.,Zhou Y. Twin support vector machines:A survey[J].Neurocomputing,2018(300):34~43.
[12]林宇,黃迅,淳偉德等.基于ODR-ADASYN-SVM的極端金融風(fēng)險(xiǎn)預(yù)警研究[J].管理科學(xué)學(xué)報(bào),2016(5):87~101.
[13]Jian C.,Gao J.,Ao Y. A new sampling method for classifying imbalanced data based on support vector machine ensemble[J].Neurocomputing,2016(193):115~122.
[14]衣柏衡,朱建軍,李杰.基于改進(jìn)SMOTE的小額貸款公司客戶(hù)信用風(fēng)險(xiǎn)非均衡SVM分類(lèi)[J].中國(guó)管理科學(xué),2016(3):24~30.
[15]Beyan C.,F(xiàn)isher R. Classifying imbalanced data sets using similarity based hierarchical decomposition[J].Pattern Recognition,2015(5):1653~1672.
[16]李揚(yáng),李竟翔,馬雙鴿.不平衡數(shù)據(jù)的企業(yè)財(cái)務(wù)預(yù)警模型研究[J].數(shù)理統(tǒng)計(jì)與管理,2016(5):893~906.
[17]R. K. Javadeva,R. Khemchandani,S. Chandra. Twin support vector machine for pattern classification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007(5):905~910.
[18]王鵬,黃迅.基于Twin-SVM的多分形金融市場(chǎng)風(fēng)險(xiǎn)的智能預(yù)警研究[J].統(tǒng)計(jì)研究,2018(2):3~13.
[19]Geng R.,Bose I.,Chen X. Prediction of financial distress:An empirical study of listed Chinese companies using data mining[J].European Journal of Operational Research,2015(1):236~247.
[20]Chu Y.,Wang G.,Chen G. A new random subspace method incorporating sentiment and textual information for financial distress prediction[J].Electronic Commerce Research & Applications,2018(29):30~49.
[21]岑慧.創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)預(yù)警模型研究[D].廈門(mén):集美大學(xué),2018.
[22]Liang D.,Tsai C. F.,Wu H. T. The effect of feature selection on financial distress prediction[J].Knowledge-Based Systems,2014(1):289
~297.
[23]Mselmi N.,Lahiani A.,Hamza T. Financial distress prediction:The case of French small and medium-sized firms[J].International Review of Financial Analysis,2017(50):67~80.
[24]Hosaka T. Bankruptcy prediction using imaged financial ratios and convolutional neural networks[J].Expert Systems with Applications,2019(117):287~299.
[25]Binh P. V. N.,Trung D. T.,Duc V. H. Financial distress and bankruptcy prediction:An appropriate model for listed firms in Vietnam[J]. Economic Systems,2018(42):616~624.