趙智繁,王世民,曹 倩
(北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院 食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)
基于數(shù)據(jù)挖掘的財(cái)務(wù)危機(jī)多分類預(yù)警研究
趙智繁,王世民,曹倩
(北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)
目前對財(cái)務(wù)危機(jī)預(yù)警模型的研究大多少為二分類研究,其只能對企業(yè)是否存在財(cái)務(wù)危機(jī)做出預(yù)警,無法對企業(yè)的財(cái)務(wù)危機(jī)程度做出警報(bào),因此簡單的二分類可能無法揭示企業(yè)財(cái)務(wù)狀況逐漸變差的事實(shí)。鑒于此,將F分?jǐn)?shù)模型與ST分類法相結(jié)合,對企業(yè)財(cái)務(wù)危機(jī)程度進(jìn)行了細(xì)化,并使用t-2年的財(cái)務(wù)數(shù)據(jù)構(gòu)建了基于關(guān)聯(lián)規(guī)則、決策樹等數(shù)據(jù)挖掘算法的財(cái)務(wù)危機(jī)多分類預(yù)警模型。實(shí)證結(jié)果表明,模型在保證了較高準(zhǔn)確率的基礎(chǔ)上,能夠提供更加精細(xì)的警報(bào)。
F分?jǐn)?shù)模型;數(shù)據(jù)挖掘;財(cái)務(wù)預(yù)警;財(cái)務(wù)危機(jī);多分類
面對日趨嚴(yán)峻的市場競爭,不少企業(yè)將會(huì)面臨財(cái)務(wù)危機(jī)的困擾。財(cái)務(wù)危機(jī)又稱財(cái)務(wù)困境,陷入財(cái)務(wù)危機(jī)的企業(yè)不但將面臨資不抵債、無法償還到期債務(wù)、盈利能力下降、財(cái)務(wù)指標(biāo)數(shù)據(jù)惡化等狀況,甚至還有破產(chǎn)的風(fēng)險(xiǎn)。因此,如何提前識別出企業(yè)潛在的財(cái)務(wù)危機(jī)狀況,及時(shí)地進(jìn)行改善,以避免更為嚴(yán)重的損失,成為了企業(yè)管理者、投資者最為關(guān)注的問題。
通過大量的、真實(shí)的企業(yè)財(cái)務(wù)歷史數(shù)據(jù),并使用一定的數(shù)學(xué)建模方法所構(gòu)建的財(cái)務(wù)危機(jī)預(yù)警模型,是用來預(yù)測企業(yè)是否存在財(cái)務(wù)危機(jī)的重要方法,也是財(cái)務(wù)危機(jī)預(yù)警定量研究的重要內(nèi)容。最早的財(cái)務(wù)危機(jī)預(yù)警模型研究是20世紀(jì)30年代Fitz Patrick等人使用的單變量預(yù)測方法。隨著統(tǒng)計(jì)理論的普及和計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫應(yīng)用的興起,財(cái)務(wù)危機(jī)預(yù)警模型得到了不斷的推衍與改進(jìn),并涌現(xiàn)出了大量的優(yōu)秀成果,如國外Altman等人的Z值計(jì)分模型和國內(nèi)周首華等人的F分?jǐn)?shù)模型等。
縱觀國內(nèi)外現(xiàn)有的研究成果,大多數(shù)研究的重點(diǎn)都集中在建模方法的對比和預(yù)測變量的選取這兩個(gè)方面,卻缺乏在財(cái)務(wù)危機(jī)預(yù)警中對財(cái)務(wù)危機(jī)進(jìn)行多分類的探討。就目前的文獻(xiàn)資料來看,大多數(shù)的研究依然采取傳統(tǒng)的二分類預(yù)警模式,即只能預(yù)測企業(yè)將成為ST企業(yè),或者將成為非ST企業(yè)。然而在實(shí)際的情況中,有些企業(yè)雖然沒有被標(biāo)記為ST,但是其財(cái)務(wù)狀況依然不樂觀,現(xiàn)有的二分類預(yù)警模型卻并不能對這一部分企業(yè)給出警報(bào)。因此當(dāng)前的依據(jù)ST進(jìn)行劃分的財(cái)務(wù)危機(jī)二分類預(yù)警模型很難提升實(shí)際應(yīng)用的價(jià)值,同時(shí)也掩蓋了企業(yè)在陷入財(cái)務(wù)危機(jī)前財(cái)務(wù)狀況惡化的過程。
對財(cái)務(wù)危機(jī)的多分類目前還沒有公認(rèn)的標(biāo)準(zhǔn),同時(shí)該問題相對定性,難以在定量研究中通過單一的數(shù)值進(jìn)行表示,這些都為在財(cái)務(wù)危機(jī)預(yù)警模型中進(jìn)行財(cái)務(wù)危機(jī)程度的多分類造成了障礙。
本文將采用目前國內(nèi)在財(cái)務(wù)危機(jī)預(yù)警領(lǐng)域使用較為廣泛的F分?jǐn)?shù)模型的判別公式,并與傳統(tǒng)研究中的ST分類方式相結(jié)合,將企業(yè)財(cái)務(wù)危機(jī)程度劃分為“財(cái)務(wù)穩(wěn)定企業(yè)”、“財(cái)務(wù)不穩(wěn)定企業(yè)”、“財(cái)務(wù)較危機(jī)企業(yè)”和“財(cái)務(wù)危機(jī)企業(yè)”四個(gè)部分。并使用t-2年的財(cái)務(wù)指標(biāo)數(shù)據(jù),通過關(guān)聯(lián)規(guī)則算法篩選出重要的預(yù)測變量,再通過決策樹模型進(jìn)行訓(xùn)練生成財(cái)務(wù)危機(jī)多分類預(yù)警模型,最后使用測試樣本對模型的準(zhǔn)確性進(jìn)行檢驗(yàn)。
財(cái)務(wù)危機(jī)預(yù)警模型的研究中,在財(cái)務(wù)危機(jī)的分類方面,最早是依據(jù)企業(yè)是否破產(chǎn)進(jìn)行分類的,其中具有代表性的研究是Altman[1]使用多元線性判別方法創(chuàng)立的 Z值計(jì)分模型,其使用的研究樣本是33家提出破產(chǎn)申請的企業(yè)與33家與之配對產(chǎn)生的財(cái)務(wù)狀況良好的企業(yè)。在國外的現(xiàn)有研究中,大部分也是依據(jù)企業(yè)是否破產(chǎn)進(jìn)行二分類。在抽樣的方法上,大多也使用配對抽樣的方法。在國內(nèi),由于上市企業(yè)的財(cái)務(wù)年報(bào)獲取較為容易,同時(shí)其年報(bào)數(shù)據(jù)的真實(shí)性、準(zhǔn)確性較高,所以大部分研究選取上市企業(yè)作為研究樣本。但是由于我國真正破產(chǎn)、退市的上市企業(yè)很少,所以在研究中一般以上市企業(yè)被特別處理(ST)作為企業(yè)陷入財(cái)務(wù)危機(jī)的標(biāo)志,同樣屬于一種二分類方式,這主要是為了迎合我國上市企業(yè)的實(shí)際情況、提升建模實(shí)驗(yàn)的可操作性以及便于不同學(xué)者的研究相互比較。其中最具影響力的是周首華[2]等人在Z值計(jì)分模型的基礎(chǔ)上,以我國企業(yè)為研究樣本進(jìn)行了修正,并考慮了現(xiàn)金流量因素,提出了F分?jǐn)?shù)模型。對于財(cái)務(wù)危機(jī)多分類預(yù)警模型的研究探討相對較少,但也有一些成果,如張坤[3]以西部四省上市企業(yè)為例,在構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型前使用數(shù)據(jù)包絡(luò)分析法將企業(yè)財(cái)務(wù)危機(jī)狀況分成五類。陳磊[4]則將傳統(tǒng)的基于ST的二分類方式擴(kuò)展為ST、*ST、非ST的三分類。
在預(yù)測變量的選擇上,目前主要分為財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)兩類。相對而言,財(cái)務(wù)指標(biāo)更加容易獲取,且構(gòu)建的財(cái)務(wù)預(yù)警模型具有直觀性、穩(wěn)定性,因此更多的研究選擇財(cái)務(wù)指標(biāo)作為預(yù)測變量。非財(cái)務(wù)指標(biāo)相對難以獲取且難以量化,但也有相關(guān)研究表明非財(cái)務(wù)指標(biāo)與財(cái)務(wù)危機(jī)具有一定的關(guān)系,如La Porta[5]等人發(fā)現(xiàn)企業(yè)股權(quán)集中度越高,企業(yè)越容易出現(xiàn)財(cái)務(wù)危機(jī)。邊海榮[6]等人將Web金融信息文本數(shù)值化后發(fā)現(xiàn),其也可以作為預(yù)測變量用于構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型。
在建模方法的應(yīng)用上,傳統(tǒng)的方法主要是單變量、多變量預(yù)測模型,但隨著計(jì)算機(jī)網(wǎng)絡(luò)和數(shù)據(jù)庫技術(shù)的興起,數(shù)據(jù)挖掘技術(shù)逐漸成為了構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型的主要工具。數(shù)據(jù)挖掘擁有強(qiáng)大的學(xué)習(xí)能力,可以從大量歷史信息中發(fā)現(xiàn)潛在的、有價(jià)值的知識,輔助管理者進(jìn)行決策。其中,Odom[7]是使用人工神經(jīng)網(wǎng)絡(luò)構(gòu)建企業(yè)財(cái)務(wù)危機(jī)預(yù)警模型的最具代表性的學(xué)者之一。吳世農(nóng)[8]等人通過對邏輯回歸模型與另外兩種方法對比發(fā)現(xiàn),邏輯回歸模型擁有最低的誤判率。李?。?]通過對邏輯回歸、決策樹、人工神經(jīng)網(wǎng)絡(luò)三種不同的數(shù)據(jù)挖掘算法進(jìn)行對比,發(fā)現(xiàn)在構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型時(shí)決策樹模型訓(xùn)練次數(shù)少、速度快,在長期預(yù)測和短期預(yù)測中都能取得較高的準(zhǔn)確率,穩(wěn)定性更強(qiáng)。
3.1技術(shù)路線
基于數(shù)據(jù)挖掘的財(cái)務(wù)危機(jī)多分類預(yù)警建模的研究,大致可分為四個(gè)部分:樣本數(shù)據(jù)的選取和財(cái)務(wù)指標(biāo)的計(jì)算、財(cái)務(wù)危機(jī)的多分類、預(yù)測變量的篩選、數(shù)據(jù)挖掘算法的訓(xùn)練。
對于財(cái)務(wù)危機(jī)的多分類,由于現(xiàn)有的二分類預(yù)警模型存在較為明顯的局限性,因此本文將F分?jǐn)?shù)模型的判別公式和ST分類方法相結(jié)合,將財(cái)務(wù)危機(jī)細(xì)化為“財(cái)務(wù)穩(wěn)定企業(yè)”、“財(cái)務(wù)不穩(wěn)定企業(yè)”、“財(cái)務(wù)較危機(jī)企業(yè)”和“財(cái)務(wù)危機(jī)企業(yè)”四個(gè)部分,使得預(yù)警模型可以對那些雖然目前沒有被標(biāo)記為ST的風(fēng)險(xiǎn),但財(cái)務(wù)狀況依舊不樂觀的企業(yè)做出警報(bào)。
對于預(yù)測變量的篩選,由于預(yù)測變量(財(cái)務(wù)指標(biāo))的多樣性,以及不同預(yù)測變量間可能存在的關(guān)聯(lián)性,同時(shí)也為了能夠生成簡練易讀的財(cái)務(wù)危機(jī)預(yù)警模型,因此需要對預(yù)測變量進(jìn)行篩選。本文將使用t-2年的財(cái)務(wù)指標(biāo)數(shù)據(jù),并通過數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法,篩選出與t年財(cái)務(wù)危機(jī)程度關(guān)聯(lián)度較大的財(cái)務(wù)指標(biāo)作為預(yù)測變量,剔除了弱關(guān)聯(lián)指標(biāo)。
最后,本文將使用t-2年的預(yù)測變量數(shù)據(jù),以t年的財(cái)務(wù)危機(jī)程度作為結(jié)果變量,并通過數(shù)據(jù)挖掘中的決策樹算法進(jìn)行訓(xùn)練,生成樹狀判別模型,并使用測試樣本檢驗(yàn)?zāi)P偷臏?zhǔn)確率。
3.2樣本來源和指標(biāo)體系
本文的樣本數(shù)據(jù)來源于上海證券交易所官網(wǎng)中上市公司定期披露的財(cái)務(wù)年報(bào),這些年報(bào)數(shù)據(jù)經(jīng)過了嚴(yán)格的審查,具有較高的真實(shí)性和規(guī)范性。
由于在財(cái)務(wù)分析研究中,各類財(cái)務(wù)指標(biāo)類型較多,為了避免在選取備用的財(cái)務(wù)指標(biāo)時(shí)造成的主觀性和相關(guān)性,本文選取了國內(nèi)相對較為完善的《企業(yè)綜合績效評價(jià)實(shí)施細(xì)則》中財(cái)務(wù)績效定量評價(jià)指標(biāo)規(guī)定的8個(gè)基本指標(biāo)與14個(gè)修正指標(biāo)作為備選的財(cái)務(wù)指標(biāo),其中舍棄4個(gè)外部報(bào)表使用者難以獲取的指標(biāo),分別是不良資產(chǎn)比率、帶息負(fù)債比率、或有負(fù)債比率和技術(shù)投入比率,剩余的財(cái)務(wù)指標(biāo)如表1所示。
表1備選的財(cái)務(wù)指標(biāo)
3.3財(cái)務(wù)危機(jī)的多分類
3.3.1 F分?jǐn)?shù)模型
為了彌補(bǔ)目前二分類預(yù)警模型的缺陷,本文采用F分?jǐn)?shù)模型的判別公式與傳統(tǒng)ST分類標(biāo)準(zhǔn)相結(jié)合,實(shí)現(xiàn)了對財(cái)務(wù)危機(jī)程度的多分類。
F分?jǐn)?shù)模型是我國學(xué)者在Z值計(jì)分模型的基礎(chǔ)上,以我國企業(yè)財(cái)務(wù)信息為樣本數(shù)據(jù)所改進(jìn)的財(cái)務(wù)危機(jī)預(yù)測模型。隨后,在相關(guān)領(lǐng)域的研究中,F(xiàn)分?jǐn)?shù)模型得到了廣泛的運(yùn)用,并保持了很高的準(zhǔn)確率。與Z值計(jì)分模型相比,它具有如下的優(yōu)勢:首先,F(xiàn)分?jǐn)?shù)模型充分考慮到現(xiàn)金流量的因素;其次,F(xiàn)分?jǐn)?shù)模型通過數(shù)據(jù)庫技術(shù)使用了更大的研究樣本,擁有更強(qiáng)的穩(wěn)定性和普遍適用性,同時(shí)更加適用于國內(nèi)企業(yè);另外,F(xiàn)分?jǐn)?shù)模型考慮到了近代企業(yè)財(cái)務(wù)狀況相關(guān)標(biāo)準(zhǔn)的更新與發(fā)展。
F分?jǐn)?shù)模型的判別公式如下:
其中的X1表示的是企業(yè)期末流動(dòng)資產(chǎn)與期末流動(dòng)負(fù)債的差值,占企業(yè)期末總資產(chǎn)的比率;X2表示企業(yè)期末留存收益與期末總資產(chǎn)的比值;X3表示企業(yè)稅后純收益與折舊的總和與平均總負(fù)債的比值;X4是期末股東權(quán)益的市場價(jià)值與期末總負(fù)債的比值;X5表示企業(yè)稅后純收益、利息、折舊三者總和與平均總資產(chǎn)的比值。與Z值計(jì)分模型相比,F(xiàn)分?jǐn)?shù)模型考慮了現(xiàn)金流量方面的情況,如 X3、X5指標(biāo)的分子項(xiàng),都是對企業(yè)創(chuàng)造的現(xiàn)金流量方面的測量[9]。F分?jǐn)?shù)的計(jì)算比較簡單,流動(dòng)資產(chǎn)、流動(dòng)負(fù)債、總負(fù)債、總資產(chǎn)等項(xiàng)目均可從資產(chǎn)負(fù)債表中直接獲取,凈利潤可從利潤表中獲取,只有期末股東權(quán)益的市場價(jià)值需要參考期末股價(jià)、未上市流通股份和已上市流通股份等其他會(huì)計(jì)資料。
F分?jǐn)?shù)模型的臨界點(diǎn)被設(shè)定為0.027 4,當(dāng)企業(yè)的F分?jǐn)?shù)小于臨界點(diǎn)時(shí),則被預(yù)測為具有較高的財(cái)務(wù)危機(jī),被標(biāo)記為ST的可能性很大;若F分?jǐn)?shù)大于臨界點(diǎn),則被預(yù)測為財(cái)務(wù)狀況正常的企業(yè)。另外,經(jīng)過大量的樣本檢驗(yàn),當(dāng)F分?jǐn)?shù)處于[-0.050 1,0.104 9]時(shí),預(yù)測的準(zhǔn)確率將會(huì)下降到僅僅70%左右,一般在研究中我們稱之為“灰色區(qū)域”。
3.3.2多分類標(biāo)準(zhǔn)
在目前的相關(guān)研究中,經(jīng)常依據(jù)上市企業(yè)被標(biāo)記為ST作為企業(yè)是否存在財(cái)務(wù)危機(jī)的分類標(biāo)準(zhǔn)。ST(Special Treatment),意為“特別處理”,是證券交易所對財(cái)務(wù)狀況或其他狀況出現(xiàn)異常的上市企業(yè)股票交易進(jìn)行的特別處理,這里的異常狀況主要包括:最近兩個(gè)會(huì)計(jì)年度的審計(jì)結(jié)果顯示的凈利潤均為負(fù);最近一個(gè)會(huì)計(jì)年度的審計(jì)結(jié)果顯示其股東權(quán)益低于注冊資本等??梢?,上市企業(yè)被標(biāo)記為ST是一種明顯的具有較高財(cái)務(wù)危機(jī)的體現(xiàn)。本文也認(rèn)同這種觀點(diǎn),因此將被標(biāo)記為ST的企業(yè)作為財(cái)務(wù)危機(jī)多分類中的“財(cái)務(wù)危機(jī)企業(yè)”樣本,并將其被標(biāo)記為ST的年份稱為第t年。但是,由于在實(shí)際情況中,部分上市企業(yè)雖然沒有被標(biāo)記為ST企業(yè),但財(cái)務(wù)狀況并不樂觀,依然存在較高的財(cái)務(wù)危機(jī)風(fēng)險(xiǎn),僅僅使用傳統(tǒng)的ST分類方式是無法將這部分企業(yè)篩選出來的。因此,將使用F分?jǐn)?shù)模型,繼續(xù)對非ST企業(yè)進(jìn)行分類。
由于財(cái)務(wù)數(shù)據(jù)的發(fā)表具有滯后性,因此使用t-1年的財(cái)務(wù)報(bào)表數(shù)據(jù)進(jìn)行F分?jǐn)?shù)的計(jì)算。當(dāng)非ST企業(yè)的F分?jǐn)?shù)低于-0.050 1時(shí),我們認(rèn)為這部分企業(yè)雖然沒有被標(biāo)記為ST,但依然存在較高的財(cái)務(wù)危機(jī)風(fēng)險(xiǎn)。而且,當(dāng)非ST企業(yè)的凈利潤為負(fù)數(shù)時(shí),近兩年成為ST企業(yè)的可能性很高。因此我們將這兩類企業(yè)作為財(cái)務(wù)危機(jī)多分類中的“財(cái)務(wù)較危機(jī)企業(yè)”樣本。
當(dāng)非ST企業(yè)的F分?jǐn)?shù)處于灰色區(qū)域 [-0.050 1,0.104 9]時(shí),F(xiàn)分?jǐn)?shù)模型的預(yù)測準(zhǔn)確率較低,因此這部分企業(yè)的財(cái)務(wù)狀況并不穩(wěn)定,將這類企業(yè)作為財(cái)務(wù)危機(jī)多分類中的“財(cái)務(wù)不穩(wěn)定企業(yè)”樣本。
當(dāng)非ST企業(yè)的F分?jǐn)?shù)高于0.104 9時(shí),F(xiàn)分?jǐn)?shù)模型的預(yù)測準(zhǔn)確率回升到了較高的水平,這部分企業(yè)的財(cái)務(wù)狀況良好,存在財(cái)務(wù)風(fēng)險(xiǎn)的可能性很低,因此我們將這類企業(yè)作為財(cái)務(wù)危機(jī)多分類中的“財(cái)務(wù)穩(wěn)定企業(yè)”樣本。
最終本文在上海證券交易所官網(wǎng)中選取了37家2015年被標(biāo)記為ST的上市企業(yè)作為“財(cái)務(wù)危機(jī)企業(yè)”樣本,同時(shí)通過計(jì)算 F分?jǐn)?shù),選取“財(cái)務(wù)較危機(jī)企業(yè)”、“財(cái)務(wù)不穩(wěn)定企業(yè)”、“財(cái)務(wù)穩(wěn)定企業(yè)”各37家,共148個(gè)研究樣本,將其中將98家作為訓(xùn)練樣本,50家作為測試樣本。
3.4預(yù)測變量的篩選
3.4.1財(cái)務(wù)危機(jī)分類結(jié)果與財(cái)務(wù)指標(biāo)的對應(yīng)
因?yàn)樨?cái)務(wù)數(shù)據(jù)的發(fā)布具有滯后性,因此當(dāng)我們獲取t-1年的財(cái)務(wù)報(bào)表數(shù)據(jù)時(shí),實(shí)際上第t年的財(cái)務(wù)危機(jī)已經(jīng)發(fā)生,因此在構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型時(shí),使用t-1年的財(cái)務(wù)數(shù)據(jù)沒有任何預(yù)警意義,使用t-2年的財(cái)務(wù)數(shù)據(jù)更為合理。
在數(shù)據(jù)庫中對預(yù)測變量進(jìn)行篩選前,需要將樣本企業(yè)第t年的財(cái)務(wù)危機(jī)分類結(jié)果與第t-2年的財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行對應(yīng)。最簡單的方法是,在企業(yè)第t-2年的財(cái)務(wù)指標(biāo)數(shù)據(jù)行中添加一個(gè)新的屬性(列),通過數(shù)據(jù)庫的存儲(chǔ)過程寫入將該企業(yè)第t年的財(cái)務(wù)危機(jī)分類結(jié)果。
3.4.2關(guān)聯(lián)規(guī)則篩選預(yù)測變量
表1中列舉了備選的財(cái)務(wù)指標(biāo),但是如果將所列的財(cái)務(wù)指標(biāo)全部當(dāng)作預(yù)測變量來構(gòu)建預(yù)警模型,則容易造成預(yù)警模型過擬合,同時(shí)過于復(fù)雜的預(yù)警模型不利于實(shí)際的應(yīng)用。因此,需要對財(cái)務(wù)指標(biāo)進(jìn)行篩選,選擇出合適的財(cái)務(wù)指標(biāo)作為預(yù)測變量。
以往的研究在篩選財(cái)務(wù)指標(biāo)時(shí)常采用的方法包括:K-S檢驗(yàn)、配對T檢驗(yàn)和主成分分析等方法,但都具有一定的局限性。首先K-S檢驗(yàn)、配對T檢驗(yàn)對樣本數(shù)據(jù)的分布狀況有一定的要求,部分財(cái)務(wù)數(shù)據(jù)因其本身的特點(diǎn)往往很難滿足要求。其次在使用主成分分析前需要對樣本進(jìn)行KMO檢驗(yàn)和Bartlett球形檢驗(yàn),而且最終形成的主成分因子是所有指標(biāo)在不同權(quán)系數(shù)下的線性組合,不一定具有合理的財(cái)務(wù)意義。因此,本文采用了數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法來篩選預(yù)測變量。關(guān)聯(lián)規(guī)則算法對樣本數(shù)據(jù)的分布沒有要求,同時(shí)能夠篩選出與財(cái)務(wù)危機(jī)狀況關(guān)聯(lián)度較高的財(cái)務(wù)指標(biāo)作為預(yù)測變量。
關(guān)聯(lián)規(guī)則是一種可以在大量數(shù)據(jù)集中找出項(xiàng)與項(xiàng)之間的關(guān)系的數(shù)據(jù)挖掘技術(shù),Apriori算法是關(guān)聯(lián)規(guī)則中最經(jīng)典的算法,依據(jù)每條規(guī)則的支持度與置信度,可以得出在規(guī)則先導(dǎo)發(fā)生的情況下,規(guī)則后繼發(fā)生的可能性。其中規(guī)則的支持度用support表示,意為在所有記錄中同時(shí)包括先導(dǎo)與后繼的比率,公式為:
其中X為規(guī)則的先導(dǎo),Y為規(guī)則的后繼,|D|表示所有記錄的條數(shù)。
規(guī)則的置信度用confidence表示,表達(dá)的含義是當(dāng)一條記錄包含先導(dǎo)時(shí),同時(shí)也包含后繼的概率,公式為:
通過設(shè)定最小支持度和最小置信度,可以選擇出我們需要的關(guān)聯(lián)規(guī)則。例如:當(dāng)規(guī)則中指標(biāo)X1<m推導(dǎo)出“財(cái)務(wù)危機(jī)企業(yè)”的支持度與置信度均滿足最低標(biāo)準(zhǔn),那么指標(biāo)X1將成合格的預(yù)測變量。
因此我們將財(cái)務(wù)危機(jī)分類設(shè)置成后繼屬性Y,通過約束規(guī)則的最大項(xiàng)數(shù),來考察單一的財(cái)務(wù)指標(biāo)數(shù)據(jù)與財(cái)務(wù)危機(jī)分類的關(guān)聯(lián)程度。經(jīng)過篩選,當(dāng)最小置信度設(shè)置為0.7時(shí),獲得的規(guī)則數(shù)目與規(guī)則先導(dǎo)數(shù)量最為合理,分別可以獲得9條重要的關(guān)聯(lián)規(guī)則和 7個(gè)預(yù)測變量,分別是 X1、X2、X3、X5、X8、X9、X16,重要的關(guān)聯(lián)規(guī)則如表2所示。
表2重要的關(guān)聯(lián)規(guī)則
3.5基于決策樹的財(cái)務(wù)危機(jī)預(yù)警模型
數(shù)據(jù)挖掘中的決策樹算法是一種逼近離散函數(shù)值的方法,可用于分類、預(yù)測。通過決策樹來構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型具有訓(xùn)練次數(shù)少、速度快的優(yōu)點(diǎn),同時(shí)決策樹的分類精度高、生成的模型直觀可讀、對樣本中的噪聲數(shù)據(jù)有很好的健壯性并能取得穩(wěn)定的預(yù)測準(zhǔn)確率。
決策樹自根節(jié)點(diǎn)開始,依據(jù)屬性的信息增益量進(jìn)行分裂,優(yōu)先分裂信息增益量最大的屬性,其分類過程具有貪心思想。屬性的信息增益量為系統(tǒng)在攜帶該屬性時(shí)與不攜帶該屬性時(shí)的信息量的差值。信息量(熵)的計(jì)算公式為:
其中Pi為變量在取不同的值i的概率。使用98組訓(xùn)練樣本,將通過關(guān)聯(lián)規(guī)則篩選出的t-2年的財(cái)務(wù)指標(biāo)作為決策樹的預(yù)測變量,以第t年的財(cái)務(wù)危機(jī)分類作為決策樹的結(jié)果變量,在葉結(jié)點(diǎn)處,決策樹給出每一個(gè)分支的預(yù)測分類,如圖1所示。
圖1決策樹預(yù)測結(jié)果
本文使用的是 SQL Server數(shù)據(jù)庫及配套的 Business Intelligence Development Studio商務(wù)智能套件,在挖掘結(jié)果信息欄中選取挖掘準(zhǔn)確性圖表,可以使用50組測試樣本數(shù)據(jù)對預(yù)警模型的準(zhǔn)確性進(jìn)行檢驗(yàn),得到如表3的結(jié)果分類矩陣。
表3預(yù)測結(jié)果分類矩陣
根據(jù)預(yù)測的結(jié)果來看,本文在使用F分?jǐn)?shù)模型與ST分類法相結(jié)合的方法將財(cái)務(wù)危機(jī)進(jìn)行了多分類,并用數(shù)據(jù)挖掘算法訓(xùn)練生成了預(yù)警模型,這使得預(yù)警模型的預(yù)警結(jié)果也是多分類的。與現(xiàn)有的二分類模型相比,多分類的預(yù)警模型不但能對可能成為ST的企業(yè)進(jìn)行警報(bào),同時(shí)能對那些雖然暫時(shí)沒有被ST的風(fēng)險(xiǎn),但是其財(cái)務(wù)狀況依舊不樂觀的企業(yè)做出警報(bào),增強(qiáng)了實(shí)用價(jià)值。
在準(zhǔn)確率方面,多分類的預(yù)警模型與傳統(tǒng)的二分類模型并不具有直接的可比性。但是從預(yù)測準(zhǔn)確率上依舊可以看出,多分類預(yù)警模型在對財(cái)務(wù)危機(jī)型企業(yè)與財(cái)務(wù)穩(wěn)定型企業(yè)進(jìn)行預(yù)警時(shí),準(zhǔn)確率較高,但在對財(cái)務(wù)較危機(jī)型企業(yè)和財(cái)務(wù)不穩(wěn)定型企業(yè)進(jìn)行預(yù)警時(shí)準(zhǔn)確率不夠,只能達(dá)到60%左右,這可能是由于難以挖掘到有效的預(yù)警指標(biāo)和預(yù)警區(qū)間,但這對實(shí)際的應(yīng)用價(jià)值影響較小。
在財(cái)務(wù)危機(jī)預(yù)警模型的驗(yàn)證中,經(jīng)常需要檢驗(yàn)?zāi)P偷腻e(cuò)誤成本,因?yàn)镾inkey[10]認(rèn)為,當(dāng)預(yù)測結(jié)果優(yōu)于實(shí)際結(jié)果時(shí),其給企業(yè)帶來的錯(cuò)誤成本要高于預(yù)測結(jié)果劣于實(shí)際結(jié)果的情況,根據(jù)本文的預(yù)測結(jié)果分類矩陣,錯(cuò)誤的預(yù)測大部分要劣于實(shí)際的結(jié)果,因此該模型的錯(cuò)誤成本相對較小。
本文使用F分?jǐn)?shù)模型,并與傳統(tǒng)的ST分類法相結(jié)合,將企業(yè)財(cái)務(wù)危機(jī)進(jìn)行了多分類,在財(cái)務(wù)危機(jī)預(yù)警建模中,提供了一種新的財(cái)務(wù)危機(jī)多分類預(yù)警思路。與傳統(tǒng)的二分類預(yù)警模型相比,多分類的預(yù)警模型在保證了一定準(zhǔn)確率的基礎(chǔ)上,能夠提供更多種類的警報(bào),具有更強(qiáng)的應(yīng)用價(jià)值。
在篩選財(cái)務(wù)指標(biāo)時(shí),關(guān)聯(lián)規(guī)則算法與K-S檢驗(yàn)、配對T檢驗(yàn)和主成分分析法相比,擁有更強(qiáng)的適用性,更加適合財(cái)務(wù)數(shù)據(jù)本身的數(shù)據(jù)特點(diǎn)。同時(shí),決策樹算法在構(gòu)建財(cái)務(wù)危機(jī)預(yù)警模型時(shí)訓(xùn)練次數(shù)少、速度快、準(zhǔn)確率較為穩(wěn)定。
就目前的研究結(jié)果來看,總資產(chǎn)報(bào)酬率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、資本保值增值率、成本費(fèi)用利潤率、凈資產(chǎn)收益率等幾個(gè)指標(biāo)在預(yù)測企業(yè)財(cái)務(wù)危機(jī)時(shí)具有較高的穩(wěn)定性。因此無論是作為企業(yè)的管理者還是外部的投資者,都應(yīng)當(dāng)重點(diǎn)關(guān)注這些指標(biāo)的變化,相關(guān)的財(cái)務(wù)指標(biāo)評價(jià)體系也可適當(dāng)調(diào)高這些指標(biāo)的權(quán)重,使其獲得更準(zhǔn)確的評價(jià)。
主要文獻(xiàn)文獻(xiàn)
[1]Altman,E.I.Financial Ratios,Discriminate Analysis and the Prediction of Corporate Bankruptcy[J].The Joural of Finance,1968(4):589-609.
[2]周首華,楊濟(jì)華,王平.論財(cái)務(wù)危機(jī)的預(yù)警分析—F分?jǐn)?shù)模型[J].會(huì)計(jì)研究,1996(8):8-11.
[3]張坤,丁玉芳,胡敏杰.基于數(shù)據(jù)包絡(luò)分析:決策樹的企業(yè)財(cái)務(wù)評價(jià)與預(yù)警——以西部四省上市企業(yè)為例 [J].財(cái)務(wù)與金融,2014(3):36-41.
[4]陳磊,任若恩,曹漢平.公司多階段財(cái)務(wù)危機(jī)動(dòng)態(tài)預(yù)警研究[J].系統(tǒng)工程理論與實(shí)踐,2008(11):29-35.
[5]N Gennaioli,RL Porta,F(xiàn)LD Silanes,et al.Growth in Regions[J].Journal of Economic Growth,1969,19(3):259-309.
[6]邊海容,萬常選,劉德喜.考慮Web金融信息的上市企業(yè)財(cái)務(wù)危機(jī)預(yù)測模型研究[J].計(jì)算機(jī)科學(xué),2013,40(11):295-298.
[7]Odom M D,Sharda R.A Neural Network for Bankruptcy Prediction[C]// Proceedings of the International Joint Conference on Neural Networks Tool,1990.
[8]吳世農(nóng),盧賢義.我國上市公司財(cái)務(wù)危機(jī)困境的預(yù)測模型研究[J].經(jīng)濟(jì)研究,2001(6):46-55.
[9]李吉林.基于F分?jǐn)?shù)模型的上市公司財(cái)務(wù)危機(jī)預(yù)警系統(tǒng)研究[J].中小企業(yè)管理與科技,2010(18):72-74.
[10]趙長明.我國二手房地產(chǎn)交易價(jià)格風(fēng)險(xiǎn)的核算[J].統(tǒng)計(jì)與決策,2014(1):50-52.
10.3969/j.issn.1673-0194.2016.11.032
F275
A
1673-0194(2016)11-0056-06
2016-04-19
北京市教委科學(xué)研究項(xiàng)目(KM201410011005);北京市優(yōu)秀人才培養(yǎng)資助項(xiàng)目(2015000020124G029);北京工商大學(xué)教育教學(xué)改革項(xiàng)目(jg155225)。