趙芮悅 鐘 意 趙雯璇 樊雯韻
(上海立信會計金融學院 上海 201209)
隨著我國證券市場的不斷發(fā)展和完善,滬深兩市交易的上市公司數(shù)量逐年增加,截至2021年,我國滬深兩市A股上市公司總數(shù)達4000多家。但隨著市場競爭的激烈,致使許多企業(yè)無法在此市場環(huán)境下幸存下來,出現(xiàn)不可挽回的財務危機。我國A股上市公司虧損數(shù)量和比重呈逐年增加態(tài)勢,業(yè)績虧損上市公司超200家,比例超6.30%,且合計虧損超1200億元,而滬深兩大證券交易所A股迄今也共有83家退市公司??梢娖髽I(yè)經(jīng)歷經(jīng)濟沖擊或是管理失控等原因,均可能使其財務活動出現(xiàn)各種隨機性和風險性,進而造成退市風險(*ST)或者被特別處理(ST)。因此防范企業(yè)財務危機并做精準預警已經(jīng)成為現(xiàn)上市公司風險管理的重要組成部分。
在基于傳統(tǒng)Cox回歸模型的研究中,多數(shù)學者采用固定協(xié)變量的Cox模型,然而考慮到實際場景中,財務指標往往會隨著時間變化而變化,因此本文將時間因素納入?yún)f(xié)變量的考量之中,構(gòu)建時依Cox模型來刻畫相對風險函數(shù)的動態(tài)變化。另外,本文引入Cox比例風險神經(jīng)網(wǎng)絡DeepSurv,將深度學習應用于非線性Cox比例風險網(wǎng)絡中,構(gòu)建深度生存分析算法以評估企業(yè)財務風險。不同于之前學者們使用的傳統(tǒng)Cox模型,將其擴展至非線性Cox能夠使協(xié)變量之間的非線性關系更好的被神經(jīng)網(wǎng)絡方法識別出,解決了傳統(tǒng)Cox無法識別協(xié)變量間的交互作用這一局限性。
實驗結(jié)果表明,DeepSurv模型能夠推廣應用于更復雜的數(shù)據(jù)集,更好的估計出相對風險函數(shù)于協(xié)變量間的非線性關系度量。應用于股票市場場景中,能夠為上市公司實時評估財務狀況、有效避免財務困境、降低退市風險做出貢獻,也為投資者和商業(yè)銀行分析、預測和監(jiān)督企業(yè)的財務狀況做出參考。
20世紀70年代,Cox[4](1972)首次提出Cox模型,隨后該模型就被廣泛運用于各個研究領域。在流行病學領域,Insan[7](1997)利用Cox模型,研究新奧爾良黃熱病有關時間與死亡風險之間的關系。在財務領域,William[5](1986)運用Cox模型來預測銀行倒閉時間,并證明其預測有效。Chancharat[10](2008)應用Cox模型,證明財務比率對澳大利亞公司財務困境的影響具有統(tǒng)計學意義。Kristanti(2016)使用Cox模型,尋找影響財務困境生存可能性的因素。在生物統(tǒng)計領域Brazauskas(2016),以造血細胞移植研究數(shù)據(jù)表明Cox模型是評估治療效果的優(yōu)良工具。在人口統(tǒng)計學方面,Kundu(2021)按人口因素分組,發(fā)現(xiàn)運用Cox模型有助于評估印度COVID-19患者存活率的變異性。
為滿足不同的研究需求,Cox模型也隨之不斷地擴展、優(yōu)化。Faraggi-Simon[6](1995)使用深度生存神經(jīng)網(wǎng)絡為協(xié)變量與因變量之間的關系建模非線性表示,使用前饋網(wǎng)絡來學習協(xié)變量與相對風險函數(shù)的關系,代表了神經(jīng)網(wǎng)絡在生存分析中的首次應用。Laura[9](2005)提出了一個隨時間變化的新鑒別指數(shù)Ctd,該指數(shù)對于具有時間依賴性的協(xié)變量的評估模型具有分辨能力。Jared(2018)使用DeepSurv來研究病人的協(xié)變量和各種治療方案之間的關系。實證發(fā)現(xiàn),DeepSurv結(jié)合神經(jīng)網(wǎng)絡有更好預測效果。Havard Kvamme(2019)基于損失函數(shù),提出了Cox模型的擴展,繼而得到神經(jīng)網(wǎng)絡擴展Cox比例風險模型。
為模擬企業(yè)財務指標和生存風險間的相互作用,本文引入Cox比例風險神經(jīng)網(wǎng)絡DeepSurv,將深度學習應用于Cox比例風險網(wǎng)絡中,更好的捕捉變量間的關系,并借此評估企業(yè)財務風險。DeepSurv本質(zhì)上是一個前饋神經(jīng)網(wǎng)絡,其輸入為企業(yè)財務數(shù)據(jù),網(wǎng)絡的隱藏層由全連接層和Dropout層組成,其輸出為是一個線性激活函數(shù)單元,用于估計Cox模型中的風險似然函數(shù)。通過設置損失函數(shù)為并進行正則化來訓練該網(wǎng)絡,最終估計出相對風險函數(shù)與協(xié)變量間的非線性關系度量。
Cox模型,又稱Cox比例風險模型,是常見的生存分析半?yún)?shù)回歸模型之一,可以研究生存時間是否具有一定規(guī)律,并分析一個或多個風險因素對生存時間的影響,在生物統(tǒng)計領域具有廣泛運用。Cox比率風險模型采用偏似然函數(shù)對協(xié)變量進行參數(shù)估計,定義為具有預測效應的協(xié)變量,為參數(shù)變量,即各協(xié)變量的回歸系數(shù),是基準風險函數(shù),即危險因素為0時t時刻的風險值,則有風險函數(shù)如下所示:
本文實驗數(shù)據(jù)取自國泰安數(shù)據(jù)庫(cndata1.csmar.com),樣本為滬深A股全部上市公司,共計3726家。在3726個樣本企業(yè)中,截止至2021年有896家企業(yè)出現(xiàn)過ST/*ST/DT,認為具有財務風險。對于ST企業(yè),本文將企業(yè)被ST的年份定義為第T年,考慮上市企業(yè)在T-3年的各項經(jīng)營指標與在T年的財務危機結(jié)果有較強的相關性,截取上市公司被ST前三年的各項指標數(shù)據(jù),對于非ST公司,則以近三年指標作為實驗數(shù)據(jù),并基于上市日期對齊時間序列。在選取變量時,依照全面性原則,由償債能力、披露財務指標、比率結(jié)構(gòu)、經(jīng)營能力、盈利能力、現(xiàn)金流分析、風險水平、發(fā)展能力、每股指標、相對價值指標共計十個大類的因素入手提取了51個原始變量。
對數(shù)據(jù)進行處理,將數(shù)據(jù)以十折交叉驗證分為隨機10組,取其中9組建立和優(yōu)化模型,剩余1組為測試集,以評價模型在新數(shù)據(jù)上的表現(xiàn)。為評價模型準確性,本文選用一致性指數(shù) (Concordance index,C-index)與Brier Score,NBLL三項指標分別對模型進行評估。為比較不同模型的預測能力,本文以時依Cox模型、邏輯回歸模型、CoxCC模型作為基準線,與本文模型進行對照實驗。實驗結(jié)果表明,DeepSurv在C-Index,Brier score,NBLL三項指標中,均取得了最優(yōu)表現(xiàn),驗證了模型的擬合優(yōu)度與準確性(見表1)。
表1:實驗結(jié)果比較
本文選用滬深A股市場的所有企業(yè)為樣本數(shù)據(jù),從比率結(jié)構(gòu)、償債能力、發(fā)展能力、風險水平、經(jīng)營能力、每股指標、現(xiàn)金流分析、相對價值指標、盈利能力十個方面選取51個原始變量作為預警指標。由于協(xié)變量在不同時間維度上存在變化,各協(xié)變量間存在交互影響,本文引用時依協(xié)變量Cox模型,隨后使用基于DeepSurv的深度生存分析算法對數(shù)據(jù)進行訓練最終獲得相對風險函數(shù),得到指標對于企業(yè)退市事件的正反影響及強度。實驗結(jié)果表明,該預測模型與其他傳統(tǒng)模型相較有較高的準確性,實現(xiàn)了對企業(yè)生存率的準確預測,動態(tài)展現(xiàn)了企業(yè)從正常轉(zhuǎn)入財務危機的變化過程,尤其是較為復雜的財務數(shù)據(jù)集預測有了一定的突破,具有一定的判斷能力。對于企業(yè)、監(jiān)管部門、投資者三方都有一定的參考價值。