康亮河 趙正強(qiáng) 萬君 王劍恩 王博
摘? 要:針對Elman神經(jīng)網(wǎng)絡(luò)在財務(wù)困境中預(yù)測精度低的問題,文章提出了結(jié)合金槍魚TSO算法與Elman神經(jīng)網(wǎng)絡(luò)的財務(wù)困境預(yù)警模型。針對2021年A股上市公司的財務(wù)數(shù)據(jù),首先采用Z分?jǐn)?shù)及多重插補(bǔ)法對異常值及缺失值進(jìn)行了處理,并利用PCA算法篩選出貢獻(xiàn)度為90%的重要屬性;其次,利用TSO算法對Elman神經(jīng)網(wǎng)絡(luò)參數(shù)尋優(yōu),構(gòu)建財務(wù)困境預(yù)測模型。實驗結(jié)果表明:TSO-Elman模型在對上市公司財務(wù)困境預(yù)測中具有較高的預(yù)測精度及穩(wěn)定性,相比RBF、BP、SVM及Elman模型,其分類準(zhǔn)確率分別提高了18.89%、14.13%、12.54%及4.61%。
關(guān)鍵詞:TSO算法;Elman神經(jīng)網(wǎng)絡(luò);PCA算法;財務(wù)困境
中圖分類號:TP391;TP183 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2023)09-0162-04
Abstract: Aiming at the problem of low prediction accuracy of Elman neural network in financial distress, this paper proposes a financial distress early warning model combining Tuna Swarm Optimization (TSO) algorithm and Elman neural network. In view of the financial data of A-share listed companies in 2021, the Z score and multiple imputation method are used to process the outliers and missing values firstly, and the PCA algorithm is used to screen out the important attributes with a contribution of 90%. Secondly, TSO algorithm is used to optimize Elman neural network parameters to construct a financial distress prediction model. The experimental results show that the TSO-Elman model has high prediction accuracy and stability in financial distress prediction of listed companies. Compared with RBF, BP, SVM and Elman models, its classification accuracy has improved 18.89%, 14.13%, 12.54% and 4.61% respectively.
Keywords: TSO algorithm; Elman neural network; PCA algorithm; financial distress
0? 引? 言
2020年一場突如其來的疫情,國內(nèi)很多大、中型企業(yè)停工停產(chǎn),陷入了財務(wù)困境,給公司股東與利益相關(guān)者帶來了巨大損失[1]。經(jīng)研究發(fā)現(xiàn),影響企業(yè)財務(wù)危機(jī)的影響因素錯綜復(fù)雜,但有跡可尋,通過建立一套高效實用的預(yù)警系統(tǒng),對于中小企業(yè)健康、有序發(fā)展具有重要意義[2]。
關(guān)于財務(wù)困境的預(yù)警已有大量研究,國內(nèi)學(xué)者郭小敏[3]在2018年指出,當(dāng)上市企業(yè)的財務(wù)連續(xù)3年虧損,表示該企業(yè)已出現(xiàn)財務(wù)困境,所以是否被ST處理可用來判斷企業(yè)是否出現(xiàn)財務(wù)困境。Altman[4]提出了Z分?jǐn)?shù)模型,運(yùn)用多個財務(wù)指標(biāo),結(jié)合加權(quán)算術(shù)平均數(shù),構(gòu)建了評價公司財務(wù)狀況的體系。Martin[5]利用多元邏輯回歸模型多銀行的經(jīng)營數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)該模型的預(yù)警能力明顯高于Z模型。Benes等[6]學(xué)者利用BP神經(jīng)網(wǎng)絡(luò)來評定公司信用等級,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)具有較好的可行性。石先兵[7]根據(jù)滬深A(yù)股制造業(yè)上市公司財務(wù)數(shù)據(jù),構(gòu)建了主成分分析法(PCA)與支持向量機(jī)(SVM)財務(wù)危機(jī)預(yù)警模型,具有良好的推廣作用和泛化作用。游旺[8]等學(xué)者利用改進(jìn)后的Elman神經(jīng)網(wǎng)絡(luò)來識別電纜故障,與BP相比,具有較高的分類準(zhǔn)確率。胡丹[9]等學(xué)者利用TSO模型結(jié)合極限學(xué)習(xí)機(jī)(ELM)來預(yù)測光伏的功率,發(fā)現(xiàn)TSO(Tuna Swarm Optimization)算法擁有更優(yōu)的尋優(yōu)精度和收斂速度。
截至目前,已有大量關(guān)于財務(wù)困境的預(yù)警研究,但其方法大致可以分為基于指標(biāo)分析與基于模型分析兩類,隨著市場的變化,單指標(biāo)與多指標(biāo)不能有效預(yù)警企業(yè)的未來財務(wù)狀況。在大數(shù)據(jù)時代,隨著信息技術(shù)快速發(fā)展,機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)算法在處理大量復(fù)雜數(shù)據(jù)方面展現(xiàn)出較大的優(yōu)勢,能夠取得較好的預(yù)測效果。以往在預(yù)測模型選擇時,基本選擇了Logistic回歸分析、SVM及BP神經(jīng)網(wǎng)絡(luò),忽略了本身存在的易陷入局部最優(yōu)及預(yù)測精度低等問題。所以本文引入了動態(tài)遞歸類Elman神經(jīng)網(wǎng)絡(luò),并利用TSO算法優(yōu)化Elman神經(jīng)網(wǎng)絡(luò),大幅度提高了Elman神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,本文提出的TSO-Elman模型可作為財務(wù)困境預(yù)警的一種可行方法。
1? 算法分析
1.1? PCA算法
主成分分析PCA算法是一種常用的非監(jiān)督降維算法,其核心思想是,在損失較小的前提下,將數(shù)據(jù)集從高緯空間轉(zhuǎn)換到低緯空間,即將n維特征映射到k維,這k維全新的正交特征被稱為主成分,其計算步驟如下:
1)構(gòu)建樣本矩陣X={x1, x2, x3,…, xn},其中n表示樣本的列數(shù),即矩陣的維度;
2)構(gòu)建協(xié)方矩陣:;
3)計算協(xié)方矩陣的特征值λ和特征向量ω;
6)提取k各主成分,實現(xiàn)將n維數(shù)據(jù)轉(zhuǎn)換到k維,實現(xiàn)主成分提取。
1.2? Elman神經(jīng)網(wǎng)絡(luò)
Elman神經(jīng)網(wǎng)絡(luò)在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中增加了接收隱含層反饋信息的承接層,用來存前一時刻的輸出值[10],提高了對過去數(shù)據(jù)的敏感度,同時也增加了Elman神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的動態(tài)計算能力,Elman的結(jié)構(gòu)如圖1所示,由于各層使用的激活函數(shù)不同,所有其輸出值的數(shù)學(xué)模型如式(2)所示:
其中x(k)和xc(k)表示隱含層和承接層在時間上的輸出向量。y(k)表示輸出向量,α1、α2、α3表示權(quán)重,b1、b2表示隱含層和輸出層的閾值。
1.3? TSO算法
海洋中的金槍魚,為了高效快速地捕獲到獵物,通過選擇螺旋覓食或拋物線覓食,成為海洋中的捕食能手,TSO算法是模擬金槍魚覓食行為的一種新型智能優(yōu)化算法。
1.3.1? 螺旋覓食
金槍魚在捕食的過程中,金槍魚可以隨時調(diào)整自己的方向,從而形成緊密的螺旋結(jié)構(gòu)來追逐周圍的獵物,同時,最優(yōu)個體在追逐獵物的過程中可與魚群交互信息,實現(xiàn)信息的共享[11],其金槍魚螺旋覓食的位置更新如式(3)所示:
1.3.2? 拋物線覓食
金槍魚覓食的第二種策略是拋物線覓食,金槍魚除了螺旋覓食外,還以食物為參照點(diǎn)形成拋物線形的形式覓食,同時金槍魚也可以在自己周圍尋找食物進(jìn)行覓食假設(shè)在概率50%的情況下兩種方式同時執(zhí)行,其數(shù)據(jù)模型如式(6)所示:
1.4? MOTSO-Elman 模型
Elman神經(jīng)網(wǎng)絡(luò)是一種動態(tài)反饋遞歸神經(jīng)網(wǎng)絡(luò),具有較強(qiáng)的非線性擬合能力及泛化能力,但由于采用梯度下降法,易陷入局部最優(yōu)導(dǎo)致預(yù)測精度較低,所以本文利用TSO算法來優(yōu)化Elman神經(jīng)網(wǎng)絡(luò)的權(quán)值及閾值,建立TSO-Elman模型,其具體的處理流程如圖2所示。
Step1:導(dǎo)入構(gòu)建的財務(wù)困境數(shù)據(jù)集;
Step2:初始化金槍魚算法的各參數(shù),包括種群規(guī)模、迭代次數(shù)、變量最大值、變量最小值、種群初始位置等;
Step3:以預(yù)測錯誤率(1-正確率)作為適應(yīng)度函數(shù),根據(jù)每條金槍魚的位置計算適應(yīng)度值;
Step4:更新參數(shù)α1、α2及p;
Step5:根據(jù)式(6)、式(7)更新個體位置;
Step6:迭代計算,返回步驟3重新計算適應(yīng)度;
Step7:判斷TSO算法是否滿足終止條件,如果滿足則結(jié)束迭代,輸出最優(yōu)個體位置和對應(yīng)的適應(yīng)度值,否則轉(zhuǎn)入Step3;
Step8:采用Step6輸出值作為Elman神經(jīng)網(wǎng)絡(luò)的初始閾值及權(quán)值,構(gòu)建Elman神經(jīng)網(wǎng)絡(luò),計算TSO-Elman的預(yù)測結(jié)果;
Step9:根據(jù)預(yù)測結(jié)果,計算該模型對應(yīng)的準(zhǔn)確率、第I類錯誤率及第II類錯誤率。
2? 實驗結(jié)果及對比討論
2.1? 數(shù)據(jù)準(zhǔn)備
2.1.1? 實驗環(huán)境
本文采用Windows 10(64 bit)操作系統(tǒng),500 GB固態(tài)
硬盤,同時以Matlab R2020b作為仿真軟件,實現(xiàn)TSO-Elman模型及各對比模型的測試。
2.1.2? 評價指標(biāo)
本文采用分類準(zhǔn)確率Accuracy、第I類錯誤率及第II類錯誤率三個指標(biāo)來評估分類模型,其三個指標(biāo)的數(shù)學(xué)表達(dá)分別如式(8~10)所示:
其中,TP表示財務(wù)正常的上市公司被正確分類的數(shù)量,TN表示出現(xiàn)財務(wù)困境的ST上市公司被正確分類的數(shù)量,F(xiàn)P表示ST上市公司被劃分為正常公司的數(shù)量,F(xiàn)N表示財務(wù)正常的上市公司被分為ST公司的數(shù)量。
2.1.3? 參數(shù)設(shè)計
在TSO算法中,金槍魚的種群數(shù)量NP=30,最大迭代次數(shù)tmax=50,金槍魚在初始階段跟隨最佳個體及前一個個體移動的權(quán)重系數(shù)=0.7。
在Elman算法中,隱含層使用tansig(x)=2/(1+exp(-2x))-1作為激活函數(shù),輸出層使用purelin(x)=x作為激活函數(shù),最大訓(xùn)練次數(shù)epochs=100,誤差目標(biāo)goal=0.000 1,學(xué)習(xí)率lr=0.1。
2.1.4? 實驗數(shù)據(jù)預(yù)處理
本文在Choice金融終端獲取了2020年全部A股財務(wù)數(shù)據(jù),共4 524家上市公司的123項財務(wù)指標(biāo)數(shù)據(jù),若該上市公司2018與2019年的財務(wù)凈利潤均小于0,則2020年該上市公可能存在財務(wù)困境,被判定為ST公司,用類別“1”表示,否則,判定為非ST公司,用類別“0”表示。
2.1.4.1? z分?jǐn)?shù)去異常值
本文通過Z分?jǐn)?shù)(Z-score)計算每個財務(wù)數(shù)據(jù)偏離其對應(yīng)平均數(shù)的距離,若距離大于3,則認(rèn)為是異常值,直接刪除,其計算公式如式(11)所示:
其中,X表示原始財務(wù)數(shù)據(jù), 表示每一個財務(wù)指標(biāo)對應(yīng)的平均數(shù),s表示標(biāo)準(zhǔn)差。
2.1.4.2? 多重插補(bǔ)法處理缺失值
對于缺失較多的財務(wù)數(shù)據(jù),直接刪除該財務(wù)指標(biāo),對于缺失的個別財務(wù)數(shù)據(jù),通過多重插補(bǔ)法進(jìn)行插補(bǔ),該方法利用模擬成m個完全數(shù)據(jù)集作為缺失值的替代值,缺失數(shù)據(jù)將用馬爾科夫鏈蒙特卡洛MCMC(Markov Chain Monte Carlo Simulation)進(jìn)行填補(bǔ)。
2.1.4.3? PCA降維
本文通過PCA方法將高緯度數(shù)據(jù)投影到較低維空間,從而降低數(shù)據(jù)集的復(fù)雜度,提高預(yù)測的準(zhǔn)確率。通過PCA算法,按累計貢獻(xiàn)率92%從87個財務(wù)指標(biāo)中篩出9個重要指標(biāo)。
2.1.4.4? 構(gòu)建樣本集
本文隨機(jī)選擇了314家(包括157家ST股及非157家非ST股)上市公司的9個財務(wù)指標(biāo)作為最終的樣本集,以80%作為訓(xùn)練集,剩余20%作為測試集。
2.2? 實驗結(jié)果及對比分析
2.2.1? 模型適應(yīng)度分析
在TSO算法中,選擇金槍魚的規(guī)模為30,迭代次數(shù)也設(shè)置了30,以錯誤率作為適應(yīng)度函數(shù),分別提取了第1次、第10次、第20次及第30次每條金槍魚的適應(yīng)度值,其結(jié)果如圖3所示,通過分析圖3發(fā)現(xiàn),在每次迭代的過程中,隨著TSO算法螺旋覓食跟拋物線覓食策略不斷更新金槍魚的位置,使其錯誤率不斷減小,另外對比第1次、第10次、20次及30次誤差,發(fā)現(xiàn)隨著不斷循環(huán)迭代,其每次迭代的誤差也逐漸縮小,TSO模型逐漸篩選出最優(yōu)個體作為Elman算法的初始閾值及權(quán)值。
2.2.2? 模型預(yù)測結(jié)果分析
本文隨機(jī)選擇了20%數(shù)據(jù)集作為測試集,共63家上市公司,其中30家公司財務(wù)正常,33家公司因連續(xù)兩年虧損變?yōu)镾T股。使用TSO-Elman模型對63家公司財務(wù)狀況進(jìn)行了預(yù)測,其中財務(wù)正常的公司有33家,ST股上市公司有29家。經(jīng)統(tǒng)計發(fā)現(xiàn),在預(yù)測的63家公司中,57家上市公司的財務(wù)狀況與實際的財務(wù)狀況一致,該模型的預(yù)測準(zhǔn)確率為90.32%,其具體的預(yù)測結(jié)構(gòu)如表1所示。
2.2.3? 模型對比分析
本文選擇了RBF、BP、SVM及Elman模型來對比分析TSO-Elman模型,對各模型分別進(jìn)行10次預(yù)測,并對預(yù)測結(jié)果取其均值,最后分別計算出各模型的準(zhǔn)確率、第I類及第II類錯誤率,結(jié)果如表2所示。
經(jīng)計算,TSO-Elman模型的準(zhǔn)確率為90.32%,第I類錯誤率為3.45%,第II類錯誤率為15.15%,比單純使用Elman算法的準(zhǔn)確率提高了4.16%,第I類及第II類錯誤分別降低了6.23%及1.52%。相比RBF算法,準(zhǔn)確率提高了18.89%,第I類及第II類錯誤分別降低了10.84%及20.56%,TSO-Elman模型其準(zhǔn)確率明顯高于其他模型,第I類及II類錯誤率低于其他模型,由此可知,本文提出的模型能夠較準(zhǔn)確地預(yù)警企業(yè)的財務(wù)狀況,使企業(yè)經(jīng)營者能盡早甄別問題、解決問題。
3? 結(jié)? 論
本文以2020年A股上市公司的財務(wù)數(shù)據(jù)作為研究對象,利用Z分?jǐn)?shù)及多重插補(bǔ)法對數(shù)據(jù)的異常值、缺失值進(jìn)行了清洗,提高了數(shù)據(jù)的質(zhì)量,針對高緯度數(shù)據(jù)集,通過PCA算法來降低數(shù)據(jù)集的復(fù)雜度,利用TSO-Elman模型以251家上市公司的財務(wù)數(shù)據(jù)為訓(xùn)練集,對63家公司的財務(wù)狀況進(jìn)行測,得到了較好的預(yù)測效果,同時利用RBF、BP、SVM等多個模型對TSO-Elman模型進(jìn)行對比分析,進(jìn)一步證明了該模型在財務(wù)困境預(yù)警中的可靠性和有效性,是企業(yè)應(yīng)對或規(guī)避財務(wù)風(fēng)險的一種有效方法。
參考文獻(xiàn):
[1] 張愛云.新冠疫情視域下山東中小企業(yè)財務(wù)困境預(yù)警研究 [J].現(xiàn)代商業(yè),2022(22):53-56.
[2] ELHOSENY M,METAWA N,SZTANO G,et al. Deep Learning-Based Model for Financial Distress Prediction [J].Annals of Operations Research,2022:21-23.
[3] 郭小敏.基于Logit模型的上市公司財務(wù)困境預(yù)測研究 [J].經(jīng)貿(mào)實踐,2018(8):54-55.
[4] ALTMAN E I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy [J].Journal of Finance,1968,23(4):589-609.
[5] MARTIN D. Early Warnings of Bank Failure: A Logit Regression Approach [J].Journal of Banking & Finance,1977,1(3):249-276.
[6] BENES J,KUMHOF M,LAXTON D. Financial Crises in DSGE Models: A prototype Model [J].IMF Working Paper,2014,14(57):1-1.
[7] 石先兵.基于PCA-SVM的企業(yè)財務(wù)危機(jī)預(yù)警模型構(gòu)建 [J].財會通訊,2020(10):131-134.
[8] 游旺,李文沛,胡泰山,等.基于改進(jìn)Elman神經(jīng)網(wǎng)絡(luò)的電纜早期故障分類識別方法 [J].電工技術(shù),2022(5):154-158+161.
[9] 胡丹,楊書恒.基于改進(jìn)金槍魚算法優(yōu)化ELM模型的光伏功率預(yù)測 [J].武漢理工大學(xué)學(xué)報,2022,44(8):97-104.
[10] ZHU C S,KANG L H,F(xiàn)ENG W F. Predicting Stock Closing Price with Stock Network Public Opinion Based on AdaBoost-AAFSA-Elman Model and CEEMDAN Algorithm [J].Journal of Shanghai Jiaotong University:Science,2021:1-13.
[11] CONCHON S,DECLERCK D,ZA?DI F. Parameterized Model Checking on the TSO Weak Memory Model [J].Journal of Automated Reasoning,2020,64(7):1307-1330.
作者簡介:康亮河(1987—),女,漢族,甘肅會寧人,助教,碩士,研究方向:人工智能算法研究;趙正強(qiáng)(1999—),男,漢族,甘肅慶陽人,本科在讀,研究方向:數(shù)據(jù)挖掘;萬君(2000—),女,漢族,甘肅酒泉人,本科在讀,研究方向:機(jī)器學(xué)習(xí);王劍恩(2002—),男,漢族,甘肅平?jīng)鋈?,本科在讀,研究方向:機(jī)器學(xué)習(xí);王博(2001—),男,漢族,甘肅天水人,本科在讀,研究方向:機(jī)器學(xué)習(xí)。