吳育輝 劉忻忻 陳韞妍
【摘 要】 自2014年我國債券市場首例違約事件發(fā)生以來,債券違約屢見不鮮。文章以2014—2022年發(fā)行的公司債、企業(yè)債和中期票據(jù)為研究對象,選取財務指標與非財務指標,搭建了基于機器學習算法SMOTETomek-GWO-XGBoost的債券違約風險預警模型。結果表明:(1)與其他方法相比,GWO-XGBoost模型在準確率、召回率、未加權平均召回率以及AUC值這四個指標上具有更加優(yōu)異的表現(xiàn);(2)SMOTETomek采樣方法可以有效平衡數(shù)據(jù)樣本,因此SMOTETomek-GWO- XGBoost模型具有更高的精度與穩(wěn)定性;(3)SHAP值法可以展示不同特征變量對債券違約風險的貢獻度,有利于就重要特征進行針對性分析。
【關鍵詞】 債券違約風險; 風險預警; 機器學習; GWO-XGBoost; SMOTETomek
【中圖分類號】 F234.3;F832.5? 【文獻標識碼】 A? 【文章編號】 1004-5937(2024)06-0073-09
一、引言
截至2022年末,我國債券市場總存量已經(jīng)達到了141.22萬億元,同比增長8.2%,這一龐大規(guī)模和快速增長的數(shù)據(jù)顯示出中國債券市場持續(xù)蓬勃發(fā)展的態(tài)勢。但值得注意的是,自2014年第一只違約債券出現(xiàn)以來,債券違約事件屢見不鮮。根據(jù)Wind數(shù)據(jù)庫的統(tǒng)計,2022年我國債券違約總金額為861.95億元,新增違約主體37家,新增違約債券152只。在實體經(jīng)濟的發(fā)展過程中,債券市場發(fā)揮了促進企業(yè)投資、融資活動的重要作用。然而,近年來屢屢發(fā)生的違約事件暴露出債券市場存在一定的信用風險。通過分析債券違約的原因,本文希望找到防范化解債券違約風險的有效途徑,從而為我國債券市場的高質量發(fā)展提供有益參考。
債券違約事件的發(fā)生,不僅與宏觀經(jīng)濟環(huán)境及監(jiān)管政策的變化密不可分,而且與公司層面的經(jīng)營財務表現(xiàn)密切相關。此外,Bao等[ 1 ]研究發(fā)現(xiàn),相比于現(xiàn)有的大多數(shù)以解釋樣本欺詐行為并強調因果推理為主要目的研究,使用集成學習構建的預測模型可以更準確地對會計欺詐行為進行預測。因此,本文從宏觀和微觀層面入手,結合財務指標與非財務指標,運用機器學習的方法對債券違約風險進行預測。
本文以我國2014—2022年企業(yè)債、公司債和中期票據(jù)為研究對象,結合SMOTETomek(Synthetic Minority Oversampling Technique Tomek Links)采樣算法以及GWO-XGBoost(Grey Wolf Optimizer Extreme Gradient Boosting)算法,構建債券違約風險預警模型。實證結果表明,該機器學習模型有較好的違約預測能力,在準確率、召回率、未加權平均召回率以及AUC值(ROC曲線下的面積)四個指標上均有不錯的表現(xiàn),為后續(xù)債券違約分析和預警提供了思路和依據(jù)。
本文的主要貢獻體現(xiàn)為兩個方面:(1)在研究方法上進行改進。相比傳統(tǒng)的XGBoost機器學習模型,本文先以GWO智能優(yōu)化算法對其進行優(yōu)化。通過利用GWO算法計算出最優(yōu)的弱分類器數(shù)量(n_estimators)、學習率(learning_rate)以及最大深度(max_depth)的方式,對XGBoost模型的參數(shù)進行調優(yōu)。在此基礎上,鑒于債券樣本非平衡的特點,使用SMOTETomek采樣算法,有效提升了小類別樣本(即違約樣本)的識別率。(2)在選取非財務指標上進行改進。本文創(chuàng)新性地引入了從上市公司年報中提取出的核心競爭力指標,并且發(fā)現(xiàn)該指標的加入對提升債券違約預警模型的性能有較大幫助。
二、文獻綜述與理論分析
債券違約一直是金融領域的熱點話題之一。債券違約風險的識別意味著對債權人發(fā)生違約的可能性進行評估和預測。已有的研究主要從財務及非財務指標的選擇、預測模型的建立,以及不平衡數(shù)據(jù)的處理這三個方面展開。
(一)指標選取
在財務指標方面,大量的研究將財務指標用于財務危機預警和企業(yè)違約風險的預測。具體而言,吳世農和黃世忠[ 2 ]從資產(chǎn)變現(xiàn)率、負債狀況、資產(chǎn)使用效率以及盈利能力四個方面選取企業(yè)破產(chǎn)分析指標。吳世農和盧賢義[ 3 ]選取了包括資產(chǎn)收益率、負債比率以及資產(chǎn)周轉率等在內的21個財務指標。吳育輝和唐浩博[ 4 ]的研究中則包括了資產(chǎn)負債率與企業(yè)成長性(營業(yè)收入同比增長率)等上述研究中未出現(xiàn)的指標。本文總結上述研究成果,從盈利能力、短期償債能力、長期償債能力、資產(chǎn)負債結構、營運能力、成長能力以及創(chuàng)現(xiàn)能力這七個維度出發(fā),選取了包括資產(chǎn)負債率、凈資產(chǎn)收益率、流動比率、總資產(chǎn)周轉天數(shù)、應收賬款周轉天數(shù)、EBIT利潤率在內的總計34個財務指標。這些財務指標可以幫助評估企業(yè)在不同層面的財務狀況和經(jīng)營業(yè)績,從而為企業(yè)的管理和決策提供有價值的信息。
在非財務指標方面,本文考慮了宏觀、行業(yè)及企業(yè)三個層面。具體而言,首先是宏觀經(jīng)濟層面。呂峻和李梓房[ 5 ]以及盧永艷[ 6 ]研究發(fā)現(xiàn),GDP、GDP增長率、消費者物價指數(shù)CPI以及狹義貨幣供給量M1的增長率這些宏觀經(jīng)濟指標對公司陷入財務危機的影響顯著;戴雅榕和沈藝峰[ 7 ]的研究表明,政府作為“看不見”的手,其隱性擔保能力在債券違約預測中有著重要作用。因此,本文將GDP增速、CPI增速以及M1增速納入全國層面的經(jīng)濟指標,將GDP增速以及政府隱性擔保能力作為省級層面的經(jīng)濟指標。其次是行業(yè)層面。Chava和Jarrow[ 8 ]指出不同行業(yè)面臨的競爭水平和破產(chǎn)可能性不同,成熟行業(yè)的破產(chǎn)率較高。此外,行業(yè)需求和行業(yè)集中度也會對企業(yè)破產(chǎn)概率產(chǎn)生影響。因此,本文選擇發(fā)債主體所在行業(yè)以及該行業(yè)的行業(yè)集中度作為行業(yè)指標。最后是企業(yè)層面。根據(jù)吳世農等[ 9 ]的研究,企業(yè)的核心競爭力越強,未來的違約風險越低。因此,本文創(chuàng)新性地選取對上市公司年報進行文本分析和提煉得到的企業(yè)核心競爭力指標作為企業(yè)的非財務指標,這是既往債券違約預測中并未出現(xiàn)過的指標。
(二)模型選取
在獲取具有研究價值的實驗指標之后,通常需要利用統(tǒng)計方法或機器學習方法對大量數(shù)據(jù)進行詳細分析。而在計量經(jīng)濟學中,主要使用統(tǒng)計方法分析指標間的相關性,并通過利用其理論背景對結果進行解釋[ 10 ]。相比統(tǒng)計方法,機器學習方法在檢測數(shù)據(jù)特征的非線性關系以及處理大量數(shù)據(jù)等方面具有重要優(yōu)勢[ 11 ]。
在諸多主流機器學習模型中,XGBoost模型自2016年由Chen和Guestrin[ 12 ]提出以來,因其在分類和預測方面的效果明顯優(yōu)于傳統(tǒng)模型而廣泛應用于風險預測領域。Barboza等[ 13 ]的實驗結果表明,在破產(chǎn)預測方面,Bagging、Boosting以及隨機森林(Random Forest,RF)比線性判別分析(Linear Discriminant Analysis,LDA)、邏輯回歸(Logistic Regression,LR)和人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,ANN)具有更好的性能。此外,Addo等[ 14 ]利用不同的機器學習和深度學習技術對貸款違約行為進行預測,證明了基于樹的模型比基于多層神經(jīng)網(wǎng)絡的模型更加穩(wěn)定。XGBoost模型作為機器學習模型用于債券違約預測,不僅在與傳統(tǒng)的邏輯回歸模型進行比較時展現(xiàn)出一定的優(yōu)越性[ 15 ],而且相比基于樹的其他模型(如決策樹、梯度提升決策樹等),在AUC、準確率、精確率、召回率以及F1值等指標上均有優(yōu)勢[ 16 ]。
參考Chen等[ 17 ]的研究,當數(shù)據(jù)樣本不平衡時,可以引入未加權平均召回率指標對模型性能進行評估。精確率與F1值在面對不平衡樣本時效果較差,故本文采用AUC、準確率、召回率以及未加權平均召回率這四個指標衡量由XGBoost模型構建的債券違約風險預測模型的性能。
然而,通過總結已有文獻得出一個結論,即單一預測模型的效果往往有限。為了更好地提高預測的精度,可以引入智能優(yōu)化算法來解決。EML(進化機器學習)是一類基于生物進化理論的機器學習算法,它模擬自然界中的生物進化過程,使用進化計算的方法來優(yōu)化模型參數(shù)或解決優(yōu)化問題。EML算法包括遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)、模擬退火算法(Simulated Annealing,SA)以及灰狼優(yōu)化算法(Grey Wolf Optimization,GWO)等,在財務領域廣泛應用。Ansari等[ 18 ]通過使用粒子群優(yōu)化算法(PSO)來改進人工神經(jīng)網(wǎng)絡模型,成功降低了人工神經(jīng)網(wǎng)絡權值訓練所需的時間復雜度,提高了ANN進行破產(chǎn)預測的效率和準確率。Wang等[ 19 ]利用灰狼優(yōu)化算法(GWO)構建了一種用于破產(chǎn)預測的新型KELM(內核極限學習機)模型,其在準確性、I型和II型誤差、AUC值以及計算時間方面都表現(xiàn)出了優(yōu)越性。除此之外,肖艷麗和向有濤[ 20 ]的研究發(fā)現(xiàn),GWO-XGBoost模型相比SVM(支持向量機)、KNN(K-近鄰)、決策樹、LDA以及RF等模型,在預測精度、穩(wěn)定性和統(tǒng)計意義方面都具有更優(yōu)異的性能,并對數(shù)據(jù)預測和決策具有重要的應用價值。前人的研究為本文提供了研究思路,即在進行預測任務時,可以考慮使用智能優(yōu)化算法來輔助模型的選擇和調整,從而獲得更準確的預測結果。
但需要注意的是,在利用機器學習分析債券違約問題時,除了要關注預測精度的提升以外,還應重視模型結果的可解釋性,盡量避免“黑箱”問題。近年來,源于Shapley值概念的SHapley Additive exPlanations(SHAP)值[ 21 ]在復雜模型的解釋中得到了頻繁的應用。SHAP值可以幫助衡量每個屬性對預測分類的貢獻,從而解釋復雜模型的預測結果。通過將不同屬性的SHAP值及其排名可視化,可以為進一步探索不同屬性與債券違約之間的因果關系提供理論依據(jù)。
(三)不平衡數(shù)據(jù)處理
在債券違約風險研究領域,數(shù)據(jù)的不平衡性是一個常見的問題。違約的樣本相較未違約的樣本而言只占全樣本的少數(shù),因此在模型的訓練過程中,往往會出現(xiàn)對少數(shù)類的識別精度較低的情況。不平衡的數(shù)據(jù)需要從數(shù)據(jù)層面或者算法層面加以處理。在算法層面,可以通過成本敏感型學習模型以及集成學習模型解決數(shù)據(jù)不平衡的問題;而在數(shù)據(jù)層面,可以通過采樣方法來平衡數(shù)據(jù)[ 22 ]。上述方法中,采樣方法是最為常用的解決數(shù)據(jù)不平衡問題的方法。
合成少數(shù)過采樣技術(SMOTE)是一種主流的過采樣方法,通過對少數(shù)類進行線性插值來生成新的綜合訓練數(shù)據(jù)。然而SMOTE方法對少數(shù)類的隨機添加,可能會導致過度泛化和噪聲數(shù)據(jù)的產(chǎn)生[ 23 ]。為了提高SMOTE方法的性能,可以采用欠采樣方法來清理多數(shù)類中的噪聲數(shù)據(jù)。一種基于SMOTE過采樣方法開發(fā)出的SMOTE-Tomek Links方法,結合了SMOTE過采樣方法和Tomek Links欠采樣方法的特點,既保留了有效信息,又可以去除具有相似特征和重疊的噪聲數(shù)據(jù),從而減輕了邊界模糊問題[ 24 ]。相比單獨使用SMOTE方法,SMOTE-Tomek Links方法可以更有效地改善數(shù)據(jù)不平衡性,并提高模型識別少數(shù)類的準確性。因此,本文采用SMOTE-Tomek Links方法(簡稱SMOTETomek)作為非平衡數(shù)據(jù)的處理方法。
三、研究設計
(一)指標選取
1.財務指標
根據(jù)前文的文獻梳理,選取以下財務指標進行分析:
(1)盈利能力:銷售毛利率、銷售凈利率、EBIT利潤率、營業(yè)利潤率、總資產(chǎn)凈利率(ROA)、凈資產(chǎn)收益率(ROE)、投入資本回報率(ROIC)。
(2)短期償債能力:流動比率、速動比率、現(xiàn)金比率。
(3)長期償債能力:資產(chǎn)負債率、凈現(xiàn)金負債率、有息負債權益比、利息保障倍數(shù)。
(4)資產(chǎn)負債結構:經(jīng)營風險、資產(chǎn)結構、負債結構。
(5)營運能力:總資產(chǎn)周轉天數(shù)、存貨周轉天數(shù)、應收賬款周轉天數(shù)、應付賬款周轉天數(shù)、預收賬款周轉天數(shù)、預付賬款周轉天數(shù)、現(xiàn)金周轉天數(shù)、凈營運周期。
(6)成長能力:營業(yè)收入增長率、凈利潤增長率、歸母扣非凈利潤增長率、經(jīng)營活動凈現(xiàn)金增長率、凈現(xiàn)金增長率、總資產(chǎn)增長率、凈資產(chǎn)增長率。
(7)創(chuàng)現(xiàn)能力:收入獲現(xiàn)率、利潤獲現(xiàn)率。
2.非財務指標
根據(jù)前文分析,選擇以下指標作為非財務指標:
(1)宏觀經(jīng)濟指標:全國層面包括GDP增速、CPI增速以及M1增速,省級層面包括地方GDP增速以及地方政府隱性擔保能力。
(2)行業(yè)指標:發(fā)債主體所屬行業(yè)以及行業(yè)集中度。
(3)企業(yè)非財務指標:上市公司核心競爭力指標。這部分指標參考吳世農等[ 9 ]的研究,利用Word2Vec模型以及命名實體識別法(NER)等文本分析技術,從2012—2022年中國A股上市公司年報中提取得出,主要包括傳統(tǒng)資源指標(Tradition)、人才資源指標(Human)、品牌資源指標(Brand)、政策資源指標(Policy)、經(jīng)營能力指標(Operation)、創(chuàng)新能力指標(Innovation)、管控能力指標(Management)、產(chǎn)業(yè)鏈協(xié)同能力指標(Industrychain)、社會責任履行能力指標(Society)以及其他能力指標(Other)共10個二級指標,通過上述二級指標求和得出上市公司核心競爭力綜合指標(Core)。
指標定義見表1。
(二)數(shù)據(jù)選取與處理
本文數(shù)據(jù)均來源于Wind數(shù)據(jù)庫??紤]到首次出現(xiàn)實質違約的樣本可能不具代表性,并且刪除發(fā)行日期早于2014年的樣本有助于調整小類別樣本的比例,因此本文選擇了2014年1月至2022年12月之間發(fā)行的債券作為研究對象。已到期債券未來沒有違約的可能,因此,本文選取已到期非違約公司債、企業(yè)債和中期票據(jù)數(shù)據(jù)作為模型的正向樣本,同時選取了在此期間發(fā)生違約的全部公司債、企業(yè)債和中期票據(jù)數(shù)據(jù)作為模型的負向樣本,即違約樣本。樣本去重后,得到正向樣本8 002條,負向樣本346條,總體樣本8 348條。在匹配核心競爭力指標(Core)且剔除樣本缺失值后,得到本文最終樣本共計1 279條,其中債券違約樣本106條。
為了排除異常值的影響,本文對財務數(shù)據(jù)進行了上下1%的Winsorize縮尾處理。由于樣本存在部分缺失值,本文采用各屬性的行業(yè)中值來填補缺失值,并對填補后的數(shù)據(jù)進行了歸一化處理,將數(shù)據(jù)范圍限制在[0,1]之間。
債券發(fā)行前3年披露的數(shù)據(jù)能夠提供較為全面的歷史信息,有助于捕捉可能對違約風險產(chǎn)生影響的因素。因此,本文以債券發(fā)行前3年的數(shù)據(jù)作為樣本,以考察各項財務指標的表現(xiàn)。舉例來說,當選擇銷售毛利率這一指標時,需要相應地提取債券發(fā)行前3年的銷售毛利率數(shù)據(jù),即銷售毛利率(t-3)、銷售毛利率(t-2)以及銷售毛利率(t-1)。其中,t表示發(fā)行起始年,t-1表示發(fā)行日期的前一年,以此類推。
(三)研究模型設計
1.XGBoost模型
XGBoost(EXtreme Gradient Boosting)是一種集成學習算法,它結合了梯度提升算法(Gradient Boosting)和決策樹模型,被廣泛應用于回歸和分類問題。該算法采用Boosting思想中的加法模型,通過逐步構建一系列弱分類器,并將它們的預測結果進行集成來提升整體性能。
2.GWO算法
XGBoost模型的參數(shù)選擇對模型的預測結果具有重要影響。本文選擇灰狼優(yōu)化算法(GWO)來優(yōu)化XGBoost模型的學習率(learning_rate)、弱分類器個數(shù)(n_estimators)以及最大深度(max_depth)的參數(shù)設置,并應用GWO-XGBoost模型來預警企業(yè)債券違約風險?;依撬惴ㄊ且环N啟發(fā)式優(yōu)化算法,它由灰狼的種群機制推演而來,通過對掠奪行為的不斷迭代,最終找到最佳解。該算法具有搜索速度快、易得到全局最優(yōu)解和穩(wěn)定性較強等優(yōu)勢。
3.SMOTE-Tomek采樣模型
SMOTE和Tomek Links是兩種常用的處理不平衡數(shù)據(jù)集的方法。它們可以結合使用,形成一種稱為SMOTE-Tomek的組合方法。SMOTE-Tomek算法首先使用SMOTE對少數(shù)類別進行過采樣,創(chuàng)建合成樣本,然后使用Tomek Links方法刪除生成的合成樣本與原始樣本之間的膠著樣本對,以改進不同類之間的分離程度。這種組合方法旨在增強不平衡數(shù)據(jù)集的分類性能,并為少數(shù)類預測提供更穩(wěn)健的模型。
四、研究結果
(一)評價指標
選擇適當?shù)哪P驮u價指標對準確評估和比較不同模型的性能至關重要。由于債券違約風險預測問題本質上是二分類問題,本文以不平衡二分類問題中常用的準確率(Accuracy)、召回率(Recall)、未加權平均召回率(UAR)以及AUC值作為模型的評價指標。
對于每一個測試樣本,模型有四種可能的預測結果,如表2所示。
以下是對上述指標的具體介紹:
1.準確率(Accuracy)
準確率是最直觀和常用的指標,它表示模型預測正確的樣本占總樣本的比例。但在數(shù)據(jù)不平衡的情況下,準確率可能會因模型傾向于預測多數(shù)類別而產(chǎn)生誤導,因此需要結合其他指標進行模型性能的評判。其具體計算公式如下:
2.召回率(Recall)
召回率衡量模型正確預測為正例的樣本占實際正例樣本的比例,高召回率表示模型能夠較好地識別出正例,對于關注正確預測實際正例的應用非常重要。其具體計算公式為:
3.UAR(Unweighted Average Recall)
UAR針對實際的正樣本和負樣本計算相關概率,表示每類數(shù)據(jù)樣本召回率(Recall)的平均值。因此,當樣本不平衡時可以使用UAR對模型進行客觀評估。其具體公式為:
其中,Recall0代表特異度[等于TN/(TN+FP)],Recall1代表召回率,分母為2代表二分類問題。
4.AUC值
AUC值是ROC曲線下的面積,用于度量二分類模型預測結果的整體性能。ROC曲線繪制了模型在不同閾值下的真正率[TPR,等于TP/(TP+FN)]和假正率[FPR,等于FP/(FP+TN)]之間的關系。AUC值越高,表示模型的性能越好。
(二)模型結果分析
非財務指標中的核心競爭力指標從上市公司年報中提取而來,因此在結合該指標后,樣本量會有較大幅度的減少。為了系統(tǒng)地探究不同模型在債券違約風險預測方面的性能,以及不同特征與違約行為之間的聯(lián)系,本研究將實驗劃分為三部分。第一部分,分別驗證不同模型基于財務指標以及全部指標的債券違約預測能力;第二部分,利用SMOTE-Tomek采樣算法對模型進行優(yōu)化;第三部分,使用SHAP值法分析各指標對債券違約預測的影響力。
1.模型實驗結果
本文對七個常用的機器學習模型進行了比較和分析,這些模型包括GWO-XGBoost、XGBoost、ANN、RF、KNN、SVM以及LR。其中,GWO算法通過優(yōu)化XGBoost模型的準確率來獲得最佳的弱分類器數(shù)量、學習率以及最大深度?;谪攧仗卣鞯腉WO-XGBoost模型最佳參數(shù)配置為n_estimators=250,learning_rate=0.3,max_depth=5;基于全部特征(即財務特征與非財務特征)的GWO-XGBoost模型最佳參數(shù)配置為n_estimators=300,learning_ rate=0.3,max_depth=6。
根據(jù)表3及圖1可知,無論基于財務特征還是基于全部特征,XGBoost模型的綜合性能都優(yōu)于其他5個模型。經(jīng)過GWO算法優(yōu)化后,基于財務特征的XGBoost模型在Recall、UAR和AUC值這三個指標上都有明顯的提高,基于全部特征的XGBoost模型在四個指標上的表現(xiàn)較默認模型均有所提升。
通過觀察基于財務特征的GWO-XGBoost模型與XGBoost模型的預測值混淆矩陣(表4)可以發(fā)現(xiàn),由于GWO算法以準確率為優(yōu)化目標,且數(shù)據(jù)的不平衡性較強(即債券違約樣本數(shù)量較少),因此,在提高準確率的同時,可能會導致少量違約樣本被錯誤分類,進而造成召回率的小幅下降。但值得注意的是,優(yōu)化后模型的UAR值與AUC值更高。其中,UAR指標只關注自類數(shù)據(jù),即分別在正樣本和負樣本中觀察相關概率問題,因此,該指標可以無視樣本不均衡的情況,對模型進行客觀評估。而AUC指標的計算方法同時考慮了學習器對正例和負例的分類能力,因此,該指標在樣本不平衡的情況下同樣可以對分類器做出合理的評價。由此可知,當模型具有更高的UAR值與AUC值時,說明該模型對不同樣本的識別能力更強且綜合表現(xiàn)更好。上述結論表明,基于本文中的數(shù)據(jù)樣本,使用GWO算法對XGBoost模型進行優(yōu)化可以提升模型的性能。
在引入非財務指標后,由于上市公司數(shù)量較少,樣本的數(shù)據(jù)量有了較大幅度的縮減,這導致模型可以學習到的信息減少。然而,與僅使用財務指標的模型相比,使用全部指標的模型準確率以及UAR值都有所提高,同時,AUC值也有顯著提高。這表明雖然樣本數(shù)據(jù)的減少會對模型的訓練造成一定的影響,但使用更全面的指標能夠彌補這一缺點,并提高模型的性能。使用全部指標的模型能夠更好地識別出正例并且減少誤報率,具備更高的實用性和可靠性。
2.引入SMOTETomek采樣算法
使用SMOTETomek采樣算法后,原始數(shù)據(jù)經(jīng)過重新平衡,得到了以下分類情況:非違約樣本數(shù)量與違約樣本數(shù)量的比例為1:1。具體而言,僅包含財務特征的樣本中,非違約樣本和違約樣本的數(shù)量均為6 408條;而包含全部特征的樣本中,非違約樣本和違約樣本的數(shù)量均為942條。
由表5可以觀察到,在對數(shù)據(jù)進行SMOTETomek采樣后,模型的召回率以及未加權平均召回率的值都有所提升,而AUC值和準確率變化不大。綜合來看,通過采用SMOTETomek算法重新平衡數(shù)據(jù),可以在不降低模型性能的情況下,有效提高模型對少數(shù)樣本(即違約樣本)的識別能力并降低模型的偏差,使模型能夠更準確地判斷正例和負例,并具有更高的實用價值。
3.特征重要性分析
Shapley Value是一種為合作博弈中的參與者分配收益的方法,衡量每個參與者對整個合作所產(chǎn)生的貢獻程度。在機器學習中,可以將特征看作參與者,將預測結果看作合作博弈的收益。SHAP值基于Shapley Value的思想,可以用來衡量每個特征對單個預測結果的貢獻。
從圖2可以看出,SHAP值排名中最重要的10個特征為:地方政府隱性擔保能力,預付賬款周轉天數(shù)(t-3),有息負債權益比(t-1),總資產(chǎn)同比增長率(t-2),存貨周轉天數(shù)(t-1),EBIT利潤率(t-1),預付賬款周轉天數(shù)(t-2),現(xiàn)金周轉天數(shù)(t-1),EBIT利潤率(t-3)以及ROE(t-1)。而在129個特征中,核心競爭力指標的排名較為靠前,其中,C_Society排名14,C_Operation排名28,說明在進行債券違約預測時,核心競爭力指標具有較高的影響力。
在上述指標中,最重要的兩個指標為地方政府隱性擔保能力以及預付賬款周轉天數(shù)。本文以地方政府財政盈余與地方GDP增速的比值作為地方政府隱性擔保能力的代理值。地方政府隱性擔保反映了地方政府的財政實力,以及政府預算對當?shù)貒笈c民企的軟約束能力。由于預算軟約束的存在,當企業(yè)產(chǎn)生資金問題時,政府可能會直接或者間接地向企業(yè)提供資金或其他方面的隱性支持,以緩解企業(yè)的經(jīng)營壓力,降低其破產(chǎn)風險。因此,債券發(fā)行人所屬地區(qū)的財政實力越強,該債券對應的違約概率相對越小。
預付賬款周轉天數(shù)是衡量企業(yè)經(jīng)營效率的一個指標,它反映了企業(yè)通過銷售所獲得的預付款項從銷售到收回所需的平均時間。高預付賬款周轉天數(shù)表明企業(yè)預付款項和合同資產(chǎn)的資金占用情況較為嚴重,資金使用效率和運營效率較低。同時該指標越高,表明企業(yè)對供應商或客戶的議價能力較弱,處于供應鏈中弱勢地位,競爭力較弱。綜上,普遍來說,預付賬款周轉天數(shù)越高,企業(yè)的經(jīng)營風險越大。
總體來說,地方政府隱性擔保能力以及企業(yè)的預付賬款周轉天數(shù)都與債券違約概率之間存在關聯(lián),但并不能單獨決定債券違約的發(fā)生。不能簡單地理解為高預付賬款周轉天數(shù)等價于高違約概率,或者高隱性擔保能力等價于低違約概率。違約概率受到眾多因素的綜合影響,包括行業(yè)情況、市場環(huán)境、經(jīng)營策略等,對違約成因的分析也應該綜合考慮多個指標,并結合具體情況進行評估。
五、研究結論
本文以我國2014—2022年發(fā)行的公司債、企業(yè)債和中期票據(jù)為研究對象,從財務特征(盈利能力、短期償債能力、長期償債能力、資產(chǎn)負債結構、營運能力、成長能力、創(chuàng)現(xiàn)能力)和非財務特征(宏觀經(jīng)濟、行業(yè)、企業(yè)核心競爭力)兩大層面選取指標構建了基于SMOTETomek-GWO-XGBoost的債券違約風險預警模型并進行分析。為了提高模型結果的準確性和可靠性,本文采用了多種性能評估指標,如準確率、召回率、未加權平均召回率和AUC值,對比分析了基于財務特征和全部特征的情況下,GWO-XGBoost模型與其他5個基準模型以及未優(yōu)化的XGBoost模型間的性能差異,以及在使用SMOTETomek采樣算法前后的GWO-XGBoost模型的性能差異。此外,本文采用SHAP值法對指標重要性進行了分析,以解釋模型結果。
實證結果表明:第一,本文所用的GWO-XGBoost 債券違約風險預警模型具有較好的泛化能力、更高的預測精度以及更強的穩(wěn)定性,能夠對債券的違約行為進行有效預測。第二,在結合SMOTETomek采樣算法后,模型的召回率以及UAR值都得到了提高,可以說明SMOTETomek具有平衡樣本和改善模型分類性能的作用。第三,應用SHAP值法可以定量展示不同特征對債券違約風險的影響力,增加機器學習模型的可解釋性,避免違約風險預測過程中的“黑箱”問題。此外,本文根據(jù)SHAP值排名的結果,重點討論了SHAP值排名前兩位的指標,即地方政府隱性擔保能力和預付賬款周轉天數(shù)與違約風險之間的關系。第四,值得注意的是,當數(shù)據(jù)量過少時,可能會導致過擬合的現(xiàn)象發(fā)生。因此,在應用機器學習模型解決實際應用問題時,應該關注數(shù)據(jù)量變化帶來的影響。
本文將SMOTETomek-GWO-XGBoost機器學習方法引入財務學研究領域,并通過與其他機器學習方法的比較,證明了其對債券違約預警具有重要的幫助作用。在后續(xù)的研究中,可以進一步挖掘更多與公司經(jīng)營管理、發(fā)展戰(zhàn)略、行業(yè)特征、宏觀環(huán)境方面相關的信息,提高財務風險預警的準確性、有效性和及時性,為防范化解重大金融風險提供支持。
【參考文獻】
[1] BAO Y,KE B,LI B,et al.Detecting accounting fraud in publicly traded US firms using a machine learning approach[J].Journal of Accounting Research,2020,58(1):199-235.
[2] 吳世農,黃世忠.企業(yè)破產(chǎn)的分析指標和預測模型[J].中國經(jīng)濟問題,1987(6):8-15.
[3] 吳世農,盧賢義.我國上市公司財務困境的預測模型研究[J].經(jīng)濟研究,2001(6):46-55,96.
[4] 吳育輝,唐浩博.風險信息披露能預測債券違約風險嗎?——來自債券募集說明書的經(jīng)驗證據(jù)[J].財務研究,2021(5):15-28.
[5] 呂峻,李梓房.宏觀經(jīng)濟因素對企業(yè)財務危機影響的實證分析[J].山西財經(jīng)大學學報,2008(11):94-100.
[6] 盧永艷.宏觀經(jīng)濟因素對企業(yè)財務困境風險影響的實證分析[J].宏觀經(jīng)濟研究,2013(5):53-58.
[7] 戴雅榕,沈藝峰.隨機森林模型能夠預測中國債券違約嗎?[J].計量經(jīng)濟學報,2022(2):418-440.
[8] CHAVA S,JARROW R A.Bankruptcy prediction with industry effects[J].Review of Finance,2004,8(4): 537-569.
[9] 吳世農,唐浩博,張騰.中國國有上市公司的核心競爭力研究[C].2022年度“中國資本市場與國資國企改革”國際學術研討會,2022.
[10] YILDIRIM M,OKAY F Y,?魻ZDEMIR S.Big data analytics for default prediction using graph theory[J].Expert Systems with Applications,2021,176:114840.
[11] KIM T,KIM H Y.Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data[J].PloS one,2019,14(2):e0212320.
[12] CHEN T,GUESTRIN C.Xgboost:a scalable tree boosting system[C]//Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining,2016:785-794.
[13] BARBOZA F,KIMURA H,ALTMAN E.Machine learning models and bankruptcy prediction[J].Expert Systems with Applications,2017,83:405-417.
[14] ADDO P M,GUEGAN D,HASSANI B.Credit risk analysis using machine and deep learning models[J]. Risks,2018,6(2):38.
[15] 馮雅情.基于改進的KMV-XGBoost的信用債風險度量[D].濟南:山東大學碩士學位論文,2020.
[16] 譚本艷,袁神鵬.基于XGboost的企業(yè)債務違約特征預警分析[J].會計之友,2023(19):74-81.
[17] CHEN M,HE X,YANG J,et al.3-D convolutional recurrent neural networks with attention model for speech emotion recognition[J].IEEE Signal Processing Letters,2018,25(10):1440-1444.
[18] ANSARI A,AHMAD I S,BAKAR A A,et al.A hybrid metaheuristic method in training artificial neural network for bankruptcy prediction[J].IEEE Access,2020,8:176640-176650.
[19] WANG M,CHEN H,LI H,et al.Grey wolf optimization evolving kernel extreme learning machine:application to bankruptcy prediction[J].Engineering Applications of Artificial Intelligence,2017,63:54-68.
[20] 肖艷麗,向有濤.企業(yè)債券違約風險預警:基于GWO- XGBoost方法[J].上海金融,2021(10):44-54.
[21] LUNDBERG S M,LEE S I.A unified approach to interpreting model predictions[J].Advances in Neural Information Processing Systems,2017,30.
[22] 遲國泰,章彤,張志鵬.基于非平衡數(shù)據(jù)處理的上市公司ST預警混合模型[J].管理評論,2020,32(3):3-20.
[23] CHANDRA W,SUPRIHATIN B,RESTI Y.Median-KNN Regressor-SMOTE-Tomek links for handling missing and imbalanced data in air quality prediction[J].Symmetry,2023,15(4):887.
[24] HAIRANI H,ANGGRAWAN A,PRIYANTO D.Improvement performance of the random forest method on unbalanced diabetes data classification using smote-tomek link[J].International Journal on Informatics Visualization,2023,7(1):258-264.