• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機器學(xué)習(xí)模型的公司債券違約預(yù)警研究

      2023-05-30 05:18:55王佩佩李俠
      經(jīng)濟(jì)研究導(dǎo)刊 2023年1期
      關(guān)鍵詞:集成學(xué)習(xí)預(yù)警模型

      王佩佩 李俠

      摘? ?要:以Stacking集成學(xué)習(xí)方法融合XGBoost、GBDT、隨機森林模三種基本算法構(gòu)建預(yù)測模型,對企業(yè)債券是否違約進(jìn)行預(yù)測。實驗結(jié)果表明:融合模型的預(yù)測精準(zhǔn)率、召回率和F1度量指標(biāo)的可靠性明顯高于單一模型;各基學(xué)習(xí)器的學(xué)習(xí)能力越強,關(guān)聯(lián)程度越低,模型融合后的預(yù)測效果越好。此外,凈資產(chǎn)收益率ROE、資產(chǎn)負(fù)債率、票面利率、流動比率、資產(chǎn)凈利率ROA是影響企業(yè)是否違約的重要關(guān)注指標(biāo)。

      關(guān)鍵詞:債券違約;預(yù)警模型;集成學(xué)習(xí);重要指標(biāo)

      中圖分類號:F830.91? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號:1673-291X(2023)01-0098-03

      一、研究背景

      近些年來,隨著我國實體經(jīng)濟(jì)的不斷增長,債券市場得到高速發(fā)展,市場規(guī)模持續(xù)擴(kuò)張、債券品種逐漸多樣化,債券違約問題越來越難以把控。自2014年“11 超日債”利息無法按期全額支付,成為國內(nèi)首例實質(zhì)性違約的公募債券后,我國債券違約事件頻發(fā),違約風(fēng)險增速較以往大幅提高。

      截至2021年年末,我國債券市場存量規(guī)模達(dá)到302.26億元,其中信用債、利率債和同業(yè)存單的存量規(guī)模分別達(dá)到62.98萬億、225.35萬億和13.93萬億,占比分別為20.84%、74.56%和4.61%。隨著債券市場的不斷發(fā)展,公司債券違約風(fēng)險逐漸增大,2021年1—10月我國違約債券公司達(dá)到74家,規(guī)模達(dá)到1 098億(數(shù)據(jù)來源于Wind)。由以上數(shù)據(jù)可知,我國債券市場的違約風(fēng)險愈加嚴(yán)重,在公司債券違約逐漸成為常態(tài)化的背景下,利用數(shù)據(jù)分析以及機器學(xué)習(xí)方法構(gòu)建一個有效的公司債券違約預(yù)警模型,以防范和應(yīng)對潛在的債券違約風(fēng)險,對債券市場的穩(wěn)定健康發(fā)展有重要的理論和現(xiàn)實意義。

      二、文獻(xiàn)綜述及理論框架

      債券違約預(yù)警是指通過挖掘公司數(shù)據(jù)和違約風(fēng)險之間的關(guān)系,預(yù)測公司發(fā)生債券危機的概率。在目前國內(nèi)外的文獻(xiàn)研究中,學(xué)者對于公司債券違約風(fēng)險的研究主要以案例分析和政策建議為主,例如虞李輝、胡婕瑩[1]和竇鵬娟[2]等。我國債券市場發(fā)生的第一次違約記錄在2014年,由于債券違約歷史較短,可觀測樣本不夠充分,且信息不對稱情況嚴(yán)重,所以利用機器學(xué)習(xí)構(gòu)建公司債券預(yù)警模型的文獻(xiàn)相對較少。隨著計算機和信息技術(shù)的發(fā)展,信息壁壘變低以及信息獲取技術(shù)的成熟,為企業(yè)各方面的財務(wù)數(shù)據(jù)分析提供了基礎(chǔ)。本文通過機器學(xué)習(xí)建立公司債券違約預(yù)警模型。一方面為市場投資者提供投資決策參考,避免由于判斷失誤遭受巨額損失,另一方面也可以為發(fā)行債券的公司提供違約預(yù)警,及時改善公司經(jīng)營,避免違約狀況的發(fā)生。

      回顧國內(nèi)外相關(guān)文獻(xiàn)發(fā)現(xiàn),logistic模型是研究債券違約問題的主要方法之一。吳世農(nóng)、盧賢義[3]以我國上市公司為研究對象,應(yīng)用Fisher線性判定分析、多元線性回歸分析和Logistic回歸分析三種方法發(fā)現(xiàn)相對同一信息集而言,Logistic預(yù)測模型的誤判率最低。生柳榮等人[4]通過建立Logistic模型分析債券發(fā)行體違約影響因素,從而建立違約預(yù)警系統(tǒng),促進(jìn)債券市場資源高效配置。肖艷麗、向有濤[5]認(rèn)為,基于單一模型的債券違約風(fēng)險預(yù)測不能充分挖掘數(shù)據(jù)的有效信息,會影響模型的預(yù)測精度從而導(dǎo)致結(jié)果出現(xiàn)一定的偏差。組合預(yù)警模型能夠?qū)我荒P偷娜秉c弱化(Wu et al.[6];Jiang et al.[7])。郭兆靈[8]將多元化的21個風(fēng)險特征指標(biāo)加入Lasso-logistic回歸模型進(jìn)行研究,最終選取了11項企業(yè)集團(tuán)信用風(fēng)險關(guān)鍵預(yù)警指標(biāo)。林同源[9]使用CART-bagging算法構(gòu)建了三類預(yù)警模型,證明非財務(wù)指標(biāo)與宏觀指標(biāo)對優(yōu)化以財務(wù)數(shù)據(jù)為基礎(chǔ)的預(yù)警模型的作用有限。

      三、實證分析

      (一)樣本的選取

      本研究選取我國2016—2020年有存續(xù)債,且披露數(shù)據(jù)較為完整的1 753家企業(yè)為對象。其中,一家企業(yè)在相同年份發(fā)行的不同債券,及不同年份的數(shù)據(jù)看為不同的樣本,記為一條數(shù)據(jù),共得到15 800條實證數(shù)據(jù)。

      (二)預(yù)測指標(biāo)變量的選取

      在選取預(yù)測指標(biāo)變量時,通過研讀相關(guān)文獻(xiàn),最終考慮從企業(yè)的綜合能力和債券屬性兩個層面構(gòu)建預(yù)測指標(biāo)體系,具體指標(biāo)如表1所示。

      (三)模型構(gòu)建

      集成學(xué)習(xí)分為三大類:基于投票式的bagging模型、基于提升式的boosting和基于模型融合的Stacking模型,本文選用Stacking模型對企業(yè)債券是否違約進(jìn)行預(yù)測。以下為具體步驟。

      第一步,數(shù)據(jù)預(yù)處理。采用one-hot編碼和數(shù)據(jù)歸一化的思想,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的處理。其中,省份按照經(jīng)濟(jì)發(fā)達(dá)程度(依據(jù)2020年GDP總額)劃分為1—5級,十個行業(yè)按同一級數(shù)據(jù)處理,其他數(shù)據(jù)采用歸一化思想進(jìn)行整合,最終滿足機器學(xué)習(xí)使用。

      第二步,SMOTE 過采樣。SMOTE是對隨機過采樣算法的一種改進(jìn)方案。由于隨機過采樣采取簡單復(fù)制樣本的策略來增加少數(shù)類樣本,容易產(chǎn)生模型學(xué)習(xí)到的信息不夠泛化的現(xiàn)象。因此采用SMOTE方法進(jìn)行修復(fù)。SMOTE的基本思想是基于K-最鄰近模型(KNN)對少標(biāo)簽樣本進(jìn)行隨機生成的采樣算法,計算公式如下:

      xnew=xi+rand(0,1)×(yi-xi),i=1,2,...,n

      本研究中包含15 622 個未違約正常樣本(記為0)和178個危機樣本(記為1),樣本的比例約為88∶1,樣本比例極其不平衡。為有效改進(jìn),本文采取SMOTE過采樣進(jìn)行處理,處理后二者的比例為1.55∶1(15 622∶10 019),這樣將有效解決非平衡數(shù)據(jù)集的問題,消除過采樣的隨機性。

      第三步,數(shù)據(jù)集劃分。劃分出80%作為訓(xùn)練集數(shù)據(jù)(包含12 498個未違約債券樣本,142個違約債券樣本),剩下的20%(包含3 124個未違約債券樣本,36個違約債券樣本)作為測試集數(shù)據(jù)。

      第四步,Stacking融合學(xué)習(xí)模型。Stacking是通過一個元分類器或者元回歸器來整合多個分類模型或回歸模型的集成學(xué)習(xí)技術(shù)。本文將隨機森林(RF)、GBDT、XGBoost作為基學(xué)習(xí)器,分別以5折交叉驗證的方式進(jìn)行訓(xùn)練,每一次的交叉驗證包含兩個過程,一是基于訓(xùn)練集訓(xùn)練模型;二是基于訓(xùn)練集訓(xùn)練生成的模型對測試集進(jìn)行預(yù)測。最終將得到的融合結(jié)果放入元學(xué)習(xí)器邏輯回歸模型中,用于企業(yè)債券違約的預(yù)測。

      (四)模型結(jié)果與分析

      1.預(yù)測結(jié)果對比與分析。本文將單個基學(xué)習(xí)器的評價指標(biāo)結(jié)果與集成融合學(xué)習(xí)模型結(jié)果進(jìn)行比較,驗證stacking集成學(xué)習(xí)對預(yù)測結(jié)果提升效果,如表2所示。

      表2 單一模型和融合模型的結(jié)果匯總

      F1-score又稱平衡F分?jǐn)?shù),輸出的F1-score值越接近1,代表模型在處理不平衡集時誤判的概率越低。從表2可以看出,融合模型的結(jié)果誤判率要優(yōu)于單一模型。精準(zhǔn)率意味著將未違約的企業(yè)債券預(yù)測為違約企業(yè)債券的可能性越低。從整體來看,單一模型的精準(zhǔn)率普遍低于融合模型,且RF+GBDT+XGBoost三模型融合的綜合評價得分最高,說明模型融合對預(yù)測效果具有提升作用。就融合模型來看,通過比較RF+XGBoost和RF+GBDT可以發(fā)現(xiàn),單一模型的效果越好,模型融合后的效果也相對更好。此外,GBDT+XGBoost模型的綜合結(jié)果相較于其他三種最差,這是因為GBDT與XGBoost 的原理都是基于提升法,屬于相近的模型。說明我們采用stcking融合模型的方法建立企業(yè)債券違約預(yù)警模型是較為合理的選擇。

      2.預(yù)測指標(biāo)重要程度分析。在違約結(jié)果預(yù)測的過程中,每項指標(biāo)的重要程度有所差異?;嵯禂?shù)代表了模型的不純度,基尼系數(shù)越小,不純度越低,特征越好。本文依據(jù)Gini差值,從總模型結(jié)果中對預(yù)測指標(biāo)的重要性進(jìn)行了排序。

      從單個變量來看,排名前五的指標(biāo)分別為:凈資產(chǎn)收益率ROE、資產(chǎn)負(fù)債率、票面利率、流動比率、資產(chǎn)凈利率ROA。

      凈資產(chǎn)收益率(Return on Equity,簡稱ROE),又稱股東權(quán)益報酬率,是凈利潤與平均股東權(quán)益的百分比,該指標(biāo)體現(xiàn)了自有資本獲得凈收益的能力。根據(jù)杜邦分析法,凈資產(chǎn)收益率=資產(chǎn)凈利率(凈利潤/總資產(chǎn))×權(quán)益乘數(shù)(總資產(chǎn)/總權(quán)益資本)。其中,權(quán)益乘數(shù)表示企業(yè)的負(fù)債程度,資產(chǎn)負(fù)債率高,權(quán)益乘數(shù)就大,公司會有較多的杠桿利益,因此債券違約的風(fēng)險也就越高。

      資產(chǎn)負(fù)債率又稱舉債經(jīng)營比率,它是用以衡量企業(yè)利用債權(quán)人提供資金進(jìn)行經(jīng)營活動的能力,以及反映債權(quán)人發(fā)放貸款的安全程度的指標(biāo)。一般來講,資產(chǎn)負(fù)債率越高,企業(yè)的財務(wù)風(fēng)險就越大,發(fā)生不償債的幾率也越大。票面利率也就是債券的名義利息率,債券的名義利率越高,一方面會使得企業(yè)定期還本付息越大,另一方面也促使更多的投資者來購買企業(yè)債券。一旦企業(yè)經(jīng)營過程中出現(xiàn)現(xiàn)金流不足,資金鏈斷裂,較高的還本付息額就會惡化企業(yè)的財務(wù)壓力,一旦難以承受,將導(dǎo)致不可避免的違約風(fēng)險。

      流動比率是流動資產(chǎn)對流動負(fù)債的比率,一般用來衡量企業(yè)流動資產(chǎn)在短期債務(wù)到期以前,可以變?yōu)楝F(xiàn)金用于償還負(fù)債的能力。一般說來,比率越高,說明企業(yè)資產(chǎn)的變現(xiàn)能力越強,短期償債能力亦越強;反之則弱。

      資產(chǎn)凈利率ROA主要用來衡量企業(yè)利用資產(chǎn)獲取利潤的能力,這一比率越高,說明企業(yè)全部資產(chǎn)的盈利能力越強。通過將違約樣本和正常樣本進(jìn)行比較發(fā)現(xiàn),發(fā)生債券的企業(yè)資產(chǎn)凈利率ROA通常較低,甚至為負(fù)值,而未發(fā)生債券違約的企業(yè)資產(chǎn)凈利率ROA通常較高。

      從整體維度來看,企業(yè)盈利能力方面對企業(yè)債券是否違約的影響最大。反映企業(yè)盈利能力的三個指標(biāo)變量:凈資產(chǎn)收益率ROE、資產(chǎn)凈利率ROA和總資產(chǎn)報酬率均在前十之列。這是因為企業(yè)盈利能力通常反映企業(yè)在一定時期賺取利潤的能力,盈利能力越高,企業(yè)的發(fā)展越穩(wěn)定,經(jīng)營管理問題越少,償還債務(wù)的資本更雄厚,因此,發(fā)生債券違約的風(fēng)險也較小。

      企業(yè)償債能力是指企業(yè)償還到期債務(wù)的承受能力或保證程度,包括償還短期債務(wù)和長期債務(wù)的能力,與企業(yè)債券是否違約有直接相關(guān)關(guān)系。本研究所選取的代表企業(yè)償債能力的三個指標(biāo):流動比率、速動比率和現(xiàn)金比率也都排名靠前,比較符合預(yù)期結(jié)果,這說明模型構(gòu)造較為合理。

      四、總結(jié)與啟示

      本文以2016—2020年企業(yè)發(fā)行債券為研究樣本,從企業(yè)的綜合能力和債券屬性兩個層面構(gòu)建指標(biāo)體系,先是采用SMOTE 算法進(jìn)行過采樣處理,然后使用Stacking算法融合了隨機森林、GBDT 和XGBoost 模型,并將融合模型與單個模型的效果進(jìn)行了比較。實驗結(jié)果表明,第一,本文所提出的Stacking融合模型算法具有較好的效果。融合模型的準(zhǔn)確率和穩(wěn)定性普遍優(yōu)于單一模型,并且,單一模型的效果以及模型之間的同質(zhì)性也會影響到融合模型的效果,對今后建立企業(yè)債券違約的預(yù)測方法具有一定的借鑒意義。第二,利用Gini系數(shù)值衡量了對企業(yè)債券違約風(fēng)險影響最大的十個指標(biāo),并對前五的指標(biāo)進(jìn)行了詳細(xì)分析。其中,凈資產(chǎn)收益率ROE、資產(chǎn)負(fù)債率、票面利率、流動比率、資產(chǎn)凈利率ROA是主要影響指標(biāo),Gini系數(shù)值占比40%以上,在今后的研究中可對這些指標(biāo)進(jìn)行重點關(guān)注。

      參考文獻(xiàn):

      [1]? ?虞李輝,胡婕瑩.市場化背景下債券違約問題解構(gòu)及其處置機制研究[J].新金融,2021,(12):14-20.

      [2]? ?竇鵬娟.新常態(tài)下我國公司債券違約問題及其解決的法治邏輯[J].法學(xué)評論,2016,(2):143-153.

      [3]? ?吳世農(nóng),盧賢義.我國上市公司財務(wù)困境的預(yù)測模型研究[J].經(jīng)濟(jì)研究,2001,(6):46-55,96.

      [4]? ?生柳榮,陳海華,胡施聰,彭雁,于天祥.企業(yè)債券信用風(fēng)險預(yù)警模型及其運用[J].投資研究,2019,(6):25-35.

      [5]? ?肖艷麗,向有濤.企業(yè)債券違約風(fēng)險預(yù)警——基于GWO-XGBoost方法[J].上海金融,2021,(10):44-54.

      [6]? ?Wu C.,Wang J.,Chen X.,et al..A novel hybrid system based on multi -objective optimization for wind speed forecasting[J].Renewable Energy,2020,(146):149-165.

      [7]? ?Jiang P.,Liu Z.,Niu X.,et al.A combined forecasting system based on statistical method, artificial neural networks, and deep learning methods for short - term wind speed forecasting[J].Energy,2021,(217).

      [8]? ?郭兆靈.基于Lasso-logistic回歸的企業(yè)集團(tuán)信用風(fēng)險研究[J].財會學(xué)習(xí),2020,(13):193,195.

      [9]? ?林同源.基于CART-Bagging算法的債券違約預(yù)警模型研究[J].全國流通經(jīng)濟(jì),2021,(19):148-152.

      [責(zé)任編輯? ?文? ?欣]

      猜你喜歡
      集成學(xué)習(xí)預(yù)警模型
      基于局部有效性的選擇性決策樹集成
      基于集成學(xué)習(xí)的高送轉(zhuǎn)股票研究
      時代金融(2016年36期)2017-03-31 05:44:10
      基于稀疏編碼器與集成學(xué)習(xí)的文本分類
      我國上市公司財務(wù)預(yù)警分析
      中國市場(2017年2期)2017-02-28 19:48:12
      基于AHP—模糊綜合分析的移動社交網(wǎng)絡(luò)輿情預(yù)警模型研究
      基于屬性權(quán)重的Bagging回歸算法研究
      基于RS—ANN的大學(xué)生心理危機預(yù)警模型構(gòu)建與應(yīng)用
      考試周刊(2016年103期)2017-01-23 17:18:13
      基于模糊分析法的高校專利初級預(yù)警模型的研究
      價值工程(2016年30期)2016-11-24 14:38:32
      農(nóng)村消失的影響因素及建模研究
      科技視界(2016年22期)2016-10-18 15:00:50
      財務(wù)風(fēng)險預(yù)警研究綜述
      中國市場(2016年33期)2016-10-18 12:52:29
      光泽县| 北川| 吉水县| 赤水市| 安多县| 吴桥县| 昌平区| 通江县| 酒泉市| 汾西县| 锡林郭勒盟| 东乡县| 淄博市| 新安县| 周宁县| 高青县| 原平市| 交城县| 城固县| 宝鸡市| 都匀市| 阳山县| 峡江县| 长沙市| 嘉善县| 临汾市| 理塘县| 沂南县| 肇源县| 吴堡县| 柳州市| 宝应县| 新竹县| 陆河县| 乌审旗| 云阳县| 蛟河市| 阳江市| 华亭县| 万年县| 金阳县|