• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機(jī)器學(xué)習(xí)模型預(yù)測信用違約的研究與實(shí)證分析

      2022-07-05 03:03:18陳雪融
      關(guān)鍵詞:預(yù)測出錯(cuò)誤率債券

      摘要:隨著信用債“暴雷”的頻繁發(fā)生,信用債違約成為金融市場較為重要的課題。文章主要利用公司財(cái)務(wù)數(shù)據(jù),采取兩種機(jī)器學(xué)習(xí)模型預(yù)測公司債違約,并利用樣本進(jìn)行了實(shí)際測算以及對(duì)結(jié)果進(jìn)行了對(duì)比,發(fā)現(xiàn)兩種機(jī)器學(xué)習(xí)模型對(duì)于預(yù)測公司債信用違約都有較好的效果。其中,SVM模型的預(yù)測精度更高,logit模型則犧牲了一部分精度來預(yù)測出更多違約事件。應(yīng)用層面上,logit模型更適合市場風(fēng)險(xiǎn)預(yù)警,而SVM模型更適用于提示監(jiān)管機(jī)構(gòu)采取一定措施。利用機(jī)器學(xué)習(xí)模型研究信用債違約,有助于推動(dòng)我國信用風(fēng)險(xiǎn)評(píng)估市場化進(jìn)程。

      關(guān)鍵詞:信用違約;logit模型;SVM模型;比較分析;應(yīng)用場景啟示中圖法分類號(hào):F830 文獻(xiàn)標(biāo)識(shí)碼:A

      Research and empirical analysis on prediction of credit default usingmachine learning model

      CHEN Xuerong

      (Yushi Internet Financial Information Service Co., Ltd., Shanghai 200120, China)

      Abstract: With the frequent occurrence of credit debt thunderstorm, credit default has become a more important issue in financial market. Mathematical methods are also more common in finance, and machine learning techniques are more mature. Therefore, this paper mainly uses the company financial data, adopts two kinds of machine learning model to forecast the company debt default, uses the sample to carry on the actual computation, and has carried on the contrast to the result. It is found that the two ML models have better effect on the default of corporate bonds. The precision of SVM model is higher, but logit model sacrifices part of precision to predict more default events. On the application level, logit model is more suitable for market risk early warning, while SVM is more suitable for prompting regulators to take certain measures. The study of credit default using machine learning model is helpful to the further development of credit default prediction and the marketization of credit risk assessment in China.

      Key words: credit default, logit model, SVM model, comparative analysis, application scenario enlightenment

      1? 研究背景

      債券是金融市場不可或缺的重要工具之一,信用債又是債券中的重要類型。信用債是企業(yè)的重要融資途徑,信用風(fēng)險(xiǎn)是金融市場風(fēng)險(xiǎn)的重要來源。近年來,信用違約事件屢屢發(fā)生,信用債違約逐漸成為常態(tài)。2019年,209 只債券發(fā)生違約,違約金額為1302.33億元;2020年,196只債券發(fā)生違約,違約金額達(dá)1752.71億元。在此背景下,研究信用債違約便成為重要課題。

      定性分析較為常見的違約分析辦法,主要分析發(fā)行公司的現(xiàn)金流和盈利狀況,常見方法為 5C ( Capacity,Capital,Collateral,Condition,Character )模型,主要從企業(yè)償債能力、資本結(jié)構(gòu)、抵押品價(jià)值、公司未來成長和公司償債意愿等維度進(jìn)行分析。

      現(xiàn)有的定量分析預(yù)測違約模型可分為三類:第一類是評(píng)分模型。其中,具有代表性的模型有基于多元判別分析( MDA)的 Altman ( 1968) Z 評(píng)分模型和 Ohlson (1980) O 評(píng)分模型。Z 評(píng)分模型存在較大的局限性。首先,其決策規(guī)則是不確定的,得分判別存在2.99~ 1.81的中空地帶。此外,它并沒有給出估計(jì)的違約概率。logit 模型則可以有效地解決該問題。 Ohlson (1980)使用 logit 模型來計(jì)算違約概率。LDA 線性與 logit 和 probit 非線性模型僅僅是將模型套用在公司/企業(yè)債上,它們存在兩個(gè)問題,即起到較大作用的是指標(biāo)的設(shè)定,而指標(biāo)的人為構(gòu)造或選取又存在一定的主觀性;線性回歸或者非線性回歸雖不易造成過擬合,但是容錯(cuò)率很高,對(duì)于違約的預(yù)測沒有很好的效果。

      第二類是 Merton (1974)提出的結(jié)構(gòu)化模型,即 Merton 模型。其假設(shè)購買杠桿公司的股票應(yīng)被視為等價(jià)于購買寫在公司資產(chǎn)上的看漲期權(quán)。Merton 模型假設(shè)資產(chǎn)價(jià)值是隨機(jī)的,并遵循幾何布朗運(yùn)動(dòng);預(yù)期資產(chǎn)收益率和波動(dòng)率以及無風(fēng)險(xiǎn)利率,不隨著時(shí)間推移改變。Merton 模型存在局限性,如需要對(duì)發(fā)債人的債務(wù)進(jìn)行持續(xù)交易,而大多數(shù)負(fù)債都很難經(jīng)常性地交易;資產(chǎn)價(jià)值的波動(dòng)標(biāo)準(zhǔn)差被假定為不變,而實(shí)際的波動(dòng)性隨著時(shí)間而變化等。5C86B066-7C09-4394-9812-2379BEA3BA58

      第三類是 Reduced Form 模型。它是生存分析模型的一種變體。之所以將 Hazard 模型稱為 Reduced Form 模型,是因?yàn)?Hazard 模型將復(fù)雜的違約機(jī)制簡化為一個(gè)簡單的表達(dá)式,使模型能夠在現(xiàn)實(shí)中接受市場數(shù)據(jù)采集。它還可以推導(dǎo)出無套利定價(jià)、估值和套期保值公式。

      2? 模型

      2.1? 因子篩選

      我們建立了關(guān)于債券的數(shù)據(jù)庫,除了債券的一些基礎(chǔ)信息外,還從公司財(cái)務(wù)報(bào)表中整理了400多個(gè)財(cái)務(wù)因子,作為模型的輸入變量。

      2.2? logit 模型建立

      (1)logit 模型原理

      在分析國內(nèi)外定量模型的優(yōu)缺點(diǎn)及適用性后,針對(duì)我國的信用債市場,考慮選擇 binomial 分布對(duì)應(yīng)的 logit 回歸為初始模型。觀測到違約事件發(fā)生情況:

      其中,殘差項(xiàng)εi 的分布為 logistic 分布。

      那么,Yi =1的概率公式如下:

      其中:

      其中,Xi 為因子參數(shù),β為對(duì)應(yīng)參數(shù)的系數(shù)值。

      (2)logit 機(jī)器學(xué)習(xí)計(jì)算步驟

      在非線性模型預(yù)測的基礎(chǔ)上,我們在模型中引入了機(jī)器學(xué)習(xí)算法(圖1)來完成預(yù)測違約。

      將該算法轉(zhuǎn)為機(jī)器學(xué)習(xí)模式,可以處理為:

      Logistic 回歸模型可以寫成 Y=h ( x )= F(X′iβ+εi ),其替代函數(shù) sigmoid 函數(shù)也叫 s 型函數(shù),用 g( z )表示:

      其中,z=X′iβ+εi 。

      誤差反饋(損失函數(shù) J)為:

      機(jī)器學(xué)習(xí)模型容易過擬合,泛化能力較差,且違約事件為小概率事件,難以訓(xùn)練[2]。此時(shí),需要模型的參數(shù)設(shè)置精巧,即考慮過擬合問題,同時(shí)能保證預(yù)測精度。為了解決機(jī)器學(xué)習(xí)的維度災(zāi)難問題,本文在模型中加入了正則項(xiàng)。正則項(xiàng)可以取不同的形式,在回歸問題中取平方損失,就是參數(shù)的 L2范數(shù),也可以取 L1范數(shù)。取平方損失時(shí),模型的損失函數(shù)變?yōu)椋?/p>

      其中,λ為正則項(xiàng)系數(shù),合適的正則函數(shù)和系數(shù)能夠提高分類問題的精度。

      模型最終篩選出了14個(gè)因子,包括一些常規(guī)因子,如代表償債能力的流動(dòng)負(fù)債和貨幣資產(chǎn);挖掘不到一些非常規(guī)但其實(shí)有效的因子,如代表資產(chǎn)結(jié)構(gòu)的固定資產(chǎn)清理和盈余公積等。

      (3)支持向量機(jī)(SVM)模型原理及公式

      支持向量機(jī) ( Support? Vector? Mechine ,SVM)是 V.Vapnik 等人提出的一種針對(duì)小樣本的分類機(jī)器學(xué)習(xí)理論[1]。支持向量機(jī)指的是將向量映射到一個(gè)高維空間,在這個(gè)高維空間中建立一個(gè)最大間距超平面。在分隔數(shù)據(jù)的超平面的兩側(cè)建立了兩個(gè)平行的超平面,以該方式使兩個(gè)平行的超平面之間的距離最大化。假設(shè)平行超平面之間的距離或差值越大,分類器的總誤差就越小。

      SVM 和 logistic 回歸是功能相近的分類器,二者的區(qū)別在于 logistic 回歸的輸出具有概率意義,也容易擴(kuò)展至多分類問題,而 SVM 的稀疏性和穩(wěn)定性使其具有良好的泛化能力并在使用核方法時(shí)計(jì)算量更小。

      3? 結(jié)果分析

      (1)樣本介紹

      由于涉及財(cái)務(wù)數(shù)據(jù),考慮債券發(fā)行公司財(cái)務(wù)數(shù)據(jù)的存在性問題,本文只選取部分上市公司的公司債的2016年 ~2020年的季度違約數(shù)據(jù)作為樣本數(shù)據(jù)做滾動(dòng)預(yù)測。

      (2)logit 機(jī)器學(xué)習(xí)模型結(jié)果分析

      違約債券方面,logit 機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果如表1 所列。

      從表1 可以看到,第一類錯(cuò)誤率較高,說明模型預(yù)測違約但實(shí)際不違約情況較多,可能雖然整體數(shù)據(jù)發(fā)出了違約信號(hào),表明公司有違約風(fēng)險(xiǎn),但公司及時(shí)籌集了足夠的資金避免了違約事件的發(fā)生。第二類錯(cuò)誤率非常低,說明模型基本可以將違約事件全部預(yù)測到,也說明模型犧牲了一部分的第一類錯(cuò)誤,以保證可以預(yù)測出更多違約事件。

      模型對(duì)于公司發(fā)生違約事件的預(yù)測結(jié)果如表2 所列。可以看出,表1 和表2 中的預(yù)測準(zhǔn)確率差別不大,但是表2 的第一類錯(cuò)誤率較低,這是因?yàn)橐粋€(gè)公司可以發(fā)多只債券,但在一個(gè)季度內(nèi),只違約了一只債券,預(yù)測違約公司的難度要小于預(yù)測違約的債券。

      (3)SVM 機(jī)器學(xué)習(xí)模型結(jié)果分析

      違約債券方面,SVM 機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果如表3 所列。

      從表3 可以看到,第一類錯(cuò)誤率非常低,說明模型預(yù)測違約但實(shí)際不違約情況為0,表明模型在樣本數(shù)據(jù)內(nèi)預(yù)測出的違約會(huì)有100%的概率發(fā)生。第二類錯(cuò)誤率比 logit 模型的結(jié)果高,說明模型不能將違約事件全部預(yù)測到,也說明模型犧牲了一部分的第二類錯(cuò)誤,以保證可以預(yù)測出的精確度。

      SVM 模型對(duì)于公司發(fā)生違約事件的預(yù)測結(jié)果如表 4所列??梢钥闯觯? 和表4 中的預(yù)測準(zhǔn)確率差別不大,但是表2 的第二類錯(cuò)誤率較低,這是因?yàn)橐粋€(gè)公司可以發(fā)多只債券,但在一個(gè)季度內(nèi),只違約了一只債券,預(yù)測違約公司的難度要小于預(yù)測違約的債券。

      (4 )模型結(jié)果比較

      通過兩個(gè)模型的結(jié)果對(duì)比可以看出,logit 模型犧牲了第一類錯(cuò)誤來保證第二類錯(cuò)誤率盡量小,即為了保證預(yù)測出所有的違約事件,將一部分高風(fēng)險(xiǎn)但沒有違約的公司或債券納判斷為違約。而 SVM 模型犧牲了第二類錯(cuò)誤來保證第一類錯(cuò)誤率盡量小,即為了保證預(yù)測出的違約事件100%的概率真實(shí)違約,保證了預(yù)測違約的精確度,但沒能預(yù)測出全部違約事件。

      筆者認(rèn)為,這兩種模型可以用于不同的方面,如 logit 模型的結(jié)果可以提供給預(yù)測出的可能違約的公司參考,供其檢視自身的流動(dòng)性是否充裕,讓公司解決其潛在問題,避免發(fā)生違約事件。而 SVM 模型的預(yù)測結(jié)果則可用于相關(guān)機(jī)構(gòu)參考,使其有足夠的時(shí)間采取必要措施,避免債券不兌付或者公司清算重組造成的影響。

      4? 總結(jié)

      由結(jié)果分析可以看出,機(jī)器學(xué)習(xí)模型對(duì)于中國公司債違約事件的預(yù)測具有一定的效果,雖然各有優(yōu)劣,但在分別使用的情況下相信有助于國內(nèi)債券市場的長期發(fā)展。

      不足之處在于:第一,數(shù)據(jù)不全,并沒有用全市場的數(shù)據(jù)代入模型,模型的系數(shù)更適用于被選中的數(shù)據(jù);第二,模型因子只包含400個(gè)財(cái)務(wù)數(shù)據(jù),只能反映企業(yè)的部分狀況,而在高管管理能力以及是否有大型集團(tuán)做擔(dān)保等難以定量化的因素方面,未能涵蓋進(jìn)模型;第三,模型應(yīng)用了機(jī)器學(xué)習(xí),可以保證預(yù)測的精度,但也有一定的缺點(diǎn),如系數(shù)的解釋性較弱,以及因變量(因子)系數(shù)的高低雖然可以反映其對(duì)違約的影響,但無法確定其真實(shí)的相關(guān)性;第四,尚未深入研究參數(shù)選擇,參數(shù)的選擇會(huì)對(duì)模型的結(jié)果有一定的影響。在后續(xù)的研究中,可以彌補(bǔ)以上不足來優(yōu)化模型,以期得到更好的結(jié)果。

      參考文獻(xiàn):

      [1 ] 喬林波.大規(guī)模正則化機(jī)器學(xué)習(xí)算法研究[ D ].長沙:國防科技大學(xué).2017.

      [2 ] 常甜甜.支持向量機(jī)學(xué)習(xí)算法若干問題的研究[ D ].西安:西安電子科技大學(xué).2010.

      作者簡介:

      陳雪融(1994—) ,碩士,研究員,研究方向:信用風(fēng)險(xiǎn)、宏觀經(jīng)濟(jì)研究、機(jī)器學(xué)習(xí)。5C86B066-7C09-4394-9812-2379BEA3BA58

      猜你喜歡
      預(yù)測出錯(cuò)誤率債券
      限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類錯(cuò)誤率膨脹*
      吸引力無法則
      正視錯(cuò)誤,尋求策略
      教師·中(2017年3期)2017-04-20 21:49:49
      解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯(cuò)誤原因
      量體薦衣
      降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
      閱讀理解沙場點(diǎn)兵
      軟實(shí)力,IBM軟件新名片
      镇平县| 阿城市| 朝阳县| 长兴县| 山阳县| 项城市| 垦利县| 莒南县| 鱼台县| 佳木斯市| 裕民县| 西和县| 金坛市| 沾益县| 光泽县| 浙江省| 宝丰县| 灵宝市| 广丰县| 教育| 博湖县| 晋宁县| 北安市| 丰镇市| 巴青县| 怀化市| 屏东市| 阜南县| 新竹市| 邮箱| 大名县| 稻城县| 博乐市| 邛崃市| 文登市| 长岭县| 桃园市| 新余市| 周宁县| 三河市| 武安市|