劉律康 班越 趙振 胡光琪 張東朔
摘要:本文以銀行間債券市場(chǎng)和交易所債券市場(chǎng)非金融企業(yè)信用債為研究對(duì)象,通過債券發(fā)行主體公開信息并結(jié)合建設(shè)銀行內(nèi)部數(shù)據(jù),從發(fā)行主體所處宏觀經(jīng)濟(jì)環(huán)境、財(cái)務(wù)指標(biāo)、債券交易價(jià)格等方面對(duì)非金融企業(yè)信用債違約因素進(jìn)行探究,發(fā)現(xiàn)經(jīng)濟(jì)周期、發(fā)行主體現(xiàn)金流及債券交易價(jià)格等因素對(duì)于揭示債券違約風(fēng)險(xiǎn)具有重要意義,并使用隨機(jī)森林和XGBoost兩種機(jī)器學(xué)習(xí)算法構(gòu)建模型,生成信用債高違約風(fēng)險(xiǎn)預(yù)警名單,旨在為風(fēng)控部門、交易與投資部門提供決策支持。
關(guān)鍵詞:非金融企業(yè)信用債 財(cái)務(wù)指標(biāo) 隨機(jī)森林算法 XGBoost算法 高風(fēng)險(xiǎn)違約預(yù)警名單
銀行間債券市場(chǎng)和交易所債券市場(chǎng)非金融企業(yè)信用債(以下簡(jiǎn)稱“信用債”)是政府之外的主體進(jìn)行直接融資的重要渠道,是資本市場(chǎng)的重要組成部分。近年來,我國(guó)信用債市場(chǎng)發(fā)展迅速,滿足了企業(yè)多種融資需求,助力實(shí)體經(jīng)濟(jì)快速發(fā)展,但同時(shí)信用債違約1風(fēng)險(xiǎn)也有快速上升的趨勢(shì)。在此背景下,本文嘗試構(gòu)建以海量數(shù)據(jù)分析為基礎(chǔ)的多指標(biāo)前瞻性違約風(fēng)險(xiǎn)模型,旨在對(duì)信用債違約先兆進(jìn)行早期識(shí)別和預(yù)警防范。
基于公開市場(chǎng)信息的信用債違約特征研究
利用公開信息對(duì)信用債違約進(jìn)行解釋并構(gòu)建相應(yīng)模型進(jìn)行預(yù)測(cè),一直是信用債違約研究的重點(diǎn)內(nèi)容。在債券違約發(fā)生前,發(fā)行主體所處宏觀經(jīng)濟(jì)環(huán)境、財(cái)務(wù)指標(biāo)、債券交易價(jià)格等通常會(huì)表現(xiàn)異常,從而反映出一定程度的違約風(fēng)險(xiǎn)信號(hào)。
(一)宏觀經(jīng)濟(jì)環(huán)境與債券違約的關(guān)系
影響債券償付能力的宏觀經(jīng)濟(jì)因素包括經(jīng)濟(jì)增速、貨幣政策與財(cái)政政策。
就經(jīng)濟(jì)增速而言,黨的十八大以來我國(guó)宏觀調(diào)控政策發(fā)生了一系列重大變革,經(jīng)濟(jì)增速趨于平穩(wěn),從雙位數(shù)向個(gè)位數(shù)緩步回歸。在經(jīng)濟(jì)繁榮時(shí)期,各行業(yè)維持高景氣度,生產(chǎn)、消費(fèi)、投資活動(dòng)活躍,企業(yè)持續(xù)創(chuàng)造利潤(rùn),現(xiàn)金流充裕,償付能力穩(wěn)健。隨著經(jīng)濟(jì)步入下行周期,部分產(chǎn)業(yè)需求萎縮,居民實(shí)際購(gòu)買力下降,企業(yè)利潤(rùn)下滑乃至虧損,現(xiàn)金流緊縮,難以如期償付債券本息,繼而形成實(shí)質(zhì)性違約。據(jù)此推論,當(dāng)經(jīng)濟(jì)增速下行時(shí),債務(wù)主體償付能力下降,發(fā)生信用債違約事件的可能性上升。鑒于2020年新冠肺炎疫情暴發(fā)的特殊性,剔除2020年數(shù)據(jù),利用2014—2019年國(guó)內(nèi)生產(chǎn)總值(GDP)增速與信用債違約數(shù)量的時(shí)間序列數(shù)據(jù)繪制得到圖1。圖1顯示,自2014年起GDP增速維持震蕩下行趨勢(shì),2016—2017年出現(xiàn)短暫上行,同期信用債違約數(shù)量則呈現(xiàn)顯著的反向特征,即經(jīng)濟(jì)增速與信用債違約數(shù)量存在一定的負(fù)相關(guān)性。
就貨幣政策而言,近年來,相較美聯(lián)儲(chǔ)、歐洲央行、日本銀行等發(fā)達(dá)經(jīng)濟(jì)體央行的寬松政策,中國(guó)人民銀行更為克制,貨幣供應(yīng)整體保持松緊適度。一般而言,當(dāng)貨幣政策趨于緊縮時(shí),金融機(jī)構(gòu)會(huì)針對(duì)信用資質(zhì)較差的債務(wù)主體要求更高的利率以彌補(bǔ)風(fēng)險(xiǎn)溢價(jià),信貸增速繼而放緩。融資成本增加導(dǎo)致發(fā)行人債務(wù)展期能力弱化,償付能力承壓,出現(xiàn)違約的可能性相應(yīng)提高。從2014年至2021年1月金融機(jī)構(gòu)信貸增速(見圖2)來看,2016年1月至2018年5月、2019年5月至2020年1月以及2020年5月至2021年1月三個(gè)階段的信貸增速顯著下行,而同時(shí)期信用債違約數(shù)量呈上升趨勢(shì),即信貸增速與信用債違約數(shù)量存在一定的負(fù)相關(guān)性。
就財(cái)政政策而言,對(duì)于部分自身造血能力不足、嚴(yán)重依賴財(cái)政資金支持的國(guó)有企業(yè),財(cái)政收入減少是導(dǎo)致其發(fā)生違約的主要原因。圖3顯示,2017年1月至12月、2018年1月至10月、2019年9月至2021年1月等階段財(cái)政收入下行趨勢(shì)明顯,財(cái)政騰挪空間受限,疊加前述貨幣政策收緊、企業(yè)自身運(yùn)營(yíng)等問題,共同導(dǎo)致了部分債務(wù)主體的違約事件。
(二)財(cái)務(wù)指標(biāo)與債券違約的關(guān)系
財(cái)務(wù)指標(biāo)可以反映企業(yè)的經(jīng)營(yíng)狀況和償債能力,其中運(yùn)營(yíng)指標(biāo)能夠充分揭示企業(yè)的還款來源,資本結(jié)構(gòu)指標(biāo)能綜合反映企業(yè)的信用風(fēng)險(xiǎn)狀況。下文將以定性與定量相結(jié)合的方式對(duì)財(cái)務(wù)指標(biāo)與債券違約的關(guān)系進(jìn)行探究。
首先,通過對(duì)歷史信用債違約案例進(jìn)行分析,將部分財(cái)務(wù)指標(biāo)予以量化,觀察各指標(biāo)在違約和正常發(fā)行主體中的表現(xiàn)差異,可將違約主要原因歸結(jié)如表1所示。
其次,為留出2020年之后的數(shù)據(jù)用于檢驗(yàn)?zāi)P托Ч?,本文選取2014年1月至2019年12月的信用債違約主體和正常到期主體為研究對(duì)象,選取部分反映盈利能力、債務(wù)償付能力和企業(yè)成長(zhǎng)前景的財(cái)務(wù)指標(biāo)進(jìn)行單指標(biāo)分析。一是銷售凈利率。銷售凈利率是指企業(yè)凈利潤(rùn)占銷售收入凈額的百分比,表現(xiàn)了企業(yè)銷售的最終盈利能力。該比率越高,說明企業(yè)的盈利能力越強(qiáng)。以發(fā)行主體債券違約或到期前最后一期財(cái)報(bào)(年報(bào)或中報(bào))中“銷售凈利率”指標(biāo)排序后分組分析(見圖4),可以看到各分組違約率呈現(xiàn)明顯線性關(guān)系,即在銷售凈利率越低的分組中,違約企業(yè)占比越高。二是速動(dòng)比率。速動(dòng)比率是指企業(yè)速動(dòng)資產(chǎn)與流動(dòng)負(fù)債之比,用來反映企業(yè)的短期償債能力。三是利潤(rùn)總額同比增長(zhǎng)率。利潤(rùn)總額同比增長(zhǎng)率是指本期利潤(rùn)總額與上期水平的比較,體現(xiàn)了企業(yè)的成長(zhǎng)前景。同樣進(jìn)行分組分析可以發(fā)現(xiàn),速動(dòng)比率和利潤(rùn)總額同比增長(zhǎng)率兩個(gè)指標(biāo)與違約的關(guān)聯(lián)性也表現(xiàn)得同樣明顯,即在速動(dòng)比率和利潤(rùn)總額同比增長(zhǎng)率越低的分組中,違約企業(yè)占比越高。
最后,企業(yè)的基本面信息,所在區(qū)域、所屬行業(yè)、性質(zhì)、員工人數(shù)等也與信用債違約有著不可忽視的關(guān)系。如圖5所示,截至2019年12月,70%的信用債違約余額來自民營(yíng)企業(yè)。
(三)交易價(jià)格數(shù)據(jù)與債券違約的關(guān)系
業(yè)界對(duì)債券違約風(fēng)險(xiǎn)進(jìn)行度量的主要方法之一就是市場(chǎng)價(jià)格法,其主要思想是基于交易價(jià)格數(shù)據(jù)來推斷隱含違約率。隱含違約率是指通過債券價(jià)格信息推導(dǎo)出來的單只債券在一個(gè)付息周期內(nèi)發(fā)生違約的邊際概率。其對(duì)債券違約風(fēng)險(xiǎn)的計(jì)量和對(duì)違約風(fēng)險(xiǎn)變化趨勢(shì)的反映具有較高的指示價(jià)值。在國(guó)際成熟債券市場(chǎng)中,隱含違約率因與實(shí)際違約率有較高的關(guān)聯(lián)性,被廣泛應(yīng)用于信用風(fēng)險(xiǎn)定價(jià)。
2020年,中債金融估值中心有限公司基于中債價(jià)格指標(biāo)產(chǎn)品及債券市場(chǎng)歷史違約信息,推出中債市場(chǎng)隱含違約率。參考2020年四個(gè)季度(第一期于1月22日發(fā)布)的中債市場(chǎng)隱含違約率,對(duì)其發(fā)布之后一個(gè)季度內(nèi)發(fā)生首次違約的發(fā)行主體進(jìn)行觀察,發(fā)現(xiàn)在劃分適當(dāng)閾值的情況下,中債市場(chǎng)隱含違約率對(duì)違約有著較強(qiáng)的預(yù)判性。這表明,中債市場(chǎng)隱含違約率能夠客觀、精細(xì)地計(jì)量發(fā)行主體信用風(fēng)險(xiǎn)水平,可用于預(yù)期信用損失計(jì)量及風(fēng)險(xiǎn)管理領(lǐng)域。
圖6中橫軸的各點(diǎn)為中債市場(chǎng)隱含違約率值(以每次增加0.5算,即點(diǎn)1的違約率值為1,點(diǎn)2的違約率值為1.5),藍(lán)色折線為當(dāng)日隱含違約率發(fā)布后的當(dāng)季度內(nèi)的百分比變化,即預(yù)測(cè)準(zhǔn)確率AR;橙色折線為當(dāng)日隱含違約率發(fā)布后的當(dāng)季度內(nèi)的百分比變化,即預(yù)測(cè)覆蓋率RECALL。圖6顯示,隨著中債市場(chǎng)隱含違約率閾值的不斷提高,預(yù)測(cè)準(zhǔn)確率AR呈上升趨勢(shì),而預(yù)測(cè)覆蓋率RECALL呈下降趨勢(shì)。機(jī)構(gòu)在進(jìn)行風(fēng)控排查時(shí)應(yīng)綜合考慮管理成本和收益,根據(jù)自身風(fēng)險(xiǎn)偏好選擇適當(dāng)閾值。
基于銀行內(nèi)部信息的信用債違約特征研究
業(yè)界對(duì)債券違約風(fēng)險(xiǎn)的分析一般是基于公開信息,而銀行作為國(guó)家最重要的金融機(jī)構(gòu),具備擁有客戶全量數(shù)據(jù)的天然優(yōu)勢(shì)。以建設(shè)銀行為例,其充分利用行內(nèi)數(shù)據(jù)資產(chǎn),加工衍生出多類數(shù)據(jù)產(chǎn)品,范圍覆蓋產(chǎn)品信息、評(píng)級(jí)信息、信貸信息、資金流向信息,以及部分外購(gòu)的工商、司法信息等。經(jīng)統(tǒng)計(jì),本文分析的債券發(fā)行主體中有近90%是或曾是建設(shè)銀行客戶。
根據(jù)考察期內(nèi)信用債違約和正常到期情況將發(fā)行主體分為違約組和正常組,統(tǒng)計(jì)其在行內(nèi)的信貸不良情況。結(jié)果顯示,違約組的行內(nèi)信貸不良客戶占比均高于正常組,違約組的不良客戶占比是正常組的約10倍。由此可見,發(fā)行主體信貸不良情況可作為判斷后期債券違約風(fēng)險(xiǎn)的重要依據(jù)。
建設(shè)銀行于2018年1月上線的全面風(fēng)險(xiǎn)監(jiān)控預(yù)警平臺(tái)(RAD)整合了行內(nèi)外大數(shù)據(jù)資源,通過構(gòu)建模型和規(guī)則對(duì)集團(tuán)所有機(jī)構(gòu)、客戶、業(yè)務(wù)的風(fēng)險(xiǎn)進(jìn)行監(jiān)控、識(shí)別、預(yù)判并預(yù)警。本文選擇RAD系統(tǒng)預(yù)警時(shí)間先于違約或到期日的發(fā)行主體分組觀察。結(jié)果顯示:一是總體上,違約組的客戶預(yù)警率和客戶均預(yù)警條數(shù)2均高于正常組,均大于1.6倍;二是從客戶維和預(yù)警維3來看,違約組有紅色級(jí)別預(yù)警的客戶比例(81.58%)和紅色預(yù)警條數(shù)比例(54.76%)也均遠(yuǎn)高于正常組。由此可見,RAD預(yù)警信息尤其是紅色預(yù)警信息對(duì)于債券違約的前瞻分析具有借鑒意義。
基于集成學(xué)習(xí)算法的發(fā)行主體違約預(yù)測(cè)建模
(一)集成學(xué)習(xí)算法簡(jiǎn)介
集成學(xué)習(xí)算法是目前最流行的機(jī)器學(xué)習(xí)算法之一。在集成學(xué)習(xí)理論中,弱學(xué)習(xí)器被稱為基礎(chǔ)模型,這些模型可作為設(shè)計(jì)更復(fù)雜模型的構(gòu)件。在大多數(shù)情況下,基礎(chǔ)模型本身的性能并不是非常好,這要么是因?yàn)榫哂休^高的偏置(如低自由度模型),要么是因?yàn)榉讲钐髮?dǎo)致魯棒性不強(qiáng)(如高自由度模型)。集成學(xué)習(xí)算法的思想是通過將這些弱學(xué)習(xí)器的偏置和/或方差結(jié)合起來,創(chuàng)建一個(gè)強(qiáng)學(xué)習(xí)器(也稱“集成學(xué)習(xí)模型”),從而獲得更好的性能。
按照弱學(xué)習(xí)器之間是否存在依賴關(guān)系可以分為以下兩類:
一是弱學(xué)習(xí)器之間不存在強(qiáng)依賴關(guān)系,一系列的個(gè)體學(xué)習(xí)器可以并行生成。作為該類中最常見的算法代表,隨機(jī)森林算法是由多棵決策樹組成的集成學(xué)習(xí)模型,在處理分類問題時(shí),其以CART分類樹4為基礎(chǔ)模型。根據(jù)大數(shù)據(jù)集理論,隨機(jī)森林算法并行訓(xùn)練速度快,不存在過擬合的問題,具備很好的泛化能力。
二是弱學(xué)習(xí)器之間存在強(qiáng)依賴關(guān)系,一系列的個(gè)體學(xué)習(xí)器基本必須串行生成,該類的代表算法包括GBDT、XGBoost和LightGBM等。XGBoost是一種提升樹模型,在2014年被首次提出后,因其優(yōu)良的學(xué)習(xí)效果以及高效的訓(xùn)練速度而獲得廣泛關(guān)注和應(yīng)用。XGBoost支持在選擇最佳分裂點(diǎn)進(jìn)行枚舉時(shí)并行化,訓(xùn)練速度快,其損失函數(shù)引入了一階和二階導(dǎo),并加入正則項(xiàng),控制了模型的復(fù)雜度,防止過擬合。相對(duì)于傳統(tǒng)的邏輯回歸等機(jī)器學(xué)習(xí)算法,XGBoost在變量挖掘方面更具優(yōu)勢(shì):邏輯回歸的變量選擇更依賴于業(yè)務(wù)經(jīng)驗(yàn),而XGBoost特有的樹結(jié)構(gòu)具備從原始變量中通過組合獲取隱含信息的特性,對(duì)陌生業(yè)務(wù)領(lǐng)域的分析更具優(yōu)勢(shì)。
(二)模型構(gòu)建
本文擬基于宏觀經(jīng)濟(jì)、財(cái)務(wù)指標(biāo)、債券交易價(jià)格等公開信息建立主模型,而對(duì)于是或曾是建設(shè)銀行客戶的發(fā)行主體使用行內(nèi)信貸、資產(chǎn)變化、敏感客戶名單、RAD預(yù)警系統(tǒng)等信息建立輔助模型,將主模型和輔助模型相結(jié)合來分析信用債違約風(fēng)險(xiǎn)。
有效的模型需具備預(yù)測(cè)的先兆性,即發(fā)行主體在發(fā)生違約前多久可被模型預(yù)測(cè)到。考慮到信用債尤其是違約風(fēng)險(xiǎn)較大的信用債流動(dòng)性較差的特點(diǎn),建模所選擇的數(shù)據(jù)時(shí)點(diǎn)為違約或到期前1個(gè)月或以上。
根據(jù)對(duì)信用債違約特征和行內(nèi)外數(shù)據(jù)的分析,本文篩選出 143個(gè)或有潛在影響的基礎(chǔ)變量,再在基礎(chǔ)變量之上進(jìn)行加工衍生,共生成525個(gè)變量,變量基本情況及衍生方式見表2。其中,基本面因素包括成立年限、所在區(qū)域、行業(yè)類別等靜態(tài)指標(biāo)。
樣本方面,2014—2019 年信用債違約或正常到期主體共有2452個(gè)(不包含沒有公開信息的發(fā)行主體),其中有134個(gè)違約樣本,包括有信用債違約記錄的120個(gè)發(fā)行主體和債券正常到期前在建設(shè)銀行或他行有信貸不良記錄的14個(gè)發(fā)行主體5,占總樣本的比例為5.46%。
針對(duì)主模型,將2452個(gè)樣本按7∶3的比例6劃分訓(xùn)練集和測(cè)試集,在兩個(gè)數(shù)據(jù)集里,違約樣本占比保持在5.46%。根據(jù)數(shù)據(jù)缺失度進(jìn)行變量篩選,刪除缺失度在40%以上的變量,最終入模385個(gè)變量。
針對(duì)輔助模型,經(jīng)過是否為建設(shè)銀行客戶的篩選后,樣本數(shù)縮減為1347個(gè),其中違約樣本為83個(gè),包括有信用債違約記錄且為建設(shè)銀行客戶的69個(gè)發(fā)行體和債券到期前在建設(shè)銀行或他行有信貸不良記錄的14個(gè)發(fā)行體,違約樣本占比為6.16%。同樣按7∶3的比例劃分訓(xùn)練集和測(cè)試集,兩個(gè)數(shù)據(jù)集中,違約樣本占比保持不變。刪除缺失度在40%以上的變量,最終入模83個(gè)變量。
歷史上,債券違約屬于小概率事件,再鑒于以上兩種集成算法的特性以及數(shù)據(jù)源的不同,在本次建模中,我們希望能得到較高的準(zhǔn)確率,且不同的數(shù)據(jù)源能達(dá)到互補(bǔ)的效果,因此采用如下的組合策略:針對(duì)同一數(shù)據(jù)源分別使用隨機(jī)森林和XGBoost兩種算法,并將結(jié)果(違約概率最大的前5%客戶)取交集作為該類數(shù)據(jù)源的唯一輸出,之后再對(duì)兩類數(shù)據(jù)源的輸出結(jié)果取并集,最后以該名單作為最終產(chǎn)出。
模型效果評(píng)估
對(duì)模型效果的評(píng)估,通常從技術(shù)指標(biāo)、應(yīng)用效果及風(fēng)險(xiǎn)因素可解釋性三個(gè)維度進(jìn)行。
(一)技術(shù)指標(biāo)
一是預(yù)警的精確性,也可理解為準(zhǔn)確率,即通過模型產(chǎn)生的高違約風(fēng)險(xiǎn)預(yù)警名單中實(shí)際違約主體比例。該值越大,模型效果越好,即只需關(guān)注極小部分發(fā)行主體(成本),就能準(zhǔn)確篩查出高違約風(fēng)險(xiǎn)主體(收益)。該值與未建模情況下違約主體基準(zhǔn)比例的比值即為提升度。
二是預(yù)警的全面性,也可理解為覆蓋率,即通過模型產(chǎn)生的高違約風(fēng)險(xiǎn)預(yù)警名單中實(shí)際違約主體占所有違約主體的比例。理想的狀態(tài)是預(yù)警名單能預(yù)測(cè)到所有實(shí)際違約主體。
在實(shí)踐中,預(yù)警的精確性和全面性是相互矛盾的,通常需根據(jù)業(yè)務(wù)部門的實(shí)際需求進(jìn)行權(quán)衡。
(二)應(yīng)用效果
以2020年1月1日存續(xù)債券的正常(未違約)發(fā)行主體1584個(gè)為觀察對(duì)象,評(píng)估其未來違約風(fēng)險(xiǎn)。截至2020年7月底,共有14個(gè)發(fā)行主體發(fā)生首次違約。
運(yùn)用上文構(gòu)建的模型產(chǎn)生出一個(gè)包含63個(gè)發(fā)行主體的高違約風(fēng)險(xiǎn)預(yù)警名單。與實(shí)際違約情況相比,這63個(gè)高違約風(fēng)險(xiǎn)發(fā)行主體中有10個(gè)發(fā)生首次違約。評(píng)估效果解析為:基準(zhǔn)比例,0.88%(14/1584);預(yù)警率,4%(63/1584);準(zhǔn)確率,15.9%(10/63);提升度,18.1倍(15.9/0.88);覆蓋率,71.4%(10/14)??梢?,模型在精確性和全面性方面均有較好表現(xiàn)。
(三)風(fēng)險(xiǎn)因素可解釋性
本文構(gòu)建的模型是通過多個(gè)入模變量的值綜合計(jì)算發(fā)行主體的違約率,但實(shí)際上,導(dǎo)致發(fā)行主體風(fēng)險(xiǎn)高的原因不盡相同,因此除了提供預(yù)警名單和違約率,我們還力圖尋求一種方法來幫助業(yè)務(wù)人員進(jìn)一步開展風(fēng)險(xiǎn)排查工作。由于XGBoost是一種集成模型,并不能得到類似線性模型的結(jié)果,所以需要引入其他貢獻(xiàn)度評(píng)價(jià)方法。
在此,引入一個(gè)概念:沙普利值(Shapley value)。在本文模型中,沙普利值是指所有可能特征組合子集中特征值的平均邊際貢獻(xiàn),是邊際貢獻(xiàn)度的加權(quán)平均值。通過使用沙普利值,可以解析出究竟是哪些因素使得該樣本的違約率高于其他樣本。我們以出現(xiàn)在模型預(yù)警名單中且在2020年已發(fā)生實(shí)際違約的某集團(tuán)為例,通過計(jì)算沙普利值來解釋各變量對(duì)違約率的貢獻(xiàn)度,結(jié)果如下:
在公開信息數(shù)據(jù)模型中,對(duì)違約率上升貢獻(xiàn)度最大的三個(gè)變量分別是違約前第一個(gè)季度與第三個(gè)季度債券區(qū)間最高價(jià)變化、違約前第一個(gè)季度與第四個(gè)季度債券區(qū)間收盤價(jià)變化及其趨勢(shì)。進(jìn)一步分析,該集團(tuán)債券區(qū)間最高價(jià)在違約前第一個(gè)季度較第三個(gè)季度下降4.92元,而同期,總體樣本均值為上升1.03元;同時(shí),其收盤價(jià)在違約前第一季度較第四季度下降且下降幅度高達(dá)23.24元,而總體樣本均值為上升1.33元。這些價(jià)格變化使得該集團(tuán)債券違約率遠(yuǎn)高于所有樣本違約率均值。
在銀行內(nèi)部數(shù)據(jù)模型中,對(duì)違約率上升貢獻(xiàn)度最大的三個(gè)變量分別是敏感名單個(gè)數(shù)、關(guān)聯(lián)被執(zhí)行人的案號(hào)數(shù)量及執(zhí)行標(biāo)的合計(jì)。具體來看,該集團(tuán)的關(guān)聯(lián)被執(zhí)行人執(zhí)行中案號(hào)執(zhí)行標(biāo)的合計(jì)高達(dá)120億元,遠(yuǎn)高于其他發(fā)行主體;另外,該集團(tuán)同時(shí)出現(xiàn)在10個(gè)各類敏感名單中和5個(gè)被執(zhí)行人案號(hào)中,該集團(tuán)法定代表人任職公司個(gè)數(shù)有15個(gè)之多,存在極大的風(fēng)險(xiǎn)隱患。在多個(gè)負(fù)面效應(yīng)的綜合作用下,該集團(tuán)的違約率遠(yuǎn)高于所有樣本違約率均值。
結(jié)論
本文對(duì)債券發(fā)行主體的多種特征(宏觀經(jīng)濟(jì)環(huán)境、財(cái)務(wù)指標(biāo)、交易價(jià)格)進(jìn)行違約關(guān)聯(lián)性分析,并采用集成學(xué)習(xí)算法建立了發(fā)行主體違約先兆預(yù)測(cè)模型,得出以下結(jié)論:
一是相對(duì)于宏觀經(jīng)濟(jì)數(shù)據(jù)和財(cái)務(wù)指標(biāo),債券交易價(jià)格對(duì)發(fā)行主體潛在風(fēng)險(xiǎn)敏感度極高,部分指標(biāo)(如中債市場(chǎng)隱含違約率)設(shè)定閾值后可直接作為預(yù)警規(guī)則部署使用;而行內(nèi)數(shù)據(jù)以獨(dú)特的觀察視角描繪出的發(fā)行主體風(fēng)險(xiǎn)畫像,可成為風(fēng)險(xiǎn)排查手段的有效補(bǔ)充。
二是通過集成模型產(chǎn)生的信用債高違約風(fēng)險(xiǎn)預(yù)警名單對(duì)發(fā)行主體的違約風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)具有很強(qiáng)的指導(dǎo)意義,而使用沙普利值將風(fēng)險(xiǎn)因素可解釋化,為業(yè)務(wù)人員進(jìn)一步開展風(fēng)險(xiǎn)排查工作指明了方向。
注:
1.根據(jù)萬得(Wind)的劃分標(biāo)準(zhǔn),本文所指違約包括信用債本息展期、交叉違約、擔(dān)保違約、技術(shù)性違約、提前到期未兌付、未按時(shí)兌付本金等情況。
2.客戶預(yù)警率是指在相應(yīng)客戶組內(nèi)有預(yù)警的客戶數(shù)占比,公式為組內(nèi)預(yù)警客戶數(shù)/組內(nèi)總客戶數(shù)??蛻艟A(yù)警條數(shù)是指在相應(yīng)客戶組內(nèi),每個(gè)客戶平均預(yù)警條數(shù),公式為組內(nèi)總預(yù)警數(shù)/組內(nèi)總客戶數(shù)。
3.客戶維是指根據(jù)預(yù)警級(jí)別將客戶劃分為紅色客戶、橙色客戶和藍(lán)色客戶,分別表示客戶的風(fēng)險(xiǎn)水平:高、中、低,用于比較正??蛻艚M和違約客戶組中各風(fēng)險(xiǎn)級(jí)別的客戶分布差異。預(yù)警維是根據(jù)預(yù)警級(jí)別將總預(yù)警數(shù)劃分為紅色預(yù)警條數(shù)、橙色預(yù)警條數(shù)和藍(lán)色預(yù)警條數(shù),用于比較正常客戶組和違約客戶組中各風(fēng)險(xiǎn)級(jí)別預(yù)警條數(shù)的分布差異。
4.CART分類(回歸)樹是幾乎所有復(fù)雜決策樹算法的基礎(chǔ)。CART樹是一棵二叉樹,當(dāng)用作解決分類問題時(shí)(如預(yù)測(cè)用戶是否違約,違約用1表示一類,不違約用0表示另一類),采用基尼雜質(zhì)(Gini Impurity)作為節(jié)點(diǎn)分裂的依據(jù),直到節(jié)點(diǎn)中樣本個(gè)數(shù)小于預(yù)定閾值。
5.因違約樣本較少,因此用于建模的為不平衡樣本集??紤]到信貸質(zhì)量與債券違約有較強(qiáng)的相關(guān)性且有一定前瞻性,因此選擇有信貸不良記錄的14個(gè)發(fā)行主體來擴(kuò)充違約樣本,以減少不平衡樣本集對(duì)模型效果的負(fù)面影響。
6.業(yè)界一般按8∶2或7∶3的比例劃分,但為了避免屬于某一類別的樣本較少導(dǎo)致劃分后測(cè)試集樣本不平衡,本文以7∶3的比例劃分。
作者單位:中國(guó)建設(shè)銀行總行風(fēng)險(xiǎn)計(jì)量中心
責(zé)任編輯:宋鵬 羅邦敏
參考文獻(xiàn)
[1] 孟祥娟.違約統(tǒng)計(jì):一件簡(jiǎn)單但容易犯錯(cuò)的事[R]. 上海:申萬宏源, 2018.
[2] 生柳榮, 陳海華, 胡施聰, 等. 企業(yè)債券信用風(fēng)險(xiǎn)預(yù)警模型及其運(yùn)用[J]. 投資研究, 2019, 38(6):25-35.
[3] 張劍文, 余艷炯, 倪力超, 馮瑞敏. 資本市場(chǎng)企業(yè)信用風(fēng)險(xiǎn)預(yù)警體系構(gòu)建[C]//中國(guó)證券業(yè)協(xié)會(huì).創(chuàng)新與發(fā)展:中國(guó)證券業(yè)2018年論文集(上冊(cè)).北京:中國(guó)財(cái)政經(jīng)濟(jì)出版社, 2019:267-275.
[4] 中國(guó)人民銀行常州市中心支行課題組,許永偉.債券違約風(fēng)險(xiǎn)預(yù)警指標(biāo)體系構(gòu)建研究[J].金融縱橫,2019(9):42-47.
[5] 周榮喜,彭航,李欣宇,等.基于XGBoost算法的信用債違約預(yù)測(cè)模型[J].債券,2019(10):61-68.