周雷 邱勛 朱奕 毛曉飛
摘? ?要:通過將前沿大數(shù)據(jù)征信技術(shù)與評(píng)分卡方法相結(jié)合,以整車制造行業(yè)供應(yīng)鏈為場(chǎng)景,對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)進(jìn)行測(cè)度。借助Python軟件,從“企查查”API數(shù)據(jù)接口和萬得數(shù)據(jù)庫獲取相關(guān)數(shù)據(jù),對(duì)27家核心企業(yè)122條供應(yīng)鏈多維指標(biāo)進(jìn)行數(shù)據(jù)挖掘、WOE編碼和變量篩選,構(gòu)建指標(biāo)體系。然后,運(yùn)用大數(shù)據(jù)和人工智能建模思路,建立涵蓋14個(gè)特征解釋變量的Logistic回歸模型,并運(yùn)用多種工具訓(xùn)練和改進(jìn)模型形成可用于實(shí)務(wù)的Logistic評(píng)分卡。經(jīng)實(shí)證檢驗(yàn),最終確定的信用評(píng)估模型區(qū)分能力強(qiáng),風(fēng)險(xiǎn)預(yù)測(cè)準(zhǔn)確率能達(dá)到96.77%?;诖髷?shù)據(jù)的Logistic評(píng)分卡將供應(yīng)鏈信用等級(jí)數(shù)字化,相較于傳統(tǒng)的信用評(píng)級(jí)更具有實(shí)用性,因此,大數(shù)據(jù)技術(shù)的運(yùn)用對(duì)提升供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估和管理水平具有重要價(jià)值。
關(guān)鍵詞:供應(yīng)鏈金融;信用風(fēng)險(xiǎn);Logistic評(píng)分卡;人工智能
中圖分類號(hào):F832? 文獻(xiàn)標(biāo)識(shí)碼:B? 文章編號(hào):1674-2265(2022)05-0064-07
DOI:10.19647/j.cnki.37-1462/f.2022.05.009
一、引言
金融科技創(chuàng)新驅(qū)動(dòng)數(shù)字供應(yīng)鏈金融快速發(fā)展,但也使信用風(fēng)險(xiǎn)的識(shí)別與評(píng)估更加復(fù)雜。為了對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)進(jìn)行有效識(shí)別與管控,大多數(shù)學(xué)者從理論分析與風(fēng)險(xiǎn)測(cè)度兩方面展開研究。在理論分析方面,付瑋瓊(2020)[1]運(yùn)用供應(yīng)鏈金融網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及依賴共生模型來說明核心企業(yè)主導(dǎo)模式下的依賴性壟斷現(xiàn)象及其對(duì)供應(yīng)鏈金融風(fēng)險(xiǎn)的作用機(jī)理。曹允春等(2020)[2]指出大數(shù)據(jù)等金融科技技術(shù)不斷推動(dòng)供應(yīng)鏈金融智慧化,各交易主體跨界聯(lián)動(dòng)及數(shù)據(jù)挖掘可以解決傳統(tǒng)風(fēng)險(xiǎn)評(píng)估中的供應(yīng)鏈關(guān)系識(shí)別、信用風(fēng)險(xiǎn)指標(biāo)關(guān)聯(lián)性等問題。趙成國(guó)和江文歆(2021)[3]基于供應(yīng)鏈金融生態(tài)發(fā)展邏輯,從資源、組織、知識(shí)分析視角建立供應(yīng)鏈金融生態(tài)風(fēng)險(xiǎn)管理內(nèi)外協(xié)同共生機(jī)制,并提出了供應(yīng)鏈金融生態(tài)風(fēng)險(xiǎn)評(píng)估和管理建議。周雷等(2021)[4]運(yùn)用博弈論分析了區(qū)塊鏈賦能供應(yīng)鏈金融的作用機(jī)理,指出區(qū)塊鏈的智能合約技術(shù)有助于提高信用風(fēng)險(xiǎn)評(píng)估效率。在風(fēng)險(xiǎn)測(cè)度方面,大數(shù)據(jù)征信在很大程度上改變了傳統(tǒng)征信對(duì)數(shù)據(jù)采集、加工和分析的方式以及對(duì)客戶信用風(fēng)險(xiǎn)預(yù)測(cè)的效果(張瑜等,2021)[5],特別是能夠通過重新設(shè)計(jì)信用評(píng)級(jí)模型以及創(chuàng)新風(fēng)險(xiǎn)識(shí)別系統(tǒng),更有效地控制和評(píng)估供應(yīng)鏈金融風(fēng)險(xiǎn)(Tian等,2019)[6]。因此,部分學(xué)者使用主成分分析和邏輯回歸模型、Rough和GADEMATEL模型、GA-BP神經(jīng)網(wǎng)絡(luò)模型、PSO-SVM供應(yīng)鏈金融預(yù)警模型、Copula 模型等進(jìn)行了信用風(fēng)險(xiǎn)測(cè)度(余得生和李星,2019;周茜等,2019;孫中葉和徐曉燕,2021;李健和張金林,2019;胡海青等,2020)[7-11]。
國(guó)家“十四五”規(guī)劃指出,要加快構(gòu)建全國(guó)一體化大數(shù)據(jù)中心體系,加強(qiáng)信用信息歸集、共享、公開和應(yīng)用。大數(shù)據(jù)技術(shù)在供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用,對(duì)于防控信用風(fēng)險(xiǎn)、提升供應(yīng)鏈發(fā)展水平具有重要的現(xiàn)實(shí)意義。但是,從已有的相關(guān)文獻(xiàn)來看,理論研究和機(jī)理分析較多,部分實(shí)證研究也大多從學(xué)術(shù)角度出發(fā),未能提供可以直接實(shí)踐應(yīng)用的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)價(jià)工具;或者僅針對(duì)某個(gè)特定供應(yīng)鏈企業(yè)案例展開,對(duì)整個(gè)行業(yè)場(chǎng)景的實(shí)踐指導(dǎo)價(jià)值較弱。鮮有學(xué)者將實(shí)務(wù)中普遍運(yùn)用的評(píng)分卡工具用于供應(yīng)鏈金融信用風(fēng)險(xiǎn)測(cè)度,而本文將前沿大數(shù)據(jù)征信模型與評(píng)分卡工具相結(jié)合,針對(duì)具體行業(yè)場(chǎng)景的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估以應(yīng)用為導(dǎo)向進(jìn)行深入研究,具有一定的創(chuàng)新性和現(xiàn)實(shí)針對(duì)性。
二、場(chǎng)景選擇與變量篩選
(一)場(chǎng)景選擇
大數(shù)據(jù)供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型的構(gòu)建首先需要選擇合適的研究對(duì)象和模型訓(xùn)練場(chǎng)景。整車制造行業(yè)具有典型的供應(yīng)鏈協(xié)同特征,該行業(yè)一般以整車制造企業(yè)為核心企業(yè),上游汽車零配件供應(yīng)商與下游整車經(jīng)銷商圍繞整車制造核心企業(yè)合作,形成上下游相互協(xié)作的供應(yīng)鏈。整車制造行業(yè)供應(yīng)鏈的供應(yīng)商數(shù)量多、交易脈絡(luò)復(fù)雜、應(yīng)收賬款和資金需求量較大,具有開展應(yīng)收賬款質(zhì)押融資的有利條件。而應(yīng)收賬款質(zhì)押融資正是供應(yīng)鏈金融發(fā)展較為成熟的主流模式。因此,本文以整車制造行業(yè)供應(yīng)鏈為場(chǎng)景探索大數(shù)據(jù)技術(shù)在供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用具有典型性和代表性。樣本具體選擇條件如下:(1)核心企業(yè)為整車制造的上市公司,屬于國(guó)民經(jīng)濟(jì)行業(yè)分類中的“汽車制造業(yè)——汽車整車制造業(yè)”;(2)中小融資企業(yè)選取自核心企業(yè)的上游供應(yīng)商,考慮數(shù)據(jù)可得性,根據(jù)證監(jiān)會(huì)《上市公司行業(yè)分類指引》將中小板、創(chuàng)業(yè)板中的汽車制造業(yè)供應(yīng)商認(rèn)定為所選樣本。根據(jù)以上篩選條件,共選取27家上市公司核心企業(yè)和122條樣本供應(yīng)鏈作為本文實(shí)證研究對(duì)象。
在選擇場(chǎng)景的基礎(chǔ)上,評(píng)估指標(biāo)設(shè)計(jì)參考中國(guó)知網(wǎng)(CNKI)的35篇相關(guān)文獻(xiàn),并咨詢大數(shù)據(jù)技術(shù)應(yīng)用與供應(yīng)鏈金融領(lǐng)域的專家,初步確定了42個(gè)原始指標(biāo)供篩選。指標(biāo)主要包括六個(gè)維度:中小融資企業(yè)情況、核心企業(yè)情況、供應(yīng)鏈關(guān)系、宏觀經(jīng)濟(jì)狀況、信用評(píng)級(jí)情況、信息披露質(zhì)量。各項(xiàng)指標(biāo)數(shù)據(jù)來源為:供應(yīng)鏈關(guān)系數(shù)據(jù),通過“企查查”關(guān)系圖譜API接口獲取,數(shù)據(jù)爬取前申請(qǐng)Key,以JSON(JavaScript Object Notation)半結(jié)構(gòu)化數(shù)據(jù)形式返回;上市公司的主體信用評(píng)級(jí)數(shù)據(jù),采用華政ESG信用評(píng)級(jí)作為代理變量;核心企業(yè)和中小融資企業(yè)的信息披露質(zhì)量數(shù)據(jù),也選自華政ESG信用評(píng)級(jí)中的信息披露選項(xiàng);其他指標(biāo)主要通過萬得數(shù)據(jù)庫整理導(dǎo)出。上述指標(biāo)數(shù)據(jù)選取的時(shí)間點(diǎn)為2020年12月31日,均使用Python3.8軟件編程進(jìn)行數(shù)據(jù)挖掘和建模分析。
在整車制造供應(yīng)鏈場(chǎng)景下,設(shè)定被解釋變量為汽車行業(yè)上市公司主體的好壞,對(duì)好樣本賦值為0,壞樣本賦值為1。由于我國(guó)汽車行業(yè)上市公司截至2021年10月沒有發(fā)生實(shí)質(zhì)的退市,通常上市公司總體評(píng)級(jí)參考標(biāo)準(zhǔn)為A級(jí)以上,因此,本文將A級(jí)作為好壞樣本的切分點(diǎn),評(píng)級(jí)為A級(jí)及以上的樣本標(biāo)簽為好樣本,A級(jí)以下(不含A級(jí))的為壞樣本。根據(jù)采集的數(shù)據(jù),122個(gè)汽車行業(yè)供應(yīng)鏈樣本中,好樣本95個(gè),占比77.87%;壞樣本27個(gè),占比22.13%。為解決數(shù)據(jù)平衡性問題,筆者使用Python進(jìn)行了SMOTE過采樣算法處理。
(二)變量篩選
1. 分箱與WOE編碼。運(yùn)用大數(shù)據(jù)技術(shù)構(gòu)建Logistic評(píng)分卡模型,先需要對(duì)各原始特征變量進(jìn)行分箱與WOE編碼處理,然后再篩選出滿足Logistic回歸模型要求的解釋變量。分箱的本質(zhì)是連續(xù)變量的離散化,即對(duì)不同屬性的變量,根據(jù)不同的類別打上不同的特征值;分箱最終的目的是讓每一組內(nèi)差異盡可能小,組間的差異盡可能大。分箱之后需要對(duì)變量進(jìn)行編碼。WOE編碼是Logistic評(píng)分卡模型常用的編碼方式。WOE稱為證據(jù)權(quán)重(Weight of Evidence),計(jì)算公式如(1)式所示。WOE在信貸業(yè)務(wù)中是衡量違約概率的指標(biāo),其本質(zhì)是壞客戶與好客戶的比例的對(duì)數(shù)。WOE越大,該分箱的壞客戶比例越高,也就是說通過對(duì)變量進(jìn)行WOE編碼,并將WOE作為特征值,則特征值不僅代表了變量的一個(gè)分類,還代表了這個(gè)分類對(duì)預(yù)測(cè)違約概率的權(quán)重或者說對(duì)信用風(fēng)險(xiǎn)評(píng)估的貢獻(xiàn)度。
公式(1)中,[pi1]是第[i]分箱中壞客戶占所有壞客戶的比例,[pi0]是第[i]分箱中好客戶占所有好客戶的比例;[*Bi]是第[i]分箱中壞客戶數(shù);[*BT]是所有壞客戶數(shù);[*Gi]是第[i]分箱中好客戶數(shù);[*GT]是所有好客戶數(shù)。
以資產(chǎn)負(fù)債率為例,該變量為連續(xù)變量,經(jīng)分箱處理后,可以劃分為三檔區(qū)間,分別為低于43.60%、介于43.60%與64.52%之間以及高于64.52%。然后運(yùn)用采集的數(shù)據(jù),根據(jù)公式(1)可以計(jì)算出資產(chǎn)負(fù)債率變量各分箱對(duì)應(yīng)的WOE,如表1所示。根據(jù)表1,資產(chǎn)負(fù)債率變量各分箱的WOE與壞客戶率成正比,壞客戶率越高,WOE越大。因此, WOE不僅可以作為資產(chǎn)負(fù)債率變量離散化處理后各分箱類別的特征值,而且反映了該類別對(duì)預(yù)測(cè)違約概率的權(quán)重。采用同樣的方法,可以對(duì)本文各評(píng)估指標(biāo)變量都進(jìn)行分箱與WOE編碼,作為變量的特征值用于后續(xù)的分析、篩選與建模。
2. 相關(guān)性分析與IV變量篩選。經(jīng)過分箱與WOE編碼,類別變量實(shí)現(xiàn)了賦值,連續(xù)變量也進(jìn)行了離散化處理并取得了特征值,從而可以進(jìn)行相關(guān)性分析與IV(信息增益值)變量篩選。兩變量間的線性相關(guān)性可用皮爾森相關(guān)系數(shù)來衡量,該系數(shù)的取值范圍為[-1,1]。相關(guān)系數(shù)越接近0,說明兩變量線性相關(guān)性越弱;越接近1或-1則兩變量線性相關(guān)性越強(qiáng)。當(dāng)指標(biāo)間兩兩相關(guān)系數(shù)的絕對(duì)值大于0.7時(shí),說明兩者的相關(guān)性較強(qiáng),會(huì)影響其對(duì)被解釋變量的可解釋性。因此,當(dāng)兩指標(biāo)間的相關(guān)系數(shù)絕對(duì)值大于0.7時(shí),選擇IV較高的指標(biāo)作為備選解釋變量,去除區(qū)分能力較低的指標(biāo)。將連續(xù)變量離散化必然伴隨信息的損失,并且分箱越少,信息損失越大。為了衡量特征變量上的信息量以及特征對(duì)預(yù)測(cè)函數(shù)的貢獻(xiàn)度,定義IV如公式(2)所示。
其中,[n]代表分箱個(gè)數(shù),[i]代表第[i]個(gè)分箱,[bad%]是這個(gè)分箱的壞客戶,即標(biāo)簽為1的客戶占整個(gè)特征中所有壞客戶的比例,[good%]是這個(gè)分箱的好客戶,即標(biāo)簽為0的客戶占整個(gè)特征中所有好客戶的比例。
IV通過在WOE基礎(chǔ)上乘以系數(shù),不僅避免了負(fù)數(shù)出現(xiàn),而且考慮了分箱中樣本占總體樣本的比例及其預(yù)測(cè)貢獻(xiàn)。對(duì)分箱而言,IV越大代表了這個(gè)分箱的壞客戶越多。對(duì)整個(gè)變量而言,IV代表了特征變量上的信息量對(duì)模型的貢獻(xiàn)度和排序的區(qū)分度。換言之,代表了分箱后模型對(duì)違約概率的預(yù)測(cè)效率。根據(jù)信息增益值IV的判定標(biāo)準(zhǔn),一般需要大于0.03,模型預(yù)測(cè)方為有效,因此,在兩兩相關(guān)系數(shù)大于0.7的各組變量中去除IV較低指標(biāo)的基礎(chǔ)上,還需要去除雖然相關(guān)系數(shù)小于0.7,但是IV小于0.03的指標(biāo),這些指標(biāo)包括營(yíng)業(yè)利潤(rùn)、信息披露質(zhì)量、公司治理能力、GDP增長(zhǎng)率、產(chǎn)業(yè)景氣指數(shù)AIC、核心企業(yè)資產(chǎn)負(fù)債率。
3.多重共線性檢驗(yàn)。多重共線性指解釋變量之間由于存在相關(guān)關(guān)系而導(dǎo)致回歸模型失真的情況。本文選取VIF(方差膨脹系數(shù))來衡量多重共線性,如公式(3)所示,其中[Ri]是被篩選的解釋變量[i]與其他解釋變量的復(fù)相關(guān)系數(shù)。
VIF值越大代表解釋變量多重共線性程度越嚴(yán)重。本文將VIF閾值設(shè)置為10,當(dāng)VIF>10,被視為出現(xiàn)多重共線性的情況。因此,篩選出所有方差膨脹系數(shù)小于10的變量,這些變量之間沒有嚴(yán)重的多重共線性,可以構(gòu)建Logistic回歸模型。
三、Logistic回歸模型
(一)模型建立
Logistic回歸模型是指被解釋變量為二級(jí)計(jì)分或二類評(píng)定的回歸分析,一般形式如式(4)。
公式(4)中,[w0]表示常數(shù)項(xiàng),[Xk]代表各解釋變量,[wk]表示對(duì)應(yīng)的回歸系數(shù),[ε]為隨機(jī)誤差項(xiàng)。被解釋變量為企業(yè)違約發(fā)生比的自然對(duì)數(shù),其中[p]為違約概率,越接近0表示企業(yè)違約風(fēng)險(xiǎn)越低,越接近1表示企業(yè)違約風(fēng)險(xiǎn)越高;[p1-p]被定義為發(fā)生比(odds),表示客戶違約的相對(duì)概率。
通過指標(biāo)體系構(gòu)建,并運(yùn)用相關(guān)性分析、多重共線性檢驗(yàn)、IV等多種方法進(jìn)行變量篩選,最終根據(jù)機(jī)器學(xué)習(xí)梯度下降樹算法GBDT重要程度排序,確定被納入Logistic回歸模型的具體變量,共包括14個(gè)特征解釋變量。為了區(qū)分核心企業(yè)與中小融資企業(yè)的財(cái)務(wù)指標(biāo)變量,將核心企業(yè)的指標(biāo)名稱加上尾綴“.H”,同時(shí)所有解釋變量都經(jīng)過了分箱和WOE編碼。WOE編碼可以把原始指標(biāo)與壞客戶率之間可能存在的非線性特征轉(zhuǎn)換為線性,這為構(gòu)建包括Logistic回歸在內(nèi)的廣義線性模型奠定了基礎(chǔ)。然后,通過估計(jì)Logistic回歸,得到大數(shù)據(jù)供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型的系數(shù),如表2所示。需要說明的是,由于WOE編碼始終與壞客戶率成正相關(guān),即變量的WOE編碼值與供應(yīng)鏈金融違約概率成正比,因此,所有的模型系數(shù)均為正數(shù)。但是,對(duì)于指標(biāo)本身的原始實(shí)際值與違約概率成負(fù)相關(guān)關(guān)系的負(fù)向指標(biāo),在后續(xù)制作Logistic評(píng)分卡與解釋模型結(jié)果時(shí),需要將其還原,以方便理解。例如,負(fù)向指標(biāo)營(yíng)業(yè)利潤(rùn)率,該指標(biāo)越高,壞客戶比例越低,WOE編碼就越小,則預(yù)測(cè)違約概率也越低,因此,該指標(biāo)的模型系數(shù)雖然也為正數(shù),但是實(shí)際是負(fù)相關(guān)關(guān)系。
由于Logistic回歸模型的被解釋變量是對(duì)數(shù)發(fā)生比[lnp1-p],因此,每個(gè)特征解釋變量的估計(jì)系數(shù)都可以解釋為對(duì)該對(duì)數(shù)發(fā)生比的作用。將表2中的模型系數(shù)用對(duì)數(shù)發(fā)生比模型表示,如下式所示。該模型即是本文構(gòu)建的大數(shù)據(jù)供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型,各變量的回歸系數(shù)均至少在5%的水平下顯著。
(二)模型檢驗(yàn)
根據(jù)大數(shù)據(jù)建模原理,通過對(duì)構(gòu)建的Logistic回歸模型設(shè)置不同的拒絕概率閾值,不斷測(cè)試模型,計(jì)算出各評(píng)估指標(biāo)的最優(yōu)值,結(jié)果如表3和圖1所示,其中準(zhǔn)確率、精確率、召回率和提升度均為最大值,相應(yīng)地,誤分類率為最小值。通過表3和圖1可知,本文構(gòu)建的大數(shù)據(jù)信用風(fēng)險(xiǎn)評(píng)估模型預(yù)測(cè)的最大準(zhǔn)確率為96.77%,AUC值約為0.88,接近于1,模型對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)的預(yù)測(cè)效果較好;經(jīng)模型排序后拒絕分箱中壞客戶濃度最大可達(dá)總體的4.01倍,風(fēng)險(xiǎn)排序能力和區(qū)分度強(qiáng);實(shí)際為好客戶卻預(yù)測(cè)為壞客戶和實(shí)際為壞客戶卻預(yù)測(cè)為好客戶的概率之和僅為3.23%,誤分類率較低。
四、Logistic評(píng)分卡構(gòu)建與應(yīng)用
為了將建立的Logistic回歸信用風(fēng)險(xiǎn)評(píng)估模型直觀展示,本文進(jìn)一步將回歸模型轉(zhuǎn)換為L(zhǎng)ogistic評(píng)分卡。Logistic評(píng)分卡分值可以定義比率對(duì)數(shù)線性表達(dá)式,如(5)式所示。
公式(5)中,A與B是常量,根據(jù)希望Logistic評(píng)分卡模型最終輸出的總分區(qū)間設(shè)定,且一般均大于0,B前面的負(fù)號(hào)表示違約概率越低,信用得分越高。通常情況下,分值越高代表風(fēng)險(xiǎn)越低,分值越低代表風(fēng)險(xiǎn)越高。將構(gòu)建的Logistic回歸模型(4)代入式(5),省略隨機(jī)誤差項(xiàng),可以得到可實(shí)際應(yīng)用的Logistic評(píng)分公式,如式(6)所示。
公式(6) 中,[A-Bw0]為基礎(chǔ)分,[Xk]是以WOE編碼為特征值的各解釋變量,[wk]表示對(duì)應(yīng)的Logistic回歸模型系數(shù)。
轉(zhuǎn)換過程中,首先,將通過檢驗(yàn)的Logistic回歸模型系數(shù)以及設(shè)定的常量A、B代入評(píng)分公式(6),可以得到基礎(chǔ)分564分。其次,把各變量每個(gè)分箱的特征值WOE分別代入公式(6)中該變量對(duì)應(yīng)的X,得到每個(gè)分箱特征值的評(píng)分結(jié)果。最后,將各分箱對(duì)應(yīng)的WOE編碼還原為指標(biāo)的實(shí)際值區(qū)間,得到指標(biāo)各分箱類別的Logistic評(píng)分。
采用上述方法,計(jì)算出各指標(biāo)的Logistic評(píng)分,然后匯總、整理,形成完整的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)分卡,如表4所示。評(píng)分卡將每個(gè)指標(biāo)的實(shí)際值劃分為三檔,評(píng)分時(shí),在基礎(chǔ)分上逐一加上每個(gè)評(píng)級(jí)指標(biāo)對(duì)應(yīng)的分檔得分(負(fù)分為減去),得到最終的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)分。結(jié)果分?jǐn)?shù)越高,代表該條供應(yīng)鏈的信用資質(zhì)越好,出現(xiàn)信用風(fēng)險(xiǎn)的概率越低?;贚ogistic回歸模型轉(zhuǎn)換和生成的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)分卡,不僅具有與原Logistic回歸模型一致的顯著性水平,而且具有很強(qiáng)的可解釋性和實(shí)際操作應(yīng)用價(jià)值,能夠使供應(yīng)鏈金融業(yè)務(wù)人員無須深入了解大數(shù)據(jù)建模原理,即可根據(jù)評(píng)分卡直接得出客戶的信用評(píng)分,以輔助授信決策和風(fēng)險(xiǎn)管理。
運(yùn)用上述Logistc評(píng)分卡,對(duì)122條供應(yīng)鏈的信用風(fēng)險(xiǎn)進(jìn)行評(píng)分,評(píng)分區(qū)間的頻數(shù)分布如圖2所示。從總體上看,汽車行業(yè)供應(yīng)鏈金融信用風(fēng)險(xiǎn)得分集中在[200,800]區(qū)間,其中[700,800]區(qū)間最多,而高于900分的情況較少。進(jìn)一步以一家供應(yīng)鏈核心企業(yè)——北汽福田汽車股份有限公司(A股,以下簡(jiǎn)稱福田汽車)為例,將福田汽車及其上游中小融資企業(yè)真實(shí)的原始數(shù)據(jù)代入Logistic評(píng)分卡模型,計(jì)算福田汽車上游中小融資企業(yè)的信用評(píng)分,結(jié)果如圖3所示。根據(jù)模型輸出結(jié)果,這10家供應(yīng)鏈上游融資企業(yè)的信用風(fēng)險(xiǎn)評(píng)分均屬于中上水平。其中評(píng)分最高的金力泰為福田汽車上游重要供應(yīng)商,從事汽車原廠涂料的生產(chǎn)和銷售,在垂直細(xì)分領(lǐng)域具有極強(qiáng)的競(jìng)爭(zhēng)力;評(píng)分最低的通合科技為新能源電動(dòng)汽車充電電源及配套設(shè)備供應(yīng)商,在創(chuàng)業(yè)板上市,尚未形成穩(wěn)定的盈利能力,但評(píng)分仍略高于基礎(chǔ)分,總體信用風(fēng)險(xiǎn)可控,若能抓住“雙碳”機(jī)遇,加大技術(shù)投入和產(chǎn)品研發(fā),仍具有廣闊的發(fā)展前景。
根據(jù)華政ESG評(píng)分,上述各家企業(yè)的信用評(píng)級(jí)均為BBB級(jí),與本文構(gòu)建的大數(shù)據(jù)供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型的評(píng)分結(jié)果較為吻合,但是本文模型的區(qū)分度更高,更加精準(zhǔn)地刻畫了汽車行業(yè)供應(yīng)鏈金融的信用風(fēng)險(xiǎn)狀況,即實(shí)現(xiàn)了信用等級(jí)的數(shù)字化。傳統(tǒng)風(fēng)險(xiǎn)評(píng)估模型的底層指標(biāo)篩選和建模邏輯大多采用德爾菲法、層次分析法等依賴專家經(jīng)驗(yàn)判斷的方法,指標(biāo)選擇、區(qū)間分級(jí)和權(quán)重確定存在一定的主觀性,評(píng)級(jí)結(jié)果以信用等級(jí)形成給出,精確度和可解釋性有限。而基于大數(shù)據(jù)技術(shù)建立的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型,不事先設(shè)定指標(biāo)區(qū)間和權(quán)重,通過數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)構(gòu)建和優(yōu)化評(píng)估體系,不僅能定量、客觀地預(yù)測(cè)違約概率,而且通過將模型轉(zhuǎn)換為L(zhǎng)ogistic評(píng)分卡,建立起原始指標(biāo)與評(píng)分結(jié)果間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)了信用等級(jí)數(shù)字化、可解釋的呈現(xiàn),能夠清晰獲知被評(píng)估對(duì)象的精確得分和每項(xiàng)指標(biāo)的特征分。
綜上,本文建立的Logistic回歸模型對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)的預(yù)測(cè)準(zhǔn)確率高,基于該模型構(gòu)建的評(píng)分卡方便業(yè)務(wù)人員操作應(yīng)用,且相較于傳統(tǒng)第三方評(píng)級(jí)機(jī)構(gòu)10個(gè)等級(jí)的信用評(píng)級(jí)結(jié)果,評(píng)分更加精確,也更具實(shí)用性和參考價(jià)值,能夠具體解釋和分析評(píng)分結(jié)果與指標(biāo)特征間的定量關(guān)系。
五、結(jié)論與建議
本文運(yùn)用大數(shù)據(jù)技術(shù)和人工智能建模思路,借助Python3.8軟件,對(duì)整車制造企業(yè)供應(yīng)鏈金融信用風(fēng)險(xiǎn)進(jìn)行測(cè)度,從“企查查”API數(shù)據(jù)接口和萬得數(shù)據(jù)庫挖掘相關(guān)數(shù)據(jù),將27家核心企業(yè)122條供應(yīng)鏈指標(biāo)數(shù)據(jù)分箱、WOE編碼和變量篩選,建立了涵蓋14個(gè)特征解釋變量的Logistic回歸模型,并運(yùn)用多種工具驗(yàn)證模型,生成了Logistic評(píng)分卡。實(shí)證檢驗(yàn)結(jié)果表明:本文最終確定的Logistic回歸模型對(duì)供應(yīng)鏈金融的信用風(fēng)險(xiǎn)區(qū)分能力較強(qiáng),預(yù)測(cè)準(zhǔn)確率能夠達(dá)到96.77%;基于上述模型構(gòu)建的Logistic評(píng)分卡將不同信用等級(jí)數(shù)字化,相較于已有的第三方信用評(píng)級(jí)工具更加具有大數(shù)據(jù)征信參考價(jià)值和實(shí)用性。因此,運(yùn)用大數(shù)據(jù)技術(shù)測(cè)度供應(yīng)鏈金融信用風(fēng)險(xiǎn)對(duì)提升供應(yīng)鏈融資風(fēng)險(xiǎn)管理水平具有重要的現(xiàn)實(shí)意義。
具體而言,根據(jù)構(gòu)建的大數(shù)據(jù)供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估模型回歸系數(shù)以及最終生成的供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)分卡,核心企業(yè)與中小融資企業(yè)自身的財(cái)務(wù)指標(biāo)和表現(xiàn),均會(huì)對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)產(chǎn)生顯著影響,主要結(jié)論如下:
其一,核心企業(yè)的經(jīng)營(yíng)狀況、盈利能力對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)有重要影響。在5%的顯著性水平下,核心企業(yè)的銷售成本率與供應(yīng)鏈金融違約概率成正相關(guān)關(guān)系;營(yíng)業(yè)利潤(rùn)率與供應(yīng)鏈金融違約概率成負(fù)相關(guān)關(guān)系。(1)銷售成本率指標(biāo)刻畫核心企業(yè)經(jīng)營(yíng)過程中的成本費(fèi)用控制能力,核心企業(yè)成本費(fèi)用控制能力越強(qiáng),銷售成本率越低,信用評(píng)分越高,供應(yīng)鏈金融違約的概率越小。(2)營(yíng)業(yè)利潤(rùn)率刻畫核心企業(yè)的盈利能力和發(fā)展前景,核心企業(yè)營(yíng)業(yè)利潤(rùn)率越高,盈利能力越強(qiáng),發(fā)展前景就越好,整條供應(yīng)鏈的信用評(píng)分就越高,越能帶來更多的融資便利,違約風(fēng)險(xiǎn)就越低。
其二,反映供應(yīng)鏈上下游中小融資企業(yè)的償債能力、盈利能力和運(yùn)營(yíng)效率的財(cái)務(wù)指標(biāo)對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)的影響均較大。(1)在5%的顯著性水平下,中小融資企業(yè)的資產(chǎn)負(fù)債率與供應(yīng)鏈金融信用風(fēng)險(xiǎn)成正相關(guān)關(guān)系。資產(chǎn)負(fù)債率是綜合反映企業(yè)償債能力的重要指標(biāo),資產(chǎn)負(fù)債率越高,企業(yè)債務(wù)負(fù)擔(dān)越重,信用評(píng)分就越低,債務(wù)違約概率就越大。(2)在5%的顯著性水平下,中小融資企業(yè)的營(yíng)業(yè)利潤(rùn)率、總資產(chǎn)增長(zhǎng)率與供應(yīng)鏈金融違約概率成負(fù)相關(guān)關(guān)系。其中,營(yíng)業(yè)利潤(rùn)率衡量中小融資企業(yè)的盈利能力,該指標(biāo)越大,表明企業(yè)的盈利能力越強(qiáng),從而保障企業(yè)還款付息,信用評(píng)分就越高,供應(yīng)鏈金融鏈條的違約風(fēng)險(xiǎn)也就越小;總資產(chǎn)增長(zhǎng)率反映了中小融資企業(yè)的增長(zhǎng)潛力,資產(chǎn)增長(zhǎng)越快,相應(yīng)的評(píng)分就越高,信用風(fēng)險(xiǎn)越低。(3)在5%的顯著性水平下,中小融資企業(yè)的應(yīng)收賬款周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率均與供應(yīng)鏈融資違約概率成負(fù)相關(guān)關(guān)系。周轉(zhuǎn)率指標(biāo)衡量企業(yè)的運(yùn)營(yíng)效率和資產(chǎn)的流動(dòng)性,上述指標(biāo)越大,表明企業(yè)的運(yùn)營(yíng)效率越高,資產(chǎn)變現(xiàn)能力越強(qiáng),相應(yīng)的信用評(píng)分就越高,供應(yīng)鏈融資違約概率就越小。
結(jié)合以上實(shí)證研究結(jié)論,可以從大數(shù)據(jù)技術(shù)賦能供應(yīng)鏈金融信用風(fēng)險(xiǎn)評(píng)估和治理的角度提出以下建議:第一,供應(yīng)鏈上的核心企業(yè)和中小融資企業(yè)要運(yùn)用大數(shù)據(jù)等新一代信息技術(shù)提高財(cái)務(wù)管理水平和信用風(fēng)險(xiǎn)治理能力,從而提升供應(yīng)鏈金融質(zhì)效和整條供應(yīng)鏈的財(cái)務(wù)健康度。根據(jù)實(shí)證檢驗(yàn)結(jié)果,供應(yīng)鏈上的核心企業(yè)與中小融資企業(yè)具有密切的信用聯(lián)系,兩者的財(cái)務(wù)指標(biāo)和經(jīng)營(yíng)狀況均會(huì)對(duì)供應(yīng)鏈金融信用風(fēng)險(xiǎn)產(chǎn)生顯著影響。在數(shù)字化時(shí)代,要運(yùn)用大數(shù)據(jù)、人工智能等新一代信息技術(shù),精準(zhǔn)評(píng)估供應(yīng)鏈信用風(fēng)險(xiǎn),同時(shí)引導(dǎo)核心企業(yè)和上下游中小融資企業(yè)加大技術(shù)投入,推進(jìn)企業(yè)智能化改造和數(shù)字化轉(zhuǎn)型,改進(jìn)財(cái)務(wù)管理,降低運(yùn)營(yíng)成本,提升財(cái)務(wù)績(jī)效和風(fēng)控能力,從而獲得更高的信用評(píng)分,提升供應(yīng)鏈融資可獲得性,滿足核心企業(yè)和中小融資企業(yè)的各類金融服務(wù)需求,提高整條供應(yīng)鏈的財(cái)務(wù)健康度和協(xié)同運(yùn)營(yíng)績(jī)效,實(shí)現(xiàn)可持續(xù)發(fā)展。第二,構(gòu)建供應(yīng)鏈數(shù)據(jù)化生態(tài)圈,實(shí)現(xiàn)供應(yīng)鏈上核心企業(yè)、上下游中小融資企業(yè)的融資交易流程透明化。傳統(tǒng)供應(yīng)鏈金融的相關(guān)利益方主體存在信息不對(duì)稱現(xiàn)象,運(yùn)用大數(shù)據(jù)、區(qū)塊鏈等技術(shù)構(gòu)建供應(yīng)鏈數(shù)據(jù)化生態(tài)圈,能夠使得供應(yīng)鏈各主體的運(yùn)營(yíng)和金融活動(dòng)中所發(fā)生的數(shù)據(jù)和信息均被不可篡改地完整記錄在平臺(tái)上,實(shí)現(xiàn)信息流、資金流、物聯(lián)和商流的全程可追溯,金融機(jī)構(gòu)、大數(shù)據(jù)征信機(jī)構(gòu)等相關(guān)主體經(jīng)授權(quán)可隨時(shí)查詢數(shù)據(jù),采集動(dòng)態(tài)、可信的各類供應(yīng)鏈企業(yè)財(cái)務(wù)指標(biāo)與全周期貿(mào)易信息,從而為全面、準(zhǔn)確評(píng)估供應(yīng)鏈金融信用風(fēng)險(xiǎn)奠定基礎(chǔ),在有效識(shí)別、評(píng)估和管控信用風(fēng)險(xiǎn)的前提下,拓展數(shù)字供應(yīng)鏈金融新生態(tài),賦能供應(yīng)鏈健康發(fā)展。
參考文獻(xiàn):
[1]付瑋瓊.核心企業(yè)主導(dǎo)的供應(yīng)鏈金融模式風(fēng)險(xiǎn)機(jī)理研究 [J].企業(yè)經(jīng)濟(jì),2020,39(01).
[2]曹允春,林浩楠,李彤.供應(yīng)鏈金融創(chuàng)新發(fā)展下的風(fēng)險(xiǎn)變化及防控措施 [J].南方金融,2020,(04).
[3]趙成國(guó),江文歆.金融生態(tài)視角下供應(yīng)鏈金融風(fēng)險(xiǎn)管理體系構(gòu)建 [J].財(cái)會(huì)通訊,2021,(06).
[4]周雷,鄧雨,張語嫣.區(qū)塊鏈賦能下供應(yīng)鏈金融服務(wù)小微企業(yè)融資博弈分析 [J].金融理論與實(shí)踐,2021,(09).
[5]張瑜,廖長(zhǎng)勇,王新軍.基于分層模型的銀行客戶信用風(fēng)險(xiǎn)預(yù)測(cè)研究 [J].金融發(fā)展研究,2021,(10).
[6]Tian Z,Hassan A F S,Razak N H A. 2019. Big Data and SME financing in China [J].Journal of Physics: Conference Series,1018(1).
[7]余得生,李星.供應(yīng)鏈金融模式下的中小企業(yè)信用風(fēng)險(xiǎn)評(píng)估:以電子制造業(yè)為例 [J].征信,2019,(10).
[8]周茜,謝雪梅,張哲.供應(yīng)鏈金融下科技型小微企業(yè)信用風(fēng)險(xiǎn)測(cè)度與管控分析:基于免疫理論 [J].企業(yè)經(jīng)濟(jì),2019,(08).
[9]孫中葉,徐曉燕.農(nóng)業(yè)供應(yīng)鏈金融風(fēng)險(xiǎn)評(píng)估研究:基于GA-BP神經(jīng)網(wǎng)絡(luò)模型 [J].技術(shù)經(jīng)濟(jì)與管理研究,2021,(08).
[10]李健,張金林.供應(yīng)鏈金融的信用風(fēng)險(xiǎn)識(shí)別及預(yù)警模型研究 [J].經(jīng)濟(jì)管理,2019,41(08).
[11]胡海青,陳迪,張丹,張瑯.基于Copula的供應(yīng)鏈金融質(zhì)物組合價(jià)格風(fēng)險(xiǎn)測(cè)度研究 [J].運(yùn)籌與管理,2020,29(03).
An Empirical Study on Credit Risk Assessment in Supply Chain Finance Based on Big Data
—— Taking the Vehicle Manufacturing Industry as the Example
Zhou Lei1,3/Qiu Xun2/Zhu Yi1/Mao Xiaofei3
(1. School of Business,Suzhou Vocational University,Suzhou? ?215104,China;
2. School of Financial Management,Zhejiang Financial College,Hangzhou? ?310018,Zhejiang,China;
3. School of Economics and Management,Southeast University,Nanjing? ?211189,Jiangsu,China)
Abstract:By combining the cutting-edge big data credit technology with the scorecard method,the credit risk of supply chain finance is measured by taking the whole vehicle manufacturing industry supply chains as the scenario. Firstly,with the help of Python,relevant data is obtained from the "Qichacha" API and Wind database,data mining,WOE coding and variable screening were carried out for the indicator system with multi-dimensional indicators of 122 supply chains contained 27 core enterprises. Then,by using big data and AI modeling technologies,a logistic regression model covering 14 characteristic explanatory variables is established,and multiple tools are used to train and improve the model to form a logistic scorecard that can be used in practice. After empirical testing,the finalized credit assessment model has strong differentiation ability and can reach 96.77% risk prediction accuracy. The logistic scorecard based on big data digitizes the supply chain credit rating,which is more practical compared to the traditional credit rating,so the use of big data is of great value to improve the credit risk assessment and management of supply chain finance.
Key Words:supply chain finance,credit risk,logistic scorecard,AI
Abstract:By combining the cutting-edge big data credit technology with the scorecard method,the credit risk of supply chain finance is measured by taking the whole vehicle manufacturing industry supply chains as the scenario. Firstly,with the help of Python,relevant data is obtained from the "Qichacha" API and Wind database,data mining,WOE coding and variable screening were carried out for the indicator system with multi-dimensional indicators of 122 supply chains contained 27 core enterprises. Then,by using big data and AI modeling technologies,a logistic regression model covering 14 characteristic explanatory variables is established,and multiple tools are used to train and improve the model to form a logistic scorecard that can be used in practice. After empirical testing,the finalized credit assessment model has strong differentiation ability and can reach 96.77% risk prediction accuracy. The logistic scorecard based on big data digitizes the supply chain credit rating,which is more practical compared to the traditional credit rating,so the use of big data is of great value to improve the credit risk assessment and management of supply chain finance.
Key Words:supply chain finance,credit risk,logistic scorecard,AI
收稿日期:2022-01-09? ? ? 修回日期:2022-02-10
基金項(xiàng)目:江蘇高校哲學(xué)社會(huì)科學(xué)研究基金項(xiàng)目“數(shù)字經(jīng)濟(jì)時(shí)代金融科技服務(wù)實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展研究”(2022SJA1415);浙江省高??蒲匈Y助項(xiàng)目“金融本質(zhì)視角下的區(qū)塊鏈金融風(fēng)險(xiǎn)監(jiān)管研究”(Y201941951)。
作者簡(jiǎn)介:周雷,男,江蘇蘇州人,蘇州市職業(yè)大學(xué)講師、研究員,東南大學(xué)SRTP項(xiàng)目指導(dǎo)教師,研究方向?yàn)榻鹑诳萍?邱勛,男,江西于都人,浙江金融職業(yè)學(xué)院副教授,研究方向?yàn)榻鹑诳萍?朱奕,女,江蘇蘇州人,蘇州市職業(yè)大學(xué)商學(xué)院,研究方向?yàn)榻鹑诳萍?毛曉飛,女,江蘇鎮(zhèn)江人,東南大學(xué)經(jīng)濟(jì)管理學(xué)院,研究方向?yàn)楣?yīng)鏈金融。