• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機(jī)器學(xué)習(xí)視角下 商業(yè)銀行客戶信用風(fēng)險(xiǎn)評(píng)估研究

      2022-02-28 22:34:13顧洲一胡麗娟
      金融發(fā)展研究 2022年1期
      關(guān)鍵詞:信貸風(fēng)險(xiǎn)機(jī)器學(xué)習(xí)

      顧洲一 胡麗娟

      摘? ?要:有效把控信貸風(fēng)險(xiǎn)是商業(yè)銀行穩(wěn)健運(yùn)行的關(guān)鍵環(huán)節(jié)。本文從商業(yè)銀行客戶信貸數(shù)據(jù)出發(fā),運(yùn)用非平衡樣本處理算法使少數(shù)類樣本信息得到平衡,并通過(guò)機(jī)器學(xué)習(xí)分類器挖掘影響客戶違約的重要風(fēng)險(xiǎn)因子,最后構(gòu)建Logistic模型計(jì)算違約概率。研究發(fā)現(xiàn):第一,客戶忠誠(chéng)度是重要因子,忠誠(chéng)度越高,客戶違約概率越低;第二,客戶歷史信貸數(shù)據(jù)價(jià)值高,是事前風(fēng)險(xiǎn)控制中的重要參考依據(jù);第三,信貸合同特征是影響客戶違約的另一重要維度,包括合同期限和合同利率。研究結(jié)論可以為銀行授信、風(fēng)險(xiǎn)預(yù)警和防范違約風(fēng)險(xiǎn)提供理論參考和實(shí)踐指導(dǎo)。

      關(guān)鍵詞:信貸風(fēng)險(xiǎn);非平衡處理;機(jī)器學(xué)習(xí);Logistic模型

      中圖分類號(hào):F830.5? ?文獻(xiàn)標(biāo)識(shí)碼:B? 文章編號(hào):1674-2265(2022)01-0079-06

      DOI:10.19647/j.cnki.37-1462/f.2022.01.010

      一、引言

      隨著全球經(jīng)濟(jì)一體化步伐加快以及區(qū)塊鏈、人工智能等信息技術(shù)的快速發(fā)展,經(jīng)濟(jì)金融環(huán)境日益復(fù)雜多變,金融衍生品種類日益增多,金融機(jī)構(gòu)面臨著更多的風(fēng)險(xiǎn)挑戰(zhàn)。銀行業(yè)作為金融業(yè)的重要組成部分,在我國(guó)經(jīng)濟(jì)和社會(huì)發(fā)展過(guò)程中不僅承擔(dān)著吸收存款、發(fā)放貸款等基本職責(zé),還要發(fā)揮正確引導(dǎo)貨幣流向、提高資金使用效率以及調(diào)節(jié)社會(huì)資金需求量等作用,成為國(guó)民經(jīng)濟(jì)發(fā)展中的關(guān)鍵因素。因此,銀行體系的平穩(wěn)運(yùn)行是一國(guó)經(jīng)濟(jì)穩(wěn)定發(fā)展的有力保障。

      《巴塞爾新資本協(xié)議》將商業(yè)銀行面臨的風(fēng)險(xiǎn)分為8大類,例如市場(chǎng)風(fēng)險(xiǎn)、流動(dòng)性風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)和操作風(fēng)險(xiǎn)等,其中信用風(fēng)險(xiǎn)是最為主要的風(fēng)險(xiǎn)之一。傳統(tǒng)觀點(diǎn)認(rèn)為商業(yè)銀行信用風(fēng)險(xiǎn)來(lái)自信貸業(yè)務(wù)所引起的違約風(fēng)險(xiǎn),但是伴隨著金融產(chǎn)品迭代創(chuàng)新以及風(fēng)險(xiǎn)環(huán)境日益變化,現(xiàn)代意義上的商業(yè)銀行信用風(fēng)險(xiǎn)范疇已有所改變,還包括由于債務(wù)人信用狀況和履約能力變化導(dǎo)致商業(yè)銀行資產(chǎn)價(jià)值變動(dòng)進(jìn)而遭受損失的風(fēng)險(xiǎn)。

      近年來(lái),我國(guó)經(jīng)濟(jì)下行壓力加大,作為金融體系核心的商業(yè)銀行面臨的信用風(fēng)險(xiǎn)也在逐漸擴(kuò)大。截至2020年末,國(guó)內(nèi)銀行業(yè)不良貸款余額已達(dá)3.5萬(wàn)億元,不良貸款率為1.92%,不良貸款余額較上年末增加2816億元,不良貸款率較上年末下降0.06個(gè)百分點(diǎn)??茖W(xué)客觀地評(píng)估銀行業(yè)信用風(fēng)險(xiǎn)對(duì)商業(yè)銀行管理以及實(shí)體經(jīng)濟(jì)發(fā)展有著舉足輕重的作用。

      傳統(tǒng)商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估主要依靠商業(yè)銀行從業(yè)人員的主觀經(jīng)驗(yàn)判斷,即通過(guò)線下收集客戶年齡、職業(yè)、歷史違約記錄等個(gè)人信息進(jìn)行人為風(fēng)險(xiǎn)把控,但是這類方式往往存在效率低、準(zhǔn)確率難以保障等缺點(diǎn)。近年來(lái),隨著數(shù)據(jù)量的爆發(fā)式增長(zhǎng),傳統(tǒng)人為風(fēng)控制度已無(wú)法滿足當(dāng)下銀行業(yè)信貸業(yè)務(wù)發(fā)展需要,利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)風(fēng)控成為新的趨勢(shì)。其核心思想是基于海量銀行客戶行為數(shù)據(jù),利用大數(shù)據(jù)技術(shù)挖掘數(shù)據(jù)背后的價(jià)值,實(shí)現(xiàn)信用風(fēng)險(xiǎn)評(píng)估。因此,在大數(shù)據(jù)風(fēng)控體系下如何借鑒已有成熟的信息技術(shù),并依托商業(yè)銀行現(xiàn)有的海量客戶數(shù)據(jù),實(shí)現(xiàn)精準(zhǔn)風(fēng)險(xiǎn)預(yù)測(cè),是值得進(jìn)一步深入研究的問(wèn)題。

      二、文獻(xiàn)綜述

      (一)關(guān)于商業(yè)銀行信用風(fēng)險(xiǎn)影響因子研究

      商業(yè)銀行信用風(fēng)險(xiǎn)影響因子的研究分為宏觀因素和微觀因素。宏觀上,Salas和Saurina(2002)[1]研究發(fā)現(xiàn),宏觀經(jīng)濟(jì)政策變動(dòng)會(huì)對(duì)商業(yè)銀行客戶的不良貸款率產(chǎn)生影響。謝太峰等(2020)[2]從總資產(chǎn)規(guī)模、通貨膨脹率、GDP增長(zhǎng)率等方面來(lái)分析它們對(duì)商業(yè)銀行信用風(fēng)險(xiǎn)所產(chǎn)生的影響。微觀上,Copestake(2007)[3]指出客戶的年齡、性別等基本特征最終會(huì)影響到用戶的信用記錄。吳金旺和顧洲一(2018)[4]利用隨機(jī)森林方法篩選出5個(gè)重要的因子,均與用戶歷史信貸信息有關(guān)。

      (二)關(guān)于商業(yè)銀行客戶信用風(fēng)險(xiǎn)預(yù)警模型研究

      商業(yè)銀行客戶信用風(fēng)險(xiǎn)預(yù)警模型的研究大致可分為三個(gè)階段。第一階段是經(jīng)驗(yàn)判斷時(shí)期,以指標(biāo)體系為構(gòu)建基礎(chǔ),通過(guò)行業(yè)專家對(duì)客戶進(jìn)行信用風(fēng)險(xiǎn)評(píng)分實(shí)現(xiàn)預(yù)警效果。Sowers和David(1942)[5]最早構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo),利用經(jīng)驗(yàn)判斷和專家打分,對(duì)個(gè)人風(fēng)險(xiǎn)級(jí)別作出判斷。之后,“5C”“5W”以及“5P”等要素分析法被廣泛應(yīng)用于個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)研究,但是這些方法主要以定性為主,主觀因素較強(qiáng)。第二階段為計(jì)量分析時(shí)期,開(kāi)始應(yīng)用計(jì)量分析模型解決個(gè)人信用風(fēng)險(xiǎn)問(wèn)題。線性回歸模型是最早被應(yīng)用于個(gè)人信用風(fēng)險(xiǎn)評(píng)估的模型之一,Orgler(1970)[6]從借款人個(gè)人信息維度選取解釋變量,通過(guò)構(gòu)建線性回歸模型來(lái)對(duì)借款人的信用風(fēng)險(xiǎn)進(jìn)行評(píng)估。Wiginton(1980)[7]最早在線性回歸的基礎(chǔ)上引入Logistic模型進(jìn)行實(shí)證分析。李萌(2005)[8]以不良貸款率作為信用風(fēng)險(xiǎn)衡量標(biāo)準(zhǔn),構(gòu)建Logistic模型,進(jìn)而證明Logistic模型具有可信的識(shí)別、預(yù)測(cè)及推廣能力。方匡南等(2014)[9]將Lasso和Logistic模型相結(jié)合,構(gòu)建個(gè)人信用風(fēng)險(xiǎn)評(píng)估模型,顯著提升了基礎(chǔ)模型的估計(jì)精度。另外,還有學(xué)者將判別分析、主成分分析等統(tǒng)計(jì)方法應(yīng)用于客戶信用風(fēng)險(xiǎn)研究。第三階段為人工智能時(shí)期,以人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等應(yīng)用最為廣泛。Bekht和Eletter(2014)[10]采用人工神經(jīng)網(wǎng)絡(luò)方法為約旦商業(yè)銀行貸款決策提供技術(shù)支持,并證實(shí)該方法能夠有效改善信貸決策效率,幫助金融機(jī)構(gòu)降低評(píng)估成本。姚瀟和余樂(lè)安(2012)[11]將模糊隸屬度引入支持向量機(jī),顯著提高了信用風(fēng)險(xiǎn)分類精度。Cano(2017)[12]利用隨機(jī)森林算法對(duì)不同數(shù)據(jù)集作特征選擇,并用其選出的重要因子進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè),結(jié)果顯示隨機(jī)森林方法較人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)更有優(yōu)勢(shì)。吳金旺和顧洲一(2018)[4]利用隨機(jī)森林算法對(duì)平衡后的數(shù)據(jù)集做重要變量篩選,并利用Logistic模型作預(yù)測(cè),預(yù)測(cè)效果顯著。方匡南等(2010)[13]將改進(jìn)后的非參數(shù)隨機(jī)森林算法用于信用卡違約風(fēng)險(xiǎn)識(shí)別,并發(fā)現(xiàn)該算法比支持向量機(jī)、單一決策樹(shù)以及Logistic回歸有更高的準(zhǔn)確率。周永圣等(2020)[14]利用改進(jìn)的隨機(jī)森林算法應(yīng)用于德國(guó)信用數(shù)據(jù)集,驗(yàn)證了隨機(jī)森林類模型的可行性和優(yōu)越性。

      綜上,隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)呈現(xiàn)爆發(fā)式增長(zhǎng),微觀視角的用戶數(shù)據(jù)呈現(xiàn)標(biāo)簽多、類型復(fù)雜且價(jià)值高等特征。而受人工智能、機(jī)器學(xué)習(xí)等信息技術(shù)影響,信用風(fēng)險(xiǎn)預(yù)警方法存在較大的拓展空間。本文從商業(yè)銀行客戶數(shù)據(jù)出發(fā),運(yùn)用非平衡樣本處理算法使少數(shù)類樣本信息得到平衡,并通過(guò)多種機(jī)器學(xué)習(xí)分類器挖掘影響客戶違約的重要風(fēng)險(xiǎn)因子來(lái)提升模型預(yù)測(cè)效果,最后構(gòu)建Logistic模型計(jì)算違約概率。根據(jù)模型研究結(jié)論,完善信用風(fēng)險(xiǎn)評(píng)估機(jī)制,為銀行授信、風(fēng)險(xiǎn)預(yù)警和防范違約風(fēng)險(xiǎn)提供理論參考和實(shí)踐指導(dǎo)。

      三、數(shù)據(jù)來(lái)源及分析

      (一)數(shù)據(jù)來(lái)源及變量介紹

      客戶樣本數(shù)據(jù)集來(lái)源于國(guó)內(nèi)某商業(yè)銀行A,共計(jì)15000份,剔除無(wú)效客戶數(shù)據(jù),最終得到有效數(shù)據(jù)集14073份。數(shù)據(jù)集包括客戶年齡、服務(wù)年數(shù)、貴賓卡客戶、網(wǎng)銀客戶等20個(gè)變量。其中,[X1,X2,…,X19]為解釋變量,即客戶特征信息;[Y]為被解釋變量,即客戶最終是否違約的情況。具體見(jiàn)表1。

      (二)相關(guān)分析

      計(jì)算發(fā)現(xiàn),各變量之間相關(guān)關(guān)系并不顯著。同時(shí),由于篇幅限制,本文選擇個(gè)別變量作相關(guān)關(guān)系矩陣熱力圖(見(jiàn)圖1)。圖1中解釋變量與被解釋變量的相關(guān)性很低,相關(guān)系數(shù)絕對(duì)值最大不超過(guò)7%,間接說(shuō)明傳統(tǒng)模型的建模效果可能欠佳。解釋變量之間的弱相關(guān)也表明不存在顯著的共線性問(wèn)題。

      四、商業(yè)銀行客戶信用風(fēng)險(xiǎn)評(píng)估研究

      (一)非平衡樣本處理

      本文共收集有效樣本數(shù)據(jù)14073份。其中,違約客戶數(shù)目為200個(gè),僅占客戶數(shù)據(jù)的1.42%;而未違約客戶數(shù)目有13873個(gè),占總樣本數(shù)據(jù)98.58%。顯然,兩者之間的比例存在較大差異,屬于非平衡數(shù)據(jù)集。在傳統(tǒng)處理數(shù)據(jù)的方法中,大多數(shù)方法都會(huì)更傾向于數(shù)據(jù)量較大的那一部分,從而忽略了數(shù)據(jù)量較少的部分,最終導(dǎo)致整體方法性能下降。因此,在對(duì)訓(xùn)練集生成分類器之前,需要做非平衡數(shù)據(jù)處理。

      過(guò)采樣(Over-sampling)是在不損失原有信息情況下,對(duì)少數(shù)類樣本集中進(jìn)行隨機(jī)抽樣復(fù)制,讓整體樣本比例保持平衡的方法。欠采樣(Under-sampling)是通過(guò)隨機(jī)概率刪除多數(shù)類樣本,以達(dá)到兩類數(shù)據(jù)集比例平衡的目的。人工合成(SMOTE)方法的基本思想是通過(guò)在少數(shù)類樣本與其鄰近樣本間插入新樣本以平衡原數(shù)據(jù)集。表2分別展示了過(guò)采樣、欠采樣、過(guò)采樣與欠采樣混合以及人工合成這4種方法對(duì)訓(xùn)練集進(jìn)行了非平衡數(shù)據(jù)處理生成的結(jié)果,其中訓(xùn)練集數(shù)據(jù)是在原有數(shù)據(jù)集中進(jìn)行簡(jiǎn)單隨機(jī)抽樣產(chǎn)生的,抽樣比例為原數(shù)據(jù)集的75%。

      (二)性能分析

      在數(shù)據(jù)挖掘技術(shù)中,分類模型(Classifier)的種類眾多,可以將其分為單一方法和組合方法。單一分類方法主要包括:K-近鄰、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)等;而組合分類方法有Bagging和Boosting。本文將從這兩大類方法中選取6種分類算法,以客戶是否違約作為二分類響應(yīng)變量,根據(jù)表2中四種不同非平衡數(shù)據(jù)處理方法生成的4個(gè)數(shù)據(jù)集,分別使用CART、C4.5、隨機(jī)森林、SVM、Adaboost和Bagging模型,并以敏感度、特異度、正負(fù)例命中率、準(zhǔn)確率、AUC曲線等6種指標(biāo)作為調(diào)節(jié)參數(shù),以此來(lái)評(píng)價(jià)不同算法下的分類器性能。

      基于同種非平衡數(shù)據(jù)處理方法,不同分類器得出的指標(biāo)并不相同,具體見(jiàn)表3。隨機(jī)森林的各項(xiàng)指標(biāo)是分類器中整體表現(xiàn)最好的,Adaboost次之,而CART分類效果相對(duì)較差。計(jì)算發(fā)現(xiàn),幾乎每個(gè)分類器的負(fù)例命中率均等于或接近于1,說(shuō)明不同分類器對(duì)于未違約的識(shí)別準(zhǔn)確率較高,而與其對(duì)應(yīng)的正例命中率差異較大,其他指標(biāo)也出現(xiàn)了不同程度的差異?;谕粋€(gè)分類器模型,不同的非平衡樣本處理方式也會(huì)造成分類表現(xiàn)的不同。欠采樣這一方法對(duì)于該數(shù)據(jù)集呈現(xiàn)的效果十分弱,正例命中率較低,過(guò)采樣與欠采樣混合的方法也隨之受影響,部分分類器效果不算明顯。而過(guò)采樣和人工合成兩種方法的敏感度、特異度、準(zhǔn)確率等指標(biāo)都較高,正例命中率在大部分分類器中也有較高的分?jǐn)?shù),說(shuō)明這兩種方法在處理非平衡數(shù)據(jù)時(shí)起到了較好的作用,適合本數(shù)據(jù)集。

      綜上所述,隨機(jī)森林分類算法在過(guò)采樣、過(guò)采樣與欠采樣混合、人工合成處理后評(píng)價(jià)指標(biāo)差異不大,相對(duì)于其他分類器具有較大優(yōu)勢(shì),敏感度、特異度、負(fù)例命中率、準(zhǔn)確率達(dá)到了100%,正例命中率均達(dá)到了90%以上,由此證明了該模型具有優(yōu)秀的性能。而CART、SVM這兩類模型與隨機(jī)森林相比性能相對(duì)較弱且不穩(wěn)定。C4.5、Adaboost和Bagging的整體評(píng)價(jià)相較于CART和SVM相對(duì)較好,在幾類評(píng)價(jià)指標(biāo)中展現(xiàn)了模型性能的優(yōu)勢(shì)。因此,基于此,本文對(duì)隨機(jī)森林、C4.5、Adaboost和Bagging四類分類器進(jìn)行詳細(xì)比較。

      在過(guò)采樣中,隨機(jī)森林、Adaboost和Bagging除正例命中率不同之外,其余指標(biāo)均相同,且隨機(jī)森林的正例命中率是三者中最高的;在過(guò)采樣與欠采樣混合方法中,隨機(jī)森林的正例命中率遠(yuǎn)遠(yuǎn)大于另外兩種模型,其他指標(biāo)也有較小優(yōu)勢(shì);在人工合成算法中,評(píng)價(jià)指標(biāo)效果與混合采樣類似,隨機(jī)森林的正例命中率大于另外兩種模型,負(fù)例命中率相同,其他指標(biāo)也是隨機(jī)森林較為領(lǐng)先。

      由前文分析可知,隨機(jī)森林算法在處理樣本數(shù)據(jù)集時(shí)性能相較于其他分類算法是最佳的。因此,本文在隨機(jī)森林算法的前提下對(duì)欠采樣、過(guò)采樣與欠采樣混合、人工合成三種方法的ROC曲線和AUC值做進(jìn)一步比較。ROC曲線越靠近左上角、AUC值越高說(shuō)明該模型的分類性能越好。結(jié)合圖2可知,在訓(xùn)練集三種數(shù)據(jù)處理方式得到的AUC值分別為0.999、0.999、0.983,差距甚微,其ROC曲線也都十分靠近左上角并無(wú)太大差別。本文用同樣的方法測(cè)試集進(jìn)行了運(yùn)算,得到的AUC值分別為0.518、0.518、0.648。相對(duì)于前兩種方法,人工合成算法的ROCA曲線較靠近左上角,AUC值也大于前兩種。因此,本文對(duì)于非平衡數(shù)據(jù)處理采用人工合成算法,分類算法采用隨機(jī)森林算法。

      (三)重要節(jié)點(diǎn)分析

      經(jīng)過(guò)非平衡樣本處理后,隨機(jī)森林在所有分類器中表現(xiàn)出較優(yōu)的性能,能顯著降低客戶違約的誤判率。因此,為了進(jìn)一步探究影響客戶違約的重要因子,對(duì)表現(xiàn)性能較優(yōu)的分類器節(jié)點(diǎn)進(jìn)行重要度排序。表4為經(jīng)過(guò)過(guò)采樣,過(guò)采樣與欠采樣混合、人工合成處理后,排名前10的重要性節(jié)點(diǎn)。通過(guò)比較發(fā)現(xiàn),貸記卡額度占用率、貸款日前6個(gè)月存款日均金額、貸記卡最近6個(gè)月平均使用額度、貸款最近6個(gè)月平均應(yīng)還款、我行服務(wù)年數(shù)、合同期限以及合同利率為三種平衡處理后的共性重要因子。

      (四)個(gè)人信貸風(fēng)險(xiǎn)評(píng)估的Logistic模型

      基于上一節(jié)重要因子結(jié)果,將7個(gè)重要因子作為解釋變量,客戶違約情況作為被解釋變量,構(gòu)建二分類Logistic模型,并采用逐步回歸法對(duì)模型進(jìn)行優(yōu)化。顯然,自變量系數(shù)均在5%顯著性水平上通過(guò)檢驗(yàn),一定程度上說(shuō)明逐步回歸后的6個(gè)重要變量對(duì)模型有一定解釋能力。

      由表5可得Logistic模型為:

      [LnP1-P=-2.88-0.16X2-0.57X9+0.05X11-0.07X12+0.92X14+0.06X18]

      其中P表示為客戶違約的概率。

      研究發(fā)現(xiàn):第一,客戶在A行服務(wù)年數(shù)越高,則其發(fā)生違約的概率就越低。第二,客戶貸款日前6個(gè)月存款日均金額越高,則該客戶發(fā)生違約概率越低。顯然,客戶在貸款日前6個(gè)月存款日均金額越高,說(shuō)明客戶具有一定的經(jīng)濟(jì)基礎(chǔ)和抗風(fēng)險(xiǎn)能力,能夠有效降低信用風(fēng)險(xiǎn)發(fā)生率。第三,客戶與銀行簽訂的貸款合同利率越高,則其發(fā)生違約概率就越高,這可能由于現(xiàn)實(shí)生活中大量貸款客戶所選擇的貸款利率超出其自身承載能力,一旦資金方面出現(xiàn)問(wèn)題,那么償還的壓力就會(huì)變大,最終導(dǎo)致違約事件發(fā)生。第四,通常情況下,一個(gè)較長(zhǎng)的還款時(shí)間可能會(huì)降低用戶在短期內(nèi)的貸款壓力??蛻艉贤谙拊介L(zhǎng),則其發(fā)生違約概率就越低。第五,客戶貸記卡最近6個(gè)月平均使用額度越高,則其發(fā)生違約的概率就越高。客戶名下貸記卡近6個(gè)月平均使用額度如果過(guò)高,或者與普通群體的均值有著顯著差別,那么說(shuō)明這個(gè)客戶的開(kāi)支具有不合理性,此時(shí)該客戶的資金風(fēng)險(xiǎn)也在加劇,一旦某一個(gè)資金環(huán)節(jié)出現(xiàn)問(wèn)題,則會(huì)導(dǎo)致違約現(xiàn)象的出現(xiàn)。第六,客戶貸款最近6個(gè)月平均應(yīng)還款越高,則其發(fā)生違約概率越高。客戶貸款最近6個(gè)月平均應(yīng)還款增加,客戶還款壓力就會(huì)變大,發(fā)生違約情況的概率隨之也會(huì)增加。

      五、結(jié)論與建議

      本研究主要工作是基于國(guó)內(nèi)A商業(yè)銀行客戶信貸數(shù)據(jù),利用非平衡樣本處理算法,并借助機(jī)器學(xué)習(xí)技術(shù)分析影響客戶違約的重要因子,最后構(gòu)建Logistic模型計(jì)算客戶違約概率。本文的主要貢獻(xiàn)在于填補(bǔ)了當(dāng)前機(jī)器學(xué)習(xí)視角下信用風(fēng)險(xiǎn)評(píng)估研究的不足,拓展了關(guān)于銀行授信、風(fēng)控等領(lǐng)域的理論研究。

      研究發(fā)現(xiàn):(1)借款人年齡、借款人業(yè)務(wù)類型(貴賓客戶、網(wǎng)銀客戶以及理財(cái)客戶)等客戶基本信息并不是客戶違約過(guò)程中的關(guān)鍵因素。但是,客戶基本信息中的忠誠(chéng)度(A行服務(wù)年數(shù))占據(jù)主導(dǎo)地位。模型結(jié)果表明,客戶在A行的服務(wù)年數(shù)越高,即客戶忠誠(chéng)度越高,則客戶違約的概率越低。因此,加強(qiáng)客戶忠誠(chéng)度管理,提高客戶留存率及留存時(shí)間,有益于優(yōu)化風(fēng)控機(jī)制。(2)客戶歷史信貸數(shù)據(jù)是相關(guān)銀行從業(yè)人員做好事前風(fēng)險(xiǎn)把控的重要參考依據(jù)。貸款日前6個(gè)月存款日均金額、貸記卡最近6個(gè)月平均使用額度以及貸款最近6個(gè)月平均應(yīng)還款是該維度下利用機(jī)器學(xué)習(xí)方法篩選出的重要因子,能在某種程度下反映出客戶過(guò)往的經(jīng)濟(jì)能力和償貸能力。(3)信貸合同特征是影響客戶違約的另一大類因素,主要包含合同期限和合同利率。研究表明,合同期限與違約率呈負(fù)相關(guān),合同利率與違約率呈正相關(guān)。因此,基于客戶基礎(chǔ)信息和歷史信貸數(shù)據(jù),實(shí)行合同期限和合同利率最優(yōu)動(dòng)態(tài)管理機(jī)制,能夠有效降低客戶違約風(fēng)險(xiǎn)。

      針對(duì)以上研究結(jié)論,本文給出以下幾點(diǎn)建議:

      第一,在商業(yè)銀行與客戶之間建立起一種相互信任、相互依賴的“質(zhì)量?jī)r(jià)值鏈”。通過(guò)提升商業(yè)銀行產(chǎn)品、服務(wù)等質(zhì)量?jī)r(jià)值,構(gòu)建商業(yè)銀行客戶文化運(yùn)營(yíng)與管理機(jī)制,從而有效提高客戶忠誠(chéng)度,實(shí)現(xiàn)信用風(fēng)險(xiǎn)事前防范。

      第二,通過(guò)數(shù)倉(cāng)搭建與數(shù)據(jù)治理,有效發(fā)揮客戶大數(shù)據(jù)的價(jià)值。通過(guò)銀行、政府、企業(yè)等多方數(shù)據(jù)融合,打造互聯(lián)互通的數(shù)據(jù)生態(tài),從而有效豐富客戶特征指標(biāo),并利用機(jī)器學(xué)習(xí)、區(qū)塊鏈等新興信息技術(shù),挖掘數(shù)據(jù)價(jià)值,實(shí)現(xiàn)精準(zhǔn)風(fēng)險(xiǎn)評(píng)級(jí)。

      第三,雙視域下科學(xué)客觀地設(shè)置信貸合同,構(gòu)建商業(yè)銀行客戶分層管理機(jī)制。宏觀視角下,以國(guó)內(nèi)及全球宏觀經(jīng)濟(jì)發(fā)展大環(huán)境為基礎(chǔ),綜合考慮宏觀經(jīng)濟(jì)因素,基于理論模型,科學(xué)計(jì)算客戶合同期限、合同利率等理論值;微觀視角下,優(yōu)化客戶風(fēng)險(xiǎn)因子,實(shí)現(xiàn)客戶動(dòng)態(tài)分層管理,從而降低客戶信用風(fēng)險(xiǎn)的發(fā)生率以及風(fēng)險(xiǎn)值。

      第四,加強(qiáng)自我信用意識(shí),筑牢道德基礎(chǔ)。通過(guò)加強(qiáng)信用教育,積極倡導(dǎo)誠(chéng)信行為,為進(jìn)一步完善社會(huì)信用體系建設(shè)奠定基礎(chǔ),為實(shí)現(xiàn)客戶自我約束提供價(jià)值觀保障。

      參考文獻(xiàn):

      [1]Salas V,Saurina J. 2002. Credit Risk in Two Institutional Regimes:Spanish Commercial and Savings Banks [J]. Journal of Financial Services Research,22(3).

      [2]謝太峰,王蘊(yùn)鑫,徐子麒.我國(guó)城市商業(yè)銀行信用風(fēng)險(xiǎn)影響因素的實(shí)證研究 [J].征信,2020,38(6).

      [3]Copestake J. 2007. Mainstreaming Microfinance:Social Performance Management or Mission Drift? [J].World Development,35(10).

      [4]吳金旺, 顧洲一. 基于非平衡樣本的商業(yè)銀行客戶信用風(fēng)險(xiǎn)評(píng)估——以A銀行為例 [J].金融理論與實(shí)踐,2018,(7).

      [5]Sowers D C,David D. 1942. Risk Elements in Consumer Instalment Financing [J].Journal of Marketing,6(4).

      [6]YE Orgler. 1970. A Credit Scoring Model for Commercial Loans [J].Journal of Money Credit & Banking,2(04).

      [7]John C Wiginton. 1980. A Note on the Comparison of Logit and Discriminant Models of Consumer Credit Behavior [J].Journal of Financial and Quantitative Analysis,15(3).

      [8]李萌. Logit模型在商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用研究 [J].管理科學(xué),2005,(2).

      [9]方匡南,章貴軍,張惠穎.基于Lasso-logistic模型的個(gè)人信用風(fēng)險(xiǎn)預(yù)警方法 [J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2014,(2).

      [10]Hussain Ali Bekhet,Shorouq Fathi Kamel Eletter.? 2014. Credit Risk Assessment Model for Jordanian Commercial Banks:Neural Scoring Approach [J].Review of Development Finance,4(1).

      [11]姚瀟,余樂(lè)安.模糊近似支持向量機(jī)模型及其在信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用 [J].系統(tǒng)工程理論與實(shí)踐,2012,32(3).

      [12]Gaspar Cano,Jose Garcia-Rodriguez,Alberto Garcia-Garcia,Horacio Perez-Sanchez,Jón Atli,Benediktssonc,Anil Thapad,Alastair Barre. 2017. Automatic Selection of Molecular Descriptors Using Random Forest:Application to Drug Discovery [J].Expert Systems With Applications,72 .

      [13]方匡南,吳見(jiàn)彬,朱建平,謝邦昌.信貸信息不對(duì)稱下的信用卡信用風(fēng)險(xiǎn)研究 [J].經(jīng)濟(jì)研究,2010,45(S1).

      [14]周永圣,崔佳麗,周琳云,孫紅霞,劉淑芹.基于改進(jìn)的隨機(jī)森林模型的個(gè)人信用風(fēng)險(xiǎn)評(píng)估研究 [J].征信,2020,38(1).

      Research on Customer Credit Risk Assessment of Commercial Banks from the Perspective of Machine Learning

      Gu Zhouyi/Hu Lijuan

      (Zhejiang Financial College,Hangzhou? ?310018,Zhejiang,China)

      Abstract:Effectively controlling credit risk is the key link for the steady operation of commercial banks. Based on the customers' credit data of commercial banks,this paper uses an unbalanced sample processing algorithm to balance the information of minority samples,and mines the key risk factors affecting customer default by a machine-learning classifier. Finally,a Logistic Model is constructed to calculate the default probability. It is found that: firstly,customer loyalty is an important fundamental factor; the higher the loyalty,the lower the chance of customer default;secondly,high value of historical customer credit data,which is an important reference basis in ex ante risk control;thirdly,credit contract characteristics are another important dimension affecting customer default,including contract duration and contract interest rate. The findings of the study can provide theoretical references and practical guidance for bank credit granting,risk warning and default risk prevention.

      Key Words:credit risk,unbalanced processing,machine learning,Logistic Model

      猜你喜歡
      信貸風(fēng)險(xiǎn)機(jī)器學(xué)習(xí)
      商業(yè)銀行個(gè)人消費(fèi)信貸風(fēng)險(xiǎn)的管理
      新常態(tài)下中小銀行信貸風(fēng)險(xiǎn)管理探討
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      四川農(nóng)戶小額信貸風(fēng)險(xiǎn)防范研究
      地方性商業(yè)銀行防范和化解信貸風(fēng)險(xiǎn)的思考
      扬州市| 宿松县| 柘荣县| 海阳市| 凯里市| 泽库县| 德钦县| 旌德县| 宣恩县| 南召县| 广宗县| 荔波县| 建阳市| 行唐县| 鄄城县| 兴义市| 都安| 若羌县| 章丘市| 尚志市| 彰武县| 富民县| 当雄县| 肇庆市| 古丈县| 荥阳市| 宾川县| 九龙县| 南溪县| 海口市| 会东县| 大石桥市| 法库县| 河北区| 宜川县| 自贡市| 绍兴县| 天津市| 黎平县| 连云港市| 太谷县|