• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于優(yōu)化ACGAN-GBDT的個人信用風(fēng)險評估模型研究

      2022-10-04 08:57:54張在美
      財經(jīng)理論與實踐 2022年5期
      關(guān)鍵詞:類間信用風(fēng)險信用

      張在美,呂 娟,劉 彥

      ( 1. 長沙理工大學(xué) 經(jīng)濟(jì)與管理學(xué)院,湖南 長沙 410114;2. 湖南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長沙 410082)*

      一、引 言

      近年來,隨著互聯(lián)網(wǎng)與信息技術(shù)向金融領(lǐng)域滲透的程度日益加深,互聯(lián)網(wǎng)金融活動日漸豐富。特別是在普惠金融政策的支持和推動下,圍繞個人消費(fèi)者、低收入家庭以及小微企業(yè)等主體開展的互聯(lián)網(wǎng)信貸業(yè)務(wù)不斷擴(kuò)大,打破了個人、小微群體金融服務(wù)匱乏的局面,豐富了我國金融體系的內(nèi)涵。而與此同時,我國個人征信體系不健全導(dǎo)致個人信貸違約風(fēng)險不斷暴露,成為當(dāng)前亟待解決的問題。因此,充分利用人工智能等技術(shù)提升個人信用風(fēng)險評估水平,控制信用風(fēng)險,對于保障我國金融、經(jīng)濟(jì)體系的安全健康發(fā)展具有重要意義。

      個人信用風(fēng)險評估本質(zhì)上是構(gòu)建二分類模型,依據(jù)借款人的多維信息特征,將其區(qū)分為 “履約”和“違約”兩種類型。其主流模型包括Logistic回歸以及決策樹、神經(jīng)網(wǎng)絡(luò)、梯度提升決策樹(gradient boosting decision tree, GBDT)等機(jī)器學(xué)習(xí)方法。其中,GBDT模型因具有適于處理非線性關(guān)系、靈活處理多種數(shù)據(jù)類型、預(yù)測精度高等特點,優(yōu)勢顯著。然而,任何分類模型的有效性均較大程度地依賴樣本數(shù)據(jù)的質(zhì)量,信用樣本固有的不平衡、類間重疊以及數(shù)據(jù)類型多樣性等特點成為影響模型性能的重要因素。因此,構(gòu)建分類模型與數(shù)據(jù)質(zhì)量提升方法相結(jié)合的組合模型,才能從根本上提高信用風(fēng)險評估性能。

      關(guān)于信用數(shù)據(jù)質(zhì)量的提升,諸多學(xué)者進(jìn)行了研究。首先,信用數(shù)據(jù)不平衡,是指實際樣本中履約(多數(shù)類)樣本數(shù)量多于違約(少數(shù)類)樣本數(shù)量。楊蓮與石寶峰(2022)、Niu等(2020)等研究表明,樣本不平衡問題將導(dǎo)致模型分類結(jié)果偏向于多數(shù)類,而對少數(shù)類樣本的識別率低。當(dāng)前的解決方案以SMOTE、Borderline-SMOTE、SMOTENC等過采樣技術(shù)為典型代表。然而,上述方法是以線性插值技術(shù)為基礎(chǔ),生成的新樣本不夠真實,易引起原始樣本分布的改變。而隨著深度學(xué)習(xí)技術(shù)等人工智能技術(shù)的進(jìn)步,生成對抗網(wǎng)絡(luò)(generative adversarial nets,GAN)及條件生成對抗網(wǎng)絡(luò)(conditional generative adversarial nets,CGAN)被Oh等(2019)、Dong等(2022)等引入高維數(shù)據(jù)重采樣中的樣本生成,結(jié)果表明這類方法可以更好地捕捉原始數(shù)據(jù)的分布特征,生成樣本的真實性優(yōu)于線性插值方法。但上述方法均無法同時解決信用數(shù)據(jù)類間重疊以及數(shù)據(jù)類型多樣的問題。

      其次,信用數(shù)據(jù)的類間重疊,是指特征值相似的樣本具有不同的類標(biāo)簽。Vuttipittayamongkol和Elyan(2020)研究認(rèn)為,類間重疊區(qū)域中的多數(shù)類屬于優(yōu)勢類,訓(xùn)練后分類模型的決策邊界將傾向于多數(shù)類。Vuttipittayamongkol等(2021)、Zhu等(2020)、Lee和Kim(2021)也認(rèn)為類間重疊會進(jìn)一步加大對不平衡樣本的學(xué)習(xí)難度。然而,目前的解決方案相對匱乏,典型的方法是在過采樣SMOTE方法的基礎(chǔ)上對重疊區(qū)域的類間邊界進(jìn)行一定程度的探索,形成邊界過采樣技術(shù)如Borderline-SMOTE。但鑒于SMOTE本身的缺陷,其整體效果仍有待提升。

      最后,信用數(shù)據(jù)類型多樣,通常同時包含連續(xù)型和離散型數(shù)據(jù)。而在不平衡樣本中,少數(shù)類中的離散型特征值因數(shù)量偏少很可能不足以完全代表該類特征的全貌,導(dǎo)致分類模型無法得到充分學(xué)習(xí),從而出現(xiàn)欠擬合與分類偏差。對離散型特征進(jìn)行合理的過采樣是解決這一問題的有效途徑,但GAN、CGAN等方法均無法直接生成離散型特征。

      通過文獻(xiàn)梳理發(fā)現(xiàn),信用樣本的不平衡、類間重疊、類型多樣等特點同時存在,且在處理過程中相互影響,前述方法均無法較好地兼顧。引入輔助分類器生成對抗網(wǎng)絡(luò)(auxiliary classifier GAN,ACGAN)并進(jìn)行優(yōu)化,使其能夠同時從信用數(shù)據(jù)的三個特點出發(fā)進(jìn)行處理以提升數(shù)據(jù)質(zhì)量,并與性能優(yōu)越的GBDT分類模型結(jié)合,構(gòu)建個人信用風(fēng)險評估組合模型,以提升風(fēng)險評估性能。

      二、模型構(gòu)建與評價指標(biāo)

      (一)優(yōu)化ACGAN-GBDT模型構(gòu)建

      構(gòu)建的優(yōu)化ACGAN-GBDT個人信用風(fēng)險評估模型框架如圖1所示。模型從真實歷史信貸記錄中獲取數(shù)據(jù),經(jīng)預(yù)處理后形成信用樣本。為提升樣本數(shù)據(jù)質(zhì)量,引入ACGAN并進(jìn)行優(yōu)化,使其能夠在多數(shù)據(jù)類型基礎(chǔ)上生成平衡的信用樣本,同時緩解類間重疊問題。在此基礎(chǔ)上運(yùn)用GBDT二分類模型進(jìn)行訓(xùn)練與分類,從而對個人信用風(fēng)險進(jìn)行評估。

      圖1 基于優(yōu)化ACGAN-GBDT的個人信用風(fēng)險評估模型框架

      1. ACGAN模型。ACGAN是在GAN和CGAN基礎(chǔ)上提出的一種深度學(xué)習(xí)模型。其中,GAN由兩個網(wǎng)絡(luò)組成:一個是生成器(generator),它學(xué)習(xí)真實樣本的概率分布并將隨機(jī)噪聲轉(zhuǎn)換為生成樣本_fake=(),目標(biāo)是使得_fake盡可能地逼近真實樣本_real;另一個是判別器(discriminator),它同時以真實樣本_real和生成樣本_fake為輸入,判斷樣本的“真”“假”,目標(biāo)是盡可能地區(qū)分出生成樣本和真實樣本。和之間的競爭可以看成一個極大極小性對抗。GAN的目標(biāo)函數(shù)(,)如式(1)所示。

      (,)=[log()]+

      ()[log(1-(()))]

      (1)

      其中,代表真實樣本的分布,是從中抽取的樣本,代表噪聲分布,是來自的噪聲樣本。從判別器的角度來看,(,)應(yīng)最大化,使()和(())分別逼近1和0,即最大概率地正確區(qū)分樣本的“真”“假”。而對于生成器來說,(,) 應(yīng)最小化,使(()) 逼近1,即使得生成樣本盡可能逼真。對和進(jìn)行反復(fù)訓(xùn)練,最終使生成的樣本分布與實際樣本分布盡可能相同。

      然而,GAN作為一種無監(jiān)督學(xué)習(xí),對于不平衡的信用數(shù)據(jù)來說,不能直接在總樣本信息基礎(chǔ)上控制對少數(shù)類樣本的生成。CGAN與GAN具有類似的結(jié)構(gòu)和學(xué)習(xí)過程,二者的區(qū)別是在CGAN的生成器和判別器中均增加了條件,其目標(biāo)函數(shù)(,) 如式 (2)所示。

      (,)=,~[log(∣)]+

      (),~[log(1-((∣)))]

      (2)

      CGAN可以通過條件約束生成需要的樣本,但它并未對生成樣本類標(biāo)簽的準(zhǔn)確性進(jìn)行判斷。

      ACGAN結(jié)合了CGAN在生成器中加入約束條件的優(yōu)越性,又在判別器中加入了一個輔助分類器對生成樣本的類標(biāo)簽進(jìn)行判斷,使其不但可以判斷樣本的“真”“假”,還可以判斷樣本的類別。

      本文將ACGAN引入個人信用風(fēng)險評估模型中,以信用樣本中的少數(shù)類(違約)標(biāo)簽作為模型的約束條件,從而形成對少數(shù)類樣本的生成方案,以平衡信用樣本。其網(wǎng)絡(luò)結(jié)構(gòu)可見圖1。其中,生成器有兩個輸入,分別為隨機(jī)噪聲和少數(shù)類的類標(biāo)簽,實現(xiàn)為少數(shù)類生成新樣本_=(,)。判別器中的輔助分類器協(xié)助對生成樣本的類別進(jìn)行判斷。其損失函數(shù)包含兩部分:

      =[log()]+

      ()[log(1-(()))]

      (3)

      =[log()]+

      ()[log(1-(()))]

      (4)

      其中,為真假判別損失,用于判斷樣本的“真”“假”;為分類損失,用于判斷生成樣本與真實樣本類標(biāo)簽的相似度。對于判別器來說,訓(xùn)練目標(biāo)是盡可能區(qū)分生成樣本和真實樣本,并有效地對樣本進(jìn)行分類,即+最大;同時,對于生成器來說,訓(xùn)練目標(biāo)是使生成的樣本盡可能真實且被正確分類,即-最大。

      基于此,判別器可以更好地傳遞損失函數(shù),使得生成器更加準(zhǔn)確地找到類標(biāo)簽對應(yīng)的數(shù)據(jù)分布。特別是對于具有類間重疊問題的信用樣本數(shù)據(jù)來說,輔助分類器的加入能夠通過對生成樣本類標(biāo)簽的判斷和反饋,有效降低生成落在重疊區(qū)間的樣本的概率,緩解樣本生成中的類間重疊,提升分類模型對少數(shù)類特征的學(xué)習(xí)效果。

      2. ACGAN判別函數(shù)優(yōu)化。ACGAN的真假判別函數(shù)采用JS散度來衡量兩種不同分布之間的差異。然而該方法存在一定的缺陷,即當(dāng)判別器處于最優(yōu)狀態(tài)時,JS散度無法對兩個沒有交集的分布進(jìn)行衡量,從而導(dǎo)致生成器梯度消失。而Wasserstein距離可以克服這一缺陷,無論兩個不同的分布是否有交集,都能夠有效地衡量其遠(yuǎn)近。因此,本文采用Wasserstein 距離對判別函數(shù)進(jìn)行優(yōu)化。

      然而,使用Wasserstein 距離的前提是要求判別器損失函數(shù)服從Lipschitz 連續(xù)條件,即導(dǎo)函數(shù)不能超過Lipschitz常數(shù)。常見的做法是通過權(quán)重裁剪將判別器的權(quán)重限制在某個范圍內(nèi),使其強(qiáng)制滿足Lipschitz條件,而此方式又易引起梯度消失或梯度爆炸,導(dǎo)致訓(xùn)練不穩(wěn)定。因此,本文將采用梯度懲罰(gradient penalty,GP)的方式替代權(quán)重裁剪,以提高訓(xùn)練穩(wěn)定性。梯度懲罰通過設(shè)置一個額外的損失項以實現(xiàn)梯度與常數(shù)之間的聯(lián)系,梯度懲罰項的定義如式(5):

      ([‖?()‖-])

      (5)

      由于的取值并不影響梯度下降的方向,因此可以設(shè)值為1,得到式(6):

      (6)

      將式(6)并入ACGAN判別器的損失函數(shù)中,則由式(3)更改為式(7),保持式(4)不變。

      =[log()]+

      ()[log(1-(()))]+

      (7)

      3. ACGAN生成函數(shù)優(yōu)化。由于ACGAN要求其生成器是完全可微分的,因此不能自然生成離散型樣本數(shù)據(jù)。而離散型變量是信用數(shù)據(jù)中的一個重要類型。為適應(yīng)信用數(shù)據(jù)處理的要求,本文采用Gumbel-softmax函數(shù)用于生成器,它是softmax函數(shù)的一種變體,將來自Gumbel分布的噪聲添加到logits函數(shù)中。以向量表示離散變量的個離散值中每一個值的非標(biāo)準(zhǔn)化對數(shù)概率,則Gumbel-softmax以式(8)方式應(yīng)用于每個元素

      Gumbel-softmax()=

      (8)

      其中,,… ,是由Gumbel(0,1)產(chǎn)生的獨(dú)立同分布變量,是可控的溫度超參數(shù)。

      Gumbel-softmax是對在softmax函數(shù)上參數(shù)化的多項分布的連續(xù)逼近,這種近似是可微的,因此能夠通過離散采樣過程的近似進(jìn)行反向傳播??捎糜诳刂平瞥潭?。

      4. GBDT二分類模型。GBDT是一種將決策樹模型與提升手段相結(jié)合的分類模型。它以CART回歸樹為基學(xué)習(xí)器,利用損失函數(shù)的負(fù)梯度來擬合殘差,通過梯度提升使得每一次迭代都在減少殘差的方向上建立一個CART樹,即不斷學(xué)習(xí)上一個弱學(xué)習(xí)器的誤差來提高模型精度,將所有樹進(jìn)行結(jié)合形成最終的模型。

      本文的個人信用風(fēng)險評估屬于二分類問題,因此二元GBDT分類模型的損失函數(shù),可用對數(shù)似然損失函數(shù)表示:

      (,())=log (1+exp (-()))

      (9)

      在模型的迭代優(yōu)化過程中,第次迭代的第個樣本的損失函數(shù)負(fù)梯度如式(10):

      (10)

      利用 (,) (=1, 2, …,)擬合CART樹,得到第棵回歸樹,其對應(yīng)的葉子節(jié)點區(qū)域為(=1, 2, …,),為葉子節(jié)點的個數(shù)。針對每個葉子節(jié)點區(qū)域中的樣本,計算該節(jié)點區(qū)域的最佳擬合值如式(11):

      (11)

      第次迭代的CART樹擬合函數(shù)如式(12):

      (12)

      為指示函數(shù),繼而得到最終強(qiáng)學(xué)習(xí)器的表達(dá)式(13):

      (13)

      (二)評價指標(biāo)

      評價指標(biāo)的選取需綜合考慮模型應(yīng)用需求和數(shù)據(jù)分布特征。對于具有顯著不平衡特點的信用數(shù)據(jù)集來說,違約用戶的識別更為重要,因此,模型整體準(zhǔn)確率指標(biāo)并不合適。而AUC、G-mean、Recall等指標(biāo)被廣泛地應(yīng)用于此類模型的評價。

      表1所示的混淆矩陣是設(shè)計二分類模型評估指標(biāo)的基礎(chǔ),它是由樣本的真實類標(biāo)簽和預(yù)測類標(biāo)簽組成的一個矩陣。其中,TP(true positive)和TN(true negative)分別表示樣本(正、負(fù))被模型正確分類的數(shù)量,而FN(false negative)和FP(false positive)分別表示樣本(正、負(fù))被模型錯誤分類的數(shù)量。

      表1 混淆矩陣

      (1)AUC(area under ROC curve):指ROC曲線下的面積,這是一個綜合反應(yīng)模型對兩類樣本識別能力的指標(biāo)。若值較小,則表示模型對兩類樣本或其中之一的分類能力較差;反之,則說明對兩類樣本的分類能力均較好。

      (2)G-mean:該指標(biāo)同時受模型對兩個類別樣本的分類能力的影響。其值越大,表示模型性能越好。其計算公式如式(14):

      (14)

      (3)召回率(Recall):又稱查全率,在二分類模型中,用于評價正(負(fù))樣本被模型正確分類的數(shù)量與正(負(fù))樣本總量的比值。其值越大越好。本文中采用多數(shù)類召回率(Maj_Recall)和少數(shù)類召回率(Min_Recall)兩個指標(biāo),計算公式如式(15)、式(16):

      (15)

      (16)

      三、實證分析

      (一)實證設(shè)計與數(shù)據(jù)來源

      為評價模型的性能,本文設(shè)計的實證方案包含兩個部分:①優(yōu)化ACGAN-GBDT模型的生成樣本質(zhì)量分析;②將優(yōu)化ACGAN-GBDT模型與其他模型進(jìn)行對比分析,檢驗?zāi)P驼w優(yōu)越性。

      限于數(shù)據(jù)的可得性,本文選取了金融及大數(shù)據(jù)相關(guān)競賽平臺提供的兩個信貸數(shù)據(jù)集進(jìn)行實證。其一是國內(nèi)金融風(fēng)控算法大賽提供的某信貸機(jī)構(gòu)個人信貸數(shù)據(jù)集,記為數(shù)據(jù)集1;其二是國際Kaggle大數(shù)據(jù)競賽平臺提供的Lending Club個人信貸數(shù)據(jù)集,記為數(shù)據(jù)集2。經(jīng)預(yù)處理后,數(shù)據(jù)集1共有樣本118767條,其中履約樣本109168條,違約樣本9599條,不平衡率為11.37;數(shù)據(jù)集2共有樣本366466條,其中履約樣本283178條,違約樣本83288條,不平衡率為3.4。兩個數(shù)據(jù)集中均包含多個特征變量,如申請貸款金額、收入水平等連續(xù)型特征以及學(xué)歷信息、住房情況等離散型特征。其基本描述如表2所示。

      表2 實證樣本描述

      (二)生成樣本質(zhì)量分析

      通過對兩個數(shù)據(jù)集中各特征的真實樣本和生成樣本進(jìn)行比較,發(fā)現(xiàn)模型的生成樣本質(zhì)量總體較好。由于特征數(shù)量較多,本文僅從數(shù)據(jù)集2中選取了連續(xù)型特征和離散型特征各一個進(jìn)行展示,如圖2所示。其中,圖2(a)是連續(xù)型特征inq_last_6mths(貸款客戶最近6個月的征信查詢次數(shù))的真實樣本與生成樣本的概率分布情況,圖2(b)是離散型特征emp_length(工作年限)生成樣本和真實樣本分別在不同取值上對應(yīng)的樣本個數(shù)占比。fake為生成樣本,real為真實樣本。從圖2可以看出,生成樣本分布均非常接近真實樣本,說明樣本生成的擬合效果較好。

      圖2 生成樣本與真實樣本的分布比較

      (三)實證比較與模型評價

      個人信貸領(lǐng)域中風(fēng)險評估模型的關(guān)鍵目標(biāo)是正確識別出潛在違約用戶,降低信用風(fēng)險,這一任務(wù)遠(yuǎn)比正確識別出履約用戶更有意義。因此,在兼顧多數(shù)類識別準(zhǔn)確率的同時,盡可能提高少數(shù)類的識別準(zhǔn)確率,是本文模型追求的目標(biāo)。為檢驗?zāi)P陀行?,本文選取了如下幾類對照模型用于性能比較:

      1)未進(jìn)行數(shù)據(jù)質(zhì)量提升處理的GBDT分類模型。

      2)應(yīng)用廣泛的樣本不平衡處理方法與GBDT的組合模型,包括隨機(jī)過采樣ROS和SMOTE系列方法如插值過采樣SMOTE、邊界過采樣BSMOTE和離散型變量過采樣SMOTENC等。

      3)GAN系列樣本生成方法與GBDT的組合模型,包括GAN、CGAN等。

      為檢驗?zāi)P头€(wěn)健性,本文在實證中均采用了十折交叉驗證法,所有模型在兩個數(shù)據(jù)集、四個評價指標(biāo)上的實證結(jié)果分別如表3、表4所示。其中,為簡化模型名稱,各組合模型中均以“G”表示“GBDT”,本文模型以“OACGAN-G”表示。

      根據(jù)以上實證結(jié)果,可以看出:

      首先,在Maj_Recall和Min_Recall兩個指標(biāo)上,GBDT和ROS-GBDT兩個模型的表現(xiàn)較為相近,二者在兩個數(shù)據(jù)集上的Maj_Recall表現(xiàn)是最好的,而在Min_Recall上表現(xiàn)最差,說明對于具有顯著不平衡特點的信用數(shù)據(jù)集來說,單純的分類模型,在訓(xùn)練中很容易受多數(shù)類樣本的主導(dǎo),導(dǎo)致對少數(shù)類樣本的識別性能很差,這遠(yuǎn)不能滿足信用風(fēng)險評估的需求,與ROS相結(jié)合后,效果也并未得到明顯改善。而當(dāng)GBDT與SMOTE系列方法和GAN系列方法相結(jié)合后,雖然在兩個數(shù)據(jù)集的Maj_Recall上相較于前兩種模型有小幅度降低,但在Min_Recall上有顯著的大幅度提升,尤其是本文模型在兩個數(shù)據(jù)集上的Min_Recall值都是最高的,相比其他模型的提升幅度均超過了5%,甚至比表現(xiàn)最差的模型提升超過900%,充分說明了本文模型在違約樣本識別上的優(yōu)越性,更加適合用于個人信貸中信用風(fēng)險的評估。

      表3 各模型在數(shù)據(jù)集1上的結(jié)果對比

      表4 各模型在數(shù)據(jù)集2上的結(jié)果對比

      其次,從綜合指標(biāo)AUC的結(jié)果來看,在數(shù)據(jù)集1上表現(xiàn)最好的是SMOTENC-GBDT模型,AUC值為0.8488,本文模型的AUC值為0.8472,雖位列其次,但差距不到0.2%,且更大幅度地領(lǐng)先于其他模型;在數(shù)據(jù)集2上,本文模型的AUC值是最高的,相比其他模型提升了1.4%~34%。綜合來看,本文模型對履約和違約兩類樣本的分類能力均表現(xiàn)良好,相對其他模型更優(yōu)。

      最后,從綜合指標(biāo)G-mean的結(jié)果來看,本文模型在兩個數(shù)據(jù)集上的值都是最高的,特別是在數(shù)據(jù)集2上相比其他模型提升了2%~190%,進(jìn)一步說明了本文模型的綜合分類性能優(yōu)越。

      總體來看,本文提出的個人信用風(fēng)險評估模型充分考慮了信用樣本不平衡、類間重疊等問題,在運(yùn)用優(yōu)化ACGAN提升樣本質(zhì)量基礎(chǔ)上,結(jié)合GBDT分類模型進(jìn)行有效分類,達(dá)到了改善信用風(fēng)險評估性能的目的。

      四、結(jié) 論

      針對個人信貸業(yè)務(wù)不斷向線上拓展的趨勢下,信用風(fēng)險評估手段相對不足的問題,提出一種基于優(yōu)化ACGAN-GBDT的個人信用風(fēng)險評估模型。由于個人信用樣本具有典型的不平衡、類間重疊以及類型多樣性等特點,使得運(yùn)用分類模型的效果并不理想,因此,須進(jìn)一步結(jié)合數(shù)據(jù)質(zhì)量提升方法以提升模型性能。將可高質(zhì)量生成樣本的優(yōu)化ACGAN與分類性能優(yōu)越的GBDT進(jìn)行組合,構(gòu)建個人信用風(fēng)險評估模型。其中,ACGAN模型的條件約束和輔助分類器設(shè)計,能夠幫助有效生成少數(shù)類樣本,在平衡樣本的同時緩解類間重疊;針對ACGAN模型不能自然生成離散型數(shù)據(jù)的缺陷,引入Gumbel-softmax函數(shù)進(jìn)行優(yōu)化,使其能夠?qū)π庞脭?shù)據(jù)進(jìn)行處理;針對ACGAN模型判別函數(shù)可能出現(xiàn)梯度消失的缺陷,引入Wasserstein 距離進(jìn)行優(yōu)化,使模型更加穩(wěn)定。

      為檢驗?zāi)P偷挠行裕x取了兩個公開的大型個人信貸數(shù)據(jù)集進(jìn)行實證,并與七個代表性模型進(jìn)行了比較。實證結(jié)果顯示,提出的優(yōu)化ACGAN-GBDT模型可顯著提升違約樣本的識別率,同時兼顧履約樣本的高識別率,在AUC、G-mean等綜合評價指標(biāo)上的總體表現(xiàn)也更為優(yōu)越。這對于提升個人信用風(fēng)險評估模型的性能,有效識別信貸違約客戶,降低信用風(fēng)險具有重要意義。另外,在研究中所采用的實證數(shù)據(jù)僅為借款人在當(dāng)時的信貸活動中留下的相關(guān)信息,在當(dāng)前的大數(shù)據(jù)環(huán)境下,如何進(jìn)一步結(jié)合更廣泛維度上的個人行為特征來協(xié)助進(jìn)行個人信用風(fēng)險評估是下一步研究的方向。

      猜你喜歡
      類間信用風(fēng)險信用
      基于OTSU改進(jìn)的布匹檢測算法研究
      為食品安全加把“信用鎖”
      基于貝葉斯估計的多類間方差目標(biāo)提取*
      信用收縮是否結(jié)束
      中國外匯(2019年9期)2019-07-13 05:46:30
      基于類間相對均勻性的紙張表面缺陷檢測
      淺析我國商業(yè)銀行信用風(fēng)險管理
      基于改進(jìn)最大類間方差法的手勢分割方法研究
      信用中國網(wǎng)
      信用消費(fèi)有多爽?
      京東商城電子商務(wù)信用風(fēng)險防范策略
      佛山市| 潜山县| 四会市| 尚志市| 册亨县| 长寿区| 延庆县| 河北省| 通山县| 西宁市| 柳江县| 特克斯县| 新余市| 渝北区| 工布江达县| 绥宁县| 武安市| 武宁县| 民权县| 绥化市| 莆田市| 安丘市| 沁阳市| 岳阳县| 陆丰市| 儋州市| 天门市| 当阳市| 铜鼓县| 北票市| 榆社县| 宽甸| 凯里市| 伊通| 左权县| 宁陕县| 马山县| 和政县| 台山市| 阳新县| 黔东|