• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向農(nóng)戶貸款信用風(fēng)險(xiǎn)評(píng)估的Relief-GEP模型

      2020-01-05 07:00:06劉田田
      軟件導(dǎo)刊 2020年11期
      關(guān)鍵詞:信用風(fēng)險(xiǎn)

      劉田田

      摘 要:現(xiàn)有的信用評(píng)估模型往往需要在建模前預(yù)設(shè)模型的基本形態(tài)結(jié)構(gòu),極易因函數(shù)形式的誤設(shè)導(dǎo)致評(píng)估結(jié)果誤差較大,同時(shí)現(xiàn)有模型大多面向傳統(tǒng)大中型企業(yè)、消費(fèi)信貸用戶,對(duì)農(nóng)戶這一借款主體缺乏適用性?;谒捱w地區(qū)某農(nóng)村信用社的農(nóng)戶信貸數(shù)據(jù)庫(kù),設(shè)計(jì)一種面向我國(guó)農(nóng)戶貸款信用風(fēng)險(xiǎn)評(píng)估模型——Relief-GEP模型。模型首先使用Relief算法,對(duì)建模樣本集維度進(jìn)行刪減,剔除對(duì)預(yù)測(cè)違約概率影響不大的各項(xiàng)指標(biāo),在擯棄部分噪聲數(shù)據(jù)的同時(shí)提高后續(xù)建模精度;在缺乏最優(yōu)函數(shù)形式的先驗(yàn)信息情況下使用基因表達(dá)式編程算法,以“適者生存”的邏輯通過(guò)反復(fù)演化迭代,動(dòng)態(tài)構(gòu)筑模型的核心部分。實(shí)證研究表明,Relief-GEP模型相比于當(dāng)前流行的12個(gè)信用風(fēng)險(xiǎn)評(píng)估模型,擁有更優(yōu)的擬合精度與更好的泛化能力。

      關(guān)鍵詞:仿真建模;信用風(fēng)險(xiǎn);特征權(quán)重選擇算法;基因表達(dá)式編程算法

      DOI:10. 11907/rjdk. 202034????????????????????????????????????????????????????????????????? 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

      中圖分類號(hào):TP303 ? 文獻(xiàn)標(biāo)識(shí)碼:A ??????????????? 文章編號(hào):1672-7800(2020)011-0079-05

      A Relief-GEP Model for Credit Risk Evaluation of Loans for Farmers

      LIU Tian-tian

      (College of Information and Electromechanical Engineering, Jiangsu Open University, Nanjing 210017,China)

      Abstract:The existing credit evaluation model needs to presuppose the basic structure of the model itself before the modeling process, then the error of the evaluation result is very easy to be caused by the setting error of the function form of the model. At the same time, most of the existing models are designed for traditional large and medium-sized enterprises or consumer users, and are lack of applicability to farmers who wish to apply for loans. Based on the credit database of a rural credit cooperative in Suqian area, this paper designs a credit risk evaluation model - the Relief-GEP model which is oriented to evaluate the credit risk of loans for farmers in China. The model firstly uses the relief algorithm to reduce the dimension of the sample set for modeling, eliminate all the indexes that have little effect on the prediction of default probability and some noise data to improve the accuracy of subsequent modeling process, and then in the condition of lack of the prior information of the optimal function form, the gene expression programming algorithm is employed with the logic of “survival of the fittest” and dynamically construct the model through the repeated evolutionary iteration. The empirical study shows that the Relief-GEP model has better fitting precision and better generalization ability than the 12 credit risk evaluation models that are popular in the current academic and industry circles.

      Key Words:simulation modeling; credit risk; relief algorithm; gene expression programming algorithm

      0 引言

      根據(jù)2016年國(guó)務(wù)院印發(fā)的《推進(jìn)普惠金融發(fā)展規(guī)劃(2016-2020)》,農(nóng)民群體是中國(guó)普惠金融[1]的重點(diǎn)服務(wù)對(duì)象之一。但迄今為止,全國(guó)農(nóng)戶的貸款可得性、貸款覆蓋率等統(tǒng)計(jì)指標(biāo)依然相對(duì)較低[2],究其根本原因,主要在于農(nóng)戶貸款的信用風(fēng)險(xiǎn)較高。信用風(fēng)險(xiǎn)[3]指獲得信用支持的債務(wù)人不能遵照合約按時(shí)足額償還本金和利息的可能性。農(nóng)戶貸款的特點(diǎn)是貸前調(diào)查不易、貸款金額小、居住分散、清收成本高,這使得傳統(tǒng)的基于信貸員逐筆審核的信用風(fēng)險(xiǎn)評(píng)估機(jī)制難以作為。為降低信用風(fēng)險(xiǎn)管理成本,提高貸款決策效率,目前信貸機(jī)構(gòu)一般選擇信用評(píng)估模型[4]對(duì)貸款農(nóng)戶信用風(fēng)險(xiǎn)進(jìn)行批量化、自動(dòng)化預(yù)測(cè)與管理,而當(dāng)前商業(yè)銀行或農(nóng)村信用社大多已有面向大中型企業(yè)、上市公司、個(gè)人消費(fèi)貸的信用評(píng)估模型,但卻缺乏專門針對(duì)農(nóng)戶的風(fēng)險(xiǎn)評(píng)估方法與模型。

      王樹(shù)娟等[5]在國(guó)內(nèi)最早研究農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估模型,將農(nóng)戶信用分為戶主素質(zhì)、資金信用和經(jīng)營(yíng)能力等3個(gè)方面7個(gè)指標(biāo),運(yùn)用模糊數(shù)學(xué)方法建立綜合評(píng)價(jià)數(shù)學(xué)模型,采用定量分析方法評(píng)估農(nóng)戶信用;王慧等[6]采用生態(tài)學(xué)中修正BS模型,利用末位淘汰機(jī)制對(duì)農(nóng)戶信用作用建模,分析末位淘汰機(jī)制對(duì)于農(nóng)戶信用水平的影響;王思宇等[7]將LightGBM算法應(yīng)用于研究用戶信用風(fēng)險(xiǎn)中,發(fā)現(xiàn)其具有更快的訓(xùn)練速度和更高的訓(xùn)練效率。

      國(guó)外對(duì)農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估模型也有研究[8-9],但由于各國(guó)農(nóng)業(yè)文化的差異,這些研究對(duì)我國(guó)農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估指導(dǎo)有限[10-11]。

      我國(guó)農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估模型研究成果數(shù)量不多,采用的模型技術(shù)大多較為老舊,如基于傳統(tǒng)統(tǒng)計(jì)學(xué)方法的logistic回歸、probit回歸等模型[12]?;诖耍疚膶?yīng)用新穎的人工智能、機(jī)器學(xué)習(xí)模型,采用特征權(quán)重選擇算法對(duì)樣本集進(jìn)行處理,運(yùn)用基因表達(dá)式編程算法構(gòu)筑信用評(píng)估模型,實(shí)驗(yàn)表明該模型在訓(xùn)練效率、泛化能力上均表現(xiàn)優(yōu)異。

      1 Relief-GEP算法設(shè)計(jì)

      針對(duì)農(nóng)戶信用風(fēng)險(xiǎn)評(píng)估的實(shí)際需求與現(xiàn)有模型存在的問(wèn)題,本文設(shè)計(jì)一種面向我國(guó)農(nóng)戶貸款信用風(fēng)險(xiǎn)的評(píng)估模型——Relief-GEP模型。Relief-GEP模型首先使用Relief算法,對(duì)建模樣本集進(jìn)行維度刪減,只保留預(yù)測(cè)農(nóng)戶違約概率意義較大的指標(biāo),從而解決構(gòu)建模型時(shí)的指標(biāo)選取問(wèn)題,盡可能擯棄噪聲信息,提高建模效率。之后基于基因表達(dá)式編程(Gene Expression Programming,GEP)模型動(dòng)態(tài)構(gòu)筑核心的信用評(píng)估模型,從而避免在缺乏先驗(yàn)信息的情況下誤設(shè)函數(shù)形式問(wèn)題。

      1.1 Relief算法

      Relief特征權(quán)重選擇算法[13]主要原理:從樣本集D中隨機(jī)選擇一個(gè)樣本xi(i∈{1,2,?,n}),之后在D中尋找k個(gè)與xi距離最近且類標(biāo)簽相同的樣本,其集合記為Shit,并在D中尋找k個(gè)與xi距離最近且類標(biāo)簽不同的樣本,其集合記為Smiss。分別計(jì)算各屬性與Shit中樣本在同一屬性上的平均距離、各屬性與Smiss中樣本在同一屬性上的平均距離。

      若前者大于后者,則表明該屬性在異類標(biāo)簽樣本上能夠較好區(qū)分,增加該屬性權(quán)重;反之則認(rèn)為該屬性不能有效區(qū)分異類樣本,減少該屬性權(quán)重,重復(fù)多次得到較為穩(wěn)定的各屬性權(quán)重。Relief特征權(quán)重選擇算法對(duì)各屬性重要程度的評(píng)價(jià)是正向的,即評(píng)價(jià)結(jié)果值越大,對(duì)應(yīng)的屬性對(duì)預(yù)測(cè)因變量的重要性越強(qiáng)。

      1.2 GEP算法

      基因表達(dá)式編程算法(GEP)是一種較為新穎的進(jìn)化智能算法[14],其將多個(gè)變量間的表達(dá)式首先表示為樹(shù)結(jié)構(gòu),之后通過(guò)廣度優(yōu)先遍歷該樹(shù)結(jié)構(gòu)表達(dá)式,得到以線性串結(jié)構(gòu)表示的“基因染色體組”。線性串結(jié)構(gòu)與樹(shù)結(jié)構(gòu)的表達(dá)式可以互相轉(zhuǎn)化,且轉(zhuǎn)化結(jié)果唯一。

      GEP 的基因用線性編碼符號(hào)串表示,由頭部和尾部共同決定。頭部可以包含函數(shù)運(yùn)算符或運(yùn)算變量,尾部?jī)H包含運(yùn)算變量。若頭部長(zhǎng)度為h,尾部長(zhǎng)度為t,則線性串結(jié)構(gòu)編碼需滿足以下函數(shù)關(guān)系:

      t=h?(n-1)+1?????? (1)

      其中,n為運(yùn)算符可支持的最大可帶運(yùn)算變量個(gè)數(shù),例如乘號(hào)運(yùn)算符最大可以攜帶兩個(gè)運(yùn)算變量。

      1.3 Relief-GEP信用評(píng)估模型設(shè)計(jì)

      Relief-GEP農(nóng)戶信用評(píng)估模型步驟如下:

      首先對(duì)用于建模的農(nóng)戶歷史信貸數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗。數(shù)據(jù)清洗工作主要包括剔除含有缺失值的樣本,對(duì)來(lái)自不同數(shù)據(jù)源的樣本進(jìn)行單位統(tǒng)一化(如借款金額的單位元與萬(wàn)元之間的不一致性),剔除明顯含有錯(cuò)誤取值指標(biāo)的樣本等。

      在完成原始樣本集數(shù)據(jù)清洗工作后,使用Relief算法對(duì)建模樣本集中各變量指標(biāo)與因變量(是否違約)的影響重要性進(jìn)行判斷?;诟髦笜?biāo)在Relief算法中的重要性得分,剔除分值為負(fù)的各項(xiàng)指標(biāo),從而在壓縮建模樣本集維度,提高后續(xù)建模效率之余,將預(yù)測(cè)違約概率關(guān)聯(lián)性不大的各項(xiàng)指標(biāo)在建模步驟前剔除,避免冗余屬性所含的噪聲信息對(duì)最終擬合得到的違約概率產(chǎn)生影響。

      基于維度精簡(jiǎn)的建模樣本使用GEP算法構(gòu)建模型。選擇常規(guī)的加減乘除、乘方、自然對(duì)數(shù)、正余弦、大于、小于、等于、大于等于、小于等于等運(yùn)算符作為備選運(yùn)算符,供GEP算法在迭代中使用。算法的停止條件為迭代次數(shù)達(dá)到預(yù)設(shè)的最大迭代次數(shù)閾值。

      在完成GEP算法迭代后,根據(jù)算法的擬合結(jié)果將農(nóng)戶違約概率的可預(yù)測(cè)模式總結(jié)為計(jì)算機(jī)邏輯語(yǔ)言,之后進(jìn)一步將其轉(zhuǎn)化為便于理解的自然語(yǔ)言。

      在使用Relief-GEP農(nóng)戶信用評(píng)估模型對(duì)新的樣本進(jìn)行違約概率預(yù)測(cè)時(shí),首先根據(jù)建模階段Relief算法發(fā)現(xiàn)的弱關(guān)聯(lián)指標(biāo)對(duì)新樣本維度進(jìn)行削減,隨后將降維了的新樣本帶入訓(xùn)練好的GEP算法預(yù)測(cè)模式中,得到最終的預(yù)測(cè)違約概率。

      2 實(shí)證研究

      2.1 實(shí)證數(shù)據(jù)

      本文的研究數(shù)據(jù)來(lái)自宿遷地區(qū)某農(nóng)村信用社農(nóng)戶信貸數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)搜集了該地區(qū)2017年共645份面向農(nóng)戶發(fā)放貸款的歷史記錄,除具有較大的樣本規(guī)模外,數(shù)據(jù)集也具有較好的時(shí)效性。

      數(shù)據(jù)集中共含有11維變量指標(biāo),分別為該筆貸款的額度、該筆貸款是否存在擔(dān)保、貸款者性別、貸款者年齡、貸款者婚姻狀況、貸款者受教育水平、貸款者健康狀況、貸款者年收入、該筆貸款的持續(xù)月數(shù)、該筆貸款的實(shí)際利率與該筆貸款最終是否違約。

      其中,貸款額度、年齡、年收入、貸款月數(shù)、實(shí)際利率均為連續(xù)性變量,剩余變量均為二值或多值離散型變量。是否存在擔(dān)保為二值啞變量,取值為1表明存在擔(dān)保,為0表明不存在;性別為二值啞變量,男性為2,女性為1;婚姻狀況為二值啞變量,未婚為0,已婚為1;教育為多值離散型變量,取值為0~9之間的整數(shù),取值越大表明受教育程度越高;健康狀況為二值變量,取值為0表明健康,為2表明存在一些健康問(wèn)題。

      表1給出本文實(shí)證數(shù)據(jù)集中自變量各指標(biāo)的描述性統(tǒng)計(jì)情況,相關(guān)計(jì)算由SPSS 20.0軟件完成。

      從表1可以看出,當(dāng)?shù)刭J款農(nóng)戶的借款金額一般不超過(guò)5萬(wàn)元,一定程度上均屬于小額貸款,同時(shí)大多數(shù)貸款農(nóng)戶都存在貸款擔(dān)保人。而在貸款農(nóng)戶中,女性數(shù)量明顯高于男性,未婚者居多,在年齡上又以中年人居多。在受教育情況方面,大多數(shù)農(nóng)戶受教育程度不高。

      2.2 實(shí)證設(shè)計(jì)

      選擇當(dāng)前最為成熟與流行的12種信用評(píng)估方法:決策樹(shù)(DT)、判別分析(DA)、logistic回歸、線性核函數(shù)的支持向量機(jī)(SVM-liner)、高斯核函數(shù)的支持向量機(jī)(SVM-rbf)、多項(xiàng)式核函數(shù)的支持向量機(jī)(SVM-polynomial)、k最近鄰(k-NN)、樸素貝葉斯(NB)、k均值聚類(k-means)、徑向基神經(jīng)網(wǎng)絡(luò)(RBF-ANN)、反向傳播神經(jīng)網(wǎng)絡(luò)(BP-ANN)、自組織映射神經(jīng)網(wǎng)絡(luò)(SOM-ANN)。這12個(gè)模型應(yīng)用廣泛,有較好的代表性。

      選用5折交叉法進(jìn)行樣本訓(xùn)練,劃分測(cè)試樣本?;趧澐值挠?xùn)練樣本模型對(duì)獨(dú)立于訓(xùn)練樣本的測(cè)試樣本進(jìn)行模型泛化能力檢驗(yàn)。

      采用AUC指標(biāo)綜合評(píng)判模型的平均預(yù)測(cè)能力和偏倚程度。AUC指標(biāo)計(jì)算方法為:首先根據(jù)表2的混淆矩陣定義兩個(gè)指標(biāo):

      假正類率:

      FPR=FPFP+TN????? (2)

      真正類率:

      TPR=TPTP+FN????? (3)

      對(duì)輸出結(jié)果為各樣本預(yù)測(cè)違約概率的模型,根據(jù)模型預(yù)測(cè)結(jié)果中每個(gè)樣本屬于正類樣本的概率從大到小排序,構(gòu)成各樣本的違約概率序列P,之后從高到低按序依次以序列P中的當(dāng)前違約概率作為閾值,判斷當(dāng)所有被預(yù)測(cè)的樣本以該閾值作為分類依據(jù)時(shí)的總體樣本劃分情況,即當(dāng)各樣本的預(yù)測(cè)違約概率大于該閾值時(shí),將其劃入違約類;反之,將其劃入未違約類。之后計(jì)算兩類樣本的假正類率和真正類率值,形成一系列假正類率序列和真正類率序列。最后在二維坐標(biāo)軸中以假正類率序列為橫軸,真正類率序列為縱軸,繪制出對(duì)應(yīng)的曲線,該曲線即為ROC曲線(Receiver Operating Characteristic),而ROC曲線下方與坐標(biāo)軸圍成的面積定義為AUC(Area Under Curve)值。

      在Relief-GEP農(nóng)戶信用評(píng)估模型參數(shù)設(shè)置方面,選擇剔除Relief算法識(shí)別結(jié)果中重要性系數(shù)小于0的指標(biāo),同時(shí)設(shè)置GEP算法的演化迭代停止閾值為300次,適應(yīng)度函數(shù)設(shè)置為建模階段的AUC指標(biāo)值最大化。

      最后,12個(gè)對(duì)比模型使用MATLAB編程實(shí)現(xiàn),Relief算法基于RapidMiner軟件運(yùn)算,GEP算法基于GeneXproTools 5.0軟件運(yùn)行。

      2.3 實(shí)證結(jié)果分析

      表3展示Relief-GEP農(nóng)戶信用評(píng)估模型各指標(biāo)對(duì)預(yù)測(cè)違約概率重要性的評(píng)價(jià)結(jié)果。

      從表3中可以明顯看出,在所用數(shù)據(jù)集各項(xiàng)指標(biāo)中,性別因素對(duì)預(yù)測(cè)違約概率作用最為明顯,作用力度在所有指標(biāo)中占比超過(guò)了50%,其次分別為婚姻狀況、教育、年齡、貸款實(shí)際利率等因素,而健康狀況、貸款是否存在擔(dān)保、貸款額度3項(xiàng)指標(biāo)的Relief算法重要性得分均為負(fù)值,表明這3項(xiàng)指標(biāo)對(duì)預(yù)測(cè)違約概率作用不強(qiáng)。故根據(jù)Relief-GEP農(nóng)戶信用評(píng)估模型設(shè)計(jì)原理,剔除這3項(xiàng)指標(biāo),從而實(shí)現(xiàn)訓(xùn)練樣本降維,擯棄噪聲信息。

      圖1進(jìn)一步展示了Relief算法篩選對(duì)預(yù)測(cè)違約概率作用較大的各項(xiàng)指標(biāo)后,GEP算法在訓(xùn)練階段多次演化迭代過(guò)程中算法的適應(yīng)度值變化情況。

      從圖1可以明顯看出,在總計(jì)300次的迭代過(guò)程中,GEP算法的最優(yōu)精度很快接近100%,同時(shí)GEP算法在迭代過(guò)程中的平均適應(yīng)度、最優(yōu)適應(yīng)度兩項(xiàng)指標(biāo)總體上均隨著迭代次數(shù)的增加而提高,表明GEP算法向最優(yōu)解逼近的能力與效率均較強(qiáng)。與此同時(shí),在整個(gè)迭代過(guò)程中,GEP算法的適應(yīng)度也出現(xiàn)了多處“驟降”現(xiàn)象,表明GEP算法在迭代過(guò)程中能夠有效跳出局部解空間,嘗試在更廣闊的解空間中尋找適應(yīng)度更高的個(gè)體。

      表4展示了在構(gòu)建模型訓(xùn)練階段與應(yīng)用模型測(cè)試階段參與比較的12個(gè)對(duì)比模型,與本文設(shè)計(jì)的Relief-GEP農(nóng)戶信用評(píng)估模型在訓(xùn)練階段AUC指標(biāo)值與測(cè)試階段AUC指標(biāo)值的具體取值情況。

      由表4可以明顯看出,在訓(xùn)練階段,除k-means模型與SOM-ANN模型之外,其余模型的擬合AUC指標(biāo)均在0.9以上,logistic、SVM-liner、SVM-rbf、SVM-polynomial、k-NN、BP-ANN與Relief-GEP模型的擬合精度更是達(dá)到了AUC值大于0.95的水平,這表明大多數(shù)模型在訓(xùn)練階段都能較好地對(duì)訓(xùn)練樣本中所含的擬合模式進(jìn)行充分整合。而在所有表現(xiàn)較好的模型中,Relief-GEP模型的擬合精度最高,AUC值達(dá)到0.976 7,SVM-rbf與k-NN模型次之,AUC指標(biāo)值分別為0.967 4與0.954 9,這表明相比于現(xiàn)有的12個(gè)代表性信用評(píng)估模型,Relief-GEP模型能夠更好地挖掘訓(xùn)練樣本中所蘊(yùn)含的擬合模式。

      從表4最右列可以發(fā)現(xiàn),在訓(xùn)練階段及測(cè)試階段表現(xiàn)較好的模型,其預(yù)測(cè)AUC指標(biāo)值相對(duì)于訓(xùn)練階段均有不同程度降低,這表明訓(xùn)練樣本集樣本所含的信息中依然存在一定的噪聲信息,從而干擾了模型對(duì)樣本集中蘊(yùn)含的違約概率精準(zhǔn)識(shí)別。而在各模型中Relief-GEP模型擁有最高的預(yù)測(cè)精度,其測(cè)試階段的AUC指標(biāo)值達(dá)到0.956 2,在所有的13個(gè)模型中排名第一,其次為RBF-ANN模型與DA模型,AUC指標(biāo)值分別為0.939與0.94。而剩余在訓(xùn)練階段表現(xiàn)較好的各模型,在測(cè)試階段性能均出現(xiàn)較大幅度的下降,AUC指標(biāo)均未達(dá)到0.9,表明這些模型在訓(xùn)練階段所表現(xiàn)出的較優(yōu)性能很大程度上是由過(guò)度擬合問(wèn)題造成的,因而其泛化能力較差。

      在實(shí)際使用信用評(píng)估模型對(duì)各貸款農(nóng)戶進(jìn)行貸前信用評(píng)估時(shí),使用者往往僅能根據(jù)各備選模型對(duì)已有樣本的擬合精度(相當(dāng)于測(cè)試階段模型的擬合結(jié)果)進(jìn)行選擇,故模型的穩(wěn)定性與泛化能力尤為重要。本文設(shè)計(jì)的Relief-GEP農(nóng)戶信用評(píng)估模型,在訓(xùn)練階段與測(cè)試階段均表現(xiàn)出穩(wěn)定的性能,較優(yōu)的泛化能力,對(duì)新樣本的違約概率預(yù)測(cè)能力較高,實(shí)用性強(qiáng)。

      將Relief-GEP農(nóng)戶信用評(píng)估模型得到的最終違約概率預(yù)測(cè)模式以C++語(yǔ)言表述如下:

      from math import *

      def gepModel(d):

      ROUNDING_THRESHOLD = 2.72727627255423

      G2C4 = -8.23297830133976

      y = 0.0

      y = pow(d[0],3.0)

      y = y + gepLT2C(gepGOE2G(((G2C4-d[5])+d[3]),exp(G2C4)),gepLogi((d[6]*d[3])))

      y = y + gepLogi(pow(d[0],4.0))

      if (y >= ROUNDING_THRESHOLD):

      return 1

      else:

      return 0

      def gepLT2C(x, y):

      if (x < y):

      return (x+y)

      else:

      return (x-y)

      def gepGOE2G(x, y):

      if (x >= y):

      return (x+y)

      else:

      return atan(x*y)

      def gepLogi(x):

      if (abs(x) > 709.0):

      return 1.0 / (1.0 + exp(abs(x) / x * 709.0))

      else:

      return 1.0 / (1.0 + exp(-x))

      3 結(jié)語(yǔ)

      本文設(shè)計(jì)了面向我國(guó)農(nóng)戶貸款信用風(fēng)險(xiǎn)評(píng)估的Relief-GEP模型。模型首先使用Relief算法刪減對(duì)預(yù)測(cè)違約概率作用不大的冗余屬性,擯棄一定的噪聲數(shù)據(jù),明晰了模型預(yù)測(cè)使用的指標(biāo),因而提高了后續(xù)建模的整體效率。在缺乏最優(yōu)模型具體結(jié)構(gòu)形態(tài)先驗(yàn)知識(shí)的情況下,結(jié)合“適者生存”的哲學(xué)思想,使用基因表達(dá)式編程算法對(duì)模型的最優(yōu)結(jié)構(gòu)不加限制地進(jìn)行演化迭代尋優(yōu),最終構(gòu)建出完整的農(nóng)戶貸款信用風(fēng)險(xiǎn)評(píng)估模型?;谒捱w地區(qū)某農(nóng)村信用社農(nóng)戶信貸歷史樣本進(jìn)行實(shí)證研究,結(jié)果表明,設(shè)計(jì)的Relief-GEP模型相比于當(dāng)前流行的12種信用風(fēng)險(xiǎn)評(píng)估模型,擁有更好的建模樣本擬合能力及更優(yōu)的樣本泛化能力。該模型形態(tài)結(jié)構(gòu)十分靈活,但如果在建模前缺乏先驗(yàn)信息而以傳統(tǒng)方式預(yù)設(shè)模型結(jié)構(gòu)形式的情況下,則極易因函數(shù)形式誤設(shè)導(dǎo)致模型識(shí)別精度不高,這需要在后續(xù)工作中進(jìn)行改進(jìn)。

      參考文獻(xiàn):

      [1] 王穎, 曾康霖. 論普惠:普惠金融的經(jīng)濟(jì)倫理本質(zhì)與史學(xué)簡(jiǎn)析[J]. 金融研究, 2016,15(2):37-54.

      [2] 張梓榆,溫濤,王小華.“新常態(tài)”下中國(guó)農(nóng)貸市場(chǎng)供求關(guān)系的重新解讀——基于農(nóng)戶分化視角[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2018,17(4):54-64.

      [3] MA X M, LV X L. Financial credit risk prediction in internet finance driven by machine learning[J]. Neural Computing and Applications,2019,31(12):128-135.

      [4] ELIANA COSTA E SILVA,ISABEL CRISTINA LOPES,ALDINA CORREIA,et al. A logistic regression model for consumer default risk[J]. Journal of Applied Statistics,2020,47(13-15):1154-1168,159-1681.

      [5] 王樹(shù)娟, 霍學(xué)喜, 何學(xué)松. 農(nóng)村信用社農(nóng)戶信用綜合評(píng)價(jià)模型[J]. 財(cái)貿(mào)研究, 2005,16(5):35-39

      [6] 王惠,王靜.末位淘汰機(jī)制下的農(nóng)戶信用水平演化動(dòng)態(tài)模擬仿真及案例檢驗(yàn)[J].農(nóng)林經(jīng)濟(jì)管理學(xué)報(bào),2019,18(6):717-724.

      [7] 王思宇,陳建平.基于LightGBM算法的信用風(fēng)險(xiǎn)評(píng)估模型研究[J].軟件導(dǎo)刊,2019,18(10):19-22.

      [8] MARTINE V,HAFSAH J,KERRI B. Risk preferences and poverty traps in the uptake of credit and insurance amongst small-scale farmers in South Africa[J]. Journal of Economic Behavior and Organization,2019,33(265):1482-1511.

      [9] VIHI S K, JESSE B, DALLA A A ,et al. Analysis of farm risk and coping strategies among maize farmers in lere local government area of kaduna state, nigeria[J]. Asian Journal of Research in Agriculture and Forestry,2018,561(9):624-637.

      [10] JAIN R, GOUR B, DUBEY S. A hybrid approach for credit card fraud detection using rough set and decision tree technique[J]. International Journal of Computer Applications, 2016,139(10):1-6.

      [11] YU L, YANG Z, TANG L. A novel multistage deep belief network based extreme learning machine ensemble learning paradigm for credit risk assessment[J]. Flexible Services & Manufacturing Journal, 2016, 28(4):576-592.

      [12] YASIN A,KADRIYE K. A jackknifed ridge estimator in probit regression model[J]. Statistics,2020,54(4):295-312.

      [13] 肖利軍,郭繼昌,顧翔元.一種采用冗余性動(dòng)態(tài)權(quán)重的特征選擇算法[J].西安電子科技大學(xué)學(xué)報(bào),2019,46(5):155-161.

      [14] MOHSEN A,RAHIM T. A gene expression programming model for economy growth using knowledge-based economy indicators[J]. Journal of Modelling in Management,2019,14(1):921-937.

      (責(zé)任編輯:杜能鋼)

      猜你喜歡
      信用風(fēng)險(xiǎn)
      油氣貿(mào)易企業(yè)信用風(fēng)險(xiǎn)管理研究
      化工管理(2022年13期)2022-12-02 09:19:16
      商業(yè)銀行信用風(fēng)險(xiǎn)管理存在的問(wèn)題及解決措施
      淺析我國(guó)商業(yè)銀行信用風(fēng)險(xiǎn)管理
      京東商城電子商務(wù)信用風(fēng)險(xiǎn)防范策略
      PPP項(xiàng)目發(fā)行中期票據(jù)的可能性與信用風(fēng)險(xiǎn)分析
      基于Lasso-logistic 模型的供應(yīng)鏈金融信用風(fēng)險(xiǎn)實(shí)證研究
      個(gè)人信用風(fēng)險(xiǎn)評(píng)分的指標(biāo)選擇研究
      基于無(wú)標(biāo)度網(wǎng)絡(luò)的關(guān)聯(lián)信用風(fēng)險(xiǎn)傳染延遲效應(yīng)
      上市公司信用風(fēng)險(xiǎn)測(cè)度的不確定性DE-KMV模型
      信用風(fēng)險(xiǎn)的誘發(fā)成因及對(duì)策思考
      昌江| 冷水江市| 新乐市| 紫云| 昂仁县| 平舆县| 南阳市| 广水市| 通江县| 延川县| 墨竹工卡县| 锡林郭勒盟| 台州市| 龙胜| 阿克苏市| 林周县| 个旧市| 兰西县| 洛南县| 黎平县| 芦山县| 虞城县| 呼和浩特市| 承德市| 安康市| 桂林市| 崇仁县| 奈曼旗| 晋宁县| 黄山市| 乌鲁木齐市| 洛隆县| 克拉玛依市| 穆棱市| 工布江达县| 鄂伦春自治旗| 湾仔区| 高密市| 土默特右旗| 灌云县| 襄城县|