• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于混合蛙跳算法優(yōu)化SVM的個(gè)人信用風(fēng)險(xiǎn)評估

      2020-09-18 07:26:02陸云峰
      黑龍江科學(xué) 2020年18期
      關(guān)鍵詞:蛙跳信用風(fēng)險(xiǎn)適應(yīng)度

      王 妍,陸云峰

      (江蘇商貿(mào)職業(yè)學(xué)院,江蘇 南通 226011)

      1 支持向量機(jī)

      支持向量機(jī)(SVM)可分為線性支持向量機(jī)和非線性支持向量機(jī)。對于非線性問題,可以通過定義一種映射來把原空間中的非線性問題轉(zhuǎn)化為新空間中的(C,g)線性問題,然后求解最優(yōu)分類面,這個(gè)新空間通常是高維的。從理論上來說,用這種轉(zhuǎn)化可以把相對比較復(fù)雜的問題用簡單的線性判別函數(shù)來解決。但轉(zhuǎn)化后新空間的維度通常比較高,經(jīng)常會出現(xiàn)“維數(shù)災(zāi)難”的問題,為問題處理帶來了新的困難,因此SVM需要一種能夠避免在高維空間中直接求解的方法[1]。

      如今,大部分建立的SVM模型中都采用了RBF核函數(shù),因?yàn)槠鋮?shù)較少且分類正確率高而成為了首選的核函數(shù)。本研究建立SVM模型所采用的核函數(shù)也是RBF核函數(shù),RBF的徑向作用范圍是被其寬度參數(shù)g所控制的。懲罰參數(shù)C是用來調(diào)節(jié)SVM建立的最優(yōu)分類超平面對樣本進(jìn)行分類時(shí)的間隔大小與分類準(zhǔn)確度之間的妥協(xié)偏好權(quán)重。對此,選取適合的 RBF核函數(shù)參數(shù)g和SVM懲罰參數(shù)C就變成了目前需要解決的關(guān)鍵性問題[2]。

      2 利用混合蛙跳算法進(jìn)行SVM超參數(shù)優(yōu)化

      混合蛙跳算法進(jìn)行超參數(shù)尋優(yōu)的具體過程:步驟1:青蛙種群初始化,設(shè)置青蛙個(gè)數(shù)、子蛙群數(shù)目、混合迭代次數(shù)和子蛙群中局部迭代次數(shù)。步驟2:計(jì)算每一個(gè)青蛙個(gè)體的適應(yīng)度值,運(yùn)用3折交叉驗(yàn)證(3-CV)方法計(jì)算出每一個(gè)個(gè)體的平均分類準(zhǔn)確率(CVA)即為適應(yīng)度值,CVA越高,適應(yīng)度值越高。步驟3:把所有青蛙個(gè)體按適應(yīng)度大小從優(yōu)到劣排序,按一定規(guī)則把青蛙個(gè)體分配到各個(gè)子蛙群中。步驟4:運(yùn)用更新策略對子蛙群中適應(yīng)度最差的個(gè)體進(jìn)行更新,以得到一個(gè)較好的解。步驟5:對子蛙群中的個(gè)體再按適應(yīng)度大小進(jìn)行排序,并轉(zhuǎn)到步驟4,重復(fù)這一操作,直至達(dá)到事先設(shè)定的局部迭代次數(shù)。步驟6:當(dāng)所有子蛙群都完成了局部搜索后,若滿足混合迭代次數(shù),則算法結(jié)束,輸出最優(yōu)目標(biāo)值和最優(yōu)超參數(shù)組(C,g),否則返回步驟2。

      3 指標(biāo)與數(shù)據(jù)說明

      本研究數(shù)據(jù)來源于第五屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽。該數(shù)據(jù)為某銀行的個(gè)人信貸數(shù)據(jù),包含了1 000條樣本數(shù)據(jù),每條樣本數(shù)據(jù)有16個(gè)特征,前15個(gè)特征是有關(guān)貸款人的各種信用特征,如銀行賬戶狀態(tài)、個(gè)人居住情況、年齡等。最后一個(gè)特征是貸款人的違約情況,主要分為兩類,0為正常,1為違約。

      選取年齡、信用歷史、婚姻關(guān)系、是否為外籍人士、個(gè)人居住情況、在這家銀行現(xiàn)有的信貸數(shù)量等15個(gè)信用評估特征作為輸入變量。其中,銀行賬戶狀態(tài)的持續(xù)月份、信用保證金、年齡為連續(xù)變量,其余12個(gè)皆為名義變量。對于名義變量需要進(jìn)行量化處理。為解決上述問題,本研究采用了One-Hot編碼。

      因?yàn)楸狙芯康闹攸c(diǎn)是評估貸款人是否存在違約風(fēng)險(xiǎn),所以將貸款用戶是否具有違約風(fēng)險(xiǎn)的結(jié)果作為信用風(fēng)險(xiǎn)評估模型的輸出變量,記為y。將存在違約風(fēng)險(xiǎn)的客戶記為1,將不存在違約風(fēng)險(xiǎn)的客戶記為0。在建立個(gè)人信用風(fēng)險(xiǎn)評估模型之前,要先利用分層抽樣和隨機(jī)抽樣來確定訓(xùn)練樣本集和測試樣本集。

      4 實(shí)驗(yàn)研究

      本研究實(shí)驗(yàn)平臺為Intel(R) Core(TM) i5-4460 CPU, 8GB RAM, Windows 7操作系統(tǒng),開發(fā)環(huán)境為Matlab R2012a,支持向量機(jī)軟件LIBSVM。先進(jìn)行參數(shù)設(shè)置。青蛙個(gè)體數(shù)為20,子蛙群數(shù)為2,子蛙群中局部迭代次數(shù)為2,混合迭代次數(shù)為50,允許青蛙更新的最大步長Dmax為1.2,懲罰參數(shù)C的搜索范圍為[0.01,100],核函數(shù)參數(shù)搜索范圍為[0.01,100]。

      實(shí)驗(yàn)?zāi)繕?biāo)函數(shù)為尋找最優(yōu)分類準(zhǔn)確率(CVA),CVA越高,最佳適應(yīng)度越大。圖1為SFLA迭代曲線圖,當(dāng)SFLA進(jìn)化到第10代時(shí),此時(shí)誤差達(dá)到最小,為8.6,CVA最高,蛙群中最佳適應(yīng)度已經(jīng)穩(wěn)定在最大值。此時(shí)取得SVM最優(yōu)C和g參數(shù)為47.596 5和23.925 0,其對應(yīng)最優(yōu)CVA為91.4%。由此可見,SFLA能夠有效搜索SVM模型的C和g參數(shù),尋優(yōu)用時(shí)為30.073 6 s。

      圖1 SFLA迭代曲線Fig.1 SFLA iterative curve

      圖2 SFLA優(yōu)化(C,g)的搜索位置圖Fig.2 Search location map of SFLA optimization (C,g)

      圖2為SFLA優(yōu)化(C,g)搜索位置圖。其中X軸為青蛙個(gè)體對超參數(shù)C進(jìn)行的搜索范圍,Y軸為青蛙個(gè)體對超參數(shù)g搜索范圍。由圖可見,歷代青蛙個(gè)體對超參數(shù)C的搜索優(yōu)化位置大都分布在[35,65]區(qū)域中,對超參數(shù)g的搜索優(yōu)化位置大都分布在[10,40]內(nèi)。

      運(yùn)用SFLA對SVM超參數(shù)進(jìn)行尋優(yōu),取得了最優(yōu)超參數(shù)組(C,g),并與訓(xùn)練樣本建立了基于SFLA-SVM的個(gè)人信用風(fēng)險(xiǎn)評估模型。為了檢驗(yàn)該模型的性能,用該模型對測試樣本進(jìn)行了測試,測試準(zhǔn)確率為90%。為了驗(yàn)證SFLA-SVM模型的優(yōu)越性,保持實(shí)驗(yàn)數(shù)據(jù)不變,分別采用網(wǎng)格搜索法(Grid Search,GS)和遺傳算法(Genetic Algorithm,GA)對SVM超參數(shù)C和g進(jìn)行優(yōu)化,并建立了GS-SVM模型和GA-SVM模型,進(jìn)而對個(gè)人信用風(fēng)險(xiǎn)進(jìn)行評估,得到的實(shí)驗(yàn)數(shù)據(jù)如表1所示。

      表1 SFLA-SVM、GS-SVM和GA-SVM模型實(shí)驗(yàn)數(shù)據(jù)對比Tab.1 Comparison of experimental data of SFLA-SVM, GS-SVM and GA-SVM

      由表1可知,SFLA-SVM和GA-SVM模型在最優(yōu)CVA、尋優(yōu)時(shí)間和預(yù)測準(zhǔn)確率三個(gè)方面都優(yōu)于GS-SVM模型?;旌贤芴惴ê瓦z傳算法找到的最優(yōu)CVA都為91.4%,對于測試集的預(yù)測準(zhǔn)確率也都為90%。但從尋優(yōu)速度來看,混合蛙跳算法比遺傳算法要快,故基于SFLA-SVM模型的個(gè)人信用風(fēng)險(xiǎn)評估效果最好。

      5 總結(jié)

      本研究運(yùn)用SVM模型對個(gè)人信用風(fēng)險(xiǎn)進(jìn)行評估。因?yàn)镾VM模型性能與其相關(guān)超參數(shù)的選取有著很大的關(guān)聯(lián),所以將SFLA引入到了SVM中來進(jìn)行超參數(shù)的尋優(yōu),從而建立信用風(fēng)險(xiǎn)評估模型。為了驗(yàn)證該模型的性能,與在相同數(shù)據(jù)下建立的GS-SVM模型和GA-SVM模型進(jìn)行信用風(fēng)險(xiǎn)評估的效果對比。結(jié)果表明,SFLA-SVM模型擁有更好的信用評估效果。

      猜你喜歡
      蛙跳信用風(fēng)險(xiǎn)適應(yīng)度
      改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
      “三層七法”:提高初中生三級蛙跳能力的實(shí)踐研究
      淺析我國商業(yè)銀行信用風(fēng)險(xiǎn)管理
      京東商城電子商務(wù)信用風(fēng)險(xiǎn)防范策略
      基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
      中國塑料(2016年11期)2016-04-16 05:26:02
      個(gè)人信用風(fēng)險(xiǎn)評分的指標(biāo)選擇研究
      信用風(fēng)險(xiǎn)的誘發(fā)成因及對策思考
      一種改進(jìn)的混合蛙跳算法及其在水浴牽伸控制中的應(yīng)用
      基于新型蛙跳算法的帶阻塞流水線調(diào)度問題
      西盟| 大悟县| 新田县| 渝中区| 玉山县| 隆昌县| 满城县| 海城市| 龙南县| 濮阳市| 高邑县| 拜泉县| 游戏| 娱乐| 拜泉县| 武隆县| 桐乡市| 拜泉县| 德兴市| 峨山| 达日县| 南昌县| 辽宁省| 油尖旺区| 察哈| 万盛区| 凤翔县| 南丰县| 夹江县| 义马市| 吉木萨尔县| 天长市| 平谷区| 兰坪| 镇宁| 江门市| 富裕县| 上饶市| 达拉特旗| 隆昌县| 三都|