• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于ODR-ADASYN-SVM的極端金融風險預警研究①

      2016-06-24 06:06:46淳偉德黃登仕
      管理科學學報 2016年5期
      關鍵詞:預警模型支持向量機

      林 宇, 黃 迅, 淳偉德, 黃登仕

      (1. 成都理工大學商學院, 成都 610059; 2. 西南交通大學經濟管理學院, 成都 610031)

      基于ODR-ADASYN-SVM的極端金融風險預警研究①

      林宇1, 黃迅1, 淳偉德1, 黃登仕2

      (1. 成都理工大學商學院, 成都 610059; 2. 西南交通大學經濟管理學院, 成都 610031)

      摘要:針對合成少數(shù)類過采樣(synthetic minority over-sampling technique, SMOTE)方法在提升支持向量機(support vector machine, SVM)的非均衡樣本學習能力中出現(xiàn)的過擬合(over fitting),引入自適應合成抽樣方法(adaptive synthetic sampling approach, ADASYN)和逐級優(yōu)化遞減欠采樣方法(optimization of decreasing reduction, ODR)分別克服SMOTE在生成新樣本中的盲目性和在處理對象上的局限性,進而與SVM相結合,構造出改進SVM,即ODR-ADASYN-SVM模型來預測中國極端金融風險;最后運用T檢驗對各模型預測精度的差異性進行顯著性檢驗以及對各模型的預測穩(wěn)定性進行評價.實證結果表明, ODR-ADASYN-SVM模型不僅能夠顯著地提升SVM的非均衡樣本學習能力,同時也能夠有效地克服SMOTE的過擬合,從而展示出優(yōu)越的極端金融風險預測性能.

      關鍵詞:ODR; ADASYN; 支持向量機; 極端金融風險; 預警模型

      0引言

      近年來爆發(fā)的次貸危機、歐債危機等金融風險危機事件,不僅給各國經濟帶來了沉重打擊,也使金融風險預警面臨著更為嚴峻的挑戰(zhàn).因此,建立科學的風險預警模型,準確地識別并有效地防范和控制風險,以維護金融經濟安全,促進經濟社會和諧穩(wěn)定,既是新形勢下金融經濟管理部門面臨的重要任務,也是學術界關注的熱點問題.

      然而,無論是對金融經濟管理部門還是對投資者來說,都更關注金融市場極端下滑(extreme downside)所引發(fā)的極端金融風險(extremely financial risk)[1].這是因為,極端金融風險盡管發(fā)生概率極小,但一旦發(fā)生,就不僅會給投資者帶來巨大損失,或是滅頂之災,甚至還可能引起社會動蕩、政權解體等嚴重后果.因此,探討極端金融風險的有效預警方法具有至關重要的現(xiàn)實意義.

      在這里需要指出的是,自從1997年東南亞金融危機發(fā)生以來,極端金融風險預警就一直都是學術界關注的焦點與熱點.學者們已運用概率比(probit)回歸、橫截面回歸(STV)、信號法(KLR模型)、邏輯(Logit)回歸、神經網絡(neural network, NN)等模型對金融風險危機預警展開了研究[2-6],雖然在預測極端金融風險上都取得了較好的效果,但卻存在前提條件過于苛刻、過學習、欠學習以及局部極小等問題[7].而SVM[8]運用計算機智能技術自動確定模型結構,不僅能有效克服上述模型所存在的問題,而且也具有優(yōu)越的智能學習與智能預測能力,因而被廣泛運用于風險預警中且取得了良好的研究效果[9].然而,SVM的良好預測性能卻需要依賴數(shù)量相同的不同類別樣本進行學習才能獲得,事實上,現(xiàn)實生活中大量存在的樣本卻往往屬于非均衡的[10],如金融市場中的極端與非極端金融危機事件所分別代表的少數(shù)和多數(shù)類樣本就正好構成一類典型的非均衡樣本.如果仍然運用SVM對這樣一類非均衡樣本進行學習,就很可能會造成SVM的分類超平面(separating hyperplane)向極端金融危機事件所代表的少數(shù)類樣本偏移,從而導致該類樣本被大量錯分,最終降低SVM的預測性能[11].由此可見,非均衡樣本使得SVM學習面臨嚴峻的挑戰(zhàn),因而就必須改進SVM模型,以提升SVM的非均衡樣本學習能力.

      盡管學者們已研究出多種方法,尤其是研究出SMOTE方法[12]來提升分類模型的非均衡樣本學習能力.但在SMOTE方法中,每個少數(shù)類樣本都盲目地生成相同數(shù)量的人造樣本,卻忽略了其鄰近樣本的分布特點,因而容易造成少數(shù)類樣本的相互重疊.同時,SMOTE也僅僅處理少數(shù)類樣本,無法實現(xiàn)對多數(shù)類樣本的處理.因此,SMOTE方法在生成少數(shù)類樣本中的盲目性以及在處理對象上的局限性,使得分類模型不僅容易錯分少數(shù)類樣本,而且也無法有效刪除多數(shù)類樣本中的噪聲信息,從而出現(xiàn)不能準確預測少數(shù)類樣本的過擬合問題[13].而ADASYN[14]卻是專門針對SMOTE的盲目性而設計的解決方法,它利用少數(shù)類樣本的密度分布來計算少數(shù)類樣本生成的數(shù)量,使學習困難的少數(shù)類樣本生成更多的人造樣本,以增強分類模型的學習能力.同時,ODR[15]利用K最鄰近規(guī)則(K-nearest neighbor,KNN)來計算多數(shù)類樣本對鄰近樣本的影響程度,進而依次刪除對分類模型的學習能力有負面影響或者影響不大的多數(shù)類樣本,以實現(xiàn)對多數(shù)類樣本有目的的篩選,從而有效克服SMOTE在處理對象上存在的局限性.由此可見,將ADASYN和ODR相結合,既能有效地克服SMOTE在生成少數(shù)類樣本中的盲目性,又能有效地克服SMOTE在處理對象上的局限性,因而在提升非均衡樣本學習能力上具有十分顯著的優(yōu)勢.但令人遺憾的是,就本文所掌握的文獻而言,尚未發(fā)現(xiàn)有學者將ADASYN與ODR相結合以提升分類模型的非均衡樣本學習能力.

      值得注意的是,中國金融市場成立時間較短,缺乏應對金融風險危機的成熟經驗,在極端金融風險的控制與防范上還存在諸多薄弱性[16-17];與此同時,隨著經濟全球化的深入發(fā)展,中國金融市場與國外金融市場的聯(lián)系日益密切,因而極易受到國外極端金融風險的傳染與沖擊,從而承受著更為艱巨的風險考驗,面臨著更為嚴峻的風險挑戰(zhàn)[18-19].那么,能否將ODR、ADASYN與SVM相結合,構建出適合中國金融市場的極端金融風險預警方法?如果能,那么在極端金融風險的預測上,構建的預警模型又是否較SVM、SMOTE-SVM、ODR-SVM以及ADASYN-SVM預警模型具有更為明顯的優(yōu)勢呢?

      基于以上分析,本文以滬深300指數(shù)(China securities index 300, CSI300)為研究對象,既引入ADASYN來克服SMOTE在生成新樣本中的盲目性.又針對SMOTE在處理對象上的局限性,引入ODR來刪除非極端金融風險樣本中的噪聲信息;并與SVM相結合,提出改進SVM,即ODR-ADASYN-SVM預警模型來預測中國極端金融風險.進而運用性能評估指標對SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM以及ODR-ADASYN-SVM模型的預測精度進行評估,并運用T檢驗對各模型預測精度的差異性進行顯著性檢驗并對各模型的預測穩(wěn)定性進行評價,以充分展示出ODR-ADASYN-SVM模型在預測性能上的顯著優(yōu)越性,從而為金融經濟管理部門及時控制與防范極端金融風險以及投資者制定合理的投資策略提供良好的決策借鑒.

      目前,國內外已有部分學者運用SVM對金融市場風險預警展開了研究.Ahn等[20]以韓國金融市場為研究對象,建立了SVM金融市場風險預警系統(tǒng);Groth和Muntermann[21]又以文本信息為研究對象,運用支持向量機(SVM)、神經網絡(NN)、貝葉斯(Bayes)等方法,探索了金融市場風險危機管理;徐國祥和楊振建[22]將主成分分析方法(principle component analysis, PCA)、遺傳算法(genetic algorithm, GA)和SVM相結合,構建了PCA-GA-SVM預警模型,并對滬深300指數(shù)和大盤股走勢進行了預測研究;李云飛和惠曉峰[23]運用SVM建立了股票投資價值分類模型,并與BP和RBF神經網絡的預測性能進行了比較.

      與本文所掌握的研究文獻相比,本文的差異性顯而易見.1)尚未發(fā)現(xiàn)有文獻集成ODR和ADASYN來克服SMOTE所存在的過擬合,尤其是沒有發(fā)現(xiàn)有文獻將SVM與該技術相結合,對中國新興金融市場(本文用CSI300作為中國新興金融市場的代表)的極端金融風險展開預警研究;2)除運用常用指標來評價非均衡樣本分類模型的性能之外,本文尤其是運用T檢驗對模型預測精度的差異性進行顯著性檢驗,以及對各模型的預測穩(wěn)定性進行評價;3)在提取能夠顯著刻畫中國新興金融市場極端金融風險的特征指標上,不僅運用統(tǒng)計假設檢驗和逐步判別分析法來提取市場內部特征指標,還運用Copula方法專門對市場外部特征指標進行了提取,從而使得提取出的特征指標能夠更為全面而顯著地刻畫中國新興金融市場的極端金融風險.

      1研究方法

      1.1極端金融風險SVM預警方法

      y(i)=sgn(f(x))

      (1)

      式中sgn(f(x))是符號函數(shù);f(x)是以特征指標變量為自變量的決策函數(shù).當金融市場處于極端金融風險狀態(tài)時,y(i)=sgn(f(x))=+1;否則,就為-1.

      運用SVM方法在訓練集上尋找最優(yōu)分類函數(shù)(即式(1)代表的極端金融風險預警模型),就需要將尋找最優(yōu)分類函數(shù)轉化為求解以下最優(yōu)問題

      (2)

      (3)

      為了求解上述最優(yōu)問題,就要利用拉格朗日乘子(Lagrangemultiplier)法將上述最優(yōu)問題轉化為對偶(dual)問題

      (4)

      (5)

      0≤αj≤C,j=1,2,…,m

      (6)

      于是,通過求解上述對偶問題,就得到以下最優(yōu)分類函數(shù)f(x)=sgn(w*x+b*)

      (7)

      其中

      (8)

      至此,極端金融風險預警的SVM方法就已構建完畢.然而,正如前文所分析的那樣,由極端與非極端金融風險樣本所構成的非均衡訓練樣本會大大削弱SVM的學習能力,最終降低SVM對極端金融風險樣本預測的精度.因此,下文將重點探討能夠提升SVM的非均衡樣本學習能力的有效方法,以降低數(shù)據的過度偏斜對SVM預測極端金融風險樣本所造成的影響.1.2提升SVM預測性能的ODR-ADASYN方法

      為克服SMOTE在生成新樣本中的盲目性以及在處理對象上的局限性,本文運用ODR和ADASYN方法來改進SMOTE,以提升SVM的極端金融風險預測性能.

      假定訓練樣本集為S,其中非極端金融風險樣本集為Smaj,極端金融風險樣本集為Smin,x屬于Smaj中的樣本.定義樣本x的關聯(lián)集是指Smaj中除x以外的其他非極端金融風險樣本的K個最鄰近樣本中包含x的樣本集,簡稱為關聯(lián)集x.則ODR-ADASYN的計算機實驗步驟如下:

      步驟1根據式(9),計算出需要刪除的非極端金融風險樣本數(shù)量Num

      (9)

      其中α∈[0,1],表示刪除指定的非極端金融風險樣本后期望得到的樣本非均衡水平,若α=1,則表示刪除指定的非極端金融風險樣本后,兩類樣本數(shù)量達到完全均衡;

      步驟2計算出非極端金融風險樣本集中每個樣本的關聯(lián)集;

      步驟3就樣本x而言,運用KNN算法對關聯(lián)集x中的所有樣本進行分類,能夠被正確分類的個數(shù)記錄為withx;

      步驟4從關聯(lián)集x包含的所有樣本的最鄰近樣本中將樣本x刪除,并將第K+1個最鄰近樣本加入,再運用KNN算法對關聯(lián)集x中的所有樣本進行分類,能夠被正確分類的個數(shù)記錄為withoutx;

      步驟5根據式(10),計算withx與withoutx的差值diffdiff=withx-withoutx

      (10)

      并通過下式判斷diff與0的大小關系來定義樣本x的屬性

      (11)

      其中N代表噪聲樣本,B代表邊界樣本,S代表安全樣本;

      步驟6根據步驟3至步驟5,定義出Smaj中除樣本x外的其余每個非極端金融風險樣本的屬性;

      步驟7根據步驟6定義出的樣本屬性,保留Smaj中的邊界樣本且刪除噪聲樣本,并針對安全樣本作下一步處理;

      (12)

      (13)

      從式(13)可知,當合成數(shù)量為Numnew的人造極端金融風險樣本后,兩類樣本數(shù)量就達到了完全均衡;

      步驟10對每一個極端金融風險樣本xi而言,從所有樣本中找出其K個最鄰近樣本,并根據下式計算出最鄰近樣本中非極端金融風險樣本的占比ri

      (14)

      其中Δi∈[0,1],指K個最鄰近樣本中屬于非極端金融風險樣本的個數(shù);

      (15)

      (16)

      步驟12計算出每一個極端金融風險樣本需要合成的人造樣本個數(shù)gi

      (17)

      步驟13對每一個極端金融風險樣本xi而言,都運用SMOTE方法合成gi個極端金融風險樣本,此時兩類樣本數(shù)量達到一致.

      需要說明的是,步驟1至步驟8是ODR的實驗步驟,步驟9至步驟13是ADASYN的實驗步驟.于是,就能夠基于上述ODR-ADASYN的實驗步驟平衡非均衡的訓練樣本,進而運用SVM對得到的均衡訓練樣本進行訓練,最后再基于測試樣本對通過訓練得到的SVM模型進行性能測試與評價.

      1.3極端金融風險預警模型的性能評估指標

      基于均衡樣本構建預警模型時,通常以分類準確率為評估指標來評價模型性能.然而,當樣本非均衡時,該指標僅能刻畫模型的整體預測性能,卻無法有效地評估模型對于極端金融風險樣本的預測性能[27].基于此,本文運用目前針對非均衡樣本分類的常用評估指標——幾何平均正確率Gmean、少數(shù)類的Fmeasure和AUC(area under ROC curve)值,對本文所提出的極端金融風險預警模型進行性能評估(以下用G和F分別代替Gmean和Fmeasure).3種評估指標的構建過程如下:

      表1 二分類數(shù)據集的混淆矩陣

      根據混淆矩陣并通過下面3個式子就可以得到靈敏度SE、特異度SP和極端金融風險樣本查準率P3類基本指標

      (18)

      (19)

      (20)

      于是,再根據上述3類基本指標并通過下面兩式就得到幾何平均正確率G以及少數(shù)類的F

      (21)

      (22)

      其中幾何平均正確率G綜合考察了模型對于兩類樣本的預測性能,若G較大,則說明模型預測兩類樣本的精度都較高,反之亦然;而少數(shù)類樣本的F主要考察了模型對極端金融風險樣本的預測性能,若F較大,就說明模型預測極端金融風險樣本的性能較優(yōu)越,反之亦然.此外,AUC代表受試者工作特征曲線(receiver operating characteristic, ROC)下方的面積.面積越大,說明模型對兩類樣本的綜合預測性能越優(yōu)異.

      2實證結果與分析

      2.1樣本選擇

      本文選取滬深300指數(shù)(CSI300)2005-04-08~2012-12-31的樣本作為研究對象.需要說明的是,之所以選擇CSI300進行研究,原因在于CSI300包含了滬深股市60%左右的市值,被視為反映滬深兩市整體走勢的“晴雨表”,具有良好的市場代表性[22,28-29],而之所以選擇從CSI300創(chuàng)建以來至2012年末這段時間為研究區(qū)間,是因為滬深股市在這段時間內經歷了暴漲暴跌的全過程,從而使滬深股市整體走勢的預測結果具有更強的說服力.

      2.2狀態(tài)指標變量的確定

      要確定出所選每個樣本的狀態(tài)指標變量,即確定出所選的每個樣本究竟屬于極端金融風險樣本還是非極端金融風險樣本,關鍵在于選擇極端金融風險門檻值.只有選擇出門檻值,才能以該門檻值為標準,將超過門檻值的樣本認定為極端金融風險樣本,未超過門檻值的樣本認定為非極端金融風險樣本,以確定出所有樣本的狀態(tài)指標變量,從而才能進一步開展預警模型的構建工作.

      需要指出的是,目前還沒有確定門檻值的最優(yōu)數(shù)學理論模型.Hill[30]嘗試運用Hill圖法來確定門檻值;Stelios和Dimitris[31]則運用了超額均值函數(shù)(mean excess function, MEF)圖法來確定門檻值;而Neftci[32]把1.65σ當作門檻值,超過1.65σ的值被作為極端金融風險樣本;另外,DuMouchel[33]選擇了10%左右的數(shù)據作為極端金融風險樣本進行研究,取得了較好的研究效果.因此,本文選取占總體樣本9%的收益率最低的樣本作為極端金融風險樣本,即極值尾部.由于根據極值理論(extreme value theory, EVT),對于充分高的門檻值,超過門檻值的樣本都近似服從廣義帕累托分布(generalized Pareto distribution, GPD)簇,用下式表示

      (23)

      其中k表示超過門檻值的極端金融風險樣本的個數(shù);Fk(x)為極值分布函數(shù);Gξ,β(x)為GPD簇分布函數(shù).因此,本文還對這些極值尾部樣本用準極大似然估計方法(quasi maximum likelihood estimation, QMLE)估計GPD簇分布函數(shù)的參數(shù)得到尾部GPD分布曲線與經驗分布的擬合效果圖(見圖1).從圖1可以直觀地看出,GPD與經驗分布具有較好的擬合效果,說明設定的極端金融風險樣本門檻值是科學合理的.此時,極端與非極端金融風險樣本的非均衡比例達到1∶10.

      圖1 CSI 300標準收益尾部經驗分布與GPD分布擬合效果圖

      2.3特征指標變量的選擇與提取

      金融風險管理的目標在于建立有效的風險預警系統(tǒng).而風險預警的重點又在于準確地提取出誘發(fā)金融市場爆發(fā)極端風險的特征指標.但極端風險的爆發(fā),不僅是市場自身風險的累積,也有外部極端風險危機的傳導作用.因此,本文通過借鑒相關文獻[22,34]選擇出由8項股指基本指標構成的內部特征指標.同時,由于相關文獻[35-36]將具有代表性的國際金融市場作為了中國金融市場的外部風險危機因素,又考慮到收益率是反映市場綜合信息的重要指標,因此,本文將8個具有代表性的國際金融市場的股指日收益率作為了外部特征指標(見表2).

      表2 極端金融風險預警模型的特征指標

      注:樣本的特征指標數(shù)據來源于雅虎財經(http://finance.yahoo.com).

      然而,最終用于預警的指標不僅是可以量化的,而且還需要存在顯著差異,這樣才可以起到預警效果.同時,宋新平和丁永生[26]也指出,預警是個多指標的復雜系統(tǒng),提取合適的特征指標可以有效地提升模型的性能.因此,為了從上述指標中進一步提取出能夠顯著刻畫中國新興金融市場極端風險的市場內外部特征指標,本文還將對表2中的國外股市指標和基本指標分別作如下處理.

      一方面,為了提取出對中國極端風險的爆發(fā)具有顯著傳導作用的外部特征指標,本文運用Clayton Copula對CSI 300日收益率和表2中的前8項國外股指日收益率的下尾相關性進行分析.這是因為下尾相關性能夠反映兩個市場同時暴跌的概率,這正好能夠刻畫外部極端金融風險對中國極端金融風險的影響程度[37].而Clayton Copula又恰好是專門刻畫下尾相關性的Copula模型.由此,計算出CSI 300與各國外股指間的下尾相依系數(shù)(見表3).

      表3 CSI 300與其余收益率之間的下尾相依系

      從表3可以看出,CSI 300與HSI、KOSPI和TWII的下尾相依系數(shù)大于0.1,與Nikkei 225和FTSE 100的下尾相依系數(shù)小于0.1,而與美國股市3大指數(shù)(GSPC,NASDAQ和DJIA)的下尾相依系數(shù)幾乎為0.從而說明,CSI300與HSI、KOSPI和TWII的下尾相關性較高,與Nikkei 225和FTSE 100的下尾相關性較低,而與美國股市3大指數(shù)(GSPC,NASDAQ和DJIA)幾乎不存在下尾相關性.基于此,本文選擇與CSI 300下尾相關性較高的HSI、KOSPI和TWII的日收益率作為最終的外部特征指標.

      另外,為了檢驗上述提出的Clayton Copula模型是否充分描述了CSI 300與國外股指之間的下尾相依關系,本文還將進行卡方檢驗,結果見表4.從表4可見,在5%的顯著性水平下,各卡方檢驗值都通過了擬合優(yōu)度檢驗,由此證明CSI 300與國外股指存在的相依結構科學合理.另外,由于CSI300與HSI、KOSPI和TWII在2005-04-08~2012-12-31這段區(qū)間內的樣本不匹配而出現(xiàn)缺失數(shù)據,因此,針對這些缺失數(shù)據,本文的處理方式是假如某個市場因節(jié)假日而沒有進行交易,則其余市場的當日樣本數(shù)據就被刪除.最終選擇出1 767個樣本進行研究.

      另一方面,為提取出能夠顯著區(qū)分風險狀態(tài)的內部特征指標,本文還借鑒相關文獻[26, 38]提出的統(tǒng)計假設檢驗方法和逐步判別分析法對表1中后8項基本指標進行提取.首先對這8項基本指標進行正態(tài)性檢驗,進而對符合與不符合正態(tài)分布的基本指標分別做單樣本T檢驗和K-S檢驗,從中提取出若干基本指標;然后,運用逐步判別分析法進一步提取基本指標;最終將這8項基本指標約簡為開盤價、收盤價、成交量和成交額這4項基本指標.并與通過Clayton Copula提取出的HSI、KOSPI和TWII日收益率這3項國外股市指標共同構成最終的能夠顯著刻畫中國新興金融市場極端金融風險的市場內外部特征指標.

      表4 卡方檢驗統(tǒng)計量

      2.4最優(yōu)ODR-ADASYN-SVM預警模型的確立

      在將SVM的核函數(shù)設為RBF核函數(shù)、懲罰參數(shù)C設為0.5、核函數(shù)參數(shù)γ設為0.5的基礎上,本文采用10折交叉驗證法(cross validation, CV)對ODR與ADASYN的最鄰近參數(shù)K以及ODR中的參數(shù)α進行討論,從而選擇出性能最優(yōu)的ODR-ADASYN-SVM模型.需要強調的是,之所以將懲罰參數(shù)C值與核函數(shù)參數(shù)γ值都設為0.5,是因為本文經過反復實驗,最后確定模型在這兩個值上的預測效果最為理想.本文主要使用Matlab 2011b進行編程分析.實驗結果如圖2和圖3所示.

      圖2不同最鄰近參數(shù)K下,參數(shù)α對模型預測精度的影響

      Fig.2 Influence of parameter alpha on prediction accuracy in different nearest neighborK

      圖3 不同參數(shù)α下,最鄰近參數(shù)K對模型預測精度的影響

      從圖2可以看出,不論K取何值,隨著參數(shù)α的增大,特別是當α>0.7時,模型的F和G值都同時呈現(xiàn)出明顯的下降趨勢,但當α≤0.7時,模型的F和G值卻無明顯的波動.此外,當α>0.8時,模型的AUC值同樣也下降明顯,但當α≤0.8時,模型的AUC值卻無明顯波動.由此說明,盡管ODR能夠有效地刪除非極端金融風險樣本的噪聲信息,但過大的α會使得ODR過多地刪除有效的非極端金融風險樣本,最終降低模型的預測精度.

      而從圖3可以看出,在絕大部分的α值下,隨著K的增大,模型的G、F和AUC值都無明顯波動,從而說明K對模型的預測精度影響不大.分析原因,主要在于當樣本的非均衡水平較高時,極端金融風險樣本的數(shù)量十分稀少,這使得每個樣本的K個最鄰近樣本中屬于極端金融風險類的樣本較少且數(shù)量較為固定,并不會隨著K的增大而增加,從而使得模型的預測精度較為穩(wěn)定.

      基于上述分析,本文認為,選擇合適的α,對于構建精度最優(yōu)的ODR-ADASYN-SVM預警模型起著至關重要的作用.因而,再次分析圖2和圖3可知,較其余絕大部分α下的ODR-ADASYN-SVM,α為0.1下的ODR-ADASYN-SVM具有最高的預測精度,特別是α為0.1、K為5下ODR-ADASYN-SVM模型的AUC值達到0.703 1,G值達到0.680 4,F(xiàn)值達到0.279 3,相比其他α與K值下的ODR-ADASYN-SVM模型,其預測精度最為優(yōu)異.

      2.5最優(yōu)ODR-ADASYN-SVM模型與其余模型的預測性能對比評估

      盡管通過上述實驗,本文選擇出最優(yōu)的ODR-ADASYN-SVM預警模型,然而,該模型是否有效地提升了SVM的非均衡樣本學習能力并成功地克服了SMOTE的過擬合,這是本文接下來需要繼續(xù)深入探討的內容.

      在將SVM的核函數(shù)設為RBF核函數(shù)、懲罰參數(shù)C設為0.5、核函數(shù)參數(shù)γ設為0.5、最鄰近參數(shù)K設為5、ODR-ADASYN-SVM中ODR的參數(shù)α設為0.1、ODR-SVM中ODR的參數(shù)α設為1的基礎上,本文仍然采用10折交叉驗證法對SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM和ODR-ADASYN-SVM模型的預測性能進行對比研究.實驗結果如表5所示.

      表5 模型預測精度的對比結果

      注:產生NAN的原因在于SVM將CSI300的所有極端金融

      從表5可以看出,SVM模型的預測性能最不理想,尤其是它的G值為0而F值為NAN的實證結果充分說明SVM模型將所有的極端金融風險樣本都錯誤地判定為非極端金融風險樣本,由此證明SVM模型無法有效地預測極端金融風險.從表5還可以看出,ODR-ADASYN-SVM模型在G、F值上都高于SMOTE-SVM、ODR-SVM和ADASYN-SVM模型,而在AUC值上略低于SMOTE-SVM和ADASYN-SVM模型,該結果能夠說明,從預測精度的角度,ODR-ADASYN-SVM模型的預測性能明顯優(yōu)于ODR-SVM模型且略優(yōu)于SMOTE-SVM和ADASYN-SVM模型.

      然而,僅根據各評估指標值就判斷模型的性能還缺少類似于統(tǒng)計學檢驗所具有的科學性與客觀性.因此,本文還將對預測結果進行配對樣本T檢驗,從而檢驗出各模型的預測性能差異是否顯著.檢驗結果如表6所示.

      表6 模型預測性能的配對樣本T檢驗結果

      注:***表示p<0.01,**表示p<0.05, 加粗值表示p>0.1.

      從表6可以看出,SVM與其余模型在G、F和AUC值上的絕大部分配對樣本T檢驗統(tǒng)計量在1%的顯著水平下拒絕零假設(nullhypothesis),即SVM與其余模型的預測性能差異顯著.由此表明,基于預測精度的角度,SVM模型的預測性能顯著低于其余模型,從而證明了SMOTE、ODR、ADASYN以及ODR與ADASYN相結合的ODR-ADASYN能夠提升SVM的非均衡樣本學習能力.此外,從表6還可以看出,ODR-SVM與SMOTE-SVM、ADASYN-SVM、ODR-ADASYN-SVM模型的預測性能也存在顯著差異,表明ODR-SVM模型的預測性能顯著低于SMOTE-SVM、ADASYN-SVM和ODR-ADASYN-SVM模型的預測性能,由此可見,僅僅運用ODR來刪除非極端金融風險樣本中的噪聲信息,以克服SMOTE在處理對象上存在的局限性,而不結合ADASYN來克服SMOTE在生成極端金融風險樣本中的盲目性,并不能十分有效地提升SVM模型的預測性能.令人遺憾的是,從表6中無法觀察到ODR-ADASYN-SVM模型與SMOTE-SVM、ADASYN-SVM模型的預測性能存在顯著差異,因而也就無法充分證明ODR與ADASYN相結合在克服SMOTE的過擬合問題上具有顯著優(yōu)勢.基于此,本文還將從預測穩(wěn)定性的角度來繼續(xù)探討ODR-ADASYN-SVM模型較SMOTE-SVM和ADASYN-SVM模型的顯著優(yōu)越性.

      為了對比ODR-ADASYN-SVM模型與SMOTE-SVM、ADASYN-SVM模型的預測穩(wěn)定性,本文在設置與上述實驗相同參數(shù)的基礎上,通過修改極端金融風險樣本的門檻值,將極端金融風險樣本與非極端金融風險樣本的比例分別設置為1∶5、1∶10、1∶15、1∶20、1∶25、1∶30、1∶35、1∶40、1∶45、1∶50這10個水平,進而對這10個水平下3類模型的預測精度變化情況進行分析,從而判定3類模型的預測穩(wěn)定性,并最終挖掘出3類模型在預測性能上的顯著差異.實驗結果如圖4和表7所示.

      從圖4可以看出,在各種非均衡比例下,ADASYN-SVM的G和AUC值幾乎都高于SMOTE-SVM,并且ADASYN-SVM的波動幅度也小于SMOTE-SVM,而從表7也可以看出,不同非均衡比例下,ADASYN-SVM的G和AUC值的均值都大于SMOTE-SVM,并且ADASYN-SVM的G和AUC值的標準差也明顯小于SMOTE-SVM,證明ADASYN-SVM的波動幅度明顯小于SMOTE-SVM,從而說明在不同的非均衡比例下,ADASYN-SVM模型對兩類樣本共同預測的穩(wěn)定性明顯優(yōu)于SMOTE-SVM模型.

      更為重要是,圖4還展示出ODR-ADASYN-SVM的G和AUC值幾乎都高于ADASYN-SVM和SMOTE-SVM,并且ODR-ADASYN-SVM的波動幅度也最小,同時,從表7也可以看出,ODR-ADASYN-SVM的G和AUC值的均值都大于ADASYN-SVM和SMOTE-SVM,并且ODR-ADASYN-SVM的G和AUC值的標準差都低于0.05,明顯小于ADASYN-SVM和SMOTE-SVM,表明ODR-ADASYN-SVM的波動幅度明顯小于ADASYN-SVM和SMOTE-SVM,從而說明在不同的非均衡比例下,ODR-ADASYN-SVM模型在對兩類樣本的共同預測上具有最優(yōu)的穩(wěn)定性.

      圖4 不同非均衡比例下ODR-ADASYN-SVM、ADASYN-SVM和SMOTE-SVM的G、F和AUC值比較

      注:不帶括號外的值表示均值,帶括號的值表示標準差.

      然而,從圖4卻無法看出3類模型的F值在不同非均衡比例下的大小差異,也看不出各模型F值的波動幅度的差異.盡管通過表7能夠看出在不同非均衡比例下,ODR-ADASYN-SVM的F值的均值大于ADASYN-SVM和SMOTE-SVM,ADASYN-SVM的F值的均值大于SMOTE-SVM,以及ODR-ADASYN-SVM的F值的標準差小于ADASYN-SVM和SMOTE-SVM,ADASYN-SVM的F值的標準差小于SMOTE-SVM,但大小差異都很不明顯,因而無法判定3類模型在極端金融風險預測上穩(wěn)定性的顯著差異,也就更加無法展現(xiàn)3類模型的極端金融風險預測性能的顯著差異.為了展現(xiàn)出3類模型的極端金融風險預測性能的顯著差異性,本文還將對在不同非均衡比例下3類模型的F值進行獨立樣本T檢驗.實驗結果見表8.

      表8 不同非均衡比例下3類模型F值的獨立樣本T檢驗結果

      注:未加括號的值表示ODR-ADASYN-SVM的p值, 加下劃線的值表示ADASYN-SVM的p值, 而加有括號的值表示SMOTE-SVM的p值, *表示p<0.1,**表示p<0.05,***表示p<0.01, 加粗值表示p>0.1.

      分析表8可知,ODR-ADASYN-SVM模型加粗的p值達到9個,帶“***”的p值只有28個;ADASYN-SVM模型加粗的p值有8個,帶“***”的p值有29個;而SMOTE-SVM模型加粗的p值只有6個,帶“***”的p值卻達到31個,說明在10%的顯著水平下,ODR-ADASYN-SVM模型的F值在所有非均衡比例下接受零假設9次,ADASYN-SVM模型接受8次,SMOTE-SVM模型僅接受6次,而在1%的顯著水平下,ODR-ADASYN-SVM模型的F值在所有非均衡比例下拒絕零假設僅28次,ADASYN-SVM拒絕29次,SMOTE-SVM模型卻拒絕31次,從這個角度來說,ODR-ADASYN-SVM模型在各非均衡比例下的預測精度差異最不顯著,其次是ADASYN-SVM模型,而最為顯著的是SMOTE-SVM模型,從而說明,在不同的非均衡比例下,ODR-ADASYN-SVM模型對于極端金融風險樣本預測的穩(wěn)定性優(yōu)于SMOTE-SVM模型和ADASYN-SVM模型,而ADASYN-SVM模型又優(yōu)于SMOTE-SVM模型.

      基于圖4、表7與表8的分析,本文認為,盡管從預測精度分析,ODR-ADASYN-SVM的預測性能并不顯著優(yōu)于SMOTE-SVM和ADASYN-SVM,但從預測穩(wěn)定性分析,ODR-ADASYN-SVM的預測性能顯著優(yōu)于SMOTE-SVM和ADASYN-SVM,而ADASYN-SVM卻又顯著優(yōu)于SMOTE-SVM,從而證明了ADASYN能夠有效地克服SMOTE在生成極端金融風險樣本中的盲目性,但僅僅運用ADASYN并不能最為有效地提升SVM模型的預測性能,只有將ODR與ADASYN相結合來克服SMOTE存在的過擬合,才能促使SVM模型的性能提升達到最為優(yōu)異的效果.

      綜上所述,參數(shù)K對ODR-ADASYN-SVM模型的預測性能影響不大,而參數(shù)α卻對ODR-ADASYN-SVM模型的預測性能有著較大的影響.因此,通過對參數(shù)α的調整,就能夠得到最優(yōu)的ODR-ADASYN-SVM預警模型.并且無論是從預測精度分析,該模型的預測性能顯著優(yōu)于SVM和ODR-SVM模型,還是從預測穩(wěn)定性分析,該模型也顯著優(yōu)于SMOTE-SVM和ADASYN-SVM模型,從而充分證明了將ODR與ADASYN相結合不僅能夠提升SVM的非均衡樣本學習能力,而且比單獨運用ODR和ADASYN來克服SMOTE的過擬合能夠取得更加優(yōu)異的效果.從上述分析可知,由ODR、ADASYN和SVM結合成ODR-ADASYN-SVM模型,能夠較好地預測中國極端金融風險,從而為金融經濟管理部門和投資者應對與防范極端金融風險提供了有效的操作工具.

      3結束語

      本文以CSI300指數(shù)為研究對象,運用EVT理論確定出極端與非極端金融風險樣本,并運用統(tǒng)計假設檢驗和逐步判別分析法提取市場內部特征指標以及運用ClaytonCopula方法提取市場外部特征指標,進而引入ADASYN來克服SMOTE在生成新樣本中的盲目性;針對SMOTE在處理對象上的局限性,還引入ODR來刪除非極端金融風險樣本中的噪聲信息;并與SVM相結合,構造了改進SVM,即ODR-ADASYN-SVM模型,并對該模型的最鄰近參數(shù)K和ODR的參數(shù)α進行討論,進而運用最優(yōu)的ODR-ADASYN-SVM模型來預測中國極端金融風險,然后再運用性能評估指標對SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM以及ODR-ADASYN-SVM模型的預測精度進行評估,并最終運用T檢驗對各模型預測精度的差異性進行顯著性檢驗以及對各模型的預測穩(wěn)定性進行評價.實證結果表明,無論是從預測精度分析,ODR-ADASYN-SVM模型的預測性能顯著優(yōu)于SVM和ODR-SVM模型,還是從預測穩(wěn)定性分析,ODR-ADASYN-SVM模型也顯著優(yōu)于SMOTE-SVM和ADASYN-SVM模型,從而說明ODR-ADASYN方法能夠成功地克服SMOTE的過擬合,并有效地提升SVM的非均衡樣本學習能力,同時,ODR-ADASYN-SVM預警模型在中國極端金融風險預測上具有最為優(yōu)越的預測性能.

      本文的研究能夠為金融經濟管理部門和投資者應對與防范極端金融風險提供可操作性的應用工具與方法.對于金融經濟管理部門而言,能夠運用ODR-ADASYN-SVM模型對未來一段時間內的金融市場極端風險進行準確預測,及時制定并實施應對金融風險危機的相關宏觀經濟政策,從而構建金融市場極端風險危機的“防火墻”,積極地化解與防范金融風險危機,以維護金融市場穩(wěn)定,促進經濟持續(xù)健康發(fā)展;對于投資者而言,能夠運用ODR-ADASYN-SVM模型提前捕獲金融市場風險危機信號,進而即時調整金融資產投資策略,以優(yōu)化金融資產投資組合,從而更為有效地管理金融資產,保證金融資產的保值甚至增值.

      本文提出的風險預警方法,雖然豐富了市場主體對極端金融風險預警的研究手段,但仍需要指出的是,金融市場樣本除存在極端與非極端兩種分類狀態(tài)外,也存在多分類狀態(tài),運用本文提出的風險預警模型將無法進行多分類研究.因此,如何改進SVM方法,并結合非均衡樣本處理方法進行多分類狀態(tài)下的極端金融風險預警研究,將是下一步的主要研究方向.

      參 考 文 獻:

      [1]魏宇. 股票市場的極值風險測度及后驗分析研究[J]. 管理科學學報, 2008, 11(1): 78-88.

      WeiYu.EVTriskmeasuresanditsbacktestinginstockmarkets[J].JournalofManagementSciencesinChina, 2008, 11(1): 78-88. (inChinese)

      [2]FrankelJA,RoseAK.Currencycrashesinemergingmarkets:Anempiricaltreatment[J].JournalofInternationalEconomics, 1996, 41(3/4): 351-366.

      [3]SachsJ,TornellA,VelascoA.Financialcrisesinemergingmarkets:Thelessonsfrom1995[J].BrookingsPapersonEconomicActivity, 1996, 27(1): 147-215.

      [4]KaminskyG,LizondoS,ReinhartCM.LeadingIndicatorsofCurrencyCrises[R].IMFStaffPaper, 1998, 45(1): 1-48.

      [5]陳守東, 楊瑩, 馬輝. 中國金融風險預警研究[J]. 數(shù)量經濟技術經濟研究, 2006, (7): 36-48.

      ChenShoudong,YangYing,MaHui.Thestudyofearly-warningonChinesefinancialrisk[J].TheJournalofQuantitative&TechnicalEconomics, 2006, (7): 36-48. (inChinese)

      [6]KimTY,OhKJ,SohnI,etal.Usefulnessofartificialneuralnetworksforearlywarningsystemofeconomiccrisis[J].ExpertSystemswithApplications, 2004, 26(4): 583-590.

      [7]周敏, 王新宇. 基于模糊優(yōu)選和神經網絡的企業(yè)財務危機預警[J]. 管理科學學報, 2002, 5(3): 86-90.

      ZhouMin,WangXinyu.Pre-warningsystemsofenterprisefinancialcrisisbasedonfuzzyselectionandartificialneuralnetworks[J].JournalofManagementSciencesinChina, 2002, 5(3): 86-90. (inChinese)

      [8]VapnikVN.TheNatureofStatisticalLearningTheory[M].NewYork:Springer-Verlag, 1995.

      [9]LiH,SunJ.Forecastingbusinessfailure:Theuseofnearest-neighboursupportvectorsandcorrectingimbalancedsamples-evidencefromtheChinesehotelindustry[J].TourismManagement, 2012, 33(3): 622-634.

      [10]MarateaA,PetrosinoA,MarioM.AdjustedF-measureandkernelscalingforimbalanceddatalearning[J].InformationSciences, 2014, 257(1): 331-341.

      [11]SundarkumarGG,RaviV.Anovelhybridundersamplingmethodforminingunbalanceddatasetsinbankingandinsurance[J].EngineeringApplicationsofArtificialIntelligence, 2015, 37(1): 368-377.

      [12]ChawlaN,BowyerK,HallL,etal.SMOTE:Syntheticminorityover-samplingtechnique[J].JournalofArtificialIntelligenceResearch, 2002, (16): 321-357.

      [13]WangBX,JapkowiczN.Imbalanceddatasetlearningwithsyntheticsamples[C]//Proc.IRISMachineLearningWorkshop, 2004: 1-25.

      [14]HeH,BaiY,GarciaEA,etal.ADASYN:Adaptivesyntheticsamplingapproachforimbalancedlearning[C]//Proc.Int’lJ.Conf.NeuralNetworks, 2008: 1322-1328.

      [15]陶新民, 童智靖, 劉玉, 等. 基于ODR和BSMOTE結合的不均衡數(shù)據SVM分類算法[J]. 控制與決策, 2011, 26(10): 1535-1541.

      TaoXinmin,TongZhijing,LiuYu,etal.SVMclassifierforunbalanceddatabasedoncombinationofODRandBSMOTE[J].ControlandDecision, 2011, 26(10): 1535-1541. (inChinese)

      [16]戴文華, 夏峰. 關于中國證券市場20年發(fā)展的基本分析與思考[J]. 證券市場導報, 2014, (1): 4-11.

      DaiWenhua,XiaFeng.Thebasicanalysisandreflectionsonthe20yearsofdevelopmentofthesecuritiesmarket[J].SecuritiesMarketHerald, 2014, (1): 4-11. (inChinese)

      [17]黃金波, 李仲飛, 姚海洋. 基于CVaR核估計量的風險管理[J]. 管理科學學報, 2014, 17(3): 49-59.

      HuangJinbo,LiZhongfei,YaoHaiyang.RiskmanagementbasedontheCVaRkernelestimator[J].JournalofManagementSciencesinChina, 2014, 17(3): 49-59. (inChinese)

      [18]熊熊, 張珂, 周欣. 國際市場對我國股票市場系統(tǒng)性風險的影響分析[J]. 證券市場導報, 2015, (1): 54-58.

      XiongXiong,ZhangKe,ZhouXin.AnalysisofimpactofinternationalmarketonChinastockmarketsystemicrisk[J].SecuritiesMarketHerald, 2015, (1): 54-58. (inChinese)

      [19]吳勇民, 紀玉山, 呂永剛. 技術進步與金融結構的協(xié)同演化研究——來自中國經驗證據[J]. 現(xiàn)代財經(天津財經大學學報), 2014, (7): 33-44.

      WuYongmin,JiYushan,LüYonggang.Studyontheco-evolutionoftechnologicalprogressandfinancialstructure:TheempiricalevidencefromChina[J].ModernFinanceandEconomics(JournalofTianjinUniversityofFinanceandEconomics), 2014, (7): 33-44. (inChinese)

      [20]AhnJJ,OhKJ,KimDH.Usefulnessofsupportvectormachinetodevelopanearlywarningsystemforfinancialcrisis[J].ExpertSystemswithApplications, 2011, 38(4): 2966-2973.

      [21]GrothSS,MuntermannJ.Anintradaymarketriskmanagementapproachbasedontextualanalysis[J].DecisionSupportSystems, 2011, 50(4): 680-691.

      [22]徐國祥, 楊振建.PCA-GA-SVM模型的構建及應用研究——滬深300指數(shù)預測精度實證分析[J]. 數(shù)量經濟技術經濟研究, 2011, (2): 135-147.

      XuGuoxiang,YangZhenjian.ResearchforconstructionandapplicationofPCA-GA-SVMmodel[J].TheJournalofQuantitative&TechnicalEconomics, 2011, (2): 135-147. (inChinese)

      [23]李云飛, 惠曉峰. 基于支持向量機的股票投資價值分類模型研究[J]. 中國軟科學, 2008, (1): 135-140.

      LiYunfei,HuiXiaofeng.TheclassificationmodelforstockinvestmentvaluebasedonSVM[J].ChinaSoftScienceMagazine, 2008, (1): 135-140. (inChinese)

      [24]FarquadMAH,IndranilB.Preprocessingunbalanceddatausingsupportvectormachine[J].DecisionSupportSystems, 2012, 53(1): 226-233.

      [25]HuangZ,ChenHC,HsuCJ,etal.Creditratinganalysiswithsupportvectormachinesandneuralnetworks:Amarketcomparativestudy[J].DecisionSupportSystems, 2004, 37 (4): 543-558.

      [26]宋新平, 丁永生. 基于最優(yōu)支持向量機模型的經營失敗預警研究[J]. 管理科學, 2008, 21(1): 115-121.

      SongXinping,DingYongsheng.Studyonbusinessfailurepredictionbasedonanoptimizedsupportvectormachinemodel[J].JournalofManagementSciences, 2008, 21(1): 115-121. (inChinese)

      [27]鄒鵬, 李一軍, 郝媛媛. 基于代價敏感性學習的客戶價值細分[J]. 管理科學學報, 2009, 12(1): 48-56.

      ZouPeng,LiYijun,HaoYuanyuan.Customervaluesegmentationbasedoncost-sensitivelearning[J].JournalofManagementSciencesinChina, 2009, 12(1): 48-56. (inChinese)

      [28]魏宇, 賴曉東, 余江. 滬深300股指期貨日內避險模型及效率研究[J]. 管理科學學報, 2013, 16(3): 29-40.

      WeiYu,LaiXiaodong,YuJiang.Intra-dayhedgingmodelsandhedgingeffectivenessofCSI300indexfutures[J].JournalofManagementSciencesinChina, 2013, 16(3): 29-40. (inChinese)

      [29]陳瑩, 武志偉, 王楊. 滬深300指數(shù)衍生證券的多市場交易與價格發(fā)現(xiàn)[J]. 管理科學學報, 2014, 17(12): 75-84.

      ChenYing,WuZhiwei,WangYang.Multi-markettradingofHS300indexderivativesandpricediscoveryofstockmarketindex[J].JournalofManagementSciencesinChina, 2014, 17(12): 75-84. (inChinese)

      [30]HillBM.Asimplegeneralapproachtoinferenceaboutthetailofadistribution[J].TheAnnalsofStatistics, 1975, 3(5): 1163-1174.

      [31]SteliosDB,DimitrisAG.EstimationofValue-at-Riskbyextremevalueandconventionalmethods:Acomparativeevaluationoftheirpredictiveperformance[J].Int.Fin.Markets,Inst.andMoney, 2005, 15 (3): 209-228.

      [32]NeftciS.Valueatriskcalculations,extremeeventsandtailestimation[J].TheJournalofDerivations, 2000(Spring), 7(3): 23-37.

      [33]DuMouchelWH.Estimatingthestableindexαinordertomeasuretailthickness:Acritique[J].AnnalsofStatistics, 1983, 11(4): 1019-1031.

      [34]KimotoT,AsakawaK.Stockmarketpredictionsystemwithmodularneuralnetworks[C]//Proc.Int’lJ.Conf.NeuralNetwork, 1990: 1-6.

      [35]葉五一, 繆柏其. 基于Copula變點檢測的美國次級債金融危機傳染分析[J]. 中國管理科學, 2009, 17(3): 1-7.

      YeWuyi,MiaoBaiqi.Analysisofsub-primeloancrisiscontagionbasedonchangepointtestingmethodofCopula[J].ChineseJournalofManagementScience, 2009, 17(3): 1-7. (inChinese)

      [36]王永巧, 劉詩文. 基于時變Copula的金融開放與風險傳染[J]. 系統(tǒng)工程理論與實踐, 2011, 31(4): 778-784.

      WangYongqiao,LiuShiwen.Financialmarketopennessandriskcontagion:Atime-varyingCopulaapproach[J].SystemsEngineering-Theory&Practice, 2011, 31(4): 778-784. (inChinese)

      [37]葉五一, 韋偉, 繆柏其. 基于非參數(shù)時變Copula模型的美國次貸危機傳染分析[J]. 管理科學學報, 2014, 17(11): 151-158.

      YeWuyi,WeiWei,MiaoBaiqi.Analysisofsub-primeloancrisiscontagionbasedonnon-parametrictime-varyingCopula[J].JournalofManagementSciencesinChina, 2014, 17(11): 151-158. (inChinese)

      [38]宋新平, 丁永生, 曾月明. 基于遺傳算法的同步優(yōu)化方法在財務困境預警中的應用[J]. 預測, 2009, 28(1): 48-55.

      SongXinping,DingYongsheng,ZengYueming.ApplicationofaGA-basedsimultaneousoptimizationmethodinfinancialcrisisprediction[J].Forecasting, 2009, 28(1): 48-55. (inChinese)

      EarlywarningforextremelyfinancialrisksbasedonODR-ADASYN-SVM

      LIN Yu1, HUANG Xun1, CHUN Wei-de1, HUANG Deng-shi2

      1.BusinessSchool,ChengduUniversityofTechnology,Chengdu610059,China;2.SchoolofEconomicsandManagement,SouthwestJiaotongUniversity,Chengdu610031,China

      Abstract:Synthetic minority over-sampling technique (SMOTE)has the problem of over fitting in improving the imbalanced samples’ learning ability of support vector machine (SVM). In this paper, adaptive synthetic sampling approach (ADASYN) and optimization of decreasing reduction approach (ODR) are assembled into an ODR-ADASYN to overcome the blindness in generating new samples and the limitations in processing the object. Combining SVM with ODR-ADASYN, an improved SVM, named ODR-ADASYN-SVM, is put forward to predict extremely financial risks; T-test is also applied to the significance test of the difference of the prediction accuracy of all models and to the evaluation of the prediction stability of all models. The result illustrates that the ODR-ADASYN-SVM can not only significantly improve the imbalanced samples’ learning ability of SVM, but also overcome the problem of over fitting for SMOTE effectively.Hence, the ODR-ADASYN-SVM has a superior ability to predict extremely financial risks.

      Key words:ODR; ADASYN; SVM; extremely financial risk; early warning model

      收稿日期:①2013-06-07;

      修訂日期:2015-07-13.

      基金項目:國家自然科學基金資助項目(71171025); 國家社會科學基金資助項目(12BGL024); 四川省軟科學研究計劃資助項目(2014ZR0093); 成都理工大學“金融與投資”優(yōu)秀創(chuàng)新團隊計劃資助項目(KYTD201303).

      作者簡介:林宇(1973—), 男, 四川儀隴人, 博士, 教授. Email:linyuphd@126.com

      中圖分類號:F832.5

      文獻標識碼:A

      文章編號:1007-9807(2016)05-0087-15

      猜你喜歡
      預警模型支持向量機
      我國上市公司財務預警分析
      中國市場(2017年2期)2017-02-28 19:48:12
      基于AHP—模糊綜合分析的移動社交網絡輿情預警模型研究
      基于RS—ANN的大學生心理危機預警模型構建與應用
      考試周刊(2016年103期)2017-01-23 17:18:13
      基于改進支持向量機的船舶縱搖預報模型
      中國水運(2016年11期)2017-01-04 12:26:47
      基于SVM的煙草銷售量預測
      軟件導刊(2016年11期)2016-12-22 21:52:38
      動態(tài)場景中的視覺目標識別方法分析
      論提高裝備故障預測準確度的方法途徑
      價值工程(2016年32期)2016-12-20 20:36:43
      基于模糊分析法的高校專利初級預警模型的研究
      價值工程(2016年30期)2016-11-24 14:38:32
      基于熵技術的公共事業(yè)費最優(yōu)組合預測
      價值工程(2016年29期)2016-11-14 00:13:35
      農村消失的影響因素及建模研究
      科技視界(2016年22期)2016-10-18 15:00:50
      临沂市| 华容县| 东丽区| 延津县| 清镇市| 正宁县| 渭南市| 宁城县| 高淳县| 清苑县| 天镇县| 时尚| 林周县| 宝兴县| 荥经县| 文化| 襄垣县| 淅川县| 安溪县| 高平市| 社旗县| 兴隆县| 威远县| 河间市| 芮城县| 静乐县| 安义县| 禹城市| 科技| 泾阳县| 鹿泉市| 福海县| 汝阳县| 永定县| 安平县| 浮山县| 青川县| 镶黄旗| 汤阴县| 紫金县| 巴青县|