• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      支持向量機的基本理論和研究進展

      2018-10-16 00:52:20林香亮袁瑞孫玉秋王超陳長勝
      關(guān)鍵詞:分類器向量分類

      林香亮,袁瑞,孫玉秋,王超,陳長勝

      (長江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)

      20世紀(jì)90年代,俄羅斯數(shù)學(xué)家Vapnik等[1]提出了支持向量機(Support Vector Machines,SVM)[2,3]的概念:支持向量機以統(tǒng)計學(xué)習(xí)理論(Statistical Learning Theory,SLT)[4,5]為基礎(chǔ),基于結(jié)構(gòu)風(fēng)險最小化(Structural Risk Minimization,SRM)[6]原理建立數(shù)據(jù)模型,為解決有限數(shù)據(jù)樣本情況下的統(tǒng)計模式識別奠定了堅實的基礎(chǔ)。與傳統(tǒng)機器學(xué)習(xí)方法相比,該方法具有結(jié)構(gòu)簡單、適應(yīng)性好、全局最優(yōu)、訓(xùn)練速度快和泛化能力強等諸多優(yōu)勢。下面,筆者簡要回顧了傳統(tǒng)支持向量機的發(fā)展歷史與基本理論,介紹了支持向量機的改進算法,系統(tǒng)總結(jié)了支持向量機在分類與回歸問題中的具體應(yīng)用實例及其優(yōu)勢。

      1 支持向量機的基本理論

      1.1 傳統(tǒng)支持向量機

      圖1 支持向量機原理

      支持向量機的基本思想如圖1所示,實心點和空心點分別代表2類數(shù)據(jù)樣本;H代表分類超平面;H1和H2分別代表數(shù)據(jù)樣本中離H最近且平行于H的面,H1和H2之間的距離稱為分類間隔(Margin)。H面不但能將H1和H2這2類樣本正確分開,而且使H1和H2之間的分類距離最大,在確保結(jié)構(gòu)風(fēng)險最小化的情況下,真正的降低了風(fēng)險。H1和H2上的數(shù)據(jù)樣本點就叫做支持向量(Support Vector)。

      假設(shè)給定樣本數(shù)據(jù)為(xi,yi),i=1,2,…,l,其中xi∈Rn,yi∈{-1,+1}。n維空間中的線性判別式為:

      f(x)=(m*xi)+n

      分類超平面方程為:

      (m*xi)+n=0

      其中,m為權(quán)重向量;n為偏置向量。

      該約束條件可引入 Lagrange(拉格朗日)函數(shù):

      則可得出對偶問題:

      進而,可得到最優(yōu)分類函數(shù):

      以上解決的問題是線性可分的。但在實際應(yīng)用中,遇到的大多數(shù)問題是非線性可分問題,因此支持向量機的主要思想就是通過非線性變換將樣本數(shù)據(jù)映射到高維的特征向量空間(Hilbert空間)中,在高維特征向量空間中求得最優(yōu)分類超平面,再用變換后的內(nèi)積運算重復(fù)上述過程。依據(jù)統(tǒng)計學(xué)習(xí)理論,假設(shè)k(x,y)為內(nèi)積函數(shù),即核函數(shù)(Kernel Function),用核函數(shù)代替決策函數(shù),即:

      在求解過程中常用的算法有塊算法(Chunking Algorithm)、分解算法(Decomposing)、增量算法(Incremental Algorithm)、序列最小優(yōu)化算法(Sequential Minimal Optimization,SMO)和多類分類算法(Multi-category Classification Algorithm)等。

      1.2 改進支持向量機

      隨著數(shù)學(xué)其他領(lǐng)域的突破,傳統(tǒng)的支持向量機理論和技術(shù)得以快速發(fā)展,出現(xiàn)了眾多的改進支持向量機理論,例如模糊支持向量機(Fuzzy Support Vector Machine,F(xiàn)SVM)[7,8]、最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)[9]、NN-支持向量機(Nearest Neighbor Support Vector Machine,NN-SVM)[10]、BS-支持向量機(Boundary Sample Support Vector Machine,BS-SVM)[11]等。

      2002年,Lin等[7,8]提出了模糊支持向量機(Fuzzy Support Vector Machine,F(xiàn)SVM),該方法主要是根據(jù)樣本輸入不同導(dǎo)致分類效果不同以及懲罰系數(shù)會隨樣本隸屬度的變化而變化等特點,進一步削弱孤立點或噪聲對支持向量機分類結(jié)果的影響。具體做法是各樣本點對應(yīng)一個隸屬度Si(0

      式中,C為懲罰系數(shù);ei為松弛變量;Siei表示不同樣本被錯分的程度。

      引入Lagranga函數(shù)得出對偶問題:

      即得到最優(yōu)分類函數(shù):

      f(x)=sgn{(m*x)+n}

      其中,SiC表示樣本xi的重要程度。當(dāng)SiC越大時,xi被錯分的可能性就越低,分類間隔就越小;反之,分類間隔就越大。對于噪聲或者孤立點而言,Si越小,對應(yīng)的SiC就越小,從而提高了分類的準(zhǔn)確度。

      20世紀(jì)90年代末,Suykens等[9]提出了最小二乘支持向量機,該算法遵循結(jié)構(gòu)風(fēng)險最小化的原則,將傳統(tǒng)的支持向量機中的不等式約束問題轉(zhuǎn)化為等式約束問題,將二次規(guī)劃問題轉(zhuǎn)化為線性方程組來求解:

      s.t.m·φ(xi)+n=1-eii=1,2,…,l

      式中,e為誤差變量;γ為正則化參數(shù),可平衡擬合精度和模型推廣度。

      最小二乘支持向量機在很大程度上降低了樣本點在訓(xùn)練過程中的復(fù)雜度,運算速度方面也遠遠超過傳統(tǒng)支持向量機。

      最近鄰即為歐氏距離最近的樣本。與傳統(tǒng)支持向量機相比,NN-支持向量機具有分類時間短、正確率高、可用于大數(shù)據(jù)訓(xùn)練樣本等優(yōu)勢。

      計算樣本屬于模式類的概率:

      通過RP的大小可將樣本分為好樣本、差樣本和邊界樣本3類,再取邊界樣本進行訓(xùn)練得到分類器。該方法具有分類速度快、正確率高、訓(xùn)練樣本集大的優(yōu)點。

      除了以上幾種改進的支持向量機外,還有中心支持向量機(Proximal Support Vector Machine)[12]、小波支持向量機(Wavelet Support Vector Machine)[13]和推理型支持向量機(InferenceSupport Vector Machine)[14]等,隨著支持向量機的不斷改進與發(fā)展,將會出現(xiàn)更多的改進支持向量機算法。

      2 支持向量機的應(yīng)用

      2.1 支持向量機分類器的應(yīng)用

      1)智能故障診斷 支持向量機分類器應(yīng)用廣泛,早在智能故障診斷(Intelligent Trouble Diagnosis)方面有所應(yīng)用。董明等[15]在大型電力變壓器故障診斷模型中引入支持向量機,他們發(fā)現(xiàn)支持向量分類器為挖掘有關(guān)監(jiān)測參數(shù)中所含的故障信息方面提供了便利,在樣本數(shù)目有限的情況下也能得到比較精準(zhǔn)的診斷結(jié)果,同時支持向量分類器被認(rèn)為是一種通用的機器學(xué)習(xí)算法,避免了當(dāng)樣本數(shù)目很大的情況下結(jié)果誤差難以控制的缺點;張周鎖等[16]提出了一種基于支持向量機的機械故障診斷方法,他們利用模擬故障數(shù)據(jù)建立了多種故障診斷分類器,無需進行數(shù)據(jù)預(yù)處理就能進行多故障的診斷與識別;鄭水波等[17]將支持向量機應(yīng)用到傳感器故障診斷中,他們在建立傳感器預(yù)測模型時主要運用了支持向量機回歸估計方法,構(gòu)造出傳感器的解析冗余來產(chǎn)生殘差,進而構(gòu)成支持向量機殘差生成器來獲得故障結(jié)果;袁勝發(fā)等[18]將人工免疫與支持向量機相結(jié)合應(yīng)用在機械故障診斷中,他們認(rèn)為支持向量機能夠?qū)收蠑?shù)據(jù)進行聚類和分類預(yù)處理,再將類別的中心作為人工免疫系統(tǒng)的疫苗,人工免疫系統(tǒng)會將其作為抗體進行學(xué)習(xí),獲得故障特征,并為人工免疫系統(tǒng)提供了先驗信息,用這種方法學(xué)習(xí)速度快,診斷效果好。

      2)圖像處理 支持向量機分類器在圖像處理(Image Processing)領(lǐng)域也有所應(yīng)用。凌旭峰等[19]和張燕昆等[20]提出了將支持向量機與主元分析(Principal ComponentAnalysis)相結(jié)合的人臉識別算法,算法充分利用了支持向量機能夠處理小樣本以及泛化能力強等方面的優(yōu)勢;段立娟等[21]提出了一種多層次圖像過濾方法,過程中采用了多個分類器,主要有膚色檢測器、最近鄰方法和支持向量機分類法,結(jié)果表明支持向量機分類法和最近鄰方法達到了85%以上的準(zhǔn)確率;李三平等[22]提出了一種基于支持向量機的彩色圖像水印算法,該方法先對圖像進行小波分解,利用分解后子圖系數(shù)之間的關(guān)系訓(xùn)練支持向量機,再將訓(xùn)練好的支持向量機在小波域內(nèi)嵌入水印和提取水印,試驗驗證了這種方法對于普通的圖像處理具有很強的魯棒性。

      3)石油勘探與開發(fā) 支持向量機分類器在石油探勘與開發(fā)(Petroleum Exploration and Development)過程中也被廣泛應(yīng)用,周繼宏等[23]將支持向量機引入到碎屑巖儲層巖性識別過程中,結(jié)果表明,與當(dāng)前被廣泛運用的BP神經(jīng)網(wǎng)絡(luò)方法相比,基于BP神經(jīng)網(wǎng)絡(luò)方法的巖性識別效果遠遠不如基于支持向量機方法的巖性識別效果;袁瑞[24]、張翔等[25]和龍熙華等[26]在研究巖性識別過程中分別對支持向量機方法進行了改進,改進后的支持向量機能夠準(zhǔn)確的反映測井資料與地層巖性之間的非線性關(guān)系,大大提高了準(zhǔn)確性。

      4)說話人識別 在說話人識別(Speaker Recognition)方面,忻棟等[27]在處理聲音信號識別時將支持向量機與隱式馬爾可夫模型(Hidden Markov Models, HMM)結(jié)合起來建立混合模型,通過實驗得到的結(jié)果與其他模型相對比,該方法明顯降低了錯誤率,縮短了訓(xùn)練時間;金煥梅等[28]研究短語音說話人識別,將支持向量機與高斯混合模型(Gaussian Mixture Model)相結(jié)合,提高了短語音數(shù)據(jù)條件下語音的識別性能,同時減少了說話人識別訓(xùn)練的時間,大大提高了系統(tǒng)的實用性;李明等[29]提出了一種基于粒子群優(yōu)化算法訓(xùn)練支持向量機研究說話人識別的方法,該方法具有較高的收斂精度和較快的識別速度,解決識別問題具有顯著的時間優(yōu)勢;張振領(lǐng)[30]提出了一種基于支持向量機和小波分析的說話人識別方法,首先用小波分析對語音進行預(yù)處理,實現(xiàn)語音增強的效果,再利用支持向量機多類分類器對樣本進行訓(xùn)練和測試,實現(xiàn)說話人的分類識別。

      除此之外,支持向量機分類器還被應(yīng)用于互聯(lián)網(wǎng)技術(shù)(Internet Technology)[31~33]、金融管理(Financial Management)[34~36]和生物醫(yī)學(xué)(Biomedical Sciences)[37~49]等各個科學(xué)領(lǐng)域,成功解決了與工業(yè)、交通、農(nóng)業(yè)和環(huán)境等多方面有關(guān)的實際問題,發(fā)揮了巨大的應(yīng)用優(yōu)勢。

      2.2 支持向量機回歸器的應(yīng)用

      1)水質(zhì)檢測與評價 針對水質(zhì)檢測與評價(Water Quality Testing and Evaluation),傳統(tǒng)的內(nèi)梅羅指數(shù)法(NemerowIndex)[40]、模糊綜合法(Fuzzy Comprehensive Method)[41]、灰色聚類法(Grey Clustering Method)[42]等方法在解決水質(zhì)因子和評價等級之間非線性關(guān)系方面存在著不足,BP神經(jīng)網(wǎng)絡(luò)方法[43]訓(xùn)練速度慢,花費時間長,結(jié)果極易受局部極小點的影響,且泛化能力低。馬文濤[44]提出了一種基于支持向量機回歸的方法來檢測評估水質(zhì),結(jié)果表示,支持向量機回歸的方法能夠較好地進行水質(zhì)評價,同時還可預(yù)測水質(zhì)的污染程度,在水質(zhì)檢測方面具有良好的優(yōu)勢;陳琳等[45]在對地下水進行水質(zhì)評價時,通過建立支持向量機模型,改進地下水評價的方式,應(yīng)用非線性支持向量機中分類支持向量機對地下水水質(zhì)進行評價,將最終結(jié)果分別與綜合指數(shù)法和BP神經(jīng)網(wǎng)絡(luò)法得到的結(jié)果進行對比,驗證了該方法具有計算速度快,所需參數(shù)少,評價精度高且易于通過計算機來實現(xiàn)等優(yōu)點;張秀菊等[46]在進行水質(zhì)預(yù)測中,分析了支持向量機的理論與算法,構(gòu)建了支持向量機水質(zhì)預(yù)測模型,利用Libsvm軟件包和Matlab軟件進行水質(zhì)預(yù)測,發(fā)現(xiàn)預(yù)測結(jié)果與實際情況相近,預(yù)測結(jié)果能較好地反映水質(zhì)情況。

      2)金融預(yù)測 支持向量機回歸器被應(yīng)用于金融預(yù)測(Preparing Financial Forecasts)領(lǐng)域。顧紅其[47]提出一種基于主成分分析的支持向量機期貨價格預(yù)測方法,首先利用主成分分析對期貨價格影響因子進行處理,消除因子之間的冗余,再用支持向量機對保留的主成分建立模型并預(yù)測,結(jié)果表明,主成分分析支持向量機模型預(yù)測的結(jié)果要優(yōu)于其他模型,且預(yù)測的結(jié)果更接近于實際值;祝金榮[48]提出將支持向量機應(yīng)用于石油期貨價格預(yù)測的方法,該方法采用石油期貨價格序列的一階差分作為支持向量機的輸出,一階差分的滯后值作為支持向量機的輸入并建立模型,試驗驗證了支持向量機的方法相比于神經(jīng)網(wǎng)絡(luò)等其他方法更具有優(yōu)勢,預(yù)測精度高,而且避免了過擬合現(xiàn)象;吳江等[49]提出一種基于加權(quán)支持向量機的金融時間序列的預(yù)測方法,對金融時間序列預(yù)測過程中的近期數(shù)據(jù)和遠期數(shù)據(jù)采用不同的權(quán)值,使近期數(shù)據(jù)的權(quán)值大一些,以此來提高預(yù)測的精度,與傳統(tǒng)金融時間序列的預(yù)測方法相比,該方法能夠提高金融時間序列預(yù)測的精度。

      3)氣象預(yù)測 支持向量機回歸器在氣象預(yù)測(Weather Forecast)領(lǐng)域被廣泛應(yīng)用。胡邦輝等[50]在研究云量預(yù)報問題時引入了最小二乘支持向量機的方法,通過選擇合適的參數(shù)和核函數(shù),對不同時段的云量建立預(yù)報模型,試驗結(jié)果證明了該算法預(yù)報的結(jié)果要優(yōu)于神經(jīng)網(wǎng)絡(luò)方法,且預(yù)報的準(zhǔn)確率不會隨樣本量的變化而受影響;王振友等[51]在研究大氣中臭氧含量分析的問題時運用了支持向量機回歸的方法,通過對多個氣象指標(biāo)進行比較以及對臭氧含量進行預(yù)測,得出的預(yù)測結(jié)果與實際情況相近,說明支持向量機在預(yù)測云量方面具有較強的泛化能力;滕衛(wèi)平等[52]將支持向量機引入到研究汛期旱澇問題,首先對降水量資料進行分析并提取高相關(guān)因子,再利用支持向量機回歸方法和逐步回歸方法分別建立汛期旱澇預(yù)測模型,結(jié)果對比發(fā)現(xiàn)支持向量機回歸模型無論是在精度預(yù)測方面還是實際預(yù)測能力方面都優(yōu)于逐步回歸模型。

      此外,支持向量機回歸器還被應(yīng)用于電信技術(shù)(Telecommunications Technology)[53~55]、機械工業(yè)(Engineering Industry)[56,57]和航空航天(Aerospace)[58~60]等領(lǐng)域,獲得了良好的應(yīng)用效果。

      3 結(jié)語

      作為一種新型的機器學(xué)習(xí)方法,支持向量機具有堅實的理論基礎(chǔ),能夠較好地解決小樣本、非線性和高維數(shù)等數(shù)學(xué)問題,適用于函數(shù)模擬、回歸分析和數(shù)據(jù)分類等領(lǐng)域。與其他傳統(tǒng)方法相比,支持向量機具有結(jié)構(gòu)簡單、適應(yīng)性好、訓(xùn)練速度快和泛化能力強等優(yōu)勢。盡管支持向量機的實際應(yīng)用范圍遠不及人工神經(jīng)網(wǎng)絡(luò),但是隨著信息化時代的發(fā)展,傳統(tǒng)和改進的支持向量機將在大數(shù)據(jù)、云技術(shù)、深度學(xué)習(xí)和人工智能等大信息領(lǐng)域深入應(yīng)用,具有更大的應(yīng)用潛力。

      猜你喜歡
      分類器向量分類
      向量的分解
      分類算一算
      聚焦“向量與三角”創(chuàng)新題
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      教你一招:數(shù)的分類
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      向量垂直在解析幾何中的應(yīng)用
      来凤县| 呼图壁县| 虞城县| 凤台县| 宜黄县| 芮城县| 大悟县| 交城县| 土默特左旗| 池州市| 南川市| 棋牌| 荃湾区| 玉门市| 白河县| 富平县| 陆良县| 柳江县| 崇仁县| 治多县| 呈贡县| 康定县| 东平县| 葫芦岛市| 鄯善县| 宜城市| 建湖县| 奇台县| 肥城市| 沁源县| 璧山县| 伊宁县| 阿尔山市| 年辖:市辖区| 沂南县| 兴安县| 阳曲县| 太和县| 南江县| 抚宁县| 南京市|