徐曉璐,吳 濤,2,顧 宏*
(1.大連理工大學(xué) 控制科學(xué)與工程學(xué)院,遼寧 大連 116024;2.北車大連電力牽引研發(fā)中心有限公司,遼寧 大連 116045)
地鐵是人員密集的公共交通系統(tǒng),設(shè)施的自動(dòng)化程度高,為保證地鐵車輛安全穩(wěn)定運(yùn)行,高效、快速排查地鐵車輛出現(xiàn)的故障并根據(jù)故障診斷結(jié)果給出相應(yīng)的維修建議十分重要.牽引控制單元(TCU)是地鐵車輛控制的重要組成部分,列車通過向牽引控制單元傳輸指令信息,實(shí)現(xiàn)對(duì)整車牽引系統(tǒng)的控制.因此必須始終保持牽引控制單元安全平穩(wěn)的工作狀態(tài).
近幾年隨著人工智能診斷方法[1-4]的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)被廣泛用于地鐵車輛的故障診斷.但神經(jīng)網(wǎng)絡(luò)存在過擬合、收斂速度慢、易陷入局部最優(yōu)的缺點(diǎn).而支持向量機(jī)(SVM)模型結(jié)構(gòu)簡(jiǎn)單,克服了維數(shù)災(zāi)難和易陷入局部最優(yōu)的缺點(diǎn),且對(duì)小樣本和非線性問題有很好的分類效果和泛化能力[5-6],已經(jīng)得到了廣泛關(guān)注,并逐漸應(yīng)用于故障診斷中.由于地鐵牽引控制單元故障診斷的復(fù)雜性和小樣本特性,SVM 方法更適用于地鐵的故障診斷.但在實(shí)際應(yīng)用中SVM 方法還存在怎樣選取參數(shù)能使其診斷性能達(dá)到最優(yōu)的問題.眾學(xué)者已經(jīng)提出了一些解決辦法,例如遺傳算法、粒子群算法[6]等.但是這些方法涉及太多人為因素,并且優(yōu)化過程中容易陷入局部最優(yōu).
為了克服這些缺點(diǎn),本文采用改進(jìn)粒子群優(yōu)化(IPSO)算法優(yōu)化SVM 參數(shù)的方法.改進(jìn)粒子群優(yōu)化算法利用混沌運(yùn)動(dòng)的規(guī)律性、遍歷性、內(nèi)部隨機(jī)性來搜索最優(yōu)參數(shù),并且在優(yōu)化過程中加入了識(shí)別過早停滯的方法,一旦發(fā)生了過早停滯,就重置個(gè)體最優(yōu)位置和全局最優(yōu)位置.最后通過實(shí)驗(yàn)驗(yàn)證這種方法的可行性.
SVM 是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的機(jī)器學(xué)習(xí)算法,最早應(yīng)用于模式識(shí)別[7].設(shè)計(jì)一個(gè)非線性SVM 模型的基本思想是:通過預(yù)先選好的非線性映射函數(shù)把輸入向量x∈Rn映射到高維特征空間F中,在此高維特征空間F中創(chuàng)建最優(yōu)分類超平面.
最優(yōu)分類超平面的決策函數(shù)如下:
式中:sgn(·)是符號(hào)函數(shù),w是權(quán)重向量,x是輸入向量,b是常數(shù).通過非線性映射函數(shù)φ(x)將數(shù)據(jù)映射到高維特征空間后,分類決策函數(shù)為
約束條件為
xi是指第i個(gè)訓(xùn)練數(shù)據(jù),yi=±1.
根據(jù)VC維理論,在上述約束條件下使結(jié)構(gòu)風(fēng)險(xiǎn)最小化,數(shù)學(xué)過程可表達(dá)為如下的二次規(guī)劃問題:
引入松弛變量ξi≥0.若樣本被準(zhǔn)確分類,那么ξi=0,否則ξi>0.則式(3)變?yōu)?/p>
分類超平面應(yīng)使兩類樣本距超平面的最小距離最大化,則優(yōu)化的目標(biāo)函數(shù)如下:
在式(6)中,懲罰因子C表示對(duì)錯(cuò)分樣本的懲罰度.最小化過程中采用拉格朗日乘子和二次規(guī)劃優(yōu)化方法,轉(zhuǎn)換后的對(duì)偶問題為
其中αi是拉格朗日乘子.則最優(yōu)決策函數(shù)可表示為
式中:I是支持向量的個(gè)數(shù).對(duì)非線性問題,需要通過非線性映射把數(shù)據(jù)映射到更高維的特征空間.假設(shè)核函數(shù)K(xi,x)為非線性映射函數(shù),則決策函數(shù)為
由于徑向基核函數(shù)(RBF)只需確定一個(gè)參數(shù),有利于參數(shù)優(yōu)化,因此本文選擇RBF 為核函數(shù):
式中:σ是核函數(shù)寬度.
研究表明C和核函數(shù)參數(shù)是影響SVM 性能的主要因素[8-10].因此為了獲得SVM 更好的泛化能力,要選擇合適的C和核函數(shù)參數(shù).本文用改進(jìn)粒子群優(yōu)化算法來優(yōu)化C和核函數(shù)參數(shù).
粒子群優(yōu)化算法是一種由鳥群覓食演化而來的全局搜索算法,它通過分享群體間的歷史信息和社會(huì)信息來搜索最優(yōu)值.由于它的概念簡(jiǎn)單、收斂速度快,已經(jīng)成功應(yīng)用于許多領(lǐng)域[11-12].其基本思想是:每一個(gè)粒子在D維搜索空間中以一定的速度飛行,以適應(yīng)值函數(shù)、粒子個(gè)體飛行經(jīng)驗(yàn)和其他粒子飛行經(jīng)驗(yàn)動(dòng)態(tài)地調(diào)整粒子本身速度和最優(yōu)位置,得到優(yōu)化問題的最優(yōu)解.
假設(shè)在D維搜索空間中由m個(gè)粒子組成一個(gè)群體,xi=(xi1,xi2,…,xiD)指第i個(gè)粒子的位置,vi=(vi1,vi2,…,viD)指第i個(gè)粒子的速度.第i個(gè)粒子的最優(yōu)位置為pi=(pi1,pi2,…,piD),整個(gè)群體的最優(yōu)位置為pg=(pg1,pg2,…,pgD).群體中粒子的速度和位置可以表示成如下方程:
式中:c1、c2是加速常數(shù),分別代表了一個(gè)粒子向局部最優(yōu)位置(pid)和全局最優(yōu)位置(pgd)飛行的加速權(quán)重;rand(0,c1)、rand(0,c2)分別是在[0,c1]、[0,c2]中均勻分布的隨機(jī)數(shù);w是慣性權(quán)重.
文獻(xiàn)[11]中標(biāo)準(zhǔn)粒子群優(yōu)化(PSO)算法的性能很大程度上依賴于粒子的數(shù)目和初始參數(shù).且由式(11)知,當(dāng)前個(gè)體位置是由pid和pgd共同決定的.如果pid和pgd都陷入局部最優(yōu),那么粒子將重復(fù)相同的搜索路徑,稱作過早停滯.本文提出能增強(qiáng)搜索多樣性并克服過早停滯的改進(jìn)粒子群優(yōu)化(IPSO)算法來解決這一問題.
w代表粒子前一次迭代速度對(duì)當(dāng)前迭代速度的影響.w越大,粒子整體速度越大,粒子的搜索空間越大,有助于群體尋找新的解空間,即種群全局搜索能力強(qiáng);w越小,粒子整體速度越小,有助于群體在當(dāng)前搜索空間中尋找更優(yōu)解,即種群局部搜索能力強(qiáng).在迭代過程中,參數(shù)w非線性減小可平衡優(yōu)化過程中的全局搜索能力和局部搜索能力.對(duì)慣性權(quán)重w改進(jìn)如下:
式中:wmax是初始慣性權(quán)重,wmin是最終慣性權(quán)重,s是當(dāng)前迭代次數(shù),smax是最大迭代次數(shù).
PSO 算法總是采用隨機(jī)初始化策略,這很難保證初始粒子群的遍歷性.混沌運(yùn)動(dòng)是非線性系統(tǒng)的一種普遍現(xiàn)象[13].混沌變量有3個(gè)主要的特性:遍歷性、隨機(jī)性和對(duì)初始條件敏感性,可利用混沌的這些特性來解決粒子初始化問題.
邏輯映射方程如下:
當(dāng)μ=4且x0{0,0.25,0.50,0.75,1}時(shí),邏輯映射是遍歷的.但是在實(shí)際應(yīng)用中,由于不同參數(shù)的優(yōu)化范圍是不同的,需要把混沌變量映射到[0,1]來定義解向量的范圍.
當(dāng)pid在M次迭代過程中不變化或者pgd在N次迭代過程中不變化,則認(rèn)為種群陷入了過早停滯.這說明群體已經(jīng)或者即將陷入局部最優(yōu).M、N的值根據(jù)問題的規(guī)模和經(jīng)驗(yàn)提前設(shè)定,M、N的值越大說明判斷過早停滯的條件越寬松.在PSO 算法中加入過早停滯計(jì)算器K1、K2來計(jì)算停滯次數(shù).如果Pi或Pg的值與前一次相同,K1或K2的值加1;否則清零.當(dāng)K1、K2的值達(dá)到極限值M、N,重置Pi和Pg使粒子跳出局部最優(yōu).
對(duì)Pi的改進(jìn):
對(duì)Pg的改進(jìn):
得到改進(jìn)算法中群體粒子速度和位置方程如下:
由理論分析可知,新算法可減少無效迭代,大大提高了收斂速度和優(yōu)化精度.
基于改進(jìn)粒子群優(yōu)化算法的優(yōu)點(diǎn),本文提出用IPSO 方法來優(yōu)化SVM 的懲罰因子C和核函數(shù)寬度σ(IPSO-SVM 分類器),以提高SVM 泛化能力和收斂能力,進(jìn)而提高分類器精度.
IPSO-SVM 分類器結(jié)構(gòu)圖如圖1所示.
圖1 IPSO-SVM 分類器結(jié)構(gòu)圖Fig.1 Schematic diagram of IPSO-SVM classifier
為了驗(yàn)證所提出分類器的有效性,本文選擇UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫[14]中的Steel Plates Faults、Ionosphere、Dermatology、Wine和Seeds 5 組數(shù)據(jù)集對(duì)分類器性能進(jìn)行測(cè)試.數(shù)據(jù)集描述如表1所示.對(duì)Dermatology數(shù)據(jù)集,刪除了其含有缺失項(xiàng)的8個(gè)樣本,余下358個(gè)樣本.實(shí)驗(yàn)中按數(shù)據(jù)集的成熟度來劃分訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),Steel Plates Faults、Dermatology、Seeds、Ionosphere、Wine數(shù)據(jù)集的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)比例分別為4∶1、2∶1、2∶1、1∶1、1∶1.
本文用Matlab2012a軟件和LibSVM 工具箱進(jìn)行仿真實(shí)驗(yàn).選擇分類準(zhǔn)確率為性能評(píng)價(jià)指標(biāo),也即優(yōu)化過程中的適應(yīng)值,徑向基函數(shù)為核函數(shù),采用5折交叉驗(yàn)證方法[15]以獲得具有統(tǒng)計(jì)意義 的 實(shí) 驗(yàn) 結(jié) 果.分 別 用IPSO-SVM、ICPSOSVM[16]、PSO-SVM、GA-SVM 4 種 方 法 對(duì) 已 選取的UCI數(shù)據(jù)集進(jìn)行分類.其中第二種方法是采用改進(jìn)的混沌粒子群算法對(duì)SVM 參數(shù)進(jìn)行優(yōu)化,得到了很好的效果并且成功地應(yīng)用于電子系統(tǒng)故障診斷.4種方法參數(shù)設(shè)置為m=20,wmax=1.35,wmin=0.35,c1=1.5,c2=1.7,smax=200,M=3,N=6.表2為各方法分類準(zhǔn)確率比較,加粗的表示分類準(zhǔn)確率最高.
表1 UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫數(shù)據(jù)集描述Tab.1 Description of datasets from UCI machine learning repository
表2 各方法分類準(zhǔn)確率比較Tab.2 Classification accuracy comparison of several methods
以上實(shí)驗(yàn)結(jié)果表明,本文提出的IPSO-SVM分類器有較好的分類效果.對(duì)Steel Plates Faults、Dermatology 和Ionosphere數(shù)據(jù)集,分類準(zhǔn)確率均高于其他3 種方法;對(duì)較為成熟的Seeds和Wine數(shù)據(jù)集也與其他方法有相同分類準(zhǔn)確率,驗(yàn)證了IPSO-SVM 方法的有效性.
應(yīng)用某地鐵6號(hào)線實(shí)際數(shù)據(jù)驗(yàn)證基于IPSOSVM 故障診斷模型的高效性和準(zhǔn)確性.
這里的數(shù)據(jù)提取與處理借助于中國北車研發(fā)的維護(hù)終端PTU 軟件.中央控制單元在地鐵運(yùn)行過程中采集運(yùn)行數(shù)據(jù)和故障數(shù)據(jù).選取地鐵車輛牽引控制單元7種有代表性的故障進(jìn)行研究,圖2是故障數(shù)據(jù)的提取過程.
本文針對(duì)地鐵牽引控制單元的7 種典型故障,即1#HSCB跳閘故障、2#電機(jī)電流超過2 200A、3#濾波電壓超過2 150V、4#逆變器故障、5#牽引電機(jī)警告級(jí)過溫、6#荷載信號(hào)故障、7#380V 供電故障進(jìn)行故障定位,并選取與牽引控制單元有關(guān)的14 個(gè)數(shù)字量和模擬量,即KIC狀態(tài)、HSCB狀態(tài)、空轉(zhuǎn)滑行信號(hào)、TCU 硬線收到的牽引指令、TCU 硬線收到的所有制動(dòng)緩解信號(hào)、電制動(dòng)退出信號(hào)、無高壓狀態(tài)、逆變器脈沖施加信號(hào)、TCU 硬線收到的制動(dòng)指令、實(shí)際牽引電制動(dòng)力平均值、TCU 硬線收到的PWM 信號(hào)、接觸網(wǎng)電壓、級(jí)位、列車速度作為輸入特征.
圖2 故障數(shù)據(jù)提取過程Fig.2 Process of failure data extraction
由上述數(shù)據(jù)提取方法得到271組故障數(shù)據(jù)并做歸一化處理,訓(xùn)練集217組,測(cè)試集54組,數(shù)據(jù)分布如表3所示.
與實(shí)驗(yàn)部分相同,這里選擇分類準(zhǔn)確率為性能評(píng)價(jià)指標(biāo),徑向基函數(shù)為核函數(shù),5 折交叉驗(yàn)證法估計(jì)模型性能.用IPSO-SVM、ICPSO-SVM、PSO-SVM、GA-SVM 4種方法對(duì)已選取的數(shù)據(jù)集做故障分類,參數(shù)設(shè)置為m=20,wmax=1.35,wmin=0.35,c1=1.5,c2=1.7,smax=200,M=3,N=6,實(shí)驗(yàn)結(jié)果如表4所示.
表3 訓(xùn)練集和測(cè)試集數(shù)量分布Tab.3 The number distribution of training and test sets
表4 各種方法故障識(shí)別率比較Tab.4 Fault detection accuracy comparison of several methods
由表4可知將本文提出的多分類IPSO-SVM方法應(yīng)用于地鐵牽引控制單元,分類準(zhǔn)確率有明顯提高,同時(shí)結(jié)果也表明了用改進(jìn)的粒子群算法優(yōu)化支持向量機(jī)參數(shù)是一種有效方法.
支持向量機(jī)泛化能力強(qiáng),處理小樣本效果好的特性使其很適用于地鐵車輛故障診斷.但是SVM 參數(shù)對(duì)其模型精度和泛化能力有很大的影響.本文提出了一種改進(jìn)的粒子群算法來優(yōu)化SVM 懲罰因子和核函數(shù)寬度.在改進(jìn)算法中,使慣性權(quán)重在迭代中逐漸減小,來平衡種群的全局搜索能力和局部搜索能力;使用混沌序列來初始化個(gè)體位置,增強(qiáng)了搜索多樣性;且在PSO 算法中加入有效識(shí)別過早停滯的算法,在一定程度上避免了過早停滯的發(fā)生.實(shí)驗(yàn)部分證實(shí)了IPSOSVM 的有效性.本文以牽引控制單元作為研究對(duì)象,但所提出的方法同樣適用于地鐵車輛其他單元的故障診斷.
[1] Tang T,Zhu Y,Li J,etal.A fuzzy and neural network integrated intelligence approach for fault diagnosing and monitoring [J].IEE Conference Publication,1998(455):975-980.
[2] Kiernan L,Warwick K.Adaptive alarm processor for fault diagnosis on power transmission networks[J].Intelligent Systems Engineering,1993,2(1):25-37.
[3] McDuff R J,Simpson P K,Gunning D.An investigation of neural networks for F-16 fault diagnosis.I.System description [C] //AUTOTESTCON′89.IEEE Automatic Testing Conference.The Systems Readiness Technology Conference.Automatic Testing in the Next Decade and the 21st Century.Conference Record.Philadelphia:IEEE,1989:351-357.
[4] 張代勝,王 悅,陳朝陽.融合實(shí)例與規(guī)則推理的車輛故障診斷專家系統(tǒng)[J].機(jī)械工程學(xué)報(bào),2002,38(7):91-95.ZHANG Dai-sheng,WANG Yue,CHEN Zhaoyang.Vehicle-fault diagnosis expert system based on integration of case-based and rule-based reasoning [J].Chinese Journal of Mechanical Engineering,2002,38(7):91-95.(in Chinese)
[5] Pednault E P D.Statistical learning theory[M]//MIT Encyclopedia of the Cognitive Sciences.Cambridge:MIT Press,1998:798-801.
[6] 連光耀,王衛(wèi)國,黃考利,等.基于粒子群優(yōu)化算法的測(cè)試選擇優(yōu)化方法研究[J].計(jì)算機(jī)測(cè)量與控制,2008,16(10):1387-1389.LIAN Guang-yao,WANG Wei-guo,HUANG Kaoli,etal.Research of optimization method for test selection based on particle swarm optimization algorithm [J].Computer Measurement & Control,2008,16(10):1387-1389.(in Chinese)
[7] Cortes C,Vapnik V.Support-vector networks[J].Machine Learning,1995,20(3):273-297.
[8] Chapelle O,Vapnik V,Bousquet O,etal.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1-3):131-159.
[9] Vapnik V N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[10] Drucker H,WU Dong-h(huán)ui,Vapnik V N.Support vector machines for spam categorization[J].IEEE Transactions on Neural Networks,1999,10(5):1048-1054.
[11] Gaing Zwe-lee.Discrete particle swarm optimization algorithm for unit commitment[C]//2003IEEE Power Engineering Society General Meeting,Conference Proceedings.Toronto:IEEE,2003:418-424.
[12] van den Bergh F,Engelbrecht A P.A new locally convergent particle swarm optimiser [J].Proceedings of the IEEE International Conference on Systems,Man and Cybernetics,2002,3:94-99.
[13] LIU Bo,WANG Ling,JIN Yi-h(huán)ui,etal.Improved particle swarm optimization combined with chaos[J].Chaos,Solitons and Fractals,2005,25(5):1261-1271.
[14] Frank A,Asuncion A.UCI Machine Learning Repository [DB/OL].[2014-06-09].http://archive.ics.uci.edu/ml.
[15] LIU Bao-ling,HOU Di-bo,HUANG Ping-jie,et al.An improved PSO-SVM model for online recognition defects in eddy current testing [J].Nondestructive Testing and Evaluation,2013,28(4):367-385.
[16] GUO Yang-ming,MA Jie-zhong,XIAO Fan,etal.SVM with optimized parameters and its application to electronic system fault diagnosis[C]//PHM 2012-2012 IEEE International Conference on Prognostics and Health Management:Enhancing Safety,Efficiency,Availability and Effectiveness of Systems Through PHM Technology and Application,Conference Program.Washington D C:IEEE Computer Society,2012:1-6.