馮 帥
(1.北京公共交通控股(集團(tuán))有限公司,北京 100161)
基于SVM-AdaBoost算法的軌道交通列車(chē)滾動(dòng)軸承故障診斷
馮 帥
(1.北京公共交通控股(集團(tuán))有限公司,北京 100161)
軌道交通列車(chē)走行部滾動(dòng)軸承是關(guān)鍵且故障多發(fā)的部件之一,其工作狀態(tài)直接影響列車(chē)的安全。故研究走行部滾動(dòng)軸承故障診斷技術(shù)對(duì)保障列車(chē)安全可靠運(yùn)營(yíng)有著現(xiàn)實(shí)意義。通過(guò)設(shè)計(jì)軸承運(yùn)行實(shí)驗(yàn),盡可能逼近現(xiàn)場(chǎng)實(shí)際工況,采集信號(hào),提取合理故障信號(hào)特征;提出一種軸承智能故障辨識(shí)算法,實(shí)現(xiàn)高精度的故障診斷。結(jié)果表明,此兩種方法均具有較好的應(yīng)用價(jià)值,能滿(mǎn)足軸承故障診斷的技術(shù)需求。
交通安全;軌道交通;SVM-AdaBoost;故障診斷
軌道交通列車(chē)是個(gè)非常復(fù)雜的系統(tǒng),其中任一環(huán)節(jié)出問(wèn)題,都可能造成車(chē)毀人亡的嚴(yán)重事故。而軸承是軌道交通列車(chē)應(yīng)用最廣泛,同時(shí)也是易損的部件之一,其工作狀態(tài)對(duì)列車(chē)安全有著重大影響[1]。
載客列車(chē)長(zhǎng)期超負(fù)荷已成常態(tài),走行部軸承“亞健康”狀態(tài)日益明顯。圖1為廣州地鐵列車(chē)近3年的列車(chē)各系統(tǒng)故障數(shù)據(jù)統(tǒng)計(jì),從圖可知,列車(chē)各大系統(tǒng)中走行部故障約占總故障數(shù)的35%。在列車(chē)走行部故障中,機(jī)械部件故障高達(dá)78%(圖2)。旋轉(zhuǎn)機(jī)械的很多故障跟機(jī)械零件故障有著密不可分的聯(lián)系。據(jù)粗略統(tǒng)計(jì),其中旋轉(zhuǎn)機(jī)械部件故障有大于1/3是由軸承因素造成的。
研究軌道交通列車(chē)軸承的狀態(tài)辨識(shí),對(duì)降低列車(chē)運(yùn)行時(shí)隱患的發(fā)生,提高列車(chē)運(yùn)行安全性,具有重要意義。
圖1 廣州地鐵列車(chē)各系統(tǒng)故障統(tǒng)計(jì)
圖2 走行部各類(lèi)別故障統(tǒng)計(jì)
本文通過(guò)設(shè)計(jì)滾動(dòng)軸承工作運(yùn)行實(shí)驗(yàn),逼近現(xiàn)場(chǎng)實(shí)際工況,并用信號(hào)采集裝置拾取振動(dòng)信號(hào),提取合理故障信號(hào)特征,提出軸承智能故障辨識(shí)算法,從而實(shí)現(xiàn)高精度的軸承故障診斷。
為了采集各種軸承工作狀態(tài)下的振動(dòng)信號(hào),搭建了軌道交通列車(chē)走行部軸承故障診斷實(shí)驗(yàn)平臺(tái),該實(shí)驗(yàn)臺(tái)主要包括驅(qū)動(dòng)電機(jī)、滾動(dòng)軸承、傳感器等部分,如圖3所示。
圖3 走行部軸承故障模擬實(shí)驗(yàn)臺(tái)
本次實(shí)驗(yàn)選擇4個(gè)走行部軸承,分別是內(nèi)圈故障,外圈故障,滾珠故障和正常狀態(tài)的滾動(dòng)軸承。模擬實(shí)驗(yàn)臺(tái)軸承如圖4所示。
故障振動(dòng)信號(hào)涵蓋了相應(yīng)的沖擊成分,分析它們對(duì)辨識(shí)軸承狀態(tài)及類(lèi)型很有益處。但是這些沖擊成分往往被環(huán)境噪聲干擾,不能單一地從時(shí)域或頻域特征中提取。小波包技術(shù)可較理想地對(duì)信號(hào)多頻帶分析,從而提取能量特征。融合時(shí)域特征參數(shù)及小波包各頻帶能量,并結(jié)合智能故障診斷算法,從而可較為準(zhǔn)確地辨識(shí)故障類(lèi)型,進(jìn)一步保障列車(chē)運(yùn)營(yíng)安全,實(shí)現(xiàn)運(yùn)維模式的轉(zhuǎn)變。
圖4 軸承狀態(tài)圖
2.1 時(shí)域特征參數(shù)
振動(dòng)信號(hào)的時(shí)域特征變化表示信號(hào)大小隨時(shí)間t而改變的趨勢(shì),通過(guò)對(duì)信號(hào)的時(shí)域分析能在時(shí)間域上顯示信號(hào)的整體變化走向。
根據(jù)以上公式,計(jì)算各種軸承狀態(tài)下的時(shí)域特征參數(shù),480r/min轉(zhuǎn)速時(shí)的見(jiàn)表1、表2、表3、表4。
從以上的時(shí)域特征參數(shù)可知,時(shí)域各指標(biāo)對(duì)滾動(dòng)軸承的缺陷足夠敏感;軸承一旦缺陷情況下,峰值、均值、峭度,均發(fā)生了顯著改變,其余的時(shí)域參數(shù)規(guī)律性相對(duì)較差。
表1 480r/min轉(zhuǎn)速時(shí)無(wú)故障軸承信號(hào)的時(shí)域指標(biāo)值
表2 480r/min轉(zhuǎn)速時(shí)滾珠故障軸承信號(hào)的時(shí)域指標(biāo)值
表3 480r/min轉(zhuǎn)速時(shí)內(nèi)圈故障軸承信號(hào)的時(shí)域指標(biāo)
表4 480r/min速度時(shí)外圈故障軸承信號(hào)的時(shí)域指標(biāo)
時(shí)域指標(biāo)可以表征軸承部分信息,在這里時(shí)域指標(biāo)選取均值與峭度。然而,單一地用時(shí)域指標(biāo)參數(shù)作為特征向量診斷軸承誤差通常很大。所以,需要再利用信號(hào)處理技術(shù)分析數(shù)據(jù)。下面用小波包分解方法分析振動(dòng)信號(hào),并將其與時(shí)域指標(biāo)一起作為軸承特征參量。
小波包分解的出現(xiàn)與發(fā)展不但會(huì)在低頻成分分解,還會(huì)在高頻成分分解,因此能夠更全面地涵蓋軸承狀態(tài)信息。對(duì)于軸承這樣的列車(chē)關(guān)鍵部件,全面捕捉有用信息,精確診斷,小波包分解將更具可靠性和可行性[3]。
基于Daubechies(db小波)的小波基函數(shù)相較于其他小波函數(shù)更適于軸承故障振動(dòng)信號(hào)分析,因此選擇db小波基函數(shù)來(lái)分析振動(dòng)信號(hào)。理論上講,隨著小波的序號(hào)N不斷增加,其性能越來(lái)越好,但實(shí)際是當(dāng)N=5時(shí),其性能最好。若N繼續(xù)增加,性能提高并不明顯,故本文選擇db5作為適合列車(chē)走行部滾動(dòng)軸承故障信號(hào)分析的小波基函數(shù)。將信號(hào)進(jìn)行3層小波包分解,得到8個(gè)子頻帶。3層分解的過(guò)程如圖5所示。表示分解的層數(shù),C表示振動(dòng)信號(hào)低頻部分,與尺度空間相對(duì)應(yīng),D表示信號(hào)高頻部分??傉駝?dòng)信號(hào)F=CCC3+DCC3+CDC3 +DDC3+CCD3+DCD3+CDD3+DDD3。
圖5 小波包變換示意圖
振動(dòng)信號(hào)在不同頻帶內(nèi),其能量值大小各異,故可通過(guò)計(jì)算各信號(hào)每個(gè)頻帶的能量判斷軸承是否發(fā)生故障。從包含有主要故障信息的小波包分解系數(shù)中提取出來(lái)的能量特征融合部分時(shí)域指標(biāo),作為數(shù)據(jù)的輸入,建立機(jī)器學(xué)習(xí)模型,進(jìn)而判斷軸承的工作狀態(tài)和故障類(lèi)型。
由parseval恒等式得:
特征向量T受滾動(dòng)軸承故障狀態(tài)影響,不同故障狀態(tài),其運(yùn)轉(zhuǎn)過(guò)程中產(chǎn)生的能量分布不同,所以可用T有效表征故障特征信息,從而用于軸承故障辨識(shí)。
在運(yùn)用小波包分解方法獲得能量特征向量的基礎(chǔ)上,將其作為表征軸承故障信息特征參量的一部分,并融合時(shí)域指標(biāo),共同構(gòu)成特征參量,為后續(xù)使用集成學(xué)習(xí)故障診斷算法診斷故障打下基礎(chǔ)。
將所得到的8個(gè)小波包能量特征與2個(gè)時(shí)域指標(biāo)參數(shù)(均值、峭度)相結(jié)合,組成每組10維特征向量,在一定程度上反映了軸承各種狀態(tài)下的信息特點(diǎn),有利于提高故障分類(lèi)精度。圖6(a)、圖6(b)是軸承4種工況下的各頻帶能量分布情況。
列車(chē)軸承故障模擬實(shí)驗(yàn)過(guò)程中,待診斷信號(hào)采樣頻率設(shè)為51.2kHz,每次取32768(32*1024)個(gè)點(diǎn)的信號(hào)作為樣本集采取小波包分解計(jì)算,那么這段信號(hào)時(shí)間長(zhǎng)度為0.64s,它包含了此軸承在0.64s內(nèi)的狀態(tài)信息,因此這段信號(hào)能有效包含軸承當(dāng)前的信息特征。本實(shí)驗(yàn)列車(chē)走行部滾動(dòng)軸承4種狀態(tài)每種分別做了80組實(shí)驗(yàn)。因此,每類(lèi)軸承狀態(tài)共得到80組8維的特征參量,總共得到320組特征參量。將其作為特征參量的一部分組成,也即前8個(gè)屬性。并融合時(shí)域指標(biāo),共同構(gòu)成最終的特征參量。
從圖6(a)、圖6(b)可以看出,四種狀態(tài)下能量特征參量存在較大差異,各有自身的特點(diǎn)。雖然已得到各種故障狀態(tài)的特征參量,它們之間也有較大差異,但仍然無(wú)法識(shí)別其故障類(lèi)型等。因此,需要構(gòu)建一套機(jī)器學(xué)習(xí)算法來(lái)搭建故障診斷模型,從而準(zhǔn)確區(qū)分各種故障種類(lèi)。
3.1 支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是由Corinna Cortes和Vapnik等學(xué)者于20世紀(jì)末期最先提出的。它以統(tǒng)計(jì)理論為基礎(chǔ),依照對(duì)訓(xùn)練數(shù)據(jù)的學(xué)習(xí)精度與學(xué)習(xí)能力之間找到最佳的折衷,以期望獲得較好泛化能力,它可一定程度上解決小樣本分類(lèi)問(wèn)題,是就機(jī)器學(xué)習(xí)問(wèn)題所構(gòu)建的一種智能故障診斷理論體系[5]。
圖6 (b) 外圈故障和內(nèi)圈故障振動(dòng)信號(hào)能量分布
SVM最初是為解決線(xiàn)性可分情況下的分類(lèi)問(wèn)題才提出的。圖7是二維二分類(lèi)問(wèn)題,其中圓圈、方框分別代表其訓(xùn)練集合。H可作為兩類(lèi)樣本的分類(lèi)線(xiàn),H1和H2代表與H相平行且離H最近的直線(xiàn),d為H1和H2直線(xiàn)間的距離。一般最優(yōu)分類(lèi)線(xiàn),也即需使其不僅僅可將兩類(lèi)數(shù)據(jù)正確分開(kāi),且需讓它們的間距是最大的。前者是為了使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,間距最大也即讓真實(shí)風(fēng)險(xiǎn)最小。將兩類(lèi)問(wèn)題應(yīng)用到更高維,H即稱(chēng)為最優(yōu)分類(lèi)面。定義標(biāo)準(zhǔn)超平面和。H1和H2上的點(diǎn)就是支持向量。支持向量之間距離,所以問(wèn)題變成在限制條件下,求的情況。
圖7 支持向量機(jī)分類(lèi)
對(duì)于線(xiàn)性不可分問(wèn)題,線(xiàn)性可分SVM可能會(huì)出現(xiàn)過(guò)學(xué)習(xí)效果。因此有必要構(gòu)建更適合的SVM算法。對(duì)于非線(xiàn)性分類(lèi)問(wèn)題,SVM處理原則為,將原來(lái)非線(xiàn)性問(wèn)題的原始樣本進(jìn)行非線(xiàn)性變換映射至更高維空間中,在中確定最優(yōu)分類(lèi)面。須注意,維數(shù)有可能很高,運(yùn)用核函數(shù)SVM可以處理此問(wèn)題。
不同的核函數(shù),對(duì)應(yīng)不同的算法。目前,在分類(lèi)問(wèn)題領(lǐng)域,通常涉及到的核函數(shù)主要有三種,表達(dá)式分別如下[6]。
(1)線(xiàn)性(Linear)核函數(shù):
(2)多項(xiàng)式(Polynomial)核函數(shù):
(3)徑向基(Radial Basis Function,簡(jiǎn)稱(chēng)RBF)核函數(shù):
其中,g表示核函數(shù)的寬度。大量研究表明,選擇RBF類(lèi)型核函數(shù)用于機(jī)械故障識(shí)別,準(zhǔn)確度相對(duì)較高,因此本文用RBF核函數(shù)構(gòu)建SVM分類(lèi)模型。在訓(xùn)練SVM模型時(shí),核函數(shù)參數(shù)g和懲罰因子c對(duì)故障辨識(shí)結(jié)果都有較大影響。其中g(shù)反映訓(xùn)練數(shù)據(jù)在高維特征空間中的分布復(fù)雜度,c反映學(xué)習(xí)機(jī)器的學(xué)習(xí)能力,分別影響著映射關(guān)系和經(jīng)驗(yàn)風(fēng)險(xiǎn)比例。本文采用交叉驗(yàn)證與網(wǎng)絡(luò)搜索方法,尋找最佳的c與g組合。
3.2 AdaBoost集成學(xué)習(xí)
AdaBoost提升方法是由Freund和Schipare于1995年首先提出的。AdaBoost方法可理解為Hedge(β)算法的拓展,它也是Boosting算法族中的最經(jīng)典方法之一[7]。AdaBoost把每個(gè)訓(xùn)練樣本點(diǎn)都賦予一權(quán)重,每輪迭代都對(duì)權(quán)重做出調(diào)整,如果某個(gè)樣本點(diǎn)沒(méi)有被準(zhǔn)確地分類(lèi),那么它的權(quán)重就得到提高,相反,如果樣本點(diǎn)被錯(cuò)誤分類(lèi)則減少權(quán)重,通過(guò)幾個(gè)基本分類(lèi)器加權(quán)多數(shù)表決組合得到較復(fù)雜的強(qiáng)分類(lèi)器。AdaBoost集成學(xué)習(xí)的一般流程如下。
選好訓(xùn)練樣本,初始化其權(quán)值分布;運(yùn)用具有初始權(quán)重分布的訓(xùn)練樣本學(xué)習(xí),獲取多個(gè)基本分類(lèi)器;計(jì)算子分類(lèi)器在訓(xùn)練數(shù)據(jù)上的分類(lèi)誤差值;計(jì)算的系數(shù),此系數(shù)代表在最終分類(lèi)器中的重要程度;更新訓(xùn)練數(shù)據(jù)集權(quán)值分布情況。權(quán)值更新原則是增加前一輪子分類(lèi)器錯(cuò)誤分類(lèi)樣本的權(quán)重,使被錯(cuò)誤分類(lèi)的數(shù)據(jù)在后一輪弱分類(lèi)器中得到更到的關(guān)注度,這樣分類(lèi)問(wèn)題就被多個(gè)子分類(lèi)器分而治之;將多個(gè)子分類(lèi)器通過(guò)聯(lián)合方式組織起來(lái),進(jìn)而形成最終分類(lèi)誤差小且穩(wěn)定的強(qiáng)分類(lèi)器。
3.3 基于SVM算法的軸承故障診斷
上述提取了4種軸承狀態(tài)下的信號(hào)特征樣本共320(4*80)組,并分別提取了每組樣本數(shù)據(jù)的10維特征向量。隨機(jī)選280組作為SVM分類(lèi)模型的訓(xùn)練集,其余40組數(shù)據(jù)作為測(cè)試集。
交叉驗(yàn)證是機(jī)器學(xué)習(xí)過(guò)程中性能評(píng)價(jià)和參數(shù)選擇的有效方法,其基本思想是把原始數(shù)據(jù)分為兩部分,一部分作為訓(xùn)練數(shù)據(jù),另一部分作為測(cè)試數(shù)據(jù),首先用訓(xùn)練集對(duì)分類(lèi)器訓(xùn)練,再用測(cè)試數(shù)據(jù)集來(lái)測(cè)試已訓(xùn)練好的模型,以此作為衡量分類(lèi)器性能好壞的指標(biāo)。
利用交叉驗(yàn)證的方法確定RBF核函數(shù)中的c和g。第一步確立參數(shù)對(duì)(c,g),是為了得到最好的參數(shù)樹(shù)(c,g),獲取準(zhǔn)確率最大的交叉驗(yàn)證結(jié)果。對(duì)c和g用網(wǎng)格搜索的方法,兩兩組合配對(duì)。應(yīng)用交叉驗(yàn)證方法,在無(wú)驗(yàn)證樣本集時(shí)能找到最佳參數(shù)c和g,但此時(shí)最佳參數(shù)c和g只是使訓(xùn)練樣本集在交叉驗(yàn)證思想下能達(dá)到分類(lèi)準(zhǔn)確率最大的參數(shù),卻并不完全確保會(huì)使得測(cè)試樣本集也能達(dá)到最高分類(lèi)準(zhǔn)確率。
交叉檢驗(yàn)結(jié)果如圖8(a)、圖8(b)所示。其中圖8(a)中x軸代表c取以2為底對(duì)數(shù)的值,y軸代表g取以2為底對(duì)數(shù)的值,從圖8(a)可以看到,右下角范圍內(nèi)c和g原則上都可以使得建立的SVM分類(lèi)器分類(lèi)準(zhǔn)確率達(dá)到最優(yōu),圖8(b)中頂端的曲面所覆蓋的c和g值也會(huì)使分類(lèi)準(zhǔn)確率最優(yōu)。根據(jù)參數(shù)選擇原則,此處選取c=0.10882和g=0.57435,交叉驗(yàn)證最優(yōu)平均準(zhǔn)確率為100%。
圖8 (b) 訓(xùn)練數(shù)據(jù)參數(shù)選擇結(jié)果
在采用時(shí)域指標(biāo)和小波包能量特征參數(shù)提取特征向量的基礎(chǔ)上,利用SVM算法進(jìn)行故障辨識(shí)。對(duì)軸承四種狀態(tài)分別定義標(biāo)簽見(jiàn)表5。
從圖9可看出,利用SVM方法,診斷4種軸承工況的分類(lèi)準(zhǔn)確率為。表6給出了4種軸承狀態(tài)的測(cè)試結(jié)果。
從表6可見(jiàn),SVM算法分類(lèi)辨識(shí)效果相對(duì)較低,不能滿(mǎn)足故障診斷的要求。因此,為更精確辨識(shí)各種故障類(lèi)型,需要進(jìn)一步對(duì)算法進(jìn)行改進(jìn),故提出集成學(xué)習(xí)故障診斷算法。它們通過(guò)改變訓(xùn)練樣本權(quán)重,學(xué)習(xí)一系列基本分類(lèi)器(SVM作為基本分類(lèi)器),并將這些基本分類(lèi)器進(jìn)行組合,從而形成一種提升集成學(xué)習(xí)方法,以更準(zhǔn)確迅速地診斷軸承故障。
表5 期望輸出標(biāo)簽
表6 SVM算法診斷結(jié)果
圖9 SVM算法故障診斷結(jié)果
針對(duì)AdaBoost提升學(xué)習(xí)的優(yōu)勢(shì),提出采用以RBF的支持向量機(jī)作為基本分類(lèi)器的一種新方法——SVM-AdaBoost。故障診斷流程如圖10所示。
根據(jù)圖10 SVM-AdaBoost算法軸承故障診斷,則強(qiáng)分類(lèi)器SVM-AdaBoost對(duì)測(cè)試樣本分類(lèi)結(jié)果如圖11所示。其中,測(cè)試結(jié)果分類(lèi)正確樣本數(shù)是40個(gè),錯(cuò)分樣本0個(gè),分類(lèi)準(zhǔn)確率是。與單個(gè)SVM分類(lèi)器相比,故障辨識(shí)的準(zhǔn)確率從82.5%提高到了100%。因此,改進(jìn)后的提升算法SVMAdaBoost在故障辨識(shí)方面有較為明顯的優(yōu)勢(shì)。
圖10 SVM-AdaBoost流程設(shè)計(jì)
圖11 SVM-AdaBoost組合分類(lèi)辨識(shí)結(jié)果
對(duì)比SVM和SVM-AdaBoost兩種不同的模式識(shí)別方法,在同等條件下診斷軸承故障,發(fā)現(xiàn)集成學(xué)習(xí)診斷算法具有較高的辨識(shí)精度、較快的診斷效率、較穩(wěn)定的辨識(shí)結(jié)果。相對(duì)單個(gè)分類(lèi)器而言,具有很大優(yōu)越性,能滿(mǎn)足故障辨識(shí)的要求。但是目前僅針對(duì)單一故障類(lèi)型進(jìn)行研究,而在實(shí)際運(yùn)營(yíng)工況中,很可能是多個(gè)故障同時(shí)發(fā)生。如何對(duì)復(fù)合故障辨識(shí),將是下一步的研究課題。
[ 1 ] 孫寧. 地鐵車(chē)輛轉(zhuǎn)向架軸承故障診斷方法研究[J]. 城市建設(shè)理論研究:電子版, 2015(11):1-2.
[ 2 ] 萬(wàn)書(shū)亭, 吳美玲. 基于時(shí)域參數(shù)趨勢(shì)分析的滾動(dòng)軸承故障診斷[J]. 機(jī)械工程與自動(dòng)化, 2010(3):108-110.
[ 3 ] 趙志宏,楊紹普.基于小波包變換與樣本熵的滾動(dòng)軸承故障診斷[J].振動(dòng)測(cè)試與診斷, 2012, 32(4):640-644.
[ 4 ] 荊雙喜,華偉.基于小波-支持向量機(jī)的齒輪故障診斷研究[J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版, 2008, 27(4):31-36.
[ 5 ] 楊宇.基于EMD和支持向量機(jī)的旋轉(zhuǎn)機(jī)械故障診斷方法研究[D].長(zhǎng)沙:湖南大學(xué),2005.
[ 6 ] 李志農(nóng), 王心怡, 張新廣. 基于核函數(shù)主元分析的滾動(dòng)軸承故障模式識(shí)別方法[J]. 軸承, 2008(6):36-39.
[ 7 ] 周?chē)?guó)雄, 沈?qū)W杰, 李琳,等. 基于A(yíng)daBoost的網(wǎng)絡(luò)入侵智能檢測(cè)[J]. 系統(tǒng)仿真學(xué)報(bào), 2014, 26(7):1517-1521.
Fault diagnosis of railway rolling bearing based on SVM-AdaBoost
(1.Beijing Public Transport Holdings,Ltd,Beijing 100161)
Feng Shuai
Running gear's rolling element bearings are key elements in rail transit trains, and are one of the multiple fault components, it directly affects the safety of rail transit trains. Therefore, research on the fault diagnosis technology of running gear's rolling bearings is of great practical significance to the safety and reliability for trains. Rolling bearing operation experiments are designed to approach operating conditions. And vibration acceleration signal is collected with a signal collecting device, the reasonable fault feature is extracted, a new bearing intelligent fault diagnosis algorithm is proposed, and can meet the needs of the rolling bearing fault diagnosis. The result shows that these two algorithms are significant in application, and can meet the needs of the rolling bearing fault diagnosis.
traffic safety; rail transit; SVM-AdaBoost ; Fault Diagnosis
U279.2
B