王 志,李有儒,田 晶,劉麗麗,李吉凱
(1.沈陽航空航天大學(xué)遼寧省航空推進系統(tǒng)先進測試技術(shù)重點實驗室,沈陽110136;2.北京交通大學(xué)信息科學(xué)研究所,北京100044)
中介軸承廣泛應(yīng)用于雙轉(zhuǎn)子航空發(fā)動機支承系統(tǒng)中,由于其工作于高、低壓轉(zhuǎn)子之間,潤滑較為困難,且隨著高、低壓轉(zhuǎn)子同時旋轉(zhuǎn)所受動載荷較大,極易發(fā)熱和過載,從而發(fā)生故障[1],進而可能對飛機的安全運行造成災(zāi)難性的危害。因此,對中介軸承狀態(tài)進行及時而準(zhǔn)確的監(jiān)測,對發(fā)生的故障進行準(zhǔn)確診斷對于保證發(fā)動機安全運行意義重大。
近年來,國內(nèi)外專家學(xué)者針對滾動軸承故障診斷開展了大量研究[2-3],但在中介軸承故障診斷方面的研究報道相對較少。廖明夫等[4-5]提出基于局部故障邊帶差值診斷法、轉(zhuǎn)差域頻譜和轉(zhuǎn)差域包絡(luò)譜方法對航空發(fā)動機中介軸承進行診斷;艾延廷等[6-7]提出了基于多種信息熵的融合算法,并通過所提出的信息熵距法和過程信息熵融合方法對中介軸承進行故障診斷。以上研究主要側(cè)重于故障特征提取方法的研究,針對中介軸承故障樣本小的故障識別算法研究較少。故障識別主要包括信號處理、特征提取和分類器設(shè)計3部分。振動信號是航空發(fā)動機軸承故障診斷中應(yīng)用最為廣泛的故障監(jiān)測信號,針對該信號的處理方法研究較為廣泛[8]。實現(xiàn)對信號更準(zhǔn)確的自適應(yīng)性分解,從而提取出能夠準(zhǔn)確反映軸承故障狀態(tài)的特征參數(shù)是特征提取的主要目的,也是故障診斷準(zhǔn)確與否的關(guān)鍵步驟。秦娜等[9]使用EMD算法對振動信號進行分解從而提取了有效的故障特征,并對特征進行分類識別取得良好的診斷效果。故障識別實質(zhì)上是數(shù)據(jù)挖掘問題,主要通過中介軸承故障特征提取和模型訓(xùn)練算法選擇實現(xiàn)。因每種訓(xùn)練算法特點不同,且不同的算法對不同類型數(shù)據(jù)的擬合能力也不盡相同。傳統(tǒng)分類器的設(shè)計基于單一的某種分類算法,弊端是分類效果過度的依賴于特征選取和訓(xùn)練集數(shù)據(jù)的清潔程度,從而使得訓(xùn)練算法具有魯棒性差、泛化能力低下等弱點[10-12]。
針對中介軸承故障信號傳遞路徑長、信噪比低,具有明顯的非線性、非平穩(wěn)性,診斷困難等特點,本文提出采用經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)模糊熵作為中介軸承故障特征向量,并建立1種基于k-最近鄰(k-NearestNeighbor,kNN)、支持向量機(Support Vector Machine,SVM)、決策分類樹(Classification And Regression Tree,CART)、隨機森林(Random Forest,RF)以及梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)5 種機器學(xué)習(xí)算法組合構(gòu)成的集成機器學(xué)習(xí)會診決策模型對中介軸承故障進行診斷。首先,開展某型航空發(fā)動機中介軸承故障模擬試驗,采集多轉(zhuǎn)速、多測點振動故障信號,并提取信號的EMD模糊熵構(gòu)造故障特征向量。然后,形成故障樣本并訓(xùn)練所提出的機器學(xué)習(xí)會診決策模型,并采用自適應(yīng)遺傳算法優(yōu)化個分類器權(quán)重,對決策結(jié)果進行融合。最后,采用會診模型對中介軸承故障進行診斷,檢驗?zāi)P偷姆夯芰Α?/p>
經(jīng)驗?zāi)J椒纸猓‥MD)是Huang等[13]提出的1種根據(jù)信號自身的時間特征尺度,將其自適應(yīng)性分解為若干個不同有限個本征模函數(shù)(Intrinsic Mode Function,IMF)分量的信號處理方法。因為EMD分解不受基函數(shù)的局限,能夠準(zhǔn)確有效地反映原始數(shù)據(jù)的微小特征,避免信號能量擴散和泄漏,故相比于小波算法的多分辨率,EMD方法在穩(wěn)定性和準(zhǔn)確性上具有更好的適應(yīng)能力。某中介軸承在故障狀態(tài)下采集到的振動信號經(jīng)EMD分解得到的各IMF分量波形如圖1所示。從圖中可見,原始信號經(jīng)過EMD分解后,各IMF分量包含了原信號的不同特征尺度,包含的頻段從高到低。由于某些微弱信號可以在IMF分量中突顯,因此利用IMF分量進行分析更加準(zhǔn)確。
圖1 中介軸承振動信號的EMD分解結(jié)果
模糊熵[14]是1種對時間序列復(fù)雜度進行度量的方法,可以衡量時間序列在發(fā)生維數(shù)變化時產(chǎn)生新模式的概率大小。中介軸承在正常和不同故障情況下信息復(fù)雜程度不同,產(chǎn)生新模式的概率也不相同,因此不同狀態(tài)的模糊熵不盡相同。模糊熵克服了樣本熵和近似熵突變性大和熵值連續(xù)性差的缺點。本文采用模糊熵作為中介軸承的故障特征參數(shù),其計算方法如下。
(1)將長度為N的原始序列x組成1組模式長度為m的向量序列
式中:Xm(i)為1個新的時間序列;x0(i)表示m個連續(xù)x(i)的均值。
(2)定義向量Xm(i)和Xm(j)的距離為dm(i,j)
(3)采用模糊函數(shù) μ(dm(i,j),n,r)定義向量 Xm(i)和Xm(j)的相似度Dm(i,j)
式中:r和n為相似容限和梯度;模糊函數(shù)為指數(shù)函數(shù)。
(4)定義函數(shù)
(5)增加維數(shù)至 m+1,重復(fù)上述步驟(1)~(4)得到φm+1(n,r)
(6)時間序列{x(i),i=1,2,…,N}的模糊熵可以定義為
式中:m、r和n的設(shè)定是模糊熵計算的主要參數(shù),本文取 m=2,r=0.2s,s為樣本的標(biāo)準(zhǔn)差,n=3。
軸承故障診斷多采用基于數(shù)據(jù)驅(qū)動判別式為核心的分類器設(shè)計,而機器學(xué)習(xí)算法是1種高效的分類器設(shè)計方法。在機器學(xué)習(xí)理論中,根據(jù)訓(xùn)練集數(shù)據(jù)有無標(biāo)簽,又可以將其分為監(jiān)督式學(xué)習(xí)和無監(jiān)督式學(xué)習(xí)。通常意義上通過構(gòu)建有監(jiān)督信息的航空發(fā)動機中介軸承故障數(shù)據(jù)集,并使用該集合訓(xùn)練所設(shè)計的分類器是基于數(shù)據(jù)的故障診斷問題的常用解決方案。本文基于此類通用的解決框架,通過優(yōu)化分類器設(shè)計來提高航空發(fā)動機中介軸承故障診斷性能。
2.2.1 k-近鄰(kNN)算法
kNN算法[15]是1種基于統(tǒng)計學(xué)思想的監(jiān)督式學(xué)習(xí)分類算法,其工作機理為:給定測試樣本,基于如廣義海明距離等某種距離度量方法找出訓(xùn)練集中與之最靠近的k個訓(xùn)練樣本,然后基于這k個“鄰居”的信息進行相應(yīng)的預(yù)測。本文在處理分類問題中可以使用“投票法”,即選擇這k個樣本中出現(xiàn)最多的類別標(biāo)簽作為預(yù)測結(jié)果。該算法可以針對中介軸承故障數(shù)據(jù)信噪比低的特點,實現(xiàn)野值和噪聲的去除并將訓(xùn)練集數(shù)據(jù)進行歸一化處理。
2.2.2 支持向量機(SVM)算法
支持向量機由Vapnik[16]提出并廣泛應(yīng)用于機械故障診斷等分類問題中。該算法最初為2值分類問題設(shè)計的,而中介軸承故障診斷為多分類問題。如直接修改目標(biāo)函數(shù)參數(shù),將不同分類平面的參數(shù)求解合并歸一化存在計算量過大問題。為了解決該問題,采用多個2分類組合成1個多分類器的方法實現(xiàn)中介軸承故障診斷的多分類功能。考慮中介軸承故障診斷結(jié)果,并兼顧模型在訓(xùn)練集和測試集上綜合的表現(xiàn),將模型中的懲罰系數(shù)設(shè)置為10。模型中采用徑向基函數(shù)(Radial Basis Function,RBF)作為核函數(shù)。核函數(shù)公式為
式中:x,y為特征向量;σ為控制函數(shù)徑向作用范圍的寬度參數(shù)。
2.2.3 分類回歸樹(CART)算法
分類回歸樹(CART)模型基于樹結(jié)構(gòu)建立,通常包含1個根節(jié)點和多個內(nèi)部節(jié)點和葉子結(jié)點。根節(jié)點中是樣本全集,葉子節(jié)點存放分類結(jié)果,中間節(jié)點對應(yīng)1個屬性測試。中介軸承的故障診斷過程即采集由模糊熵組成的故障數(shù)據(jù)樣本被劃分到對應(yīng)的故障類型的子節(jié)點中。訓(xùn)練過程,子節(jié)點的樣本純度(包含相同種類樣本的比例)不斷迭代。本文采用Gini系數(shù)進行節(jié)點純度度量,以降低Gini系數(shù)為目標(biāo)進行中間節(jié)點的屬性劃分。Gini系數(shù)可以表示為
式中:K為分類數(shù);pk為樣本屬于第k個類的概率。
2.2.4 集成學(xué)習(xí)算法
集成學(xué)習(xí)算法中的掛袋法和提升法是經(jīng)典的故障診斷方法。掛袋法又稱為引導(dǎo)聚集,只有在潛在的模型能產(chǎn)生不同的變化時才有效,即讓潛在的數(shù)據(jù)引入變化,就產(chǎn)生有著輕微變化的多種模型。掛袋法自舉產(chǎn)生個不同的數(shù)據(jù)集,然后對每個數(shù)據(jù)集構(gòu)建1個模型。對于分類問題,最后輸出的結(jié)果取決于投票。Leo Breiman[18]提出的隨機森林(RF)算法就是利用掛袋法思想通過改進決策樹而形成的1種集成學(xué)習(xí)技術(shù)。構(gòu)建隨機森林的步驟如下:
從1-T進行迭代,構(gòu)建T棵決策樹。
(1)對于每棵樹,從輸入數(shù)據(jù)集中自舉大小為D的樣本。
(2)對輸入數(shù)據(jù)產(chǎn)生出1棵樹t:
Step1:隨機選擇m個屬性;
Step2:采用預(yù)先定義好的標(biāo)準(zhǔn),選擇1個最佳屬性作為劃分變量;
Step3:將數(shù)據(jù)集劃分成2部分;
Step4:在已經(jīng)劃分的數(shù)據(jù)集Step1-Step3;
(3)返回樹 T。
Friedman[19]提出的GBDT算法是采用M棵決策樹為弱分類器的加法模型,其數(shù)學(xué)形式表示為
式中:ω0為初始值;Φ(x)為模型的損失函數(shù)。
傳統(tǒng)提升法將所有樣本初始化相同權(quán)重,通過迭代過程發(fā)現(xiàn)樣本的分類差異進而對其權(quán)值進行調(diào)整,每次迭代都將產(chǎn)生1個弱分類器。最后通過投票或加權(quán)等方式產(chǎn)生最后的強分類器。該方法對中介軸承故障信號這種非線性、非平穩(wěn)信號診斷效率較低。梯度提升表示在模型訓(xùn)練的過程中,為減小殘差而在殘差降低的梯度的方向上去建立新的模型。使上一個模型的殘差在梯度方向上減少,提高中介軸承故障診斷效率。
基于機器學(xué)習(xí)理論中的集成學(xué)習(xí)方法思想建立機器學(xué)習(xí)會診模型。但有別于集成學(xué)習(xí)算法融合多種弱分類器,針對中介軸承故障信號非線性、非平穩(wěn)和信噪比低的特點,本文建立的會診模型融合kNN、SVM、CART、RF和GBDT等5種強分類器。通過對會診模型中的5種強分類器的決策結(jié)果進行融合,抑制信號中的噪聲和野值,提高信噪比,提升中介軸承故障診斷效率。
本文建立的會診模型是基于Bootstrap抽樣方法構(gòu)建與訓(xùn)練樣本相同的數(shù)據(jù)集,基于抽樣后的新的故障數(shù)據(jù)集,訓(xùn)練kNN、SVM、CART、RF和GBDT等5種強分類器。通過統(tǒng)計多個分類器得到的決策結(jié)果產(chǎn)生最終診斷結(jié)果,同時根據(jù)故障診斷結(jié)果,采用遺傳算法優(yōu)化5個分類器的決策權(quán)重,最終結(jié)果優(yōu)于單個分類器診斷獲得的結(jié)果,提高中介軸承故障診斷的容錯能力,降低誤判率。
遺傳算法目標(biāo)函數(shù)為
式中:f為會診模型故障識別準(zhǔn)確度;ξi為子模型的準(zhǔn)確度;λi為子模型的權(quán)重。
遺傳算法編碼長度選擇采用40位長度的二進制碼實現(xiàn)。初始種群容量為50,初始交叉概率為0.9,初始變異概率為0.01。
機器學(xué)習(xí)會診模型的實現(xiàn)過程如圖2所示。
圖2 會診模型決策融合過程
集成學(xué)習(xí)會診模型是基于信息融合中的決策融合理論構(gòu)建的1種信息融合故障診斷模型。該模型區(qū)別于現(xiàn)有的同類模型決策融合,是基于Bootstrap抽樣方法建立的異類模型的決策融合診斷模型,其融合了以SVM為代表的核模型和以GBDT為代表的樹模型,集成了2種類模型的優(yōu)點。因此,提高了故障診斷的精度和泛化能力。
為驗證機器學(xué)習(xí)會診模型在航空發(fā)動機中介軸承故障診斷中的性能,開展某型航空發(fā)動機中介軸承故障模擬試驗,其試驗臺如圖3所示。該試驗臺能夠模擬中介軸承與發(fā)動機匣之間的傳遞路徑,其信號復(fù)雜程度更加接近發(fā)動機實際工作狀態(tài)。同時在機匣的表面上布置了5個ICP加速度傳感器,采用Test.lab數(shù)據(jù)采集分析系統(tǒng)進行振動數(shù)據(jù)采集。在試驗中采集了不同轉(zhuǎn)速下的中介軸承內(nèi)環(huán)故障、內(nèi)環(huán)-滾動體耦合故障、正常、滾棒剝落、滾棒劃傷5種不同狀態(tài)的振動信號。每次試驗采樣時間為2 s,采樣頻率為6400 Hz,每種故障類型試驗40次。試驗所采用的某型發(fā)動機中介軸承為圓柱滾棒軸承,軸承結(jié)構(gòu)如圖4所示,軸承參數(shù)見表1。
圖3 航空發(fā)動機中介軸承故障模擬試驗臺
圖4 某型航空發(fā)動機中介軸承
表1 中介軸承幾何參數(shù)
采集信號經(jīng)EMD分解得到10維IMF分量,按照式(1)~(8)計算出相應(yīng)的模糊熵作為故障特征,選取前8維特征向量組成特征矩陣。每種狀態(tài)試驗40次,在5種狀態(tài)下總計200組模糊熵值。最后得到特征矩陣和標(biāo)簽向量
在保證訓(xùn)練集和測試集樣本屬性分布一致的情況下,劃分訓(xùn)練集和測試集的比例大小為80%和20%。最終用160個帶故障類別的樣本訓(xùn)練會診決策模型,40個帶故障類別的樣本測試會診模型的泛化能力并根據(jù)中介軸承故障預(yù)測結(jié)果的準(zhǔn)確率對模型進行評估。部分故障樣本見表2。
表2 部分EMD模糊熵故障樣本
采用所建立的會診決策模型對160組訓(xùn)練樣本進行分類測試,分類結(jié)果如圖5、6所示。
圖5 IMF1和IMF2維度的分類結(jié)果
圖6 IMF3和IMF4維度的分類結(jié)果
從圖5、6中可見,樣本數(shù)據(jù)在IMF1-2上的類聚性最優(yōu),IMF3-4次之。根據(jù)聚類結(jié)果可知,會診模型在對于160組訓(xùn)練樣本能夠準(zhǔn)確分類,分類準(zhǔn)確率達到100%。
為了驗證模型的泛化能力,采用40組測試樣本對所建立的會診模型進行測試。故障診斷結(jié)果如圖7所示。
從圖中可見,會診模型的泛化能力較好,最終實現(xiàn)了92.5%的診斷率。其中在圖中圓圈標(biāo)記的3個點為錯誤分類情況。即錯誤的將內(nèi)環(huán)故障狀態(tài)混同于內(nèi)環(huán)和滾動體聯(lián)合故障狀態(tài)。這是由于2種故障模式中內(nèi)環(huán)都存在故障,故障樣本的EMD模糊熵較為相似,因此出現(xiàn)誤分類。而會診模型在對正常狀態(tài)、滾棒劃傷狀態(tài)以及滾棒剝落狀態(tài)下表現(xiàn)良好,均實現(xiàn)了零失誤診斷。由此可見,會診模型在某型航空發(fā)動機中介軸承故障診斷中表現(xiàn)出良好的泛化性能。
圖7 泛化性能測試結(jié)果
為驗證會診模型的決策性能優(yōu)于單一模型,采用相同的訓(xùn)練集和測試集分別對5種單一模型和會診模型進行訓(xùn)練并進行泛化能力測試。模型間的故障診斷準(zhǔn)確率比較如圖8所示。
圖8 模型泛化能力比較
從圖中可見,會診模型診斷準(zhǔn)確率達到92.5%,優(yōu)于其他基礎(chǔ)識別算法,在試驗中SVM、RF以及GBDT模型分別以90%、87.5%和85%取得較好的分類結(jié)果,而kNN、CART模型診斷準(zhǔn)確率則小于80%相對落后。同時,試驗驗證了本文所選取的基礎(chǔ)模型在保持較好泛化能力的同時且存在一定決策能力差別,因而成功地實現(xiàn)了差異化的基礎(chǔ)模型選擇過程。
(1)針對中介軸承故障信號微弱且具有非平穩(wěn)性的特點,提出采用EMD模糊熵這一非線性動力學(xué)參數(shù)作為故障特征。試驗數(shù)據(jù)表明:中介軸承的5種不同故障狀態(tài)下的EMD模糊熵具有較好的類別可分性;
(2)采用基于多種機器學(xué)習(xí)算法的集成學(xué)習(xí)會診模型,有利于整合不同類型機器學(xué)習(xí)方法在不同故障辨識中的優(yōu)勢。試驗結(jié)果證明:會診模型在測試集的泛化能力測試中表現(xiàn)出良好的學(xué)習(xí)能力和較為精準(zhǔn)的分類性能;
(3)對比分析了會診模型與其基分類器之間的泛化能力,會診模型故障診斷準(zhǔn)確率為92.5%,優(yōu)于其基分類器。由此可見,會診模型實現(xiàn)了利用不同類型分類算法之間的優(yōu)勢,以完成更高質(zhì)量診斷任務(wù)的預(yù)期結(jié)果。