于飛, 樊清川, 宣敏
(海軍工程大學(xué) 電氣工程學(xué)院,湖北 武漢 430033)
滾動(dòng)軸承的運(yùn)行狀態(tài)能夠直接影響電機(jī)的整體性能,電機(jī)故障中有40%左右是由軸承故障引發(fā)[1],是電機(jī)健康監(jiān)測的重要對象,通過有效評估電機(jī)軸承的退化狀態(tài)并及時(shí)預(yù)測軸承故障,進(jìn)行早期維護(hù)和檢修,可以避免工業(yè)中的經(jīng)濟(jì)損失和重大安全事故。電機(jī)軸承故障預(yù)測的關(guān)鍵在于兩點(diǎn):一是確定合適的軸承性能退化指標(biāo),二是搭建有效的故障預(yù)測模型。
性能退化指標(biāo)是故障判別標(biāo)準(zhǔn)的關(guān)鍵,現(xiàn)有的研究中大多用峰度、均方根、峰峰值等無量綱參數(shù)作為性能退化指標(biāo),預(yù)測模型是故障預(yù)測的核心,近年來有許多學(xué)者利用機(jī)器學(xué)習(xí)算法有效地實(shí)現(xiàn)了軸承的故障預(yù)測。文獻(xiàn)[2]利用字典學(xué)習(xí)法對振動(dòng)信號進(jìn)行降噪處理,并采用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行軸承故障預(yù)測,證明了BP神經(jīng)網(wǎng)絡(luò)在軸承故障預(yù)測中的有效性,但其權(quán)值和閾值的設(shè)置較大地影響了預(yù)測的精度;文獻(xiàn)[3]使用遞歸能量化分析以及自回歸模型實(shí)現(xiàn)了退化的檢測和狀態(tài)的預(yù)測;文獻(xiàn)[4]引入了兩種新型混合模型相互結(jié)合,實(shí)現(xiàn)了軸承的剩余壽命預(yù)測;文獻(xiàn)[5]提出利用堆疊去噪自編碼累積和時(shí)滯最小二乘支持向量機(jī)的牽引電機(jī)狀態(tài)預(yù)測方法,利用堆疊去噪自編碼器進(jìn)行特征降維并獲得相關(guān)退化指標(biāo),通過對退化指標(biāo)的預(yù)測實(shí)現(xiàn)運(yùn)行狀態(tài)預(yù)測;文獻(xiàn)[6]利用核主元分析法構(gòu)建T2和SPE統(tǒng)計(jì)量作為電機(jī)軸承退化指標(biāo),將預(yù)處理過的振動(dòng)信號輸入支持向量機(jī)進(jìn)行回歸計(jì)算,實(shí)現(xiàn)了軸承性能退化趨勢的合理追蹤。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)早已應(yīng)用在軸承的健康狀態(tài)預(yù)測中[7]?;谇叭说难芯浚疚睦肦NN的一個(gè)優(yōu)秀變體——長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory, LSTM),LSTM具有良好的記憶存儲特性,記錄序列有用信息從而獲得更優(yōu)的預(yù)測精度。文獻(xiàn)[8]將“波形熵”作為性能退化指標(biāo),利用LSTM網(wǎng)絡(luò)實(shí)現(xiàn)了滾動(dòng)軸承的壽命預(yù)測。上述方法都實(shí)現(xiàn)了軸承退化狀態(tài)的有效預(yù)測,但在方法的精度和穩(wěn)定性上有待提高。
高質(zhì)量的數(shù)據(jù)特征能夠大大提高預(yù)測分析的性能,集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)作為一種自主分解數(shù)據(jù)方法解決了經(jīng)驗(yàn)?zāi)B(tài)分解存在的模態(tài)混疊等現(xiàn)象,在處理振動(dòng)信號時(shí)效果較好,但其分解后遺留在分量中的白噪聲會(huì)出現(xiàn)重構(gòu)誤差,為解決以上問題,本文選擇利用互補(bǔ)經(jīng)驗(yàn)?zāi)B(tài)分解[9]提取振動(dòng)信號的固有模態(tài)分量(intrinsic mode function,IMF),并計(jì)算各組IMF分量的奇異值能量譜確定性能退化指標(biāo),再提出使用蝗蟲優(yōu)化算法優(yōu)化雙向長短時(shí)記憶網(wǎng)絡(luò)(bidirectional long short-term memory,Bi-LSTM)的故障預(yù)測模型。將該模型應(yīng)用在電機(jī)軸承故障預(yù)測中,最后,實(shí)驗(yàn)對比分析證實(shí)了本文所提方法在電機(jī)軸承故障預(yù)測中的優(yōu)越性。
模態(tài)分解的方法很多,互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)是基于經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和EEMD分解改進(jìn)而來,既消除了EMD分解中時(shí)常存在的模態(tài)混疊現(xiàn)象,又優(yōu)化了EEMD分解過程效率較低、時(shí)間過長的情況。CEEMD分解在信號中引入互補(bǔ)的高斯白噪聲,借助噪聲信號相互獨(dú)立,絕對負(fù)相關(guān),信號分解時(shí)能夠盡可能地抵消掉冗余的噪聲[10]。CEEMD分解過程如下:
1)在預(yù)處理的信號x(t)中加入N次幅值相同的互補(bǔ)白噪聲μ,組成新的序列為:
(1)
(2)
式中cj為CEEMD分解的第j個(gè)IMF分量。
當(dāng)電機(jī)軸承將要出現(xiàn)故障時(shí),各IMF的能量都會(huì)發(fā)生變化,信號能量逐漸分散,奇異值能量隨之變化。當(dāng)出現(xiàn)明顯故障狀態(tài)時(shí),噪聲比例快速增加,信號能量迅速增大,奇異值能量迅速增大。鑒于上述分析,奇異值能量譜可以作為表征電機(jī)軸承狀態(tài)退化的性能指標(biāo)。
振動(dòng)信號經(jīng)過CEMMD分解,得到IMF分量矩陣為
B=[IMF1,IMF2,…,IMFk]T。
(3)
對每組IMF分量進(jìn)行奇異值分解(singular value decomposition,SVD),該項(xiàng)技術(shù)以其出色的去噪和周期成分提取效果,在故障診斷領(lǐng)域早有研究,奇異值分解的具體過程如下:
一個(gè)實(shí)矩陣A∈Rm×n,一定存在一個(gè)正交矩陣U=[u1,u2,…,um]∈Rm×n和正交矩陣V=[v1,v2,…,vn]∈Rm×n,使得
A=USVT。
(4)
式中S=[diag(s1,s2,…,sk),O],或其轉(zhuǎn)置,O表示零矩陣,k=min(m,n),且有s1≥s2,…,≥sk>0,即為A的奇異值[12]。
解出矩陣B對應(yīng)的奇異值矩陣為
S=[s1,s2,…,sk]T。
(5)
由文獻(xiàn)[13]可知,信號能量可表示為
(6)
蝗蟲優(yōu)化算法(grasshopper optimization algorithm,GOA)是2017年由Arora[14]等人提出的一種新的啟發(fā)式優(yōu)化算法。算法思想是基于蝗蟲覓食得來,每個(gè)蝗蟲個(gè)體即為搜索空間的一個(gè)搜索個(gè)體,成蟲的搜索范圍較廣、跳躍能力較強(qiáng),負(fù)責(zé)種群全局搜索任務(wù),幼蟲的搜索范圍較窄,負(fù)責(zé)種群的局部搜索任務(wù)。GOA的具體過程如下:
1)初始化種群規(guī)模N、種群位置Xi、最大迭代次數(shù)Tmax以及參數(shù)cmax和cmin,則
Xi=Si+Gi+Ai。
(7)
式中:Si表示種群個(gè)體之間對第i個(gè)個(gè)體的影響;Gi表示第i只蝗蟲受到的重力影響;Ai表示第i只蝗蟲受到的風(fēng)力作用。計(jì)算式子為:
(8)
s(r)=fe-r/l-e-r。
(9)
式中:|xi-xj|表示第i只蝗蟲與第j只蝗蟲間的距離;s(r)表示蝗蟲個(gè)體間的相互作用力,當(dāng)s>0時(shí),個(gè)體間相互吸引,當(dāng)s<0時(shí),個(gè)體間相互排斥;f、l分別表示吸引力度和吸引尺度,均為常數(shù),本文取值f=0.5,l=1.5。則有
(10)
(11)
2)計(jì)算每只蝗蟲個(gè)體的適應(yīng)度函數(shù)值,并將最優(yōu)蝗蟲個(gè)體寄存在變量Ffit。
3)基于下式更新參數(shù)c,表達(dá)式為
(12)
式中t表示當(dāng)前的迭代次數(shù)。
4)基于下式更新蝗蟲個(gè)體的位置并計(jì)算每只個(gè)體的適應(yīng)度值,表達(dá)式為
(13)
6)判斷是否達(dá)到迭代終止條件,若是則返回最優(yōu)個(gè)體,否則重復(fù)步驟3)~步驟5)。
GOA算法流程如圖1所示。
圖1 GOA算法流程
長短時(shí)記憶網(wǎng)絡(luò)繼承了循環(huán)神經(jīng)網(wǎng)絡(luò)的可記憶性功能,有利于讀取信號序列的非線性特點(diǎn),LSTM網(wǎng)絡(luò)還引入了門控單元,從而解決長序列數(shù)據(jù)的長期依賴問題,避免網(wǎng)絡(luò)訓(xùn)練過程中出現(xiàn)梯度消失或爆炸,以便保留每一循環(huán)單元的不同時(shí)間尺度信息特征[15-16]。LSTM單元結(jié)構(gòu)如圖2所示。
圖2 LSTM的單元結(jié)構(gòu)
LSTM網(wǎng)絡(luò)的計(jì)算過程如下:
1)由遺忘門判斷是否保留前一時(shí)刻細(xì)胞的狀態(tài)信息Ct-1。遺忘門輸入前一時(shí)刻的隱藏狀態(tài)ht-1和新輸入的數(shù)據(jù)Xt,輸出遺忘門的值為
ft=σ(Wf[ht-1,xt]+bf)。
(14)
it=σ(Wi[ht-1,xt]+bi);
(15)
(16)
ht=ottanh(Ct);
(17)
Ot=σ(Wo[ht-1,xt]+bo)。
(18)
式中:Wf,Wi,Wc,Wo和bf,bi,bc,bo對應(yīng)各門的權(quán)重矩陣和偏差;σ表示sigmoid函數(shù)。此處介紹的是前向LSTM,后向LSTM的基本結(jié)構(gòu)與此相同,區(qū)別在于將原信號以倒序的方式輸入網(wǎng)絡(luò)。
雖然LSTM網(wǎng)絡(luò)記憶功能強(qiáng)大,能夠提取歷史序列中的有用信息,但其只能提取序列的前向信息,從而造成后向序列中的有用信息被浪費(fèi)掉。Bi-LSTM是對LSTM的改進(jìn),該網(wǎng)絡(luò)連接了一前一后兩個(gè)反向的LSTM網(wǎng)絡(luò),使得模型的序列信息提取能力有了進(jìn)一步提升。Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,前傳層訓(xùn)練前向序列,后傳層訓(xùn)練后向序列,共同作用。
圖3 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
Bi-LSTM網(wǎng)絡(luò)數(shù)學(xué)表達(dá)式為:
(19)
(20)
(21)
利用Bi-LSTM模型進(jìn)行預(yù)測時(shí),超參數(shù)眾多影響著模型的精度與效率,其中初始學(xué)習(xí)率α、隱藏層神經(jīng)元個(gè)數(shù)m以及迭代次數(shù)H影響作用較大[17]。本文利用GOA算法對這3個(gè)參數(shù)進(jìn)行迭代尋優(yōu),以增強(qiáng)模型的故障預(yù)測性能?;贕OA優(yōu)化的Bi-LSTM電機(jī)軸承故障預(yù)測流程如圖4所示,步驟如下:
圖4 電機(jī)軸承故障預(yù)測流程圖
1)數(shù)據(jù)采集。在電機(jī)軸承的垂直方向和水平方向布置兩個(gè)振動(dòng)傳感器,采集不同工況下的原始振動(dòng)數(shù)據(jù)。
2)數(shù)據(jù)與處理。采集電機(jī)軸承的振動(dòng)信號,利用CEEMD分解提取振動(dòng)信號的IMF分量并進(jìn)行歸一化。
3)建立退化指標(biāo)。計(jì)算每組IMF分量的奇異值并求其能量組成奇異值能量譜,并進(jìn)行平滑去噪處理,將奇異值能量譜作為性能退化指標(biāo)。
4)訓(xùn)練模型。將奇異值能量譜以一定比例分為訓(xùn)練集和測試集,基于訓(xùn)練集數(shù)據(jù),以真實(shí)值與預(yù)測值的均方根誤差為適應(yīng)度值,利用蝗蟲優(yōu)化算法優(yōu)化Bi-LSTM網(wǎng)絡(luò)。
5)故障預(yù)測。將訓(xùn)練好的最優(yōu)超參數(shù)代入Bi-LSTM網(wǎng)絡(luò),進(jìn)行故障預(yù)測測試并與真實(shí)狀態(tài)進(jìn)行對比。
為驗(yàn)證本文建立模型有效可行,使用辛辛那提大學(xué)軸承退化數(shù)據(jù)集[18]進(jìn)行實(shí)驗(yàn)驗(yàn)證。該數(shù)據(jù)集振動(dòng)信號的采樣頻率為20 kHz,采樣周期為10 min,第一組實(shí)驗(yàn)包含4個(gè)軸承,本文選用3號軸承的振動(dòng)數(shù)據(jù),3號軸承共有2 156組振動(dòng)數(shù)據(jù),每組數(shù)據(jù)包含20 180個(gè)點(diǎn),反映了3號軸承從正常運(yùn)行到出現(xiàn)內(nèi)圈嚴(yán)重故障,整個(gè)運(yùn)行周期的振動(dòng)信號。為了加快運(yùn)算速度,這里提取每組數(shù)據(jù)的前10 000個(gè)點(diǎn)進(jìn)行計(jì)算,得到信號波形如圖5所示。
圖5 振動(dòng)信號波形圖
首先,利用CEEMD算法對軸承振動(dòng)信號進(jìn)行分解,得到10個(gè)IMF分量以及1個(gè)剩余分量。然后,計(jì)算各組IMF分量的奇異值能量,得到奇異值能量譜如圖6所示,可以看出,數(shù)據(jù)中存在很多噪聲,這會(huì)影響預(yù)測效果,于是對其進(jìn)行平滑降噪處理,如圖7所示。
圖6 原始信號奇異值能量譜
圖7 降噪后的奇異值能量譜
軸承的時(shí)域振動(dòng)信號近似呈高斯分布,由圖6可知,電機(jī)軸承衰退過程中,在每個(gè)階段其性能退化指標(biāo)會(huì)出現(xiàn)局部差異的特點(diǎn),可將整個(gè)周期的運(yùn)行退化情況劃分成三個(gè)階段:階段Ⅰ,實(shí)驗(yàn)剛起步,振動(dòng)信號僅出現(xiàn)少量的頻率成分,能量較為集中,奇異值分解結(jié)果也僅集中在少數(shù)成分上,求得奇異值能量較小,隨時(shí)間變化非常穩(wěn)定,軸承狀態(tài)優(yōu)良、運(yùn)行穩(wěn)定、未發(fā)生故障;階段Ⅱ,軸承正常運(yùn)轉(zhuǎn),局部奇異值能量時(shí)而出現(xiàn)不合理的波動(dòng),表示在其工作過程中可能出現(xiàn)機(jī)械整體抖動(dòng)或是輕微磨損的情況,屬于正常現(xiàn)象,利用Bi-LSTM模型進(jìn)行故障預(yù)測是基于時(shí)序信號的整體趨勢,出現(xiàn)這種現(xiàn)象并不會(huì)影響預(yù)測的效果;階段Ⅲ,隨著波動(dòng)頻率增多,此時(shí)軸承磨損加重,信號中出現(xiàn)了復(fù)雜的故障頻率與共振頻率,信號的能量以及分解的奇異值也隨之分散,導(dǎo)致奇異值能量增大,軸承處于性能衰退期,故障程度也隨之加劇。根據(jù)實(shí)驗(yàn)經(jīng)驗(yàn),設(shè)置故障閾值為70,奇異值能量超過閾值則被認(rèn)定為嚴(yán)重故障,為避免振動(dòng)信號出現(xiàn)波動(dòng)或誤采樣的情況,規(guī)定指標(biāo)超過閾值5次,電機(jī)停機(jī)進(jìn)行檢修。
由于電機(jī)在運(yùn)行至21 560 min時(shí)軸承故障程度已經(jīng)加劇,應(yīng)當(dāng)更早地停止運(yùn)行,因此在故障加劇后的數(shù)據(jù)不具有預(yù)測意義,選取第1 900組到2 125組的數(shù)據(jù)作為訓(xùn)練集,第2 126組到2 150組的數(shù)據(jù)作為測試集。利用訓(xùn)練集數(shù)據(jù)訓(xùn)練GOA-Bi-LSTM模型,蝗蟲優(yōu)化算法初始參數(shù)如表1所示,為了比較GOA算法的優(yōu)越性,這里同時(shí)使用鯨魚優(yōu)化算法(whale optimization algorithm,WOA)進(jìn)行優(yōu)化,依據(jù)經(jīng)驗(yàn)設(shè)置WOA的參數(shù),以均方根誤差(root mean square error,RMSE)作為適應(yīng)度函數(shù),其隨迭代次數(shù)變化曲線如圖8所示。獲得最優(yōu)超參數(shù)為:初始學(xué)習(xí)率α=0.003、隱藏層神經(jīng)元個(gè)數(shù)m=152以及迭代次數(shù)H=237。
表1 GOA參數(shù)
圖8 迭代尋優(yōu)過程
由圖8可得,GOA算法在迭代進(jìn)行到第20代時(shí)開始有了較好的收斂效果,WOA算法在第13次迭代時(shí)開始了收斂,收斂速度較快,但其收斂時(shí)未達(dá)到最低適應(yīng)度值,說明WOA算法容易陷入局部最優(yōu)解。其次,GOA算法在收斂時(shí)的均方根誤差也較小,表明其預(yù)測精度更優(yōu)。
利用訓(xùn)練好的Bi-LSTM網(wǎng)絡(luò)進(jìn)行一步迭代預(yù)測,在進(jìn)行每一次預(yù)測時(shí),將前一次預(yù)測的結(jié)果加在當(dāng)前輸入的結(jié)尾,預(yù)測結(jié)果如圖9所示。
圖9 GOA-Bi-LSTM故障預(yù)測結(jié)果
為驗(yàn)證本文所建立模型的優(yōu)越性,選取極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)、時(shí)滯性支持向量回歸(time delay support vector regression,TD-SVR)模型、深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network, DCNN)模型進(jìn)行對比實(shí)驗(yàn),數(shù)據(jù)集劃分與本文完全相同,參數(shù)設(shè)置完全依照經(jīng)驗(yàn)數(shù)據(jù),預(yù)測結(jié)果如圖10~圖12所示。
圖10 ELM故障預(yù)測結(jié)果
圖11 TD-SVR故障預(yù)測結(jié)果
圖12 DCNN故障預(yù)測結(jié)果
從圖9~圖12可以直觀地看出,本文所建立的模型預(yù)測精度要優(yōu)于其他模型的精度。為了準(zhǔn)確評估模型預(yù)測的精度,本文利用RMSE和那什系數(shù)(Nash-Sutcliffe efficiency coefficient, NSE)作為評估標(biāo)準(zhǔn),表達(dá)式為:
(22)
(23)
表2 預(yù)測結(jié)果對比
由表2可以看出,相較于ELM、RD-SVR、DCNN模型,本文所提模型的NSE值最接近于1,RMSE值最小,僅有5.713,說明GOA-Bi-LSTM的擬合效果最好,相比于ELM、TD-SVR、DCNN模型在電機(jī)軸承故障預(yù)測領(lǐng)域的預(yù)測精度最高。
表3 誤采樣對預(yù)測結(jié)果的影響
圖13 容錯(cuò)性分析預(yù)測結(jié)果
本文建立了一種基于GOA優(yōu)化Bi-LSTM模型的電機(jī)軸承故障預(yù)測方法。首先,利用CEEMD分解振動(dòng)信號,提取振動(dòng)信號的特征分量并計(jì)算奇異值能量譜構(gòu)造性能退化指標(biāo);其次,利用GOA對Bi-LSTM網(wǎng)絡(luò)進(jìn)行優(yōu)化返回最優(yōu)超參數(shù);最后,利用優(yōu)化好的Bi-LSTM網(wǎng)絡(luò)實(shí)現(xiàn)電機(jī)軸承的故障預(yù)測,得到結(jié)論如下:
1)利用奇異值能量譜作為性能退化指標(biāo),能夠很好地體現(xiàn)出電機(jī)軸承狀態(tài)的變化趨勢,能夠間接反應(yīng)電機(jī)軸承的故障變化。
2)利用蝗蟲優(yōu)化算法對雙向長短時(shí)記憶網(wǎng)絡(luò)的超參數(shù)進(jìn)行優(yōu)化,蝗蟲優(yōu)化算法相較于鯨魚優(yōu)化算法具有更高的收斂精度。
3)針對LSTM網(wǎng)絡(luò)處理前向序列,僅考慮前向信息而忽略了后向信息的情況,提出Bi-LSTM網(wǎng)絡(luò),具有一前一后兩個(gè)互補(bǔ)的LSTM網(wǎng)絡(luò),分別處理時(shí)間序列的前向和后向信息,提高了模型信息提取能力。
4)基于開源數(shù)據(jù)集,將本文模型與ELM、TD-SVR、DCNN模型進(jìn)行對比分析,本文模型具有更高的預(yù)測精度以及更強(qiáng)的魯棒性。