臧傳濤,劉冉冉,顏海彬
(江蘇理工學院 汽車與交通工程學院,江蘇 常州 213001)
隨著現代制造業(yè)生產力和電子信息技術水平的快速提升,機械設備正朝向高集成化、智能化、數據化方向發(fā)展。作為具有高傳動效率而被廣泛使用的機械零件,滾動軸承的運行質量是旋轉機械能否正常運轉的前提,因此,對軸承進行剩余使用壽命(Remaining Useful Life,RUL)預測極為重要。現階段,軸承剩余壽命預測的重點是預測模型的選取,普遍使用的主要有基于物理分析、統(tǒng)計學分析及人工智能的三類軸承剩余壽命預測模型。
傳統(tǒng)的軸承剩余使用壽命預測模型主要為物理、數學模型。Luca Quagliato等人[1]提出一種利用加速度測試和建立有限元數值模型對軸承壽命進行預測的方法。賈磊等人[2]通過對調心滾子軸承載荷進行計算,分析了齒輪推力和溫度對軸承壽命的影響。上述模型雖然計算簡單,但軸承實際運行工況復雜,易受到噪聲等因素的影響,且建立的預測模型很難推廣到其他工況下,模型泛化能力差。
基于統(tǒng)計學的預測方法主要有回歸預測和時間序列預測等。Gao等人[3]利用線性回歸模型對軸承性能進行預測。王萌[4]使用邏輯回歸模型實現了對軸承退化情況的評估?;诮y(tǒng)計學的預測模型雖然具有模型參數識別簡單、實時性好等優(yōu)點,但上述模型多用于處理簡單的問題,對于擁有復雜退化特征的軸承RUL預測效果往往欠佳。
人工智能技術的出現,使得智能化預測成為軸承剩余壽命預測的主流方法[5]。Ren等人[6]提出了一種基于深度卷積神經網絡的方法預測軸承RUL,并與支持向量機結果進行對比,證明其有效性;但文中關于特征提取的方法較為簡單,并不能很好地提取到有效的故障特征。王奉濤等人[7]提出一種基于長短期記憶(Long Short-Term Memory,LSTM)的軸承RUL預測模型,并將預測結果同反向傳播(Back Propagation,BP)神經網絡和支持向量回歸機(SVRM)進行對比,驗證了方法的有效性。雖然LSTM在軸承壽命預測方面得到廣泛應用,但仍存在以下兩個問題:(1)LSTM的學習率、隱藏層單元數等需要人為選擇;(2)直接使用歸一化后的剩余壽命時間作為訓練標簽,軸承退化趨勢的隨機性將會大概率造成神經網絡的過擬合現象[8]。目前,常見的LSTM優(yōu)化算法有遺傳算法、粒子群算法等。Cao等人[9]利用遺傳算法(Genetic Algorithm,GA)對LSTM的超參數進行尋優(yōu),Gundu Venkateswarlu等人[10]使用粒子群算法(Particle Swarm Optimization,PSO)對LSTM的超參數進行自動尋優(yōu),均取得了一定的效果,證明了通過優(yōu)化算法能夠提高深度學習預測模型的性能和精度,但上述優(yōu)化算法易陷入到局部最優(yōu)狀態(tài)。
黏菌算法(Slime Mould Algorithm,SMA)是我國學者李世民于2020年新提出的一種群智能優(yōu)化算法。SMA原理簡單,需要確定的參數少,它使用自適應權重來模擬基于生物振蕩器的黏菌傳播波產生正反饋和負反饋的過程,從而在許多優(yōu)化問題上可以實現快速收斂。此外,由于具有動態(tài)結構,其可以在全局和局部搜索漂移之間保持穩(wěn)定的平衡,因此,在防止陷入局部最優(yōu)的同時又具有很強的局部搜索能力[11]。劉通[12]利用SMA在醫(yī)學領域學習機優(yōu)化方面取得了較好的效果。
基于上述分析,本文擬選用基于LSTM的軸承剩余壽命預測方法,實現對軸承RUL的預測。針對其超參數選取困難、遺傳算法和粒子群等常見參數優(yōu)化算法容易出現局部最優(yōu)、模型的泛化能力差等缺陷,利用SMA對LSTM中的學習率、訓練次數、隱藏層神經元數目進行優(yōu)化。(1)利用變分模態(tài)分解(Variational Modal Decomposition,VMD)對振動信號降噪,將降噪后的振動信號提取出15類時域、頻域特征向量,并通過主成分分析(Principal Component Analysis,PCA)對特征向量進行降維,篩選出能夠有效代表軸承故障特性的特征向量;(2)軸承的退化過程同時間相關成線性變化[13],為減小模型的過擬合現象,提高模型的泛化能力,由此構建退化系數;(3)利用SMA對LSTM預測模型中的超參數(如訓練次數、隱藏層神經元數目、學習率)進行自動尋優(yōu),并使用超參數優(yōu)化后的LSTM模型對退化系數進行預測,進而實現軸承RUL的預測。
VMD是美國學者Konstantin Dragomiretskiy于2014年提出的自適應分解方法[14],趙昕海等人[15]已將其成功應用于振動信號的降噪。VMD首先對原始信號的特征劃分頻帶;然后,連續(xù)更新各模態(tài)分量及其對應的中心頻率;最后,根據約束條件將原始信號自適應分解,并對分解的模態(tài)分量進行重構,從而完成對信號的降噪。
1.1.1 變分模型的構造
通過高斯平滑處理得到約束變分模型:
其中:δ(t)表示脈沖函數;k=1,2,…,K;K的值通過中心頻率確定;uk(t)為第k個模態(tài)分量;ωk為uk(t)的中心頻率;f(t)為原始輸入信號;‖?‖2為2的范數;?t為對t求偏導。
1.1.2 變分模型的求解
為了求解構造的變分模型,在此引入增廣拉格朗日公式:
其中:α為懲罰因子;〈?,?〉為內積運算;λ(t)為拉格朗日乘法算子。
VMD中各變量的迭代表達式為:
其中:τ表示噪聲容限;^表示傅里葉變換;ω為傅里葉變換中原函數周期所對應的基頻。
1.1.3 信號重構
原始振動信號經過VMD后得到了K個模態(tài)分量,根據峭度和相關性準則,選取模態(tài)分量中峭度和相關系數最大的兩個分量進行信號重構,得到降噪后的振動信號。
合適特征指標的選取對反映軸承退化情況至關重要。根據之前降噪得到的振動信號,對反映軸承退化情況的時域、頻域特征參數進行提取,特征指標如表1所示。
表1 時域及頻域特征
值得注意的是,所提取的特征指標往往不能全部反映軸承運行過程中的性能退化趨勢,需要對冗余特征向量進行降維[6]。
PCA是利用線性變換將原始的特征向量簡化成幾個與線性無關的組合,以保留主要信息,用于主要特征向量的提取。本文通過PCA對前面提取的經過歸一化的特征向量進行降維,剔除冗余特征,過程如下[7]。
(1)收集數據,將提取的特征向量進行歸一化處理,確定輸入為特征向量矩陣X,Xk=(x1k,x2k,…,xnk)T為n維的向量,xk為軸承的某一狀態(tài),xk的協(xié)方差矩陣為:
其中,的表達式為:
(2)求Wx的特征值λi(i=1,2,…,n)和對應的特征向量hi,并將其按從大到小排序。則xi投影到特征向量hi上的主分量為:
(3)所有的hi組成n維正交空間,x在此正交空間上投影得到n維主分量。其中:前m個主分量累積貢獻率的計算式為:
(4)選擇主成分。根據貢獻率選擇相應的主分量。
LSTM是在原有循環(huán)神經網絡基礎上改進得到的,如圖1所示為LSTM結構。循環(huán)神經網絡每個循環(huán)體內部只有一個狀態(tài),但LSTM內部有四個狀態(tài);因此,LSTM可以使單元狀態(tài)長久保持,后面過程中可以選擇哪些信息需要保存或傳遞下去。另外,LSTM結構經改進后可以解決循環(huán)神經網絡存在的梯度消失或爆炸問題。LSTM的關鍵部分為細胞狀態(tài),由上方的水平線連接,它能夠將上一時刻的細胞狀態(tài)傳輸到下一時刻。
圖1 LSTM網絡結構
LSTM中的門結構和單元狀態(tài)共同組成細胞:門結構中的輸入門控制輸入信息保留到單元狀態(tài)的多少;遺忘門控制之前單元狀態(tài)信息保留到當前的多少;輸出門控制當前單元狀態(tài)到輸出值的多少。
LSTM模型中前一個時間t-1的輸入可表示為xt-1,對應的輸出為ht。如果當前時刻輸入xt和ht是下一次t+1的輸入,則輸出為ht+1。最后,計算候選記憶細胞,公式為:
其中:Wxc為輸入到細胞的權重系數;Whc為隱藏層到細胞的權重系數;bc為細胞的偏置量。
上述三個門控制隱藏層信息狀態(tài)的流動,表達式為:
其中:ft為遺忘門的輸出;it為輸入門的輸出;?為元素乘法運算。
記憶細胞到隱藏層狀態(tài)ht之間的信息流動,通過輸出門進行控制:
其中:ot為輸出門的輸出。
SMA是一種基于黏菌型多頭絨泡菌的覓食行為和形態(tài)變化的群體優(yōu)化算法[11]。黏菌是一類長期在陰暗潮濕環(huán)境中生長的生物,由于黏菌沒有大腦和任何的神經元,因此,通過前端放出的扇形靜脈網絡來搜尋食物。當黏菌找到食物時,連向食物的靜脈就會在生物振蕩器發(fā)出的生物波的影響下,通過改變靜脈中細胞質的流量,增加靜脈直徑,從而達到加速吸收營養(yǎng)物質的目的;而沒有找到食物的靜脈直徑就會逐漸減小。即使找到食物,黏菌依然會分離出一部分組織繼續(xù)尋找更優(yōu)質的食物,通過正負反饋檢測并開發(fā)連接食物的最佳路徑。通過上述過程,黏菌可以非常高效地搜索食物,因而,該模式也被應用于數學建模中。
1.5.1 接近食物
黏菌通過空氣中營養(yǎng)物質的氣味追蹤并接近食物,由下式來模擬其收縮模式:
p的公式為:
其中:i∈1,2,…,n;S(i)表示的適應度值;DF表示在所有迭代過程中獲得的最佳適應度。
其中:condition代表S(i)在所有群體中排名位列前50%的部分;maxt為最大迭代次數;bF為當前迭代過程中獲得的最佳適應度;ωF表示在迭代過程中獲得的最差適應度;SI為適應度值經過升序排列后的序列。式(16)模擬了黏菌靜脈的寬度和食物濃度之間的正反饋和負反饋。參數r模擬了靜脈收縮方式的不確定性,log用于減小數值的變化率,以使收縮率的值不會有太大變化。condition模擬了黏菌根據食物質量來調整搜索模式。
1.5.2 包裹食物
該部分模擬了黏菌在搜索食物時的收縮模式,表達式為:
其中:UB和LB為搜索范圍的上下邊界;rand為0~1之間的隨機值;z值根據實驗情況選取,多為0.03[11]。
1.5.3 振蕩
黏菌主要通過生物振蕩器中產生的傳播波來改變靜脈網絡中細胞質的流量,從而使靜脈更好地向食物集中的位置分布。為了模擬靜脈寬度的變化,使用和實現上述過程:通過數學方法模擬不同食物濃度下黏菌的振蕩頻率;隨機在[-a,a]之間振動,并且逐漸接近至0;隨機在[-1,1]之間振動到接近0。為了找到更好的食物來源,即使黏菌找到了食物,其仍然會分離一些組織,以探索其他地區(qū),從而尋求更高質量的食物來源。振蕩過程模擬黏菌的狀態(tài),它決定是接近食物來源還是尋找其他食物來源。探測食物過程中可能存在的各種障礙限制了黏菌的擴散;但是,這也增加了黏菌找到更高品質食物的可能性,并能防止黏菌算法陷入局部最優(yōu)狀態(tài)的陷阱。上述過程模仿了黏菌選擇性尋找優(yōu)質食物的行為,算法偽代碼如下:
電話響了半天,沒人接。哥們兒朝洛蒙想燒烤店老板還沒有起床。燒烤的生意一般都在晚上,要到凌晨才能收攤。所以都要睡到中午。
由于振動信號往往是非平穩(wěn)信號,且信號中存在大量噪聲,影響特征提取的準確性,而VMD作為近些年新提出的方法,可以有效地對非線性、非平穩(wěn)信號進行降噪;因此,本文利用VMD將數據集中的原始振動信號分解成若干個分量,再選取峭度值和相關性系數最大的兩個分量進行重構,完成對信號的降噪。
對降噪后的信號提取15個時域、頻域參數。并不是提取的所有特征都可以反映軸承的退化情況,冗余的特征向量會降低預測速度;因此,對提取的特征參數進行PCA降維,去除冗余特征向量。
若直接將軸承的剩余壽命作為預測模型的標簽,則容易造成神經網絡的過擬合現象[8]。通常軸承的退化過程隨時間呈線性變化。本文擬構建退化系數R來描述軸承的退化程度。通過連續(xù)w個特征值組成一個時間序列,第i個時間序列的退化系數Ri為:
其中:n為振動信號采集的組數;w為每個時間序列的長度;R隨著時間從1到0線性減小,當R=1時,表明軸承剛剛開始退化,當R=0時,表示軸承完全報廢。
以前面提取的軸承退化特征向量為輸入,退化系數R作為標簽,劃分訓練集和測試集:
其中:t是振動信號每次采樣的時間間隔。
利用黏菌算法既具有動態(tài)搜索結構又不易陷入局部最優(yōu)的特點,對LSTM的超參數進行優(yōu)化。首先,需對黏菌算法的參數進行初始化,以LSTM的均方根誤差(Root-Mean-Square Error,RMSE)為SMA的目標函數,對模型進行訓練;通過目標函數計算適應度值并對其進行排序,更新最佳適應度和最佳個體位置;通過最后輸出的最佳位置得到LSTM的最佳超參數組合;最終,將優(yōu)化后的超參數輸入LSTM模型,得到訓練好的最佳模型。
軸承前期運行平穩(wěn),后期會有故障信號突變,直接將每組步長為一的故障特征作為預測模型的輸入,并不能很好地預測后期突變故障的特點。因此,本文確定軸承退化起始時刻,將測試集中的n維特征向量按每w組作為一個時間序列輸入到SMA-LSTM中,對測試集中退化起始時刻后的R進行預測。用RMSE和平均絕對誤差(Mean Absolute Error,MAE)對預測模型的性能進行評估。
為了驗證本文所提出方法的有效性,選取IEEEPHM 2012 Data Challenge軸承數據作為實驗數據進行驗證[16]。數據集中包括水平加速度、垂直加速度振動信號和溫度數據。溫度數據為單通道連續(xù)采集,采樣頻率為10 Hz,但溫度數據不適用于所有的案例[17]。根據相關學者的研究,相比于垂直振動信號,水平振動信號能提供更多有用的信息[18],故將水平振動信號作為本文數據集。實驗設置當振動信號的幅值超過20 g時軸承發(fā)生失效。軸承振動信號的采樣頻率為25.6 kHz,每次采樣持續(xù)0.1 s[17]。
如表2所示,軸承在三種工況下進行試驗。為使預測的軸承剩余壽命在不同的工況下都能有較高的精度,本文將三種工況下Bearing1_1、Bearing2_1、Bearing3_1的全壽命周期作為實驗的訓練集,將Bearing1_3作為實驗的測試集。
軸承通常前期運行平穩(wěn),故障往往發(fā)生在運行后期,對軸承發(fā)生故障到完全報廢的時間段進行預測,可以縮短預測時間,提高效率。軸承振動信號中的均方根值(Root Mean Square,RMS)與軸承的退化情況密切相關[19]。本文將RMS的均值作為軸承發(fā)生故障的上閾值點,超過該閾值點,軸承開始發(fā)生故障。通過上述方法確定軸承Bearing1_3退化時刻,將軸承退化起點至退化終點間的數據作為實驗的測試集。
表2 2012 PHM挑戰(zhàn)賽數據集
如圖2所示,為Bearing1_3原始振動信號的波形和經過VMD降噪后的波形,如圖3所示為RMS值。
圖2 軸承1_3的振動信號波形圖
圖3 RMS值
由圖2可知,軸承振動信號經過降噪后,時域圖中故障沖擊特征明顯增強,從而更易判斷其退化起始時刻。由圖3中的RMS值可知:在軸承運行前期,RMS較?。划斴S承發(fā)生故障時,RMS急劇增大,與圖2振動信號中出現突變的時刻大致相同。
如圖4所示,為對降噪后的信號提取的時域、頻域特征參數。在軸承運行前期,軸承運轉狀態(tài)穩(wěn)定,特征指標值變化相對平緩;隨著軸承運轉,軸承開始發(fā)生失效,特征指標值出現突變。由圖4可知:各指標隨軸承運行狀態(tài)變化趨勢大致相同,但均方根頻率等指標隨軸承運行的變化并不明顯,不能反映出軸承的退化過程。冗余的特征向量會增加計算量,干擾軸承故障診斷的準確性[20],因此,有必要剔除不能反映軸承運行狀態(tài)的指標,并利用PCA對特征向量進行降維。
圖4 退化特征參數
在通過Python進行降維時,PCA算法中的參數n_components設置為mle,即根據效果自動選擇合適的特征向量。
為了對比分析,本實驗采用BP神經網絡和SVR進行對比實驗,并用遺傳算法(Genetic Algorithm,GA)和灰狼優(yōu)化算法(Grey Wolf Optimizer,GWO)對上述模型參數優(yōu)化,與SMA-LSTM模型進行對比。其中,LSTM模型網絡層數為3,優(yōu)化器為SGD,批次大小為32,用均方誤差(Mean Square Error,MSE)作為模型訓練時的損失函數,通過SMA、GA和GWO優(yōu)化算法對LSTM模型中的學習率、訓練次數和隱藏層神經元的數目進行優(yōu)化。利用SMA對BP模型中的學習率和訓練次數進行優(yōu)化。SVR模型采用poly核函數,通過SMA對SVR模型中的懲罰因子和核函數參數進行自動尋優(yōu)。
通過RMS確定軸承退化起始時刻后,對起始點后的軸承剩余RUL進行預測。采用RMSE和MAE作為衡量預測模型精度的指標。
如圖5所示,為利用GA、GWO、SMA以及未用優(yōu)化算法的LSTM模型的預測結果。由圖5可知:經GA和GWO優(yōu)化后的LSTM和未采用優(yōu)化算法的LSTM,在預測過程中都存在振蕩,這說明優(yōu)化算法在區(qū)域內存在局部最優(yōu)解;而經SMA優(yōu)化后的LSTM預測平穩(wěn),無明顯震蕩區(qū)域,這證明了SMA算法可以有效跳出局部最優(yōu)解,其預測精度高于經GA算法和GWO算法優(yōu)化后的LSTM模型,擬合效果較好。
SMA在優(yōu)化預測模型超參數方面具有較好的效果。如圖6所示,為利用SMA對BP、SVR和LSTM模型進行優(yōu)化后的預測結果。由圖6可知:采用SMA-LSTM模型能更好地反映出軸承的剩余壽命,其預測結果平穩(wěn),預測精度高于SMA-BP和SMA-SVR預測模型。
如表3所示,為上述預測模型的誤差。
由圖5、圖6和表3可知:
(1)GA-LSTM、GWO-LSTM和SMA-LSTM預測模型的誤差MAE和RMSE均低于未經參數優(yōu)化的LSTM,從而證明上述三種優(yōu)化算法確實可以提高LSTM的預測精度;SMA-LSTM的預測誤差最低,證明SMA算法相比于其他優(yōu)化算法可以更好地提高LSTM的預測精度。因此,用SMA對LSTM超參數進行優(yōu)化是切實可行的。
圖5 LSTM預測結果
圖6 SMA優(yōu)化后各模型的預測結果
表3 預測誤差
(2)相比于SMA-BP和SMA-SVR模型,SMALSTM的MAE和RMSE更低,證明在相同優(yōu)化算法下,LSTM模型的預測精度高于上述模型。
本文提出了一種基于LSTM的軸承剩余壽命預測方法,實現對軸承RUL的預測。結論如下:
(1)針對軸承早期失效階段故障特征信息微弱、易受噪聲干擾的問題,利用VMD方法對軸承信號降噪。降噪后的振動信號相比于原始信號,故障特征波形沖擊明顯增強。
(2)針對直接預測軸承剩余時間容易造成過擬合的問題,構建退化系數R,由R計算得到軸承剩余使用時間。利用三種不同工況下的軸承數據作為實驗數據,對軸承RUL進行預測,證明了模型具有較好的泛化能力。
(3)針對預測模型LSTM中超參數選取困難、大多優(yōu)化算法容易出現局部最優(yōu)的問題,提出了基于SMA-LSTM的軸承RUL預測模型。利用SMA具有動態(tài)搜索能力且不易陷入到局部最優(yōu)的特點,對LSTM的超參數進行優(yōu)化。為了驗證SMA-LSTM的有效性,將預測結果同GWO、GA優(yōu)化算法以及BP、SVR預測模型進行對比,仿真結果表明,基于SMA-LSTM的軸承RUL預測方法是可行的。