普會杰,劉 韜,褚 惟
(昆明理工大學a.機電工程學院;b.云南省先進裝備智能維護工程研究中心,昆明 650500)
機械設備在使用過程中會由于疲勞磨損、工作環(huán)境惡劣等問題,容易發(fā)生性能和健康狀態(tài)的退化[1]。而滾動軸承、齒輪故障是大多數機械設備性能失效的主要原因之一,因此對滾動軸承、齒輪的故障診斷就顯得尤其重要。
在故障診斷研究中,普遍采用信號處理與模式識別相結合的診斷方法[2],特征提取和模式識別是故障診斷的核心技術。如利用經驗模態(tài)分解、小波分解等,提取特征并送入支持向量機、極限學習機等模型進行故障診斷。由于特征提取的部分參數和信號分量的選擇等依賴先驗知識,因此存在一定的不確定性。此外,傳統(tǒng)分類模型的泛化能力不佳,輸入特征的微調有時甚至會導致分類效果明顯下降,而且當輸入的特征維度較大時,分類器的訓練也變得困難,模型訓練效率變低。
近年來,深度學習被廣泛應用到故障診斷,它利用機器學習的深度結構,自動學習高層次的本質特征[3],根據輸入自動提取更具鑒別性的高層次特征,解決了傳統(tǒng)提取特征的弊端。JIA等[4]結合機械大數據和深度學習理論,提出了一種新的機械裝備健康監(jiān)測方法。HU等[5]將降噪稀疏自編碼用于風機轉速預測。張紹輝[6]提出利用稀疏自編碼深度學習模型對各個傳感器采集到的數據進行融合,采用稀疏自編碼與平方預測誤差相結合的模型有效監(jiān)測軸承故障,并對故障部位進行準確定位。汪鵬等[7]提出了一種基于參數稀疏自編碼器的故障診斷方法,通過編碼過程分析信號組成成分來判斷旋轉機械的故障。袁憲鋒等[8]提出了一種基于棧式稀疏自編碼網絡、改進灰狼智能優(yōu)化算法以及支持向量機的混合智能故障診斷模型,對不同滾動軸承故障類型的振動信號實現更精準的識別。張紹輝等[9]提出了一種基于頻譜包絡曲線的稀疏自編碼算法,并用齒輪箱故障數據進行了驗證,在保證診斷模型識別效果的同時,降低算法的計算復雜度,提高診斷模型的適用性。
自動編碼器以其良好的特征提取和降維性能,被廣泛應用于機械設備的故障診斷。目前大多數研究集中在將時域信號、頻域信號直接輸入到深度學習模型中或者人工提取特征后再將其送到網絡模型,通過不斷訓練調整參數和人工調整來提高的模型泛化能力。但是,將時域信號直接輸入深度學習模型,存在信號截取規(guī)則隨機導致分類結果差異較大;而以頻域信號作為輸入,又存在頻譜中各頻段信息的有效信息不一致,降低了模型學習效率;包絡譜低頻信息雖然在一定程度上提高了計算效率,但變轉速設備難以從包絡譜里面提取到有用的信息,限制了該方法的應用。
因此,本文提出了一種基于信息融合的稀疏自編碼故障診斷方法,充分利用振動加速度信號、速度信號、位移信號里的有效信息進行故障診斷,降低模型復雜度的同時,提高了診斷準確率和泛化性。
基于信息融合的稀疏自編碼故障診斷方法包括數據信息融合、稀疏自編碼器和SoftMax分類器三部分。信息融合層次分為數據級融合、特征級融合、決策級融合[10]。數據級融合信號的特點是數據量龐大、維數繁多,且融合在底層發(fā)生,可以提供最完整的信息,精度屬最高。3種融合關系如圖1所示。
通過頻域積分方法對原始振動加速度進行一次、二次積分得到速度、位移信號,并結合頻譜信號,將3個信號進行數據層融合作為自編碼器的輸入。稀疏自編碼器可視為一個深度自適應學習網絡,可以無監(jiān)督自適應學習特征。SoftMax分類器[11]將稀疏自編碼器提取的特征經過非線性變換,輸出分類結果。
在進行信號采集的過程中,可能會受到儀器設備或環(huán)境等因素的限制,部分物理量往往要通過另外一些采集到的物理量進行轉化,如將振動加速度信號轉化為速度、位移信號。加速度傳感器廣泛用于獲取振動信號,因為與速度和位移傳感器相比,振動數據可以快速捕獲,并且采集系統(tǒng)需要安裝的附加設備更少?;谡駝蛹铀俣刃盘?可以通過傅立葉變換和積分運算獲得速度和位移信息[12-14]。常用的將振動加速度信號轉化為速度、位移信號的方法有時域積分和頻域積分兩種方法。
1.1.1 時域積分
設采集到的振動加速度信號a(t)為:
a(t)=x(t)+ε
(1)
式中:ε是采集時產生的誤差。
一次時域積分得到速度信號v(t):
(2)
二次時域積分得到速度信號s(t):
(3)
時域積分,方法原理簡單,但多次積分后,測量誤差ε的作用被放大,導致一次、二次積分得到的速度、位移信號與真實情況有很大偏差[15],位移振幅值將產生嚴重偏移趨勢項,很大程度影響測量的準確程度。理論上加速度信號在時域上進行兩次積分可以得到位移信號,但實際的結果不理想。
1.1.2 頻域積分
頻域積分算法是將時域數據通過傅里葉變換轉換為頻域數據,在頻域中解決時域計算無法解決的響應問題,得到精確解[15]。積分在頻域里積分的原理是:將信號做傅里葉變換,將變換結果在頻域里做積分運算,最后做傅里葉逆變換得到積分后的時域信號。
加速度信號a(t)在某一頻率的傅里葉變量形式表示為:
a(t)=Aejwt
(4)
初速度為0時,對加速度信號進行時間積分可以得到速度信號分量,即:
(5)
式中:V為速度信號分量v(t)對應的系數。
一次積分在頻域里的關系為:
(6)
初速度和初位移分量都為0時,對加速度信號的傅里葉變量兩次積分就能得到位移信號分量,即:
(7)
式中:X為位移信號分量s(t)對應的系數。
兩次積分在頻域里的關系為:
(8)
將振動加速度信號中所有不同頻率的傅里葉分量按照積分在頻域里的關系式計算后,進行傅里葉逆變換就能得到相應的速度信號和位移信號。利用頻域積分的計算結果較時域積分算法會更準確,故選用頻域積分算法來求速度、位移信號。
自編碼器是一種無監(jiān)督自適應學習神經網絡,由輸入層、隱含層和輸出層組成,通過對輸入的編碼和解碼兩個過程提取輸入數據的隱含層特征,稀疏自編碼器基于自編碼器在目標函數的變化上加入系數懲罰項,通過稀疏懲罰項,提取稀疏的數據特征,有效降維并改善聚類的效果,自編碼器的結構如圖2所示。
圖2 自編碼器結構圖
編碼過程:設輸入的無標簽樣本數據為:{x1,x2,…,xn-1,xn},利用編碼器激活函數fθ對輸入數據進行編碼轉化為隱含層矢量hm,即:
(9)
(10)
式中:fθ的激活函數為tanh函數,編碼層的權重矩陣和偏置參數為w和b。
(11)
式中:fθ′是解碼層的激活函數,解碼層的權重矩陣和偏置參數分別為w′和c。
在進行隱含層矢量重構的過程中,通過構建誤差損失函數對網絡的誤差進行計算,從而得到最優(yōu)的輸出結果,損失函數J為:
(12)
(13)
當神經元輸出接近于1時表示活躍,輸出接近于-1時表示是被抑制。
通過相對熵來測量2個分布之間得差異,引入相對稀疏性因子ρ,于是懲罰因子可以定義為:
(14)
在自編碼器中加入稀疏性約束,將式(14)作為懲罰因子加入原損失函數J中。
基于信息融合的稀疏自編碼故障診斷模型的方法流程如圖3所示,主要包括數據預處理、模型訓練和故障診斷3個過程,具體的做法如下:
圖3 基于信息融合的故障診斷模型的流程圖
步驟1:數據預處理過程:將原始振動加速度時域信號a(t)經一次頻域積分得到速度信號v(t),同時將原始振動加速度信號a(t)做快速傅里葉變換得到頻譜信號,然后將一次積分得到的速度信號v(t)再經一次頻域積分得到位移信號s(t),最后將頻譜、速度、位移信號融合成一個復合信號作為樣本數據集;
步驟2:模型訓練過程:對融合后的復合信號劃分訓練集和測試集,通過構建的稀疏自編碼網絡進行無監(jiān)督學習訓練,自適應學習,得到深度特征向量;然后,將提取的深度特征向量送入SoftMax分類器進行故障模式識別,與真實標簽進行對比后,若未達到期望的識別精度,則對模型進行微調直至達到期望的診斷準確率,保存訓練好的SAE故障診斷模型;
步驟3:故障診斷過程:將劃分好的測試集數據送入訓練好的SAE故障診斷模型,輸出診斷結果,完成故障診斷過程。
為驗證所提方法的有效性和實用性,本文引入了滾動軸承故障實驗數據和RV減速器行星輪故障實驗數據進行驗證。
滾動軸承故障實驗數據選用某大學軸承振動加速度數據[16]。滾動軸承有正常、內圈故障、滾動體故障和外圈故障4種狀態(tài),3種故障狀態(tài)下?lián)p傷直徑又分為0.177 8、0.355 6、0.533 4 mm的3種損傷尺寸大小,故滾動軸承的故障實驗數據有10種狀態(tài)。
滾動軸承數據樣本劃分如表1所示。其中振動加速度信號的FFT變換后的頻譜信號有1024個采樣點,為了減少模型訓練時間和探討速度、位移信號融合對模型的有效性,對頻域積分后的速度、位移信號只選取占頻譜信息一定比例的長度來進行數據融合,即選取的速度、位移信號的點數占頻譜信號點數的15%、30%、50%。
表1 滾動軸承數據樣本集劃分
2.1.1 滾動軸承故障診斷的步驟
首先,對滾動軸承加速度振動信號做一次、二次頻域積分得到速度、位移信號,同時對振動加速度信號做快速傅里葉變換得到頻譜信號,對頻譜、速度、位移3種信號分別做歸一化處理到[-1,1]。
其次,每個樣本的頻譜信號點數取1024,對速度、位移信號的點數長度只選取頻譜信號點數的15%、30%、50%,即對速度、位移信號每個樣本取154、308、512個點3種方式。
最后,為了對比不同輸入對結果的影響,將劃分好的樣本數據集按照以下3種方式輸入到稀疏自編碼網絡。方式1:歸一化后的原始加速度信號;方式2:原始加速度信號作快速傅里葉變換后的頻譜信號;方式3:頻譜信號、速度和位移信號融合后的復合信號。方式3輸入的復合信號的每個樣本的長度有3種,取整后分別為1332、1640、2048。故障標簽類型個數為10,所以3種輸入方式的輸出層神經元個數都為10,經稀疏自編碼提取深度特征后,再通過SoftMax分類器輸出診斷結果。
2.1.2 診斷結果
采用方式1、方式2輸入的稀疏自編碼網絡分別構建了1、2、3層的網絡模型,并對每種情況的診斷模型訓練并測試了10次,取10次測試結果的平均值。方式1和方式2的在不同層數下的平均診斷率如圖4所示。
圖4 方式1、2在不同深度下的平均診斷率對比
由圖4可以看出,在不同的網絡層數下,振動加速度信號的頻譜作為輸入,診斷準確率總是高于振動加速度作為輸入的診斷準確率,這表明相比于振動加速度信號,頻譜信號作為輸入效果更好,但單獨使用頻譜信號作為輸入,模型的診斷精度還有待提高。
利用t-SNE方法,對方式1、方式2、方式3提取的深層特征向量進行可視化,如圖5所示。
(a) 方式1輸入 (b) 方式2輸入
由圖5可以看出,方式1輸入,經稀疏自編碼網絡提取的深度特征散點圖混疊,軸承的10種狀態(tài)完全不可分;方式2輸入,經稀疏自編碼網絡提取的深度頻譜特征降低了不同狀態(tài)的重疊程度,10種狀態(tài)的特征散點圖基本可分,但仍有極小部分劃分錯誤,且3種不同故障尺寸的內圈故障之間的區(qū)分不夠明顯;方式3三種不同比例混合的復合信號作為輸入,且只采用一層網絡結構提取的深度特征,就能將軸承的10種狀態(tài)完全區(qū)分出來。因此,頻譜、速度、位移信號融合后提取到的深層故障特征更顯優(yōu)勢,更適合分類器來做故障識別。
方式3輸入中3種不同比例混合的復合信號,經10次測試后的平均準確率如表2所示。
表2 方式3中3種不同比例混合的結果
由表2可以看出,輸入的復合信號隨著速度、位移信號信息量的不斷增加,軸承的平均診斷準確率不斷提高,并且方差也逐漸減小,說明速度、位移信號的信息增加會提高模型的穩(wěn)定性,從而更加準確識別出軸承的狀態(tài)。
2.1.3 對比分析
方式1中的振動加速度信號、方式2中的頻譜信號和方式3中的3種不同比例混合的復合信號輸入的診斷結果進行對比,利用測試集在這5種不同輸入方式的故障模型上分別進行10次實驗,方式1和方式2輸入均選取診斷效果最好的層數模型結果進行對比,10次測試對比的結果如圖6所示。
圖6 5種不同輸入方式10次測試的結果對比
將振動加速度信號直接輸入到SAE網絡的平均診斷準確率最低,僅為52.24%,方差為29.24;將振動加速度信號轉換為頻譜信號輸入到SAE網絡的平均診斷準確率為91.40%,方差為12.27;在頻譜信號的基礎上融合了速度、位移信號后,診斷準確率明顯提高,平均診斷準確率分別為98.33%、98.87%、99.20%,方差分別為23.02、6.70、4.84。通過對比,可以得出結論:頻譜信號融合速度、位移信號后,模型的故障診斷準確率會明顯提高,且隨著速度、位移信息量的增加,診斷模型的穩(wěn)定性會更好。
采用某大學工業(yè)機器人RV的實驗數據[17]。RV減速器行星輪故障實驗在RV減速器測試臺上進行,實驗臺如圖7所示。
圖7 工業(yè)機器人RV減速器故障實驗臺
RV減速器的實驗數據選用減速器輸出軸單向無負載的持續(xù)運動故障數據,RV的狀態(tài)主要有5種:正常、點蝕故障、斷齒故障、裂紋故障、磨損故障,故障主要發(fā)生在行星輪上。
故障數據樣本劃分如表3所示。同樣對頻域積分后的速度、位移信號只選取頻譜采樣點數的一定比例長度來進行數據融合,即選取速度、位移信號的點數占頻譜信號點數的15%、30%、50%。
表3 RV故障數據樣本集劃分
2.2.1 RV行星輪故障診斷的過程
首先,對采集到的RV振動加速度信號做一次、二次頻域積分得到速度、位移信號,同時對振動加速度信號做快速傅里葉變換得到頻譜信號,對頻譜、速度、位移3種信號分別做歸一化處理。
其次,選取每個樣本的長度為1875,且對速度、位移信號的點數長度選取頻譜信號點數的15%、30%、50%,即取282、563、938個點3種方式。
最后,同樣按照以下3種方式輸入到稀疏自編碼模型。方式1:歸一化后的振動加速度信號;方式2:原始振動加速度信號做快速傅里葉變換后的頻譜信號。方式3:3種不同比例的復合信號。方式1和方式2每類RV狀態(tài)的樣本數為280,每個樣本的數據長度為1875。方式3輸入的復合信號的每個樣本的長度有3種,取整后分別為2439、3001、3751。RV的狀態(tài)為5類,所以3種輸入方式的輸出層神經元個數都為5,經稀疏自編碼提取深度特征后,通過SoftMax分類器得到最終的診斷結果。
2.2.2 診斷結果
同樣對方式1、方式2輸入分別構建了1、2、3層的模型,并對不同層數的診斷模型訓練并測試了10次,取10次測試結果的平均值,方式1、2在不同層數下的平均診斷率如圖8所示。
圖8 方式1、 2在不同深度下的平均診斷率對比
圖8中,在不同的稀疏自編碼網絡層數下,振動加速度信號的頻譜作為輸入的診斷準確率總是高于振動加速度作為輸入的診斷準確率,但單獨用頻譜信號作為稀疏自編碼的輸入,診斷精度還未達到預期目標。
利用t-SNE方法,對方式1、方式2、方式3輸入提取的5種深層特征向量進行可視化,如圖9所示。
(a) 方式1輸入 (b) 方式2輸入
由圖9a可以看出,將RV的振動加速度信號作為稀疏自編碼網絡的輸入,提取的深度特征散點圖除斷齒故障呈聚集狀態(tài),其余4種狀態(tài)完全不可分;圖9b圖輸入頻譜信號,提取出來的深度頻譜特征改善了不同狀態(tài)間的混疊程度,5種狀態(tài)的特征散點圖大致可分,但正常、點蝕、裂紋、磨損狀態(tài)的特征散點圖還存在部分混疊,且類間距并不大,同一種狀態(tài)的聚集程度并不明顯;圖9c~圖9e圖在頻譜的基礎上分別融合了15%、30%、50%的速度、位移信息,3種情況下的特征散點圖RV的5種狀態(tài)都可以明顯區(qū)分出來,且不同狀態(tài)的類間距明顯增大,同一種狀態(tài)的聚集程度也有明顯改善。因此,將頻譜、速度、位移信號融合后作為稀疏自編碼網絡的輸入來提取RV行星輪的深層故障特征是完全可行的。
2.2.3 對比分析
方式1中的振動加速度信號、方式2中的頻譜信號和方式3中的3種不同比例混合的信號輸入的診斷結果進行對比,在這5種故障診斷模型上分別進行10次測試,方式1和方式2輸入均選取診斷效果最好的層數結果進行對比,10次測試對比的結果如圖10所示。
圖10 5種不同輸入10次測試的結果對比
將RV的振動加速度信號直接輸入到SAE網絡的平均診斷準確率最低,僅為71.30%,方差為15.41;輸入為頻譜信號后,平均診斷準確率為94.20%,雖然識別準確率明顯提升,但方差為19.93,模型的穩(wěn)定性較差;在頻譜信號的基礎上融合了速度、位移信號后,3種不同比例的混合信號10次測試的平均診斷準確率均為100%。通過對比,可以得出結論:頻譜信號融合速度、位移信號后,診斷準確率會明顯提高,且頻譜信號輸入中只需要融入15%的速度和15%的位移信息量,診斷模型的精度就可以達到100%,且穩(wěn)定性較好。為節(jié)省模型的訓練時間,對于RV減速器行星輪5狀態(tài)的故障識別,只需要融合15%的速度、位移信息量即可達到預期診斷目的。
振動加速度信息、速度信息、位移信息能更全面包含設備狀態(tài)信息,本文將三者進行數據融合,并利用稀疏自編碼與SoftMax分類器構建深度學習網絡,對滾動軸承、RV減速器行星輪進行狀態(tài)識別,最終得出以下結論:
(1)稀疏自編碼具有強大的特征提取和降維性能,可以自適應提取深層故障特征,能有效解決傳統(tǒng)手工提取特征區(qū)分度差、代表性弱的問題。
(2)相比于單一數據輸入,頻譜、速度、位移信號進行數據融合后的復合信號作為稀疏自編碼網絡的輸入,滾動軸承和RV行星輪的多組對比實驗結果表明,相比經典方法,所提方法在保證識別準確率和降低模型復雜度的同時,有效提高了其泛化性。