郭梓良, 郝如江, 王一帆, 楊文哲, 趙瑞祥
(石家莊鐵道大學機械工程學院,河北 石家莊 050043)
對工作中的軸承進行故障識別與診斷的過程中,常常受到噪聲的干擾導致故障識別準確率降低。因此對噪聲進行篩選和處理,是滾動軸承故障識別的關鍵所在[1]。
當今的軸承故障診斷主要是圍繞著故障振動信號的特征提取和分類等方面進行研究。史東海等[2]通過使用傳統(tǒng)方法對信號進行處理后使用PCA降維,隨后采用K近鄰算法對結果進行分類。姚峰林等[3]通過使用小波包變換對滾動軸承數(shù)據(jù)消噪處理后再進行極限學習機特征提取分類。汪朝海等[4]對原數(shù)據(jù)通過經(jīng)驗模態(tài)分解后使用卷積神經(jīng)網(wǎng)絡進行故障分類。上述方法對原始故障信號進行相應處理,削弱了噪聲干擾信號所帶來的影響,從而使得信號特征更易提取,但是仍存在著一定的不足。傳統(tǒng)方法雖然能減少噪聲帶來的信號干擾,但是由于初始參數(shù)的影響,常常導致有用的特征信號被篩選清除。使用小波分解處理方法,因小波基參數(shù)需要多次實驗分析確定,缺少信號處理的泛化性。EMD可以對信號進行自適應分解,但是會產(chǎn)生嚴重的端點效應并具有模態(tài)混疊的缺點。
為了解決上述問題,本文采用一種集合經(jīng)驗模態(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)、主成分分析算法(Principal Component Analysis,PCA)和一維卷積神經(jīng)網(wǎng)絡(one-Dimensional Convolutional Neural Network,1D-CNN)相結合的軸承故障識別的方法:首先將原始數(shù)據(jù)進行重構分解得到若干個本征模函數(shù)(Intrinsic Mode Function,IMF)分量,通過篩選能夠充分表達出數(shù)據(jù)特征的一條IMF分量再進行PCA算法去冗余處理,其次將原始數(shù)據(jù)也經(jīng)過PCA去冗余處理,并采用將PCA-IMF分量和經(jīng)過處理的新數(shù)據(jù)作為一維卷積神經(jīng)網(wǎng)絡(1D-CNN)的輸入數(shù)據(jù),最后把處理后的數(shù)據(jù)投入到網(wǎng)絡中進行多次迭代訓練特征提取分類,為滾動軸承故障預防和故障研究提供了一種新方法。
EEMD方法是為了彌補EMD模態(tài)混疊現(xiàn)象而提出的,通過對EMD分解后的若干個IMF分量添加對應的高斯白噪聲來改變分解過程中極值點的位置,從而可以有效地抑制模態(tài)混疊的產(chǎn)生。具體步驟如下:
(1)設定EEMD的運算次數(shù)z和高斯白噪聲標準差n。
(4)重復步驟(1)和步驟(2)的操作z次后,篩選適當?shù)腎MF分量進行信號重構。
當振動信號經(jīng)過EEMD分解后仍存在干擾和冗余,這些干擾在網(wǎng)絡訓練時會影響網(wǎng)絡準確性,因此需要篩選并去除其中的干擾值,提高IMF分量的表現(xiàn)力。
PCA算法通過計算樣本向量中的特征值和均值,并通過投影運算便可以達到降維的目的。主要步驟如下:
(1)首先將數(shù)據(jù)進行中心化。
(2)計算樣本的協(xié)方差矩陣ZZi。
(3)對協(xié)方差矩陣ZZi進行特征值分解。
(4)取最大的d個特征值所對應的特征向量ωi。
(5)將ωi投影成矩陣。
隨著機器學習的發(fā)展,卷積神經(jīng)網(wǎng)絡在數(shù)據(jù)處理及分類等方面取得了巨大的進步。卷積神經(jīng)網(wǎng)絡是通過類似神經(jīng)元的反應及反饋,利用卷積運算提取訓練樣本中的特征,其主要包括卷積層、池化層和全連接層。由于CNN超強的學習和特征提取能力因此廣泛用于工學的各個領域。
卷積層是通過卷積塊對數(shù)據(jù)進行局部運算并產(chǎn)生特征圖。池化層可以通過特征降維,提高網(wǎng)絡活性。全連接層是將上層傳入的數(shù)據(jù)進行進一步特征提取并將提取出的特征輸入Softmax函數(shù)進行分類。
為了防止EEMD分解所帶來的特征缺失,提高模型的魯棒性和泛化性,提出基于EEMD分解和原始數(shù)據(jù)相互結合的方法。具體滾動軸承故障識別實驗方法如圖1所示。
圖1 EEMD-PCA-1D-CNN故障分類流程
本文數(shù)據(jù)是采用美國西儲大學電機軸承故障狀況實驗,通過人為電火花破壞滾動軸承形成三種故障類型,對比正常類型,并篩選不同工況、載荷以及轉速下的振動信號,具體數(shù)據(jù)選取如表1所示。
表1 軸承信號選取參數(shù)
根據(jù)本文上述的實驗方法,首先對數(shù)據(jù)進行EEMD處理,通過篩選適合的IMF分量對分解后的信號進行重構。相關系數(shù)可以用來表現(xiàn)分解后的IMF分量與原數(shù)據(jù)的相關程度。通過計算振動信號的譜峭度值ku可以發(fā)現(xiàn)運行系統(tǒng)中的異常,當軸承在正常運行時,譜峭度ku約等于3;當軸承發(fā)生故障或者運行不正常時,此時的譜峭度將會偏離正常值[5]。
相關系數(shù)的計算公式:
(1)
式中:i,j為兩個變量;Cov()為i,j的協(xié)方差;Var[]為i,j的方差。求得各IMF分量的相關系數(shù)并取絕對值,絕對值越大則表明該IMF分量所體現(xiàn)的故障振動信號所包含的原始信號相關程度越高。
根據(jù)上述的方法,計算各個IMF分量的相關系數(shù)和譜峭度,部分結果如表2、表3所示。為了體現(xiàn)EEMD算法更能體現(xiàn)出故障信號特征,因此將原始數(shù)據(jù)經(jīng)過EMD分解設置為對照組,并計算對照組的相關系數(shù)和譜峭度值,部分結果同見表2、表3。
由表2、表3可知,軸承故障越嚴重,數(shù)據(jù)經(jīng)過EEMD分解后所得譜峭度與正常值偏差更大,故障特征信息更明顯。由表2、表3可知,EEMD相比于EMD可以更有效的提取軸承信號的故障信息。通過計算分解后的各個IMF分量,將含有故障的軸承進行分解篩選,選取譜峭度與正常值3偏差較大、相關系數(shù)的絕對值較大的分量進行數(shù)據(jù)重構,并作為神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)集。
表2 EEMD-滾動體故障和EMD-滾動體故障(0.007 in)
表3 EEMD-滾動體故障和EMD-滾動體故障(0.014 in)
將重構后的信號輸入主成分分析算法中計算,按照7∶3的比例分為測試集與訓練集,放入一維卷積神經(jīng)網(wǎng)絡中。本文基于經(jīng)典卷積網(wǎng)絡LeNet-5模型并多次調(diào)試,最終選取的各個參數(shù)如表4所示。
表4 卷積層參數(shù)
本次實驗所使用的深度學習框架為Tensorflow,編程語言為Python。計算機配置為銳龍R7-5800H,英偉達GeForce RTX3050Ti,16G內(nèi)存。此次實驗每組數(shù)據(jù)中包括1 000個數(shù)據(jù)點,通過五折交叉驗證法確定最優(yōu)網(wǎng)絡模型,測試階段重復5次,最終測試結果取均值。
通過多次對比實驗,10類故障信號分類準確率和損失值如圖2、圖3所示,經(jīng)過500次迭代后準確率趨于穩(wěn)定。通過t-SNE技術對原始數(shù)據(jù)和經(jīng)過訓練的模型進行特征可視化分類,如圖4所示(只模擬分類擬合情況,橫、縱坐標無實際意義),未經(jīng)過模型訓練的各個故障混亂,經(jīng)過訓練后的模型故障標簽7和標簽8發(fā)生分類錯誤。通過圖5可知EEMD算法過程中存在端點效應而導致分類錯誤。
圖2 準確率 圖3 損失值
圖4 特征可視化 圖5 混淆矩陣
為了驗證本文所采用的軸承診斷方法的適用性和準確性,通過使用機器學習中的分類方法對處理后的數(shù)據(jù)進行對比。將上述處理好的數(shù)據(jù)作為輸入數(shù)據(jù)輸入到EEMD-CNN和隨機森林中,10次實驗測試結果為:本文方法平均準確率98.6%,EEMD-CNN平均準確率92.3%,EEMD-隨機森林平均準確率86.6%??芍ㄟ^使用EEMD-PCA-1DCNN的方法可以有效的提取故障類型的振動信號特征并分類,相比于其他算法有最高的平均準確率(98.6%),特征識別及分類效率有著明顯的提高,證明本文所提方法的可行性與有效性。
因軸承故障的振動信號復雜且包含有多種干擾,本文提出一種基于EEMD-PCA-1D-CNN的故障診斷方法,由對比結果可知,本文的方法在軸承故障診斷分類中準確率更高。本文在EEMD處理時數(shù)據(jù)產(chǎn)生了端點效應而導致準確率降低,還應探究多種網(wǎng)絡及算法優(yōu)化以獲得最優(yōu)模型,并通過變工況設計實驗增加網(wǎng)絡模型的魯棒性和泛化性。