黃磊,馬圣
(1.江蘇航空職業(yè)技術學院 航空工程學院,江蘇 鎮(zhèn)江 212134;2.成都芯米科技有限公司 技術研發(fā)部,成都 610213)
軸承在旋轉機械中承載著較強的工作載荷,其性能好壞直接決定著旋轉機械的動力性能。隨著對轉子動力學的深入研究,振動信號能夠用于揭示設備的健康狀況,但實際工程中的軸承振動信號往往摻雜著不同部件振動帶來的噪聲而呈現(xiàn)為非平穩(wěn)的周期信號,直接提取振動信號的故障特征難度較大。
奇異譜分析(Singular Spectrum Analysis,SSA)是一種基于主成分分析的非參數(shù)估計方法,常用于處理包含噪聲的非平穩(wěn)信號,其主要依據(jù)軌跡矩陣的主成分進行奇異分解、特征重組和重構,這種選擇方式對其性能影響極大[1-3]。因此,文獻[4]提出自適應的信號處理方法,實現(xiàn)信號從高頻到低頻的重構;文獻[5]將分解后的分量進行形態(tài)學解調以避免端點效應并用于滾動軸承故障診斷。
另外,振動信號分析結合人工智能診斷方法成為主流,如支持向量機[7-9]、學習機[10]、人工神經(jīng)網(wǎng)絡[11]等被用于軸承故障診斷。但部分神經(jīng)網(wǎng)絡需要大量的訓練樣本,而支持向量機(Support Vector Machine,SVM)能夠通過少量樣本解決非線性高維空間問題,推廣性較強。罰參數(shù)和核參數(shù)的取值影響著SVM的性能[12],粒子群算法(Particle Swarm Optimization,PSO)相比遺傳算法具有操作簡單,尋優(yōu)速度快等特點,但易陷入局部極小值等問題限制了PSO的擴展性[13]。
綜上所述,引入信息增益比(Information Gain Ratio,IGR)選擇SSA分解后的分量信號進行重構去噪,采用動態(tài)慣性權重并引入梯度信息改進PSO,最終使用基于信息增益比的奇異譜分析對振動信號降噪,并結合改進PSO(IPSO)優(yōu)化的SVM對滾動軸承進行故障診斷。
奇異譜分析屬于一種廣義功率譜分析,基本思想為:將一定長度的一維時間序列按照給定的嵌入窗口長度和時滯構造成軌跡矩陣,用主成分分析方法對軌跡矩陣中的時間序列進行分析,得到軌跡矩陣的特征向量和特征值,隨后選用其中部分特征向量和時間系數(shù)實現(xiàn)信號的重構[14]。
使用奇異譜對時間序列x(t)進行分解重構時,選取的Ri分量決定重構信號的準確性。一般通過比較Ri分量所構成子矩陣的貢獻率與閾值η(0.85~0.95)之間的關系進行選擇[1]。為避免Ri分量增多而引入一些差異性較小的分量,不再考慮Ri分量所構成子矩陣的貢獻率,而是直接考慮軌跡矩陣X的特征值的信息增益比,構造基于信息增益比的奇異譜分析(IGRSSA)。
為避免求解軌跡矩陣X的特征值時部分特征值的數(shù)量級存在明顯差異,對所有特征值進行歸一化處理,即
(1)
第i個特征值的熵值pi為
(2)
則第i個特征值熵值pi的增益比gi為
(3)
在選取分量Ri時,選擇特征值信息增益比大于0.01的前k個分量進行信號重構。
仿真信號如(4)式所示,沖擊頻率為250 Hz,信號采樣頻率為10 240 Hz,采集0.4 s共4 096個采樣點,附帶均值為0.5的隨機噪聲r(t)。用IGRSSA與SSA對仿真信號進行降噪分析,并結合(5)式的擬合優(yōu)度函數(shù)計算2種方法對原信號的逼近程度。IGRSSA中熵值增益比閾值設定為0.01,SSA中子矩陣貢獻率閾值設為0.85,IGRSSA與SSA的窗口長度均為1 333。
y(t)=y1(t)+0.5r(t)=
e-15tsin(2π×250t)+0.5r(t),
(4)
(5)
原始信號、重構信號的時域波形分別如圖1、圖2所示,由圖可知:仿真信號在噪聲干擾下發(fā)生紊亂,IGRSSA與SSA均能有效去除噪聲,但IGRSSA去噪效果相比SSA好很多,尤其在采樣點的后段。為進一步分析兩者的降噪程度,按照(5)式計算IGRSSA與SSA重構信號的擬合優(yōu)度,其中IGRSSA的擬合優(yōu)度達到0.996 7,而SSA的擬合優(yōu)度僅有0.913 3,說明IGRSSA相比SSA能夠更好的對信號進行重構并抑制噪聲。
圖1 仿真信號的時域波形
圖2 重構信號的時域波形
支持向量機能夠將低維線性不可分問題通過映射到高維空間進行線性可分,且在小樣本下能夠表現(xiàn)出較好的性能,因而被廣泛應用于模式識別等領域[12]。
支持向量機屬于數(shù)據(jù)驅動的分類診斷模型,通常針對某類故障構建樣本數(shù)據(jù)時,提取的特征維度較高容易造成維度災難且難以避免特征之間存在的共線性,反而容易導致診斷模型效果不佳。平均影響值(Mean Impact Value, MIV)用于評價自變量對因變量的影響程度,是神經(jīng)網(wǎng)絡中評價變量相關性較好的指標,其符號代表相關方向,絕對值大小代表自變量影響的重要程度[13]。假設網(wǎng)絡的訓練樣本為P,當網(wǎng)絡訓練終止后,各自變量計算步驟如下[15]:
1)將訓練樣本P中的每個自變量在其原值基礎上加、減10%,構成新的訓練樣本P1和P2。
2)用訓練好的網(wǎng)絡對P1和P2進行仿真,得到仿真結果Y1和Y2。
3)令YIV=Y1-Y2并按照觀測列數(shù)平均,得到自變量對因變量的MIV值。
4)重復第1—第3步,計算各自變量的MIV值,并根據(jù)MIV的絕對值大小篩選自變量。
經(jīng)典PSO算法簡單,收斂速度快,但容易陷入局部極值而導致趨同效應[16],且搜索移動時受到慣性行為影響而導致搜索精度較低。因此,對經(jīng)典PSO進行改進以在小樣本數(shù)據(jù)下取得較好的尋優(yōu)結果。
考慮到慣性權值ω決定粒子在搜索空間的搜索能力,采用動態(tài)慣性權重,即
(6)
式中:ωmax,ωmin分別為最大、最小慣性權值;k為粒子當前迭代次數(shù);G為粒子最大迭代次數(shù)。動態(tài)慣性權重能夠保證在迭代次較小時權值較大,全局搜索能力強;迭代次數(shù)增加時權值減小,局部搜索能力強。
為使粒子能夠較快的向最優(yōu)目標方向進行搜索,引入梯度信息[17]優(yōu)化SVM的罰參數(shù)c和核參數(shù)g,定義PSO優(yōu)化SVM的適應度函數(shù)G(x)為
,(7)
式中:f(x|c,g),fo(x|c,g)分別為SVM在罰參數(shù)c、核參數(shù)g下的實際輸出和期望輸出;n為校驗集樣本數(shù)量。
假設G(X)對于變量X(X=[c,g])的偏導數(shù)都存在,則
(8)
若目標中各變量為線性時,G(X)對于變量X的導數(shù)可表示為
(9)
(10)
式中:x(k|t+1),x(k|t)分別為t+1和t時刻個體向量中第k個變量的位置;V(t)為粒子在t時刻的速度。
如圖3所示,IPSO-SVM利用IPSO種群中的個體作為SVM的罰參數(shù)c和核參數(shù)g,校驗集誤差作為適應度函數(shù),按照IPSO的步驟對粒子進行尋優(yōu)操作,找到最優(yōu)粒子位置作為SVM的罰參數(shù)c和核參數(shù)g。
圖3 IPSO-SVM流程圖
IPSO-SVM算法步驟為:
1)將SVM的罰參數(shù)c和核參數(shù)g作為待優(yōu)化變量,進行實數(shù)編碼。
2)隨機初始化種群,種群中的每個個體向量表示SVM的一組可行解。
3)按照(7)式計算種群的適應度值,找到個體最優(yōu)位置。
4)計算個體向量梯度并排序,按照(10)式更新粒子位置,計算適應度值并實時更新最優(yōu)個體的位置。
5)判斷是否滿足終止條件,若不滿足則重復第3—第4步;若滿足則輸出最優(yōu)個體,并將其賦值給SVM的罰參數(shù)c和核參數(shù)g。
滾動軸承試驗數(shù)據(jù)來源于美國西儲大學軸承數(shù)據(jù)中心[18],電動機轉速1 796 r/min,信號采樣頻率12 kHz,每周期傳感器采樣1 024個點工況下,6205-2RS深溝球軸承的故障數(shù)據(jù)見表1。
軸承振動信號某一周期內的時域信號、經(jīng)IGRSSA算法處理后得到的重構信號如圖4所示,經(jīng)過IGRSSA處理后,不同故障類型軸承振動信號的幅值均有減小,且重構信號的趨勢更為明顯。
圖4 不同故障類型軸承振動信號及IGRSSA重構信號
時域分析法在處理過程能夠減少信號的畸變或損失[10],因此提取平均值、峰峰值、均方根值、標準差、偏度、峭度、波峰因子和變異系數(shù)等時域特征參數(shù),每類故障樣本選擇100組,合計300組數(shù)據(jù),提取的部分時域數(shù)據(jù)見表2。
表2 軸承振動信號的時域特征參數(shù)
考慮到變量之間耦合性等因素對自變量帶來的影響,使用MIV方法對時域特征參數(shù)進行篩選。計算各個參數(shù)在正負10%增量時的MIV值,其負號代表相關的方向,絕對值大小表示影響程度大小。重復6次計算得到的MIV值見表3,由表可知:均值、標準差、波峰因子對仿真結果影響程度較小,可以考慮將其去除,選擇峰峰值、均方根值、偏度、峭度和變異系數(shù)建立故障診斷模型。經(jīng)過MIV篩選后的部分試驗數(shù)據(jù)見表4。
表3 各時域參數(shù)的平均影響值
表4 最優(yōu)時域特征參數(shù)
按3∶1∶1的比例將數(shù)據(jù)集分為訓練集、校驗集、測試集,各樣本集的數(shù)據(jù)隨機選擇,互不重復。為驗證IPSO-SVM方法在滾動軸承故障診斷中的有效性,選擇常用的BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡、SVM、交叉驗證優(yōu)化的SVM(GridSearchSVM)、遺傳算法優(yōu)化的SVM(GA-SVM)、粒子群優(yōu)化的SVM(PSO-SVM)進行對比分析。
3.3.1 對比算法的參數(shù)設置
BP神經(jīng)網(wǎng)絡絡采用5-11-1的網(wǎng)絡結構,即輸入層5個神經(jīng)元,隱含層11個神經(jīng)元,輸出層1個神經(jīng)元,權值和閾值隨機產(chǎn)生,隱含層采用S型正切函數(shù)tansig,輸出層采用S型對數(shù)函數(shù)logsig,網(wǎng)絡訓練函數(shù)為trainlm;RBF神經(jīng)網(wǎng)絡中散布系數(shù)spread=0.5;SVM中的罰參數(shù)和核參數(shù)隨機產(chǎn)生,文中記為Rand-SVM;GridSearchSVM中交叉驗證樣本為20;GA-SVM中,最大迭代步數(shù)為100、種群大小為30、選擇交叉概率為0.6、變異概率為0.05、優(yōu)化參數(shù)為2;PSO-SVM和IPSO-SVM中,c1=c2=1.5、迭代步數(shù)為100、粒子群大小為30、最大權重為0.9、最小權重為0.4、粒子最大搜索速度為10、最小搜索速度為-10、優(yōu)化參數(shù)為2。注意:對比算法中SVM的罰參數(shù)和核參數(shù)的范圍分別為[0.1,100]和[0.01,100]。
3.3.2 平均診斷準確率
在相同訓練集和測試集的基礎上,使用上述算法對滾動軸承故障數(shù)據(jù)進行診斷,結果見表5。其中,BP神經(jīng)網(wǎng)絡隨機產(chǎn)生初始權值和閾值的問題導致每次試驗結果不一致,表中數(shù)據(jù)為BP神經(jīng)網(wǎng)絡重復試驗30次后的平均值;Rand-SVM的結果為隨機試驗10次后選擇的最優(yōu)值;GridSearchSVM,GA-SVM,PSO-SVM和IPSO-SVM均為某一次的診斷結果。
表5 不同算法的診斷結果
由表5可知:BP和RBF診斷方法由于參數(shù)設置問題導致診斷效果較差;選擇Sigmoid核函數(shù)時所有的SVM診斷效果都較差;但SVM在選擇RBF核函數(shù)和多項式核函數(shù)時均能達到很好的診斷效果,核函數(shù)為多項式時GridSearchSVM診斷效果最好(98.33%),核函數(shù)為RBF時IPSO-SVM的效果最好(98.33%)且其校驗集誤差相對較低;由最優(yōu)罰參數(shù)和核參數(shù)可知,使得SVM達到較佳診斷效果的參數(shù)并不唯一;優(yōu)化SVM中涉及到重復運算過程,因此診斷時間相對較長,但IPSO-SVM的診斷時間相對PSO-SVM和GA-SVM略短幾秒。
3.3.3 算法的穩(wěn)定性及收斂性
比較IPSO-SVM,PSO-SVM和GA-SVM對樣本的適應性,采用對樣本進行有放回的隨機抽樣,樣本比例分配同3.3節(jié)但每次被選擇為訓練、校驗、測試的樣本數(shù)據(jù)不同。在核函數(shù)為RBF的前提下重復試驗30次,診斷結果如圖5所示,由圖可知:IPSO-SVM,PSO-SVM,GA-SVM算法均存在不同程度的波動,其最大波動幅度分別為5.0%,6.3%,8.2%,平均準確率分別為97.72%,97.17%,96.50%;IPSO-SVM和PSO-SVM的平均誤差收斂值均比GA-SVM效果好,但GA-SVM相比PSO-SVM收斂更早,IPSO-SVM平均收斂誤差最小且其收斂速度最快。綜上分析可知,IPSO-SVM的穩(wěn)定性、平均診斷準確率和誤差收斂效果均比PSO-SVM和GA-SVM要好。
引入信息增益比選擇有用分量進行重構,并與基于子矩陣貢獻率的奇異譜對比分析,從仿真信號重構趨勢圖、重構信號與原信號的擬合優(yōu)度而言,IGRSSA的去噪重構性能比SSA的效果明顯;采用動態(tài)慣性權值并引入梯度信息調整粒子搜索趨勢也顯著提高了PSO的性能。使用IGRSSA對軸承故障信號降噪處理并提取時域信號,采用MIV法篩選出最優(yōu)時域特征參量作為后續(xù)故障診斷的數(shù)據(jù)集,與其他算法的對比分析表明,IPSO-SVM在選擇RBF核函數(shù)時效果最好,波動性較小,誤差收斂值小,收斂速度快,平均診斷準確較高,更適合滾動軸承的故障診斷。
圖5 不同算法的隨機抽樣結果