姜保軍,曹 浩
(重慶交通大學(xué) a.機(jī)電與車輛工程學(xué)院;b.城市軌道車輛系統(tǒng)集成與控制重點(diǎn)實(shí)驗(yàn)室,重慶 400074)
齒輪箱是機(jī)械設(shè)備中常用裝置,一旦發(fā)生故障,將會(huì)導(dǎo)致機(jī)器設(shè)備無(wú)法正常工作,因此,對(duì)齒輪箱故障進(jìn)行檢測(cè)有著重要的意義。齒輪箱的故障信號(hào)具有非平穩(wěn)性以及復(fù)雜性等特點(diǎn),其故障診斷方法的研究主要包括特征提取和模式識(shí)別這兩方面的工作。在特征提取方面,常見(jiàn)的特征提取方法主要包括時(shí)域分析[1]、小波變換[2-4]和能量譜等。文獻(xiàn)[5]提出了一種利用時(shí)序分析方法提取齒輪箱故障特征最終獲得較好的實(shí)驗(yàn)結(jié)果,文獻(xiàn)[6]利用小波和能量譜的分析方法對(duì)風(fēng)電機(jī)組齒輪箱故障進(jìn)行診斷,該方法能準(zhǔn)確地診斷出故障的形式以及位置。由此可見(jiàn),小波分解是一種有效的齒輪箱故障診斷方法,對(duì)于機(jī)械設(shè)備的故障診斷具有重要意義。
在模式識(shí)別方面,主要的方法包括BP神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)(support vector machine,SVM)[8]和深度學(xué)習(xí)[9]等。BP神經(jīng)網(wǎng)絡(luò)算法收斂的速度較慢,并且容易陷入局部極值從而導(dǎo)致網(wǎng)絡(luò)訓(xùn)練失敗[10],支持向量機(jī)在小樣本的分類能力上具有獨(dú)特的優(yōu)勢(shì)[11],但是在故障診斷的過(guò)程中受參數(shù)選取的影響較大,通常和參數(shù)優(yōu)化算法結(jié)合起來(lái)完成故障的診斷,常用的參數(shù)優(yōu)化方法包括網(wǎng)格劃分法、遺傳算法優(yōu)化(Genetic Algorithm,GA)[12]和粒子群優(yōu)化算法(Particle Swarm optimization,PSO),粒子群優(yōu)化算法容易陷入局部最優(yōu),并且在算法上容易不穩(wěn)定[13]。深度學(xué)習(xí)主要利用含有多隱層的多層感知器進(jìn)行機(jī)器學(xué)習(xí)提取更加抽象的類別屬性以及特征,其訓(xùn)練過(guò)程需要在大量的樣本下進(jìn)行學(xué)習(xí)并且需要耗費(fèi)較長(zhǎng)的時(shí)間[14]。
綜上所述,選擇合適的特征提取方法以及識(shí)別模型對(duì)于齒輪箱故障檢測(cè)十分重要。針對(duì)復(fù)雜且非平穩(wěn)的齒輪箱故障信號(hào),本文提出了一種基于小波分解和樣本熵的遺傳優(yōu)化支持向量機(jī)的齒輪箱故障診斷方法,該方法利用3層小波對(duì)齒輪箱故障信號(hào)進(jìn)行分解,對(duì)分解后的信號(hào)進(jìn)行樣本熵計(jì)算,并將結(jié)果輸入到用遺傳優(yōu)化方法優(yōu)化后的支持向量機(jī)中進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明優(yōu)化后的分類模型具有更高的準(zhǔn)確率。
小波分解是一種比較常用的信號(hào)處理方法。多尺度分解是由Mallat等人在進(jìn)行正交小波基構(gòu)造時(shí)提出的,按照多分辨分析理論,其分解尺度越大,分解的系數(shù)長(zhǎng)度越小,對(duì)于任意的信號(hào)f(x)∈L2(R)均可以分解低頻部分(近似部分)和高頻部分(細(xì)節(jié)部分),而接近部分最能反映信號(hào)的本質(zhì)信息,高頻部分則和噪音相關(guān)[15]。多尺度分析只對(duì)低頻部分進(jìn)行進(jìn)一步分解,而高頻部分則不考慮,因此,信號(hào)f(x)可以分解為:
f(x)=An+Dn+Dn-1+Dn-2+…+D2+D1
(1)
其中,An代表低頻近似部分,Dn代表高頻細(xì)節(jié)部分,n代表分解層數(shù)。對(duì)于?Ψ∈L2(R),如果Ψ(t)的Fourier 變換Ψ(w)滿足條件:
(2)
(3)
根據(jù)分解的需要,可對(duì)所得到的低頻部分作進(jìn)一步的分解,這樣就能到更低頻部分的信號(hào)以及頻率相對(duì)較高部分的信號(hào),然而信號(hào)的分解層數(shù)不是任意的,其最多可分解成log2N層,其中N為信號(hào)的長(zhǎng)度。在實(shí)際過(guò)程中,可根據(jù)需要選擇合適的分層數(shù)。
設(shè)時(shí)間序列x(n)是由N個(gè)數(shù)據(jù)構(gòu)成,其計(jì)算過(guò)程如下:
(1)重構(gòu)一組m維的向量序列X(1),X(2),X(3),…,X(N-m+1),其中,Xm(i)=[x(i),x(i+1),x(i+2),…,x(i+m-1)],1≤i≤N-m+1。
(2) 計(jì)算Xm(i)和Xn(j)之間的距離d(i,j),計(jì)算公式如下:
d(i,j)=|x(i+k)-x(j+k)|,0≤k≤m-1
(4)
(5)
(6)
(5)令k=m+1,重復(fù)(2)和(3)步驟,得到Bm+1(r)。
(6)求出樣本熵SampEn
(7)
由于在實(shí)際的計(jì)算過(guò)程中,N的值不可能無(wú)限大,因此當(dāng)N有限時(shí),其樣本熵的估計(jì)值為:
(8)
由于參數(shù)m和r的取值直接決定最后樣本熵的計(jì)算結(jié)果,因此,本文在對(duì)小波系數(shù)進(jìn)行計(jì)算的過(guò)程中,m設(shè)置為2,r設(shè)置為0.2。
支持向量機(jī)(Support Vector Machine,SVM)是由Vapnik 提出來(lái)的,其主要思想是建立一個(gè)決策分類的超平面作為決策曲面,在解決小樣本、非線性以及高維模式下的識(shí)別問(wèn)題中具有特有的優(yōu)勢(shì),其二分類的支持向量機(jī)具體形式如下:
給定含有m個(gè)樣本的樣本:
T={(x1,y1),(x2,y2),…,(xl,yl)}∈(X×Y)l
(9)
xi∈X=Rn,yi∈Y={1,-1}(i=1,2,…,l),xi為特征向量。在解決實(shí)際問(wèn)題時(shí),需要選擇合適的核函數(shù)K(x,x′)和適當(dāng)?shù)膮?shù)C,以達(dá)到最優(yōu)解目的。常見(jiàn)的核函數(shù)有三種,即:
線性核函數(shù):
K(x,xi)=xΤxi
(10)
多項(xiàng)式核函數(shù):
K(x,xi)=(γxTxi+r)p,γ>0
(11)
徑向基核函數(shù):
(12)
本文選擇徑向基核函數(shù)作為SVM模型的核函數(shù)。
遺傳優(yōu)化算法(Genetic Algorithm ,GA)是一種更大范圍的尋求全局最優(yōu)解的算法,它是一種高效、實(shí)用且魯棒性強(qiáng)的技術(shù)?;贑V(Cross Validation)意義下的GA優(yōu)化算法流程如圖1所示。
圖1 CV意義下的GA遺傳優(yōu)化算法流程圖
本文利用GA算法對(duì)SVM的參數(shù)進(jìn)行尋優(yōu),具體的實(shí)驗(yàn)流程如下:
(1)對(duì)原始數(shù)據(jù)進(jìn)行初步截?cái)嗵幚恚?024個(gè)樣本點(diǎn)為基準(zhǔn)對(duì)其進(jìn)行截?cái)唷?/p>
(2)對(duì)截?cái)嗪蟮臄?shù)據(jù)進(jìn)行小波分解和樣本熵計(jì)算,構(gòu)建數(shù)據(jù)樣本特征。
(3)對(duì)提取的特征進(jìn)行歸一化處理,歸一化的范圍為[0,1]之間,對(duì)歸一化的特征參數(shù)數(shù)據(jù)集進(jìn)行訓(xùn)練集和測(cè)試集劃分,并設(shè)置相應(yīng)的訓(xùn)練集標(biāo)簽和測(cè)試集標(biāo)簽。
(4)設(shè)置遺傳算法初始化參數(shù):種群進(jìn)化代數(shù)為200,種群數(shù)量為20,懲罰因子c的取值范圍為[0,100],徑向基參數(shù)g的參數(shù)范圍為[0,100],k-折交叉驗(yàn)證法中的k為5,采用CV意義下訓(xùn)練集精度作為GA的適應(yīng)度函數(shù)值。
(5)利用GA算法選擇出最佳的參數(shù)c和g,利用訓(xùn)練集訓(xùn)練齒輪箱故障診斷模型。將測(cè)試集輸入到訓(xùn)練好的SVM模型中進(jìn)行測(cè)試,然后輸出測(cè)試結(jié)果。
為了驗(yàn)證本文提出方法在齒輪箱故障診斷中的效果,使用QPZZ-II實(shí)驗(yàn)平臺(tái)模擬齒輪箱故障,獲得正常、磨損故障、斷磨故障(大齒輪斷齒和小齒輪磨損)、斷齒故障、點(diǎn)蝕故障(大齒輪點(diǎn)蝕)和點(diǎn)磨故障(大齒輪點(diǎn)蝕和小齒輪磨損)這6種齒輪箱狀態(tài)數(shù)據(jù)。數(shù)據(jù)采樣頻率為5120Hz,每個(gè)齒輪箱狀態(tài)記錄由9個(gè)通道進(jìn)行數(shù)據(jù)采集,所有的數(shù)據(jù)均在轉(zhuǎn)速為1470rpm和轉(zhuǎn)速為880rpm下得到,為了驗(yàn)證相同轉(zhuǎn)速下不同負(fù)荷時(shí)齒輪箱的運(yùn)轉(zhuǎn)狀態(tài),在880rpm的工況下,分別加載0.2A、0.1A、0.05A制動(dòng)力矩輸出電流。4種不同工況下共獲得4類數(shù)據(jù)集,即A、B、C、D數(shù)據(jù)集,為了驗(yàn)證本文模型在復(fù)雜工況下對(duì)齒輪箱的故障診斷效果,將相同故障類型數(shù)據(jù)樣本組合在一起構(gòu)成復(fù)合型數(shù)據(jù)集E。在進(jìn)行數(shù)據(jù)預(yù)處理的過(guò)程中,將數(shù)據(jù)樣本以1024個(gè)數(shù)據(jù)點(diǎn)為基準(zhǔn)進(jìn)行截?cái)?,最終同一工況下每種類型數(shù)據(jù)將得到52個(gè)樣本,具體的數(shù)據(jù)如表1所示。
表1 齒輪箱狀態(tài)樣本表
續(xù)表
對(duì)每一類故障數(shù)據(jù)進(jìn)行截?cái)嘀?,需要獲得表征齒輪箱類型的特征值,本文采用小波分解和樣本熵的方法對(duì)樣本數(shù)據(jù)進(jìn)行特征提取。考慮到小波分解尺度太大會(huì)增加數(shù)據(jù)計(jì)算的復(fù)雜性,尺度太小可能導(dǎo)致信號(hào)分解不徹底,因此本文選擇3尺度的小波對(duì)樣本信號(hào)進(jìn)行分解。在進(jìn)行3層小波分解時(shí)采用db4小波基,然后分別提取不同尺度下分解后的低頻系數(shù)和高頻系數(shù),最后計(jì)算其系數(shù)的樣本熵值,由于一個(gè)樣本記錄由9個(gè)通道的數(shù)據(jù)組成,每一個(gè)通道截?cái)嗪蟮臉颖緮?shù)據(jù)通過(guò)上述方法處理后得到4個(gè)樣本熵值,因此一個(gè)記錄共得到36個(gè)樣本熵值,最終每個(gè)樣本由36個(gè)樣本熵值組成的特征向量表征。利用T-SNE[16]流形學(xué)習(xí)方法對(duì)數(shù)據(jù)集E進(jìn)行二維可視化,其結(jié)果如圖2所示。
圖2 數(shù)據(jù)集E特征可視化結(jié)果
從可視化結(jié)果可知,對(duì)于數(shù)據(jù)集E中的6類齒輪箱狀態(tài)特征數(shù)據(jù),同一種類別的數(shù)據(jù)被有效地聚集起來(lái),而不同類別的數(shù)據(jù)之間呈現(xiàn)較好地分離狀態(tài)。這說(shuō)明原始信號(hào)經(jīng)過(guò)小波分解和樣本熵的特征提取方法后所得到的特征數(shù)據(jù)具有較好的分類性。
對(duì)于數(shù)據(jù)集A、B、C、D,每個(gè)數(shù)據(jù)集均有312組樣本,其中每類故障樣本數(shù)均為52。從每類狀態(tài)樣本中隨機(jī)選擇26個(gè)樣本作為訓(xùn)練樣本,剩余26個(gè)樣本作為測(cè)試樣本,最終每種工況得到的訓(xùn)練集樣本數(shù)為156和測(cè)試集樣本數(shù)為156個(gè)。隨機(jī)進(jìn)行10次試驗(yàn),將最后得到的準(zhǔn)確率取平均值,其結(jié)果如表2所示。
表2 SVM模型和GA-SVM模型隨機(jī)試驗(yàn)10次平均結(jié)果
從表2可以看出,對(duì)應(yīng)數(shù)據(jù)集A而言,雖然正常樣本的識(shí)別率大體相當(dāng),但是其余故障類型的識(shí)別率均是GA-SVM分類模型比較高,對(duì)于數(shù)據(jù)集B而言,兩個(gè)模型每類狀態(tài)樣本的識(shí)別率整體相當(dāng),這可能是樣本的特征值均具有較高的區(qū)分性。對(duì)于數(shù)據(jù)集C和數(shù)據(jù)集D而言,除了正常樣本、磨損樣本以及點(diǎn)蝕樣本的識(shí)別率相當(dāng)之外,其余類別的樣本識(shí)別率均是GA-SVM模型高于SVM模型,因此進(jìn)行參數(shù)優(yōu)化的SVM識(shí)別模型具有更有效的識(shí)別率。
為了驗(yàn)證復(fù)雜工況下,本文提出模型的實(shí)驗(yàn)效果,利用數(shù)據(jù)集F進(jìn)行試驗(yàn),其中“NOR”代表正常樣本,“MS”代表磨損故障樣本,“DM”代表斷磨故障樣本,“DC”代表斷齒故障樣本,“DS”代表點(diǎn)蝕故障樣本,“DM1”代表點(diǎn)磨故障樣本, 實(shí)驗(yàn)結(jié)果如圖3、圖4 和表3所示。
圖3 GA算法適應(yīng)度曲線
圖4 GA-SVM測(cè)試集樣本分類結(jié)果
表3 GA-SVM算法分類結(jié)果
從圖3中可以看出,通過(guò)遺傳算法優(yōu)化后得到的最佳懲罰因子參數(shù)值c為44.5004,徑向基參數(shù)g的值為0.18911,CV意義下的準(zhǔn)確率為98.89%。由圖4可以看出,在624個(gè)樣本中,只有8個(gè)樣本預(yù)測(cè)錯(cuò)誤,從表3可以得出,正常樣本和斷齒故障樣本的識(shí)別準(zhǔn)確率為99%(103/104),磨損和點(diǎn)蝕故障樣本的識(shí)別準(zhǔn)確率為100%(104/104),點(diǎn)蝕磨損的識(shí)別準(zhǔn)確率為96.2%(100/104),平均準(zhǔn)確率為98.7%(616/624)。由此可見(jiàn),GA-SVM模型能較好的用于齒輪箱故障診斷,并能獲得較高的識(shí)別準(zhǔn)確率。
為了進(jìn)一步驗(yàn)證分類模型的實(shí)驗(yàn)效果,分別構(gòu)建傳統(tǒng)的SVM、GA-SVM、BP神經(jīng)網(wǎng)絡(luò)和SAE(稀疏自編碼器),其中SVM模型的核函數(shù)為RBF核函數(shù)(徑向基核函數(shù)),BP神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為36、隱含層節(jié)點(diǎn)數(shù)為37、輸出層節(jié)點(diǎn)數(shù)為6, SAE由兩層的稀疏自編碼器構(gòu)建,其第一層隱含層節(jié)點(diǎn)數(shù)為80,第二層隱含層節(jié)點(diǎn)數(shù)為30,利用Softmax作為分類器。選擇數(shù)據(jù)集A、C和E隨機(jī)進(jìn)行10次試驗(yàn),選擇數(shù)據(jù)A、C和E的原因是這幾類數(shù)據(jù)是常見(jiàn)工況下的故障數(shù)據(jù)類型,其結(jié)果如圖5、圖6和圖7所示。
圖5 數(shù)據(jù)集A隨機(jī)10次試驗(yàn)準(zhǔn)確率
圖6 數(shù)據(jù)集C隨機(jī)10次試驗(yàn)準(zhǔn)確率
圖7 數(shù)據(jù)集E隨機(jī)10次試驗(yàn)準(zhǔn)確率
從圖5~圖7中可以看出,在隨機(jī)試驗(yàn)過(guò)程中,SVM模型和GA-SVM模型得到的實(shí)驗(yàn)結(jié)果均高于其他模型,而所有數(shù)據(jù)集中GA-SVM分類模型所得到的準(zhǔn)確率均高于單獨(dú)使用SVM分類模型所得到的準(zhǔn)確率,并且波動(dòng)比較小,相對(duì)比較穩(wěn)定,這說(shuō)明遺傳優(yōu)化算法能對(duì)SVM中的核函數(shù)的參數(shù)進(jìn)行優(yōu)化并能提高分類器的性能。對(duì)于數(shù)據(jù)集A、C、E,經(jīng)過(guò)SAE堆棧所得到分類模型的準(zhǔn)確率不穩(wěn)定,并且在數(shù)據(jù)集A中得到的分類準(zhǔn)確率最低,因此深度學(xué)習(xí)網(wǎng)絡(luò)適用于解決大量樣本數(shù)據(jù)的分類問(wèn)題。
在齒輪箱的故障診斷中,常見(jiàn)的故障診斷只是針對(duì)于點(diǎn)蝕、磨損以及斷齒進(jìn)行故障診斷,本文針對(duì)齒輪箱4種工況下6類齒輪箱狀態(tài)樣本進(jìn)行診斷,得出如下結(jié)論:
(1)利用小波分解和樣本熵方法對(duì)信號(hào)數(shù)據(jù)進(jìn)行特征提取,能達(dá)到不同類別樣本具有較好區(qū)分度的目的。
(2)GA算法能對(duì)SVM的核函數(shù)參數(shù)和懲罰因子參數(shù)進(jìn)行優(yōu)化,將優(yōu)化后的參數(shù)值輸入SVM模型中能獲得較高的分類識(shí)別率,且準(zhǔn)確率均高于單獨(dú)使用SVM分類模型、BP神經(jīng)網(wǎng)絡(luò)模型、經(jīng)過(guò)SAE堆棧得到的深度學(xué)習(xí)模型,因此本文提出的方法適用于解決多工況下齒輪箱故障分類問(wèn)題。