何 強(qiáng) 唐向紅,,3 李傳江 陸見光,,3 陳家兌
1.貴州大學(xué)現(xiàn)代制造技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,貴陽,5500252.貴州大學(xué)機(jī)械工程學(xué)院,貴陽,5500253.貴州大學(xué)公共大數(shù)據(jù)國家重點(diǎn)實(shí)驗(yàn)室,貴陽,550025
在工業(yè)生產(chǎn)中,機(jī)械傳動(dòng)設(shè)備的安全運(yùn)行是工業(yè)生產(chǎn)過程中的核心要求,設(shè)備故障可能會(huì)導(dǎo)致嚴(yán)重的經(jīng)濟(jì)損失乃至災(zāi)難性事故。軸承作為機(jī)械傳動(dòng)裝置必不可少的零件,有必要對其進(jìn)行監(jiān)測與診斷。
軸承惡劣的工作環(huán)境(如負(fù)載不平衡、變負(fù)載、變轉(zhuǎn)速)對軸承可靠性診斷提出了挑戰(zhàn)。負(fù)載不平衡在軸承旋轉(zhuǎn)時(shí)會(huì)產(chǎn)生一個(gè)與轉(zhuǎn)速同頻的不平衡激勵(lì)力,從而引起軸承的不平衡振動(dòng),因此從負(fù)載不平衡軸承上測得的振動(dòng)信號具有非平穩(wěn)性特點(diǎn)[1],很難從中提取到有效特征用于故障診斷。短時(shí)傅里葉變換(short-time Fourier transform,STFT)作為時(shí)頻分析方法的一種,能夠有效處理非平穩(wěn)信號,目前在機(jī)械故障診斷中已得到了廣泛的應(yīng)用。HE等[2]利用LAMSTAR神經(jīng)網(wǎng)絡(luò)對經(jīng)過STFT預(yù)處理的傳感器信號進(jìn)行分類,實(shí)現(xiàn)了各種工況下軸承故障精確診斷;王麗華等[3]提出了一種基于短時(shí)傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的故障診斷方法,成功應(yīng)用于異步電動(dòng)機(jī)的故障診斷。由于軸承工作環(huán)境以及數(shù)據(jù)采集設(shè)備等原因,實(shí)際上采集到的軸承工作數(shù)據(jù)是有限的;同時(shí),由于軸承大多數(shù)時(shí)候都處于正常運(yùn)行狀態(tài),導(dǎo)致了其故障樣本更為稀少。上述方法雖然實(shí)現(xiàn)了機(jī)械設(shè)備故障的精確診斷,但是訓(xùn)練數(shù)據(jù)對基于深度學(xué)習(xí)的故障診斷方法有著較大影響,在小樣本、數(shù)據(jù)不平衡等情況下,其診斷性能會(huì)嚴(yán)重下降[4-5]。
2014年,GOODFELLOW等[6]提出了生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN),它在圖像生成方面具有顯著的能力。針對機(jī)械設(shè)備故障故障樣本量少、數(shù)據(jù)不平衡等問題,生成對抗網(wǎng)絡(luò)被引入故障診斷領(lǐng)域。文獻(xiàn)[4]提出了一種結(jié)合GAN和堆疊自動(dòng)編碼器(stacked denoising auto encoder,SDAE)的齒輪箱故障診斷方法,它在小樣本情況下依然具有較好的診斷效果;文獻(xiàn)[7]提出一種基于GAN的往復(fù)式機(jī)械故障診斷方法,它在數(shù)據(jù)極端失衡情況下依然有效;文獻(xiàn)[8]提出了一種小樣本條件下基于GAN的旋轉(zhuǎn)機(jī)械故障診斷方法。以上方法雖然在故障樣本生成方面具有一定的貢獻(xiàn),但依然缺乏以下兩點(diǎn)考慮:其一,大多數(shù)基于GAN的故障診斷方法單單針對時(shí)域信號或頻域信號,不能良好地利用振動(dòng)信號的頻域信息與時(shí)域信息;其二,GAN及其變種都是建立在圖像處理領(lǐng)域上的,基于一維信號的GAN故障診斷方法不能充分發(fā)揮出其圖像生成能力。
本文將STFT與梯度懲罰Wasserstein距離生成對抗網(wǎng)絡(luò)(WGAN-GP)相結(jié)合,通過STFT構(gòu)建軸承振動(dòng)信號的時(shí)頻譜圖,在充分利用振動(dòng)信號時(shí)域信息與頻域信息的同時(shí),更好地發(fā)揮WGAN-GP的圖像生成能力。此外,構(gòu)建自注意力卷積神經(jīng)網(wǎng)絡(luò)(SeCNN)以進(jìn)一步提高模型對不平衡負(fù)載的抗干擾能力。分析CUT-2實(shí)驗(yàn)平臺(tái)兩種負(fù)載不平衡軸承數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明該方法具有良好的魯棒性和泛化能力,且在小樣本條件下具有較好的故障診斷性能。
STFT變換是一種針對突變、非平穩(wěn)信號的時(shí)頻分析方法,通過STFT能夠?qū)⒁痪S的振動(dòng)信號轉(zhuǎn)變?yōu)榘瑫r(shí)域、頻域信息的二維矩陣。它的基本思想是:為時(shí)域信號加上具有固定長度的滑動(dòng)窗,并對窗內(nèi)的信號做傅里葉變換,得到窗長度這一時(shí)間段內(nèi)的局部頻譜,隨著窗口在信號上的平移,最終可以得到每一時(shí)間段上頻譜的集合。STFT的一般數(shù)學(xué)表達(dá)式為
(1)
式中,g(t-τ)為τ時(shí)刻的滑動(dòng)窗;f(t)為時(shí)域信號。
GAN網(wǎng)絡(luò)主要由生成器G與鑒別器D兩個(gè)模塊組成。生成器主要職能是接收已知分布的隨機(jī)噪聲z,并盡力輸出與真實(shí)樣本分布一致的假樣本G(z);鑒別器主要職能是接受混合有真實(shí)樣本與假樣本的數(shù)據(jù)集,并盡力從中辨別出真實(shí)樣本與假樣本。生成器與鑒別器通過不斷地博弈學(xué)習(xí)來提高各自擬合真實(shí)樣本的能力與鑒別真假樣本的能力。生成器與鑒別器在交替訓(xùn)練中達(dá)到納什均衡,其一般數(shù)學(xué)表達(dá)式為
(2)
式中,D(·)、G(·)分別為生成器與鑒別器的輸出值;x~Pdata(x)表示輸入樣本x的分布為Pdata(x);z~Pz(z)表示輸入噪聲z的分布為Pz(z);E[·]為期望函數(shù)。
由于JS散度導(dǎo)致了GAN訓(xùn)練不穩(wěn)定、模式崩塌等問題,故Wasserstein距離生成對抗網(wǎng)絡(luò)(Wasserstein generative adversarial network,WGAN)[9]引入了一種新的分布度量距離,即Wasserstein Distance,也叫做EM距離,定義為
(3)
式中,Ⅱ(p,q)表示分布p、q的聯(lián)合分布;(x,y)采樣自聯(lián)合分布r;Ε(x,y)~y[‖x-y‖]為距離‖x-y‖的期望;inf{·}表示集合的下確界;W(p,q)為分布p、q的Wasserstein距離。
WGAN從理論層面上分析了GAN訓(xùn)練不穩(wěn)定的原因,并有效解決了問題。然而,WGAN權(quán)重裁剪的實(shí)現(xiàn)方式存在兩個(gè)問題:其一,網(wǎng)絡(luò)的權(quán)重大部分都集中在兩端,這使得神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)變成了簡單的函數(shù)映射;其二,對網(wǎng)絡(luò)權(quán)重的強(qiáng)制裁剪容易造成梯度消失或梯度爆炸。為解決以上問題,WGAN-GP[10]被提了出來,采用增加梯度懲罰項(xiàng)的方式來迫使判別器滿足1-Lipschitz函數(shù)約束。同時(shí),將梯度值約束在1周圍時(shí)網(wǎng)絡(luò)的效果會(huì)更好,梯度懲罰項(xiàng)的定義為
(4)
相對于WGAN,WGAN-GP收斂速度更快,生成樣本質(zhì)量更好。
自注意力機(jī)制已成功應(yīng)用于語音識別[11]、圖像處理[12-13]等領(lǐng)域。本文將自注意力機(jī)制引入軸承故障診斷以進(jìn)一步提高故障診斷效率。自注意力機(jī)制的實(shí)現(xiàn)參考文獻(xiàn)[14]中的SE(Squeeze-and-Excitation)模塊。由于本文自注意力模塊是在網(wǎng)絡(luò)的全連接層后實(shí)現(xiàn)的,因此不需要額外的全局平均池化操作(Squeeze)。此外,在Excitation操作中多加入一層全連接層以進(jìn)一步加強(qiáng)自注意力機(jī)制對故障特征的非線性擬合能力。自注意力模塊實(shí)現(xiàn)如圖1所示。
圖1 自注意力模塊示意圖Fig.1 Schematic diagram of self-attention module
自注意力模塊一共有FC1、FC2、FC3三個(gè)全連接層,兩個(gè)ReLU激活函數(shù)和一個(gè) Sigmoid激活函數(shù)。首先,第一個(gè)全連接層將特征維度降到輸入特征維度(X-dim)的1/16,第二個(gè)全連接層將特征維度增加到X/4,再分別使用ReLU激活函數(shù);第三個(gè)全連接層將特征維度恢復(fù)到X,也就是輸入特征維度。通過這樣的設(shè)計(jì)可以提高自注意力模塊對振動(dòng)信號中復(fù)雜故障特征的非線性擬合能力。此外采用全連接層以及ReLU激活函數(shù)這樣的結(jié)構(gòu)可使參數(shù)量、計(jì)算量極小。然后使用Sigmoid激活函數(shù)對第三個(gè)全連接層的輸出進(jìn)行激活,這樣就得到了區(qū)間[0,1]的權(quán)重值。最后將權(quán)重值與輸入特征的元素按位相乘就實(shí)現(xiàn)了自注意力模塊。
針對軸承振動(dòng)信號易受負(fù)載不平衡干擾、故障樣本數(shù)量少等問題,提出基于WGAN-GP和SeCNN的故障診斷方法。診斷過程如下:首先對軸承振動(dòng)信號進(jìn)行短時(shí)傅里葉變換,得到信號的時(shí)頻譜圖,分為訓(xùn)練集、驗(yàn)證集、測試集;然后將訓(xùn)練集輸入到WGAN-GP中進(jìn)行對抗訓(xùn)練,直至網(wǎng)絡(luò)收斂,從生成器中生成與訓(xùn)練樣本分布相似的新樣本,將新樣本添加到訓(xùn)練集中以擴(kuò)充訓(xùn)練集;最后,將擴(kuò)充后的訓(xùn)練集輸入到SeCNN中進(jìn)行訓(xùn)練,并將訓(xùn)練好的模型應(yīng)用于測試集,輸出故障識別結(jié)果。診斷流程見圖2。
圖2 基于WGAN-GP和SeCNN的軸承故障診斷流程圖Fig.2 Flow chart of bearing fault diagnosis basedon WGAN-GP and SeCNN
實(shí)際工業(yè)中收集足夠的軸承故障數(shù)據(jù)是比較困難的,因此將少數(shù)樣本的時(shí)頻譜作為WGAN-GP的真實(shí)樣本,訓(xùn)練WGAN-GP并生成與真實(shí)樣本分布相似的時(shí)頻譜樣本?;赪GAN-GP模型生成的高質(zhì)量時(shí)頻譜樣本能夠進(jìn)一步豐富原始數(shù)據(jù)集、提高診斷模型的魯棒性,從而有助于實(shí)現(xiàn)軸承故障的精確診斷。WGAN-GP模型結(jié)構(gòu)示意圖見圖3。
圖3 WGAN-GP示意圖Fig.3 Schematic diagram of WGAN-GP
生成器的輸入為隨機(jī)噪聲z,它采樣自區(qū)間為[-1,1]上的均勻分布;生成器的輸出為合成樣本G(z),其分布與真實(shí)樣本X分布相似。鑒別器的輸入為真實(shí)樣本X或合成樣本G(z),輸出為線性函數(shù)值y。因?yàn)榫矸e運(yùn)算在特征提取上的能力已被證明,所以本文模型WGAN-GP的鑒別器和生成器主要由卷積與轉(zhuǎn)置卷積構(gòu)成。生成器與鑒別器網(wǎng)絡(luò)詳細(xì)結(jié)構(gòu)圖見圖4。
(a)生成器
在生成器G中,輸入為符合均勻分布的隨機(jī)噪聲z,噪聲維度為200。該輸入先經(jīng)過全連接層F1擴(kuò)維,然后將數(shù)據(jù)重組為三維張量并使用LeakyReLU[15]激活函數(shù),最后通過三層轉(zhuǎn)置卷積操作生成大小為(65,65,1)的張量,也就是生成的時(shí)頻譜樣本,其中前兩層轉(zhuǎn)置卷積均采用批量歸一化。第一層轉(zhuǎn)置卷積的卷積核個(gè)數(shù)為256,大小為3,步長為3,LeakyReLU作為激活函數(shù);第二層轉(zhuǎn)置卷積的卷積核個(gè)數(shù)為128,大小為5,步長為2,LeakyReLU作為激活函數(shù);第三層轉(zhuǎn)置卷積的卷積核個(gè)數(shù)為1,大小為5,步長為3,使用Tanh激活函數(shù)。
在鑒別器D中,一共3個(gè)卷積層,卷積核大小均為4,步長均為2,卷積核個(gè)數(shù)分別為64、128、256,均將LeakyReLU作為激活函數(shù);最后一層為全連接層,節(jié)點(diǎn)個(gè)數(shù)為1,不使用激活函數(shù)。
在訓(xùn)練WGAN-GP時(shí)可以用鑒別器的loss值來指示模型訓(xùn)練進(jìn)度,鑒別器的loss值越趨向于收斂就代表模型訓(xùn)練得越好,生成的樣本質(zhì)量越高。鑒別器的loss值定義如下:
(5)
在WGAN-GP訓(xùn)練中,基于上述損失函數(shù),迭代更新模型參數(shù)。采用Adam[16]優(yōu)化器,鑒別器學(xué)習(xí)率為0.0001,生成器學(xué)習(xí)率為0.0002,兩者交替訓(xùn)練直至鑒別器loss值收斂。
本文提出的基于自注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)(SeCNN)旨在減小不平衡負(fù)載對數(shù)據(jù)的影響、提高模型的軸承故障特征提取能力,進(jìn)而實(shí)現(xiàn)軸承故障抗干擾診斷。SeCNN的輸入為混合了真實(shí)時(shí)頻譜樣本和生成時(shí)頻譜樣本的訓(xùn)練集,通過驗(yàn)證集識別準(zhǔn)確率指示SeCNN模型的訓(xùn)練進(jìn)度,最后將訓(xùn)練好的SeCNN模型用于測試集識別,并輸出識別結(jié)果。本文提出的SeCNN模型主要由最大池化層、卷積層以及自注意力模塊組成,SeCNN結(jié)構(gòu)圖見圖5。
圖5 SeCNN模型結(jié)構(gòu)圖Fig.5 SeCNN model structure diagram
在SeCNN中,卷積層CONV1和CONV2的卷積核大小均為3,步長均為1,卷積核個(gè)數(shù)分別為32、64,使用ReLU激活函數(shù);池化層MaxP1和MaxP2的窗口大小均為2,步長均為2;GAP1為全局平均池化層;F1為全連接層,節(jié)點(diǎn)數(shù)為2048;輸出層節(jié)點(diǎn)數(shù)為輸入樣本的類別數(shù)n,采用Softmax激活函數(shù)。
為了驗(yàn)證本文所提方法的有效性,針對軸承實(shí)測的振動(dòng)信號,分析該方法在軸承負(fù)載不平衡和小樣本情況下的魯棒性和泛化能力。
軸承實(shí)驗(yàn)數(shù)據(jù)來源于CUT-2軸承實(shí)驗(yàn)平臺(tái),平臺(tái)如圖6所示。實(shí)驗(yàn)軸承型號為6900ZZ,使用電火花加工技術(shù)分別在軸承外圈、滾珠、內(nèi)圈加工直徑為0.2 mm和0.3 mm的故障,單點(diǎn)故障以及復(fù)合故障如圖7所示。使用加速度傳感器采集軸承振動(dòng)信號,采樣頻率10 kHz,軸承轉(zhuǎn)速3000 r/min。軸承不平衡負(fù)載的構(gòu)建分為兩種:第一種為加裝負(fù)載在負(fù)載盤上單點(diǎn)連續(xù)分布;第二種為加裝負(fù)載在負(fù)載盤上半盤均勻分布。每種軸承負(fù)載不平衡條件下采集12類故障,包含單點(diǎn)故障以及復(fù)合故障。每類故障采集200個(gè)樣本,樣本長度為1024,按照2∶1∶1把數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測試集,具體的數(shù)據(jù)集信息如表1所示。同時(shí)設(shè)定短時(shí)傅里葉變換的窗函數(shù)長度為128,窗函數(shù)重疊點(diǎn)數(shù)為112,每個(gè)樣本對應(yīng)生成的時(shí)頻譜圖尺寸為65×65。
圖6 CUT-2軸承實(shí)驗(yàn)平臺(tái)Fig.6 CUT-2 bearing test platform
(a)外圈故障 (b)內(nèi)圈故障 (c)球體故障 (d)復(fù)合故障圖7 軸承故障的位置Fig.7 Location of the bearing faults
表1 CUT-2平臺(tái)軸承數(shù)據(jù)集
使用第一種負(fù)載不平衡軸承數(shù)據(jù)訓(xùn)練集對所提出的WGAN-GP模型進(jìn)行訓(xùn)練。訓(xùn)練輪數(shù)設(shè)為2000,模型批處理樣本數(shù)目為10,每類故障生成的時(shí)頻譜樣本數(shù)量預(yù)設(shè)定100,訓(xùn)練集做區(qū)間為[-1,1]的歸一化處理?;谏疃葘W(xué)習(xí)框架Tensorflow進(jìn)行模型的搭建與訓(xùn)練,記錄鑒別器loss的值并獲得合成樣本,實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 鑒別器loss變化曲線Fig.8 Loss variation curve of discriminator
由圖8可以看出,最初鑒別器loss值由大幅振蕩迅速趨向于收斂但隨后又出現(xiàn)小幅振蕩,說明此時(shí)模型正處于學(xué)習(xí)階段,并沒有找到最優(yōu)解方向。經(jīng)過15 000次迭代后,鑒別器loss值小幅波動(dòng)并趨向于平穩(wěn),說明此時(shí)WGAN-GP已經(jīng)得到了很好的訓(xùn)練,生成器合成的時(shí)頻譜樣本分布已經(jīng)很接近故障樣本分布。待模型訓(xùn)練完畢后,從生成器獲得合成的時(shí)頻譜樣本。表2展示了傳感器獲取的故障標(biāo)簽為1~6的真實(shí)樣本及其時(shí)頻譜圖和對應(yīng)生成器合成的時(shí)頻譜樣本。由表2可以看出,合成的時(shí)頻譜圖與真實(shí)時(shí)頻譜圖很相似但又不完全相同,這說明模型既有效學(xué)習(xí)到故障特征,又保證了合成樣本的高質(zhì)量、多樣性。
表2 真實(shí)樣本及其時(shí)頻譜圖與合成樣本時(shí)頻譜圖
SeCNN采用Adam優(yōu)化器更新模型參數(shù),學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練輪數(shù)設(shè)置為100,批處理樣本數(shù)目為10。雖然訓(xùn)練輪數(shù)設(shè)置為100,但是本文在SeCNN的訓(xùn)練過程中引入了Early-Stopping機(jī)制,在一定訓(xùn)練輪數(shù)內(nèi),如果模型的驗(yàn)證集的準(zhǔn)確率沒有提高,則停止訓(xùn)練并保存模型參數(shù)。訓(xùn)練集準(zhǔn)確率及驗(yàn)證集準(zhǔn)確率變化曲線見圖9。由圖9可以看出,模型在第59輪時(shí)就達(dá)到了停止條件,訓(xùn)練集準(zhǔn)確率與驗(yàn)證集準(zhǔn)確率趨向于重合,這說明模型被訓(xùn)練良好,且沒有出現(xiàn)過擬合現(xiàn)象。
圖9 訓(xùn)練集及驗(yàn)證集準(zhǔn)確率變化曲線Fig.9 Accuracy change curve of training set andverification set
為了進(jìn)一步評估合成樣本的質(zhì)量以及合成樣本數(shù)量對SeCNN模型學(xué)習(xí)的影響,每類故障分別生成100、200、500、1000個(gè)樣本,將生成的樣本與初始訓(xùn)練集混合組成新的訓(xùn)練集輸入到SeCNN中,并將訓(xùn)練好的SeCNN模型應(yīng)用于測試集。為了避免實(shí)驗(yàn)結(jié)果受隨機(jī)因素的影響,每次測試均進(jìn)行10次重復(fù)性實(shí)驗(yàn),計(jì)算出模型的平均準(zhǔn)確率及其標(biāo)準(zhǔn)差,實(shí)驗(yàn)結(jié)果如表3所示。表3中,實(shí)驗(yàn)方法SeCNN表示沒有向訓(xùn)練集中添加合成樣本,SeCNN_100、SeCNN_200、SeCNN_500、SeCNN_1000表示向訓(xùn)練集每類故障分別添加100、200、500、1000個(gè)合成樣本。
由表3可以看出,當(dāng)向訓(xùn)練集每類故障添加合成樣本的數(shù)量達(dá)到500個(gè)時(shí),SeCNN平均準(zhǔn)確率達(dá)到了94.23%,相較于沒有添加合成樣本的SeCNN來說其平均準(zhǔn)確率提高了3.01%,準(zhǔn)確率標(biāo)準(zhǔn)差更是減小了82%,充分說明了通過WGAN-GP合成樣本的高質(zhì)量、多樣性以及對故障診斷模型性能的有效提高。值得一提的是,SeCNN_1000相較于SeCNN_500,平均準(zhǔn)確率雖然只提高了0.19%,但是其準(zhǔn)確率標(biāo)準(zhǔn)差卻減小了81.13%,這說明了大數(shù)據(jù)對基于深度學(xué)習(xí)的故障診斷模型的泛化能力以及穩(wěn)定性具有顯著提高作用。
表3 生成不同樣本的數(shù)量對模型SeCNN的影響
為了進(jìn)一步驗(yàn)證本文基于短時(shí)傅里葉變換的WGAN-GP+SeCNN軸承故障診斷方法的有效性,將其與CNN以及文獻(xiàn)[3]、文獻(xiàn)[17]、文獻(xiàn)[18]中算法共四種算法進(jìn)行對比。其中CNN是不帶自注意力模塊的SeCNN,輸入為時(shí)頻譜圖,其他參數(shù)與SeCNN保持一致。每種算法進(jìn)行10次重復(fù)性實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表4所示。
表4 第一種軸承負(fù)載不平衡下不同算法實(shí)驗(yàn)結(jié)果
由表4可以看出,文獻(xiàn)[17]與文獻(xiàn)[18]提出的基于一維振動(dòng)信號的故障診斷算法對負(fù)載不平衡下的軸承數(shù)據(jù)集診斷精度較低,不能有效識別出各種故障。其中文獻(xiàn)[17]的診斷精度只有10.27%,這可能是由于其卷積核設(shè)置過大,不能有效學(xué)習(xí)到故障局部特征所致;通過查看其訓(xùn)練過程發(fā)現(xiàn)訓(xùn)練集準(zhǔn)確率已經(jīng)達(dá)到100%,但是驗(yàn)證集卻只有10%左右,說明該模型已經(jīng)出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象。文獻(xiàn)[18]雖然診斷精度相對于文獻(xiàn)[17]有所提高,但是該算法是基于一維時(shí)域信號的故障診斷方法,丟失了信號的頻域信息;其次,批處理大小設(shè)置為64,在樣本量較小時(shí)不能發(fā)揮出算法的性能,所以文獻(xiàn)[18]的診斷精度依然較低。文獻(xiàn)[3]與算法CNN+STFT都是基于短時(shí)傅里葉變換的故障診斷方法,其診斷精度相較于基于一維振動(dòng)信號的故障診斷方法有了很大提高,這說明短時(shí)傅里葉變換能很好地應(yīng)對非平穩(wěn)信號,且時(shí)頻域信息的樣本在提高數(shù)據(jù)量的同時(shí)對模型性能也有較大提高。此外,由表4算法SeCNN的實(shí)驗(yàn)結(jié)果可以看出,相對于沒有自注意力機(jī)制的CNN+STFT以及文獻(xiàn)[3]來說,其診斷精度有了一定提高,這說明自注意力模塊在抑制噪聲權(quán)重、提高故障特征權(quán)重方面具有比較明顯的作用。本文方法相較于其他主流故障診斷方法具有較大優(yōu)勢,相較于文獻(xiàn)[3]與算法CNN+STFT的故障診斷方法其準(zhǔn)確率提高了4%以上,準(zhǔn)確率標(biāo)準(zhǔn)差減少了95%以上,驗(yàn)證了本文方法在軸承負(fù)載不平衡下基于小樣本數(shù)據(jù)的故障診斷具有可行性。
為了說明本文方法在處理軸承負(fù)載不平衡問題時(shí)的優(yōu)越性,將負(fù)載平衡軸承數(shù)據(jù)輸入到不同故障診斷算法中進(jìn)行訓(xùn)練與測試,實(shí)驗(yàn)結(jié)果如表5所示。
表5 軸承負(fù)載平衡下不同算法實(shí)驗(yàn)結(jié)果
由表5可以看出,文獻(xiàn)[17]的平均識別率幾乎沒有變化,說明該算法沒有學(xué)習(xí)到故障特征,造成了模型的隨機(jī)分類,這與前文的分析一致。文獻(xiàn)[18]的平均準(zhǔn)確率在移除負(fù)載不平衡的影響后反而下降了,說明影響該算法的主要因素是數(shù)據(jù)量,較小的樣本量造成了模型的不穩(wěn)定。算法CNN+STFT與文獻(xiàn)[3]在負(fù)載平衡下不僅平均準(zhǔn)確率得到了提高并且準(zhǔn)確率標(biāo)準(zhǔn)差也減小了86%左右,這說明在移除負(fù)載不平衡的影響后普通算法的診斷性能與穩(wěn)定性都得到了提高。對照表4與表5可以看出,本文方法在負(fù)載平衡下與負(fù)載不平衡下的診斷性能相近,這說明該方法對負(fù)載不平衡具有較好的魯棒性。
為了進(jìn)一步驗(yàn)證軸承負(fù)載不平衡下本文方法的魯棒性與泛化能力,對第二種負(fù)載不平衡軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)與分析。使用軸承訓(xùn)練集對WGAN-GP進(jìn)行訓(xùn)練,通過實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)訓(xùn)練輪數(shù)達(dá)到5000時(shí),模型鑒別器的loss值處于收斂狀態(tài),因此確定訓(xùn)練輪數(shù)為5000。將本文方法與其他四種故障診斷方法進(jìn)行對比,所有配置與前文保持一致,每種模型進(jìn)行10次重復(fù)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表6所示。
表6 第二種軸承負(fù)載不平衡下不同算法實(shí)驗(yàn)結(jié)果
由表6可以看出,本文方法相較于其他四種算法具有明顯優(yōu)勢,故障識別平均準(zhǔn)確率達(dá)到了94.58%,能夠有效分辨出軸承負(fù)載不平衡下的復(fù)合故障與單點(diǎn)故障,證明了該方法具有良好的魯棒性與泛化性能。
(1)將振動(dòng)信號通過短時(shí)傅里葉變換轉(zhuǎn)為時(shí)頻譜能夠充分利用的時(shí)域與頻域信息,并且時(shí)頻譜樣本方便生成對抗網(wǎng)絡(luò)(GAN)處理,可更好地發(fā)揮其生成圖像的優(yōu)勢。
(2)利用梯度懲罰Wasserstein距離生成對抗網(wǎng)絡(luò)(WGAN-GP)生成時(shí)頻譜樣本,豐富了數(shù)據(jù)集,可以有效提高基于深度學(xué)習(xí)的故障診斷模型的泛化能力和魯棒性。
(3)基于自注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)在面對負(fù)載不平衡條件下的軸承時(shí),其故障診斷能力相較于普通卷積神經(jīng)網(wǎng)絡(luò)有了較大提高,說明將自注意力機(jī)制引入到故障診斷領(lǐng)域中具有可行性。