張曉鋒, 郝如江, 段澤森, 夏晗鐸, 程 旺
(石家莊鐵道大學(xué)機械工程學(xué)院,河北 石家莊 050043)
齒輪箱是旋轉(zhuǎn)機械的關(guān)鍵部件,而旋轉(zhuǎn)機械的機械故障約30%是由齒輪箱發(fā)生故障引起的[1]。而對機械設(shè)備進(jìn)行定期的故障診斷之后,可以將事故的發(fā)生率減少75%,維修的費用也可以降低25%~50%[2]。伴隨著深度學(xué)習(xí)的快速發(fā)展,科研人員逐漸將淺層的機器學(xué)習(xí)方法應(yīng)用到旋轉(zhuǎn)機械的故障診斷之中,常見的有支持向量機、深度置信網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等故障分類方法或模型。殘差網(wǎng)絡(luò)(Residual Neural Network,ResNet)作為卷積神經(jīng)網(wǎng)絡(luò)的一種優(yōu)異模型,在圖像識別領(lǐng)域等二維信息之間應(yīng)用廣泛,本文對其進(jìn)行改進(jìn)使其具有良好的抗噪能力,以剔除具體工業(yè)環(huán)境下噪聲的干擾,以利于機械故障診斷。
當(dāng)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)較深時,模型難以直接擬合實際映射H(x),于是殘差網(wǎng)絡(luò)引入了x這一恒等映射,將問題轉(zhuǎn)換為擬合殘差映射F(x),只需最小化殘差函數(shù)F(x)=H(x)-x來逼近實際映射,以此來解決網(wǎng)絡(luò)在加深時特征丟失這一問題。在殘差網(wǎng)絡(luò)中,假設(shè)有L個殘差塊在進(jìn)行堆疊連接,其中xl表示為第l個殘差塊的輸入,那么x(l+1)就表示第l個殘差塊的輸出,同時也是第(l+1)個殘差塊的數(shù)據(jù)輸入。由此可推導(dǎo)第L個殘差塊的輸出為:
(1)
可以發(fā)現(xiàn),在殘差網(wǎng)絡(luò)中第L層的特征是各個殘差塊特征的累和,殘差網(wǎng)絡(luò)不斷地學(xué)習(xí)每個殘差塊的特征,又因為訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)常用的算法是反向傳播算法,假設(shè)該神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為ε,那么網(wǎng)絡(luò)的第l個殘差塊梯度計算公式如式(2)所示:
(2)
通常是設(shè)置數(shù)值確定的閾值以去除冗余噪聲,閾值在很多降噪中都有應(yīng)用,其公式如式(3)所示,x代表輸入數(shù)據(jù),τ為閾值,即將閾值[-τ,τ]區(qū)間內(nèi)的特征置為0,讓距0較遠(yuǎn)的特征趨向0收縮。
(3)
本文基于深度殘差網(wǎng)絡(luò),利用注意力機制對閾值進(jìn)行改進(jìn),使網(wǎng)絡(luò)根據(jù)數(shù)據(jù)本身自動生成相對應(yīng)的閾值來消除噪聲,每組數(shù)據(jù)都可以根據(jù)樣本自身的重要程度不同,進(jìn)行獨特的特征通道加權(quán)調(diào)整[3]。該自適應(yīng)閾值的生成過程如圖1虛線框內(nèi)所示,數(shù)據(jù)先經(jīng)過權(quán)值均值池化處理,而后經(jīng)過批量歸一化與激活層,用sigmoid函數(shù)使輸出映射到[0,1]之內(nèi),該映射縮放系數(shù)記為α,最終的閾值可以表示為α×A,則不同的樣本對應(yīng)不同的閾值。將自適應(yīng)閾值塊加入到殘差網(wǎng)絡(luò)中改進(jìn)為殘差收縮模塊(Residual Shrinkage Network Block),稱其為RSNB模塊,從而達(dá)到剔除或減弱噪聲的目的。
圖1 RSNB模型
由于全連接層是將卷積層展開,然后對每個feature map分類,這樣的參數(shù)計算量巨大,往往全連接層的參數(shù)計算量占據(jù)了網(wǎng)絡(luò)總參數(shù)計算量的大部分,使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度非常慢。為解決訓(xùn)練速度慢的問題將全局均值池化引入到網(wǎng)絡(luò)中,全局平均池化是直接將每個通道的feature map做平均值處理,即一個feature map輸出一個值,然后將結(jié)果輸入到softmax來進(jìn)行分類。在識別任務(wù)中,全局平均池化能夠為最后的卷積層中的每一個特定的類別生成一個feature map(有多少個類就產(chǎn)生多少個feature map)。
如圖2所示,GAP加入到原來的FC層,其所需要計算的參數(shù)大大減少,這很大程度的提升了網(wǎng)絡(luò)的計算速度; GAP不需要像FC層那樣大量的訓(xùn)練調(diào)優(yōu)參數(shù),如此避免了過擬合問題。GAP匯總了空間信息,因此對輸入的空間轉(zhuǎn)換更為魯棒。為驗證GAP層對網(wǎng)絡(luò)訓(xùn)練時間的影響,本文在CPU版本為intel 5十代、運行環(huán)境為TensorFlow1.19 下進(jìn)行實驗,得到實驗結(jié)果如表1所示。
圖2 GAP結(jié)構(gòu)
表1 訓(xùn)練時間對比s
通過對比,GAP層確實可以很大程度上提高模型訓(xùn)練的速度,因此決定在改進(jìn)的殘差收縮網(wǎng)絡(luò)中加入該層來加快網(wǎng)絡(luò)模型的訓(xùn)練。
RSNB模塊改進(jìn)后的網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示,故障數(shù)據(jù)輸入后先經(jīng)過兩個卷積層,而后輸入到第一個殘差收縮模塊(RSNB1)中,殘差收縮模塊引入了批量歸一化層(BN層)與ReLU激活函數(shù)。BN層可以減小訓(xùn)練數(shù)據(jù)的梯度差異,從而提升網(wǎng)絡(luò)的泛化能力;ReLU激活函數(shù)增加了神經(jīng)網(wǎng)絡(luò)各層之間的非線性關(guān)系,節(jié)約大量計算,緩解過擬合現(xiàn)象,進(jìn)而提高故障診斷效果;再將之前的Identity與之相加,再進(jìn)入后續(xù)的池化層來減少網(wǎng)絡(luò)參數(shù),而后通過第二個殘差收縮模塊(RSNB2),最后通過Dense層來進(jìn)行分類。
圖3 改進(jìn)后的殘差網(wǎng)絡(luò)結(jié)構(gòu)
本文的實驗數(shù)據(jù)來自于動力傳動故障診斷綜合實驗臺(DDS實驗臺)。DDS實驗臺主要由電機、兩級傳動變速箱、扭矩控制器和磁粉制動器組成。
本實驗主要針對平行軸齒輪箱進(jìn)行故障研究,信號采集實驗將驅(qū)動電機轉(zhuǎn)頻設(shè)為35 Hz,信號采集頻率設(shè)為12.8 kHz。本文設(shè)置了8種齒輪箱狀態(tài),包括7種故障類型與1種正常類型,具體齒輪箱零件狀態(tài)如圖4所示。
圖4 齒輪箱零件狀態(tài)
為驗證改進(jìn)后網(wǎng)絡(luò)模型的抗噪效果,分別使用目前比較先進(jìn)的幾種網(wǎng)絡(luò)模型在有隨機噪聲和無隨機噪聲兩種數(shù)據(jù)下進(jìn)行實驗,分別為CNN、ResNet和本文提出的RSNB三種網(wǎng)絡(luò)模型。8種狀態(tài)類型,每種類型選取1 536×250個樣本點,共選取了1 536×2 000個點作為樣本數(shù)據(jù),其中1 536×1 600個點為訓(xùn)練集,1 536×400個點為測試集。將強度為-2 dB的隨機噪聲加入與無隨機噪聲狀態(tài)測試相同的數(shù)據(jù)分別輸入到CNN、ResNet、RSNB三個網(wǎng)絡(luò)中,迭代次數(shù)與無噪聲狀態(tài)下相同。兩種條件下的故障診斷準(zhǔn)確率對比結(jié)果如表2所示。
表2 三種網(wǎng)絡(luò)故障診斷正確率對比 %
在無噪聲情況下CNN、ResNet和本文提出的RSNB表現(xiàn)相差不大,而在數(shù)據(jù)中加入噪聲后CNN、ResNet網(wǎng)絡(luò)的性能急劇下降,而RSNB網(wǎng)絡(luò)可以很好的剔除噪聲對網(wǎng)絡(luò)模型的干擾。RSNB網(wǎng)絡(luò)訓(xùn)練期間正確率與損失的變化如圖5所示,在迭代次數(shù)達(dá)到105次左右時,分類準(zhǔn)確率與損失值能夠收斂并且保持穩(wěn)定,沒有發(fā)生過擬合現(xiàn)象,網(wǎng)絡(luò)的分類準(zhǔn)確率能夠達(dá)到99.7%,表明所構(gòu)建的網(wǎng)絡(luò)模型在有噪聲的情況下也可以保持良好的學(xué)習(xí)能力。
圖5 RSNB訓(xùn)練正確率與訓(xùn)練損失變化
為驗證RSNB的抗噪性能,測試三種網(wǎng)絡(luò)在不同信噪比下的故障診斷準(zhǔn)確率結(jié)果(如圖6所示),發(fā)現(xiàn)總體而言隨著數(shù)據(jù)信噪比的降低,故障診斷的效果出現(xiàn)下降,在信噪比為-6 dB的時候,RSNB模型的診斷精度為84%,而ResNet網(wǎng)絡(luò)、CNN網(wǎng)絡(luò)的故障診斷精度分別為61.1%、33.2%,低于RSNB網(wǎng)絡(luò)的診斷精度。而當(dāng)信噪比較大時,說明數(shù)據(jù)中的噪聲強度對網(wǎng)絡(luò)性能的影響變小,RSNB網(wǎng)絡(luò)與ResNet網(wǎng)絡(luò)都有不錯的診斷效果。
圖6 不同信噪比準(zhǔn)確率
(1)將殘差模塊加入到傳統(tǒng)CNN中進(jìn)行訓(xùn)練,降低了在層數(shù)加深時特征丟失嚴(yán)重的問題,使網(wǎng)絡(luò)可以學(xué)習(xí)到更多的數(shù)據(jù)特征,從而可以達(dá)到加深網(wǎng)絡(luò)進(jìn)而提升網(wǎng)絡(luò)性能的目的。
(2)將注意力機制與軟閾值化應(yīng)用到到網(wǎng)絡(luò)中,針對在復(fù)雜工況下的噪聲問題設(shè)計自適應(yīng)閾值塊(RSNB)來進(jìn)行處理,使神經(jīng)網(wǎng)絡(luò)根據(jù)不同的噪聲特征來學(xué)習(xí)生成相應(yīng)的閾值,實驗結(jié)果表明自適應(yīng)閾值塊具有良好的降噪效果。
(3)在高強度噪聲情況下,RSNB故障診斷性能明顯優(yōu)于其他網(wǎng)絡(luò)模型,在中低等噪聲強度下具有很高的故障診斷精度。
為了提高RSNB網(wǎng)絡(luò)的魯棒性,還需要采集不同實驗臺上的數(shù)據(jù)來進(jìn)行模型的訓(xùn)練,并且根據(jù)不同的數(shù)據(jù)選取合適的激活函數(shù)以及網(wǎng)絡(luò)參數(shù),探究網(wǎng)絡(luò)在其他類型故障診斷的應(yīng)用及改進(jìn)。