趙志宏,李春秀,楊紹普,張然
(1.石家莊鐵道大學(xué) 信息科學(xué)與技術(shù)學(xué)院,石家莊 050043;2.省部共建交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國家重點實驗室,石家莊 050043)
軸承是機械設(shè)備中的關(guān)鍵部件,設(shè)備性能與軸承工作狀態(tài)息息相關(guān),而軸承運行狀態(tài)極易受到惡劣工作環(huán)境和工作時間的影響。據(jù)統(tǒng)計,旋轉(zhuǎn)機械中的故障大約有30%與軸承有關(guān)[1],因此,軸承故障診斷一直是研究的熱點問題。故障診斷方法利用短時傅里葉變換[2-4]、經(jīng)驗?zāi)B(tài)分解[5]、小波變換[6]等算法提取軸承故障特征,再結(jié)合模式識別方法進行故障診斷[7]。如文獻[8]利用希爾伯特-黃變換分析軸承振動信號并通過傅里葉變換提取故障特征;文獻[9]利用集合經(jīng)驗?zāi)B(tài)分解處理軸承振動信號,將得到的樣本熵作為故障特征并通過支持向量機進行故障分類。
近年來,隨著深度學(xué)習的快速發(fā)展,越來越多學(xué)者將深度學(xué)習應(yīng)用于機械設(shè)備故障診斷中:基于堆疊式自動編碼器[10]、卷積膠囊網(wǎng)絡(luò)[11]、改進堆疊式循環(huán)網(wǎng)絡(luò)[12]的滾動軸承故障診斷方法均取得了良好的效果;文獻[13]利用譜峭度圖包含的時頻能量特性對滾動軸承振動信號進行編碼并將特征圖輸入卷積神經(jīng)網(wǎng)絡(luò)完成故障分類;文獻[14]利用格拉姆角差場方法對軸承振動信號進行圖像轉(zhuǎn)換后將其輸入卷積神經(jīng)網(wǎng)絡(luò),獲得較高的診斷準確率;文獻[15]將軸承振動信號進行短時傅里葉變換得到時頻譜后輸入卷積神經(jīng)網(wǎng)絡(luò)進行故障診斷,取得了99%以上的故障識別率。
為取得更高的故障識別率,深度神經(jīng)網(wǎng)絡(luò)模型朝著越來越復(fù)雜的方向發(fā)展,但大而復(fù)雜的模型難以應(yīng)用在真實場景或移動設(shè)備中,因此小而高效的神經(jīng)網(wǎng)絡(luò)模型具有非常高的研究價值。目前,常用的輕量級網(wǎng)絡(luò)模型有MobileNet[16],SqueezeNet[17],Xception[18]和ShuffleNet[19]。在模型大小相同的條件下,ShuffleNet 的準確率優(yōu)于MobileNet。ShuffleNet V1主要采用分組卷積和深度可分離卷積來降低模型的參數(shù)量以及運算量,但是過多的分組卷積會導(dǎo)致內(nèi)存使用量增加;ShuffleNet V2[20]去掉了分組卷積,設(shè)計了Channel Split操作,在提高模型準確率的同時降低了運算量,但模型結(jié)構(gòu)中仍存在參數(shù)冗余和空間信息丟失的問題?;谝陨峡紤],本文提出一種改進的ShuffleNet V2軸承故障診斷方法,通過去掉ShuffleNet V2基本單元中的一層1×1卷積對模型進行簡化,并用空洞卷積替換基本單元中的深度卷積,擴大模型特征提取的感受野,從而提高軸承故障特征提取能力。
對于任意的L2(R)空間中的函數(shù)f(t),其連續(xù)小波變換定義為
fCWT(a,τ)=[f(t),ψa,τ(t)]=
(1)
式中:a為與頻率相關(guān)的尺度因子;τ為平移因子;ψa,τ(t)為小波基函數(shù)。
連續(xù)小波變換的關(guān)鍵在于小波基函數(shù)的選取,Morlet小波是一種指數(shù)衰減的余弦信號,與沖擊衰減波形的軸承振動信號匹配性較好[21-24],文獻[25]利用相關(guān)系數(shù)度量小波函數(shù)與軸承沖擊成分的相似性,與5種常用小波函數(shù)的對比結(jié)果表明Morlet小波最適用于軸承振動信號的分析,能更好地提取軸承故障特征。本文在Morlet小波的基礎(chǔ)上,選擇其復(fù)數(shù)形式的CMOR小波,以獲取更好的自適應(yīng)性能[26],對軸承故障振動信號進行時頻轉(zhuǎn)換。
ShuffleNet V2模型中采用了3×3深度可分離卷積,其計算量比3×3的標準卷積約少88%,而精度只有很小的損失[27]。深度可分離卷積由深度卷積和1×1逐點卷積兩部分組成,深度卷積將單個固定大小的卷積核作用到每個輸入通道上,1×1卷積將深度卷積輸出的特征進行合并,在不改變輸出特征圖大小的條件下增強網(wǎng)絡(luò)表達能力。
空洞卷積也稱膨脹卷積[28],是在標準卷積核中注入空洞,將小卷積核尺寸變大的同時保持卷積的參數(shù)量不變,擴大的幅度稱為空洞率。標準卷積是空洞率為1的卷積,空洞率為2的卷積與標準卷積的對比如圖1所示:3×3卷積在空洞率為2的樣本特征映射與5×5標準卷積類似,在不增加參數(shù)量的基礎(chǔ)上擴大了感受野,從而獲取更大范圍內(nèi)的特征信息。
(a)空洞卷積
ShuffleNet V2主要由2種基本單元堆疊而成[20],基本單元結(jié)構(gòu)如圖2所示:步長為1的基本單元中,輸入數(shù)據(jù)按照通道數(shù)一分為二,進入2個分支,右分支通過2層1×1卷積和3×3深度卷積進行特征提取,之后與左分支輸入進行通道級聯(lián)合并兩部分數(shù)據(jù),再通過通道混洗(Channel Shuffle,CS)均勻地打亂信息的順序;步長為2的基本單元主要進行降采樣操作,相比步長為1的基本單元,其取消了通道分開步驟并在左分支部分增加了1×1卷積和3×3深度卷積,使輸出通道的數(shù)目增加了一倍,特征圖大小減半。在基本單元中,卷積操作之后均采用Batch Normalization(BN)層加快網(wǎng)絡(luò)收斂速度,在1×1卷積之后還采用了Relu函數(shù)增加模型的非線性特征。
(a)步長為1
改進的ShuffleNet V2基本單元如圖3所示,與原模型相比,改進的基本單元去掉了右分支中最后的1×1卷積,并將步長為2單元中的3×3深度卷積替換為空洞率為2的空洞卷積,原因如下:
(a)步長為1
1)深度可分離卷積中,1×1卷積作用是融合通道間的信息,ShuffleNet V2基本單元右分支中有2層1×1卷積,去掉一層1×1卷積仍然可以實現(xiàn)信息融合,但可以減少模型參數(shù)量,提升模型泛化能力。
2)采用空洞卷積對基本單元中的深度卷積進行替換,可以在不增加參數(shù)量的條件下增大感受野的范圍,提高模型的特征提取能力。
基于改進ShuffleNet V2的軸承故障診斷模型的診斷過程如圖4所示:首先,將獲取的軸承數(shù)據(jù)按照一定長度進行劃分并編號,按一定的比例劃分為訓(xùn)練集、驗證集和測試集:其次,采用CMOR小波將劃分好的數(shù)據(jù)轉(zhuǎn)換為時頻圖;然后,將訓(xùn)練集數(shù)據(jù)輸入改進ShuffleNet V2網(wǎng)絡(luò)進行訓(xùn)練,調(diào)整模型相關(guān)參數(shù)完成訓(xùn)練并采用驗證集驗證模型;最后,將測試集輸入驗證過的模型進行故障識別。
圖4 改進ShuffleNet V2模型診斷過程
改進ShuffleNet V2網(wǎng)絡(luò)模型的具體結(jié)構(gòu)見表1,其中階段2,3,4部分是ShuffleNet V2改進單元的堆疊結(jié)構(gòu),數(shù)目代表單元的堆疊數(shù)目,步長代表的是當前ShuffleNet V2改進單元的類型。
表1 改進ShuffleNet V2 網(wǎng)絡(luò)的結(jié)構(gòu)
為驗證本文模型的性能,選用凱斯西儲大學(xué)軸承數(shù)據(jù)集[29]中驅(qū)動端的6205-2RS 軸承數(shù)據(jù),采樣頻率為12 kHz,轉(zhuǎn)速為1 797 r/min。試驗數(shù)據(jù)集見表2,將軸承振動信號進行分割,每864個采樣點作為一個樣本,每種類型的數(shù)據(jù)構(gòu)造300個樣本,按7:2:1的比例將構(gòu)造好的樣本隨機劃分為訓(xùn)練集、驗證集和測試集并采用 One-hot 編碼[30]方式對10種軸承工作狀態(tài)賦予標簽。
表 2 西儲大學(xué)軸承試驗數(shù)據(jù)集
采用CMOR小波對數(shù)據(jù)集進行變換得到二維時頻圖。以故障直徑為0.178 mm的內(nèi)圈、外圈、鋼球的故障信號和正常信號為例,生成的CMOR時頻圖如圖5所示,可以看出軸承的內(nèi)圈、外圈、鋼球故障和正常軸承的CMOR時頻圖明顯不同。
(a)正常狀態(tài) (b)鋼球故障
采用試驗數(shù)據(jù)生成的時頻圖作為輸入,模型使用Adam優(yōu)化算法,交叉熵損失函數(shù),迭代次數(shù)為40,學(xué)習率設(shè)置為0.001,通過試驗確定改進模型中空洞卷積的空洞率以及改進單元的選擇。
4.2.1 空洞率的影響
空洞卷積通過設(shè)置不同大小的空洞率對普通卷積窗進行空洞填充,不同的空洞率會獲得不同的感受野,空洞率過大時會帶來局部信息缺失和所獲取信息相關(guān)性低等問題。去掉ShuffleNet V2基本單元中的一層1×1卷積并將3×3深度卷積替換為空洞卷積,空洞率設(shè)置為1,2,3分別進行5次試驗,結(jié)果見表3,空洞率為2時模型的準確率最高,因此后續(xù)試驗中采用空洞率為2的卷積進行替換。
表 3 不同空洞率模型的分類準確率
4.2.2 不同改進單元的影響
ShuffleNet V2網(wǎng)絡(luò)模型主要是由步長為1和步長為2的基本單元堆疊而成,由于空洞卷積的連續(xù)使用會導(dǎo)致局部信息缺失,需研究不同基本單元采用空洞卷積時對試驗結(jié)果的影響。
模型A代表只對步長為1基本單元中的3×3深度卷積進行空洞卷積替換;模型B代表對所有基本單元中的3×3深度卷積進行空洞卷積替換;模型C代表只對步長為2基本單元中的3×3深度卷積進行空洞卷積替換。分別采用3個模型進行5次試驗,結(jié)果如圖6所示,模型C的準確率更高,因此后續(xù)試驗?zāi)P椭粚Σ介L為2基本單元中的3×3深度卷積進行空洞卷積替換且空洞率為2。
圖6 不同改進單元ShuffleNet V2模型的準確率
確定模型的基本單元及空洞率后,分別采用訓(xùn)練集、驗證集進行訓(xùn)練和驗證,模型的準確率和損失率曲線如圖7所示:第5次迭代時模型的準確率已經(jīng)達到了100%,20次迭代后的準確率也能達到99%以上,此時網(wǎng)絡(luò)訓(xùn)練至收斂,訓(xùn)練集與驗證集的損失函數(shù)值也逐漸平穩(wěn)且趨近于0。將測試集數(shù)據(jù)輸入驗證后的模型進行分類,得到的混淆矩陣如圖8所示,測試集的故障分類準確率達100%。
圖7 改進ShuffleNet V2模型的準確率及損失率曲線
圖8 改進ShuffleNet V2模型的分類混淆矩陣
采用T-SNE算法對模型的分類過程進行特征可視化,原始數(shù)據(jù)及網(wǎng)絡(luò)層輸出可視化結(jié)果如圖9所示:原始數(shù)據(jù)集處于混亂狀態(tài),很難區(qū)分故障類別;經(jīng)過改進ShuffleNetV2模型第1層卷積后,故障類別由混亂無序狀態(tài)開始有效的聚集,但類別4,7,9仍存在交叉重疊現(xiàn)象;再經(jīng)過改進單元卷積層特征提取后,10種故障類別清晰分明,沒有出現(xiàn)相互交錯現(xiàn)象。
(a)原始數(shù)據(jù)
在相同數(shù)據(jù)集條件下,不同輕量級網(wǎng)絡(luò)模型的對比結(jié)果見表4:與簡化ShuffleNet V2模型相比,本文模型在參數(shù)量一致的情況下有更高的準確率,有效的證明了空洞卷積可以在不增加參數(shù)的前提下進一步提升模型的特征提取能力;與MobileNet V2模型相比,本文模型在參數(shù)量上節(jié)省了約72%,且在多次分類過程中都取得了100%的準確率;說明改進ShuffleNet V2模型在參數(shù)量和性能上都優(yōu)于其他輕量級神經(jīng)網(wǎng)絡(luò)模型,更適合部署到移動設(shè)備中。
表 4 不同模型的分類準確率及參數(shù)量
為驗證改進ShuffleNet V2模型的泛化能力,選用12 kHz的采樣頻率分別采集1 797,1 772和1 750 r/min轉(zhuǎn)速下的軸承數(shù)據(jù)分為數(shù)據(jù)集a,b,c,每個數(shù)據(jù)集均包含10種運行狀態(tài),模型泛化能力試驗結(jié)果如圖10所示,其中a→b表示用a數(shù)據(jù)集訓(xùn)練模型后用b數(shù)據(jù)集進行測試。由圖10可知:在a→c和c→a這2組轉(zhuǎn)速相差較大時,模型的分類準確率較低,泛化能力相對較弱;但由于簡化后模型結(jié)構(gòu)相對簡單,參數(shù)量少,可以減小因參數(shù)過擬合帶來的泛化誤差,本文模型在泛化試驗中的平均分類準確率仍可達到97%以上,整體泛化性能較好。
圖10 泛化性能對比
鐵路貨車輪對軸承試驗臺如圖11所示,由調(diào)速驅(qū)動電動機、液壓與電氣控制裝置、機架、液壓輪對加緊裝置、加速度傳感器等組成,軸承型號為197726雙列圓錐滾子軸承,故障為實際運行過程中自然形成,外圈剝落、滾動體表面損傷和滾動體電蝕如圖12所示。采樣頻率為5 120 Hz,采集水平方向振動信號,4類軸承信號如圖13所示,可以看出振動信號呈現(xiàn)非線性、非平穩(wěn)的特點,故障特征被噪聲所淹沒。試驗過程中,以864個采樣點作為一個樣本進行二維圖像轉(zhuǎn)換,每種類型數(shù)據(jù)構(gòu)造300個樣本。
圖11 輪對軸承試驗臺
(a)外圈剝落
(a)健康狀態(tài)
根據(jù)前文所述步驟對輪對軸承數(shù)據(jù)進行試驗, ShuffleNet V2模型、簡化ShuffleNet V2模型和本文模型分別取得了92.5%,93.3%,96.7%的分類準確率。本文模型的準確率最高,說明其能更好地提取故障特征,具備更好的故障診斷性能。
本文提出一種基于改進ShuffleNet V2網(wǎng)絡(luò)的軸承故障診斷模型并進行了試驗研究,從試驗中可以得到以下結(jié)論:
1)改進的ShuffleNet V2網(wǎng)絡(luò)不僅在模型參數(shù)量和計算量上更有優(yōu)勢,特征提取能力也得到進一步提升,與ShuffleNet V2網(wǎng)絡(luò)相比,本文模型在更少參數(shù)量和計算量的條件下得到了更好的軸承故障識別效果。
2)空洞率對改進ShuffleNet V2模型識別效果的影響非常大,當空洞率為2時取得了最好的軸承故障識別效果,應(yīng)根據(jù)實際工況選擇合適的空洞率。
3)泛性化試驗結(jié)果表明改進ShuffleNet V2模型比其他輕量級網(wǎng)絡(luò)模型的的泛化性能更好。
4)鐵路貨車輪對軸承數(shù)據(jù)集的試驗結(jié)果表明改進ShuffleNet V2模型的抗噪性更強,更適合實際應(yīng)用工況。