虞滸,繆小冬,顧寅驥,荀志文,隋天舉
(1.南京工業(yè)大學 a.機械與動力工程學院;b.計算機科學與技術學院,南京 211800;2.大連理工大學 工業(yè)裝備智能控制與優(yōu)化教育部重點實驗室,遼寧 大連 116024)
滾動軸承是旋轉機械設備的關鍵部件,其主要功能是傳遞前后部件產(chǎn)生的力和扭矩,同時減少旋轉體之間摩擦產(chǎn)生的能量損失[1]。然而,軸承是容易損傷的部件之一,一旦失效可能導致整個機械系統(tǒng)崩潰[2?3],因此,對滾動軸承進行及時的故障診斷和在線監(jiān)測至關重要。傳統(tǒng)的滾動軸承故障診斷大多依賴人工對軸承原始故障數(shù)據(jù)進行特征提取,分析不同特征分量之間的內在邏輯關系進而確定軸承的破壞形式,而對于復雜工況下的軸承,往往面臨診斷效果不佳和泛化能力不強的問題,因此,研究具有快速自適應特征提取和泛化性能強的智能診斷方法具有重要意義。
深度學習方法在故障診斷領域得到了深入研究,如深度置信網(wǎng)絡(Deep Belief Network, DBN)[4]、堆疊降噪自編碼器 (Stacked AutoEncoders,SAE)[5]、卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)[6]和遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)[7]。深度神經(jīng)網(wǎng)絡彌補了淺層學習機在特征提取上的短板,能夠自適應識別深層的隱藏特征,降低了故障診斷算法對于數(shù)據(jù)預處理的依賴。CNN 作為深度學習的典型代表,對于一維數(shù)據(jù)和多通道的二維數(shù)據(jù)均有不錯的表現(xiàn),并產(chǎn)生了眾多具有特長的變體,如Visual Geometry Group(VGG)[8],GoogLeNet[9]以及Residual Network(ResNet)[10]等:文獻[11]提出了基于改進ResNet的故障診斷算法,將傳統(tǒng)信號處理中常見的軟閾值去噪構建為收縮模塊嵌入ResNet,在不同信噪比下進行試驗并與傳統(tǒng)CNN和ResNet對比,發(fā)現(xiàn)在強噪聲干擾環(huán)境下所提方法性能良好;文獻[12]在不改動CNN 模塊的前提下,引入INCEPTION模塊實現(xiàn)網(wǎng)絡的跳躍連接,較大程度增強了故障特征信息的提取能力,試驗結果表明該方法在多種強噪聲工況下的診斷準確率保持在90%以上。
為更加有效地適應具有卷積操作功能的神經(jīng)網(wǎng)絡,有學者嘗試采用特征信息聯(lián)合處理的方式對原始數(shù)據(jù)特征二次加工,然后再使網(wǎng)絡模型參與工作:文獻[13]提出基于多層降噪技術結合改進CNN的滾動軸承故障診斷方法,采用奇異值分解(Singu?lar Value Decomposition, SVD)處理訓練樣本,經(jīng)驗模態(tài)分解(Empirical Mode Decomposition, EMD)獲得本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF),IMF疊加原始信號得到最終信號,再交由改進CNN進行故障診斷驗證其有效性;文獻[14]提出雙小波去噪方法,可以保留原始信號更多細節(jié),對比試驗表明雙小波去噪在原始故障特征細節(jié)獲取中性能更加優(yōu)越。由此可見,少量特征工程提高了網(wǎng)絡訓練效果,使具有傳統(tǒng)結構或簡單結構的網(wǎng)絡模型的診斷效果接近更先進的網(wǎng)絡結構。
格拉姆角場(Gramian Angular Field,GAF)具有存儲信號時序,保證緊鄰信號特征之間時間相關性的優(yōu)點;DarkNet 是圖像識別Yolo 算法中用于提取特征的重要骨干,其主要功能依然是卷積,但各個版本中的DarkNet 都引入了殘差結構,以增強對圖像特征提取的性能。因此,本文提出一種基于 GAF 和 DarkNet?53 網(wǎng)絡(GAF?DarkNet)的軸承故障診斷方法,利用GAF 編碼方式將原始滾動軸承振動信號轉化為具有時間相關性的二維特征圖像,將特征圖像作為DarkNet?53 網(wǎng)絡模型的輸入進行自適應特征提取和故障診斷。選取凱斯西儲大學(CWRU)滾動軸承數(shù)據(jù)集驗證模型的有效性,并進一步通過變載荷工況和實際轉盤軸承數(shù)據(jù)集驗證模型的泛化性能,同時與幾種最新的數(shù)據(jù)維度重構診斷方法進行性能對比。
格拉姆角場可以將原始一維振動信號轉化為二維時間序列圖像,該方法主要基于反余弦極坐標編碼和格拉姆矩陣內部余弦解碼對原始特征值進行重新排列。
滾動軸承故障特征信號在時域上呈現(xiàn)不規(guī)律波動,每個采樣點的值對應一個時間戳,可設一段故障信號為X=[x1,x2,…,xi],xi為對應時間戳i的幅值。然而,脫離時序的xi沒有任何物理意義,且機器學習的過程對數(shù)值的前后變化具有強依賴性,因此需要對每個幅值進行時序標簽。對于笛卡爾坐標系中的一維時序數(shù)據(jù),通過極坐標編碼將時序映射為角度,為增強前后時序相關性并降低部分故障時序特征值突變現(xiàn)象的影響,采用分段聚合近似(Piecewise Aggregation Approximation,PAA)的方法進行編碼,隨后導入極坐標再次編碼,具體步驟如下:
1)取每k個采樣點的平均值來減小故障特征信息的序列值,得到新的序列Xk。
式中:xi,xo和xp為原始序列對應時序區(qū)間的特征幅值。令xkn為新序列對應時序kn的特征值,PAA編碼后的新序列可表示為Xk=[xk1,xk2,…,xkn]。
2)將時序值放縮到[0,1]區(qū)間進行歸一化處理,標準化特征重要程度,方便后期不同故障類型分類,考慮到幅值存在負值,歸一化方法為
通過以e 為底數(shù)的指數(shù)函數(shù)的倒數(shù)將時序值進行了歸一化,可令δkn= e?|xkn|,則歸一化后序列可表示為Xk=[δk1,δk2,…,δkn]。
3)極坐標化處理,將時序kn作為極坐標半徑和歸一化處理的對應時序值的反余弦值生成極坐標,如此便將時序值δkn與對應的時序kn聯(lián)系起來,即
在數(shù)據(jù)升維重構階段,將極坐標化處理后的序列Xk導入GAF獲得二維時序圖。根據(jù)角度和與角度差的不同,GAF 的編碼方式分為格拉姆角和場(Gramian Angular Summation Field,GASF)和格拉姆角差場(Gramian Angular Difference Field,GADF),本文采用GASF進行數(shù)據(jù)升維,即
(4)式從左上到右下分配時序,將時序中的每對值逐對求和并取余弦值匯總,得到的二維時序圖如圖1 所示,通過升維加灰度處理使故障特征信息像素化,并通過像素對比度量化了特征重要程度。
圖1 GASF二維時序圖Fig.1 Two?dimensional temporal diagram of GASF
基于tensorflow2.1 和DarkNet 框架搭建神經(jīng)網(wǎng)絡,在一臺搭載Intel(R) Xeron(R) W?2223 CPU @3.6 GHz,NVIDIA Quadro P2200 GPU 的聯(lián)想工作站上進行試驗。
DarkNet?53 是具有卷積和殘差結構的深度神經(jīng)網(wǎng)絡,其基本結構如圖2 所示。傳統(tǒng)的CNN 模型通常由卷積層、池化層、全連接層和Softmax 分類器組成,其原理是通過具有若干能夠提取數(shù)據(jù)特征的濾波器對輸入圖像進行卷積運算和池化降采樣,從而獲取具有顯著特征的圖像,然后經(jīng)過全連接層進行參數(shù)優(yōu)化和誤差計算,最后通過Soft?max分類器進行分類。DarkNet網(wǎng)絡引入了殘差結構使其具有更深的層數(shù),無池化層使其比傳統(tǒng)CNN 更加輕量化。DarkNet?53 是Yolo v3 算法中用于提取特征的重要骨干,相較于Yolo v2 中的DarkNet?19 引入了更多的殘差連接,并且利用卷積核為3×3,映射步長為2 的二維卷積模塊代替了二維最大池化,在保證準確率的同時提升了網(wǎng)絡的運行速度。
圖2 DarkNet?53網(wǎng)絡基本結構Fig.2 Basic structure of DarkNet?53 network
所提GAF?DarkNet 滾動軸承故障診斷方法結合了GAF 編碼方式保留數(shù)據(jù)之間時序相關性的優(yōu)勢和DarkNet 網(wǎng)絡強大的特征提取能力及參數(shù)計算能力,基本流程如圖3 所示。模型訓練階段,通過Softmax 分類函數(shù)結合Adam 優(yōu)化器反向傳播更新網(wǎng)絡的權重和偏差,使誤差降到最小,完成模型的訓練;模型測試階段,將訓練好的模型在新的測試數(shù)據(jù)上進行特征提取計算,最后通過分類器進行故障分類并監(jiān)視其診斷準確率。
圖3 基于GAF?DarkNet的滾動軸承故障診斷流程圖Fig.3 Flow chart of fault diagnosis for rolling bearing based on GAF?DarkNet
3.1.1 CWRU數(shù)據(jù)集
利用CWRU數(shù)據(jù)集驗證模型的有效性,以驅動端深溝球軸承6205?2RS JEM SKF 數(shù)據(jù)為例,采樣頻率為12 kHz,負載為1~3 hp(1 hp=745.7 W),故障位置分別位于內圈、外圈及鋼球,每種故障位置均分別包含0.178,0.356,0.534 mm 3種故障直徑。軸承狀態(tài)類型共計10種:健康狀態(tài)軸承記為F1;故障直徑為0.178 mm 的內圈、外圈及鋼球故障分別標記為F2,F(xiàn)3及F4;故障直徑為0.356 mm的內圈、外圈及鋼球故障分別記為F5,F(xiàn)6及F7;故障直徑為0.534 mm的內圈、外圈及鋼球故障分別記為F8,F(xiàn)9及F10。試驗中軸承的最高轉速為1772 r/min,可得一周期包含406個采樣點。為保證各時序片段故障數(shù)據(jù)的密度,設置每個重采樣片段的樣本長度為1024。采用間隔采樣和等長截取的方式增加樣本特征的稀疏性,采樣間隔步長為256(約為半個采樣周期),以方便驗證各網(wǎng)絡模型的泛化性能。根據(jù)負載工況將數(shù)據(jù)集分為D1,D2,D3,每個數(shù)據(jù)集包括10 種軸承狀態(tài),每種軸承狀態(tài)包含500 個樣本,并按照4∶1的比例劃分訓練集和測試集,每個數(shù)據(jù)集共計5000個樣本,具體見表1。
表1 CWRU數(shù)據(jù)集樣本劃分Tab.1 Sample partitioning of dataset from CWRU
3.1.2 轉盤軸承數(shù)據(jù)集
利用南京工業(yè)大學江蘇省工業(yè)設備數(shù)字化制造與控制技術重點實驗室轉盤軸承試驗平臺的數(shù)據(jù)對所提方法的泛化性進行驗證。轉盤軸承試驗臺(圖4)通過液壓泵站驅動,采用NI9205 和NI9234 數(shù)據(jù)采集模塊將采集到的信號通過PCI 總線傳輸?shù)絇C 機中,PC 機通過Labview 軟件對轉盤軸承的實時信號進行監(jiān)控。軸承型號為QNA?730?22,鋼球直徑為22 mm,鋼球個數(shù)為97,接觸角為45°。ULT2001 型低頻電容式加速度傳感器用于實時監(jiān)測轉盤軸承的振動信號,采樣頻率為0.033 Hz,采樣時間為15000 min。本文僅采用振動信號進行模型測試,考慮到局部共振對振動信號采集的干擾,將加速度傳感器通過磁座固定,具體布置如圖5所示。
圖4 轉盤軸承試驗臺Fig.4 Slewing bearing test bench
圖5 加速度傳感器安裝位置Fig.5 Installation position of acceleration sensor
滿載(扭矩峰值為240 kN · m,轉速峰值為4 r/min,軸向力峰值為96 kN)運行7 天后,轉盤軸承4 個測點的振動信號如圖6 所示。轉盤軸承故障存在耦合現(xiàn)象,經(jīng)滿載運行后出現(xiàn)卡滯停機,出現(xiàn)的3 種故障形式如圖7 所示,保持架故障記為F11,鋼球故障記為F12,溝道故障記為F13。與處理CWRU 數(shù)據(jù)集一樣的方式對轉盤故障振動信號進行處理,數(shù)據(jù)集片段見表2。
表2 轉盤軸承數(shù)據(jù)集樣本劃分Tab.2 Sample partitioning of dataset from slewing bearing
圖6 轉盤軸承不同測點的振動信號Fig.6 Vibration signals of different measuring points on slewing bearing
圖7 轉盤軸承故障類型Fig.7 Fault types of slewing bearing
3.2.1 時序數(shù)據(jù)稀疏化
現(xiàn)有智能故障診斷方法在故障特征連續(xù)且均勻的理想條件下的計算準確性較高,然而,工業(yè)生產(chǎn)過程中不能及時獲取時序信號且時序丟失的情況時有發(fā)生。本文在保證樣本規(guī)模足夠的情況下,采用間隔采樣的方法對時序數(shù)據(jù)進行稀疏化處理,如圖8所示,采樣間隔約為半個采樣周期,降低了特征在時序上的關聯(lián)性,模擬了時序丟失導致特征不連續(xù)的工況。
圖8 數(shù)據(jù)稀疏化采樣示意圖Fig.8 Diagram of data sparse sampling
3.2.2 GAF特征圖像
GAF 編碼方式通過等長間隔截取長度相等的時序信號片段并生成特征圖像,此工序后所有一維數(shù)據(jù)片段全部轉換為二維GAF 特征圖像,以1 hp 工況下的10 種CWRU 軸承故障和3 種轉盤軸承故障為例給出二維GAF 特征圖如圖9 所示。
圖9 10種CWRU軸承故障和3種轉盤軸承故障的GAF特征圖Fig.9 GAF characteristic diagram of ten types of CWRU bearing fault and three types of slewing bearing fault
3.3.1 模型超參數(shù)設置
采用人工選取參數(shù)結合遺傳算法超參數(shù)自搜索優(yōu)化的方法對模型進行超參數(shù)設置,參數(shù)優(yōu)化流程如圖10 所示。參數(shù)優(yōu)化后Batch Size 為20,Kernel Size 為3,迭代次數(shù)為70,卷積層的激活函數(shù)為LeakyReLU,學習率為0.001,Dropout 設置為0.4。
圖10 模型超參數(shù)優(yōu)化流程圖Fig.10 Flow chart for hyperparameter optimization of model
3.3.2 模型訓練和測試結果分析
選取數(shù)據(jù)集D1 進行測試,模型經(jīng)過50 次迭代,訓練和測試結果如圖11 所示:迭代到第30 步時,模型的精度和損失開始趨于穩(wěn)定,模型穩(wěn)定后在訓練集上的平均精度達到99.89%,在測試集上達到99.81%,模型損失值降到0.153趨于平穩(wěn),初步驗證了GAF?DarkNet 模型在滾動軸承故障診斷中具有較好的診斷效果。
圖11 GAF?DarkNet 模型在數(shù)據(jù)集D1 上的訓練和測試結果Fig.11 Training and testing results of GAF?DarkNet model on dataset D1
模型在數(shù)據(jù)集D1 上的故障診斷分類效果混淆矩陣如圖12所示,故障分類效果較好。
圖12 模型在數(shù)據(jù)集D1上的故障診斷分類效果混淆矩陣Fig.12 Confusion matrix of fault diagnosis classification effect of model on dataset D1
3.3.3 可視化分析
為進一步理解GAF?DarkNet 提取特征的過程,選取數(shù)據(jù)集D1 中0.178 mm 鋼球故障信號輸入GAF?DarkNet 中并對模型進行分層展示,由于DarkNet?53 模型的殘差結構使網(wǎng)絡深度遠超傳統(tǒng)CNN,因此僅選取具有顯著狀態(tài)變化的圖像進行展示,結果如圖13 所示:第1 層卷積層呈現(xiàn)該故障類型的GAF 特征圖形態(tài),隨著網(wǎng)絡層數(shù)的逐漸加深,特征圖像越來越抽象。這是因為淺層網(wǎng)絡對特征圖像的紋理和邊緣等細節(jié)特征進行提取,如第1 層卷積到其激活時的狀態(tài)變化依然呈現(xiàn)GAF圖的具象形態(tài);進入深層結構,網(wǎng)絡提取到更具有分類意義上的抽象特征,呈現(xiàn)模糊的抽象形態(tài),只有少部分關鍵特征被激活呈明黃色。
圖13 故障直徑為0.178 mm 的鋼球故障信號的網(wǎng)絡分層可視化Fig.13 Network layered visualization of fault signals for steel balls with a fault diameter of 0.178 mm
為探索上述網(wǎng)絡層的狀態(tài)信息對于模型分類準確率的影響,進一步通過主成分分析(PCA)結合t分布隨機近鄰嵌入(t?SNE)技術將各層提取的特征進行降維可視化,50 維以上的高維數(shù)據(jù)通過PCA 進行維數(shù)約減,50 維以下的數(shù)據(jù)通過t?SNE進行降維,因層數(shù)過多,僅選取輸入層、部分中間層以及分類輸出層進行展示,如圖14所示:從輸入層到分類層的分類特征逐漸鮮明,Softmax 分類層的分類特性突出,證明了模型分類的有效性。
圖14 PCA和t?SNE對部分網(wǎng)絡層的降維可視化Fig.14 PCA and t?SNE for dimensionality reduction visualization of partial network layers
3.4.1 基于CWRU數(shù)據(jù)集變載荷工況分析
為驗證GAF?DarkNet 模型在不同工況下的診斷效果,在D1,D2,D3 數(shù)據(jù)集下進行變工況測試,如D1→D2表示訓練集為D1,測試集為D2,并選取傳統(tǒng)智能診斷算法支持向量機(SVM),DBN,CNN及近3年較熱門的深度殘差收縮網(wǎng)絡(DRSN)與GAF?DarkNet 進行對比,各模型在不同工況下的診斷效果如圖15 所示:諸模型在單一工況下的診斷效果最佳,除GAF?DarkNet 和DRSN 外,其余模型在變工況下的診斷效果都出現(xiàn)較大程度下降;GAF?DarkNet 和DRSN 的平均診斷精度遠高于其他模型,且GAF?DarkNet 略高于DRSN。因此GAF?DarkNet 算法具有良好的診斷性能和泛化性能,且算法的魯棒性符合變載荷工況的診斷要求。
圖15 各模型在不同工況下的診斷效果對比Fig.15 Comparison of diagnostic effect of various models under different operating conditions
3.4.2 基于轉盤軸承數(shù)據(jù)集診斷結果分析
利用實際的轉盤軸承數(shù)據(jù)集對模型的泛化性進行驗證,選取3 種最新的二維重構診斷方法與GAF?DarkNet 進行對比,具體結果見表3,GAF?DarkNet在各方面的診斷性能均優(yōu)于文獻中的方法。
表3 各方法在轉盤軸承數(shù)據(jù)集上的診斷性能對比Tab.3 Comparison of diagnostic performance of various methods on slewing bearing dataset
與文獻[10]中的連續(xù)堆棧卷積的殘差模塊聯(lián)合GAF 圖像重構方法(ResNet152?MSRF)相比,DarkNet 在轉盤軸承數(shù)據(jù)集上明顯獲得更高的訓練和測試精度,理論上連續(xù)堆棧小卷積核在特征提取層可以較完整地提取GAF主時序線上保留的特征信息,但對轉盤軸承這種大型旋轉支承部件的離散振動特征不敏感,經(jīng)過參數(shù)尋優(yōu)依然難以獲得高訓練精度;與文獻[15]中的時頻圖像聯(lián)合膠囊網(wǎng)絡(ARCN)模型相比,GAF?DarkNet 在召回率方面有明顯優(yōu)勢,這是因為GAF 算法保留時序并不影響原始特征狀態(tài),傳統(tǒng)小波基時頻變換依然存在時域分辨率和頻域分辨率難以同時兼顧的缺陷;文獻[16]中馬爾可夫變遷場(MTF)將時間節(jié)點與對應特征值擴展成相互依賴的條件概率函數(shù),以一個分位數(shù)的形式對應每個時間節(jié)點,以此保證時序和原始特征完整共存的狀態(tài),但對于不同的數(shù)據(jù)集,在數(shù)據(jù)分片段轉換的過程中,片段數(shù)據(jù)量對于馬爾可夫變遷場重構的影響非常大,在進行故障診斷任務轉移時,對不同數(shù)據(jù)集的分段要求無法統(tǒng)一標準,存在依賴專家經(jīng)驗的行為。
在設備智能運維過程中,診斷算法的計算成本是一項重要指標,體量小的網(wǎng)絡模型可以節(jié)約硬件成本,縮短訓練時間。從模型參數(shù)量和計算時間上選取CNN 和DRSN 模型與本文模型進行對比,其中CNN 模型共5 層,包含2 層卷積和2 層池化,DRSN 中的殘差部分為50 層,包含8 個殘差模塊和收縮模塊,對比結果見表4:DRSN 和DarkNet的計算成本低于CNN 且網(wǎng)絡更深;相比DRSN,DarkNet計算參數(shù)更少,計算時間更短。
表4 各模型的參數(shù)量及計算時間Tab.4 Parameter quantity and calculation time of each model
針對滾動軸承在實際工作過程中載荷工況復雜多變,傳統(tǒng)的智能診斷方法難以獲得良好的診斷精度以及部分特征難以有效提取等問題,提出一種基于GAF?DarkNet 的滾動軸承故障診斷方法。采用GAF編碼將原始振動信號轉換為具有強時序特征的二維圖像,然后結合DarkNet?53 實現(xiàn)滾動軸承故障診斷。基于CWRU 數(shù)據(jù)集和轉盤軸承數(shù)據(jù)集并與其他智能診斷算法對比,驗證了本文模型在診斷精度和泛化性能上的優(yōu)越性,且計算參數(shù)量更少,計算效率更高;但模型訓練過程可解釋性較弱,并且特征工程部分在數(shù)據(jù)規(guī)模較大的情況下會消耗更大的時間成本,因此下一步將針對模型可解釋性訓練模式和圖像壓縮處理2 個方面展開深入研究。