陳鈞钖 袁逸萍 陳彩鳳
(新疆大學機械工程學院,新疆 烏魯木齊 830046)
隨著工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術的迅速發(fā)展,機械設備能夠提取的監(jiān)測數(shù)據(jù)不斷增加,相應的數(shù)據(jù)采集量也與日俱增,為設備狀態(tài)監(jiān)測提供了堅實的數(shù)據(jù)基礎。旋轉(zhuǎn)機械作為工業(yè)設備的關鍵設備,其中軸承是旋轉(zhuǎn)機械的關鍵組成部件,其一旦發(fā)生故障則會嚴重造成企業(yè)的經(jīng)濟損失甚至人員傷害[1]。因此對軸承進行狀態(tài)監(jiān)測與故障識別對保證設備安全穩(wěn)定運行具有重要意義。
在實際情況下,診斷任務難以獲取滿足診斷模型訓練的數(shù)據(jù)樣本。針對缺乏充足故障樣本數(shù)據(jù)的問題,文獻[2]采用兩個同結構、參數(shù)共享的卷積網(wǎng)絡以及雙向門控循環(huán)單元構成孿生網(wǎng)絡進行故障分類,取得良好的診斷結果;文獻[3]在生成對抗網(wǎng)絡中引入條件梯度懲罰機制的軸承故障診斷方法,其能夠生成與真實樣本高度相似的生成樣本,有效地提高了故障診斷的準確率。文獻[4]采用有限元方法得到不同工況下軸承故障樣本并且利用冗余屬性投影并結合支持向量機進行軸承故障診斷。雖然數(shù)據(jù)增強以及仿真的方法在一定程度上解決了數(shù)據(jù)樣本缺乏的問題,但數(shù)據(jù)間的差異性會導致診斷方法的精度下降。針對數(shù)據(jù)之間存在差異問題,遷移學習中領域自適應解決了數(shù)據(jù)特征之間存在差異的問題。文獻[5]在故障診斷過程中引入最小化最大均值差異(max mean discrepancy,MMD),進而減小不同域之間的分布距離。文獻[6]通過對不同域特征的多層域適配,以及利用偽標簽學習方法,使不同域之間的條件分布差異進一步減小,進一步提升了故障診斷精度。
上述文獻所提方法在一定程度上解決了數(shù)據(jù)樣本不足的問題。建立故障仿真模型得到相應仿真數(shù)據(jù)可在一定程度上得到設備故障樣本數(shù)據(jù),但仿真數(shù)據(jù)和實際數(shù)據(jù)的依舊存在一定差異性。因此利用數(shù)值仿真得到故障數(shù)據(jù)并采用遷移學習領域自適應方法降低仿真數(shù)據(jù)與真實數(shù)據(jù)的差異性,能夠為缺少故障數(shù)據(jù)的診斷任務提供一種解決思路,有望在一定程度上解決故障診斷的實際問題。
本文根據(jù)軸承幾何參數(shù)建立滾動軸承故障動力學仿真模型,進而得到充足的軸承故障仿真數(shù)據(jù)構建遷移學習源域,然后利用遷移學習中領域自適應方法在實現(xiàn)不同域特征全局分布對齊的基礎上,對目標域樣本引入最大最小化分類器差異的對抗訓練方法,使不同域的特征實現(xiàn)更精確的子領域?qū)R,進一步提高了模型的泛化能力和對目標域的故障診斷精度。
軸承動力學模型建立參考文獻[7]方法。其依據(jù)軸承的幾何參數(shù)建立軸承動力學模型,然后引入軸承故障參數(shù),通過解析軸承動力學方程獲得的振動數(shù)據(jù)。通過驗證仿真數(shù)據(jù)與凱斯西儲大學(CWRU)軸承實驗數(shù)據(jù)集數(shù)據(jù)在時頻域的差異對仿真模型的合理性進行驗證。
滾動軸承運動系統(tǒng)可視為四自由度運動系統(tǒng),在軸承運動過程中僅考慮軸承內(nèi)外圈在水平方向和豎直方向的位移,根據(jù)其動力學模型如圖1 所示,并對軸承的運動系統(tǒng)進行以下的簡化:(1) 在建立動力學模型時,忽略由于非線性因素導致的軸承非線性接觸力以及彈性流體潤滑的剛度和阻尼。(2) 軸承只在單一平面內(nèi)運動,內(nèi)圈與以定角速度ω轉(zhuǎn)動與軸一起繞z軸轉(zhuǎn)動,外圈固定。(3) 假定滾動體與內(nèi)外滾道之間的接觸為Hertz接觸。(4) 不考慮滾動體以及保持架的質(zhì)量以及轉(zhuǎn)動慣量。
圖1 軸承動力學簡化模型
考慮制造和安裝時誤差所導致的離心力對軸承動力學建模,得到動力學系統(tǒng)的動力學方程為
式(1)~式(4)中:min與mout分別為內(nèi)外圈與其相連接部分質(zhì)量之和,kg;cin與cout分別為內(nèi)外圈等效阻尼,N·s/m;kin與kout分別為內(nèi)外圈與其相連接部分的等效剛度,N/m;FX與FY為滾動體彈性力在x和y方向的分量,N;e為偏心距,m;ω為軸承內(nèi)圈旋轉(zhuǎn)的角頻率,rad/s;g為重力加速度,m/s2;t為運動時間,s。
圖2 所示為滾動軸承的故障示意圖,其中滾動體故障包含滾動體分別與內(nèi)外圈接觸,只列出內(nèi)圈接觸情況,外圈接觸情況相似。
圖2 滾動軸承的故障示意圖
以內(nèi)圈故障為例,滾動體在進入故障區(qū)域到離開故障區(qū)域時,滾動體與滾道之間的接觸相應會由突然消失到恢復[8]。接觸的變化也會造成接觸變形δi的變化。當引入故障后,滾動體i處的 δi為
利用游隙的瞬時變化來表征故障。如當內(nèi)圈故障時:
式中: θin為內(nèi)圈故障的角位置; ?di為內(nèi)圈故障缺陷角。
當滾動體進入故障區(qū)域時,其產(chǎn)生的接觸變形H0實際是內(nèi)圈與滾動體圓心的距離變化。
式中:rb為滾動體半徑;L為故障寬度;Dt內(nèi)圈直徑;h為故障深度。由式(5)~式(7)可以求出軸承徑向變形 δi。由Hertz 接觸理論可知,第i個滾動體變形引起的彈性恢復力為
利用動力學方程求解出來的加速度信號與標準數(shù)據(jù)集的振動加速度信號進行對比,分別從時域和頻域信號進行對比。
利用Matlab 對動力學仿真模型進行建模,并利用ode45 方法對動力學方程進行求解,進而得到滾動軸承各種狀態(tài)下振動響應。如圖3 所示,為了更好地觀察時域數(shù)據(jù)的沖擊特性,對仿真與實際數(shù)據(jù)取100 ms 數(shù)據(jù)進行時頻域?qū)Ρ?。在進行對比時,僅需定性分析時域數(shù)據(jù)的沖擊特性和頻域特性,所以將數(shù)據(jù)歸一化至[-1,1]。以內(nèi)圈故障為例,由圖3a與圖3c 可知,實際與仿真的時域信號中單個故障周期為6.27 ms 和6.25 ms,相對偏差為0.32%,二者比較接近;當滾動體經(jīng)過故障區(qū)域并且滾動體承受較大載荷時,沖擊較大,其周期分別為31.19 ms和31.17 ms,相對偏差為0.64%,二者比較接近。由圖3b 與圖3d 可知,在頻域中仿真數(shù)據(jù)與實際數(shù)據(jù)均包含轉(zhuǎn)頻(29.60 Hz、29.50 Hz)及轉(zhuǎn)頻的二倍頻、故障頻率(160.10 Hz、160.30 Hz)以及其二倍頻和兩側邊頻,二者關鍵特征頻率均較為接近。
圖3 仿真數(shù)據(jù)時域圖及包絡譜圖
圖4 為仿真數(shù)據(jù)中內(nèi)圈故障與實際數(shù)據(jù)進行正態(tài)分布擬合,擬合參數(shù)均值和標準差分別為實際數(shù)據(jù)為0.003 9 和0.165 3、仿真數(shù)據(jù)為-0.122 4 和0.165 2,標準差較為接近但均值相差較大,其主要原因可能是:① 在建立動力學仿真模型時進行了較多簡化,如忽略了保持架和滾動體的影響,仿真時僅考慮較大的影響因素并不能與實際設備完全一致;② 在滾動體經(jīng)過缺陷區(qū)域時,相應地載荷會有所變化;③ 實際環(huán)境中的不確定因素如噪聲的影響并不能在準確在仿真數(shù)據(jù)體現(xiàn)。實際數(shù)據(jù)與仿真數(shù)據(jù)的特征分布存在一定的差異,因此采用遷移學習進行故障診斷十分有必要。
圖4 仿真數(shù)據(jù)和實際數(shù)據(jù)正態(tài)分布擬合圖
無監(jiān)督領域自適應是遷移學習的一種方法,通過學習源域和目標域共享的特征并且在源域和目標域之間進行知識遷移,進而改善診斷模型在目標域上的學習能力。分布不同的數(shù)據(jù)樣本,源域樣本為和目標域樣本可以分別表示為與Yt=其中xi為第i個源域樣本,yi為其對應的標簽,ns為源域樣本個數(shù),xk為第k個目標域樣本,yk為對應的標簽,nt為目標域樣本個數(shù)[9]。
特征提取網(wǎng)絡的卷積塊中,在開始使用較大卷積核的尺寸來捕捉提取信號的全局特征;隨著網(wǎng)絡的加深,逐漸減小卷積核的尺寸以捕捉細粒度的局部特征。表1 為特征提取網(wǎng)絡的參數(shù)。
表1 特征提取網(wǎng)絡參數(shù)
由于本身誤差、運行條件以及噪聲等因素影響,源域仿真數(shù)據(jù)與目標域?qū)嶒灁?shù)據(jù)之間分布存在著較大的差異源域仿真數(shù)據(jù)與目標域?qū)嶒灁?shù)據(jù)之間分布存在著較大的差異。為了減小源域和目標域的數(shù)據(jù)特征差異,可考慮從數(shù)據(jù)邊緣概率分布自適應和條件概率分布自適應入手。
邊緣分布自適應通過減小源域和目標域之間的邊緣概率分布差異實現(xiàn)不同域之間分布差異。最大均值差異被廣泛用于度量遷移學習中源域和目標域的分布差異[10]。其直接從數(shù)據(jù)本身出發(fā)的特點,可以不考慮類別標簽,進而實現(xiàn)不同域特征的全局分布對齊。源域和目標域數(shù)據(jù)在特征提取網(wǎng)絡輸出層的邊緣概率分布分別為p(xs)和p(xt)的MMD 被定義為
式中: H為可再生核希爾伯特空間;?(·)為其相應的映射函數(shù),這里取映射函數(shù)為高斯核函數(shù)。
條件分布自適應通過減小源域和目標域之間的條件概率分布差異實現(xiàn)不同域之間分布差異。雖然可以采用輸出偽標簽的方法來減小不同域特征的條件分布差異,但當不同域的數(shù)據(jù)分布差異過大時,偽標簽的準確率會下降,進而對模型的監(jiān)督訓練產(chǎn)生影響[11]。本文最大最小化分類器差異的對抗學習策略,不直接去衡量不同域之間的條件概率分布,而是利用不同的分類器對目標任務的分類決策邊界進而實現(xiàn)源域和目標域的條件分布差異的減小。
本文提出建立特征提取模型并且將上述特征分布適配方法,整合到深度學習模型的訓練過程中,以減小仿真樣本與實驗樣本的特征分布差異。網(wǎng)絡模型如圖5 所示。
圖5 遷移學習網(wǎng)絡模型
對于2 個分類器,除了初始化參數(shù)不同外,其各自的全連接層采用不同的激活函數(shù),使其輸出盡可能具有差異性。分類器網(wǎng)絡參數(shù)見表2。
表2 分類器參數(shù)
針對深度遷移學習模型主要分3 個階段進行訓練。具體流程如下所示:
首先,利用源域和目標域數(shù)據(jù)對特征提取器G和分類器C1、C2進行訓練。保證特征提取器和分類器對源域數(shù)據(jù)正確分類以及對目標域數(shù)據(jù)的邊緣分布適配。式(10)為該訓練過程所優(yōu)化的目標函數(shù),其中Lc為源域樣本上的交叉熵分類損失函數(shù),可按式(11)計算。式(11)中:E()表示對所有源域樣本分類損失的期望;K為總類別數(shù);Π[k=ys]表示類別的one-hot 索引值k和標簽ys一致時,值為1,否則為0;p(y|xs)為模型對第k個類別的預測概率;Lmmd為源域和目標域在特征層上的mmd 域適應損失。
然后,凍結特征提取器,訓練分類器。為了使分類器能夠更好地提取除目標域中分歧樣本,通過最大化未標記的目標樣本的預測差異來尋找源分布支持之外的目標樣本,同時最小化標記的源樣本的交叉熵來更新兩個分類器。此時模型訓練優(yōu)化的目標函數(shù)表述為
式中:Ladv為目標域樣本在兩個分類器上的分類差異損失;其中E(.)表示對所有目標域樣本分類差異損失的期望;分類差異d()。
最后,凍結分類器,訓練特征提取器。將訓練好的分類器固定,訓練特征提取器以減小目標域樣本的分類差異,讓特征提取器在源域特征附近提取目標域樣本的相應特征,從而實現(xiàn)對源域與目標域數(shù)據(jù)的子領域?qū)R,此時訓練優(yōu)化的目標函數(shù)為
使用滾動軸承仿真數(shù)據(jù)作為源域樣本,凱斯西儲大學軸承實驗數(shù)據(jù)作為目標域樣本,選取驅(qū)動端軸承,型號為SKF 6205-2RS 的實驗數(shù)據(jù)驗證上述方法有效性。實驗數(shù)據(jù)采用加速度信號,采樣頻率為12 kHz,每個樣本包含1 024 個采樣點。使用重疊采樣方法對樣本進行分割,每種狀態(tài)有500 個樣本。表3 為各數(shù)據(jù)樣本劃分情況以及標簽情況。在本方法做領域自適應遷移診斷時,訓練樣本(仿真數(shù)據(jù))除了包括有標簽的源域數(shù)據(jù)樣本外,還需要無標簽(標準數(shù)據(jù)集數(shù)據(jù))的目標域數(shù)據(jù)樣本參與訓練過程進行領域自適應。在訓練過程中,其中訓練集由不同域80 %的數(shù)據(jù)樣本組成,測試集為剩下20 %的目標域數(shù)據(jù)。
表3 數(shù)據(jù)樣本
將所提方法與無遷移學習模型以及其他主流的深度遷移學習模型進行結果對比分析,進而驗證所提方法的有效性。對比模型分別為:模型1 無遷移、模型2 DeepCoral[12]、模型3 深度自適應網(wǎng)絡(deep adaptation network,DAN)[13]、模型4 域?qū)股窠?jīng)網(wǎng)絡(domain-adversarial training of neural networks,DANN)[14]、模型5 深度子領域自適應網(wǎng)絡(deep subdomain adaption network, DSAN)[15]。每個模型均進行10 次重復實驗取平均值,進而減小初始化模型的隨機誤差對診斷模型的影響。
采用深度學習框架Pytorch 構建診斷網(wǎng)絡,訓練時模型迭代輪數(shù)保持一致,設置訓練輪數(shù)為200輪,樣本個數(shù)batch 為32,采用Adam 梯度優(yōu)化方法,學習率為0.005。
以模型在測試集上的平均診斷精度和某次結果混淆矩陣來比較各方法的診斷性能。見表4 和圖6 所示,在混淆矩陣中橫縱坐標分別為診斷模型預測的標簽信息和樣本真實的標簽,其中0、1、2、3 與表4 中標簽號對應。使用遷移學習的方法普遍高于無遷移學習模型。其中,DeepCoral、DAN、DANN 方法的平均診斷精度分別為56.42%、75.17%、72.67%,DSAN 方法的平均診斷精度為84.53%,高于前4 類方法,因為其將局部最大均值差異引入模型訓練,利用目標域偽標簽減小條件分布差異進而實現(xiàn)子領域自適應。本文所提方法的平均診斷精度為87.53%,且標準差相較于其他方法更低,模型穩(wěn)定性較好,原因其在全局領域適配的基礎上,引入最大最小化分類器差異的對抗學習策略,進一步減小了源域和目標域特征的條件分布差異,更好地實現(xiàn)子領域的對齊。但各方法的準確率的標準差都較大,可能由于仿真數(shù)據(jù)相較于實驗數(shù)據(jù)的分布差異過大,導致模型訓練結果不穩(wěn)定。
表4 不同方法平均診斷精度
采用t分布領域嵌入將降維過后的特征進行數(shù)據(jù)并實現(xiàn)特征可視化。圖7 中源域為S,目標域為T,NO、OF、IF、BF 分別代表正常、外圈故障、內(nèi)圈故障、滾動體故障4 種故障狀態(tài)。上述對比方法的特征可視化結果可知,由于源域的訓練樣本帶有標簽,因此在采取遷移策略或不遷移時,源域數(shù)據(jù)不同故障類別的特征都可以得到有效區(qū)分。由圖7a 可知,在不使用遷移策略時,目標域的內(nèi)外圈故障樣本大部分都混淆在一起,導致分類精度低。由圖7b~圖7d 可知,DeepCoral、DAN、DANN 這3 種方法可以將目標域類別的故障特征分得更加清晰,但仍存在混疊區(qū)域。由圖7e 可知,DSAN 考慮了目標域不同類別的子領域?qū)R,使特征類間距更小,不同類之間間距更大。由圖7f 可知,本文方法由于采用最大最小化分類器差異的域適配方法,能夠有效區(qū)分目標域不同類別之間的差異。但是也可以看出,源域目標域之間存在部分樣本的特征混疊和分類失敗結果,其主要原因是實際數(shù)據(jù)與仿真數(shù)據(jù)之間由于實際運行中不確定因素的影響導致分布差異過大。
圖7 各方法的特征可視化
本文針對實際工業(yè)生產(chǎn)中軸承故障樣本較少的問題,建立了滾動軸承動力學仿真模型,提出基于仿真數(shù)據(jù)和無監(jiān)督領域自適應的軸承故障診斷方法。得到了以下結論:
(1) 采用動力學仿真的方法獲取源域數(shù)據(jù)實現(xiàn)對實際數(shù)據(jù)進行故障診斷,降低了對試驗臺的依賴,具有一定的實際意義。
(2) 通過無監(jiān)督領域自適應方法,在實現(xiàn)不用域特征分布對齊基礎上,在目標域上引入最大最小分類器差異的對抗學習方法,進一步縮小了不同域特征的條件分布差異,增強了網(wǎng)絡模型的預適應能力。
(3) 通過在CWRU 軸承數(shù)據(jù)集上進行驗證并與不同的診斷方法進行對比,結果表明本文方法優(yōu)于DAN、DANN、DSAN 等方法,但由于數(shù)據(jù)分布差異,模型診斷精度和穩(wěn)定性依舊有可改進的空間。