牟紅霞
(山東職業(yè)學(xué)院,山東 濟南 250104)
隨著機械設(shè)備智能化水平提高和機械結(jié)構(gòu)日趨復(fù)雜,企業(yè)對設(shè)備的可靠性要求也越來越高。軸承等旋轉(zhuǎn)機械由于工況復(fù)雜多變而容易發(fā)生故障,不僅影響企業(yè)的生產(chǎn)效率,嚴(yán)重時會造成巨大的經(jīng)濟損失,甚至機毀人亡[1]。因此,研究軸承故障的智能診斷技術(shù)具有重要的經(jīng)濟意義和安全意義。
軸承的振動信號中包含有豐富的故障信息,能夠?qū)崟r準(zhǔn)確的反應(yīng)軸承當(dāng)前工作狀態(tài),因此軸承故障狀態(tài)實時監(jiān)測的信號主要為振動信號[2]。軸承故障診斷分為3個重要步驟:(1)振動信號的有效獲?。唬?)振動信號故障特征的提?。唬?)軸承故障模式的準(zhǔn)確識別。由于故障特征提取的優(yōu)劣直接影響故障診斷結(jié)果,因此故障特征提取最為關(guān)鍵,常見的故障特征提取方法包括時域特征、頻域特征和時頻域特征[3]。時域特征出現(xiàn)最早,包括峰值、裕度、峭度等[4],由于時域特征抗干擾性能差,因此極易發(fā)生誤判。頻域特征的基礎(chǔ)是傅里葉變換,頻域特征分析方法包括頻譜分析、倒譜分析、包絡(luò)分析等[5],由于頻域分析完全拋棄了時間域,因此無法分析非平穩(wěn)非線性的振動信號。時頻域特征結(jié)合了時域與頻域的優(yōu)點,即分析信號頻率隨時間的變化情況,先后出現(xiàn)了短時傅里葉變換、小波變換、經(jīng)驗?zāi)B(tài)分解等方法。文獻[6]使用短時傅里葉變換提取信號的時頻域特征,并使用卷積神經(jīng)網(wǎng)絡(luò)識別故障類型,經(jīng)驗證此方法對不同故障類型具有較高的識別準(zhǔn)確率;文獻[7]使用經(jīng)驗小波變換將振動信號分解為不同時間尺度的IMF分量,提取IMF分量中的時域、頻域、時頻域特征,而后使用流行學(xué)習(xí)法進行特征簡化,該方法提取的故障特征具有更高的識別準(zhǔn)確度;文獻[8]針對強噪聲背景下軸承微弱故障信號的特征提取問題,提出了級聯(lián)自適應(yīng)分段線性隨機共振系統(tǒng)降噪的經(jīng)驗?zāi)B(tài)分解方法,有效減少了經(jīng)驗?zāi)B(tài)分解階數(shù),實現(xiàn)了強噪聲背景下的微弱故障提取。傳統(tǒng)的時域特征、頻域特征和時頻域特征能夠有效提取軸承特征,但是由于種類繁多而難以選擇。而且,當(dāng)前故障診斷方法均假設(shè)訓(xùn)練樣本和測試樣本獨立同分布,這對變設(shè)備、變工況、變故障程度的情況明顯不適用。
這里研究了變設(shè)備、變工況條件下的軸承故障診斷問題,以深度卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),使用對抗訓(xùn)練的方式使深度學(xué)習(xí)網(wǎng)絡(luò)獲得域自適應(yīng)遷移能力,域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)能夠提取不同域數(shù)據(jù)的共同特征,實現(xiàn)變設(shè)備、變工況條件下的軸承故障精確識別。
在遷移學(xué)習(xí)中,域D使用特征空間x和邊緣概率分布P(x)進行定義和描述,含有n個故障樣本的數(shù)據(jù)集可記為{,其中xi∈x,即xi屬于特征空間x;yi∈y為樣本標(biāo)簽,y={1,2,…,k}為軸承故障標(biāo)簽值(即故障狀態(tài)值)。
傳統(tǒng)故障診斷方法一般假設(shè)測試樣本與訓(xùn)練樣本獨立同分布,因此經(jīng)訓(xùn)練集訓(xùn)練完畢的故障診斷模型直接用于測試集的故障診斷。但是,訓(xùn)練集一般是在設(shè)定的實驗環(huán)境下得到的,而將診斷模型應(yīng)用于實際診斷時,設(shè)備實際運行環(huán)境與實驗環(huán)境差別較大,必然引起故障模式誤判。將實驗環(huán)境下得到的有標(biāo)簽訓(xùn)練集稱為源域,記為Ds={xs,P(xs) },將工作環(huán)境下得到的無標(biāo)簽測試集稱為目標(biāo)域,記為Dt={xt,P(xt) },由于訓(xùn)練集與測試集之間分布存在差異,直接將訓(xùn)練模型應(yīng)用于測試集,必然引起模式誤判,如圖1所示。圖中實線區(qū)域為源域,虛線區(qū)域為目標(biāo)域,故障模式分界線依據(jù)訓(xùn)練集(即源域)確定。
圖1 故障模式誤判示意圖Fig.1 Diagram of Fault Mode Misjudgment
為了解決這一問題,這里提出了域自適應(yīng)遷移策略,該策略以提取測試集與訓(xùn)練集公共特征的方式,試圖減小測試集與訓(xùn)練集之間的分布偏移,達到提高診斷模型泛化能力的目的,域自適應(yīng)遷移效果,如圖2所示。
圖2 域自適應(yīng)遷移策略Fig.2 Domain Adaptive Migration Strategy
這里基于深度學(xué)習(xí)實現(xiàn)域自適應(yīng)遷移策略,因此首先介紹深度卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法。深度卷積神經(jīng)網(wǎng)絡(luò)由輸入層、卷積層、池化層、全連接層、輸出層等組成[9],其中卷積層與池化層交替出現(xiàn),兩者交替層數(shù)越多則特征提取越充分但同時計算量越大。
(1)卷積層。卷積層將上層輸出與卷積核做卷積運算,生成特征輸出,即:
(2)池化層。池化層作用是降低特征維度,提取最為重要的特征信息,防止出現(xiàn)過擬合問題。池化作用包括平均池化和最大池化兩種,由于軸承故障時振動信號出現(xiàn)周期性極值,因此最大池化方式在軸承故障特征提取中極為適用。最大池化方法為:
(3)全連接層。全連接層一般與輸出層的Softmax函數(shù)組成分類器,將最后一層池化層得到的輸出特征進行平鋪作為全連接層的輸入,全連接層輸出為:
式中:—第l+1層全連接層的第t個輸出結(jié)果—平鋪后的第k個特征量;—第l層第k個特征量與第l+1層第t個輸出的傳遞權(quán)值;—第l+1 層網(wǎng)絡(luò)的第k個神經(jīng)元偏差;F()—ReLU激活函數(shù)。
(4)輸出層。輸出層使用Softmax函數(shù)計算每個標(biāo)簽的歸一化概率,即:
式中:Hot—歸一化概率矩陣;
p(y=t)—輸出標(biāo)簽為t時的歸一化概率;
T—輸出標(biāo)簽數(shù)量。
從本質(zhì)上講,深度卷積神經(jīng)網(wǎng)絡(luò)中卷積層與池化層的交替過程為輸入數(shù)據(jù)的特征提取過程,而全連接層與輸出層為故障模式的識別過程。但是傳統(tǒng)的深度卷積神經(jīng)網(wǎng)絡(luò)明顯無法解決域之間分布差異帶來的故障誤判問題,這里將域自適應(yīng)遷移學(xué)習(xí)方法引入到深度卷積神經(jīng)網(wǎng)絡(luò)中,具體思路為:基于對抗訓(xùn)練的策略提取源域與目標(biāo)域的公共特征,公共故障特征具有源域與目標(biāo)域間的不可分辨性。
具有域自適應(yīng)遷移能力的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。圖中:Gf(·;θf)—故障特征提取模塊,有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)使用完全一致的網(wǎng)絡(luò)模型;Gd(·;θd)—二分類域識別器,用于判斷故障特征屬于源域或目標(biāo)域;Gy(·;θy)—標(biāo)簽分類器,判斷故障特征對應(yīng)的故障模式;θf—故障提取模塊的網(wǎng)絡(luò)參數(shù),θd—域識別器的網(wǎng)絡(luò)參數(shù),θy—標(biāo)簽分類器的網(wǎng)絡(luò)參數(shù)。實現(xiàn)域自適應(yīng)遷移的核心問題是提取源域與目標(biāo)域的公共故障特征,即Gf(·;θf)的構(gòu)造與訓(xùn)練。
圖3 域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)Fig.3 Deep Convolution Neutral Network With Domain Adaptive Migration
實現(xiàn)域自適應(yīng)遷移的具體方法為:使用圖3中的特征提取模塊Gf(·;θf)提取源域與目標(biāo)域的公共特征向量,將提取特征輸入到域判別模塊Gd(·;θd)中識別故障特征的域?qū)傩?,?dāng)Gd(·;θd)無法判斷出故障特征所屬域時,說明提取特征為源域和目標(biāo)域的公共特征。域自適應(yīng)遷移需解決兩個問題,一是故障提取的域不變性,二是故障模式的可識別性。
3.2.1 故障提取的域不變性。
域識別器Gd(·;θd)為二分類識別器,識別結(jié)果記為域標(biāo)簽di,當(dāng)di=0時表示識別結(jié)果為源域,當(dāng)di=1時表示識別結(jié)果為目標(biāo)域。二分類交叉熵?fù)p失能夠定量的評估識別器對源域和目標(biāo)域的識別能力,因此這里使用二分類交叉熵?fù)p失描述二分類器的識別能力。對于任意一個輸入樣本xi,域識別器Gd(·;θd)的二分類交叉熵?fù)p失為:
式中:Ld—二分類交叉熵?fù)p失。
式中:E()—二分類交叉熵?fù)p失正則項,是關(guān)于參數(shù)θf與參數(shù)θd的函數(shù);ns—源域數(shù)據(jù)量;nt—目標(biāo)域數(shù)據(jù)量。
使用對抗訓(xùn)練機制以交替的方式輪流訓(xùn)練域識別器參數(shù)θd與特征提取模塊參數(shù)θf,即:
式(7)中第一式表示熵?fù)p失朝著減小的方向?qū)?shù)θf進行訓(xùn)練,意味著模塊Gf(·;θf)提取的故障特征在源域和目標(biāo)域朝著無差異方向優(yōu)化,使得域識別器Gd(·;θd)無法準(zhǔn)確識別域標(biāo)簽;式(7)中第二式表示熵?fù)p失朝著增大的方向?qū)?shù)θd進行訓(xùn)練,從而提高模塊Gd(·;θd)的域識別能力,通過這種對抗交替訓(xùn)練的方式,逐漸減小源域數(shù)據(jù)特征與目標(biāo)域數(shù)據(jù)特征的差異。
3.2.2 故障模式的可識別性。
使用源域的有標(biāo)簽數(shù)據(jù)集可以訓(xùn)練標(biāo)簽分類器Gy(·;θy),實現(xiàn)對源域數(shù)據(jù)的準(zhǔn)確分類。而特征提取模塊Gf(·;θf)提取了源域與目標(biāo)域的無差別特征,因此標(biāo)簽分類器可以對目標(biāo)域特征進行分類。對于任一有標(biāo)簽數(shù)據(jù){},標(biāo)簽分類器Gf(·;θf)的交叉熵?fù)p失為:
在交叉熵?fù)p失中融入模型參數(shù)正則項,得到標(biāo)簽分類器模塊的參數(shù)優(yōu)化目標(biāo)函數(shù)為:
式中:λ—超參數(shù);Φ(θf,θy)—模型參數(shù)正則項。
綜合考慮故障提取的域不變性與故障模式的可識別性,得到參數(shù)θf、θd、θy的綜合訓(xùn)練目標(biāo)函數(shù)為:
式中:E(θf,θy,θd)—綜合訓(xùn)練目標(biāo)函數(shù),等式右側(cè)第一項為標(biāo)簽分類器的交叉熵?fù)p失項,第二項為參數(shù)正則項,第三項為域識別器的二分類交叉熵?fù)p失項。與前文對抗訓(xùn)練思路一致,得到參數(shù)的θf、θd、θy綜合對抗訓(xùn)練方法為:
對于參數(shù)θf、θd、θy的綜合訓(xùn)練,θy依據(jù)源域有標(biāo)簽數(shù)據(jù)集的交叉熵?fù)p失Ly進行訓(xùn)練,θd依據(jù)二分類交叉熵?fù)p失Ld進行訓(xùn)練,而θf則同時由Ly和Ld進行更新。由于θd朝著Ld增大的方向進行訓(xùn)練,文獻[10]以梯度反轉(zhuǎn)方式實現(xiàn)了θf與θd的交替訓(xùn)練,這里以改寫二分類交叉熵?fù)p失函數(shù)的方式,使θd朝著改寫熵?fù)p失函數(shù)減小的方向訓(xùn)練,為:
式(12)將域標(biāo)簽更改為相反值,即源域時di=1,目標(biāo)域時di=0。按照這種構(gòu)造方法,θd朝Ld增大的方向優(yōu)化,就相當(dāng)于朝著Ld'減小的方向優(yōu)化,因此可以傳統(tǒng)的參數(shù)訓(xùn)練方法。這里選擇隨機梯度下降法進行參數(shù)訓(xùn)練,為:
式中:μ—學(xué)習(xí)效率。
基于深度卷積神經(jīng)網(wǎng)絡(luò)的域自適應(yīng)遷移故障診斷可以分為3步實現(xiàn):
(1)使用源域的有標(biāo)簽數(shù)據(jù)集對圖3中的特征提取模塊和標(biāo)簽分類器模塊進行預(yù)訓(xùn)練,訓(xùn)練完畢的特征提取模塊參數(shù)作為此模塊的參數(shù)初值,訓(xùn)練完畢的標(biāo)簽分類器模塊參數(shù)作為此模塊的參數(shù)終值。
(2)將預(yù)訓(xùn)練所得參數(shù)作為特征提取模塊參數(shù)初值,綜合使用源域數(shù)據(jù)集和目標(biāo)域數(shù)據(jù)集,以深度對抗訓(xùn)練的方式,確定特征提取模塊參數(shù)和域識別器模塊參數(shù),實現(xiàn)域自適應(yīng)遷移能力,減小源域和目標(biāo)域的特征差異。
(3)將目標(biāo)域數(shù)據(jù)集輸入到訓(xùn)練完畢的診斷模型中,進行故障模式識別。
這里使用美國凱斯西儲大學(xué)的軸承數(shù)據(jù)和智能維護系統(tǒng)中心的軸承數(shù)據(jù)構(gòu)造不同設(shè)備、不同工況下的故障診斷實驗。
美國凱斯西儲大學(xué)軸承數(shù)據(jù)樣本:選擇軸承型號為SKF6205的數(shù)據(jù)樣本,軸承狀態(tài)分為正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障,選擇故障直徑為0.007英寸下的實驗數(shù)據(jù),實驗采樣頻率為12kHz,在實驗載荷分別為0HP、1HP、2HP、3HP條件下各選取250個樣本,每個樣本長度為2048,則共抽取250×4×4=4000個樣本數(shù)據(jù),此樣本記為樣本A。
智能維護系統(tǒng)中心軸承數(shù)據(jù)樣本:此數(shù)據(jù)集包含型號為Rexnord ZA-2115 軸承的全周期振動數(shù)據(jù),隨著退化實驗的進行,軸承故障程度不斷加深。實驗結(jié)束時1#軸承為外圈故障,3#軸承為內(nèi)圈故障,4#軸承為滾動體故障,實驗采樣頻率為20kHz,抽取每種工作狀態(tài)下1000個樣本,樣本長度為2048。共抽取兩組樣本,分別記為樣本B和樣本C,由于此實驗為軸承的全周期實驗,因此樣本B和樣本C為不同故障程度下的軸承實驗數(shù)據(jù)。
為了形成對比,這里同時使用傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)與域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)進行變設(shè)備、變工況下的模式識別,傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)沒有域識別器模塊,其余結(jié)構(gòu)與域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)一致。域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)由13層網(wǎng)絡(luò)構(gòu)成,1~10層為卷積層與池化層交替,功能上講為特征提取模塊Gf(·;θf),11~13層為全連接層與輸出層,功能上講為標(biāo)簽分類器Gy(·;θy);并列11~13層為域識別器Gd(·;θd),網(wǎng)絡(luò)結(jié)構(gòu),如表1所示。傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)使用源域的有標(biāo)簽數(shù)據(jù)集進行訓(xùn)練后,直接應(yīng)用于目標(biāo)域的故障模式識別;而域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)按照3.3節(jié)的過程進行訓(xùn)練,從而獲得域自適應(yīng)遷移能力和故障模式判別能力。
表1 網(wǎng)絡(luò)結(jié)構(gòu)Tab.1 Network Structure
根據(jù)4.1 節(jié)抽取的樣本A、樣本B和樣本C,設(shè)計4 組遷移實驗,分別為A→B,A→C,B→A和C→A。以A→B為例,其含義為以樣本A為源域的有標(biāo)簽數(shù)據(jù)集,以樣本B為目標(biāo)域的無標(biāo)簽數(shù)據(jù)集進行診斷。傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)和域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)對4種遷移實驗的診斷結(jié)果,如表2所示。
表2 診斷結(jié)果Tab.2 Diagnosis Result
由表2可知,在變設(shè)備、變工況條件下,傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)在4組實驗中的診斷準(zhǔn)確率均值為64.5%,域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率均值為94.9%,比傳統(tǒng)深度學(xué)習(xí)方法提高了47.13%,說明域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)能夠有效應(yīng)對變設(shè)備、變工況條件下的軸承故障診斷問題,基于深度對抗訓(xùn)練的域識別器與特征提取模塊聯(lián)合訓(xùn)練方法,能夠有效提取源域與目標(biāo)域的共同特征,從而獲得域自適應(yīng)遷移能力。
為了更加直觀地展示域遷移效果,使用t-分布鄰域嵌入算法[11]對標(biāo)簽分類器最后一層全連接層的特征降維到2維空間,以遷移實驗A→B、A→C為例,降維后特征的空間分布,如圖4、圖5所示。圖中橫縱坐標(biāo)均為無量綱特征量,圖例中“內(nèi)”指內(nèi)圈故障“源”指源域,“目”指目標(biāo)域,“內(nèi)-源”指源域的內(nèi)圈故障數(shù)據(jù),其余與此含義解釋一致。
圖4 A→B實驗的特征量分布Fig.4 Characteristic Quantity Distribution of Experiment A→B
圖5 A→C實驗的特征量分布Fig.5 Characteristic Quantity Distribution of Experiment A→C
分析圖4、圖5可以看出,對于源域數(shù)據(jù),傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò)能夠有效進行故障模式識別,但是由于目標(biāo)域與源域存在分布差異,直接將深度學(xué)習(xí)模型應(yīng)用于目標(biāo)域時,存在大片重合和混疊區(qū)域,無法有效識別出故障模式。而域自適應(yīng)遷移深度學(xué)習(xí)網(wǎng)絡(luò)能夠明確區(qū)分源域和目標(biāo)域的4種軸承狀態(tài),不存在重合和混疊部分,說明這里設(shè)計的域自適應(yīng)遷移技術(shù)有效減小了源域和目標(biāo)域的分布差異,實現(xiàn)了變設(shè)備、變工況條件下的軸承狀態(tài)精確識別。
這里研究了變設(shè)備、變工況條件下的軸承故障診斷問題,以深度卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),以對抗訓(xùn)練機制實現(xiàn)了深度學(xué)習(xí)網(wǎng)絡(luò)的域自適應(yīng)遷移能力。經(jīng)實驗驗證得出以下結(jié)論:(1)在變設(shè)備和變工況條件下,域自適應(yīng)遷移深度卷積神經(jīng)網(wǎng)絡(luò)能夠以較高精度識別軸承故障模式,識別精度遠高于傳統(tǒng)深度卷積神經(jīng)網(wǎng)絡(luò);(2)對抗訓(xùn)練方式能夠使深度學(xué)習(xí)網(wǎng)絡(luò)有效獲得域自適應(yīng)遷移能力。