蘇靖涵,張 瀟
(1.南開大學(xué) 電子信息與光學(xué)工程學(xué)院,天津 300350;2.徐州醫(yī)科大學(xué) 醫(yī)學(xué)信息與工程學(xué)院,江蘇 徐州 221008)
在現(xiàn)代工業(yè)領(lǐng)域中,旋轉(zhuǎn)機(jī)械設(shè)備的運(yùn)行狀態(tài)將直接影響工業(yè)生產(chǎn)的進(jìn)程和效率,而作為其核心部件之一的滾動軸承發(fā)生故障將直接影響設(shè)備的安全運(yùn)行,因此,滾動軸承的故障診斷研究對保障工業(yè)機(jī)械設(shè)備安全穩(wěn)定運(yùn)行具有重要意義[1-3]。
隨著傳感器技術(shù)、工業(yè)互聯(lián)網(wǎng)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的快速發(fā)展,基于人工智能數(shù)據(jù)驅(qū)動的故障診斷方法逐漸成為研究熱點(diǎn)[1]。近年來,深度學(xué)習(xí)理論作為研究熱點(diǎn),由于深度學(xué)習(xí)模型具備強(qiáng)大的特征提取能力,能夠克服淺層學(xué)習(xí)模型的缺陷,進(jìn)而在機(jī)械故障診斷領(lǐng)域獲得了越來越多的關(guān)注[2-5]。然而,面對實(shí)際工業(yè)場景下的故障診斷,存在如下問題[1,3,6]:(1)由于機(jī)械設(shè)備運(yùn)行工況復(fù)雜多變,導(dǎo)致故障診斷模型的訓(xùn)練樣本與實(shí)際運(yùn)行過程中的軸承振動信號樣本存在分布差異,而傳統(tǒng)的深度故障診斷模型大多假設(shè)訓(xùn)練樣本與測試樣本是相同分布。(2)實(shí)際工況下的軸承故障樣本不足。機(jī)械設(shè)備中正常狀態(tài)的軸承在不同工況下運(yùn)行的監(jiān)測數(shù)據(jù)易獲取,但若想獲取不同工況下的故障數(shù)據(jù),代價(jià)巨大。
針對上述問題,遷移學(xué)習(xí)方法在近年來逐漸獲得研究者的關(guān)注,遷移學(xué)習(xí)旨在利用已有領(lǐng)域(源域)的知識解決不同但相關(guān)領(lǐng)域(目標(biāo)域)的問題,包括基于樣本、基于特征、基于關(guān)系和基于模型的4種遷移方法[2-5]。文獻(xiàn)[1]提出了一種深度在線遷移的故障診斷方法,通過建立CNN-ISVM預(yù)訓(xùn)練模型并保存參數(shù),使在線處理新增目標(biāo)數(shù)據(jù)時(shí),無需重新訓(xùn)練,實(shí)驗(yàn)表明所提出方法能夠較好實(shí)現(xiàn)變負(fù)載下的滾動軸承多狀態(tài)在線故障分類。文獻(xiàn)[3]針對軸承監(jiān)測數(shù)據(jù)嚴(yán)重缺乏的問題,提出一種用于不同機(jī)械設(shè)備間軸承故障診斷的深度遷移自編碼器模型,采用可縮放指數(shù)型線性單元作為自編碼器的激活函數(shù),修正代價(jià)函數(shù)來降低重構(gòu)誤差,最后采用不同設(shè)備中的軸承開展實(shí)驗(yàn),驗(yàn)證了所提出方法的有效性與適應(yīng)性。文獻(xiàn)[6]利用稀疏自編碼器構(gòu)建深度遷移學(xué)習(xí)模型,用于不同載荷工況下的軸承故障診斷。文獻(xiàn)[7]針對不同設(shè)備,提出了一種增強(qiáng)深度自編碼器用于跨域故障診斷,實(shí)驗(yàn)分析表明,所提出的方法能夠表現(xiàn)出更優(yōu)的故障診斷性能。然而,上述文獻(xiàn)中的故障診斷方法關(guān)注于深度模型的遷移,而未考慮特征間分布差異和判別性能對深度模型遷移后的故障分類影響。對此,本文提出一種新的變工況下滾動軸承故障診斷框架,首先,利用小波包變換(WPT,wavelet packet transform)處理原始信號,進(jìn)行統(tǒng)計(jì)特征提取,構(gòu)建源域和目標(biāo)域特征樣本;其次,利用源域帶標(biāo)簽樣本與目標(biāo)域正常狀態(tài)樣本,綜合考慮特征的判別性能和域間分布差異,選取更有利于跨域故障診斷的特征構(gòu)建源域特征子集;然后,利用源域特征子集訓(xùn)練深度自編碼器(DAE,deep auto encoder),將模型參數(shù)直接遷移至目標(biāo)域,在微調(diào)階段,利用源域帶標(biāo)簽特征樣本與目標(biāo)域正常狀態(tài)特征樣本進(jìn)行遷移學(xué)習(xí),獲得深度遷移模型;最后,診斷模型對目標(biāo)域無標(biāo)簽特征樣本進(jìn)行識別分類,輸出故障診斷結(jié)果。
樸素貝葉斯算法是一種基于貝葉斯定理的數(shù)據(jù)分類方法,其通過貝葉斯公式對已有樣本數(shù)據(jù)的類別進(jìn)行判別[9]。貝葉斯公式如下:
(1)
式中,P(A|B)表示A在B條件下的后驗(yàn)概率;P(B|A)表示B在A條件下的后驗(yàn)概率;P(A)和P(B)均為先驗(yàn)概率;樸素貝葉斯算法分類的原理是將事件的先驗(yàn)概率和后驗(yàn)概率相聯(lián)系,并利用先驗(yàn)信息預(yù)測事件的后驗(yàn)概率。
(2)
式中,P(t1,t2,…,tn|cj)為故障類型ai∈Rm的條件概率;式中P(cj)為Rd(d (3) 在基于特征的遷移學(xué)習(xí)中,最大均值差異(Maximum mean discrepancy,MMD)被常應(yīng)用于度量不同域數(shù)據(jù)間分布差異[2,10]。給定源域特征樣本XS與目標(biāo)域特征樣本XT,有PT(XT)≠PS(XS),則兩個(gè)域間的邊緣分布差異有: (4) 式中,φ為再生核Hilbert空間H中的非線性映射函數(shù),nS與nT分別為源域與目標(biāo)域的樣本數(shù)。 為從原始特征集中選取更有利于跨域故障診斷的特征用于深度模型的訓(xùn)練和遷移,本文提出基于基于樸素貝葉斯與域間差異的特征選取方法(FSBD),F(xiàn)SBD從兩方面角度評價(jià)特征,特征的判別性能和特征在不同域間的分布差異。我們認(rèn)為,判別性能高且在不同域間的分布差異小的特征更有利于跨域故障診斷和深度模型的遷移。 給定工況1下的帶標(biāo)簽軸承特征樣本作為源域XS,工況2下的正常狀態(tài)特征樣本和無標(biāo)簽故障特征樣本作為目標(biāo)域XT。源域與目標(biāo)域樣本中均包含M種故障類型(包括正常狀態(tài)),每種故障類型有N個(gè)樣本,每個(gè)樣本有K種特征。本節(jié)中,對于特征判別性能的評估,利用樸素貝葉斯算法對源域中每種特征樣本進(jìn)行分類,得到的分類精度作為表征特征判別性能的指標(biāo)。對于特征在不同域間分布差異的度量,利用MMD度量源域和目標(biāo)域中正常狀態(tài)下的特征樣本的邊緣分布差異。最后,基于樸素貝葉斯算法的分類精度和特征的MMD值,構(gòu)建新的特征選取指標(biāo)FSI。FSBD的具體步驟如下: (5) ACC={acc(1),acc(2),…,acc(K)} (6) (7) DD={MMD(1),MMD(2),…,MMD(K)} (8) 3)構(gòu)建新的特征選取指標(biāo)FSI?;谇皟刹襟E獲得的分類精度序列ACC和域間差異序列DD,構(gòu)建新的特征選取指標(biāo)FSI,表達(dá)式如下: (9) 對于K種特征,可得到FSI序列如下: FSI={FSI(1),FSI(2),…,FSI(K)} (10) 本文認(rèn)為,特征的ACC值越大,其用于分類的判別性能越好,特征在不同域間分布差異MMD越小,則其域適應(yīng)能力越強(qiáng)。因此,當(dāng)FSI值越大,則對應(yīng)的特征更有利于跨域故障診斷和深度模型遷移。最后,將FSI序列根據(jù)數(shù)值大小降序排列,選取前d個(gè)數(shù)值對應(yīng)的特征用于后續(xù)的深度模型訓(xùn)練和遷移。 自編碼器(Auto encoder,AE)[8]是一種無監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它能夠從無標(biāo)簽數(shù)據(jù)集中學(xué)習(xí)提取出深層特征。AE包括編碼和解碼兩個(gè)過程,自編碼器的結(jié)構(gòu)可分為三層,輸入層、隱含層和輸出層[10],其結(jié)構(gòu)如圖1所示。 圖1 一個(gè)自編碼器的結(jié)構(gòu) 在編碼過程,輸入層數(shù)據(jù){x1,x2,...,xm}通過激活函數(shù)φact(·)映射到隱含層{h1,h2,...,hn},映射關(guān)系如下所示: h=φact(W·x+b) (11) 其中,W∈Rn×m為編碼權(quán)重矩陣,b∈Rn為偏置向量。在解碼過程,隱藏層數(shù)據(jù){h1,h2,...,hn}通過激活函數(shù)φact(·)映射到輸出層{z1,z2,...,zm},映射關(guān)系如下所示: z=φact(W′·h+b′) (12) 其中,W′∈Rm×n為解碼權(quán)重矩陣,b′∈Rm為偏置向量。AE的參數(shù)通過最小化重構(gòu)誤差為優(yōu)化目標(biāo),訓(xùn)練獲得,其重構(gòu)誤差如下所示: (13) 其中,θ={W,b,W′,b′}為自編碼器參數(shù)。 深度自編碼器的構(gòu)建,本文是將多個(gè)AE疊加在一起,即堆疊自編碼器(stacked auto encoders,SAE),將每個(gè)AE經(jīng)編碼后的隱含層作為下一級AE的輸入層,最后一級AE的隱含層作為輸出的深度特征,最后輸入分類器。上述深度自編碼器的訓(xùn)練有兩個(gè)階段: 1)無監(jiān)督預(yù)訓(xùn)練。利用訓(xùn)練集樣本進(jìn)行各層AE訓(xùn)練,獲得深度自編碼器的參數(shù)。 2)對深度自編碼器網(wǎng)絡(luò)的整體進(jìn)行有監(jiān)督微調(diào)。 為實(shí)現(xiàn)跨域故障診斷,本文在深度自編碼器的基礎(chǔ)上,構(gòu)建深度遷移自編碼器,具體過程如下: 1)設(shè)置AE模型的激活函數(shù),本文采用SELU函數(shù)作為激活函數(shù);設(shè)置深度自編碼器的結(jié)構(gòu)層數(shù),每層節(jié)點(diǎn)數(shù)。 2)利用源域無標(biāo)簽特征數(shù)據(jù)訓(xùn)練深度自編碼器模型,獲得每一層的編碼權(quán)重參數(shù)和偏置參數(shù)。 3)將利用源域數(shù)據(jù)訓(xùn)練得到的深度自編碼器模型的結(jié)構(gòu)層數(shù),節(jié)點(diǎn)層數(shù),編碼權(quán)重參數(shù)以及偏置參數(shù)遷移至目標(biāo)域的模型,作為針對目標(biāo)域數(shù)據(jù)的深度自編碼器初始參數(shù)。 4)利用softmax分類器構(gòu)建分類層,連接在深度自編碼器的最后一層,再利用目標(biāo)域中正常狀態(tài)下特征數(shù)據(jù)對連接了分類層的深度自編碼器進(jìn)行Fine-tuning微調(diào)。 5)獲得深度遷移自編碼器模型,可用于目標(biāo)域無標(biāo)簽特征數(shù)據(jù)的分類。 本文基于信號處理,提出的基于樸素貝葉斯與域間差異的特征選取方法和深度遷移自編碼器,提出一種新的應(yīng)用于變工況下軸承故障診斷框架FS-DTAE,如圖2所示。該框架主要包括3個(gè)步驟:信號處理與特征提取,特征選取和深度遷移學(xué)習(xí)。具體描述如下: 圖2 基于深度遷移自編碼器的變工況下軸承故障診斷框架FS-DTAE 1)信號處理與特征提取。本文利用WPT對采集到的軸承振動信號進(jìn)行分解,結(jié)合統(tǒng)計(jì)參數(shù),提取統(tǒng)計(jì)特征作為原始特征集。 2)特征選取。為從高維原始特征集中選取有利于跨域故障診斷和深度遷移學(xué)習(xí)的特征,基于源域有標(biāo)簽特征數(shù)據(jù)和目標(biāo)域正常狀態(tài)數(shù)據(jù),利用提出的特征選取方法FSBD,對原始特征集中各特征進(jìn)行判別性能與域間差異的度量,提出新的量化指標(biāo)FSI?;诮敌蚺帕械腇SI序列,選取特征構(gòu)建子集,用于后續(xù)的深度模型訓(xùn)練與遷移。 3)深度遷移學(xué)習(xí)。在第二步基礎(chǔ)上,獲得源域和目標(biāo)域特征子集。首先,利用源域無標(biāo)簽特征子集數(shù)據(jù)作為訓(xùn)練樣本,訓(xùn)練深度自編碼器;其次,將源域訓(xùn)練得到的深度自編碼器參數(shù)遷移至目標(biāo)域,作為目標(biāo)域深度自編碼器模型的初始化參數(shù)。最后,利用源域和目標(biāo)域中正常狀態(tài)的特征數(shù)據(jù)對目標(biāo)域深度自編碼器進(jìn)行Fine-tuning微調(diào)。最后,目標(biāo)域無標(biāo)簽特征數(shù)據(jù)測試深度遷移自編碼器的故障診斷性能。 為驗(yàn)證本文所提出的變工況下軸承故障診斷框架FS-DTAE的有效性與適應(yīng)性,采用美國凱斯西儲大學(xué)(CWRU)的軸承振動數(shù)據(jù)開展不同工況下故障診斷實(shí)驗(yàn)驗(yàn)證。 本文使用的CWRU軸承數(shù)據(jù)采集自圖3所示的故障模擬試驗(yàn)臺,該數(shù)據(jù)集廣泛的被研究人員用于開展軸承故障診斷研究。該試驗(yàn)臺軸承有三類故障,內(nèi)圈缺陷,外圈缺陷以及滾動體缺陷,缺陷的尺寸包括0.007英寸、0.014英寸、0.021英寸和0.028英寸。振動數(shù)據(jù)集中包含4種不同運(yùn)行狀態(tài)下的振動數(shù)據(jù),分別為0 hp、1 hp、2hp和3 hp電機(jī)負(fù)載情況下?;谠摂?shù)據(jù)集,本文設(shè)置2個(gè)跨域故障診斷任務(wù),任務(wù)1中,2 hp和3 hp下的故障數(shù)據(jù)分別作為源域和目標(biāo)域;任務(wù)2中,2 hp和3 hp下的故障數(shù)據(jù)分別作為目標(biāo)域和源域。兩個(gè)任務(wù)的實(shí)驗(yàn)數(shù)據(jù)具體如表1所示。任務(wù)1和2中,源域和目標(biāo)域數(shù)據(jù)均包含12種軸承故障樣本,對應(yīng)的類別標(biāo)簽為1-12,其中源域中樣本數(shù)為240,目標(biāo)域中樣本數(shù)為480。每個(gè)樣本包含2 000個(gè)采樣數(shù)據(jù)點(diǎn)。 圖3 CWRU的軸承故障實(shí)驗(yàn)臺 表1 CWRU軸承振動數(shù)據(jù)集 根據(jù)本文提出的FS-DTAE故障診斷框架,首先,利用WPT對軸承振動信號進(jìn)行四層分解(母小波為“demy”),基于第四層的16個(gè)終端節(jié)點(diǎn)的單支重構(gòu)信號(16個(gè)信號),和重構(gòu)信號的16個(gè)Hilbert包絡(luò)譜,計(jì)算11種統(tǒng)計(jì)參數(shù)[5,11-13](極差,平均值,標(biāo)準(zhǔn)差,峰度,能量,能量熵,偏度,波峰因子,脈沖因子,形狀因子和緯度因子)。因此,共計(jì)算得到352個(gè)統(tǒng)計(jì)特征,構(gòu)建原始特征集(Raw feature set,RFS)。 在原始特征集基礎(chǔ)上,運(yùn)用本文提出的FSBD方法,評價(jià)各特征的判別性能和不同域間差異,獲取特征選取的量化指標(biāo)FSI,圖4所示為352個(gè)特征值的FSI值。根據(jù)得到的FSI值序列,進(jìn)行降序排列,選取序列中前d個(gè)FSI值對應(yīng)的統(tǒng)計(jì)特征構(gòu)建特征子集,再進(jìn)行深度自編碼器訓(xùn)練和模型遷移。本文基于從源域選取的特征用于深度自編碼器訓(xùn)練,設(shè)置隱含層4個(gè),每層節(jié)點(diǎn)個(gè)數(shù)分別為400,200,100和50,分類層為softmax分類器。 圖4 352個(gè)統(tǒng)計(jì)特征的FSI值 為進(jìn)一步驗(yàn)證本文所提出框架的優(yōu)越性,選取一些經(jīng)典和常用遷移學(xué)習(xí)的故障診斷方法進(jìn)行實(shí)驗(yàn)對比。經(jīng)典方法包括SVM,KNN,CNN和DBN,常用遷移學(xué)習(xí)方法包括TCA和JDA[14-16]。基于上述方法,構(gòu)建對比故障診斷模型,如表2所示。舉例說明,RFS-SVM模型表示源域的特征數(shù)據(jù)全部作為SVM的輸入,進(jìn)行故障診斷模型的訓(xùn)練,再利用訓(xùn)練好的模型對目標(biāo)域進(jìn)行故障分類;RFS-TCA/JDA模型表示源域和目標(biāo)域無標(biāo)簽特征數(shù)據(jù)經(jīng)TCA/JDA處理后,再輸入SVM分類器進(jìn)行模型訓(xùn)練,訓(xùn)練好的模型再對目標(biāo)域特征數(shù)據(jù)進(jìn)行故障分類[17-20]。RFS-FSBD-TCA/JDA模型則是在RFS-TCA/JDA模型基礎(chǔ)上引入本文所提出的特征選取方法,特征選取后構(gòu)建的特征子集再進(jìn)行TCA/JDA處理。 表2 對比故障診斷模型 基于表2中所示的對比模型,進(jìn)行表1中所示的故障診斷任務(wù)1和2,對應(yīng)的故障診斷結(jié)果如表3和圖5所示。圖5所示為表2中各故障診斷模型的實(shí)驗(yàn)結(jié)果對比,表3所示為所提出的FS-DTAE模型,RFS-FSBD-TCA和RFS-FSBD-JDA模型在不同的特征選取數(shù)時(shí)的故障診斷結(jié)果。 表3 軸承故障診斷結(jié)果 圖5所示的實(shí)驗(yàn)結(jié)果對比表明本文所以出的故障診斷模型在不同工況下的故障診斷性能最優(yōu),任務(wù)1和任務(wù)2的故障診斷精度最高分別可達(dá)99.79%和100%,高于其他對比模型的最大故障診斷精度。對比模型中,將本文提出的特征選取方法FSBD與遷移學(xué)習(xí)方法結(jié)合起來,能夠明顯提高故障診斷精度,RFS-FSBD-TCA和RFS-FSBD-JDA兩個(gè)模型在任務(wù)1中所取得的最大故障診斷精度分別為95.21%和98.13%,在任務(wù)2中,最大故障診斷精度可達(dá)98.13%和97.92%。表明,F(xiàn)SBD方法所選取出的特征更有利于跨域故障診斷和遷移學(xué)習(xí)過程,進(jìn)而提高模型的故障診斷性能。 圖5 不同故障診斷模型的實(shí)驗(yàn)結(jié)果對比 表3所示的故障診斷結(jié)果表明本文提出的特征選取方法FSBD在選取合適的特征數(shù)時(shí),能夠明顯提高故障診斷準(zhǔn)確率,對于FS-DTAE模型,任務(wù)1中,根據(jù)降序FSI序列選取前120個(gè)特征用于后續(xù)的模型訓(xùn)練和遷移,能夠取得最大的故障診斷準(zhǔn)確率;任務(wù)2中,選取前100個(gè)特征可達(dá)到100%的診斷準(zhǔn)確率。FSBD與遷移學(xué)習(xí)方法TCA和JDA結(jié)合起來構(gòu)建的故障診斷模型,基于降序FSI序列選取一定數(shù)量的特征,能夠提升模型的故障診斷性能。 本文在信號處理與統(tǒng)計(jì)特征提取,特征選取和深度自編碼器基礎(chǔ)上,提出了一種新的基于深度遷移自編碼器的軸承故障診斷模型FS-DTAE,旨在提高在不同工況下的軸承故障診斷準(zhǔn)確率。利用CWRU軸承故障數(shù)據(jù)開展不同工況下的故障診斷實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明: 1)本文所提出的FS-DTAE模型與設(shè)置的對比模型相比,取得的故障診斷準(zhǔn)確率最高,驗(yàn)證了該模型在不同工況下故障診斷的有效性和優(yōu)越性。 2)本文提出的特征選取方法FSBD能夠明顯提高遷移故障診斷模型的診斷準(zhǔn)確率?;谠继卣鞯慕敌騀SI序列,分別選取前120個(gè)和100個(gè)特征時(shí),可使FS-DTAE模型在任務(wù)1和2的故障診斷結(jié)果分別達(dá)到99.79%和100%。 3)本文提出的FSBD方法與其他遷移學(xué)習(xí)方法結(jié)合,同樣能夠明顯提高故障診斷準(zhǔn)確率,表明該方法所選取出的特征更有利于跨域故障診斷和遷移學(xué)習(xí)。 綜合實(shí)驗(yàn)結(jié)果分析,本文所提出的FSBD方法能夠提升故障診斷模型的性能,使構(gòu)建的深度遷移模型達(dá)到理想的故障診斷準(zhǔn)確率。1.2 最大均值差異
1.3 基于樸素貝葉斯與域間差異的特征選取(FSBD)
2 深度遷移自編碼器
2.1 堆疊自編碼器
2.2 深度遷移自編碼器
3 故障診斷框架
4 實(shí)驗(yàn)驗(yàn)證
4.1 實(shí)驗(yàn)設(shè)置與任務(wù)
4.2 實(shí)驗(yàn)結(jié)果分析
5 結(jié)束語