許愛華,杜 洋,段玉波,許瀚鋒
(1.東北石油大學(xué)電氣信息工程學(xué)院,黑龍江 大慶 163318;2.國網(wǎng)山東省電力公司臨邑縣供電公司,山東 德州 251500)
由于軸承在電機運行中的重要作用與地位,以及軸承故障診斷的復(fù)雜性,使電機軸承故障診斷成為了電機故障診斷研究領(lǐng)域的一個熱點課題。之前的很長一段時間內(nèi)對于軸承故障診斷工作的主流方案多是從為了有效的特征信息提取出發(fā),通過采用各種有效的特征提取算法,對采集到的軸承振動信號進(jìn)行多樣的預(yù)處理,進(jìn)而通過選擇合適的分類模型對故障類型進(jìn)行分類。受限于特征提取算法對于人工干預(yù)與專家經(jīng)驗介入的依賴,目前所使用的軸承故障分類方法的可靠性與準(zhǔn)確性較低。
隨著機器學(xué)習(xí)的進(jìn)一步發(fā)展及深度學(xué)習(xí)的再次火熱,目前部分學(xué)者開始將其與軸承故障診斷工作結(jié)合起來進(jìn)行研究。郭亮等[1]通過提取時域、頻域以及時頻域特征輸入到稀疏自編碼網(wǎng)絡(luò)進(jìn)行訓(xùn)練分類;趙光權(quán)等[2]提出一種基于深度置信網(wǎng)絡(luò)的故障特征提取及診斷方法;王麗華等[3]提出了一種基于短時傅里葉變換與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合的電機故障診斷方法;袁建虎等[4]提出了一種基于小波分析基礎(chǔ)上的時頻圖結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承的故障診斷方法。上述幾種方法的使用均在一定程度上提高了軸承故障診斷工作的效率和準(zhǔn)確率,但同樣擺脫不了對原始數(shù)據(jù)預(yù)處理工作的依賴?;诖?,許愛華等[5]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)處理大數(shù)據(jù)樣本的優(yōu)點,通過構(gòu)建大數(shù)據(jù)樣本,直接將原始數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,對模型訓(xùn)練分類,不再需要對數(shù)據(jù)進(jìn)行預(yù)處理,較大程度上擺脫了人工干預(yù)和經(jīng)驗干預(yù)。該方法實現(xiàn)了一定的突破,但需要大量訓(xùn)練樣本方能發(fā)揮其強大的自學(xué)習(xí)能力,在一定程度上降低了軸承故障診斷工作的效率。因此,本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)特征提取的優(yōu)勢和門控循環(huán)單元處理時序數(shù)據(jù)的有效性,提出了基于卷積神經(jīng)網(wǎng)絡(luò)與門控循環(huán)單元(C-GRU)的軸承故障診斷模型,使用Softmax分類器進(jìn)行分類,希望在樣本數(shù)量減小的情況下也能獲得較好的準(zhǔn)確率。
因本文后續(xù)用到卷積神經(jīng)網(wǎng)絡(luò)(CNN),故這里對CNN的特征提取過程做一個簡單的介紹,CNN通過構(gòu)建卷積層,對輸入的數(shù)據(jù)進(jìn)行卷積運算后生成新的數(shù)據(jù),新數(shù)據(jù)的每個值即代表卷積核所覆蓋的一小片區(qū)域內(nèi)數(shù)據(jù)的一個特征表示。在模型的卷積層間,卷積核通過對提取的特征矢量進(jìn)行卷積操作后,使用非線性激活函數(shù)構(gòu)建新的特征矢量,同時,每個卷積層的輸出結(jié)果均對應(yīng)多對輸入特征的卷積結(jié)果[6-8]。其數(shù)學(xué)表達(dá)式為:
(1)
(2)
同時通過設(shè)置池化層,對每個覆蓋區(qū)域中選擇一個具有代表性的向量值,實現(xiàn)對特征向量的約簡[10]。通過池化層的操作,能夠大大減少數(shù)據(jù)的空間大小,并減少參數(shù)數(shù)目,提高模型的訓(xùn)練效率。此外,池化層的存在使得CNN網(wǎng)絡(luò)對于噪聲干擾具有一定程度的“免疫性”,即降低訓(xùn)練樣本中噪聲對池化層輸出的影響。
GRU單元作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種,和長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)一樣,他們的提出都是為了解決反向傳播和長期記憶中的梯度消失或爆炸問題而提出的,GRU單元內(nèi)部將LSTM內(nèi)部中三個控制門的結(jié)構(gòu)改為了兩個控制門的結(jié)構(gòu),在提高了效率的同時,與LSTM具有相似的效果。
1.2.1 重置門與更新門
GRU單元將LSTM單元中的輸入門、遺忘門以及輸出門的結(jié)構(gòu),減少為重置門與更新門兩個門的結(jié)構(gòu),從而改變了LSTM中對隱藏狀態(tài)的計算方式。重置門的作用是有助于捕捉時序數(shù)據(jù)中短期的依賴關(guān)系,而更新門的作用是有助于捕捉時序數(shù)據(jù)中長期依賴關(guān)系。重置門與更新門的結(jié)構(gòu)如圖1所示。其中GRU單元中的重置門與更新門的輸入均為當(dāng)前時間步Xt,與上一時間步的隱藏狀態(tài)Ht-1,輸出的值由激活函數(shù)為Sigmoid函數(shù)的全連接層計算得到[11]。
圖1 GRU單元中重置門與更新門的計算
具體來說,假設(shè)隱藏單元個數(shù)為h,給定時間步t的小批量輸入Xt∈Rn×d(樣本數(shù)為n,輸入個數(shù)為d),和上一時間步隱藏狀態(tài)Ht-1∈Rn×d。重置門與更新門的計算如下:
Rt=σ(XtWxr+Ht-1Whr+br)
(3)
Zt=σ(XtWxz+Ht-1Whz+bz)
(4)
其中,Wxr,Wxz∈Rd×h和Whr,Whz∈Rh×h是權(quán)重參數(shù);br,bz∈R1×h表示差參數(shù)。由于Sigmoid函數(shù)可將元素的值變換到0和1之間。因此重置門Rt和更新門Zt中每個元素的值域都為[0,1]。
1.2.2 候選隱藏狀態(tài)
(5)
在式(5)中,Wxh∈Rd×h和Whh∈Rh×h表示為權(quán)重參數(shù),bh∈R1×h表示為偏差參數(shù)。從式(5)可看出,重置門的存在,決定了前一隱藏狀態(tài)是否能夠與當(dāng)前候選隱藏狀態(tài)控制相連接,而前一隱藏狀態(tài)中可能保存了在其之前的歷史時序信息,因此重置門可用以丟棄與預(yù)測無關(guān)的信息。
圖2 GRU單元中候選隱藏狀態(tài)的計算
1.2.3 隱藏狀態(tài)
(6)
需要注意的是,更新門通過控制隱藏狀態(tài),決定著候選隱藏狀態(tài)中所包含的是時序信息是否更新,如圖3所示。假設(shè)更新門在時間步t′到t(t′ 圖3 GRU單元中隱藏狀態(tài)的計算 在本文中,由于所使用軸承故障數(shù)據(jù)為一維時序數(shù)據(jù),因此在使用CNN網(wǎng)絡(luò)進(jìn)行特征提取時,需將卷積操作同樣設(shè)置為一維。并且為了能夠?qū)NN算法在數(shù)據(jù)特征提取的優(yōu)點,以及GRU網(wǎng)絡(luò)在處理時序數(shù)據(jù)的優(yōu)點有效結(jié)合起來,本文中所使用的模型前端設(shè)置為CNN網(wǎng)絡(luò),后端設(shè)置為GRU單元。通過網(wǎng)絡(luò)前端搭設(shè)的卷積層等結(jié)構(gòu)實現(xiàn)對故障信息的特征提取后,進(jìn)而通過GRU網(wǎng)絡(luò)層實現(xiàn)對提取后的特征中所蘊含的時序信息深入挖掘后,最終使用Softmax分類器分類不同類型的電機軸承故障。 為了保證模型的訓(xùn)練效率以及分類的可靠性,在經(jīng)過多次實驗綜合對比后,最終確定了本文所搭建的基于C-GRU的電機軸承故障診斷模型結(jié)構(gòu)如圖4所示。其中,第1、3、5、6層為卷積層,并分別將卷積核的數(shù)目設(shè)置為256、128、64、32個,卷積核尺寸設(shè)置為1×4,以實現(xiàn)對數(shù)據(jù)進(jìn)行特征提取工作。此外,為了提高模型的魯棒性以及保障模型能夠?qū)W習(xí)到有效特征信息,本文所用的是從不同方向或位置采集到的同一故障類型的數(shù)據(jù),因此將卷積層設(shè)置為多通道處理模式,以提高模型的訓(xùn)練和學(xué)習(xí)效率。同時,由于樣本數(shù)量眾多,故在模型訓(xùn)練過程中,模型極易出現(xiàn)過擬合現(xiàn)象,使得模型的訓(xùn)練效率大幅度下降,因此將第2、4、7層分別設(shè)置最大池化層,并將池化尺寸設(shè)置為1×2,以提取數(shù)據(jù)特征中的局部最大值,有效降低參數(shù)數(shù)量,在一定程度上降低過擬合的可能性。由于GRU模型訓(xùn)練過程中的單向性,多層結(jié)構(gòu)的GRU會大大延長模型的訓(xùn)練時間,因此為了保證模型的訓(xùn)練效率,將第8、9層設(shè)置為GRU單元層。同時,由于GRU網(wǎng)絡(luò)中單元的數(shù)量決定著對時序信息提取的效率,為了能夠更好的提取電機軸承振動信號中所蘊含的時序信息,以及為了減少網(wǎng)絡(luò)模型的復(fù)雜程度,將兩層GRU單元層中的單元數(shù)分別設(shè)置為128個,實現(xiàn)在減少模型復(fù)雜度的同時,能夠有效的提取出數(shù)據(jù)中所蘊含的時序特征。將最后3層設(shè)置為全連接層,將模型前端中網(wǎng)絡(luò)結(jié)構(gòu)所提取的大量的有效信息進(jìn)行平鋪處理,重新構(gòu)成一維向量。將第3層全連接層設(shè)置為分類層,最終使用Softmax分類器分類不同類型的電機軸承故障。 圖4 基于C-GRU的電機軸承故障診斷模型 實驗采用的數(shù)據(jù)來自于美國凱斯西儲大學(xué)開放軸承數(shù)據(jù)庫,使用Tensorflow與Keras深度學(xué)習(xí)框架搭建卷積神經(jīng)網(wǎng)絡(luò)模型,將原始數(shù)據(jù)進(jìn)行打標(biāo)簽后輸入進(jìn)行訓(xùn)練分類。所選樣本數(shù)據(jù)采樣頻率為12 kHz,數(shù)據(jù)樣本分別選取正常狀態(tài)數(shù)據(jù),0.007 in、0.014 in和0.021 in故障尺寸下的軸承內(nèi)外圈及滾珠故障數(shù)據(jù)。這些數(shù)據(jù)樣本按照3個不同點分別對應(yīng)作為3個通道的輸入數(shù)據(jù),數(shù)據(jù)分別對應(yīng)不同通道按組輸入。 為了方便對比驗證,本文首先搭建了基于CNN的軸承故障診斷模型,依據(jù)數(shù)據(jù)量的不同分別選用了兩個數(shù)據(jù)集。數(shù)據(jù)集1中10個類型共1440萬個樣本數(shù)據(jù)分為4800組,數(shù)據(jù)集2中10個類型共720萬個樣本數(shù)據(jù),數(shù)據(jù)量是數(shù)據(jù)集1的一半,具體的樣本組成如表1、表2所示,訓(xùn)練和測試樣本均是隨機按照49:1的比例選取。 表1 數(shù)據(jù)集1樣本組成 表2 數(shù)據(jù)集2樣本組成 基于CNN的模型共10層,模型的第1、3、5、6層為卷積層,并分別將卷積核的數(shù)目設(shè)置為256、128、64、32個,卷積核尺寸設(shè)置為1×4,采用3通道處理方式。第2、4、7層為最大池化層,池化尺寸為1×2。并在模型的最后設(shè)置3層全連接層(其中最后一層為分類層),實現(xiàn)對軸承故障分類。 分別使用數(shù)據(jù)集1與數(shù)據(jù)集2對基于CNN的軸承故障診斷模型進(jìn)行訓(xùn)練分類,并將模型的最大迭代次數(shù)設(shè)置為15次。使用Tensorflow中可視化工具Tensorboard將模型的訓(xùn)練結(jié)果可視化后,使用數(shù)據(jù)集1的訓(xùn)練與測試的準(zhǔn)確率及損失函數(shù)值如圖5、圖6所示,使用數(shù)據(jù)集2的訓(xùn)練與測試的準(zhǔn)確率及損失函數(shù)值如圖7、圖8所示。 圖5 CNN模型使用數(shù)據(jù)集1訓(xùn)練與測試準(zhǔn)確率 圖6 CNN模型使用數(shù)據(jù)集1訓(xùn)練與測試損失函數(shù) 圖7 CNN模型使用數(shù)據(jù)集2訓(xùn)練與測試準(zhǔn)確率 圖8 CNN模型使用數(shù)據(jù)集2訓(xùn)練與測試損失函數(shù) 由圖5、圖6所示,基于CNN的軸承故障診斷模型使用數(shù)據(jù)集1進(jìn)行訓(xùn)練后,測試集中準(zhǔn)確率與訓(xùn)練集中的準(zhǔn)確率基本沒有差別;對比損失函數(shù)值,測試集的普遍略小于訓(xùn)練集,證實了該參數(shù)設(shè)置下的CNN網(wǎng)絡(luò)模型的分類準(zhǔn)確性較高,較好地避免了過擬合或欠擬合的現(xiàn)象發(fā)生。而由圖7、圖8所示,使用數(shù)據(jù)集2進(jìn)行訓(xùn)練后,CNN模型訓(xùn)練與測試的準(zhǔn)確率雖達(dá)到了94%,但是訓(xùn)練與測試集的損失函數(shù)值較高,說明在使用數(shù)據(jù)集2進(jìn)行訓(xùn)練的過程中,基于CNN的軸承故障診斷模型出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象,嚴(yán)重影響了軸承故障診斷工作的可靠性與準(zhǔn)確性。 接著使用本文所搭建的C-GRU模型,直接使用數(shù)據(jù)量較少數(shù)據(jù)集2對搭建好的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,同樣將網(wǎng)絡(luò)的最大迭代次數(shù)設(shè)置為15次。使用可視化工具Tensorboard將模型的訓(xùn)練結(jié)果可視化后,訓(xùn)練集與測試集的準(zhǔn)確率和損失函數(shù)曲線如圖9、圖10所示。 圖9 C-GRU模型使用數(shù)據(jù)集2訓(xùn)練與測試準(zhǔn)確率 圖10 C-GRU模型使用數(shù)據(jù)集2訓(xùn)練與測試損失函數(shù) 與基于CNN的軸承故障診斷模型相比,在訓(xùn)練樣本減少一半的情況下,本文所搭建的C-GRU網(wǎng)絡(luò)模型通過深入挖掘原始數(shù)據(jù)中所蘊含的時序信息,使得最終的訓(xùn)練與測試準(zhǔn)確率與采用數(shù)據(jù)集1進(jìn)行訓(xùn)練后的基于CNN的軸承故障診斷方法獲得的結(jié)果基本相近,最終測試集的準(zhǔn)確率為99.7%,且測試集的損失函數(shù)也低于訓(xùn)練集的損失函數(shù),未出現(xiàn)過擬合的情況。 前一部分使用國際通用數(shù)據(jù)集進(jìn)行測試驗證了C-GRU模型的可行性,為了進(jìn)一步驗證該模型在實際電機軸承故障診斷分類中的應(yīng)用情況,使用實驗室QPZZ-II旋轉(zhuǎn)機械振動分析及故障模擬實驗系統(tǒng)平臺進(jìn)行電機軸承故障診斷測試。如圖11所示,該試驗臺主要由0.75 kW變速驅(qū)動電機、變頻器、平衡盤、齒輪箱以及軸系總成等組成。本次故障診斷測試中使用的軸承型號為N205,故障類型分別為外圈、內(nèi)圈、滾珠以及混合故障,其中混合故障為外圈與滾珠故障組成。上位機采集軟件使用Labview編寫數(shù)據(jù)采集程序,數(shù)據(jù)采集卡使用NI PCI-6251加SCB-68A接線盒,加速度傳感器使用的是蘭德公司的BZ1151三軸加速度傳感器,采集卡采樣率設(shè)置為12 k,電機工頻額定轉(zhuǎn)速運行。 圖11 QPZZ-II旋轉(zhuǎn)機械振動分析及故障模擬實驗系統(tǒng)平臺 將采集到相同位置中x軸、y軸、z軸的數(shù)據(jù)作為3個通道,每個通道的每組數(shù)據(jù)量為1000按組輸入至本文搭建的C-GRU軸承故障診斷模型進(jìn)行訓(xùn)練和測試,樣本數(shù)據(jù)組成如表3所示。 表3 QPZZ-II型平臺電機軸承數(shù)據(jù)樣本數(shù)據(jù)組成 由圖12可以看出經(jīng)過15次的模型迭代后,本文中所搭建的基于C-GRU的電機軸承故障診斷模型,在實驗室QPZZ-II電機試驗臺軸承故障診斷工作中的訓(xùn)練準(zhǔn)確率與測試準(zhǔn)確率分別為99.1%和99.6%,與凱斯西儲大學(xué)開放軸承數(shù)據(jù)庫數(shù)據(jù)訓(xùn)練測試的準(zhǔn)確率基本相同。同時在圖13中,測試集損失函數(shù)略低于訓(xùn)練集損失函數(shù),未出現(xiàn)過擬合的情況。由上述結(jié)果可看出,本文所搭建的網(wǎng)絡(luò)模型在不同的電機軸承故障診斷中均具有較高的診斷效率與可靠性,達(dá)到了預(yù)期的訓(xùn)練和診斷效果。 圖12 QPZZ-II電機平臺軸承故障訓(xùn)練與測試準(zhǔn)確率 圖13 QPZZ-II電機平臺軸承故障數(shù)據(jù)訓(xùn)練與測試損失函數(shù) 本文所提出的基于C-GRU軸承故障診斷模型取長補短,一方面結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)(CNN)在處理大數(shù)據(jù)特征提取中的優(yōu)勢和門控循環(huán)單元(GRU)善于處理時序數(shù)據(jù)的特點,另一方面也在一定程度上彌補了單一CNN和GRU各自的不足。通過多次實驗選擇合適的模型結(jié)構(gòu),將前端CNN網(wǎng)絡(luò)對電機軸承故障數(shù)據(jù)進(jìn)行特征提取的數(shù)據(jù)作為后端GRU網(wǎng)絡(luò)的輸入,充分挖掘了電機軸承故障數(shù)據(jù)中所蘊含的時序信息。通過使用凱斯西儲大學(xué)開放軸承數(shù)據(jù)庫數(shù)據(jù),以及實驗室QPZZ-II型電機平臺的數(shù)據(jù)對文中所搭建的網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練分類,發(fā)現(xiàn)該方法在減少了對樣本量需求的同時,很好地保障了電機軸承故障診斷分類的準(zhǔn)確率,同時對不同的類型電機軸承同樣具有很好的分類準(zhǔn)確性,證明了該模型具有較強的魯棒性,對于時序數(shù)據(jù)的分析分類具有一定的實用價值。1.3 模型搭建與參數(shù)選擇
2 通用數(shù)據(jù)集實驗分析
3 其他類型軸承故障分類對比實驗分析
4 結(jié)論