王曉玉,王金瑞,韓寶坤,張冬鳴,閆振豪,石兆婷
(山東科技大學(xué)機械電子工程學(xué)院,山東青島266590)
在現(xiàn)代工業(yè)中,傳統(tǒng)機械工業(yè)正迅速向自動化、智能化轉(zhuǎn)變[1-2]。為了保證機器的正常運行,各種智能故障診斷方法層出不窮。雷亞國等[3]設(shè)計了多層堆疊DAE,并對頻域信號加噪,從而實現(xiàn)了了齒輪箱的智能故障診斷。樊薇等[4]設(shè)計了一種基于小波基稀疏信號特征提取的軸承故障診斷系統(tǒng),實現(xiàn)強背景噪聲下軸承弱特征振動信號的有效提取。Wang等[5]為了提高模型訓(xùn)練效率,同時解決深層神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中出現(xiàn)的梯度消失問題,引入批標準化算法,實現(xiàn)了軸承振動信號的快速故障診斷。
機械故障診斷的發(fā)展離不開大數(shù)據(jù)的支持。因此,利用生成對抗網(wǎng)絡(luò)(GAN)等[6]深度學(xué)習(xí)算法來提高訓(xùn)練樣本的數(shù)量成為研究熱點。Shao等[7]將不同標號類型的故障時域數(shù)據(jù)輸入到GAN中,生成一維仿真信號樣本,然后將其與原始信號輸入到卷積神經(jīng)網(wǎng)絡(luò)中,實現(xiàn)訓(xùn)練樣本的數(shù)據(jù)增強和故障識別;Wang等[8]利用GAN學(xué)習(xí)故障信號的仿真頻譜,實現(xiàn)數(shù)據(jù)增強,并選擇堆疊式自編碼器(SAE)[9]進行準確的故障分類;Mao等[10]還利用GAN對小樣本故障類型數(shù)據(jù)進行增強,實現(xiàn)異步電機的故障診斷,并通過對比研究驗證了該方法的有效性。
因此,數(shù)據(jù)采集的過程變得尤為重要[11]。采樣頻率越高,單位時間采集的數(shù)據(jù)點越多,越有利于研究和分析被測對象的內(nèi)部特征,從而實現(xiàn)對機器故障的準確診斷[12-15]。因此,高分辨率樣本常被用于故障診斷研究[16-17]。但是,上述方法不能提高單個樣本的分辨率。在實際應(yīng)用中,傳感器應(yīng)用通常需要測量大的動態(tài)范圍,但需要精細的分辨率來感知獲取信號的微小變化[18]。此外,關(guān)于分辨率增強的研究較少。與此形成鮮明對比的是,分辨率增強技術(shù)被廣泛應(yīng)用于圖像處理領(lǐng)域[19]。分辨率增強技術(shù)可以解決原始圖像和視頻分辨率低的問題。超分辨率卷積神經(jīng)網(wǎng)絡(luò)(SRCNN)[20]、深度重構(gòu)分類網(wǎng)絡(luò)(DRCN)[21]和超分辨率生成對抗網(wǎng)絡(luò)(SRGAN)[22]等是常用的超分辨率深度網(wǎng)絡(luò)。以SRCNN為例,首先利用雙三次插值將低分辨率的輸入圖像放大到目標形狀,然后利用三層卷積網(wǎng)絡(luò)進行非線性映射,進而輸出重建后的高分辨率圖像。
由于卷積運算的分辨率較高,計算復(fù)雜度增加。高效的亞像素卷積神經(jīng)網(wǎng)絡(luò)(ESPCN)[23]可以直接從低分辨率圖像形狀中提取特征,有效生成高分辨率圖像。
因此,為了使樣本的分辨率得到增強,生成更多仿真的樣本特征,本文提出了一個有效的算法——高效亞像素全連接神經(jīng)網(wǎng)絡(luò)(ESPFCN)算法。為了檢驗分辨率增強后的樣本結(jié)果,使用SAE分類網(wǎng)絡(luò)對樣本進行了故障分類的準確性測試。實驗結(jié)果驗證了ESPFCN在增強數(shù)據(jù)分辨率方面的有效性。
本文的主要見解和貢獻總結(jié)如下:1)嘗試使用深度學(xué)習(xí)的方法來解決樣本分辨率低的問題。本文提出的ESPFCN方法可以將樣本的分辨率增強為原來的4倍;2)通過軸承實驗驗證了該方法的有效性,并對實驗結(jié)果進行了可視化展示;3)為了更好地理解ESPFCN分辨率增強的過程,展示并分析了其各隱含層特征學(xué)習(xí)過程。
ESPCN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。ESPCN主要由卷積神經(jīng)網(wǎng)絡(luò)和亞像素卷積層組成。利用L通道卷積神經(jīng)網(wǎng)絡(luò)生成低分辨率圖像,然后利用亞像素卷積層對低分辨率圖像進行采樣,生成高分辨率圖像。卷積神經(jīng)網(wǎng)絡(luò)的第一個L-1通道描述如下:
圖1 ESPCN結(jié)構(gòu)Fig.1 Structure of ESPCN
式 中Wl,bl,l∈(1,L-1)為 可 學(xué) 習(xí) 權(quán) 值 和 偏 移量,Wl為一個大小為nl-1×nl×kl×kl的二維卷積張量,其中nl為L層的特征數(shù),kl為L層的卷積核數(shù),偏移bl為長度為nl的向量,激活函數(shù)φ被逐個應(yīng)用并固定。經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)層,得到與輸入圖像形狀相同的特征圖像,并將特征圖像發(fā)送到亞像素卷積層進行采樣。
其次是映照修辭格的使用。歌詞中秀才的離開與胡同中夢的落空形成映照。映照修辭格的使用讓書生的離開與胡同的敗落形成了奇妙的統(tǒng)一,給聽眾以雙重的沖擊。他不是功成名就而離開,他心中功名、往事、胡同都恍然如夢,隨著記憶被埋葬,只留妻子凄苦中掙扎。
亞像素卷積層由卷積層和亞像素卷積層兩部分組成。卷積層部分輸出與輸入圖像形狀相同的r2個低分辨率卷積特征圖,其中r為升尺度比率,然后根據(jù)公式計算超分辨率重建的特征圖ISR
式中PS為一個將元素按形狀重新排列的操作符。重排PS的數(shù)學(xué)描述如下
其實質(zhì)是將低分辨率的特征周期性地插入到高分辨率圖像中。
自編碼器(AE)[24]是SAE的基本組成單元,主要用于數(shù)據(jù)的特征提取和降維。如圖2所示,AE的結(jié)構(gòu)是一個三層前饋神經(jīng)網(wǎng)絡(luò)[25-26],包括數(shù)據(jù)輸入層、隱含層和輸出層。AE分為兩部分,即編碼器部分和解碼器部分。利用編碼器將輸入信號映射到隱層表達式中,實現(xiàn)數(shù)據(jù)高維特征提取的過程。利用解碼器從隱層中恢復(fù)原始輸入數(shù)據(jù),完成數(shù)據(jù)重建過程。
圖2 AE的架構(gòu)Fig.2 Framework of AE
假設(shè)有一個未標記的訓(xùn)練數(shù)據(jù)集xn∈Rm×1,其中xn∈Rm×1只有一個樣本xn,編碼器的過程為
式中hn表示由xn計算出的隱藏編碼器向量,sf為編碼器激活函數(shù),b為偏置向量,W為權(quán)值矩陣。
gθ′為解碼函數(shù),它將hn從低維特征映射回高維特征,產(chǎn)生重構(gòu)。
式中sg為解碼器激活函數(shù),d為偏置向量,WT為權(quán)值矩陣。
式中AEs的參數(shù)集為θ={W,b}和θ′={WT,d},其中b和d為偏置向量,W和WT為權(quán)值矩陣。
選擇一個包括數(shù)據(jù)輸入層、隱含層和輸出層的三層前饋神經(jīng)網(wǎng)絡(luò)的SAE作為分類模型,如圖3所示。輸入層神經(jīng)元數(shù)目與輸入樣本相同。隱層神經(jīng)元的數(shù)目與輸入樣本的維數(shù)有關(guān)。輸入維數(shù)為300時,隱含層神經(jīng)元數(shù)為200-150-100。當(dāng)輸入維度為1200時,隱含層神經(jīng)元數(shù)為600-200-100。輸出層神經(jīng)元數(shù)目與健康軸承數(shù)目相同。網(wǎng)絡(luò)的激活函數(shù)為Sigmoid,迭代訓(xùn)練次數(shù)為20次,學(xué)習(xí)率為1×10-3,批量大小為5。最后一層使用Softmax分類器[27],采用BP算法[28]對SAE網(wǎng)絡(luò)進行微調(diào)。需要注意的是,為了提高網(wǎng)絡(luò)訓(xùn)練速度,避免梯度消失的問題,在SAE的每一個激活層之前都使用了批標準化(BN)算法[29]。
圖3 SAE結(jié)構(gòu)Fig.3 Structure of the SAE
如圖4所示為ESPFCN的結(jié)構(gòu),其主要由全連接層神經(jīng)網(wǎng)絡(luò)和亞像素全連接層組成。全連接神經(jīng)網(wǎng)絡(luò)層可以描述為:
圖4 ESPFCN結(jié)構(gòu)Fig.4 Structure of the ESPFCN
式中XLR為低分辨率樣本,Wi,i∈(1,2,3)為第i層網(wǎng)絡(luò)的權(quán)重,激活函數(shù)φ為ReLU。
其中:第一、二和第三層全連接層分別為64,32和4通道。為了實現(xiàn)分辨率增強操作,將低分辨率數(shù)據(jù)XLR通過全連接神經(jīng)層輸出到亞像素全連接層。
亞像素全連接層由全連接層和元素排列構(gòu)成。全連接層輸出r2(r=2)通道與輸入數(shù)據(jù)維數(shù)相同的數(shù)據(jù),根據(jù)公式得到
式中XSR為ESPFCN網(wǎng)絡(luò)生成的高分辨率樣本,PS算子能夠?qū)埩康男螤钣蒆×W×C?r2重新排列成rH×rW×C。PS算子的數(shù)學(xué)描述如下
其實質(zhì)是對四通道的低分辨率特征進行周期性的排列,最終得到一組高分辨率特征。
使用均方誤差(MSE)度量真實低分辨率樣本與生成的低分辨率特征的差異程度,其計算公式如下
為了驗證ESPFCN對樣本分辨率增強的效果,設(shè)計了一個模擬軸承失效的實驗平臺,如圖5所示。該平臺主要由電動機、聯(lián)軸器、軸承座、齒輪箱和制動器組成。軸承底座的振動信號由帶振動傳感器的LMS數(shù)據(jù)采集儀采集,傳感器置于軸承座側(cè)。采樣頻率為25.6 kHz。發(fā)動機轉(zhuǎn)速為3000 r/min,圖6所示的三種軸承類型均為N205EU圓柱滾子軸承。如表1所示,軸承有4種狀態(tài):正常狀態(tài)(NC)、內(nèi)圈故障(IF)、外圈故障(OF)和滾珠故障(RF)。每種故障類型有三種不同程度的損害:0.18,0.36和0.54 mm。軸承狀態(tài)分為10種,每種狀態(tài)包含200個樣本。
圖5 滾珠軸承數(shù)據(jù)測試平臺Fig.5 Ball bearing data testing platform
圖6 軸承結(jié)構(gòu)展示Fig.6 Structure display of rolling bearing
為了合理設(shè)置每個樣本中包含的數(shù)據(jù)點數(shù)量,使用公式
可以看出,在采樣頻率為25.6 Hz,電機轉(zhuǎn)速為3000 r/min的情況下,電機每轉(zhuǎn)一圈采樣設(shè)備將采集512個數(shù)據(jù)點。因此,將每600個數(shù)據(jù)點設(shè)為一個低分辨率的樣本,每個樣本經(jīng)過傅里葉變換后得到300個傅里葉系數(shù)。設(shè)置2400個數(shù)據(jù)點為一個高分辨率樣本,每個樣本經(jīng)過傅里葉變換后得到1200個傅里葉系數(shù)。所有實驗樣本數(shù)據(jù)在相同負載下采集。
ESPFCN的參數(shù)設(shè)置如下:迭代次數(shù)為40次,學(xué) 習(xí)率為10-3,激活函數(shù) 為ReLU[30]。使用SAE測試ESPFCN生成數(shù)據(jù)的有效性。使用低分辨率樣本作為ESPFCN的輸入樣本,并將生成的數(shù)據(jù)集作為SAE的訓(xùn)練樣本,將原始的高分辨率數(shù)據(jù)集作為測試樣本。另外兩種方法從不同故障類型的樣本中隨機抽取50%作為訓(xùn)練集,剩余50%作為測試集。
圖7顯示了三種數(shù)據(jù)類型的頻域圖(低分辨率頻譜圖、ESPFCN生成的頻譜圖和高分辨率的頻譜圖)。由圖可以看出,從頻譜圖中很難直觀地區(qū)分不同的故障類型,因此有必要使用基于深度學(xué)習(xí)的分類網(wǎng)絡(luò)來提取樣本特征,以更好地區(qū)分故障類型。當(dāng)采樣設(shè)備的采樣頻率越高,采集的數(shù)據(jù)點越多,數(shù)據(jù)包含的特征越多,判別網(wǎng)絡(luò)的訓(xùn)練效果越好。由于低分辨率樣本只含有一圈的軸承數(shù)據(jù),所以特征較少。ESPFCN生成樣本的特征趨勢與原始高分辨率樣本的特征趨勢基本一致,但是由于低分辨率樣本僅含有高分辨率樣本1/4的特征,因此由低分辨率增強后的樣本與原始的高分辨率樣本存在一定的差異。
圖7 三種電機軸承數(shù)據(jù)類型頻譜的比較Fig.7 Comparison of three motor bearing data type spectra
為了驗證該方法的有效性,將ESPFCN生成的數(shù)據(jù)集和兩個比較數(shù)據(jù)(低維數(shù)據(jù)集和高維數(shù)據(jù)集)分別作為SAE的輸入數(shù)據(jù)集。實驗結(jié)果如圖8所示,實驗重復(fù)15次以減少隨機性的影響,并于表2展示了這15次實驗的數(shù)值結(jié)果。可以看出,低分辨率數(shù)據(jù)集的結(jié)果并不理想,平均準確率為95.78%,這是因為低分辨率樣本包含的特征相對較少,從而導(dǎo)致判別網(wǎng)絡(luò)欠擬合;ESPFCN的平均準確率為98.25%,這是因為ESPFCN使低分辨率的數(shù)據(jù)增強為原來的四倍,增強后的樣本包含更多的特征信息,從而能夠更好地訓(xùn)練判別網(wǎng)絡(luò);高分辨率數(shù)據(jù)的平均準確率最高,達到了99.94%。不同運行狀況下的其他樣本被很好地分離。此外,利用皮爾遜相關(guān)系數(shù)(PCC)評估生成樣本與原始高分辨率樣本之間的相似性,PCC的值越大,表示兩者之間的相關(guān)性越強,PCC的計算公式如下式中X表示ESPFCN生成的樣本,Y表示原始高分辨率樣本,cov(?,?)是協(xié)方差,σX和σY分別是X和Y的標準 差,μX和μY分別 是X和Y的 均值,E是期望。ESPFCN與原始高分辨率樣本的PCC為0.81,說明這兩類樣本之間的相似性較強。
圖8 測試準確率對比曲線圖Fig.8 Comparison graph of test accuracy
表2 測試準確率對比表Tab.2 Comparison table of test accuracy
為了直觀地展示這三種數(shù)據(jù)集的分類效果,采用t-SNE(t-distributed random neighbor)[31]方 法 將SAE隱含層特征映射到三維特征中。從圖9(a)可以看出,低分辨率數(shù)據(jù)的聚類效果并不理想,部分樣本相互混合,不同樣本之間存在不同程度的誤分類;在圖9(b)所示,ESPFCN的聚類效果優(yōu)于低分辨率樣本的聚類效果,除了少數(shù)OF3和IF1樣本發(fā)生了誤分類的情況,其他不同健康狀況的樣本被很好地分離,分類結(jié)果接近圖9(c)高分辨率樣本的分類結(jié)果。
圖9 三組電機軸承數(shù)據(jù)集的可視化結(jié)果Fig.9 The visualization results of three motor bearing datasets
此外,為了了解ESPFCN如何提高樣本的分辨率,研究了該方法的特征學(xué)習(xí)過程。圖10為一個低分辨率樣本經(jīng)過ESPFCN各全連接層的特征圖??梢钥闯?,在同一全連接層中,不同通道的特征是不同的,除了少數(shù)通道的特征區(qū)分度較大,其余通道的特征較為相似。隨著全連接層數(shù)的增加,隱層的通道數(shù)從64通道減少到4通道,通道數(shù)量的縮減導(dǎo)致不同通道之間特征的分化程度更加明顯,增大了特征的多樣性。由于ESPFCN能夠同時增強10種狀態(tài)的低分辨率樣本,因此圖11隨機展示了樣本為正常工況(NC)時的三種數(shù)據(jù)類型的頻譜圖。由圖11(a)可知,低分辨率樣本的樣本點只有300,因此其特征明顯少于其他兩種數(shù)據(jù)類型的特征。由圖11(b)所示,相比于低分辨率樣本,ESPFCN生成的高分辨率樣本含有更多的數(shù)據(jù)點,特征也更加的明顯,而且其頻譜與圖11(c)的高分辨率頻譜具有一致的特征趨勢,即由ESPFCN生成的高分辨率樣本在一定程度上還原了真實的高分辨率樣本的頻譜。
圖10 ESPFCN中各層軸承信號特性的可視化圖Fig.10 Visual diagram of bearing signal characteristics of each layer in ESPFCN
圖11 三種數(shù)據(jù)類型的頻譜的比較Fig.11 Comparison of three data type spectrum
為了提高低分辨率樣本的分辨率,提出了一種有效的深度學(xué)習(xí)框架——ESPFCN。低分辨率樣本經(jīng)全連接層輸出四通道特征,然后通過亞像素全連接層將四通道的特征合成高分辨率特征,實現(xiàn)樣本由低分辨率到高分辨率的轉(zhuǎn)變,樣本的特征進而增多,有利于對機械的健康狀況進行準確的分析和診斷。在軸承實驗的基礎(chǔ)上,提出了一種測試策略來評估ESPFCN的可行性。生成的數(shù)據(jù)集和原始數(shù)據(jù)集分別作為SAE分類器模型的訓(xùn)練集和測試集。分類結(jié)果表明,本文所提出的ESPFCN模型在恒轉(zhuǎn)速下的數(shù)據(jù)擴充是可行的,可以產(chǎn)生可靠的仿真樣本。本文試圖為機械故障診斷任務(wù)建立一個預(yù)測框架,生成數(shù)據(jù)的分析驗證和提出框架的隱層可視化展示,有利于后續(xù)的故障診斷。