尹文哲,夏虹,彭彬森,朱少民,王志超
1.哈爾濱工程大學(xué) 核安全與先進(jìn)核能技術(shù)工信部重點(diǎn)實(shí)驗(yàn)室,黑龍江 哈爾濱 150001 2.哈爾濱工程大學(xué) 核安全與仿真技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,黑龍江 哈爾濱 150001
在核電廠中存在諸多旋轉(zhuǎn)設(shè)備,如電機(jī)、泵、風(fēng)機(jī)、汽輪機(jī)等,它們?cè)诤藙?dòng)力系統(tǒng)中扮演著重要的角色,而滾動(dòng)軸承是旋轉(zhuǎn)設(shè)備中最常用的部件之一,其對(duì)旋轉(zhuǎn)設(shè)備完成預(yù)定功能起著至關(guān)重要的作用。但由于設(shè)計(jì)、制造、安裝、工況等多方面因素,滾動(dòng)軸承也是最常出現(xiàn)故障的部件之一。為確保核動(dòng)力系統(tǒng)安全穩(wěn)定運(yùn)行,對(duì)滾動(dòng)軸承進(jìn)行有效的故障診斷十分必要。
目前最常用的滾動(dòng)軸承故障診斷方法是振動(dòng)分析法,即利用滾動(dòng)軸承的振動(dòng)信號(hào)進(jìn)行故障診斷。針對(duì)該方法的研究主要集中在特征提取和模式識(shí)別2 個(gè)方面:首先利用信號(hào)處理方法,如小波變換[1]、希爾伯特-黃變換[2]、局部均值分解[3]、變分模態(tài)分解[4]等,提取原始振動(dòng)數(shù)據(jù)的相關(guān)特征,并構(gòu)建特征向量;然后利用機(jī)器學(xué)習(xí)算法,如貝葉斯分類器[5]、支持向量機(jī)[6]、神經(jīng)網(wǎng)絡(luò)[7]等,對(duì)特征向量進(jìn)行模式識(shí)別。雖然傳統(tǒng)的滾動(dòng)軸承故障診斷方法已取得一定的效果,但其診斷模型表達(dá)能力有限,且較依賴于信號(hào)處理技術(shù)和專家經(jīng)驗(yàn)。
近年來(lái),深度學(xué)習(xí)已成為學(xué)術(shù)研究熱點(diǎn),為了增強(qiáng)故障診斷模型的表達(dá)能力,擺脫對(duì)專家經(jīng)驗(yàn)的過度依賴,學(xué)者們開始研究將深度學(xué)習(xí)模型應(yīng)用到滾動(dòng)軸承故障診斷中,以追求更加良好的診斷效果。其中,研究最多的深度學(xué)習(xí)模型是卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)是一種監(jiān)督學(xué)習(xí)算法,廣泛應(yīng)用于模式識(shí)別領(lǐng)域。目前,一般是將原始振動(dòng)信號(hào)處理變換成時(shí)域圖像、頻域圖像或時(shí)頻圖像,然后用卷積神經(jīng)網(wǎng)絡(luò)對(duì)這些圖像進(jìn)行診斷識(shí)別故障類型。HAN 等[8]將滾動(dòng)軸承振動(dòng)信號(hào)轉(zhuǎn)換成時(shí)域圖像,對(duì)圖像進(jìn)行相關(guān)處理后將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,以實(shí)現(xiàn)對(duì)軸承故障類別的判定。李恒等[9]對(duì)原始振動(dòng)信號(hào)進(jìn)行短時(shí)傅里葉變換,構(gòu)造時(shí)頻圖樣本,并將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,完成故障識(shí)別。袁建虎等[10]對(duì)軸承振動(dòng)信號(hào)進(jìn)行連續(xù)小波變換,得到相關(guān)時(shí)頻圖,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。許理等[11]對(duì)采集的軸承信號(hào)進(jìn)行小波包時(shí)頻分析,得到各類信號(hào)的時(shí)頻圖,然后與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合進(jìn)行故障診斷。然而,以時(shí)域圖像或頻域圖像作為輸入的卷積神經(jīng)網(wǎng)絡(luò)診斷效果有限,采用時(shí)頻圖像作為輸入,診斷效果雖然得到一定的提升,但一般需要對(duì)相關(guān)預(yù)定義參數(shù),如基函數(shù)、窗函數(shù)、窗口大小等參數(shù)進(jìn)行合適地選擇才能得到較好的效果,對(duì)專家經(jīng)驗(yàn)具有一定的依賴性。
針對(duì)上述問題,本文提出一種基于快速傅里葉變換(FFT)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的滾動(dòng)軸承故障診斷方法。該方法在信號(hào)處理過程中不需要設(shè)定相關(guān)預(yù)定義參數(shù),對(duì)原始振動(dòng)信號(hào)進(jìn)行快速傅里葉變換后,將得到一維數(shù)據(jù)轉(zhuǎn)換為二維的特征圖作為ResNet-18 網(wǎng)絡(luò)的輸入,對(duì)不同故障類型和故障程度的滾動(dòng)軸承進(jìn)行診斷識(shí)別。
快速傅里葉變換是快速計(jì)算序列的離散傅里葉 變換(discrete Fourier transform, DFT)或其逆變換的方法。傅里葉分析能夠?qū)⑿盘?hào)從原始域(通常是時(shí)間或空間)轉(zhuǎn)換到頻域中進(jìn)行表示,對(duì)于序列x(n)={x0,x1,···,xN-1},0 ≤n<N的離散傅里葉變換表達(dá)式為
式中:e為自然對(duì)數(shù)的底數(shù);i為虛數(shù)單位;k=0,1,···,N-1。
FFT 通過將DFT 矩陣分解為稀疏因子之積來(lái)快速計(jì)算此類變換,因此它能夠計(jì)算DFT 的復(fù)雜度,將用DFT 定義計(jì)算需要的O(n2)降低到O(nlogn)。
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的代表算法之一,它是一類包含卷積計(jì)算的前饋深度神經(jīng)網(wǎng)絡(luò)。CNN 在如文本識(shí)別、語(yǔ)音識(shí)別、故障診斷等識(shí)別領(lǐng)域有著廣泛的應(yīng)用。典型的卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成。其中,卷積層以及池化層屬于濾波級(jí),用于對(duì)輸入信號(hào)進(jìn)行深度特征提??;全連接層屬于分類級(jí),用于對(duì)得到的特征向量進(jìn)行分類判斷。
在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層可以有效地對(duì)圖像進(jìn)行特征提取,它具有權(quán)值共享、局部連接的特點(diǎn),即使用若干個(gè)卷積核對(duì)原始輸入數(shù)據(jù)按照一定的步長(zhǎng)進(jìn)行局部滑動(dòng)卷積計(jì)算,從而實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的特征提取,因而可以利用較低的計(jì)算成本得到較好的提取效果。卷積操作過程的數(shù)學(xué)表示如下:池化層也稱下采樣層,主要是通過采樣的方法來(lái)減小特征的空間尺寸。目前比較常用的2 種池化方法是平均池化和最大池化,兩者分別是用一定寬度的窗口以一定的步長(zhǎng)在得到的特征圖上滑動(dòng),求取該窗口內(nèi)特征值的均值或最大值。本文選用的池化方法是最大池化法,可降低參數(shù)數(shù)目,提高特征的魯棒性。
在經(jīng)過前面一系列的卷積操作和采樣操作后,會(huì)連接一個(gè)或多個(gè)全連接層,用于整合通過卷積層和采樣層提取出的局部信息,然后將這些局部信息輸入到Softmax 分類器中進(jìn)行故障分類。Softmax 分類器實(shí)質(zhì)上是邏輯回歸二分類器的演化,它在多分類場(chǎng)景中應(yīng)用較為廣泛,通過將多分類問題映射為概率分布以實(shí)現(xiàn)分類決策。
由于卷積層、池化層和全連接層都是線性計(jì)算,為彌補(bǔ)線性模型表達(dá)能力的不足,通常會(huì)引入激活函數(shù)進(jìn)行非線性操作,使得整個(gè)網(wǎng)絡(luò)的非線性表達(dá)能力增強(qiáng),挖掘出信號(hào)背后的潛藏特征,提升網(wǎng)絡(luò)在非線性場(chǎng)景下的分類能力。常用的激活函數(shù)有Sigmoid 函數(shù)、tanh 函數(shù)以及Relu函數(shù)。本文使用的激活函數(shù)是Relu 函數(shù),它能夠避免神經(jīng)網(wǎng)絡(luò)出現(xiàn)梯度消失的問題,并且收斂速度快。
本文的故障診斷流程如圖1 所示,首先對(duì)原始振動(dòng)信號(hào)進(jìn)行信號(hào)處理,再將處理后的信號(hào)按一定比例隨機(jī)分為訓(xùn)練集和測(cè)試集;然后采用交叉熵函數(shù)作為損失函數(shù),并使用Adam 方法對(duì)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;最后使用測(cè)試集對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試,驗(yàn)證模型的泛化性能。
圖1 故障診斷流程
在信號(hào)處理過程中,首先將原始振動(dòng)信號(hào)等分成若干個(gè)數(shù)據(jù)段,假設(shè)每段序列表示為y(N)={y1,y2,···,yk,···,ym×n},其中m、n為正整數(shù),1 ≤N≤m×n;接著,對(duì)y(N)進(jìn)行快速傅里葉變換,并求其模值,即可得到變換后的數(shù)據(jù)序列Y(N)={Y1,Y2,···,Yk,···,Ym×n};最后,將序列Y(N)按如圖2 所示方式轉(zhuǎn)換成m×n的二維矩陣,構(gòu)成特征圖,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。
圖2 轉(zhuǎn)換方式
這種數(shù)據(jù)預(yù)處理方法直接有效,且處理速度快。更重要的是,相比于一些時(shí)頻分析方法,如小波變換(wavelet transform, WT)需要選擇合適的基函數(shù)、短時(shí)傅里葉變換(short time Fourier transform,STFT)需要選擇合適的窗函數(shù)以及窗口大小等,該方法不需要設(shè)定相關(guān)預(yù)定義參數(shù),直接進(jìn)行計(jì)算,擺脫了對(duì)專家經(jīng)驗(yàn)的過度依賴。在本文中,分割1 024 個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)數(shù)據(jù)段,對(duì)每一數(shù)據(jù)段采用上述信號(hào)處理方法,將其構(gòu)成大小為32 ×32 的特征圖。
本文所采用卷積神經(jīng)網(wǎng)絡(luò)是ResNet-18 網(wǎng)絡(luò),它是經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)之一。ResNet 網(wǎng)絡(luò)的特點(diǎn)是其存在著大量殘差模塊,這些殘差模塊包含著恒等映射層,其能使網(wǎng)絡(luò)隨著深度的增加而不會(huì)產(chǎn)生權(quán)重衰減和梯度衰減或消失等問題。ResNet-18 網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示,包含一系列卷積層、恒等映射、Relu 激活函數(shù)、批量標(biāo)準(zhǔn)化、全局均值池化、全連接層等。
圖3 ResNet-18 網(wǎng)絡(luò)結(jié)構(gòu)
圖3 中“Conv 3× 3”指的是長(zhǎng)為3、寬為3 的卷積核;64、128、256、512 表示的是卷積核的個(gè)數(shù);“/2”指的是卷積核的步長(zhǎng)設(shè)置為2,可實(shí)現(xiàn)特征圖的長(zhǎng)寬減半;Relu 是激活函數(shù);BN 是批量標(biāo)準(zhǔn)化;GAP 是全局均值化;Max Pool 是最大值池化,其窗口大小為2 ×2;FC 是全連接層。
實(shí)驗(yàn)所采用的數(shù)據(jù)來(lái)自美國(guó)凱斯西儲(chǔ)大學(xué)的公開軸承實(shí)驗(yàn)數(shù)據(jù),其實(shí)驗(yàn)臺(tái)架如圖4 所示。本文采用的數(shù)據(jù)包含正常運(yùn)行狀態(tài)數(shù)據(jù)、3 種外圈故障數(shù)據(jù)、3 種內(nèi)圈故障數(shù)據(jù)以及3 種滾動(dòng)體故障數(shù)據(jù),共10 種狀態(tài)運(yùn)行數(shù)據(jù),實(shí)驗(yàn)樣本信息如表1 所示,采樣頻率為12 kHz。每種數(shù)據(jù)的樣本數(shù)目為100,每個(gè)樣本有1 024 個(gè)數(shù)據(jù)點(diǎn),共計(jì)1 000個(gè)樣本。將全部樣本經(jīng)過如前所述的處理變換后,從中隨機(jī)抽取700 個(gè)樣本作為訓(xùn)練集,另外300 個(gè)樣本作為測(cè)試集。
圖4 軸承實(shí)驗(yàn)臺(tái)架
表1 故障樣本信息
在本實(shí)驗(yàn)中,需要進(jìn)行設(shè)定的卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)為批量大小m、學(xué)習(xí)速率α以及迭代次數(shù)N。為保證網(wǎng)絡(luò)具有較好的分類效果,本文通過對(duì)m、α以及N進(jìn)行組合對(duì)比試驗(yàn),以得到良好的超參數(shù)組合。選擇常用的m值以及α值作為可選值(m可選值為32、64、128,α可選值為0.01、0.001、0.000 1),得到9 種組合,每種組合迭代次數(shù)為10 次。用已準(zhǔn)備好的訓(xùn)練集對(duì)不同超參數(shù)設(shè)置的神經(jīng)網(wǎng)絡(luò)模型分別進(jìn)行訓(xùn)練,訓(xùn)練完成后,用測(cè)試集進(jìn)行測(cè)試。為避免實(shí)驗(yàn)的偶然性,對(duì)每種組合進(jìn)行10 次訓(xùn)練和測(cè)試,將得到的10 次測(cè)試準(zhǔn)確率結(jié)果去除最大、最小值后取均值,即為平均測(cè)試準(zhǔn)確率,實(shí)驗(yàn)結(jié)果如圖5 所示。
圖5 超參數(shù)設(shè)置結(jié)果
當(dāng)學(xué)習(xí)速率α=0.01 時(shí),由于學(xué)習(xí)速率過大,出現(xiàn)了梯度彌散現(xiàn)象;當(dāng)學(xué)習(xí)速率α=0.001 時(shí),平均測(cè)試準(zhǔn)確率最大值為100%,此時(shí)批量大小m=32;當(dāng)學(xué)習(xí)速率α=0.000 1 時(shí),平均測(cè)試準(zhǔn)確率最大值為100%,此時(shí)批量大小m=32 或m=64。而在平均測(cè)試準(zhǔn)確率為100%的3 種超參數(shù)組合中,α=0.000 1、m=32 組合收斂速度最快。綜上,本文采用學(xué)習(xí)速率α為0.000 1、批量大小m為32、迭代次數(shù)N為10 的超參數(shù)組合進(jìn)行正式的訓(xùn)練和測(cè)試。
用已準(zhǔn)備好的訓(xùn)練集數(shù)據(jù)對(duì)ResNet-18 模型進(jìn)行訓(xùn)練,訓(xùn)練完成后用測(cè)試集數(shù)據(jù)對(duì)模型進(jìn)行測(cè)試。在迭代過程中的平均測(cè)試準(zhǔn)確率結(jié)果如圖6 所示。
圖6 本文方法結(jié)果
可以看出,本文所提出的故障診斷方法對(duì)于多種滾動(dòng)軸承故障具有極好的分類效果,平均測(cè)試準(zhǔn)確率可達(dá)100%,診斷效果優(yōu)良,證明了本文所提出的滾動(dòng)軸承故障診斷方法的可行性與有效性。
為凸顯本文診斷方法的優(yōu)越性,將原始振動(dòng)信號(hào)分別處理成時(shí)域圖像、頻域圖像、經(jīng)過STFT 變換的時(shí)頻圖像以及經(jīng)過WT 變換的時(shí)頻圖像,且圖像均先經(jīng)過灰度化處理,再對(duì)每個(gè)像素點(diǎn)值進(jìn)行歸一化,然后作為ResNet-18 網(wǎng)絡(luò)的輸入,進(jìn)行對(duì)比分析,其結(jié)果如圖7 和表2 所示。
圖7 不同方法平均測(cè)試準(zhǔn)確率變化趨勢(shì)
表2 平均測(cè)試準(zhǔn)確率結(jié)果
通過對(duì)比實(shí)驗(yàn)可知:輸入形式為本文特征圖的卷積神經(jīng)網(wǎng)絡(luò)分類效果最佳,其平均測(cè)試準(zhǔn)確率達(dá)到100%;其次是2 種時(shí)頻圖像以及頻域圖像,平均測(cè)試準(zhǔn)確率分別為99.34%、97.34%、96.86%;最差的是時(shí)域圖像,平均測(cè)試準(zhǔn)確率為63.78%。相對(duì)于其他幾種輸入形式,本文的特征圖能夠更好地表現(xiàn)出信號(hào)的特征,當(dāng)其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入時(shí),更有利于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別分類。此外,相對(duì)于2 種時(shí)頻圖像,本文方法不僅測(cè)試準(zhǔn)確率更高、收斂速度更快,而且不需要設(shè)定相關(guān)預(yù)定義參數(shù),如基函數(shù)、窗函數(shù)、窗口大小等,擺脫了對(duì)專家經(jīng)驗(yàn)的過度依賴。
本文提出了一種基于快速傅里葉變換和卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法。對(duì)原始振動(dòng)信號(hào)進(jìn)行相關(guān)處理得到特征圖,將其作為CNN 的輸入進(jìn)行學(xué)習(xí)訓(xùn)練,并通過超參數(shù)尋優(yōu)使得模型具有較好的診斷效果。實(shí)驗(yàn)結(jié)果表明,提出的診斷方法對(duì)于多類滾動(dòng)軸承故障的識(shí)別準(zhǔn)確率高,診斷效果良好;通過與不同的輸入形式進(jìn)行對(duì)比分析,本文方法的診斷準(zhǔn)確率更高,收斂速度更快,并且在本文方法的信號(hào)處理過程中不需要設(shè)定相關(guān)預(yù)定義參數(shù),可直接進(jìn)行計(jì)算。