雷春麗,夏奔鋒,薛林林,焦孟萱,張護(hù)強(qiáng)
(1.蘭州理工大學(xué)機(jī)電工程學(xué)院,甘肅 蘭州 730050;2.蘭州理工大學(xué)數(shù)字制造技術(shù)與應(yīng)用省部共建教育部重點(diǎn)實(shí)驗(yàn)室,甘肅 蘭州 730050)
滾動(dòng)軸承作為現(xiàn)代旋轉(zhuǎn)機(jī)械的關(guān)鍵零部件之一,它的運(yùn)行狀態(tài)對(duì)整個(gè)機(jī)械設(shè)備的性能、可靠性和使用壽命都有重要影響[1]。滾動(dòng)軸承的故障可能會(huì)導(dǎo)致整個(gè)機(jī)械系統(tǒng)的損壞,造成經(jīng)濟(jì)損失[2]。因此,滾動(dòng)軸承故障的在線監(jiān)測(cè)和實(shí)時(shí)診斷,對(duì)保持設(shè)備運(yùn)轉(zhuǎn)時(shí)的安全性和可靠性具有極其重要的意義。隨著故障診斷技術(shù)的研究不斷深入,學(xué)者們提出了多種通過(guò)人工提取原始信號(hào)特征的傳統(tǒng)智能故障診斷方法[3-5]。這些方法雖然能夠有效地診斷軸承故障,但需手動(dòng)提取故障特征,在實(shí)際工況復(fù)雜多變時(shí)不利于故障特征的快速提取和健康狀態(tài)的準(zhǔn)確識(shí)別[6],因此,需要研究出一種既能自動(dòng)提取故障特征,又能快速精準(zhǔn)識(shí)別故障類型的智能算法。
深度學(xué)習(xí)理論具有強(qiáng)大的自動(dòng)特征提取能力,在圖像識(shí)別[7]、語(yǔ)音識(shí)別[8]、自然語(yǔ)言處理[9]等領(lǐng)域獲得到了廣泛的應(yīng)用。它克服了傳統(tǒng)故障診斷方法適應(yīng)能力弱的問(wèn)題,已經(jīng)成為故障智能診斷的主要手段。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)的代表算法之一,可直接提取原始信號(hào)的特征并進(jìn)行故障診斷。Janssens 等[10]利用CNN 對(duì)齒輪箱中的軸承進(jìn)行故障診斷,相比于常規(guī)算法,其故障診斷精度有了大幅度的提高。宮文峰等[11]對(duì)卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)的選擇和訓(xùn)練技巧進(jìn)行了深度分析,提高了模型結(jié)構(gòu)的通用性和可操作性。
傳統(tǒng)的CNN 模型雖然在滾動(dòng)軸承故障診斷中都有良好的表現(xiàn),但在診斷精度上仍有提升的空間,為此,一系列改進(jìn)的CNN 模型應(yīng)運(yùn)而生。Zhang等[12]提出了一種寬卷積核深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Networks wtih Wide First-layer Kernel,WDCNN),利用第一個(gè)卷積層中的寬卷積核來(lái)提取特征,提高了滾動(dòng)軸承故障診斷的識(shí)別準(zhǔn)確率和抗噪性,但未考慮模型的診斷效率。Liang等[13]提出了一種并行卷積神經(jīng)網(wǎng)絡(luò)(Parallel Convolutional Neural Network,P-CNN),將一維信號(hào)轉(zhuǎn)化為二維圖像,并融合了時(shí)域特征和頻域特征,在故障數(shù)據(jù)樣本較少時(shí)獲得了較高的識(shí)別準(zhǔn)確率。Eren等[14]提出了一種新的卷積神經(jīng)網(wǎng)絡(luò),利用自適應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)(One Dimension Convolutional Neural Network,1D-CNN)分類器進(jìn)行特征提取,實(shí)現(xiàn)了對(duì)滾動(dòng)軸承的實(shí)時(shí)故障診斷。但上述文獻(xiàn)均未考慮環(huán)境噪聲對(duì)模型診斷效果的影響。Yu 等[15]利用多尺度注意映射殘差神經(jīng)網(wǎng)絡(luò)(Residual Neural Network Framework with Multiscale Attention Mapping,ResNet-MA)提取振動(dòng)信號(hào)中的退化特征,提高了模型的故障診斷性能,但該模型結(jié)構(gòu)復(fù)雜,不利于故障的快速診斷。趙小強(qiáng)等[16]提出了一種帶跳躍連接線和空洞卷積的殘差網(wǎng)絡(luò),在變工況和高信噪比條件下取得了較高的識(shí)別準(zhǔn)確率,但未考慮強(qiáng)噪聲背景對(duì)診斷性能的影響。這些方法雖然有效地解決了傳統(tǒng)CNN 診斷精度不足的問(wèn)題,但仍然無(wú)法較好地降低噪聲對(duì)模型的干擾,尤其是在強(qiáng)噪聲環(huán)境下,模型的識(shí)別分類效果有待提高,同時(shí)模型也難以保證較高的計(jì)算效率。
基于上述分析,本文提出了一種優(yōu)化深度殘差網(wǎng)絡(luò)(DS-ResNet)模型進(jìn)行滾動(dòng)軸承故障診斷。首先采用快速傅里葉變換將一維振動(dòng)信號(hào)從時(shí)域轉(zhuǎn)換為頻域進(jìn)行表示,再將其輸入到DS-ResNet 模型中進(jìn)行模型的預(yù)訓(xùn)練,最后通過(guò)在測(cè)試樣本中添加高斯白噪聲模擬實(shí)際工程的噪聲環(huán)境,實(shí)現(xiàn)滾動(dòng)軸承的故障診斷和故障分類,證明了所提方法在強(qiáng)噪聲環(huán)境下的有效性。
He 等[17]提出了深度殘差網(wǎng)絡(luò)(Deep Residual Networks,ResNet),殘差模塊(Residual Building Block,RBB)是ResNet 的核心部分,傳統(tǒng)殘差模塊的結(jié)構(gòu)如圖1 所示。主要由卷積層、BN 層和ReLU激活函數(shù)構(gòu)成,并通過(guò)快捷跨躍實(shí)現(xiàn)信號(hào)的跨層傳播,使訓(xùn)練過(guò)程中的底層誤差可以通過(guò)快捷連接傳遞給上一層,通過(guò)殘差學(xué)習(xí)的方式有效地解決了深度神經(jīng)網(wǎng)絡(luò)由于深度增加而導(dǎo)致整個(gè)網(wǎng)絡(luò)性能下降的問(wèn)題。
圖1 中X表示殘差模塊的輸入;F(X)表示殘差映射函數(shù);G(X)表示底層恒等映射函數(shù);wl表示輸入經(jīng)過(guò)殘差模塊中第l個(gè)卷積層時(shí)獲得的權(quán)重矩陣。
1.1.1 卷積層
卷積層是整個(gè)卷積神經(jīng)網(wǎng)絡(luò)中的核心組成部分,其主要作用是對(duì)輸入數(shù)據(jù)進(jìn)行特征提取。卷積操作運(yùn)算公式如下所示[18]:
1.1.2 批量歸一化層
批量歸一化(Batch Normalization,BN)主要是為了解決內(nèi)部協(xié)變量偏移問(wèn)題而被提出的一種歸一化方法。BN 的表達(dá)式為:
式中xi表示批量歸一化操作的第i個(gè)輸入值;yi表示批量歸一化操作的第i個(gè)輸出值;n表示分類任務(wù)中每個(gè)輸入批次樣本的數(shù)量;γ,β表示BN 層的放縮與偏置;ε表示保證數(shù)值穩(wěn)定的常數(shù)項(xiàng)。
1.1.3 ReLU 激活函數(shù)
ReLU 函數(shù)是CNN 中最常見(jiàn)的激活函數(shù),其主要作用是為網(wǎng)絡(luò)模型提供非線性表達(dá),可以防止網(wǎng)絡(luò)發(fā)生梯度消失問(wèn)題。其數(shù)學(xué)表達(dá)式為:
式中x表示激活函數(shù)的輸入;f表示激活函數(shù)的輸出。
Chollet[19]提出了使用深度可分離卷積代替標(biāo)準(zhǔn)卷積運(yùn)算來(lái)解決模型深度增加導(dǎo)致的診斷性能下降和計(jì)算時(shí)間過(guò)長(zhǎng)的問(wèn)題,在保證網(wǎng)絡(luò)性能優(yōu)良的同時(shí),減少了可訓(xùn)練的權(quán)重參數(shù),使模型更加輕量化。深度可分離卷積(Depthwise Separable Convolution,DSC)的結(jié)構(gòu)如圖2(a)所示,包括一個(gè)使用常規(guī)卷積核寬度的深度卷積層(Depthwise Convolution,DWC)和一個(gè)卷積核尺寸為1×1 的逐點(diǎn)卷積層(Pointwise Convolution,PWC)。
圖2 深度可分離卷積示意圖Fig.2 Schematic of DSC
深度卷積層不同于普通標(biāo)準(zhǔn)卷積,對(duì)輸入的每個(gè)通道進(jìn)行獨(dú)立的卷積操作,卷積核個(gè)數(shù)等于通道數(shù),其表達(dá)式為:
式中S表示輸出特征;V表示寬為W、高為H的卷積核;X表示輸入特征;m表示特征的第m通道;i,j表示輸出特征在第m通道上的i,j坐標(biāo);w,h表示第m通道的卷積核權(quán)重元素坐標(biāo)。
逐點(diǎn)卷積與標(biāo)準(zhǔn)卷積基本相同,主要作用是將輸出特征在通道方向進(jìn)行加權(quán)組合。一維深度可分離卷積的原理和具體操作如圖2 所示,首先利用深度卷積分別提取每個(gè)通道的特征,再利用逐點(diǎn)卷積對(duì)通道輸出特征進(jìn)行整合,若輸入特征尺寸寬度為Wn,通道數(shù)為M,卷積核寬度為W,卷積核數(shù)量為K,則深度可分離卷積的計(jì)算量為:
標(biāo)準(zhǔn)卷積可分為提取特征和合并特征兩個(gè)操作,其操作如圖3 所示,標(biāo)準(zhǔn)卷積的計(jì)算量為:
圖3 標(biāo)準(zhǔn)卷積計(jì)算操作Fig.3 Calculation operation of standard convolution
由式(5)和(6)可得深度可分離卷積和標(biāo)準(zhǔn)卷積的計(jì)算量比值為:
式中 卷積核寬度W通常取3,5 和7,而卷積核數(shù)量K大于1,故式(7)的值小于1,即深度可分離卷積的計(jì)算量小于傳統(tǒng)標(biāo)準(zhǔn)卷積。
本文對(duì)傳統(tǒng)殘差模塊進(jìn)行了優(yōu)化,優(yōu)化殘差模塊(Optimized Residual Building Block,ORBB)如圖4 所示。優(yōu)化的核心部分主要有以下三點(diǎn):
圖4 優(yōu)化殘差模塊Fig.4 Optimized residual building block
(1)將RBB 的第一個(gè)標(biāo)準(zhǔn)卷積層用DSC 代替,其中DWC 通過(guò)拆分通道維度的相關(guān)性降低了模型的復(fù)雜度,從而一定程度上提升了卷積核參數(shù)的使用效率;PWC 增強(qiáng)了網(wǎng)絡(luò)的非線性表達(dá)能力,同時(shí)將多通道特征嵌入到單通道中并保留顯著特征,提高了模型對(duì)淹沒(méi)于噪聲中非敏感特征的提取能力。
(2)在深度可分離卷積層后再增加一個(gè)逐點(diǎn)卷積層,進(jìn)一步提取非敏感特征信息,增強(qiáng)了模型的抗干擾能力。
(3)在逐點(diǎn)卷積層后添加了一個(gè)BN 層,減少在噪聲干擾下樣本特征之間的分布差異,提高了模型的抗噪性和泛化性能。
本文利用深度可分離卷積復(fù)雜度低和逐點(diǎn)卷積能增強(qiáng)網(wǎng)絡(luò)非線性表達(dá)的優(yōu)點(diǎn)對(duì)傳統(tǒng)殘差模塊進(jìn)行了優(yōu)化,提出了一種優(yōu)化深度殘差網(wǎng)絡(luò)滾動(dòng)軸承故障診斷模型,如圖5 所示。在模型的測(cè)試階段,首先利用FFT 將被噪聲信號(hào)干擾的振動(dòng)信號(hào)從時(shí)域轉(zhuǎn)化為頻域進(jìn)行表示,突出故障特征頻率的成分;其次將頻域信號(hào)樣本輸入到訓(xùn)練好的模型中,輸入信號(hào)經(jīng)過(guò)具有寬卷積核的標(biāo)準(zhǔn)卷積層和池化層,削弱噪聲對(duì)提取有用特征信息的影響;然后信號(hào)進(jìn)入兩組ORBB 層和池化層,利用DWC 和PWC 提高對(duì)淹沒(méi)于噪聲中非敏感特征的提取能力,采用BN 層解決由于噪聲干擾引起的內(nèi)部協(xié)變量偏移問(wèn)題,并通過(guò)深層標(biāo)準(zhǔn)卷積層和池化層進(jìn)一步提取抽象特征信息;再經(jīng)過(guò)Dropout 層提高模型對(duì)噪聲的容忍度;最后經(jīng)過(guò)全連接層和Softmax 分類器輸出多種故障類別,實(shí)現(xiàn)滾動(dòng)軸承的故障診斷。
本文采用本實(shí)驗(yàn)室滾動(dòng)軸承故障模擬實(shí)驗(yàn)臺(tái)采集的數(shù)據(jù)來(lái)驗(yàn)證所提方法的有效性。在MFS 實(shí)驗(yàn)臺(tái)上測(cè)試帶有故障的滾動(dòng)軸承,實(shí)驗(yàn)臺(tái)實(shí)物如圖6所示。三相交流電機(jī)與驅(qū)動(dòng)軸通過(guò)聯(lián)軸器相連,轉(zhuǎn)軸兩端各安裝一個(gè)型號(hào)為ER-16K 的深溝球軸承,其中驅(qū)動(dòng)端是帶有故障的軸承,另一端是健康軸承,并在轉(zhuǎn)軸中間安裝了一個(gè)質(zhì)量為5.1 kg 的轉(zhuǎn)盤(pán)以施加50 N 的徑向載荷。實(shí)驗(yàn)采用3 通道數(shù)據(jù)線連接信號(hào)采集器和加速度傳感器,并通過(guò)USB 接口將信號(hào)傳輸?shù)接?jì)算機(jī),以此采集振動(dòng)信號(hào)。本文采集了軸承轉(zhuǎn)速分別為1200,1300 和1400 r/min 三種不同工況下的振動(dòng)信號(hào),信號(hào)采樣頻率為15.3 kHz,采樣時(shí)間為8 s。
本文實(shí)驗(yàn)測(cè)試所用的軸承故障采用激光蝕刻技術(shù)加工而成,其中軸承故障位置為內(nèi)圈故障、外圈故障和滾動(dòng)體故障,如圖7 所示。實(shí)驗(yàn)所用軸承內(nèi)、外圈故障寬度和滾動(dòng)體故障孔徑分別為0.6,1.2 和1.8 mm,可分為輕度、中度和重度三種故障程度,故障深度均為0.25 mm,共計(jì)9 種故障類型。為充分保證每個(gè)數(shù)據(jù)樣本故障信息的完整度,本文設(shè)置每個(gè)樣本長(zhǎng)度為2048 個(gè)采樣點(diǎn),并采用重疊采樣的方式對(duì)數(shù)據(jù)進(jìn)行隨機(jī)分割。每類信號(hào)包含250 個(gè)樣本,共計(jì)2250 個(gè)樣本,并采用One-hot 編碼[20]方式將9種不同故障類型的數(shù)據(jù)樣本進(jìn)行標(biāo)簽化,根據(jù)轉(zhuǎn)速不同可制作成F1,F(xiàn)2 和F3 三種數(shù)據(jù)集,并按照4∶1的比例劃分為訓(xùn)練集和測(cè)試集,具體滾動(dòng)軸承故障的樣本分布如表1 所示。
表1 滾動(dòng)軸承故障樣本分布Tab.1 Fault sample distribution of rolling bearing
圖7 滾動(dòng)軸承故障部位Fig.7 Failure location of rolling bearing
本文實(shí)驗(yàn)的軟件環(huán)境為PyCharm2020.1.2 中的Keras框架,硬件環(huán) 境為Intel(R)Xeon(-R)Silver 4110 CPU @2.10 GHz,2.10 GHz 雙處理器和NVIDIA Quadro P4000 顯卡。
在實(shí)際工況中,采集到的振動(dòng)信號(hào)往往會(huì)受到環(huán)境噪聲的污染,導(dǎo)致信號(hào)中有用的故障信息被掩蓋。對(duì)此,本文將通過(guò)在測(cè)試樣本中添加不同信噪比(Signal to Noise Ratio,SNR)的高斯白噪聲來(lái)模擬實(shí)際工作環(huán)境中不同強(qiáng)度的噪聲。
3.1.1 結(jié)構(gòu)參數(shù)的設(shè)置
模型選取Adam 自適應(yīng)優(yōu)化器優(yōu)化參數(shù),設(shè)置Batch Size=10,epoch=30,深度可分離卷積層和傳統(tǒng)卷積層均采用ReLU 激活函數(shù),Dropout 的值為0.5,即每次訓(xùn)練隨機(jī)選取50%的神經(jīng)元失活,以防止網(wǎng)絡(luò)結(jié)構(gòu)過(guò)擬合,DS-ResNet 模型的結(jié)構(gòu)參數(shù)設(shè)置如表2 所示。
表2 DS-ResNet 模型的結(jié)構(gòu)參數(shù)Tab.2 The structural parameters of DS-ResNet
表2 中每個(gè)優(yōu)化殘差模塊包含了一個(gè)深度可分離卷積層和一個(gè)單一逐點(diǎn)卷積層,如ORBB-1 中,[5,1,64]-[1,1,64]表示深度可分離卷積層中深度卷積的卷積核為5×1,逐點(diǎn)卷積的卷積核為1×1,通道數(shù)為64。其中標(biāo)準(zhǔn)卷積層和優(yōu)化殘差模塊中的卷積步長(zhǎng)均為1×1。
3.1.2 第一層卷積核寬度的選擇
對(duì)于一維振動(dòng)信號(hào),第一層卷積核寬度對(duì)模型的故障診斷性能有著重要的影響[21]。因此,需要選擇合適的卷積核寬度來(lái)保證DS-ResNet 模型的故障診斷性能。由于論文篇幅原因,本文對(duì)第一層卷積核寬度分別為4,32,64,112 和128 時(shí)模型的收斂情況進(jìn)行分析。在數(shù)據(jù)集F3 的測(cè)試集中加入信噪比為-4 dB 的噪聲信號(hào)情況下,不同卷積核寬度時(shí)模型的損失率變化如圖8 所示。
圖8 第一層卷積核寬度不同時(shí)模型的損失率Fig.8 Loss rate of the model with different width of the first layer convolution kernel
從圖8 中可以看出,卷積核寬度為112 時(shí)損失率下降最快且初始值最低;卷積核寬度為4 時(shí)的損失率下降最慢且初始值最高;在經(jīng)過(guò)15 輪計(jì)算之后模型開(kāi)始收斂,從圖中也可看出在收斂時(shí)卷積核寬度為112 時(shí)的損失率最低且最平穩(wěn),其他寬度時(shí)損失率均存在波動(dòng)。不同卷積核寬度時(shí)模型的識(shí)別準(zhǔn)確率如表3 所示,當(dāng)卷積核寬度為4 時(shí)識(shí)別準(zhǔn)確率僅為83.11%,當(dāng)卷積核寬度為112 時(shí)識(shí)別準(zhǔn)確率最高達(dá)到91.78%,當(dāng)卷積核寬度為128 時(shí)識(shí)別準(zhǔn)確率降低至91.11%。出現(xiàn)這種現(xiàn)象的主要原因是當(dāng)卷積核寬度過(guò)小時(shí),難以學(xué)習(xí)到足夠的特征,且易受到高頻噪聲的干擾;而當(dāng)卷積核寬度過(guò)大時(shí),不利于提取信號(hào)的局部特征,導(dǎo)致模型識(shí)別準(zhǔn)確率降低。因此本文選擇第一層卷積核的寬度為112。
表3 第一層卷積核寬度對(duì)識(shí)別準(zhǔn)確率的影響Tab.3 Influence of the width of the first layer convolution kernel on identification accuracy
3.1.3 學(xué)習(xí)率的選擇
學(xué)習(xí)率決定了模型參數(shù)能否更新到最優(yōu)值,學(xué)習(xí)率過(guò)大或過(guò)小都會(huì)影響模型的收斂速度,不利于故障類型的精確識(shí)別[22]。為了避免由于該問(wèn)題導(dǎo)致無(wú)法訓(xùn)練得到最優(yōu)診斷性能的模型,現(xiàn)研究學(xué)習(xí)率分別1×10-3,1×10-4,5×10-5和1×10-5時(shí)對(duì)模型收斂性的影響,設(shè)置第一層卷積核寬度為112,在數(shù)據(jù)集F3 的測(cè)試集中加入信噪比為-4 dB 噪聲信號(hào)的情況下,使用不同學(xué)習(xí)率的模型損失率變化如圖9 所示。
圖9 學(xué)習(xí)率不同時(shí)模型的損失率Fig.9 Loss rate of model with different learning rate
從圖9 中可以看出,學(xué)習(xí)率為1×10-4時(shí)損失率初始值最低且下降最快;學(xué)習(xí)率為1×10-5時(shí)損失率的初始值最高且下降最緩慢;模型經(jīng)過(guò)15 輪計(jì)算之后,學(xué)習(xí)率為1×10-4和5×10-5時(shí)的模型已經(jīng)完全收斂,且學(xué)習(xí)率為1×10-4時(shí)損失率更穩(wěn)定;學(xué)習(xí)率為1×10-3時(shí)的損失率存在較大波動(dòng),學(xué)習(xí)率為1×10-5時(shí)損失率仍處于下降階段,模型均尚未完全收斂。不同學(xué)習(xí)率時(shí)模型的識(shí)別準(zhǔn)確率如表4 所示。當(dāng)學(xué)習(xí)率為1×10-4時(shí)識(shí)別準(zhǔn)確率達(dá)到91.78%,當(dāng)學(xué)習(xí)率為1×10-5時(shí)識(shí)別準(zhǔn)確率最低僅為84.44%。經(jīng)過(guò)以上分析,本文設(shè)置學(xué)習(xí)率為1×10-4。
表4 學(xué)習(xí)率對(duì)識(shí)別準(zhǔn)確率的影響Tab.4 Influence of learning rate on identification accuracy
3.2.1 模型驗(yàn)證
為了驗(yàn)證本文所提出的DS-ResNet 模型的診斷性能,與5 種常用的深度學(xué)習(xí)故障診斷模型進(jìn)行對(duì)比分析,其中A 表示本文所提模型,采用DS-ResNet的滾動(dòng)軸承故障診斷方法;B 表示傳統(tǒng)ResNet 模型,僅殘差塊結(jié)構(gòu)與本文模型不同,為RBB 結(jié)構(gòu);C表示LeNet-5 模型,是一種主要由兩組卷積層和池化層構(gòu)成的輕量化淺層神經(jīng)網(wǎng)絡(luò);D 表示VGG16 模型,是一種常見(jiàn)的深層神經(jīng)網(wǎng)絡(luò);E 表示W(wǎng)DCNN 模型[13],是一種寬卷積核深度卷積神經(jīng)網(wǎng)絡(luò);F 表示MBDS-CNN 模型[22],是一種多分支深度可分離卷積神經(jīng)網(wǎng)絡(luò)。以上所有深度學(xué)習(xí)模型的參數(shù)設(shè)置均與本文模型相同,并在卷積層之后均添加BN 層。
采用每輪次的訓(xùn)練時(shí)間來(lái)評(píng)估本文故障診斷模型的計(jì)算效率,實(shí)驗(yàn)在轉(zhuǎn)速為1400 r/min,信噪比為-4 dB 的噪聲信號(hào)環(huán)境下進(jìn)行,所得結(jié)果均取10 次實(shí)驗(yàn)的平均值,結(jié)果如表5 所示。表中模型深度包含卷積層、池化層、BN 層、Dropout 層、全連接層和Softmax 層。由表5 可以看出本文模型的計(jì)算效率高于模型B,D,E 和F,比這4 種模型中深度最淺的模型E 快了0.29 s,比深度最深的模型F 快了1.01 s;相較于最典型的淺層神經(jīng)網(wǎng)絡(luò)模型C,本文模型雖然在計(jì)算效率上沒(méi)有優(yōu)勢(shì),但在信噪比為-4 dB 的強(qiáng)噪聲環(huán)境下的識(shí)別準(zhǔn)確率提高了10.49%。
表5 不同模型的故障診斷效果Tab.5 Fault diagnosis effects of different models
3.2.2 抗噪性能分析
為了驗(yàn)證本文所提DS-ResNet 模型的抗噪性,分別與5種常用的深度學(xué)習(xí)故障診斷模型(與3.2.1節(jié)相同)在轉(zhuǎn)速為1400 r/min 的工況下進(jìn)行對(duì)比分析,設(shè)置信噪比為-4~4 dB,實(shí)驗(yàn)所得結(jié)果均取10 次實(shí)驗(yàn)的平均值,實(shí)驗(yàn)結(jié)果如圖10 所示。
圖10 不同模型在噪聲環(huán)境下的識(shí)別準(zhǔn)確率Fig.10 Identification accuracy of different models in noisy environment
由圖10 可知,在信噪比為-4~4 dB 的環(huán)境下,本文模型的故障識(shí)別準(zhǔn)確率均為最高。尤其是在信噪比為-4 dB 的強(qiáng)噪聲環(huán)境中,本文所提出的模型的故障識(shí)別準(zhǔn)確率達(dá)到92.71%,模型B,C,D,E 和F 分別為90.67%,82.22%,80.27%,85.78% 和83.29%,模型A 比5 種對(duì)比模型的識(shí)別準(zhǔn)確率分別高2.04%,10.49%,12.44%,6.93% 和9.42%;在信噪比為-2 dB 的噪聲環(huán)境中,所有模型的故障識(shí)別準(zhǔn)確率均高于90%,其中本文所提模型識(shí)別準(zhǔn)確率為98.22%,比最高的ResNet 高0.58%,比最低的VGG16 高6.75%;當(dāng)信噪比為4 dB 時(shí),6 種模型的故障識(shí)別準(zhǔn)確率均在99%以上,本文模型的識(shí)別準(zhǔn)確率依然最高,達(dá)到100%。
為了進(jìn)一步驗(yàn)證本文模型在受到強(qiáng)噪聲干擾時(shí)的診斷性能,采用箱型圖來(lái)說(shuō)明不同模型識(shí)別結(jié)果的穩(wěn)定性,實(shí)驗(yàn)在信噪比為-4 dB 和-2 dB 的噪聲環(huán)境下進(jìn)行,結(jié)果如圖11 所示。所提出的DS-ResNet模型在強(qiáng)噪聲環(huán)境下具有較好的識(shí)別效果,并且方差較小。除了在信噪比為-2 dB 時(shí)ResNet的識(shí)別準(zhǔn)確率表現(xiàn)出較小方差,其他模型在強(qiáng)噪聲環(huán)境下的識(shí)別結(jié)果都不夠穩(wěn)定。結(jié)果表明,與其他模型相比,本文所提模型能顯著提高滾動(dòng)軸承故障在受到強(qiáng)噪聲干擾時(shí)識(shí)別效果的準(zhǔn)確性和穩(wěn)定性。
圖11 不同模型在強(qiáng)噪聲環(huán)境下的識(shí)別準(zhǔn)確率箱型圖Fig.11 Box diagram of identification accuracy of different models in strong noise environment
3.2.3 泛化性能分析
為驗(yàn)證DS-ResNet 模型在強(qiáng)噪聲環(huán)境中變工況下識(shí)別軸承損傷程度的能力,設(shè)置了泛化性能實(shí)驗(yàn),實(shí)驗(yàn)在信噪比為-4 dB 強(qiáng)噪聲環(huán)境下進(jìn)行。分別與5 種常用的深度學(xué)習(xí)故障診斷模型(與3.2.1 節(jié)相同)進(jìn)行對(duì)比分析,選用三種不同轉(zhuǎn)速下的故障數(shù)據(jù)即F1,F(xiàn)2 和F3 構(gòu)建訓(xùn)練集和測(cè)試集,如F1→F2 表示數(shù)據(jù)集F1 用于模型訓(xùn)練,數(shù)據(jù)集F2 用于模型測(cè)試。所得結(jié)果均取10 次實(shí)驗(yàn)的平均值,實(shí)驗(yàn)結(jié)果如表6 所示。
表6 不同模型在變轉(zhuǎn)速工況下的故障識(shí)別效果Tab.6 Fault identification effects of different models under variable speed conditions
從表6 可以看出,在信噪比為-4 dB 的情況下,本文所提出的DS-ResNet 模型在6 種變轉(zhuǎn)速工況中的平均識(shí)別準(zhǔn)確率為90.23%,是所有模型中故障識(shí)別效果最好的。模型B 是5 種常用模型中識(shí)別效果最佳的,其平均識(shí)別準(zhǔn)確率為88.21%,但依然比本文模型低2.02%。對(duì)比分析模型A 和B 各實(shí)驗(yàn)工況的故障識(shí)別性能,在6 種工況下模型B 的識(shí)別準(zhǔn)確率均不如模型A,由此可見(jiàn),在深度殘差網(wǎng)絡(luò)中引入深度可分離卷積和逐點(diǎn)卷積,可有效改善模型的特征提取能力,從而增強(qiáng)了模型在強(qiáng)噪聲環(huán)境下的變轉(zhuǎn)速自適應(yīng)能力。模型C 的平均識(shí)別準(zhǔn)確率是所有模型中最低的,僅為69.17%,比模型A 低了21.06%。綜上所述,在受到強(qiáng)噪聲干擾同時(shí)轉(zhuǎn)速改變的工況下,本文所提模型在滾動(dòng)軸承故障識(shí)別中仍然保持了較好的泛化性能。
3.2.4 分類結(jié)果可視化
本節(jié)采用t-SNE(t-Distributed Stochastic Neighbor Embedding)非線性降維算法,分別對(duì)本文所提模型在數(shù)據(jù)集F3 的測(cè)試集中添加信噪比為-4~4 dB 噪聲時(shí)的分類結(jié)果進(jìn)行可視化,圖12 展示了模型在不同強(qiáng)度噪聲環(huán)境下故障類別的分布情況。
圖12 不同信噪比環(huán)境下模型的預(yù)測(cè)樣本分布Fig.12 Prediction sample distribution of the model in different SNR environments
從圖12 中可以看出,隨著信噪比的提高,模型的故障分類能力也隨之增強(qiáng)。在信噪比為-4 dB時(shí),大多數(shù)故障可以很好地聚類,只有標(biāo)簽3 和6 在聚類過(guò)程中有部分重疊,說(shuō)明此時(shí)中度內(nèi)圈故障和重度內(nèi)圈故障容易混淆;在信噪比為2 dB 時(shí),所有故障都得到了很好地聚類,模型可以很清晰地識(shí)別出所有故障類別,驗(yàn)證了本文模型在噪聲環(huán)境下有較好的故障分類能力。
3.2.5 權(quán)重優(yōu)化過(guò)程可視化
能否學(xué)習(xí)到合適的權(quán)重參數(shù)是深度神經(jīng)網(wǎng)絡(luò)的核心問(wèn)題之一,為了理解深層網(wǎng)絡(luò)模型中深層權(quán)重的優(yōu)化過(guò)程,利用TensorBoard 可視化工具對(duì)模型的權(quán)重分布進(jìn)行可視化分析,兩個(gè)深度可分離卷積層和最后一個(gè)標(biāo)準(zhǔn)卷積層的權(quán)重分布隨輪次的變化如圖13 所示。
圖13 模型權(quán)重優(yōu)化過(guò)程的可視化Fig.13 Visualization of model weight optimization process
從圖13 中可以看出,隨著計(jì)算輪次的增加,權(quán)重不斷更新,在第7 輪次模型開(kāi)始收斂;第一個(gè)DSC層卷積核的權(quán)重密集分布范圍最大,為-0.17~0.17,學(xué)到的特征最多;隨著模型深度的增加,權(quán)重密集分布范圍開(kāi)始減小,第二個(gè)DSC 層卷積核的權(quán)重密集分布范圍為-0.12~0.12,相比于第一個(gè)DSC 層的權(quán)重密集分布范圍更小,學(xué)到的特征也隨之減少;最后一個(gè)標(biāo)準(zhǔn)卷積層卷積核的權(quán)重密集分布范圍為-0.10~0.10,學(xué)到的特征最少。由此可知,隨著網(wǎng)絡(luò)深度的增加,本文所提模型的權(quán)重分布范圍在最后一個(gè)標(biāo)準(zhǔn)卷積層達(dá)到最小,此時(shí)模型收斂。
(1)本文提出了基于DS-ResNet 的滾動(dòng)軸承故障診斷模型,以模型的收斂性為評(píng)價(jià)指標(biāo),研究第一層卷積核寬度和學(xué)習(xí)率對(duì)所提模型診斷性能的影響規(guī)律,最后確定當(dāng)?shù)谝粚泳矸e核寬度為112、學(xué)習(xí)率為1×10-4時(shí)模型的診斷性能最佳。
(2)所提DS-ResNet 模型在信噪比為-4 dB 的強(qiáng)噪聲環(huán)境下對(duì)各類軸承故障進(jìn)行分類,識(shí)別準(zhǔn)確率達(dá)到92.71%,模型每輪次訓(xùn)練時(shí)間僅為2.16 s,提高了滾動(dòng)軸承故障的識(shí)別準(zhǔn)確率和診斷效率。在轉(zhuǎn)速改變的情況下,所提模型的平均識(shí)別準(zhǔn)確率依然可達(dá)90.23%,提高了滾動(dòng)軸承故障診斷的變轉(zhuǎn)速自適應(yīng)能力。與其他常用的深度學(xué)習(xí)故障診斷模型相比,DS-ResNet 模型在受到強(qiáng)噪聲干擾和變轉(zhuǎn)速工況下保持了較高的識(shí)別準(zhǔn)確率,在強(qiáng)噪聲環(huán)境下具有更好的抗干擾能力和泛化性能。
(3)采用t-SNE 算法對(duì)模型在不同強(qiáng)度噪聲環(huán)境下的分類結(jié)果進(jìn)行可視化分析,進(jìn)一步驗(yàn)證了本文模型在噪聲環(huán)境下有較好的故障分類能力;采用TensorBoard 可視化工具對(duì)模型的權(quán)重分布進(jìn)行展示,有利于更深刻地理解模型權(quán)重的優(yōu)化過(guò)程。