閆佳瑛,朱希安
(北京信息科技大學(xué) 信息與通信工程學(xué)院,北京 100101)
滾動(dòng)軸承是電機(jī)設(shè)備中最常用的部件,其運(yùn)行狀態(tài)對(duì)機(jī)械電機(jī)的穩(wěn)定性和壽命有直接的影響[1-2]。電機(jī)設(shè)備長(zhǎng)期處于復(fù)雜的工作環(huán)境下,其軸承故障信號(hào)普遍呈現(xiàn)線性平穩(wěn)的特點(diǎn),難以充分提取故障信號(hào)的特征,導(dǎo)致電機(jī)軸承故障的識(shí)別準(zhǔn)確率不高。因此,如何快速高效地提取出故障信號(hào)的特征,進(jìn)而精準(zhǔn)識(shí)別電機(jī)軸承故障的狀態(tài),一直是國(guó)內(nèi)外學(xué)者關(guān)注的問(wèn)題。
一般的研究思路是,通過(guò)各種方法對(duì)振動(dòng)信號(hào)的故障特征進(jìn)行提取,然后構(gòu)建模型對(duì)故障特征進(jìn)行學(xué)習(xí)分析,進(jìn)而對(duì)故障進(jìn)行精準(zhǔn)的分類(lèi)識(shí)別。來(lái)凌紅等[3]通過(guò)將經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和樣本熵結(jié)合的方法對(duì)滾動(dòng)軸承故障進(jìn)行診斷,但EMD方法存在模態(tài)混疊現(xiàn)象。文獻(xiàn)[4-5]提出了一種變分模態(tài)分解(variational mode decomposition,VMD)方法,該方法具有一定的自適應(yīng)性,能夠?qū)⑿盘?hào)從不同頻段分離并提取出有效成分,有效解決了EMD方法產(chǎn)生的模態(tài)混疊現(xiàn)象。機(jī)器學(xué)習(xí)在故障識(shí)別領(lǐng)域也應(yīng)用廣泛,張優(yōu)云等[7]采用集成支持向量機(jī)(support vector machines,SVM)的方法對(duì)滾動(dòng)軸承故障智能診斷進(jìn)行研究,但該方法存在核函數(shù)難以確定且對(duì)弱故障特征難以識(shí)別的問(wèn)題。付華等[8]提出組合核相關(guān)向量機(jī)的方法,雖然改進(jìn)了SVM存在的問(wèn)題,但在解決多分類(lèi)問(wèn)題時(shí),存在累積誤差、結(jié)構(gòu)十分復(fù)雜的問(wèn)題。
本文為充分提取故障信號(hào)識(shí)別特征將VMD與CNN相結(jié)合。通過(guò)VMD方法分解原始信號(hào)得到模態(tài)向量(intrinsic mode function,IMF),達(dá)到擴(kuò)大信號(hào)識(shí)別特征的目的;同時(shí)利用峭度準(zhǔn)則對(duì)分解后的若干模態(tài)向量進(jìn)行篩選,選取符合條件的模態(tài)數(shù)據(jù)結(jié)合原始振動(dòng)信號(hào)構(gòu)成新的二維特征圖作為模型輸入,對(duì)正常情況、內(nèi)外圈故障及滾子故障等多種故障情況進(jìn)行識(shí)別判斷。
在故障診斷識(shí)別的過(guò)程中,對(duì)振動(dòng)信號(hào)的特征提取直接關(guān)系到診斷結(jié)果。原始振動(dòng)信號(hào)的信息特征較為單一,通過(guò)對(duì)振動(dòng)信號(hào)的分解,可以豐富信號(hào)的特征,便于提取故障特征進(jìn)而提高識(shí)別準(zhǔn)確率。傳統(tǒng)EMD算法存在模態(tài)混疊等問(wèn)題,不利于故障特征的提取。VMD算法能夠有效地克服模態(tài)混疊問(wèn)題,實(shí)現(xiàn)各個(gè)分量序列的自適應(yīng)分割。本文采用VMD算法對(duì)原始振動(dòng)信號(hào)進(jìn)行自適應(yīng)分解,進(jìn)而豐富輸入數(shù)據(jù)的故障識(shí)別特征。
VMD算法對(duì)信號(hào)的分解過(guò)程可理解為對(duì)變分問(wèn)題構(gòu)造并求最優(yōu)解的過(guò)程[9]。
假設(shè)原始振動(dòng)信號(hào)f包含k個(gè)有限帶寬的模態(tài)分量uk(t),其中各模態(tài)之和等于輸入信號(hào)f且各個(gè)模態(tài)分量的中心頻率為ωk,詳細(xì)構(gòu)造步驟如下:
振動(dòng)信號(hào)f經(jīng)過(guò)Hilbert變換,得到uk(t)的解析信號(hào),將解析信號(hào)的單邊譜乘以e-jωkt,則各模態(tài)分量uk(t)的中心頻帶會(huì)被調(diào)制到基頻帶上,uk(t)為
(1)
式中δ(t)為狄拉克函數(shù)。然后計(jì)算得到上述解調(diào)信號(hào)梯度的平方L2范數(shù)并估算出uk(t)的帶寬,受約束的變分問(wèn)題如下:
(2)
通過(guò)引入拉格朗日乘法算子λ(t)及二次懲罰因子α,可將式(2)問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題。其中,α能夠保證信號(hào)的重構(gòu)精度,λ(t)能夠保證約束條件的嚴(yán)格性。將λ(t)及α代入式(2)得
L({uk},{ωk},λ)=
(3)
利用乘子交替方向算法求解式(3),該算法的原理通過(guò)不斷更新各分量及其中心頻率,求解得到上述非約束模型的鞍點(diǎn),也就是原問(wèn)題的最優(yōu)解,而所有的分量可從頻域中由式(4)獲得:
(4)
(5)
VMD算法步驟如下:
2)根據(jù)式(4)和式(5)更新uk和ωk;
3)更新λ:
(6)
根據(jù)VMD算法的具體步驟可以看出,VMD算法的分解過(guò)程是比較簡(jiǎn)單的,主要包括兩部分:首先各IMF在頻域上不斷進(jìn)行更新,通過(guò)傅里葉反變換法變換到時(shí)域;然后各IMF的中心頻率不斷估計(jì)并進(jìn)行交替更新,將振動(dòng)信號(hào)進(jìn)行自適應(yīng)分解得到多個(gè)子序列。
峭度為無(wú)量綱的參數(shù),用來(lái)描述振動(dòng)信號(hào)的峰值程度。原始振動(dòng)信號(hào)經(jīng)過(guò)VMD算法分解后得到IMF分量,則IMF分量的峭度為
(7)
若滾動(dòng)軸承未發(fā)生故障,則其振動(dòng)信號(hào)近似正態(tài)分布,此時(shí)通過(guò)式(7)計(jì)算可得其峭度值約為3;而當(dāng)振動(dòng)信號(hào)受到多沖擊成分影響時(shí),其峭度值會(huì)明顯增大[12]。當(dāng)滾動(dòng)軸承發(fā)生故障時(shí),其檢測(cè)到的振動(dòng)信號(hào)會(huì)受到?jīng)_擊導(dǎo)致波形偏離正態(tài)分布,且峭度值越大表示信號(hào)受沖擊越強(qiáng)烈,包含的故障信息越多。當(dāng)軸承某個(gè)部位出現(xiàn)故障后,會(huì)連帶影響其他部件產(chǎn)生頻段各異的固有振動(dòng)。此時(shí),各模態(tài)分量同樣受到影響產(chǎn)生不同頻段的振動(dòng)成分,模態(tài)分量的峭度值越大說(shuō)明其受到的沖擊影響強(qiáng)烈,包含的故障信息也越明顯,經(jīng)特征提取后更易被識(shí)別。
卷積神經(jīng)網(wǎng)絡(luò)[9-11]包含輸入層、卷積層、池化層、全連接層和輸出層。它通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行一系列的卷積運(yùn)算、池化操作以及非線性激活函數(shù)映射等方式,得到抽象度更高的特征,最終在全連接層和輸出層將提取到的特征信息映射到樣本的標(biāo)記空間。圖1是簡(jiǎn)單的卷積神經(jīng)網(wǎng)絡(luò)模型。
在卷積層中,卷積核按照指定步長(zhǎng)對(duì)輸入矩陣進(jìn)行卷積操作,并且利用激活函數(shù)獲取卷積操作后的非線性特征,該函數(shù)式如下:
(8)
池化層也被稱(chēng)為下采樣層,一般夾在兩個(gè)卷積操作之間,當(dāng)卷積核位于池化層時(shí),只取對(duì)應(yīng)位置的平均值、最大值等(平均池化、最大池化),即矩陣之間的運(yùn)算規(guī)律不一樣,并且不受到模型反向傳播的影響。池化層在保證主要特征不受影響的同時(shí)減少參數(shù)和計(jì)算量,用于壓縮數(shù)據(jù)和參數(shù),它的泛化能力更強(qiáng),更加不容易產(chǎn)生過(guò)擬合現(xiàn)象。為保證故障特征不丟失,采取最大值池化方式,表達(dá)式如下:
(9)
經(jīng)過(guò)所有的卷積運(yùn)算和池化操作后,特征提取數(shù)據(jù)進(jìn)入到全連接層。全連接層類(lèi)似于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),該層中的每個(gè)神經(jīng)層與其前一層的所有神經(jīng)元進(jìn)行全連接。將卷積層和池化層提取到的局部特征信息進(jìn)行整合。同時(shí),為避免過(guò)擬合現(xiàn)象,在該層中加入丟失數(shù)據(jù)(dropout)技術(shù)。經(jīng)過(guò)最后一層全連接層的輸出值會(huì)傳遞到輸出層,在該層中一般采用邏輯回歸方法對(duì)故障特征進(jìn)行分類(lèi)。原始振動(dòng)信號(hào)經(jīng)VMD算法分解后,產(chǎn)生多個(gè)模態(tài)分量,經(jīng)峭度準(zhǔn)則篩選后作為CNN的輸出。
VMD與CNN的聯(lián)合故障診斷單位,能夠有效地提取振動(dòng)信號(hào)的故障特征,并對(duì)故障特征進(jìn)行識(shí)別分類(lèi),方法流程如圖2所示,步驟如下:
1)將采集到的原始振動(dòng)信號(hào)利用VMD算法進(jìn)行分解,得到若干模態(tài)分量;
2)根據(jù)式(7)來(lái)計(jì)算各模態(tài)分量的峭度值,根據(jù)峭度值的大小篩選IMF分量,并結(jié)合原始振動(dòng)信號(hào)構(gòu)成混合特征矩陣作為網(wǎng)絡(luò)模型的輸入。
3)將特征矩陣進(jìn)行歸一化處理后輸入模型,通過(guò)調(diào)整確定CNN模型的最優(yōu)結(jié)構(gòu),利用測(cè)試樣本對(duì)訓(xùn)練模型進(jìn)行測(cè)試和驗(yàn)證。
為驗(yàn)證本文提出的基于VMD與CNN結(jié)合的滾動(dòng)軸承故障診斷模型的性能,采用美國(guó)凱斯西儲(chǔ)大學(xué)所公開(kāi)的軸承實(shí)驗(yàn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。軸承型號(hào)為SKF6205,轉(zhuǎn)速1730~1797 r/min,采樣頻率為12 kHz。其中故障部位分別位于內(nèi)、外圈及滾子,損傷直徑分為3種:0.21 mm、0.14 mm和0.07 mm。實(shí)驗(yàn)故障分類(lèi)共有10種,假如外圈直徑0.21 mm的故障類(lèi)型是9,其編碼為[0,0,0,0,0,0,0,0,1,0]。每種分類(lèi)樣本數(shù)約為400組。隨機(jī)選取80%作為訓(xùn)練集,20%作為測(cè)試集。每個(gè)樣本長(zhǎng)度為2048,其中故障尺寸直徑為0.07 mm時(shí)的時(shí)域波形如圖3所示。
以電機(jī)滾動(dòng)體故障為例。采用本文的VMD方法進(jìn)行原始振動(dòng)信號(hào)的預(yù)處理,取模態(tài)常數(shù)k為8,得到8個(gè)不發(fā)生模態(tài)混疊的模態(tài)分量,如圖4所示。相較于EMD算法分解,更能有效及準(zhǔn)確地反映振動(dòng)信號(hào)的物理意義。通過(guò)分解在避免噪聲干擾的同時(shí)能夠增加信號(hào)故障特征的可識(shí)別性。
通過(guò)VMD算法分解后的一些分量不能充分體現(xiàn)信號(hào)的特征,而且會(huì)使后期模型的復(fù)雜度增加,導(dǎo)致不必要的時(shí)間成本。因此,需要通過(guò)峭度準(zhǔn)則的方法對(duì)分解后所得到的模態(tài)分量做進(jìn)一步的篩選。通過(guò)式(7)可以得到模態(tài)分量的峭度值,峭度值越大包含的故障信息越明顯,故選取前5個(gè)峭度值較大的模態(tài)分量來(lái)構(gòu)造特征矩陣。
通過(guò)峭度準(zhǔn)則篩選出的5個(gè)模態(tài)分量及其峭度值如表1所示,這5個(gè)分量幾乎包含了振動(dòng)信號(hào)的最主要信息,故本文將這5個(gè)IMF分量與原始振動(dòng)信號(hào)結(jié)合構(gòu)成2 048×6的特征矩陣,并對(duì)該矩陣做歸一化預(yù)處理,以此作為故障診斷模型的輸入數(shù)據(jù)。
表1 部分IMF峭度值
卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù)對(duì)模型的準(zhǔn)確率以及訓(xùn)練時(shí)間有直接影響,需要憑借歷史經(jīng)驗(yàn)及大量的實(shí)驗(yàn)確定超參數(shù)的值。本文卷積核大小為3×3,池化層選用最大池化方法且激活函數(shù)選擇修正線性單元(ReLU)。在此基礎(chǔ)上為減少訓(xùn)練的時(shí)間成本,最大程度減少過(guò)擬合以及陷入局部最優(yōu)等情況。下面討論各卷積層卷積核的數(shù)目以及每次批處理樣本數(shù)目?jī)煞N因素對(duì)故障診斷準(zhǔn)確率的影響,從而確定卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)。
4.2.1 卷積核的個(gè)數(shù)
卷積神經(jīng)網(wǎng)絡(luò)中卷積核個(gè)數(shù)的增加能夠充分提取訓(xùn)練樣本中的差別信息。但在本實(shí)驗(yàn)中,由于樣本數(shù)量有限,為最大程度地減少過(guò)擬合現(xiàn)象的發(fā)生以及考慮到時(shí)間成本,在設(shè)定卷積層為兩層的前提下,確定各層卷積核的個(gè)數(shù)。在不同配置方案下,設(shè)定4種不同超參數(shù)的模型進(jìn)行訓(xùn)練評(píng)估,取訓(xùn)練集、驗(yàn)證集以及測(cè)試集的平均準(zhǔn)確率為衡量依據(jù)。不同模型的實(shí)驗(yàn)結(jié)果如表2所示。
表2 不同卷積核數(shù)目的實(shí)驗(yàn)結(jié)果 %
由表2可以看出,隨著配置方案種各層卷積核數(shù)量的增加,訓(xùn)練集的準(zhǔn)確率在不斷上升,但驗(yàn)證集準(zhǔn)確率卻在相對(duì)降低,可見(jiàn)模型過(guò)擬合現(xiàn)象在逐步加重。故本文采用的卷積層卷積核的個(gè)數(shù)為(16,32)的形式。
4.2.2 批次處理樣本數(shù)目
為避免CNN模型陷入局部最優(yōu),致使模型泛化能力變差,本實(shí)驗(yàn)使用批次處理樣本的方式來(lái)加快模型的收斂,但批次樣本數(shù)目過(guò)多的話會(huì)產(chǎn)生內(nèi)存消耗及迭代次數(shù)過(guò)大等問(wèn)題。本文設(shè)置批次樣本數(shù)為50、100、150、200、300分別進(jìn)行5次訓(xùn)練,以平均準(zhǔn)確率作為評(píng)估標(biāo)準(zhǔn)進(jìn)行模型評(píng)估,表3為實(shí)驗(yàn)結(jié)果。由表中可見(jiàn)當(dāng)設(shè)置批處理樣本數(shù)目為100時(shí),測(cè)試集識(shí)別的準(zhǔn)確率能夠達(dá)到最優(yōu),因此在本模型中采用批次處理樣本數(shù)目為100。
表3 不同批次處理樣本數(shù)目的實(shí)驗(yàn)結(jié)果 %
綜合前文分析,具體網(wǎng)絡(luò)模型參數(shù)設(shè)置如表4所示。
表4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文采用TensorFlow架構(gòu)進(jìn)行神經(jīng)網(wǎng)絡(luò)模型構(gòu)建,訓(xùn)練集和測(cè)試集損失函數(shù)值變化曲線如圖5所示。
訓(xùn)練集和測(cè)試集的準(zhǔn)確率如圖6所示。
由圖6可以看出,本模型訓(xùn)練集準(zhǔn)確率在98%以上,測(cè)試集準(zhǔn)確率基本穩(wěn)定在95%,且迭代次數(shù)較少,訓(xùn)練成本也較低,具備較好的識(shí)別效果。
為比較本文所提故障診斷模型與其他故障診斷算法的診斷效果,選擇BP神經(jīng)網(wǎng)絡(luò)方法對(duì)同類(lèi)型故障進(jìn)行分類(lèi)識(shí)別診斷。
其中BP神經(jīng)網(wǎng)絡(luò)的輸入為時(shí)域特征:峭度、脈沖、峰值、均方根頻率、波形、頻率標(biāo)準(zhǔn)差等6種因子。BP神經(jīng)網(wǎng)絡(luò)模型設(shè)定為4層隱含層,每層包含50個(gè)神經(jīng)元。
同樣以西儲(chǔ)大學(xué)公開(kāi)數(shù)據(jù)集為實(shí)驗(yàn)數(shù)據(jù)集,其中隨機(jī)80%作為訓(xùn)練集,20%作為測(cè)試集。診斷準(zhǔn)確率如圖7所示。其中測(cè)試集準(zhǔn)確率在80%左右,遠(yuǎn)低于本文所提的模型。
本文建立的基于VMD和CNN的滾動(dòng)軸承故障診斷模型是一種信號(hào)處理與深度學(xué)習(xí)的診斷模型。通過(guò)采用VMD算法對(duì)振動(dòng)信號(hào)進(jìn)行分解,并依據(jù)峭度準(zhǔn)則進(jìn)行篩選,增加故障識(shí)別特征的同時(shí),減少模型的復(fù)雜度及時(shí)間成本,再結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)故障進(jìn)行診斷分類(lèi)。利用西儲(chǔ)大學(xué)的軸承故障數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),結(jié)果表明此模型的診斷準(zhǔn)確率優(yōu)于傳統(tǒng)方法。