董逸凡,文傳博,王正
(上海電機(jī)學(xué)院 電氣學(xué)院,上海 201306)
軸承是電動(dòng)機(jī)的重要部件,對(duì)電動(dòng)機(jī)的健康可靠運(yùn)行有著極大影響[1],約40%大型機(jī)械系統(tǒng),90%小型機(jī)械系統(tǒng)的故障可歸因于軸承缺陷[2],因此,軸承故障診斷的研究具有十分重要的現(xiàn)實(shí)意義。近年來(lái),基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷算法發(fā)展迅速,但其會(huì)遇到數(shù)據(jù)不平衡的問(wèn)題,即不同類別的樣本量差異非常大。在實(shí)際工況中,正常狀態(tài)下收集到的數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于故障狀態(tài)下的數(shù)據(jù),從而帶來(lái)以下問(wèn)題:1)少數(shù)類樣本所包含的信息有限,導(dǎo)致少數(shù)類的識(shí)別率低;2)許多算法在存在不確定時(shí)往往傾向于把樣本分類為多數(shù)類,這將極大地影響算法精度[3]。因此,解決不平衡數(shù)據(jù)所帶來(lái)的影響是當(dāng)前研究的熱點(diǎn)。
目前,國(guó)內(nèi)外學(xué)者試圖從以下幾個(gè)方面解決不平衡問(wèn)題:
1)數(shù)據(jù)層面,研究主要涵蓋了上采樣、下采樣以及數(shù)據(jù)增廣。文獻(xiàn)[4]提出一種二次數(shù)據(jù)增強(qiáng)以及深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的故障診斷模型,通過(guò)重采樣構(gòu)造平衡數(shù)據(jù)集,再利用一維CNN進(jìn)行特征提取;文獻(xiàn)[5]結(jié)合過(guò)采樣和欠采樣方法,提出了一種基于混合采樣和支持向量機(jī)(Support Vector Machine,SVM)的診斷方法;文獻(xiàn)[6]結(jié)合CNN設(shè)計(jì)了一種新的生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)模型,使用CNN提取特征后再利用GAN將特征解碼生成樣本。
2)算法層面,主要是研究不平衡權(quán)重對(duì)模型的影響。文獻(xiàn)[7]提出一種基于自適應(yīng)增強(qiáng)算法(Adaptive Boosting,AdaBoost)集成加權(quán)寬度學(xué)習(xí)系統(tǒng)的不平衡數(shù)據(jù)分類方法;文獻(xiàn)[8]提出一種自適應(yīng)權(quán)重和多尺度卷積的提升CNN,對(duì)多尺度特征進(jìn)行加權(quán)融合,增加重要特征的貢獻(xiàn)度,減少非相關(guān)特征的影響。
3)損失函數(shù)層面,主要通過(guò)對(duì)少數(shù)類樣本的損失進(jìn)行加權(quán)從而使得算法更關(guān)注少數(shù)類樣本[9-10]。
4)試驗(yàn)驗(yàn)證,通過(guò)大量試驗(yàn)將不平衡問(wèn)題轉(zhuǎn)換為樣本的難易區(qū)分問(wèn)題,從另一個(gè)角度解決不平衡問(wèn)題[11-12]。
上述研究雖然考慮了數(shù)據(jù)不平衡問(wèn)題,但并未考慮到實(shí)際工況下的數(shù)據(jù)源往往并不單一,而大量文獻(xiàn)表明,使用多傳感器數(shù)據(jù)將會(huì)加強(qiáng)診斷的可靠性和穩(wěn)定性并大大提高診斷精度:文獻(xiàn)[13]通過(guò)變分模態(tài)分解和改進(jìn)深度自編碼器實(shí)現(xiàn)了多域特征集的融合;文獻(xiàn)[14]使用快速傅里葉變換將多傳感器信號(hào)轉(zhuǎn)為頻域信號(hào),使用CNN和動(dòng)態(tài)路由算法進(jìn)行故障診斷;文獻(xiàn)[15]將每個(gè)傳感器數(shù)據(jù)視為一個(gè)通道,使用一維CNN對(duì)信號(hào)進(jìn)行特征提取。
綜上,本文基于多傳感器數(shù)據(jù),從數(shù)據(jù)增強(qiáng)和損失函數(shù)2個(gè)方面對(duì)數(shù)據(jù)不平衡問(wèn)題展開(kāi)研究。首先,使用多傳感器數(shù)據(jù)代替單傳感器數(shù)據(jù)進(jìn)行診斷,增強(qiáng)數(shù)據(jù)所包含的信息;然后,針對(duì)數(shù)據(jù)不平衡問(wèn)題設(shè)計(jì)了一種基于多傳感器的帶輔助分類器的生成對(duì)抗網(wǎng)絡(luò)(Auxiliary Classifier GAN,ACGAN),將少數(shù)類多傳感器數(shù)據(jù)樣本輸入ACGAN生成足量的多維高質(zhì)量數(shù)據(jù);最后,提出了一種改進(jìn)的均值焦點(diǎn)損失函數(shù)(m-Focal Loss),通過(guò)加入均值實(shí)時(shí)更新?lián)p失函數(shù)的調(diào)制系數(shù),從而使得分類模型在訓(xùn)練時(shí)更專注于難分類的樣本,進(jìn)一步提高模型診斷效果。
ACGAN是GAN架構(gòu)的一個(gè)變體,特點(diǎn)是使用一個(gè)分類器對(duì)生成數(shù)據(jù)進(jìn)行分類,若生成數(shù)據(jù)具有較高的分類準(zhǔn)確率,即可認(rèn)為所生成的數(shù)據(jù)具有高質(zhì)量的特點(diǎn)。
如圖1所示:ACGAN由生成器和鑒別器組成,同時(shí)在鑒別器的輸出部分加入一個(gè)輔助分類器提高性能。將類標(biāo)簽和噪聲輸入鑒別器,生成假數(shù)據(jù)后送入鑒別器區(qū)分真假與類別,然后得到損失進(jìn)行反向傳播,當(dāng)鑒別器無(wú)法區(qū)分所生成的假數(shù)據(jù)的真假并能夠準(zhǔn)確區(qū)分類別時(shí),則說(shuō)明網(wǎng)絡(luò)具有生成高質(zhì)量數(shù)據(jù)的能力。
圖1 ACGAN的結(jié)構(gòu)
傳統(tǒng)的ACGAN通常使用全連接層構(gòu)建生成器和鑒別器,而本文加入卷積層和轉(zhuǎn)置卷積層代替對(duì)應(yīng)部分,不僅可以減少模型參數(shù)量,降低計(jì)算負(fù)荷,提高數(shù)據(jù)生成速度,而且可以生成多維數(shù)據(jù),避免分別生成每個(gè)維度數(shù)據(jù)而造成的數(shù)據(jù)質(zhì)量下降問(wèn)題。如果將每種傳感器視為一個(gè)維度,則可將所生成的多維數(shù)據(jù)用于擴(kuò)充原多傳感器數(shù)據(jù)集,從而緩解原數(shù)據(jù)集的不平衡對(duì)分類模型精度的影響。同時(shí),ACGAN所特有的鑒定-分類結(jié)構(gòu)可以生成高質(zhì)量的數(shù)據(jù),保證所生成數(shù)據(jù)對(duì)于模型訓(xùn)練具有正面作用。
生成器由4層一維轉(zhuǎn)置卷積組成,一組一維的隨機(jī)噪聲輸入生成器后輸出生成多維的假數(shù)據(jù)。鑒別器和分類器共享3層的一維卷積進(jìn)行特征提取,分別對(duì)輸出進(jìn)行一維卷積、全局池化,經(jīng)過(guò)全連接層和激活函數(shù)Sigmoid得到鑒別結(jié)果并經(jīng)過(guò)全連接層和Softmax分類器得到分類結(jié)果。
以二分類為例,標(biāo)準(zhǔn)交叉熵?fù)p失(CrossEntropy Loss,CE)函數(shù)可表示為
(1)
式中:pt為預(yù)測(cè)樣本屬于1的概率;y為標(biāo)簽,取值為{0,1}。當(dāng)y=0時(shí),假如某個(gè)樣本x預(yù)測(cè)為0這個(gè)類的概率pt=a,那么損失就是-loga。多分類以此類推。
對(duì)于標(biāo)準(zhǔn)交叉熵?fù)p失,根據(jù)樣本比例加權(quán)雖然可以提高少數(shù)類樣本的損失,但其本身也屬于難分類樣本,加權(quán)乘積后的效果并不好;另外,負(fù)樣本數(shù)量太大,占總損失值的大部分,而且多是容易分類的。于是,在標(biāo)準(zhǔn)交叉熵?fù)p失前加上一個(gè)調(diào)制系數(shù)γ,通過(guò)減小易分類樣本的權(quán)重使模型在訓(xùn)練時(shí)更專注于難分類的樣本,即交點(diǎn)損失(Focal Loss,FL)函數(shù)[16],可表示為
LFL(pt)=-(1-pt)γlogpt。
(2)
交點(diǎn)損失函數(shù)將樣本類別不平衡問(wèn)題轉(zhuǎn)化為樣本的難易分類問(wèn)題,在一定程度上提高了分類精度,但其難分類區(qū)間固定,不利于網(wǎng)絡(luò)后期的訓(xùn)練。
統(tǒng)計(jì)不平衡數(shù)據(jù)早期訓(xùn)練中的結(jié)果概率并繪制成密度分布圖,結(jié)果如圖2所示。觀察不平衡數(shù)據(jù)的早期訓(xùn)練結(jié)果概率密度分布可以發(fā)現(xiàn),每次早期訓(xùn)練結(jié)果的概率可以近似看作雙峰分布。將2個(gè)峰看作較易樣本和較難樣本的集合,以概率均值作為與CE的交點(diǎn),根據(jù)每一次結(jié)果的概率分布情況放大或縮小難易樣本的調(diào)制系數(shù),就可以完成對(duì)調(diào)制系數(shù)的動(dòng)態(tài)更新:因此,提出一種改進(jìn)的均值交點(diǎn)損失(m-Focal Loss,m-FL)函數(shù),可表示為
(a) 均值為0.301是
Lm-FL(pt)=-ka-ptlogpt,
(3)
式中:a為概率均值,隨每次訓(xùn)練結(jié)果更新。相比標(biāo)準(zhǔn)交叉熵?fù)p失,均值交點(diǎn)損失值在均值a前放大且在a之后縮小。
3種損失函數(shù)在不同概率下的損失值曲線如圖3所示:對(duì)于γ=5的FL曲線,難分類樣本區(qū)間大概在0~0.3, 即當(dāng)結(jié)果概率超過(guò)0.3則反向傳播的梯度幾乎為0,在訓(xùn)練后期易出現(xiàn)梯度消失;m-FL由于存在動(dòng)態(tài)更新的調(diào)制系數(shù),隨著每次訓(xùn)練結(jié)果概率均值的不斷變大,相對(duì)難分類樣本區(qū)間也在變大,對(duì)整個(gè)訓(xùn)練過(guò)程具有良好的指導(dǎo)作用。
(a) CE與FL
本文采用的生成器和鑒別器如圖4所示:生成器由4層一維轉(zhuǎn)置卷積組成,一組一維的隨機(jī)噪聲輸入生成器后輸出生成多維的假數(shù)據(jù)。鑒別器和分類器共享3層的一維卷積進(jìn)行特征提取,分別對(duì)輸出進(jìn)行一維卷積、全局池化,經(jīng)過(guò)全連接層和激活函數(shù)Sigmoid得到鑒別結(jié)果,經(jīng)過(guò)全連接層和Softmax分類器得到分類結(jié)果。
(a) 生成器
ACGAN的生成器和鑒別器的模型參數(shù)見(jiàn)表1,其中n為傳感器個(gè)數(shù),即數(shù)據(jù)的通道數(shù)。隨機(jī)生成一組一維長(zhǎng)度100的數(shù)據(jù)送入生成器,輸出一組n維長(zhǎng)度512的數(shù)據(jù);然后將生成數(shù)據(jù)送入鑒別器,經(jīng)過(guò)特征提取得出鑒別結(jié)果和分類結(jié)果。
表1 生成器和鑒別器的結(jié)構(gòu)及參數(shù)
本文所設(shè)計(jì)的故障診斷流程如圖5所示:首先,將數(shù)據(jù)按比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集并進(jìn)行標(biāo)準(zhǔn)化;然后,訓(xùn)練ACGAN并分別生成每一類小樣本,將生成數(shù)據(jù)與原始數(shù)據(jù)混合后送入1DCNN進(jìn)行特征提取;最后,通過(guò)Softmax分類并使用m-FL對(duì)反向傳播進(jìn)行引導(dǎo),在達(dá)到所設(shè)定的最大循環(huán)次數(shù)后結(jié)束訓(xùn)練。
圖5 故障診斷流程
試驗(yàn)采用美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)軸承數(shù)據(jù)集進(jìn)行測(cè)試并以實(shí)驗(yàn)室數(shù)據(jù)集進(jìn)行驗(yàn)證,利用Intel(R)Core(TM)i5-10400 CPU @ 2.90GHz 2.90 GHz + NVIDIA GeForce GTX 2060設(shè)備進(jìn)行數(shù)據(jù)分析,并使用均值平均精準(zhǔn)率(Mean Average Precision,MAP)衡量模型的測(cè)試結(jié)果。
平均精度(Average Precision,AP)是每類的精準(zhǔn)率(precision)和召回率(recall)構(gòu)成曲線的面積,其表達(dá)式為
(4)
(5)
(6)
式中:n為召回率的個(gè)數(shù);ri為按升序排列的第i個(gè)召回率值;p(ri+1)為ri+1對(duì)應(yīng)的最大精準(zhǔn)率;TP為真正例;FN為假負(fù)例;FP為假正例。
均值平均精準(zhǔn)率則定義為每類平均精度的均值,可表示為
(7)
式中:K為總類別數(shù)。
選用CWRU軸承數(shù)據(jù)集中12 kHz,0 kW負(fù)載,1 797 r/min轉(zhuǎn)速下在驅(qū)動(dòng)端和風(fēng)扇端采集的振動(dòng)加速度信號(hào)。6205軸承的運(yùn)行狀態(tài)分為正常、內(nèi)圈故障、外圈故障以及鋼球故障,故障直徑均包括0.178,0.356,0.533 mm這3種尺寸,總計(jì)10種狀態(tài)。根據(jù)實(shí)際工況,設(shè)置正常狀態(tài)下訓(xùn)練集、驗(yàn)證集和測(cè)試集的樣本數(shù)為100/50/50。各故障狀態(tài)的訓(xùn)練集、驗(yàn)證集和測(cè)試集樣本數(shù)按1∶1,2∶1,5∶1,10∶1的不平衡數(shù)據(jù)比例分別等比縮為100/50/50,50/25/25,20/10/10,10/5/5,數(shù)據(jù)長(zhǎng)度均為512。
實(shí)驗(yàn)室使用的電動(dòng)機(jī)額定轉(zhuǎn)速為1 420 r/min,軸承型號(hào)為6206-2RS,采樣頻率為10 kHz。軸承運(yùn)行狀態(tài)分為正常、內(nèi)圈故障、外圈故障以及鋼球故障。內(nèi)、外圈故障為由砂輪機(jī)加工形成的條狀磨損,故障深度為0.6 mm,鋼球故障由機(jī)器擠壓而成。由于0負(fù)載、25%負(fù)載以及50%負(fù)載對(duì)應(yīng)的電動(dòng)機(jī)實(shí)際轉(zhuǎn)速不同,同類故障狀態(tài)下振動(dòng)信號(hào)的特征也不相同[17-19],因此細(xì)分為12種狀態(tài)。試驗(yàn)數(shù)據(jù)由安裝在電動(dòng)機(jī)徑向、橫向和軸向的振動(dòng)傳感器和定子的三相電壓傳感器采集,共6通道。振動(dòng)信號(hào)用于檢測(cè)結(jié)構(gòu)缺陷,電壓信號(hào)用于測(cè)量故障期間電動(dòng)機(jī)電源的波動(dòng),結(jié)合2種信號(hào)可以更全面地描述電動(dòng)機(jī)狀態(tài)。設(shè)置正常狀態(tài)下訓(xùn)練集、驗(yàn)證集和測(cè)試集的樣本數(shù)為100/50/50,各故障狀態(tài)同樣按1∶1,2∶1,5∶1,10∶1的不平衡數(shù)據(jù)比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集,數(shù)據(jù)長(zhǎng)度均為512。
使用多傳感器數(shù)據(jù)驗(yàn)證本文所提方法,并與單傳感器數(shù)據(jù)試驗(yàn)進(jìn)行對(duì)比以驗(yàn)證多傳感器數(shù)據(jù)對(duì)不平衡數(shù)據(jù)下模型精度的提升作用。試驗(yàn)結(jié)果見(jiàn)表2:在CWRU數(shù)據(jù)集上,使用多傳感器數(shù)據(jù),在不平衡程度從1∶1到10∶1的情況下,PmAP從0.979下降到了0.921,只降低了0.058,而使用單傳感器數(shù)據(jù)時(shí)則從0.955降到0.871,降低了0.084;在實(shí)驗(yàn)室數(shù)據(jù)集上,使用多傳感器和單傳感器時(shí)PmAP分別下降了0.081和0.130;同時(shí),在同一不平衡比例下,使用多傳感器數(shù)據(jù)時(shí)的PmAP始終更高;試驗(yàn)結(jié)果充分說(shuō)明使用多傳感器數(shù)據(jù)可以有效抑制不平衡數(shù)據(jù)帶來(lái)的精度下降,增強(qiáng)診斷結(jié)果的可靠性和穩(wěn)定性。
表2 多傳感器數(shù)據(jù)對(duì)不平衡數(shù)據(jù)故障診斷PmAP的影響
使用ACGAN生成高質(zhì)量多傳感器數(shù)據(jù),在不平衡程度分別為10∶1,5∶1和2∶1的情況下將數(shù)據(jù)補(bǔ)全為1∶1。多傳感器下數(shù)據(jù)增強(qiáng)試驗(yàn)的PmAP折線圖如圖6所示:盡管無(wú)法將診斷結(jié)果還原成不平衡比例1∶1下使用原始數(shù)據(jù)時(shí)的精度,但數(shù)據(jù)增強(qiáng)后的PmAP有了巨大地提高,這說(shuō)明本文所構(gòu)造的ACGAN具有產(chǎn)生高質(zhì)量多維數(shù)據(jù)的能力,使用ACGAN擴(kuò)充數(shù)據(jù)集可在一定程度上遏制數(shù)據(jù)不平衡造成的精度下降問(wèn)題。
圖6 多傳感器下數(shù)據(jù)增強(qiáng)試驗(yàn)的PmAP
使用欠采樣、隨機(jī)偏度過(guò)采樣技術(shù)(Random Skewness Oversampling Technique,RSOT)、人工少數(shù)類過(guò)采樣法(Synthetic Minority Over-Sampling Technique,SMOTE)和GAN進(jìn)行數(shù)據(jù)處理,對(duì)比驗(yàn)證本文模型在不平衡多傳感器數(shù)據(jù)處理上的優(yōu)勢(shì)。各數(shù)據(jù)處理技術(shù)的結(jié)果如圖7所示:欠采樣方法效果最差,ROST和SMOTE這2種過(guò)采樣技術(shù)與GAN的效果接近,但均不如本文所設(shè)計(jì)的ACGAN。欠采樣減少了大樣本數(shù)據(jù)從而使數(shù)據(jù)達(dá)到平衡,但同時(shí)也拋棄了大樣本數(shù)據(jù)所具有的特征信息,導(dǎo)致樣本難以區(qū)分,在小數(shù)據(jù)集中尤其明顯;而ACGAN在數(shù)據(jù)生成時(shí)經(jīng)過(guò)輔助分類器鑒定,其所攜帶的特征信息更明顯,補(bǔ)充了數(shù)據(jù)集的同時(shí)也使其更容易被分類。
圖7 各數(shù)據(jù)處理技術(shù)的PmAP
分別使用CE,FL以及m-FL對(duì)不平衡狀態(tài)下的軸承數(shù)據(jù)進(jìn)行診斷,為使差異更明顯,不使用ACGAN進(jìn)行數(shù)據(jù)擴(kuò)充,試驗(yàn)結(jié)果見(jiàn)表3:在不平衡比例為1∶1時(shí),3種損失函數(shù)的效果接近,而在其他不平衡比例時(shí)m-FL均取得了更高的精度;在10∶1的不平衡比例下,CWRU數(shù)據(jù)集中m-FL的PmAP分別比CE和FL高0.015和0.029,實(shí)驗(yàn)室數(shù)據(jù)集中m-FL的PmAP則高出了0.037和0.059,說(shuō)明m-FL動(dòng)態(tài)調(diào)整調(diào)制系數(shù)從而放大難分類樣本的概率,縮小易分類樣本的概率,相比于CE和FL更有利于指導(dǎo)網(wǎng)絡(luò)向少數(shù)類樣本進(jìn)行學(xué)習(xí)。
表3 不同損失函數(shù)在不平衡比例下的PmAP
對(duì)于GAN網(wǎng)絡(luò),由于生成器輸入、輸出的尺寸固定,每層的卷積核參數(shù)需計(jì)算得到。因此,在3層結(jié)構(gòu)鑒別器網(wǎng)絡(luò)的基礎(chǔ)上改變鑒別器的層數(shù)結(jié)構(gòu),通過(guò)觀察鑒別器和生成器訓(xùn)練中的損失函數(shù)查看網(wǎng)絡(luò)調(diào)參結(jié)果,如圖8所示:2層的卷積結(jié)構(gòu)使鑒別器偏弱,無(wú)法很好地指導(dǎo)生成器,鑒別器和生成器的損失值增加,且振幅比較大;而4層的卷積結(jié)構(gòu)使得鑒別器過(guò)強(qiáng),梯度消失,損失函數(shù)劇烈震蕩;本文所提3層卷積結(jié)構(gòu)的鑒別器和生成器的損失函數(shù)最終分別在0.75和0上下小幅振蕩,具有較優(yōu)的數(shù)據(jù)生成能力。
(a) 3層卷積結(jié)構(gòu)
針對(duì)不平衡數(shù)據(jù)影響故障診斷模型精度的問(wèn)題,設(shè)計(jì)了一種基于多傳感器的輔助分類對(duì)抗神經(jīng)網(wǎng)絡(luò)模型,并提出改進(jìn)m-FL以加強(qiáng)損失函數(shù)對(duì)網(wǎng)絡(luò)訓(xùn)練的指導(dǎo)能力,通過(guò)CWRU和實(shí)驗(yàn)室數(shù)據(jù)集對(duì)所提方法進(jìn)行了驗(yàn)證,得到以下結(jié)論:
1)使用多傳感器數(shù)據(jù)可以有效抑制不平衡數(shù)據(jù)帶來(lái)的精度下降問(wèn)題。
2)加入ACGAN所生成的樣本可大大提高不平衡數(shù)據(jù)下軸承故障診斷模型的精度。
3)所提出的m-FL,可以帶來(lái)比CE,FL等損失函數(shù)更高的PmAP。