陳功勝,唐向紅,1b,2,陸見光,1b,2,楊瑞恒
(1.貴州大學 a.現(xiàn)代制造技術(shù)教育部重點實驗室; b.機械工程學院, 貴陽 550025; 2.貴州省公共大數(shù)據(jù)重點實驗室, 貴陽 550025)
滾動軸承在機械設(shè)備中占據(jù)著舉足輕重的地位,通常也是機械設(shè)備中最容易出現(xiàn)故障的部分[1],據(jù)機械故障統(tǒng)計,旋轉(zhuǎn)機械中的滾動軸承故障比例占據(jù)了機械故障的40%[2-3]。因此,開展軸承故障診斷研究具有重要意義。
傳統(tǒng)故障診斷方法是提取傳感器采集原始振動信號中的有用特征,常用的方法有:短時傅里葉變換(STFT)[4],包絡(luò)分析(EA)[5],小波變換(WT)[6]等。傳統(tǒng)的方法是基于理論出發(fā)對問題進行分析,雖然在原理上具備可解釋性,但診斷精度低。隨著“互聯(lián)網(wǎng)+智能制造”的快速發(fā)展,以數(shù)據(jù)驅(qū)動的機器學習方法逐漸應(yīng)用到故障診斷中。如SVM[7],樸素貝葉斯[8],K最近鄰[9]等,與傳統(tǒng)信號處理方法不同,這些算法在診斷精度及直觀性方面都有較大的提升,但也需要更高的計算能力。這類方法在很大程度上取決于人工特征提取的質(zhì)量,這就依賴于專家經(jīng)驗和先驗知識[10]。
因此,為了克服這一問題,實現(xiàn)特征自提取。近些年,一些學者將深度學習技術(shù)應(yīng)用到故障診斷領(lǐng)域的研究,如深度置信網(wǎng)絡(luò)(DBN)、深度自動編碼器(DAE)[16]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)等。其中CNN在軸承故障診斷中的應(yīng)用最為廣泛。文獻[11-13]中提出將一維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于滾動軸承自適應(yīng)故障診斷方法。這些研究雖然省去人工提取特征的工作,但基于一維時序信號的處理方法仍存在著丟失特征的缺陷,而將原始時序信號轉(zhuǎn)變?yōu)榛叶葓D像信號后進行特征提取會很大程度上改進這個問題[14]。文獻[15]中以滾動軸承時頻圖像作為研究對象輸送至ResNet進行分類,實驗證明了該方法的有效性。文獻[16]中提出一種將振動信號進行灰度轉(zhuǎn)換,然后輸入卷積神經(jīng)網(wǎng)絡(luò)進行分類,從而實現(xiàn)了對航空故障中介軸承的快速分類的方法。WAN等[17]提出了將深度自動編碼器與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,先利用小波變換構(gòu)造不同狀態(tài)下的時頻圖,再采用卷積神經(jīng)網(wǎng)絡(luò)對DCAE降噪后的時頻圖進行故障分類,實驗結(jié)果驗證了該方法可在高噪聲情況下具備更高的識別率。上述研究表明,首先將時域信號轉(zhuǎn)為圖像形式,然后輸入卷積神經(jīng)網(wǎng)絡(luò)進行特征提取與分類,同樣能取得出色的分類效果。結(jié)合CNN的結(jié)構(gòu)特點,其自帶的softmax分類器存在著易陷入局部最優(yōu)的缺陷[18]。由于極限樹回歸計算分裂的方式具有隨機性,選取完全隨機所得到最優(yōu)分叉值,這就有效避免了softmax分類的不足。針對該問題,本文提出一種二維卷積神經(jīng)網(wǎng)絡(luò)與極限樹回歸相結(jié)合的自適應(yīng)軸承故障診斷方法。在此基礎(chǔ)上增加隨機搜索算法,相較于網(wǎng)格搜索,可快速地檢索到該模型較優(yōu)參數(shù)組合。最后將CNN-ETR算法與傳統(tǒng)的DT、CNN、CNN-DT算法進行比較,驗證了CNN-ETR模型對軸承故障具有很好的分類能力。
CNN具有自動提取復雜的非平穩(wěn)振動信號特征的強大能力。通常CNN包括若干卷積層、池化層、一個全連接層和一個輸出分類器。圖1為卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)架構(gòu)。
圖1 卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)示意圖
根據(jù)上述結(jié)構(gòu),CNN的處理流程如下,無論輸入是圖像還是數(shù)據(jù)集都將轉(zhuǎn)換為數(shù)組,并將其傳遞到輸入層。然后由卷積層創(chuàng)建的卷積核在前一層的矩陣上進行卷積操作,獲得低級特征子圖。為了增強神經(jīng)網(wǎng)絡(luò)模型的表達能力,引入ReLU讓卷積神經(jīng)網(wǎng)絡(luò)具有非線性輸出的能力。
(1)
(2)
在經(jīng)過重復的卷積和池化操作后,高級特征矩陣會進一步映射為一維向量。最后,通過softmax分類器對運行狀態(tài)進行分類。若為N種輸入信號,類別標簽設(shè)為i所對應(yīng)輸出yi概率為:
(3)
其中:wi表示由第i個輸出神經(jīng)元連接的權(quán)重矩陣;bi是偏置;而x表示softmax層的輸入。
極限樹回歸作為集成分類模型的一種,當特征屬性以類別為標準時,隨機選擇具有類別的樣本作為左分支,其他類別樣本作為右分支,可以應(yīng)用基尼系數(shù)進行分類
(4)
其中:m為數(shù)據(jù)集中樣本類型的數(shù)量;Pi是第i類樣本的占比。當特征屬性以特征值為標準時,利用與特征值比較大小將樣本分類,可以應(yīng)用均方誤差進行分類
(5)
為了提高該算法的準確性,除了將本文模型設(shè)計不要過于復雜的同時,仍需對極限樹回歸中的超參數(shù)(評估器、最大深度及學習率等值)的選優(yōu)。由于集成模型的超參數(shù)個數(shù)較多,如果使用網(wǎng)格搜索,那么搜索所需時間會將呈指數(shù)級增長,而隨機搜索會在超參數(shù)空間內(nèi)隨機搜尋數(shù)十或上百個點,可快速的檢索到較優(yōu)的參數(shù)組合,這種做法比網(wǎng)格搜索要快很多,因此本文選用隨機搜索算法。
CNN-ETR模型主要包括兩部分:訓練CNN模型用來提取故障軸承特征;然后將CNN全連接層的128維特征向量輸入極限樹回歸中進行訓練及測試,從而診斷出軸承故障。此外,為了進一步提高該模型的診斷精度,采用隨機搜索匹配適用模型的較優(yōu)參數(shù)組合。CNN-ERT診斷流程如圖2所示。
圖2 CNN-ETR診斷流程框圖
本研究采用了CUT-2實驗平臺(見圖3)進行數(shù)據(jù)采集,測試軸承放置在試驗臺的右端。實驗軸承型號為6900ZZ,使用電火花加工技術(shù)在軸承內(nèi)圈、外圈及滾動體上分別布置直徑為0.2 mm與0.3 mm的故障(見圖4)。軸承故障如圖所示,在電機轉(zhuǎn)速為1 500 r/min,采樣頻率為2K時,選取10種故障類型,每類故障類型包含330個樣本,每個樣本包含512個數(shù)據(jù)點(見表1)。樣本按照隨機75%的訓練集和25%的測試集進行劃分并用于訓練及測試。本次實驗在電腦Win10×64位操作系統(tǒng),處理器為:Inter(R)Core(TM):i5-6500CPU@3.20GHz,RAM:8GB的配置環(huán)境下進行的。
圖3 CUT-2軸承實驗平臺
表1 CUT-2實驗數(shù)據(jù)
3.2.1激活函數(shù)的選擇
本次實驗選擇最常用的Sigmoid、Tanh、ReLU及PReLU四類激活函數(shù)進行了比較,為了避免實驗結(jié)果出現(xiàn)偶然性,采用了10次交叉驗證方法,從表2中可以看出,在同等條件下,選用ReLU激活函數(shù)能達到最佳實驗精度。
表2 不同激活函數(shù)性能表
3.2.2優(yōu)化器的選擇
本次實驗選用較為常用的Adam、SGD、RMSprop三類優(yōu)化器,且分別在學習率為0.000 1、0.001、0.005、0.01、0.05五種情況下測試出每種分類器的性能。
如圖5所示,Adam優(yōu)化器在學習率為0.005時取得了最佳分類效果,此外,該優(yōu)化器在設(shè)定區(qū)間內(nèi)(0.000 1~0.05)穩(wěn)定性最好,因此本次實驗選取學習率為0.005的 Adam 優(yōu)化器。
圖5 不同優(yōu)化器及學習率直方圖
3.2.3批處理樣本數(shù)目
批處理樣本數(shù)目指模型每輪更新參數(shù)所需訓練的樣本數(shù)量。若批樣本處理數(shù)目選擇較少,即會增加模型陷入局部最優(yōu)的風險和模型訓練時間;若批樣本處理數(shù)目選擇較少,則無法保證模型參數(shù)的最佳優(yōu)化方向[11]。本研究在選取ReLU激活函數(shù),選取Adam優(yōu)化器及學習率為0.005的條件下測試不同大小的批量訓練數(shù)據(jù)對模型的性能影響。數(shù)據(jù)大小分別取8、16、32、64、128,實驗結(jié)果如表3所示,當批量訓練數(shù)據(jù)大小為64時,該模型在測試集上取得最佳的分類表現(xiàn)。因此選取批量訓練數(shù)據(jù)大小為64。
表3 塊大小取得的準確率
根據(jù)上述的參數(shù)選擇,CNN-ETR模型最終確定的模型參數(shù)如表4所示。
表4 CNN-ETR模型參數(shù)
為了展示該模型對不同類型故障的提取能力,使用t_SNE技術(shù)分別提取不同層的特征映射成二維并進行可視化。具體效果如圖6所示。圖6(a)為輸入原始信號樣本的分類結(jié)果,可以看出信號之間具有亢余性,導致各類別難以區(qū)分。在經(jīng)過多次的卷積池化操作后,圖6(b)展示全連接層的特征提取結(jié)果,除第六類樣本中少量樣本被誤分在第五類,及第一類樣本中少量樣本被誤分入第四類中,其余類別的樣本均能很好的聚攏在相應(yīng)區(qū)域內(nèi)。
圖6 不同層級的特征可視化效果圖
在上述的基礎(chǔ)上,更為直觀地考察CNN-ETR模型在識別故障軸承的能力及具體細節(jié),本文引入混淆矩陣對診斷結(jié)果進行量化分析,在圖7中,可以清楚的觀察到該模型對每類軸承診斷情況。從總體上來看,該模型準確率平均維持在99%以上,近一半類別故障軸承診斷精度甚至達到了100%,證明了該模型在故障軸承的類別診斷方面具有出色的表現(xiàn)。
圖7 多分類混淆矩陣元素圖
考慮到在實際工程應(yīng)用中,滾動軸承發(fā)生故障的方式多樣化,因此本文對CNN-ETR模型的泛化能力進行了實驗,以驗證不同故障占比率對該模型精度的影響。在總樣本容量保持不變的基礎(chǔ)上,分別對故障占比率處于70%~94%的數(shù)據(jù)進行測試。實驗結(jié)果如圖8所示,可以看出僅故障占比率在76%及82%時,對應(yīng)的故障識別率略低于99%,分別為98.94%、98.95%,其余測試結(jié)果均穩(wěn)定在99%及以上。證明了該模型具有較好的魯棒性,對軸承運轉(zhuǎn)狀態(tài)監(jiān)測有著重要意義。
圖8 故障占比率對算法精度的影響曲線
由于極限樹回歸由多個決策樹組成,為了驗證CNN-ETR算法的有效性,本文選取DT、CNN、CNN-DT算法分別進行了對比實驗。并將所有實驗的準確率、精確率、召回率及F1指標進行了繪制。在決策樹模型中,在對數(shù)據(jù)進行標準化后,選取C4.5生成樹算法使用熵,其他參數(shù)默認初始化配置。為了增加實驗可信度,每種模型取20次重復性試驗的平均值。所得結(jié)果如圖9所示。
圖9 對比算法有效性的直方圖
從上述可以看出,使用DT模型分類時,準確率、精確率、召回率及F1指標均為最低,這是因為DT模型對有時間序列的數(shù)據(jù)并不敏感,此外當其在某一節(jié)點發(fā)生分類錯誤時,那錯誤會沿著該節(jié)點一直延伸下去。在使用ETR進行分類時,可以看出該模型在組合了大量決策樹的基礎(chǔ)上,其分類能力有了明顯的提升,但依舊在很大程度上取決于人工提取特征的質(zhì)量。值得關(guān)注的是,借助卷積神經(jīng)網(wǎng)絡(luò)強大的特征自提取能力,CNN的故障診斷準確率為90.2%,而CNN-DT的故障診斷準確率達到了95.7%,相比于卷積神經(jīng)網(wǎng)絡(luò)的訓練結(jié)果有了較大的改進。CNN-ETR采用了隨機搜索算法,可快速搜索極限樹回歸模型中較優(yōu)的參數(shù)組合,并利用該模型實現(xiàn)快速分類,該算法的故障軸承診斷準確率達到了99.6%,比CNN-DT算法還要高出3.9%,由此從四項分類指標中驗證了CNN-ETR模型的有效性。
CNN-ETR是一種結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)與極限回歸樹的自適應(yīng)診斷算法,相較于傳統(tǒng)算法具有更高的精確度,并具備以下特點:
1) 在數(shù)據(jù)預(yù)處理階段,將時域信號轉(zhuǎn)為灰度圖像后輸入卷積神經(jīng)網(wǎng)絡(luò)進行特征提取,可有效地保留信號特征。
2) 利用極限樹回歸對卷積神經(jīng)網(wǎng)絡(luò)提取的特征進行快速分類,可提高故障分類的精度,增加模型的泛化能力。
3) 采用隨機搜索算法可快速搜索極限樹回歸模型中較優(yōu)的參數(shù)組合。分類準確率都能穩(wěn)定在99%以上,該模型在故障診斷領(lǐng)域中有著良好的識別能力。