吳希明,吳英友,王 鑫,李成鋒,張方海
(1.中海油能源發(fā)展股份有限公司湛江采油服務(wù)文昌分公司,廣東 湛江 524057;2.廣東海洋大學(xué)海洋工程學(xué)院,廣東 湛江 524088)
隨著科技的進(jìn)步與發(fā)展,現(xiàn)代機(jī)械設(shè)備作為現(xiàn)代工業(yè)中最重要的一環(huán),也得到快速發(fā)展,各種機(jī)械設(shè)備功能越來越多,結(jié)構(gòu)越來越復(fù)雜。旋轉(zhuǎn)機(jī)械作為現(xiàn)代機(jī)械設(shè)備最具代表性的機(jī)械之一,其重要性不言而喻。而軸承是旋轉(zhuǎn)機(jī)械中關(guān)鍵的組件之一,同樣也是其中最脆弱的組件,軸承狀態(tài)可以影響整個(gè)機(jī)械系統(tǒng)的運(yùn)行,因此為避免更大的經(jīng)濟(jì)損失,通常會(huì)對軸承進(jìn)行早期故障診斷,及時(shí)發(fā)現(xiàn)軸承存在的各種隱患,避免因軸承的故障導(dǎo)致的巨大經(jīng)濟(jì)損失和人員傷亡。
軸承運(yùn)行時(shí),由于各零件之間的相互連接而產(chǎn)生相互作用,不同的故障位置,最終采集到的振動(dòng)信號(hào)也是不同的,通過傳感器對機(jī)械運(yùn)行時(shí)的振動(dòng)數(shù)據(jù)進(jìn)行采集,可以得到反映機(jī)器狀態(tài)的振動(dòng)數(shù)據(jù)。由于現(xiàn)代機(jī)械的復(fù)雜多樣化,振動(dòng)信號(hào)也是非常多樣可變的,同時(shí)還有各種復(fù)雜的噪聲干擾,幾乎很難直接識(shí)別信號(hào),因此想要通過數(shù)據(jù)驅(qū)動(dòng)方法來實(shí)現(xiàn)故障診斷,最重要的就是對數(shù)據(jù)內(nèi)在特征進(jìn)行提取與識(shí)別。而機(jī)器學(xué)習(xí)憑借其強(qiáng)大的數(shù)據(jù)分類能力,吸引了眾多故障診斷研究人員的目光,將機(jī)器學(xué)習(xí)算法應(yīng)用在故障診斷領(lǐng)域內(nèi)已成為當(dāng)前熱門的研究內(nèi)容。
基于機(jī)器學(xué)習(xí)的故障診斷方法是需要向機(jī)器學(xué)習(xí)算法模型輸入特征向量。進(jìn)行故障診斷時(shí),首先對傳感器采集到的振動(dòng)信號(hào)進(jìn)行特征提取,然后基于數(shù)據(jù)集進(jìn)行機(jī)器學(xué)習(xí)算法模型的構(gòu)建,將提取到的特征輸入機(jī)器學(xué)習(xí)算法模型,最后由機(jī)器學(xué)習(xí)對故障類型進(jìn)行劃分。故障診斷領(lǐng)域隨著各種機(jī)器學(xué)習(xí)算法的加入,精度與效率相較以前有較大的提高,也使設(shè)備的安全得到了很好的保障。
本研究從理論和實(shí)踐兩方面探討各種機(jī)器學(xué)習(xí)算法,同時(shí)也給從事該領(lǐng)域研究者在算法選擇上提供一點(diǎn)參考意見。
機(jī)器學(xué)習(xí)算法以其可靠性、適應(yīng)性和魯棒性在故障檢測系統(tǒng)中得到了廣泛的應(yīng)用,這些算法的應(yīng)用有助于開發(fā)一個(gè)高效的系統(tǒng)。本研究將詳細(xì)介紹一些在軸承故障診斷中常用的機(jī)器學(xué)習(xí)算法,包含支持向量機(jī)、決策樹、k近鄰、樸素貝葉斯、人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)以及遷移學(xué)習(xí)等軸承故障診斷的常用算法。
支持向量機(jī)(SVM)是一種監(jiān)督式的學(xué)習(xí)方法,可以對數(shù)據(jù)進(jìn)行二元分類。Vladimir Vapnik[1]在1994年首次引入了支持向量機(jī)概念。支持向量機(jī)在無限維空間中構(gòu)造一個(gè)或一組超平面,通過選擇其中邊際最大的超平面作為最優(yōu)決策邊界。在處理二值分類問題時(shí)通過最優(yōu)超平面來進(jìn)行類的劃分。對于一組給定的訓(xùn)練樣本數(shù)據(jù),進(jìn)行兩類標(biāo)記,通過支持向量機(jī)建立訓(xùn)練模型,將未知的數(shù)據(jù)進(jìn)行二類分配,這樣就得到了一個(gè)非概率的二元線性分類模型,如圖1所示。支持向量機(jī)除了支持線性分類外,同樣也可以用于非線性分類,支持向量機(jī)將給定的輸入映射到高維特征空間,然后利用核函數(shù)技巧將非線性分類問題轉(zhuǎn)換為線性分類再進(jìn)行分類。在處理分類問題時(shí),分類向量的維數(shù)不會(huì)影響模型的分類性能,這一點(diǎn)使得該方法在軸承故障診斷領(lǐng)域中有著更好的泛化性能。
圖1 支持向量機(jī)模型
支持向量機(jī)是軸承故障診斷的有力工具之一。并且在軸承故障診斷領(lǐng)域得到了廣泛應(yīng)用。孟宗等[2]利用經(jīng)驗(yàn)?zāi)J剑―EMD)來對信號(hào)進(jìn)行分解,由所得分量計(jì)算模糊熵,然后作為輸入,通過SVM對故障進(jìn)行分類診斷。齊詠生等[3]為解決基于數(shù)據(jù)的傳統(tǒng)診斷算法無法充分挖掘非平穩(wěn)信號(hào)內(nèi)部信息的問題,提出用熵價(jià)值法篩選信息最多的模態(tài)組成特征向量,作為支持向量機(jī)的輸入。Guo[4]將包絡(luò)譜中提取的振動(dòng)故障特征作為一種新的“一對一”支持向量機(jī)算法的輸入,解決了支持向量機(jī)的二分類局限性。Francos等[5]將監(jiān)測軸承振動(dòng)信號(hào)的包絡(luò)分析提取的特征作為一類支持向量機(jī)模型的輸入,以區(qū)分健康數(shù)據(jù)和故障數(shù)據(jù)。進(jìn)一步對故障數(shù)據(jù)進(jìn)行分析,確定具體的特征故障頻率,從而診斷故障類型。
為了開發(fā)高效的故障檢測系統(tǒng),近年來研究了多種支持向量機(jī)結(jié)構(gòu)。Deng等[6]通過粒子群優(yōu)化算法對最小二乘支持向量機(jī)進(jìn)行最優(yōu)參數(shù)選擇,將其應(yīng)用于電機(jī)軸承的故障診斷。Wang等[7]針對可擴(kuò)展性好、計(jì)算速度快等研究,提出了一種超球結(jié)構(gòu)的多類支持向量機(jī)。主要思想是,為每個(gè)類構(gòu)建一個(gè)超球,超球模型針對與軸承故障相關(guān)的每個(gè)故障類進(jìn)行調(diào)整。Salahshoor等[8]將一個(gè)通用框架與自適應(yīng)神經(jīng)模糊推理系統(tǒng)分類器集成到SVM分類器中,以增強(qiáng)故障檢測和診斷的目的。李怡等[9]為解決傳統(tǒng)svm模型在故障診斷中存在的參數(shù)過多,調(diào)優(yōu)速度慢等特點(diǎn),提出了一種基于多尺度熵與麻雀搜索算法-支持向量機(jī)(SSA-SVM)相結(jié)合的故障診斷方法。楊婧等[10]提出一種基于相關(guān)度分析與網(wǎng)格搜索算法(GS)優(yōu)化支持向量機(jī)(SVM)的軸承故障診斷方法。采用GS算法對SVM的懲罰參數(shù)c和核函數(shù)參數(shù)g進(jìn)行尋優(yōu),以此提高故障診斷的準(zhǔn)確率。
決策樹(DT)是一種非常經(jīng)典的監(jiān)督式機(jī)器學(xué)習(xí)算法,擁有逆樹狀結(jié)構(gòu),是常用的一種分類方法。決策樹模仿的是樹形結(jié)構(gòu),通常以一個(gè)根節(jié)點(diǎn)作為起始點(diǎn),該節(jié)點(diǎn)分支到不同可能的內(nèi)部節(jié)點(diǎn),每一個(gè)內(nèi)部節(jié)點(diǎn)都可以表示為一個(gè)輸入特征,對比不同內(nèi)部節(jié)點(diǎn)的期望值,按選定決策標(biāo)準(zhǔn)篩選出最佳方案。每個(gè)葉子節(jié)點(diǎn)都有對應(yīng)的一類標(biāo)簽,決策樹通過把數(shù)據(jù)樣本分配到某個(gè)葉子節(jié)點(diǎn)來確定樣本數(shù)據(jù)所屬類別。圖2介紹了樹形圖的組成部分。
圖2 決策樹樹形圖
決策樹中ID3、C4.5、CART等常見算法由于其解決分類問題的優(yōu)秀能力,常被應(yīng)用于故障診斷場景,其中C4.5更是取得了非常良好的效果。在軸承故障診斷領(lǐng)域類,一般是利用決策樹的分類特性來作為分類器進(jìn)行故障分類。Sugumaran等[11]利用決策樹從特征集自動(dòng)生成規(guī)則,形成模糊分類器,利用該分類器對測試數(shù)據(jù)進(jìn)行故障分類。趙慶恩等[12]通過小波包對故障特征進(jìn)行提取,然后輸入C4.5決策樹分類器進(jìn)行故障診斷。Amarnath等[13]利用決策樹從聲音信號(hào)中提取的多個(gè)特征中選擇重要的故障特征,再輸入C4.5決策樹進(jìn)行軸承故障的分類。Muralidharan等[14]基于連續(xù)小波變換提取特征,采用基于決策樹算法進(jìn)行分類,提供合理的分類精度。Sun等[15]利用主成分分析對特征進(jìn)行降維,然后將最優(yōu)特征作為輸入用決策樹進(jìn)行故障分類,分類效果良好。在大多數(shù)情況下,決策樹與其他分類器一起用于高效的故障檢測系統(tǒng)。
K-最近鄰算法(KNN)是由Cover[16]在1968年提出的一種監(jiān)督學(xué)習(xí)算法,常用于分類問題的處理上。KNN是一種區(qū)分性、非參數(shù)性及基于實(shí)例的分類器模型,無法對數(shù)據(jù)集中的每個(gè)類的分布做出任何明確的假設(shè),適用于非線性及非高斯的數(shù)據(jù)集,這一特性使其非常適合處理軸承故障數(shù)據(jù)。KNN在訓(xùn)練期間不會(huì)直接的學(xué)習(xí)模型,只會(huì)將訓(xùn)練實(shí)例作為預(yù)測目的的知識(shí)。KNN分類的核心思維即,對于一任意輸入的樣本向量將其映射到特征空間對應(yīng)的點(diǎn),此特征空間中對應(yīng)輸入樣本向量的點(diǎn)的k個(gè)最近鄰中,大多數(shù)樣本所屬的類別,即將輸入樣本也劃分到同樣類別中。
如圖3所示,方框和三角分別代表不同的類別,要判斷一個(gè)未知類別的樣本圓屬于哪一類型,過程如下:
(1)計(jì)算圓到特征空間每一個(gè)方框和三角的距離.
(2)選擇合適的k值。
(3)找出特征距離圓最近的k個(gè)點(diǎn)。
(4)統(tǒng)計(jì)方框和三角在k個(gè)點(diǎn)里的概率。
(5)將圓分配到概率高的樣本中。
圖3 K近鄰判別模型
KNN模型中,對每一個(gè)輸入的樣本,當(dāng)所有參數(shù)確定后,所屬類唯一確定。通過測量距離、k值以及決策規(guī)則,可將映射特征空間分割成一個(gè)個(gè)子空間,對于每一個(gè)子空間內(nèi)的點(diǎn)都有對應(yīng)的所屬的類。
He等[17]從固有模式函數(shù)中提取時(shí)域和頻域特征,用于軸承故障診斷的KNN分類器的輸入。Jiang等[18]使用從半監(jiān)督核邊緣fisher分析中提取的特征,輸入KNN分類器,可以區(qū)分不同的故障類別和嚴(yán)重程度。陳法法等[19]基于時(shí)域、頻域、時(shí)頻域信號(hào)處理方法計(jì)算滾動(dòng)軸承早期故障的特征指標(biāo)量,構(gòu)造混合域特征集,輸入KNN實(shí)現(xiàn)故障的早期診斷。姚武軍等[20]使用集合模態(tài)分解(EEMD)分解滾動(dòng)軸承振動(dòng)信號(hào),計(jì)算并挑選較大能量熵構(gòu)建特征向量,輸入KNN模型識(shí)別故障類型。
數(shù)據(jù)的非線性和高維性增加了要估計(jì)的分類器參數(shù)的數(shù)量,將會(huì)引發(fā)維度詛咒這一問題,這可能導(dǎo)致分類器提供有偏差的估計(jì),從而對軸承故障診斷提出重大挑戰(zhàn)。為了克服這一限制,通常在使用KNN作為分類器時(shí),需要將所選特征向量進(jìn)行降維,避免維度災(zāi)難的發(fā)生。將降維后的特征作為輸入,通常能得到較好的分類結(jié)果。Zhou等[21]使用最近成分分析來減少從振動(dòng)數(shù)據(jù)中提取的訓(xùn)練特征向量的維數(shù),用于軸承故障分類的KNN算法。蔡鍔等[22]利用主成分分析對高維特征向量進(jìn)行降維,在低維空間中用KNN進(jìn)行故障的分類識(shí)別。黃國榮等[23]利用主成分分析對原始非線性時(shí)間序列數(shù)據(jù)的特征向量進(jìn)行降維,并選取其中主成分特征向量。將得到的主成分特征向量作為KNN的輸入進(jìn)行故障分類。
樸素貝葉斯是一種生成概率模型,具有較高的學(xué)習(xí)和預(yù)測效率,特征向量之間的獨(dú)立假設(shè)性強(qiáng),即類中某個(gè)特征的存在與任何其他特征都沒有關(guān)系。且由于該模型通常需要先驗(yàn)知識(shí),所以樸素貝葉斯方法只適用于獨(dú)立特征向量。通過相互獨(dú)立的特征向量,以貝葉斯定理為基礎(chǔ),構(gòu)建一個(gè)基本方程,然后通過該方程去估計(jì)這一類后驗(yàn)概率的方法就是樸素貝葉斯分類方法。樸素貝葉斯模型簡單,易于實(shí)現(xiàn),所需估計(jì)參數(shù)少,對缺少數(shù)據(jù)不敏感,這些都使它在軸承故障診斷得到廣泛應(yīng)用。
軸承故障診斷領(lǐng)域,樸素貝葉斯分類器已經(jīng)得到廣泛的應(yīng)用。Jin等[24]使用連續(xù)Morlet小波分析以及時(shí)間序列分析提取各種統(tǒng)計(jì)特征,在選擇最優(yōu)特征后輸入集成貝葉斯分類器進(jìn)行分類。Zhang等[25]通過檢測基線數(shù)據(jù)和傳入的新數(shù)據(jù)之間的偏差,提出了使用貝葉斯估計(jì)算法進(jìn)行軸承健康評(píng)估,該算法提供了異常情況的概率以及給定的置信水平。姚成玉等[26]提出了一種基于熵權(quán)法的屬性加權(quán)樸素貝葉斯分類器算法,利用改進(jìn)小波包算法提取的特征向量作為輸入,提高了故障診斷的精度
樸素貝葉斯方法通常適用于獨(dú)立特征向量。然而,工業(yè)信號(hào)特征往往是相互依賴的,例如最常用的統(tǒng)計(jì)特征。因此,樸素貝葉斯的應(yīng)用通常是經(jīng)過一些降維操作來實(shí)現(xiàn)。Nguyen等[27]提出一種軸承早期故障的綜合多故障診斷方法,利用LDA選擇判別特征作為樸素貝葉斯分類器的輸入,對故障種類進(jìn)行分類。朱興統(tǒng)[28]通過主成分分析對特征向量進(jìn)行降維處理,再輸入樸素貝葉斯模型進(jìn)行故障分類。
人工神經(jīng)網(wǎng)絡(luò)是一種監(jiān)督學(xué)習(xí)算法,并在多領(lǐng)域得到非常廣泛的應(yīng)用。通常用在解決聚類、分類、回歸和非線性函數(shù)估計(jì)等問題。人工神經(jīng)網(wǎng)絡(luò)最常見的形式包括三個(gè)組件:輸入層、隱藏層、輸出層。人工神經(jīng)網(wǎng)絡(luò)可以用輸入層和隱含層之間的一組鏈路來表示,該鏈路由權(quán)重和相關(guān)偏差的倍數(shù)連接。人工神經(jīng)網(wǎng)絡(luò)是一種基于多個(gè)簡單處理器或神經(jīng)元的智能技術(shù),如圖4為神經(jīng)網(wǎng)絡(luò)的簡單模型。
圖4 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
輸入神經(jīng)元不參與任何處理,只是用來提供輸入信號(hào)。而輸出神經(jīng)元?jiǎng)t是通過對隱藏層中的單元進(jìn)行處理來獲得輸出。隱層中的神經(jīng)元作為處理單元,實(shí)現(xiàn)收斂解。通過使用偏差來避免零結(jié)果。在算法開始時(shí),權(quán)值被隨機(jī)分配,在每次迭代中,當(dāng)訓(xùn)練數(shù)據(jù)被輸入網(wǎng)絡(luò)時(shí),權(quán)值被相應(yīng)地更新。對于簡單神經(jīng)網(wǎng)絡(luò),每個(gè)神經(jīng)元與相鄰層的每個(gè)神經(jīng)元相連,沒有橫向連接。
大量的研究表明,神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的模式分類和模式識(shí)別能力。特別是在一些小數(shù)據(jù)集中,人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)出了對故障信號(hào)和特征的良好非線性近似能力。因此,人工神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于軸承故障診斷領(lǐng)域。目前人工神經(jīng)網(wǎng)絡(luò)有非常多模型。本研究探討幾種常見于軸承故障診斷領(lǐng)域的網(wǎng)絡(luò)模型,主要包括有多層感知器(MLP)、徑向基(RBF)神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)(PNN)等。
多層感知器(MLP),是一種由各層單元組成的神經(jīng)網(wǎng)絡(luò),只與后續(xù)層單元前向連接[29],它已經(jīng)在多個(gè)場景中得到應(yīng)用。Rafiee等[30]采用16∶20∶5結(jié)構(gòu)的輸入-隱藏-輸出層MLP網(wǎng)絡(luò)進(jìn)行齒輪箱軸承故障檢測與識(shí)別。利用預(yù)處理信號(hào)小波包系數(shù)的標(biāo)準(zhǔn)差作為特征向量。Kankar等[31]比較了神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)在轉(zhuǎn)子軸承系統(tǒng)故障診斷中的性能。實(shí)驗(yàn)結(jié)果表明,在研究中考慮的情況下,神經(jīng)網(wǎng)絡(luò)的分類精度高于支持向量機(jī)。
徑向基函數(shù)(RBF)基于函數(shù)逼近理論,是多元逼近和散亂數(shù)據(jù)插值的著名工具。盡管RBF神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)都可以逼近任何非線性函數(shù),但RBF神經(jīng)網(wǎng)絡(luò)由于具有良好的全局收斂性、較快的收斂速度和良好的泛化能力而表現(xiàn)出優(yōu)越的性能。張遠(yuǎn)緒等[32]通過建聚類算法改進(jìn)RBF網(wǎng)絡(luò),利用該神經(jīng)網(wǎng)絡(luò)對軸承故障進(jìn)行分類,與BP神經(jīng)網(wǎng)絡(luò)做對比實(shí)驗(yàn),結(jié)果表明改進(jìn)RBF準(zhǔn)確率更高。王海林等[33]采用小波分析與RBF神經(jīng)網(wǎng)絡(luò)結(jié)合的方法對軸承故障信號(hào)進(jìn)行分類識(shí)別,相比常見軸承故障分類算法有更高的準(zhǔn)確率。
概率神經(jīng)網(wǎng)絡(luò)(PNN)在結(jié)構(gòu)上與MLP相似。最基本的區(qū)別是使用了指數(shù)激活函數(shù)和神經(jīng)元之間的連接模式。PNN隱藏層的神經(jīng)元沒有完全連接。由于連接數(shù)量較少,PNN通常比MLP更容易訓(xùn)練。李文峰等[34]融合傳統(tǒng)時(shí)域指標(biāo)得到兩個(gè)更為敏感的新時(shí)域指標(biāo),利用概率神經(jīng)網(wǎng)絡(luò)(PNN)對兩個(gè)新指標(biāo)進(jìn)行訓(xùn)練測試,實(shí)驗(yàn)表明提高了軸承診斷的準(zhǔn)確性。陳慧等[35]利用多尺度熵(MSE)提取特征向量,并將其作為概率神經(jīng)網(wǎng)絡(luò)的輸入,有效實(shí)現(xiàn)了更高精度的軸承故障分類診斷。徐統(tǒng)等[36]利用變分模態(tài)分解(VMD)對滾動(dòng)軸承信號(hào)進(jìn)行分解,分別計(jì)算分解分量的K-L值,并將較小的兩個(gè)與其瞬時(shí)能量組成特征向量,輸入概率神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。
在軸承故障診斷領(lǐng)域,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)(ANN)時(shí),需要大量的訓(xùn)練數(shù)據(jù)。然而,在實(shí)際工業(yè)中,由于環(huán)境噪聲、機(jī)器對機(jī)器的變化等原因,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)之間普遍存在分布差異。這些差異會(huì)顯著降低人工神經(jīng)網(wǎng)絡(luò)的故障診斷性能。因此,在模型精度和對看不見數(shù)據(jù)的適應(yīng)性之間保持平衡是一個(gè)需要重點(diǎn)關(guān)注突破的對象。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支,深度學(xué)習(xí)通過復(fù)雜結(jié)構(gòu)的多個(gè)處理層來建模數(shù)據(jù)背后的多層次表示,并對數(shù)據(jù)進(jìn)行分類或預(yù)測。深度學(xué)習(xí)是由人工神經(jīng)網(wǎng)絡(luò)衍生而來,但相對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)單層的網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)是多處理層的,需要人工進(jìn)行特征提取,極易陷入局部最優(yōu)的缺點(diǎn),深度學(xué)習(xí)通過引入概率生成的模型,可以直接從原始信號(hào)數(shù)據(jù)中提取特征向量集。多層次堆疊的網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn)可以使其在簡單概念中學(xué)習(xí)到復(fù)雜的概念,可以避免對信號(hào)數(shù)據(jù)特征挖掘的不充分性。
深度學(xué)習(xí)模型有幾種常見模型,如深度信念網(wǎng)絡(luò)(DBN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等,下面對這幾種模型原理進(jìn)行簡單介紹:
DBN由多個(gè)限制玻爾茲曼機(jī)(RBM)層組成,一個(gè)典型的網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。這些網(wǎng)絡(luò)被“限制”為一個(gè)可視層和一個(gè)隱層,層間存在連接,但層內(nèi)的單元間不存在連接。隱層單元被訓(xùn)練去捕捉在可視層表現(xiàn)出來的高階數(shù)據(jù)的相關(guān)性。在軸承故障診斷領(lǐng)域,Shao等[37]提出了一種用于滾動(dòng)軸承故障診斷的優(yōu)化深度信念網(wǎng)絡(luò)。采用隨機(jī)梯度下降法對限制波爾曼機(jī)的權(quán)重w進(jìn)行微調(diào)。然后,利用粒子群算法確定訓(xùn)練好的DBN最優(yōu)結(jié)構(gòu)。在另一項(xiàng)工作中[38],他們提出了一種雙樹復(fù)小波包來提取故障特征,并使用DBN對多種類型的軸承故障進(jìn)行分類。楊宇等[39]提出了一種新的深度信念網(wǎng)絡(luò),即結(jié)構(gòu)自適應(yīng)深度信念網(wǎng)絡(luò)(SADBN)。該方法能有效解決DBN結(jié)構(gòu)難以確定已經(jīng)能有效提升網(wǎng)絡(luò)診斷效率的問題。DBN不僅能用于故障的分類,對于軸承健康狀態(tài)的預(yù)測,同樣有十分顯著的效果。Deutsch等[40]就通過使用帶粒子過濾器的DBN預(yù)測軸承的健康狀態(tài)以及剩余壽命。DBN診斷模型還可通過預(yù)訓(xùn)練一組限制波爾曼機(jī)來自動(dòng)學(xué)習(xí)特征,能解決部分深層網(wǎng)絡(luò)帶來的梯度消失問題。
圖5 深度信念網(wǎng)絡(luò)
CNN的基本架構(gòu)如圖6所示??傮w而言,該體系結(jié)構(gòu)主要由三層組成:卷積層、池化層、全連接層。卷積層包含許多過濾器,其主要功能是從給定的輸入數(shù)據(jù)集中識(shí)別重要特征或特征映射。使用多個(gè)過濾器背后的想法是,當(dāng)與輸入數(shù)據(jù)進(jìn)行卷積時(shí),不同的過濾器將檢測/識(shí)別不同的特征集。然后將提取的特征傳遞到下一層。Janssens等[41]是最早將卷積神經(jīng)網(wǎng)絡(luò)(CNN)引入軸承故障診斷的,通過CNN從軸承x和y反向的加速度振動(dòng)數(shù)據(jù)中自動(dòng)學(xué)習(xí)故障特征,最終證明CNN的自動(dòng)特征學(xué)習(xí)能力優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)方法。為了消除原始振動(dòng)信號(hào)中高頻噪聲的影響,Zhang等[42]在所提出的CNN體系結(jié)構(gòu)中采用了寬核,并證明所提出的模型的結(jié)果優(yōu)于目前最先進(jìn)的基于頻率特征的深度神經(jīng)網(wǎng)絡(luò)(DNN)模型。陳仁祥等[43]利用散小波變換將軸承振動(dòng)信號(hào)時(shí)頻特征充分展現(xiàn),然后利用卷積神經(jīng)網(wǎng)絡(luò)多層特征提取的特點(diǎn),將低層信號(hào)特征變?yōu)樯顚犹卣?,最后輸入softmax分類器,以達(dá)到提高診斷精度的目的。肖雄等[44]將原始信號(hào)轉(zhuǎn)換為二維灰度圖像作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,并對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行梯度下降算法優(yōu)化,最終得到較好的軸承故障診斷效果。與DBN相比,基于CNN的診斷模型可以直接從原始信號(hào)數(shù)據(jù)中學(xué)習(xí)特征,無需進(jìn)行頻域變換等預(yù)處理,可以直接捕捉數(shù)據(jù)位移特征。此外,采用權(quán)值共享的方法有效減少了診斷模型中訓(xùn)練參數(shù)的數(shù)量,加快了收斂速度,抑制了過擬合現(xiàn)象。
圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
RNN的結(jié)構(gòu)主要用于處理和預(yù)測序列數(shù)據(jù),通常卷積神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)都是由輸入層到隱藏層再到輸出層,中間采用全連接或者部分連接,但是層與層之間節(jié)點(diǎn)沒有連接,而循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是用來處理和預(yù)測數(shù)據(jù)的,所以需要去連系輸出與之前信息的關(guān)系,并通過前面的輸入信息影響后面的輸出信息,所以從網(wǎng)絡(luò)結(jié)構(gòu)上來講,循環(huán)神經(jīng)網(wǎng)絡(luò)隱藏層之間的節(jié)點(diǎn)是有連接的。圖7是RNN的網(wǎng)絡(luò)模型。振動(dòng)信號(hào)數(shù)據(jù)大部分通過傳感器收集,屬于時(shí)間序列。其包括長短期記憶網(wǎng)絡(luò)(LSTM)和門循環(huán)單元(GRU)在內(nèi)的RNN模型已經(jīng)成為處理時(shí)序數(shù)據(jù)的一種流行的體系結(jié)構(gòu),具有時(shí)序信息編碼的能力。Jiang等[45]提出一種具有堆疊隱藏層的LSTM單元,以均方誤差(MSE)作為損失函數(shù)的軸承故障分類方法,通過實(shí)驗(yàn)證明具有良好的故障分類效果。孫潔娣等[46]提出了一種深度卷積神經(jīng)網(wǎng)絡(luò)與長短期記憶網(wǎng)絡(luò)相結(jié)合的智能故障診斷方法,該方法能自適應(yīng)的從軸承故障數(shù)據(jù)中提取魯棒性特征,通過LSTM中時(shí)間序列依存關(guān)系實(shí)現(xiàn)高精度軸承故障診斷。張立鵬等[47]利用預(yù)處理后的機(jī)械振動(dòng)信號(hào),搭建了雙向門控循環(huán)單元的故障診斷模型,并通過注意力機(jī)制的模型優(yōu)化,提高了診斷模型對故障特征提取的效率。王超群等[48]提出一種基于門控循環(huán)單元(GRU)的膠囊網(wǎng)絡(luò)模型,利用門控循環(huán)單元充分提取故障特征,并盡可能減少細(xì)節(jié)特征的丟失,最后實(shí)現(xiàn)故障分類。RNN與CNN相比較,RNN屬于時(shí)間擴(kuò)展屬性,神經(jīng)元與時(shí)間序列輸出計(jì)算相關(guān)聯(lián),不同于CNN中的神經(jīng)元與特征卷積相互關(guān)聯(lián),在深度學(xué)習(xí)中,空間屬性的CNN和時(shí)間屬性的RNN是深度學(xué)習(xí)中最重要的兩個(gè)板塊。
圖7 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
遷移學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一種,通過從一個(gè)或多個(gè)相關(guān)但不同的應(yīng)用場景中學(xué)習(xí)通用知識(shí),以幫助智能算法在遷移場景中獲得更強(qiáng)大的性能,是一種非監(jiān)督式學(xué)習(xí)方法,可以幫助深度學(xué)習(xí)克服一些局限性。類似人類工程師可以通過以往的經(jīng)驗(yàn)知識(shí)去解決同類型不同場景的新問題,遷移學(xué)習(xí)可以賦予人工智能模型更好的學(xué)習(xí)性能,即使在訓(xùn)練數(shù)據(jù)稀疏和有限的情況下,也具有從相關(guān)但不同的應(yīng)用程序場景到一個(gè)新的的魯棒泛化性能。
在傳統(tǒng)機(jī)器學(xué)習(xí)中,我們會(huì)根據(jù)不同任務(wù)已經(jīng)場景來對訓(xùn)練相對應(yīng)的模型。如圖8中所展示的,想要完成兩個(gè)模型的訓(xùn)練,需要分別使用不同的帶標(biāo)簽數(shù)據(jù),與具體任務(wù)及場景相匹配。但是在遷移學(xué)習(xí)中,我們可以先完成對模型A的訓(xùn)練,然后通過遷移學(xué)習(xí)將學(xué)習(xí)到的知識(shí)從源域遷移到與源域模型類似,使得目標(biāo)模型能更加快速穩(wěn)定的構(gòu)建。
圖8 遷移學(xué)習(xí)原理圖
遷移學(xué)習(xí)與其他深度學(xué)習(xí)模型相結(jié)合的診斷模式已經(jīng)得到廣泛研究人員的驗(yàn)證,遷移學(xué)習(xí)是一種幫助智能故障診斷從理論到工業(yè)應(yīng)用的非常有效的工具。Liu等[49]提出了一種基于深度全卷積條件Wasserstein對抗網(wǎng)絡(luò)(FCWAN)的遷移學(xué)習(xí)故障診斷模型。所提出的模型通過隨機(jī)采樣圖分類和差異分類器用于加強(qiáng)目標(biāo)條件下的分類準(zhǔn)確率,在對抗學(xué)習(xí)領(lǐng)域引入標(biāo)簽,加強(qiáng)對學(xué)習(xí)過程的監(jiān)督和類別域?qū)R的效果,提高了遷移學(xué)習(xí)應(yīng)用的準(zhǔn)確率。Qian等[50]提出了一種新的基于卷積自編碼器(CAE-DTLN)的深度轉(zhuǎn)移學(xué)習(xí)網(wǎng)絡(luò),在沒有標(biāo)記數(shù)據(jù)的情況下實(shí)現(xiàn)目標(biāo)域的機(jī)械故障診斷。同時(shí)由于卷積自編碼器的除噪能力,使得整個(gè)模型具有很好的抗噪魯棒性。陳仁祥等[51]提出一種自適應(yīng)正則化遷移學(xué)習(xí)的滾動(dòng)軸承故障診斷方法,對不同工況下軸承的故障診斷都有非常好的效果。
支持向量機(jī)具有非常優(yōu)秀的泛化性能,在訓(xùn)練數(shù)據(jù)集較少的情況下,也能進(jìn)行有效的分類和預(yù)測。通過核函數(shù)對非線性數(shù)據(jù)進(jìn)行映射,通過超平面進(jìn)行多分類問題處理,且分類精度高于常規(guī)軸承故障診斷模型。同時(shí)支持向量機(jī)計(jì)算資源少,是一種有效的實(shí)時(shí)分類工具。
決策樹在訓(xùn)練過程中速度是比較快的,不需要大量的參數(shù),沒有數(shù)據(jù)的限制,當(dāng)需要增加新的模型類別時(shí),也不需要使用者出現(xiàn)構(gòu)建新的樹。在決策樹中由于每個(gè)特征被單獨(dú)處理,而且數(shù)據(jù)的劃分也不依賴于縮放,因此決策樹算法不需要特征預(yù)處理。特別是特征的尺度完全不一樣時(shí)或者二元特征和連續(xù)特征同時(shí)存在時(shí),決策樹的效果很好。但是在實(shí)際分類過程中,決策樹通常容易過擬合,泛化性能比較差。
KNN是一種基于實(shí)例的學(xué)習(xí)算法,但因?yàn)槠鋵W(xué)習(xí)較少或基本不學(xué)習(xí),也被稱為機(jī)器學(xué)習(xí)中的懶惰者。在模型的訓(xùn)練階段速度很快,但到了分類階段就比較慢了。K-NN的理論成熟,思想簡單是其應(yīng)用在軸承故障診斷的優(yōu)點(diǎn)之一,在對數(shù)據(jù)集訓(xùn)練時(shí),對噪聲有較好的魯棒性。
樸素貝葉斯算法是一種潛在的概率模型,有著穩(wěn)定的分類效率,同時(shí)對缺失數(shù)據(jù)不敏感,當(dāng)缺失少量數(shù)據(jù)時(shí)可以使用樸素貝葉斯算法。對小規(guī)模數(shù)據(jù)表現(xiàn)良好,運(yùn)行時(shí)占用內(nèi)存少,適用于多分類任務(wù),在增量樣本訓(xùn)練時(shí)可以分批次進(jìn)行訓(xùn)練。
人工神經(jīng)網(wǎng)絡(luò)實(shí)際上是模仿人腦神經(jīng)的一種計(jì)算模型,有著多個(gè)節(jié)點(diǎn)和多個(gè)輸出點(diǎn)的網(wǎng)絡(luò)結(jié)構(gòu),可以對任意的非線性、復(fù)雜、多維數(shù)據(jù)進(jìn)行映射,并且有著非常高的分類精度,在處理并行分類問題時(shí)有著非常良好的表現(xiàn)。人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是多樣化的,在軸承故障診斷中,通常會(huì)改變其結(jié)構(gòu)來達(dá)到提高分類效率與精度的目的。
深度學(xué)習(xí)是在人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,再進(jìn)行深度架構(gòu)的方法,由于其特殊的結(jié)構(gòu),可以直接從數(shù)據(jù)集中有多個(gè)層次上抽象出數(shù)據(jù)中具有代表性的特征,可以省去人工特征提取的步驟。同時(shí)深度學(xué)習(xí)有很高的分類精度,這是其他算法都比不了的。在實(shí)際故障診斷中,深度學(xué)習(xí)的這些特性非常適合將其引入工業(yè)故障診斷中。
遷移學(xué)習(xí)擁有巨大的工業(yè)應(yīng)用潛力,對于現(xiàn)有的軸承故障診斷領(lǐng)域的算法,都能達(dá)到一個(gè)增強(qiáng)的作用,與現(xiàn)在熱門的深度學(xué)習(xí)算法結(jié)合,可以有效解決深度學(xué)習(xí)在故障診斷實(shí)際應(yīng)用中存在的一些問題,提高模型構(gòu)建速度,從而提高診斷準(zhǔn)確率的效果。
一般情況下,在處理多維連續(xù)特征時(shí),支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)會(huì)有較好的表現(xiàn),而KNN、決策樹、樸素貝葉斯在處理離散特征時(shí)有較大優(yōu)勢,同時(shí)他們在信號(hào)處理中,都會(huì)有明確的物理意義,而支持向量機(jī)以及神經(jīng)網(wǎng)絡(luò)等因?yàn)樘幚磉^程黑箱化,因此過程及結(jié)果一直難以解釋,神經(jīng)網(wǎng)絡(luò)的可視化也一直是研究人員重點(diǎn)關(guān)注的一個(gè)方向。
機(jī)器學(xué)習(xí)在故障診斷領(lǐng)域的發(fā)展是值得期待的,雖然在工業(yè)上的應(yīng)用還存在限制,但是機(jī)器學(xué)習(xí)算法對于工業(yè)故障診斷領(lǐng)域來說,是一個(gè)非常有前景的軸承故障處理工具,除了以上的理論探討以及實(shí)踐,目前機(jī)器學(xué)習(xí)的發(fā)展還有以下幾個(gè)方面值得關(guān)注:
(1)考慮到不同算法各有優(yōu)缺點(diǎn),可以將這些算法的優(yōu)點(diǎn)提取集成到一個(gè)混合故障診斷系統(tǒng)上,去針對不同情景的實(shí)際工業(yè)故障診斷,用多算法集成解決實(shí)際應(yīng)用問題。
(2)隨著深度學(xué)習(xí)的興起以及在故障診斷方面的應(yīng)用,對軸承故障的數(shù)據(jù)要求也越來越高,不僅需要數(shù)量也同樣需要質(zhì)量,在應(yīng)用基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)診斷算法的同時(shí),需要給整個(gè)系統(tǒng)配套使用更高精度的數(shù)據(jù)采集系統(tǒng)。
(3)深度學(xué)習(xí)可以減少人工特征提取的過程,同時(shí)有很強(qiáng)的實(shí)時(shí)性,可以考慮開發(fā)基于深度學(xué)習(xí)的整套工業(yè)故障診斷系統(tǒng)實(shí)時(shí)監(jiān)控,挖掘出深度學(xué)習(xí)的潛力。
(4)基于機(jī)器學(xué)習(xí)的軸承故障診斷方法不斷發(fā)展完善,不僅要單獨(dú)從數(shù)據(jù)驅(qū)動(dòng)的角度,同時(shí)也不能忽略人的作用,建立良好的人機(jī)交互功能,在高素質(zhì)從業(yè)人員的輔助下,使得整個(gè)系統(tǒng)有更好的運(yùn)行作用。
(5)遷移學(xué)習(xí)與深度學(xué)習(xí)相結(jié)合,由于一些機(jī)器故障診斷問題有足夠的訓(xùn)練數(shù)據(jù),而其他工業(yè)場景缺乏訓(xùn)練數(shù)據(jù),通過深度學(xué)習(xí)與遷移學(xué)習(xí)結(jié)合,可以有效將深度學(xué)習(xí)模型自適應(yīng)學(xué)習(xí)的知識(shí)轉(zhuǎn)移到其他場景使用,不用重新訓(xùn)練深度模型以及獲取大量標(biāo)簽數(shù)據(jù)。因此該研究方向?qū)ι疃葘W(xué)習(xí)在機(jī)器故障診斷的實(shí)際應(yīng)用有很大意義。
本文對基于機(jī)器學(xué)習(xí)的軸承故障診斷進(jìn)行了詳細(xì)的綜述。對支持向量機(jī)、k-NN、決策樹、樸素貝葉斯人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、遷移學(xué)習(xí)等機(jī)器學(xué)習(xí)算法進(jìn)行了深入的討論。并對自動(dòng)編碼器、深度置信網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等最新的深度學(xué)習(xí)算法在軸承故障診斷中的應(yīng)用進(jìn)行了綜述。對機(jī)器學(xué)習(xí)各種算法的優(yōu)缺點(diǎn)進(jìn)行總結(jié)。深度學(xué)習(xí)的應(yīng)用具有自特征提取和自特征選擇的優(yōu)勢,從而降低了在特征提取和特征選擇中人為錯(cuò)誤的風(fēng)險(xiǎn),在未來是極具應(yīng)用潛力的。機(jī)器學(xué)習(xí)算法在軸承故障診斷的未來表現(xiàn)是非常值得期待的,不論是傳統(tǒng)的機(jī)器學(xué)習(xí)算法,還是最近熱門的深度學(xué)習(xí)算法,在軸承故障診斷領(lǐng)域都已經(jīng)有著非常好的表現(xiàn),值得期待其在未來有更廣闊的應(yīng)用前景。