江 麗 郭順生
武漢理工大學,武漢,430070
?
基于半監(jiān)督拉普拉斯特征映射的故障診斷
江麗郭順生
武漢理工大學,武漢,430070
摘要:針對有標記故障樣本不足和故障數(shù)據(jù)高維非線性的問題,提出了基于半監(jiān)督拉普拉斯特征映射(LE)算法的故障診斷模型。該模型運用LE算法,直接從原始高維振動信號中提取低維流形特征,并將其輸入到基于LE的半監(jiān)督分類器,從而識別出機械設備的運行狀態(tài)。與傳統(tǒng)方法相比,該模型能明顯提高滾動軸承和齒輪的故障識別性能。
關鍵詞:故障診斷;特征提?。涣餍螌W習;半監(jiān)督拉普拉斯特征映射
0引言
現(xiàn)代機械設備的故障數(shù)據(jù)往往呈現(xiàn)出海量、高維、非平穩(wěn)性、非高斯分布和結(jié)構(gòu)非線性的特征[1-4]。如何從高維非線性故障數(shù)據(jù)中,提取能反映其運行狀態(tài)的低維故障特征,具有重要的理論意義和工程應用價值。
傳統(tǒng)的非線性特征提取算法,如核主成分分析(kernel principal component analysis,KPCA)算法[5]沒有考慮樣本的類別信息,核判別分析(kernel discriminant analysis,KDA)算法[6]要求故障數(shù)據(jù)服從高斯分布。自組織特征映射(self organizingmaps, SOM)算法[7]計算復雜度比較高,在循環(huán)迭代尋優(yōu)過程中易陷入局部極值。另外,它們大多在歐氏空間分析故障數(shù)據(jù),不能充分挖掘蘊含在高維數(shù)據(jù)中的潛在信息。流形學習能很好地挖掘非線性數(shù)據(jù)中的潛在幾何結(jié)構(gòu)和內(nèi)在規(guī)律,為基于數(shù)據(jù)幾何結(jié)構(gòu)驅(qū)動的機械故障診斷技術開辟了新思路[3-4,8-12]。
從機械設備獲取大量有標記樣本費時費力,但傳統(tǒng)的機械故障分類,需要利用大量有標記樣本訓練分類器。另外,經(jīng)典的流形學習算法,如拉普拉斯特征映射(Laplacian eigenmaps,LE)算法,大多是無監(jiān)督的,在特征提取的過程中沒有考慮樣本的類別信息,不利于后續(xù)的故障模式分類。針對這些情況,本文在LE算法基礎上,提出了一種基于半監(jiān)督LE算法的故障診斷模型并應用于機械設備的故障識別。該模型直接運用LE算法,從原始的高維振動信號中提取反映故障數(shù)據(jù)內(nèi)蘊幾何結(jié)構(gòu)的低維流形特征,隨后將該特征輸入到基于LE的半監(jiān)督分類器中,從而識別機械設備的運行狀態(tài)。
1基于LE的半監(jiān)督分類
給定高維空間RD的一組觀測數(shù)據(jù)集X=[x1x2…xN],xi∈RD,N為觀測數(shù)據(jù)集中樣本總數(shù)。假設其在低維嵌入空間Rd上的映射數(shù)據(jù)集Y=[y1y2…yN],yi∈Rd,d?D。
1.1LE算法
LE算法[13]是一種基于譜圖理論的局部非線性特征提取和降維方法,其基本思想是:在高維空間中離得很近的點,投影到低維流形上也應該離得很近,即保持投影前后局部近鄰關系不變。該算法利用Laplace-Beltrami算子(定義為流形切空間上梯度向量的負散度函數(shù)),將兩點間的加權(quán)距離作為損失函數(shù),通過求解圖拉普拉斯算子的廣義特征值來實現(xiàn)流形的最優(yōu)嵌入。其算法流程如下:
(1)構(gòu)造近鄰圖G。計算數(shù)據(jù)集X中所有樣本點對之間的歐氏距離,根據(jù)k-近鄰法,確定每個樣本點的k個近鄰點,如果樣本點xi和xj是近鄰點,那么這兩個點在圖G上有邊連接,否則斷開。
(2)構(gòu)建鄰接權(quán)值矩陣W=[Wij]。根據(jù)樣本點對之間的近鄰關系,其鄰接權(quán)值定義如下:
(1)
(3)計算低維嵌入。嵌入空間的代價函數(shù)定義為
(2)
1.2基于拉普拉斯特征映射的分類器
假設數(shù)據(jù)集X的前M個樣本的類別標簽為ci,其中M (3) 式(3)的解可表示為 (4) Elab=[eji]d×Mc=(c1,c2,…,cM)其中,eji為已標記樣本利用Le=λDe進行拉普拉斯特征映射后,d個最小特征值對應的特征向量。 根據(jù)式(3)、式(4)構(gòu)造的分類器對未標記樣本xi(i=M+1,M+2,…,N-1)進行分類,其類別標簽判別如下: (5) 2基于半監(jiān)督LE算法的故障診斷模型 如圖1所示,本文提出的基于半監(jiān)督LE算法的故障診斷模型的基本思想是:根據(jù)機械設備不同類型的故障樣本在高維空間中呈現(xiàn)出的不同流形拓撲結(jié)構(gòu),采用LE算法,直接學習機械設備的原始高維故障信息,提取故障數(shù)據(jù)的潛在低維流形特征。隨后,將該低維特征輸入到基于LE的半監(jiān)督分類器中,利用大量廉價的未標記故障樣本學習出故障數(shù)據(jù)的潛在流形結(jié)構(gòu)。然后通過少量昂貴的有標記故障樣本學習出整個流形上的類別信息,從而識別機械設備的工作狀態(tài)和故障類型。該算法的故障診斷過程如下: (1)數(shù)據(jù)采集。從故障設備上采集多種運行狀態(tài)下的振動信號,采用最小值-最大值標準化法對信號進行歸一化預處理后,得到一個由原始振動時間序列構(gòu)建的高維模式空間。 (2)運用LE算法提取低維流形特征。采用LE算法直接對高維模式空間中的故障樣本進行流形學習,挖掘原始高維振動信號中的潛在幾何結(jié)構(gòu),提取反映故障本質(zhì)的低維流形特征,并將原始高維樣本映射到一個低維的特征空間。 (3)故障分類。將特征空間中的低維流形特征分成兩部分,將將有標記的特征作為訓練樣本(有標記樣本),將未標記的特征作為測試樣本(未標記樣本)。依據(jù)少量昂貴的有標記樣本訓練出基于LE的半監(jiān)督分類器,從而構(gòu)造一個類別空間,并將大量廉價的未標記樣本輸入該類別空間進行故障分類,找出故障原因。 圖1 基于半監(jiān)督LE算法的故障診斷模型 本模型由于采用LE算法,因而選擇合適的嵌入維數(shù)d和近鄰點數(shù)k,對低維流形的構(gòu)建和最終的故障診斷精度至關重要。根據(jù)文獻[15-16]的研究結(jié)果,本文最優(yōu)的嵌入維數(shù)d=C-1,并根據(jù)最高的故障識別精度來選取最優(yōu)的近鄰點數(shù)k。 3故障診斷實驗 滾動軸承和齒輪廣泛應用于支撐國民經(jīng)濟的現(xiàn)代機械設備中,其運行狀態(tài)往往直接影響到整臺機器的可靠性。因此,實驗采用美國Case Western Reserve University電氣工程實驗室的滾動軸承故障數(shù)據(jù)[17]和布魯塞爾自由大學的齒輪箱試驗數(shù)據(jù)[18]來驗證本文提出方法的有效性。同時,將其與經(jīng)典的模式識別方法,如KPCA+KNN算法、KDA+KNN算法以及LE+ KNN算法進行了比較。這3種經(jīng)典的模式識別算法的故障診斷過程為:分別采用KPCA算法、KDA算法或者LE算法,從原始的高維振動信號中提取低維故障特征后,再采用K近鄰(K-nearest neighbor,KNN)分類器進行故障模式分類。通過五折交叉驗證,分別確定KPCA算法和KDA算法對應的最佳核(本文全部選用RBF核函數(shù))寬度σ。 3.1滾動軸承故障識別 滾動軸承實驗臺由1個1491.4 W的三相電動機、1個扭矩傳感器和1個加載電機組成。待測試的滾動軸承(型號為6205-2RS JEM SKF)安裝在電動機的驅(qū)動端,加速度傳感器粘貼于電動機驅(qū)動端正上方的機殼上。故障軸承的振動數(shù)據(jù)由一個16通道的數(shù)據(jù)記錄儀(采樣率為12 kHz)獲取。模擬了滾動軸承的 4 種故障狀態(tài):①正常運行狀態(tài)(轉(zhuǎn)速為1797 r/min,工作載荷為0);②內(nèi)圈嚴重故障(轉(zhuǎn)速為1772 r/min,工作載荷為745.7 W);③滾動體嚴重故障(轉(zhuǎn)速為1750 r/min,工作載荷為1491.4 W);④外圈嚴重故障(轉(zhuǎn)速為1730 r/min,工作載荷為2237.1 W)。后3種故障狀態(tài)的損傷直徑均為0.54 mm。分別采集這4種故障狀態(tài)的振動信號后,每種狀態(tài)選取100個故障樣本,每個故障樣本均包含1024個采樣點,從而構(gòu)建了一個1024維的模式空間,得到N×D=(4×100)×1024的高維故障樣本矩陣。根據(jù)第2章的方法,確定LE算法對應的嵌入維數(shù)d=3。 原始高維振動數(shù)據(jù)的低維可視化表示,有助于直觀地識別故障設備的運行狀態(tài)。因此,當有標記樣本數(shù)目為10時,采用LE算法(近鄰點數(shù)k=5)直接對由原始振動信號構(gòu)建的1024維故障樣本提取低維流形特征,并與KPCA算法和KDA算法(核寬度σ分別為10和3)進行比較,圖2所示為90個未標記樣本的前兩個主分量(原始高維樣本提取低維特征后所得到的前兩個低維特征)對應的可視化結(jié)果。如圖2所示,因為滾動體故障和正常狀態(tài)這兩類樣本的聚類性太差,因此KPCA算法不能完全區(qū)分這四類故障;雖然KDA特征有很好的聚類效果,但滾動體故障和正常狀態(tài)這兩類樣本的分界面不太清晰;相比而言,LE特征表現(xiàn)出較好的分離性能和聚類效果,能更好地表達和區(qū)分軸承的故障狀態(tài)。 (a)LE算法 (b)KPCA算法 (c)KDA算法 圖2不同算法的低維映射結(jié)果 為了進一步驗證基于半監(jiān)督LE算法的智能診斷模型的有效性,考察了不同數(shù)目的未標記樣本對其故障識別性能的影響,每類未標記樣本數(shù)目以步長為10,在區(qū)間[10,90]遞增變化,相應的剩余樣本為有標記樣本。不同數(shù)目的未標記故障樣本在4種算法下對應的故障識別精度見圖3,其對應的參數(shù)設置見表1。從圖3可以看出,當每類未標記樣本數(shù)目不超過70時,KDA+KNN算法的故障識別性能要優(yōu)于KPCA+KNN算法。雖然每類未標記樣本數(shù)目不超過40時,KPCA+KNN算法的故障識別性能比較接近本文提出的方法,但是每類未標記樣本數(shù)目為90時,其故障識別精度不到60%。盡管LE+KNN算法的故障識別精度要高于前面兩種算法,但每類未標記樣本數(shù)目為90時,其故障識別率要略低于95%。另外,這3種經(jīng)典的模式識別算法的故障識別精度,基本上都是隨著未標記樣本數(shù)目的增加而降低。相比之下,本文提出的方法比較穩(wěn)定,對于不同數(shù)目的未標記樣本,一直保持100%的分類精度??梢姡谌纸Y(jié)構(gòu)的KPCA算法和KDA算法都不能很好挖掘故障軸承的潛在信息;基于局部結(jié)構(gòu)保持特性的LE算法雖能很好地從故障軸承的高維振動信號中提取最具代表性的低維流形特征,然而基于監(jiān)督分類的KNN分類器僅利用了少量標記樣本,容易引起過擬合,降低分類精度;本文提出的基于半監(jiān)督LE算法的故障診斷模型,不僅能很好地從故障軸承的高維振動信號中挖掘低維流形的潛在幾何分布規(guī)律,而且大量未標記樣本有助于少量標記樣本學習出整個流形上的類別信息,因而該模型具有更好的分類能力。 圖3 4種算法對應的最高故障識別精度 有標記樣本數(shù)目KPCA(d=20)KDA(d=3)LE(d=3)半監(jiān)督LE(d=3)10σ=10σ=3k=5k=520σ=5σ=3k=5k=830σ=5σ=3k=4k=840σ=5σ=3k=5k=550σ=5σ=3k=8k=560σ=5σ=3k=5k=570σ=5σ=3k=4k=880σ=5σ=3k=5k=590σ=5σ=3k=5k=5 3.2齒輪故障識別 實驗采用齒數(shù)比為41∶37、模數(shù)為5 mm的低碳鋼斜齒輪副,齒輪箱信號采集裝置如圖4所示。待測試對象為41齒的斜齒輪,其輸入扭矩為80 N·m,齒輪軸轉(zhuǎn)頻為10 Hz,其振動加速度信號由垂直固定在箱體外軸承座上的壓電式加速度傳感器拾取,采樣頻率為10 kHz。實驗模擬了該齒輪的3種故障狀態(tài)(正常狀態(tài)、齒面點蝕、齒面磨損)。分別采集這3種故障狀態(tài)的振動信號后,每種狀態(tài)選取35個故障樣本,每個故障樣本均包含1024個采樣點,從而構(gòu)建了一個1024維的模式空間,得到N×D=(3×35)×1024的高維故障樣本矩陣。根據(jù)第2章的方法,確定LE算法對應的嵌入維數(shù)d=2。 圖4 齒輪箱信號采集裝置 當有標記樣本數(shù)目為5時,分別采用LE算法(近鄰點數(shù)k=5)、KPCA算法和KDA算法(核寬度σ分別為1和8)進行特征提取,30個未標記樣本的低維可視化結(jié)果如圖5所示,可知LE特征的3類故障樣本分別聚集于一點,并具有清晰的分類邊界。相比而言,KPCA特征和KDA特征的聚類性太差,3類故障樣本之間存在交叉區(qū)域,因而它們完全不能分辨出3類故障。每類未標記樣本數(shù)目為30時,不同數(shù)目的有標記故障樣本在4種算法下對應的故障識別精度及其對應的參數(shù)設置見表2。隨著有標記樣本數(shù)目的增加,4種算法的故障識別率都不斷提高。然而,對于不同數(shù)目的有標記樣本,基于全局結(jié)構(gòu)的KDA+KNN算法和KPCA+KNN算法的故障識別精度均遠低于其余兩種基于局部流形結(jié)構(gòu)保持的算法。另外,當有標記樣本數(shù)目相同時,基于半監(jiān)督LE算法的故障識別率均高于LE+ KNN算法,可見,半監(jiān)督學習的引入,提高了LE算法的故障識別精度。因此,相對其他3種算法而言,本文提出的方法能提高齒輪的故障診斷性能。 (a)LE算法 (b)KPCA算法 (c)KDA算法 圖5 不同算法的低維映射結(jié)果 4結(jié)語 本文在LE算法基礎上,提出一種基于半監(jiān)督LE算法的故障診斷模型。該模型采用LE算法,直接從原始高維故障信號構(gòu)成的觀測樣本空間中,提取反映故障數(shù)據(jù)內(nèi)蘊幾何結(jié)構(gòu)的低維流形特征,并將其輸入到基于LE算法的半監(jiān)督分類器中進行故障模式分類,從而獲取整個流形上的類別信息。軸承和齒輪箱故障診斷實驗驗證了該模型的有效性和優(yōu)越性。實驗結(jié)果表明,與KPCA算法和KDA算法相比,LE算法表現(xiàn)出較好的分離性能和聚類效果。與KPCA+KNN算法、KDA+KNN算法以及LE+KNN算法比較,本文提出的基于LE算法的故障診斷模型大大提高了軸承和齒輪箱的故障分類精度。因此,與傳統(tǒng)方法相比,本文提出的基于半監(jiān)督LE算法的故障診斷模型,能更好地表征機械設備的運行狀態(tài),并明顯提高它們的故障識別性能。 參考文獻: [1]HeQingbo.Time-frequencyManifoldforNonlinearFeatureExtractioninMachineryFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2013, 35(1/2):200-218. [2]LuWenbo,JiangWeikang,WuHaijun,etal.AFaultDiagnosisSchemeofRollingElementBearingBasedonNear-fieldAcousticHolographyandGrayLevelCo-occurrenceMatrix[J].JournalofSoundandVibration,2012, 331(15): 3663-3674. [3]黃宏臣, 韓振南, 張倩倩,等. 基于拉普拉斯特征映射的滾動軸承故障識別[J]. 振動與沖擊,2015,34(5): 128-134. HuangHongchen,HanZhennan,ZhangQianqian,etal.MethodofFaultDiagnosisforRollingBearingsBasedonLaplacianEigenmap[J].JournalofVibrationandShock,2015, 34(5): 128-134. [4]孫斌, 劉立遠, 牛翀,等. 基于局部切空間排列和K-最近鄰分類器的轉(zhuǎn)子故障診斷方法[J]. 中國機械工程,2015,26(1): 74-78. SunBin,LiuLiyuan,NiuChong,etal.RotorFaultDiagnosisMethodsBasedonLocalTangentSpaceAlignmentandK-nearestNeighborClassifier[J].ChinaMechanicalEngineering,2015, 26(1): 74-78. [5]Sch?lkopfB,SmolaA,MullerKR.NonlinearComponentAnalysisasaKernelEigenvalueProblem[J].NeuralComputation, 1998, 10(5): 1299-1319. [6]MikaS,R?tschG,WestonJ,etal.FisherDiscriminantAnalysiswithKernels[C]//Proceedingsofthe1999IEEESignalProcessingSocietyWorkshop.NewYork,1999: 41-48. [7]OwsleyLMD,AtlasLE,BernardGD.Self-organizingFeatureMapsandHiddenMarkovModelsforMachine-toolMonitoring[J].IEEETransactionsonSignalProcessing, 1997, 45(11): 2787-2798. [8]劉麗娟, 陳果, 郝騰飛. 基于流形學習與一類支持向量機的滾動軸承早期故障識別方法[J]. 中國機械工程,2013,24(5): 628-633. LiuLijuan,ChenGuo,HaoTengfei.IncipientFaultRecognitionofRollingBearingsBasedonManifoldLearningandOne-classSVM[J].ChinaMechanicalEngineering,2013, 24(5): 628-633. [9]歐璐, 于德介. 基于拉普拉斯分值和模糊c均值聚類的滾動軸承故障診斷[J]. 中國機械工程,2014,25(10): 1352-1357. OuLu,YuDejie.RollingBearingFaultDiagnosisBasedonLaplacianScoreandFuzzyC-meansClustering[J].ChinaMechanicalEngineering,2014, 25(10): 1352-1357. [10]蘇祖強, 湯寶平, 劉自然,等. 基于正交半監(jiān)督局部fisher判別分析的故障診斷[J]. 機械工程學報,2014,50(18): 7-13. SuZuqiang,TangBaoping,LiuZiran.FaultDiagnosisMethodBasedonOrthogonalSemi-supervisedLocalFisherDiscriminantAnalysis[J].JournalofMechanicalEngineering,2014, 50(18): 7-13. [11]SuZuqiang,TangBaoping,MaJinghua,etal.FaultDiagnosisMethodBasedonIncrementalEnhancedSupervisedLocallyLinearEmbeddingandAdaptiveNearestNeighborClassifier[J].Measurement,2014, 48: 136-148. [12]WangYi,XuGuanghua,LiangLin,etal.DetectionofWeakTransientSignalsBasedonWaveletPacketTransformandManifoldLearningforRollingElementBearingFaultDiagnosis[J].MechanicalSystemsandSignalProcessing,2015, 54: 259-276. [13]BelkinM,NiyogiP.LaplacianEigenmapsforDimensionalityReductionandDataRepresentation[J].NeuralComputation, 2003, 15(6): 1373-1396. [14]BelkinM,NiyogiPi.Semi-supervisedLearningonRiemannianManifolds[J].MachineLearning,2004, 56(1/3): 209-239. [15]KouroptevaO,OkunO,HadidA,etal.BeyondLocallyLinearEmbeddingAlgorithm,MVG-01-2002[R].Oulu,F(xiàn)inland:UniversityofOulu, 2002. [16]HeQingbo.Time-frequencyManifoldforNonlinearFeatureExtractioninMachineryFaultDiagnosis[J].MechanicalSystemsandSignalProcessing, 2013, 35(1/2): 200-218. [17]LoparoKA.BearingsVibrationDataSet[DB/OL].Cleveland,Ohio:CaseWesternReserveUniversity. [2014-10-28].http://Csegroups.Case.Edu/Bearingdatacenter/Home. [18]VibroacousticGearSignatureswithTime-FrequencySpectrograms[DB/OL]. [2015-05-09].http://www.ulb.ac.be/polytech/laborulb/gearvi/gearjtfa.htm. (編輯張洋) 收稿日期:2015-09-05 基金項目:國家自然科學基金資助項目(71171154);湖北省自然科學基金資助項目(2015CFB698);湖北省科技支撐計劃資助項目(2014BAA032,2015BAA063) 中圖分類號:TP206;TP391.4 DOI:10.3969/j.issn.1004-132X.2016.14.012 作者簡介:江麗,女,1980年生。武漢理工大學機電工程學院助理研究員、博士。主要研究方向為機械設備狀態(tài)監(jiān)測與故障診斷、模式識別。發(fā)表論文3篇。郭順生(通信作者),男,1963 年生。武漢理工大學機電工程學院教授、博士研究生導師。 Fault Diagnosis Based on Semi-supervised Laplacian Eigenmaps Jiang LiGuo Shunsheng Wuhan University of Technology,Wuhan,430070 Abstract:Aiming at solving the problems of insufficient labeled fault samples and high-dimensional nonlinear fault data, a fault diagnosis model was proposed based on semi-supervised LE algorithm. The model directly extracted the low-dimensional manifold features from the raw high-dimensional vibration signals, by implementing LE algorithm. The features were fed into semi-supervised classifier based on LE algorithm. Thereby, the operating conditions of mechanical equipment were recognized. Compared with the traditional methods, the model is able to obviously improve fault recognition performance of rolling bearings and gears. Key words:fault diagnosis;feature extraction;manifold learning;semi-supervised Laplacian eigenmap(LE)