胡常安,袁德強,王 彭,杜文波
(1.中國測試技術(shù)研究院,成都610021;2.蘭州理工大學(xué) 機電工程學(xué)院,蘭州730050)
增量LTSA算法在轉(zhuǎn)子故障數(shù)據(jù)集降維中的應(yīng)用
胡常安1,袁德強2,王 彭1,杜文波1
(1.中國測試技術(shù)研究院,成都610021;2.蘭州理工大學(xué) 機電工程學(xué)院,蘭州730050)
針對傳統(tǒng)流形學(xué)習(xí)算法不具有增量學(xué)習(xí)能力;故難以處理新增數(shù)據(jù)與大規(guī)模海量數(shù)據(jù)集的問題,由此,提出一種用于機械轉(zhuǎn)子故障數(shù)據(jù)集降維的增量局部切空間的排列算法(ILTSA)。該算法首先采用局部切空間排列算法對原始訓(xùn)練樣本進行降維處理,獲得其低維流形結(jié)構(gòu),然后通過增量學(xué)習(xí)算法對新增樣本進行處理。得到所有數(shù)據(jù)的低維嵌入坐標,最后通過轉(zhuǎn)子故障數(shù)據(jù)集驗證了該方法的有效性,取得了良好的分類效果,有利于實時動態(tài)故障監(jiān)測與診斷。
振動與波;故障診斷;人工智能理論;轉(zhuǎn)子;局部切空間排列算法
流形學(xué)習(xí)作為一種非線性數(shù)據(jù)降維方法,能夠發(fā)現(xiàn)高維非線性樣本數(shù)據(jù)嵌入在高維數(shù)據(jù)空間中的低維流形結(jié)構(gòu)。該算法對訓(xùn)練樣本進行一次性學(xué)習(xí)而獲得數(shù)據(jù)分類模型,新增數(shù)據(jù)時需對所有數(shù)據(jù)重新學(xué)習(xí)[1]。當(dāng)需實時監(jiān)測時數(shù)據(jù)不停的輸送進來,重新學(xué)習(xí)導(dǎo)致對算法的要求極高。數(shù)據(jù)量十分龐大時,該算法只能采用分批處理的方法對數(shù)據(jù)進行處理。機械轉(zhuǎn)子系統(tǒng)在運行過程中一旦發(fā)生故障,其振動數(shù)據(jù)表現(xiàn)出的非平穩(wěn)、非線性特性將隨著故障程度的加深而越加強烈。將流形學(xué)習(xí)用于高維非線性故障數(shù)據(jù)樣本的學(xué)習(xí),可有效發(fā)現(xiàn)其內(nèi)在本質(zhì)特征,便于故障的辨識與程度分析。萬鵬等人[2]利用流形學(xué)習(xí)算法與支持向量機相結(jié)合,提高了機電系統(tǒng)故障診斷精度。楊慶等人[3]將流形學(xué)習(xí)算法用于軸承早期故障診斷,使得提取的故障特征敏感性更好,提高了模式識別能力。
但是,監(jiān)測系統(tǒng)得到的信息嵌入在高維、大量的數(shù)據(jù)中,流形學(xué)習(xí)算法難以從高維數(shù)據(jù)流及大規(guī)模海量數(shù)據(jù)集中獲得有價值的信息[4],楊慶等人[5]提出了帶標志點的增量流形學(xué)習(xí)算法,保證了軸承不同狀態(tài)樣本間較高的類別可分性。朱明旱等人[6]提出了基于正交迭代的增量LLE算法,能有效的實現(xiàn)增量處理功能。以上都是采用的單點增值處理方法,該方法在處理數(shù)據(jù)時效率低,實時性差,容易造成數(shù)據(jù)不能及時處理,引起數(shù)據(jù)堆積。
文中采用一種基于增量流形學(xué)習(xí)的故障診斷方法,該方法通過流形學(xué)習(xí)算法對訓(xùn)練數(shù)據(jù)進行降維處理,得到初始流形結(jié)構(gòu),然后利用增量學(xué)習(xí)方法對新增數(shù)據(jù)進行狀態(tài)分析,從而實現(xiàn)在線狀態(tài)監(jiān)測。最后通過對轉(zhuǎn)子訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的計算分析,驗證了該方法能有效獲得設(shè)備的實時運行狀態(tài)及相關(guān)信息。
1.1 局部切空間排列算法(LTSA)
由于訓(xùn)練樣本數(shù)據(jù)通常比較少,會出現(xiàn)數(shù)據(jù)不完整現(xiàn)象,即數(shù)據(jù)集存在“空洞現(xiàn)象”,局部切空間排列算法能很好的處理“空洞”數(shù)據(jù),能獲得較好的嵌入效果[7]。因此,本文采用LTSA算法對轉(zhuǎn)子高維故障數(shù)據(jù)集進行降維處理。
采用LTSA算法對訓(xùn)練數(shù)據(jù)進行降維處理時,選取鄰域、局部坐標計算、低維嵌入坐標計算的時間復(fù)雜度與空間復(fù)雜度將隨著訓(xùn)練數(shù)據(jù)的增加而成倍增長,該算法對訓(xùn)練數(shù)據(jù)進行批量處理非常耗時。在線監(jiān)測將不斷產(chǎn)生新數(shù)據(jù),如何對新增數(shù)據(jù)與原始數(shù)據(jù)進行合理處理來達到既能很好的分析設(shè)備當(dāng)前的狀態(tài),又能很好的降低數(shù)據(jù)處理的時間復(fù)雜度與空間復(fù)雜度將是需要研究的問題。
1.2 增量流形學(xué)習(xí)機制
故障監(jiān)測與診斷過程中包含數(shù)據(jù)訓(xùn)練學(xué)習(xí)階段和狀態(tài)識別階段。在訓(xùn)練學(xué)習(xí)階段,通過對訓(xùn)練數(shù)據(jù)進行學(xué)習(xí),得到用于模式辨識的低維嵌入流形結(jié)構(gòu),這種方式屬于靜態(tài)處理模式。當(dāng)運行設(shè)備的信息數(shù)據(jù)源源不斷的產(chǎn)生且需要及時分析處理時,面臨如何有效處理新增數(shù)據(jù)的問題,為此學(xué)者提出了各種用于新增數(shù)據(jù)處理的方法,即動態(tài)增量學(xué)習(xí)方法[8]。該方法能較好的達到實時狀態(tài)監(jiān)測與故障診斷的要求。
1.3 特征生成
特征生成主要是為后續(xù)的特征選擇以及特征壓縮(降維)服務(wù),常通過對消噪濾波后的數(shù)據(jù)進行線性處理來得到原始特征,如時域分析方法、頻域分析方法[9]、小波分析方法[10]等。在特征生成過程中,若數(shù)據(jù)呈現(xiàn)出非線性特性,則可采用滑動時間窗進行預(yù)處理,將消噪濾波后的數(shù)據(jù)分割成長度相同的數(shù)據(jù)段,對每一段數(shù)據(jù)分別進行特征統(tǒng)計分析,構(gòu)造出高維特征向量。對機械設(shè)備信號數(shù)據(jù)進行特征生成,既可以去除對故障識別不相干的噪聲特征,又可以簡化后續(xù)處理的復(fù)雜度。
1.4 增量局部切空間排列算法(ILTSA)
LTSA根據(jù)存在交叉片段的局部鄰域中的特征信息來構(gòu)造特征數(shù)據(jù)集的整體流形結(jié)構(gòu),它使高維嵌入空間與其內(nèi)在低維流形空間中的近鄰點保持著相同的近鄰關(guān)系。任何數(shù)據(jù)點與它的近鄰點具有“平移、旋轉(zhuǎn)及伸縮”不變性,當(dāng)觀測數(shù)據(jù)不斷增多時,使用平移、旋轉(zhuǎn)以及伸縮變換對存在于高維空間的數(shù)據(jù)進行處理,使其得到的低維全局固有結(jié)構(gòu)更加真實,這就是增量學(xué)習(xí)。其方法是:設(shè)數(shù)據(jù)集X={x1,x2,...,xn∈RD}作為已經(jīng)通過LTSA學(xué)習(xí)獲得了低維表示的訓(xùn)練數(shù)據(jù)集。設(shè)新增數(shù)據(jù)集Y={xn+1,xn+2,...,xn+m∈RD},以便把新增數(shù)據(jù)的有用信息合理的融入到已有的低維模型結(jié)構(gòu)中去。具體步驟如下:
step 1:對原始訓(xùn)練數(shù)據(jù)集X進行LTSA非線性降維學(xué)習(xí),得到其低維流形嵌入坐標ZX={z1,z2,…,zn∈Rd},d表示原始訓(xùn)練數(shù)據(jù)集X的本征維數(shù)。從新增數(shù)據(jù)集Y中找出k近鄰全在X中的數(shù)據(jù)點xi放入X中,并求取這些點的正交投影其中j=1,2,…,k;xij為xi的第j個近鄰點,xi為k個鄰域點的均值,Qi是在xi的鄰域矩陣中選擇的一組正交基,通過對加入X中的新增數(shù)據(jù)點進行全局坐標重構(gòu),最后獲得其低維嵌入坐標ZY→X={zn+1,zn+2,…,zn+b∈Rd},其中b表示Y中數(shù)據(jù)的k近鄰全在X中的數(shù)據(jù)點數(shù);
step 2:從訓(xùn)練數(shù)據(jù)集X,Y中選出k鄰域既包含X中的點也包含Y中的點的數(shù)據(jù)點,運用LTSA降維算法求出這些點對應(yīng)的正交投影,從而獲得全局坐標,最終得出它們的低維嵌入坐標ZXY={zn+b+1,zn+b+2,…,zn+b+p∈Rd},p表示k鄰域?qū)儆趦蓚€集合的數(shù)據(jù)點數(shù);
step 3:用LTSA算法對新增數(shù)據(jù)集Y進行降維處理,得到的低維坐標ZY={y1,y2,…,ym∈Rd},設(shè)集合Y中k近鄰中既存在X中的點也存在Y中的點的d維表示為{yB1,yB2,…,yBq∈Rd},其中Bq表示集合Y中屬于邊界點的數(shù)量;
最后,積極有效地進行反對歷史虛無主義思潮教育。近年來,每逢抗戰(zhàn)勝利紀念日等重要時間節(jié)點,片面抗戰(zhàn)論、唯武器論等早在抗戰(zhàn)時期就存在并被證明為錯誤的論調(diào)不時出現(xiàn),起了懷疑和否定黨的歷史的作用。對于這一歷史虛無主義思潮在抗戰(zhàn)問題上的表現(xiàn),各種紀念活動和紀念文章中對黨在抗戰(zhàn)中歷史作用進行了反復(fù)闡述。
step 4:計算新增數(shù)據(jù)集Y的平移、旋轉(zhuǎn)及伸縮變換:ynew=a(Ty+u),其中T為旋轉(zhuǎn)變換矩陣,u是平移向量,a是伸縮因子,要使下式最小:
修正下面中公式的min排列
其中Ti=[τi1,τi2,…,τik],Li是待定映射矩陣。
要使Ei最小,即使Ei=Ti(I-k-1eeT)LiΘi最小。
LTSA算法的各階段采用順序結(jié)構(gòu)執(zhí)行時,計算每一個數(shù)據(jù)點的k近鄰,如果存在n個數(shù)據(jù)需要處理,即從高維數(shù)據(jù)到低維坐標的計算時間復(fù)雜度為O(d2n),d為數(shù)據(jù)集的本征維數(shù)。文中提出的動態(tài)LTSA增量流形學(xué)習(xí)把原始訓(xùn)練數(shù)據(jù)集與現(xiàn)有新增數(shù)據(jù)集分別進行動態(tài)流形學(xué)習(xí),從而發(fā)現(xiàn)整體數(shù)據(jù)集的低維嵌入坐標。最終的計算復(fù)雜度遠小于傳統(tǒng)流形學(xué)習(xí)方法,其時間復(fù)雜度為
2.1 算法的設(shè)計流程
本實驗以轉(zhuǎn)子實驗臺采集的振動信號數(shù)據(jù)作為原始數(shù)據(jù)進行分析。其中轉(zhuǎn)子試驗臺如圖1所示。
圖1 轉(zhuǎn)子試驗臺
首先在試驗臺上模擬轉(zhuǎn)子的4種運行狀態(tài)(轉(zhuǎn)子正常狀態(tài)、不平衡狀態(tài)、不對中狀態(tài),碰磨狀態(tài)),然后分別采用電渦流傳感器、放大器、電路轉(zhuǎn)換器以及采集卡在雙跨轉(zhuǎn)子轉(zhuǎn)速為3 000 r/min,采樣頻率為5 000 Hz時對轉(zhuǎn)子振動信號進行采集,對原始信號數(shù)據(jù)進行消噪濾波處理。得到如圖2所示的四種狀態(tài)下消噪后的波形圖,四種狀態(tài)下波形圖略有區(qū)別,正常狀態(tài)下波形圖相對平穩(wěn),不平衡狀態(tài)下波形有緊鄰相同幅度二次雜波,不對著中狀態(tài)下有小幅度二次雜波且整個波形幅值減小明顯,碰磨狀態(tài)下也存在小幅二次雜波。
圖2 四種不同狀態(tài)的消噪后波形圖
對12個通道采集的濾波后的數(shù)據(jù)進行特征生成。采用14個時域特征參數(shù)(均值、均方根幅值、標準差、方差、絕對均值、偏度、峭度、峰峰值、峰值指標、裕度指標、波形指標、C因素、均根方值、L因素等)來描述信號的特征信息并構(gòu)造訓(xùn)練樣本集。
流程圖如圖3所示,首先將采集到的轉(zhuǎn)子4種狀態(tài)下的原始數(shù)據(jù)分成兩部分,分別進行濾波消躁處理。第一部分數(shù)據(jù)用于訓(xùn)練;第二部分數(shù)據(jù)定為新增數(shù)據(jù)集,用于增量式流形學(xué)習(xí)中。對4種狀態(tài)的訓(xùn)練數(shù)據(jù)集進行特征生成得到時域特征。通過對所有狀態(tài)的統(tǒng)計特征數(shù)據(jù)進行LTSA降維處理,獲得訓(xùn)練數(shù)據(jù)的全局坐標矩陣與低維嵌入坐標。同理,對新增數(shù)據(jù)也進行特征生成獲得其14個時域特征,將獲得的特征數(shù)據(jù)與訓(xùn)練數(shù)據(jù)進行k近鄰計算分析,達到對訓(xùn)練模型的修正與完善和對新增數(shù)據(jù)信息的及時采納與補充,實現(xiàn)信息量越來越完整,越來越準確的目的。
圖3 增量式LTSA降維算法流程圖
2.2 仿真結(jié)果及分析
圖4是訓(xùn)練數(shù)據(jù)時域統(tǒng)計特征通過LTSA降維處理獲得的四類低維特征數(shù)據(jù),其中“○”代表正常特征數(shù)據(jù)點,“◇”代表不平衡數(shù)據(jù)點,“*”代表不對中數(shù)據(jù)點,“+”代表碰磨數(shù)據(jù)點,可以看到通過流形學(xué)習(xí)LTSA的降維處理,獲得的不同類別的低維特征數(shù)據(jù)能很好的得到分離。圖6是在訓(xùn)練數(shù)據(jù)的基礎(chǔ)上增加了10個樣本點的降維效果,可以看出新增數(shù)據(jù)并沒有影響數(shù)據(jù)的分類。在新增數(shù)據(jù)的降維過程中,不僅將新增點的特征信息融入到了原來的訓(xùn)練模型中,而且完善了原始數(shù)據(jù)的分類模型,增強了模型的魯棒性。圖6、7分別是新增20個和新增40個特征數(shù)據(jù)的降維結(jié)果,分類效果略低于前面兩種情況,但幾種類型的數(shù)據(jù)仍然得到了較好的分離。類間距略大于前兩種情況,類內(nèi)距略小于前兩種情況。為了進一步說明降維效果,文中采用聚類方法對降維后數(shù)據(jù)進行處理如表1所示。通過表1可以看出LLTSA降維后的數(shù)據(jù)所得的數(shù)據(jù)具有更好的聚類性。
表1 數(shù)據(jù)聚類結(jié)果
圖4 原始LTSA對四類數(shù)據(jù)的降維效果
從圖中可以看出增量LTSA算法對新增數(shù)據(jù)有較好的識別能力。隨機以一次數(shù)據(jù)作為分析準則,盡管數(shù)據(jù)有所增加,但各類數(shù)據(jù)的內(nèi)類聚集度和識別度都較高。圖中顯示訓(xùn)練樣本的低維嵌入坐標與新增數(shù)據(jù)的低維嵌入坐標變化不大,原因在于新增樣本來源于原始類別基礎(chǔ)上,且其低維坐標變化范圍控制在訓(xùn)練樣本的低維嵌入坐標內(nèi)。圖像略微的變化是由于新增樣本改變了原始訓(xùn)練數(shù)據(jù)中部分數(shù)據(jù)的鄰域。通過對比發(fā)現(xiàn),新增數(shù)據(jù)量越大,其變化越明顯。因此,在增量處理的過程中需要注意的是:在保持模式識別精度的情況下,盡可能擴大新增數(shù)據(jù)的容量,這樣更有利于大數(shù)據(jù)的處理和滿足智能診斷的要求。
圖5 新增10個樣本的降維效果
圖6 新增20個樣本的降維效果
圖7 新增40個樣本的降維效果
針對流形學(xué)習(xí)在新增數(shù)據(jù)和海量數(shù)據(jù)處理方面存在的不足,本文提出了一種增量學(xué)習(xí)算法。在此基礎(chǔ)上詳細介紹了幾種最新的增量學(xué)習(xí)算法并受其啟發(fā),提出了增量LTSA流形學(xué)習(xí)算法。將該方法用于轉(zhuǎn)子實驗臺4種不同狀態(tài)的時域統(tǒng)計特征的學(xué)習(xí)中,發(fā)現(xiàn)該算法在保證降維精度的同時能較好的將新增數(shù)據(jù)的特征信息融入到已有分類模型中。為實時狀態(tài)監(jiān)測與智能診斷提供了一種可行性方法。
[1]Jia P,Yin J,Huang X,et al.Incremental laplacian eigenmaps by preserving adjacent information between data points[J].Pattern Recognition Letters,2009,30(16): 1457-1463.
[2]萬鵬,王紅軍,徐小力.局部切空間排列和支持向量機的故障診斷模型[J].儀器儀表學(xué)報,2013,33(12):2789-2795.
[3]楊慶,陳桂明,童興民,等.增量式局部切空間排列算法在滾動軸承故障診斷中的應(yīng)用[J].機械工程學(xué)報,2012,48(5):81-86.
[4]Law M H C,Jain A K.Incremental nonlinear dimensionality reduction by manifold learning[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2006, 28(3):377-391.
[5]楊慶,陳桂明,江良洲,等.帶標志點的LTSA算法及其在軸承故障診斷中的應(yīng)用[J].振動工程學(xué)報,2013,25 (6):732-738.
[6]朱明旱,羅大庸,易勵群,等.基于正交迭代的增量LLE算法[J].電子學(xué)報,2009,37(1):132-136.
[7]曾憲華,羅四維.動態(tài)增殖流形學(xué)習(xí)算法[J].計算機研究與發(fā)展,2007,44(9):1462-1468.
[8]李文華.改進的線性局部切空間排列算法[J].計算機應(yīng)用,2011,31(001):247-249.
[9]唐新安,謝志明,王哲,等.風(fēng)力機齒輪箱故障診斷[J].噪聲與振動控制,2007,2(1):120-124.
[10]花漢兵.基于小波包的振動信號去噪應(yīng)用與研究[J].噪聲與振動控制,2007,12(6):19-21.
Application of Incremental Local Tangent SpaceAlignment Algorithm to Dimension Reduction for Rotor Failure Data Set
HU Chang-an1,YUAN De-qiang2,WANG Peng1,DU Wen-bo1
(1.National Institute of Measurement and Testing Technology,Chengdu 610021,China; 2.Lanzhou University of Technology,Lanzhou 730050,China)
The traditional learning algorithm does not have incremental learning ability,so it is unlikely to deal with additional new data and large data sets.In this paper,an incremental local tangent space alignment(LTSA)algorithm for mechanical rotor fault diagnosis was put forward.In this method,the LTSA algorithm was used for dimension reduction of the original training samples,and the corresponding low-dimension configuration was obtained.Then,using the incremental learning algorithm,the additional new samples were processed,and the embedded low-dimensional coordinates of the data were obtained.Finally,the rotor fault datasets verified the feasibility of the method,and a good classification effect was obtained.
vibration and wave;fault diagnosis;artificial intelligence;rotor;local tangent space alignment(LTSA) algorithm
TB53;TP206+.3;TP18;TN911.7
:A
:10.3969/j.issn.1006-1335.2015.01.047
1006-1355(2015)01-0230-05
2014-06-19
胡常安(1986-),男,山東人,碩士,主要從事檢測校準、無損檢測、故障診斷研究。E-mail:ajitaiajitai@163.com