(東北電力大學能源與動力工程學院,吉林 吉林 132012)
現(xiàn)代汽輪機轉子的結構越來越復雜,出現(xiàn)故障的原因也日趨多樣性,這給設備的故障診斷帶來了困難[1-2]。汽輪機轉子的故障診斷過程大體可以分為3個步驟:①故障信號的采集及處理;②故障特征的提取;③模式識別。其中特征提取是故障診斷的關鍵步驟。因而尋找一種有效可行的故障特征提取方法對于順利進行故障模式識別分類和完成設備的故障診斷具有重要的意義和價值。
針對高維非線性的故障數(shù)據(jù)空間,利用線性局部切空間排列(linear local tangent space alignment,LLTSA算法對數(shù)據(jù)進行特征提取[3-4],數(shù)據(jù)降維前后的內在屬性沒有任何變化。LLTSA算法保持了非線性流形結構的低維內在本質特征,比傳統(tǒng)的流形學習算法具有更好的分類識別能力[5-6]。
極限學習機(extreme learning machine,ELM)是近年來由Huang G B提出的一種單隱含層前向反饋神經(jīng)網(wǎng)絡(single-hidden layer feed-forward neural network,SLFN)分類器[7-10],這種分類器相對于BP神經(jīng)網(wǎng)絡(BP neural network,BPNN)、支持向量機(support vector machine,SVM)等分類器[11-12],不僅具有良好的泛化性,也極大地提高了前向神經(jīng)網(wǎng)絡的學習速度和效率。本文采用了“故障信號-時域與頻域的融合-LLTSA-ELM”的診斷模型,該模型實現(xiàn)了故障診斷的全程自動化、快速化和準確化。
LLTSA是在LTSA的基礎上發(fā)展起來的,算法增加了主成分分析(principal component analysis,PCA)過程,通過無限靠近每一樣本點的空間來構建低維的線性局部空間,然后利用局部切空間排列求出整體低維嵌入坐標。
故障樣本個數(shù)為n,故障樣本維數(shù)為m,XORG為含噪聲故障樣本集,LLTSA算法的目的是找到高維樣本集XORG在Rd空間的數(shù)據(jù)集Y,其表達式為:
Y=ATXORGGn
(1)
式中:Gn=E-iiT/n為中心矩陣,E為單位矩陣,i為所有元素為1的n維列向量;Y為XORG潛在的d維非線性流形。
線性局部切空間排列算法步驟如下。
② 計算鄰域。通過K-近鄰(KNN)方法搜尋數(shù)據(jù)點xi的鄰域,首先應用歐幾里得原理得出所有數(shù)據(jù)點的距離矩陣,再通過分析距離矩陣尋找數(shù)據(jù)點xi的k個同類近似點xj。
③ 獲取局部信息。計算XiGk(其中,Xi=[xi1,…,xik])的d個最大特征值對應d個特征矢量構成的矩陣Fi,Gk=E-iiT/k。
④ 排列矩陣的構造。
通過局部累加構造矩陣A為:
(2)
⑤ 映射的計算。
XGnAGnXTβ=λXGnXTβ
(3)
與特征值λ1,λ2,…,λd(λ1<λ2<…<λd)對應的特征解為β1,β2,…,βd,則BLLTSA=[β1,β2,…,βd]。轉換矩陣B=BPCA×BLLTSA,則X→Y=BTXORGGn
對于N個不同的訓練樣本,其集合表示為N={(Xi,Yi)|i=1,2,…,N;Xi∈Rn;Yi∈Rm},具有隱藏節(jié)點數(shù)M且激活函數(shù)為f(x)的SLFN模型為:
(4)
式中:αi為連接第i個隱藏層節(jié)點的輸出權值;βi為連接第i隱藏層節(jié)點的輸入權值;bi為第i個隱藏節(jié)點的偏置;oj為第j個樣本的輸出值。
假設標準單隱層前饋神經(jīng)網(wǎng)絡能夠零誤差逼近N個樣本,即:
(5)
由αi、βi、bi可得:
(6)
Gα=T
(7)
式中:G為神經(jīng)網(wǎng)絡的隱層輸出矩陣。
G中的第i列定義為第i個隱層節(jié)點對應的輸入X1,X2,…,XN的輸出向量,其表達式為:
(8)
輸出權值可通過最小范數(shù)的最小二乘解來獲得,即:
α=G+T
(9)
式中:G+為隱層輸出矩陣G的Moore-Penrose廣義逆。
極限學習機的基本思路是:網(wǎng)絡參數(shù)并不需要全部進行設定,輸入權值β和隱含層節(jié)點偏置值b在計算過程中可隨機給定,這大大提高了收斂速度。通過式(9)使輸出權值得到了最小的訓練誤差,自身的最小范數(shù)也得到了最優(yōu)的泛化性能,最終計算結果使得范數(shù)的最小二乘解是唯一的,從而使算法不會產生局部最優(yōu)解。
轉子振動試驗臺可以模擬振動信號,通過人為措施制造一些故障來模擬汽輪機轉子的振動故障。試驗裝置包括轉子ZXP- 4A、振動試驗臺、數(shù)字測振儀主機、信號采集器、電渦流傳感器、計算機以及信號處理器DASP等。模擬的故障分為3類,包括不對中、不對中加松動、轉子質量不平衡。各種故障模擬的方法具體如下:不對中故障是將聯(lián)軸器換成硬質橡膠管,并在軸末端的軸承座底墊上1~2個墊片,人為地將軸承座扭轉一定角度實現(xiàn);不對中加松動故障則是在不對中的試驗中同時加入軸承座松動來實現(xiàn);不平衡故障通過在臨近電渦流傳感器的轉子轉盤上旋入3~5個螺絲釘。
故障信號的原始振動頻率為1 000 Hz,采取樣本點數(shù)為8 000點,試驗中,3種轉子轉速分別為1 000 r/min、1 150 r/min和1 200 r/min。在每個轉速下,每種故障采取10組樣本數(shù)據(jù)。
故障診斷過程中,為了全面刻畫轉子系統(tǒng)不同類型的故障特性,本文將采用混合域特征融合方法(時域和頻域的融合)來描述轉子不同故障的信息,從而解決汽輪機故障診斷方法的通用性問題。從樣本信號中選取11個時域特征和3個頻域特征來構造14維特征空間,用絕對均值、均方根值、方根幅值、歪度、峰值指標、裕度指標、峭度指標、最大峰值、方差、峭度、脈沖指標代表11個時域參數(shù),將平均頻率、譜峰穩(wěn)定指數(shù)、相對功率譜能量作為頻域統(tǒng)計指標。在試驗數(shù)據(jù)中,截取長度為t的振動信號,利用相空間重構方法將數(shù)據(jù)劃分為N個子數(shù)據(jù)量,然后再分別算出每個子數(shù)據(jù)量的14維特征值,這樣就構造了N×14的高維特征矩陣,N代表樣本點數(shù),高維特征空間包括了14種描述機械振動特性的特征參數(shù)。
3種降維方法的特征分布圖如圖1所示。
圖1 3種降維方法的特征分布圖
分別用LLE、LTSA、LLTSA對高維矩陣X降維,得到低維空間Y,然后投影到可視空間來完成視覺故障分類。設定近鄰點數(shù)K=15,投影維數(shù)d=3。在分析過程中,LLE的分類效果最差,3種故障樣本有交疊的部分,而且不同故障的類型距離也非常近,不能區(qū)分故障。LTSA的分類效果相對于LLE要好一些,但是不對中和不平衡故障樣本也有交疊的部分,不同故障類型距離也較近,不太容易進行故障分類。LLTSA效果較好,不同故障點沒有交疊的部分,而且也相對距離較遠,容易分辨不同類型的故障。
為了進一步說明LLTSA的性能,每類故障選用160個訓練樣本,80個測試樣本,選用支持向量機作為分類器對結果進行分析、通過反復試驗,確定高斯函數(shù)為核函數(shù),確定核半徑σ=0.99和誤差懲罰參數(shù)λ=100為最優(yōu)參數(shù),計算機配置為Core(TM)2,CPU 2.20 Hz,內存2 GHz。不同特征提取方法比較如表1所示。從表1可以看出,每種方法的樣本訓練時間和測試時間相差不大,但是LLTSA與SVM構造的故障分類器訓練準確率和測試準確率最高,充分體現(xiàn)了LLTSA具有較高的綜合性能。
表1 不同特征提取方法比較
本文以20作為初始化隱藏節(jié)點個數(shù),然后以5為單位依次遞加,選取Sin、Sigmoidal、Radial basis作為激活函數(shù)進行試驗。測試準確率變化曲線如圖2所示。
圖2 測試準確率變化曲線
從圖2可以看出,隨著隱藏節(jié)點數(shù)的增加,各種激活函數(shù)的測試準確率也隨之增加,增加到一定程度后都保持穩(wěn)定。經(jīng)綜合考慮,我們確定Sin函數(shù)為ELM的激活函數(shù),最優(yōu)隱藏節(jié)點數(shù)確定為70。BP網(wǎng)絡模型選用運算速度最快、最穩(wěn)健的Levenberg-Marquardt 算法,確定最佳隱藏節(jié)點數(shù)為130。每類故障依然選用160個訓練樣本和80個測試樣本。
不同診斷模型比較如表2所示。
表2 不同診斷模型比較
從表2可以看出,在訓練速度方面,由于ELM自動調整網(wǎng)絡的輸入權值以及隱元的偏置,LLTSA和ELM構造的故障分類器所用的訓練時間非常短;而SVM和BP網(wǎng)絡的訓練過程需要反復迭代來確定參數(shù),所以耗時較長;ELM的測試速度也要好于其他兩者,訓練和測試準確率也非常高,說明該模型的泛化能力更好。
本文將流形學習方法應用到轉子故障診斷中,提出了一種有效的線性局部切空間排列算法(LLTSA)。將LLTSA的維數(shù)化簡效果與LTSA、LLE作對比,表明了LLTSA算法成功提取了高維非線性數(shù)據(jù)的低維流形的特征,明顯改善了故障模式識別的分類效果。這3種流形算法維數(shù)化簡后的故障診斷精度表明,無論是在提取低維流形特征方面,還是在故障診斷率方面,LLTSA的分類性能都優(yōu)于LTSA、LLE。
不同的激活函數(shù)會影響ELM的性能,本文使用了Sin、Sigmoidal、Radial basis作為激活函數(shù)進行試驗,說明了Sin函數(shù)和其他激活函數(shù)相比,具有更好的測試分類效果。通過LLTSA+ELM和其他兩種故障診斷模型對比,充分證明了ELM在訓練速度、測試速度、準確率方面的優(yōu)越性。
[1] 簡小剛,張艷偉,馮躍,等.工程機械故障診斷技術的研究現(xiàn)狀與發(fā)展趨勢[J].中國工程機械學報,2005,3(4):446-449.
[2] 程加堂,艾莉,徐紹坤.汽輪機轉子故障診斷中的應用[J].自動化儀表,2012,33(11):13-14.
[3] Seung H S,Daniel D L.The manifold ways of perception[J].Science,2000,29(55):2268-2269.
[4] Kouropteva O,Okun O,Pietikainen M.Supervised locally linear embedding algorithm for pattern recognition[J].Pattern Recognition and Image Analysis,2003,26(9):386-394.
[5] Liu X M,Yin J W,Feng Z L,et al.Orthogonal neighborhood preserving embedding for face recognition[C]//2007 IEEE International Conference on Image Processing,New York,USA:IEEE,2007:133-136.
[6] 薛廣鑫,陳軍,蔣能飛.基于局部線性嵌入和云神經(jīng)網(wǎng)絡的轉子故障診斷方法[J].振動與沖擊,2012,31(23):100-103.
[7] Huang G B,Babri H A.Upper bounds on the number of hidden neurons in feed forward networks with arbitrary bounded nonlinear activation functions[J].IEEE Transaction on Neural Networks,1998,9(1):224-229.
[8] Law Y W,Etalle S,Hartel P H.Key Management with group-wise pre-deployed keying and secret sharing pre-de-ployed keying[R].Technical Report TR-CTIT- 02-25,University of Twente,2002.
[9] Eschenauer L,Gligor V D.A Key management scheme for distributed sensor networks[C]//Proceeding of ACM Conference on Computer and Communication Security,2002:41-47.
[10]常玉清,李玉朝,王福利.基于極限學習機的生化過程軟測量建模[J].系統(tǒng)仿真學報,2007,19(23):5587-5590.
[11]萬鵬,王紅軍,徐小力.局部切空間排列和支持向量機的故障診斷模型[J].儀器儀表學報,2012,33(12):2790-2795.
[12]王忠峰,湯偉,黃俊梅.BP神經(jīng)網(wǎng)絡在軸承故障診斷中的研究與應用[J].化工自動化儀表,2010,38(3):327-331.