劉海瑞,武憲威,李 鵬,錢征華*,李 錕
(1.南京航空航天大學(xué) 航空航天結(jié)構(gòu)力學(xué)及控制全國重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210016;2.中國航發(fā)四川燃?xì)鉁u輪研究院,四川 綿陽 621703)
滾動(dòng)軸承作為航空發(fā)動(dòng)機(jī)的重要零部件之一[1],在發(fā)動(dòng)機(jī)工作過程中發(fā)揮著至關(guān)重要的作用,它的工作性能會(huì)對(duì)發(fā)動(dòng)機(jī)的可靠性產(chǎn)生直接影響。如果航空發(fā)動(dòng)機(jī)軸承出現(xiàn)故障不能及時(shí)被發(fā)現(xiàn)和處理,將引起嚴(yán)重的后果,造成巨大的損失。因此,對(duì)滾動(dòng)軸承的運(yùn)行狀態(tài)和健康程度進(jìn)行實(shí)時(shí)精準(zhǔn)監(jiān)控[2],并對(duì)其可能出現(xiàn)的故障進(jìn)行精準(zhǔn)的預(yù)測(cè),對(duì)航空發(fā)動(dòng)機(jī)的安全至關(guān)重要[3]。
支持向量機(jī)(Support Vector Machine,SVM)最早由Vapnik提出,其核心思想是通過使用核函數(shù)對(duì)坐標(biāo)進(jìn)行變換,使低維線性不可分問題轉(zhuǎn)化為高維線性可分問題,然后在高維空間中構(gòu)造出超平面實(shí)現(xiàn)非線性分類和回歸。由于其具有最小化結(jié)構(gòu)風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)等優(yōu)點(diǎn),在處理軸承狀態(tài)監(jiān)測(cè)等小樣本數(shù)據(jù)問題時(shí),泛化能力比人工神經(jīng)網(wǎng)絡(luò)更強(qiáng)[4],因此在機(jī)械狀態(tài)監(jiān)測(cè)與故障機(jī)器識(shí)別中得到了廣泛應(yīng)用[5-6]。為解決SVM在求解對(duì)偶問題時(shí)計(jì)算過程繁冗、效率較低等問題[7],Suykens等[8]提出了最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)方法,將復(fù)雜的二次規(guī)劃問題轉(zhuǎn)變?yōu)榫€性方程組的求解問題,使計(jì)算效率極大地提高。
然而,SVM的性能受核函數(shù)參數(shù)和懲罰因子的影響較大,如何在使用過程中對(duì)這兩個(gè)參數(shù)進(jìn)行恰當(dāng)?shù)倪x擇顯得尤為重要。Agasthian等[9]用布谷鳥搜索算法對(duì)SVM的懲罰因子及核函數(shù)參數(shù)進(jìn)行了優(yōu)化,構(gòu)建了用于風(fēng)力機(jī)齒輪箱故障診斷的高精度模型。譚晶晶[10]提出了彌補(bǔ)固定步長(zhǎng)缺點(diǎn)的動(dòng)態(tài)變步長(zhǎng)果蠅算法,并對(duì)支持向量機(jī)的參數(shù)進(jìn)行了優(yōu)化,使軸承故障的診斷精確度有了明顯的提高。文獻(xiàn)[11]將蟻群算法用于SVM參數(shù)優(yōu)化,使錯(cuò)誤率最小化,以提高故障診斷準(zhǔn)確率。皮駿等[12]在采用遺傳算法的同時(shí)對(duì)支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,用優(yōu)化后的模型對(duì)航空發(fā)動(dòng)機(jī)的油液磨粒進(jìn)行診斷,結(jié)果表明遺傳算法優(yōu)化的SVM精度明顯高于RBF和BP神經(jīng)網(wǎng)絡(luò)。此外,還可以將粒子群優(yōu)化(Partide Swarm Optimization,PSO)算法[13]、免疫算法[14]、量子自適應(yīng)粒子群算法[15]分別與SVM進(jìn)行結(jié)合,并應(yīng)用于航空發(fā)動(dòng)機(jī)磨損故障診斷中。
上述研究使用了各種種群算法對(duì)SVM的超參數(shù)進(jìn)行尋優(yōu),但并沒有考慮到種群迭代過程中移動(dòng)步長(zhǎng)的調(diào)整,會(huì)導(dǎo)致前期收斂緩慢,有的后期無法收斂[16],使最終結(jié)果陷入局部最優(yōu)值。針對(duì)這一問題,本文采用一種自適應(yīng)粒子群優(yōu)化(Adaptive Particle Swarm Optimization,APSO)算法對(duì)LSSVM進(jìn)行參數(shù)尋優(yōu),創(chuàng)新性地采用自適應(yīng)移動(dòng)步長(zhǎng),降低算法陷入局部最優(yōu)的可能性,提高算法的收斂性及搜索效率。在此基礎(chǔ)上,結(jié)合主成分分析法(Principal Components Analysis,PCA)對(duì)軸承磨屑數(shù)據(jù)進(jìn)行降維并提取特征值,最終通過本文的方法對(duì)軸承故障數(shù)據(jù)進(jìn)行分類,實(shí)現(xiàn)了航空發(fā)動(dòng)機(jī)軸承的故障診斷,并通過對(duì)軸承故障數(shù)據(jù)進(jìn)行回歸成功實(shí)現(xiàn)了軸承的剩余壽命預(yù)測(cè)。
LSSVM作為一種基于統(tǒng)計(jì)理論的改進(jìn)型SVM,其理論體系先進(jìn)完備,可以將二次優(yōu)化問題的解決轉(zhuǎn)化為求解線性方程組[17],從而極大地簡(jiǎn)化問題,目前已在數(shù)據(jù)回歸、模式識(shí)別、時(shí)間序列預(yù)測(cè)等方面得到成功應(yīng)用。下面簡(jiǎn)要敘述其求解過程。
對(duì)于給定訓(xùn)練集T={(x1,y1),(x2,y2),…,(xl,yl)}∈(χ×γ)l(式中:xi∈χ=Rk;yi∈γ=R;i=1,2,…,l;xi為模型的樣本輸入,yi為模型的樣本輸出),LSSVM可以通過樣本訓(xùn)練后得到函數(shù)f,通過f即可將輸入轉(zhuǎn)化為輸出,對(duì)數(shù)據(jù)進(jìn)行分類或者回歸。首先通過非線性映射x→φ將輸入轉(zhuǎn)換到高維特征空間H,然后在特征空間實(shí)現(xiàn)分類,其函數(shù)表達(dá)式可以表示為
f(x)=ωTφ(x)+b
(1)
式中:ω為超平面系數(shù);b為偏差;φ為非線性映射函數(shù)。
目標(biāo)性問題根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則,可用約束優(yōu)化問題表述為
(2)
式中:γ為正則化參數(shù);i=1,2,…,l;ei為允許的分類誤差。
構(gòu)建如下的Lagrange函數(shù)求解式(2)的約束優(yōu)化問題:
(3)
式中:αi為拉格朗日乘數(shù)。由Karush-Kuhn-Tucker(KKT)條件,可得:
(4)
綜上所述,LSSVM模型可表示為
(5)
式中:K(x,xi)為核函數(shù),用于將數(shù)據(jù)從低維空間變換到高維空間。本文采用的徑向基核函數(shù)為
(6)
式中:σ為核函數(shù)寬度。LSSVM模型在使用過程中極易受到正則化參數(shù)γ和核函數(shù)參數(shù)σ的影響,因此,建立LSSVM模型時(shí)有必要對(duì)這2個(gè)參數(shù)進(jìn)行優(yōu)化。
在對(duì)正則化參數(shù)γ和核函數(shù)參數(shù)σ進(jìn)行調(diào)整時(shí),一般使用劃分網(wǎng)格點(diǎn)進(jìn)行尋找,但這種方式的技術(shù)精度與劃分網(wǎng)格點(diǎn)的密度相關(guān),需要花費(fèi)大量的時(shí)間才能找到更好的點(diǎn)。為找到這2個(gè)參數(shù)的最佳取值,本文采用自適應(yīng)PSO進(jìn)行參數(shù)尋優(yōu)。
PSO最早由Eberhart和Kennedy共同提出[17],是一種種群智能算法,通過模擬鳥類捕食行為而設(shè)計(jì)出來。可以解釋為設(shè)n維空間中的一個(gè)優(yōu)化問題,首先生成一個(gè)初始化種群X,該種群由m個(gè)粒子{X1,X2,…,Xm}組成,每個(gè)粒子在空間中的位置為{Xi,1,Xi,2,…,Xi,n}。粒子每次通過將位置坐標(biāo)代入適應(yīng)度函數(shù)來計(jì)算此時(shí)位置的好壞。在移動(dòng)過程中,每個(gè)粒子都會(huì)記住個(gè)體自己搜索到的最佳位置,并記住整個(gè)種群搜索到的當(dāng)前最優(yōu)解,然后下一步朝著這2個(gè)最佳位置移動(dòng),移動(dòng)速度及位置的更新公式為
(7)
(8)
式中:Xi和vi分別為粒子的位置和速度;a為慣性因子;c1和c2分別為個(gè)體認(rèn)知加速度和全局認(rèn)知加速度;Pi和Pg分別為個(gè)體歷史最佳位置和全局歷史最佳位置;r1和r2為0~1之間的隨機(jī)數(shù)。
在使用PSO確定正則化參數(shù)γ和核函數(shù)參數(shù)σ的過程中,會(huì)面臨前期移動(dòng)步幅過小、收斂過慢、后期移動(dòng)步幅過大、找不到最優(yōu)值的問題,所以需要對(duì)a、c1、c2這3個(gè)參數(shù)進(jìn)行調(diào)整,本文采用一種自適應(yīng)粒子群算法[18]實(shí)現(xiàn)參數(shù)自動(dòng)調(diào)節(jié)。參數(shù)自適應(yīng)調(diào)節(jié)步驟如下所述。
① 計(jì)算每個(gè)粒子i相對(duì)于其他粒子的平均距離,即
(9)
式中:N為粒子總數(shù);D為粒子維度數(shù)。
② 選出di中最好的值db、最大距離dmax、最小距離dmin,計(jì)算出進(jìn)化因子h,
(10)
③ 根據(jù)h的值,使用圖1所示的隸屬函數(shù)判斷此刻進(jìn)化的狀態(tài)。
圖1 隸屬函數(shù)圖
④ 對(duì)慣性因子a進(jìn)行自適應(yīng)調(diào)整,即
(11)
⑤ 應(yīng)用表1對(duì)加速因子c1、c2進(jìn)行更新。
表1 加速度因子更新策略
同時(shí),為保證每一步參數(shù)變化不會(huì)太突兀,應(yīng)滿足|ci(g+1)-ci(g)|≤δ。式中:i=1,2;g為迭代次數(shù);δ定義為加速度率,根據(jù)經(jīng)驗(yàn)一般取0.05~0.1;c1與c2值應(yīng)滿足[1.5,2.5],且和小于4,若超出則歸一化,則ci=4ci/(c1+c2)?;贏PSO的LSSVM模型的整體優(yōu)化步驟如圖2所示。
圖2 基于APSO的LSSVM模型的優(yōu)化步驟
本文針對(duì)中國航發(fā)四川燃?xì)鉁u輪研究院的航空發(fā)動(dòng)機(jī)主軸三號(hào)軸承的全過程壽命試驗(yàn)滑油磨屑數(shù)據(jù),應(yīng)用本算法對(duì)軸承進(jìn)行故障診斷和剩余壽命預(yù)測(cè)。數(shù)據(jù)利用的是中國航發(fā)四川燃?xì)鉁u輪研究院5套C1276720NW1(H)軸承全壽命過程中的磨屑信息。實(shí)驗(yàn)過程中,通過間歇斷油來預(yù)制初始損傷,軸向和徑向分別施加19.30 kN和2.16 kN的載荷,1號(hào)和2號(hào)軸承的轉(zhuǎn)速為800 r/min,其余3個(gè)軸承的轉(zhuǎn)速為1 200 r/min。研究過程中選取20個(gè)磨屑信息特征值,包括直徑為155 μm、175 μm、201 μm、225 μm、250 μm、275 μm、301 μm、401 μm、501 μm的顆粒累計(jì)數(shù)量和累計(jì)體積等18個(gè)特征值,以及磨屑顆??倲?shù)和總體積每分鐘的變化率。考慮到這20個(gè)特征值中存在線性相關(guān)項(xiàng),且過多的冗余數(shù)據(jù)會(huì)影響算法的計(jì)算效率,因此本文采用PCA對(duì)數(shù)據(jù)進(jìn)行降維。
PCA可以將高維數(shù)據(jù)降維為低維數(shù)據(jù),解決多維數(shù)據(jù)分析中的計(jì)算量過大、維度災(zāi)難、維度冗余等問題。它的基本思想是,將數(shù)據(jù)集中的多個(gè)變量轉(zhuǎn)換為一組新的變量,稱這些新的變量為主成分。具體過程如下:
① 輸入m條樣本,特征數(shù)為20的軸承磨屑信息數(shù)據(jù)集,記為
④ 對(duì)協(xié)方差矩陣C進(jìn)行特征分解,求出協(xié)方差矩陣的特征值λk及對(duì)應(yīng)的特征向量vk,即Cvk=λkvk。
⑤ 將特征向量對(duì)應(yīng)特征值從左到右按列降序排列成矩陣,取前5列組成n×k階矩陣W。
⑥ 通過Y=X*W計(jì)算降維到5維后的樣本特征,即m×5階矩陣。應(yīng)用PCA將原始特征值降維到5個(gè)特征向量,主成分的累計(jì)貢獻(xiàn)占比如圖3所示。由此可見,降維后的前5個(gè)主成分分量可表達(dá)出原來20個(gè)特征值的99.9%的信息。
圖3 主成分累計(jì)貢獻(xiàn)占比
將軸承的全壽命劃分為4個(gè)階段,即正常運(yùn)行、輕微磨損、初期失效、嚴(yán)重失效,分別將其定義為標(biāo)簽“0”“1”“2”“3”,使用APSO-LSSVM對(duì)其進(jìn)行故障分類。采用1、3、4號(hào)軸承磨屑數(shù)據(jù)作為訓(xùn)練集,2號(hào)和5號(hào)軸承磨屑數(shù)據(jù)作為測(cè)試集進(jìn)行訓(xùn)練和驗(yàn)證。為進(jìn)一步說明算法的優(yōu)勢(shì),將本模型的預(yù)測(cè)結(jié)果與LSSVM、基于遺傳算法優(yōu)化的最小二乘支持向量機(jī)(GA-LSSVM)、基于灰狼算法優(yōu)化的最小二乘支持向量機(jī)(GWO-LSSVM)和基于粒子群算法優(yōu)化的最小二乘支持向量機(jī)(PSO-LSSVM)進(jìn)行比較,5種種群算法初始種群數(shù)量都為25,迭代次數(shù)為10次,參數(shù)γ和σ的搜索范圍都設(shè)為[0,200],模型輸入為油液磨屑信息進(jìn)行PCA降維后的5維特征向量,輸出為1維的4種分類標(biāo)簽。每種算法取50次計(jì)算結(jié)果平均值,結(jié)果如表2所示。
表2 5種算法結(jié)果比較
由表2可知,應(yīng)用了智能種群算法對(duì)LSSVM超參數(shù)進(jìn)行尋優(yōu)后,雖然訓(xùn)練時(shí)間大幅增加,但準(zhǔn)確率有明顯提高,同時(shí)也可證明本文算法的正確性。在使用智能種群算法對(duì)SVM的2個(gè)參數(shù)進(jìn)行尋優(yōu)的問題上,PSO算法相對(duì)于GWO和GA算法,準(zhǔn)確率和計(jì)算速度都有所提升,測(cè)試集準(zhǔn)確率可達(dá)到95%,訓(xùn)練時(shí)間也減小到17.27 s,這是由于PSO的尋優(yōu)策略簡(jiǎn)單而高效,更適合于處理二維目標(biāo)的尋優(yōu)問題。而APSO相比于PSO穩(wěn)定性進(jìn)一步提高,因?yàn)槠渥赃m應(yīng)調(diào)節(jié)粒子移動(dòng)步長(zhǎng),可以減小在粒子搜索過程中掉入局部最優(yōu)的概率,增加算法的穩(wěn)定性,進(jìn)而提高算法準(zhǔn)確率。5種算法測(cè)試集的混淆矩陣如圖4所示。
圖4 5種算法測(cè)試集的混淆矩陣
由圖4可知:LSSVM整體識(shí)別率較低;GWO-LSSVM算法無法識(shí)別標(biāo)簽為“0”的樣本,并且將許多標(biāo)簽為“2”的樣本識(shí)別成標(biāo)簽為“1”的樣本,整體識(shí)別度比較低,其原因在于灰狼算法在迭代過程中同時(shí)選擇“三匹頭狼”為移動(dòng)方向,導(dǎo)致向最優(yōu)位置的移動(dòng)速度較慢;GA-LSSVM出現(xiàn)部分標(biāo)簽“2”識(shí)別為標(biāo)簽“3”的樣本,相比于GWO-LSSVM精度有顯著提高,但因?yàn)檫z傳算法在迭代過程中變異導(dǎo)致的較大隨機(jī)性,使算法不夠穩(wěn)定;PSO-LSSVM將少數(shù)標(biāo)簽為“2”的樣本錯(cuò)誤識(shí)別為標(biāo)簽“1”和“3”,相比于前兩種算法,其精度進(jìn)一步提高,但算法中粒子在移動(dòng)過程中步幅可能無法調(diào)整,導(dǎo)致后期無法收斂到全局最優(yōu)值;對(duì)于APSO-LSSVM,因?yàn)榱W硬捎昧俗赃m應(yīng)調(diào)節(jié)步長(zhǎng),相比于PSO-LSSVM精度進(jìn)一步提高,APSO找到全局最優(yōu)解的概率提高。因此在使用APSO-LSSVM對(duì)軸承的運(yùn)行狀態(tài)進(jìn)行分類評(píng)估時(shí),可以完全識(shí)別出前期故障,同時(shí)對(duì)故障后期的判斷精度明顯優(yōu)于GWO-LSSVM和GA-LSSVM,同時(shí)搜索到最優(yōu)解的穩(wěn)定性也高于PSO-LSSVM。
為了提前預(yù)警,實(shí)時(shí)在線監(jiān)測(cè)軸承的運(yùn)行狀態(tài),以便于發(fā)現(xiàn)問題及時(shí)報(bào)警,本文的方法還可用于對(duì)軸承的剩余壽命進(jìn)行預(yù)測(cè)。以PCA降維后的顆粒累計(jì)數(shù)量和累計(jì)體積為特征值,軸承剩余壽命(單位/萬轉(zhuǎn))為標(biāo)簽,對(duì)軸承壽命模型進(jìn)行回歸。在進(jìn)行軸承壽命預(yù)測(cè)時(shí),需要保證模型在未經(jīng)過訓(xùn)練的新軸承上也可以表現(xiàn)良好,這就需要模型具有較好的泛化能力,本文分別單獨(dú)選取5個(gè)軸承作為測(cè)試集,采用均方誤差(Mean Squared Error,MSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)和平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)3個(gè)參數(shù)作為描述模型精準(zhǔn)度的指標(biāo),5種種群算法初始種群數(shù)量都為25,迭代次數(shù)為10次,參數(shù)γ和σ的搜索范圍都設(shè)為[0,200],模型輸入為油液磨屑信息進(jìn)行PCA降維后的5維特征向量,輸出為1維的剩余壽命,分別給出5種模型在每個(gè)測(cè)試集軸承上的預(yù)測(cè)精度指標(biāo),結(jié)果如表3所示。
表3 5個(gè)模型在每種測(cè)試集軸承上的預(yù)測(cè)精度指標(biāo)
由表3可知:APSO-LSSVM模型的預(yù)測(cè)結(jié)果各項(xiàng)指標(biāo)都優(yōu)于其他4種模型,又因?yàn)槟P驮谒阉髯罴褏?shù)的過程中是以MSE為適應(yīng)度函數(shù),所以MSE指標(biāo)顯著高于其他模型。接下來本文結(jié)合APSO-LSSVM模型具體討論其在各個(gè)軸承上的表現(xiàn)。APSO-LSSVM在5個(gè)軸承上的剩余壽命預(yù)測(cè)表現(xiàn)如圖5所示。
圖5 APSO-LSSVM在5個(gè)軸承上的剩余壽命預(yù)測(cè)表現(xiàn)
結(jié)合圖5和表3可知:模型在3號(hào)軸承和4號(hào)軸承上表現(xiàn)較好,預(yù)測(cè)結(jié)果與真實(shí)結(jié)果基本一致,MSE比其他3個(gè)軸承的預(yù)測(cè)結(jié)果小一個(gè)數(shù)量級(jí),MAE也遠(yuǎn)小于其他軸承預(yù)測(cè)結(jié)果,其中3號(hào)軸承預(yù)測(cè)結(jié)果的MAPE最小;1號(hào)軸承和5號(hào)軸承預(yù)測(cè)結(jié)果的趨勢(shì)整體上與真實(shí)結(jié)果相似,但在軸承破壞前期預(yù)測(cè)結(jié)果誤差較大,導(dǎo)致MSE、MAE、MAPE結(jié)果相比于3號(hào)軸承和4號(hào)軸承的預(yù)測(cè)明顯增加;2號(hào)軸承的預(yù)測(cè)結(jié)果只能大體上預(yù)測(cè)出趨勢(shì),誤差較大,可能是因?yàn)槠鋫€(gè)體的獨(dú)特性,所以其MSE、MAE、MAPE均最大。結(jié)合以上分析,本文的模型能夠整體上預(yù)測(cè)出軸承剩余壽命的變化趨勢(shì),算法的泛化性較好。
本文提出了一種APSO-LSSVM模型,應(yīng)用其對(duì)軸承的運(yùn)行狀態(tài)進(jìn)行故障分類和剩余壽命預(yù)測(cè),并采用中國航發(fā)四川燃?xì)鉁u輪研究院的軸承試驗(yàn)數(shù)據(jù)進(jìn)行分析和驗(yàn)證,得出如下主要結(jié)論。
① 在處理樣本特征數(shù)據(jù)時(shí),采用PCA對(duì)軸承特征數(shù)據(jù)進(jìn)行處理,在保留原始數(shù)據(jù)99.9%信息的同時(shí)可極大地降低特征向量的維度。
② 在使用試驗(yàn)數(shù)據(jù)對(duì)軸承進(jìn)行狀態(tài)評(píng)估時(shí),APSO-LSSVM相比于GWO-LSSVM、GA-LSSVM、PSO-LSSVM具有顯著優(yōu)勢(shì),模型訓(xùn)練速度更快、預(yù)測(cè)結(jié)果準(zhǔn)確度更高,且掉入局部最優(yōu)的概率更低,算法穩(wěn)定性好。
③ 在使用試驗(yàn)數(shù)據(jù)對(duì)軸承剩余壽命進(jìn)行預(yù)測(cè)時(shí),模型在新軸承數(shù)據(jù)上可以預(yù)測(cè)出剩余壽命的整體趨勢(shì),模型泛化能力較好,但鑒于某些軸承的個(gè)體差異及樣本數(shù)量的限制,預(yù)測(cè)的精度有待提升,需要在后續(xù)的使用過程中不斷擴(kuò)充數(shù)據(jù)庫,使模型更加精確。