楊天林, 朱 燁2, 徐占艷2, 白舒雯2, 吳 奐, 趙永平
(1.南京航空航天大學(xué) 能源與動力學(xué)院,江蘇 南京 210016; 2.中國航發(fā)控制系統(tǒng)研究所,江蘇 無錫 214063)
航空發(fā)動機作為一種復(fù)雜的氣動熱力學(xué)系統(tǒng)[1],監(jiān)控其工作狀態(tài)和性能參數(shù)變化趨勢,及時有效地規(guī)避故障,對于保證和提高發(fā)動機工作的安全性和可靠性有著重要意義。發(fā)動機數(shù)據(jù)是規(guī)避故障的基礎(chǔ),然而隨著系統(tǒng)可靠性的逐漸提高,發(fā)動機故障數(shù)據(jù)在較短時間內(nèi)難以獲得,故傳統(tǒng)針對故障數(shù)據(jù)的監(jiān)測方法不再適用。同時,數(shù)據(jù)庫、傳感器技術(shù)、數(shù)據(jù)采集方法等的應(yīng)用為發(fā)動機健康監(jiān)測提供了大量的發(fā)動機狀態(tài)數(shù)據(jù),基于該狀態(tài)數(shù)據(jù)對發(fā)動機各個部件及其故障進行可靠性分析和監(jiān)測已成為趨勢[2]。
飛機發(fā)動機的泵調(diào)系統(tǒng)是數(shù)控系統(tǒng)的組成部分之一,也是故障頻發(fā)的部件之一,其中泵調(diào)包括油源部件、電液轉(zhuǎn)換裝置、燃油切斷模塊、保護模塊、監(jiān)控模塊等。國內(nèi)針對發(fā)動機泵調(diào)系統(tǒng)故障研究相對較少,針對發(fā)動機整機及其他部附件的研究較多,這些研究取得的成果對泵調(diào)系統(tǒng)的健康監(jiān)測有一定的參考價值。如陶立權(quán)等[3]針對航空發(fā)動機傳感器故障檢測方法的適用范圍缺乏量化數(shù)據(jù)問題,對基于卡爾曼濾波器和基于自適應(yīng)滑模觀測器的故障檢測方法適用性進行了對比分析,但是所采用方法的故障檢測率較低。王天義[4]對燃油系統(tǒng)典型故障進行了特征分析,并提供了處理這些故障的應(yīng)急措施,但缺少相應(yīng)的故障檢測算法。崔建國等[5]通過提出的小波包能量比與極限學(xué)習(xí)機相結(jié)合的方法對航空發(fā)動機燃油泵進行故障診斷,以振動傳感器感知發(fā)動機附件機匣的振動信號為分析對象,證明了該方法的有效性。以上研究均未涉及到基于泵調(diào)系統(tǒng)特征數(shù)據(jù)的健康監(jiān)測算法,故對于泵調(diào)系統(tǒng)的健康監(jiān)測沒有一定的針對性。
由于泵調(diào)系統(tǒng)沒有實現(xiàn)自動監(jiān)控,因此在航線上常發(fā)生突發(fā)故障,目前航空公司關(guān)于泵調(diào)系統(tǒng)的維修主要是利用可視化工具對泵調(diào)系統(tǒng)性能參數(shù)可視化,技術(shù)人員觀察并分析參數(shù)變化曲線,依據(jù)經(jīng)驗確定范圍邊界或閾值,一旦數(shù)據(jù)超限則停下來維修[6]。這種事后維修,無法有效地健康監(jiān)測甚至故障預(yù)測。綜上所述,本文選擇發(fā)動機泵調(diào)系統(tǒng)作為研究對象,對泵調(diào)系統(tǒng)的健康監(jiān)測方法進行研究。第1節(jié)分析了發(fā)動機泵調(diào)系統(tǒng)非參數(shù)化模型的建立方法,引出馬氏距離技術(shù)的優(yōu)越性;第2節(jié)從原理和影響因素兩方面對馬氏距離技術(shù)進行闡述;第3、4兩節(jié)分別介紹了預(yù)警閾值確定方法和健康監(jiān)測聚類算法;最后在第5節(jié)具體介紹了2、3、4節(jié)中的方法在泵調(diào)系統(tǒng)健康監(jiān)測中的實際應(yīng)用和實踐結(jié)果,最終得出結(jié)論。
一般基于數(shù)據(jù)挖掘技術(shù)所構(gòu)建的數(shù)據(jù)模型分為兩類:參數(shù)化模型與非參數(shù)化模型。參數(shù)化模型主要是指假設(shè)模型由有限組參數(shù)限定,已知數(shù)據(jù)分布的情況下,參數(shù)可以捕獲關(guān)于數(shù)據(jù)的全部信息的模型。例如神經(jīng)網(wǎng)絡(luò)、支持向量機等算法。非參數(shù)化模型則相反,例如多元狀態(tài)估計等,數(shù)據(jù)分布不能由一組有限參數(shù)限定,參數(shù)捕獲的關(guān)于數(shù)據(jù)的信息會隨著數(shù)據(jù)的增多而增多。由于基線模型屬于非參數(shù)化模型,故本文以馬氏距離算法作為健康監(jiān)測算法。馬氏距離是由印度統(tǒng)計學(xué)家馬哈拉諾比斯提出的,它是一種有效的計算兩個未知樣本集的相似度的方法[7]。馬氏距離算法針對非參數(shù)化模型建立有以下幾個優(yōu)勢:
① 由于泵調(diào)系統(tǒng)性能參數(shù)較多,且參數(shù)之間具有較高的關(guān)聯(lián)性,馬氏距離可以很好地處理該問題[6];
② 馬氏距離技術(shù)是一種數(shù)據(jù)驅(qū)動建模技術(shù)[8],不需要了解甚至建立泵調(diào)系統(tǒng)的物理模型,省去了高成本的監(jiān)控軟件;
③ 馬氏距離技術(shù)對訓(xùn)練樣本數(shù)量的要求不高,且可以利用訓(xùn)練樣本自行驗證方法的有效性。
為敘述方便,下文中的馬氏距離由Mdist替代。
Mdist技術(shù)是通過學(xué)習(xí)發(fā)動機泵調(diào)系統(tǒng)歷史健康監(jiān)測數(shù)據(jù),并且根據(jù)相關(guān)特征值體系構(gòu)建參數(shù)之間相似數(shù)學(xué)模型的一種相似性計算技術(shù)。針對某一起動序列的飛行數(shù)據(jù),與歷史樣本數(shù)據(jù)進行比對,得出兩者之間的Mdist數(shù)值。由于歷史樣本數(shù)據(jù)表征系統(tǒng)處于完全健康的狀態(tài),故Mdist數(shù)值越小,代表與歷史樣本越相似,即系統(tǒng)越健康;反之,系統(tǒng)則越不健康,甚至是故障。從而達到起動系統(tǒng)健康監(jiān)測的目的。
(1) 提取訓(xùn)練樣本。
首先需要挑選出系統(tǒng)歷史健康狀態(tài)下的特征值集合,組成訓(xùn)練樣本矩陣D,D的每一列代表一類型的特征值,每一行代表一個訓(xùn)練樣本,即一次起動試驗。假設(shè)訓(xùn)練集合中包含N個訓(xùn)練樣本,M個特征值。則訓(xùn)練樣本矩陣可表示為
D=[X1,X2,…,XM]
(1)
Xj=[x1j,x2j,…,xNj]T, 1≤j≤M
(2)
(2) 建立系統(tǒng)性能參數(shù)基線模型。
在訓(xùn)練矩陣D中,一個行向量表示系統(tǒng)在健康狀態(tài)下的特征值集合。為了使訓(xùn)練矩陣D更具有一般性,應(yīng)盡量選取表征能力強的特征參數(shù)。提取基線模型的方法有很多,如隨機森林、主成分分析法、多元狀態(tài)估計等。由于本文所用的起動過程數(shù)據(jù)已經(jīng)進行了去噪、歸一化等操作,因此本研究選用均值來計算泵調(diào)系統(tǒng)起動過程性能參數(shù)基線,即
(3)
(4)
(3) 計算協(xié)方差矩陣。
協(xié)方差是概率論與數(shù)理統(tǒng)計中一個非常重要的概念,主要用來計算兩個變量的整體偏差。k和l兩個維度樣本的協(xié)方差為
(5)
式中:n為樣本數(shù)量。
那么對于實際樣本集Dreal,大小為Nreal×M的矩陣,其協(xié)方差矩陣S為
(6)
式中:
(7)
(4) 計算實際樣本與參數(shù)基線之間的相似度,即Mdist。
(8)
式中:dMdist,i為第i次試驗樣本與參數(shù)基線的Mdist,即第i次試驗的健康指數(shù),用來表征系統(tǒng)的健康狀態(tài),達到健康監(jiān)測的目的。
(1) 訓(xùn)練樣本選擇。
在確定了所需的特征參數(shù)之后,由于特征參數(shù)是隨轉(zhuǎn)速變化的一系列時間序列,采樣時間為0.1 s,在起動時間范圍內(nèi),若選擇所有的數(shù)據(jù)作為樣本,不僅會造成計算負(fù)荷的指數(shù)型增加,而且樣本的維數(shù)過高,會使得算法計算結(jié)果精度較低。因此,本文采用分段線性插值的方法來從飛行歷史數(shù)據(jù)中篩選出合適的樣本組成最佳訓(xùn)練樣本,該方法能較好地保留原特征參數(shù)的變化趨勢,同時也降低了樣本維度。
分段線性插值擬合法首先就是要對所有時間序列平均劃分為K段:
(9)
式中:Lm為時間序列長度;M為所需數(shù)據(jù)向量維數(shù),在歷史記錄樣本被分為K段后,每一段上的數(shù)據(jù)用線性差值進行擬合,組成訓(xùn)練樣本。插值公式如下:
(10)
式中:xm為所求特征參數(shù)對應(yīng)的轉(zhuǎn)速;x1和x2分別為前一時刻的轉(zhuǎn)速和后一時刻的轉(zhuǎn)速;ym為所求特征參數(shù);y1和y2分別為x1和x2轉(zhuǎn)速所對應(yīng)的特征參數(shù)。
(2) 性能參數(shù)標(biāo)準(zhǔn)化。
Mdist技術(shù)進行健康監(jiān)測時,除了樣本的選擇,性能參數(shù)本身的系統(tǒng)偏差也是影響其精度的重要因素。而系統(tǒng)偏差的主要原因在于環(huán)境因素的影響,系統(tǒng)在不同的溫度、壓力下,性能參數(shù)的數(shù)值會不同。因此選取同一架飛機、同一臺泵的主控通道的數(shù)據(jù)。此外,為了消除異常數(shù)據(jù)對基線模型的影響,需要對性能參數(shù)標(biāo)準(zhǔn)化。目前性能參數(shù)標(biāo)準(zhǔn)化比較流行的方法步驟如下:
① 選擇起動過程中有利于研究的性能參數(shù),并且按照起動序列一一對應(yīng)。
② 將性能參數(shù)按照起動序列進行繪圖,繪制出性能參數(shù)變化圖(如圖1所示),并根據(jù)3σ模型在圖形中繪出性能參數(shù)偏差圖(如圖2所示),其中綠線代表σ,紅線代表3σ。
圖1 泵調(diào)系統(tǒng)某性能參數(shù)數(shù)值
圖2 某性能參數(shù)偏差圖
③ 選擇超過3σ的起動序列,分析其偏差較大的原因,在不考慮外界環(huán)境參數(shù)影響的情況下,該參數(shù)可以認(rèn)為已經(jīng)出現(xiàn)了異常,應(yīng)當(dāng)從訓(xùn)練樣本中剔除,保留在測試樣本中。
通過Mdist系統(tǒng)健康監(jiān)測技術(shù)計算出實際運行樣本與基線模型之間的相似度(即健康指數(shù)),為了消除隨機因素的隨機干擾,使健康指數(shù)更具代表性,進而使健康監(jiān)測更準(zhǔn)確,本節(jié)介紹滑動窗口偏差統(tǒng)計的方法對相似度數(shù)值進行處理。
假定在泵調(diào)系統(tǒng)某運行時間段內(nèi),由Mdist技術(shù)計算的樣本之間相似度數(shù)值(即健康指數(shù)數(shù)值)序列如下(按照時間排序):
ε=[ε1,ε2,ε3,…,εj,…]
(11)
對健康指數(shù)序列取一個寬度為j的滑動窗口,然后對窗口內(nèi)連續(xù)j個值取其平均值:
(12)
設(shè)置合理的滑動窗口大小j,使得系統(tǒng)內(nèi)由于隨機因素而產(chǎn)生的隨機干擾被消除?;谠摲椒ǎ到y(tǒng)健康指數(shù)的變化趨勢不僅可以被準(zhǔn)確及時地表征,還能準(zhǔn)確地反映系統(tǒng)的健康狀態(tài)。進而通過經(jīng)驗或資料對健康指數(shù)均值設(shè)定合理的閾值,一旦健康指數(shù)均值超過閾值,便發(fā)出警告,達到系統(tǒng)故障提前預(yù)警的目的。此外,經(jīng)過滑動窗口均值化后的健康指數(shù)提高了健康監(jiān)測和預(yù)警的可靠性。
接下來根據(jù)計算的健康指數(shù)均值來設(shè)定合理的閾值EAN:
EAN=±k·EN
(13)
式中:EN為發(fā)動機泵調(diào)系統(tǒng)在完全健康狀態(tài)下的健康指數(shù)均值絕對值的最大值;k為預(yù)警閾值系數(shù),可根據(jù)實際經(jīng)驗來確定,一般在1~1.2之間。
由于簡單快速的原因,本文采用基于歐氏距離的K均值聚類算法[9]進行發(fā)動機泵調(diào)系統(tǒng)健康監(jiān)測。具體算法流程圖如圖3所示。其中,聚類中心的選擇主要有3種方式:① 從樣本中隨機選取K個對象作為中心;② 根據(jù)樣本的數(shù)據(jù)分布范圍均勻地隨機生成K個中心;③ 初始聚類階段隨機選擇10%的樣本的子樣本。
發(fā)動機泵調(diào)系統(tǒng)健康監(jiān)測流程圖如圖4所示。流程如下:首先,在獲取以往發(fā)參數(shù)據(jù)的基礎(chǔ)上提取起動過程的相關(guān)參數(shù),形成訓(xùn)練樣本;繼而,對所有特征
圖3 K均值聚類算法流程圖
圖4 發(fā)動機泵調(diào)系統(tǒng)健康監(jiān)測流程圖
數(shù)據(jù)進行標(biāo)準(zhǔn)化,篩選出完全健康的樣本數(shù)據(jù);其次,根據(jù)Mdist技術(shù)計算泵調(diào)系統(tǒng)起動過程性能參數(shù)基線模型以及健康指數(shù)閾值。當(dāng)有新的發(fā)參數(shù)據(jù)時,得到新數(shù)據(jù)的性能參數(shù)與基線模型計算求取Mdist值,作為表征泵調(diào)系統(tǒng)健康狀態(tài)的健康指數(shù);采用K均值聚類算法對樣本進行聚類,因偏差值異常而被判定為離群點的數(shù)據(jù),被劃分為故障類,繼而對其進行故障預(yù)警,否則繼續(xù)監(jiān)控。
本文所選型號飛機為雙發(fā),故泵調(diào)系統(tǒng)包括左泵和右泵。由于故障數(shù)據(jù)有限,僅對右泵的數(shù)據(jù)進行分析。首先,從數(shù)據(jù)庫中的數(shù)據(jù)中篩選出同一型號飛機右泵的主控通道數(shù)據(jù)。根據(jù)判據(jù),處理數(shù)據(jù),得到所需的特征值。為研究泵調(diào)系統(tǒng)的特性選擇兩個關(guān)系型特征,即油針控制精度與轉(zhuǎn)速、油針位置與轉(zhuǎn)速,進行曲線趨勢分析。發(fā)動機起動階段右泵關(guān)系型特征參數(shù)變化趨勢如圖5所示(注:油針控制精度與油針位置均為歸一化后的量)。
圖5 右泵特征參數(shù)變化曲線
分析圖5(a)曲線,10%轉(zhuǎn)速之前的曲線體現(xiàn)出泵調(diào)的一種設(shè)計方式,油針控制精度基本不變,在10%轉(zhuǎn)速之后,除較為異常的兩條曲線外,油針控制精度控制在0~5%之間,且呈現(xiàn)出A、B兩個通道的數(shù)據(jù)簇。
分析圖5(b)曲線,由于發(fā)動機轉(zhuǎn)速較低時,熱能與機械能的轉(zhuǎn)換效率較低,加速性較差,故在轉(zhuǎn)速10%~30%之間采取固定的供油方式,此后供油量迅速增加,充分提升轉(zhuǎn)速。此外,除了兩條異常數(shù)據(jù)線外,整體呈現(xiàn)出A、B兩個通道的數(shù)據(jù)簇。
綜上所述,為了消除通道不同以及異常數(shù)據(jù)等的影響,應(yīng)對A、B主控通道分別建立泵調(diào)系統(tǒng)參數(shù)基線模型,并剔除故障數(shù)據(jù)或異常數(shù)據(jù),篩選出完全健康的起動序列。
5.2.1 訓(xùn)練樣本的選擇與構(gòu)建
按照文中2.2節(jié)介紹的選擇樣本與處理的方法,先對提取的轉(zhuǎn)子轉(zhuǎn)速Ng數(shù)據(jù)進行劃分,以2%轉(zhuǎn)速為間隔記錄一次數(shù)據(jù),采用分段線性插值的方法分別計算相應(yīng)轉(zhuǎn)速下的油針位置、油針控制精度等特征值,構(gòu)成訓(xùn)練樣本。訓(xùn)練樣本的每行代表一次起動試驗,所選的特征參數(shù)作為樣本的每列。
繼而,對所有特征數(shù)據(jù)進行標(biāo)準(zhǔn)化,選擇3σ模型從訓(xùn)練樣本中剔除數(shù)據(jù)異常的樣本,得到完全健康的樣本數(shù)據(jù)。經(jīng)過標(biāo)準(zhǔn)化后泵調(diào)系統(tǒng)部分特征變化趨勢如圖6所示(注:油針控制精度與油針位置均為歸一化后的量)。
圖6 標(biāo)準(zhǔn)化后右泵特征參數(shù)變化曲線
5.2.2 性能參數(shù)基線模型的建立
根據(jù)維修記錄(如表1所示,1號為左泵,2號為右泵),選擇出泵調(diào)系統(tǒng)完全健康的起動序列;基于3σ模型對泵調(diào)系統(tǒng)性能參數(shù)完成了標(biāo)準(zhǔn)化。接下來,本文將按照2.1節(jié)中建立基線模型的方法,計算泵調(diào)系統(tǒng)在飛機起動過程健康狀態(tài)參數(shù)基線。
表1 某型號飛機左右泵的維修記錄
本文采取均值的方法,建立參數(shù)基線模型,飛機A泵調(diào)系統(tǒng)起動過程基線結(jié)果如表2所示(篇幅限制僅展示20%轉(zhuǎn)速以內(nèi)的基線模型數(shù)據(jù))。
表2 飛機A右泵A、B主控通道特征參數(shù)基線模型
5.2.3 監(jiān)測預(yù)警閾值的確定
在確定監(jiān)測預(yù)警閾值之前,需要計算訓(xùn)練樣本與基線之間的Mdist數(shù)值,即健康指數(shù)。訓(xùn)練樣本由完全健康的樣本組成,故所計算的健康指數(shù)應(yīng)表征完全健康的泵調(diào)系統(tǒng)。
參照文中2.1節(jié)Mdist的計算方法,訓(xùn)練樣本的健康指數(shù)如圖7、圖8所示。
圖7 A主控通道訓(xùn)練樣本的健康指數(shù)
繼而通過滑動窗口的方法來確定泵調(diào)系統(tǒng)起動過程健康監(jiān)測的預(yù)警閾值。選擇窗口寬度,根據(jù)經(jīng)驗選取預(yù)警值系數(shù),計算得到健康指數(shù)預(yù)警閾值。需要指出的是該健康指數(shù)預(yù)警閾值只適用于基于同一基線模型同一臺泵的數(shù)據(jù)。
當(dāng)飛機起動過程發(fā)生突發(fā)故障時,傳統(tǒng)的判別故障類型的方法是將起動過程參數(shù)可視化,根據(jù)維修人員經(jīng)驗進行排故,該方法效率較低,且事后維修起不到健康監(jiān)測或故障預(yù)測的作用。故本文在基線模型的基礎(chǔ)上,采用文中第4節(jié)介紹的K均值聚類算法對泵調(diào)系統(tǒng)的起動過程進行健康監(jiān)測,同時對3種質(zhì)心選擇方法的聚類結(jié)果進行了對比。
算法輸入的實際樣本數(shù)據(jù)包含飛機右泵A、B主控通道的所有飛行數(shù)據(jù)。每一行代表起動序列,每一列代表起動過程特征參數(shù),聚類個數(shù)K為2,即故障數(shù)據(jù)為一類,健康數(shù)據(jù)為另一類。第4節(jié)中介紹的3種質(zhì)心選擇方法的聚類結(jié)果以及Silhouette相似度量值如圖9所示。
圖9中,方法1與方法3的聚類結(jié)果相同,故障數(shù)據(jù)個數(shù)均為15;方法2的聚類結(jié)果中,故障數(shù)據(jù)個數(shù)為“1”,且該故障數(shù)據(jù)發(fā)生的日期為2019年8月22日。由于實際飛行記錄中,只有2019年8月22日當(dāng)天發(fā)生故障,且之前的數(shù)據(jù)默認(rèn)為健康數(shù)據(jù)。因此,方法1與方法3的聚類結(jié)果故障誤報率較高,方法2的聚類結(jié)果誤報率為“0”,驗證了方法2的K均值聚類的可行性和準(zhǔn)確性。且分析圖9相似度量值可知,3種方法的正常類中均有一次相似度量值較小的試驗,即差異較大,這與圖5中出現(xiàn)數(shù)據(jù)明顯異常的兩條曲線(其中包括8月22日的故障數(shù)據(jù))的現(xiàn)象保持一致,同樣驗證了基于方法2的K均值聚類算法的有效性和準(zhǔn)確性。這種根據(jù)樣本分布范圍均勻地隨機生成質(zhì)心的K均值聚類算法為實現(xiàn)泵調(diào)系統(tǒng)健康監(jiān)測自動化提供了保障。
圖9 3種方法的聚類結(jié)果
本文基于發(fā)參數(shù)據(jù)研究飛機發(fā)動機泵調(diào)系統(tǒng)的健康監(jiān)測方法:
① 從實際發(fā)參數(shù)據(jù)中篩選出飛機A泵調(diào)系統(tǒng)起動過程的健康參數(shù),并建立了飛機A泵調(diào)系統(tǒng)起動過程的參數(shù)基線模型,為泵調(diào)系統(tǒng)的健康監(jiān)測打下堅實基礎(chǔ)。
② 基于Mdist技術(shù)計算出泵調(diào)系統(tǒng)的健康指數(shù),并通過滑動窗口的方法確定了泵調(diào)系統(tǒng)起動過程健康監(jiān)測的預(yù)警閾值,為以后泵調(diào)系統(tǒng)的退化監(jiān)測以及起動過程的故障預(yù)測提供了有效判據(jù)。
③ 通過3種K均值聚類算法對泵調(diào)系統(tǒng)起動過程的飛行數(shù)據(jù)進行故障診斷的結(jié)果的對比分析,驗證了根據(jù)樣本分布范圍均勻地隨機生成質(zhì)心的K均值聚類算法的可行性與準(zhǔn)確性,對實現(xiàn)泵調(diào)系統(tǒng)的健康監(jiān)測自動化具有重要的實際意義。