盧俊鋼,張世榮,梁少軍,楊 毅
(1.武漢大學(xué) 電氣與自動(dòng)化學(xué)院, 武漢 430072;2.陸軍工程大學(xué) 軍械士官學(xué)校, 武漢 430075)
無人機(jī)具有易開發(fā)、成本低、靈活性強(qiáng)等特點(diǎn),近年來在軍事、民用領(lǐng)域得到了長足發(fā)展和廣泛應(yīng)用。其中,固定翼無人機(jī)(Fixed-Wing Unmanned Aerial Vehicles,F(xiàn)W-UAVs)集成技術(shù)先進(jìn)、造價(jià)高、系統(tǒng)復(fù)雜,一般應(yīng)用于速度快、距離遠(yuǎn)和續(xù)航久的場景。FW-UAV的性能會(huì)隨著運(yùn)行時(shí)間增加逐漸衰退,導(dǎo)致故障發(fā)生率增高。FW-UAV一旦因故障墜毀會(huì)導(dǎo)致較大的經(jīng)濟(jì)損失甚至引發(fā)軍事、政治和社會(huì)影響。故使用故障預(yù)測和健康管理技術(shù)提升無人機(jī)設(shè)備的可靠性與可用性具有重要意義,眾多學(xué)者圍繞此問題進(jìn)行了大量深入研究。
FW-UAV的設(shè)備復(fù)雜性、任務(wù)規(guī)劃多變性和環(huán)境多樣性導(dǎo)致其工作狀態(tài)反復(fù)切換,呈現(xiàn)多工況特征,這給基于數(shù)據(jù)的故障預(yù)測和健康管理帶來諸多挑戰(zhàn)。因此,有必要對(duì)無人機(jī)的多工況問題進(jìn)行研究。從數(shù)據(jù)挖掘角度看,F(xiàn)W-UAV的多工況分析是典型的數(shù)據(jù)分組問題,可以使用聚類算法解決,在線數(shù)據(jù)分類則屬于模式識(shí)別問題。常見的聚類算法有層次聚類、密度聚類和譜聚類等。目前已經(jīng)出現(xiàn)了基于相似性(距離)、基于神經(jīng)網(wǎng)絡(luò)和基于機(jī)器學(xué)習(xí)等方法的模式識(shí)別,并被廣泛應(yīng)用于工業(yè)、軍事等領(lǐng)域。例如,張俊楠等將支持向量機(jī)與二叉樹結(jié)構(gòu)相結(jié)合對(duì)分布式光纖擾動(dòng)傳感系統(tǒng)的擾動(dòng)模式進(jìn)行了有效識(shí)別。別鋒鋒等利用ICEEMDAN算法提取了往復(fù)泵的故障特征,并使用GRNN神經(jīng)網(wǎng)絡(luò)進(jìn)行故障識(shí)別,有效提高了識(shí)別準(zhǔn)確度。王爍等基于反向傳播神經(jīng)網(wǎng)絡(luò)對(duì)多因素作用下破片對(duì)靶板的侵徹毀傷模式進(jìn)行了有效識(shí)別。劉凡等利用小波包分解提取了電力變壓器的多維度能量特征,進(jìn)而使用近鄰算法實(shí)現(xiàn)局部放電超高頻信號(hào)的模式識(shí)別。張陽陽等使用概率神經(jīng)網(wǎng)絡(luò)對(duì)齒輪箱典型故障進(jìn)行了有效識(shí)別。
以上方法在不同領(lǐng)域應(yīng)用收到了較好效果,但無法直接應(yīng)用于FW-UAV工況分析。主要原因在于:含類標(biāo)的FW-UAV數(shù)據(jù)很難獲取,導(dǎo)致監(jiān)督模式識(shí)別算法無法應(yīng)用;FW-UAV數(shù)據(jù)鏈傳輸速率快,在線數(shù)據(jù)量大,對(duì)工況識(shí)別算法時(shí)效性要求高。為解決以上問題,本文將聚類分析與模式識(shí)別算法相結(jié)合,采用組合算法來實(shí)現(xiàn)無人機(jī)多工況的高效分析。擬提出一種基于分組的非監(jiān)督密度聚類(Group-based DBSCAN,G-DBSCAN)算法,在不依賴數(shù)據(jù)工況類標(biāo)基礎(chǔ)上實(shí)現(xiàn)多工況分析;并將提出一種基于多維度分解的快速工況識(shí)別算法(Pattern Recognition based on Dimensional Decomposition,PRDD),PRDD將進(jìn)一步與聚類算法深度融合以實(shí)現(xiàn)FW-UAV在線數(shù)據(jù)工況識(shí)別的快速性和準(zhǔn)確性。
FW-UAV執(zhí)行任務(wù)的全流程包含起飛、巡航、遂行任務(wù)、返航、回收等多個(gè)階段,屬于典型的多工況過程,若將其簡單處理為一個(gè)工況,則會(huì)因模型失配降低故障預(yù)測、故障診斷、剩余壽命預(yù)測等數(shù)據(jù)驅(qū)動(dòng)算法的準(zhǔn)確率。
這里以某FW-UAV實(shí)際飛行數(shù)據(jù)集中縱向控制回路與速度控制回路相關(guān)數(shù)據(jù)為例,展示其多工況特征并說明工況分析的必要性。FW-UAV縱向控制回路與速度控制回路均是閉環(huán)反饋回路,相關(guān)的變量包括俯仰角、升降舵偏角、發(fā)動(dòng)機(jī)缸溫、發(fā)動(dòng)機(jī)轉(zhuǎn)速和高度共5維數(shù)據(jù)。圖1為某飛行時(shí)間段該5維數(shù)據(jù)歸一化后的飛行曲線。從圖1可以看出,隨著時(shí)間推移曲線幅值波動(dòng)較大且各維度數(shù)據(jù)呈現(xiàn)非線性關(guān)系,無法從直觀角度辨識(shí)工況。為進(jìn)一步分析無人機(jī)工況特征,下一節(jié)將基于數(shù)據(jù)分布特征,提出一種密度聚類算法對(duì)其進(jìn)行多工況分析。
圖1 FW-UAVs某飛行時(shí)間段飛行曲線
DBSCAN作為基于密度的聚類算法,能夠在數(shù)據(jù)集中找出具有不同大小和形狀的簇,對(duì)噪聲有較強(qiáng)的魯棒性,能基于數(shù)據(jù)自主推測聚類個(gè)數(shù)。DBSCAN的主要參數(shù)為掃描半徑和核心點(diǎn)最小數(shù)據(jù)量Min,算法將數(shù)據(jù)集中的樣本點(diǎn)分為核心點(diǎn)、邊界點(diǎn)和離群點(diǎn)3類。在DBSCAN算法中定義了兩點(diǎn)之間3種特殊關(guān)系:直接密度可達(dá)、密度可達(dá)以及密度相連。經(jīng)典DBSCAN算法將原始數(shù)據(jù)集中的所有樣本點(diǎn)視為潛在的核心點(diǎn)逐個(gè)掃描,若確認(rèn)為核心點(diǎn)則將與其密度相連的所有數(shù)據(jù)點(diǎn)視為同一類。以下提出了一種基于分組的DBSCAN算法,它將數(shù)據(jù)分布特性融入經(jīng)典DBSCAN算法,旨在提高算法的效率。
對(duì)于數(shù)據(jù)集中的給定點(diǎn),∈,令,表示點(diǎn)和之間的距離,,()表示點(diǎn)到其第個(gè)最近鄰點(diǎn)()的距離。在距離基礎(chǔ)上進(jìn)一步定義分組核心點(diǎn)、分組離群點(diǎn)和分組待定點(diǎn)。
1) 分組核心點(diǎn):對(duì)于給定點(diǎn)∈,若,(Min)≤,則將該點(diǎn)標(biāo)記為分組核心點(diǎn)。這就意味著點(diǎn)與其第Min個(gè)最近鄰點(diǎn)的距離小于。
2) 分組離群點(diǎn):對(duì)于給定點(diǎn)∈,若,(Min)>2,則將該點(diǎn)標(biāo)記為分組離群點(diǎn)。
3) 分組待定點(diǎn):給定點(diǎn)∈,當(dāng)<,(Min)≤2時(shí),將其標(biāo)記為分組待定點(diǎn)。顯然,邊界點(diǎn)以及離群點(diǎn)都有可能是待定點(diǎn),因此還需進(jìn)一步采取策略進(jìn)行識(shí)別。
使用基于KD樹的最近鄰搜索算法獲取數(shù)據(jù)集中的每個(gè)點(diǎn)到其第Min個(gè)最近鄰點(diǎn)的距離,并將得到的距離值以升序進(jìn)行排序,就可以得到距離曲線(Min-th distance Curve,MC),如圖2所示。
圖2 樣本點(diǎn)到其第MinPts個(gè)最近鄰點(diǎn)的距離曲線
令、、分別表示分組核心點(diǎn)、分組待定點(diǎn)以及分組離群點(diǎn)。以圖3(a)為例,此時(shí)Min=3,所有核心點(diǎn)、、、、均屬于。因?yàn)?span id="j5i0abt0b" class="subscript">,(3)=,>2,故點(diǎn)屬于,而另外2個(gè)真實(shí)離群點(diǎn)與被臨時(shí)收集在中。此例說明包含了所有的核心點(diǎn),包含了部分的真實(shí)離群點(diǎn),而包含了邊界點(diǎn)和離群點(diǎn)。其中中的離群點(diǎn)并不參與最終的聚類結(jié)果,因此可以被直接剔除以提高算法效率。由于核心點(diǎn)將決定最終聚類的形狀、大小以及數(shù)量,因此可以對(duì)使用經(jīng)典DBSCAN算法,并設(shè)置Min=1,以獲得聚類結(jié)果,如圖3(b)所示。由于已經(jīng)獲得了數(shù)據(jù)間的距離矩陣,聚類結(jié)果獲取時(shí)可直接調(diào)用該矩陣以進(jìn)一步提高算法效率。
圖3 2種方法的聚類結(jié)果示意圖
(1)
輸入:
(1):原始數(shù)據(jù)集
(2):掃描半徑
(3) Min:核心點(diǎn)最小數(shù)據(jù)量
輸出:
(1)、、:分組核心點(diǎn)、待定點(diǎn)、離群點(diǎn)類標(biāo)
方法:
(1) 初始化=,=,=
(2) 使用基于KD樹的最近鄰搜索獲取MC曲線及距離矩陣
(3) for中每個(gè)點(diǎn)
if≤then=∪
else if<≤2then=∪
else=∪
end if
end for
(4) 將中的所有點(diǎn)都標(biāo)記為噪聲
(5) 執(zhí)行DBSCAN算法(,,1)來獲得每個(gè)核心點(diǎn)的簇ID
end if
end for
前一節(jié)使用G-DBSCAN算法對(duì)FW-UAV原始數(shù)據(jù)完成聚類分析后,會(huì)將原始數(shù)據(jù)集分為若干個(gè)簇,并標(biāo)以不用的類標(biāo),即完成數(shù)據(jù)分組。本文將密度聚類算法與工況識(shí)別深度結(jié)合,充分利用已完成聚類的核心點(diǎn)信息,融合主成分分析法,提出一種基于多維度分解的模式識(shí)別算法(PRDD),完成新數(shù)據(jù)的聚類類標(biāo)模式識(shí)別。
該算法首先將聚類獲得的核心點(diǎn)數(shù)據(jù)以及新數(shù)據(jù)使用主成分分析法(principal component analysis,PCA)降維,以提高運(yùn)算效率,進(jìn)而對(duì)兩類數(shù)據(jù)進(jìn)行維度分解,通過判斷各個(gè)維度上新數(shù)據(jù)一定鄰域內(nèi)核心點(diǎn)數(shù)據(jù)的分布情況,結(jié)合邏輯運(yùn)算粗略推定新數(shù)據(jù)周邊有無核心點(diǎn)。之后根據(jù)核心點(diǎn)數(shù)量以及與新數(shù)據(jù)的真實(shí)距離準(zhǔn)確識(shí)別測試數(shù)據(jù)的類標(biāo)。
輸入:
(1): G-DBSCAN中的核心點(diǎn)矩陣
(2): G-DBSCAN中的核心點(diǎn)類標(biāo)矩陣
(3): 測試數(shù)據(jù),即新數(shù)據(jù)
(4): G-DBSCAN算法中鄰域半徑
輸出:
(1):新數(shù)據(jù)的多工況識(shí)別類標(biāo)
方法:
(1) 基于實(shí)現(xiàn)、的降維
(2) 初始化類標(biāo)矩陣
(3) for中每個(gè)點(diǎn)do
創(chuàng)建的鄰近點(diǎn)集合,并初始化
for中每個(gè)點(diǎn)do
將加入鄰近點(diǎn)集合
end if
end for
end for
if=then
標(biāo)記為噪聲點(diǎn)
else if()==1 then僅一個(gè)核心點(diǎn)
if ‖-‖≤then‖·‖為二范數(shù)計(jì)算
else 標(biāo)記為噪聲點(diǎn)
end if
else 從中剔除與距離大于的核心點(diǎn)
if=then
標(biāo)記為噪聲點(diǎn)
else if()==1 then
else if()>1 then
if中所有核心點(diǎn)類標(biāo)相同 then
end if
end if
end if
end for
以上算法相比較于傳統(tǒng)模式識(shí)別算法具有以下優(yōu)勢(shì):
1) 無額外參數(shù)。該算法僅需輸入G-DBSCAN算法(或是其他以密度聚類為核心的算法)的掃描半徑,因此可擺脫部分機(jī)器學(xué)習(xí)算法中所存在的超參數(shù)調(diào)節(jié)困擾;
2) 無需建模。該算法在深度研究密度聚類算法的基礎(chǔ)上,從維度分解以及數(shù)學(xué)規(guī)律層面對(duì)新數(shù)據(jù)進(jìn)行工況識(shí)別,無需依靠訓(xùn)練數(shù)據(jù)進(jìn)行建模,故也不存在模型過擬合、欠擬合以及陷入局部最優(yōu)的問題;3) 開銷小。該算法充分利用維度分解的便利性,在各個(gè)維度上分別執(zhí)行查找運(yùn)算,之后通過邏輯判斷將待處理范圍縮小后再運(yùn)行計(jì)算開銷較大的距離運(yùn)算。與其他基于相似性/距離、基于神經(jīng)網(wǎng)絡(luò)和基于機(jī)器學(xué)習(xí)的模式識(shí)別方法相比,本算法具有顯著的計(jì)算優(yōu)勢(shì)。
工況聚類和在線工況識(shí)別是無人機(jī)故障診斷和健康管理的前提,多工況分析平臺(tái)設(shè)計(jì)如圖4所示,該平臺(tái)可進(jìn)一步服務(wù)于無人機(jī)故障診斷和健康管理系統(tǒng)。圖4中,機(jī)載飛行控制計(jì)算機(jī)采集飛機(jī)俯仰角、升降舵偏角、高度、發(fā)動(dòng)機(jī)缸溫和轉(zhuǎn)速狀態(tài)信息,并編碼形成遙測數(shù)據(jù)通過數(shù)據(jù)鏈發(fā)送至地面設(shè)備。地面設(shè)備接收并處理遙測信息,在對(duì)遙測數(shù)據(jù)清洗和采樣后存入歷史飛行數(shù)據(jù)庫。終端設(shè)備封裝了G-DBSCAN算法以及PRDD工況識(shí)別算法,執(zhí)行多工況聚類與識(shí)別算法運(yùn)算。以下首先以獲得的實(shí)飛數(shù)據(jù)為例進(jìn)行算法驗(yàn)證。
圖4 無人機(jī)多工況分析平臺(tái)框圖
利用圖4所示分析平臺(tái)獲取了FW-UAV的實(shí)飛數(shù)據(jù)集,以下取某次飛行數(shù)據(jù)用于算法驗(yàn)證。從數(shù)據(jù)集中選取數(shù)據(jù)量=500的數(shù)據(jù)樣本,數(shù)據(jù)維度=5(飛行數(shù)據(jù)曲線見圖1)。首先使用PCA算法降至二維,并設(shè)置G-DBSCAN算法參數(shù)Min=8,=007,算法首先得到飛行采樣數(shù)據(jù)MC曲線。根據(jù)MC曲線縱軸距離值與的關(guān)系可將飛行采樣數(shù)據(jù)劃分為分組核心點(diǎn)、分組待定點(diǎn)和分組離群點(diǎn)。如圖5所示,圖中縱軸距離值小于等于的區(qū)間聚集了所有的分組核心點(diǎn),在與2區(qū)間聚集了待定點(diǎn)數(shù)據(jù),在大于2的區(qū)間收集了分組離群點(diǎn),這一結(jié)果與3.1算法描述一致。
本文算法測試環(huán)境為Matlab 2020b,終端設(shè)備配置為主頻2.2 GHz,內(nèi)存16 G。根據(jù)G-DBSCAN算法步驟,圖6(a)、圖6(b)和圖6(c)為使用分組策略所獲取的3種不同數(shù)據(jù)的聚類結(jié)果。圖6(a)為算法篩選出的離群數(shù)據(jù)。圖6(b)為篩選得到的分組核心點(diǎn)數(shù)據(jù)在重新設(shè)定Min=1之后執(zhí)行經(jīng)典DBSCAN算法所獲得的聚類結(jié)果,從圖中可以看出分組核心點(diǎn)被聚為5類,由于分組核心點(diǎn)聚類結(jié)果表征了聚類的大致分布結(jié)構(gòu),因此可以斷定最終聚類結(jié)果將被分為5類,且邊界點(diǎn)將分布在此5類核心點(diǎn)數(shù)據(jù)簇的邊緣。在圖6(c)中,分組待定點(diǎn)中的邊界點(diǎn)被劃分到各核心點(diǎn)組成的簇中,而離群點(diǎn)被單獨(dú)標(biāo)記。此過程將針對(duì)分組待定點(diǎn)的聚類分析過程轉(zhuǎn)化為了聚類類標(biāo)識(shí)別過程,提升了算法效率。匯總以上結(jié)果即可得到算法最終聚類結(jié)果,如圖6(d)所示。圖6(e)為傳統(tǒng)DBSCAN算法聚類結(jié)果,對(duì)比G-DBSCAN算法,后者在保證了不影響原有聚類效果的前提下,平均運(yùn)行時(shí)間從0.021 27 s減少到0.006 3 s,有效提高了算法的效率。
圖5 無人機(jī)飛行數(shù)據(jù)的MC曲線
圖6 FW-UAVs飛行數(shù)據(jù)聚類結(jié)果示意圖
綜上,G-DBSCAN算法能更快獲取到聚類核心點(diǎn),無需重復(fù)遍歷原始數(shù)據(jù)集,結(jié)合后續(xù)模式識(shí)別算法將有效提高整體技術(shù)路線運(yùn)行效率。
從已完成聚類分析的數(shù)據(jù)集中提取核心點(diǎn)矩陣及其對(duì)應(yīng)的類標(biāo)矩陣,同時(shí)從該數(shù)據(jù)集中分別隨機(jī)選取20、35、50的數(shù)據(jù)制成測試數(shù)據(jù)20、35、50用于PRDD工況識(shí)別算法的驗(yàn)證。首先使用PCA算法將核心點(diǎn)矩陣及3組測試數(shù)據(jù)降至2維,并將降維后的、20、35、50以及參數(shù)(聚類時(shí)設(shè)置的參數(shù))輸入PRDD算法,結(jié)果如圖7所示。該算法在3種測試數(shù)據(jù)集下的識(shí)別率均達(dá)到100%。
圖7 3種測試數(shù)據(jù)集下的識(shí)別結(jié)果示意圖
為了進(jìn)一步檢驗(yàn)該算法的優(yōu)劣,選取了幾類常見的模式識(shí)別算法進(jìn)行比較:加權(quán)近鄰算法(weighted-nearest neighbor,WKNN)、反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)、概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)以及支持向量機(jī)(support vector machine,SVM)。從數(shù)據(jù)集中隨機(jī)選取80%作為上述算法的訓(xùn)練數(shù)據(jù),剩余20%作為測試數(shù)據(jù),使用上述算法分別對(duì)無人機(jī)工況進(jìn)行識(shí)別,并將識(shí)別結(jié)果與PRDD算法的結(jié)果列表。如表1所示。
表1 不同模式識(shí)別算法的識(shí)別結(jié)果
由表1可知:文章所提算法在識(shí)別準(zhǔn)確率和運(yùn)行時(shí)間方面較其他算法具有明顯優(yōu)勢(shì),進(jìn)一步驗(yàn)證了算法的有效性和實(shí)用性。
提出了“聚類分析-模式識(shí)別”相結(jié)合的多工況識(shí)別技術(shù)路線。聚類分析階段從數(shù)據(jù)挖掘角度分析FW-UAV飛行數(shù)據(jù),使用非監(jiān)督改進(jìn)型密度聚類算法G-DBSCAN解決了FW-UAV工況劃分難題,與工況識(shí)別緊密結(jié)合,融合主成分分析法,提出了基于多維度分解的快速工況識(shí)別算法。在已有聚類核心點(diǎn)類標(biāo)的基礎(chǔ)上,充分利用維度分解的計(jì)算便利性,通過執(zhí)行查找和組合邏輯運(yùn)算減小了計(jì)算開銷,并進(jìn)一步進(jìn)行精確識(shí)別。相比較于傳統(tǒng)模式識(shí)別算法,能夠在保持較高工況識(shí)別準(zhǔn)確率的同時(shí)有效提高算法效率。