張浩東
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
目前對(duì)于航空異常檢測(cè)的研究多是對(duì)于某一特定故障,取相關(guān)數(shù)據(jù)訓(xùn)練之后建模,根據(jù)模型檢測(cè)異常。然而,依據(jù)飛行軌跡進(jìn)行航空異常檢測(cè)很少有人涉及。針對(duì)傳統(tǒng)的檢測(cè)方法,無(wú)法應(yīng)用于一架飛機(jī)從起飛到降落整個(gè)過(guò)程,因?yàn)槠陂g的數(shù)據(jù)項(xiàng)和數(shù)據(jù)量超出了其算法的范疇。但是,應(yīng)用于飛行軌跡的檢測(cè),我們只需要關(guān)心軌跡點(diǎn)的坐標(biāo)數(shù)據(jù),大大減少了數(shù)據(jù)量,提高了效率。
對(duì)于異常軌跡檢測(cè)的研究中,Lee等人通過(guò)計(jì)算線段Hausdorff的距離來(lái)鑒別異常軌跡[1],Li等人通過(guò)人工智能方法訓(xùn)練分類(lèi)器,以此區(qū)別異常軌跡。但是他們都忽視了對(duì)于軌跡點(diǎn)方向的研究,軌跡點(diǎn)的方向信息可以反映出當(dāng)時(shí)物體的運(yùn)動(dòng)趨勢(shì),并且該特征對(duì)軌跡的長(zhǎng)度不敏感,可以用作一個(gè)有效的異常檢測(cè)方法。并且以保證準(zhǔn)確率和提升效率為目的,本文提出雙層異常軌跡檢測(cè)方法:由粗粒度到細(xì)粒度。
如圖1所示,在5條軌跡中,明顯可以看出軌跡3屬于異常軌跡。在航空飛行中,這樣偏離正常的軌道說(shuō)明飛機(jī)在這個(gè)時(shí)間段遇到了異常狀況,有可能是內(nèi)部因素(航空器異常),也有可能是外部因素(天氣因素)??傊谶@個(gè)時(shí)間段內(nèi)有危險(xiǎn)征候,需要加強(qiáng)防范。
當(dāng)軌跡出現(xiàn)異常的時(shí)候,軌跡點(diǎn)之間的夾角也隨之發(fā)生較大的偏差。因此,方向信息也可以反映出異常情況。在這種情況下,再對(duì)異常軌跡進(jìn)行細(xì)粒度劃分,如圖1中的p0p1、p1p2和p2p3三個(gè)子軌跡,以減少不必要的數(shù)據(jù)分析,提高效率,具體再對(duì)子軌跡進(jìn)行高精度異常分析,提高準(zhǔn)確率。
圖1 軌跡示意圖
軌跡一般由一個(gè)二維的點(diǎn)集合來(lái)表示:
方便提取方向向量,對(duì)軌跡點(diǎn)進(jìn)行橫坐標(biāo)和縱坐標(biāo)分解,我們可以把軌跡表示為:
首先,定義粗粒度和細(xì)粒度分別為pipi+jb和pipi+b(j>1),b是一個(gè)基本長(zhǎng)度單位。用L表示粗粒度軌跡,用l表示粒度軌跡。
根據(jù)上一步中提取的方向特征,對(duì)軌跡進(jìn)行粗粒度的異常檢測(cè),如果θiθi+1<0則表示軌跡在點(diǎn)i處進(jìn)行了大角度的方向變化,很有可能是異常情況。以此,將軌跡點(diǎn)i作為細(xì)粒度劃分起始點(diǎn),進(jìn)一步檢測(cè)異常情況。這樣就減少了對(duì)不必要的一段數(shù)據(jù)進(jìn)行細(xì)粒度檢測(cè),于是提升了檢測(cè)效率。
在此,我們根據(jù)上一步粗粒度檢測(cè)出的異常子軌跡進(jìn)行在劃分,并進(jìn)行高精度異常檢測(cè),確保準(zhǔn)確率。
為了方便計(jì)算,因?yàn)榇至6溶壽E和細(xì)粒度軌跡的角距離一般很小而且可以認(rèn)為它們是平行的,所以我們選擇忽略角距離,也不會(huì)引起誤差。
于是,我們只需考慮以最小基本單位b為細(xì)粒度劃分單位,將檢測(cè)出的粗粒度軌跡進(jìn)行劃分。再根據(jù)粗粒度的異常判別方法進(jìn)行細(xì)粒度的異常判別。
實(shí)驗(yàn)采用西南片區(qū)500架航班中的FOQA(飛行品質(zhì)監(jiān)控)作為實(shí)驗(yàn)數(shù)據(jù),在其中的50架航班中參入異常數(shù)據(jù),異常數(shù)據(jù)是由離散數(shù)據(jù)(飛機(jī)起落架放下、升起等)和連續(xù)數(shù)據(jù)(飛機(jī)速度等)組成的異構(gòu)數(shù)據(jù),足以組成傳統(tǒng)檢測(cè)方法和本文方法的測(cè)試數(shù)據(jù)。
傳統(tǒng)檢測(cè)方法我們使用神經(jīng)網(wǎng)絡(luò)算法作為實(shí)驗(yàn)對(duì)比,取其中250架正常航班數(shù)據(jù)作為其訓(xùn)練集,其余250架含有異常數(shù)據(jù)的航班數(shù)據(jù)作為測(cè)試集。
表1
圖2 神經(jīng)網(wǎng)絡(luò)(右)和本文算法(左)實(shí)驗(yàn)效果圖
可以看出當(dāng)實(shí)驗(yàn)數(shù)據(jù)量足夠大的時(shí)候,神經(jīng)網(wǎng)絡(luò)算法已經(jīng)無(wú)法保持檢測(cè)準(zhǔn)確率在90%以上,相對(duì)于本文算法來(lái)說(shuō)較低,并且花費(fèi)時(shí)間也遠(yuǎn)遠(yuǎn)超過(guò)本文算法。所以從準(zhǔn)確率和效率來(lái)看,本文算法對(duì)大量數(shù)據(jù)的航空異常檢測(cè)是有效的。
在航空異常檢測(cè)中,本文提出的算法從傳統(tǒng)異常檢測(cè)的缺點(diǎn)入手,解決了數(shù)據(jù)量大對(duì)檢測(cè)的影響,并且提升了準(zhǔn)確率和效率。在關(guān)于軌跡研究發(fā)面提出了新的思路,用以解決航空器的軌跡異常,利用雙層粒度檢測(cè)方法在去除不必要的數(shù)據(jù)分析的同時(shí)確保了對(duì)異常情況的準(zhǔn)確檢測(cè)。
[1]J.G.Lee,J.Han,X.Li.Trajectory Outlier Detection:A Partition-and-Detect Framework.Washington:Computer Society,2008.
[2]X.Li,J.Han,S.Kim.ROAM:Rule-Based and Motif-Based Anomaly Dection in Massive Moving Object Data Sets.SIAM Press,2007.
[3]劉良旭,喬少杰,劉賓.V基于R-Tree的高效異常軌跡檢測(cè)算法.軟件學(xué)報(bào),2009,24:26-35.
[4]朱明.數(shù)據(jù)挖掘[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2002.