潘新龍, 王海鵬, 何友, 熊偉, 周偉
海軍航空工程學(xué)院 信息融合研究所, 煙臺 264001
基于多維航跡特征的異常行為檢測方法
潘新龍*, 王海鵬*, 何友, 熊偉, 周偉
海軍航空工程學(xué)院 信息融合研究所, 煙臺 264001
在信息融合領(lǐng)域,利用數(shù)據(jù)挖掘中的異常檢測技術(shù),可以基于目標(biāo)的多維航跡特征來挖掘目標(biāo)的異常行為?,F(xiàn)有軌跡異常檢測方法主要檢測目標(biāo)的位置異常,沒有充分利用目標(biāo)的屬性、類型、位置、速度和航向等多維特征,在挖掘目標(biāo)的異常行為時具有局限性。通過定義多因素定向Hausdorff距離和構(gòu)造多維度局部異常因子,提出了一種基于多維航跡特征的異常行為檢測方法,通過對多維航跡數(shù)據(jù)的異常檢測,實現(xiàn)對目標(biāo)異常行為的挖掘。在仿真軍事場景和真實的民用場景上進(jìn)行了實驗分析,所提方法都能有效的檢測出目標(biāo)的異常行為。
異常行為; 航跡; 多維特征; 局部異常因子; Hausdorff距離
隨著目標(biāo)探測手段的不斷豐富和多傳感器信息融合技術(shù)[1]的不斷完善,各種各樣的目標(biāo)被檢測、跟蹤和識別,乃至形成連續(xù)穩(wěn)定的目標(biāo)航跡。海量的目標(biāo)航跡數(shù)據(jù)在各種目標(biāo)情報處理系統(tǒng)、預(yù)警監(jiān)視系統(tǒng)、航行管制系統(tǒng)和視頻監(jiān)控系統(tǒng)中存儲和積累,這些航跡數(shù)據(jù)中蘊(yùn)含著大量的信息和知識。作為數(shù)據(jù)庫知識發(fā)現(xiàn)中重要步驟的數(shù)據(jù)挖掘技術(shù)[2-3]依靠跨學(xué)科的特點(diǎn)已經(jīng)在各個領(lǐng)域得到了廣泛應(yīng)用,軌跡數(shù)據(jù)挖掘技術(shù)[4]也成為數(shù)據(jù)挖掘領(lǐng)域的一個熱點(diǎn)。在信息融合領(lǐng)域,利用數(shù)據(jù)挖掘中的異常檢測技術(shù),可以基于目標(biāo)的多維航跡特征來挖掘目標(biāo)的異常行為,實現(xiàn)對異常情報的智能處理,這對于態(tài)勢評估、威脅估計和指揮決策都具有非常重要的意義。
目標(biāo)航跡數(shù)據(jù)通常是由多維數(shù)據(jù)點(diǎn)組成的多維序列,通過對多維航跡的異常檢測,可以挖掘目標(biāo)的異常行為。很多學(xué)者在異常檢測和軌跡異常檢測方面進(jìn)行了大量的研究。Chandola等對異常檢測技術(shù)、分類、應(yīng)用范圍和優(yōu)缺點(diǎn)進(jìn)行了全面的概述[5-6]?,F(xiàn)有異常檢測方法可以分為基于統(tǒng)計的異常檢測[7]、基于距離的異常檢測[8]、基于密度的異常檢測[9]、基于深度的異常檢測[10]和基于偏離的異常檢測[11]等。軌跡異常檢測就是找出偏離其周圍軌跡運(yùn)動規(guī)律達(dá)到一定程度的軌跡?,F(xiàn)有軌跡異常檢測方法可以分為基于抽取軌跡全局特征的方法[12]、基于分類器的方法[13-14]和基于點(diǎn)集(軌跡片段)相似度檢測的方法[15-16]等。這些方法主要檢測目標(biāo)航跡的位置異常,沒有充分利用目標(biāo)的屬性、類型、位置、速度和航向等多維特征,在挖掘目標(biāo)的異常行為時具有局限性。
本文針對現(xiàn)有軌跡異常檢測方法的局限性,提出了一種基于多維航跡特征的異常行為檢測方法。利用目標(biāo)的屬性、類型、位置、速度和航向特征,通過對多維航跡數(shù)據(jù)的異常檢測,實現(xiàn)對目標(biāo)異常行為的挖掘。
航跡數(shù)據(jù)是由目標(biāo)數(shù)據(jù)點(diǎn)組成的序列,根據(jù)應(yīng)用場景,可將航跡數(shù)據(jù)分為預(yù)警監(jiān)視航跡數(shù)據(jù),航行管制航跡數(shù)據(jù)和視頻監(jiān)控航跡數(shù)據(jù)等,根據(jù)目標(biāo)的類型,可將航跡數(shù)據(jù)分為飛機(jī)航跡數(shù)據(jù)、船舶航跡數(shù)據(jù)、車輛航跡數(shù)據(jù)、行人航跡數(shù)據(jù)、動物航跡數(shù)據(jù)和龍卷風(fēng)航跡數(shù)據(jù)等。目標(biāo)航跡數(shù)據(jù)通常是由多維數(shù)據(jù)點(diǎn)組成的多維序列,例如,在廣播式自動相關(guān)監(jiān)視系統(tǒng)(Automatic Dependent Surveillance Broadcast, ADS-B)[17-18]中,航跡數(shù)據(jù)通常包括飛機(jī)編號、時間、經(jīng)度、緯度、高度、速度及航向等多維特征。在預(yù)警監(jiān)視情報處理系統(tǒng)中,航跡數(shù)據(jù)通常包括目標(biāo)的批號、屬性、類別、數(shù)量、型號、機(jī)/舷號、時間、經(jīng)度、維度、高度、速度及航向等多維特征。
航跡可以表示成如下集合的形式:
TD={TR1,TR2…,TRi,…,TRn}
(1)
式中:TD為航跡集合,i∈[1,n]為航跡編號,n為航跡總條數(shù);航跡TRi為由若干個多維航跡點(diǎn)按照時間順序組成的一個多維航跡點(diǎn)序列:
TRi={Pi1,Pi2,…,Pij,…,Pim}
(2)
式中:Pij為第i條航跡中的第j個多維航跡點(diǎn),j∈[1,m]為航跡點(diǎn)編號,m為航跡點(diǎn)總條數(shù),對于不同的航跡TRi,航跡點(diǎn)總數(shù)m不一定相同。航跡點(diǎn)Pij為一個具有多維特征的向量,其表達(dá)式為
Pij=[label attribute category … time
longitude latiude altitude velocity course]
(3)
包含表示第i條航跡中的第j個多維航跡點(diǎn)的目標(biāo)編號、屬性、類型、時間、經(jīng)度、維度、高度、速度和航向等特征。對于不同的航跡數(shù)據(jù),航跡點(diǎn)Pij包含的多維特征也不一定相同。
在D維特征向量空間Y={y1,y2,…,yD}中,特征選擇是指從原有的D維特征空間中刪去一些特征描述量,從而得到精簡后的特征空間。在這個特征空間中,樣本由n維的特征向量描述:X={x1,x2,…,xn},n Hausdorff距離是描述兩組集合之間相似程度的一種度量。在幾何計算和圖像處理領(lǐng)域非常著名,廣泛應(yīng)用于形狀匹配和圖形識別方面[19-20]。給定兩條航跡TRA、TRB,設(shè)TRA到TRB的定向Hausdorff距離為δH,則 (4) 式中:dist(Pa,Pb)為兩點(diǎn)之間只考慮位置特征的歐氏距離;δH(TRA,TRB)為TRA中的點(diǎn)到TRB中點(diǎn)的最近距離中的最大距離,表示航跡TRA和TRB的相似程度。δH(TRA,TRB)并不要求TRB的每一部分都與TRA的某一部分相匹配,當(dāng)TRA和TRB不完整時,δH(TRA,TRB)也能很好地度量它們之間的相似程度。航跡TRA和TRB如圖1所示。 但是兩點(diǎn)之間的歐氏距離只考慮了固定的位置特征,沒有考慮速度、航向向等動態(tài)特征。本文通過構(gòu)造兩點(diǎn)之間的多因素距離mfdist(Pa,Pb),來定義航跡TRA到TRB的多因素定向Hausdorff距離δM??紤]兩個矢量點(diǎn)之間的位置特征、速度特征和航向特征,定義兩點(diǎn)之間的多因素距離為 mfdist(Pa,Pb)=wd·dist(Pa,Pb)+ wv·dist(vPa,vPb)+wθ·dist(θPa,θPb) (5) 式中:vPa與vPb為點(diǎn)Pa與點(diǎn)Pb的速度;θPa與θPb為點(diǎn)Pa與點(diǎn)Pb的航向;dist(vPa,vPb)為點(diǎn)Pa與點(diǎn)Pb之間速度特征的歐氏距離; dist(θPa,θPb)為點(diǎn) 圖1 航跡間的定向Hausdorff距離示意圖
Fig.1 Illustration of directed Hausdorff distance between trajectories
Pa與點(diǎn)Pb之間航向特征的歐氏距離;wd為位置特征的權(quán)重因子;wv為速度特征的權(quán)重因子;wθ為航向特征的權(quán)重因子,權(quán)重因子的取值取決于多因素距離的應(yīng)用場景,滿足wd≥0,wv≥0,wθ≥0和wd+wv+wθ=1。
在一個應(yīng)用場景中,如果只需考慮位置異常的情況,那么wd=1,wv=0,wθ=0即可。如果位置異常、速度異常和航向異常都需要考慮,就需要合理的選取這3個權(quán)重因子的取值,使構(gòu)造的多因素距離能夠均衡的體現(xiàn)出位置、速度和航向特征的影響。由于不同特征的量綱不同,所以不能平均分配3個權(quán)重,可以根據(jù)不同特征取值的大小差別程度按比例確定特征權(quán)重。在某一個具體的應(yīng)用場景,一旦特征權(quán)重確定,在以后的異常檢測中,就可以采用這組權(quán)重取值。
基于定義的多因素距離mfdist(Pa,Pb),可以將定向Hausdorff距離的維度進(jìn)行擴(kuò)展,定義多維航跡TRA和多維航跡TRB之間的多因素定向Hausdorff距離為
(6)
式中:δM(TRA,TRB)可以表示多維航跡TRA和多維航跡TRB的相似程度,δM(TRA,TRB)不要求TRB的每一部分都與TRA的某一部分相匹配,當(dāng)TRA和TRB不完整時,δM(TRA,TRB)也能很好地度量它們之間的相似程度。
局部異常因子[21](Local Outlier Factor,LOF)是一個基于密度的異常度量,在異常檢測領(lǐng)域具有非常廣泛的應(yīng)用。LOF可以很好地解決局部密度不一致的異常檢測問題[22],比基于距離的異常檢測算法更適用于航跡的異常檢測。LOF雖然克服了基于距離的方法的部分缺陷,但是LOF是基于k近鄰距離提出來的,距離計算采用傳統(tǒng)的歐氏距離,因此,LOF只能度量歐氏距離體現(xiàn)的位置異常情況。對于多維的目標(biāo)航跡數(shù)據(jù),需要度量目標(biāo)的位置異常、速度異常和航向異常,此時LOF是不能夠勝任的。因此,基于多因素定向Hausdorff距離,構(gòu)造一個多維度局部異常因子(Multi Dimensional Local Outlier Factor,MDLOF)作為多維航跡的異常度量,MDLOF可以不僅可以度量目標(biāo)的位置異常,還可以同時度量目標(biāo)的速度異常和航向異常。
對于每條多維航跡TRi∈TD,分3步來構(gòu)造MDLOF。
步驟1確定每條航跡的近鄰航跡。為了確定TRi的近鄰航跡,先定義它的多因素近鄰邊界距離為
δM border(TRi,k)=δM(TRi,NN(TRi,k))
(7)
式中:NN(TRi,k)為多維航跡數(shù)據(jù)集中與TRi的多因素定向Hausdorff距離第k近的航跡。那么,TRi的近鄰航跡為
N(TRi,k)={TRj∈TDTRi|δM(TRi,TRj)≤
δM border(TRi,k)}
(8)
步驟2估計每條航跡的近鄰密度。為了估計TRi的近鄰密度,先定義航跡TRi到TRj的多因素可達(dá)距離為
δM reach(TRi,TRj,k)=
max{δM border(TRj,k),δM(TRj,TRi)}
(9)
那么,TRi的近鄰密度可以定義為
(10)
式中:使用δM reach代替δM可以對近鄰密度進(jìn)行平滑,k的取值越大,平滑的效果越明顯。
步驟3計算每條航跡的多維度局部異常因子。通過比較TRi與TRi近鄰航跡的近鄰密度來計算TRi的多維度局部異常因子:
(11)
當(dāng)航跡TRi的異常程度越大,多維度局部異常因子的取值越大。
本文基于定義的多因素定向Hausdorff距離和構(gòu)造的多維度局部異常因子,設(shè)計了一種基于多維航跡特征的異常行為檢測(MTC-ABD)方法。MTC-ABD流程為
步驟1輸入近鄰數(shù)k,異常閾值ε和多維航跡數(shù)據(jù)集TD={TR1,TR2,…,TRn}。
步驟2利用多維航跡數(shù)據(jù)中的位置、速度和航向特征,計算目標(biāo)航跡間的多因素定向Hausdorff距離δM(TRi,TRj)。
步驟3利用近鄰數(shù)和目標(biāo)航跡間的多因素定向Hausdorff距離,計算每條航跡TRi的多因素近鄰邊界距離δM border(TRi,k)。
步驟4利用目標(biāo)航跡間的多因素定向Hausdorff距離和每條航跡TRi的多因素近鄰邊界距離δM border(TRi,k),確定每條航跡TRi的近鄰航跡N(TRi,k)。
步驟5利用目標(biāo)航跡間的多因素定向Hausdorff距離和每條航跡TRi的多因素近鄰邊界距離δM border(TRi,k),計算每條航跡到它的近鄰航跡的多因素可達(dá)距離δM reach(TRi,TRj,k)。
步驟6利用每條航跡到它的近鄰航跡的多因素可達(dá)距離δM reach(TRi,TRj,k),計算每條航跡的近鄰密度ρ(TRi,k)。
步驟7利用每條航跡和它的近鄰航跡的近鄰密度,計算每條航跡的多維度局部異常因子MDLOF(TRi,k)。
步驟8利用輸入的異常閾值對每條航跡進(jìn)行異常檢測判決。
由于本文所提的方法是對靜態(tài)數(shù)據(jù)的離線異常檢測,所以可以通過實驗驗證確定近鄰數(shù)k和異常閾值ε,在某一個具體的應(yīng)用場景,一旦k和ε的取值確定,在以后的異常檢測中,就可以采用這組取值。MTC-ABD方法的偽代碼如算法1所示。
算法1:MTC-ABD
輸入: 1.多維航跡數(shù)據(jù)集TD={TR1,TR2,…,TRn}。
2.近鄰數(shù)k和異常閾值ε。
for eachTRi,TRj∈TD∧i≠jdo
δM border(TRi,k)=δM(TRi,NN(TRi,k))
N(TRi,k)=TRj∈TDTRi|
δM(TRi,TRj)≤δM border(TRi,k)
end for
for eachTRido
forTRj∈N(TRi,k) do
δM reach(TRi,TRj,k)=
max{δM border(TRj,k),δM(TRj,TRi)}
end for
end for
for eachTRido
end for
for eachTRido
forTRNj∈N(TRi,k) do
MDLOF(TRi,k)=
if MDLOF(TRi,k)>εthen
else
end if
end for
end for
為了驗證本文提出的基于多維特征的異常行為檢測算法的異常檢測性能,5.1節(jié)在一個模擬軍用場景的仿真數(shù)據(jù)集上進(jìn)行異常行為檢測實驗,5.2節(jié)在一個民用場景的ADS-B數(shù)據(jù)集上進(jìn)行異常行為檢測實驗,并對結(jié)果進(jìn)行分析。
5.1 軍用場景仿真實驗分析
在這個實驗中,生成一個航跡數(shù)據(jù)集來模擬敵方軍用飛機(jī)在一個空域的飛行行為,然后用MTC-ABD算法對其中的異常行為進(jìn)行檢測,并對實驗結(jié)果進(jìn)行分析。
5.1.1 數(shù)據(jù)集
本實驗利用Piciarelli公開的目標(biāo)航跡生成程序[23],產(chǎn)生包含二維位置特征的目標(biāo)航跡數(shù)據(jù),然后人為添加目標(biāo)的屬性特征、類型特征、速度特征和航向特征,并對其中的部分目標(biāo)航跡進(jìn)行修改,構(gòu)造一個新的目標(biāo)多維航跡數(shù)據(jù)集。設(shè)定目標(biāo)的運(yùn)動方向為從點(diǎn)(xi,yi)到點(diǎn)(xi+1,yi+1),兩點(diǎn)之間的時間間隔相等。如圖2所示,目標(biāo)的速度特征和航向特征可以由式(12)和式(13)計算得出。
(12)
(13)
這個數(shù)據(jù)集包括2 000條代表目標(biāo)行為的多維航跡數(shù)據(jù),每條航跡數(shù)據(jù)包括32個數(shù)據(jù)點(diǎn)。具體構(gòu)造過程如下:首先,利用目標(biāo)航跡生成程序產(chǎn)生10個簇的2 000條對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)和1 000條對應(yīng)目標(biāo)位置異常的異常航跡數(shù)據(jù),目標(biāo)航跡生成程序中的隨機(jī)參數(shù)設(shè)為0.6。將這3 000條航跡的屬性標(biāo)簽設(shè)置為2,類型標(biāo)簽設(shè)置為1,速度信息和航向信息由式(12)和式(13)計算得出,這樣就得到了3 000條目標(biāo)多維航跡數(shù)據(jù)。然后,從每個對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)簇中隨機(jī)取出1條目標(biāo)航跡,修改這10條航跡數(shù)據(jù),使這10條航跡對應(yīng)的目標(biāo)速度為正常目標(biāo)速度的2倍;再從每個對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)簇中隨機(jī)取出1條目標(biāo)航跡,修改這10條航跡數(shù)據(jù),使這10條航跡對應(yīng)的目標(biāo)航向與正常目標(biāo)的航向相反;再從每個對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)簇中隨機(jī)取出1條目標(biāo)航跡,刪除這10條航跡數(shù)據(jù);從1 000條對應(yīng)目標(biāo)位置異常的異常航跡數(shù)據(jù)中隨機(jī)取出10條。最后,將10個簇中剩余的1 970條對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)、10條對應(yīng)目標(biāo)位置異常的航跡數(shù)據(jù)、10條對應(yīng)目標(biāo)速度異常的航跡數(shù)據(jù)和10條對應(yīng)目標(biāo)航向異常的航跡數(shù)據(jù),共2 000條航跡數(shù)據(jù)隨機(jī)排列順序,形成這個實驗用的數(shù)據(jù)集,這個數(shù)據(jù)集中包括1 970條對應(yīng)目標(biāo)正常行為的航跡數(shù)據(jù)和30條對應(yīng)目標(biāo)異常行為的航跡數(shù)據(jù)。圖3為這個數(shù)據(jù)集中的2 000條航跡。1 970條細(xì)航跡對應(yīng)目標(biāo)的正常行為模式,30條粗航跡對應(yīng)目標(biāo)的異常行為模式,其中10條粗連線畫出航跡對應(yīng)位置異常,10條粗點(diǎn)劃線畫出的航跡對應(yīng)速度異常,10條粗點(diǎn)線畫出的航跡代表航向異常。這30條異常航跡對應(yīng)的異常行為可以依次表示為2101,2102,2103,…,2129,2130。
圖2 目標(biāo)的速度和航向示意圖
Fig.2 Illustration of target velocity and course
圖3 實驗數(shù)據(jù)集中的2 000條航跡示意圖
Fig.3 Plot of 2000 trajectories in experiment dataset
5.1.2 結(jié)果分析
利用MTC-ABD算法對圖3所示的航跡數(shù)據(jù)集中的多維數(shù)據(jù)對應(yīng)的目標(biāo)行為進(jìn)行異常檢測。
本實驗通過計算異常檢測的敏感度(Sensitivity)、準(zhǔn)確度(Precision)、虛警率(False alarm rate)和異常檢測得分(F1-score)來評價MTC-ABD算法的異常檢測性能[24]。敏感度為對應(yīng)目標(biāo)異常行為的航跡被檢測為異常的比率,準(zhǔn)確度為被檢測為異常的航跡中真正對應(yīng)目標(biāo)異常行為的航跡所占的比率,虛警率為對應(yīng)目標(biāo)正常行為的航跡被檢測為異常的比率。F1-score由Sensitivity和Precision共同決定:
(14)
F1-score可以很好地評估異常檢測器的分類性能。
本實驗場景根據(jù)位置、速度和航向特征的取值大小差別程度,按比例確定權(quán)重因子wd、wv和wθ的取值,使構(gòu)造的多因素距離能夠均衡地體現(xiàn)出位置、速度和航向特征的影響。
下面通過實驗的方法討論近鄰數(shù)k和異常閾值ε的取值情況。k取計算k近鄰距離時常用的2、3、4和5。因為MDLOF(TRi,k)∈[0,1],所以ε∈[0,1],ε從0到1范圍內(nèi)均勻地取101個點(diǎn)進(jìn)行實驗。在k取值固定的情況下,計算F1-score 隨ε取值的變化情況,并繪制曲線圖。
圖4為異常檢測得分F1-score隨異常閾值ε取值的變化曲線,從圖中可以看出,近鄰數(shù)k取2、3、4、5時,異常檢測得分都可以達(dá)到較高的水平,而異常閾值ε的取值對異常檢測得分的影響較大。因此,在一個具體的應(yīng)用場景中,需要在固定k值的情況下,選取合適的ε取值,使異常檢測得分達(dá)到預(yù)期的水平。在本實驗中,取k=4,ε=0.58分析MTC-ABD算法的性能以及隨著數(shù)據(jù)規(guī)模的變化情況。
圖4 異常檢測得分F-score隨ε的變化情況
Fig.4 Plot of F-score dependent on the value of ε
在逐漸增大數(shù)據(jù)規(guī)模的情況下對該多維航跡數(shù)據(jù)集進(jìn)行異常檢測,并利用多項式擬合的方法繪制了敏感度、準(zhǔn)確度、虛警率和異常檢測得分隨著數(shù)據(jù)規(guī)模變化的曲線圖。
圖5(a)為目標(biāo)異常行為檢測的敏感度隨數(shù)據(jù)集規(guī)模變化的曲線,從圖中可以看出,在數(shù)據(jù)集規(guī)模較小時,隨著數(shù)據(jù)集規(guī)模的不斷增大,目標(biāo)異常行為檢測的敏感度逐漸增加,當(dāng)數(shù)據(jù)集達(dá)到一定規(guī)模后,敏感度始終保持在很高的水平。這說明在這個仿真的軍用場景中,MTC-ABD算法可以很好地將目標(biāo)的異常行為檢測為異常。
圖5(b)為目標(biāo)異常行為檢測的準(zhǔn)確度隨數(shù)據(jù)集規(guī)模變化的曲線,從圖中可以看出,隨著數(shù)據(jù)集規(guī)模的不斷增大,目標(biāo)異常行為檢測的準(zhǔn)確度逐漸增加和稍微回落振蕩,始終保持在較高的水平。這說明在這個仿真的軍用場景中,被MTC-ABD算法檢測為異常的行為絕大部分是真正的目標(biāo)異常行為。
圖5(c)為目標(biāo)異常行為檢測的虛警率隨數(shù)據(jù)集規(guī)模變化的曲線,從圖中可以看出,在數(shù)據(jù)集規(guī)模較小時,隨著數(shù)據(jù)集規(guī)模的不斷增大,目標(biāo)異常行為檢測的虛警率逐漸減小,當(dāng)數(shù)據(jù)集達(dá)到一定規(guī)模后,虛警率始終保持在非常低的水平。這說明在這個仿真的軍用場景中,MTC-ABD算法將目標(biāo)的正常行為檢測為異常行為的概率非常低,這對于很多應(yīng)用尤其是軍事應(yīng)用來說是非常重要的。
圖5(d)為目標(biāo)異常行為檢測得分隨數(shù)據(jù)集規(guī)模變化的曲線,從圖中可以看出,在數(shù)據(jù)集規(guī)模較小時,隨著數(shù)據(jù)集規(guī)模的不斷增大,目標(biāo)異常行為檢測得分逐漸增加,當(dāng)數(shù)據(jù)集達(dá)到一定規(guī)模后,異常檢測得分始終保持在很高的水平。這說明在這個仿真的軍用場景中,MTC-ABD算法具有很好的目標(biāo)異常行為檢測性能,可以非常有效地檢測出敵方軍用飛機(jī)飛行訓(xùn)練的異常行為,這對于掌握敵機(jī)的行為改變規(guī)律,進(jìn)行提前預(yù)警和防范,具有非常重要的意義。
圖5 敏感度、準(zhǔn)確度、虛警率和異常檢測得分隨數(shù)據(jù)集規(guī)模的變化情況
Fig.5 Plot of sensitivity, precision, falase alarm rate and F-score dependent on the size of dataset
5.2 民用場景真實數(shù)據(jù)驗證
在這個實驗中,對一個廣播式自動相關(guān)監(jiān)視系統(tǒng)接收到的部分民用航班飛行的航跡數(shù)據(jù)進(jìn)行處理,得到一個實驗用的多維航跡數(shù)據(jù)集,然后用MTC-ABD算法對其中的異常行為進(jìn)行檢測。由于該數(shù)據(jù)集是真實的民用航班飛行航跡數(shù)據(jù),事先并不知道其中哪些為異常航跡,所以無法進(jìn)行如5.1節(jié)所示的仿真分析,但是可以將檢測出的異常行為表示出來,用于查找民航飛機(jī)出現(xiàn)飛行異常的規(guī)律,進(jìn)而查找出現(xiàn)飛行異常的原因,修正飛行程序等。
5.2.1 數(shù)據(jù)集
該ADS-B數(shù)據(jù)集包括2015年5月接收到的237條民航飛行航跡,每條航跡包括若干個多維數(shù)據(jù)點(diǎn)。可以直接讀取目標(biāo)的維度、經(jīng)度、高度組成的位置特征,速度特征和航向特征,目標(biāo)屬性為友方,用標(biāo)簽3表示,類型為民用飛機(jī),用標(biāo)簽2表示。
為了計算目標(biāo)航跡之間的多因素Hausdorff距離,將目標(biāo)航跡數(shù)據(jù)點(diǎn)的位置特征由地理坐標(biāo)中的維度、經(jīng)度和高度坐標(biāo)轉(zhuǎn)換到局部直角坐標(biāo)系中。在轉(zhuǎn)換時,選擇北京首都國際機(jī)場的地理坐標(biāo)作為局部直角坐標(biāo)系的原點(diǎn),然后將這237條目標(biāo)航跡的所有數(shù)據(jù)點(diǎn)都轉(zhuǎn)換到這個局部直角坐標(biāo)系中。圖6為這些民用航班在三維和二維空間中的航跡。
5.2.2 實驗結(jié)果
利用MTC-ABD算法對這個ADS-B航跡數(shù)據(jù)集對應(yīng)的民用航班的飛行行為進(jìn)行異常檢測。采用5.1節(jié)所述的方法確定權(quán)重因子wd、wv和wθ的取值,在固定k=4的情況下,取ε=0.4進(jìn)行異常檢測實驗。
實驗結(jié)果得到了6條異常航跡,分別對應(yīng)2015年5月份該區(qū)域內(nèi)民用航班飛行的6種異常行為。因為民用航班的目標(biāo)屬性為友方,用標(biāo)簽3表示,類型為民用飛機(jī),用標(biāo)簽2表示,所以這6種異常行為可以表示為3201、3202、3203、3204、3205和3206。圖7為異常行為示意圖,箭頭表示民用航班的飛行方向。
圖6 民用航班在三維和二維空間中的航跡
Fig.6 Plot of civilian flight trajectories in three and two dimensional plane
圖7 民用航班異常行為示意圖
Fig.7 Plot of anomalous behaviors for civilian flights
由圖7可以看出,異常行為3205可能是ADS-B在發(fā)射接收過程中造成的目標(biāo)航跡接收不全。異常行為3201、3202、3203、3204和3206都是該區(qū)域內(nèi)民用航班偏離固定飛行程序的異常行為,發(fā)現(xiàn)這些異常行為對于查找民航飛機(jī)出現(xiàn)飛行異常的規(guī)律,進(jìn)而查找出現(xiàn)飛行異常的原因,修正飛行程序等具有非常重要的參考意義。
本文利用目標(biāo)的多維航跡特征,提出了一種基于多維航跡特征的異常行為檢測方法,并進(jìn)行了實驗分析驗證。
1) 利用目標(biāo)的位置特征、速度特征和航向特征,定義了多因素距離,并將定向Hausdorff距離進(jìn)行擴(kuò)展,定義了多因素定向Hausdorff距離,從而度量目標(biāo)行為之間的相似程度。
2) 針對局部異常因子不能很好的度量目標(biāo)行為之間差異程度的問題,本文利用定義的多因素定向Hausdorff距離,構(gòu)建了多維度異常因子,可以有效的度量目標(biāo)行為之間的差異程度。
3) 基于定義的多因素定向Hausdorff距離和構(gòu)造的多維度局部異常因子,設(shè)計了一種基于多維特征的異常行為檢測(MTC-ABD)算法,并給出了偽代碼,用于目標(biāo)異常行為的檢測。
4) 在一個模擬軍用場景的仿真數(shù)據(jù)集上對MTC-ABD算法進(jìn)行了仿真實驗,使用多個指標(biāo)分析了該算法的異常檢測性能。在一個真實的ADS-B民用航班數(shù)據(jù)集上利用MTC-ABD算法進(jìn)行了異常行為檢測實驗,并利用目標(biāo)的屬性特征、類型特征和異常航跡序號設(shè)置異常行為標(biāo)簽,對目標(biāo)的異常行為進(jìn)行了可視化,得到了非常有意義的結(jié)果。
[1] 何友, 王國宏, 關(guān)欣, 等. 信息融合理論及應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2010: 1-15.
HE Y, WANG G H, GUAN X, et al. Information fusion theory with applications[M]. Beijing: Publishing House of Electronics Industry, 2010: 1-15 (in Chinese).
[2] CHEN M S, HAN J, YU P S. Data mining: An overview from a database perspective[J]. IEEE Transactions on Knowledge and Data Engineering, 1997, 8(6): 866-883.
[3] HAN J, KAMBER M. Data mining: Concepts and techniques[M]. San Francisco: Morgan Kaufmann, 2001: 1-18.
[4] ZHENG Y. Trajectory data mining: An overview[J]. ACM Transactions on Intelligent Systems and Technology, 2015, 6(3): 1-41.
[5] CHANDOLA V, BANERJEE A, KUMAR V. Anomaly detection: A survey[J]. ACM Computing Surveys, 2009, 41(3): 1-58.
[6] CHANDOLA V, BANERJEE A, KUMAR V. Anomaly detection for discrete sequences: A survey[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(99): 1-16.
[7] BARNETT V, LEWIS T. Outliers in statistical data[M]. New York: Wiley, 1994: 24-26.
[8] KNORR E M, NG R T, TUCAKOV V. Distance-based outliers: Algorithms and applications[J]. International Journal on Very Large Data Bases, 2000, 8(3): 237-253.
[9] JIN W, TUNG A K H, HAN J, et al. Ranking outliers using symmetric neighborhood relationship[J]. Lecture Notes in Computer Science, 2006, 3918: 577-593.
[10] STRUYF A, ROUSSEEUW P J. High-dimensional computation of the deepest location[J]. Computational Statistics and Data Analysis, 2000, 34: 415-426.
[11] SARAWAGI S, AGRAWAL R, MEGIDDO N. Discovery driven exploration of OLAP data cubes[M]. Berlin: Springer, 1998: 67-69.
[12] KNORR E M, NG R T. Algorithms for mining distanced-based outliers in large datasets[C]//Proceedings of 24th International Conference on Very Large Data Bases. New York: Morgan Kaufmann, 1998: 392-403.
[13] LI X, HAN J, KIM S. Motion-Alert: Automatic anomaly detection in massive moving objects[C]//IEEE International Conference on Intelligence and Security Informatics. Piscataway, NJ: IEEE Press, 2006: 166-177.
[14] LI X, HAN J, KIM S, et al. ROAM: Rule-based and motif-based anomaly detection in massive moving object data sets[C]//Proceedings of 7th SIAM International Conference on Data Mining. Philadelphia: SIAM Press, 2007: 273-284.
[15] LEE J G, HAN J, LI X. Trajectory outlier detection: A partition-and-detect framework[C]//Proceedings of 24th International Conference on Data Engineering. Washington, D.C.: IEEE Computer Society, 2008: 140-149.
[16] 劉良旭, 喬少杰, 劉賓, 等. 基于R-Tree的高效異常軌跡檢測算法[J]. 軟件學(xué)報, 2009, 20(9): 2426-2435.
LIU L X, QIAO S J, LIU B, et al. Efficient trajectory outlier detection algorithm based on R-Tree[J]. Journal of Software, 2009, 20(9): 2426-2435 (in Chinese).
[17] YANG A, TAN X, BAEK J, et al. A new ADS-B authentication framework based on efficient hierarchical identity-based signature with batch verification[J]. IEEE Transactions on Services Computing, 1939, PP(99): 1.
[18] 沈笑云, 唐鵬, 張思遠(yuǎn), 等. ADS-B統(tǒng)計數(shù)據(jù)的位置導(dǎo)航不確定類別質(zhì)量分析[J]. 航空學(xué)報, 2015, 36(9): 3128-3136.
SHEN X Y, TANG P, ZHANG S Y, et al. Quality analysis of navigation uncertain category for position based on ADS-B statistical data[J]. Acta Aeronautica et Astronautica Sinica, 2015, 36(9): 3128-3136 (in Chinese).
[19] HUTTENLOCHER D P, KLANDERMAN G A, RUCKLIDGE W A. Comparing images using the Hausdorff distance[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, 15(9):850-863.
[20] GAO Y, LEUNG M K H. Line segment Hausdorff distance on face matching[J]. Pattern Recognition, 2002, 35(2): 361-371.
[21] BREUNIG M M, KRIEGEL H P , NG R T, et al. LOF: Identifying density-based local outliers[C]//Proceedings of ACM SIGMOD International Conference on Management of Data, 2000, 29(2): 93-104.
[22] JANSSENS J, POSTMA E. One-class classification with LOF and LOCI: An empirical comparison[C]//Proceedings of the 18th Belgian-Dutch Conference on Machine Learning, 2009: 1021-1040.
[23] PICIARELLI C, MICHELONI C, FORESTI G. Trajectory-based anomalous event detection[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(11): 1544-1554.
[24] LAXHAMMAR R, FALKMAN G. Online learning and sequential anomaly detection in trajectories[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(6): 1158-1173.
Anomalousbehaviordetectionmethodbasedonmultidimensionaltrajectorycharacteristics
PANXinlong*,WANGHaipeng*,HEYou,XIONGWei,ZHOUWei
InstituteofInformationFusion,NavalAeronauticalandAstronauticalUniversity,Yantai264001,China
Intheinformationfusiondomain,anomalousbehaviorscouldbeminedbasedonmultidimensionaltrajectorycharacteristicsbyusingtheanomalousdetectiontechniqueindatamining.Previoustrajectoryanomalydetectionalgorithmsmainlydetectthepositionanomalies,withoutmakingfulluseoftheattribute,category,position,velocity,andcoursecharacteristics.Inordertoovercomethislimitation,wedefinethemulti-factorHausdorffdistance,constructthemultidimensionallocaloutlierfactor,andproposeamethodfordetectinganomalousbehaviorsbasedonmultidimensionaltrajectorycharacteristics.Themethodcanmineanomalousbehaviorsbasedondetectingmultidimensionaltrajectories.Weconductedexperimentsonsimulatedmilitaryscenarioandrealcivilianscenario,theproposedmethodcaneffectivelydetecttheanomalousbehaviorofthetarget.
anomalousbehavior;trajectory;multidimensionalcharacteristics;localoutlierfactor;Hausdorffdistance
2016-05-17;Revised2016-06-22;Accepted2016-07-18;Publishedonline2016-07-191706
URL:www.cnki.net/kcms/detail/11.1929.V.20160719.1706.004.html
s:NationalNaturalScienceFoundationofChina(61531020,61471383,91538201);MajorScienceandTechnologyProjectsinShandongProvince(2015ZDZX01001)
2016-05-17;退修日期2016-06-22;錄用日期2016-07-18; < class="emphasis_bold">網(wǎng)絡(luò)出版時間
時間:2016-07-191706
www.cnki.net/kcms/detail/11.1929.V.20160719.1706.004.html
國家自然科學(xué)基金 (61531020,61471383,91538201); 山東省科技重大專項基金 (2015ZDZX01001)
*
.E-mailairadar@126.com;whp5691@163.com
潘新龍, 王海鵬, 何友, 等. 基于多維航跡特征的異常行為檢測方法J. 航空學(xué)報,2017,38(4):320442.PANXL,WANGHP,HEY,etal.AnomalousbehaviordetectionmethodbasedonmultidimensionaltrajectorycharacteristicsJ.ActaAeronauticaetAstronauticaSinica,2017,38(4):320442.
http://hkxb.buaa.edu.cnhkxb@buaa.edu.cn
10.7527/S1000-6893.2016.0217
V355.1; TP274.2
A
1000-6893(2017)04-320442-10
(責(zé)任編輯: 蘇磊)
*Correspondingauthor.E-mailairadar@126.com;whp5691@163.com