趙小瑞,李宏權(quán),梁復(fù)臺(tái),3,楊 凡
(1.空軍預(yù)警學(xué)院,湖北 武漢 430019;2.解放軍96714部隊(duì),福建 永安 366000;3.解放軍31121部隊(duì),江蘇 南京 210000)
預(yù)警探測體系中,目標(biāo)航跡數(shù)據(jù)具有量大、更新快、價(jià)值高等特點(diǎn)。如何高效利用目標(biāo)歷史航跡大數(shù)據(jù),從數(shù)據(jù)中挖掘其蘊(yùn)含的價(jià)值,尋找目標(biāo)內(nèi)在的規(guī)律,為快速、準(zhǔn)確地判斷空中目標(biāo)提供支撐是當(dāng)前研究的熱點(diǎn)。在數(shù)據(jù)壓縮上,文獻(xiàn)[1]提出基于空間曲線壓縮算法的空中目標(biāo)航跡提取算法,通過設(shè)定閾值提取關(guān)鍵點(diǎn)的方法,減少數(shù)據(jù)量,降低了計(jì)算的復(fù)雜度。航跡匹配通常采取K-means算法、層次方法[2]等進(jìn)行航跡擬合聚類,再建立神經(jīng)網(wǎng)絡(luò)預(yù)測模型[3]進(jìn)行航跡匹配。文獻(xiàn)[4]提出一種多屬性加權(quán)關(guān)聯(lián)關(guān)系匹配模型,重點(diǎn)解決熱點(diǎn)區(qū)域戰(zhàn)略空中目標(biāo)經(jīng)典航跡提取及實(shí)時(shí)航跡的關(guān)聯(lián)匹配問題。目前大部分文獻(xiàn)都是針對(duì)數(shù)據(jù)本身進(jìn)行篩選,航跡匹配只與當(dāng)前輸入的數(shù)據(jù)有關(guān),對(duì)歷史數(shù)據(jù)利用率不高,對(duì)應(yīng)結(jié)果只能反映當(dāng)前數(shù)據(jù)信息,不具備可持續(xù)性。
本文針對(duì)空中目標(biāo)航跡數(shù)據(jù)量大、運(yùn)算量過高,傳統(tǒng)目標(biāo)航跡空域特征提取較為復(fù)雜的情況,提出基于空間格的連續(xù)時(shí)間空域特征提取算法。通過對(duì)選定空域以一定長度為單位距離進(jìn)行網(wǎng)格化劃分,再將收集到的航跡大數(shù)據(jù)進(jìn)行預(yù)篩選、坐標(biāo)轉(zhuǎn)換,將航跡點(diǎn)與網(wǎng)格對(duì)應(yīng)匹配,統(tǒng)計(jì)出每個(gè)網(wǎng)格內(nèi)出現(xiàn)的航跡點(diǎn)次數(shù),實(shí)現(xiàn)對(duì)目標(biāo)航跡空域特征的提取,保留能突出航跡特點(diǎn)的網(wǎng)格,以減少數(shù)據(jù)量。并且可隨著數(shù)據(jù)的不斷輸入,結(jié)果不斷更新,該結(jié)果可反映出輸入數(shù)據(jù)所有時(shí)間的航跡總體規(guī)律,避免了歷史數(shù)據(jù)利用率不高以及結(jié)果反映過于片面的問題。
(1) 空間格定義
(2) 空間格坐標(biāo)
空間格采用直角坐標(biāo)系,將指定區(qū)域地圖的左下角坐標(biāo)作為空間格的原點(diǎn)(0,0),以正東方向?yàn)橹苯亲鴺?biāo)的x軸,正北方向?yàn)橹苯亲鴺?biāo)的y軸,以a作為單位長度,將空域范圍劃分成m×n的二維網(wǎng)格,每個(gè)網(wǎng)格都有一個(gè)唯一的編號(hào),即由空間格左下角的x軸和y軸坐標(biāo)組成,坐標(biāo)之間用逗號(hào)分隔。
(3) 目標(biāo)空域特征
目標(biāo)空域是指目標(biāo)所在的空間位置。對(duì)于空中目標(biāo)而言,目標(biāo)空域通常由目標(biāo)情報(bào)點(diǎn)的經(jīng)度、緯度和高度來表示。單批目標(biāo)的空域信息就是由其整條航跡所有點(diǎn)的經(jīng)度、緯度和高度構(gòu)成;某類目標(biāo)的空域信息就是由該類所有歷史航跡數(shù)據(jù)點(diǎn)的經(jīng)度、緯度和高度構(gòu)成。目標(biāo)空域特征是指能夠表征某批或某類目標(biāo)空間位置信息的典型、有代表性的特殊數(shù)據(jù)集。本文所研究的目標(biāo)空域特征就是以空間格為基礎(chǔ),將歷史航跡的空間位置信息映射到空間格之中,進(jìn)而獲取某批或某類目標(biāo)的空域特征值。
(4) 目標(biāo)空域特征提取
特征提取就是在目標(biāo)空域網(wǎng)格化的基礎(chǔ)上,將目標(biāo)航跡數(shù)據(jù)點(diǎn)按照地理坐標(biāo)位置,對(duì)應(yīng)放入網(wǎng)格中,同時(shí)對(duì)前后小于30 s的2個(gè)點(diǎn)進(jìn)行連接,將2點(diǎn)間航跡粗略看成直線[5],航跡點(diǎn)本身,以及按時(shí)間順序相連的直線所經(jīng)過的網(wǎng)格,其對(duì)應(yīng)點(diǎn)數(shù)全部加1,以便增加對(duì)航跡判別有幫助的點(diǎn)數(shù)量。
由于常用算法大部分對(duì)單條航跡進(jìn)行特征點(diǎn)提取,不具有針對(duì)時(shí)間的連續(xù)性。因此本文提出基于空間格的連續(xù)時(shí)間空域特征提取算法進(jìn)行目標(biāo)空域特征提取。首先需要對(duì)原始航跡進(jìn)行預(yù)處理,篩選出符合要求航跡點(diǎn)的基礎(chǔ)上,對(duì)目標(biāo)活動(dòng)空域進(jìn)行網(wǎng)格布設(shè),其次通過航跡坐標(biāo)變換,實(shí)現(xiàn)航跡點(diǎn)空域映射,最后得到目標(biāo)空域特征矩陣。
對(duì)目標(biāo)活動(dòng)空域進(jìn)行網(wǎng)格化處理,將目標(biāo)空域映射到直角坐標(biāo)系中。首先需要確定空域的區(qū)域范圍,然后根據(jù)區(qū)域邊緣經(jīng)緯度信息,按照經(jīng)緯度距離公式,求出最大區(qū)域距離范圍,再根據(jù)設(shè)定的網(wǎng)格邊長,求出劃分網(wǎng)格的長寬個(gè)數(shù)m×n。
需要特別注意的是數(shù)據(jù)空域范圍的選定,由于網(wǎng)格是由多個(gè)方格構(gòu)成的矩形,受地球曲率影響,相同距離下,在低緯度地區(qū)跨過的經(jīng)度要比高緯度地區(qū)跨過的經(jīng)度少。地球上同一經(jīng)度上所有緯度1°間的距離均約為111.12 km,即1′的距離均約為1.86 km,而對(duì)于同一緯度,2個(gè)不同經(jīng)度的距離為:
d=111.12(x2-x1)cosy
(1)
式中:d為同一緯度y上2點(diǎn)之間的距離,單位為km;x1、x2分別為2點(diǎn)經(jīng)度,單位為°;y為緯度數(shù)據(jù),單位rad。
由于2個(gè)經(jīng)度之間,高緯度長度低于低緯度,為了空間格的完整度,需要將高緯度的長度延長至低緯度長度,故高緯度區(qū)域的截止經(jīng)度將會(huì)發(fā)生改變。高緯度調(diào)整后的經(jīng)度計(jì)算方法為:
(2)
目標(biāo)航跡數(shù)據(jù)包含經(jīng)度、緯度、時(shí)間、類型、批次、架數(shù)等信息。將航跡點(diǎn)對(duì)應(yīng)到相應(yīng)空間格中,則需要對(duì)數(shù)據(jù)進(jìn)行坐標(biāo)轉(zhuǎn)換,航跡坐標(biāo)變換就是將目標(biāo)航跡點(diǎn)的經(jīng)度和緯度從地理坐標(biāo)轉(zhuǎn)換成空域網(wǎng)格坐標(biāo)。設(shè)航跡點(diǎn)數(shù)據(jù)集合為Hi={P1,P2,…,Pk,…,Pn},其中n為航跡點(diǎn)總個(gè)數(shù),Pk=(類型,架數(shù),ak,bk),ak為第k個(gè)航跡點(diǎn)坐標(biāo)經(jīng)度,bk為第k個(gè)航跡點(diǎn)坐標(biāo)緯度(1≤k≤n)。
以選定空域高緯度為x軸,以西側(cè)經(jīng)度為y軸,兩者交點(diǎn)為原點(diǎn),建立笛卡爾坐標(biāo)系。將航跡點(diǎn)數(shù)據(jù)集合Hi={P1,P2,…,Pk,…,Pn},即Pk=(類型,架數(shù),ak,bk)的經(jīng)緯度坐標(biāo),轉(zhuǎn)換為空域網(wǎng)格坐標(biāo)系里的距離坐標(biāo),即pk=(類型,架數(shù),xk,yk)。其中xk的坐標(biāo)為:
xk=111.12(ak-109°)cosbk
(3)
同理,yk的坐標(biāo)為:
yk=111.12|bk-21°|
(4)
形成一個(gè)新的數(shù)據(jù)點(diǎn)集合Hi={p1,p2,…,pk,…,pn},pk=(類型,架數(shù),xk,yk),xk為第k個(gè)數(shù)據(jù)點(diǎn)橫坐標(biāo)距離位置信息,yk為第k個(gè)數(shù)據(jù)點(diǎn)距離位置信息。
基于空間格定義,構(gòu)建空間格數(shù)據(jù)存儲(chǔ)矩陣,然后將航跡點(diǎn)空間特征值存入空間格矩陣。令空間格矩陣為G=(gij)m×n,gij=(類型,架數(shù),次數(shù)),i、j分別為空間格第i行、第j列的網(wǎng)格坐標(biāo),0≤i≤m,0≤j≤n。具體步驟如下:
(3) 判斷若i1≠i0,且|k|≥1,則將j0與j1之間的整數(shù)值依次代入函數(shù)關(guān)系式中的值y(j),求出對(duì)應(yīng)的值x(i),并將x(i)向上取整,對(duì)應(yīng)的gij中對(duì)應(yīng)的次數(shù)加1。若|k|<1,則將i0與i1之間的整數(shù)值依次代入函數(shù)關(guān)系式中的值x(i),求出對(duì)應(yīng)的值y(j),并向上取整y(j),對(duì)應(yīng)的gij中對(duì)應(yīng)的次數(shù)加1。
(4) 讀取新的航跡數(shù)據(jù),再次執(zhí)行(1)~(3)。
將點(diǎn)數(shù)較高的網(wǎng)格予以保留,但是防止航線過于密集,而出現(xiàn)整體航跡占用網(wǎng)格較寬的情況,只保留最密集最能體現(xiàn)航跡規(guī)律的網(wǎng)格;同時(shí),對(duì)于數(shù)量不多,但是和其他航跡有明顯區(qū)別的航跡,所占用的網(wǎng)格也要保留。步驟如下:
(1) 以單個(gè)單元格中的數(shù)據(jù)點(diǎn)出現(xiàn)的次數(shù)為橫軸,以包含同一數(shù)據(jù)點(diǎn)量的單元格數(shù)量為縱軸,畫出柱狀圖;
(2) 設(shè)定單個(gè)單元格點(diǎn)內(nèi)數(shù)量閾值為M,若不少于M,則單元格暫時(shí)保留,并采用3×3的框架,將框架中的數(shù)據(jù)數(shù)量Aij進(jìn)行排序,取最高的3個(gè)值的單元格予以徹底保留,舍棄其他的單元格;
(3) 若閾值小于M,但頻次不少于給定閾值N,則單元格暫時(shí)保留,且以此單元格為中心,用3×3的框架,框架內(nèi),若暫時(shí)保留的單元格數(shù)超過3個(gè),則將所有暫時(shí)保留網(wǎng)格予以徹底保留,否則將該單元格去除;
以南北縱跨為400 km、緯度橫越為180 km的某空域?yàn)槔?。由于大多預(yù)警雷達(dá)掃描1圈的時(shí)間約為10 s,目標(biāo)飛行速度通常為800 km/h,則10 s內(nèi)的飛行距離約為2.22 km,故將空間單元格的邊長設(shè)為2 km,空間格由200×90個(gè)單元格組成。數(shù)據(jù)來源為某站1周內(nèi)在該區(qū)域經(jīng)過數(shù)據(jù)預(yù)處理后的150條航線的8 959條雷達(dá)數(shù)據(jù)。
將數(shù)據(jù)進(jìn)行初步清洗后,按本文方法進(jìn)行坐標(biāo)轉(zhuǎn)換,而后對(duì)應(yīng)到空間格中,數(shù)據(jù)點(diǎn)數(shù)量即空間格矩陣數(shù)值分布如圖1所示,橫坐標(biāo)為矩陣元素?cái)?shù)值,縱坐標(biāo)為單元格數(shù)量,其中不包括數(shù)據(jù)量為0的單元格數(shù)量。
圖1 空間格矩陣數(shù)值分布圖
空間格矩陣做成的熱力圖如圖2所示。
圖2 空間格矩陣熱力圖
由圖1可知,橫坐標(biāo)中位數(shù)為12,因此將M閾值設(shè)為12,可得結(jié)果如圖3所示。篩選出典型航跡,但是原數(shù)據(jù)中下方的少量異常航跡被消除,損失了重要信息。從圖1也可以直觀地看出,眾數(shù)為6,即有700多個(gè)單元格中包含的數(shù)據(jù)點(diǎn)數(shù)量為6,因此可以得出結(jié)論:雖然數(shù)據(jù)點(diǎn)數(shù)量較少,但同時(shí)有大量單元格擁有相同數(shù)據(jù),證明此處很可能包含數(shù)據(jù)量較少的異常航跡,因此將2.4步驟中的閾值N設(shè)為5而不設(shè)置成6的原因是盡量保證異常航跡的數(shù)據(jù)量。得到的特征格矩陣做成熱力圖如圖4所示,異常航線顯現(xiàn)。
圖3 篩選后的高頻航線熱力圖
圖4 特征格矩陣熱力圖
由圖4可以直觀看出,未經(jīng)處理的航線數(shù)據(jù)較多且密集,經(jīng)過特征網(wǎng)格提取后的航線,數(shù)據(jù)量少很多,并且很好地保留了原有航線的特征,下方數(shù)量較少的異常航線也被很好保留。原8 959條數(shù)據(jù),經(jīng)過生成空間格,數(shù)據(jù)量減少至1 671,經(jīng)過提取特征格后,數(shù)據(jù)降為341,僅為原始數(shù)據(jù)的3.81%。
本算法的優(yōu)勢在于:存儲(chǔ)空間最多為m×n×2(空間格矩陣及特征格矩陣大小),此后不會(huì)因?yàn)樵己桔E的增加而增加。航跡關(guān)鍵點(diǎn)提取[1]和曲線擬合法[6]等傳統(tǒng)航跡處理方法,都是對(duì)航跡點(diǎn)進(jìn)行壓縮,達(dá)到用最少的參量來表示整條航跡的運(yùn)動(dòng)特征。但算法的處理能力有限,可同時(shí)處理的航線最多為幾十條,并且著眼于數(shù)據(jù)本身,反映的結(jié)果是當(dāng)前輸入的數(shù)據(jù)。本文方法可隨著數(shù)據(jù)的不斷輸入,特征網(wǎng)格位置隨著輸入數(shù)據(jù)的增加而發(fā)生變化,聚類結(jié)果能反映出隨著時(shí)間推移的總體航跡趨勢。因?yàn)楹桔E點(diǎn)的增加最終都會(huì)對(duì)應(yīng)成空間格矩陣中的數(shù)值變化,理論上可處理的數(shù)據(jù)無上限,但是若處理的數(shù)據(jù)在時(shí)間跨度上過長,會(huì)導(dǎo)致大量歷史因素對(duì)結(jié)果產(chǎn)生影響,降低時(shí)效性。
本文基于空中目標(biāo)的歷史大數(shù)據(jù),提出對(duì)目標(biāo)空域進(jìn)行網(wǎng)格化處理,生成目標(biāo)活動(dòng)空間格。基于布設(shè)的空間格,將歷史航跡的空間位置映射到空間格中,實(shí)現(xiàn)目標(biāo)空域特征的提取,也就是將海量的歷史航跡數(shù)據(jù)轉(zhuǎn)變成有限的空間格數(shù)據(jù)集。經(jīng)過算法處理后,大幅減少了數(shù)據(jù)量,在存儲(chǔ)空間利用、對(duì)連續(xù)時(shí)間的軌跡研究等方面具有較為明顯的優(yōu)勢,便于后續(xù)對(duì)目標(biāo)的空間活動(dòng)規(guī)律進(jìn)行聚類、分類、關(guān)聯(lián)關(guān)系等分析。并且本算法具備可持續(xù)性,可不斷輸入新數(shù)據(jù)進(jìn)行規(guī)劃完善,輸入數(shù)據(jù)越多,航跡聚類越精確,且不增加數(shù)據(jù)存儲(chǔ)容量。但是此方法忽略了目標(biāo)航跡高度的影響,下一步還需把高度納入考慮范圍,對(duì)空間格進(jìn)行三維化處理。