曲成華 史新虎 張程 吳金海
【摘 要】現(xiàn)代科技工業(yè)的發(fā)展促進了各種戰(zhàn)斗機、直升機等武器的機動性能和隱身性能,水平機動、垂直機動、空中懸停等戰(zhàn)斗動作成為國土防空預警探測領域急需解決的技術難點;近年來,人工智能技術取得了一系列突破性進展,可以用來解決這一難題。此篇論文介紹了人工智能及深度學習知識在雷達信息處理中的相關應用情況,并嘗試應用深度學習相關成果和先進理論來解決低小慢目標發(fā)現(xiàn)跟蹤、高機動目標跟蹤、直升機/無人機懸停跟蹤等疑難問題,有效提升對機動目標的發(fā)現(xiàn)和穩(wěn)定跟蹤能力。
【關鍵詞】人工智能;深度學習;機動目標跟蹤;航跡相關
中圖分類號: TP18 文獻標識碼: A 文章編號: 2095-2457(2018)13-0003-003
DOI:10.19694/j.cnki.issn2095-2457.2018.13.002
【Abstract】the development of modern science, technology and industry to promote the various of motor performance and stealth fighter jets, helicopters and other weapons performance, the level of motor, vertical motor, hovering combat action become urgently needs to solve the technical difficulties of homeland air defense early warning detection field; In recent years, a series of breakthroughs have been made in artificial intelligence technology, which can be used to solve this problem. This paper introduces the artificial intelligence and deep learning knowledge of related applications in radar information processing, and try the deep learning achievements and advanced theory to solve the low found little slow target tracking, high maneuvering target tracking, helicopter/unmanned aerial vehicle (uav) hovering tracking problems, effectively improve the ability of discovery and stability of the maneuvering target tracking.
【Key words】Artificial intelligence; Deep learning; Maneuvering target tracking; Track is related
0 引言
近年來,人工智能技術取得了突破性進展,深度學習的進化已經(jīng)使人類賦予機器通過學習已有的知識和分析的積累數(shù)據(jù),通過反復進行特征提取、自主學習應用效果和不斷的反饋訓練,推導或預測出未知的事物。這些理論和思想都是可以應用于雷達信息處理及多雷達信息融合中的目標跟蹤處理,特別是針對雜波環(huán)境下的低小慢目標跟蹤處理、高機動目標跟蹤處理、直升機/無人機懸停跟蹤等疑難問題,本文應用人工智能的相關成果和先進理論對這一難題進行探索性研究和應用,來提升對機動目標的發(fā)現(xiàn)跟蹤能力。
1 雷達目標發(fā)現(xiàn)跟蹤的技術難題
探測和跟蹤低RCS目標、雜波/干擾環(huán)境下低小慢目標及高機動目標,將一直是航空識別區(qū)的正常維護和適應于低空空域的逐步開放所必需面對的難題。在現(xiàn)代雷達系統(tǒng)中,經(jīng)過前端收發(fā)處理、數(shù)字波束形成和信號處理,可以檢測獲取目標點跡數(shù)據(jù);目標跟蹤濾波器把雷達威力范圍內新發(fā)現(xiàn)的空中目標點跡建立新的目標航跡,并把新的點跡與現(xiàn)有航跡進行關聯(lián)匹配。點跡-航跡關聯(lián)是把噪聲化觀測點跡與已有航跡進行關聯(lián)匹配和同目標確認的過程,由于雜波、干擾以及目標機動等因素,關聯(lián)判斷的正確率需要得到提升。
1.1 雷達目標發(fā)現(xiàn)跟蹤的難題
雷達目標的發(fā)現(xiàn)跟蹤需要解決一下四點難題:
1)點跡關聯(lián)區(qū)域內目標點跡、雜波剩余產(chǎn)生的點跡、干擾產(chǎn)生的點跡及噪聲虛警產(chǎn)生的點跡(以下簡稱目標點、雜波點、干擾點、虛警點)的區(qū)分與判別。一般情況下,這四種點跡在點跡關聯(lián)區(qū)都同時存在,或部分同時存在。點跡處理環(huán)節(jié)通過對點跡產(chǎn)生信號的方位展寬、距離展寬、信噪比、多普勒速度等信息計算點跡置信度,當信噪比較低特別是目標發(fā)生機動時,幾乎所有的信息都變得模糊不清,需要分清真實的點跡與其他點跡。
2)目標機動造成的點跡丟失判斷。空中目標環(huán)境往往異常復雜,包括起飛、降落、直線飛行、轉彎、垂直拉升、大角度俯沖、緊急避閃等情況,多架多批目標的機動飛行訓練、表演和空戰(zhàn)時情況就更加復雜。目標機動往往造成雷達反射截面積的急劇變化,是造成目標丟點的主要原因。如何判斷丟點,而不被其它點跡干擾,是正確跟蹤機動目標所必需面對的難題。
3)目標由運動轉為靜止造成的點跡丟失判斷。這種情況主要發(fā)生在直升機/無人機由運動變?yōu)閼彝r,回波信號被作為固定回波加以濾除;此時需要通過目標的運動狀態(tài)進行判別,確保目標持續(xù)跟蹤,并且在其運動之后能夠及時連續(xù)跟蹤。
4)目標跟蹤過程中,因雜波點、干擾點造成點跡-航跡的關聯(lián)錯誤,如何在新的點跡出現(xiàn)后能夠糾正。前面點跡-航跡的關聯(lián)出現(xiàn)錯誤,后續(xù)如何發(fā)現(xiàn)并及時糾正,這也特別關鍵。
1.2 應用人工智能解決目標跟蹤難題的設想
人工智能技術積極利用深度學習抽象模擬人類神經(jīng)元傳遞信息和鏈接方式,經(jīng)過反復抽象多層次提取特征,構成多層級神經(jīng)網(wǎng)絡,通過對已獲得樣本數(shù)據(jù)的學習訓練和評估,對評估結果的反饋應用,不斷修改特征值和權系數(shù),使得各層級特征值和權系數(shù)足以覆蓋所有可能出現(xiàn)的實際輸入數(shù)據(jù)。這種方法研制的設備和系統(tǒng)已用于各種分類、控制、決策和預測等應用場合,在圖像處理、語音識別、語言翻譯等方面取得極大應用,包括AlphaGo在與人類的一系列對弈中均取得巨大成功。這種思路和思想可以用于雷達目標發(fā)現(xiàn)跟蹤處理。
現(xiàn)代雷達在探測發(fā)現(xiàn)跟蹤目標時,經(jīng)過前端發(fā)射接收和一系列信號處理后,得到了雷達點跡數(shù)據(jù),對點跡數(shù)據(jù)的關聯(lián)積累,實現(xiàn)目標的發(fā)現(xiàn)和起始跟蹤。點跡數(shù)據(jù)的關聯(lián)積累、點跡-航跡關聯(lián),需要處理就是點跡關聯(lián)矩陣。點跡關聯(lián)矩陣的大小與目標運動/機動狀態(tài)、航跡預測精度和雷達測量精度密切關聯(lián),而其矩陣的復雜性與探測背景、雜波干擾環(huán)境密切相關。如何針對不同的目標運動特性、雜波干擾環(huán)境收集各種樣本數(shù)據(jù),并盡可能仿真出所用可能的樣本數(shù)據(jù),就能夠應用人工智能的深度學習方法,結合現(xiàn)在使用的一些跟蹤濾波方法,更好地解決雷達目標發(fā)現(xiàn)跟蹤中關鍵問題,特別是目標機動跟蹤難題。
2 人工智能在機動目標跟蹤中的應用
在雷達目標跟蹤過程中,很容易對勻速直線飛行的目標進行檢測、關聯(lián)和濾波跟蹤,但是目標運動狀態(tài)發(fā)生改變即發(fā)生機動后,關聯(lián)與跟蹤的穩(wěn)定狀態(tài)將被改變,這是需要解決的核心問題。本文主要應用人工智能的相關成果來解決機動目標相關的難題,其他發(fā)現(xiàn)跟蹤的難題不在此文解決。
2.1 “機動”的相關概念
目標機動,就是指目標運動狀態(tài)發(fā)生了變化。由于目標絕大多數(shù)時間做勻速直線運動或者勻加速直線運動,因此目標機動可以理解為目標的速度、方向、高度、加速度等運動參數(shù)發(fā)生了變化。從濾波器的角度看,目標機動是指為執(zhí)行某種戰(zhàn)術意圖或者由于非預謀的原因,改變了原有的運動規(guī)律,造成了目標運動規(guī)律和濾波器已經(jīng)建立的模型不匹配。
典型的機動模式包括轉向、俯沖、下滑、爬升、蛇形、增速、降速、停止(空中懸停)等。
1)轉向機動:目標的運動航向發(fā)生改變,既包括二維平面的轉彎機動,也包括三維空間的轉彎機動;
2)俯沖機動,目標的高度發(fā)生改變,急速降低;
3)下滑機動:目標的高度發(fā)生改變,平穩(wěn)降低;
4)爬升機動:目標的高度發(fā)生改變,平穩(wěn)上升;
5)蛇形機動:目標的運動航向發(fā)生多次變化,運動軌跡類似于蛇類的運動;
6)增速/減速機動:目標的運動加速度發(fā)送變化,運動速度隨之改變;
7)停止機動:目標停止運動,位置保持不變,多為直升機/無人機的懸停動作。
需要指出的是,以上機動模式在大多數(shù)情況下是組合在一起表現(xiàn)出來,如F-22的J型轉彎機動就包括了俯沖、爬升、轉向等機動模式。
2.2 表征目標機動的性能指標
對于跟蹤濾波器,需要定義一些指標來衡量機動的強弱,以便濾波器能夠識別出機動并做出相應的調整,主要的衡量指標如下所述。
(1)機動性指標?姿
該指標與過程噪聲方差、觀測噪聲方差、采樣周期相關,用于表征目標在運動周期內的機動的不確定性和觀測的不確定性,定義為:
(3)歸一化的新息加權平方和
基于卡爾曼濾波算法,使用歸一化的變量來表征目標運動的機動強度,定義如下:
某時刻的新息量表示為:
2.3 點跡-航跡關聯(lián)
點跡-航跡關聯(lián)是把雷達掃描相繼收到的點跡與已知航跡比較并確定正確配對的過程。當配對實現(xiàn)后,航跡信息被更新,并產(chǎn)生精確的位置和目標速度估值等參數(shù)。
點跡-航跡關聯(lián)分下列三個步驟實現(xiàn):首先按點跡、航跡扇區(qū)信息,對每個重要的新航跡,產(chǎn)生一個配對表,表中應包括全部可能的點跡-航跡配對;其次按配對表分別計算點跡與航跡的多因子相關積累值,每個航跡與積累值點跡構成暫時關聯(lián),然后再檢查暫時關聯(lián),去掉那些重復使用的點跡;最后,對選出的單個點跡與單條航跡進行唯一配對,從而更新航跡信息。
在進行初相關配對時,使用統(tǒng)計間隔劃定相關波門范圍。統(tǒng)計間隔是按坐標精度對歐幾里德間隔進行修正,更具合理性。在進行精相關時,通常采用基于隸屬度的綜合多因子相關算法,更充分地使用了各種先驗信息,有效提高了點航相關的正確性。通常的相關因子主要包括:位置間隔、回波寬度、回波強度、航向偏差、目標多普勒速度、目標高度以及目標之間的空間分布等。根據(jù)雷達的不同,對各相關因子進行取舍和分配權重,將積累權重最大的點跡定義為吻合度最好,從而作為目標點跡進行相關。
2.4 基于人工智能的點跡航跡相關處理
加拿大多倫多大學教授、機器學習領域的泰斗Geoffrey Hinton和他的學生Ruslan Salakhutdinov于2006年在《科學》雜志上發(fā)表了一篇論文,得到了世界各地專家學者的廣泛關注與一致好評。這篇論文主要觀點:(1)許多隱層人工神經(jīng)網(wǎng)絡具有優(yōu)異的特征學習能力,學習得到的特征對數(shù)據(jù)有更深刻的描述,從而有利于可視化或分類。(2)可以通過“逐層初始化”來有效克服深度神經(jīng)網(wǎng)絡在訓練上的難度。
基于人工智能的點跡航跡相關系統(tǒng)主要由策略網(wǎng)(PN,Policy network) 和價值網(wǎng)(VN,Value network) 組成,策略網(wǎng)又分為有監(jiān)督學習策略網(wǎng)(SLPN,SL policy network)、快速相關策略網(wǎng)(FCP,F(xiàn)ast Correlation policy) 和增強學習策略網(wǎng)絡(RLPN,RL policy network)。用策略網(wǎng)PN來模擬人類的對點跡和航跡相關的判斷,價值網(wǎng)絡VN 來模擬人類對多幀相關的綜合評估,運用蒙特卡洛樹搜索將策略網(wǎng)和價值網(wǎng)融合起來,來模擬人類對多條航跡的多個點跡相關的搜索過程。
有監(jiān)督學習策略網(wǎng)是一個5層的卷積神經(jīng)網(wǎng)絡,其主要功能是:輸入當前航跡特征參數(shù)(航向、水平速度、水平加速度、垂直速度、垂直加速度、多普勒速度、RCS值均值、目標機動狀態(tài)等),輸出下一幀點跡在立體空間中的概率分布p,點跡航跡相關系統(tǒng)按照概率的高低對整個立體空間進行點跡搜索,進行綜合隸屬度的計算并建立n個點跡航跡相關鏈。需要指出的是,由于目標的機動性和測量的噪聲干擾,因此目標點跡出現(xiàn)的位置并不一定是概率最高的位置,需要根據(jù)航跡的特征參數(shù)做出適當?shù)恼{整。
快速相關策略網(wǎng)是一個線性模型,其主要功能是處理簡單模式下的點跡航跡相關,如勻速直線運動或勻加速直線運動狀態(tài)下清潔區(qū)內只有一個隸屬度非常高的點跡,則可以進行快速點跡航跡相關處理和判決。
增強學習策略網(wǎng)絡是通過增強學習的方法對有監(jiān)督學習策略網(wǎng)加強學習和訓練,網(wǎng)絡結構和功能與有監(jiān)督學習策略網(wǎng)完全相同,性能上強化了學習。通過歷史數(shù)據(jù)進行海量訓練后產(chǎn)生多次迭代,提高相關的準確性。
價值網(wǎng)絡是一個5層的卷積神經(jīng)網(wǎng)絡,與策略網(wǎng)絡具有相同的結構,主要功能是:輸入航跡的相關鏈和歷史航跡分支,輸出每一條相關鏈以及歷史航跡分支的估值,以此評價點跡選擇的整體優(yōu)劣。針對雜波剩余點跡、干擾點跡及噪聲虛警點跡等多點跡存在的情況,特別是目標開始機動、由運動狀態(tài)轉為懸停狀態(tài)等特殊情況,就要根據(jù)綜合隸屬度以及目標的運動趨勢,建立航跡分支,通過多幀的綜合判斷來對點跡航跡相關的情況進行綜合評價,以達到全局的性能最優(yōu)。
2.5 應用人工智能的點跡航跡相關處理效果分析
以某次軍事演習的實際測量數(shù)據(jù)為應用場景來檢驗應用人工智能后的點跡航跡相關處理效果,如圖1所示。在這次演習中,多架次的飛機進行了多種戰(zhàn)術動作,從雷達測量數(shù)據(jù)分析,有水平機動、垂直機動、直線運動轉水平機動、機動造成雷達測量點等情形,利用該人工智能系統(tǒng)對此復雜環(huán)境下的機動目標進行相關處理和跟蹤濾波,克服了傳統(tǒng)點航相關在處理機動、丟點后造成的航跡斷批、濾波點誤差較大等缺陷,保證了對同一批目標的連續(xù)穩(wěn)定和高精度的跟蹤;通過深度學習使得該系統(tǒng)具備了更進一步學習和經(jīng)驗積累的能力,有效解決了產(chǎn)品定型后軟件設置的策略不能滿足各種新出現(xiàn)的復雜情況。
3 結論
目前,把人工智能的理論和方法應用到雷達目標跟蹤處理的研究尚處于起步和探索階段,本文的研究和探索只是將人工智能領域的知識應用于雷達航跡跟蹤的初步嘗試,畢竟深度學習還是一門不成熟的框架,同樣存在著一些問題,局部最優(yōu)問題、內存消耗大、計算復雜度高、代價函數(shù)設計、整個智能網(wǎng)絡的設計等。這些問題需要在將來的研究中繼續(xù)解決,以便更加完善深度學習在點跡航跡關聯(lián)與航跡跟蹤的應用,適應各種目標機動的處理和跟蹤。
【參考文獻】
[1]劉成成.復雜環(huán)境下強機動目標跟蹤算法研究[D].上海交通大學,2015.
[2]陶九陽.AlphaGo技術原理分析及人工智能軍事應用展望[J]. 指揮與控制學報,2016,2(6):114-120.
[3]文孟飛.一種基于深度學習的異構多模態(tài)目標識別方法[J]. 中南大學學報(自然科學版),2016,5:1580-1587.
[4]劉建偉.劉媛.羅雄麟.深度學習研究進展[J].計算機應用研究,2014,31(7):1921-1930.
[5]陳亮.機動目標跟蹤算法研究[D].江南大學,2016.