王 偉, 史國友, 鄭海濤, 王毓瑋
(1.大連海事大學(xué) 航海學(xué)院, 遼寧 大連 116026;2.遼寧省航海安全保障重點實驗室, 遼寧 大連 116026)
目標(biāo)跟蹤是運用各種觀測和計算手段,實現(xiàn)主體對所關(guān)注運動客體的狀態(tài)進(jìn)行建模、估計、跟蹤的過程。隨著人工智能的不斷發(fā)展,在今后的無人船應(yīng)用當(dāng)中,由雷達(dá)等傳感器測得目標(biāo),然后根據(jù)其過去直到當(dāng)前的觀測值,預(yù)測和估計其運動軌跡,對目標(biāo)進(jìn)行跟蹤檢測,進(jìn)而針對目標(biāo)做下一步操作,保障無人船的安全。目標(biāo)跟蹤技術(shù)[1]主要包括:數(shù)據(jù)關(guān)聯(lián)、狀態(tài)估計融合和航跡管理,而數(shù)據(jù)關(guān)聯(lián)屬于目標(biāo)跟蹤技術(shù)中需要解決的首要問題。
在目標(biāo)跟蹤技術(shù)當(dāng)中,數(shù)據(jù)關(guān)聯(lián)的作用是基礎(chǔ),不正確的數(shù)據(jù)關(guān)聯(lián)將直接導(dǎo)致跟蹤精度降低甚至丟失目標(biāo),數(shù)據(jù)關(guān)聯(lián)的難度體現(xiàn)在傳感器存在漏檢、虛警以及在測量值比較密集的情況下的關(guān)聯(lián)。國內(nèi)外學(xué)者信息融合技術(shù)的研究,比較常用的數(shù)據(jù)關(guān)聯(lián)算法包括最近鄰方法、概率數(shù)據(jù)關(guān)聯(lián)、聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)、多假設(shè)方法等以上方法的改進(jìn)算法。[2]聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)(Joint Probabilistic Data Association,JPDA)是公認(rèn)的目標(biāo)跟蹤中最有效的數(shù)據(jù)關(guān)聯(lián)算法,利用落在跟蹤門限內(nèi)的當(dāng)前掃描周期中的點跡,計算點跡和相應(yīng)航跡的關(guān)聯(lián)概率。JPDA計算包含關(guān)聯(lián)事件構(gòu)造和關(guān)聯(lián)概率計算兩部分。但該算法計算量過大,導(dǎo)致其實時性較差,同時隨著目標(biāo)的增多,JPDA可行事件的數(shù)量將呈指數(shù)級增長,發(fā)生組合“爆炸”。因此,需要比以上數(shù)據(jù)關(guān)聯(lián)更精確的技術(shù)來解決數(shù)據(jù)關(guān)聯(lián)問題。神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的模式識別和數(shù)據(jù)擬合能力,以及具有良好的魯棒性與容錯性,局部的損害會使得人工神經(jīng)網(wǎng)絡(luò)的運行適度減弱,但不會造成災(zāi)難性的錯誤。因此,將神經(jīng)網(wǎng)絡(luò)用于目標(biāo)跟蹤研究中可克服跟蹤精度和快速響應(yīng)的矛盾及數(shù)據(jù)關(guān)聯(lián)方法的組合“爆炸”等問題。[3-4]
聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法是利用落在跟蹤門限內(nèi)的當(dāng)前掃描周期中的點跡,計算點跡和相應(yīng)航跡的關(guān)聯(lián)概率,利用關(guān)聯(lián)概率對當(dāng)前點跡求權(quán)值來修正航跡,權(quán)值就是跟蹤中的點跡,來自于目標(biāo)的概率。[5]聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法包含關(guān)聯(lián)事件的構(gòu)造和關(guān)聯(lián)概率的計算兩部分,其實質(zhì)就是由關(guān)聯(lián)事件構(gòu)造的確認(rèn)矩陣拆分得到關(guān)聯(lián)矩陣,計算量測j與目標(biāo)的關(guān)聯(lián)概率βjt(k)。[6]
構(gòu)造關(guān)聯(lián)事件θi(k),為表示有效回波和各個跟蹤門的復(fù)雜關(guān)系,引入確認(rèn)矩陣Ω的概念,確認(rèn)矩陣定義為
Ω=[ωjt],j=1,2,…,mk;t=0,1,…,T
(1)
式(1)中:ωjt為二進(jìn)制變量,ωjt=1為量測j落入目標(biāo)t的確認(rèn)門內(nèi),ωjt=0為量測j沒有落入目標(biāo)t的確認(rèn)門內(nèi),t=0表示沒有目標(biāo)。矩陣Ω的第一列元素ωj0全都是1,這是因為任一量測都可能源于雜波或者虛警。[7]
(2)
綜上所述互聯(lián)態(tài)勢的確認(rèn)矩陣為
j=1,2,…,mk;t=0,1,…,T
(3)
對于多目標(biāo)跟蹤問題,一旦給定反映有效回波與目標(biāo)或雜波矩陣,則可通過拆分確認(rèn)矩陣來得到所有的關(guān)聯(lián)矩陣,對確認(rèn)矩陣的拆分要遵循以下原則:在確認(rèn)矩陣的每一行,僅選出一個作為互聯(lián)矩陣在該行唯一非零元素,即滿足可能事件的第一個假設(shè)是每個量測j有唯一的源。在互聯(lián)矩陣中,除第一列以外,每列最多只能有一個非零元素。即滿足可能事件的第二個假設(shè)是每個目標(biāo)最多有一個量測j以其為源。[8]解釋見圖1。
圖1 兩目標(biāo)預(yù)測值及橢圓跟蹤門觀測值
(4)
然后依據(jù)確認(rèn)矩陣的兩個拆分原則對上述確認(rèn)矩陣進(jìn)行拆分,得到互聯(lián)矩陣
(5)
通過上述例子可知:在計算量測與目標(biāo)的關(guān)聯(lián)概率βjt(k)時,兩目標(biāo)的確認(rèn)矩陣拆分所得的互聯(lián)矩陣為8個,隨著跟蹤目標(biāo)的增多,通過確認(rèn)矩陣得到的互聯(lián)矩陣將以指數(shù)形式增長,計算量大幅增加。
Hopfield神經(jīng)網(wǎng)絡(luò)是由美國加州理工學(xué)院的Hopfield教授于1982年提出的,是一種單層反饋神經(jīng)網(wǎng)絡(luò),具有離散性和連續(xù)性的兩種網(wǎng)絡(luò)模型。[9]在解決優(yōu)化問題時,采用的均為連續(xù)性Hopfield網(wǎng)絡(luò)。引入系統(tǒng)能量函數(shù),通過對能量函數(shù)進(jìn)行微分處理來使得能量函數(shù)及優(yōu)化問題被最小化。用模擬電路實現(xiàn)的連續(xù)性Hopfield網(wǎng)絡(luò)見圖2。
每個神經(jīng)元由一個運算放大器和相關(guān)的元件組成,其輸入一方面由輸出的反饋組成,另一方面也有
圖2 模擬電路實現(xiàn)的連續(xù)性Hopfield網(wǎng)絡(luò)
以電流形式從外界連接進(jìn)來的輸入,以b1、b2、b3如圖2所示。根據(jù)基爾霍夫電流定律,
(6)
式(6)中:Ci為運算放大器的電容;Ri0為對應(yīng)電阻的阻值;ui為運算放大器的輸入電壓;yj為輸出電壓。令
(7)
式(7)在連續(xù)性Hopfield網(wǎng)絡(luò)中引入能量函數(shù)為
(8)
由于式(8)中第二項計算繁瑣且影響不是很大,通常通過控制電路參數(shù)將第二項忽略:
(9)
對該能量函數(shù)進(jìn)行微分處理為
(10)
JPDA由于在拆分矩陣時,在跟蹤目標(biāo)以及回波數(shù)量增多的情況下,可行事件將以指數(shù)形式增長,計算量也隨之增加,實時性較差。對此,針對無人船雷達(dá)目標(biāo)跟蹤提出一種性能更加優(yōu)化的神經(jīng)網(wǎng)絡(luò)H-JPDA來進(jìn)行海面雷達(dá)的目標(biāo)跟蹤,在目標(biāo)附近存在密集雜波或者多個目標(biāo)航跡交叉時,仍能較好地實現(xiàn)最佳的跟蹤效果。
聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)的求解實質(zhì)上得到量測j與目標(biāo)T互聯(lián)的概率βjt(k)[10],類似于Hopfield神經(jīng)網(wǎng)絡(luò)解決旅行商問題(Travelling Salesman Problem,TSP)的組合優(yōu)化,兩者對比見表1。針對其計算量的復(fù)雜程度,Hopfield神經(jīng)概率數(shù)據(jù)關(guān)聯(lián)將對其簡化處理。
表1 JPDA與TSP對比
(11)
(12)
式(12)中:ρjt為Pjt(k)的歸一化值,即
(13)
因此,求解神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)關(guān)聯(lián)的概率為
(14)
為方便進(jìn)行仿真,將式(9)寫為
dε[d+e(T-1)]Vjt(i)-
(15)
(16)
Vjt初始條件為
(17)
ujt初始條件為
(18)
式(18)中:δujt常采用隨機(jī)擾動的方法,為區(qū)間[-0.1u0,0.1u0]的隨機(jī)變量。[12]
綜上,H-JPDA算法步驟:
1) 利用初始條件,根據(jù)式(12)和式(13)得ρjt(k)和Pjt(k),j=0,1,2,…,mk;t=1,2,…,T。
2) 由式(18)ujt的初始值,再利用式(13)求得ujt(i+1)。
3) 由式(17)Vjt的初始值,再利用式(16)求得Vjt(i+1)。
5) 由互聯(lián)概率βjt(k),利用卡爾曼濾波進(jìn)行跟蹤濾波,對下一時刻狀態(tài)向量預(yù)測和量測向量預(yù)測。
為驗證Hopfield神經(jīng)網(wǎng)絡(luò)聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法的有效性,對兩目標(biāo)進(jìn)行仿真分析[13],運動過程中發(fā)生航跡交叉,目標(biāo)A初始位置和目標(biāo)B初始位置和初始運動狀態(tài)見表2。
表2 目標(biāo)A、目標(biāo)B初始位置和運動狀態(tài)
Hopfield神經(jīng)網(wǎng)絡(luò)聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)參數(shù),采樣次數(shù)n=50,采樣間隔t0=1 s,蒙特卡洛仿真次數(shù)Mc=20,雜波密度λ=2×10-6km-2,門限g=10,檢測概率PD=0.98,量測落入跟蹤門的概率Pg=0.99,時間步長ε=0.000 01 s,目標(biāo)數(shù)T=2,采樣間隔t0=1 s。系統(tǒng)過程噪聲協(xié)方差為
(19)
觀測矩陣
(20)
狀態(tài)轉(zhuǎn)移矩陣
(21)
系統(tǒng)過程噪聲矩陣
(22)
Hopfield神經(jīng)網(wǎng)絡(luò)能量函數(shù)參數(shù)對網(wǎng)絡(luò)的變化相當(dāng)敏感,原則上不能隨意改變,取a=b=d=500,c=200,e=10,u0=0.2。這種選擇是考慮參數(shù)值較小時,容易獲得合法路徑;參數(shù)值較大時,可增加路徑長度的權(quán)重,從而使合法路徑趨于最優(yōu);u0是放大器的增益,參數(shù)值太小時,閾值函數(shù)接近于符號函數(shù),不能獲得較好的解;參數(shù)值太大時,S型閾值函數(shù)過于平坦,神經(jīng)元狀態(tài)不易于收斂到0和1,從而獲得合法路徑的概率。[14]
仿真環(huán)境為處理器Inter(R)Core(TM)i7-7500U CPU@2.70GHz 2.90 GHz,8.00 GB內(nèi)存。仿真平臺為MATLAB 2017b。[15]目標(biāo)的實際運動軌跡以及聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)下的目標(biāo)的觀測和估計運動軌跡分別見圖3和圖4。測量值與估計值之間的均方差見圖5。濾波值與估計值的均方差同測量值與估計值的均方差之間的比值見圖6。MATLAB平臺仿真得到JPDA與H-JPDA運行時間比較見表3。由表3可知:基于Hopfield神經(jīng)網(wǎng)絡(luò)聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)運行時間明顯優(yōu)于聯(lián)合概率數(shù)據(jù)關(guān)聯(lián),提高目標(biāo)跟蹤的速率以及目標(biāo)跟蹤的實時性。
圖3 目標(biāo)實際運動軌跡 圖4 目標(biāo)觀測和估計運動軌跡
圖5 測量值與估計值間均方差圖6 濾波值與估計值的均方差同測量值與估計值的均方差之比
表3 JPDA與H-JPDA運行時間比較
本文針對海上船舶雷達(dá)多目標(biāo)跟蹤軌跡數(shù)據(jù)關(guān)聯(lián)問題,提出基于Hopfield神經(jīng)網(wǎng)絡(luò)的聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法,該算法充分考慮到聯(lián)合數(shù)據(jù)關(guān)聯(lián)隨著目標(biāo)增多對跟蹤精度和實時性的影響。依據(jù)Hopfield神經(jīng)網(wǎng)絡(luò)自適應(yīng)性和數(shù)據(jù)擬合能力等優(yōu)勢,研究表明:該算法可較好地解決在密集雜波情況下的多目標(biāo)跟蹤領(lǐng)域問題,在保證目標(biāo)跟蹤實時性及跟蹤精度的情況下,同時可大幅度減少計算量。在目標(biāo)增多的情況下,該算法的優(yōu)勢會更加明顯?;诟倪M(jìn)聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法為多目標(biāo)跟蹤算法提出一種新思路。將該方法應(yīng)用于雷達(dá)使用中,可提高雷達(dá)的跟蹤精度,增加航行安全。