徐瑞陽(yáng),馮新喜,孔云波,鹿傳國(guó)
(1.空軍工程大學(xué)信息與導(dǎo)航學(xué)院,陜西西安710077;2.95806部隊(duì),北京100086)
目標(biāo)跟蹤是傳感器系統(tǒng)的一項(xiàng)重要功能,當(dāng)使用多只傳感器對(duì)目標(biāo)進(jìn)行跟蹤時(shí),由于傳感器的能量有限,不能時(shí)刻使用所有的傳感器進(jìn)行觀測(cè)和跟蹤,需要根據(jù)不同的情況調(diào)用傳感器資源,同時(shí),傳感器與目標(biāo)的分配管理也是一個(gè)至關(guān)重要的問題。
Nash M[1]提出使用線性規(guī)劃確定傳感器對(duì)目標(biāo)的分配,使用卡爾曼濾波器中的誤差協(xié)方差矩陣的跡作為目標(biāo)函數(shù)中的代價(jià)系數(shù);Bier SG 和 Rothman P L[2,3]使用布爾矩陣定義了一種以傳感器能力和有效性為準(zhǔn)的傳感器與目標(biāo)配對(duì)方法。童俊和單甘霖[4]提出了一種基于目標(biāo)跟蹤精度Cramér-Rao下限的多傳感器跟蹤資源協(xié)同分配方法。楊小軍和馬祥[5]提出了一種基于條件后驗(yàn)克拉美—羅下界(CPCRLB)的傳感器網(wǎng)絡(luò)節(jié)點(diǎn)管理方法。基于目標(biāo)信號(hào)強(qiáng)度(RSS)推導(dǎo)了目標(biāo)狀態(tài)估計(jì)均方誤差的CPCRLB。利用粒子濾波器逼近目標(biāo)狀態(tài)并估計(jì)CPCRLB,實(shí)現(xiàn)傳感器節(jié)點(diǎn)在線選擇。
本文在上述研究工作的基礎(chǔ)上,首先推導(dǎo)了粒子濾波下無源傳感器后驗(yàn)CPCRLB的計(jì)算公式,然后以目標(biāo)跟蹤后驗(yàn)CPCRLB的相反數(shù)作為選擇的適應(yīng)值進(jìn)行遺傳迭代,同時(shí)計(jì)算目標(biāo)的區(qū)分度增量,通過合理分配傳感器資源降低整個(gè)跟蹤過程中的能耗。
假定有m只傳感器和n個(gè)目標(biāo),進(jìn)行傳感器管理就是通過分配矩陣將傳感器分配給不同的目標(biāo),分配矩陣中的元素為0或1,行數(shù)為傳感器數(shù)量,列數(shù)為目標(biāo)數(shù)量
其中,0為該傳感器u這一時(shí)刻的量測(cè)不分配給目標(biāo)ν,1為傳感器u這一時(shí)刻的量測(cè)分配給目標(biāo)ν。
以 C={C1,C2,…,C2m×n-1}來表示傳感器的分配方案,其中,Ci為不同的傳感器分配矩陣,假設(shè)每個(gè)傳感器最多可以跟蹤ki(i=1,2,…,n)個(gè)目標(biāo),設(shè)定某種度量方法P(x)作為代價(jià)的衡量,所以,傳感器管理的模型為
約束條件為
對(duì)一個(gè)二維目標(biāo)進(jìn)行跟蹤,目標(biāo)的狀態(tài)方程和量測(cè)方程分別為
其中,wk為零均值高斯白噪聲,vk為量測(cè)噪聲并獨(dú)立于狀態(tài)噪聲wk。
根據(jù)文獻(xiàn)[5]可得,在k+1時(shí)刻對(duì)目標(biāo)狀態(tài)估計(jì)的條件下界滿足
其中,L-1(xk+1|z1∶k)為 CPCRLB。
文獻(xiàn)[6]提出了一種直接計(jì)算CPCRLB的計(jì)算方法
目標(biāo)跟蹤的量測(cè)方程為非線性方程
其中,θk=是在無源傳感器下,傳感器對(duì)目標(biāo)的量測(cè),(ak,bk),(a0,b0)分別為目標(biāo)位置預(yù)測(cè)與傳感器的橫縱坐標(biāo)。
在加性高斯量測(cè)噪聲假設(shè)下,量測(cè)數(shù)據(jù)的對(duì)數(shù)似然度為
初始迭代條件為
在式(4)和式(8)確定的狀態(tài)方程和量測(cè)方程下,計(jì)算CPCRLB所需的式(8)~式(10)中的數(shù)學(xué)期望為
對(duì)非線性量測(cè)模型,B22,bk通常沒有解析表達(dá)式。為計(jì)算B22,bk,假設(shè)目標(biāo)狀態(tài)服從一階Markov過程,采用重要性重采樣粒子濾波器進(jìn)行濾波,重要性函數(shù)選為通常使用的狀態(tài)轉(zhuǎn)移函數(shù),此時(shí)權(quán)值可由似然函數(shù)獲得,在重采樣后,目標(biāo)的概率密度函數(shù)可近似為
由式(11)~式(14)可得,基于無源量測(cè)數(shù)據(jù)的條件FIM可以迭代逼近計(jì)算如下
矩陣B22,bk的元素如下
當(dāng)目標(biāo)之間的距離過近時(shí),需要依據(jù)目標(biāo)之間的區(qū)分度制定傳感器資源分配策略。根據(jù)文獻(xiàn)[8],假設(shè)k時(shí)刻獲得的量測(cè)為zk,在第k次觀測(cè)后,目標(biāo)的區(qū)分度由下式計(jì)算獲得
其中,p(xk|zk)為k時(shí)刻獲得第k次觀測(cè)后的后驗(yàn)概率密度函數(shù),第k次觀測(cè)之后所得的期望區(qū)分度增量為
在觀測(cè)方程為非線性時(shí),需要用采樣粒子對(duì)結(jié)果進(jìn)行近似,近似后的結(jié)果為
當(dāng)E[D|zk]小于某個(gè)門限值時(shí),就需要調(diào)用更多的傳感器資源對(duì)目標(biāo)進(jìn)行更精確的跟蹤。
計(jì)算采用矩陣遺傳算法作為優(yōu)化算法,計(jì)算每次跟蹤的條件后驗(yàn)CPCRLB的相反數(shù)作為適應(yīng)值,并計(jì)算每一時(shí)刻的目標(biāo)區(qū)分度增量。算法的具體過程如下:
1)隨機(jī)產(chǎn)生初始的分配矩陣種群,設(shè)定交叉和變異概率,設(shè)定區(qū)分度增量門限值;
2)用初始種群中的個(gè)體對(duì)目標(biāo)進(jìn)行跟蹤,計(jì)算CPCRLB的相反數(shù)作為適應(yīng)值進(jìn)行選擇,規(guī)定分配矩陣中如果有任意一列為全0(該目標(biāo)沒有被跟蹤),則適應(yīng)值為無窮;
3)進(jìn)行交叉和變異;
4)計(jì)算目標(biāo)的區(qū)分度增量;
5)當(dāng)區(qū)分度增量小于設(shè)定的門限時(shí),增加傳感器的數(shù)目;
6)反復(fù)進(jìn)行步驟(1)~(5),根據(jù)不同的情況確定不同的傳感器分配矩陣對(duì)傳感器進(jìn)行分配。
設(shè)定仿真環(huán)境為使用5只傳感器對(duì)目標(biāo)進(jìn)行跟蹤,傳感器為無源傳感器,初始目標(biāo)為3個(gè),運(yùn)行傳感器數(shù)為2只,之后又出現(xiàn)2個(gè)目標(biāo),目標(biāo)間距變小。濾波算法采用粒子濾波算法,關(guān)聯(lián)算法采用最近鄰算法,選擇算子采用輪盤賭算子,種群數(shù)量為7個(gè),交叉和變異概率分別設(shè)置為pc=0.2,pm=0.3,進(jìn)行50次蒙特—卡洛仿真。目標(biāo)航跡和跟蹤效果如圖1、圖2所示。
圖1 目標(biāo)航跡圖Fig 1 Target trajectories
圖2 跟蹤效果圖Fig 2 Tracking effect diagram
圖1 中從(1,20),(4,30),(6,40)m 起始的三個(gè)目標(biāo)為初始目標(biāo);圖2中觀測(cè)站1,2為最初使用的傳感器,觀測(cè)站3,4,5為新目標(biāo)出現(xiàn)后新調(diào)用的傳感器,從圖2中可以看出:當(dāng)新出現(xiàn)目標(biāo)使得目標(biāo)間距減小時(shí),該算法通過增加傳感器數(shù)量保證了目標(biāo)之間的區(qū)分和對(duì)目標(biāo)的跟蹤。
目標(biāo)跟蹤過程中的區(qū)分度增量變化如圖3所示。
圖3中由于傳感器數(shù)目帶來的跟蹤精度影響,目標(biāo)區(qū)分度增量在跟蹤初始階段波動(dòng)比較大,在20 s時(shí)刻新目標(biāo)出現(xiàn),目標(biāo)間距減小導(dǎo)致區(qū)分度增量減少,調(diào)用更多傳感器進(jìn)行跟蹤后,區(qū)分度增量逐步增大,并趨于穩(wěn)定。
圖3 跟蹤過程中區(qū)分度增量變化情況Fig 3 Change of discrimination gain during tracking process
整個(gè)跟蹤過程中傳感器能量消耗如圖4所示。
圖4 不同算法跟蹤過程能量消耗對(duì)比Fig 4 Contrast of energy consumption of tracking process of different algorithms
圖4顯示了引入?yún)^(qū)分度增量的傳感器管理算法和一般傳感器管理算法在跟蹤過程中能量消耗對(duì)比情況,假設(shè)傳感器在工作時(shí)每秒耗能5 W,初始跟蹤時(shí)只使用了2只傳感器對(duì)目標(biāo)進(jìn)行跟蹤,新目標(biāo)出現(xiàn)后才調(diào)用了其他傳感器,整個(gè)過程中能量消耗950 W,相比于使用全部傳感器進(jìn)行跟蹤消耗的1250 W減少了300 W。
跟蹤過程中7個(gè)個(gè)體的適應(yīng)值變化情況如圖5所示。
圖5 跟蹤過程中個(gè)體適應(yīng)值變化情況Fig 5 Change of individual fitness value during tracking process
本文基于區(qū)分度增量和條件后驗(yàn)CPCRLB提出了一種傳感器資源分配算法,這種算法以CPCRLB的相反數(shù)作為遺傳算法的適應(yīng)值,同時(shí)引入目標(biāo)區(qū)分度增量作為判斷目標(biāo)區(qū)分度的標(biāo)準(zhǔn),相比于用固定數(shù)量傳感器跟蹤目標(biāo)降低了整個(gè)傳感器系統(tǒng)的能耗。接下來需要深入研究對(duì)異類傳感器進(jìn)行管理和將目標(biāo)的優(yōu)先級(jí)與算法結(jié)合起來。
[1]Nash M.Optimal allocation of tracking resource[C]∥Proceedings of the IEEE Conference on Decision and Control,1977:1177-1180.
[2]Rothman P L,Bier S G.Eva1uation of sensor management systems[C]∥Proceedings of the NAECON,1989:1747-1752.
[3]Bier SG,Rothman P L,Manske R A.Intelligent sensor management for beyond visual range air-to-air combat[C]∥Proceedings of the NAE2CON,1988:264-269.
[4]童 俊,單甘霖.基于Cramér-Rao下限的多傳感器跟蹤資源協(xié)同分配[J].宇航學(xué)報(bào),2012,33(9):1314-1321.
[5]楊小軍,馬 祥,宋青松,等.基于條件后驗(yàn)克拉美—羅下界的目標(biāo)跟蹤傳感器管理[J].控制理論與應(yīng)用,2013,30(5):543-548.
[6]Zuo L,Niu R,Varshney P K.Conditional posterior Cramer-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2011,59(1):1-14.
[7]Zheng Y,Ozdemir O,Niu R,et al.New conditional posterior Cramér-Rao lower bounds for nonlinear sequential Bayesian estimation[J].IEEE Transactions on Signal Processing,2012,60(10):5549-5556.
[8]Cai Chenghui,F(xiàn)errari Silvia.Comparison of information-theoretic objective functions for decision support in sensor systems[C]∥Proc of the American Control Conference,2007:3559-3564.
[9]李 秉,王鳳山.區(qū)域防空多傳感器管理體系結(jié)構(gòu)與功能模塊研究[J].傳感器與微系統(tǒng),2009,28(3):117-120.
[10]張應(yīng)華,周 林,劉先省.基于測(cè)量方差時(shí)變的傳感器管理算法[J].傳感器與微系統(tǒng),2007,26(3):68-72.