(杭州電子科技大學信息與控制研究所,浙江 杭州310018)
隨著現(xiàn)代戰(zhàn)爭環(huán)境日益復雜,防空預警體系通過配置多個傳感器組網(wǎng)進行協(xié)同探測,可提高對目標的探測和跟蹤效果[1]。在跟蹤系統(tǒng)中引入傳感器管理是在跟蹤性能和系統(tǒng)資源之間建立一種平衡,以達到系統(tǒng)整體性能最優(yōu)[2]。傳感器管理技術的核心問題是依據(jù)一定的準則,對傳感器資源進行優(yōu)化分配[3]。目前主要有基于線性規(guī)劃論[4]、基于信息論和基于協(xié)方差控制[5-7]的傳感器管理方法。但是由于組網(wǎng)中傳感器數(shù)目的增加,帶來傳感器選擇算法計算量過大的問題。于是便有了貪婪算法[5]的提出,但是該算法對傳感器的選取過于保守,導致頻繁選擇了精度過高的傳感器。本文提出了一種快速多傳感器選擇算法。本方法以控制協(xié)方差水平的思想對傳感器進行管理,在線通過每次選取期望最接近期望增益的傳感器形成探測某目標的傳感器組合,在滿足目標跟蹤精度的前提下,減少了算法的計算量。
目標的運動方程和量測方程為X(k)=FX(k-1)+Gw(k-1)和Zi(k)=HiX(k)+vi(k)。其中i=1,…,N,X(k)是k時刻的目標狀態(tài)向量,Zi(k)是k時刻傳感器i 對目標的量測值,w(k)是系統(tǒng)噪聲,vi(k)是第i個傳感器的量測誤差,都是高斯噪聲且均值為零。Q和Ri是相應的協(xié)方差矩陣。F為狀態(tài)轉(zhuǎn)移矩陣,G為輸入分布矩陣,Hi為傳感器i的觀測矩陣,N為跟蹤系統(tǒng)中的傳感器個數(shù)。對于這樣一個系統(tǒng),傳感器的組合數(shù)可以達到2N-1種。假設第s個傳感器組合用Ds表示,每個組合中的個數(shù)用Ns表示,那么對于給定的第s個組合,其序貫卡爾曼濾波的主要過程為:先對第一個傳感器做一次卡爾曼濾波,接著從第二個傳感器開始依次將前一個傳感器的濾波結果,即狀態(tài)估計值作為下一個傳感器濾波的預測值。
在多傳感器跟蹤融合中,協(xié)方差的遞推更新表達式如下:
狀態(tài)估計的更新過程通常采用上述的逆協(xié)方差形式,這種形式又稱為信息矩陣。定義傳感器組合Ds的信息增益Js為:
由式(2)可知,在不同的觀測噪聲下,各傳感器的信息增益不同。
在組網(wǎng)系統(tǒng)中,傳感器資源相對比較豐富,所以對系統(tǒng)內(nèi)的傳感器資源在跟蹤模式下做選擇時很有必要的。一方面可以提高組網(wǎng)的跟蹤性能,另一方面在滿足跟蹤精度的要求下,可節(jié)省系統(tǒng)資源。
然而使式(3)達到最小的傳感器組合并不一定是控制實際協(xié)方差逼近期望協(xié)方差的最優(yōu)傳感器組合。為此,采用基于協(xié)方差控制的策略進行傳感器分配傳感器資源,其基本思想是對每個目標預先設定一個期望的跟蹤精度Pd(k),即期望協(xié)方差陣,控制傳感器在某種度量及準則下使實際協(xié)方差在某種意義上逼近Pd(k)。目標函數(shù)為:
傳感器選擇問題可描述為一個組合優(yōu)化問題。以前對于傳感器組合的選擇一般都需要遍歷組網(wǎng)中所有的傳感器組合,假設組網(wǎng)中有N個傳感器,那么遍歷步長則為2N-1步,其計算復雜度為O(2Nn3)。所以增加組網(wǎng)中的傳感器數(shù)量,計算量會顯著增加,全遍歷尋優(yōu)方式存在組合爆炸問題。為了減少計算量,本文提出一種貪婪啟發(fā)式算法,算法的主要思想是基于期望信息增益的思想,每次選取一個“最佳”的傳感器形成探測某目標的傳感器組合,通過一系列的貪婪選擇當前狀態(tài)下的最優(yōu)選擇,逐步逼近給定的目標,直到滿足跟蹤精度要求。
算法結合協(xié)方差控制傳感器管理方法的概念,引入“期望信息增益”概念,動態(tài)計算各傳感器的期望信息增益,根據(jù)式(2)可計算出各傳感器觀測目標時的信息增益:
根據(jù)各傳感器接近期望信息增益的程度對傳感器進行排序,在線通過每次選取期望最接近期望增益的傳感器形成探測某目標的傳感器組合。排序目標函數(shù)如下:
根據(jù)每個時刻的排序結果,利用協(xié)方差思想可以選出當前時刻使的對角陣的最小值大于零的傳感器組合D(k),這便是當前時刻作為濾波跟蹤的傳感器組合。
與傳統(tǒng)協(xié)方差控制相比,本方法中待選的傳感器組合數(shù)為M個,而傳統(tǒng)協(xié)方差控制中待選傳感器組合個數(shù)為2M-1。同時本算法無需遍歷所有傳感器組合,當某種組合下跟蹤精度滿足時,停止搜索。本算法保證在滿足跟蹤精度的前提下,大大減小了計算量??朔嘶谛畔⒄搨鞲衅鞴芾矸椒ㄆ孀非笮畔⒘孔畲蟮娜秉c,滿足系統(tǒng)對跟蹤精度要求的前提下,可以盡可能地節(jié)省資源。
仿真場景參考文獻[8]。將本文提出的快速啟發(fā)式算法與傳統(tǒng)協(xié)方差控制算法和貪婪算法進行比較,使用Monte Carlo仿真,仿真測試為50次。經(jīng)過50次Monte Carlo仿真,貪婪算法和快速啟發(fā)式算法的平均計算時間為0.001 1 s和0.001 4 s,而傳統(tǒng)的協(xié)方差控制算法的平均耗時為0.499 5 s,可以發(fā)現(xiàn)算法在減少計算量上取得了明顯的效果。
3種算法各時刻的雷達選擇情況如圖1所示。由圖1可知傳統(tǒng)協(xié)方差控制算法在傳感器選擇上出現(xiàn)明顯的切換情況,貪婪算法在穩(wěn)定后沒有出現(xiàn)切換,快速啟發(fā)式算法在穩(wěn)定后傳感器2和6 之間有切換。而且在前50 s 快速啟發(fā)式算法比貪婪算法只多選了一個傳感器,在后50 s 快速啟發(fā)式算法雖然與傳統(tǒng)協(xié)方差控制算法都選擇了5個傳感器,但是明顯穩(wěn)定了許多。
3種算法的濾波協(xié)方差與期望協(xié)方差的一個相互比較如圖2所示,控制效果最好的自然是傳統(tǒng)的協(xié)方差控制算法,但是它的耗時大大降低了其實用性。其他兩種算法中,都具有耗時短實用性強的特點,但是快速啟發(fā)式算法的協(xié)方差控制效果與期望的差距明顯小于貪婪算法,控制效果的提高體現(xiàn)了在選擇最好傳感器的準則的改變是可行的。
圖1 3種算法各時刻的雷達選擇情況
圖2 3種算法的位置協(xié)方差比較
傳統(tǒng)的協(xié)方差控制算法由于計算量太大常不能應用于實際系統(tǒng)中,貪婪算法和快速啟發(fā)式算法降低了傳感器選擇算法中計算的復雜度,具有很強實用性,這也是降低傳感器選擇算法的一種趨勢。在這個趨勢下,可以通過選取某種更好地貪婪準則使其即快速又準確的選擇與最優(yōu)組合更接近的傳感器組合。本文討論的多傳感器快速選擇算法比貪婪算法增加計算量很少,并且可以找到一個更優(yōu)的傳感器組合,使濾波協(xié)方差更接近期望協(xié)方差水平。所以它具有貪婪算法的計算效率,同時獲得比貪婪算法具有更好性能。
[1]葉朝謀,丁建江,李庭勝,等.雷達探測資源管理技術分析與評估[J].現(xiàn)代雷達,2012,34(3):6-11.
[2]田康生,朱光喜.目標跟蹤中的傳感器管理[J].傳感器技術,2003,22(3):27-29.
[3]何友,王國宏,關欣.信息融合理論及應用[M].北京:電子工業(yè)出版社,2010:444-447.
[4]Xiong N,Svensson P.Multi-sensor management for information fusion:issues and approaches[J].Information Fusion,2002,3(2):163-186.
[5]Kalandros M,Pao L Y.Controlling Target Estimate Covariance in Centralized Multisensor Systems[C].Philadelphia:American Automatic Control Council,1998:2 749-2 753.
[6]周文輝,胡衛(wèi)東,余安喜,等.基于協(xié)方差控制的集中式傳感器分配算法研究[J].電子學報,2003,31(12):2 158-2 162.
[7]楊秀珍,何友,鞠傳文.基于跟蹤精度控制的傳感器管理方法研究[J].電光與控制,2005,12(1):9-11.
[8]韓海峰,周文輝,陳國海.目標跟蹤中期望協(xié)方差控制的分布式多傳感器管理[J].現(xiàn)代雷達,2007,29(1):47-51.