李召瑞,安 雷,吉 兵,朱世磊
(陸軍工程大學(xué) 石家莊校區(qū),河北 石家莊 050051)
傳感器調(diào)度主要通過(guò)有針對(duì)性地分配傳感器資源及探測(cè)時(shí)間區(qū)間,以達(dá)到提高目標(biāo)跟蹤精度、降低使用代價(jià)等目的。在傳感器目標(biāo)跟蹤的實(shí)際應(yīng)用中,調(diào)度信號(hào)延遲、伺服系統(tǒng)工作駐留、跟蹤信息轉(zhuǎn)交等因素頻繁地切換會(huì)嚴(yán)重影響目標(biāo)跟蹤效能。在跟蹤精度的同時(shí),為降低切換頻次,文獻(xiàn)[2]將交接次數(shù)閾值代入到調(diào)度方案求解當(dāng)中,但只能獲得次優(yōu)解;文獻(xiàn)[3]為應(yīng)對(duì)相控陣?yán)走_(dá)跟蹤中存在的時(shí)延問(wèn)題,引入調(diào)度代價(jià)以確保任務(wù)優(yōu)先級(jí),但可操作性不強(qiáng),容易丟失最優(yōu)解;文獻(xiàn)[4]則基于最大切換次數(shù)求解多基地雷達(dá)系統(tǒng)最優(yōu)調(diào)度序列,但未考慮工作時(shí)長(zhǎng)因素,仍然存在缺陷;文獻(xiàn)[5]基于固定工作時(shí)長(zhǎng)約束研究傳感器調(diào)度方法,規(guī)定傳感器只要達(dá)到工作時(shí)長(zhǎng)就進(jìn)行切換,沒(méi)有考慮代價(jià)因素,與實(shí)際情況不符;相比之下,文獻(xiàn)[6-7]中調(diào)度時(shí)刻由工作時(shí)長(zhǎng)和代價(jià)函數(shù)共同決定,方法更加貼近實(shí)際。
針對(duì)上述問(wèn)題,本文以多傳感器跟蹤多目標(biāo)為應(yīng)用場(chǎng)景,基于最小工作時(shí)長(zhǎng),提出一種以傳感器切換代價(jià)為約束條件的長(zhǎng)時(shí)調(diào)度方法。首先,基于POMDP建立多傳感器系統(tǒng)跟蹤多目標(biāo)場(chǎng)景下的調(diào)度模型;然后,將交互式多模型算法(IMM)與模糊積分粒子濾波算法(FQPF)相結(jié)合,并以后驗(yàn)克拉美羅下界(PCRLB)為衡量指標(biāo),提出長(zhǎng)時(shí)跟蹤精度的預(yù)測(cè)方法,當(dāng)傳感器達(dá)到最小工作時(shí)長(zhǎng)后,再根據(jù)跟蹤精度預(yù)測(cè)結(jié)果來(lái)決策是否進(jìn)行切換;最后,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證調(diào)度模型和調(diào)度方法的有效性。
充分考慮不同傳感器功能的差異性,將傳感器的最小工作時(shí)長(zhǎng)設(shè)為φ∈{ },,…,φ。假設(shè)其中傳感器在時(shí)刻已工作滿φ時(shí)長(zhǎng),則此時(shí)依據(jù)目標(biāo)優(yōu)化函數(shù)決策是否進(jìn)行切換,若仍然調(diào)度進(jìn)行觀測(cè),則在+1時(shí)刻繼續(xù)決策;若時(shí)刻選擇調(diào)度傳感器(≠),則該傳感器必須工作滿φ時(shí)長(zhǎng),直至+φ時(shí)刻重新決策是否切換傳感器。
在此基礎(chǔ)上,構(gòu)建目標(biāo)優(yōu)化函數(shù):
2.1.1 初始數(shù)據(jù)交互
2.1.2 模型濾波估計(jì)
2.1.3 模型概率更新
2.1.4 數(shù)據(jù)估計(jì)融合
根據(jù)目標(biāo)在各模型跟蹤下的狀態(tài)、協(xié)方差及對(duì)應(yīng)的模型概率,獲得+1時(shí)刻的目標(biāo)的運(yùn)動(dòng)狀態(tài)及其協(xié)方差矩陣:
通過(guò)IMM-FQPF算法可以有效改善目標(biāo)跟蹤能力,便于長(zhǎng)期跟蹤精度的準(zhǔn)確預(yù)測(cè)。
PCRLB是隨機(jī)向量?的Fisher信息矩陣的逆矩陣,它可以在目標(biāo)跟蹤中僅依據(jù)當(dāng)前先驗(yàn)信息,預(yù)測(cè)下一步或多步時(shí)刻內(nèi)未知狀態(tài)的估計(jì)性能邊界,常作為跟蹤精度的衡量指標(biāo),其詳細(xì)推導(dǎo)過(guò)程見(jiàn)文獻(xiàn)[13]。在PCRLB的基礎(chǔ)上結(jié)合IMM-FQPF算法,提出長(zhǎng)時(shí)跟蹤精度的預(yù)測(cè)方法。
1)初始化
4)計(jì)算目標(biāo)狀態(tài)轉(zhuǎn)移先驗(yàn)概率密度函數(shù)
依據(jù)文獻(xiàn)[15],目標(biāo)的狀態(tài)轉(zhuǎn)移先驗(yàn)概率密度函數(shù)為:
在仿真中,為驗(yàn)證本文提出方法的有效性,同時(shí)選取無(wú)時(shí)長(zhǎng)約束調(diào)度策略(Non Time Constrained Scheduling Policy,NTCSP)以及固定時(shí)長(zhǎng)約束調(diào)度策略(Fixed Time Scheduling Policy,F(xiàn)TSP)進(jìn)行對(duì)比,三種方法的目標(biāo)跟蹤精度對(duì)比結(jié)果如圖1所示。
由圖1可看出,閾值分別取40,50,60時(shí),將本文方法與NTCSP、FTSP所得目標(biāo)跟蹤精度進(jìn)行對(duì)比,目標(biāo)跟蹤精度的值用協(xié)方差矩陣的跡來(lái)表示。由于三種方法本質(zhì)上都是調(diào)度滿足跟蹤精度閾值的誤差最小的傳感器進(jìn)行跟蹤,所以基本都能滿足閾值要求。但在目標(biāo)跟蹤中,傳感器的切換次數(shù)越多,產(chǎn)生的切換代價(jià)越大,而本文的優(yōu)化目標(biāo)是利用更小的切換代價(jià),獲得更高的跟蹤精度,所以采取閾值與平均跟蹤精度的差除以切換次數(shù)的數(shù)值作為指標(biāo),衡量不同方法在目標(biāo)跟蹤中的實(shí)際效能。為此,將三類方法在跟蹤過(guò)程中的平均跟蹤精度、傳感器切換次數(shù)及跟蹤效能指標(biāo)進(jìn)行對(duì)比,結(jié)果如表1所示。
圖1 不同閾值條件下的目標(biāo)跟蹤精度
表1 不同閾值條件下的目標(biāo)跟蹤效能對(duì)比
從表1中可知:FTSP的平均跟蹤精度要略低于本文方法,但由于其規(guī)定傳感器工作滿固定時(shí)長(zhǎng)后,必須切換其他傳感器進(jìn)行跟蹤,導(dǎo)致切換次數(shù)明顯偏高;而NTCSP不考慮工作時(shí)長(zhǎng)約束,每一時(shí)刻都進(jìn)行決策,切換次數(shù)最高。所以,在3個(gè)閾值條件下比較跟蹤效能指標(biāo),所提方法明顯優(yōu)于NTCSP和FTSP。
在本節(jié)仿真條件下,利用所提方法跟蹤目標(biāo)得到的運(yùn)動(dòng)軌跡及調(diào)度序列如圖2、圖3所示(=50)。
圖2 目標(biāo)運(yùn)動(dòng)軌跡
圖3 傳感器調(diào)度序列
從3.1節(jié)仿真實(shí)驗(yàn)可以看出,不同閾值條件下的傳感器系統(tǒng)目標(biāo)跟蹤精度和切換次數(shù)存在顯著差異。為進(jìn)一步分析閾值選取在本文所提方法中對(duì)目標(biāo)跟蹤效能的影響,在[10,90]區(qū)間內(nèi)間隔一共選取81個(gè)閾值進(jìn)行200次蒙特卡洛仿真實(shí)驗(yàn),其余參數(shù)設(shè)置不變。不同閾值下的平均跟蹤精度結(jié)果如圖4所示。由圖4可知:當(dāng)閾值小于40時(shí),所提方法的目標(biāo)跟蹤精度受跟蹤算法性能的限制,將會(huì)穩(wěn)定保持在算法精度的最小值附近波動(dòng);反之,閾值設(shè)置的過(guò)大,所有的傳感器都能滿足要求,將會(huì)減弱閾值對(duì)跟蹤精度的限制作用,而且由于跟蹤精度會(huì)隨著時(shí)間的推移保持穩(wěn)定,所以隨著閾值的不斷增大,平均跟蹤精度將逐漸趨向于跟蹤算法精度的均值。
圖4 不同閾值下的平均跟蹤精度
根據(jù)目標(biāo)函數(shù)的要求,在不考慮輻射代價(jià)的前提下,要利用更低的切換代價(jià)獲得最佳的跟蹤精度,不同閾值下滿足其精度要求的時(shí)長(zhǎng)曲線如圖5所示。由圖5可知,當(dāng)閾值過(guò)低時(shí),受跟蹤算法性能的限制,每輪仿真時(shí)間內(nèi)不能達(dá)到跟蹤精度閾值要求的時(shí)間較大(當(dāng)>24時(shí),滿足閾值要求的時(shí)間等于74 s)。
圖5 不同閾值下滿足跟蹤精度閾值要求的時(shí)長(zhǎng)
不同閾值下的傳感器切換次數(shù)如圖6所示,當(dāng)閾值過(guò)高時(shí),一方面急劇增加的傳感器切換次數(shù)會(huì)帶來(lái)過(guò)高的切換代價(jià),影響跟蹤性能;另一方面過(guò)高閾值所帶來(lái)的跟蹤精度上升問(wèn)題,也會(huì)使得目標(biāo)跟蹤失去意義。閾值小于40時(shí),閾值的變化對(duì)傳感器跟蹤精度的影響較小,在滿足閾值的前提下,基于降低調(diào)度代價(jià)的目的,會(huì)促使傳感器切換次數(shù)保持在較低水平。所以,為保持更佳的目標(biāo)跟蹤效能,閾值建議在(24,40)區(qū)間內(nèi)選取。
圖6 不同閾值下的傳感器切換次數(shù)
本文以多傳感器跟蹤多目標(biāo)為應(yīng)用場(chǎng)景,引入最小工作時(shí)長(zhǎng),提出一種切換代價(jià)約束下的傳感器調(diào)度方法。該方法在保證目標(biāo)跟蹤精度的同時(shí),可有效兼顧傳感器切換代價(jià),跟蹤效果穩(wěn)定,可依據(jù)實(shí)際任務(wù)需求,通過(guò)閾值對(duì)跟蹤精度進(jìn)行有效控制,進(jìn)而減少不必要的調(diào)度,基本實(shí)現(xiàn)了利用更少的切換代價(jià)獲得較好跟蹤精度的目標(biāo)。仿真實(shí)驗(yàn)結(jié)果表明,相比于NTCSP和FTSP,本文方法在滿足跟蹤精度閾值要求的同時(shí),顯著降低了傳感器切換次數(shù),能夠有效克服切換代價(jià)對(duì)目標(biāo)跟蹤的影響,跟蹤效能更優(yōu)。