楊善超,田康生,吳長飛
(空軍預(yù)警學(xué)院 預(yù)警情報(bào)系,湖北 武漢 430019)
在現(xiàn)代高技術(shù)、信息化作戰(zhàn)中,防空反導(dǎo)預(yù)警體系所面臨的敵方電子干擾、反輻射導(dǎo)彈、隱身目標(biāo)和低空入侵等威脅越來越嚴(yán)重。雷達(dá)組網(wǎng)能夠運(yùn)用數(shù)據(jù)融合技術(shù),通過對多雷達(dá)進(jìn)行管理,實(shí)現(xiàn)信息的冗余和互補(bǔ)、覆蓋范圍的拓展、檢測性能和空間分辨率的提高,是提高我“四抗”能力,應(yīng)對這些威脅的有效方式。在多雷達(dá)多目標(biāo)背景下,由于傳感器資源的相對不足、目標(biāo)機(jī)動性的增強(qiáng)及環(huán)境不確定性的增加,必須解決雷達(dá)對目標(biāo)的分配問題,才能完成對多掃描空間和多目標(biāo)的探測跟蹤任務(wù)。近年來,部分學(xué)者將雷達(dá)網(wǎng)多目標(biāo)分配方法總結(jié)為以下幾種:基于濾波技術(shù)及協(xié)方差控制的方法、基于數(shù)學(xué)規(guī)劃及智能優(yōu)化技術(shù)的方法、基于信息論的方法、其他方法[1-2];但是這些有的是分配模型構(gòu)建方法(基于協(xié)方差控制),有的是分配方案某種衡量標(biāo)準(zhǔn)的度量(例如信息增量),有的是模型求解算法(數(shù)學(xué)規(guī)劃及智能優(yōu)化技術(shù)),將其作為目標(biāo)分配方法并行的分類并不合理。
另一種是將目標(biāo)分配方法分為優(yōu)化方法、控制方法、決策方法3類。優(yōu)化方法是找出使某一指標(biāo)達(dá)到最優(yōu)的分配方案;控制方法是將某一指標(biāo)控制在限定范圍之內(nèi),例如基于協(xié)方差控制的方法就是找出使實(shí)際跟蹤精度最貼近于期望精度的分配方案;決策方法則將人的偏好等因素考慮在內(nèi)。這種分類方法是并行的分類,但是存在交叉問題,比如決策類方法,有時在進(jìn)行決策過程中也需要使某一指標(biāo)達(dá)到最優(yōu),這又可以歸類為優(yōu)化方法。但是總的來看,這3類方法都是先構(gòu)建出一定約束條件下反映某種性能指標(biāo)的目標(biāo)函數(shù),綜合目標(biāo)函數(shù)、約束條件構(gòu)成了雷達(dá)網(wǎng)多目標(biāo)分配模型,再利用求解算法找出其最優(yōu)目標(biāo)分配方案。劉先省[2]也指出傳感器管理的核心問題就是依據(jù)傳感器資源的約束條件建立一個易于量化的目標(biāo)函數(shù),然后對目標(biāo)函數(shù)進(jìn)行求解以獲得傳感器對目標(biāo)的有效分配。因此,本文將從目標(biāo)函數(shù)、約束條件和求解方法3方面對雷達(dá)網(wǎng)目標(biāo)分配的方法、理論進(jìn)行梳理和概述,以對其研究現(xiàn)狀和前沿問題進(jìn)行把握和跟蹤。
分配模型包含目標(biāo)函數(shù)和約束條件2部分。目標(biāo)函數(shù)的構(gòu)建是為了達(dá)到某個具體特性的要求,反映了進(jìn)行雷達(dá)網(wǎng)目標(biāo)分配所要實(shí)現(xiàn)的目的;約束條件反映了雷達(dá)網(wǎng)資源、探測能力等的約束限制。雷達(dá)網(wǎng)目標(biāo)分配模型流程如圖1所示。
1.1.1 效能函數(shù)
雷達(dá)對目標(biāo)執(zhí)行任務(wù)時所產(chǎn)生的效能反應(yīng)了該任務(wù)所能取得的成效,其決定于目標(biāo)特性、雷達(dá)性能、雷達(dá)與目標(biāo)配對與否等因素。雷達(dá)網(wǎng)目標(biāo)分配的效能函數(shù)衡量不同方案所產(chǎn)生的系統(tǒng)效能,從而找出最優(yōu)目標(biāo)分配方案。
Bier和Rothman[3-4]定義了一種基于傳感器與目標(biāo)配對有效性的模型,利用傳感器性能模型預(yù)測傳感器對目標(biāo)的效能,并將其作為目標(biāo)函數(shù),對各備選傳感器分配方案的臨界效益進(jìn)行量化,利用目標(biāo)航跡的有效數(shù)據(jù),可以對量測性能進(jìn)一步預(yù)測,這樣就可以估計(jì)出每個備選方案的目標(biāo)函數(shù)值。國內(nèi)學(xué)者的研究大多集中于構(gòu)建不同雷達(dá)與目標(biāo)配對的效能函數(shù),在此基礎(chǔ)上根據(jù)目標(biāo)優(yōu)先級以及雷達(dá)與目標(biāo)配對與否構(gòu)建出目標(biāo)函數(shù),其一般形式為
(1)
(2)
式中:efij為效能函數(shù),其一般定義為:當(dāng)用雷達(dá)(組)對目標(biāo)進(jìn)行探測時,雷達(dá)對系統(tǒng)所做貢獻(xiàn)的大小與其潛在價值相比較的數(shù)值。效能函數(shù)的影響因素不同,其內(nèi)涵和表現(xiàn)形式都不同。
梅發(fā)國等[5]將傳感器分配給探測航跡段的效能定義為以下3個值的加權(quán)和:傳感器對探測航跡段的覆蓋能力得分、跟蹤能力得分、預(yù)警時間。田德偉[6]將傳感器對目標(biāo)的效能函數(shù)定義為監(jiān)視效果。張雅青[7]將效能函數(shù)定義為最小夾角和駐留時間的函數(shù)。
可以看出這些效能函數(shù)主要從預(yù)警時間、多目標(biāo)能力、航跡壽命、跟蹤能力,以及探測發(fā)現(xiàn)概率等角度出發(fā)。在這些效能因素里,預(yù)警時間、跟蹤能力、探測發(fā)現(xiàn)概率3種效能受到相對更多的重視,體現(xiàn)了更強(qiáng)的重要性,這是由于預(yù)警時間、跟蹤能力、以及發(fā)現(xiàn)概率是評判雷達(dá)執(zhí)行預(yù)警探測任務(wù)情況主要指標(biāo),對這三者進(jìn)行優(yōu)化才能更好地完成預(yù)警探測任務(wù)。
另一方面,上述的效能函數(shù)更多反映的是雷達(dá)自身性能;然而雷達(dá)與目標(biāo)配對的效能函數(shù)不僅與雷達(dá)有關(guān),還與目標(biāo)的優(yōu)先級等特性有關(guān),對高優(yōu)先級的目標(biāo)執(zhí)行同級別的任務(wù)其效能必定更高[8-9]。此外朱斯平[10]從系統(tǒng)要求的角度出發(fā),將雷達(dá)測量參數(shù)精度和系統(tǒng)要求精度的匹配度作為效能函數(shù)的一部分。
1.1.2 跟蹤精度函數(shù)
跟蹤過程中,目標(biāo)的跟蹤精度與對其分配的雷達(dá)資源的多少有關(guān);同樣的,針對不目標(biāo)執(zhí)行不同任務(wù),其對于跟蹤精度的要求也不同。基于跟蹤精度對傳感器進(jìn)行管理是盡可能達(dá)到每個目標(biāo)所需跟蹤精度的主要方法[11]。
目標(biāo)跟蹤精度大多是通過濾波估計(jì)協(xié)方差的形式來表示的,很多學(xué)者在研究雷達(dá)網(wǎng)目標(biāo)分配時,提出了基于協(xié)方差控制的方法[12-13],以卡爾曼濾波估計(jì)協(xié)方差為參考,每一時刻遍歷所有雷達(dá)組合并預(yù)測其濾波估計(jì)協(xié)方差,最終選擇濾波估計(jì)協(xié)方差Pi(tk)與期望協(xié)方差Pd(tk)最接近的組合,目標(biāo)函數(shù)為
(3)
上述方法都是假定傳感器對目標(biāo)的觀測是同步的,但是在實(shí)際的雷達(dá)組網(wǎng)探測系統(tǒng)中,各雷達(dá)的采樣周期、通訊延遲等可能會有區(qū)別,會導(dǎo)致在融合中心得到的各雷達(dá)數(shù)據(jù)不能同步。針對這一問題,尹德興等[14]提出了一種基于協(xié)方差控制的異步觀測融合方法,對異步雷達(dá)的量測值按采樣時刻順序?yàn)V波后得到估計(jì)協(xié)方差與期望協(xié)方差之間的偏差。另一方面,周文輝[15]提出一種穩(wěn)態(tài)傳感器目標(biāo)分配算法,設(shè)置一個期望達(dá)到的穩(wěn)態(tài)狀態(tài)協(xié)方差矩陣,根據(jù)Riccati方程對不同傳感器組合進(jìn)行計(jì)算。
利用濾波估計(jì)協(xié)方差來表示跟蹤精度容易受到濾波算法優(yōu)劣以及適應(yīng)性的影響,某一次濾波誤差就有可能導(dǎo)致分配的偏差。文獻(xiàn)[16-17]采用后驗(yàn)克拉美羅下界(PCRLB)作為目標(biāo)跟蹤精度衡量標(biāo)準(zhǔn),獨(dú)立于所采用的濾波算法,易于做單步或者多步預(yù)測計(jì)算,避免了單次運(yùn)算可能帶來的誤差。
為了盡可能的保證重點(diǎn)目標(biāo)的跟蹤精度,需要在每一時刻都進(jìn)行目標(biāo)分配,且每一次分配都要遍歷所有的雷達(dá)組合,這樣可能會導(dǎo)致計(jì)算量的急劇增加以及傳感器的頻繁切換,進(jìn)而給雷達(dá)網(wǎng)系統(tǒng)造成極大負(fù)荷。文獻(xiàn)[18]提出一種改進(jìn)的協(xié)方差控制方法,在目標(biāo)函數(shù)中加入傳感器是否切換的度量因子,以改進(jìn)現(xiàn)有協(xié)方差控制方法要遍歷所有傳感器組合的問題。
1.1.3 信息增量函數(shù)
基于信息論的方法是一種應(yīng)用廣泛的雷達(dá)網(wǎng)目標(biāo)分配方法,通常情況下采用集中式管理策略,將系統(tǒng)信息增量最大作為目標(biāo)函數(shù)[19-20]。
Hintz和McIntyre等[21-23]首先將信息論方法應(yīng)用于單傳感器跟蹤多目標(biāo)時的目標(biāo)分配問題中,使用期望熵變作為期望信息增量,根據(jù)期望信息增量的大小來確定被測量目標(biāo),可以達(dá)到每個采樣間隔獲取信息量最大化的目的。文獻(xiàn)[24-25]給出了2種不同任務(wù)情形下的信息增量表達(dá)方式,在進(jìn)行目標(biāo)檢測時,以最大化先、后驗(yàn)概率密度函數(shù)間的信息熵變化量作為信息增量;當(dāng)進(jìn)行目標(biāo)檢測時,以量測前后目標(biāo)航跡協(xié)方差間的的信息熵變化量作為信息增量,并以此來實(shí)現(xiàn)傳感器的選擇。目標(biāo)檢測時信息增量表達(dá)式為
(4)
目標(biāo)跟蹤時信息增量表達(dá)式為
(5)
或者
I=tr{P(k|k-1)}-tr{P(k|k)}.
(6)
信息論中不確定性的表示方法除開信息熵之外,還有混合0熵(分辨力函數(shù))的形式,它與信息熵不同之處在于混合熵本身就是信息量大小的一種度量[26-27]。另外,文獻(xiàn)[28-29]采用Rényi差異來計(jì)算信息增量,Rényi信息增量對先、后驗(yàn)概率密度函數(shù)的分布沒有高斯限制,更具有靈活性。文獻(xiàn)[28]還將指數(shù)定義的信息熵引入到目標(biāo)檢測問題中,該指數(shù)定義信息熵改善了對數(shù)定義Shannon信息熵中存在的部分情況下信息熵?zé)o定義值和零值問題。
在實(shí)際目標(biāo)分配的過程中,基于信息增量的方法可以通過相關(guān)目標(biāo)信息的積累使其不確定性得到控制,但是信息增量只是目標(biāo)分配的必要條件,還應(yīng)該從目標(biāo)及任務(wù)特性的角度出發(fā)對目標(biāo)分配的充分條件進(jìn)行完善。文獻(xiàn)[30]提出了一種目標(biāo)權(quán)重和信息增量相結(jié)合的方法,該方法在利用IMMKF獲取信息增量的基礎(chǔ)上,結(jié)合由部分排序集合方法得出的任務(wù)優(yōu)先級別來對傳感器資源進(jìn)行分配。
上述方法中,都是通過卡爾曼濾波或者并行、串行卡爾曼濾波得到信息增量,對于只存在高斯噪聲的線性系統(tǒng),采用卡爾曼濾波就進(jìn)行系統(tǒng)狀態(tài)估計(jì),但是現(xiàn)實(shí)中很多系統(tǒng)都是非線性的,卡爾曼濾波便不再適用。針對系統(tǒng)的非線性問題,學(xué)者首先提出了擴(kuò)展卡爾曼濾波方法(EKF)[31],其基本思想是將非線性系統(tǒng)進(jìn)行線性化后再進(jìn)行卡爾曼濾波;但EKF因需要計(jì)算模型的Jacbian矩陣而導(dǎo)致實(shí)現(xiàn)困難,此外EKF在將非線性系統(tǒng)進(jìn)行線性化的過程中,只對非線性函數(shù)泰勒展開式的一階偏導(dǎo)部分進(jìn)行利用,容易產(chǎn)生狀態(tài)估計(jì)誤差,影響濾波算法性能。后來出現(xiàn)了無需Jacbian矩陣計(jì)算的濾波方法,如Unscented卡爾曼濾波(UKF)[32]、粒子濾波[33]。UKF不再對非線性方程進(jìn)行線性化,仍然采用高斯隨機(jī)變量表示狀態(tài)分布,用特定選擇的樣本點(diǎn)對狀態(tài)的后驗(yàn)概率密度進(jìn)行逼近;與EKF相比,UKF能夠有效減小誤差,并且計(jì)算更簡單。粒子濾波是一種基于MonteCarlo仿真的最優(yōu)回歸貝葉斯濾波算法,這種方法需要大量的量測,在此基礎(chǔ)上通過對一組加權(quán)粒子進(jìn)行演化和傳播,來獲得近似的狀態(tài)統(tǒng)計(jì)量,該方法適用于非線性系統(tǒng)的目標(biāo)狀態(tài)濾波[34]。
1.1.4 代價函數(shù)
雷達(dá)網(wǎng)在對目標(biāo)執(zhí)行任務(wù)時,必然會產(chǎn)生資源消耗,也就是雷達(dá)網(wǎng)為目標(biāo)分配所付出的代價。很多學(xué)者針對使系統(tǒng)以最小的資源代價來達(dá)到設(shè)定跟蹤狀態(tài)或者完成規(guī)定任務(wù)的方法進(jìn)行了研究。代價函數(shù)模型為
(7)
文獻(xiàn)[30]在研究雷達(dá)網(wǎng)目標(biāo)分配的過程中,將網(wǎng)絡(luò)傳輸耗能最小作為目標(biāo)函數(shù),不僅考慮了雷達(dá)任務(wù)的要求,還考慮了網(wǎng)絡(luò)間信息傳遞的限制;給出了雷達(dá)發(fā)送和接收數(shù)據(jù)時的耗能模型,這樣就可以根據(jù)傳感器與目標(biāo)配對情況求出每一種方案的總能耗,進(jìn)而選擇能耗最小的分配方案。
雷達(dá)網(wǎng)資源的消耗不僅僅是網(wǎng)絡(luò)線路傳輸能耗,更主要的是雷達(dá)自身資源的消耗。文獻(xiàn)[35-36]根據(jù)目標(biāo)跟蹤性能和傳感器資源的消耗,綜合建立了傳感器管理代價函數(shù),以代價取值最小為目標(biāo)來分配傳感器資源。此外,王慶賀[37]等人在解決多無人機(jī)多目標(biāo)情況下目標(biāo)分配的優(yōu)化問題時,以由無人機(jī)總飛行距離代價、總飛行時間代價、總損毀概率代價構(gòu)成的綜合代價最小作為目標(biāo)函數(shù)。
除開上述的集中目標(biāo)函數(shù)之外,還有一些研究從目標(biāo)的發(fā)現(xiàn)概率[38]、雷達(dá)開機(jī)數(shù)目[39]、雷達(dá)網(wǎng)能發(fā)揮出的威力[40]等角度出發(fā)構(gòu)建目標(biāo)函數(shù),在保證雷達(dá)網(wǎng)自身安全的前提下確保其對目標(biāo)的效能或者威力。
還有很多學(xué)者將上述的2種或多種因素結(jié)合起來構(gòu)建綜合性目標(biāo)函數(shù)或者多目標(biāo)函數(shù)。例如王琳[41]從目標(biāo)跟蹤精度與代價最小2方面共同考慮,將誤差協(xié)方差矩陣的跡與代價之和最小作為目標(biāo)函數(shù)。楊龍坡[42]將傳感器對目標(biāo)執(zhí)行任務(wù)的風(fēng)險系數(shù)、情報(bào)時延系數(shù)、定位誤差系數(shù)和探測概率系數(shù)結(jié)合起來,構(gòu)建了一個綜合因子目標(biāo)函數(shù)。
總的來看,從跟蹤精度和信息增量2個角度進(jìn)行的研究占據(jù)主要部分,說明學(xué)者對目標(biāo)的跟蹤精度以及系統(tǒng)不確定性的優(yōu)化更為重視。
1.2.1 最大跟蹤數(shù)目約束
單傳感器能力是有限制的,最直接的體現(xiàn)就是其可跟蹤的目標(biāo)數(shù)目是有限的,將每個雷達(dá)最多能跟蹤目標(biāo)數(shù)目作為約束函數(shù)的數(shù)學(xué)表達(dá)式為
(8)
1.2.2 目標(biāo)被執(zhí)行任務(wù)容量
目標(biāo)被執(zhí)行任務(wù)容量是指每個目標(biāo)占用的雷達(dá)數(shù)目,雷達(dá)組網(wǎng)將多雷達(dá)組合起來增強(qiáng)整體性能以更好地完成對多目標(biāo)的探測跟蹤任務(wù),單個目標(biāo)占用雷達(dá)數(shù)目越多時,對其執(zhí)行任務(wù)效果會越好。但是雷達(dá)數(shù)目不可能無限制增長,在滿足對每一目標(biāo)執(zhí)行任務(wù)需要的基礎(chǔ)上,單目標(biāo)所占用的雷達(dá)數(shù)目是有限的。文獻(xiàn)[5]將目標(biāo)每一個目標(biāo)只需要一部雷達(dá)進(jìn)行探測作為約束函數(shù):
(9)
文獻(xiàn)[7,9]構(gòu)建的優(yōu)化模型中,將每個目標(biāo)至少分配一個雷達(dá)(組)做為約束條件;相反的,文獻(xiàn)[24]構(gòu)建的基于信息論的目標(biāo)分配規(guī)劃模型中,將每個目標(biāo)只分配不多于一個雷達(dá)(組)作為約束條件。
1.2.3 時間和能量資源約束
雷達(dá)的時間和能量資源有限性是其固有屬性,正是由于這種限制,才導(dǎo)致單雷達(dá)不能完成超出其能力范圍之外的多目標(biāo)跟蹤探測任務(wù),需要以雷達(dá)組網(wǎng)的形式滿足對多目標(biāo)和掃描空間的需求;同樣的,在雷達(dá)組網(wǎng)中,每個雷達(dá)所分配目標(biāo)的時間和能量資源消耗也不能超過其自身限制[43]。實(shí)際上,雷達(dá)的時間和能量資源約束是目標(biāo)分配問題中最重要的約束,其數(shù)學(xué)表達(dá)式為
(10)
式中:Time(i,j),Energy(i,j)分別表示用雷達(dá)j跟蹤目標(biāo)i時所消耗的時間和能量資源。
Severson[44]研究了?;嗫仃?yán)走_(dá)組網(wǎng)的目標(biāo)分配問題,利用搜索以及跟蹤模式中信噪比SNR公式推導(dǎo)出某雷達(dá)分別用于搜索、跟蹤、以及附加的時間資源占用比:Tsearch,Ttrack,Teng,從總?cè)蝿?wù)時間占用比小于1的角度構(gòu)建出雷達(dá)的時間資源約束。
1.2.4 目標(biāo)發(fā)現(xiàn)概率約束
在傳感器管理過程中,當(dāng)有新目標(biāo)出現(xiàn)時,必須要對其分配足夠的傳感器資源以滿足對其探測發(fā)現(xiàn)的需要,這就對其他任務(wù)的傳感器資源分配形成了約束。文獻(xiàn)[14-15]研究了在新生目標(biāo)發(fā)現(xiàn)概率最大的條件下使目標(biāo)的跟蹤精度最優(yōu)化。
同時,當(dāng)目標(biāo)不在雷達(dá)的探測范圍時,該雷達(dá)對目標(biāo)的發(fā)現(xiàn)概率必然很低,雷達(dá)探測范圍約束也是發(fā)現(xiàn)概率約束的一部分[45]。
求解算法是通過目標(biāo)分配模型得到最分配方案的關(guān)鍵步驟,人們一直致力于求解算法的研究和更新,以在盡可能減少計(jì)算量的基礎(chǔ)上達(dá)到收斂并得到最終分配方案。
早先的求解算法大多是遍歷性質(zhì)的,但是隨著傳感器和目標(biāo)數(shù)目的增多,以及空中環(huán)境的日趨復(fù)雜,采用遍歷算法勢必會導(dǎo)致計(jì)算量的組合爆炸;人們就越來越多的引入包括智能求解算法在內(nèi)的啟發(fā)式算法,這些算法具備更好的魯棒性和自組織性,極大的提高了尋找最優(yōu)解的效率,但是也會由于部分參數(shù)或者初始域設(shè)置不合理導(dǎo)致不能收斂或陷入局部最優(yōu)。下面主要分基于規(guī)劃論的求解方法、基于博弈論的求解方法和啟發(fā)式算法3方面對多目標(biāo)分配模型求解算法進(jìn)行介紹。
2.1.1 匈牙利算法
1955年Kuhn針對指派問題提出了一種求解方法,它引用了匈牙利數(shù)學(xué)家Konig一個關(guān)于矩陣中0元素的定理:一個系數(shù)矩陣中,獨(dú)立0元素的個數(shù)最多等于能覆蓋所有0元素的最小直線數(shù),因此該方法稱為匈牙利算法。指派問題包括平衡指派問題和非平衡指派問題2類,多雷達(dá)目標(biāo)分配平衡問題是指雷達(dá)與目標(biāo)個數(shù)相等,非平衡是指兩者個數(shù)不等[7]。針對平衡問題,可以直接用經(jīng)典的匈牙利算法進(jìn)行解決,而對于非平衡指派問題,需要通過構(gòu)建“虛擬變量” (當(dāng)雷達(dá)數(shù)目大于目標(biāo)數(shù)目時構(gòu)建虛擬目標(biāo),當(dāng)雷達(dá)數(shù)目小于目標(biāo)數(shù)目時構(gòu)建虛擬雷達(dá)組)變成平衡問題求解。
2.1.2 拍賣算法
拍賣算法是一種多智能體協(xié)調(diào)機(jī)制,具有運(yùn)行速度快、可操作性好的特點(diǎn)。拍賣算法一般包含兩種智能體:拍賣智能體A代表目標(biāo)進(jìn)行拍賣,競拍智能體B則根據(jù)自身資源和目標(biāo)相關(guān)特點(diǎn)投標(biāo)。通過拍賣,A選擇競價最高的智能體B作為優(yōu)勝者,從而資源與目標(biāo)之間的映射,即完成多個智能體之間的分配[46]。在雷達(dá)網(wǎng)多目標(biāo)分配的過程中,智能體A代表多目標(biāo)任務(wù),智能體B代表目標(biāo)分配方案,競拍過程中通過一定的規(guī)則對不同分配方案進(jìn)行衡量,最終選取優(yōu)勝者即最優(yōu)分配方案完成對多目標(biāo)的任務(wù)。
2.1.3 多重優(yōu)化解法
多重優(yōu)化解法(或者二次分配方法)的思想是首先將多目標(biāo)函數(shù)按層次分解成多個單目標(biāo)函數(shù),再按照其重要程度進(jìn)行多次單目標(biāo)優(yōu)化。
文獻(xiàn)[13]中首先對跟蹤數(shù)目最大化進(jìn)行求解使雷達(dá)網(wǎng)跟蹤目標(biāo)數(shù)目最大化;對于還有剩余資源的雷達(dá),再根據(jù)目標(biāo)的優(yōu)先級等進(jìn)行再一次的資源分配,使各目標(biāo)的跟蹤精度滿足期望要求。文獻(xiàn)[14]中構(gòu)建了包含跟蹤數(shù)目最大化和雷達(dá)威力最大化的多目標(biāo)規(guī)劃模型,先針對跟蹤數(shù)目最大化進(jìn)行求解再針對雷達(dá)威力最大化進(jìn)行求解,同時在完成第1個優(yōu)化模型求解之后將其解集加入到第2個優(yōu)化模型的約束條件中。
2.1.4 單目標(biāo)化解法
由于多目標(biāo)函數(shù)之間可能存在一定的正相關(guān)或者負(fù)相關(guān),導(dǎo)致多目標(biāo)優(yōu)化問題的求解非常復(fù)雜。單目標(biāo)化解思路是指將多目標(biāo)問題中的多個目標(biāo)函數(shù)通過一定的方轉(zhuǎn)化成單目標(biāo)函數(shù)[5]:
f=f(f1,f2,…,fs).
(11)
新構(gòu)建的單目標(biāo)函數(shù)可以根據(jù)約束條件的不同單調(diào)遞增或遞減,對單目標(biāo)模型進(jìn)行求解得到的和原多目標(biāo)問題的最終分配方案是等價的。
2.1.5 隱枚舉法
當(dāng)雷達(dá)和目標(biāo)數(shù)目都不多時可以用窮舉法找到最優(yōu)的目標(biāo)分配方案,但是當(dāng)數(shù)目較多時窮舉法顯然是一種耗時很長、效率低下的方法,這時可以采用隱枚舉法來找到最優(yōu)解。其思路可以描述為:首先找出一個可行解,計(jì)算其對應(yīng)的目標(biāo)函數(shù)值作為閾值,并由此一個過濾條件,對于其他不滿足過濾條件的分配方案,就不用再去檢驗(yàn)其是否為是可行解;對于滿足過濾條件的方案,則求得其目標(biāo)函數(shù)值,如果比閾值好,則進(jìn)行閾值更新,同時將當(dāng)前的方案作為待選解。這種方法雖然列出所有的可能分配方案,但并沒有針對所有方案都進(jìn)行約束條件的計(jì)算[9]。
通常一個博弈模型由以下3個基本要素組成:參與者、策略和收益。參與者是指參與博弈的決策主體,其目的是通過選擇最終執(zhí)行的策略使自己的收益最大化;策略是指每個參與者為了使自身利益最大化,而給出的相關(guān)解決方案;收益是指按不同策略計(jì)算得出的各個參與者能獲得的收益。在雷達(dá)網(wǎng)目標(biāo)分配過程中,雷達(dá)是博弈參與者,不同的分配方案是博弈策略,目標(biāo)函數(shù)所追求的某種指標(biāo)最優(yōu)化就是效益,通過博弈、選擇使效益最大化的分配方案[47-48]。在目標(biāo)數(shù)目比較少的情況下,文獻(xiàn)[49]將目標(biāo)作為博弈主體,以各目標(biāo)的收益作為博弈收益構(gòu)建模型,能大大減少計(jì)算量。
啟發(fā)式算法的特點(diǎn)就是在解決問題時,結(jié)合過去的經(jīng)驗(yàn)選擇已經(jīng)具有一定有效性的方法,以隨機(jī)或近似隨機(jī)方法搜索非線性復(fù)雜空間中全局最優(yōu)解,而不是系統(tǒng)地以確定步驟尋求答案,這樣能大大減少計(jì)算量[50]。
2.3.1 遺傳算法
利用遺傳算法求解多目標(biāo)分配模型的基本步驟就是從所有可能的分配方案中選擇初代種群,通過交叉、變異等操作進(jìn)行迭代遺傳,利用適應(yīng)度函數(shù)衡量解的優(yōu)劣,經(jīng)過多次迭代直到迭代次數(shù)到達(dá)規(guī)定值或者出現(xiàn)最優(yōu)解為止[5]。文獻(xiàn)[51]利用改進(jìn)的遺傳算法解決多目標(biāo)分配問題,首先以目標(biāo)的價值作為初始種群的啟發(fā)信息,由此產(chǎn)生一部分適應(yīng)度較高的初始種群;在構(gòu)造適應(yīng)度函數(shù)的時候,利用罰函數(shù)對約束條件進(jìn)行處理,對于不滿足約束條件的種群減少其適應(yīng)度值,使其遺傳到下一代的概率隨之變小,在一定程度上減少了目標(biāo)分配的不合理性,并提高算法效率。
2.3.2 智能算法
人工螢火蟲群優(yōu)化(GSO)算法是基于每個螢火蟲個體總是趨近于周邊亮度更強(qiáng)的螢火蟲的思想,在求解函數(shù)極值問題、優(yōu)化問題上取得了很好的效果,具有尋解速度快、通用性強(qiáng)等優(yōu)點(diǎn),將其應(yīng)用到多目標(biāo)分配問題中發(fā)現(xiàn)該算法的收斂速度比遺傳算法更快[9]。
文獻(xiàn)[41]利用蟻群算法對目標(biāo)分配模型進(jìn)行了研究,蟻群優(yōu)化算法是最近幾年發(fā)展起來的一種模擬螞蟻群體行為的智能仿生方法,具有較好的穩(wěn)定性和分布式計(jì)算能力,很適用于解決離散組合問題。
粒子群算法是一種新的進(jìn)化算法,該算法也是通過適應(yīng)度來評價解的品質(zhì),但是比遺傳算法規(guī)則更為簡單,沒有交叉、變異等操作,在近年的雷達(dá)網(wǎng)目標(biāo)分配研究中應(yīng)用越來越多。在運(yùn)用粒子群算法的時候,最關(guān)鍵的問題是模型中相關(guān)參數(shù)的設(shè)置,這決定了算法收斂的速度,以及是趨向于全局最優(yōu)還是局部最優(yōu),同時粒子群算法有很強(qiáng)的兼容性,可以和遺傳算法、魚群算法等結(jié)合起來適用[52]。
隨著數(shù)據(jù)融合技術(shù)在軍事領(lǐng)域的廣泛應(yīng)用和高速發(fā)展,雷達(dá)組網(wǎng)管理問題會受到越來越多的重視,合理有效的多目標(biāo)分配是雷達(dá)網(wǎng)能有效完成任務(wù)的關(guān)鍵。為了更好的進(jìn)行雷達(dá)網(wǎng)目標(biāo)分配,有效完成對多目標(biāo)、多空間的探測跟蹤任務(wù),作者認(rèn)為未來還可以從以下幾方面展開研究。
現(xiàn)有的雷達(dá)網(wǎng)目標(biāo)分配沒有延續(xù)性,下一時刻的目標(biāo)分配雖然會利用到上一時刻相應(yīng)雷達(dá)對目標(biāo)執(zhí)行任務(wù)產(chǎn)生的量測信息,但是并沒有參考上一時刻的分配方案,只是簡單地根據(jù)該量測信息結(jié)合目標(biāo)需求以及客觀條件進(jìn)行重新分配,這種方式會造成資源極大的浪費(fèi);所以要考慮到增量調(diào)整的問題,即在每一次目標(biāo)分配的時候要參考上一次的分配方案,考慮到其后續(xù)影響,盡量在前一方案的基礎(chǔ)上進(jìn)行改動,而不是簡單的重新分配。
現(xiàn)在雷達(dá)網(wǎng)目標(biāo)分配大多是在融合中心進(jìn)行的,除此之外,還可以考慮先將每個雷達(dá)作為節(jié)點(diǎn)進(jìn)行分布式的目標(biāo)分配,形成其自己的方案,這樣可以更好的參考目標(biāo)對于不同雷達(dá)的優(yōu)先級的差異;再將各雷達(dá)的方案集中起來在融合中心進(jìn)行基于一致性的目標(biāo)分配,形成唯一的最優(yōu)方案。這種兩層的分配方法可以更好地利用不同目標(biāo)—雷達(dá)配對之間的效能、權(quán)重等因素。
在進(jìn)行雷達(dá)網(wǎng)管理的時候,不僅要考慮分配結(jié)果要達(dá)到的效能,還要盡量降低由于雷達(dá)主動探測而給自身帶來的暴露威脅,提升雷達(dá)網(wǎng)自身的安全系數(shù),將這些因素結(jié)合起來進(jìn)行研究,才能在實(shí)際應(yīng)用中獲得更大成效。
雷達(dá)網(wǎng)目標(biāo)分配是雷達(dá)網(wǎng)資源管理的重要內(nèi)容,合理有效的目標(biāo)分配是雷達(dá)網(wǎng)能在有限資源條件下完成對多目標(biāo)或多掃描空間有效探測和跟蹤的關(guān)鍵。本文從模型、求解算法2方面對雷達(dá)網(wǎng)目標(biāo)分配的研究現(xiàn)狀進(jìn)行了總結(jié)分析(其中模型又分為目標(biāo)函數(shù)、約束條件2部分);并從提升目標(biāo)分配有效性、節(jié)省資源、減少計(jì)算量的角度出發(fā),對未來的研究方向進(jìn)行了展望。進(jìn)一步深入研究雷達(dá)網(wǎng)目標(biāo)分配及其關(guān)鍵技術(shù),對未來雷達(dá)網(wǎng)體系建設(shè)以及雷達(dá)網(wǎng)資源管理的研究具有重要的支持作用和參考意義。