赫 彬,蘇洪濤
(西安電子科技大學(xué) 雷達(dá)信號(hào)處理國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710071)
隨著現(xiàn)代科技的發(fā)展,多基地多輸入多輸出(Multiple-Input Multiple-Output,MIMO) 雷達(dá)作為一種新體制雷達(dá)系統(tǒng)已經(jīng)成為了研究熱點(diǎn)[1-2]。由于多基地多輸入多輸出雷達(dá)在目標(biāo)檢測、跟蹤與定位以及抗干擾等方面表現(xiàn)出了比單基地多輸入多輸出雷達(dá)更優(yōu)越的性能,受到了各軍事強(qiáng)國的高度關(guān)注。為了更好地提升多輸入多輸出雷達(dá)的抗干擾能力和覆蓋范圍,分布式多基地多輸入多輸出雷達(dá)系統(tǒng)被作為主要的研究方向[2]。而對(duì)于工作中的多基地雷達(dá)系統(tǒng),雷達(dá)之間會(huì)產(chǎn)生合作與沖突的博弈關(guān)系。為了降低雷達(dá)之間的沖突影響,需要對(duì)雷達(dá)的資源和站址進(jìn)行合理的布置來提升多基地雷達(dá)之間的協(xié)作能力,進(jìn)而提升雷達(dá)對(duì)目標(biāo)和干擾機(jī)的抵御能力。博弈論作為一種合作與非合作的分析理論,可被應(yīng)用于處理多基地多輸入多輸出雷達(dá)的資源分配和站址布置等問題當(dāng)中[3]。
近期,許多學(xué)者將博弈理論引入到雷達(dá)對(duì)抗研究的不同方向[4-14],其中包括功率分配[4-8]、目標(biāo)檢測[9-10]、目標(biāo)跟蹤與定位[11]、編碼和波形設(shè)計(jì)[12-13]以及雷達(dá)通信一體化[14]等。對(duì)于功率分配問題,文獻(xiàn)[6]研究了智能干擾機(jī)與多輸入多輸出雷達(dá)之間功率分配博弈,并構(gòu)造了兩種非合作博弈模型:一種是兩人零和博弈;另一種是斯塔伯格博弈,通過數(shù)值實(shí)驗(yàn)驗(yàn)證了這兩種博弈都收斂到博弈的均衡狀態(tài)。文獻(xiàn)[8]利用合作博弈研究了多基地多輸入多輸出雷達(dá)在目標(biāo)跟蹤和定位中的功率分配問題。在目標(biāo)檢測方面,文獻(xiàn)[9]構(gòu)造了一種聯(lián)合檢測概率與虛警概率的效用函數(shù),針對(duì)不同場景提出了多種博弈方案,通過超模理論驗(yàn)證了這些博弈屬于超模博弈,最后博弈都收斂到純策略的納什均衡。與文獻(xiàn)[9]不同,文獻(xiàn)[10]的作者依據(jù)潛博弈論設(shè)計(jì)了一種極化多輸入多輸出雷達(dá)目標(biāo)檢測方法,該方法較單一的水平極化或垂直極化有更好的檢測性能。在目標(biāo)跟蹤方面,文獻(xiàn)[11]提出了一種新穎的聯(lián)合并行粒子濾波和數(shù)據(jù)關(guān)聯(lián)的博弈算法,該算法在跟蹤多個(gè)機(jī)動(dòng)目標(biāo)的情況下表現(xiàn)出了比其他粒子濾波算法更優(yōu)越的性能。為了更好地抑制干擾的影響,博弈論被作為一種有效的策略分析理論應(yīng)用于雷達(dá)波形的設(shè)計(jì)當(dāng)中,這樣可以有效地提升雷達(dá)的戰(zhàn)場性能和存活能力[12-13]。雷達(dá)通信一體化是近期的一個(gè)研究熱點(diǎn),雷達(dá)和通信作為兩種不同系統(tǒng)存在著合作與沖突的關(guān)系,為了減少二者在實(shí)際工作中的相互影響,通過博弈論分析策略使二者保持在一種穩(wěn)定的狀態(tài),提升二者之間協(xié)同工作能力[14]。
筆者在研究了凸優(yōu)化和博弈論的基礎(chǔ)上,分析了一種多基地雷達(dá)之間的博弈優(yōu)化模型。首先,構(gòu)造了一種多基地多輸入多輸出雷達(dá)的博弈框架,在此基礎(chǔ)上建立了信干噪比(Signal to Interference Noise Ratio,SINR) 約束的極小化發(fā)射功率優(yōu)化模型。然后,利用拉格朗日對(duì)偶理論求得雷達(dá)發(fā)射功率的迭代公式,利用博弈論分析驗(yàn)證了雷達(dá)發(fā)射功率滿足標(biāo)準(zhǔn)函數(shù),并收斂到博弈的納什均衡。進(jìn)一步,通過線性約束最小方差(Linearly Constrained Minimum Variance,LCMV) 準(zhǔn)則得到接收波束成形器權(quán)矢量,并提出了一種聯(lián)合波束成形和功率分配的博弈算法。最后,數(shù)值實(shí)驗(yàn)驗(yàn)證了算法的有效性和抑制互雷達(dá)干擾的能力。
多基地雷達(dá)是由K個(gè)分離的多輸入多輸出雷達(dá)構(gòu)成,并且每個(gè)多輸入多輸出雷達(dá)由相同的M個(gè)收發(fā)天線構(gòu)成。每個(gè)雷達(dá)都希望自身花費(fèi)最少的功率來滿足一個(gè)期望的信干噪比約束。假定所有的雷達(dá)屬于同一方,并且所有的目標(biāo)屬于敵對(duì)的另一方。另外,目標(biāo)位于多基地多輸入多輸出雷達(dá)的遠(yuǎn)場環(huán)境。對(duì)于雜波的干擾影響,可以通過動(dòng)目標(biāo)顯示和動(dòng)目標(biāo)檢測來抑制。基于雷達(dá)之間的先驗(yàn)信息,雷達(dá)可以通過自適應(yīng)波束成形來抑制它們之間的互干擾影響,這樣可以確保雷達(dá)更好地檢測目標(biāo)。接下來,在多基地多輸入多輸出雷達(dá)中,第k個(gè)雷達(dá)主波束指向第l個(gè)目標(biāo)的預(yù)編碼波形序列skl(t)(k=1,…,K;l=1,…,L),t為雷達(dá)脈沖時(shí)間指數(shù)。第k個(gè)雷達(dá)發(fā)射的預(yù)編碼波形矢量sk(t)=[sk1(t),…,skL(t)]T。對(duì)于多輸入多輸出雷達(dá),滿足波形的正交性條件如下:
(1)
其中,Tp為雷達(dá)發(fā)射脈沖寬度;上標(biāo)*表示矢量的共軛運(yùn)算;τkl為正交波形可接受的延時(shí)。
接下來,第k個(gè)雷達(dá)發(fā)射到第l個(gè)目標(biāo)的信號(hào)形式如下:
xkl(t)=wt(kl)skl(t) ,
(2)
其中,wt(kl)為第k個(gè)雷達(dá)主波束指向第l個(gè)目標(biāo)復(fù)發(fā)射波束權(quán)矢量。第k個(gè)雷達(dá)的全部發(fā)射信號(hào)為
(3)
進(jìn)而,第k個(gè)雷達(dá)經(jīng)第l個(gè)目標(biāo)方向角θkl的反射信號(hào)可以寫為
(4)
其中,βl為第l個(gè)目標(biāo)的雷達(dá)橫截面積的散射幅度。第k個(gè)雷達(dá)的全部接收信號(hào)為
(5)
(6)
(7)
(8)
(9)
其中,wr(kl)為第k個(gè)雷達(dá)對(duì)第l個(gè)目標(biāo)的M×1復(fù)接收波束權(quán)矢量;βkil為從第i個(gè)雷達(dá)到第k個(gè)雷達(dá)的經(jīng)過第l個(gè)目標(biāo)的雷達(dá)橫截面反射系數(shù);a(θk)和b(θk)分別為第k個(gè)雷達(dá)發(fā)射和接收導(dǎo)向矢量,即
a(θk)=[1 ejd2π/λsin(θk)… ej(M-1)d2π/λsin(θk)]T,
b(θk)=[1 ejd2π/λsin(θk)… ej(M-1)d2π/λsin(θk)]T,
其中,d為陣元間距,所有雷達(dá)都是相同的。
多輸入多輸出雷達(dá)的接收端利用匹配濾波來接收期望的目標(biāo)信號(hào),但這仍會(huì)存在一些干擾的影響。因此,通過第k個(gè)雷達(dá)對(duì)第l個(gè)目標(biāo)的回波信號(hào)進(jìn)行匹配濾波可以得到:
(10)
其中,ρklij(τlj)是第i個(gè)雷達(dá)發(fā)射到第l個(gè)目標(biāo)的波形與第k個(gè)雷達(dá)發(fā)射到第j個(gè)目標(biāo)的波形的相關(guān)因子。進(jìn)一步,第k個(gè)雷達(dá)通過自適應(yīng)波束成形對(duì)第l個(gè)目標(biāo)的回波進(jìn)行處理,并得到期望輸出為
(11)
由于多目標(biāo)和交叉通道的干擾影響,會(huì)降低雷達(dá)的目標(biāo)檢測能力。因此,通過自適應(yīng)波束成形壓制的干擾表示為
(12)
進(jìn)一步,第k個(gè)雷達(dá)對(duì)應(yīng)于第l個(gè)目標(biāo)的輸出信干噪比可以表示為
(13)
其中,‖·‖表示歐氏范數(shù)。
一種多基地多輸入多輸出雷達(dá)之間的聯(lián)合功率分配和波束成形的博弈論框架被建立。由于多基地雷達(dá)在對(duì)目標(biāo)進(jìn)行檢測的時(shí)候,避免不了會(huì)產(chǎn)生互雷達(dá)干擾,這樣可以利用策略的非合作博弈進(jìn)行處理。為了提高雷達(dá)的工作效率,需要通過自適應(yīng)波束成形來抑制互雷達(dá)干擾。對(duì)于該策略非合作博弈,每個(gè)多輸入多輸出雷達(dá)被作為參與者,其對(duì)應(yīng)的發(fā)射功率和權(quán)矢量作為相應(yīng)的博弈策略。而雷達(dá)的總發(fā)射功率被作為效用函數(shù)。因此,博弈框架被表示為
G={P,S,U} ,
(14)
(1) 參與者集:P={Rk|k=1,2,…K};
其中,pR(kl)為第k個(gè)雷達(dá)對(duì)應(yīng)于第l個(gè)目標(biāo)的發(fā)射功率;1L表示長度為L的全1列矢量。
在分析策略博弈時(shí),給定了其它雷達(dá)的波束策略,每一個(gè)雷達(dá)都希望自身花費(fèi)最小的代價(jià),并能實(shí)現(xiàn)對(duì)目標(biāo)的準(zhǔn)確檢測。由于每個(gè)雷達(dá)是自私的,在抑制其它雷達(dá)的直接干擾的同時(shí),又能夠極小化自身的發(fā)射功率。根據(jù)預(yù)設(shè)的信干噪比準(zhǔn)則,建立第k個(gè)雷達(dá)的波束成形和約束信干噪比的優(yōu)化模型,即
(15)
(16)
針對(duì)上述功率分配博弈模型,為了驗(yàn)證博弈G的納什均衡的存在性和唯一性,需要證明每個(gè)參與者的最佳反應(yīng)策略滿足標(biāo)準(zhǔn)函數(shù)的定義。為了獲得最優(yōu)的發(fā)射功率分配策略,問題(16)的不等式約束可以用等式約束來替換,且滿足最小的信干噪比準(zhǔn)則;同樣地,滿足更大的信干噪比需求。因此,等式形式如下:
(17)
進(jìn)一步,式(17)可以表示成下面的矩陣形式:
(18)
(19)
根據(jù)Arrow-Debreu定理,上式的解的存在性被滿足[7]。進(jìn)一步,納什均衡的唯一性被驗(yàn)證通過最佳反應(yīng)函數(shù)為標(biāo)準(zhǔn)函數(shù)。因此,引入標(biāo)準(zhǔn)函數(shù)的定義:
(a)恒正性:對(duì)于全部的x>0,則有I(x)>0;
(b)單調(diào)性:若x′>x,則I(x′)>I(x);
(c)擴(kuò)展性:對(duì)任意a>1,則aI(x)>I(ax)。
另外,從第i個(gè)雷達(dá)到第k個(gè)雷達(dá)的其他目標(biāo)信號(hào)干擾矩陣可以表示為Hki∈L×L和其對(duì)應(yīng)元素為因此,將干擾矢量分解,得到雷達(dá)k的最佳反應(yīng)策略函數(shù)為
(20)
定理最佳反應(yīng)函數(shù)式(20)滿足標(biāo)準(zhǔn)函數(shù)的以下3條性質(zhì)。
總之,本節(jié)構(gòu)造了一個(gè)多基地多輸入多輸出雷達(dá)與多目標(biāo)之間的博弈論框架。在一個(gè)確定的信干噪比約束下,建立了聯(lián)合功率分配與波束成形的優(yōu)化模型,并驗(yàn)證了博弈的納什均衡的存在性和唯一性。
雷達(dá)為了在博弈過程中獲得更大的優(yōu)勢,每個(gè)參與者都期望獲得其他參與者的通道信息。由于多基地雷達(dá)屬于同一組織的參與者,所有互雷達(dá)通道信息參與者都相互了解,并且每個(gè)雷達(dá)都了解其他雷達(dá)的確切位置。問題(15)是一個(gè)二次約束二次規(guī)劃問題,可以通過拉格朗日對(duì)偶理論來求解,則拉格朗日函數(shù)為
(21)
其中,λkl,υkl為拉格朗日乘子。進(jìn)一步,拉格朗日函數(shù)可以重新寫為
(22)
因此,可以得到拉格朗日對(duì)偶函數(shù):
(23)
進(jìn)而,若Λk不是半正定矩陣,則存在wt(kl)的集合使得對(duì)偶函數(shù)gk(λk,υk)=-∞。問題(16)的對(duì)偶問題為
(24)
(25)
然后,再由上式可以得到最優(yōu)λkl一個(gè)必要條件如下:
(26)
根據(jù)強(qiáng)對(duì)偶定理,主優(yōu)化問題的最優(yōu)值等于對(duì)偶問題的最優(yōu)值。因此,可以得到如下的結(jié)果:
(27)
另外,η-kl為一個(gè)有界的能量值。因此,式(26)和式(27)可以通過變量替換得到雷達(dá)的功率分配公式;該式滿足標(biāo)準(zhǔn)函數(shù)的三條性質(zhì),迭代地收斂到一個(gè)固定的點(diǎn)。
對(duì)于回波信號(hào)模型,不考慮雜波和其他有源干擾。在接收端對(duì)互雷達(dá)通道干擾利用自適應(yīng)波束成形算法進(jìn)行抑制,通過線性約束最小方差準(zhǔn)則來求解雷達(dá)的最優(yōu)接收權(quán)矢量:
(28)
(29)
進(jìn)而,利用拉格朗日乘子法可以得到接收波束成形權(quán)矢量:
(30)
根據(jù)文獻(xiàn)[7],發(fā)射波束成形權(quán)矢量和接收波束權(quán)矢量存在一個(gè)尺度系數(shù)的關(guān)系,即
(31)
其中,δkl是一個(gè)標(biāo)量因子,是通過式(15)的信干噪比不等式約束的最優(yōu)等式約束所得到的。將式(31)代入式(15)中的信干噪比等式約束形式,可以得到下式:
(32)
最后,提出一種迭代的聯(lián)合功率分配和波束成形博弈算法,算法如下。
算法1聯(lián)合功率分配和波束成形博弈算法。
① 輸入:參數(shù)和初始功率。
② 執(zhí)行。
③ 根據(jù)式(27),更新pR(kl)。
④ 根據(jù)式(30),更新wr(kl)。
⑤ 根據(jù)式(31),更新wt(kl)。
⑦ 輸出:pR(kl),wr(kl),wt(kl)。
圖1 本文算法對(duì)不同目標(biāo)的功率分配收斂圖
圖2 均衡狀態(tài)下總功率消耗對(duì)比
圖3 雷達(dá)1的主波束指向目標(biāo)1
圖4 雷達(dá)1的主波束指向目標(biāo)2
圖5 雷達(dá)2的主波束指向目標(biāo)1
圖6 雷達(dá)2的主波束指向目標(biāo)2
筆者研究了一種多基地雷達(dá)與多目標(biāo)之間的博弈模型。首先,根據(jù)每個(gè)雷達(dá)需求和約束構(gòu)造了多基地多輸入多輸出雷達(dá)的信號(hào)系統(tǒng)模型。然后,基于每個(gè)雷達(dá)的自私性,建立了一種策略非合作博弈論框架;依據(jù)該框架構(gòu)造了一種確定信干噪比約束的極小化發(fā)射功率優(yōu)化模型,并利用凸優(yōu)化和博弈論得到了納什均衡的存在性和唯一性。接下來,提出了一種聯(lián)合功率分配和波束成形博弈算法。該算法通過對(duì)不同目標(biāo)的功率分配來調(diào)整波束成形器權(quán)矢量,進(jìn)而對(duì)不同方向的干擾進(jìn)行有策略的抑制。對(duì)于外部的強(qiáng)干擾方向可以通過增大雷達(dá)發(fā)射功率進(jìn)行有效的抑制,而對(duì)于同一方的雷達(dá)方向,可以降低發(fā)射功率以減少相互之間的干擾,這樣針對(duì)不同方向上的干擾類型可以通過調(diào)整雷達(dá)發(fā)射功率和波束成形權(quán)矢量策略進(jìn)行有效的抑制。最后,通過數(shù)值仿真驗(yàn)證了算法的收斂性和可行性,并較相關(guān)的博弈算法有更優(yōu)越的性能。在將來,筆者將應(yīng)用合作博弈對(duì)多基地雷達(dá)系統(tǒng)的協(xié)作關(guān)系進(jìn)行分析和研究,并應(yīng)用更先進(jìn)的波束成形算法作進(jìn)一步的研究。