王鑫,閆杰,孟廷偉,*
1.西北工業(yè)大學(xué) 航天學(xué)院,西安 710072 2.西北工業(yè)大學(xué) 無人系統(tǒng)技術(shù)研究院,西安 710072
由超燃沖壓發(fā)動(dòng)機(jī)提供動(dòng)力的吸氣式高超聲速飛行器(Airbreathing Hyper-sonic Vehicle, AHV)具有航程遠(yuǎn)、飛行高度高、速度快、突防能力強(qiáng)等突出優(yōu)點(diǎn),極大地壓縮了防御方的準(zhǔn)備和反應(yīng)時(shí)間,超出了現(xiàn)有防空武器的攔截能力。美俄等針對AHV相關(guān)技術(shù)的研究及驗(yàn)證已長達(dá)數(shù)十年之久。相關(guān)資料顯示,新型高超聲速飛行器的研制已邁向武器化階段。來自于臨近空間的現(xiàn)實(shí)威脅日益突出,研究針對此類飛行器的攔截技術(shù)需求迫在眉睫。受到發(fā)動(dòng)機(jī)性能、熱防護(hù)、氣動(dòng)布局、制導(dǎo)控制律等約束,AHV機(jī)動(dòng)能力及機(jī)動(dòng)特征存在一定的限制及規(guī)律性。復(fù)雜環(huán)境下攔截彈和高速目標(biāo)的攻防對抗可以看作是動(dòng)態(tài)博弈的過程,而針對攻防博弈的相關(guān)研究主要集中在飛行器彈道規(guī)劃、單邊最優(yōu)導(dǎo)引律和微分對策導(dǎo)引律3個(gè)方面。張大元等研究了攔截彈軌跡規(guī)劃的問題,綜合考慮終端速度、終點(diǎn)脫靶量和氣動(dòng)加熱3個(gè)因素,并通過粒子群算法求解彈道。在單邊最優(yōu)制導(dǎo)律方面,文獻(xiàn)[2]基于線性二次型理論提出了一種最優(yōu)控制的協(xié)同制導(dǎo)律,該制導(dǎo)律保證多彈在攔截時(shí)相對機(jī)動(dòng)目標(biāo)具有一個(gè)有利的幾何態(tài)勢。來自不同方向的攔截彈集群完成對目標(biāo)的飽和攻擊。為了提高攔截彈間的通信性能,文獻(xiàn)[3]基于線性二次最優(yōu)控制方法提出了一種協(xié)同制導(dǎo)律,使得在攔截機(jī)動(dòng)目標(biāo)時(shí)相鄰導(dǎo)彈間的相對視角的變化率趨于零。該制導(dǎo)方法的典型應(yīng)用場景是保證齊射導(dǎo)彈之間可以使用定向天線進(jìn)行通信,從而提高通信性能。
在微分對策制導(dǎo)律方面,Nobahari和Nasrollahi將受不確定性影響的彈目二維交戰(zhàn)場景表述為非線性微分博弈模型,并將其轉(zhuǎn)換為非線性模型的預(yù)測微分對策控制問題,提出了一種基于粒子群的動(dòng)態(tài)優(yōu)化算法。通過蒙特卡羅分析以及與傳統(tǒng)制導(dǎo)算法的對比仿真驗(yàn)證該算法的實(shí)現(xiàn)能力和性能。Shaferman和Shima基于協(xié)同微分對策研究了多個(gè)攔截器從不同方向攔截機(jī)動(dòng)目標(biāo)的制導(dǎo)問題,基于二人零和微分博弈框架,防御方和目標(biāo)組成博弈雙方,基于設(shè)計(jì)的制導(dǎo)律使得多個(gè)攔截器間構(gòu)建的幾何態(tài)勢滿足攔截需求,且相對攔截彈角度的要求不會(huì)產(chǎn)生額外的過載需求。
除了上述針對高速目標(biāo)動(dòng)態(tài)博弈的攔截形式外,在其他方面國內(nèi)外學(xué)者作了大量研究。郭正玉等提出了一種分布式有限時(shí)間協(xié)同制導(dǎo)律。為了對攻擊時(shí)間和攻擊角度進(jìn)行約束,對各攔截彈的視線方向、視線縱向和視線法向加速度分別設(shè)計(jì),達(dá)到同時(shí)多角度協(xié)同攻擊的效果。Yuksek等研究了針對高機(jī)動(dòng)目標(biāo)的多攔截器合作和非合作下的攔截問題,攔截器可以通過共享信息實(shí)現(xiàn)對目標(biāo)的精確跟蹤。Chen等建立協(xié)同攔截三維非線性模型,提出多枚導(dǎo)彈的協(xié)同覆蓋策略及協(xié)同制導(dǎo)律,并設(shè)計(jì)制導(dǎo)參數(shù)及攔截器數(shù)量動(dòng)態(tài)調(diào)整策略。在智能協(xié)同攔截方面,文獻(xiàn)[9]基于強(qiáng)化學(xué)習(xí)提出了一種新的制導(dǎo)律,該制導(dǎo)形式不需要進(jìn)行距離估計(jì),僅需要觀測導(dǎo)引頭視線角及其變化率,因此適合用于被動(dòng)導(dǎo)引頭?;趶?qiáng)化元學(xué)習(xí)的優(yōu)化策略能夠適應(yīng)目標(biāo)加速度,相對最優(yōu)制導(dǎo)形式具有更好的性能。
通過分析可知,上述文獻(xiàn)中提出的多彈協(xié)同策略有飽和攻擊和全覆蓋攻擊兩種,然而在實(shí)際攔截過程中多彈很難一次對目標(biāo)實(shí)施準(zhǔn)確攔截。此外,上述文獻(xiàn)均未考慮目標(biāo)在中制導(dǎo)過程可能做出的突防策略。因此,在結(jié)合高超聲速目標(biāo)運(yùn)動(dòng)特征的基礎(chǔ)上整體考慮目標(biāo)的攔截過程。文獻(xiàn)[10]在多彈協(xié)同攔截的展望中提出,針對攔截目標(biāo)的高速和高機(jī)動(dòng)性能,多彈的時(shí)空匹配性至關(guān)重要。在上述背景下,本文結(jié)合吸氣式高超聲速目標(biāo)的運(yùn)動(dòng)特征,積極探索一種新型的多彈攔截機(jī)制,增大攔截系統(tǒng)復(fù)雜環(huán)境下對于高速大機(jī)動(dòng)目標(biāo)的攔截概率。
考慮地球?yàn)榍蛐?不考慮地球自轉(zhuǎn),AHV目標(biāo)動(dòng)力學(xué)方程為
(1)
式中:為地心距;和為經(jīng)緯度;為地球相對速度;為航跡角;為航向角;為滾轉(zhuǎn)角;為攻角;為發(fā)動(dòng)機(jī)比沖(N·s/kg);、、分別為發(fā)動(dòng)機(jī)推力、氣動(dòng)升力、氣動(dòng)阻力;為飛行器質(zhì)量;為重力加速度。
具有乘波體構(gòu)型的吸氣式高超聲速飛行器表面氣動(dòng)力可以通過斜激波方程及普朗特-邁耶方程進(jìn)行求解。文獻(xiàn)[12]對AHV的氣動(dòng)特性機(jī)理模型進(jìn)行分析,氣動(dòng)力表示為
(2)
式中:為動(dòng)壓;為飛行器參考面積;為馬赫數(shù);為燃油當(dāng)量比;、、分別為升力系數(shù)、阻力系數(shù)、推力系數(shù)。
此外,AHV在飛行過程中需要滿足過程約束,包括熱流約束、過載約束以及動(dòng)壓約束
(3)
(4)
將攔截彈視為可控質(zhì)點(diǎn),動(dòng)力學(xué)方程為
(5)
式中:、、為慣性系坐標(biāo);為攔截彈速度;、m為彈道傾角和彈道偏角;、為攻角和側(cè)滑角;、、為氣動(dòng)阻力、升力和側(cè)向力;為發(fā)動(dòng)機(jī)推力。
攔截彈自動(dòng)駕駛儀近似為二階動(dòng)態(tài)環(huán)節(jié)為
(6)
式中:為阻尼比;為自然角頻率;為攔截彈加速度;為制導(dǎo)指令。此外,攔截彈存在過載約束
=(sin+)
(7)
=(cossin+)
(8)
(9)
圖1 分階段攔截時(shí)序圖Fig.1 Sequence diagram of interception in stages
攔截系統(tǒng)包含兩枚攔截彈,記為攔截彈I和攔截彈II。攔截彈I在整個(gè)攔截過程中主要負(fù)責(zé)通過第一階段對抗減弱目標(biāo)機(jī)動(dòng)能力。攔截彈II則是在形成態(tài)勢壓制的基礎(chǔ)上與目標(biāo)直接進(jìn)行動(dòng)態(tài)博弈,使得攔截彈II可以適應(yīng)復(fù)雜的博弈環(huán)境,從而提高對目標(biāo)的攔截精度。需要注意的是,分階段協(xié)同是時(shí)間上的協(xié)同,分別對各攔截彈的時(shí)間進(jìn)程進(jìn)行設(shè)計(jì)。
1)~:攔截彈I中制導(dǎo)過程??栈脚_(tái)在時(shí)刻發(fā)射攔截彈I,目標(biāo)運(yùn)動(dòng)信息由地面雷達(dá)提供。在此階段,攔截系統(tǒng)依據(jù)目標(biāo)運(yùn)動(dòng)信息、目標(biāo)物理屬性及任務(wù)屬性對在交匯平面上的可達(dá)范圍及“虛擬交班點(diǎn)”進(jìn)行計(jì)算,并完成最優(yōu)中制導(dǎo)過程,在時(shí)刻攔截彈I完成交接班。
2)~:攔截彈I末制導(dǎo)過程。攔截彈I通過末制導(dǎo)使目標(biāo)在突防過程中失去機(jī)動(dòng)能力優(yōu)勢,對目標(biāo)形成態(tài)勢壓制。
3)~:攔截彈II的中制導(dǎo)過程??栈脚_(tái)時(shí)刻發(fā)射攔截彈II,且需要對發(fā)射時(shí)間間隔在滿足(-)<(-)的約束下進(jìn)行優(yōu)化。攔截彈II依據(jù)彈目相對運(yùn)動(dòng)關(guān)系進(jìn)行最優(yōu)中制導(dǎo),在時(shí)刻完成交接班。攔截彈II在~時(shí)間段內(nèi)由地面雷達(dá)提供目標(biāo)信息,在~由攔截彈I提供目標(biāo)信息。
4)~:攔截彈II末制導(dǎo)過程。攔截彈II以直覺模糊博弈理論為基礎(chǔ),建立彈目動(dòng)態(tài)博弈模型。結(jié)合多屬性評估,通過納什均衡求解攔截彈混合策略,保證攔截彈對目標(biāo)攔截的綜合收益。
由于AHV在巡航段經(jīng)歷時(shí)間較長,此階段也可以使用多個(gè)由攔截彈I和攔截彈II組成的攔截單元對目標(biāo)進(jìn)行攔截,推導(dǎo)的原理相同,在此略。
2.1.1 預(yù)測交匯平面
AHV在執(zhí)行任務(wù)過程中會(huì)經(jīng)歷爬升段、巡航段以及俯沖攻擊段。假設(shè)巡航段初始時(shí)刻AHV位置(地心距,經(jīng)度,緯度)為(,,),敵方攻擊目標(biāo)(,,),定義點(diǎn)、和地心所在的平面為面。
排練時(shí),為了讓孩子們更有代入感,我打扮成“與平叔叔”,裹上日式頭巾,抹一道黑炭小胡子,穿著日式服裝,和孩子們一起唱啊、跳啊、鬧啊,大家馬上興奮起來,投入劇情之中……你看我像不像從日本來的小伙子?其實(shí),我都八十多歲了!
預(yù)測交匯平面滿足:① 垂直于面;② 某一時(shí)刻攔截彈I和AHV同時(shí)在該平面上,該時(shí)刻即為預(yù)測交匯時(shí)刻,記為。將目標(biāo)在交匯平面上的最大機(jī)動(dòng)范圍定義為預(yù)測目標(biāo)可達(dá)范圍,記為R。
目標(biāo)垂直于面的速度分量為,通過算法預(yù)測在未來一段時(shí)間內(nèi)的變化情況?;谧钚《朔▽δ繕?biāo)速度進(jìn)行擬合
(10)
式中:為離散時(shí)間序列;為多項(xiàng)式的參數(shù);為曲線模型的階數(shù)。
定義目標(biāo)函數(shù)
(11)
2.1.2 虛擬攔截點(diǎn)設(shè)計(jì)
通過位置幾何關(guān)系可以求得交匯平面在慣性系下的表達(dá)式。以交匯時(shí)刻為節(jié)點(diǎn)將目標(biāo)巡航段分為兩個(gè)階段。通過高斯偽譜法求解滿足約束條件目標(biāo)在交匯平面的最大的可行范圍。AHV軌跡約束除式(1)~式(4)外,有
階段1初始狀態(tài):
(12)
階段1終端狀態(tài):
(13)
階段2初始狀態(tài):
(14)
階段2終端狀態(tài):
(15)
兩個(gè)階段的代價(jià)函數(shù)可以表示為
(16)
目標(biāo)預(yù)測到達(dá)位置(,,)的求解式為
(17)
式中:、、為慣性坐標(biāo)系下目標(biāo)當(dāng)前位置坐標(biāo);T、T、T為目標(biāo)在慣性坐標(biāo)系各軸的速度分量;=(1-e-),且0<<1, 03≤≤05,參數(shù)可有效修正目標(biāo)機(jī)動(dòng)時(shí)的預(yù)測攔截點(diǎn);為剩余飛行時(shí)間。
(18)
“虛擬攔截點(diǎn)”的設(shè)計(jì)思想是:為了使攔截彈I在末制導(dǎo)階段對目標(biāo)形成態(tài)勢壓制,即在對抗過程中迫使目標(biāo)機(jī)動(dòng)到可達(dá)邊界處,虛擬攔截點(diǎn)必須位于目標(biāo)預(yù)測位置與可達(dá)邊界幾何中心之間,三者關(guān)系如圖2所示。
圖2 “虛擬攔截點(diǎn)”定義Fig.2 Definition of “virtual interception point”
虛擬攔截點(diǎn)可以通過式(19)計(jì)算得到
(19)
式中:(,,)為幾何中心的位置坐標(biāo)。此外,的取值需要滿足
(20)
其中:為攔截彈導(dǎo)引頭的探測距離。
2.1.3 攔截彈I最優(yōu)中制導(dǎo)模型
首先計(jì)算出中末交班點(diǎn)處導(dǎo)彈期望速度終端角和。期望的終端角是指在預(yù)測交班點(diǎn)處彈目的視線角速率為0 rad/s時(shí)導(dǎo)彈的速度指向,在中末交班點(diǎn)處攔截彈期望速度傾角為
(21)
式中:、、T分別為縱向平面的彈目視線角、攔截彈速度、目標(biāo)速度;為目標(biāo)彈道傾角。在側(cè)向平面以同樣方式求解。
攔截彈I的虛擬交班位置表示為
(22)
因此,攔截彈I中制導(dǎo)初始時(shí)刻,交班時(shí)刻,中末交班條件可以表示為
(23)
(24)
最優(yōu)中制導(dǎo)性能指標(biāo)為
=()
(25)
攔截彈I最優(yōu)中制導(dǎo)律設(shè)計(jì)目標(biāo):滿足動(dòng)力學(xué)約束式(5),邊界約束式(23)和式(24),控制約束式(9),確定制導(dǎo)指令和使得性能指標(biāo)式(25) 達(dá)到極大。
需要指出攔截彈I中制導(dǎo)設(shè)計(jì)的思想:為了使攔截彈I在對抗過程中對目標(biāo)形成態(tài)勢壓制,減弱其機(jī)動(dòng)能力。需要通過中制導(dǎo)將攔截彈I導(dǎo)引到由虛擬攔截點(diǎn)解算得到的虛擬交班點(diǎn)處,此時(shí)攔截彈I-目標(biāo)相對關(guān)系如圖3所示,此時(shí)目標(biāo)突防域相對于攔截彈I的攔截域更靠近邊界(邊界處對于目標(biāo)不利),因此經(jīng)過末制導(dǎo)對抗目標(biāo)機(jī)動(dòng)能力將大大減弱。
圖3 預(yù)測交匯平面Fig.3 Plane of prediction encounter
攔截彈II中制導(dǎo)過程同樣采用最優(yōu)中制導(dǎo)律。由于攔截彈II需要對目標(biāo)進(jìn)行精確攔截,因此中制導(dǎo)過程對于最終攔截性能有重要影響。本節(jié)對攔截彈II中制導(dǎo)及中末交班條件進(jìn)行設(shè)計(jì)。
攔截彈II-目標(biāo)相對運(yùn)動(dòng)方程為
(26)
(27)
()=d,()=d
(28)
(29)
min≤≤max,min≤≤max
(30)
攔截彈中制導(dǎo)性能指標(biāo):
(31)
攔截彈II最優(yōu)中制導(dǎo)律的設(shè)計(jì)目標(biāo):在滿足微分方程約束式(26)、邊界約束式(27)~式(29)和控制輸入約束式(30)的條件下,確定制導(dǎo)指令和以及終端時(shí)間使得性能指標(biāo)式(31)達(dá)到極小。
可以將攔截彈中制導(dǎo)律的設(shè)計(jì)問題統(tǒng)一描述為一般的最優(yōu)控制問題,設(shè)計(jì)性能指標(biāo)為
(32)
式中:()∈為狀態(tài)變量;、分別為起始和終端時(shí)間。在滿足約束式式(33)~式(35)的基礎(chǔ)上求解控制變量()∈,使得性能指標(biāo)式(32) 最小。
動(dòng)力學(xué)微分方程約束為
(33)
邊界條件為
((),,(),)=
(34)
路徑約束為
((),(),)≤
(35)
本文采用高斯偽譜法(Gauss Pseudospectral Method,GPM)對攔截彈I和攔截彈II的中制導(dǎo)最優(yōu)軌跡進(jìn)行求解。GPM求解基本過程:把時(shí)間軸按照拉格朗日-高斯(Legendre-Gauss,LG)方法離散為一系列的時(shí)間點(diǎn),然后對系統(tǒng)狀態(tài)變量和控制變量進(jìn)行離散,從而使系統(tǒng)的狀態(tài)方程、約束條件以及性能指標(biāo)函數(shù)通過上述離散量表示出來。上述過程將優(yōu)化問題轉(zhuǎn)化為非線性規(guī)劃(Nonlinear Programming,NLP)問題,然后采用成熟的序列二次規(guī)劃(Sequential Quadratic Programming,SQP)方法進(jìn)行求解。GPM方法具有求解精度高、收斂速度快、對初值不敏感等優(yōu)點(diǎn)。
末制導(dǎo)過程彈目相對運(yùn)動(dòng)關(guān)系如圖4所示,視末制導(dǎo)初始時(shí)刻攔截彈和目標(biāo)的彈道坐標(biāo)系和為慣性系,為視線坐標(biāo)系,和為視線偏航角和視線俯仰角。
圖4 彈目相對運(yùn)動(dòng)模型Fig.4 Missile-target relative motion model
定義視線法向速度制導(dǎo)模型
(36)
依據(jù)文獻(xiàn)[15]對三維制導(dǎo)律的廣義設(shè)計(jì)方法,視法向速度模型下的廣義制導(dǎo)律設(shè)計(jì)為
(37)
考慮如下李雅普諾夫方程
(38)
將制導(dǎo)律式(37)代入模型式(36),并對式(38) 求導(dǎo)得到
(39)
攔截彈和目標(biāo)實(shí)際對抗環(huán)境較為復(fù)雜且具有模糊特性,應(yīng)用基于精確物理模型設(shè)計(jì)的制導(dǎo)策略可能會(huì)導(dǎo)致較差的制導(dǎo)性能。為了使攔截彈II在具有機(jī)動(dòng)優(yōu)勢的基礎(chǔ)上提高對目標(biāo)的攔截精度,針對攔截彈II和目標(biāo)的攻防對抗,采用基于直覺模糊的動(dòng)態(tài)博弈模型,結(jié)合多屬性評估方法以及支付矩陣直覺模糊表示,有效求解博弈雙方動(dòng)態(tài)策略,確保攔截方獲得最大收益。
3.2.1 策略評估屬性
攔截彈制導(dǎo)策略通過制導(dǎo)精度、能量消耗以及彈道特征3個(gè)屬性來進(jìn)行評價(jià)?;谥庇X模糊理論將各評價(jià)因素用模糊語言劃分成7個(gè)等級,采用分檔模糊集法對信息進(jìn)行模糊化。
依據(jù)專家經(jīng)驗(yàn)獲得屬性(=1,2,3)相對于屬性(=1,2,3)的重要標(biāo)度,且與互為倒數(shù),計(jì)算各項(xiàng)屬性的權(quán)重為
(40)
式中:(=1,2,3)為屬性的權(quán)重。
3.2.2 直覺模糊矩陣博弈模型
攔截彈-目標(biāo)末制導(dǎo)過程是典型的二人有限非合作零和博弈模型,基于直覺模糊理論的博弈模型可以由五元組={,,,,}表示:
1)={,,…,}和={,,…,}分別為攔截彈和目標(biāo)的策略集,由直覺模糊數(shù)=(,)對策略進(jìn)行定量評價(jià),其中∈[0,1],∈[0,1], 0≤+≤1。
3) 混合策略空間:
(41)
式中:、為策略∈、∈的選擇概率。依據(jù)直覺模糊運(yùn)算求得期望收益函數(shù):
(42)
4) 求解均衡策略?;诘梅趾瘮?shù)法對直覺模糊數(shù)進(jìn)行排序?;谏鲜鋈蜿P(guān)系的納什均衡條件:若存在(,),對于?∈, ?∈有
(,)<(,)<(,)
(43)
則混合策略(,)為滿足博弈模型的均衡策略。依據(jù)矩陣博弈的最大最小法則,通過得分函數(shù)展開,博弈問題可以轉(zhuǎn)換為非線性規(guī)劃模型進(jìn)行求解,并將對偶非線性規(guī)劃模型合并,
(44)
(45)
將最優(yōu)化問題式(44)轉(zhuǎn)化為無約束模型,進(jìn)而可以通過差分進(jìn)化算法得到其最優(yōu)解式(45),即均衡策略解。
3.2.3 博弈雙方策略集設(shè)計(jì)
1) 攔截彈策略集
攔截彈II動(dòng)態(tài)策略由基礎(chǔ)制導(dǎo)律和參數(shù)調(diào)節(jié)組成?;A(chǔ)制導(dǎo)律和攔截彈I形式一致,該制導(dǎo)律涉及3個(gè)關(guān)鍵參數(shù)、1、2,=1,2,嚴(yán)重影響攔截彈II制導(dǎo)性能??梢酝ㄟ^優(yōu)化制導(dǎo)參數(shù)作為攔截彈博弈策略。從李雅普諾夫穩(wěn)定性的角度而言,制導(dǎo)參數(shù)需滿足>0;1,2>0;=1,2。通過分布特征求取參數(shù)的概率均勻離散水平,根據(jù)文獻(xiàn)[23]介紹的數(shù)論方法,生成攔截彈II的均勻策略集。
2) 目標(biāo)策略集
所研究AHV類型目標(biāo)具有以下特征:① 乘波體結(jié)構(gòu);② 具有超燃沖壓發(fā)動(dòng)機(jī);③ 采用傾斜轉(zhuǎn)彎方式(BTT)實(shí)現(xiàn)橫向機(jī)動(dòng)。由1.1節(jié)建立的AHV動(dòng)力學(xué)模型可知,目標(biāo)機(jī)動(dòng)方式與飛行器在彈道坐標(biāo)系各軸的加速度有關(guān)。定義為目標(biāo)在彈道系中的凈加速度,可通過升力、阻力以及推力經(jīng)過坐標(biāo)轉(zhuǎn)換獲得,表示為
(46)
由式(46)分析可知,目標(biāo)機(jī)動(dòng)形式與攻角、滾轉(zhuǎn)角以及燃油當(dāng)量比直接相關(guān)。在沒有先驗(yàn)信息的情況下,為了使超燃沖壓發(fā)動(dòng)機(jī)正常工作,取服從[-3°,10°]上的均勻分布;取服從[-30°,30°]上的均勻分布;取服從[0.2,1]上的均勻分布。依據(jù)參數(shù)分布特征求取參數(shù),和的概率均勻離散水平,根據(jù)文獻(xiàn)[23]介紹的數(shù)論方法,生成AHV目標(biāo)均勻模型集。
本節(jié)對提出的分階段攔截方案進(jìn)行全過程仿真,驗(yàn)證該方案的有效性。
首先對攔截彈I的虛擬交班點(diǎn)進(jìn)行預(yù)測。假設(shè)AHV在巡航段存在以下約束:
1) 初始狀態(tài)約束:
(47)
式中:為平均地球半徑。
2) 終端狀態(tài)約束
(48)
3) 過程約束
≤50 kPa,≤4,≤600 kW/m
(49)
4) 控制約束
-3°≤≤10°,-30°≤≤30°,02≤≤1
(50)
假設(shè)通過速度擬合預(yù)測交匯時(shí)間=450 s,預(yù)測交匯面=30°。通過多階段優(yōu)化可以得到AHV在交匯平面的可達(dá)邊界及虛擬攔截點(diǎn)。
使用Gpops-II軟件實(shí)現(xiàn)hp自適應(yīng)偽譜法的優(yōu)化計(jì)算。通過hp自適應(yīng)偽譜法對目標(biāo)軌跡進(jìn)行分階段優(yōu)化,求得目標(biāo)在預(yù)測交匯平面的可達(dá)邊界(見表1),虛擬攔截點(diǎn)位置為(=30°,=0.021°,=+30.897 km)。表1中結(jié)果均為時(shí)間和飛行器運(yùn)動(dòng)狀態(tài)的函數(shù),因此隨攻防對抗過程表1動(dòng)態(tài)變化。
表1 目標(biāo)可達(dá)邊界離散點(diǎn)Table 1 Discrete points of target’s accessible boundary
獲得虛擬攔截點(diǎn)的坐標(biāo)位置后,經(jīng)過坐標(biāo)變換,虛擬攔截點(diǎn)在發(fā)射點(diǎn)慣性系中的位置為:(120,24,-3.4) km。通過最優(yōu)控制算法為攔截彈I設(shè)計(jì)最優(yōu)軌跡,使得在中末交班時(shí)刻速度最大,且滿足交班條件。
如圖5所示,攔截彈I從發(fā)射平臺(tái)經(jīng)過兩次助推,最終無動(dòng)力導(dǎo)引到預(yù)測交班位置。且保證在交班位置滿足彈道傾角和彈道偏角約束。最優(yōu)中制導(dǎo)律保證攔截彈在交班位置處的速度最大,如圖6所示。
圖5 攔截彈I最優(yōu)軌跡Fig.5 Optimal trajectory of Interceptor I
圖6 攔截彈I速度Fig.6 Speed of Interceptor I
圖7 攔截彈II-目標(biāo)相對距離Fig.7 Interceptor II-Target relative distance
圖8 攔截彈II-目標(biāo)視線俯仰角Fig.8 Interceptor II-Target line of sight pitch angle
圖9 攔截彈II-目標(biāo)視線偏航角Fig.9 Interceptor II-Target line of sight yaw angle
攔截彈I的末制導(dǎo)過程對制導(dǎo)精度不高,主要完成對目標(biāo)的態(tài)勢壓制,不需要對制導(dǎo)參數(shù)進(jìn)行動(dòng)態(tài)調(diào)整。攔截彈II在順利完成交接班的基礎(chǔ)上,為了提高對目標(biāo)的攔截概率,需要在攔截過程中動(dòng)態(tài)調(diào)整制導(dǎo)參數(shù)。假設(shè)博弈周期為500 ms。博弈策略采用多屬性評評估方式,制導(dǎo)精度、能量消耗和彈道特征的屬性權(quán)重分別為:0.5,0.25,0.25。
通過計(jì)算得到各博弈周期內(nèi)彈目雙方的均衡策略以及策略收益得分。計(jì)算得到第一個(gè)博弈周期內(nèi)的策略收益分值為0.659 7。攔截彈和目標(biāo)隨機(jī)生成30組混合策略,并分別計(jì)算策略收益。如圖10所示,可以看出任意一方取隨機(jī)策略使得己方收益減少對方收益增加。
圖10 均衡策略驗(yàn)證Fig.10 Equilibrium strategy verification
為了驗(yàn)證動(dòng)態(tài)博弈策略的有效性,需要對攔截彈II在動(dòng)態(tài)策略和固定策略下的仿真結(jié)果進(jìn)行對比分析。假設(shè)目標(biāo)也選擇動(dòng)態(tài)博弈策略,即為目標(biāo)綜合收益最優(yōu)的策略。依據(jù)多屬性評估原則,從制導(dǎo)精度、能量消耗及軌跡特征3個(gè)方面對制導(dǎo)策略進(jìn)行分析。圖11和圖12分別為動(dòng)態(tài)策略和固定策略下“攔截彈II-目標(biāo)”的視線法向速度。固定策略不能適應(yīng)所有態(tài)勢,通過對比發(fā)現(xiàn)固定策略下視線法向速度變化大且存在無法收斂到零的情況,表明固定策略制導(dǎo)精度收益低。圖13 和圖14分別為動(dòng)態(tài)策略和固定策略下攔截彈道坐標(biāo)系各軸加速度的變化情況。對比可以看出固定策略在制導(dǎo)過程中需要消耗更多能量來修正彈道。因此動(dòng)態(tài)策略能量消耗收益更高。圖15 和圖16分別為動(dòng)態(tài)策略和固定策略下攔截彈道傾角/偏角的變化情況,在動(dòng)態(tài)策略下攔截彈道更加平緩。因此動(dòng)態(tài)策略軌跡特征收益更高。綜合仿真結(jié)果,攔截彈II在動(dòng)態(tài)策略下的綜合收益高于固定策略。上述結(jié)果驗(yàn)證了當(dāng)博弈雙方中的一方采取除均衡策略以外的隨機(jī)策略時(shí),其綜合收益會(huì)減小。圖17是動(dòng)態(tài)策略和固定策略下進(jìn)行多次仿真的脫靶量結(jié)果,動(dòng)態(tài)策略制導(dǎo)精度更高。
圖11 動(dòng)態(tài)策略視線法向速度Fig.11 Dynamic strategy line of sight normal velocity
圖12 固定策略視線法向速度Fig.12 Fixed strategy line of sight normal velocity
圖13 動(dòng)態(tài)策略攔截彈道各軸加速度Fig.13 Dynamic strategy acceleration of intercept missile in trajectory coordinates
圖14 固定策略攔截彈道各軸加速度Fig.14 Fixed strategy acceleration of intercept missile in trajectory coordinates
圖15 動(dòng)態(tài)策略攔截彈道傾角/偏角Fig.15 Dynamic strategy inclination and deflection angle of interception trajectory
圖16 固定策略攔截彈道傾角/偏角Fig.16 Fixed strategy inclination and deflection angle of interception trajectory
圖17 脫靶量統(tǒng)計(jì)Fig.17 Miss distance statistics
目標(biāo)采用最優(yōu)機(jī)動(dòng)的策略,攔截彈II也需要采用動(dòng)態(tài)均衡策略進(jìn)行博弈對抗。圖18為攔截彈I與攔截彈II對目標(biāo)進(jìn)行協(xié)同攔截的彈目軌跡圖。由于機(jī)動(dòng)能力約束和存在交班誤差等原因,攔截彈I對目標(biāo)不直接進(jìn)行碰撞攔截。但是攔截彈I可以通過干擾對抗對目標(biāo)形成態(tài)勢壓制。假設(shè)攔截彈II和目標(biāo)中末交班時(shí)刻在交匯平面上的可達(dá)域分別為Are和Are,定義攔截彈II的攔截態(tài)勢系數(shù)為(Are∩Are)/Are,通過攔截態(tài)勢系數(shù)可以評價(jià)攔截彈II-目標(biāo)的攻防態(tài)勢,攔截態(tài)勢系數(shù)越高說明攔截彈相對于目標(biāo)在攻防態(tài)勢上越具有優(yōu)勢。為了驗(yàn)證攔截彈I和攔截彈II分階段協(xié)同的有效性,分別進(jìn)行了協(xié)同和非協(xié)同情況下的彈目博弈仿真。這里非協(xié)同指使用單枚攔截彈II與目標(biāo)直接進(jìn)行動(dòng)態(tài)博弈。圖19為協(xié)同和非協(xié)同條件下攔截彈II的攔截態(tài)勢系數(shù),可以得出協(xié)同條件下攔截彈I的對抗使得目標(biāo)態(tài)勢受到壓制,進(jìn)而導(dǎo)致攔截彈II的攔截態(tài)勢系數(shù)的均值高于非協(xié)同攔截情況,使得對目標(biāo)的攔截概率增大。圖20為協(xié)同和非協(xié)同條件下的最終脫靶量和平均綜合收益的仿真結(jié)果。綜合分析,由于非協(xié)同條件下在彈目動(dòng)態(tài)博弈之前防御方?jīng)]有攔截器對目標(biāo)機(jī)動(dòng)施加約束,目標(biāo)的可執(zhí)行策略空間相較于協(xié)同情況下要大,導(dǎo)致整個(gè)博弈過程攔截彈II綜合收益降低。仿真結(jié)果表明兩彈協(xié)同條件下攔截彈II可以更好發(fā)揮動(dòng)態(tài)博弈的優(yōu)勢,最大化博弈綜合收益,提高攔截彈II對目標(biāo)的攔截概率。
圖18 彈目運(yùn)動(dòng)軌跡Fig.18 Trajectory of missile and target
圖19 攔截態(tài)勢系數(shù)Fig.19 Coefficient of intercept situation
圖20 協(xié)同與非協(xié)同對比仿真Fig.20 Comparative simulation of cooperative and non-cooperative
1) 本文基于AHV動(dòng)力學(xué)模型對該類型目標(biāo)在巡航階段的典型軌跡特征進(jìn)行分析,在此基礎(chǔ)上提出對目標(biāo)進(jìn)行多階段協(xié)同攔截的策略?;诓呗缘耐暾詾楦麟A段設(shè)計(jì)了任務(wù)目標(biāo)和方案。
2) 攔截彈I的目標(biāo)是通過第一階段對抗減小AHV的可行域及減弱其機(jī)動(dòng)能力。進(jìn)行目標(biāo)速度預(yù)測以及交匯平面的可達(dá)范圍和虛擬攔截點(diǎn)的計(jì)算,本文為攔截彈I設(shè)計(jì)了基于虛擬交班點(diǎn)的最優(yōu)中制導(dǎo)律以及廣義三維末制導(dǎo)律。
3) 攔截彈II需要對目標(biāo)進(jìn)行精確攔截,要適應(yīng)可能出現(xiàn)的復(fù)雜態(tài)勢。為了順利完成中末交班,攔截彈II中制導(dǎo)過程采用基于彈目相對運(yùn)動(dòng)模型的最優(yōu)中制導(dǎo)律。在末制導(dǎo)階段需要為攔截彈設(shè)計(jì)可行的動(dòng)態(tài)策略?;谥庇X模糊理論、多屬性評估方法以及博弈理論對彈目對抗進(jìn)行建模,通過模型轉(zhuǎn)化獲得攔截彈動(dòng)態(tài)均衡策略。結(jié)果顯示該方案最終攔截效果符合設(shè)計(jì)要求。上述方案為在復(fù)雜和不確定性環(huán)境下攔截高速機(jī)動(dòng)目標(biāo)提供新的解決思路。