張 帥,朱東方,孫 俊,華 春,劉延芳
(1. 航空工業(yè)哈爾濱飛機工業(yè)集團有限責任公司·哈爾濱·150066;2. 上海航天控制技術研究所·上?!?01109;3. 上海航天信息研究所·上?!?01109;4. 哈爾濱工業(yè)大學 航天學院·哈爾濱·150001)
未來的新型空襲武器,如戰(zhàn)術彈道導彈(Tactical Ballistic Missile,TBM)、高超聲速巡航導彈(Supersonic Cruise Missile,SCM)和無人駕駛飛行器(Unmanned Aerial Vehicle,UAV)等,具有飛行速度快、機動能力強等特點[1]。在攔截這類目標時,攔截彈在速度、機動能力、過載響應速度等方面不再具有明顯的優(yōu)勢。同時,由于這類新型目標的結(jié)構(gòu)尺寸小、結(jié)構(gòu)強度高,要對其進行成功攔截需要實現(xiàn)很小的脫靶量,甚至需要通過直接碰撞將其摧毀(Hit to Kill)。
為提高成功攔截的概率,一方面需要采用先進的制導、控制系統(tǒng),提高單發(fā)命中概率(Single Shot Kill Probability,SSKP);另一方面,可以采用同時發(fā)射多枚攔截彈的方式完成攔截。本文主要對后者進行了研究。
微分對策理論是在古典對策理論和最優(yōu)控制理論相結(jié)合的基礎上,研究雙方或多方最優(yōu)對抗策略的理論[1],其被廣泛應用于攔截彈制導律的設計[2-9]。Gutman S 指出,比例導引(Proportional Navigation,PN)制導律是一種在對抗雙方都具有理想側(cè)向動力學特性假設下的線性二次型微分對策(Linear Quadratic Differential Game,LQDG)制導律[3],他同時給出了同樣假設下、對抗雙方控制受限條件下的邊界型微分對策(Bounded Differential Game,BDG)制導律[4]。Shinar J等將BDG制導律擴展到了包含攔截彈一階動力學特性(DGL/0)[5]和目標一階動力學特性(DGL/1)[6-7]的模型上。考慮對目標狀態(tài)估計的延遲、速度和速度剖面的時變特性,Shinar J和 Shima T等提出了DGL/C[5,8]、DGL/E[9]和DGL/EC[10]制導律。李云遷等針對新型攔截彈,將復合控制引入到了微分對策制導律中[11-12]。劉延芳等針對大初始航向誤差時的角度非線性,提出了非線性微分對策制導律[13]。劉長有等[14]采用強迫奇異攝動給出了非線性微分對策次最優(yōu)反饋制導律。
然而,以上文獻中提出的制導律針對的是一對一攔截問題。在多彈攔截問題中,新攔截彈的加入使得對策模型復雜化,演變?yōu)椤岸鄬σ蛔粉?逃逸”問題。Perelman A等基于零和(Zero-Sum)理論提出了協(xié)同二次型微分對策(Cooperative Linear Quadratic Differential Game,CLQDG)制導律[15-16]。該制導律針對的是航空器通過發(fā)射防護導彈來躲避來襲攔截彈攻擊的兩組三體最優(yōu)策略問題:攔截彈追蹤航空器,航空器躲避來襲攔截彈,防護導彈試圖摧毀攔截彈。針對同樣的問題,Shima T在攻擊導彈采用線性制導律、線性化運動學和完全信息的假設下給出了最優(yōu)合作追蹤-逃逸策略[17]。然而,該問題與多彈攔截問題有很大的不同。彭琛等研究了飽和攻擊多彈分布協(xié)同末制導問題[18],但此問題并不適用于多彈攔截問題。Foley A M給出了非零和多對一對策問題的基本模型和最優(yōu)策略[19-20],Lin W給出了在擁有局部信息時的多對一對策問題的納什平衡策略(Nash Equilibrium Strategy, NESS)[21]。
本文針對兩枚攔截彈攔截單目標的末段制導問題,將其建模為非零和二對一追蹤-逃逸對策模型,采用微分對策理論給出BDG制導律,并對該制導律的性能進行分析。
在末制導段,2枚攔截彈P、Q和目標T的三維相對運動可以分解到2個正交平面內(nèi),本文僅對俯仰平面內(nèi)的運動進行了研究。為簡化分析,采用如下假設[1-5,7-8]:
(1)攔截彈和目標的速度為常值;
(2)攔截彈和目標可以獲得彼此的精確信息;
(3)攔截彈和目標的相對運動可以在初始視線附近實現(xiàn)線性化;
(4)忽略由于攔截彈和目標高度不同帶來的重力加速的影響;
(5)攔截彈和目標的自動駕駛儀具有理想的動力學響應(零階延遲)。
末制導段俯仰平面內(nèi)攔截彈和目標間的相對運動如圖1所示。其中,V、a和γ分別表示速度、加速度和航跡角;λ和r分別表示視線角和彈目距離;y表示在垂直視線方向上,目標與攔截彈之間的相對距離;下標P、Q和T分別表示攔截彈P、Q和目標T,PT表示P和T之間的對抗,QT表示Q和T之間的對抗,0表示初始時刻。
圖1 末制導段攔截彈和目標間的幾何關系Fig.1 Geometry of end-game guidance
(1)
其中
(2)
基于假設1)、3),在給定的初始條件下,對抗PT和QT的結(jié)束時間可以近似計算為
(3)
滿足
tf,PT>tf,QT
(4)
其中,φ為前置角,定義為
(5)
本文主要對迎向攔截[12]進行研究,對于迎向攔截,前置角滿足關系
-π/2<φi<π/2,i∈{P,Q,PT,QT}
(6)
將攔截的結(jié)束時間定義為
tf=tf,PT
(7)
攔截彈和目標的最大加速度受限,為避免控制飽和,有
|ui| (8) ZEM表示從當前時刻(攔截彈和目標都不再輸出指令時)至末制導結(jié)束時的脫靶量的大小。應用狀態(tài)轉(zhuǎn)移矩陣,ZEM矢量可以表示為 z(t)=DΦ(tf,t)x(t) (9) 其中,狀態(tài)轉(zhuǎn)移矩陣為 D為常值矩陣,為 將式(9)對時間求導可以得到ZEM動態(tài)為 (10) 其中, 假設2枚攔截彈完全一致且攔截過程相互獨立,每一枚攔截彈都控制自己的脫靶量使其達到最小,而目標選擇使最小脫靶量最大的控制策略,因此攔截彈和目標的目標函數(shù)為 (11) 將狀態(tài)方程(1)、約束方程(8)和目標函數(shù)(11)定義的非零和二對一追蹤-逃逸對策模型表示為G。 (12) 使三個不等式對所有的容許控制uP、uQ和uT都成立,則該策略集稱為G的納什平衡策略。 由于式(11)中目標的性能函數(shù)不連續(xù),為了應用現(xiàn)有理論進行求解,重新定義連續(xù)的性能函數(shù)為 (13) (14) (15) 協(xié)變量滿足 (16) 最優(yōu)控制策略為 (17) 其中 將開環(huán)最優(yōu)策略(15)代入式(9),可得到最優(yōu)零控脫靶量動態(tài) (18) 定義2:ZEM矢量z(t)的集合稱為攔截空間S,即 S={z(t)} (19) 2.2.1 P-攔截空間 定義3:滿足 的ZEM矢量組成的攔截空間S的子空間稱為P-攔截空間,即有 (20) 定理1:如果滿足z(t)∈SP,當κ=1時式(17)是對策模型G的納什平衡策略。 (21) 因此,為證明式(17)是G的納什平衡策略,只需要對式(12)中的第三式進行驗證。 當κ=1時, (22) 將式(17)代入式(10),可以得到 (23) 由z(t)∈SP,可以得到|zP(tf)|<|zQ(tf)|,因此有 (24) 假設攔截彈P和Q采用式(17)的策略,而目標采用任意容許策略uT,此時有三種可能的結(jié)果 a) |zP(tf)|>|zQ(tf)|,此時有 (25) 結(jié)合式(22)、(24)和(25),可以得到 (26) 對于情況b)|zP(tf)|=|zQ(tf)|和c)|zP(tf)|<|zQ(tf)|,同樣可以得到式(26)成立,即式(12)第三式得到驗證。因此,如果滿足z(t)∈SP,當κ=1時,式(17)是對策模型G的納什平衡策略,定理得證。 在P-攔截空間里,結(jié)合式(20)和式(23),可以得到 signz(t)=signz(tf) (27) 因此,最優(yōu)反饋制導律為 (28) 2.2.2 Q-攔截空間 定義4:滿足 的由ZEM矢量組成的攔截空間S的子空間稱為Q-攔截空間,即有 (29) 定理2:如果滿足z(t)∈SQ,當κ=0時,式(17)是對策模型G的納什平衡策略。 證明:同定理1,這里只需要對式(12)中的第三式進行驗證。 當κ=0時, (30) 將式(17)代入式(10),可以得到 (31) 由z(t)∈SQ,可以得到|zP(tf)|>|zQ(tf)|,因此有 (32) 假設攔截彈P和Q采用式(17)的策略,而目標采用任意容許策略,此時有三種可能的結(jié)果 a)|zP(tf)|>|zQ(tf)|,此時有 (33) 結(jié)合式(30)、(32)和(33),可以得到 (34) 對于情況b)|zP(tf)|=|zQ(tf)|和c)|zP(tf)|<|zQ(tf)|,同樣可以得到式(34)成立,即式(12)第三式得到驗證。因此,如果滿足z(t)∈SQ,當κ=0時,式(17)是對策模型的納什平衡策略。定理得證。 在Q-攔截空間里,結(jié)合式(29)和式(31)可以得到 signz(t)=signz(tf) (35) 因此,最優(yōu)反饋制導律為 (36) 2.2.3 PQ-攔截空間 定義5:存在0<κ<1使得在式(17)策略的作用下終端零控脫靶量滿足zP(tf)=zQ(tf)的攔截空間的子空間稱為PQ-攔截空間,即有 SPQ={z(t)|?0<κ<1,zP(tf)=zQ(tf)} (37) 定理3:如果滿足z(t)∈SPQ,當κ滿足|zP(tf)|=|zQ(tf)|時,式(17)是對策模型G的納什平衡策略。 證明:同定理1,這里只需要對式(12)中的第三式進行驗證。 根據(jù)PQ-攔截空間的定義,當z(t)∈SPQ時,|zP(tf)|=|zQ(tf)|,因此有 (38) 假設攔截彈P和Q采用式(17)的策略,而目標采用任意容許策略uT,此時有三種可能的結(jié)果: 情況a)為 |zP(tf)|>|zQ(tf)|,此時有 (39) 結(jié)合式(38)和(39),可以得到 (40) 對于情況b)|zP(tf)|=|zQ(tf)|和情況c)|zP(tf)|<|zQ(tf)|,同樣可以得到式(40)成立,即式(12)第三式得到驗證。因此,如果滿足z(t)∈SPQ,當κ滿足zP(tf)=zQ(tf)時,式(17)是對策模型G的納什平衡策略。定理得證。 在PQ-攔截空間里,0<κ<1,根據(jù)式(17),當signzP(tf)=signzQ(tf)時,最優(yōu)反饋制導律為 (41) 當signzP(tf)=-signzQ(tf)時,最優(yōu)反饋制導律與κ相關,其中κ可通過求解|zP(tf)|=|zQ(tf)|獲得。 典型的攔截空間分布如圖2所示,其中中心區(qū)域為奇異區(qū)(Sigular Range),其物理意義將在下一節(jié)進行說明。在奇異區(qū),攔截彈和目標的最優(yōu)反饋策略是任意的。 圖2 攔截空間分布Fig.2 Distribution of intercept space 在給定任意最終脫靶量時,結(jié)合式(14)可以得到κ值,將κ值帶入式(17)可以獲得最優(yōu)制導策略,將最優(yōu)制導律代入式(18)并積分可以得到最優(yōu)軌跡。當zP(tf)=zQ(tf)時,取κ值為[0,1]之間任意的數(shù),可以得到給定κ值下的最優(yōu)軌跡。從不同的最終脫靶量及κ值出發(fā),可以得到最優(yōu)軌跡集合,該集合填充著對策空間(t,zP,zQ)。典型的對策空間的結(jié)構(gòu)如圖3所示。圖中給出的曲線為奇異區(qū)與P-攔截空間、Q-攔截空間及PQ-攔截空間的邊界最優(yōu)航跡。P-攔截空間、Q-攔截空間和PQ-攔截空間之外的區(qū)域為奇異區(qū)。當攔截的初始條件位于該區(qū)域時,最優(yōu)導航策略是任意的。不論采用什么樣的制導策略,當零控脫靶量矢量達到邊界最優(yōu)航跡時,其會沿著邊界最優(yōu)航跡運動,并保證零脫靶量攔截。從圖3可以看到,當P攔截彈和Q攔截彈的初始零控脫靶量具有相反的符號時,奇異區(qū)域會增加,即零脫靶量攔截的區(qū)域有所增加。 圖3 對策空間結(jié)構(gòu)Fig.3 Game space structure 選擇在初始ZEM矢量位于PQ-攔截空間條件下進行仿真研究,兩枚攔截彈采用本文提出的制導律(表示為LQDG/S),目標采用“棒-棒”機動策略,即初始時沿某一方向采用最大加速度機動,在時刻(tgo)sw時改變機動方向沿相反的方向以最大加速度機動[5,8,10-12]。假設目標無法獲得攔截彈的準確信息,加速度方向的改變時間隨機,此時目標以一定的概率實現(xiàn)最優(yōu)機動。在不同的仿真中,機動方向的改變時刻(tgo)sw在剩余飛行時間內(nèi)以0.03s的時間間隔變化。在仿真中,制導周期為10ms,積分步長為1ms。目標和攔截彈的加速度受最大可用過載的限制。仿真采用的主要參數(shù)在表1中給出。 表1 仿真參數(shù) 圖4、圖5給出了(tgo)sw=2s時的零控脫靶量和加速度隨時間變化的曲線。圖6給出了脫靶量隨目標機動方向的轉(zhuǎn)向時間變化關系,圖6中的直線表示脫靶量的均值。其中,脫靶量定義為攔截彈P和Q的脫靶量的最小值。從圖6可以看到,脫靶量的均值約為0.4m。在目標的加速度轉(zhuǎn)向時間(tgo)sw=0.4s時,脫靶量存在峰值,表明該時刻為目標的最優(yōu)機動轉(zhuǎn)向時機。 圖4 零控脫靶量軌跡Fig.4 Trajectory for zero-effort miss distance 圖5 加速度曲線Fig.5 History of acceleration 圖6 脫靶量隨轉(zhuǎn)向時間的變化曲線Fig.6 Relationship between miss distance and switch time 本文主要研究了2枚攔截彈同時攔截單個目標時在末段制導問題,主要結(jié)論為: (1)將2枚攔截彈同時攔截單個目標的問題建模為“非零和二對一微分對策模型”,并采用最優(yōu)控制及邊界型微分對策理論對模型進行求解; (2)攔截空間分解為4個相互交集為空集、且并集覆蓋整個攔截空間的子空間SP、SQ、SPQ和奇異區(qū),并根據(jù)納什平衡策略給出了考慮其他攔截彈存在的邊界型微分對策制導律; (3)當2枚攔截彈在初始時刻的零控脫靶量具有相反的符號時,對策空間存在一個較大的奇異區(qū); (4)仿真結(jié)果表明,采用2枚攔截彈進行攔截時,脫靶量對目標機動方向的轉(zhuǎn)變時間具有很好的魯棒性。1.2 對策模型
2 納什平衡策略
2.1 伴隨模型及求解
2.2 攔截空間及最優(yōu)策略
2.3 對策空間結(jié)構(gòu)
3 仿真研究
4 結(jié) 論