李寧波,雷虎民,譚詩利,朱 利,李 解
(1.空軍工程大學 防空反導學院,西安 710051;2.西北工業(yè)大學 電子信息學院,西安 710129)
?
基于虛擬域動態(tài)逆的空地反輻射導彈軌跡優(yōu)化
李寧波1,雷虎民1,譚詩利1,朱 利2,李 解1
(1.空軍工程大學 防空反導學院,西安 710051;2.西北工業(yè)大學 電子信息學院,西安 710129)
針對空地反輻射導彈抗雷達關(guān)機問題,基于虛擬域動態(tài)逆(IDVD)的方法設(shè)計了一種軌跡優(yōu)化算法?;趧討B(tài)逆的思想,通過虛擬弧長高次擬合導彈軌跡坐標,并將邊界條件以及狀態(tài)變量從時間域轉(zhuǎn)換到虛擬域,在虛擬域中求出邊界條件的導數(shù)。再根據(jù)直接法原理離散導彈軌跡,采用罰函數(shù)法處理性能指標,尋優(yōu)得到最優(yōu)軌跡。仿真結(jié)果表明,該方法能夠快速計算生成反輻射導彈軌跡,達到了即使雷達關(guān)機,也能準確命中目標的目的。該方法通過虛擬化軌跡長度能夠方便地求解邊界條件的高階導數(shù),簡化了計算過程,能夠快速生成參考彈道,且對參數(shù)初值不敏感。
反輻射導彈;抗雷達關(guān)機;軌跡優(yōu)化;虛擬域動態(tài)逆
反輻射導彈對地面雷達目標進行攻擊的過程中,通常需要通過被動雷達導引頭接收地面雷達的輻射信息,以此獲取信息提供給制導系統(tǒng),導引導彈飛向目標。地面雷達通常會根據(jù)作戰(zhàn)需求或者感知到威脅而采取永久關(guān)閉雷達或間歇關(guān)機來達到對抗反輻射導彈的目的[1-3]。所以,需要研究反輻射導彈的抗雷達關(guān)機問題,也就是在地面雷達目標采取關(guān)機措施的時候,如何保證導彈制導系統(tǒng)繼續(xù)輸出制導指令,導引導彈飛向目標,最終實現(xiàn)精確制導[4]。
軌跡優(yōu)化是以最優(yōu)化理論為基礎(chǔ),在最優(yōu)問題上衍生出來的一種導彈飛行軌跡規(guī)劃及生成的方法。根據(jù)最優(yōu)化理論,給定導彈的初始狀態(tài)和末端狀態(tài)以及制導過程中的約束,結(jié)合相應(yīng)的優(yōu)化算法,就可規(guī)劃出一條最優(yōu)的彈道。根據(jù)空地反輻射導彈抗雷達關(guān)機這一特殊需求,若針對地面雷達目標能夠事先規(guī)劃出一條符合某些指標的彈道,那么導彈只需跟蹤這條規(guī)劃好的彈道即可命中目標。即使目標雷達關(guān)機,也不會影響導彈的制導。針對反輻射導彈的特點,本文采用一種基于動態(tài)逆思想的直接法來處理軌跡優(yōu)化問題[5]。
1.1 導彈運動模型
空地反輻射導彈的狀態(tài)變量設(shè)置為Z(t)=(x1(t) x2(t) x3(t) v(t) θ(t) ψ(t))T∈Rn,系統(tǒng)狀態(tài)方程為[6]
(1)
式中:x1=x,x2=y,x3=z,(x,y,z)為導彈坐標;v,θ,ψ分別為導彈速度、彈道傾角和彈道偏角;nx,ny,nz分別為導彈過載在速度坐標系3個坐標軸上的分量。
1.2 最優(yōu)控制問題描述
最優(yōu)問題可以描述為給定一個系統(tǒng),通過數(shù)學手段,找到一組控制輸入序列,使得在這組控制輸入的作用下,系統(tǒng)的狀態(tài)轉(zhuǎn)移過程滿足設(shè)計期望,并且在某種程度上滿足給定的性能指標,使其最優(yōu)[7]。
系統(tǒng)狀態(tài)方程為
(2)
首先,描述該系統(tǒng)的狀態(tài)轉(zhuǎn)移,即系統(tǒng)狀態(tài)從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài),從初始時刻狀態(tài),經(jīng)過一定時間逐步轉(zhuǎn)移到末端時刻狀態(tài)。由初始狀態(tài)到末端狀態(tài)全部狀態(tài)的集合為系統(tǒng)的狀態(tài)序列。在最優(yōu)問題中,序列兩端的初始狀態(tài)和末端狀態(tài)所需要滿足的約束條件稱之為邊界條件,即
(3)
對系統(tǒng)狀態(tài)轉(zhuǎn)移過程中的狀態(tài)及其他參數(shù)的約束要求稱之為路徑約束,包括等式和不等式約束:
(4)
路徑約束中包含u(t),即控制變量。應(yīng)滿足的約束為
(5)
式中:U為m維控制變量空間中的一個閉點集;uL,uR分別為控制變量的上邊界和下邊界。
在不同的控制量的影響下,系統(tǒng)將出現(xiàn)不同的響應(yīng),其狀態(tài)軌跡Z(t)也不盡相同,性能指標就是用來衡量不同響應(yīng)優(yōu)劣程度的尺度。根據(jù)最優(yōu)問題優(yōu)化需求和方向的不同,性能指標的形式也會有相應(yīng)改變。一般采用Bolza型性能指標,即
(6)
式中:Φ為末值型性能指標,L為拉格朗日型性能指標。式(2)~式(6)即是對一般最優(yōu)控制問題的完整描述。
(7)
(8)
所假設(shè)的虛擬量τ為導彈在空間軌跡的虛擬弧長,其目的是在對目標函數(shù)進行優(yōu)化時,不會對導彈速度產(chǎn)生影響。其末端值τf是一個待優(yōu)化參數(shù)。
虛擬域與時間域的聯(lián)系通過虛擬視線角速度實現(xiàn):
(9)
通過上述關(guān)系可以建立虛擬域與時間域中邊界條件的聯(lián)系。
首先,令X=(x1x2x3)T,求取初始條件:
(10)
(11)
末端條件:
(12)
(13)
由邊界條件二階導數(shù)可知,彈道傾角和彈道偏角的初值和末值θ0、θf、ψ0、ψf將會是另外4個待優(yōu)化參數(shù)。
此時,就可以將邊界條由時間域轉(zhuǎn)化為虛擬域,轉(zhuǎn)換關(guān)系如下:
(14)
(15)
(16)
整理得:
(17)
(18)
則在邊界點處,有:
(19)
(20)
(21)
(22)
(23)
虛擬弧長的迭代公式為
τj=τj-1+Δτj=2,3,…,N
(24)
式中:下標j表示第j個節(jié)點。
依次求解彈道傾角和彈道偏角為
(25)
(26)
彈道傾角和彈道偏角的導數(shù)為
(27)
(28)
虛擬速度的導數(shù)為
(29)
則速度迭代公式為
(30)
時間間隔Δt和虛擬速度λj計算如下:
(31)
tj=tj-1+Δtj-1
(32)
(33)
控制量u=(nynz)計算如下:
(34)
(35)
當所有節(jié)點的狀態(tài)量和控制量都計算完成后,就可以計算性能指標PI和懲罰函數(shù)PF[8]。
PF表示為
(36)
PI可表示為
(37)
式中:w1,w2,w3為權(quán)值,且w1+w2+w3=1;k1,k2,k3為比例系數(shù),用于使性能指標在優(yōu)化時,各個組成部分粗略相等。該性能指標優(yōu)化的目的是使τf最小,tgo最小,vf最大。τf為虛擬弧長,其值與實際導彈軌跡弧長成比例,可直接反映實際導彈軌跡。因為初始點和終點固定,使τf最小,則導彈軌跡彎曲程度小,減少導彈在攔截過程中的機動,從而減少能量損耗。tgo為剩余攔截時間,其優(yōu)化目的是為了使攔截時間最短。vf為導彈末速度,使其最大化是為了保證末端彈目碰撞時的最大動能。
一般情況下,由于導彈推力曲線給定,并沒有對導彈末速度vf直接控制的指令,而tgo最小,就可以間接保證vf的最大化。所以,若不考慮末速,則性能指標PI可以寫成:
(38)
綜上所述,IDVD方法可以同時滿足以下制導要求:
①通過高次多項式對導彈參考軌跡的擬合,保證了傳統(tǒng)制導律對零脫靶量的要求。
③通過性能指標的設(shè)置使τf和tgo最小,并且保證末端速度vf最大。
④通過對優(yōu)化參數(shù)θf和ψf的調(diào)整,可直接約束導彈彈道末端角度,做到三維彈道成型。
該仿真的目的在于:通過導彈和目標的初始位置及其他邊界條件快速生成一條參考彈道,提供給導彈跟蹤飛行以完成制導。無論地面目標雷達是否關(guān)機,都可以精確制導。
仿真參數(shù)如下,導彈初始位置(0,12 000,0),目標初始位置(25 000,0,25 000),導彈初始速度v0=850 m/s,末端彈道傾角為-60°,彈道偏角約束為-30°,導彈過載限制為27。在MATLAB環(huán)境下,計算耗時14.677 s,其結(jié)果如圖1所示。
圖1 IDVD算法生成彈道圖
如圖1所示,實線表示用IDVD算法,通過邊界條件直接生成的導彈參考軌跡,該軌跡保證了脫靶量為0,并且約束了末端導彈攻擊角度。虛線是用優(yōu)化算法,針對性能指標優(yōu)化后的導彈參考軌跡,滿足末速度最大和時間最短的性能指標,并且同時滿足脫靶量和末端角度約束的要求。優(yōu)化后軌跡的速度、彈道角、過載如圖2和圖3所示。
圖2 導彈速度變化曲線
圖3 導彈彈道角變化曲線
由圖2、圖3可知,該軌跡可以滿足空地彈對末端攻擊角度約束的要求,導彈的彈道傾角和彈道偏角分別達到了預(yù)期的-60°和-30°。
由圖4可知,最大過載沒有超過所約束的27,除了一開始的幾秒,整個過程導彈都處于一個比較平滑的飛行軌跡上。
圖4 導彈過載變化曲線
本文考慮抗雷達關(guān)機問題關(guān)鍵的2個要點,即保證在地面雷達目標關(guān)機后制導系統(tǒng)能夠繼續(xù)輸出正確的制導指令,在地面雷達目標關(guān)機后導彈能夠繼續(xù)沿理想彈道飛向目標并精確制導?;谲壽E規(guī)劃的思想,結(jié)合反輻射導彈對地攻擊的任務(wù)特點,采用IDVD方法對導彈攻擊參考彈道進行預(yù)生成,達到了即使雷達關(guān)機,也能準確命中目標的目的。該方法通過虛擬化軌跡長度能夠方便地求解邊界條件的高階導數(shù),簡化了計算過程,能夠快速生成參考彈道,且對參數(shù)初值不敏感。
[1] 馮雨,卞樹檀,李站良.反輻射導彈及其發(fā)展趨勢[J].戰(zhàn)術(shù)導彈技術(shù),2005(4):1-3. FENG Yu,BIAN Shu-tan,LI Zhan-liang.Anti-radiation missile and it’s development tendency[J].Tactical Missile Technology,2005(4):1-3.(in Chinese)
[2]曲長文,陳鐵柱.機載反輻射導彈技術(shù)[M].北京:國防工業(yè)出版社,2010. QU Chang-wen,CHEN Tie-zhu.Guided aircraft anti-radiation missile technology[M].Beijing:National Defense Industry Press,2010.(in Chinese)
[3]司錫才,崔冬槐,司偉建.反輻射導彈對抗低截獲概率雷達和誘餌技術(shù)[J].系統(tǒng)工程與電子技術(shù),2005,27(9):1 549-1 552. SI Xi-cai,CUI Dong-huai,SI Jian-wei.Technology of ARM contradict LIP radar and bait[J].Systems Engineering and Electronics,2005,27(9):1 549-1 552.(in Chinese)
[4]LOFFLER T,NIELSON J.International HARM precision navigation upgrade a GPS/INS missile upgrade that improves effectiveness and minimizes friendly-fire accidents[J].IEEE AESS Systems Magazine,2003,18(5):26-31.
[5]YAKIMENKO O A.Direct method for rapid prototyping of near-optimal aircraft trajectories[J].Journal of Guidance,Control,and Dynamics,2000,23(5):865-875.
[6]ZARCHAN P.Tactical and strategic missile guidance[M].America:American Institute of Aeronautics and Astronautics,2012.
[7]胡壽松,王執(zhí)銓,胡維禮.最優(yōu)控制理論與系統(tǒng)[M].北京:科學出版社,2010. HU Shou-song,WANG Zhi-quan,HU Wei-li.Optimal control theory and system[M].Beijing:Science Press,2010.(in Chinese)
[8]唐國金,羅亞中,雍恩米.航天器軌跡優(yōu)化理論、方法及應(yīng)用[M].北京:科學出版社,2011. TANG Guo-jin,LUO Ya-zhong,YONG En-mi.Theory,method and application of spacecraft trajectory optimization[M].Beijing:Science Press,2011.(in Chinese)
Trajectory Optimization for Air-to-ground ARM Based on Inverse Dynamics in the Virtual Domain
LI Ning-bo1,LEI Hu-min1,TAN Shi-li1,ZHU Li2,LI Jie1
(1.Air and Missile Defense College,Air Force Engineering University,Xi’an 710043,China; 2.School of Electronics and Information,Northwestern Polytechnical University,Xi’an 710129,China)
Aiming at the countermeasure against radar switching-off of anti-radiation missile,a trajectory optimization algorithm was designed based on the method of inverse dynamics in virtual domain(IDVD).Based on the inverse dynamics principle,the position of missile was fitted by virtual arc,and the boundary conditions and state variables were transformed from time domain to virtual domain.The derivatives of boundary conditions were derived in virtual domain.The trajectory was discretized according to the direct method,and the performance indexes were set by penalty function to obtain the optimal trajectory.The simulation results show that the trajectory of anti-radiation missile generates rapidly by using this method.The purpose of hitting the target precisely with the radar of target switching-off was realized.This method can solve the high order derivatives of boundary conditions conveniently by virtualizing the length of trajectory,which simplifies the calculation process,and the reference trajectory can generate rapidly,and it is also insensitive to the initial value of parameters.
anti-radiation missile;countermeasure against radar switching-off;trajectory optimization;inverse dynamics in the virtual domain
2016-07-21
國家自然科學基金項目(61573374,61503408);航空科學基金項目(20150196006)
李寧波(1992- ),男,碩士研究生,研究方向為空天攔截器導航、制導與控制。E-mail:lnb_las@163.com。
TJ303.4
A
1004-499X(2016)04-0007-05