李新三,汪立新,丁邦平,閆循良,劉國(guó)輝,王明建
(1 第二炮兵工程大學(xué),西安 710025;2 第二炮兵工程大學(xué)士官職業(yè)技術(shù)教育學(xué)院,山東青州 262500)
?
基于G-MPSP算法的非線性制導(dǎo)律研究*
李新三1,汪立新1,丁邦平2,閆循良1,劉國(guó)輝2,王明建2
(1第二炮兵工程大學(xué),西安710025;2第二炮兵工程大學(xué)士官職業(yè)技術(shù)教育學(xué)院,山東青州262500)
摘要:針對(duì)帶有末端多約束的非線性制導(dǎo)問(wèn)題,運(yùn)用通用模型預(yù)測(cè)靜態(tài)規(guī)劃(G-MPSP)算法設(shè)計(jì)了一種快速求解連續(xù)時(shí)間系統(tǒng)具有終端落角約束的非線性最優(yōu)制導(dǎo)律。該算法通過(guò)向后迭代求解小維數(shù)權(quán)矩陣微分方程對(duì)控制量進(jìn)行更新,將動(dòng)態(tài)優(yōu)化問(wèn)題轉(zhuǎn)化為靜態(tài)優(yōu)化問(wèn)題,計(jì)算效率得以提高??紤]目標(biāo)以不同的方式機(jī)動(dòng),仿真結(jié)果表明,末端位移偏差小于1.0 m,末端角度約束偏差可控制在0.1°范圍內(nèi),該制導(dǎo)律能夠滿足脫靶量和末端角度雙重要求,法向過(guò)載在整個(gè)制導(dǎo)過(guò)程中變化平緩。
關(guān)鍵詞:制導(dǎo)律;角度約束;模型預(yù)測(cè)靜態(tài)規(guī)劃
0引言
運(yùn)用最優(yōu)控制理論設(shè)計(jì)對(duì)地攻擊導(dǎo)彈制導(dǎo)律具有許多優(yōu)點(diǎn),不僅可以考慮多種約束條件,同時(shí)還可以對(duì)給定的目標(biāo)函數(shù)進(jìn)行優(yōu)化[1],例如梯度法[2]、打靶法[3]等。但是這些傳統(tǒng)的優(yōu)化算法計(jì)算量大,只適用于離線軌跡優(yōu)化。LQR理論[4]通過(guò)求解代數(shù)黎卡提方程來(lái)獲得最優(yōu)控制量,但是LQR理論僅僅適用于線性時(shí)不變系統(tǒng)。目前,非線性最優(yōu)控制理論在導(dǎo)彈上在線應(yīng)用主要分為兩類方法:1)參考軌跡跟蹤法;2)預(yù)測(cè)-校正法。參考軌跡跟蹤法需要離線生成參考軌跡。預(yù)測(cè)-校正法首先利用猜測(cè)的初始控制量對(duì)末端狀態(tài)進(jìn)行預(yù)測(cè),然后利用末端狀態(tài)實(shí)際值與期望值的偏差對(duì)控制量進(jìn)行更新。偽譜法[5-6]是一種在計(jì)算效率方面有很好效果的預(yù)測(cè)-校正法,但是該方法需要謹(jǐn)慎選擇基底函數(shù)和配置極點(diǎn)。
借鑒模型預(yù)測(cè)控制方法(MPC)[4]思想,文中給出一種通用模型預(yù)測(cè)靜態(tài)規(guī)劃算法(G-MPSP)來(lái)快速求解具有末端約束的非線性制導(dǎo)問(wèn)題。G-MPSP算法將動(dòng)態(tài)規(guī)劃問(wèn)題轉(zhuǎn)化為靜態(tài)規(guī)劃問(wèn)題,拉格朗日乘子以顯式表達(dá)式形式給出。該算法受近幾年研究比較熱的MPSP[7-10]算法啟發(fā)很大,在歐拉積分條件下,兩種算法相互等價(jià),在文中將加以證明。仿真驗(yàn)證表明該制導(dǎo)方法能夠滿足末端角度和脫靶量的雙重要求,法向過(guò)載變化平緩,末端時(shí)刻不會(huì)突變。
1G-MPSP制導(dǎo)算法
采用如下形式的非線性系統(tǒng)狀態(tài)方程和輸出方程如下:
式中:X∈Rn為狀態(tài)量,U∈Rm為控制量,Y∈Rp為輸出量。文中給出的制導(dǎo)算法需要確定初始控制量,通過(guò)優(yōu)化的方法實(shí)現(xiàn)對(duì)當(dāng)前控制量U(t)的更新,確保末端時(shí)刻輸出量Yd(tf)滿足:Y(tf)→Yd(tf)。
末端時(shí)刻tf對(duì)應(yīng)的輸出量偏差可表示為:
(3)
G-MPSP制導(dǎo)算法通過(guò)對(duì)控制量進(jìn)行更新確保末端時(shí)刻輸出量偏差δY(X(tf))→0。下面將對(duì)G-MPSP制導(dǎo)算法進(jìn)行推導(dǎo)。
式(1)等號(hào)兩邊與權(quán)矩陣W(t)相乘,得:
(4)
式中:W(t)∈Rp×n,可以通過(guò)W(t)將系統(tǒng)狀態(tài)方程映射到輸出空間,減小系統(tǒng)動(dòng)力學(xué)方程的維數(shù),可以縮短運(yùn)算時(shí)間。
式(4)進(jìn)行積分運(yùn)算,得:
(5)
Y(X(tf))加到式(5)左右兩邊,得:
(6)
對(duì)式(6)最后一項(xiàng)進(jìn)行分步積分,得:
(7)
將式(7)代入式(6)得:
(8)
上式進(jìn)行變分運(yùn)算,得:
(9)
式(9)中,選取合適的W(t)可以使與δX(t)相關(guān)的系數(shù)項(xiàng)為零,得:
(10)
(11)
式(10)和式(11)為關(guān)于W(t)的微分方程和邊界條件,對(duì)式(10)反向積分運(yùn)算可以求解W(t)。
對(duì)于確定的初始條件,δX(t0)=0。結(jié)合式(10)和式(9),得:
(12)
式中:
(13)
其中,Bs(t)為控制量偏差δU(t)和輸出量偏差δY(X(tf))之間的靈敏矩陣,即式(12)建立了末端時(shí)刻tf對(duì)應(yīng)的輸出量偏差和t∈[t0,tf)時(shí)間歷程內(nèi)的控制量偏差之間的聯(lián)系。
性能指標(biāo)函數(shù)如下式:
(14)
式中:Up(t)代表更新前的控制量;δU(t)為控制量偏差。將末端約束考慮進(jìn)去,式(14)可以表示為:
(15)
式中:λ∈Rp為靜態(tài)拉格朗日乘子。式(15)進(jìn)行變分運(yùn)算,得:
(16)
t=tf
(17)
由式(16)得:
(18)
將式(18)代入式(17),得:
(19)
其中:
(20)
(21)
當(dāng)Aλ非奇異時(shí),由式(19)得:
(22)
式(22)可以求得靜態(tài)變量拉格朗日乘子λ。文中給出的制導(dǎo)算法避免求解時(shí)變協(xié)態(tài)變量的問(wèn)題,簡(jiǎn)化了計(jì)算。
將式(22)代入式(18),得:
(23)
由式(23)可得到更新后的控制量:
(24)
文中給出的制導(dǎo)算法通過(guò)將動(dòng)態(tài)優(yōu)化問(wèn)題轉(zhuǎn)化為維數(shù)更小的靜態(tài)優(yōu)化問(wèn)題進(jìn)行求解,只需要求解靜態(tài)拉格朗日乘子,這種處理方法使得優(yōu)化問(wèn)題的求解更簡(jiǎn)單。
基于歐拉近似處理,G-MPSP算法與MPSP算法是相互等價(jià)的[11]。與MPSP相比,G-MPSP不需要對(duì)運(yùn)動(dòng)方程進(jìn)行離散化處理。由于論文篇幅的限制,文中不予證明。
2基于G-MPSP的制導(dǎo)律設(shè)計(jì)
圖1為導(dǎo)彈與目標(biāo)運(yùn)動(dòng)示意圖,M為導(dǎo)彈,T為目標(biāo),導(dǎo)彈的速度為Vm,彈道傾角為γm,彈道偏角為ψm,導(dǎo)彈的位移分別為xm、ym、zm,導(dǎo)彈法向過(guò)載指令分別為az、ay,下標(biāo)f代表末端時(shí)刻導(dǎo)彈狀態(tài)量。假設(shè)目標(biāo)低速機(jī)動(dòng),要求導(dǎo)彈精確擊中目標(biāo),彈道偏角和傾角滿足ψm(tf)→ψmf,γm(tf)→γmf約束。
圖1 導(dǎo)彈目標(biāo)運(yùn)動(dòng)示意圖
狀態(tài)方程經(jīng)歸一化處理得:
(25)
其中:Xn=[Vmnγmnψmnxmnymnzmn]T為歸一化處理后的狀態(tài)量;Un=[aznayn]T為歸一化處理后的控制量;Tm為推力;Dm為阻力。
選擇輸出量:
(26)
式(25)對(duì)狀態(tài)量微分,得:
(27)
式(25)對(duì)控制量微分,得:
(28)
式(26)對(duì)末端時(shí)刻狀態(tài)量Xn(tf)微分,得:
(29)
G-MPSP算法制導(dǎo)律設(shè)計(jì)時(shí),需要對(duì)初始控制量進(jìn)行猜測(cè),文中運(yùn)用增廣比例制導(dǎo)對(duì)初始控制量進(jìn)行猜測(cè)。文獻(xiàn)[12]推導(dǎo)出的增廣比例制導(dǎo)(APN)方向加速度指令為:
(30)
(31)
G-MPSP制導(dǎo)律設(shè)計(jì)執(zhí)行流程如下:
1)選擇初始控制量,文中通過(guò)增廣比例導(dǎo)引律(APN)計(jì)算初始控制量,這一步將給出導(dǎo)彈的飛行時(shí)間tf[11]。
(2)求末端時(shí)刻輸出量偏差δY(tf)=Yd(tf)-Y(tf),Yd(tf)由目標(biāo)狀態(tài)和給定的導(dǎo)彈期望角度約束確定,如果偏差值滿足設(shè)計(jì)要求,程序結(jié)束;如果不滿足要求,執(zhí)行步驟3)。
3)對(duì)式(10)和式(11)進(jìn)行數(shù)值積分計(jì)算W(t),文中采用四階龍格庫(kù)塔方法。
4)由式(13)計(jì)算Bs(t)。
5)由式(20)和式(21)計(jì)算Aλ和bλ。
6)最后,由式(23)和式(24)計(jì)算δU(t)和U(t),令Up(t)=U(t),回到步驟1)進(jìn)行下一步迭代。
3數(shù)值仿真
仿真時(shí)考慮攻擊地面機(jī)動(dòng)目標(biāo)。導(dǎo)彈質(zhì)量:t≤6 s時(shí),mm=165 kg;t>6 s時(shí),mm=150 kg。導(dǎo)彈推力:t≤6 s時(shí),Tm=5 880 N;t>6 s時(shí),Tm=0 N。導(dǎo)彈參考面積Sm=0.032 4 m2。阻力Dm計(jì)算參考文獻(xiàn)[12]。導(dǎo)彈初始速度為635 m/s,初始位置為(10 000 m,5 000 m,5 000 m),初始彈道傾角和偏角為(0°,170°),末端時(shí)刻彈道傾角和偏角期望值為(-60°,250°)。目標(biāo)速度為20 m/s,初始位置為(1 000 m,0 m),初始航跡偏角為60°。歸一化速度、角度、位移和加速度分別取為600 m/s、50°、5000 m和9.81 m/s2,APN系數(shù)Ne=3,仿真步長(zhǎng)取為0.02 s。
仿真時(shí)分別考慮目標(biāo)的3種機(jī)動(dòng)方式:正弦機(jī)動(dòng),常值加速度機(jī)動(dòng)和零值加速度機(jī)動(dòng)。正弦機(jī)動(dòng)時(shí)目標(biāo)加速度為ayT=2gsin(ωt),機(jī)動(dòng)頻率w=1 rad/s;常值加速度機(jī)動(dòng)時(shí)目標(biāo)加速度ayT=g;零值加速度機(jī)動(dòng)目標(biāo)加速度ayT=0,ψT為常值。
圖2 不同機(jī)動(dòng)方式下的三維軌跡圖
仿真時(shí)經(jīng)過(guò)6次迭代即可滿足迭代終止條件。圖2給出了目標(biāo)以不同的方式機(jī)動(dòng)時(shí),導(dǎo)彈飛行的三維軌跡,圖3給出了導(dǎo)彈擊中目標(biāo)時(shí)三維軌跡放大圖。圖4和圖5給出了目標(biāo)以不同的方式機(jī)動(dòng)導(dǎo)彈飛行時(shí)彈道傾角γm和偏角ψm的變化曲線。表1給出了末端時(shí)刻導(dǎo)彈和目標(biāo)的輸出參數(shù),由仿真結(jié)果可知,末端時(shí)刻導(dǎo)彈飛行的彈道傾角γmf和偏角ψmf與給定的期望約束值之間的偏差在0.1°范圍內(nèi),位移參數(shù)(xmf,ymf,zmf)的偏差在1 m范圍內(nèi),即文中所提出的G-MPSP算法能較好的滿足末端約束要求。
圖3 擊中目標(biāo)時(shí)軌跡放大圖
圖4 彈道傾角γm變化曲線
圖5 導(dǎo)彈偏角ψm變化曲線
機(jī)動(dòng)方式xmf/mymf/mzmf/mxTf/myTf/mγmf/(°)ψmf/(°)正弦878.3278.30.0878.1278.3-60.0250.0常值924.722.30.0923.922.4-60.0250.1零值1197.8340.80.01196.8340.9-60.0250.1
圖6和圖7為目標(biāo)機(jī)動(dòng)時(shí),法向過(guò)載az和ay的變化曲線。與傳統(tǒng)的PN制導(dǎo)律相比,G-MPSP算法攻擊機(jī)動(dòng)目標(biāo)時(shí)終端時(shí)刻法向過(guò)載az和ay不會(huì)突變;在制導(dǎo)過(guò)程中,法向過(guò)載az和ay大小變化比較平緩。
圖6 法向過(guò)載az變化曲線
圖7 法向過(guò)載ay變化曲線
4結(jié)論
文中針對(duì)帶有末端角度約束的機(jī)動(dòng)目標(biāo)非線性制導(dǎo)問(wèn)題,設(shè)計(jì)了一種通用模型預(yù)測(cè)靜態(tài)規(guī)劃(G-MPSP)制導(dǎo)算法,推導(dǎo)了算法的制導(dǎo)原理。該算法避免了求解時(shí)變協(xié)態(tài)變量,具有在線應(yīng)用的潛力。設(shè)計(jì)數(shù)值仿真驗(yàn)證了該算法的有效性。下一步將考慮不同的初始控制量猜測(cè)方法對(duì)G-MPSP算法執(zhí)行效率的影響,并驗(yàn)證G-MPSP算法的實(shí)時(shí)性。
參考文獻(xiàn):
[1]BRYSON J A E, HO Y C. Applied optimal control [M]. New York: John Wiley & Sons, 1975.
[2]ROBERTS S M, SHIPMAN J S. Two-point boundary value
problems: Shooting methods [M]. New York: American Elsevier Publishing Company Inc, 1972.
[3]KIRK D E. Optimal control theory: an introduction [M]. NewJersey, USA: Prentice Hal, 1970.
[4]BETTS J T. Practical methods for optimal control using nonlinear programming [M]. Philadelphia: Society for Industrial and Applied Mathematics, 2001: 61-125.
[5]GONG Q, KANG W, ROSS I M. A pseudospectral method for the optimal control of constrained feedback linearizable systems [J]. IEEE Transactions on Automatic Control, 2006, 51(7): 1115-1129.
[6]GONG Q, FAHROO F, ROSS I M. Spectral algorithm for pseudospectral methods in optimal control [J]. Journal of Guidance, Control, and Dynamics, 2008, 31(3): 460-471.
[7]ROSSITER J A. Model based predictive control: A practical approach[R]. New York: CRC, 2003.
[8]PADHI R, KOTHARI M. Model predictive static programming: A computationally efficient technique for suboptimal control design [J]. International Journal of Innovative Computing, Information and Control, 2009, 5(2): 399-411.
[9]OZA H B, PADHI R. Impact-angle-constrained suboptimal model predictive static programming guidance of air-to-ground missiles [J]. Journal of Guidance, Control, and Dynamics, 2012, 35(1): 153-164.
[10]郭鵬飛, 佘浩平. 一種具有落角約束的非線性次優(yōu)制導(dǎo)律[C]∥第32屆中國(guó)控制工程會(huì)議, 2013.
[11]MAITY Arnab, OZA Harshal B, Radhakant Padhi. Generalized model predictive static programming and its application to 3D impact angle constrained guidance of air-to-surface missiles[C]∥ 2013 American Control Conference (ACC), 2013.
[12]IMADO F, KURODA T, TAHK M J. A new missile guidance algorithm against a maneuvering target[C]∥ Proceedings of the AIAA Guidance, Navigation, and Control Conference and Exhibit, 1998.
*收稿日期:2015-01-12
基金項(xiàng)目:國(guó)家自然科學(xué)基金(61203354)資助
作者簡(jiǎn)介:李新三(1982-),男,湖北廣水人,講師,博士,研究方向:飛行器制導(dǎo)與控制技術(shù)。
中圖分類號(hào):V444
文獻(xiàn)標(biāo)志碼:A
Nonlinear Guidance Law Research Based on G-MPSP Technique
LI Xinsan1,WANG Lixin1,DING Bangping2,YAN Xunliang1,LIU Guohui2,WANG Mingjian2
(1The Second Artillery Engineering University, Xi’an 710025, China; 2College of Sergeant Occupation Technology Education,The Second Artillery Engineering University, Shandong Qingzhou 262500, China)
Abstract:Generalized model predictive static programming (G-MPSP) technique was presented in this paper in continuous time framework for rapidly solving a class of nonlinear optimal control problems with hard multiple terminal constraints. A key feature of the technique is backward propagation of a small-dimensional weight matrix dynamics, using which the control history got updated. It leads to a static optimization problem and it is the reason for its high computational efficiency. Different maneuvering ground targets were considered in the simulation studies. Simulation results show that final miss distance is less than 1.0 m, terminal impact angle errors are less than 0.1°. Impact angle constraints are met in addition to achieving near zero miss distance and the variation in the lateral acceleration history is quite smooth throughout the engagement.
Keywords:guidance law; impact angle constraints; model predictive static programming