摘 要:針對過載受限和自動駕駛儀延遲等條件下的非線性最優(yōu)末制導(dǎo)指令在線生成方法進行研究。 首先, 基于龐特里亞金極大值原理, 建立了目標(biāo)靜止的非線性最優(yōu)末制導(dǎo)問題的最優(yōu)性條件, 并利用飽和函數(shù)將過載約束嵌入最優(yōu)性條件。 其次, 應(yīng)用參數(shù)化方法使得通過數(shù)值積分即可快速生成滿足最優(yōu)性條件的飛行軌跡數(shù)據(jù)集。 然后, 利用該數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò), 使其擬合彈-目相對運動狀態(tài)到最優(yōu)制導(dǎo)指令的映射關(guān)系, 實現(xiàn)過載約束下制導(dǎo)指令的毫秒量級在線生成。 針對自動駕駛儀的延遲響應(yīng), 通過微分補償法估計神經(jīng)網(wǎng)絡(luò)下一時刻輸出的制導(dǎo)指令以實現(xiàn)快速跟蹤。 最后, 仿真結(jié)果表明, 本文所提出方法針對靜止目標(biāo)與小機動目標(biāo)都能夠在線生成最優(yōu)制導(dǎo)指令。
關(guān)鍵詞:過載約束; 自動駕駛儀延遲; 非線性最優(yōu)末制導(dǎo); 參數(shù)化方法; 神經(jīng)網(wǎng)絡(luò)
中圖分類號: TJ765; V448.2
文獻標(biāo)識碼: A
文章編號:1673-5048(2024)04-0064-08
DOI: 10.12132/ISSN.1673-5048.2023.0250
0 引 言
在精確制導(dǎo)打擊中, 零脫靶量不再是評估制導(dǎo)律性能的唯一指標(biāo)[1]。 新型作戰(zhàn)任務(wù)對導(dǎo)彈提出了更高的要求, 如滿足過載約束、 滿足落角約束、 考慮自動駕駛儀延遲、 優(yōu)化能量消耗等。 然而, 傳統(tǒng)的基于線性化方法推導(dǎo)的制導(dǎo)律[2]在一定程度上會破壞約束或損失最優(yōu)性[3], 影響導(dǎo)彈充分發(fā)揮打擊能力。 因此, 研究如何在滿足各種約束條件下在線求解非線性最優(yōu)制導(dǎo)問題(Nonlinear Optimal Guidance, NOG)具有重要意義。
目前, 在求解NOG問題時, 通常采用半解析法、 直接法和間接法等。 半解析法的主要思路是通過各種近似或假設(shè)將問題進行簡化處理, 從而得到解析解或半解析解。 文獻[4]基于線性二次最優(yōu)控制理論, 針對具有時變加速度和高階自動駕駛儀動力學(xué)約束的導(dǎo)彈, 設(shè)計了滿足落角約束的次優(yōu)制導(dǎo)律。 文獻[5]對打擊靜止目標(biāo)的NOG問題進行參數(shù)化處理, 將問題簡化為求實值函數(shù)零點的問題。 由于設(shè)計了實值函數(shù)的半解析形式, 并限制了其零點的區(qū)間, 因此使用暴力搜索便可找到所有零點, 從而快速得到非線性最優(yōu)制導(dǎo)律。 文獻[6]基于小角度假設(shè)建立了線性化的彈-目相對運動學(xué)方程, 應(yīng)用Schwarz不等式, 針對帶落角約束的一般加權(quán)函數(shù)形式的最優(yōu)制導(dǎo)律進行研究, 得到最優(yōu)制導(dǎo)律的一般表達式。
雖然將問題簡化處理有可能得到解析/半解析形式的制導(dǎo)指令, 滿足在線生成制導(dǎo)指令的需求, 但這種處理方式只適用于一些特殊場景, 且非線性特征的缺失會損失一定的最優(yōu)性。 比較而言, 直接法[7-8]和間接法[9-10]直接對NOG相關(guān)的最優(yōu)控制問題進行求解, 得到最優(yōu)制導(dǎo)指令。 但是, 在高度非線性條件下, 直接法和間接法存在收斂時間長, 甚至不收斂的問題, 難以滿足在線生成制導(dǎo)指令的需求[11]。
為解決上述問題, Chen[12]提出一種哈密爾頓軌跡參數(shù)化方法, 通過對最優(yōu)控制問題的解空間進行參數(shù)化表征, 將最優(yōu)性條件嵌入一組微分方程, 使得利用簡單數(shù)值積分即可生成滿足最優(yōu)性條件的飛行軌跡。 Wang等[13]利用文獻[12]中的參數(shù)化方法, 研究了具有攻擊時間約束的NOG問題, 實現(xiàn)了時間約束下非線性最優(yōu)制導(dǎo)指令毫秒量級在線生成。 文獻[14]進一步圍繞過載、 攻擊時間等約束條件下的非線性最優(yōu)制導(dǎo)指令在線生成問題進行研究。 文獻[15]直接利用文獻[13]中提出的參數(shù)化方法研究了縱向平面內(nèi)考慮落角約束的NOG問題。
上述文獻在使用參數(shù)化方法解決NOG問題時, 均未考慮自動駕駛儀延遲。 導(dǎo)彈的制導(dǎo)控制系統(tǒng)如圖1所示。 實際上, 在導(dǎo)彈執(zhí)行機構(gòu)工作過程中, 制導(dǎo)系統(tǒng)與控制系統(tǒng)之間存在響應(yīng)延遲, 該延遲特性會影響導(dǎo)彈性能。 文獻[16]利用H∞控制理論, 設(shè)計了考慮導(dǎo)彈自動駕駛儀動態(tài)特性的H∞魯棒制導(dǎo)律。 文獻[17-18]在分析導(dǎo)彈自動駕駛儀動態(tài)特性的基礎(chǔ)上, 將其近似為一階慣性環(huán)節(jié), 設(shè)計了自適應(yīng)滑模制導(dǎo)律。 文獻[19]將導(dǎo)彈自動駕駛儀動態(tài)特性視為一階慣性環(huán)節(jié), 并將目標(biāo)加速度視為外界干擾, 基于自抗擾理論設(shè)計了自抗擾制導(dǎo)律。 文獻[20-21]基于觀測器和滑模控制理論, 設(shè)計了考慮導(dǎo)彈一階動態(tài)延遲特性的制導(dǎo)律, 同時能夠以期望的角度攻擊目標(biāo)。 文獻[22-23]在考慮角度約束和通訊延遲等情況下, 設(shè)計了飽和制導(dǎo)律和控制器。
除了響應(yīng)延遲外, 導(dǎo)彈還存在過載受限的問題。 若只是簡單地通過控制器對過載指令進行限幅, 必然會損失一定的最優(yōu)性, 甚至還可能導(dǎo)致系統(tǒng)不穩(wěn)定[24]。 所以, 在研究制導(dǎo)方法時, 加入過載約束才能夠更好地發(fā)揮導(dǎo)彈的性能。 目前, 針對過載約束下的制導(dǎo)律進行了廣泛研究。 Rusnak等[25-27]針對線性、 時不變的導(dǎo)彈模型, 以零脫靶量和控制能量最優(yōu)為性能指標(biāo), 在加速度受限條件下推導(dǎo)了最優(yōu)制導(dǎo)律的顯式解。 文獻[28]以彈-目相對距離和視線角速率為主要狀態(tài)變量, 采用指令濾波 backstepping 方法設(shè)計了一種過載約束下的導(dǎo)引律。 Hexner等[29]在考慮導(dǎo)彈加速度約束和制導(dǎo)增益最大值約束等情況下, 使用線性二次隨機高斯最優(yōu)控制理論和隨機輸入描述函數(shù)(Random-Input Describing Function, RIDF)得到最優(yōu)制導(dǎo)律。
雖然上述文獻考慮了過載約束和自動駕駛儀延遲等問題, 但基本上是采用線性化或者簡化的處理方法。 本文在同時考慮過載約束與自動駕駛儀延遲的情況下, 完全基于非線性模型研究了最優(yōu)末制導(dǎo)指令在線生成方法。 首先, 基于目標(biāo)靜止的導(dǎo)彈非線性模型, 利用龐特里亞金極大值原理(Pontryagin’s Maximum Principle, PMP)建立了NOG問題的最優(yōu)性條件, 并利用飽和函數(shù)將過載約束嵌入最優(yōu)性條件。 其次, 通過參數(shù)化方法[12]生成滿足最優(yōu)性條件的飛行軌跡簇, 構(gòu)建彈-目相對運動狀態(tài)到最優(yōu)制導(dǎo)指令映射關(guān)系的數(shù)據(jù)集。 然后, 利用該數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò), 使其擬合上述映射關(guān)系, 保證神經(jīng)網(wǎng)絡(luò)能夠毫秒量級在線生成最優(yōu)制導(dǎo)指令。 最后, 針對自動駕駛儀延遲問題, 通過微分補償方法對神經(jīng)網(wǎng)絡(luò)下一時刻輸出的最優(yōu)制導(dǎo)指令進行估計, 從而實現(xiàn)快速跟蹤。 值得注意的是, 本文所提方法能夠?qū)崟r更新狀態(tài)信息, 并將彈-目相對運動狀態(tài)作為神經(jīng)網(wǎng)絡(luò)的輸入在線生成制導(dǎo)指令。 因此, 該方法同樣適用于攔截小機動目標(biāo)的場景, 并且無需事先得到目標(biāo)的加速度信息。 針對靜止目標(biāo)和小機動目標(biāo), 分別采用本文所提方法與線性化方法進行仿真對比, 驗證了所提方法的有效性。
1 數(shù)學(xué)模型
1.1 導(dǎo)彈的運動模型
在二維平面內(nèi), 彈-目相對運動的幾何關(guān)系如圖2所示。 其中, OXY為慣性坐標(biāo)系。 為便于分析且不失一般性, 將目標(biāo)位置作為坐標(biāo)系原點。 M表示導(dǎo)彈; V, a, θ分別表示導(dǎo)彈的速度、 法向加速度、 速度方向角; λ∈[0, 2π]表示彈-目視線角; σ∈[-π, π]表示前置角; r表示彈-目相對距離。
用(x, y)表示導(dǎo)彈在慣性坐標(biāo)系中的位置, 根據(jù)圖2有如下關(guān)系式:
r=x2+y2
λ=arctanyx
σ=λ-θ(1)
假設(shè)導(dǎo)彈在末制導(dǎo)過程中常速運動, 其非線性運動學(xué)模型可以表示為
x·(t)=Vcosθ(t)
y·(t)=Vsinθ(t)
θ·(t)=a(t)V(2)
式中: t為時間; 上標(biāo)“·”表示關(guān)于時間的導(dǎo)數(shù)。
過載n與法向加速度a之間滿足:
n=ag(3)
式中: g為重力加速度常數(shù)。 假設(shè)過載上限為nmax, 則法向加速度上限amax=g·nmax。 因此, 法向加速度約束為
a≤amax(4)
針對自動駕駛儀跟蹤制導(dǎo)指令時存在響應(yīng)延遲的問題, 采用一階慣性環(huán)節(jié)來近似自動駕駛儀的動力學(xué)模型:
a·(t)=u(t)-a(t)τ(5)
式中: τ為導(dǎo)彈自動駕駛儀動態(tài)延遲的時間常數(shù); u為制導(dǎo)環(huán)節(jié)輸出的加速度指令, 如圖1所示。
1.2 最優(yōu)制導(dǎo)問題描述
根據(jù)文獻[5], 自由時間下控制效率最優(yōu)的制導(dǎo)律無解。 因此, 選擇將控制效率與攻擊時間的權(quán)重相加作為性能指標(biāo), 即
J=∫tft0κ+12(1-κ)a2dt(6)
式中: t0為初始時刻; tf為自由的終端時刻; κ∈[0, 1]為權(quán)重常數(shù)。
導(dǎo)彈的初始條件可以表示為
x(t0)=x0
y(t0)=y0
θ(t0)=θ0(7)
為滿足零脫靶量要求, 導(dǎo)彈最終應(yīng)到達目標(biāo)所在位置, 即
x(tf)=xT
y(tf)=yT(8)
在定義坐標(biāo)系時, 將目標(biāo)位置作為坐標(biāo)系原點, 因此有(xT, yT)=(0, 0)。
綜上, 當(dāng)前的NOG問題可以描述為, 在滿足狀態(tài)約束式(2)、 法向加速度約束式(4)及邊界條件式(7)~(8)下, 求解使得性能指標(biāo)J最小的法向加速度a。
2 最優(yōu)性條件
將法向加速度a作為控制量, 上述最優(yōu)控制問題的Hamiltonian函數(shù)可以表示為
H=pxVcosθ+pyVsinθ+pθaV-κ+12(1-κ)a2(9)
式中: p=[px, py, pθ]T為z=[x, y, θ]T對應(yīng)的伴隨狀態(tài)。 根據(jù)PMP, 有
z·=Hp
p·=-Hz(10)
其中, p·=-Hz可展開為
p·x=-Hx=0
p·y=-Hy=0
p·θ=-Hθ=pxVsinθ-pyVcosθ(11)
由于θ(tf)是自由的, 有如下橫截條件:
pθ(tf)=0(12)
通過式(11)中前兩個等式可知, px和py為常數(shù)。 考慮終端約束式(8)及橫截條件式(12), 對式(11)中第3個等式積分可得
pθ(t)=pxy(t)-pyx(t)(13)
由于終端時間tf自由, 且Hamiltonian函數(shù)不顯含t, 有
H≡0(14)
根據(jù)PMP, 當(dāng)不考慮輸入約束時, 存在最優(yōu)控制a(t)滿足Ha=0, 即
a(t)=pθ(t)V(1-κ)(15)
然而, 由于存在過載約束, 考慮法向加速度上限的最優(yōu)控制a(t)為
a(t)=satpθ(t)V(1-κ), amax, -amax(16)
式中: sat(·)表示飽和函數(shù), 定義為
sat(i, α, β)=α i>αi α≤i≤ββ i<β (17)
式中: i為飽和函數(shù)的輸入; α為輸入的上限; β為輸入的下限。 式(17)可改寫為如下形式:
sat(i, α, β)=12(i-β)2-(i-α)2+α+β(18)
式(18)與式(17)的分段函數(shù)完全相同。 為解決其在i=α和i=β處不可導(dǎo)的問題, 根據(jù)文獻[30], 采用如下公式進行修正:
sat(i, α, β, δ)=12((i-α)2+δ-
(i-β)2+δ+α+β)(19)
式中: δ為保證飽和函數(shù)在i=α和i=β處可導(dǎo)的參數(shù)。 參數(shù)δ的取值不同, 修正后的飽和函數(shù)式(19)對式(18)的近似精度不同[31]。
利用飽和函數(shù)將過載約束嵌入最優(yōu)性條件后, 最優(yōu)制導(dǎo)指令可以表示為
a(t, δ)=satpθ(t)V(1-κ), amax, -amax, δ(20)
式中: δ>0越小, 式(20)越逼近式(16)。
得到上述一階必要條件后, 仍然無法保證軌跡的最優(yōu)性[32], 還需要建立附加的最優(yōu)性條件。 根據(jù)文獻[13], 對于任意一條滿足一階必要條件的軌跡, 若在某一時刻t-, 速度方向與彈-目視線共線, 則其不再滿足最優(yōu)性。 因此, 飛行軌跡必須滿足以下附加最優(yōu)性條件:
x(t-)cosθ(t-)+y(t-)sinθ(t-)
x(t-)2+y(t-)2≠1(21)
本文將滿足一階必要條件及附加最優(yōu)性條件的軌跡稱為最優(yōu)軌跡。
3 最優(yōu)末制導(dǎo)指令在線生成方法
基于上述最優(yōu)性條件, 先利用參數(shù)化方法離線生成飛行狀態(tài)到最優(yōu)制導(dǎo)指令映射關(guān)系的數(shù)據(jù)集, 然后利用該數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò)擬合上述映射關(guān)系, 最終通過神經(jīng)網(wǎng)絡(luò)實現(xiàn)最優(yōu)制導(dǎo)指令的在線生成。
為便于后續(xù)分析, 參考文獻[13]定義如下參數(shù)化微分方程組:
X·(t)=-VcosΘ(t)
Y·(t)=-VsinΘ(t)
Θ·(t)=-A(t)V(22)
式中: (X, Y)∈R2, Θ∈[0, 2π]。 最優(yōu)制導(dǎo)指令A(yù)(t)表示為
A(t)=satpxY(t)-pyX(t)V(1-κ), amax, -amax, δ
令X(t)和Y(t)的初值為
X(0)=0
Y(0)=0(23)
令Θ(t)的初值滿足如下方程:
pxVcosΘ(0)+pyVsinΘ(0)-κ=0(24)
定義參數(shù)向量q為
q=[px, py](25)
根據(jù)式(23)~(25)可知, 式(22)的解由參數(shù)[t, q]確定。 為了便于分析, 將(X(t, q), Y(t, q), Θ(t, q))表示為參數(shù)化微分方程組(22)的解, 且初始條件滿足式(23)~(24)。
根據(jù)文獻[13]可知, 對于任意參數(shù)向量q, 參數(shù)化軌跡(X(t, q), Y(t, q), Θ(t, q))滿足第2節(jié)中的所有必要性條件和終端條件。 因此, 在式(23)~(24)定義的初始條件下對式(22)進行數(shù)值積分, 同時考慮式(21)的附加最優(yōu)性條件, 即可得到一條最優(yōu)軌跡。 通過在二維空間內(nèi)遍歷參數(shù)q, 可以獲得大量最優(yōu)軌跡。 將每條軌跡進行離散處理, 能夠得到包含飛行狀態(tài)到最優(yōu)制導(dǎo)指令映射關(guān)系的數(shù)據(jù)集。
值得注意的是, 上文是基于慣性坐標(biāo)系中導(dǎo)彈攻擊靜止目標(biāo)的運動學(xué)模型得到的最優(yōu)制導(dǎo)指令, 為了使本文提出的制導(dǎo)策略能夠更靈活準(zhǔn)確地應(yīng)用于攔截機動目標(biāo)的任務(wù)場景中, 可以將慣性坐標(biāo)系下的導(dǎo)彈運動參數(shù)轉(zhuǎn)換為彈-目相對運動參數(shù)。 根據(jù)彈-目相對運動參數(shù)生成最優(yōu)制導(dǎo)指令, 從而實現(xiàn)對機動目標(biāo)的精準(zhǔn)攔截。
彈-目相對運動參數(shù)也可以用參數(shù)化形式表征, 定義如下參數(shù)化微分方程組:
R·(t, q)=VcosΩ(t, q)
Λ·(t, q)=-VsinΩ(t, q)R(t, q)
Θ·(t, q)=-A(t, q)V(26)
式中: R(t, q), Ω(t, q), Θ(t, q)分別為參數(shù)化形式的彈-目相對運動距離、 前置角以及速度方向角。 具體表達式如下:
R(t, q)=X2(t, q)+Y2(t, q)Ω(t, q)=Λ(t, q)-Θ(t, q)(27)
因此, 式(26)可以表示為
R·(t, q)=VcosΩ(t, q)
Ω·(t, q)=-VsinΩ(t, q)R(t, q)+A(t, q)V(28)
對于R(t, q)>0, 式(28)與式(22)等價。 因此, 最優(yōu)制導(dǎo)指令A(yù)(t, q)既可以由慣性坐標(biāo)系下的導(dǎo)彈運動參數(shù)X(t, q), Y(t, q), Θ(t, q)決定, 也可以由彈-目相對運動參數(shù)R(t, q), Ω(t, q)決定。
定義飛行狀態(tài)R(t, q), Ω(t, q)到最優(yōu)制導(dǎo)指令A(yù)(t, q)的映射關(guān)系為
f:(R, Ω)→A(29)
根據(jù)通用近似性原理[33], 可以利用上述數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò), 使其擬合映射關(guān)系f, 最終通過神經(jīng)網(wǎng)絡(luò)實現(xiàn)最優(yōu)制導(dǎo)指令的毫秒量級在線生成。
4 考慮自動駕駛儀延遲的最優(yōu)制導(dǎo)律
在導(dǎo)彈執(zhí)行機構(gòu)工作過程中, 制導(dǎo)回路生成的加速度指令是通過自動駕駛儀跟蹤的。 因此, 相比于加速度指令, 實際加速度總是會存在一定的響應(yīng)延遲。 常采用一階慣性環(huán)節(jié)來近似自動駕駛儀的動態(tài)特性, 如式(5)所示。
第3節(jié)在建立飛行狀態(tài)到最優(yōu)制導(dǎo)指令映射關(guān)系時, 未考慮自動駕駛儀的響應(yīng)延遲。 因此, 若將神經(jīng)網(wǎng)絡(luò)得到的法向加速度直接作為指令u代入式(5), 會導(dǎo)致實際加速度無法快速跟蹤制導(dǎo)回路給出的最優(yōu)加速度, 從而降低制導(dǎo)性能。 為解決該問題, 本文提出了一種微分補償方法, 將式(5)改進為
a·=(uτ-a)/τ(30)
式中: uτ為考慮了自動駕駛儀延遲的指令加速度。
關(guān)于uτ的具體描述如下:
假設(shè)由于存在響應(yīng)時間τ, tk時刻的實際加速度ak與當(dāng)前狀態(tài)下的最優(yōu)加速度uk不等, 且差值為εk, 即
ak=uk+εk(31)
為實現(xiàn)快速跟蹤, 在tk+1時刻, 期望實際加速度ak+1等于最優(yōu)加速度uk+1, 即
ak+1=uk+1(32)
根據(jù)歐拉積分公式, ak+1與uk+1可以表示為
ak+1=ak+ha·k=ak+huτk-akτ(33)
uk+1=uk+hu·k(34)
式中: h為積分步長。 將式(33)~(34)代入式(32)可得
uτk=ak+τu·k-τh(ak-uk)(35)
式中: u·k為當(dāng)前時刻的最優(yōu)加速度uk的導(dǎo)數(shù), 可以通過對神經(jīng)網(wǎng)絡(luò)生成的指令進行差分得到。 顯然, 指令加速度uτk不僅與uk相關(guān), 也與u·k相關(guān)。 正因為u·k的存在, 能夠提前對uk+1進行預(yù)測, 從而使實際加速度能夠快速跟蹤最優(yōu)加速度, 提高制導(dǎo)性能。
5 數(shù)值仿真與分析
分別針對靜止目標(biāo)與機動目標(biāo)進行數(shù)值仿真, 從而驗證本文提出的NOG方法在過載受限和自動駕駛儀響應(yīng)延遲條件下的有效性。
5.1 不同制導(dǎo)方法攻擊靜止目標(biāo)的仿真對比
20 世紀(jì)60年代, Rishel[34]從最優(yōu)控制角度證明, 針對非機動目標(biāo), 比例導(dǎo)引律 (Proportional Navigation Guidance, PNG) 是理想系統(tǒng)下的最優(yōu)制導(dǎo)律。 Lu等[35]進一步證明, 當(dāng)不存在落角約束時, 導(dǎo)引系數(shù)N=3的PNG近似等效于橫向加速度下二次性能指標(biāo)最小的最優(yōu)制導(dǎo)律。 因此, 分別采用導(dǎo)引系數(shù)N=3的PNG和本文提出的NOG方法在不同的初始前置角下攻擊靜止目標(biāo)。
假設(shè)靜止目標(biāo)位于原點, 即xT(0)=0 m, yT(0)=0 m。 導(dǎo)彈在初始時刻的位置為x(0)=-3 000 m, y(0)=-4 000 m, 速度V=300 m/s, 法向加速度上限amax=5g。
圖3(a)為導(dǎo)彈在不同初始前置角下的飛行軌跡。 可以看出, 當(dāng)初始前置角的絕對值較小時, 采用兩種方法得到的飛行軌跡相近。 但是隨著初始前置角絕對值的增大, 兩種方法生成的軌跡差異越來越明顯。 因此, 分別給出初始前置角為-87°和-107°的加速度指令、 前置角以及彈-目相對距離變化曲線, 如圖3(b)~(d)所示。
觀察圖3(a)中導(dǎo)彈的飛行軌跡可以看出, 在不同的初始前置角下, 兩種制導(dǎo)方法都能夠成功打擊靜止目標(biāo), 滿足終端脫靶量要求。 然而, 如圖3(b)所示, 當(dāng)導(dǎo)彈的初始前置角較大時, PNG在初始階段的加速度指令會達到上限, 需要對其進行限幅處理, 這將在一定程度上損失最優(yōu)性。 相比較而言, 由于加入了過載約束, NOG的加速度指令不會達到飽和, 變化曲線更加平滑。
導(dǎo)彈在飛行過程中, 所消耗的控制能量通常表示為
J=∫tf012u(t)2dt
根據(jù)仿真計算可得, 當(dāng)σ(0)=-87°時, PNG和NOG的控制能量消耗分別為1.36×104 m2/s3和1.28×104 m2/s3; 當(dāng)σ(0)=-107°時, PNG和NOG的控制能量消耗分別為1.71×104 m2/s3和1.60×104 m2/s3。 顯然, 當(dāng)初始前置角較大時, 相比于傳統(tǒng)的PNG方法, NOG通過引入過載約束, 可以在滿足脫靶量要求的同時, 實現(xiàn)更小的能量消耗, 性能更優(yōu)。
5.2 不同制導(dǎo)方法攔截機動目標(biāo)的仿真對比
一般來說, 當(dāng)針對機動目標(biāo)時, PNG不再具有最優(yōu)性。 而增強型比例導(dǎo)引(Augmented PNG, APNG)是一種針對機動目標(biāo)的擴展型比例導(dǎo)引律, 其中增加了考慮機動目標(biāo)的額外項。 APNG被證明可以在最小化能量消耗的同時, 消除目標(biāo)機動對終端脫靶量的影響[36]。 文獻[37]利用Schwartz不等式, 證明了基于垂直于彈-目視線的目標(biāo)加速度保持不變這一假設(shè)條件, APNG為線性化運動模型下最小化控制能量消耗的最優(yōu)解。
根據(jù)第3節(jié)可知, 本文提出的NOG方法能夠?qū)崟r更新的彈-目相對運動狀態(tài)輸入到神經(jīng)網(wǎng)絡(luò), 從而在線生成制導(dǎo)指令。 因此針對小機動目標(biāo)時, NOG方法仍然適用。 下面分別采用APNG與NOG方法在相同的初始條件下攔截機動目標(biāo)。 其中, APNG的制導(dǎo)指令表達式參考文獻[38]中式(48)。
假設(shè)導(dǎo)彈的初始位置為x(0)=-4 000 m, y(0)=-3 000 m, 速度V=500 m/s, 初始速度方向角θ(0)=120°。 目標(biāo)的初始位置為xT(0)=0 m, yT(0)=0 m, 速度VT=60 m/s, 初始速度方向角θT(0)=0°。 此時導(dǎo)彈的初始前置角σ(0)=-83°。 假設(shè)目標(biāo)作正弦機動, 加速度為aT=-15sinπ12t+π12; 導(dǎo)彈的法向加速度上限amax=15g; 自動駕駛儀的響應(yīng)時間τ=0.4 s。
圖4(a)~(d)分別為導(dǎo)彈和目標(biāo)的飛行軌跡、 導(dǎo)彈的加速度指令、 前置角以及彈-目相對距離的變化曲線。
由圖4(a)可以看出, 導(dǎo)彈采用兩種方法都能夠成功攔截機動目標(biāo)。 然而, 在初始階段導(dǎo)彈的前置角較大時, APNG的加速度指令會達到上限。 正如5.1節(jié)所述, 對其
進行限幅處理必然會損失一定的最優(yōu)性。 此外, 當(dāng)導(dǎo)彈接近機動目標(biāo)時, 彈-目相對運動狀態(tài)變化迅速, APNG未考慮自動駕駛儀延遲, 因此在攔截末段的加速度指令迅速達到飽和。 相較而言, 由于NOG中考慮了自動駕駛儀延遲, 其在接近機動目標(biāo)時, 加速度指令明顯較小。
根據(jù)仿真結(jié)果可知, 當(dāng)前場景下采用APNG的能量消耗為7.14×104 m2/s3, 采用NOG的能量消耗為6.63×104 m2/s3。 顯然, 在攔截過程中, NOG可以實現(xiàn)更小的能量消耗, 性能更優(yōu)。
值得注意的是, 根據(jù)文獻[38]中關(guān)于APNG的描述可知, APNG要求已知目標(biāo)的加速度信息, 但這通常難以直接獲得。 相較而言, 本文提出的NOG方法只需要得到彈-目相對運動信息, 即可在線生成制導(dǎo)指令。 此外, 若在某一時刻t~, 導(dǎo)彈的速度方向垂直于彈-目視線, 即|σ(t~)|=90°, APNG可能無解。 換言之, 若導(dǎo)彈的初始前置角|σ(0)|>90°, APNG可能無法攔截機動目標(biāo)。 為驗證本文提出的NOG方法在|σ(0)|>90°時的有效性, 在兩組不同的初始條件下進行仿真。
假設(shè)目標(biāo)的運動狀態(tài)與上文相同。 導(dǎo)彈的初始位置為x(0)=-5 000 m, y(0)=-2 000 m, 速度V=500 m/s。 假設(shè)場景一中導(dǎo)彈的初始速度方向角為θ(0)=120°, 初始前置角σ(0)=-108°; 場景二中導(dǎo)彈的初始速度方向角θ(0)=-70°, 初始前置角σ(0)=92°。 圖5分別為導(dǎo)彈和目標(biāo)在場景一和場景二下的飛行軌跡。
由圖5可以看出, 當(dāng)導(dǎo)彈的初始前置角|σ(0)|>90°時, APNG的軌跡逐漸偏離目標(biāo), 無法實現(xiàn)攔截, 而NOG仍然有效。 顯然, 相比于APNG, NOG能夠顯著增加攔截半徑, 擴大作戰(zhàn)范圍。
綜上, 根據(jù)攔截小機動目標(biāo)的仿真結(jié)果可以得出:
(1) 當(dāng)導(dǎo)彈的初始前置角較大時, NOG通過引入過載約束, 可以有效避免加速度指令達到飽和。
(2) NOG考慮了自動駕駛儀延遲, 因此能夠顯著改善導(dǎo)彈接近目標(biāo)時需用過載較大的問題, 同時降低了能量消耗。
(3) NOG方法無需得到目標(biāo)的加速度信息即可在線生成制導(dǎo)指令。
(4) 當(dāng)導(dǎo)彈的初始前置角|σ(0)|>90°時, APNG不再適用, 但應(yīng)用NOG方法仍然能夠?qū)崿F(xiàn)精準(zhǔn)攔截, 有效擴大了作戰(zhàn)范圍。
6 結(jié) 論
本文研究了自由時間下過載受限且存在自動駕駛儀延遲的非線性最優(yōu)末制導(dǎo)指令在線生成方法。 首先, 基于參數(shù)化方法建立了最優(yōu)軌跡的參數(shù)化微分方程組, 使得通過數(shù)值積分即可得到包含狀態(tài)到最優(yōu)制導(dǎo)指令映射關(guān)系的飛行軌跡數(shù)據(jù)集。 其次, 訓(xùn)練神經(jīng)網(wǎng)絡(luò)擬合上述映射關(guān)系, 保證神經(jīng)網(wǎng)絡(luò)能夠根據(jù)實時更新的彈-目相對運動信息在線生成最優(yōu)制導(dǎo)指令, 從而使本文提出的制導(dǎo)方法不僅能夠用于攻擊靜止目標(biāo), 還可以在目標(biāo)加速度未知的情況下攔截小機動目標(biāo)。 針對自動駕駛儀延遲, 提出一種微分補償法以實現(xiàn)快速響應(yīng)。 數(shù)值仿真結(jié)果表明: 不論是針對靜止目標(biāo)還是小機動目標(biāo), 當(dāng)導(dǎo)彈的初始前置角較大時, 由于引入了過載約束, 提出的NOG方法不會使加速度指令達到飽和。 考慮自動駕駛儀延遲后, 實際加速度能夠快速跟蹤加速度指令, 從而使導(dǎo)彈在接近機動目標(biāo)時過載較小, 能量消耗降低。 更重要的是, 攔截小機動目標(biāo)時, 能夠在目標(biāo)加速度未知的情況下, 應(yīng)用NOG方法在線生成制導(dǎo)指令。 而且, 當(dāng)導(dǎo)彈的初始前置角|σ(0)|>90°時, NOG方法仍然能夠完成精準(zhǔn)攔截, 顯著擴大了作戰(zhàn)范圍。
參考文獻:
[1] 亢有為, 單家元, 趙新. 一種基于角約束的三維三平面最優(yōu)真比例導(dǎo)引方法[C]∥ 第三十四屆中國控制會議, 2015: 103-108.
Kang Youwei, Shan Jiayuan, Zhao Xin. A 3D Three Planes Optimal True Proportional Navigation with Angle Constraint[C]∥ 34th Chinese Control Conference, 2015: 103-108. (in Chinese)
[2] Kim M, Grider K V. Terminal Guidance for Impact Attitude Angle Constrained Flight Trajectories[J]. IEEE Transactions on Aerospace and Electronic Systems, 1973, AES-9(6): 852-859.
[3] 郭志強, 周紹磊, 于運治, 等. 基于狀態(tài)相關(guān)黎卡提方程的非線性協(xié)同制導(dǎo)律[J]. 中國慣性技術(shù)學(xué)報, 2018, 26(6): 822-829.
Guo Zhiqiang, Zhou Shaolei, Yu Yunzhi, et al. Nonlinear Cooperative Guidance Law Based on State-Dependent Riccati-Equation[J]. Journal of Chinese Inertial Technology, 2018, 26(6): 822-829.(in Chinese)
[4] Taub I, Shima T. Intercept Angle Missile Guidance under Time Varying Acceleration Bounds[J]. Journal of Guidance, Control, and Dynamics, 2013, 36(3): 686-699.
[5] Chen Z, Shima T. Nonlinear Optimal Guidance for Intercepting a Stationary Target[J]. Journal of Guidance, Control, and Dyna-mics, 2019, 42(11): 2418-2431.
[6] 張友安, 黃詰, 孫陽平. 帶有落角約束的一般加權(quán)最優(yōu)制導(dǎo)律[J]. 航空學(xué)報, 2014, 35(3): 848-856.
Zhang You’an, Huang Jie, Sun Yangping. Generalized Weighted Optimal Guidance Laws with Impact Angle Constraints[J]. Acta Aeronautica et Astronautica Sinica, 2014, 35(3): 848-856.(in Chinese)
[7] Oshagh M K, Shamsi M. Direct Pseudo-Spectral Method for Optimal Control of Obstacle Problem-An Optimal Control Problem Go-verned by Elliptic Variational Inequality[J]. Mathematical Methods in the Applied Sciences, 2017, 40(13): 4993-5004.
[8] 劉平, 胡云卿, 廖俊, 等. 基于兩階段自適應(yīng)Gauss配點重構(gòu)偽譜法的電力機車優(yōu)化操縱[J]. 自動化學(xué)報, 2019, 45(12): 2344-2354.
Liu Ping, Hu Yunqing, Liao Jun, et al. Optimization Operation of Electric Locomotive Based on Two-Stage Adaptive Gauss Re-Collocation Pseudospectral Approach[J]. Acta Automatica Sinica, 2019, 45(12): 2344-2354.(in Chinese)
[9] Garg D, Patterson M, Hager W W, et al. A Unified Framework for the Numerical Solution of Optimal Control Problems Using Pseudospectral Methods[J]. Automatica, 2010, 46(11): 1843-1851.
[10] Yan H, Wu H X. Initial Adjoint-Variable Guess Technique and Its Application in Optimal Orbital Transfer[J]. Journal of Gui-dance, Control, and Dynamics, 1999, 22(3): 490-492.
[11SD/RsIsDP4mJBmDu+8dZEg==] 李惠峰, 李昭瑩. 高超聲速飛行器上升段最優(yōu)制導(dǎo)間接法研究[J]. 宇航學(xué)報, 2011, 32(2): 297-302.
Li Huifeng, Li Zhaoying. Indirect Method of Optimal Ascent Guidance for Hypersonic Vehicle[J]. Journal of Astronautics, 2011, 32(2): 297-302.(in Chinese)
[12] Chen Z. Second-Order Conditions for Fuel-Optimal Control Problems with Variable Endpoints[J]. Journal of Guidance, Control, and Dynamics, 2022, 45(2): 335-347.
[13] Wang K, Chen Z, Wang H, et al. Nonlinear Optimal Guidance for Intercepting Stationary Targets with Impact-Time Constraints[J]. Journal of Guidance, Control, and Dynamics, 2022, 45(9): 1614-1626.
[14] 王坤, 段欣然, 陳征, 等. 過載和攻擊時間約束下的非線性最優(yōu)制導(dǎo)方法[J]. 系統(tǒng)工程與電子技術(shù), 2024, 46(2): 649-657.
Wang Kun, Duan Xinran, Chen Zheng, et al. Nonlinear Optimal Guidance with Constraints on Overload and Impact Time[J]. Systems Engineering and Electronics, 2024, 46(2): 649-657. (in Chinese)
[15] Cheng L, Wang H, Gong S P, et al. Neural-Network-Based Nonlinear Optimal Terminal Guidance with Impact Angle Constraints[J]. IEEE Transactions on Aerospace and Electronic Systems, 2023: 1-11.
[16] 孟克子, 周荻. 考慮導(dǎo)彈自動駕駛儀動態(tài)特性的H∞導(dǎo)引律[J]. 兵工學(xué)報, 2016, 37(7): 1194-1202.
Meng Kezi, Zhou Di. H∞ Guidance Law Accounting for Dynamics of Missile Autopilot[J]. Acta Armamentarii, 2016, 37(7): 1194-1202.(in Chinese)
[17] 李炯, 張濤, 雷虎民, 等. 非奇異快速終端二階滑模有限時間制導(dǎo)律[J]. 系統(tǒng)工程與電子技術(shù), 2018, 40(4): 860-867.
Li Jiong, Zhang Tao, Lei Humin, et al. Nonsingular Fast Terminal Second-Order Sliding Mode Guidance Law with Finite-Time Convergence[J]. Systems Engineering and Electronics, 2018, 40(4): 860-867.(in Chinese)
[18] 佘文學(xué), 周軍, 周鳳岐. 一種考慮自動駕駛儀動態(tài)特性的自適應(yīng)變結(jié)構(gòu)制導(dǎo)律[J]. 宇航學(xué)報, 2003, 24(3): 245-249.
She Wenxue, Zhou Jun, Zhou Fengqi. An Adaptive Variable Structure Guidance Law Considering Missile’s Dynamics of Autopilot[J]. Journal of Astronautics, 2003, 24(3): 245-249.(in Chinese)
[19] 王冬, 馬清華, 陳韻, 等. 考慮導(dǎo)引頭和駕駛儀動態(tài)特性的自抗擾制導(dǎo)律[J]. 彈箭與制導(dǎo)學(xué)報, 2018, 38(5): 102-106.
Wang Dong, Ma Qinghua, Chen Yun, et al. ADRC Guidance Law Based on Dynamic Characteristics of Seeker and Autopilot[J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2018, 38(5): 102-106.(in Chinese)
[20] Zhang Z X, Li S H, Luo S. Composite Guidance Laws Based on Sliding Mode Control with Impact Angle Constraint and Autopilot Lag[J]. Transactions of the Institute of Measurement and Control, 2013, 35(6): 764-776.
[21] 周慧波, 宋申民, 宋俊紅, 等. 基于擴張狀態(tài)觀測器的有限時間導(dǎo)引律設(shè)計[C]∥ 第25屆中國控制與決策會議, 2013: 5090-5094.
Zhou Huibo, Song Shenmin, Song Junhong, et al. Design of Guidance Law with Finite Time Convergence Based on Extended State Observer[C]∥ 25th Chinese Control and Decision Conference, 2013: 5090-5094. (in Chinese)
[22] 陳寶文, 孫經(jīng)廣. 考慮通信延遲的多導(dǎo)彈協(xié)同分布飽和控制器[J]. 控制工程, 2021, 28(6): 1223-1228.
Chen Baowen, Sun Jingguang. Anti-Saturation Multi-Missile Cooperative Controller with Communication Delay[J]. Control Engineering of China, 2021, 28(6): 1223-1228.(in Chinese)
[23] 孫經(jīng)廣, 孟慶鵬, 李傳明. 帶有落角約束的反艦導(dǎo)彈自適應(yīng)飽和制導(dǎo)律設(shè)計[J]. 指揮控制與仿真, 2020, 42(3): 118-122.
Sun Jingguang, Meng Qingpeng, Li Chuanming. Adaptive Saturated Guidance Law Designed for Anti-Ship Missile with Terminal Angular Constraint[J]. Command Control & Simulation, 2020, 42(3): 118-122.(in Chinese)
[24] 張宇獻, 劉民, 王建輝. 具有執(zhí)行器飽和特性的不確定系統(tǒng)預(yù)測控制器設(shè)計[J]. 控制與決策, 2009, 24(2): 217-220.
Zhang Yuxian, Liu Min, Wang Jianhui. Design of Model Predictive Controller for Uncertain Systems with Actuator Saturation[J]. Control and Decision, 2009, 24(2): 217-220.(in Chinese)
[25] Rusnak I, Meir L. Optimal Guidance for High-Order and Acceleration Constrained Missile[J]. Journal of Guidance, Control, and Dynamics, 1991, 14(3): 589-596.
[26] Rusnak I. Advanced Guidance Laws for Acceleration-Constrained Missile, Randomly Maneuvering Target and Noisy Measurements[J]. IEEE Transactions on Aerospace and Electronic Systems, 1996, 32(1): 456-464.
[27] Rusnak I, Meir L. Optimal Guidance for Acceleration Constrained Missile and Maneuvering Target[J]. IEEE Transactions on Aerospace and Electronic Systems, 1990, 26(4): 618-624.
[28] 孟克子, 周荻. 過載指令約束下的導(dǎo)彈導(dǎo)引律設(shè)計[J]. 兵工學(xué)報, 2014, 35(9): 1419-1427.
Meng Kezi, Zhou Di. Design of Missile Guidance Law Subject to Acceleration Command Constraint[J]. Acta Armamentarii, 2014, 35(9): 1419-1427.(in Chinese)
[29] Hexner G, Pila A W. Practical Stochastic Optimal Guidance Law for Bounded Acceleration Missiles[J]. Journal of Guidance, Control, and Dynamics, 2011, 34(2): 437-445.
[30] Avvakumov S N, Kiselev Y N. Boundary Value Problem for Ordinary Differential Equations with Applications to Optimal Control[J]. Spectral and Evolution Problems, 2000, 10: 147-155.
[31] Wang Z, Li Y. An Indirect Method for Inequality Constrained Optimal Control Problems[J]. IFAC-Papers On Line, 2017, 50(1): 4070-4075.
[32] Chen Z, Caillau J B, Chitour Y. L1-Minimization for Mechanical Systems[J]. SIAM Journal on Control and Optimization, 2016, 54(3): 1245-1265.
[33] Hornik K, Stinchcombe M, White H. Multilayer Feedforward Networks are Universal Approximators[J]. Neural Networks, 1989, 2(5): 359-366.
[34] Rishel R W. Optimal Terminal Guidance of an Air-to-Surface Missile[J]. Journal of Spacecraft and Rockets, 1968, 5(6): 649-654.
[35] Lu P, Chavez F R. Nonlinear Optimal Guidance[C]∥AIAA Guidance, Navigation, and Control Conference and Exhibit, 20099222067cc6035753c136b808038b8906: 618-628.
[36] 王輝, 林德福, 祁載康, 等. 時變最優(yōu)的增強型比例導(dǎo)引及其脫靶量解析解[J]. 紅外與激光工程, 2013, 42(3): 692-698.
Wang Hui, Lin Defu, Qi Zaikang, et al. Time-Varying Optimal Augmented Proportional Navigation and Miss Distance Closed-Form Solutions[J]. Infrared and Laser Engineering, 2013, 42(3): 692-698.(in Chinese)
[37] Zarchan P. Tactical and Strategic Missile Guidance[M]. 4th ed. Reston: AIAA, 2002: 149-152.
[38] Jeon I S, Cho H, Lee J I. Exact Guidance Solution for Maneuver-ing Target on Relative Virtual Frame Formulation[J]. Journal of Guidance, Control, and Dynamics, 2015, 38(7): 1330-1340.
Nonlinear Optimal Terminal Guidance Considering Autopilot Delay
Liu Juntong1, Chen Zheng1, 2*, Zhang Ze3
(1. School of Aeronautics and Astronautics, Zhejiang University, Hangzhou 310027, China;
2. Huanjiang Laboratory, Zhuji 311800, China;
3. Beijing Institute of Control and Electronic Technology, Beijing 100038, China)
Abstract: The online generation method of nonlinear optimal terminal guidance command with the overload constraint and autopilot delay is studied. Firstly, the optimality conditions of the nonlinear optimal guidance problem with stationary target are established based on the Pontryagin’s maximum principle, and the overload constraint is embedded into the optimality conditions by the saturation function. Secondly, the parametric method is used to generate the flight trajectory data set that satisfies the optimality conditions by numerical integration. Then, the neural network is trained using the data set to fit the mapping relationship between the relative motion state of the missile-target and the optimal guidance command, so as to generate the guidance command under the overload constraint within milliseconds. For the delay response of autopilot, the differential compensation method is used to estimate the optimal guidance command output by the neural network at the next moment to achieve fast tracking. Finally, the simulation results show that the proposed method can generate optimal guidance command online for both stationary targets and small maneuvering targets.
Key words: overload constraint; autopilot delay; nonlinear optimal terminal guidance; parameterized method; neural network