張 聰
(中國航天科工集團(tuán)第四研究院指揮自動化技術(shù)研發(fā)與應(yīng)用中心,北京 100854)
隨著科技的發(fā)展,反導(dǎo)武器能力不斷得到提升。為了增強(qiáng)彈道導(dǎo)彈的突防能力和生存能力,多彈協(xié)同攻擊受到越來越多的關(guān)注。另外,彈間鏈技術(shù)進(jìn)一步發(fā)展成熟,使多彈協(xié)同攻擊成為可能。多彈協(xié)同可以通過彈間協(xié)同,將多枚導(dǎo)彈融合成一個信息共享、功能互補(bǔ)、戰(zhàn)術(shù)協(xié)同的作戰(zhàn)群體,利用群體優(yōu)勢對敵防御體系和目標(biāo)進(jìn)行多層次、全方位的打擊,實(shí)現(xiàn)突防能力和打擊能力的整體提升[1]。
對于協(xié)同問題,國內(nèi)外在無人機(jī)編隊(duì)協(xié)同制導(dǎo)與控制方面開展了大量理論和實(shí)物研究[2-4]。但因?yàn)閷?dǎo)彈具有其特殊性,無人機(jī)的相關(guān)研究成果并不能直接應(yīng)用于導(dǎo)彈的協(xié)同制導(dǎo)。本質(zhì)上,導(dǎo)彈協(xié)同制導(dǎo)是多智能體協(xié)同制導(dǎo)與控制的一個方向,但導(dǎo)彈的速度更快、難以實(shí)現(xiàn)盤旋、靜止等戰(zhàn)術(shù)動作,所以要求其彈道應(yīng)盡可能平直,這就對多導(dǎo)彈協(xié)同提出了更高的要求。
另外,與制導(dǎo)控制問題類似,現(xiàn)有協(xié)同制導(dǎo)研究中一般不考慮姿態(tài)控制環(huán)節(jié)或?qū)⒆藨B(tài)控制環(huán)節(jié)近似為一階系統(tǒng)。這沒有能充分考慮導(dǎo)彈機(jī)動性能的限制。鑒于此,本文在文獻(xiàn)[5]的基礎(chǔ)上,針對多反艦彈道導(dǎo)彈的末制導(dǎo)段,在領(lǐng)彈與從彈通信之外,加入從彈之間的相互通信,對一體化位姿控制進(jìn)行拓展,提出一體化協(xié)同制導(dǎo)與控制的概念。以一致性理論為支撐,結(jié)合動態(tài)面控制和擴(kuò)張狀態(tài)觀測器理論,研究“領(lǐng)彈—從彈”構(gòu)型的多反艦彈道導(dǎo)彈的協(xié)同制導(dǎo)與控制問題。
定義1. 一體化協(xié)同制導(dǎo)與控制運(yùn)用一體化思想[6-7]對多導(dǎo)彈的協(xié)同、制導(dǎo)、控制問題進(jìn)行研究。
本文研究主要針對多枚反艦彈道導(dǎo)彈齊射情景,進(jìn)入末制導(dǎo)階段后,各從彈以指定的空間位置跟隨領(lǐng)彈,使其與領(lǐng)彈保持一定空間構(gòu)型集中攻擊同一目標(biāo)。需要一枚有尋的制導(dǎo)能力的領(lǐng)彈對目標(biāo)進(jìn)行尋的攻擊;其余從彈只需要其具有與其指定相鄰從彈相互通信的能力,并要求至少有一枚從彈可以獲取領(lǐng)彈信息。
建立導(dǎo)彈的運(yùn)動學(xué)和動力學(xué)模型、氣動力和氣動力矩模型、發(fā)動機(jī)模型。在氣動力和氣動力矩模型中加入擾動,模擬外界氣流對導(dǎo)彈性能的影響[8-9]。
本文考慮導(dǎo)彈為軸對稱氣動外形,要求通過控制δx使速度傾斜角保持為0。因此,可將滾轉(zhuǎn)通道獨(dú)立出來進(jìn)行控制算法設(shè)計。具體設(shè)計過程參見文獻(xiàn)[5]。
文獻(xiàn)[5]將力和力矩公式代入到運(yùn)動學(xué)和動力學(xué)模型中,將滾轉(zhuǎn)通道以外的其余通道整合為一體化位姿控制的設(shè)計模型,如下所示:
(1)
式中:
各變量具體含義詳見文獻(xiàn)[5]。
設(shè)有n枚從彈,則第i枚從彈的一體化協(xié)同制導(dǎo)與控制的多智能體形式的模型,如式(2)所示。各變量具體含義同文獻(xiàn)[5]。
(2)
設(shè)計模型(2)的建立,將一體化協(xié)同制導(dǎo)與控制問題,提煉為針對如式(3)類型的高階非線性多智能體系統(tǒng),設(shè)計協(xié)同一致性算法的科學(xué)問題。
設(shè)有n個節(jié)點(diǎn)n>2,則第i個節(jié)點(diǎn)的狀態(tài)方程表達(dá)式如式(3)所示。
(3)
式中:xil∈R是節(jié)點(diǎn)i的第l階狀態(tài);fil(xi1,…,xi1):RM→R在定義域內(nèi)Lipschitz連續(xù),且fil(0,…,0)=0,是已知函數(shù);ui∈R是控制輸入;gil是放大系數(shù);dil(t)∈R指本文所述的“總擾動”,未知且有界。這里的“總擾動”包含各種各樣的擾動因素(如系統(tǒng)未建模部分、參數(shù)不確定性和外來干擾等)。
式(3)是串級系統(tǒng),前k階是積分型系統(tǒng),后m-k階中各階都包含擾動項(xiàng)(非匹配擾動)。因此,針對第i個節(jié)點(diǎn)前k階,基于一致性理論設(shè)計一致性算法,得到虛擬控制量xi(k+1)c;針對系統(tǒng)后m-k階,需要在動態(tài)面控制的思想框架下,設(shè)計控制律使?fàn)顟B(tài)變量xi(k+1)迅速趨近虛擬控制量xi(k+1)c。
假設(shè)1. (a)對于前k階,只有最外層狀態(tài)xi1可以通過節(jié)點(diǎn)自身的傳感器直接測量獲取,其他狀態(tài)需通過ESO進(jìn)行估計;(b)后m-k階中,各個狀態(tài)量可通過節(jié)點(diǎn)自身傳感器直接測量獲得。
本文中的領(lǐng)彈,可視為是多智能體系統(tǒng)中的主節(jié)點(diǎn)0,其時變動態(tài)可以描述為
(4)
式中:x0h∈R表示主節(jié)點(diǎn)的第h階狀態(tài),h=1,…,k;x0:=x0,1,…,x0,k,f0(t,x0):[0,∞)×RM→R是分段局部Lipschitz連續(xù)的,f0(t,0,…,0)=0,且對于任意從節(jié)點(diǎn)是未知的。對于任意初始狀態(tài),t≥0時,系統(tǒng)(4)的解存在。主節(jié)點(diǎn)的動態(tài)(4)可以視為軌跡生成器。
定義節(jié)點(diǎn)i的第h階跟蹤誤差為δih=xih-x0h,定義δh=[δ1h,…,δnh]T,則
δh=xh-x0,h
式中:x0,h=x0,h1,1=[1,…,1]T∈Rn,h=1,…,k。
本文目的是設(shè)計一體化協(xié)同制導(dǎo)與控制律,使跟蹤誤差δh(h=1,…,k)最終一致收斂到0的極小鄰域內(nèi)。以下定義具體描述了最終一致有界的概念。
定義2[10-11]. 協(xié)同最終一致有界:對于任意h(h=1,…,k),如果存在緊集Ωm?RN滿足如下條件:
1){0}?Ωh
2)?δh(t0)∈Ωh
則說跟蹤誤差δh是協(xié)同一致最終有界的(Cooperatively uniformly ultimately bounded, CUUB)。對于節(jié)點(diǎn)i,在t≥t0+Tm時,如果跟蹤誤差δh是協(xié)同一致最終有界的,則狀態(tài)xih收斂到x0h的鄰域內(nèi)。
定義協(xié)同誤差為
(5)
式中:bi≥0表示主節(jié)點(diǎn)0到從節(jié)點(diǎn)i的通信權(quán)重,當(dāng)且僅當(dāng)從節(jié)點(diǎn)i可以從主節(jié)點(diǎn)獲取信息時bi>0。
定義eh=[e1h,…,enh]T,B=diag(b1,…,bn)∈Rn×n,f0=[f0(t,x0),…,f0(t,x0)]T∈Rn。由圖論知識可得L1=0,其中,0=[0,…,0]T∈Rn,1=[1,…,1]T∈Rn,可以得到誤差動態(tài)的向量形式,如下所示:
(6)
對式(6)求導(dǎo)可得協(xié)同誤差的狀態(tài)方程組形式
(7)
式中:fk=[f1k(xi),…,fnk(xi)]T,xk_=[x1k_,…,xnk_]T,Gk=diag(g1k,…,gnk)。
進(jìn)一步,根據(jù)假設(shè)1(a),針對系統(tǒng)前k階,只有最外層狀態(tài)xi1可以通過節(jié)點(diǎn)自身的傳感器直接測量獲取,其他狀態(tài)將通過ESO進(jìn)行估計。因此,得到協(xié)同誤差的估計量,如下
(8)
將式(8)整合成如下向量形式,
(9)
對式(8)求導(dǎo)可得估計協(xié)同誤差的狀態(tài)方程組形式
(10)
定義誤差si如下:
si=λ1ei1+…+λk-1ei(k-1)+eik
(11)
選取λ1,…,λk-1使多項(xiàng)式sk-1+λk-1sk-2+…+λ1是Hurwitz的。因此在誤差面上(si=0),eih指數(shù)收斂到0,h=1,…,k。因此,控制誤差si保持為0或在0附近,即可保證eih為0或是最終一致有界的。
誤差的向量形式為s=[s1,…,sn]T∈Rn,則
s=λ1e1+…+λk-1ek-1+ek
得到
(12)
由于λ1,…,λk-1使多項(xiàng)式sk-1+λk-1sk-2+…+λ1是Hurwitz的,所以Λ是Hurwitz的,對于給定的正數(shù)κ,存在整定矩陣PΛ,滿足
ΛTPΛ+PΛΛ=-κI
(13)
則向量形式估計滑模誤差的導(dǎo)數(shù)為
以下定理表明當(dāng)si有界時,即有ei有界。因此只需確保si有界即可。即稱si為ei的等效誤差。
引理1[11-12].對于任意節(jié)點(diǎn)i,i=1,…,n,設(shè)
對于任意邊界層ψi>0,ξi>0,任意時間Ti>t0存在邊界Ψi>0, Ξi>0和時間Δi>t0,使得
由于假設(shè)1,本節(jié)先設(shè)計擴(kuò)張狀態(tài)觀測器,之后再設(shè)計一致性算法來解決系統(tǒng)的協(xié)同跟蹤問題。
2.6.1擴(kuò)張狀態(tài)觀測器設(shè)計
需要進(jìn)行擴(kuò)張狀態(tài)觀測器設(shè)計的原因有2個:1)在制導(dǎo)過程視線角速度信息較難獲取,或需增加設(shè)計成本,通過觀測手段可以低成本的獲取視線角速度信息;2)模型中包含各種不同來源的干擾,需要通過觀測手段對其進(jìn)行估計,并在一體化制導(dǎo)控制回路中對其進(jìn)行補(bǔ)償以減少系統(tǒng)中的干擾,這有利于制導(dǎo)控制一體化回路的設(shè)計和整個系統(tǒng)的穩(wěn)定性。擴(kuò)張狀態(tài)觀測器無需區(qū)分誤差類型和來源,可以對系統(tǒng)中的總體擾動進(jìn)行實(shí)時估計,正好能滿足以上2個需求。
式(3)相當(dāng)于包含一個k階積分型系統(tǒng)和m-k個一階系統(tǒng)。所以,只需針對前k階積分型系統(tǒng)進(jìn)行擴(kuò)張狀態(tài)觀測器的設(shè)計,也即包含了對后m-k的一階系統(tǒng)的擴(kuò)張狀態(tài)觀測器設(shè)計。
設(shè)k階積分型系統(tǒng)如下
(14)
用擴(kuò)張狀態(tài)xk+1代替總擾動d(t),將式(14)擴(kuò)張為k+1階增廣系統(tǒng),如下所示:
(15)
針對式(15),設(shè)計ESO如下
(16)
寫成狀態(tài)方程組形式,如下所示:
(17)
選取ηh使得多項(xiàng)式sk+1+μ1sk+…+μks+μk+1是Hurwitz的,就有如下等式成立
(18)
式中:P,Q為正定矩陣。
對擴(kuò)張狀態(tài)觀測器的穩(wěn)定性和收斂性進(jìn)行證明分析。設(shè)待選函數(shù)為
(19)
結(jié)合式(17)和式(18),求式(19)對時間的導(dǎo)數(shù),有
(20)
結(jié)合P>0,從式(19)中可直接得出
整理得到
(21)
將式(21)代入式(20),得到
(22)
式(22)的解為
(23)
將式(23)代入式(21),得到
(24)
2.6.2前k階算法設(shè)計
對從節(jié)點(diǎn)i設(shè)計分布式控制算法如下
(25)
寫成向量形式為
(26)
適當(dāng)?shù)卣{(diào)整參數(shù)λ1,…,λk-1和c,分布式控制律(25)可以保證協(xié)同跟蹤誤差δh的最終一致有界。
下面將進(jìn)行證明和分析。
在證明之前先引入如下引理和定理:
引理2[11-12].定義q=[q1,…,qN]T=(L+B)-11,P=diag{pi}=diag{1/qi},則矩陣P正定且存在正定矩陣Q使得
Q=P(L+B)+(L+B)TP
(27)
式中:1=[1,…,1]T。
定理1. 對于由從節(jié)點(diǎn)(3)和主節(jié)點(diǎn)(4)構(gòu)成的多智能體系統(tǒng)。如果假設(shè)2成立,通過結(jié)合擴(kuò)張狀態(tài)觀測器的分布式控制律(25)的控制,跟蹤誤差δ1,…,δM將協(xié)同一致最終有界。這意味著,圖G中所有從節(jié)點(diǎn)的前k階狀態(tài)將在有界殘差內(nèi)同步趨近于主節(jié)點(diǎn)對應(yīng)階狀態(tài)。
證. 取待選Lyapunov函數(shù)為
(28)
(29)
然后,結(jié)合式(12)和式(13),計算VE對時間的導(dǎo)數(shù),可得
(30)
聯(lián)合式(29)和式(30),整理得到
(31)
式中:
(32)
(33)
(34)
將式(32)代入式(28),得到
式中:Γ=diag(σmin(PΛ)/2,σmin(P)/2)
Τ=diag(σmax(PΛ)/2,σmax(P)/2)
通過文獻(xiàn)[13]中的定理4.18得出結(jié)論:對于任意初始條件v(t0)存在時間T0,使得
(35)
結(jié)論1. 根據(jù)w的定義,式(35)即說明s是有限時間一致有界的,進(jìn)而si是有限時間一致有界的。再根據(jù)引理1可知ei是有限時間一致有界的,進(jìn)而eih是有限時間一致有界的。再根據(jù)定理 1得到δ1,…,δk是有限時間協(xié)同一致有界的,有向圖G中的所有從節(jié)點(diǎn)的前k階狀態(tài)同步趨于主節(jié)點(diǎn)的對應(yīng)階狀態(tài)。
2.6.3后m-k階算法設(shè)計
由于系統(tǒng)后m-k階相當(dāng)于帶有非匹配擾動的串級系統(tǒng),所以考慮使用動態(tài)面控制的方法進(jìn)行控制律的設(shè)計。下面對系統(tǒng)的后m-k階進(jìn)行算法設(shè)計和證明分析,這過程中將對假設(shè)sk+1和zk+1有界成立進(jìn)行說明。
在系統(tǒng)的后m-k階中,假設(shè)所有的狀態(tài)變量可通過直接測量獲得。擴(kuò)張狀態(tài)觀測器的設(shè)計目的只是為了估計各階總擾動。因此,設(shè)滑模面為
sil=xil-xild
(36)
結(jié)合式(3),求(36)對時間的導(dǎo)數(shù)如下
(37)
式中:zil=xild-xilc,l=k+1,…,m。
動態(tài)面控制律設(shè)計如下:
(38)
對系統(tǒng)后m-k階的穩(wěn)定性進(jìn)行證明分析。設(shè)待選Lyapunov函數(shù)如下
(39)
結(jié)合式(37)和式(38),求取式(39)對時間的導(dǎo)數(shù),得
0.5n(m-k)
(40)
式中:Δsil≥|gil||zi(l+1)|+|Δdil|∈R+,gim=0。
-2ζs(m-k)Vs(m-k)+0.5n(m-k)
(41)
再次,針對低通濾波部分進(jìn)行穩(wěn)定性證明。結(jié)合式(38)求zil對時間的導(dǎo)數(shù)如式(42)所示
(42)
設(shè)待選Lyapunov函數(shù)為
(43)
結(jié)合式(42),求取式(43)對時間的導(dǎo)數(shù),得
0.5n(m-k)
(44)
(45)
然后,將Vs和Vz(m-k)部分進(jìn)行整合。設(shè)待選Lyapunov函數(shù)為
Vsz=Vs+Vz(m-k)
(46)
整合式(41)和式(44),得到式(46)的導(dǎo)數(shù)為
Vz(m-k)+n(m-k)
(47)
設(shè)計ζz(m-k) (48) 式(48)的解為: 由結(jié)論1和結(jié)論2得出結(jié)論3。 結(jié)論3. 由控制律(25)和(38)構(gòu)成的整體控制律,保證了由式(3)和式(4)構(gòu)成的多智能體系統(tǒng)的有限時間協(xié)同一致有界。 針對本文“領(lǐng)彈—從彈”構(gòu)型的多反艦彈道導(dǎo)彈系統(tǒng)給出具體的ICGC算法,如下 1)ESO 對于系統(tǒng)(2),需要一個3階ESO和兩個2階ESO,如下 一個3階ESO: (49) 兩個2階ESO分別為: (50) (51) 2)ICGC算法 ICGC算法如下所示 (52) 式中:ei1=xi1-xi1c,ei2=xi2-xi2c,i=1,2,3。 本節(jié)對一體化協(xié)同制導(dǎo)與控制算法進(jìn)行仿真校驗(yàn)。即是對式(2)、(49)、(50)、(51)、(52)構(gòu)成的閉環(huán)系統(tǒng)進(jìn)行仿真校驗(yàn)。采用“領(lǐng)彈—從彈”的協(xié)同構(gòu)型(其中包含1枚領(lǐng)彈和3枚從彈),各個從彈分別獲取領(lǐng)彈位置速度信息,從彈之間相互通信,可獲取其他從彈的位置速度信息。 為了突出本文算法的一致性特征,與文獻(xiàn)[5]中的一體化位姿控制(Integrated control of position and attitude,ICPA)算法(53)進(jìn)行對比。 (53) 關(guān)于“領(lǐng)彈—從彈”的協(xié)同構(gòu)型采用圖論拓?fù)涞男问竭M(jìn)行描述。具體針對以下兩種拓?fù)浣Y(jié)構(gòu)進(jìn)行仿真。其中,拓?fù)浣Y(jié)構(gòu)1,各個從彈分別獲取領(lǐng)彈位置速度信息,從彈之間無通信;拓?fù)浣Y(jié)構(gòu)2,各個從彈分別獲取領(lǐng)彈位置速度信息,從彈之間相互通信,可獲取鄰居從彈的位置速度信息。對應(yīng)鄰接矩陣A和主從矩陣B如表1所示。 表1 拓?fù)浣Y(jié)構(gòu)Table 1 Topological structure 當(dāng)從彈間沒有通信,且每個從彈都能從領(lǐng)彈獲取信息時,有bi=1,di=0;令λ1=c1,λ2=1,K=c且式(53)中η=0。則式(52)與式(53)完全相同。即此時一體化協(xié)同制導(dǎo)與控制退化為一體化位姿控制。 期望空間構(gòu)型如表2所示,領(lǐng)彈和各枚從彈的狀態(tài)初始值如表3所示,算法參數(shù)設(shè)定如表4所示。本節(jié)的多彈協(xié)同攻擊仿真中,領(lǐng)彈的一體化制導(dǎo)控制算法采用NTSMC_DSC方法[14]。 表2 期望空間構(gòu)型Table 2 Desired special structure 表3 領(lǐng)彈和各枚從彈的狀態(tài)初始值Table 3 Initial-states of the lead and the follow 仿真結(jié)果如圖1~圖4所示。對比圖1和圖2發(fā)現(xiàn),使用ICGC算法時3枚從彈位置曲線走勢更具有一致性。對比圖3和圖4發(fā)現(xiàn),使用ICGC算法時3枚從彈位置關(guān)系曲線走勢更具有一致性。一體化協(xié)同制導(dǎo)與控制通過增強(qiáng)從彈間的一致性,進(jìn)一步提高了多導(dǎo)彈末制導(dǎo)段的協(xié)同攻擊的能力。 表4 算法參數(shù)設(shè)定Table 4 Parameters of ICGC 為了更具一般地對本文提出的算法進(jìn)行校驗(yàn),進(jìn)行蒙特卡洛仿真試驗(yàn)對脫靶量進(jìn)行統(tǒng)計。改變目標(biāo)初始位置、拉偏氣動數(shù)據(jù),進(jìn)行200次的蒙特卡洛仿真試驗(yàn),統(tǒng)計結(jié)果如表5所示。統(tǒng)計脫靶量的期望(μ)和均方差(σ)。發(fā)現(xiàn)在當(dāng)前仿真場景中,領(lǐng)彈和從彈的脫靶量都很小。 表5 Monte Carlo仿真試驗(yàn)統(tǒng)計分析結(jié)果Table 5 Results and analysis of Monte-Carlo simulations 本文將一體化思想延伸到一體化協(xié)同制導(dǎo)與控制問題中。首先,將一體化協(xié)同制導(dǎo)與控制問題,提煉為針對一類型的高階非線性多智能體系統(tǒng),并設(shè)計協(xié)同一致性算法的科學(xué)問題。其次,設(shè)計了分布式一致性控制算法,對其穩(wěn)定性和收斂特性進(jìn)行了證明與分析,并取得了收斂條件。最后,通過ICGC和ICPA的仿真對比,突出了ICGC方法的一致性特性。另外,對于大機(jī)動性彈道,由于導(dǎo)彈自身結(jié)構(gòu)和穩(wěn)定性等需求對氣動角進(jìn)行了限制,仿真過程中系統(tǒng)出現(xiàn)了不同程度的飽和。這是期望攻擊角度和氣動角度限制之間的矛盾,如何解決這個矛盾可作為以后的研究方向。2.7 一體化協(xié)同制導(dǎo)與控制具體算法
3 仿真校驗(yàn)
4 結(jié) 論