趙學(xué)遠(yuǎn),周紹磊,王帥磊,閆 實(shí)
(海軍航空大學(xué) 控制工程系,山東 煙臺(tái) 264001)
隨著通信技術(shù)、機(jī)器人技術(shù)以及無(wú)人飛行器和水下航行器技術(shù)的進(jìn)步,多智能體系統(tǒng)的協(xié)同控制引起了人們的廣泛關(guān)注[1-3]。作為協(xié)同控制的重要分支,研究人員分別對(duì)一致性問(wèn)題、包含問(wèn)題、編隊(duì)控制問(wèn)題進(jìn)行了研究,如文獻(xiàn)[4]研究了基于路徑規(guī)劃的多無(wú)人機(jī)系統(tǒng)編隊(duì)控制問(wèn)題,并給出了控制器的設(shè)計(jì)算法。一致性問(wèn)題作為協(xié)同控制的基礎(chǔ)組成部分,要求與多智能體狀態(tài)達(dá)成一致[5-6]。
包含問(wèn)題是指作為跟隨者的智能體的每個(gè)狀態(tài)量,由多個(gè)領(lǐng)導(dǎo)者對(duì)應(yīng)狀態(tài)量構(gòu)成的凸包內(nèi)變化。文獻(xiàn)[7]依賴于鄰居智能體信息設(shè)計(jì)了分布式一致性控制器,解決了連續(xù)時(shí)間和離散時(shí)間下多智能體系統(tǒng)的包含問(wèn)題。文獻(xiàn)[8]研究了有限時(shí)間內(nèi)的拉格朗日多智能體系統(tǒng)的包含控制問(wèn)題。但上述研究得出的結(jié)論是在領(lǐng)導(dǎo)者不進(jìn)行通信的前提下得出的。
編隊(duì)控制問(wèn)題是指多智能體系統(tǒng)在控制器作用下形成預(yù)先給出的期望編隊(duì)。近年來(lái),將多智能體的一致性理論成果用于解決編隊(duì)控制問(wèn)題成為人們研究的熱點(diǎn)[9-10]。文獻(xiàn)[11]解決了具有雙積分動(dòng)力學(xué)系統(tǒng)模型的多智能體編隊(duì)控制問(wèn)題,并與之前在機(jī)器人領(lǐng)域界的研究方法進(jìn)行了比較。文獻(xiàn)[12]設(shè)計(jì)了基于事件觸發(fā)機(jī)制下的控制器,節(jié)約了系統(tǒng)的通信帶寬,同樣實(shí)現(xiàn)了多智能體系統(tǒng)的編隊(duì)控制。
編隊(duì)包含控制問(wèn)題作為以上兩個(gè)問(wèn)題的結(jié)合,要求領(lǐng)導(dǎo)者形成期望編隊(duì)隊(duì)形,而跟隨者在所形成的編隊(duì)內(nèi)部運(yùn)動(dòng),因此編隊(duì)包含控制問(wèn)題在有人機(jī)-無(wú)人機(jī)系統(tǒng)作戰(zhàn)、多枚導(dǎo)彈協(xié)同突防等領(lǐng)域具有廣泛的應(yīng)用前景。而文獻(xiàn)[13]僅研究多智能體的包含控制問(wèn)題,領(lǐng)導(dǎo)者不能按照需求形成期望編隊(duì)。目前也有部分文獻(xiàn)解決了編隊(duì)包含控制問(wèn)題,如文獻(xiàn)[14]提出多領(lǐng)導(dǎo)者能夠形成期望編隊(duì),跟隨者在編隊(duì)構(gòu)成的凸包內(nèi)運(yùn)動(dòng),但所采用方法過(guò)于復(fù)雜,需要求解多個(gè)復(fù)雜的線性矩陣不等式。總之,多數(shù)文獻(xiàn)還只是研究編隊(duì)控制問(wèn)題或者包含控制問(wèn)題,如文獻(xiàn)[15-16]不存在多個(gè)領(lǐng)導(dǎo)者,且只是解決了多智能體系統(tǒng)的編隊(duì)控制問(wèn)題,未解決包含控制問(wèn)題。而文獻(xiàn)[7]則只是解決了包含控制問(wèn)題,未涉及編隊(duì)控制。但無(wú)論是編隊(duì)控制問(wèn)題還是包含控制問(wèn)題,都可以看作是編隊(duì)包含控制問(wèn)題的特例,因此研究編隊(duì)包含控制問(wèn)題更具有實(shí)際意義。
本文研究了具有多領(lǐng)導(dǎo)者的多無(wú)人機(jī)系統(tǒng)編隊(duì)包含控制問(wèn)題,利用一般通信拓?fù)錀l件下Laplacian矩陣特殊性質(zhì),將編隊(duì)包含控制問(wèn)題化簡(jiǎn)為兩個(gè)低階子系統(tǒng)的漸進(jìn)穩(wěn)定性問(wèn)題,以解決多無(wú)人機(jī)時(shí)變編隊(duì)包含控制問(wèn)題。
為便于后文對(duì)多無(wú)人機(jī)系統(tǒng)編隊(duì)包含控制的研究,給出部分需要用到的引理。
引理1如果有向圖G包含一條有向生成樹(shù),則0是圖G對(duì)應(yīng)的Laplacian矩陣L的一個(gè)特征值,且1為特征值0對(duì)應(yīng)的特征向量,其余N-1個(gè)特征值均具有正實(shí)部[17]。
特別地,如果0是Z的單特征根,則矩陣Y是列滿秩的,矩陣EY的特征值是Z的非零特征值。
考慮由N架無(wú)人機(jī)構(gòu)成的多無(wú)人機(jī)系統(tǒng),多無(wú)人機(jī)系統(tǒng)內(nèi)部的通信結(jié)構(gòu)描述為有向圖G。本文主要研究多無(wú)人機(jī)的時(shí)變編隊(duì)包含控制問(wèn)題,故將單架無(wú)人機(jī)視為質(zhì)點(diǎn),第i架無(wú)人機(jī)的動(dòng)力學(xué)系統(tǒng)模型描述為:
(1)
(2)
假設(shè)1為分析方便,假設(shè)無(wú)人機(jī)在三維空間內(nèi)的運(yùn)動(dòng)相互解耦,那么在一維空間的結(jié)論可以順利推廣至三維空間。
根據(jù)無(wú)人機(jī)要完成任務(wù)的不同,將式(2)中的無(wú)人機(jī)分為領(lǐng)導(dǎo)者和跟隨者。假設(shè)式(2)中包含M(M
從L的結(jié)構(gòu)可知,L3是有向圖GE對(duì)應(yīng)的Laplacian矩陣。為了使領(lǐng)導(dǎo)者形成期望時(shí)變編隊(duì),關(guān)于領(lǐng)導(dǎo)者之間的通信拓?fù)鋱D,本文進(jìn)行如下假設(shè):
假設(shè)2GE有一條有向生成樹(shù)。
在假設(shè)2成立的前提下,類比于引理2有如下引理成立:
引理4對(duì)于引理3中定義的矩陣EM,存在一個(gè)對(duì)稱正定矩陣Q和一個(gè)正數(shù)α,使得[18]:
(EM)TQ+QEM>αQ
(3)
其中,0<α<2×min{Re(λ(EM))}。
假設(shè)3對(duì)于跟隨者,至少有一個(gè)領(lǐng)導(dǎo)者有一條路徑可到達(dá)。
在假設(shè)3成立的前提下,有如下引理成立:
領(lǐng)導(dǎo)者的期望編隊(duì)隊(duì)形描述為:
(4)
其中,hi(t)=[hiz(t),hiv(t)]連續(xù)可微。
(5)
其中,r(t)稱為編隊(duì)中心軌跡。
(6)
本文基于一致性算法設(shè)計(jì)如下控制器:
(xi(t)-xj(t)),i∈F
(7)
ui(t)=K1(xi(t)-hi(t))+
(xj(t)-hj(t)))+wi(t),i∈E
(8)
其中,K1、K2和K3為待求的反饋矩陣,wi(t)為輔助控制函數(shù)。
將控制器式(7)和式(8)代入式(2)并整理,可得:
(L1?BK2)xF(t)+(L2?BK2)xE(t)
(L3?BK3)xE(t)-(L3?BK3)hE(t)-
(IN-M?BK1)hE(t)+(IN-M?I)w(t)
(9)
令ηi(t)=xi(t)-hi(t),i∈E,得:
(L3?BK3)ηE(t)+(IN-M?A)hE(t)+
(10)
因此,領(lǐng)導(dǎo)者的編隊(duì)形成問(wèn)題轉(zhuǎn)化為系統(tǒng)式(10)的一致性問(wèn)題。
令ξi(t)=ηi(t)-ηi+1(t),得:
(EM?BK3)ξE(t)+(E?A)hE(t)+
(11)
因此:
ηM+1(t)=ηM+2(t)=…=ηN(t)
(12)
(13)
(EM?BK3)ξE(t)
(14)
式(13)、式(14)是漸進(jìn)穩(wěn)定的。
φF(t)=(L2?I)xE(t)+(L1?I)xF(t)
(15)
(16)
進(jìn)而由引理5可得引理6成立。
引理6多無(wú)人機(jī)系統(tǒng)式(2)在控制器式(7)和式(8)的作用下,對(duì)于任意的有界初始狀態(tài),能夠?qū)崿F(xiàn)編隊(duì)包含控制。
(17)
當(dāng)式(17)成立時(shí),具有多個(gè)領(lǐng)導(dǎo)者的多無(wú)人機(jī)系統(tǒng)實(shí)現(xiàn)時(shí)變編隊(duì)包含控制問(wèn)題,簡(jiǎn)化為式(17)中的兩個(gè)系統(tǒng)的漸進(jìn)穩(wěn)定性問(wèn)題。為實(shí)現(xiàn)式(17)的漸進(jìn)穩(wěn)定性問(wèn)題,控制器設(shè)計(jì)步驟如下:
1)選取矩陣K1,使得:
(18)
2)根據(jù)第1)步中求得的K1,選定標(biāo)量參數(shù)α,求線性矩陣不等式(19),得到可行解P1:
(19)
其中,0<α<2×min{Re(λ(EM))},S1=A+BK1。
3)根據(jù)第1)步中求得的K1,求解線性矩陣不等式(20),得到可行解P2:
(20)
其中,λ=min(λ(L1))。
4)設(shè)計(jì)反饋矩陣K2=-BTP2,K3=-BTP1。
證明對(duì)式(15)求導(dǎo)可得:
(L2L3?BK3)xE(t)-(L2L3?BK3)hE(t)-
(L2?BK1)hE(t)+(L2?I)w(t)+
(L1?(A+BK1))xF(t)+
(21)
當(dāng)系統(tǒng)式(12)中的領(lǐng)導(dǎo)者形成期望編隊(duì)時(shí):
(22)
根據(jù)引理1可知:L3L1=0。
因此:
(23)
又因?yàn)槭?18)成立,所以系統(tǒng)式(21)是漸進(jìn)穩(wěn)定的,等價(jià)于系統(tǒng)式(24)是漸進(jìn)穩(wěn)定的。
(24)
選取Lyapunov函數(shù)為:
(25)
令K3=-BTP1,對(duì)式(25)沿著系統(tǒng)式(11)求導(dǎo)可得:
(26)
其中,S2=(EM)TQ+QEM。
根據(jù)引理4可得:
(27)
選取Lyapunov函數(shù)為:
(28)
令K2=-BTP2,對(duì)式(28)沿著系統(tǒng)式(24)求導(dǎo)可得:
(29)
本文考慮由8架無(wú)人機(jī)構(gòu)成的多無(wú)人機(jī)系統(tǒng),其中,跟隨者的標(biāo)號(hào)集合為F={1,2,3,4},領(lǐng)導(dǎo)者的標(biāo)號(hào)集合為E={5,6,7,8},在假設(shè)1成立的前提下,每架無(wú)人機(jī)在一維空間動(dòng)力學(xué)系統(tǒng)模型由式(2)描述。無(wú)人機(jī)在三維空間運(yùn)動(dòng),其初始狀態(tài)為:
x1=[1 -1 2 1 3 -4]T
x2=[2 -1 -2 1 3 2]T
x3=[1 -1 2 1 3 -4]T
x4=[2 -1 -2 1 3 2]T
x5=[0 1 -1 2 -3 4]T
x6=[1 1 3 -1 2 0]T
x7=[-1 3 1 -1 2 4]T
x8=[0 1 -3 -1 2 -1]T
領(lǐng)導(dǎo)者的期望編隊(duì)隊(duì)形為:
hix(t)=[hi1xhi2xhi3x]T,i∈E
其中,hi1x=[hi.zhi1v]T,hi2x=[hi2zhi2v]T,hi3x=[hi1z3hi3v]T分別表示在三維空間中的期望編隊(duì),本文令:
8架無(wú)人機(jī)系統(tǒng)內(nèi)部通信拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 多無(wú)人機(jī)系統(tǒng)拓?fù)浣Y(jié)構(gòu)Fig.1 Topology of multi-UAV system
從圖1中可得到相應(yīng)的Laplacian矩陣為:
按照控制器設(shè)計(jì)步驟設(shè)計(jì)控制器,通過(guò)步驟1)求得:
K1=[-4 0]
選取a=0.9,求解步驟2)中的線性矩陣不等式,可得:
解步驟3)中的線性矩陣不等式,可得:
通過(guò)步驟4),可得:
K2=[-0.261 1 -0.752 0]
K3=[-0.090 2 -0.882 5]
多無(wú)人機(jī)系統(tǒng)在控制器式(7)和式(8)的作用下,領(lǐng)導(dǎo)者將形成時(shí)變編隊(duì),跟隨者將在由領(lǐng)導(dǎo)者構(gòu)成的凸包內(nèi)移動(dòng)。假設(shè)無(wú)人機(jī)在三維空間運(yùn)動(dòng)相互解耦,那么領(lǐng)導(dǎo)者在三維空間的運(yùn)動(dòng)狀態(tài)相似,其中一維空間作為領(lǐng)導(dǎo)者的無(wú)人機(jī)實(shí)際位置與期望編隊(duì)位置誤差狀態(tài),實(shí)際速度與期望編隊(duì)速度誤差狀態(tài)趨向于一致的過(guò)程如圖2和圖3所示。由定義1可知,當(dāng)領(lǐng)導(dǎo)者位置誤差與速度誤差都達(dá)成一致時(shí),領(lǐng)導(dǎo)者形成了期望的時(shí)變編隊(duì)。
圖2 領(lǐng)導(dǎo)者與期望編隊(duì)位置誤差Fig.2 Position error of leader and expected formation
圖3 領(lǐng)導(dǎo)者與期望編隊(duì)速度誤差Fig.3 Speed error of leader and expected formation
從圖2和圖3可以看出,領(lǐng)導(dǎo)者的位置與期望位置誤差以及速度與期望速度誤差均在7 s時(shí)趨于保持一致,意味著領(lǐng)導(dǎo)者已經(jīng)形成了期望的時(shí)變編隊(duì)隊(duì)形。
將8架無(wú)人機(jī)的位置在三維空間坐標(biāo)中表示,其中,圖4為t=1 s時(shí)的無(wú)人機(jī)空間位置,圖5為t=10 s時(shí)的無(wú)人機(jī)空間位置,圖6為t=15 s時(shí)的無(wú)人機(jī)空間位置。
圖4 1 s時(shí)無(wú)人機(jī)空間位置Fig.4 UAV space position at 1 s
圖5 10 s時(shí)無(wú)人機(jī)空間位置Fig.5 UAV space position at 10 s
圖6 15 s時(shí)無(wú)人機(jī)空間位置Fig.6 UAV space position at 15 s
從圖4可以看出,當(dāng)t=1 s時(shí),領(lǐng)導(dǎo)者仍未形成期望的編隊(duì)隊(duì)形,跟隨者也未在領(lǐng)導(dǎo)者構(gòu)成的凸包內(nèi)運(yùn)動(dòng),與圖2和圖3中顯示的在t=1 s時(shí),領(lǐng)導(dǎo)者位置誤差與速度誤差均未達(dá)成一致相呼應(yīng)。從圖5和圖6可以看出,多無(wú)人機(jī)實(shí)現(xiàn)了時(shí)變編隊(duì)包含控制,其中領(lǐng)導(dǎo)者在外圍形成了一個(gè)時(shí)變的平行四邊形編隊(duì),隨著時(shí)間變化,領(lǐng)導(dǎo)者構(gòu)成一個(gè)平行四邊形,但隨著時(shí)間變化,平行四邊形也發(fā)生變化,這與圖2和圖3顯示領(lǐng)導(dǎo)者的位置誤差與速度誤差均已經(jīng)達(dá)成一致。與此同時(shí),跟隨者則在作為領(lǐng)導(dǎo)者的4架無(wú)人機(jī)構(gòu)成的平行四邊形內(nèi)運(yùn)動(dòng)。
為更清晰地驗(yàn)證多無(wú)人機(jī)系統(tǒng)在控制器作用下形成的時(shí)變編隊(duì)包含控制,將t=15 s時(shí)無(wú)人機(jī)在三維空間中的位置的不同視圖在圖7~圖9中展示。其中,從圖7~圖9可以看出,領(lǐng)導(dǎo)者構(gòu)成了平行四邊形,而跟隨者的運(yùn)動(dòng)也未超出領(lǐng)導(dǎo)者構(gòu)成的凸包。
圖7 15 s時(shí)無(wú)人機(jī)空間位置視圖1Fig.7 UAV space position view1 at 15 s
圖8 15 s時(shí)無(wú)人機(jī)空間位置視圖2Fig.8 UAV space position view2 at 15 s
圖9 15 s時(shí)無(wú)人機(jī)空間位置視圖3Fig.9 UAV space position view3 at 15 s
本文通過(guò)對(duì)具有多個(gè)領(lǐng)導(dǎo)者的多無(wú)人機(jī)系統(tǒng)時(shí)變編隊(duì)包含控制問(wèn)題進(jìn)行研究,設(shè)計(jì)一致性分布式控制器。在控制器作用下,無(wú)人機(jī)系統(tǒng)能夠形成期望的編隊(duì)包含控制,通過(guò)變量代換和矩陣特殊分解,將編隊(duì)包含控制問(wèn)題簡(jiǎn)化為低階系統(tǒng)的漸進(jìn)穩(wěn)定性問(wèn)題,使得各狀態(tài)量更具有實(shí)際物理意義。但本文研究仍存在一些不足,當(dāng)拓?fù)浣Y(jié)構(gòu)發(fā)生變化時(shí),按照本文設(shè)計(jì)的控制器無(wú)法實(shí)現(xiàn)編隊(duì)包含控制,下一步將對(duì)該問(wèn)題進(jìn)行研究。