王 平,劉 暢
(1.海鷹航空通用裝備有限責(zé)任公司,北京 100074;2.北京自動(dòng)化控制設(shè)備研究所,北京 100074)
近年來(lái),多智能體系統(tǒng)的編隊(duì)控制引起各個(gè)領(lǐng)域研究人員的廣泛關(guān)注。智能體之間通過(guò)編隊(duì)協(xié)同工作充分發(fā)揮單個(gè)智能體的優(yōu)勢(shì),提高任務(wù)的完成率、拓寬其使用范圍等,在民生、軍事等領(lǐng)域均有巨大的應(yīng)用潛力[1-5]。例如,在執(zhí)行偵察任務(wù)時(shí),單架無(wú)人機(jī)受到傳感器的角度限制,不能從多個(gè)方位對(duì)目標(biāo)區(qū)域進(jìn)行觀測(cè),多架無(wú)人機(jī)編隊(duì)飛行,通過(guò)分工協(xié)作可實(shí)現(xiàn)目標(biāo)區(qū)域的多方位觀測(cè),縮短任務(wù)完成時(shí)間,提高任務(wù)完成效率[6]。編隊(duì)保持作為編隊(duì)控制的基本問(wèn)題,是編隊(duì)有效執(zhí)行任務(wù)的基本保障。編隊(duì)保持的核心問(wèn)題是通過(guò)設(shè)計(jì)恰當(dāng)?shù)目刂茀f(xié)議,借助鄰居智能體之間的局部交互形成并保持期望的隊(duì)形。目前編隊(duì)保持和控制的方法主要包括領(lǐng)航—跟隨法[7]、虛擬結(jié)構(gòu)法[8]、行為控制法[9]及一致性控制方法[10]。Ren[11]論證了領(lǐng)航—跟隨法、虛擬結(jié)構(gòu)法及行為控制法都可以歸入一致性的統(tǒng)一框架內(nèi)。
許多物理系統(tǒng),特別是機(jī)械系統(tǒng),通常表示為二階積分器模型。然而工程實(shí)踐中的物理系統(tǒng)往往具有非線(xiàn)性特性,導(dǎo)致系統(tǒng)模型無(wú)法簡(jiǎn)化為線(xiàn)性積分系統(tǒng)的形式。針對(duì)有向網(wǎng)絡(luò)拓?fù)淝樾?,Yu等[12]研究了具有非線(xiàn)性動(dòng)態(tài)的二階多智能體系統(tǒng)的一致性,得到了系統(tǒng)達(dá)到一致的條件。在此基礎(chǔ)上,Song等[13]考慮了帶有領(lǐng)航者的情形,利用牽引控制方法研究了二階非線(xiàn)性多智能體系統(tǒng)的協(xié)調(diào)跟蹤問(wèn)題。針對(duì)跟隨者之間的通信拓?fù)鋱D為無(wú)向圖和有向圖兩種情形,Wen等[14]給出了控制增益滿(mǎn)足的條件,確保系統(tǒng)實(shí)現(xiàn)目標(biāo)跟蹤。然而上述控制增益均依賴(lài)智能體的非線(xiàn)性特性以及通信拓?fù)鋱D等全局信息,并沒(méi)有實(shí)現(xiàn)真正意義上的分布式。注意到鳥(niǎo)群、魚(yú)群、羊群等在集群運(yùn)動(dòng)過(guò)程中,只需調(diào)整自身與相鄰智能體的相對(duì)位置即可維持整體隊(duì)形。為此,設(shè)計(jì)僅依賴(lài)自身與鄰居智能體之間相對(duì)狀態(tài)的控制協(xié)議實(shí)現(xiàn)群體分布式控制更符合實(shí)際且更具有挑戰(zhàn)性。
基于以上分析,本文研究二階非線(xiàn)性多智能體系統(tǒng)的分布式編隊(duì)控制問(wèn)題。利用鄰居智能體之間的相對(duì)狀態(tài)信息,提出了具有時(shí)變?cè)鲆娴淖赃m應(yīng)控制協(xié)議,確保實(shí)現(xiàn)多智能體系統(tǒng)編隊(duì)控制。本文的創(chuàng)新主要體現(xiàn)在以下兩個(gè)方面:(1)考慮了智能體自身的非線(xiàn)性動(dòng)態(tài)特性,更符合工程實(shí)際;(2)設(shè)計(jì)的自適應(yīng)編隊(duì)控制協(xié)議不依賴(lài)智能體的非線(xiàn)性動(dòng)態(tài)及通信拓?fù)鋱D信息,實(shí)現(xiàn)了真正意義上的分布式,可滿(mǎn)足大規(guī)模的多智能體編隊(duì)控制需求。
本節(jié)簡(jiǎn)要介紹代數(shù)圖論的相關(guān)概念(詳細(xì)內(nèi)容參考文獻(xiàn)[15]),采用拓?fù)鋱DG(υ,ε,A)表示智能體之間的通信關(guān)系,其中υ= {υ1,υ2,… ,υN}表示參與編隊(duì)的N個(gè)智能體,表示編隊(duì)中各有向信息路徑組成的集合。連接權(quán)重表示智能體之間的通信狀態(tài),當(dāng)智能體i收到智能體j的信息時(shí),aij> 0,否則aij= 0,并且規(guī)定aii= 0,對(duì)應(yīng)鄰接矩陣。如果對(duì)任意的(υi,υj)∈ε均有(υj,υi)∈ε,則圖G為無(wú)向圖,反之則圖G為有向圖。圖G的一條有向路徑是指一組有限的節(jié)點(diǎn)序列υ1,υ2,… ,υl,滿(mǎn) 足(υi-1,υi) ∈υ,i= 1,2,…,l。定義拉普拉斯矩陣為
采用G表示有領(lǐng)航者的通信拓?fù)鋱D,節(jié)點(diǎn)υ0表示領(lǐng)航者,υ1,υ2,… ,υN為跟隨者。對(duì)角矩陣表示領(lǐng)航者的鄰接矩陣,若υ0是υi的鄰居時(shí),bi=ai0> 0,否則bi= 0。
假設(shè)1.對(duì)于每一個(gè)跟隨者,均存在一條由領(lǐng)航者到跟隨者的有向路徑。此外,跟隨者之間的通信拓?fù)鋱D為無(wú)向圖。
引理1[16].在假設(shè)1成立的條件下,矩陣M=L+B正定。
考慮包含N個(gè)跟隨者和1個(gè)領(lǐng)航者的多智能體系統(tǒng),其通信拓?fù)鋱D為G,節(jié)點(diǎn)υ0表示領(lǐng)航者,υ1,υ2,… ,υN為跟隨者。第i個(gè)智能體的動(dòng)態(tài)方程表示如下:
其中:xi(t),vi(t),ui(t) ∈Rm分別表示第i個(gè)智能體的位置、速度和控制輸入(或者控制協(xié)議),u0=0。f(t,xi(t),vi(t))表示第i個(gè)智能體的非線(xiàn)性動(dòng)態(tài),為一致連續(xù)可微的向量函數(shù)并且滿(mǎn)足利普希茨條件:
?x1,x2,v1,v2∈Rm,t≥0成立,其中ρ1≥0,ρ2≥ 0為利普希茨常數(shù)。
定義1.稱(chēng)控制協(xié)議iu能夠解決系統(tǒng)的編隊(duì)控制問(wèn)題,當(dāng)且僅當(dāng)對(duì)于任意的初始狀態(tài),所有智能體漸近形成期望的編隊(duì),即
本文的目標(biāo)是設(shè)計(jì)分布式控制協(xié)議iu以解決多智能體系統(tǒng)(2)的編隊(duì)控制問(wèn)題。
注意到文獻(xiàn)[11-13]控制協(xié)議中的控制增益均為常值,且依賴(lài)智能體的非線(xiàn)性特性及通信拓?fù)鋱D等全局信息。然而集群運(yùn)動(dòng)過(guò)程中,各智能體只需調(diào)整自身與相鄰智能體的相對(duì)位置即可維持整體隊(duì)形。為進(jìn)一步提升系統(tǒng)的智能程度,本文基于相鄰智能體之間的相對(duì)狀態(tài)信息,提出了如下具有時(shí)變?cè)鲆娴淖赃m應(yīng)控制協(xié)議:
其中:k1,k2,τi均為正數(shù),αi(t)為對(duì)應(yīng)于第i個(gè)跟隨者的時(shí)變控制增益。
定義編隊(duì)誤差:
記:
編隊(duì)誤差系統(tǒng)(6)可描述為如下矩陣形式:
定理1.在假設(shè)1成立的條件下,自適應(yīng)控制協(xié)議(5)無(wú)須借助任何全局信息即可解決多智能體系統(tǒng)(2)的編隊(duì)控制問(wèn)題。此外,控制增益αi(t)收斂于有限值。
證.考慮如下的李雅普諾夫函數(shù):
V(t)沿著系統(tǒng)(7)對(duì)時(shí)間t求導(dǎo),得
注意到非線(xiàn)性動(dòng)態(tài)F(t,ξ,ζ)滿(mǎn)足利普希茨條件(3),則有
從而:
此外:
將式(11)、式(12)代入式(9)得
注.文獻(xiàn)[12-14]中確定靜態(tài)控制增益需要事先知道通信拓?fù)鋱D的拉普拉斯矩陣及智能體自身的非線(xiàn)性特性,然后根據(jù)系統(tǒng)穩(wěn)定性理論確定靜態(tài)控制增益的取值范圍。本文提出的自適應(yīng)控制協(xié)議(5)的參數(shù)自主調(diào)節(jié),不依賴(lài)智能體自身的非線(xiàn)性動(dòng)態(tài)及通信拓?fù)鋱D信息,可滿(mǎn)足大規(guī)模的多智能體編隊(duì)控制需求。然而,控制協(xié)議(5)中的控制增益需要不斷更新,相比于靜態(tài)控制協(xié)議更復(fù)雜,對(duì)硬件設(shè)備計(jì)算性能提出更高的要求。
本節(jié)通過(guò)仿真實(shí)例驗(yàn)證自適應(yīng)控制協(xié)議的有效性??紤]包含6個(gè)跟隨者和1個(gè)領(lǐng)航者的多智能體系統(tǒng),節(jié)點(diǎn)υ0表示領(lǐng)航者,υ1,υ2,… ,υ6表示跟隨者,其通信拓?fù)鋱D如圖1所示。顯然該通信拓?fù)鋱D滿(mǎn)足假設(shè)1。假設(shè)所有的非零權(quán)重均為1。
圖1 通信拓?fù)鋱DFig.1 The communication graph
所有智能體的動(dòng)態(tài)方程均由系統(tǒng)(2)給出,非線(xiàn)性動(dòng)態(tài)由下列Chua's 電路[17]給出:
當(dāng)p=10,q=18, a= 4/3, b=-3 /4時(shí),系統(tǒng)呈現(xiàn)混沌狀態(tài)。選取k1=3,k2=2。
6個(gè)跟隨者的初始位置和速度狀態(tài)分別從[0,10]×[-6 ,6]×[-1 0,0]和[-4 ,4]×[-4,4]×[-4 ,4]中隨機(jī)選取,領(lǐng)航者的初始位置和速度分別為[1,2,3]T和 [0.6,-0 .2,0.3]T。此外,時(shí)變控制增益的初值設(shè)置為 αi( 0) =0和τi= 0.01,i = 1,2,…, 6。假設(shè)期望的一字隊(duì)形為其中:
在自適應(yīng)控制協(xié)議(5)作用下多智能體系統(tǒng)的位置和速度曲線(xiàn)分別如圖2~3所示,可以看出多智能體系統(tǒng)形成并保持期望的一字隊(duì)形,且速度漸近達(dá)到一致。圖4描述了自適應(yīng)控制協(xié)議(5)中時(shí)變?cè)鲆?αi(t), i= 1,2,… ,6的軌跡曲線(xiàn)。顯然,αi(t), i= 1,2,… ,6漸近趨于某個(gè)有限值。
圖2 自適應(yīng)控制協(xié)議(5)作用下的位置曲線(xiàn)Fig.2 Position trajectories of the network under the adaptive control protocol (5)
圖3 自適應(yīng)控制協(xié)議(5)作用下的速度曲線(xiàn)Fig.3 Velocity trajectories of the network under the adaptive control protocol (5)
圖4 時(shí)變控制增益 αi(t), i= 1,2,… ,6Fig.4 Time-varying control gains αi(t), i= 1,2,… ,6
本文針對(duì)二階非線(xiàn)性多智能體系統(tǒng)的編隊(duì)控制問(wèn)題,設(shè)計(jì)了具有時(shí)變?cè)鲆娴淖赃m應(yīng)控制協(xié)議。該控制協(xié)議僅依賴(lài)鄰居智能體之間的相對(duì)狀態(tài)信息,無(wú)須知道智能體自身的非線(xiàn)性動(dòng)態(tài)特性或通信拓?fù)鋱D的特征值等全局信息,從而實(shí)現(xiàn)了真正意義上的分布式。通過(guò)對(duì)包含6個(gè)跟隨者和1個(gè)領(lǐng)航者的多智能體系統(tǒng)的編隊(duì)控制進(jìn)行數(shù)值仿真,證實(shí)了該控制協(xié)議的有效性。值得注意的是,本文假設(shè)跟隨者之間的通信拓?fù)鋱D為無(wú)向圖,未來(lái)將持續(xù)研究跟隨者之間的通信拓?fù)鋱D為有向圖的情形。