于 鏑,李 鋮,冷傳英,任偉建
(1.東北石油大學(xué) 電氣信息工程學(xué)院,黑龍江 大慶 163318; 2.大慶石化公司 熱電廠,黑龍江 大慶 163714)
近年來(lái),多智能體協(xié)調(diào)控制作為復(fù)雜系統(tǒng)和控制科學(xué)領(lǐng)域的前沿課題被人們關(guān)注,并且在航空航天、軍事、民用等方面得到廣泛應(yīng)用[1-3].作為多智能體協(xié)調(diào)控制的基本問(wèn)題,一致性問(wèn)題在多機(jī)器人編隊(duì)[4]、群集[5-6]、任務(wù)分配[7]和傳感器網(wǎng)絡(luò)定位[8]等方面起重要作用,目的是通過(guò)設(shè)計(jì)分布式控制協(xié)議,使多智能體網(wǎng)絡(luò)中每個(gè)智能體的最終狀態(tài)趨于一致[9-10].
人們對(duì)個(gè)體動(dòng)態(tài)為一階積分器的多智能體網(wǎng)絡(luò)進(jìn)行研究[11-16].Jadbabaie A等基于最近鄰規(guī)則設(shè)計(jì)簡(jiǎn)單的控制協(xié)議,采用非負(fù)矩陣?yán)碚撚懻摕o(wú)向固定網(wǎng)絡(luò)拓?fù)浜颓袚Q網(wǎng)絡(luò)拓?fù)淝闆r下的一致性問(wèn)題,給出網(wǎng)絡(luò)實(shí)現(xiàn)一致的充分條件[11].在Jadbabaie A等研究基礎(chǔ)上,Olfati-Saber R等給出整個(gè)多智能體網(wǎng)絡(luò)的控制框架,將網(wǎng)絡(luò)一致性和控制系統(tǒng)穩(wěn)定性聯(lián)系起來(lái),分別討論無(wú)向圖、有向平衡圖情況下網(wǎng)絡(luò)的一致性和平均一致性問(wèn)題[12].這些研究為多智能體網(wǎng)絡(luò)一致性分析和控制奠定理論基礎(chǔ).Ren W等進(jìn)一步討論有向拓?fù)渚W(wǎng)絡(luò)的一致性,應(yīng)用矩陣?yán)碚摻o出最終一致解[13],并在Jadbabaie A等結(jié)論基礎(chǔ)上,研究有向切換拓?fù)渚W(wǎng)絡(luò)的一致性[14],拓寬對(duì)網(wǎng)絡(luò)拓?fù)涞南拗?Moreau L基于凸論和設(shè)定值Lyapunov理論研究多智能體網(wǎng)絡(luò)的穩(wěn)定性問(wèn)題[15].Lin Z等為一組移動(dòng)智能體無(wú)向拓?fù)淝闆r下的編隊(duì)問(wèn)題提出3種不同控制方案,最終目標(biāo)是靜態(tài)點(diǎn)[16].王垚等研究智能體網(wǎng)絡(luò)的量化一致性問(wèn)題[17].
目前研究多為考慮無(wú)領(lǐng)航或領(lǐng)航者狀態(tài)恒定的情況,實(shí)際應(yīng)用中,為了更快速有效地完成協(xié)調(diào)任務(wù),在多智能體網(wǎng)絡(luò)中通常存在狀態(tài)時(shí)變的領(lǐng)航智能體.當(dāng)協(xié)調(diào)目標(biāo)為時(shí)變參考軌跡時(shí),即網(wǎng)絡(luò)存在虛擬領(lǐng)航者,如在進(jìn)行多車輛或多機(jī)器人編隊(duì)控制時(shí),編隊(duì)中心的時(shí)變軌跡即為整個(gè)多智能體網(wǎng)絡(luò)的虛擬領(lǐng)航者.由于存在通信范圍和帶寬的限制,網(wǎng)絡(luò)中僅有部分個(gè)體能夠獲取領(lǐng)航者的狀態(tài)信息,因此在部分個(gè)體已知時(shí)變領(lǐng)航者狀態(tài)的情況下,有向拓?fù)渚W(wǎng)絡(luò)一致性問(wèn)題的研究尤為重要.
筆者對(duì)時(shí)變領(lǐng)航情況下多智能體網(wǎng)絡(luò)進(jìn)行一致性分析.首先,設(shè)計(jì)領(lǐng)航狀態(tài)信息為時(shí)變情況下的一致性控制算法,實(shí)現(xiàn)部分智能體已知領(lǐng)航狀態(tài)信息情況下的一致性追蹤,給出實(shí)現(xiàn)一致的充要條件及算法;然后,將此算法拓展至個(gè)體與領(lǐng)航者之間存在狀態(tài)偏差情況,提出基于偏差情況下的分布式控制算法,給出保持恒定偏差的充要條件及算法;最后,應(yīng)用編隊(duì)仿真實(shí)驗(yàn)驗(yàn)證基于2種情況算法的控制協(xié)議的正確性.
網(wǎng)絡(luò)中智能體間的信息交換可用有向或無(wú)向圖G加以描述.首先令λn={1,2,…,n}代表指標(biāo)集,圖G=(V,E)由節(jié)點(diǎn)集V(G)={vi,i∈λn}和邊集E(G)?{(vi,vj):i,j∈λn}構(gòu)成.若(vi,vj)是圖G 的一個(gè)邊,那么vi稱為父節(jié)點(diǎn),vj稱為子節(jié)點(diǎn).在無(wú)向圖中邊均為無(wú)向,即節(jié)點(diǎn)vi和節(jié)點(diǎn)vj能夠互相獲取信息.有向圖是由一系列有序的邊(vi1,vi2),(vi2,vi3),…,(vi2n,vin+1)構(gòu)成,其中vij∈V(G).若邊(vi,vj)存在,表示節(jié)點(diǎn)vj能夠獲取節(jié)點(diǎn)vi的信息,則鄰接矩陣元素aij>0;否則,aij=0,?i,j∈λn.網(wǎng)絡(luò)中智能體之間的拓?fù)潢P(guān)系用Laplacian矩陣L=[lij]∈Rn×n表示,其中
考慮由n+1個(gè)智能體所構(gòu)成的有向網(wǎng)絡(luò),其中第i個(gè)跟隨智能體的動(dòng)態(tài)表示為
式中:xi為第i個(gè)智能體的狀態(tài),xi∈Rn;xi(0)為第i個(gè)智能體的初始狀態(tài);ui為第i個(gè)智能體的控制輸入,ui∈Rn.
為不失一般性,令領(lǐng)航者為第n+1個(gè)智能體的狀態(tài)為xn+1=xr,動(dòng)態(tài)為
式中:xr為領(lǐng)航者的狀態(tài),xr∈Rn;f為非線性函數(shù).
針對(duì)多智能體網(wǎng)絡(luò),在只有部分智能體已知領(lǐng)航時(shí)變狀態(tài)xr(t)的情況下,基于鄰居信息設(shè)計(jì)控制協(xié)議ui,使多智能體網(wǎng)絡(luò)能夠漸近達(dá)成一致.主要考慮2種情況:
定義1 若對(duì)于任意的xi(0),i=1,…,n,當(dāng)t→∞時(shí),有xi(t)→xr(t),則稱該智能體網(wǎng)絡(luò)實(shí)現(xiàn)漸近跟蹤一致.
定義2 若對(duì)于任意的xi(0),i=1,…,n,當(dāng)t→∞時(shí),有xi(t)→xr(t)+其中為第i個(gè)智能體與領(lǐng)航者之間的期望狀態(tài)偏差,則稱該智能體網(wǎng)絡(luò)實(shí)現(xiàn)相對(duì)狀態(tài)保持期望偏差的漸進(jìn)一致.
引理1[13]假設(shè)網(wǎng)絡(luò)狀態(tài)矢量x=[x1,x2,…,xp]T,xi∈R,L∈Rp×p滿足 Laplacian矩陣性質(zhì),情況等價(jià):(1)L有一個(gè)和特征向量lp相對(duì)應(yīng)的簡(jiǎn)單0特征值,其他所有特征值存在正實(shí)部;(2)Lx=0意味著x1=x2=…=xn;(3)系統(tǒng)˙x=-Lx漸進(jìn)趨于一致;(4)L的有向圖存在一個(gè)有向生成樹.
考慮僅有部分智能體在已知時(shí)變領(lǐng)航狀態(tài)xr情況下,多智能體網(wǎng)絡(luò)(1)的跟蹤一致性問(wèn)題.基于鄰居相對(duì)信息,提出一致性算法:
式中:ki為控制增益參數(shù)當(dāng)智能體vi可以收到領(lǐng)航者的狀態(tài)信息時(shí),ai(n+1)>0;否則,ai(n+1)=0.
定理1 考慮多智能體網(wǎng)絡(luò)(1),當(dāng)且僅當(dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸鋾r(shí),采用控制協(xié)議(3),可實(shí)現(xiàn)網(wǎng)絡(luò)的跟蹤一致.
證明:先證充分條件.當(dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸鋾r(shí),由引理1可得-Ln+1x=0,則xi=xj=xn+1≡xr,i,j=1,2,…,n,即網(wǎng)絡(luò)實(shí)現(xiàn)漸近跟蹤一致.
再證必要條件.將控制協(xié)議(3)帶入網(wǎng)絡(luò)動(dòng)態(tài)(1),可得
所以-Ln+1x→0,其中網(wǎng)絡(luò)狀態(tài)矢量為包含領(lǐng)航者在內(nèi)的n+1個(gè)智能體所構(gòu)成網(wǎng)絡(luò)的Laplacian矩陣
由引理1可得xi→xr,i=1,2,…,n,即網(wǎng)絡(luò)實(shí)現(xiàn)跟蹤一致,并且網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸?
在實(shí)際應(yīng)用中,當(dāng)考慮跟隨智能體與領(lǐng)航智能體之間存在恒定距離時(shí),需要考慮相對(duì)狀態(tài)保持期望偏差的漸近一致問(wèn)題.此時(shí)將算法(2)進(jìn)一步拓展,提出一致性算法:
定理2 考慮多智能體網(wǎng)絡(luò)(1),當(dāng)且僅當(dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸鋾r(shí),采用控制協(xié)議(6),可實(shí)現(xiàn)相對(duì)狀態(tài)保持期望偏差的漸近一致.
先證明充分條件.當(dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸鋾r(shí),由引理1可得=1,2,…,n;因?yàn)榧淳W(wǎng)絡(luò)實(shí)現(xiàn)相對(duì)狀態(tài)保持期望偏差的漸近一致.
再證明必要條件.由于式(7)形同于協(xié)議(3),根據(jù)算法(3)必要條件的證明過(guò)程,由定理1可得→xr,i=1,2,…,n時(shí),網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸?,即?dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸?
應(yīng)用仿真實(shí)驗(yàn)驗(yàn)證文中算法的正確性,實(shí)驗(yàn)中實(shí)例1和實(shí)例2分別針對(duì)算法(3)和算法(6)進(jìn)行網(wǎng)絡(luò)一致性仿真研究,實(shí)例3應(yīng)用算法(6)進(jìn)行多車輛網(wǎng)絡(luò)的編隊(duì)控制.智能體之間的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)見(jiàn)圖1,網(wǎng)絡(luò)中共5個(gè)智能體,其中L代表多智能體網(wǎng)絡(luò)中的虛擬領(lǐng)航者,F(xiàn)i(i=1,2,3,4)分別代表多智能體網(wǎng)絡(luò)中的第i個(gè)跟隨者.
實(shí)例1有向網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)見(jiàn)圖1(a).由圖1(a)可見(jiàn),只有智能體1和2能夠收到領(lǐng)航智能體的狀態(tài)信息,并且該有向拓?fù)渚哂杏邢蛏蓸?,滿足定理1條件.令虛擬領(lǐng)航者的狀態(tài)為時(shí)變函數(shù)f(t,xr)=cos t,針對(duì)多智能體網(wǎng)絡(luò)(1)采用控制算法(3),得到各個(gè)智能體的狀態(tài)變量軌跡(見(jiàn)圖2).由圖2可見(jiàn),所有智能體的狀態(tài)漸近趨于一致,并且收斂于領(lǐng)航者的狀態(tài),實(shí)現(xiàn)一致性跟蹤,與定理1結(jié)論符合.
實(shí)例2有向網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)見(jiàn)圖1(b).由圖1(b)可知,只有智能體1能夠收到領(lǐng)航智能體的狀態(tài)信息,并且該有向拓?fù)渚哂杏邢蛏蓸?,滿足定理2條件.令虛擬領(lǐng)航者的狀態(tài)為時(shí)變函數(shù)f(t,xr)=cos t,并且令第i個(gè)智能體與領(lǐng)航狀態(tài)位置的理想偏差為δei=1-i,i=1,2,3,4.針對(duì)多智能體網(wǎng)絡(luò)(1)采用控制算法(6),得到各個(gè)智能體的狀態(tài)變量軌跡(見(jiàn)圖3).由圖3可見(jiàn),所有智能體的狀態(tài)與領(lǐng)航者狀態(tài)通過(guò)快速調(diào)整之后漸近保持恒定偏差,實(shí)現(xiàn)相對(duì)狀態(tài)保持期望偏差的漸近一致,與定理2結(jié)論符合.
實(shí)例3驗(yàn)證算法(6)在多智能體網(wǎng)絡(luò)編隊(duì)控制中的有效性,考慮由4個(gè)移動(dòng)車輛所構(gòu)成網(wǎng)絡(luò)的編隊(duì)控制,有 向 網(wǎng) 絡(luò) 拓 撲 見(jiàn) 圖 1(b).令 xr=[30sin(πt/100),20sin(πt/50)],為編隊(duì)中心,4個(gè)移動(dòng)車輛與編隊(duì)中心的期望偏差為編隊(duì)隊(duì)形在t為0,10,20,25,30,35s時(shí)的隊(duì)形見(jiàn)圖4.由圖4可見(jiàn),在初始時(shí)刻,車輛之間隊(duì)形不規(guī)則,在左右車輛網(wǎng)絡(luò)漸近具有理想編隊(duì)隊(duì)形,并且在t為20s后一直保持穩(wěn)定的理想隊(duì)形.
針對(duì)一階多智能體網(wǎng)絡(luò)在有向固定通信拓?fù)淝闆r下,只有部分個(gè)體已知時(shí)變領(lǐng)航參考狀態(tài)的一致性問(wèn)題,提出一致性控制協(xié)議,并通過(guò)圖論、矩陣論及穩(wěn)定性理論提出實(shí)現(xiàn)跟蹤時(shí)變領(lǐng)航一致的充要條件及控制算法.將該控制算法拓展到智能體間具有固定相對(duì)狀態(tài)偏差的情況,給出實(shí)現(xiàn)具有固定相對(duì)偏差一致的充要條件及控制算法,并將該控制算法應(yīng)用到多移動(dòng)車輛網(wǎng)絡(luò)編隊(duì)控制中.通過(guò)3個(gè)實(shí)例仿真實(shí)驗(yàn)驗(yàn)證基于文中算法的控制協(xié)議,實(shí)例1驗(yàn)證當(dāng)且僅當(dāng)網(wǎng)絡(luò)拓?fù)渚哂杏邢蛏蓸鋾r(shí),文中算法控制協(xié)議可以解決部分智能體在已知時(shí)變參考狀態(tài)情況下的一致性追蹤問(wèn)題;實(shí)例2應(yīng)用基于拓展算法的控制協(xié)議,驗(yàn)證所有智能體的狀態(tài)與領(lǐng)航者狀態(tài)能夠漸近保持恒定偏差,實(shí)現(xiàn)相對(duì)狀態(tài)保持期望偏差的漸近一致;實(shí)例3將相對(duì)狀態(tài)偏差算法引入到多車輛的編隊(duì)控制中,拓展多智能體編隊(duì)的控制方法.
(References):
[1]Zou Yunfei,Prabhakar R P.Distributed formation control of multiple aircraft using constraint forces[C].Seattle:American Control Conf.,2008:644-649.
[2]Liu Huagang,F(xiàn)ang Hao,Mao Yutian.Distributed flocking control and obstacle avoidance for multiagent systems[C].Xuzhou:Chinese Control Conf.,2010:4536-4541.
[3]Yan Jing,Guan Xinping,Luo Xiaoyuan.Multi-target pursuit formation of multi-agent systems[J].Chinese Physics B,2011,20(1):698-707.
[4]Jos'e Rodrigues,Dario Figueira.Leader-following graphbased distributed formation control[C].Aveiro:Proceedings of Robotica,2008:71-77.
[5]Olfati-Saber R.Flocking for multi-agent dynamic systems:algorithmsand theory [J].IEEE Transactions on Automatic Control,2006,51(3):401-420.
[6]Tanner H G,Jadbabaie A,Pappas G J.Stable flocking of mobile agents,partⅡ:dynamic topology[C].Hawaii:Proceedings of the IEEE Conference on Decision and Control,2003:2016-2021.
[7]Alighanbari M,How J.Decentralized task assignment for unmanned air vehicles[C].Seville:Proceedings of IEEE Conference on Decision and Control,2005:5668-5673.
[8]Olfati-Saber R,Shamma J S.Consensus filters for sensor networks and distributed sensor fusion[C].Seville:Proceed-ings of IEEE Conference on Decision and Control,2005:6698-6703.
[9]Ren W,Beard R W,Atkins E M.Information consensus in multivehicle cooperative control[J].IEEE Control Syst.Mag.,2007,27(2):71-82.
[10]Olfati-Saber R,F(xiàn)ax J A,Murray R M.Consensus and cooperation in networked multi-agent systems[J].IEEE Transactions on Automatic Control,2007,46(3):215-233.
[11]Jadbabaie A,Lin J,Morse A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[12]Olfati-Saber R,Murray R M.Consensus problems in networks of agents with switch in topology and time-delays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[13]Ren W,Beard R W,McLain T W.Coordination variables and consensus building in multiple vehicle systems[M].Lecture Notes in Control and Information Sciences,New York:Springer-Verlag,2004:171-188.
[14]Ren W,Beard R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies[J].IEEE Transactions on Automatic Control,2005,50(5):655-661.
[15]Moreau L.Stability of multi-agent systems with time-dependent communication links[J].IEEE Transactions on Automatic Control,2005,50(2):169-182.
[16]Lin Z,Broucke M,F(xiàn)rancis B.Local control strategies for groups of mobile autonomous agents[J].IEEE Transactions on Automatic Control,2004,49(4):622-629.
[17]王垚,伍清河,王寅秋.切換拓?fù)湟浑A積分器網(wǎng)絡(luò)量化趨同控制[J].控制與決策,2013,28(3):429-433.Wang Yao,Wu Qinghe,Wang Yinqiu.Quantized consensus of first-order Integrator networks with switehing topologies[J].Control and Decision,2013,28(3):429-433.
[18]紀(jì)良浩,廖曉峰.具有不同時(shí)延的多智能體系統(tǒng)一致性分析[J].物理學(xué)報(bào),2012,61(15):150-202.Ji Lianghao,Liao Xiaofeng.Consensus analysis of multi-agant system with multiple time delays[J].Acta Physica Sinica,2012,61(15):150-202.