夏倩倩,劉開恩,紀(jì)志堅(jiān)
近幾年,由于多智能體系統(tǒng)一致性問題在機(jī)器人編隊(duì)問題[1]、群集運(yùn)動問題[2]等方面得到廣泛應(yīng)用,這一問題成為了當(dāng)前控制領(lǐng)域的研究重點(diǎn)。一致性控制就是設(shè)計(jì)一個一致性協(xié)議使得所有智能體的狀態(tài)漸近達(dá)到一個共同的值。許多學(xué)者已經(jīng)研究了在拓?fù)渚W(wǎng)絡(luò)、非線性、時滯等約束條件下,以一階、二階或高階動力學(xué)方程為模型的多智能體系統(tǒng)的一致性問題[3-7]。
用基于事件觸發(fā)控制代替時間觸發(fā)控制具有十分重要的意義[8]。通過與時間觸發(fā)控制的比較發(fā)現(xiàn),基于事件觸發(fā)控制在減少通信次數(shù)方面具有明顯的優(yōu)點(diǎn),在多數(shù)情況下,基于事件觸發(fā)控制要優(yōu)于傳統(tǒng)的時間觸發(fā)控制[9]。2013年,X.Y.Meng等[10]在固定拓?fù)渚W(wǎng)絡(luò)下針對特定事件設(shè)計(jì)了一致性協(xié)議來探索多智能體系統(tǒng)的一致性問題,隨后又提出了在切換拓?fù)渚W(wǎng)絡(luò)下的基于事件的一致性協(xié)議。2014年,王航飛等[1]將基于事件觸發(fā)控制應(yīng)用到了環(huán)形編隊(duì)問題中;2016年,K.Liu等[11]基于一致性理論研究成果研究了一階和二階多智能體系統(tǒng)在有向圖下基于事件的包容控制問題,基于一定的事件,智能體決定何時傳遞狀態(tài)給它的鄰居,并且利用這些采樣狀態(tài)設(shè)計(jì)了分布式協(xié)議,從而使得跟隨者最終收斂到領(lǐng)導(dǎo)者所形成的凸包中;Y.Fan等[12]對進(jìn)行周期采樣的多智能體系統(tǒng)設(shè)計(jì)了基于事件一致性協(xié)議,并且在此基礎(chǔ)上設(shè)計(jì)了自觸發(fā)一致性協(xié)議來減少通信次數(shù)和采樣次數(shù);2017年,W.Zhu等[13]研究了二階多智能體系統(tǒng)在離散時間情況下的基于事件觸發(fā)控制的一致性問題,通過自觸發(fā)方式避免了觀察智能體及其鄰居在所有離散時刻的狀態(tài);文獻(xiàn)[14]針對二階多智能體系統(tǒng)提出了基于事件觸發(fā)控制的一致性協(xié)議,對固定有向拓?fù)渚W(wǎng)絡(luò)下的系統(tǒng)一致性問題進(jìn)行了分析;2013年,胡春健[15]采用事件驅(qū)動控制方法,研究了一類一般線性多智能體系統(tǒng)的一致性問題,研究方法上不再要求拉普拉斯矩陣具有對稱性,并獲得了一類線性多智能體系統(tǒng)達(dá)到一致的充分條件;2016年,D.P.Yang等[16]研究了一般線性多智能體系統(tǒng)在有向圖中的基于事件觸發(fā)控制的一致性問題,基于狀態(tài)反饋,采用分布式事件觸發(fā)一致性協(xié)議使得所有智能體都實(shí)現(xiàn)了一致性,不需要智能體之間進(jìn)行連續(xù)通信;文獻(xiàn)[17]研究了一般線性模型多智能體系統(tǒng)在基于事件觸發(fā)情況下的采樣數(shù)據(jù)一致性問題,分別設(shè)計(jì)了固定和切換拓?fù)淝闆r下的分布式事件觸發(fā)策略。
雖然利用一階鄰居信息研究多智能體系統(tǒng)的一致性較為普遍,但由于系統(tǒng)的復(fù)雜性,為了提高系統(tǒng)的收斂速率,許多學(xué)者開始利用二階鄰居信息對多智能體系統(tǒng)的一致性問題進(jìn)行研究。2010年,D.Yuan等[18]研究了一階多智能體系統(tǒng)利用二階鄰居信息來加速分布式平均一致性的問題,解決了在離散和連續(xù)時間情況下的加速平均一致性問題,并發(fā)現(xiàn)了利用二階鄰居信息要比只使用一階鄰居信息的協(xié)議收斂速度快;不同于Z.Liu等[19]在2010年利用全局信息對多智能體系統(tǒng)的一致性進(jìn)行研究的結(jié)果,文中只需要利用一階和二階鄰居信息來研究一階多智能體系統(tǒng)的一致性問題,結(jié)合二階鄰居信息和事件觸發(fā)條件,通過對一階多智能體系統(tǒng)加速平均一致性問題的研究來提高網(wǎng)絡(luò)收斂速度;2017年,王康等[20]為了研究一階多智能體系統(tǒng)的一致性特點(diǎn)及能控、能觀性保持策略,分析了具有時變拓?fù)浣Y(jié)構(gòu)的多智能體系統(tǒng)在一階鄰居和二階鄰居協(xié)議下的一致性速度,并且得出了系統(tǒng)在二階鄰居協(xié)議下具有更快的收斂速度的結(jié)論;2014年,H.Pan等[21]證明了在二階動力學(xué)方程下利用二階鄰居信息并不一定能夠加速一致性速度,一致性速度還和二階鄰居協(xié)議的參數(shù)有關(guān)系。
本文將針對一類一階多智能體系統(tǒng)的一致性問題展開研究,通過合理設(shè)計(jì)事件觸發(fā)條件和一致性協(xié)議得到事件觸發(fā)時刻序列,并獲得使系統(tǒng)達(dá)到一致性的條件。本文采用的是文獻(xiàn)[10]中的研究模型。
設(shè)智能體vi的事件觸發(fā)判定條件為
在每個采樣時刻,每個智能體都傳遞自己的狀態(tài)信息給它的一階鄰居和二階鄰居并且也接收來自它一階鄰居和二階鄰居的狀態(tài)信息用于事件檢測。如果條件(2)滿足,那么智能體vi不需要更新自己的控制輸入;否則,vi將更新它自己的控制輸入并且通知它的一階鄰居和二階鄰居利用vi當(dāng)前的狀態(tài)信息來更新它們的控制輸入,同時將誤差置于零,這時就滿足了條件(2)。也即vi的事件觸發(fā)時刻為
為了減少符號的復(fù)雜程度,定義
根據(jù)定義的符號,考慮利用二階鄰居信息構(gòu)造一致性協(xié)議,由此給出下面的基于事件一致性協(xié)議:
暫且假設(shè)系統(tǒng)具有固定拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu),由協(xié)議(3)式得到智能體vi的閉環(huán)系統(tǒng)為
在無向連通圖中,由于L的非對角線元素不大于零,主對角線元素大于等于零且行和為零,具有相同的性質(zhì),容易得到具有同樣的性質(zhì),所以仍為拉普拉斯矩陣。
考慮系統(tǒng)的平均狀態(tài):
δ(t)=x(t)?ˉx(t)1n=x(t)?ˉx1n
考慮李雅普諾夫函數(shù)
即狀態(tài)的平方和的1/2。
引理 2 (Lasalle不變原理) 設(shè)C是有界閉集,從C內(nèi)出發(fā)的系統(tǒng)的解,若存在,具有連續(xù)一階偏導(dǎo)數(shù),滿足。又設(shè) ,是最大不變集,則當(dāng)時,有。
定理 1 設(shè)系統(tǒng)(1)具有連通通信拓?fù)?,采用協(xié)議(3)的系統(tǒng)(1)在事件觸發(fā)條件(2)的驅(qū)動下,若條件
結(jié)合事件觸發(fā)條件(2)得到
結(jié)合事件觸發(fā)條件(2)得到
在這部分中,將固定拓?fù)渚W(wǎng)絡(luò)下的研究結(jié)果擴(kuò)展到了G在連通圖之間切換的情況,假定所有可能的連通圖構(gòu)成有限集,定義下標(biāo)集,引入一個分段常數(shù)切換信號來描述t時刻系統(tǒng)具有的拓?fù)浣Y(jié)構(gòu),表示在采樣觸發(fā)時刻rh時的活動拓?fù)?,表示其對?yīng)的由一階和二階鄰居所確定的拉普拉斯矩陣。
在切換拓?fù)淝闆r下,根據(jù)(2)式和(3)式類似地定義事件觸發(fā)條件和基于事件的一致性協(xié)議。在切換拓?fù)淝樾蜗?,李雅普諾夫函數(shù)不變,仍是
定理 2 設(shè)系統(tǒng)(1)式的通信拓?fù)渚W(wǎng)絡(luò)在有限個連通圖之間進(jìn)行切換,采用協(xié)議(3)式的系統(tǒng)(1)式在事件觸發(fā)條件(2)式的驅(qū)動下,若滿足下列條件
或者
通過與文獻(xiàn)[10]的比較發(fā)現(xiàn):即使多智能體系統(tǒng)(1)只采用一階鄰居信息用于研究系統(tǒng)的一致性收斂問題,與文獻(xiàn)[10]的采樣周期相比,本文所提出的采樣周期的選取范圍也比文獻(xiàn)[10]中的采樣周期選取范圍更大。
在理論分析的基礎(chǔ)上,本部分將通過仿真實(shí)驗(yàn)對所得出的理論結(jié)果進(jìn)行驗(yàn)證。
考慮由4個智能體組成的多智能體系統(tǒng),為了便于比較,采用與文獻(xiàn)[10]相同的通信拓?fù)浜蛥?shù)。圖1是無向連通圖,其利用二階鄰居信息所得的拉普拉斯矩陣為
圖1 通信拓?fù)鋱DFig. 1 Communication topology
圖2 是所有智能體在基于事件一致性協(xié)議(3)下的狀態(tài)演變,從圖2可以看出系統(tǒng)達(dá)到了一致,所有智能體的狀態(tài)趨于一個共同的值。
圖2 智能體的狀態(tài)Fig. 2 States of the agents
圖3 是所有智能體在基于事件一致性協(xié)議(3)下的非一致向量的演變過程,從圖3可以看出所有智能體的狀態(tài)都趨于它們的初始狀態(tài)平均值。
圖3 非一致向量范數(shù)Fig. 3 Norm of the disagreement vector
圖4 是所有智能體在基于事件一致性協(xié)議(3)下的控制輸入的仿真結(jié)果,最終所有智能體的控制輸入都趨于0。
圖5是所有智能體在基于事件一致性協(xié)議(3)下的事件觸發(fā)時刻,說明只在特定時刻對智能體施加控制輸入系統(tǒng)就能實(shí)現(xiàn)一致性。
圖6和圖7分別是文獻(xiàn)[7]中所有智能體利用一階鄰居信息在基于事件一致性協(xié)議下的狀態(tài)和非一致向量的演變過程。
圖4 智能體的控制輸入Fig. 4 Control inputs for the agents
圖5 智能體的事件觸發(fā)時刻Fig. 5 Event times for the agents
圖6 智能體的狀態(tài)Fig. 6 States of the agents
圖7 非一致向量范數(shù)Fig. 7 Norm of the disagreement vector
從圖2可以看出所有智能體大約在t=1 s這一時刻收斂到了相同的值,從圖6可以看出所有智能體大約在t=3 s這一時刻收斂到了相同的值,通過比較可以發(fā)現(xiàn)利用二階鄰居信息之后所有智能體的狀態(tài)達(dá)到一致性的速度更快。同樣通過比較非一致性向量范數(shù),我們發(fā)現(xiàn)圖3在利用了二階鄰居信息之后所有智能體的狀態(tài)趨于它們的初始狀態(tài)平均值的速度明顯比圖7只利用一階鄰居信息時所有智能體的狀態(tài)趨于它們的初始狀態(tài)平均值的速度快。
下面給出在切換拓?fù)渚W(wǎng)絡(luò)下的仿真實(shí)驗(yàn)。
考慮由4個智能體組成的多智能體系統(tǒng)在圖G1和圖G2之間進(jìn)行切換,切換時刻是隨機(jī)的,如圖8所示。取智能體的事件檢測器的參數(shù)為所有智能體的采樣周期為,智能體初始狀態(tài)為,在進(jìn)行仿真。
圖8 切換拓?fù)鋱DFig. 8 Switching topology
圖9 是所有智能體在基于事件一致性協(xié)議(3)下的狀態(tài)演變,可以看出在切換拓?fù)渚W(wǎng)絡(luò)下所有智能體的狀態(tài)仍可以收斂到一個相同的值。
圖9 智能體的狀態(tài)Fig. 9 States of the agents
圖10 是所有智能體在基于事件一致性協(xié)議(3)下的事件觸發(fā)時刻。
圖10 智能體的事件觸發(fā)時刻Fig. 10 Event times for the agents
本文首先在特定事件條件下利用二階鄰居信息設(shè)計(jì)了一階多智能體系統(tǒng)在固定拓?fù)渚W(wǎng)絡(luò)下的一致性協(xié)議,利用李雅普諾夫函數(shù),設(shè)計(jì)采樣數(shù)據(jù)事件檢測器使?fàn)顟B(tài)漸近收斂到它們的初始狀態(tài)平均值,發(fā)現(xiàn)多智能體系統(tǒng)利用二階鄰居信息能夠加快一致性收斂速度。在固定拓?fù)渚W(wǎng)絡(luò)研究結(jié)果的基礎(chǔ)上,同樣給出在切換拓?fù)渚W(wǎng)絡(luò)下的基于事件一致性結(jié)果,最后利用仿真加以說明。以后將在二階動力學(xué)方程下利用特定的事件觸發(fā)條件來研究多智能體系統(tǒng)的一致性問題。
[1]王航飛, 禹梅, 謝廣明. 基于事件驅(qū)動的環(huán)形編隊(duì)多智能體系統(tǒng)[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2014, 34(7): 815–827.WANG Hangfei, YU Mei, XIE Guangming. Event-driven circle formation control for multi-agent systems[J]. Journal of systems science and mathematical sciences, 2014, 34(7):815–827.
[2]莊昊, 楊洪勇. 聯(lián)合連通拓?fù)湎碌亩A多自主體系統(tǒng)有限時間包容控制[J]. 智能系統(tǒng)學(xué)報(bào), 2017, 12(2): 188–195.ZHUANG Hao, YANG Hongyong. Finite-time containment control of second-order multi-agent systems with jointly connected topologies[J]. CAAI transactions on intelligent systems, 2017, 12(2): 188–195.
[3]OLFATI-SABER R, MURRAY R M. Consensus problems in networks of agents with switching topology and timedelays[J]. IEEE transactions on automatic control, 2004,49(9): 1520–1533.
[4]俞輝, 蹇繼貴, 王永驥. 多智能體時滯網(wǎng)絡(luò)的加權(quán)平均一致性[J]. 控制與決策, 2007, 22(5): 558–561.YU Hui, JIAN Jigui, WANG Yongji. Weighted average consensus for networks of multi-agent with time -delays[J].Control and decision, 2007, 22(5): 558–561.
[5]GUO Meng, D V DIMAROGONAS. Nonlinear consensus via continuous, sampled, and aperiodic updates[J]. International journal of control, 2013, 86(4): 567–578.
[6]LI Hongjie, ZHU Yinglian, WANG Jietai, et al. Consensus of nonlinear second-order multi-agent systems with mixed time-delays and intermittent communications[J]. Neurocomputing, 2017, 251(16): 115–126.
[7]REZAEEA H, ABDOLLAHIA F. Discrete-time consensus strategy for a class of high-order linear multiagent systems under stochastic communication topologies[J]. Journal of the franklin institute, 2017, 354(9): 3690–3705.
[8]LUNZE J, LEHMANN D. A state-feedback approach to event-based control[J]. Automatica, 2010, 46(1): 211–215.
[9]MENG Xiangyu, CHEN Tongwen. Optimal sampling and performance comparison of periodic and event based impulse control[J]. IEEE transactions on automatic control,2012, 57(12): 3252–3259.
[10]MENG Xiangyu, CHEN Tongwen. Event based agreement protocols for multi-agent networks[J]. Automatica, 2013,49(7): 2125–2132.
[11]LIU Kaien, JI Zhijian, XIE Guangming, et al. Event-based broadcasting containment control for multi-agent systems under directed topology[J]. International journal of control,2016, 89(11): 2360–2370.
[12]FAN Yuan, YANG Yong, ZHANG Yang. Sampling-based event-triggered consensus for multi-agent systems[J].Neurocomputing, 2016, 191: 141–147.
[13]ZHU Wei, PU Huizhu, WANG Dandan, et al. Event-based consensus of second-order multi-agent systems with discrete time[J]. Automatica, 2017, 79: 78–83.
[14]黃紅偉, 黃天民. 基于事件觸發(fā)的二階多智能體領(lǐng)導(dǎo)跟隨一致性[J]. 控制與決策, 2016, 31(5): 835–841.HUANG Hongwei, HUANG Tianmin. Leader-following consensus of second-order multi-agent systems via eventtriggered control[J]. Control and decision, 2016, 31(5):835–841.
[15]胡春健. 基于事件驅(qū)動的一般線性多智能體系統(tǒng)的一致性[J]. 重慶郵電大學(xué)學(xué)報(bào): 自然科學(xué)版, 2013, 25(4):549–562.HU Chunjian. Event-based consensus of general linear multi-agent systems[J]. Journal of chongqing university of posts and telecommunications: Natural science edition,2013, 25(4): 549–562.
[16]YANG Dapeng, REN Wei, LIU Xiaodong, et al. Decentralized event-triggered consensus for linear multi-agent systems under general directed graphs[J]. Automatica,2016, 69: 242–249.
[17]張協(xié)衍. 網(wǎng)絡(luò)化多智能體系統(tǒng)的一致性研究[D]. 長沙:湖南大學(xué), 2015: 75-102.ZHANG Xieyan. Consensus problem of network multiagent systems[D]. Changsha: Hunan university, 2015: 75-102.
[18]YUAN Deming, XU Shengyuan. Accelerating distributed average consensus by exploring the information of secondorder neighbors[J]. Physics letters A, 2010, 374(24): 2438–2445.
[19]LIU Zhongxin, CHEN Zengqiang. Event-triggered average-consensus for multi-agent systems[J]. Proceedings of the 29th chinese control conference, 2010, 57(12): 4506–4511.
[20]王康, 紀(jì)志堅(jiān), 晁永翠. 二階鄰居協(xié)議下多智能體系統(tǒng)能控能觀性保持[J]. 智能系統(tǒng)學(xué)報(bào), 2017, 12(02): 213–220.WANG Kang, JI Zhijian, CHAO Yongcui. A control Strategy for maitaining controllability and observability of a multi-agent system with the second-order neighborhood protocol[J]. CAAI transactions on intelligent systems,2017, 12(02): 213–220.
[21]PAN Huan, NIAN Xiaohong. Second-order consensus in multi-agent systems based on second-order neighbours’information[J]. International journal of systems science,2014, 45(5): 902–914.
[22]HORN R A , JOHNSON C R. Matrix analysis[M]. Cambridge university press, 2012: 344.