李 麗,王 佳,胡鴻翔
(杭州電子科技大學(xué)理學(xué)院,浙江 杭州 310018)
多智能體系統(tǒng)在電力系統(tǒng)控制、交通控制等領(lǐng)域應(yīng)用廣泛。一致性[1]一直是該領(lǐng)域的研究核心,即通過個(gè)體間信息交互使得所有個(gè)體狀態(tài)最終達(dá)成共識(shí)。在多智能體系統(tǒng)中,個(gè)體間頻繁的信息交互占用了大量網(wǎng)絡(luò)資源,甚至導(dǎo)致系統(tǒng)崩潰[2]。事件觸發(fā)機(jī)制通過設(shè)計(jì)個(gè)體間信息交互的事件來減少其交互頻次,節(jié)約了網(wǎng)絡(luò)資源[3]。文獻(xiàn)[4]比較分析了事件觸發(fā)采樣與傳統(tǒng)周期采樣,研究發(fā)現(xiàn),事件觸發(fā)采樣可有效降低系統(tǒng)狀態(tài)更新頻率和個(gè)體之間的信息通信頻次。Hu等[5]研究了二階多智能體系統(tǒng)的一致性問題,設(shè)計(jì)的集中式事件觸發(fā)機(jī)制需要每個(gè)個(gè)體的狀態(tài)信息。Dimarogonas等[6]從分布式策略出發(fā),針對(duì)每個(gè)個(gè)體,設(shè)計(jì)了各自的事件觸發(fā)機(jī)制,進(jìn)而解決了漸近一致性問題。與集中式事件觸發(fā)機(jī)制相比,這類分布式事件觸發(fā)機(jī)制只需要個(gè)體的鄰居狀態(tài)信息,更具操作性。進(jìn)一步地,Fan等[7]在事件觸發(fā)機(jī)制中引入“組合測(cè)量”法,不僅有效減少了個(gè)體間的交互更新的頻率,而且保證了每個(gè)個(gè)體收斂性能的一致性。文獻(xiàn)[8-9]將事件觸發(fā)機(jī)制引入領(lǐng)導(dǎo)者跟隨的多智能體系統(tǒng)中,提出一種基于事件觸發(fā)機(jī)制的分布式跟蹤方案,成功實(shí)現(xiàn)了領(lǐng)導(dǎo)者跟蹤一致性。針對(duì)二階個(gè)體,Hu等[10]研究了二階個(gè)體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性問題。值得注意的是,在實(shí)際網(wǎng)絡(luò)中,個(gè)體間不僅具有合作關(guān)系,還有競爭關(guān)系,研究合作競爭網(wǎng)絡(luò)中的群集行為更具現(xiàn)實(shí)意義。Hu等[11]在合作競爭網(wǎng)絡(luò)中研究一致性問題,設(shè)計(jì)了一種新穎的帶有通信時(shí)延的事件觸發(fā)機(jī)制。本文探討合作競爭網(wǎng)絡(luò)中帶有事件觸發(fā)項(xiàng)的線性系統(tǒng)的分布式兩分跟蹤問題,設(shè)計(jì)了一種新型事件觸發(fā)機(jī)制下的分布式協(xié)議,實(shí)現(xiàn)了多智能體系統(tǒng)的分布式兩分跟蹤,并排除了Zeno現(xiàn)象。
針對(duì)網(wǎng)絡(luò)拓?fù)?本文采用加權(quán)圖G={V,ε,A}來刻畫,其中V={1,…,N}是個(gè)體集,ε=V×V是邊集,且A=[aij]∈RN×N是圖G的權(quán)重矩陣,aij≠0?{j,i}∈ε。本文中,所研究的圖是沒有自環(huán)的,即aii=0,?i∈V,同時(shí)非零權(quán)重可正可負(fù),負(fù)權(quán)重代表相應(yīng)個(gè)體間為競爭關(guān)系。若矩陣是對(duì)稱的,則網(wǎng)絡(luò)拓?fù)涫菬o向的。圖中路徑指的是從圖上一點(diǎn)到另外一點(diǎn)所經(jīng)過的不會(huì)重合的點(diǎn)和邊的集合,如果任何2個(gè)不同的個(gè)體間都有1條路徑,則稱網(wǎng)絡(luò)拓?fù)鋱DG是連通的。個(gè)體i的鄰居集定義為Ni={j∈V|aij≠0,j≠i}。注意到權(quán)重符號(hào)有正負(fù),邊集ε可分解為ε+與ε-,其中ε+={(j,i)|aij>0},ε-={(j,i)|aij<0}。
定義1對(duì)于合作競爭網(wǎng)絡(luò)圖G,如果存在一組個(gè)體集的劃分{V1,V2}滿足V1∪V2=V和V1∩V2=Φ,使得對(duì)于任意的i,j∈Vm(m∈{1,2}),aij≥0,并且對(duì)于任意的i∈Vm,j∈Vn,m≠n(m,n)∈{1,2},aij<0,則稱合作競爭網(wǎng)絡(luò)圖G是結(jié)構(gòu)平衡的。
引理1[12]合作競爭網(wǎng)絡(luò)圖G是結(jié)構(gòu)平衡的當(dāng)且僅當(dāng)存在一個(gè)規(guī)范變換[13]矩陣D=diag{d1,d2,…,dn},其中的元素di∈{1,-1},使得DAD中的元素都非負(fù)。其中D對(duì)G中節(jié)點(diǎn)集提供了一個(gè)劃分,V1={i|di=1},V2={i|di=-1}。
對(duì)于對(duì)稱矩陣H∈RN×N,λmin(H),λmax(H)分別表示其最小特征值和最大特征值。?代表相應(yīng)矩陣的克羅內(nèi)克積。1N=[1,…,1]∈RN。
本文主要研究領(lǐng)導(dǎo)跟隨者框架下的分布式兩分跟蹤問題,其中領(lǐng)導(dǎo)者的動(dòng)力學(xué)方程為:
(1)
式中,x0(t)∈Rn表示領(lǐng)導(dǎo)者狀態(tài),A∈Rn×n是一個(gè)常量矩陣。在研究框架下,共有N個(gè)跟隨者,其動(dòng)力學(xué)方程為:
(2)
式中,xi(t)∈Rn表示跟隨者i的狀態(tài),ui(t)∈Rm表示施加在個(gè)體i的分布式協(xié)議,B∈Rn×m是常量矩陣。
根據(jù)系統(tǒng)中個(gè)體間的合作競爭關(guān)系,本文將分布式控制協(xié)議設(shè)計(jì)為:
(3)
式中,K為分布式增益矩陣。xi(t)-xj(t)代表個(gè)體i與其合作鄰居間的信息交互,xi(t)+xj(t)代表個(gè)體i與其競爭鄰居間的信息交互,xi(t)-dix0(t)代表個(gè)體i與領(lǐng)導(dǎo)者間的信息交互。顯然當(dāng)ai0=0時(shí),個(gè)體i與領(lǐng)導(dǎo)者之間是沒有信息交互的。
(4)
式中,H=L+M。為便于理論分析,本文有如下2個(gè)假設(shè)。
假設(shè)1矩陣對(duì)(A,B)是可控的。
假設(shè)2對(duì)于任意一個(gè)跟隨者i,存在領(lǐng)導(dǎo)者到該跟隨者的一條路徑。
根據(jù)線性系統(tǒng)理論,在假設(shè)1下,對(duì)于任何給定的正定矩陣Q,存在唯一的正定矩陣P,使得ATP+PA-PBBTP+Q=0。進(jìn)一步地,在假設(shè)2下,H為正定矩陣。因此,存在一個(gè)正數(shù)l,使得lλmin(H)≥1。
(5)
(6)
因此,有:
(7)
(8)
(9)
(10)
(11)
(12)
式中,控制增益為K=lBTP。
進(jìn)一步設(shè)計(jì)事件觸發(fā)機(jī)制如下:
(13)
首先給出兩分一致跟蹤的定義。
定理 由系統(tǒng)(1)和系統(tǒng)(2)組成的多智能體系統(tǒng)中,其控制協(xié)議形如式(9),個(gè)體間的事件觸發(fā)時(shí)刻由式(13)決定。在假設(shè)1和假設(shè)2前提下,針對(duì)無向連通且結(jié)構(gòu)平衡的合作競爭網(wǎng)絡(luò),多智能體系統(tǒng)可漸近實(shí)現(xiàn)兩分一致跟蹤,并且不存在Zeno現(xiàn)象。
(14)
(15)
(16)
由于,
(17)
式(16)可改寫為:
(18)
所以,有:
(19)
(20)
(21)
τ>0表明事件觸發(fā)時(shí)間間隔存在正下界,也說明該事件觸發(fā)機(jī)制不存在Zeno現(xiàn)象。證畢。
用一個(gè)具體數(shù)值仿真實(shí)例來驗(yàn)證定理和理論推導(dǎo)的正確性。
1個(gè)由7個(gè)個(gè)體組成的合作競爭網(wǎng)絡(luò),0代表領(lǐng)導(dǎo)者,1~6代表跟隨個(gè)體,其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖如圖1所示,其中實(shí)線邊的權(quán)重為正,表示合作關(guān)系;虛線邊的權(quán)重為負(fù),表示競爭關(guān)系。顯然,合作競爭網(wǎng)絡(luò)G1是結(jié)構(gòu)平衡的,即V1={1,2,3},V2={4,5,6},進(jìn)而對(duì)應(yīng)的規(guī)范變換矩陣為D=diag(1,1,1,-1,-1,-1),個(gè)體1和個(gè)體5可以直接獲得領(lǐng)導(dǎo)者的信息。根據(jù)圖1可以得到拉普拉斯矩陣L以及矩陣H,
圖1 通信拓?fù)鋱D
多智能體系統(tǒng)的個(gè)體狀態(tài)方程如下:
(22)
(23)
其中,取m=1,a=1,g=9.8,且
圖2 集中式事件驅(qū)動(dòng)的智能體狀態(tài)軌跡圖
圖3 集中式事件驅(qū)動(dòng)的觸發(fā)時(shí)刻
從圖2可以看出,隨著演化時(shí)間的變化,跟隨者與領(lǐng)導(dǎo)者的狀態(tài)最終呈現(xiàn)為數(shù)值相同,符號(hào)相反,實(shí)現(xiàn)了兩分一致性跟蹤的目標(biāo)。從圖3可以看出,智能體之間的通信次數(shù)減少,有效降低了通信成本。綜上分析可知,在滿足相應(yīng)條件和相應(yīng)控制器的情況下,合作競爭網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中的個(gè)體最終可漸近實(shí)現(xiàn)兩分跟蹤,驗(yàn)證了本文理論的正確性。
針對(duì)一類多智能體系統(tǒng)的分布式兩分跟蹤問題,本文設(shè)計(jì)了一類新型的帶有事件觸發(fā)機(jī)制的控制協(xié)議。在設(shè)計(jì)的控制協(xié)議下,無向連通且結(jié)構(gòu)平衡的合作競爭網(wǎng)絡(luò)中,所有個(gè)體狀態(tài)均能漸近實(shí)現(xiàn)分布式兩分跟蹤,且不會(huì)出現(xiàn)Zeno現(xiàn)象。但是,本文設(shè)計(jì)的事件觸發(fā)機(jī)制只是合作競爭網(wǎng)絡(luò)的初步探索,研究對(duì)象是一階線性多智能體系統(tǒng),后續(xù)將對(duì)二階系統(tǒng)或非線性系統(tǒng)展開進(jìn)一步研究。