劉自理, 嚴(yán)衛(wèi)生, 張守旭
(西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072)
由于在編隊控制[1-2]、目標(biāo)跟蹤[3]、覆蓋控制[4]、姿態(tài)控制[5]等領(lǐng)域的廣泛應(yīng)用,近年來多智能體系統(tǒng)的協(xié)同輸出調(diào)節(jié)問題得到了越來越多的關(guān)注。
多智能體系統(tǒng)的協(xié)同控制問題可根據(jù)系統(tǒng)內(nèi)有無領(lǐng)導(dǎo)者分為均勻一致性問題[6]和主從跟蹤一致性問題[7]。本文研究的協(xié)同輸出調(diào)節(jié)問題屬于主從跟蹤一致性問題,該問題的解決需要達(dá)成2個條件:①保證閉環(huán)多智能體系統(tǒng)的穩(wěn)定性;②確保輸出信號與外部信號之間的追蹤誤差趨近于零。該外部信號可代表外部輸入或者外部干擾,由外部系統(tǒng)(即領(lǐng)導(dǎo)者系統(tǒng))產(chǎn)生。經(jīng)典的多智能體系統(tǒng)輸出調(diào)節(jié)問題最初由Davison、Francis等[8-9]提出,但其控制器要求多智能體系統(tǒng)內(nèi)的每個智能體不僅需要獲知自身狀態(tài)信息而且需要獲知外部系統(tǒng)的狀態(tài)變量信息。針對部分跟隨者無法直接獲知外部系統(tǒng)狀態(tài)變量的多智能體系統(tǒng),Huang等[7]提出了分布式協(xié)同控制算法以解決多智能體系統(tǒng)輸出調(diào)節(jié)問題,該項研究可被看作經(jīng)典輸出調(diào)節(jié)問題的延伸。隨后,文獻 [10-12] 對多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題進行了一系列擴展性研究,但是這些研究中多數(shù)沒有考慮多智能體通信網(wǎng)絡(luò)中的時延現(xiàn)象或者假設(shè)時延為固定時延。
事實上,大多數(shù)的多智能體系統(tǒng)都基于無線網(wǎng)絡(luò)進行通信,因此在智能體通信過程中不可避免地會產(chǎn)生通信時延[13],文獻[14]的研究對象為含有通信時延的多智能體系統(tǒng),但解決的是無領(lǐng)導(dǎo)者的多智能體系統(tǒng)一致性問題,文獻[15]研究了具有離散時間時延多智能體系統(tǒng)的輸出調(diào)節(jié)問題,但其關(guān)注的是固定時延。由于每個智能體所處的外部環(huán)境和通信目標(biāo)是時變的,智能體通信過程中發(fā)生的時延一般也為時變的。文獻[16]研究了時變通信時延的多智能體一致性問題,但其關(guān)注的是平均一致性問題。由于多智能體通信網(wǎng)絡(luò)中時變時延的存在,各智能體控制器將會無規(guī)律地異步更新鄰居節(jié)點的狀態(tài)信息,這將為分布式反饋控制算法設(shè)計增加難度,從而給多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題的解決帶來極大困難,這是本文所面臨的第一個難點。
另外,在智能體通信過程中,產(chǎn)生時變通信時延的同時數(shù)據(jù)丟失現(xiàn)象也將隨機出現(xiàn)[17],這將導(dǎo)致多智能體系統(tǒng)通信網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)動態(tài)地發(fā)生變化,從而給多智能體閉環(huán)控制系統(tǒng)的穩(wěn)定性分析和跟蹤誤差的收斂性分析造成極大困難。文獻[18]研究了通信網(wǎng)絡(luò)中存在數(shù)據(jù)丟包的多智能體一致性問題,但其關(guān)注的是平均一致性問題。文獻[11,19-21]研究了動態(tài)網(wǎng)絡(luò)拓?fù)湎碌亩嘀悄荏w輸出調(diào)節(jié)問題,但并未討論數(shù)據(jù)丟包和通信時延同時存在時的一致性問題。文獻[22]對多智能體系統(tǒng)動態(tài)網(wǎng)絡(luò)拓?fù)湎麓嬖跁r延現(xiàn)象的輸出調(diào)節(jié)問題進行了研究,但其關(guān)注的是固定時延。目前已發(fā)表文獻中,對通信網(wǎng)絡(luò)中同時存在數(shù)據(jù)包丟失和時變時延現(xiàn)象的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題的研究成果較少,這也是本文所面臨的第二個難點。
基于上述研究現(xiàn)狀分析,本文主要研究動態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題。本文通過引入隊列機制,將時變時延多智能體系統(tǒng)轉(zhuǎn)化為具有固定時延和隨機數(shù)據(jù)丟包的多智能體系統(tǒng),隨后設(shè)計出相應(yīng)的狀態(tài)觀測器,進而提出分布式測量輸出反饋控制算法。該算法能有效解決隨機數(shù)據(jù)丟包和時變通信時延同時存在情況下的多智能體輸出調(diào)節(jié)問題。針對不穩(wěn)定和穩(wěn)定外部系統(tǒng),分別給出了解決多智能體系統(tǒng)輸出調(diào)節(jié)問題需要滿足的條件。
若有向圖G中存在一個邊序列(v1,v2),(v2,v3),…,(vk-1,vk),則稱vk由v1可達(dá)。若有向圖G中的每一個智能體都由vi可達(dá),則稱圖G中至少包含一個以vi為根的生成樹。
考慮引入文獻 [15] 中的隊列機制來處理多智能體通信過程中伴隨的時變時延現(xiàn)象。
假設(shè)G內(nèi)的所有智能體時鐘同步并且數(shù)據(jù)包都以h為周期向外發(fā)送。令τ(dmin<τ 在t∈[kh,kh+τ)內(nèi),當(dāng)有數(shù)據(jù)包到達(dá)vi的接收器時,vi將檢查該數(shù)據(jù)包的時間戳,若該數(shù)據(jù)包在kh時刻被發(fā)送,則vi將其放入隊列中,否則該數(shù)據(jù)包將被丟棄;在t=kh+τ時刻,vi將利用接收器隊列中的數(shù)據(jù)更新其控制輸入;在t∈[kh+τ,(k+1)h)內(nèi),所有到達(dá)vi的數(shù)據(jù)均被看為過時信息而被丟棄。通過引入隊列機制,在每個周期內(nèi)G內(nèi)的所有智能體都將在t=kh+τ時刻同步更新控制輸入。 假設(shè)1通信網(wǎng)絡(luò)中,任意2個智能體的通信與其他智能體無關(guān);獨立同分布的時變通信時延服從均勻分布U[0,dmax],其中dmax為最大通信時延;隨機丟包過程服從伯努利分布。 一般情況下,固定拓?fù)湎聼o時延的線性離散多智能體系統(tǒng)中的跟隨者系統(tǒng)可表示為如下形式: 式中,i=1,…,n,xi∈Rp,ui∈Rq,ei∈Rc,υ∈Rd分別表示第i個智能體系統(tǒng)的狀態(tài),控制輸入,追蹤誤差和外部信號;Ai∈Rp×p,Bi∈Rp×q,Ei∈Rp×d,Ci∈Rc×p,Di∈Rc×q和Fi∈Rc×d均為常數(shù)矩陣;ymi∈Rcm表示第i個智能體的測量輸出,其中,角標(biāo)中的m表示此變量為測量值,i指代第i個智能體;Cmi∈Rcm×p,Dmi∈Rcm×q,Fmi∈Rcm×d。 外部信號υ可以表示外部輸入或外部干擾,它可由如下外部系統(tǒng)產(chǎn)生 υ(k+1)=Sυ(k) 式中,S∈Rd×d為常數(shù)矩陣。 為保證信息傳輸?shù)臅r效性,假設(shè)本文研究的多智能體系統(tǒng)中只有鄰居節(jié)點之間才有數(shù)據(jù)傳輸,并且各智能體不對外轉(zhuǎn)發(fā)其所接收的各項信息。因此,若智能體vj是智能體vi的鄰居節(jié)點,則vi只能將vj的狀態(tài)信息作為vi自身的控制輸入,而不能作為中繼器將vj的信息轉(zhuǎn)發(fā)給其他智能體vk。由于不能保證每個跟隨者的鄰居節(jié)點集合中都包含有領(lǐng)導(dǎo)者,為保證無法接收外部信號的跟隨者也能實現(xiàn)對領(lǐng)導(dǎo)者的跟蹤控制,可考慮設(shè)計如下分布式測量輸出反饋控制算法 在隊列機制下,針對通信網(wǎng)絡(luò)中存在隨機數(shù)據(jù)丟失和時變通信時延的多智能體系統(tǒng),考慮描述跟隨者系統(tǒng)如(1)式所示 (1) 外部系統(tǒng)如(2)式所示 υ((k+1)h)=Sυ(kh) (2) (1)式和(2)式共同構(gòu)成了本文研究的動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下具有時變通信時延的多智能體系統(tǒng),該系統(tǒng)包含n+1個多智能體,其中,(1)式表示跟隨者系統(tǒng),(2)式表示領(lǐng)導(dǎo)者系統(tǒng)。 在隊列機制下,設(shè)計外部系統(tǒng)狀態(tài)變量的動態(tài)觀測器如下 (3) 針對智能體不能直接測量自身狀態(tài)信息的情況,設(shè)計自身狀態(tài)變量動態(tài)觀測器如下 (4) 因此,結(jié)合(3)式和(4)式可設(shè)計分布式測量輸出反饋控制算法如(5)式所示 (5) 結(jié)合(1)~(5)式可得智能體vi的閉環(huán)控制系統(tǒng)如下所示 令 (6) 式中,In?S表示單位矩陣In與矩陣S的克羅內(nèi)克積,1n表示元素為1的n維列向量。 Al(k)= 定義1 給定多智能體系統(tǒng)(6),若存在分布式測量輸出反饋控制算法(5)使得離散時間閉環(huán)多智能體系統(tǒng)滿足: 1) 當(dāng)外界輸入為零時,閉環(huán)多智能體系統(tǒng)漸進穩(wěn)定; 則表明動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下多智能體系統(tǒng)的協(xié)同輸出控制問題可被反饋控制算法(5)解決。 在保證一般性的前提下,首先給出解決多智能體協(xié)同輸出調(diào)節(jié)問題的標(biāo)準(zhǔn)假設(shè)條件: 假設(shè)2外部系統(tǒng)的系統(tǒng)矩陣S的所有特征值的模均不小于1。 假設(shè)3(Ai,Bi) 是可鎮(zhèn)定的,i=1,…,n。 假設(shè)4(Cmi,Ai) 是可觀測的,i=1,…,n。 定理1若假設(shè)1~5同時成立,令增益矩陣Ki1和Li分別滿足假設(shè)3和假設(shè)4,當(dāng)且僅當(dāng)參數(shù)φ(k)和Ki2在每個周期內(nèi)同時滿足以下2個條件: 1) 2) 矩陣方程 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 有解(Xi,Ki2); 則稱反饋控制算法(5)可以解決動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體系統(tǒng)(6)的協(xié)同輸出調(diào)節(jié)問題。 證明: 令 則可得 AiXi+BiKi1Xi+BiKi2+Ei=XiS CiXi+DiKi1Xi+DiKi2+Fi=0 綜上可得,在假設(shè)1~5同時成立的前提下,當(dāng)且僅當(dāng)參數(shù)φ(k)和Ki2在每個周期內(nèi)均滿足定理1的2個條件時,反饋控制算法(5)可以解決動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題。 假設(shè)6外部系統(tǒng)的系統(tǒng)矩陣S的所有特征值的模均小于1。 定理2若假設(shè)1和假設(shè)3~6同時成立,令增益矩陣Ki1和Li分別滿足假設(shè)3和假設(shè)4,當(dāng)且僅當(dāng)參數(shù)φ(k)在每個周期內(nèi)均滿足 則稱反饋控制算法(5)可以解決動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體系統(tǒng)(6)的協(xié)同輸出調(diào)節(jié)問題。 證明: 同理定理1的證明過程可得,若選取滿足假設(shè)3和假設(shè)4的增益矩陣Ki1和Li,當(dāng)且僅當(dāng)參數(shù)φ(k)在每個周期內(nèi)均滿足 綜上可得,在假設(shè)1和假設(shè)3~6同時成立的前提下,當(dāng)且僅當(dāng)存在參數(shù)φ(k),使得定理2中給出的條件在每個周期內(nèi)均成立,則測量輸出反饋控制算法(5)可以解決動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題。 本節(jié)以如下多智能體系統(tǒng)為例進行仿真分析。 假設(shè)跟蹤者系統(tǒng)如下所示 其領(lǐng)導(dǎo)者系統(tǒng)為如下形式 若轉(zhuǎn)換為(1)式和(2)式所示形式,可得 令Ki1=[-1.5,-0.5],Li=[-1.5,-3]T。顯然,假設(shè)3和假設(shè)4成立。 本節(jié)所研究的多智能體系統(tǒng)中存在5個多智能體,其中節(jié)點0代表領(lǐng)導(dǎo)者,節(jié)點1~4代表跟隨者。初始時刻的多智能體網(wǎng)絡(luò)拓?fù)淙鐖D1所示,此拓?fù)浣Y(jié)構(gòu)中存在以0節(jié)點為根的有向生成樹。 圖1 初始網(wǎng)絡(luò)拓?fù)?/p> 由于多智能體系統(tǒng)在通信過程中存在隨機的數(shù)據(jù)丟包,多智能體的通信網(wǎng)絡(luò)在[kh,kh+τ]內(nèi)的不同時刻會具有不同形式的拓?fù)浣Y(jié)構(gòu),在某些特定時刻其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中將不再存在生成樹,如圖2所示。 圖2 數(shù)據(jù)丟包時的網(wǎng)絡(luò)拓?fù)浼?/p> 圖3 期望網(wǎng)絡(luò)拓?fù)?/p> 從圖3a)中可得: 圖4 外部系統(tǒng)不穩(wěn)定時跟隨者的追蹤誤差 由定理2可知,分布式測量測量輸出反饋控制算法(5)可以解決動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體協(xié)同輸出調(diào)節(jié)問題,仿真結(jié)果如圖5所示。 圖5 外部系統(tǒng)穩(wěn)定時跟隨者的追蹤誤差 由圖4和圖5可得,針對不穩(wěn)定和穩(wěn)定的外部系統(tǒng),測量輸出反饋控制算法(5)均可使得其所有跟隨者的跟蹤誤差漸進趨向于零,動態(tài)網(wǎng)絡(luò)拓?fù)洵h(huán)境下存在時變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題可以被有效解決。 本文研究了動態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題。主要得到以下3項結(jié)論:①基于隊列機制,設(shè)計了新的分布式測量輸出反饋控制算法以解決具有隨機數(shù)據(jù)丟包和時變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題;②在標(biāo)準(zhǔn)假設(shè)成立的前提下,針對不穩(wěn)定外部系統(tǒng),給出了動態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題的解決條件;③在標(biāo)準(zhǔn)假設(shè)成立的前提下,針對穩(wěn)定外部系統(tǒng),給出了動態(tài)網(wǎng)絡(luò)拓?fù)湎戮哂袝r變通信時延的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題的解決條件。仿真分析驗證了本文所提出的測量輸出反饋控制算法能夠有效解決具有通信時延和數(shù)據(jù)丟失的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題。另外,在基于隊列機制的多智能體系統(tǒng)協(xié)同輸出調(diào)節(jié)問題中,隊列時間的取值十分重要,因此,最優(yōu)隊列時間問題將是未來工作的重心之一。1.3 系統(tǒng)描述
2 主要結(jié)論
3 仿真結(jié)果與分析
4 結(jié) 論