張海江,文家燕*,謝廣明,2,景永年
(1.廣西科技大學 自動化學院,廣西 柳州 545616;2.北京大學 工學院,北京 100871;3.黑芝麻智能科技有限公司,廣東 深圳 518005)
近年來多智能體的編隊控制問題作為一個熱點問題被廣泛應用于各個領域。環(huán)形編隊作為編隊控制的一個基準問題而備受學者關注。Ⅹu等給出了環(huán)形編隊的具體定義,并證明了環(huán)形編隊的可行性。Wang等針對在環(huán)形編隊過程中的智能體排序和碰撞問題進行分析,設計了相應的通信協(xié)議以保證環(huán)形編隊可實現(xiàn)。
上述控制方法是假設系統(tǒng)中智能體之間的通信信道具有足夠大的帶寬或容量。但在實際系統(tǒng)中,數(shù)字網(wǎng)絡通信會受到不同程度的帶寬和容量限制。針對這一問題,F(xiàn)rasca 等提出了基于數(shù)據(jù)量化的通信算法,通過使用靜態(tài)量化器來完成智能體之間的信息交換。在此基礎上,Carli等提出了一種動態(tài)編解碼量化算法,設計了一種基于編碼-解碼器的量化器并在量化器中引入一個標度函數(shù),實現(xiàn)了系統(tǒng)在有限量化級別上的一致性。此后,量化算法得到了快速發(fā)展,形成了不少理論成果。Li等設計了一種可以對稱補償?shù)牧炕椒?,通過調(diào)整量化器自身相應參數(shù),將每個數(shù)字通道傳輸?shù)谋忍財?shù)減少到只有1 bit。
在系統(tǒng)實際工作中,有時無需對系統(tǒng)的控制輸入信息進行實時更新,尤其是在某些資源受限的工況下?;诖?,Guo 等將事件觸發(fā)機制引入多智能體系統(tǒng)中,相對于時間驅(qū)動機制,這種方法可以有效降低系統(tǒng)的更新頻率,減少不必要的通信資源損耗。事件觸發(fā)機制也被進一步應用于一般線性系統(tǒng)、二階系統(tǒng)以及非線性系統(tǒng)中。此外,在實際物理系統(tǒng)中存在輸入受限的工程約束,這是控制理論面向工程實現(xiàn)所必然要面對的問題。蔡旭等考慮了多智能體系統(tǒng)在實際應用中存在的輸入飽和現(xiàn)象,并給出了系統(tǒng)闡述。
綜上可知,在多智能體系統(tǒng)研究中,綜合考慮輸入受限、通信帶寬有限和節(jié)約有限資源消耗等約束在一起的環(huán)形編隊控制問題,仍是一個熱點、難點問題。為此,本文針對一階帶有輸入限制的多智能體動力學模型,圍繞耦合考慮系統(tǒng)資源有限、通信帶寬限制等問題,提出基于事件觸發(fā)控制策略和量化通信機制的控制律,在保證系統(tǒng)能實現(xiàn)環(huán)形編隊的前提下,探究對系統(tǒng)有限資源的節(jié)約和通信所需帶寬的減小。
令R、N 和Z分別表示實數(shù)集、自然數(shù)集和正整數(shù)集。表示矩陣的轉置,‖‖表示矩陣的范數(shù)。列向量1∈R,0∈R表示向量內(nèi)所有元素分別等于1和0,為自然數(shù)。
對于一個加權有向圖=(,E,A),其中={,,…,v}表示節(jié)點集,={1,2,…,}為節(jié)點的下標集。E?×表示邊集,(v,v)∈E表示智能體到智能體的單向通信信道。 A=[a]∈R 為加權鄰接矩陣,如果a≠0則表示智能體與智能體之間存在相應權重的信息交換,a=0則表示智能體與智能體之間不存在信息交換。矩陣=- A為對應拓撲圖的Laplace 矩陣,其中矩陣是有向圖的度矩陣(為對角陣)。
考慮由(≥2)個智能體組成的系統(tǒng),每個智能體都是相互獨立的個體。所有智能體的初始位置都隨機分布在一個圓上且不發(fā)生重合。規(guī)定每個智能體只能與其逆時針方向的鄰居進行信息交互。
如圖1所示,為了更易于解釋環(huán)形編隊的編隊運動過程,將按照逆時針方向?qū)λ械闹悄荏w從1到(≥2)進行編號,即()=[(),(),…,x()],其中(t)表示智能體在時刻的角度位置狀態(tài)。所有智能體初始位置均滿足如下條件:
圖1 智能體在環(huán)上分布圖
如圖1所示,所有的智能體始終都在固定的圓環(huán)上運動,且每個智能體僅能感知到逆時針方向鄰居的信息;因此,為不失一般性,作如下定義:
其中,為智能體逆時針方向緊鄰的智能體,為智能體順時針方向緊鄰的智能體。令d表示智能體與其鄰居智能體之間的期望角度間距;因此,期望的環(huán)形編隊相對間距可以由式(2)的向量確定:
考慮一個具有輸入限制的個智能體組成的多智能體系統(tǒng),其一階動力學模型描述如下:
其中,x()為智能體的當前狀態(tài),u()為智能體的控制輸入。sat(*)為非線性的對稱輸入飽和函數(shù),其函數(shù)表達式為:
令y∈(0,2π)表示智能體與其逆時針方向鄰居之間的實際角度距離,其表達式如下:
環(huán)形編隊定義:對于一個給定的可容許的期望環(huán)形編隊,通過設計分布式控制協(xié)議u()=u(y,d),=1,2,…,,使得在滿足式(1)的初始條件下,系統(tǒng)(3)的解始終收斂到某個平衡點,且滿足=,即可實現(xiàn)環(huán)形編隊。
其中()表示矩陣I-去掉第一行第一列的一個子矩陣,則有如下關系成立:
首先,借助環(huán)形編隊控制問題的相關做法,基于事件觸發(fā)的環(huán)形編隊控制協(xié)議設計如下:
其次,將介紹在有限通信帶寬下,多智能體系統(tǒng)中任意2個相鄰的智能體間的量化通信的實現(xiàn)過程。對于每個智能體,其中∈{1,2,…,},其對應的基于事件觸發(fā)編碼器φ設計如下:
其中:ξ()∈R 為編碼器φ的內(nèi)部狀態(tài);s()為智能體傳輸給其鄰居的當前信息;(-1) >0是一個衰減函數(shù);q()表示具有有限量化級數(shù)的均勻量化器,其作用是把智能體當前狀態(tài)的偏差值映射為離散的量化器所對應的量化層級。q()如下所示:
式中:為量化器的量化間隔;≥1 為量化層級。在每次智能體進行信息傳遞時,其通信信道的傳輸比特數(shù)為log(2+1)比特。此外,在智能體之間進行信息交換時必須保證量化器始終處于不飽和狀態(tài)。
當智能體接收到智能體傳遞過來的當前狀態(tài)信息s()時,需要通過對應的解碼器ψ將智能體的狀態(tài)值估計出來。解碼器ψ數(shù)學表達式如下:
為便于分析,在分布式控制協(xié)議(6)的基礎上,引入中間變量以簡化后續(xù)的理論證明,其變換如下:
綜上設計與分析,聯(lián)合式(11)、編碼器(8)、解碼器(10),對控制協(xié)議(6)進行設計,可以得到基于事件觸發(fā)與量化通信機制的分布式控制協(xié)議,具體如下:
證明系統(tǒng)在所設計的控制協(xié)議(12)的作用下,可以實現(xiàn)期望的環(huán)形編隊。具體包括2個方面:一是系統(tǒng)在事件觸發(fā)條件(7)下是穩(wěn)定的;二是證明系統(tǒng)在前述條件作用下,環(huán)形編隊可以實現(xiàn)。具體如下:
將式(12)代入式(3),可以得到如下結果:
根據(jù)式(13)可以將個智能的系統(tǒng)模型寫成緊湊形式,具體如下:
考慮如下合適的Lyapunov函數(shù):
沿著時間變量對Lyapunov函數(shù)求導,得到:
令Δ<0,可以得到如下不等式:
根據(jù)范數(shù)的運算法則可以將式(15)改寫為:
綜上,證明了系統(tǒng)在事件觸發(fā)條件(7)和控制協(xié)議(12)下是穩(wěn)定的。根據(jù)文獻[15]中的定理1 可知,當時間步長≤1 時,在所給出的控制協(xié)議(12)下,可以實現(xiàn)任意一個期望的環(huán)形編隊。
由于量化器一旦出現(xiàn)飽和則無法確定此時傳遞的信息是否為智能體的真實狀態(tài)信息,因此,如何通過合理設計相應參數(shù),保證所設計的量化器在任意時刻都不會飽和是十分必要的。
則基于量化通信的環(huán)形編隊可以實現(xiàn),且智能體之間進行信息交互時,量化器始終不會出現(xiàn)飽和。
證明:結合編碼-解碼器對表達式可以得到:
定義矩陣J= Iξ,其中向量為引理1 中矩陣的第一行,則JL= LJ=0 成立。結合式(18)可得:
為了使證明過程更加清晰明了,將分2個步驟來證明系統(tǒng)工作過程中所有的量化器不會飽和:
由式(23)中的結果可知,當=0 時,系統(tǒng)中所有量化器均不飽和。
2)當≥1,對任意的非負整數(shù)=0,1,…,,假定如下關系成立:
在式(26)中,可將復雜關系式分三部分進行整理,具體如下:
結合給出的的存在條件以及式(24)與式(30)可得:
根據(jù)式(31)的結果可知,如果存在(2+1)量化電平數(shù)的量化器滿足式(17)與式(31)的條件時,那么在系統(tǒng)運行的整個過程中,所有智能體對應的量化器都不會出現(xiàn)飽和現(xiàn)象。至此,量化器合理性得證。
為驗證所提出算法的有效性,本節(jié)將給出基于Matlab的數(shù)值仿真驗證??紤]由6個智能體組成多智能體系統(tǒng),智能體初始狀態(tài)為滿足條件(1)的任意位置,智能體之間的期望環(huán)形編隊的角度差由滿足條件(2)的向量確定,具體如下:
設定量化器的相關參數(shù)為=0.05,=10,=0.982 88。仿真結果如圖2、圖3所示。
圖2 (網(wǎng)絡版彩圖)連續(xù)時間觸發(fā)下各智能體的狀態(tài)信息
圖3 (網(wǎng)絡版彩圖)事件觸發(fā)下各智能體的狀態(tài)信息
通過觀察圖2 和圖3 中的仿真結果可知,在系統(tǒng)允許的誤差范圍內(nèi),事件觸發(fā)控制策略能有效地降低智能體之間的通信頻率,達到節(jié)省系統(tǒng)有限通信資源的目的。
本文在文獻[16]的研究基礎上進一步考慮系統(tǒng)中存在輸入飽和限制,結果如圖4、圖5所示。對比圖4 和圖5 可以看出,雖然系統(tǒng)中控制器的調(diào)節(jié)時間會受到輸入飽和限制的影響而增加,但系統(tǒng)中的每個智能體都能在所設計的控制協(xié)議下使自身狀態(tài)保持在一個很小的誤差范圍內(nèi),使得多智能體運動至期望編隊位置。
圖4 (網(wǎng)絡版彩圖)輸入不受限時各智能體的狀態(tài)信息(詳見文獻[16])
圖5 (網(wǎng)絡版彩圖)輸入受限時各智能體的狀態(tài)信息
文中設定的量化器量化間隔=0.05。從圖6中可以清晰地看到,在系統(tǒng)運行過程中的任意一個時間點上,各個智能體的量化器都沒有出現(xiàn)飽和現(xiàn)象,證實了本文所設計的量化通信方案可行。
圖6 (網(wǎng)絡版彩圖)各智能體的量化誤差(β=0.05)
本文研究了一階帶有輸入飽和限制的多智能體系統(tǒng)事件觸發(fā)量化通信環(huán)形編隊問題,其中智能體與其鄰居之間的通信和狀態(tài)更新由事件觸發(fā)機制控制??紤]實際工程中存在輸入飽和、系統(tǒng)資源受限和通信帶寬受限等問題,設計了帶有輸入飽和的事件觸發(fā)機制與量化通信方式相結合的控制策略,在保證任意一個時間點上所有量化器均不飽和的前提下使系統(tǒng)達到期望的環(huán)形編隊。最后通過仿真驗證了所提出控制策略的有效性。未來的工作將更加關注實際系統(tǒng)中的問題,例如將量化通信與輸入飽和限制推廣到一般線性或者異構系統(tǒng)中。