陳 俠,周琦軒
(沈陽航空航天大學,沈陽 110136)
近年來,多智能體系統(tǒng)逐漸成為人工智能領域的一項重要內容。多智能體系統(tǒng)可以對現(xiàn)實中的復雜系統(tǒng)進行分析、設計和建模,從而將一個大規(guī)模的復雜任務由多個簡單的智能體完成,達到節(jié)約資源,節(jié)省成本的目的。隨著研究的深入多智能體系統(tǒng)在越來越多的領域展現(xiàn)其應用價值,例如無人機編隊控制、傳感器網絡等,其中,多智能體系統(tǒng)一致性問題成為熱點的研究課題之一。多智能體系統(tǒng)一致性問題指系統(tǒng)在任意初始狀態(tài)下,智能體之間利用一致性控制協(xié)議進行信息交互,最終使所有智能體的狀態(tài)能夠達到一致。一致性控制協(xié)議就是智能體之間相互作用的具體規(guī)則。陳珂熙等設計了一種一致性控制協(xié)議,解決了多智能體系統(tǒng)領導-跟隨一致性問題。
通信時滯在實際應用中是常見問題,受網絡延時影響,智能體之間不能及時進行信息傳遞或智能體需要在相關計算上花費時間都會導致時間延時。Hu 等研究僅含有通信時滯的非線性多智能體H一致性問題。本文考慮了延時對系統(tǒng)的影響。
為了實現(xiàn)多智能體一致,各智能體間需不斷進行局部信息交換。而在實際情況下多智能體之間通信拓撲經常會受到外部干擾而發(fā)生變化,這對控制系統(tǒng)的信息傳遞產生極大威脅,使智能體不能達到一致。切換拓撲即由于臨時通信丟失或智能體布局的改變而導致拓撲發(fā)生變化。周紹磊等提出了一種一致性控制方法,實現(xiàn)了有向切換拓撲多智能體系統(tǒng)帶領導者的一致性追蹤問題。
隨著數字化網絡的不斷發(fā)展,傳統(tǒng)的觸發(fā)方式并不能有效地節(jié)約網絡資源。例如時間觸發(fā)機制周期性地進行狀態(tài)采樣和信息傳輸的采樣方式有一定的局限性。學者們提出用事件觸發(fā)機制,通過預先設置觸發(fā)條件來決定數據是否被傳輸,這樣可以減少不必要的采樣以節(jié)約通信資源。申通等為解決自主車輛隊列協(xié)同控制問題,使用事件觸發(fā)機制來減少控制中冗雜信息的傳輸。值得注意的是,事件觸發(fā)的觸發(fā)條件僅受智能體當前狀態(tài)和誤差的影響,并沒有考慮以前的狀態(tài)和誤差對觸發(fā)規(guī)則的影響。本文在事件觸發(fā)機制的基礎上,通過引入一個動態(tài)變量,提出了動態(tài)事件觸發(fā)機制。使觸發(fā)條件不僅受智能體當前狀態(tài)和誤差的影響,還受智能體以前的狀態(tài)和誤差影響。該動態(tài)變量是動態(tài)事件觸發(fā)的發(fā)動機,其能夠動態(tài)地對觸發(fā)規(guī)則進行改變,相比于事件觸發(fā)更合理地減少采樣次數,有效節(jié)約了網絡資源。目前,關于動態(tài)事件觸發(fā)也引起了有關學者的重視,王世等研究了多智能體系統(tǒng)事件觸發(fā)一致性控制算法。但該系統(tǒng)考慮的數學模型比較簡單,也沒有考慮延時和不確定切換拓撲對控制系統(tǒng)的影響。
本文研究了具有延時和不確定切換拓撲的多智能體系統(tǒng)動態(tài)事件觸發(fā)一致性問題。既使用了動態(tài)事件觸發(fā)機制有效地節(jié)約了網絡資源,又考慮了延時和切換拓撲對多智能體一致性的影響。最后基于Lyapunov 穩(wěn)定性理論、線性矩陣不等式和代數圖論,證明了所提出的動態(tài)事件觸發(fā)控制策略能有效地實現(xiàn)多智能體系統(tǒng)一致性,并且不存在Zeno 行為。
圖1 動態(tài)事件觸發(fā)的多智能體系統(tǒng)控制框圖
根據文獻[19],為了解決多智能體一致性問題采用樹型轉換法通過引入不一致的新變量,將一致性問題轉化為閉環(huán)系統(tǒng)穩(wěn)定性問題。
討論多智能體系統(tǒng)式(23)穩(wěn)定性,若下列不等式成立,則閉環(huán)多智能體系統(tǒng)就在均方意義下實現(xiàn)一致性:
此節(jié)通過MATLAB 仿真證明了本文所提出的方法的可行性。仿真例子考慮了包含4 個智能體的多智能體系統(tǒng),系統(tǒng)的模型圖如圖2 所示。
圖2 具有3 種拓撲的多智能體系統(tǒng)模型圖
因此,可得Laplacians 矩陣如下:
圖3 智能體狀態(tài)的響應曲線
圖5 和圖6 分別是靜態(tài)事件觸發(fā)和動態(tài)事件觸發(fā)的觸發(fā)時間和區(qū)間。在相同的觸發(fā)時間里靜態(tài)事件觸發(fā)機制在50 s 內觸發(fā)42 次,而動態(tài)事件觸發(fā)機制在50 s 內觸發(fā)30 次。在保證系統(tǒng)穩(wěn)定的前提下,可以看出動態(tài)事件觸發(fā)出區(qū)間更長且能夠減少觸發(fā)次數并節(jié)約網絡資源。
圖5 事件觸發(fā)時間和區(qū)間
圖6 動態(tài)事件觸發(fā)時間和區(qū)間
表1 給出了兩種采樣機制每次執(zhí)行時間的平均值??梢钥闯觯瑒討B(tài)事件觸發(fā)機制(DETM)的平均執(zhí)行時間明顯大于靜態(tài)事件觸發(fā)機制。σ 的值越小,動態(tài)事件觸發(fā)機制相比于靜態(tài)事件觸發(fā)的增益越大。
表1 兩種機制平均執(zhí)行時間對比
圖4 是動態(tài)事件觸發(fā)誤差的歐幾里得范數變化,當觸發(fā)條件被滿足誤差返回到0。圖7 表示3 種拓撲之間的切換。當θ=1 時多智能體系統(tǒng)在第1 種拓撲下運行。3 種拓撲之間切換的概率是不確定的,本文的方法可以分析系統(tǒng)在不確定性和估計性條件下的一致性。
圖4 誤差的歐幾里得范數變化
圖7 3 個拓撲的之間的切換
上述仿真結果表明,本文提出的動態(tài)事件觸發(fā)多智能體一致性算法,可以應用于具有時變時滯和切換拓撲的一般線性動態(tài)多智能體系統(tǒng)中?;谝陨戏治隹梢钥闯觯嘀悄荏w系統(tǒng)最后實現(xiàn)了漸近穩(wěn)定性和一致性。因此,該方法可以靈活地保證系統(tǒng)的一致性。
本文研究了具有延時和切換拓撲的一般線性多智能體系統(tǒng)動態(tài)事件觸發(fā)一致性問題。在實際系統(tǒng)中,智能體的通信帶寬有限,動態(tài)事件觸發(fā)通過引入動態(tài)變量,能夠動態(tài)地對觸發(fā)規(guī)則進行改變,合理地減少采樣次數,節(jié)約了網絡資源。并且考慮了延時和切換拓撲對多智能體一致性的影響。最后基于李雅普諾夫穩(wěn)定性理論和線性矩陣不等式理論,給出了動態(tài)事件觸發(fā)控制下多智能體系統(tǒng)在均方意義上實現(xiàn)一致性的充分條件。最后,通過數值仿真對本方法的有效性進行了驗證。