隆騰,楊莎莎,王茜竹
(1.重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065;2.重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶 400065)
近年來(lái),多智能體系統(tǒng)(Multi-Agent Systems,MASs)的分布式控制與優(yōu)化廣泛應(yīng)用于無(wú)人機(jī)、機(jī)器人集群的協(xié)同作業(yè)[1-3],但在已有研究中MASs 通信環(huán)境通常為理想狀態(tài),然而在真實(shí)網(wǎng)絡(luò)環(huán)境中系統(tǒng)可能會(huì)受到環(huán)境干擾的隨機(jī)變化[4-5],例如信息傳輸?shù)碾S機(jī)噪聲干擾、隨機(jī)故障等。而且由于外部工作環(huán)境復(fù)雜,智能體之間在傳輸過(guò)程中往往會(huì)受到外部隨機(jī)波動(dòng)等概率因素引起的隨機(jī)擾動(dòng)[6-7],因此一致性問(wèn)題隨著研究的深入逐漸引起關(guān)注[8]。
目前,有許多控制方法可以實(shí)現(xiàn)MASs 一致性,如自適應(yīng)控制[9]、牽引控制[10]、魯棒控制[11]等。脈沖控制作為一種有效的非連續(xù)控制策略,只允許每個(gè)節(jié)點(diǎn)在脈沖瞬間傳輸信息,這大大降低了網(wǎng)絡(luò)的通信負(fù)載。文獻(xiàn)[12]提出基于固定拓?fù)?、切換拓?fù)浜屯獠扛蓴_的3 種脈沖控制協(xié)議,以實(shí)現(xiàn)連續(xù)時(shí)間網(wǎng)絡(luò)的一致性。文獻(xiàn)[13]研究具有輸入飽和度的分布式脈沖一致協(xié)議,以漸近地保證動(dòng)態(tài)系統(tǒng)的動(dòng)態(tài)一致。但是,上述研究對(duì)于脈沖間隔的設(shè)定比較固定,也就是預(yù)先設(shè)定脈沖間隔。由于實(shí)際系統(tǒng)的物理約束,因此智能體之間的信息交換不能準(zhǔn)確地在預(yù)先設(shè)定好的脈沖采樣時(shí)間內(nèi)發(fā)生。為了獲得更靈活的脈沖采樣時(shí)刻,文獻(xiàn)[14]提出在脈沖時(shí)間窗內(nèi)約束脈沖輸入的可變脈沖控制策略。文獻(xiàn)[15]研究了有向網(wǎng)絡(luò)拓?fù)渲蠱ASs 具有領(lǐng)導(dǎo)-跟隨者一致的可變脈沖控制策略,這種策略允許脈沖采樣時(shí)間隨機(jī)發(fā)生在脈沖時(shí)間窗內(nèi),從而使得系統(tǒng)更加適用于現(xiàn)實(shí)場(chǎng)景。
雖然上述工作研究了如何降低系統(tǒng)的通信負(fù)載并使其更加適用于現(xiàn)實(shí)情況,但是所用方法為漸近一致性,忽略了系統(tǒng)達(dá)到一致時(shí)所需要的時(shí)間。與漸近一致性相比,有限時(shí)間一致性提高了系統(tǒng)的收斂速度[16-17]。但是,有限時(shí)間一致性的時(shí)間計(jì)算需要依賴于系統(tǒng)的初始狀態(tài)。因此,有研究人員提出了固定時(shí)間一致性,使系統(tǒng)的一致性時(shí)間不再依賴于初始條件[18-19]。另外,在實(shí)際的通信環(huán)境中,由于外部干擾或鏈路故障,智能體之間的通信拓?fù)浣Y(jié)構(gòu)可能會(huì)改變[20-21],因此可以引入切換拓?fù)浣Y(jié)構(gòu)。目前,關(guān)于脈沖控制與固定時(shí)間一致相結(jié)合的研究采用單階控制,然而由于MASs 應(yīng)用場(chǎng)景的復(fù)雜性和多樣化,單階控制的收斂狀態(tài)相對(duì)單一,靈活性較差。
受到上述工作的啟發(fā),本文研究可變脈沖控制和固定時(shí)間一致性相結(jié)合的雙階控制(Two-Stage Control,TSC)策略。TSC 策略根據(jù)實(shí)際應(yīng)用需求進(jìn)行動(dòng)態(tài)調(diào)整收斂周期,通過(guò)增加脈沖個(gè)數(shù)來(lái)應(yīng)對(duì)通信資源稀缺的問(wèn)題,但如果系統(tǒng)需要獲得更快的收斂速度且網(wǎng)絡(luò)條件良好,則可以適當(dāng)減少脈沖數(shù)量。通過(guò)在領(lǐng)導(dǎo)-跟隨者情況下的具有切換拓?fù)涞腗ASs數(shù)值仿真案例以驗(yàn)證理論結(jié)果的有效性。
假設(shè)1在Gσ(t)中存在有向生成樹并且領(lǐng)導(dǎo)者節(jié)點(diǎn)為根節(jié)點(diǎn)。
假設(shè)2設(shè)φ(·)和h(·)為非線性函數(shù)并滿足以下Lipschi tz 條件:
在式(5)中:Γ和Σ為已知常數(shù)矩陣;‖ · ‖表示歐氏范數(shù)。
假設(shè)3 可變脈沖控制階段遵循如下規(guī)則:
本文設(shè)計(jì)將可變脈沖控制和固定時(shí)間一致相結(jié)合的TSC 策略,因此給出如下有效的TSC 協(xié)議:
在式(11)中:δ(t-tn)為沖激函數(shù);bn為脈沖控制增益;脈沖序列0 <t0<t1<…<tn<…并且+∞;定 義并設(shè)xi(t) 為右連續(xù);?表示固定時(shí)間階段的控制參數(shù);?、k、p、q都為奇數(shù)并滿足?<k和p>q;T1表示脈沖控制階段和固定時(shí)間階段的分界時(shí)間,也表示固定時(shí)間階段的初始時(shí)間;T2表示系統(tǒng)達(dá)到一致時(shí)具體的預(yù)設(shè)時(shí)間。
如圖1 所示,系統(tǒng)收斂周期分為兩個(gè)階段,分別是可變脈沖控制階段和固定時(shí)間連續(xù)控制階段。為了進(jìn)一步提升系統(tǒng)收斂速度,并準(zhǔn)確計(jì)算出系統(tǒng)的預(yù)設(shè)時(shí)間,本文在有限時(shí)間一致控制器的基礎(chǔ)上進(jìn)行改進(jìn)引入了固定時(shí)間一致性理論,與文獻(xiàn)[16-17]相比,本文采用的固定時(shí)間一致的預(yù)設(shè)時(shí)間與系統(tǒng)的初始條件無(wú)關(guān),該方法能夠根據(jù)相關(guān)參數(shù)準(zhǔn)確地計(jì)算出系統(tǒng)達(dá)到一致時(shí)的時(shí)間,比有限時(shí)間一致更準(zhǔn)確。此外,本文中的固定時(shí)間一致控制協(xié)議沒(méi)有使用會(huì)引起系統(tǒng)顫振的符號(hào)函數(shù),這對(duì)系統(tǒng)的穩(wěn)定性會(huì)有較大的提升。
圖1 TSC 示意圖Fig.1 Schematic diagram of TSC
在第一個(gè)控制階段,結(jié)合控制器式(11)和系統(tǒng)式(1),可以將脈沖控制系統(tǒng)定義如下:
若上述條件滿足,則系統(tǒng)式(1)可以通過(guò)控制器式(11)達(dá)到具有領(lǐng)導(dǎo)-跟隨者的固定時(shí)間一致。
證明在第一個(gè)控制階段t∈[t0,T1),定義如下Lyapunov 函數(shù):
在式(33)中:tω表示脈沖發(fā)生的次數(shù);T1是固定時(shí)間階段的起始時(shí)間和在整個(gè)脈沖周期中所經(jīng)過(guò)的時(shí)間,為中的隨機(jī)值;V(T1,ε(T1))表示固定時(shí)間階段的初始狀態(tài)。本文根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)置ω的個(gè)數(shù),則脈沖個(gè)數(shù)可以決定T1的大小。
不等式(26)中的特征值θn表示系統(tǒng)中的全局信息會(huì)有n次脈沖采樣。從式(27)到式(29)可以看出,當(dāng)系統(tǒng)時(shí)間達(dá)到tn時(shí),則系統(tǒng)會(huì)得到特征值θ,也就意味著系統(tǒng)會(huì)觸發(fā)脈沖采樣;如果系統(tǒng)時(shí)間沒(méi)有超過(guò)脈沖時(shí)間窗口的脈沖控制時(shí)間,則系統(tǒng)不會(huì)觸發(fā)脈沖采樣。例如,若選擇5 個(gè)脈沖采樣,則ω=5,則通過(guò)式(33)脈沖推導(dǎo)過(guò)程可以改寫為:那么第5 個(gè)脈沖就會(huì)在第5 個(gè)脈沖時(shí)間窗的左端點(diǎn)到第6 個(gè)脈沖時(shí)間窗的左端點(diǎn),也就是在內(nèi)發(fā)生,利用條件進(jìn)行反 推,可得該式中特征值θ有5 個(gè),則系統(tǒng)在達(dá)到第6 個(gè)脈沖時(shí)間窗的左端點(diǎn)時(shí)發(fā)生5 個(gè)脈沖采樣。
本文主要是利用TSC 策略對(duì)收斂周期進(jìn)行動(dòng)態(tài)調(diào)整,脈沖數(shù)量減少的觸發(fā)條件可以依據(jù)式(26)~式(33)的推導(dǎo)過(guò)程進(jìn)行判定,主要是對(duì)ω的大小進(jìn)行設(shè)定。此外,本文主要根據(jù)現(xiàn)實(shí)應(yīng)用要求進(jìn)行選擇脈沖采樣數(shù)量以應(yīng)對(duì)系統(tǒng)網(wǎng)絡(luò)條件:若網(wǎng)絡(luò)通信資源比較豐富,則可以減少脈沖數(shù)量以更快地提升系統(tǒng)的收斂速度;若通信資源較稀缺,則可以適當(dāng)增加脈沖數(shù)量以減少通信量。因此,本文研究?jī)?nèi)容主要為減少系統(tǒng)通信成本的同時(shí)提升一致性速度提供一種新思路。
在固定時(shí)間控制階段的系統(tǒng)誤差可以表示如下:
根據(jù)定理1 和式(23)得到式(37)。進(jìn)一步地,根據(jù)(37)可以得到式(38)。根據(jù)引理1~引理5 可得式(39)。
因此,根據(jù)引理1,可以得到系統(tǒng)式(1)的一致時(shí)間:
在式(43)中:T2是脈沖控制階段和固定時(shí)間階段的整個(gè)收斂時(shí)間。當(dāng)t≥T2時(shí),可以得到EV(t,ε(t)) ≡0。因此,具有隨機(jī)擾動(dòng)的MASs 能夠達(dá)到全局固定時(shí)間穩(wěn)定。
本節(jié)給出一個(gè)領(lǐng)導(dǎo)-跟隨者的仿真案例,證明了控制協(xié)議式(11)的有效性和可靠性。
考慮具有5 個(gè)智能體的MASs 參數(shù)設(shè)置如下:
從上述公式中可以得出Γ=diag{0.5,0.5,0.8}以及Σ=diag{0.2,0.4,0.6}。設(shè)伯努利分布的隨機(jī)變量α(t)和β(t)滿足α=β=0.5。設(shè)?=2,那么通過(guò)簡(jiǎn)單的計(jì)算得到λmax(Φ)=23.415 9,λmax(Ψ)=31.740 2。
系統(tǒng)的通信拓?fù)鋱D如圖2 所示,其中,0 節(jié)點(diǎn)為領(lǐng)導(dǎo)者,其他節(jié)點(diǎn)為跟隨者。
圖2 通信拓?fù)鋱DFig.2 Communication topology
根據(jù)定理1 以及已知參數(shù),設(shè)bn=-0.4,ζ=1.01。通過(guò)簡(jiǎn)單的計(jì)算得到θn=0.866 5,則脈沖時(shí)間窗上限為簡(jiǎn)單起見,選用=0.005 5。如圖3 所示,脈沖采樣時(shí)刻在脈沖時(shí)間窗內(nèi)隨機(jī)發(fā)生,并分別設(shè)定6 個(gè)和9 個(gè)脈沖采樣時(shí)刻,即ω=6 和ω=9。設(shè)切換信號(hào)為σ(t)=(nmod 4),t∈[tn,tn+1)。
圖3 脈沖時(shí)間窗與脈沖數(shù)量的關(guān)系Fig.3 Relationship of the impulsive time window and the number of impulsive
設(shè)定所有智能體的初始狀態(tài)值x0=[0.1,0.2,-0.3]T、x1=[5.5,3,4.6]T、x2=[-3.9,-2.8,4.3]T、x3=[ -5.7,3.5,-6.2]T、x4=[4.9,-3.2,-2.4]T。TSC 收斂過(guò)程如圖4、圖5 所示(彩色效果見《計(jì)算機(jī)工程》官網(wǎng)HTML 版),可以看出t6=T1=0.034 4,t9=T1=0.050 8。在固定時(shí)間控制階段,設(shè)?=35、κ1=2、κ2=2.5、?=1、k=3、p=5、q=3。根據(jù)式(43)可以計(jì)算出系統(tǒng)的一致時(shí)間為T2=2.354 1,從圖4 和圖5 的結(jié)果可以看出,系統(tǒng)的收斂時(shí)間要遠(yuǎn)小于T2,并且可以根據(jù)脈沖個(gè)數(shù)對(duì)收斂周期進(jìn)行動(dòng)態(tài)調(diào)整。當(dāng)設(shè)定的脈沖采樣數(shù)量較多時(shí),系統(tǒng)的收斂時(shí)間會(huì)更長(zhǎng),但是減少的通信量更多,通信資源的消耗更少;當(dāng)設(shè)定的脈沖采樣數(shù)量較少時(shí),則收斂周期會(huì)更快地進(jìn)入第二階段,隨之收斂時(shí)間也會(huì)更短。這也進(jìn)一步驗(yàn)證了雙階控制對(duì)于動(dòng)態(tài)調(diào)整系統(tǒng)收斂周期的有效性和準(zhǔn)確性,因此,具有隨機(jī)擾動(dòng)的領(lǐng)導(dǎo)-跟隨者M(jìn)ASs 可以在控制協(xié)議式(11)下達(dá)到固定時(shí)間一致。
單階控制、可變脈沖控制和固定時(shí)間連續(xù)控制下得到的三維狀態(tài)值以及狀態(tài)誤差如圖6~圖8 所示(彩色效果見《計(jì)算機(jī)工程》官網(wǎng)HTML 版)。由圖6 可以看出,單階控制收斂速度要稍快,但單階控制的收斂狀態(tài)比較單一,無(wú)法改變脈沖采樣個(gè)數(shù)。由圖7 可以看出,單一的脈沖控制可以減少通信成本,但是漸近一致性使得該方案不適用于現(xiàn)實(shí)場(chǎng)景,而TSC 策略的收斂時(shí)間相比于單一可變脈沖控制減少了0.07 s。由圖8 可以看出,單一固定時(shí)間連續(xù)控制有較快的收斂速度,但是連續(xù)不斷的通信交互使得通信資源的消耗也不斷增加,而TSC 策略的通信次數(shù)相比于單一固定時(shí)間連續(xù)控制分別減少了6~9。
因此,通過(guò)與圖4 和圖5 的雙階控制以及圖6~圖8的單階和單一控0 制的對(duì)比可以看出,本文提出的TSC策略是有效的,符合實(shí)際應(yīng)用場(chǎng)景。
圖4 6 個(gè)脈沖控制下得到的三維狀態(tài)值以及狀態(tài)誤差Fig.4 3D state value and state error obtained via the six impulsive controls
圖5 9 個(gè)脈沖控制下得到的三維狀態(tài)值以及狀態(tài)誤差Fig.5 3D state value and state error obtained via the nine impulsive controls
圖6 單階控制下得到的三維狀態(tài)值以及狀態(tài)誤差Fig.6 3D state value and state error obtained via single-stage control
圖7 可變脈沖控制下得到的三維狀態(tài)值以及狀態(tài)誤差Fig.7 3D state value and state error obtained via variable impulsive control
圖8 固定時(shí)間連續(xù)控制下得到的三維狀態(tài)值以及狀態(tài)誤差Fig.8 3D state value and state error obtained via fixed-time continuous control
本文通過(guò)分析并研究具有隨機(jī)擾動(dòng)的多智能體系統(tǒng)的固定時(shí)間一致性問(wèn)題提出TSC 策略,將整個(gè)控制周期分為可變脈沖控制階段和固定時(shí)間一致控制階段。通過(guò)數(shù)值仿真案例驗(yàn)證了TSC 策略的有效性,并表明其為不同通信網(wǎng)絡(luò)條件下的應(yīng)用場(chǎng)景提供了一個(gè)新的研究視角。由于本文引入可變脈沖控制,這對(duì)脈沖采樣的靈活性有較大提升,但是脈沖觸發(fā)時(shí)間主要是在脈沖時(shí)間窗范圍內(nèi)隨機(jī)發(fā)生,可變脈沖控制難以估計(jì)脈沖采樣時(shí)間,對(duì)于最終結(jié)果的可控程度會(huì)產(chǎn)生一定的影響,因此后續(xù)將進(jìn)一步探索可控性更高的脈沖控制策略以及二階多智能體系統(tǒng)。