林曼菲,張?zhí)炱?/p>
(揚(yáng)州大學(xué)信息工程學(xué)院自動(dòng)化專(zhuān)業(yè)部,江蘇揚(yáng)州 225127)
多智能體系統(tǒng)是由多個(gè)智能體組成的分布式獨(dú)立系統(tǒng),它能夠解決單一智能體無(wú)法解決的問(wèn)題,并提高其效率及魯棒性.特別是分布式多智能體系統(tǒng)的一致性控制在傳感器網(wǎng)絡(luò)、隨機(jī)多智能體系統(tǒng)、多機(jī)器人、機(jī)器人編隊(duì)等領(lǐng)域得到了廣泛的研究.多智能體系統(tǒng)的模型可分為無(wú)頭節(jié)點(diǎn)模型和帶有頭節(jié)點(diǎn)的模型[1].對(duì)于多智能體系統(tǒng)的分布式控制,多智能體的一致性控制已成為一個(gè)主要的研究方向,它的目的是設(shè)計(jì)分布式算法,使得一組智能體達(dá)到給定的協(xié)議.文獻(xiàn)[2]利用強(qiáng)化學(xué)習(xí)控制方法(reinforcement learning control,RLC)研究了多智能體系統(tǒng)(multi-agent systems,MAS)中的一致性問(wèn)題,并給出了一種可視的分布式量化協(xié)議來(lái)更新動(dòng)態(tài)系統(tǒng).文獻(xiàn)[3]研究了不可測(cè)量狀態(tài)非線性多智能體系統(tǒng)的一致量化控制設(shè)計(jì)問(wèn)題.文獻(xiàn)[4]研究了具有固定拓?fù)浣Y(jié)構(gòu)的無(wú)向圖上多智能體系統(tǒng)的分布式一致跟蹤問(wèn)題,并將命令濾波器后推技術(shù)推廣到一致性跟蹤控制問(wèn)題中,避免了后推設(shè)計(jì)中存在的“復(fù)雜性爆炸”問(wèn)題.文獻(xiàn)[5]研究了嚴(yán)格反饋形式下的多智能體系統(tǒng)的一致性問(wèn)題.文獻(xiàn)[6]考慮了一組高階非線性嚴(yán)格反饋多智能體系統(tǒng)在定向通信拓?fù)渖细櫰谕壽E的輸出一致問(wèn)題.
在實(shí)際工業(yè)應(yīng)用中,當(dāng)執(zhí)行器將設(shè)計(jì)的控制信號(hào)輸入到實(shí)際系統(tǒng)中時(shí),它們面臨兩個(gè)問(wèn)題:信號(hào)量化或執(zhí)行器故障.量化控制技術(shù)廣泛應(yīng)用于現(xiàn)代生產(chǎn)過(guò)程、電力系統(tǒng)、智能交通和需要通信的智能設(shè)備等領(lǐng)域.量化是連續(xù)信號(hào)離散化的過(guò)程,必然會(huì)給系統(tǒng)帶來(lái)額外的非線性.文獻(xiàn)[7]引入了一種滯回量化器,并設(shè)計(jì)了一種基于動(dòng)態(tài)面控制的控制律方法,去除了早期文獻(xiàn)中量化系統(tǒng)的許多假設(shè).文獻(xiàn)[8]討論了一類(lèi)具有輸入量化、未建模動(dòng)態(tài)和輸出約束的非線性系統(tǒng)的自適應(yīng)輸出反饋跟蹤控制問(wèn)題.引入了一類(lèi)具有滯回和均勻量化的新的量化器來(lái)處理輸入信號(hào).文獻(xiàn)[9–10]提出了一種有限時(shí)間輸入量化自適應(yīng)控制方法.文獻(xiàn)[11–12]提出了一種由均勻量化器和對(duì)數(shù)量化器的組合的量化器.另一個(gè)問(wèn)題是執(zhí)行器故障,執(zhí)行器故障分為部分失效和完全失效,執(zhí)行器完全失效時(shí),輸出不再受執(zhí)行器的影響[13–14].文獻(xiàn)[15]引入光滑函數(shù)來(lái)處理量化以及執(zhí)行器故障對(duì)于系統(tǒng)性能的影響,并將量化以及執(zhí)行器故障推廣到多智能體系統(tǒng)中.文獻(xiàn)[16]針對(duì)未知執(zhí)行器故障和系統(tǒng)不確定性,提出了一種自適應(yīng)控制方案,在執(zhí)行器故障的情況下實(shí)現(xiàn)期望的輸出跟蹤和閉環(huán)穩(wěn)定.
將自適應(yīng)動(dòng)態(tài)面方法和神經(jīng)網(wǎng)絡(luò)相結(jié)合有效地解決了一類(lèi)自適應(yīng)非線性系統(tǒng)的魯棒自適應(yīng)跟蹤控制問(wèn)題.自文獻(xiàn)[17]提出后推設(shè)計(jì)方法以來(lái),后推設(shè)計(jì)被廣泛應(yīng)用于非線性系統(tǒng)的控制器設(shè)計(jì).但是由于在遞歸設(shè)計(jì)的每一步都需要對(duì)虛擬控制律進(jìn)行求導(dǎo),造成了復(fù)雜性爆炸問(wèn)題.為了解決這一問(wèn)題[18]在后推設(shè)計(jì)的每一步中引入一階濾波器,提出了動(dòng)態(tài)面控制.文獻(xiàn)[19]研究了具有動(dòng)態(tài)不確定性的自適應(yīng)動(dòng)態(tài)面控制.文獻(xiàn)[20]研究了一類(lèi)帶有未知死區(qū)的純反饋非線性系統(tǒng)的自適應(yīng)動(dòng)態(tài)面控制.文獻(xiàn)[21]針對(duì)一類(lèi)具有全狀態(tài)約束和動(dòng)態(tài)不確定性的純反饋非線性系統(tǒng),利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neural networks,RBFNNs)建立了自適應(yīng)神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)面控制(dynamic surface control,DSC).文獻(xiàn)[22]將動(dòng)態(tài)面控制方法應(yīng)用于隨機(jī)系統(tǒng)中.在實(shí)際系統(tǒng)中存在許多不確定性,如未建模動(dòng)態(tài)、死區(qū)和狀態(tài)約束,這可能會(huì)降低系統(tǒng)的性能,甚至影響系統(tǒng)的穩(wěn)定性.未建模動(dòng)態(tài)是不確定非線性系統(tǒng)研究中考慮的一種不確定性.文獻(xiàn)[23–24]引入動(dòng)態(tài)信號(hào)來(lái)處理未建模動(dòng)態(tài).文獻(xiàn)[25]用李雅普諾夫函數(shù)來(lái)處理未建模動(dòng)態(tài).
本文在已有文獻(xiàn)的基礎(chǔ)上,主要解決了一類(lèi)具有輸入量化、未建模動(dòng)態(tài)和執(zhí)行器故障的非線性多智能體系統(tǒng)的一致跟蹤問(wèn)題.當(dāng)多智能體系統(tǒng)同時(shí)存在輸入量化、未建模動(dòng)態(tài)和執(zhí)行器故障時(shí),每一種不確定性都會(huì)對(duì)系統(tǒng)穩(wěn)定性產(chǎn)生影響,如何處理這些不確定項(xiàng)對(duì)系統(tǒng)的影響,以及如何將輸入量化以及執(zhí)行器故障模型線性化表示并設(shè)計(jì)合適的控制器是本文面臨的挑戰(zhàn).本文的主要貢獻(xiàn)如下:1)利用Young’s不等式和高斯函數(shù)的性質(zhì),有效地處理了多智能體鄰居節(jié)點(diǎn)在設(shè)計(jì)的第1步中對(duì)子系統(tǒng)的耦合作用,減少了所設(shè)計(jì)的虛擬控制中神經(jīng)網(wǎng)絡(luò)基向量的變量個(gè)數(shù),簡(jiǎn)化了穩(wěn)定性分析;2) 與文獻(xiàn)[3]相比,本文考慮了多智能體系統(tǒng)中存在未建模動(dòng)態(tài)以及執(zhí)行器故障的問(wèn)題,克服了一階濾波器常數(shù)無(wú)法求解的問(wèn)題,并在設(shè)計(jì)過(guò)程中簡(jiǎn)化了自適應(yīng)律的設(shè)計(jì);3)與文獻(xiàn)[15]相比,本文對(duì)執(zhí)行器故障模型和輸入量化模型進(jìn)行線性化處理,避免設(shè)計(jì)中間控制器,并且簡(jiǎn)化了自適應(yīng)律的設(shè)計(jì),同時(shí)采用自適應(yīng)動(dòng)態(tài)面方法,最后證明了領(lǐng)導(dǎo)者和跟隨者之間達(dá)成期望一致,同時(shí)保持誤差一致有界.
考慮由1個(gè)領(lǐng)導(dǎo)者和N個(gè)跟隨者組成的具有滯回量化器和執(zhí)行器故障的不確定多智能體系統(tǒng),第i個(gè)跟隨者系統(tǒng)和滯回量化器輸出Qi(ui,f)描述如下:
系統(tǒng)的控制目標(biāo)是考慮在執(zhí)行器部分失效情況下,在執(zhí)行器發(fā)生故障的時(shí)間段內(nèi)設(shè)計(jì)系統(tǒng)正??刂戚斎雞i,f,使閉環(huán)系統(tǒng)中所有信號(hào)都是半全局一致終結(jié)有界的,此外,使領(lǐng)導(dǎo)者和追隨者之間達(dá)成期望一致,同時(shí)保持誤差一致有界.
假設(shè)1[3]相對(duì)于跟隨者,領(lǐng)導(dǎo)者的信號(hào)yr∈R是可以獲得的,且滿(mǎn)足
其中B0>0為常數(shù).
假設(shè)2[7]未知?jiǎng)討B(tài)擾動(dòng)Δi,j(zi,,t)(i1,···,N;j1,···,n)滿(mǎn)足下列不等式
其中:?ij1(·)是未知光滑函數(shù),?ij2(·)是未知非負(fù)單調(diào)遞增連續(xù)函數(shù).
假設(shè)3[15]函數(shù)ui,sf,h有界,且上界是未知正數(shù),即存在正常數(shù),使得|ui,sf,h(t)|≤0.
假設(shè)4[15]所有執(zhí)行機(jī)構(gòu)不會(huì)同時(shí)失效且每個(gè)執(zhí)行器發(fā)生故障的次數(shù)為有限次,如果執(zhí)行器故障小于p,則閉環(huán)系統(tǒng)仍與其余執(zhí)行器良好工作.
假設(shè)6[3]多智能體存在根節(jié)點(diǎn),根節(jié)點(diǎn)與其他跟隨者之間有連接且根節(jié)點(diǎn)能夠獲取來(lái)自于領(lǐng)導(dǎo)者的信息.
引理1[24]如果Vi,0是系統(tǒng)的一個(gè)指數(shù)輸入狀態(tài)實(shí)用穩(wěn)定的Lyapunov函數(shù),當(dāng)式(10)–(11)成立,對(duì)任意常數(shù)ci0∈(0,ci),任意初始時(shí)刻ti0>0,任意初始條件zi0zi(ti0),vi0>0,對(duì)任意連續(xù)K∞類(lèi)函數(shù)滿(mǎn)足則存在一個(gè)有限時(shí)間Ti0?ci0)}≥0,一個(gè)非負(fù)函數(shù)Di(ti0,t),對(duì)于所有t≥ti0,信號(hào)可以描述為
因此,當(dāng)t≥ti0+Ti0時(shí),Di(ti,0,t)0,且Vi,0(zi)≤vi(t)+Di(ti0,t),其中Di(ti0,t)
令G(Γ,ζ)作為一個(gè)有向圖來(lái)模擬N個(gè)跟隨者之間的信息交換;其中Γ{n1,···,nN}表示節(jié)點(diǎn)集合,ζ{(ni,nj)}∈Γ ×Γ表示邊集合.定義鄰接矩陣A[aij]∈RN×N,aij≥0.對(duì)于有向圖,若(j,i)∈ζ,i ←j表明第i個(gè)智能體可以獲取來(lái)自第j個(gè)智能體的信息,此時(shí)aij1,否則aij0.定義度矩陣以Ddiag{d1,···,dN}以及Laplacian矩陣L,LD ?A,其中diNi為智能體i的鄰居的集合,定義為Ni{j ∈Γ:(j,i)∈ζ}.從智能體i到智能體j的有向圖是{(i,l),(l,m),···,(k,j)}的連續(xù)邊緣序列形式.若存在一個(gè)稱(chēng)為根節(jié)點(diǎn)的智能體i,從i到其他智能體都有一條有向通路,則有向圖G被稱(chēng)為生成樹(shù).此外,定義A0diag{a10,···,aN0}是領(lǐng)導(dǎo)者的鄰接矩陣.ai01表示第i個(gè)跟隨者可以獲取來(lái)自領(lǐng)導(dǎo)者的信息,否則ai00,令HL+A0.
引理2[3]如果生成樹(shù)存在于有向圖G中,根跟隨者有機(jī)會(huì)獲得領(lǐng)導(dǎo)者的信息,那么矩陣H所有特征值均具有正實(shí)部.
在給定的緊集?x?Rn,利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)逼近未知連續(xù)函數(shù)fi(x),有
其中:δi(x)為逼近誤差,?i(x)[?i1(x)···?iMi(x)]T∈RMi為基向量,其分量基函數(shù)?ij(x)取為下述高斯函數(shù):
其中:1 ≤i≤n,1 ≤j≤Mi,μij和bij分別為高斯函數(shù)的中心和寬度,Mi為第i個(gè)神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù),理想權(quán)重定義為
引 理3[26]若Z[χ1··· χN]T∈RN,X∈Rk,{i1,···,ik}是{1,···,N}的一個(gè)子序列,μ[μ1··· μN(yùn)]T,σ[σ1··· σN]T是兩個(gè)常數(shù)向量,
為每個(gè)跟隨者設(shè)計(jì)一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)面控制,根據(jù)跟隨者之間的關(guān)系定義坐標(biāo)變換如下:
根據(jù)引理2可知,H可逆.因此,有
步驟1由于第i個(gè)跟隨者的同步誤差為
故式(27)可重新寫(xiě)為
根據(jù)式(26)(29)代入式(25)得
設(shè)計(jì)虛擬控制律αi,2和估計(jì)參數(shù)的自適應(yīng)律如下:
其中:ki,1>0,ηi,1>0,σi,1>0是設(shè)計(jì)參數(shù).
注1根據(jù)假設(shè)6可知系統(tǒng)存在根節(jié)點(diǎn),不妨設(shè)第i0個(gè)智體是根節(jié)點(diǎn).由于根節(jié)點(diǎn)能從頭節(jié)點(diǎn)獲取信息,因此有ai001.當(dāng)ii0時(shí),存在根節(jié)點(diǎn)到多智能體i的通路,即存在j0i,j0∈Ni,使得1.故di≥1.進(jìn)一步得di+ai0 ≥1,i1,···,N.
注2引理3提供了處理非嚴(yán)格反饋系統(tǒng)中未知函數(shù)變量不滿(mǎn)足下三角條件的一種方法.根據(jù)上述推導(dǎo)可知,通過(guò)利用引理3和Young’s不等式,用于逼近未知函數(shù)的神經(jīng)網(wǎng)絡(luò)回歸向量中全部狀態(tài)變量可用部分滿(mǎn)足下三角條件的變量代替,從而簡(jiǎn)化了虛擬控制器和稍后的控制器設(shè)計(jì)以及穩(wěn)定性分析.
將式(31)–(32)代入式(30)得
引入一階濾波器,定義ωi,2如下:
其中:τi,2>0是一個(gè)正常數(shù),αi,2是一階濾波器輸入,ωi,2是一階濾波器輸出.令
對(duì)式(35)關(guān)于時(shí)間t求導(dǎo)得
進(jìn)一步得
步驟2定義誤差面如下:
將si,2關(guān)于時(shí)間t求導(dǎo)得
定義Lyapunov函數(shù)如下:
將V2關(guān)于時(shí)間t求導(dǎo)得
由Young’s不等式得
令
由Young’s不等式得
設(shè)計(jì)虛擬控制律αi,3和估計(jì)參數(shù)的自適應(yīng)律如下:
其中ki,2>0,ηi,2>0,σi,2>0是設(shè)計(jì)參數(shù).
將式(53)–(54)代入式(52)得
引入一階濾波器,定義ωi,3如下:
其中:τi,3>0是一個(gè)正常數(shù),αi,3是一階濾波器輸入,ωi,3是一階濾波器輸出.令
對(duì)式(57)關(guān)于時(shí)間t求導(dǎo)得
進(jìn)一步得
利用Young’s不等式得
步驟m(3 ≤m≤n ?1) 定義誤差面如下:
將si,m關(guān)于時(shí)間t求導(dǎo)得
定義Lyapunov函數(shù)如下:
將Vm關(guān)于時(shí)間t求導(dǎo)得
由Young’s不等式得
為
設(shè)計(jì)虛擬控制律αi,m+1和參數(shù)的自適應(yīng)律如下:
其中ki,m >0,ηi,m >0,σi,m >0是設(shè)計(jì)參數(shù).
將式(75)–(76)代入式(74)得
定義ωi,m+1如下:
其中:ωi,m+1(0)αi,m+1(0),τi,m+1>0是一個(gè)正常數(shù),αi,m+1是一階濾波器輸入,ωi,m+1是一階濾波器輸出.令
對(duì)式(79)關(guān)于時(shí)間t求導(dǎo)得
進(jìn)一步得
利用Young’s不等式得
步驟n定義誤差面如下:
將si,n關(guān)于時(shí)間t求導(dǎo)得
定義Lyapunov函數(shù):
將Vn關(guān)于時(shí)間t求導(dǎo)得
根據(jù)Young’s不等式得
由Young’s不等式得
由假設(shè)3–4以及式(3)–(4)得
其中:ki,n >0,ηi,n >0,σi,n >0是設(shè)計(jì)參數(shù).將式(95)–(96)代入式(94)得
由Young’s不等式得
定義總的Lyapunov函數(shù)和緊集如下:
定理1考慮具有控制器(95),虛擬控制器(31)(53)(75),以及自適應(yīng)律(32)(54)(76)(96)的多智能體系統(tǒng)(1),若假設(shè)1–6成立,則對(duì)任意正常數(shù)P及有界初始條件V(0)≤P,存在ki,1,ki,j(j2,···,n),τi,j,ηi,j,σi,j滿(mǎn)足式(101),使得當(dāng)系統(tǒng)具有量化輸入、執(zhí)行器故障及未建模動(dòng)態(tài)的情況下,閉環(huán)多智能體系統(tǒng)所有信號(hào)一致終結(jié)有界,各跟隨誤差收斂到原點(diǎn)的一個(gè)小領(lǐng)域內(nèi),其中
將上式兩邊積分得
其中:σ(H)是矩陣H的最小奇異值.對(duì)于給定的設(shè)計(jì)參數(shù)σij,選取充分大的設(shè)計(jì)參數(shù)γij.由式(101)可知,常數(shù)α0可充分大.根據(jù)式(104)可知,常數(shù)D0與所有的設(shè)計(jì)參數(shù)γij無(wú)關(guān).因此,對(duì)于給定的設(shè)計(jì)參數(shù)σij和正常數(shù)P,通過(guò)選取充分大的設(shè)計(jì)參數(shù)γij使常數(shù)α0充分大,從而使充分小.根據(jù)式(107)可知,隨著時(shí)間t的不斷增大,跟蹤誤差能夠變得足夠小.
下面給出一個(gè)算例驗(yàn)證所設(shè)計(jì)控制器的有效性.
例1考慮如下多智能體系統(tǒng):
其中:i1,2,3,4.故障模型描述如下:
考慮具有一個(gè)領(lǐng)導(dǎo)者和4個(gè)跟隨者的多智能體系統(tǒng),4個(gè)跟隨者通過(guò)如圖1所示的有向通信拓?fù)鋱D連接.在圖1中,領(lǐng)導(dǎo)者有指向所有跟隨者“1”,“2”,“3”,“4”的路徑.由拓?fù)鋱D可知,
圖1 多智能體的通訊拓?fù)銯ig.1 Communication topology of multi-agents
故鄰接矩陣A為
由拓?fù)鋱D可知,第2個(gè)跟隨者能夠獲取來(lái)自領(lǐng)導(dǎo)者的信息,即a201,A0為對(duì)角矩陣,表示為A0diag{0,1,0,0}.
選取
誤差面定義如下:
虛擬控制律設(shè)計(jì)如下:
自適應(yīng)律設(shè)計(jì)如下:
控制律設(shè)計(jì)如下:
選取設(shè)計(jì)參數(shù)如下:
選取初值如下:
仿真結(jié)果如圖2–9所示.圖2表明各跟隨智能體對(duì)頭智能體具有良好的一致跟蹤性;圖4表明各執(zhí)行器輸入信號(hào)是有界的;圖5–8表明不同智能體的故障信號(hào)是有界的;圖9表明估計(jì)參數(shù)隨著時(shí)間的增大趨于穩(wěn)定.
圖2 輸出yi(i1,2,3,4)和給定的期望軌跡yrFig.2 Outputs yi(i1,2,3,4)and desired trajectory yr
圖3 跟蹤誤差曲線Fig.3 Tracking error curves
圖4 控制信號(hào)Fig.4 Control signals
圖5 第1個(gè)跟隨者的執(zhí)行器故障信號(hào)Fig.5 The actuator fault signals of the first follower
圖6 第2個(gè)跟隨者的執(zhí)行器故障信號(hào)Fig.6 The actuator fault signals of the second follower
圖7 第3個(gè)跟隨者的執(zhí)行器故障信號(hào)Fig.7 The actuator fault signals of the third follower
圖8 第4個(gè)跟隨者的執(zhí)行器故障信號(hào)Fig.8 The actuator fault signals of the fourth follower
圖9 自適應(yīng)調(diào)節(jié)參數(shù)Fig.9 Adaptive adjustment parameters
本文針對(duì)一類(lèi)具有輸入量化、未建模動(dòng)態(tài)和執(zhí)行器故障的非線性多智能體系統(tǒng),提出了一種自適應(yīng)動(dòng)態(tài)面控制方法.通過(guò)理論分析證明了閉環(huán)控制系統(tǒng)是半全局一致終結(jié)有界的,所有跟隨者都能實(shí)現(xiàn)期望的一致性.仿真結(jié)果證明了所提出方案的有效性.