吳慕蘭
(中國科學(xué)技術(shù)大學(xué) 自動化系,安徽 合肥230026)
近年來,多智能體系統(tǒng)由于在編隊控制、無線傳感器、機器人協(xié)作裝備等領(lǐng)域的廣泛應(yīng)用而受到越來越多的關(guān)注。 作為多智能體系統(tǒng)研究中的基礎(chǔ)問題,同步指所有智能體在某些變量例如位置或速度上達到一致的動態(tài)過程。目前存在的有關(guān)同步問題的工作主要分為兩類:一類是無領(lǐng)航者的同步問題[1],一類是領(lǐng)航-追隨者同步問題[2],并且其中大多數(shù)工作是關(guān)于線性系統(tǒng)的。但是在實際情況中系統(tǒng)不可避免地會出現(xiàn)各種非線性和不確定性項,因此未知非線性多智能體系統(tǒng)的同步已成為一個研究的熱點。
由于神經(jīng)網(wǎng)絡(luò)方法[3-4]具有可以從樣本集學(xué)習(xí)復(fù)雜映射的能力,其可以在線學(xué)習(xí)對未知非線性動力學(xué)系統(tǒng)的識別?;谏窠?jīng)網(wǎng)絡(luò)固有的非線性逼近能力和內(nèi)在的自適應(yīng)學(xué)習(xí)特征,原始的控制問題常??梢赞D(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制問題[5-6]。 這類控制策略能保證系統(tǒng)的一致性誤差最終可以穩(wěn)定在一個較小的界內(nèi),其大小取決于模型中的一些顯式參數(shù)和未知但有界的項,然而并沒有系統(tǒng)的方法去計算這些上界,因此無法去準(zhǔn)確地評估最終的穩(wěn)定狀態(tài)性能。 同時,不確定性使得控制過程中誤差的收斂速度也難以準(zhǔn)確地評估。 實際控制過程中,希望系統(tǒng)在各項參數(shù)設(shè)計好后滿足給定的穩(wěn)態(tài)性能和瞬態(tài)性能,即系統(tǒng)的誤差最終收斂到給定的較小的界內(nèi), 同時收斂的速度不小于給定的值。KATSOUKIS T 等通過使用預(yù)設(shè)性能控制的方法來實現(xiàn)這一同步誤差約束[7],其最終目標(biāo)是使得每個智能體的同步誤差嚴(yán)格地在預(yù)設(shè)區(qū)域內(nèi)演化。 關(guān)鍵思想是通過轉(zhuǎn)換后的同步誤差將每個智能體的約束誤差放寬為不受約束的誤差,但是轉(zhuǎn)換后的誤差會增加需要處理的變量的數(shù)量且控制效果不穩(wěn)定。
本文采用障礙Lyapunov 函數(shù)方法[8]解決誤差約束問題從而避免引入轉(zhuǎn)換誤差,設(shè)計了新的分布式障礙Lyapunov 用以研究多智能體系統(tǒng)問題,實驗結(jié)果表明同步誤差能夠被嚴(yán)格限制在預(yù)設(shè)范圍內(nèi)演化。
投影運算常被用于自適應(yīng)控制中約束被估計的參數(shù),下面給出一類投影算子的定義。
對于N 維實向量θ,y ∈RN,投影算子Proj 的定義如下:其中標(biāo)量函數(shù)φ:RN→R 是一個連續(xù)的凸函數(shù),φ′(θ)是φ(θ)關(guān)于θ 的偏導(dǎo)數(shù)。
定 義 凸 集 合Ω0?{θ ∈RN|φ(θ)≤0}以 及Ω1?{θ∈RN|φ(θ)≤1}。 由文獻[10]可知,在上文定義的投 影 算 子Proj(θ,y)和 初 始 值θ(t=0)=θ0∈Ω1下,θ永遠(yuǎn)不會超出集合Ω1。 同時對于任意的θ*∈Ω0和任意的y∈RN,下面的不等式成立:
給定一個由N 個追隨者和一個標(biāo)記為0 的領(lǐng)航者組成的多智能體系統(tǒng)。 第i 個追隨者的動力學(xué)方程如下:
其 中,xi∈R 是 追 隨 者i 的 狀 態(tài),ui∈R 表 示 施 加在追隨者i 上的控制輸入,δi∈R 是外界干擾因素,fi(xi)∈R 是滿足局部Lipschitz 條件的非線性函數(shù)。
領(lǐng)航者根據(jù)以下動力學(xué)方程演變:
其中x0∈R 是領(lǐng)航者的狀態(tài)。
本文的目的在于實現(xiàn)多智能體的同步,同時同步誤差限定在給定的范圍內(nèi)以滿足預(yù)期的瞬態(tài)和穩(wěn)態(tài)性能。 為此,定義了鄰居同步誤差:
和與時間有關(guān)的性能函數(shù):
其 中ρi0、ρi∞、mi是 根 據(jù) 初 始 條 件 和 期 望 性 能 選 擇 的合適參數(shù),期待達到的誤差約束可以通過以下不等式說明:
即希望誤差ei的最大超調(diào)量不超過ρi0,最終收斂值小于ρi∞,收斂的速率不小于mi。
其中神經(jīng)元的個數(shù)為vi,Wi∈Rvi是一個未知的理想權(quán)重列向量,其定義如下:
其中Si(xi)∈Rvi是一組基函數(shù)向量,多種類型的基函數(shù)如sigmoid 函數(shù)、 高斯函數(shù)都可以使用在神經(jīng)網(wǎng)絡(luò)中[5]。
真實的權(quán)重向量Wi值常常難以獲得,采用估計值代 替則有:
障礙Lyapunov 函數(shù)是自適應(yīng)控制系統(tǒng)中常用來限制變量的工具。 它是一類定義在包含原點的開區(qū)域上的標(biāo)量函數(shù),一旦變量趨向于給定的邊界,障礙Lyapunov 函數(shù)便會趨向于無窮大。 若能夠設(shè)計合理的控制器保證障礙Lyapunov 函數(shù)是有界的,那么變量就會永遠(yuǎn)限制在給定的區(qū)域。 在介紹分布式障礙Lyapunov 函數(shù)之前,先給出一個相關(guān)的正定矩陣性質(zhì)[11]。
令(L+B)是一個非奇異M-矩陣。 定義向量
和矩陣
那么矩陣P 是正定的,同時定義矩陣Q 為
可以得到矩陣Q 也是正定的。
對于上文給定的鄰居同步誤差ei,接下來給出相應(yīng)的分布式障礙Lyapunov 函數(shù)φ(e)RN→R+的表達形式如下:
其中e 為鄰居同步誤差ei組成的列向量,即e=[e1,e2,…,eN]T,并且有:
φ(e)對時間t 求導(dǎo)可以得到:
其中矩陣
矩陣對角元素
矩陣
矩陣對角元素
基于前面提出的分布式障礙Lyapunov 函數(shù),接下來給出第i 個追隨者的控制律如下:
其中控制增益c>0。 基于定理1 的穩(wěn)定性分析,局部神經(jīng)網(wǎng)絡(luò)的權(quán)重更新律如下:
其中di、bi和pi定義分別如上文矩陣D、B 和P 所示,矩 陣Ri=ΠiIvi∈Rvi×vi,待 設(shè) 計 的 參 數(shù)Πi>0。 1.2小節(jié)投影算子Proj 定義中的θ 對應(yīng)這里的W?,y 對應(yīng) 這 里 的RiSi(xi)eiφdi(ei)pi(di+bi)。
式(19)對時間t 求導(dǎo)可以得到:
將式(16)代入式(20)得到:
在給出定理1 之前,對系統(tǒng)有如下假設(shè):
(2)各個多智能體干擾量組成的列向量δ 有界,即||δ||≤δM。
(3)神經(jīng)網(wǎng)絡(luò)基函數(shù)向量滿足||S(x)||≤SM,權(quán)重估計值矩陣滿足||W||F≤WM, 神經(jīng)網(wǎng)絡(luò)近似誤差滿足||ε||≤εM。
定理1:考慮由式(3)、式(4)定義的多智能體系統(tǒng),其通信拓?fù)浒豢靡灶I(lǐng)航者為根節(jié)點的有向生成樹。已知|ei(0)|<ρi0,i=1,2,…,N,ρi(t)是如前文所提到的性能函數(shù)(6),并且有:
證 明: 考 慮 一 個 在 集 合Dρ×∈RviN上 定 義 的Lyapunov 函 數(shù)V:Dρ×∈RviN→R+如 下:
其 中,Dρ?{e|e=[e1,e2,…,ei],ei∈(-ρi(t),ρi(t))},φ(e)是分布式障礙Lyapunov 函數(shù)(11),W~i是神經(jīng)網(wǎng)絡(luò)權(quán)重估計誤差向量,Ri是神經(jīng)網(wǎng)絡(luò)權(quán)重更新律(15)中的對角矩陣。 利用Frobenius 范數(shù),式(25)可以寫成:
其中R=diag{R1,R2,…,RN}。 式(26)關(guān)于時間t 的導(dǎo)數(shù)為:·
將式(21)代入式(25)得到:
應(yīng)用神經(jīng)網(wǎng)絡(luò)權(quán)重更新規(guī)則(15)以及相關(guān)性質(zhì)(2),可以得到:
因此由式(28)得到:
令α+β=1,0<α<1,那么不等式(29)可以寫成:
利用式(13),式(31)中的γcΦd(e)+Yd(e)可以寫成對角陣的形式:
其中對角元素:
由ρi(t)≥(ρi0-ρi∞)exp(-γct)可 以 得 知,
這確保了
那 么 立 即 能 夠 得 到γc φdi(ei)+Ydi(ei)>0,i=1,2,…,N。 因此γcΦd(e)+Yd(e)>0,不等式(31)可以放縮為:
其中
因此,V˙≤0 的充分條件為:
利 用 初 始 條 件|ei(0)|<ρi0,|ei(t)|<ρi(t)?t ≥0 可以由文獻[8]中引理1 得到。證畢。
為了驗證所提出的的分布式自適應(yīng)控制律的有效性,本文考慮圖1 所示的通信拓?fù)?,其包?個跟隨者和一個領(lǐng)航者,通信拓?fù)浒豢靡灶I(lǐng)航節(jié)點為根節(jié)點的有向生成樹,邊的權(quán)重都設(shè)為1。
圖1 多智能體系統(tǒng)的通信拓?fù)?/p>
首先,考慮文獻[4]中提出的分布式自適應(yīng)控制律:
其神經(jīng)網(wǎng)絡(luò)權(quán)重更新律為:
其中,參數(shù)Fi=1 500,c=225,κ=0.01,此外第i 個節(jié)點的神經(jīng)元的個數(shù)選擇為vi=3。 系統(tǒng)狀態(tài)和局部鄰域同步誤差如圖2、圖3 所示。
圖2 采用控制律(23)和神經(jīng)網(wǎng)絡(luò)權(quán)重更新律(24)時的狀態(tài)值
圖3 采用控制律(14)和神經(jīng)網(wǎng)絡(luò)權(quán)重更新律(15)時的狀態(tài)值
接下來,采用本文提出的基于DBLF 的自適應(yīng)控制 律。 參數(shù)Πi=150,c=225,DBLF 的參數(shù)為ρi0=2.1,ρi∞=0.005 和mi=30,即:
ρi(t)=(2.1-0.005)×exp(-30t)+0.005,i=1,2,…,5
使用本文的自適應(yīng)控制律的系統(tǒng)狀態(tài)和局部鄰居同步誤差如圖4 和圖5 所示。
圖4 采用控制律(23)和神經(jīng)網(wǎng)絡(luò)權(quán)重更新律(24)時的誤差值
圖5 采用控制律(14)和神經(jīng)網(wǎng)絡(luò)權(quán)重更新律(15)時的狀態(tài)值
本文研究了領(lǐng)航-追隨者多智能體的同步誤差限制問題,其中智能體動力學(xué)具有未知的非線性和不確定的干擾。 為了實現(xiàn)同步誤差約束,本文開發(fā)了一種新穎的分布式障礙Lyapunov 函數(shù),然后提出了基于分布式障礙Lyapunov 函數(shù)的神經(jīng)自適應(yīng)控制律。 最后用仿真實例證明了所提出協(xié)議的有效性。