姚立強,宋艷榮,張術(shù)東
(1. 煙臺大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,山東 煙臺 264005; 2. 海軍航空工程學(xué)院系統(tǒng)科學(xué)與數(shù)學(xué)研究所,山東 煙臺 264001)
多智能體系統(tǒng)的協(xié)同控制問題是多智能體系統(tǒng)研究的熱點問題,協(xié)同控制問題研究主要集中在蜂擁控制問題[1]、一致性問題[2-3]、隊形控制問題[4]以及群集控制問題[5].多智能體避障隊形控制是指如何在有障礙物的環(huán)境中,智能體編隊在運動過程中能安全、無碰撞地繞開所有障礙物,速度達(dá)到一致,且實現(xiàn)并維持預(yù)先指定的隊形.隊形控制廣泛應(yīng)用于民用工業(yè)領(lǐng)域和軍事領(lǐng)域.
目前,多智能體系統(tǒng)隊形控制方法主要有領(lǐng)導(dǎo)-跟隨法[6]、基于行為法[7]、虛結(jié)構(gòu)法[8]和勢函數(shù)法[9].領(lǐng)導(dǎo)-跟隨法既可以處理帶領(lǐng)導(dǎo)者的多智能體系統(tǒng)問題,也可以將不帶領(lǐng)導(dǎo)者的多智能體系統(tǒng)引入虛擬領(lǐng)導(dǎo)者,將問題轉(zhuǎn)化為有領(lǐng)導(dǎo)者問題來處理.Olfati-saber運用這一思想在文獻[10]中給出了具有單個虛擬領(lǐng)導(dǎo)者的蜂擁控制策略;Su Housheng[11]將Olfati-saber的結(jié)果進一步推廣,提出了跟蹤多個虛擬領(lǐng)導(dǎo)者的蜂擁控制策略.領(lǐng)導(dǎo)-跟隨法雖然在多智能體控制研究中得到廣泛應(yīng)用,但在用于隊形控制時大多不考慮障礙物的存在.本文研究在障礙物存在的情況下如何實現(xiàn)隊形控制問題,同時要求多智能體既能避免相互之間發(fā)生碰撞,又能繞開障礙物.由于在實現(xiàn)隊形的過程中要同時考慮避障和避碰問題,所以在運用領(lǐng)導(dǎo)-跟隨法實現(xiàn)隊形控制的基礎(chǔ)上,引入勢函數(shù),實現(xiàn)避障和避碰問題.
本文主要運用人工勢場法,借助改進后的避障勢函數(shù)和避撞勢函數(shù),在文獻[12]的基礎(chǔ)上研究帶有領(lǐng)導(dǎo)者的多智能體系統(tǒng)的隊形控制及避撞、避障問題,給出了實現(xiàn)期望隊形控制的控制策略的設(shè)計方法.
考慮由N+1個智能體組成的多智能體系統(tǒng),其中有且只有一個領(lǐng)導(dǎo)者,該領(lǐng)導(dǎo)者具有如下所示的位置—速度模型
(1)
其中:q0∈Rn是領(lǐng)導(dǎo)者的位置向量,p0∈Rn是其速度向量,a0∈Rn是其加速度向量.
多智能體系統(tǒng)中其他N個智能體的地位是平等的,都是跟隨者.假定第i(i=1,2,…,N)個跟隨者具有如下的位置-速度模型
(2)
其中:qi∈Rn是跟隨者i的位置向量,pi∈Rn是其速度向量,ui∈Rn是控制輸入.
注1 領(lǐng)導(dǎo)者可以向每一個跟隨者發(fā)送信息,跟隨者能夠接收來自領(lǐng)導(dǎo)者的信息且具有避撞感知、避障感知功能.
為了更好地描述多智能體系統(tǒng)的隊形控制問題,我們引入以下定義.
定義1[11](基于感知的跟隨者的鄰居集) 如果多智能體系統(tǒng)中的智能體j(包括領(lǐng)導(dǎo)者)位于跟隨者i的避撞感知區(qū)域(以避撞感知半徑Ri為半徑的區(qū)域)內(nèi),即2個智能體的相對位置滿足‖qi-qj‖ Nαi={j|‖qi-qj‖ (i=1,2,…,N) (3) 稱為跟隨者i的鄰居集. 智能體之間的避撞控制目標(biāo)用數(shù)學(xué)形式可以描述為 ?t>0,‖qi(t)-qj(t)‖→/ 0. (i≠j;i,j=0,1,…,N) (4) 受Olfati-saber在文獻[10]中對固定障礙物的處理方法的啟發(fā),我們給出徑向K∞類函數(shù)的定義. 定義2(徑向K∞類函數(shù)) 全平面上定義的二元連續(xù)可微函數(shù)F(x,y)在點(a,b)取得最小值0,如果滿足 1) 對于固定的角度θ,F(a+rcosθ,b+rsinθ) (r≥0)是r的嚴(yán)格單調(diào)上升函數(shù); 2) 對于固定的角度θ,當(dāng)r→∞時,有F(a+rcosθ,b+rsinθ)→∞; 則稱F(x,y)為以(a,b)為底的徑向K∞類函數(shù). 徑向K∞類函數(shù)具有如下性質(zhì) (1) 對任意C>0,{(x,y):F(x,y)≤C}是一個單連通的有界閉區(qū)域,邊界為F(x,y)=C. (2) 定義ρC(d)=min{‖X-Y‖:X∈BC,Y∈BC+d},則ρC(d)是d(d≥0)的單調(diào)遞增函數(shù). 注2 基于徑向K∞類函數(shù)性質(zhì)1,可以用形如{(x,y):F(x,y)≤C} (C>0)的集合來描述障礙物,障礙物邊界用BC={(x,y):F(x,y)=c}表示. 注3 借助于徑向K∞類函數(shù)的性質(zhì),智能體和障礙物之間的避障問題可以轉(zhuǎn)換為障礙物邊界曲線函數(shù)值與智能體位置向量在該邊界曲線的等位線曲線上函數(shù)值之間的大小比較問題. 注4 假設(shè)系統(tǒng)中的領(lǐng)導(dǎo)者總是可以成功躲避障礙物. 下面,我們給出跟隨者i相對于固定障礙物Ok的避障感知半徑和避障作用區(qū)域的定義. 定義3(跟隨者相對于障礙物的避障感知半徑) 如果障礙物Ok對距離小于等于dik的跟隨者i產(chǎn)生“排斥力”,即跟隨者i采取避障動作,則稱dik為跟隨者i相對于障礙物Ok的避障感知半徑. 定義4(障礙物相對于跟隨者的避障作用區(qū)域) 對于給定的避障感知半徑dik,區(qū)域Dik={(x,y):Ck 跟隨智能體i的障礙物鄰居集可以寫為 Nβi={k|rik∈Dik;i=1,2,…,N;k=1,2,…,M}. 這里,rik=Fk(qi)是智能體i在障礙物Ok邊界曲線的一條等位線上的函數(shù)值,Dik是跟隨智能體i相對于障礙物Ok的避障作用區(qū)域,M是障礙物的個數(shù). 跟隨智能體i與障礙物Ok之間的避障控制目標(biāo)可以描述為 ?t>0,rik-Ck→/ 0. (i=1,…,N;k=1,2,…,M) (5) 定義5[12](期望隊形) 期望隊形就是某個向量h=col(h1,h2,…,hN),其中hi是跟隨智能體i相對領(lǐng)導(dǎo)智能體的相對位置. 如果多智能體系統(tǒng)(1)和(2)中智能體i的位置向量滿足 qi-q0=hi.(i≠j;i,j=1,2,…,N) (6) 則稱多智能體系統(tǒng)實現(xiàn)期望隊形h. 注5 期望隊形中兩智能體之間的距離總是大于它們的避撞感知半徑. 因此,本文控制問題可以描述為:設(shè)計恰當(dāng)?shù)膮f(xié)作控制輸入ui,使得多智能體系統(tǒng)(1)和(2)滿足避撞控制目標(biāo)(4)、避障控制目標(biāo)(5)和隊形控制目標(biāo)(6). 本節(jié)主要研究在避撞、避障條件下設(shè)計控制策略,以實現(xiàn)期望隊形.借助文獻[12]中隊形匹配勢函數(shù)生成函數(shù)和避撞勢函數(shù)生成函數(shù),可以定義如下的隊形匹配勢函數(shù)和避撞勢函數(shù). 定義6(隊形匹配勢函數(shù)) 在多智能體系統(tǒng)(1)和(2)中,跟隨者i的隊形匹配勢函數(shù)Vi(qi-q0,hi)是一個非負(fù)、連續(xù)可導(dǎo)的函數(shù),且滿足:1)Vi(qi-q0,hi)=0成立當(dāng)且僅當(dāng)qi-q0=hi;2) 當(dāng)‖qi-q0-hi‖→∞時,Vi(qi-q0,hi)→∞. 要想實現(xiàn)避撞控制目標(biāo)(4),應(yīng)構(gòu)造能夠產(chǎn)生避撞的勢函數(shù). 跟隨智能體i的總的避撞勢函數(shù) (7) 要實現(xiàn)避障控制目標(biāo)(5),需構(gòu)造躲避障礙物的避障勢函數(shù). 跟隨者i總的避障勢函數(shù)為 (8) 定理1 考慮一個由N+1個智能體組成的多智能體系統(tǒng),其中有且僅有一個領(lǐng)導(dǎo)者,其余智能體為跟隨者,系統(tǒng)中智能體的位置—速度模型為(1)和(2).假定系統(tǒng)在行進過程中至多會遇到M個外部環(huán)境中的固定障礙物Ok(k=1,2,…,M),領(lǐng)導(dǎo)者總是在障礙物的避障作用區(qū)域外活動,同時假設(shè)多智能體系統(tǒng)總的能量W0為一個有限值,則多智能體系統(tǒng)在控制輸入(9)的作用下,最終會形成期望隊形,且在運動過程中智能體之間不發(fā)生碰撞,并能成功避開障礙物,即同時實現(xiàn)避撞控制目標(biāo)(4)、避障控制目標(biāo)(5)和隊形控制目標(biāo)(6). (9) 其中: 證明定義多智能體系統(tǒng)(1)和(2)總的能量W為智能體系統(tǒng)總的隊形匹配勢函數(shù)、避撞勢函數(shù)以及智能體與障礙物之間總的避障勢函數(shù)之和,簡稱能量函數(shù).它的表達(dá)式如下 (10) 從能量函數(shù)W的表達(dá)式可以知道該函數(shù)是一個半正定的函數(shù),并且 (11) (12) 將式(12)代入控制輸入(9)和能量函數(shù)(10)中,可得 (13) (14) 其中: (15) 進一步,將式(12)代入式(11)中得 (16) 由于 (17) (18) (19) (20) 將式(13)、式(17)~(20)代入式(16)中得 (21) (22) pi=p0.(i=1,2,…,N) (23) ▽qiVi(qi-q0,hi)=0. (24) 式(24)可以理解為,系統(tǒng)的隊形匹配勢函數(shù)對系統(tǒng)的作用力為零.由定義8可知 qi-q0=hi. (i=1,2,…,N) (25) 這樣,由式(23)和(25)可知,在控制輸入(11)的作用下,多智能體系統(tǒng)(1)和(2)能夠?qū)崿F(xiàn)預(yù)先給定的期望隊形h,即實現(xiàn)隊形控制目標(biāo)(6). 下面,用反證法來證明多智能體系統(tǒng)在運動過程中,智能體之間不會發(fā)生碰撞. 假設(shè)系統(tǒng)中智能體r和e在時刻t1>0相撞,即智能體r和e在時刻t1的位置滿足 qr(t1)=qe(t1). (r≠e;r,e=0,1,2,…,N) 由定義10和式(7)知 由于t=t1時,qr(t1)=qe(t1),所以根據(jù)定義10,當(dāng)t→t1時 (26) 另一方面,由式(10)知 (27) 由于系統(tǒng)總的能量W0為有限值,這樣式(26)和(27)產(chǎn)生矛盾.說明假設(shè)錯誤,多智能體系統(tǒng)在行進過程中智能體之間不會發(fā)生碰撞,即實現(xiàn)避撞控制目標(biāo)(4). 同理,用反證法也可以證明系統(tǒng)在行進過程中可以成功躲避來自外部環(huán)境的固定障礙物,這里略過. 綜上所述,在控制輸入(9)的作用下,有領(lǐng)導(dǎo)者多智能體系統(tǒng)(1)和(2)可以實現(xiàn)避撞控制目標(biāo)(4)、避障控制目標(biāo)(5)和隊形控制目標(biāo)(6).證畢. 本節(jié)主要驗證施加控制輸入(11)后,多智能體系統(tǒng)(1)和(2)中的跟隨者能夠跟隨領(lǐng)導(dǎo)者實現(xiàn)避撞控制目標(biāo)(4)、避障控制目標(biāo)(5)和隊形控制目標(biāo)(6). 仿真中系統(tǒng)的領(lǐng)導(dǎo)者在平面中沿平行于x軸的方向勻速向右移動,領(lǐng)導(dǎo)者和19個跟隨者的初始位置在[0,2]×[-2,2]的區(qū)域內(nèi)任意選取,初始速度隨機生成,障礙物是2個以(20,6),(25,-2)為中心的圓.仿真的目標(biāo)是跟隨者在避撞、避障的前提下以領(lǐng)導(dǎo)者為圓心均勻排列在半徑為5的圓周上行進.仿真圖如圖1所示. 圖1 帶領(lǐng)導(dǎo)者多智能體系統(tǒng)的運動軌跡圖 由圖1系統(tǒng)運動軌跡可以看出,在無障礙情形,系統(tǒng)中的跟隨者排列在領(lǐng)導(dǎo)者周圍逐漸形成期望隊形 (如t=28 s所示);遇到障礙物后,跟隨者暫時不考慮隊形,以避障為主(如t=60 s,t=85 s所示);穿越障礙物后,跟隨者再次與領(lǐng)導(dǎo)者形成期望隊形 (如t=100 s,t=133 s所示). 本文利用勢函數(shù)方法研究了帶有領(lǐng)導(dǎo)者的多智能體在避撞、避障條件下的隊形控制問題.通過構(gòu)造隊形勢函數(shù)、避撞勢函數(shù)以及避障勢函數(shù),給出了隊形控制的控制策略,并證明了在該控制策略的作用下,系統(tǒng)能夠?qū)崿F(xiàn)期望的隊形,并且避免了智能體之間碰撞的發(fā)生,成功躲避外部障礙物.最后,利用仿真說明了該方法的有效性. 參考文獻: [1]Lu Xiaoqing, Austin F, Chen Shihua.Flocking in multi-agent systems with active virtual leader and time-varying delays coupling [J].Communications in Nonlinear Science and Numerical Simulation, 2011, 16(2): 1014-1026. [2]Hu Guoqiang. Robust consensus tracking of a class of second-order multi-agent dynamic systems[J].Systems & Control Letters, 2012, 61(1): 134-142. [3]Huang Qizhen. Consensus analysis of multi-agent discrete-time systems [J]. Acta Automatica Sinica, 2012, 38(7): 1127-1133. [4]Liu Yang, Jia Yingmin. An iterative learning approach to formation control of multi-agent systems [J]. Systems & Control Letters, 2012, 61(1): 148-154. [5]Ryan M R, Madey G R. Swarm control of UAVs for cooperative hunting with DDDAS [J]. Procedia Computer Science, 2013, 18: 2537-2544. [6]Cui Rongxin, Ge S S, How B V E, et al.Leader-follower formation control of underactuated autonomous underwater vehicles [J]. Ocean Engineering, 2010, 37(17-18): 1491-1502. [7]Liang Haizhao, Wang Jianying, Sun Zhaowei. Robust decentralized coordinated attitude control of spacecraft formation [J]. Acta Astronautica, 2011, 69(5-6): 280-288. [8]Cong Binglong, Liu Xiangdong, Chen Zhen. Distributed attitude synchronization of formation flying via consensus-based virtual structure [J].Acta Astronautica, 2011,68(11-12): 1973-1986. [9]Badawy A, McInnes C R. Small spacecraft formation using potential functions [J]. Acta Astronautica, 2009, 65(11-12): 1783-1788. [10]Olfati-saber R.Flocking for multi-agent dynamic systems: algorithms and theory[J]. IEEE Transactions on Automatic Control, 2006, 51(3): 401-420. [11]Su Housheng, Wang Xiaofan, Lin Zongli. Flocking of multi-agents with a virtual Leader [J].IEEE Transactions on Automatic Control, 2009, 54(2): 293-307. [12]姚立強,宋艷榮,張術(shù)東.基于勢函數(shù)的多智能體避撞隊形控制[J].煙臺大學(xué)學(xué)報:自然科學(xué)與工程版,2014, 27(1):45-49.2 控制策略的設(shè)計
3 仿真實例
4 小 結(jié)
—— 甕福集團PPA項目成為攪動市場的“鯰魚”