黃捷 李俊杰
摘 要:針對(duì)僅在獲取多智能體局部距離及相對(duì)角度信息條件下如何保持多智能體系統(tǒng)剛性編任務(wù)規(guī)劃隊(duì)問題, 本文提出了兩種多智能體剛性編隊(duì)任務(wù)規(guī)劃方案。 首先提出一種基于距離和相對(duì)角度的剛性編隊(duì)規(guī)劃方案, 規(guī)劃在未知相對(duì)位置情況下確保智能體剛性編隊(duì)。 其次利用零空間投影的任務(wù)規(guī)劃方法解決編隊(duì)任務(wù)與避障任務(wù)的沖突, 確保編隊(duì)移動(dòng)過程中編隊(duì)隊(duì)形的穩(wěn)定。 再次結(jié)合距離和相對(duì)角度提出一種整體剛性編隊(duì)規(guī)劃方案, 并在避障過程中將多智能體系統(tǒng)視為整體進(jìn)行避障, 確保穩(wěn)定的剛性編隊(duì)和避障任務(wù)的完成。 經(jīng)過仿真驗(yàn)證本文提出的兩種方法在弱化相對(duì)位置信息的條件下能夠較好的保持剛性編隊(duì)并完成避障任務(wù), 對(duì)比于依賴相對(duì)位置的零空間行為控制方法弱化了對(duì)于相對(duì)位置信息的依賴。
關(guān)鍵詞:? 剛性編隊(duì); 任務(wù)規(guī)劃; 多智能體系統(tǒng);? 相對(duì)角度信息;? 距離信息
中圖分類號(hào):? TJ760
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào):? 1673-5048(2024)02-0079-12
DOI: 10.12132/ISSN.1673-5048.2024.0003
0 引? 言
由于多智能體系統(tǒng)具備自主性、 分布性、 協(xié)同性等特性, 近二十年來, 多智能體系統(tǒng)的研究成為人工智能領(lǐng)域的熱點(diǎn)之一。 多智能體系統(tǒng)通過各智能體間的通訊、 合作、 競(jìng)爭(zhēng)及控制等來實(shí)現(xiàn)大規(guī)模自主無人系統(tǒng)群體智能特征的涌現(xiàn)。 多智能體系統(tǒng)協(xié)作不僅是單個(gè)智能體作用的簡(jiǎn)單相加, 其整體效能還包括個(gè)體之間相互作用的非線性增量。
多智能體是表征集群飛行器等無人系統(tǒng)的一種典型技術(shù), 由于飛行器等運(yùn)動(dòng)體往往具有任務(wù)約束和編隊(duì)的性能要求, 包括了集群任務(wù)規(guī)劃與協(xié)同運(yùn)動(dòng)控制等關(guān)鍵技術(shù)。 在過去的研究中, Martin等[1]基于博弈理論提出一種合作博弈理論框架用以實(shí)現(xiàn)多機(jī)器人的集聚與編隊(duì)生成; Flores-Resendiz等[2]提出一種由有界吸引分量和互補(bǔ)排斥分量組成的控制策略解決二階多智能體系統(tǒng)的無碰撞編隊(duì)控制問題; Lin等[3]基于李代數(shù)方法提出一種多四旋翼系統(tǒng)內(nèi)外環(huán)分布式編隊(duì)控制方案, 消除干擾和偏置擾動(dòng)引起的不可靠角速度反饋; Kankashvar等[4]基于改進(jìn)多智能體強(qiáng)化學(xué)習(xí)價(jià)值函數(shù)提出一種航天器編隊(duì)飛行重構(gòu)跟蹤方法; Guo等[5]基于一致性理論和局部鄰域信息提出一種包含避障, 避碰和編隊(duì)重建控制項(xiàng)的分布式編隊(duì)控制器。
剛性編隊(duì)是多智能體編隊(duì)領(lǐng)域的一種特殊編隊(duì)方法, 其要求各智能體兩兩之間距離保持不變, 從而形成固定的剛性隊(duì)形, 多智能體剛性編隊(duì)包括了剛性任務(wù)規(guī)劃與運(yùn)動(dòng)控制。 在一些具體的應(yīng)用任務(wù), 如大型物體的搬運(yùn)[6]、 多無人機(jī)協(xié)同覆蓋[7-8]和多航天器穩(wěn)定編隊(duì)[9-10]等研究中, 所有的智能體必須組成特定的隊(duì)形并在執(zhí)行任務(wù)期間保持整個(gè)隊(duì)形不變, 保持嚴(yán)格的剛性編隊(duì)。 當(dāng)多智能體的坐標(biāo)框架存在微小的錯(cuò)位時(shí), 隊(duì)形會(huì)發(fā)生扭曲, 并帶來額外的平移運(yùn)動(dòng), 這將影響整體框架穩(wěn)定性。 為了增強(qiáng)多智能體坐標(biāo)框架的魯棒性, 可采用剛性理論[11]這一數(shù)學(xué)工具來保證多智能體系統(tǒng)的剛性編隊(duì)保持。 Krick等[12]以及Aranda等[13]提出,? 多智能體系統(tǒng)剛性編隊(duì)要求在歐幾里得空間中, 整個(gè)系統(tǒng)的隊(duì)形逐漸收斂到一組由期望距離所定義的剛性隊(duì)形。
圖論在多智能體剛性編隊(duì)問題中扮演關(guān)鍵角色, 尤其剛性圖理論成為該領(lǐng)域的研究熱點(diǎn)。 Aspnes等[14]的研究揭示了剛性概念與編隊(duì)問題之間的關(guān)聯(lián),? 并提出了一種基于剛性圖設(shè)計(jì)剛性編隊(duì)規(guī)劃的方法。 Olfati-Saber等[15]采用質(zhì)點(diǎn)模型, 提出了基于勢(shì)函數(shù)的編隊(duì)規(guī)劃方法, 并利用剛性圖論定義了編隊(duì)隊(duì)形, 實(shí)現(xiàn)了基本的剛性隊(duì)形。 Zhou等[16]以及Arrichiello等[17]利用全局相對(duì)位置信息并基于零空間行為控制(Null-Space-based Behavioral Control, NSBC)的方法設(shè)計(jì)了剛性編隊(duì)的控制律。 然而, 在實(shí)際應(yīng)用場(chǎng)景下如物流智能體編隊(duì)控制, 智能體室內(nèi)編隊(duì)探測(cè)過程中, 全局的相對(duì)位置信息及全部智能體的質(zhì)心往往難以獲得, 且獲取相對(duì)位置信息一般需要依賴衛(wèi)星定位。 劉國波[18]考慮弱化相對(duì)位置信息, 提出基于部分方位剛性的多智能體領(lǐng)航-跟隨編隊(duì)控制方法, 滿足了剛性編隊(duì)中智能體間的期望相對(duì)方位約束。
在弱化多智能體相對(duì)位置信息的剛性編隊(duì)研究中, 部分研究者針對(duì)如何形成剛性編隊(duì)的規(guī)劃問題進(jìn)行了研究。 肖志旋等[19]利用多智能體方位信息,? 提出了一種基于方位信息的剛性編隊(duì)方法, 使得系統(tǒng)能夠?qū)崿F(xiàn)無窮小方位剛性。 然而僅利用方位信息形成的編隊(duì)仍存在縮放特性, 無法在距離上滿足全局剛性的要求; Yang等[20-21]基于邊緣應(yīng)力結(jié)構(gòu)提出了一個(gè)具有全局剛性的虛擬張拉整體框架, 以滿足各智能體間的嚴(yán)格距離要求。 然而, 該方法對(duì)距離的限制要求過于嚴(yán)苛, 且構(gòu)造張拉結(jié)構(gòu)的過程較為復(fù)雜, 在特定場(chǎng)景下的魯棒性較差; Chen等[22]利用初始三個(gè)智能體的相對(duì)位置信息并根據(jù)相對(duì)角度信息對(duì)其余智能體進(jìn)行剛性編隊(duì), 保證隊(duì)形的剛性要求。 然而該方法仍需獲取初始三個(gè)智能體的相對(duì)位置信息, 在位置信息的要求上仍有提升空間。 Wang等[23]及Zou等[24]利用領(lǐng)航者測(cè)量相對(duì)于不確定目標(biāo)的相對(duì)方位信息, 同時(shí)保證定位和繞航目標(biāo)的實(shí)現(xiàn)。
在多智能體剛性編隊(duì)問題中, 同時(shí)滿足避障約束并保持編隊(duì)穩(wěn)定是剛性編隊(duì)過程中的一大挑戰(zhàn)。 目前, 研究人員采用了多種避障技術(shù), 包括人工勢(shì)場(chǎng)方法[25-26], 基于行為的方法[27-28]和基于優(yōu)化的方法[29-30]等。 這些方法在各種多智能體編隊(duì)問題中得到了廣泛應(yīng)用, 但眾所周知的是其都存在一些局限性, 例如容易陷入局部極小值問題而導(dǎo)致避障失敗。 基于行為方法中的基于零空間的行為控制方法, 是一種通過零空間投影解決任務(wù)沖突來實(shí)現(xiàn)避障的方法。 該方法允許多智能體系統(tǒng)在執(zhí)行主要任務(wù)的同時(shí), 處理附加的次要任務(wù)或行為。 使得多智能體系統(tǒng)在執(zhí)行主要任務(wù)時(shí)具備更高的靈活性和多功能性[31]。 例如, Zheng等[32]采用了零空間行為控制架構(gòu)來實(shí)現(xiàn)多智能體系統(tǒng)的時(shí)變隊(duì)形控制, 并避免與障礙物發(fā)生碰撞; Golluccio等[33]提出一種改進(jìn)的學(xué)習(xí)算法對(duì)NSBC方法進(jìn)行了擴(kuò)充, 使得機(jī)器人能夠動(dòng)態(tài)選擇適當(dāng)?shù)牡蛢?yōu)先級(jí)任務(wù)進(jìn)行執(zhí)行; Wang等[34]基于零空間行為控制方法提出了一種分層子任務(wù)融合策略, 用于解決多個(gè)子任務(wù)的無沖突融合調(diào)度; Zhang等[35]基于零空間的行為控制框架提出了一種自適應(yīng)動(dòng)態(tài)規(guī)劃方法, 用于無人地面車輛-機(jī)械臂的協(xié)調(diào)控制。
由于飛行器編隊(duì)方法大多依賴期望相對(duì)位置信息[36-37], 然而快速運(yùn)動(dòng)的集群無人機(jī)等系統(tǒng)常常難以獲得期望的相對(duì)位置信息, 為了降低各飛行器對(duì)位置信息依賴, 受到文獻(xiàn)[16, 27]等研究成果的啟發(fā), 本文進(jìn)一步研究如何在不使用相對(duì)位置信息情況下通過得到各智能體間的相對(duì)角度信息與距離信息來保證多智能體系統(tǒng)的剛性編隊(duì)規(guī)劃方案。 其中, 相對(duì)角度及距離分別表示在智能體i坐標(biāo)系下與父節(jié)點(diǎn)j以及領(lǐng)航者k所形成的相對(duì)角度以及在智能體i坐標(biāo)系下與父節(jié)點(diǎn)j之間的距離。
本文的創(chuàng)新點(diǎn)如下:
(1) 提出一種基于距離及相對(duì)角度限制約束的多智能體系統(tǒng)剛性編隊(duì)任務(wù)規(guī)劃方案。 相較于文獻(xiàn)[16],? 該方案無需獲取全局的編隊(duì)位置信息, 消除了編隊(duì)任務(wù)對(duì)于相對(duì)位置信息的依賴。 相較于文獻(xiàn)[20-21],? 該方案考慮在編隊(duì)移動(dòng)過程中的避障問題, 解決編隊(duì)任務(wù)與避障任務(wù)的沖突。
(2) 提出一種將多智能體編隊(duì)在避障行為中視為整體的大范圍避障方法, 該方法在保持編隊(duì)剛性的要求下, 相較于文獻(xiàn)[16]具有更小的位移及相對(duì)角度偏差, 在不需要進(jìn)行經(jīng)過較小障礙通道的情況下具有更小的相對(duì)角度和距離誤差。
1 基本概念及問題描述
1.1 剛性圖及剛性矩陣?yán)碚?/p>
多智能體系統(tǒng)剛性編隊(duì)在數(shù)學(xué)上可以用如圖1所示的桿-球鏈接結(jié)構(gòu)來形象地描述。 其中球代表智能體, 木桿代表邊。 球和球之間由一定數(shù)量的不可形變的木桿聯(lián)系, 這種擁有桿-球鏈接的編隊(duì)就是剛性編隊(duì)。 這種編隊(duì)結(jié)構(gòu)可以通過圖論方法進(jìn)行數(shù)學(xué)表示。 在剛性編隊(duì)中, 智能體對(duì)應(yīng)圖論中的頂點(diǎn), 智能體之間的通訊對(duì)應(yīng)圖論中的邊。 本節(jié)將介紹剛性概念的規(guī)范定義和一些重要的定理性質(zhì)。
定義1: 在瘙綆2中, 各個(gè)智能體的位置信息可用pi={pix,? piy}來表示, 而各個(gè)智能體的位置合集為P={p1,? p2,? …, pn}, 各個(gè)智能體之間建立的通訊關(guān)系可用E來表示, E={e1,? e2,? …, em}。 整個(gè)隊(duì)伍的隊(duì)形用Fp=({p1,? p2,? …, pn},? E)來表示, 各個(gè)智能體之間的距離用dij=pi-pj2來表示, 式中P與E分別為數(shù)學(xué)中的頂點(diǎn)集與邊集的概念。
定義2: 某一個(gè)隊(duì)形Fp是由P,? E,? d所唯一決定的。
定義3: 在瘙綆2中, 如果剛性是一個(gè)隊(duì)形Fp的唯一運(yùn)動(dòng)要求, 則Fp在執(zhí)行任何任務(wù)的時(shí)候都能夠保持E中的各條邊的距離不變, 則稱Fp為剛性編隊(duì)隊(duì)形。
定義4: 剛性矩陣R表征了剛性編隊(duì)中各個(gè)頂點(diǎn)之間的鏈接關(guān)系及各條邊的距離關(guān)系, 綜合性反應(yīng)了剛性編隊(duì)的性能指標(biāo)。 剛性矩陣R具有兩種定義方式, 分別從不同的角度出發(fā)但最終得到的矩陣形式是相同的。
剛性矩陣在剛性編隊(duì)中扮演著至關(guān)重要的角色。 多智能體剛性編隊(duì)是指由多個(gè)智能體以固定的相對(duì)位置和姿態(tài)組成的編隊(duì)。 剛性矩陣作為一種數(shù)學(xué)工具, 用于描述不同多智能體之間的相對(duì)位置關(guān)系。
具體而言, 剛性矩陣用于表示一個(gè)多智能體相對(duì)于另一個(gè)多智能體的旋轉(zhuǎn)和平移關(guān)系。 這些關(guān)系可以通過測(cè)量多智能體之間的距離和相對(duì)角度來確定。 在剛性編隊(duì)中, 每個(gè)多智能體都配備了傳感器, 用于測(cè)量其與其他多智能體之間的距離和相對(duì)角度。 這些測(cè)量值可用于確定各智能體的期望位置。
剛性矩陣的計(jì)算和更新是剛性編隊(duì)算法的核心。 通過不斷計(jì)算和更新剛性矩陣, 多智能體可以實(shí)時(shí)調(diào)整其相對(duì)位置和姿態(tài), 以保持編隊(duì)的穩(wěn)定和準(zhǔn)確性。 剛性矩陣的主要求解方法包括定義剛性方程以獲取雅可比矩陣, 并據(jù)此得到剛性矩陣。
由定義1能夠給出剛性方程gG:瘙綆2n→瘙綆|E|的概念:
gG(p)=[‖pin1-pout1‖2,? …, ‖pinm-poutm‖2]T(1)
式中: pin1,? pout1,? …,? poutm∈1,? 2,? 3,? …, n, pini-pouti2是由E中的ei來決定的, 表征的是第i條邊的情況, 而pini和pouti分別為第i條邊的兩個(gè)頂點(diǎn)。 而剛性方程是由各個(gè)智能體構(gòu)成的圖的邊與頂點(diǎn)的分布情況來決定的, 所以, 求解剛性方程的雅可比矩陣, 便可以得到剛性矩陣:
JgG(p)=2(pin1-pout1)p1(pin1-pout1)p2…(pin1-pout1)pn
(pin2-pout2)p1…(pin2-pout2)pn
(pinm-poutm)p1……(pinm-poutm)pn(2)
除去系數(shù)2, 則得到的JgG(p)=R(p), 由此可得到剛性矩陣R。 零空間行為控制方法求解得到的雅可比矩陣與得到剛性矩陣的思想相似[16], 均是通過對(duì)編隊(duì)任務(wù)進(jìn)行求導(dǎo)以得到實(shí)時(shí)雅可比矩陣從而確定各個(gè)智能體的運(yùn)動(dòng)規(guī)則。
1.2 基于零空間的行為控制算法介紹
本文采用了基于零空間的行為控制方法[16], 通過將多智能體的不同行為設(shè)計(jì)為不同的任務(wù)函數(shù), 并根據(jù)實(shí)際經(jīng)驗(yàn)對(duì)任務(wù)進(jìn)行優(yōu)先級(jí)設(shè)計(jì)。 此方法將低優(yōu)先級(jí)的任務(wù)投影到高優(yōu)先級(jí)任務(wù)的零空間向量上, 以實(shí)現(xiàn)在高優(yōu)先級(jí)任務(wù)完整執(zhí)行的同時(shí), 執(zhí)行低優(yōu)先級(jí)任務(wù)與高優(yōu)先級(jí)任務(wù)的不沖突部分, 解決任務(wù)的沖突問題, 保證編隊(duì)穩(wěn)定性。 根據(jù)實(shí)際經(jīng)驗(yàn), 本文將避碰和避障設(shè)置為多智能體的最高優(yōu)先級(jí)任務(wù), 編隊(duì)形成、 編隊(duì)切換等其他任務(wù)都作為次優(yōu)先級(jí)任務(wù)。
基于上述任務(wù)優(yōu)先級(jí)設(shè)計(jì), 進(jìn)一步對(duì)多智能體系統(tǒng)的基本任務(wù)進(jìn)行設(shè)計(jì)。 假設(shè)通用任務(wù)函數(shù)為σ∈瘙綆m(m表示通用任務(wù)的維度), 則任務(wù)函數(shù)為
σ=f(p)(3)
式中: p=[p1, p2, …, pn]T為多智能體位置的集合, n為智能體的數(shù)量;? f(·)為多智能體位置到任務(wù)函數(shù)的映射。 對(duì)式(3)求關(guān)于位置p的偏導(dǎo)可得:
σ·=f(p)pp·=J(p)p·(4)
式中: J(p)∈瘙綆m×n為雅可比矩陣, 表示任務(wù)函數(shù)σ到多智能體位置p的映射關(guān)系。
在任務(wù)的執(zhí)行過程中, 期望的任務(wù)函數(shù)σd(t)存在對(duì)應(yīng)的期望位置pd(t), 期望軌跡可由期望速度的時(shí)間積分得到, 通過對(duì)雅可比矩陣進(jìn)行偽逆運(yùn)算, 求得任務(wù)函數(shù)速度輸出的最小二乘解如下:
ν=J+σ·=JT(JJT)-1σ·(5)
式中: ν為任務(wù)的速度矢量輸出指令; J+=JT(JJT)-1為雅可比矩陣的偽逆。
除參考速度外還需要參考軌跡, 由上述可知, 參考速度的時(shí)間積分可以得到參考軌跡, 但速度的離散時(shí)間積分過程會(huì)產(chǎn)生參考軌跡偏差, 該偏差通過閉環(huán)逆運(yùn)動(dòng)學(xué)方法進(jìn)行偏差抵消, 則第l個(gè)任務(wù)的參考速度輸出為
νl=J+lσ·d.l+Λlσ~l (6)
式中: νl為第l個(gè)任務(wù)的速度輸出指令; J+l為雅可比矩陣Jl的偽逆; σ·d.l為期望任務(wù)函數(shù)的導(dǎo)數(shù); Λl為正定增益矩陣; σ~l=σ·d.l-σl為任務(wù)偏差; σd.l為期望任務(wù)函數(shù)。
假設(shè)全局任務(wù)由多個(gè)基本任務(wù)組成, 將低優(yōu)先級(jí)任務(wù)投影到高優(yōu)先級(jí)任務(wù)的零空間上, 從而消除任務(wù)速度輸出指令之間的沖突部分, 最終得到全局任務(wù)的速度輸出為
νG=νl+(I-J+lJl)νl+1(7)
式中: νG為全局任務(wù)的速度輸出指令; I-J+lJl為第l個(gè)任務(wù)的零空間矩陣。
1.3 問題描述
運(yùn)動(dòng)學(xué)模型: 考慮平面上有N個(gè)智能體, 每個(gè)智能體i由單積分器動(dòng)力學(xué)表示[24]:
p·i=uii=1, …, N(8)
式中: pi∈瘙綆2為智能體i在全局坐標(biāo)系中的位置; ui∈瘙綆2為控制輸入。
規(guī)劃目標(biāo): 智能體編隊(duì)系統(tǒng)在滿足自身狀態(tài)、 輸入約束的情況下, 能夠按照期望的距離和相對(duì)角度跟蹤領(lǐng)航者以形成剛性編隊(duì), 且能保持較高的編隊(duì)剛性在編隊(duì)整體移動(dòng)到目標(biāo)點(diǎn)的過程中, 具備與系統(tǒng)內(nèi)部智能體、 系統(tǒng)外部預(yù)先未知障礙的避碰能力。 為滿足規(guī)劃目標(biāo), 現(xiàn)作出以下假設(shè):
假設(shè)1: 智能體間通信拓?fù)錆M足如圖2所示的拓?fù)浣Y(jié)構(gòu), 任意智能體與其父節(jié)點(diǎn)和領(lǐng)航者節(jié)點(diǎn)之間存在通路。
其中通信拓?fù)浣Y(jié)構(gòu)可以用鄰接矩陣形式表示如下:
C=01…00
001…0
0
1
0…000; D=0111。
式中: C為各跟隨者之間的通信拓?fù)洌?D為領(lǐng)航者與各跟隨者之間的通信拓?fù)洹?/p>
假設(shè)2: 智能體具備一定的探測(cè)能力和通信能力。 在一個(gè)采樣周期內(nèi), 智能體能夠?qū)崟r(shí)獲取進(jìn)入其探測(cè)范圍內(nèi)的障礙物的當(dāng)前位置信息, 能夠?qū)崟r(shí)獲取進(jìn)入其通信范圍的智能體所發(fā)送的距離信息及相對(duì)角度信息。
假設(shè)3: 不考慮外界干擾、 噪聲、 空氣阻力等對(duì)智能體動(dòng)態(tài)的影響。
考慮到智能體計(jì)算資源有限, 且并不是所有障礙物都會(huì)給智能體帶來威脅, 只有當(dāng)障礙物與智能體的距離較近時(shí), 才有發(fā)生碰撞的風(fēng)險(xiǎn), 因此, 基于智能體能夠?qū)崟r(shí)探測(cè)障礙物的能力, 根據(jù)有無碰撞風(fēng)險(xiǎn), 設(shè)計(jì)出跟蹤、 避碰兩種控制任務(wù)。
注: 本文主要考慮在行為控制框架下的運(yùn)動(dòng)學(xué)/任務(wù)層面的控制問題, 跟隨者通過得到與其父節(jié)點(diǎn)及領(lǐng)航者節(jié)點(diǎn)的距離信息與相對(duì)角度信息以滿足編隊(duì)任務(wù)約束從而形成編隊(duì)。 零空間行為控制的協(xié)作式任務(wù)為達(dá)到投影的目的, 會(huì)將其任務(wù)轉(zhuǎn)化為個(gè)體的速度向量用于進(jìn)行零空間投影, 但是任務(wù)變量設(shè)計(jì)中是包含團(tuán)體信息的屬于協(xié)作式行為, 任務(wù)函數(shù)中包含多體變量, 并非單一的單機(jī)控制。
2 基于NSBC算法的剛性編隊(duì)規(guī)劃設(shè)計(jì)
本節(jié)提出了基于零空間行為控制算法的帶有距離及相對(duì)角度限制約束的剛性編隊(duì)規(guī)劃方案。 該方法采用領(lǐng)航者-跟隨者策略, 并將規(guī)劃方案設(shè)計(jì)分為編隊(duì)環(huán)節(jié)和避障環(huán)節(jié), 從而完成多智能體的剛性編隊(duì)任務(wù)。
2.1 帶相對(duì)角度與距離約束的智能體編隊(duì)
多智能體剛性編隊(duì)任務(wù)要求多智能體在不改變整體隊(duì)形的情況下移動(dòng)到期望位置, 同時(shí)保持整體編隊(duì)的相對(duì)剛性。 假設(shè)p={p1, p2, …, pn}為各個(gè)智能體位置信息, 本節(jié)中定義的剛性編隊(duì)任務(wù)函數(shù)為
σr=[dij, ≮jik]Ti∈1, 2, …, n(9)
式中: dij=pi-pj2為pj與pi期望的距離; ≮jik為控制pj-pi與pk-pi之間的夾角, 各智能體編隊(duì)示意圖以及≮jik的具體細(xì)節(jié)如圖3所示。
本文弱化的相對(duì)位置信息指智能體在形成剛性編隊(duì)過程中無需使用到期望的相對(duì)位置, 而僅通過期望距離和相對(duì)角度達(dá)到剛性編隊(duì)的性能要求, 在實(shí)際編隊(duì)控制中相對(duì)位置是難以使用傳感器測(cè)量的。
本文使用頂點(diǎn)集V={1, 2, …, N}, 表示在平面上N個(gè)點(diǎn)的指標(biāo)集合, 如圖3所示, 為了描述射線j-i到射線j-k的有符號(hào)角, 需要使用有序三元組(i, j, k), 顯然, (k, i, j)和(j, i, k)對(duì)應(yīng)的兩個(gè)角是不同的, 其實(shí)際上被稱為補(bǔ)角或共軛角。 其中每個(gè)三元組(j, i, k)的相對(duì)角度≮jik在[0, 2π]范圍內(nèi)逆時(shí)針測(cè)量, ΤV×V×V={(i, j, k), i, j, k∈V, i≠j≠k}表示角集, 其每個(gè)元素都是有序三元組。
M表示角集合T的元素?cái)?shù)T, 假設(shè)T中的三元組中沒有一對(duì)互為補(bǔ)充的。 假設(shè)p中沒有重疊點(diǎn), 即對(duì)于每個(gè)i≠j有pi≠pj且i, j∈{1, 2, …, N}。 然后, 頂點(diǎn)集合V、 角度集合T和位置向量p的組合稱為相對(duì)角度, 在本文中用≮jik表示。 若給定不重疊的位置pi、 pj和pk, 那么相對(duì)角度≮jik∈[0, 2π)可以通過下式唯一地計(jì)算:
≮jik=arccos(zTijzik)z⊥ij·zik≥0
2π-arccos(zTijzik)otherwise? (10)
式中: zij=pj-pi‖pj-pi‖; zik=pk-pi‖pk-pi‖; z⊥ij=Q0zij=0-110zij為zij逆時(shí)針旋轉(zhuǎn)π2得到的矢量; ·表為點(diǎn)積。
定義任務(wù)誤差為σ~r=σr-σd2×1, 其中σd表示多智能體的期望位置, 即要保持期望編隊(duì)的期望距離與期望相對(duì)角度。
為求解任務(wù)雅可比矩陣, 需要對(duì)任務(wù)函數(shù)求偏導(dǎo), 具體求解方式如下:
JgG(p)=σr1p1σr1p2…σr1pn
σr2p1σr2p2…σr2pn
σrnp1σrnp2…σrnpn(11)
式中: σripi=σrixiσriyi, 即對(duì)每一個(gè)任務(wù)在x, y方向上分別求偏導(dǎo), 根據(jù)式(11), 可以求解得到的雅可比矩陣為如下形式:
JgG(p)=[A, ±B] (12)
雅可比矩陣JgG(p)式中每一項(xiàng)的具體形式如下:
Aij=-sgn(pi-pj)pi-pj2(pi-pj)22(13)
Bjik=1Cjikxj-2xi+xk(pj-pi2)(pk-pi2)+
Djik|xi-xj|sign(xi-xj)(pj-pi2)3(pk-pi2)+
|xi-xk|sign(xi-xk)(pj-pi2)(pk-pi2)3(14)
式中: Cjik=1-((xi-xj)(xi-xk)+(yi-yj)(yi-yk))2(pj-pi2)2(pk-pi2)2;
Djik=((xi-xj)(xi-xk)+(yi-yj)(yi-yk))。
該雅可比矩陣限制了兩個(gè)智能體之間的距離與相對(duì)角度, 用于約束每個(gè)智能體與其鄰居的相對(duì)位置, 從而實(shí)現(xiàn)分布式編隊(duì)的剛性要求。
在求得編隊(duì)的雅可比矩陣后, 結(jié)合零空間行為控制方法, 最終能得到編隊(duì)任務(wù)函數(shù)的輸出速度如下:
νr=J+gGΛrσ~r(15)
2.2 多智能體避障
假設(shè)障礙物po(i)為一球形障礙物, 且給定智能體一定的安全距離dd后可以視障礙物為一虛擬的球體, 當(dāng)智能體距離障礙物質(zhì)心位置小于安全距離時(shí)則認(rèn)為其具有碰撞危險(xiǎn)。 障礙物集合Or的定義如下:
Or=(pi∈瘙綆2, po(i)∈瘙綆2:‖pi-po(i)‖≤dd)(16)
式中: pi=[pix, piy]T為第i個(gè)智能體的位置即相對(duì)應(yīng)的x, y坐標(biāo); po(i)為第i個(gè)智能體對(duì)應(yīng)的障礙物位置坐標(biāo); dd為人為給定的安全距離, 設(shè)計(jì)第i個(gè)多智能體的任務(wù)函數(shù)為
σio=(max{pi-po(i), dd})(17)
由于是離散狀態(tài)下, 所以避障任務(wù)的雅可比矩陣為Jo(i)=(pi-po(i))pi-po(i)即一個(gè)指向障礙物方向的梯度矢量。
最后得到的輸出為避障速度為
νo(i)=J+o(i)λo(i)σ~io=J+oλo(i)(dd-‖pi-po(i)‖)(18)
式中: σ~io=(dd-‖pi-po(i)‖)為避障任務(wù)誤差; λo(i)為設(shè)定的正定增益矩陣; J+o(i)為避障雅可比矩陣的偽逆。
當(dāng)dd-‖pi-po(i)‖>0時(shí), 表明智能體距離障礙物的距離小于給定的安全距離, 即進(jìn)入虛擬球體, 需要進(jìn)行避障任務(wù), 得到的νo(i)=J+o(i)λo(i)σ~io; 反之, 當(dāng)dd-‖pi-po(i)‖<0時(shí), 表明智能體距離障礙物的距離大于給定的安全距離, 不需要進(jìn)行避障任務(wù), 得到的νo(i)=0。 避障任務(wù)的切換取決于任務(wù)誤差, 并通過投影到零空間上實(shí)現(xiàn)避障速度的求解。
最終得到的合速度解為νG, 當(dāng)多智能體系統(tǒng)未接近障礙物且未進(jìn)入安全距離時(shí)合速度為
νG=νr+(I-J+gGJgG)νo(i)(19)
當(dāng)多智能體系統(tǒng)接近障礙物且進(jìn)入安全距離時(shí)合速度為
νG=νo(i)+(I-J+o(i)Jo(i))νr(20)
速度信息傳遞方式如結(jié)構(gòu)圖4所示。 各智能體能夠根據(jù)其領(lǐng)航者以及其父節(jié)點(diǎn)的方位得到其期望的相對(duì)角度信息以及與父節(jié)點(diǎn)的距離信息以形成完整的編隊(duì)任務(wù)約束。 編隊(duì)任務(wù)與避障任務(wù)經(jīng)過優(yōu)先級(jí)調(diào)整后投影到零空間中得到智能體i的合速度, 圖中所示避障任務(wù)為最高優(yōu)先級(jí)。 最終由各智能體執(zhí)行合速度并將實(shí)際的距離信息和相對(duì)角度信息等反饋信息, 傳遞至期望任務(wù)中以實(shí)現(xiàn)系統(tǒng)的完整閉環(huán)控制。
2.3 帶相對(duì)角度與距離約束的智能體大范圍編隊(duì)避障
設(shè)計(jì)的編隊(duì)任務(wù)函數(shù)為如下形式:
σr=[pi-pj2, ≮jik]T i∈1, 2, …, n(21)
具體編隊(duì)方法如3.1節(jié)中相同, 而避障過程中采用將多智能體系統(tǒng)視作一個(gè)整體以進(jìn)行大范圍的避障。 將所有跟隨者的任務(wù)僅設(shè)計(jì)為編隊(duì)任務(wù), 而避障任務(wù)依靠領(lǐng)航者確保較大的安全距離來實(shí)現(xiàn)。 具體的領(lǐng)航者避障任務(wù)設(shè)計(jì)與3.2節(jié)中相類似, 為
Or=(pi∈瘙綆2, po(i)∈瘙綆2:‖pi-po(i)‖≤dmax)(22)
式中: dmax為多智能體系統(tǒng)各智能體間的最大距離。
注1: 本文提出的編隊(duì)方案以單積分器模型為例, 聚焦于編隊(duì)規(guī)劃模塊。 由于行為控制與其他相關(guān)方法具有很強(qiáng)的融合性, 即使模型轉(zhuǎn)換后也仍可適用于其他的控制器, 在文獻(xiàn)[35, 38-40]中都展示了行為控制與不同物理模型以及不同控制器相結(jié)合的實(shí)例。
注2: 傳統(tǒng)的多智能體基于父節(jié)點(diǎn)位置信息進(jìn)行控制算法設(shè)計(jì)如下:
σf=[(p1-pb)T, …, (pn-pb)T]T
pb=1/n∑nk=1pk(23)
需要知道各智能體間的相對(duì)位置信息以得到質(zhì)心位置信息形成剛性編隊(duì), 式(10)為本文自主設(shè)計(jì)引入的剛性編隊(duì)約束, ≮jik為本文引入的相對(duì)角度信息用以弱化相對(duì)位置信息, 使得系統(tǒng)編隊(duì)僅需得到智能體間距離信息及相對(duì)角度信息便可形成剛性編隊(duì), 能夠降低對(duì)于相對(duì)位置信息的依賴。
2.4 帶相對(duì)角度與距離約束的智能體編隊(duì)任務(wù)穩(wěn)定性證明
對(duì)本文提出的基于距離及相對(duì)角度信息的剛性編隊(duì)規(guī)劃設(shè)計(jì)方案的任務(wù)穩(wěn)定性在數(shù)學(xué)上進(jìn)行了證明。 其中, 任務(wù)穩(wěn)定性指的是經(jīng)過零空間投影后, 各任務(wù)仍能收斂到其各自穩(wěn)定狀態(tài)的性質(zhì)。 從任務(wù)目的出發(fā), 驗(yàn)證了不同優(yōu)先級(jí)任務(wù)的穩(wěn)定性。 假設(shè)K=2, 且下標(biāo)更小的任務(wù)優(yōu)先級(jí)更高; 選定李雅普諾夫函數(shù)為
Vη=12η~T1γη1η~1+…+12η~TKγηKη~K(24)
式中: η~K為優(yōu)先級(jí)為K的任務(wù)設(shè)計(jì), 在本文中為σr及σio, 其中由于K=2, 故有
Vη=12η~T1γη1η~1+12η~T2γη2η~2(25)
對(duì)式(25)進(jìn)行求導(dǎo):
V·η=σ~T2P2σ~2(26)
式中: σ~2=[η~T1, η~T2]T; P2=P2, 11P2, 12P2, 21P2, 22; P2, 11=
γη1Λη1; P2, 21=PT2, 12=12γη2Jη2J+η1Λη1; P2, 22=γη2Jη2(In-J+η1Jη1)J+η2Λη2。 式(26)滿足以下不等式:
V·η≤-P^2, 11‖η~1‖2-P^2, 22‖η~2‖2+
2P^2, 21‖η~1‖‖η~2‖=-σ^T2P^2σ^2(27)
式中:
σ^2=[‖η~1‖, ‖η~2‖]T;? P^2=γ1Λ1 γ2Λ1-2γ2Λ1-2 γ2Λ2; Jη1=1; In-J+η1Jη1≤1。 其中γ1是滿足條件γ1>γ2(Λ1)24Λ1Λ2的正常數(shù), P^2是一個(gè)正定對(duì)稱矩陣。 式(27)進(jìn)一步可改寫為
V·η≤-λ-P^2σ^T2σ^2≤0(28)
式中: λ-P^2為P^2的最小特征值。
所以可以得到在兩個(gè)任務(wù)的情況下該編隊(duì)規(guī)劃方案具有穩(wěn)定性, 而三個(gè)及以上的任務(wù)場(chǎng)景證明思路同上, 可參照文獻(xiàn)[34, 41-42]進(jìn)行擴(kuò)展證明。
3 仿真驗(yàn)證
3.1 仿真例1
本節(jié)對(duì)所提出的算法進(jìn)行仿真驗(yàn)證, 通過與基于相對(duì)位置的剛性編隊(duì)方法[16]進(jìn)行對(duì)比, 驗(yàn)證算法的有效性。
假設(shè)各智能體通信拓?fù)浣Y(jié)構(gòu)圖如圖5所示。
其通信拓?fù)淇梢酝ㄟ^鄰接矩陣表示:
C=0100000100000100000100000; D=01111。
假設(shè)有5個(gè)智能體從初始位置p1=[0, 1], p2=[-1, 2], p3=[-1, 0], p4=[1, 0], p5=[-2, -1]運(yùn)動(dòng)到目標(biāo)點(diǎn)p~1=[30, 30], p~2=[29, 31], p~3=[29, 29], p~4=[31, 29], p~5=[28, 28]。 在移動(dòng)路徑中有兩個(gè)障礙物阻擋, 兩個(gè)障礙物位置為po(1)=[4, 4], po(2)=[15, 15.5]。 在仿真過程中智能體僅能得到其父節(jié)點(diǎn)和領(lǐng)航者的信息, 無法獲取其他智能體的信息。 分別利用相對(duì)位置信息確定剛性隊(duì)形的規(guī)劃方案與帶有相對(duì)角度與距離約束的規(guī)劃方案以及基于整體的編隊(duì)規(guī)劃方案對(duì)智能體進(jìn)行剛性編隊(duì)。
首先, 采用基于相對(duì)位置信息多智能體剛性編隊(duì)仿真如圖6所示, 為保證剛性編隊(duì)的要求, 每?jī)蓚€(gè)智能體之間需要保持恒定的距離, 從圖中可以看出該方法能基本滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離以及各自的相對(duì)角度如圖7~8所示。
其次, 采用基于整體的多智能體剛性編隊(duì)仿真如圖9所示, 從圖中可以看出該方法能很好的滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離以及各自的相對(duì)角度如圖10~11所示。
最后, 采用基于相對(duì)角度與距離信息的多智能體剛性編隊(duì)仿真如圖12所示, 從圖中可以看出該方法能基本滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離以及各自的相對(duì)角度如圖13~14所示。
將上述基于相對(duì)位置, 整體編隊(duì)以及基于距離及相對(duì)角度編隊(duì)三種方法的仿真結(jié)果進(jìn)行對(duì)比, 可以得到如圖15~16所示的相對(duì)角度偏差對(duì)比結(jié)果圖及如圖17~18所示的距離偏差對(duì)比結(jié)果圖。
圖15~16中(A)為文獻(xiàn)[16]所提方法的相對(duì)距離, (B)為本文提出的整體編隊(duì)避障方法的相對(duì)角度, (C)為本文提出的基于距離及相對(duì)角度的相對(duì)角度。
圖17~18中(A)為文獻(xiàn)[16]所提方法的相對(duì)距離, (B)為本文提出的整體編隊(duì)避障方法的相對(duì)距離, (C)為本文提出的基于距離及相對(duì)角度的相對(duì)距離。
從基于相對(duì)位置, 整體編隊(duì)避障以及基于距離及相對(duì)角度編隊(duì)三種方法所規(guī)劃的剛性編隊(duì)隊(duì)形仿真結(jié)果可以得到以下結(jié)果:
(1) 基于整體的編隊(duì)方法可以以維持剛性距離偏差不超過3.3%, 相對(duì)角度偏差不超過2.5%且非剛性時(shí)間不超過10%的性能很好的在完成整體避障的前提下完成前往目標(biāo)點(diǎn)與編隊(duì)任務(wù), 但從仿真軌跡及理論研究表面, 基于整體的避障方法的避障范圍較大, 使用該避障方法難以穿過小于dmax的狹窄空間;
(2) 基于相對(duì)角度與距離的編隊(duì)方法可以以維持剛性距離偏差不超過38.3%, 相對(duì)角度偏差不超過42.5%且非剛性時(shí)間不超過20%的性能很好的在完成分布式避障的前提下完成前往目標(biāo)點(diǎn)與編隊(duì)任務(wù), 與文獻(xiàn)[16]直接使用相對(duì)位置的編隊(duì)方法對(duì)比, 其在距離偏差性能上損失了約14%, 相對(duì)角度偏差性能提升了約23%, 非剛性時(shí)間性能提升了約2%, 能夠在不損失較大編隊(duì)剛性的前提下, 整個(gè)編隊(duì)過程不需要得到全局的相對(duì)位置, 有效的放寬了編隊(duì)的相對(duì)位置約束。
3.2 仿真例2
本節(jié)對(duì)所提出的算法進(jìn)行仿真驗(yàn)證, 并進(jìn)一步與文獻(xiàn)[27]方法進(jìn)行對(duì)比驗(yàn)證算法的有效性。
采用文獻(xiàn)[27]方法的多智能體剛性編隊(duì)仿真如圖19所示, 從圖中可以看出該方法能基本滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離以及各自的相對(duì)角度如圖20~21所示。
將基于相對(duì)位置, 基于距離及相對(duì)角度編隊(duì)及文獻(xiàn)[27]所用的3種方法的仿真結(jié)果進(jìn)行對(duì)比, 可以得到如圖22~23所示的相對(duì)角度偏差對(duì)比結(jié)果圖及如圖24~25所示的距離偏差對(duì)比結(jié)果圖。
圖22~23中(A)為文獻(xiàn)[16]所提方法的相對(duì)角度, (C)為本文提出的基于距離及角度的相對(duì)角度, (D)為文獻(xiàn)[27]提出方法的相對(duì)角度。
圖24~25中(A)為文獻(xiàn)[16]所提方法的距離, (C)為本文提出的基于距離及相對(duì)角度的距離, (D)為文獻(xiàn)[27]提出方法的距離。
由仿真結(jié)果能夠看出, 本文所提出的剛性編隊(duì)方法與文獻(xiàn)[27]使用方法對(duì)比, 其在距離偏差性能上提升了約4%, 相對(duì)角度偏差性能提升了約6%, 非剛性時(shí)間性能降低了約9%, 在不損失較大編隊(duì)剛性的前提下, 整個(gè)編隊(duì)過程不需要得到全局的相對(duì)位置, 有效的放寬了編隊(duì)的相對(duì)位置約束。
3.3 仿真例3
對(duì)所提出的算法的拓?fù)浣Y(jié)構(gòu)及智能體數(shù)量進(jìn)行修改并進(jìn)行仿真驗(yàn)證。
假設(shè)各智能體通信拓?fù)浣Y(jié)構(gòu)圖如圖26所示。
其通信拓?fù)淇梢酝ㄟ^鄰接矩陣表示:
C=0100100001001000010000000100000001000000010000000; D=0111111。
改變智能體數(shù)量及拓?fù)浣Y(jié)構(gòu)后采用基于相對(duì)角度與距離信息的多智能體剛性編隊(duì)仿真如圖27所示, 從圖中可以看出該方法能基本滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離及各自的相對(duì)角度如圖28~29所示。
3.4 仿真例4
對(duì)所提出的算法增加了速度擾動(dòng)并進(jìn)行仿真驗(yàn)證。 增加速度擾動(dòng)后采用基于相對(duì)角度與距離信息的多智能體剛性編隊(duì)仿真如圖30所示, 從圖中可以看出該方法能基本滿足剛性編隊(duì)的要求。 5個(gè)智能體各自之間的距離以及各自的相對(duì)角度如圖31~32所示。 在加入速度擾動(dòng)后, 本文所提方案仍能夠基本滿足剛性編隊(duì)的要求, 相對(duì)角度及距離偏差在較小范圍內(nèi)波動(dòng), 具備一定的魯棒性。
4 總? 結(jié)
針對(duì)多智能體剛性編隊(duì)過程中不采用智能體相對(duì)位
置信息的前提下如何保持剛性隊(duì)形的任務(wù)規(guī)劃問題提出了兩種規(guī)劃方法, 其中基于整體的編隊(duì)規(guī)劃方案在剛性編隊(duì)任務(wù)規(guī)劃過程中采用距離信息及相對(duì)角度信息實(shí)現(xiàn)多個(gè)智能體的剛性編隊(duì)過程, 在避障過程中將編隊(duì)看作整體并進(jìn)行大范圍的避障行為, 能夠在保證多智能體編隊(duì)隊(duì)形穩(wěn)定前提下完成編隊(duì)及避障任務(wù); 基于相對(duì)角度與距離的編隊(duì)規(guī)劃方案在未知智能體相對(duì)位置情況下通過對(duì)其父節(jié)點(diǎn)的距離及相對(duì)角度信息進(jìn)行跟蹤, 解決多智能體的剛性編隊(duì)問題, 能夠在保證多智能體編隊(duì)相對(duì)穩(wěn)定并最終收斂到穩(wěn)定編隊(duì)的前提下進(jìn)行編隊(duì)避障。
本文提出的方法與直接使用相對(duì)位置的編隊(duì)方法相比, 其損失了較小的距離偏差性能, 提升了相對(duì)角度偏差性能以及部分非剛性時(shí)間性能, 能夠在不損失較大編隊(duì)剛性的前提下, 有效的放寬編隊(duì)的約束。 本文所提的多智能體系統(tǒng)剛性編隊(duì)任務(wù)規(guī)劃方案具有良好的推廣性, 在引入智能體的精確模型后, 進(jìn)一步融合復(fù)雜控制方法, 可以擴(kuò)展應(yīng)用場(chǎng)景。
參考文獻(xiàn):
[1] Martin J G,? Muros F J,? Maestre J M,? et al. Multi-Robot Task Allocation Clustering Based on Game Theory[J]. Robotics and Autonomous Systems,? 2023,? 161: 104314.
[2] Flores-Resendiz J F,? Avilés D,? Aranda-Bricaire E. Formation Control for Second-Order Multi-Agent Systems with Collision Avoidance[J]. Machines,? 2023,? 11(2): 208.
[3] Lin J,? Miao Z Q,? Wang Y N,? et al. Aggressive Formation Tracking for Multiple Quadrotors without Velocity Measurements over Directed Topologies[J]. IEEE Transactions on Aerospace and Electronic Systems,? 2023,? 59(5): 5541-5553.
[4] Kankashvar M,? Bolandi H,? Mozayani N. Multi-Agent Q-Learning Control of Spacecraft Formation Flying Reconfiguration Trajectories[J]. Advances in Space Research,? 2023,? 71(3): 1627-1643.
[5] Guo J J,? Qi J T,? Wang M M,? et al. Distributed Cooperative Obstacle Avoidance and Formation Reconfiguration for Multiple Quadrotors: Theory and Experiment[J]. Aerospace Science and Technology,? 2023,? 136: 108218.
[6] Chen L M,? Cao M,? Li C J. Angle Rigidity and Its Usage to Stabilize Multiagent Formations in 2-D[J]. IEEE Transactions on Automatic Control,? 2021,? 66(8): 3667-3681.
[7] Sial M B,? Zhang Y W,? Wang S P,? et al. Bearing-Based Distributed Formation Control of Unmanned Aerial Vehicle Swarm by Quaternion-Based Attitude Synchronization in Three-Dimensional Space[J]. Drones,? 2022,? 6(9): 227.
[8] Li P,? Cao J,? Liang D C. UAV-BS Formation Control Method Based on Loose Coupling Structure[J]. IEEE Access,? 2022,? 10: 88330-88339.
[9] Wang H,? Zhang J X,? Zhou Q R,? et al. Optimal Attitude Consensus Control for Rigid Spacecraft Formation Based on Control Lyapunov Functions[J]. IET Control Theory & Applications,? 2023,? 17(12): 1720-1731.
[10] Sun H J,? Wu Y Y,? Zhang J X. A Distributed Predefined-Time Attitude Coordination Control Scheme for Multiple Rigid Spacecraft[J]. Aerospace Science and Technology,? 2023,? 133: 108134.
[11] Hendrickx J M,? Anderson B D O,? Delvenne J C,? et al. Directed Graphs for the Analysis of Rigidity and Persistence in Autonomous Agent Systems[J]. International Journal of Robust and Nonlinear Control,? 2007,? 17(10/11): 960-981.
[12] Krick L,? Broucke M E,? Francis B A. Stabilization of Infinitesimally Rigid Formations of Multi-Robot Networks[C]∥47th IEEE Conference on Decision and Control,? 2008: 477-482.
[13] Aranda M,? López-Nicolás G,? Sagüés C,? et al. Coordinate-Free Formation Stabilization Based on Relative Position Measurements[J]. Automatica,? 2015,? 57: 11-20.
[14] Aspnes J,? Eren T,? Goldenberg D K,? et al. A Theory of Network Localization[J]. IEEE Transactions on Mobile Computing,? 2006,? 5(12): 1663-1678.
[15] Olfati-Saber R,? Murray R M. Graph Rigidity and Distributed Formation Stabilization of Multi-Vehicle Systems[C]∥41st IEEE Conference on Decision and Control,? 2002: 2965-2971.
[16] Zhou N,? Xia Y Q. Coordination Control Design for Formation Reconfiguration of Multiple Spacecraft[J]. IET Control Theory & Applications,? 2015,? 9(15): 2222-2231.
[17] Arrichiello F,? Chiaverini S,? Fossen T I. Formation Control of Underactuated Surface Vessels Using the Null-Space-Based Behavioral Control[C]∥IEEE/RSJ International Conference on Intelligent Robots and Systems,? 2006: 5942-5947.
[18] 劉國波. 基于方位剛性的多智能體主從編隊(duì)控制研究[D]. 成都: 西南交通大學(xué),? 2019.
Liu Guobo. Research on Multi-Agent Leader-Following Formation Control Based on Bearing[D].Chengdu: Southwest Jiaotong University,? 2019. (in Chinese)
[19] 肖志旋. 基于方位剛性理論的多智能體編隊(duì)控制方法研究[D]. 長(zhǎng)沙: 中南大學(xué),? 2022.
Xiao Zhixuan. Research on Multi-Agent Formation Control Methods Based on Bearing Rigidity Theory[D].Changsha: Central South University,? 2022. (in Chinese)
[20] Yang Q K,? Cao M,? Fang H,? et al. Constructing Universally Rigid Tensegrity Frameworks with Application in Multiagent Formation Control[J]. IEEE Transactions on Automatic Control,? 2019,? 64(1): 381-388.
[21] Yang Q K,? Sun Z Y,? Cao M,? et al. Stress-Matrix-Based Formation Scaling Control[J]. Automatica,? 2019,? 101: 120-127.
[22] Chen L M,? Yang Q K,? Shi M M,? et al. Stabilizing Angle Rigid Formations with Prescribed Orientation and Scale[J]. IEEE Transactions on Industrial Electronics,? 2022,? 69(11): 11654-11664.
[23] Wang L,? Zou Y,? Meng Z Y. Coordinated Localization and Circumnavigation of Multi-Agent Systems: A Distributed Observer-Based Approach[C]∥IEEE 15th International Conference on Control and Automation (ICCA),? 2019: 1540-1544.
[24] Zou Y,? Wang L,? Meng Z Y. Distributed Localization and Circumnavigation Algorithms for a Multiagent System with Persistent and Intermittent Bearing Measurements[J]. IEEE Transactions on Control Systems Technology,? 2021,? 29(5): 2092-2101.
[25] Guo Y H,? Zhou J,? Liu Y Y. Distributed RISE Control for Spacecraft Formation Reconfiguration with Collision Avoidance[J]. Journal of the Franklin Institute,? 2019,? 356(10): 5332-5352.
[26] Panagou D. A Distributed Feedback Motion Planning Protocol for Multiple Unicycle Agents of Different Classes[J]. IEEE Transactions on Automatic Control,? 2017,? 62(3): 1178-1193.
[27] Zhou N,? Cheng X D,? Sun Z Q,? et al. Fixed-Time Cooperative Behavioral Control for Networked Autonomous Agents with Second-Order Nonlinear Dynamics[J]. IEEE Transactions on Cyberne-tics,? 2022,? 52(9): 9504-9518.
[28] Xia Y Q,? Zhang J H,? Lu K F,? et al. Coordination Control Design for Formation Reconfiguration of Multiple Spacecraft[M]∥ Finite Time and Cooperative Control of Flight Vehicles. Singapore: Springer,? 2019: 325-345.
[29] 安凱,? 郭振云,? 黃偉,? 等. 低/高速飛行器系統(tǒng)編隊(duì)協(xié)同控制方法研究進(jìn)展[J]. 航空兵器,? 2022,? 29(5): 53-65.
An Kai,? Guo Zhenyun,? Huang Wei,? et al. Research Progress of Formation-Cooperative Control Methods for Low-Speed and High-Speed Vehicle Systems[J]. Aero Weaponry,? 2022,? 29(5): 53-65.(in Chinese)
[30] 趙超輪,? 戴邵武,? 何云風(fēng),? 等. 基于DMPC的多無人機(jī)軌跡跟蹤與避碰切換控制[J]. 航空兵器,? 2023,? 30(6): 64-74.
Zhao Chaolun,? Dai Shaowu,? He Yunfeng,? et al. Trajectory Tracking and Collision Avoidance Switching Control for Multi-UAV Based on DMPC[J]. Aero Weaponry,? 2023,? 30(6): 64-74.(in Chinese)
[31] Huang J,? Zhou N,? Cao M. Adaptive Fuzzy Behavioral Control of Second-Order Autonomous Agents with Prioritized Missions: Theory and Experiments[J]. IEEE Transactions on Industrial Electronics,? 2019,? 66(12): 9612-9622.
[32] Zheng C B,? Pang Z H,? Wang J X,? et al. Null-Space-Based Time-Varying Formation Control of Uncertain Nonlinear Second-Order Multiagent Systems with Collision Avoidance[J]. IEEE Transactions on Industrial Electronics,? 2023,? 70(10): 10476-10485.
[33] Golluccio G,? Di Lillo P,? Marino A,? et al. When Local Optimization is Bad: Learning what to (not) Maximize in the Null-Space for Redundant Robot Control[C]∥9th International Conference on Control,? Decision and Information Technologies (CoDIT),? 2023: 506-511.
[34] Wang C H,? Wei Z Q,? Jiang W J,? et al. Cooperative Sensing Enhanced UAV Path-Following and Obstacle Avoidance with Variable Formation[J]. IEEE Transactions on Vehicular Technology,? 2024(99): 1-16.
[35] Zhang Z Y,? Chen J F,? Mo Z B,? et al. A Behavior-Based Adaptive Dynamic Programming Method for Multiple Mobile Manipulators Coordination Control[J]. International Journal of Control,? Automation and Systems,? 2023,? 21(9): 3022-3035.
[36] 郭竹森. 基于北斗的飛行器落點(diǎn)定位及地面搜尋技術(shù)研究[D]. 太原: 中北大學(xué),? 2021.
Guo Zhusen. Based on BeiDous Aircraft Landing Point Positioning and Ground Search Technology Research[D].Taiyuan: North University of China,? 2021. (in Chinese)
[37] 姚博譽(yù),? 路平,? 楊森,? 等. 四旋翼飛行器飛行控制技術(shù)綜述[J]. 航空兵器,? 2020,? 27(1): 9-16.
Yao Boyu,? Lu Ping,? Yang Sen,? et al. An Overview of Flight Control Technology for Quadrotor Aircrafts[J]. Aero Weaponry,? 2020,? 27(1): 9-16.(in Chinese)
[38] Chen J,? Gan M G,? Huang J,? et al. Formation Control of Multiple? Euler-Lagrange Systems via Null-Space-Based Behavioral Control[J]. Science China Information Sciences,? 2016,? 59(1): 1-11.
[39] Chen Y T,? Zhang Z Y,? Huang J. Dynamic Task Priority Planning for Null-Space Behavioral Control of Multi-Agent Systems[J]. IEEE Access,? 2020,? 8: 149643-149651.
[40] Huang J,? Mo Z B,? Zhang Z Y,? et al. Behavioral Control Task Supervisor with Memory Based on Reinforcement Learning for Human-Multi-Robot Coordination Systems[J]. Frontiers of Information Technology & Electronic Engineering,? 2022,? 23(8): 1174-1188.
[41] Huang J,? Wu W H,? Zhang Z Y,? et al. A Human Decision-Making Behavior Model for Human-Robot Interaction in Multi-Robot Systems[J]. IEEE Access,? 2020,? 8: 197853-197862.
[42] Antonelli G. Stability Analysis for Prioritized Closed-Loop Inverse Kinematic Algorithms for Redundant Robotic Systems[J]. IEEE Transactions on Robotics,? 2009,? 25(5): 985-994.
Rigid Formation Task Planning for Multi-Agent Systems
Based on Distance and Relative Angle Information
Huang Jie1, 2*, Li Junjie1, 2
(1. Faculty of Electrical Engineering and Automation, Fuzhou University,? Fuzhou 350108, China;
2. 5G+Industrial Internet Research Institute, Fuzhou University, Fuzhou 350108, China)
Abstract: This paper proposes two rigid formation task planning schemes for multi-agent systems to address the problem of maintaining rigid formation task planning under the condition of only obtaining local distance and relative angle information of multi-agent systems. Firstly,? a rigid formation planning scheme based on distance and relative angle is proposed to ensure the rigid formation of intelligent agents in unknown relative positions. Secondly,? the task planning method of null space projection is used to solve the conflict between formation tasks and obstacle avoidance tasks,? ensuring the stability of formation during the movement process. An overall rigid formation planning scheme is proposed that combines distance and relative angle again,? and? the multi-agent system is considered as a whole for obstacle avoidance during the obstacle avoidance process,? ensuring stable rigid formation and the completion of obstacle avoidance tasks. After simulation verification,? the two methods proposed in this paper can maintain a rigid formation and complete obstacle avoidance tasks well under the condition of weakening relative position information. Compared with the null space behavior control method that relies on relative position,? it weakens the dependence on relative position information.
Key words: rigid formation; task planning; multi agent systems; relative angle information; distance information