范 衠 ,王詔君 ,石 澤 ,王 琛 ,王 柳 ,蔡堉偉 ,黃華興 ,寧為博 ,董朝暉 ,李文姬 ,朱貴杰,李 恪,李 兵,谷敏強,朱曉敏,包衛(wèi)東
(1.汕頭大學電子系,廣東 汕頭 515063 2.汕頭大學廣東省數(shù)字信號與圖像處理技術重點實驗室,廣東 汕頭 515063 3.汕頭大學數(shù)學系,廣東 汕頭 515063;4.國防科技大學系統(tǒng)工程學院,長沙 410073)
工程技術的不斷發(fā)展推動了機器人技術的快速進步,機器人開始廣泛應用于工業(yè)、醫(yī)療、軍事等領域.對于復雜應用場景,多機器人協(xié)作逐漸成為提高任務執(zhí)行效率的有效途徑.傳統(tǒng)的中心控制方式根據(jù)系統(tǒng)狀態(tài)對所有機器人行為進行統(tǒng)一規(guī)劃,一定程度上解決了多機器人協(xié)同問題.但當系統(tǒng)規(guī)模較大時,中心控制方法面臨諸多挑戰(zhàn),如容錯能力不足,少數(shù)個體故障可能導致系統(tǒng)功能失效;計算開銷急劇增大,難以對突發(fā)因素作出及時響應;系統(tǒng)動態(tài)調(diào)節(jié)能力有限,難以根據(jù)系統(tǒng)規(guī)模變化進行適應性調(diào)整等.受自然界生物集群現(xiàn)象啟發(fā),集群機器人旨在通過自組織協(xié)同控制方式使多機器人系統(tǒng)具備高效完成復雜任務的能力,從而為上述困難的解決提供了可行方案[1-2].
根據(jù)集群行為特點及可完成的集群任務類型,集群機器人研究可分為3類:集群模式、集群導航、集群決策.特別是,集群模式形成作為實現(xiàn)上述任務的基本功能已經(jīng)得到了相當多的關注,大致可以分為四類:1)基于行為的控制,在單個機器人上實現(xiàn)一組期望的具有相對重要性的行為[3-4];2)基于領導者-追隨者模型,即確定了領導者,追隨者應該追隨領導者,并有剛性或?qū)捤傻年囆图s束[5-6];3)基于勢場模型,機器人沿著勢場的梯度移動,勢場是吸引力和排斥力的總和[7-8];4)基于生物啟發(fā)方法,機器人控制模型來自生物系統(tǒng),如信息素/激素模型[9-10]或基因調(diào)節(jié)網(wǎng)絡(GRN)模型[11-12].
現(xiàn)有的大多數(shù)群體模式形成算法的一個重要局限性是目標形狀需要預先定義,只形成少量的簡單幾何形狀,可能無法滿足未知復雜環(huán)境的需求[13].為了緩解這個問題,Beta和Kumar[14]提出了一種針對大量機器人的編隊控制方法.在這個工作中,雖然目標形狀可以通過改變形狀大小來適應環(huán)境的變化(以一個狹窄的隧道通過場景為例),但是只考慮了兩個簡單的形狀,最終形成的形狀導致機器人在形狀內(nèi)部松散分布.Cheah等[15]引入了一種基于勢場的機器人群體形狀控制,即群體中的每個機器人都停留在一個移動區(qū)域內(nèi),彼此之間保持最小的距離.他們考慮了不同形狀的不等式函數(shù)的組合與收斂分析.然而,目標形狀的復雜性仍然是有限的,并且目標形狀必須預先定義.
然而,目前基于層次GRNs的框架的群體模型生成算法都假設群體機器人位置信息通過全局定位獲得的.但是在實際應用中,由于群體機器人所用的里程計等傳感器往往存在誤差和外界環(huán)境的干擾,導致基于全局坐標系的群體機器人位置信息很難準確獲得[16].此外,在群機器人系統(tǒng)中,借助與相鄰機器人的局部通信實現(xiàn)自身定位是一種常見的做法.如文獻[17]假設群體機器人之間存在分散的全局位置感知參考點;文獻[18]含有一個靜止且固定位置的群體機器人作為其他群體機器人的參考點.這些算法都含有一個基本假設是它們具有預定的位置或配備定位系統(tǒng)[19],再或者一些機器人向目標移動,另一些保持不動,為移動機器人提供位置信息[20].如果沒有這樣的假設,群中的其他機器人將無法正常工作.對于圍捕任務來說,在群集系統(tǒng)中偵測到目標的群體機器人與鄰域群體機器人之間局部合作可以獲得相對位置和航向信息,再把相關信息傳遞到通訊范圍內(nèi)的其他群體機器人,從而實現(xiàn)對目標自適應的圍捕和群體形態(tài)的生成.換句話說,群體機器人不用知道整個環(huán)境里的信息,只用知道目標周圍環(huán)境信息.群體機器人只用構建關于目標周圍的坐標系,獲得目標和目標周圍環(huán)境位置信息.為此,我們提出一種基于合作自主定位的群體模式自動生成方法.該方法設計一個三層基因調(diào)控網(wǎng)絡模型.首先,第一層為局部坐標系的構建,即當群體機器人偵查到目標后,群體機器人根據(jù)其傳感器獲得的局部信息或與鄰近群體機器人通過局部協(xié)調(diào)建立局部坐標系.緊接著,通過群體機器人的局部感知獲得目標和障礙物相對位置信息.第二層結構為自適應群體模式生成,即它能夠根據(jù)目標位置信息和群體機器人檢測到目標周圍環(huán)境信息作為輸入,從而生成各種復雜的群體模式.第三層負責引導群體機器人移動到第二層生成的群體形態(tài).
本文的其余部分組織如下.第二部分提供了詳細的問題陳述,并列出了該模型工作的一些假設.第三部分給出了本文提出方法詳細描述.第四部分通過多種仿真場景對本文提出的方法進行評估.最后,第五部分對本文做出總結.
本文主要研究利用基因調(diào)控模型生成群體形態(tài)在障礙物環(huán)境中對目標圍捕.目標圍捕任務主要包括兩個步驟:1)生成包圍目標的群體形態(tài);2)控制群體機器人移動到群體形態(tài)上.值得注意的是,在生成群體形態(tài)時,群體機器人需要根據(jù)目標的數(shù)量和目標周圍環(huán)境生成合適的群體模式.尤其是,當目標從障礙物中移動時,群體形態(tài)可以根據(jù)目標位置和目標周圍環(huán)境的不同自適應對目標進行圍捕.在群體機器人圍捕目標時,群體機器人需在沒有集中控制的情況下將自己部署到生成的群體模式上.與文獻[21]類似,群體機器人被分為兩類:1)組織機器人(可以檢測到至少一個目標并負責模式生成);2)非組織機器人(尚未檢測到任何目標).更具體的說,非組織機器人跟隨鄰近的組織機器人獲取目標信息,直到自己檢測到目標.
本研究做了以下幾個假設:
1)在群體機器人攜帶的傳感器感知范圍內(nèi),群體機器人可以通過其傳感器感知到自身與鄰居群體機器人、目標和障礙物之間的距離;
2)在通信范圍內(nèi),群體機器人之間可以無障礙的快速通信.因為對于移動的群體機器人來說,如果定位過程的計算和通信太慢,無法與群體機器人的位移兼容,那么傳感器得到的數(shù)據(jù)就會變得非常不準確,所以群體機器人之間必須無障礙的快速地通信.
3)群體機器人移動速度大于目標移動速度.因為如果群體機器人移動速度太慢就無法保證群體機器人追上目標且對于目標進行圍捕.
在本文中,為了衡量本文提出的方法性能,本文定義以下指標(如收斂誤差φs(g)和分布誤差Ds),具體如下:
● 收斂誤差φs(g):
● 分布誤差Ds
在實際應用中,由于群體機器人所用的里程計等傳感器往往存在誤差和外界環(huán)境的干擾,導致基于全局坐標系的群體機器人位置信息很難準確獲得.對于圍捕任務來說,群體形態(tài)形成主要受目標周圍環(huán)境的影響.為此,我們提出一種基于合作自主定位的群體模式自動生成方法,該方法的一般結構圖如圖1所示.從圖1中可知,該方法分為三部分:1)群體機器人相互協(xié)作自主定位;2)基于局部信息的群體形態(tài)自動生成;3)群體機器人分布式自主控制策略.
圖1 基于合作自主定位的群體模式自動生成方法的示意圖
在群體機器人系統(tǒng)中,每個群體機器人都能夠測量它與通信范圍內(nèi)的機器人的距離.群中的每個群體機器人都可以看作是圖2中的一個節(jié)點.如果節(jié)點B在節(jié)點A的通信范圍內(nèi),則圖中的節(jié)點A鏈接到節(jié)點B.基于所有群體機器人的通信范圍相等的假設,通信圖的鏈接是雙向的.如果一個節(jié)點在鄰域內(nèi)已知三個距離的局部節(jié)點,則它能夠使用三點定位的方法計算出自己的相對位置.值得注意的是,我們假設在群體機器人系統(tǒng)中機器人是適當分布的,以便在通信范圍內(nèi)被連接,即每個節(jié)點與其他節(jié)點有兩個以上的鏈接,如圖2所示.這樣在群體機器人系統(tǒng)中群體機器人相對位置信息就可以通過三點定位方位計算出來.
圖2 群體機器人系統(tǒng)構成的通信圖
為了建立局部坐標系,我們首先確定坐標系的中心.對于圍捕任務來說,我們假設第一個偵測到目標的機器人稱為中心機器人(o-robot),它所在的位置被設置為(0,0).然后,我們需要確定所建立的坐標系的x軸.離中心機器人最近的鄰居機器人記為x-robot,且o-robot到x-robot的方向設為x軸的正方向.尤其是,o-robot利用自身傳感器檢測到x-robot的距離(dox)后,x-robot的位置設置為(dox,0).最后,我們要確定所建立的坐標系的y軸的正方向.我們把在o-robot和x-robot通信范圍交集的區(qū)域里的機器人記為y-robot.該機器人還需要滿足:它不應該在x-bot和o-robot的連接線上,即它不應該在x軸上.y-robot所在的一側(cè)建立y軸的正方向.圖3展示了建立局部坐標系的示意圖.
圖3 建立局部坐標系的示意圖
值得注意的是,當多個機器人出現(xiàn)在o-robot和x-robot通信范圍交集的區(qū)域時,通過式子(3)來確定y-robot.
其中,dcx和dci分別是o-robot到x-robot和機器人i的距離,dix是機器人i與x-robot之間的距離.
到目前為止,通過o-robot、x-robot和y-robot確定局部坐標系,這將使所有能夠與這三個機器人通信的機器人都能夠使用三點定位方法確定它們的相對位置.同樣的方法,可以計算出在該群體機器人系統(tǒng)的探測范圍內(nèi)的目標位置和障礙物位置信息.值得注意的是,目標位置和障礙物位置信息將作為本文提出的基于合作自主定位的群體模式自動生成方法的第二層的輸入.
需要說明的是,由于群體機器人在運行的過程可能會被障礙物分成多個子群體機器人系統(tǒng),為此,我們將從以下三種情況進行分析,如圖4所示.
圖4 三種建立局部坐標系的情況
圖4 (a)展示了當群體機器人系統(tǒng)被分成兩個子群體,且僅僅一個子群體發(fā)現(xiàn)目標時,發(fā)現(xiàn)目標的子群體通過三點定位方法建立關于目標的局部坐標系.沒有發(fā)現(xiàn)目標的子群體通過隨機游走策略去發(fā)現(xiàn)目標或者與發(fā)現(xiàn)目標的子群體的通信范圍重合.圖4(b)展示了當群體機器人系統(tǒng)被分成兩個子群體,且都發(fā)現(xiàn)目標但它們的通信范圍不重合時,這兩個子群體分別使用三點定位策略建立各自的局部坐標系.圖4(c)展示了當群體機器人系統(tǒng)被分成兩個子群體,且都發(fā)現(xiàn)目標和它們的通信范圍重合時,它們共用一個局部坐標系.
基于檢測到的目標的位置,群體形態(tài)將由第二層中的基因調(diào)控函數(shù)生成.自適應群體形態(tài)生成過程包括兩個步驟:i)根據(jù)基因調(diào)控函數(shù)形成一個形態(tài)梯度空間;ii)提取梯度值大于閾值的等勢線為生成的群體形態(tài).
在群體模式生成過程中,偵測到目標的機器人將通過公式(5)-(9)生成關于目標的形態(tài)梯度空間.在式(5)-(6)中,γi和βj都是標量值,它們分別表示為目標和障礙物輸入.i為第i個目標和j為第j個障礙物.值得注意的是,γi和βj分別在目標和障礙物所在的位置為一個恒定的正數(shù),且其他位置為零(即無目標和障礙物的位置為零).
其中,Ti代表由第i個目標在環(huán)境輸入(γi,目標位置信息)下產(chǎn)生的蛋白質(zhì)濃度.Oj代表由第j個障礙物在環(huán)境輸入(βj,障礙物位置信息)下產(chǎn)生的蛋白質(zhì)濃度.T和O分別為所有目標和障礙物產(chǎn)生的綜合蛋白質(zhì)濃度.為Laplacian算子,定義為Ti和Oj所在形態(tài)梯度空間的二階導數(shù),可視為生物系統(tǒng)中的蛋白質(zhì)擴散過程.M定義為考慮障礙物情況下目標所形成的形態(tài)梯度空間.值得注意的是,當目標周圍沒有障礙物時,式子(9)將簡化為式子(11).此外,θ和k為調(diào)控參數(shù).
現(xiàn)在,讓我們簡單解釋一下M是如何基于目標和障礙物信息形成形態(tài)梯度空間的.為了簡單起見,我們假設環(huán)境中只有一個目標和目標周圍只有一個障礙物.首先,目標和障礙物所在位置分別輸入一個常數(shù)γ和β.然后,T和O通過式(9)建立了關于目標和障礙物的形態(tài)濃度空間,且離目標和障礙物越遠而衰減,如圖5(a)和5(b)所示.特別是,通過式(9)的作用,可以將目標和障礙物形成的濃度場呈現(xiàn)相反的狀態(tài),即離目標越近濃度越低,離障礙物越近濃度越高,如圖5(c)所示.
圖5 T和O分別建立的蛋白質(zhì)濃度場,通過式子(9)擬合后建立的綜合蛋白質(zhì)濃度場
本文提出的方法的第三層用于引導和控制群體機器人到第二層生成的群體形態(tài)上.由于這個部分是被文獻[21]和[22]證明可以有效地指導群體機器人移動到群體形態(tài)上,為此,本文采用同樣的方法控制群體機器人,具體如下:
其中,i為第 i個機器人.Gi,x和 Gi,y代表第 i個機器人的 x 軸和 y 軸上的位置.Pi,x和 Pi,y是第i個機器人的兩個內(nèi)部狀態(tài).r為機器人的通信距離.a、b、c、r和m為參數(shù).Di為第i個機器人附近的鄰域機器人的數(shù)量.更具體的來說,Di,x和Di,y分別為第i個機器人到鄰居機器人綜合方向上x軸與y軸的分量.zi,x和zi,y分別為第i個機器人到目標方向上x軸與y軸的分量.此外,式(14)和(15)的作用是使群體機器人均勻地分布在群體形態(tài)上,換句話說,有助于避免群體機器人之間避碰和機器人與目標碰撞.
在本節(jié)中,我們將通過三種仿真實驗來驗證本文提出方法的有效性.這三種實驗分別為:1)無障礙物的情況下圍捕靜止的目標;2)含有障礙物的情況下圍捕靜止目標;3)含有障礙物的情況下圍捕動態(tài)目標.
仿真實驗參數(shù)如下設置:
a)仿真場景大小:20*20;
b)群體機器人個數(shù):20;目標個數(shù)1個;
c)目標的移動速度是群體機器人移動速度的0.5倍.在本文中,目標移動速度設置為0.5,群體機器人移動速度為1;
d)由于本文針對圍捕任務,所以假設群體機器人已知目標的大概方位.
圖6 展示了群體機器人在無障礙物的環(huán)境下包圍靜止目標的過程.在圖6(a)中,當群體機器人剛發(fā)現(xiàn)目標時,發(fā)現(xiàn)目標的機器人通過通信將信息傳輸給鄰居機器人,并且與鄰居機器人協(xié)同合作建立局部坐標系.通過此局部坐標系下,目標位置信息被計算出來,再利用本文提出的方法自動生成了關于目標的群體形態(tài).由于本文使用的基因調(diào)控網(wǎng)絡模型產(chǎn)生的濃度場呈現(xiàn)出離目標越近濃度越低的現(xiàn)象,所以為群體機器人移動至目標提供了方向信息,即起到指引群體機器人圍捕目標的作用.圖6(a)~6(d)展示了群體機器人包圍目標的整個過程.在這個過程中,群體機器人沿著群體形態(tài)向兩邊移動逐步包圍目標,最后群體機器人基本穩(wěn)定在群體形態(tài)附近.
圖6 群體機器人在無障礙物的環(huán)境下包圍靜止目標的過程
圖7 展示本文提出的算法在無障礙物環(huán)境中控制群體機器人包圍靜止目標時,群體機器人隨時間步長收斂到群體形態(tài)情況和群體機器人隨時間步長在群體形態(tài)均勻分布情況.通過對圖7(a)和圖7(b)分析發(fā)現(xiàn),由于剛開始時群體機器人沒有發(fā)現(xiàn)目標,導致沒有收斂誤差和分布誤差.由于群體機器人發(fā)現(xiàn)目標是逐個發(fā)現(xiàn)的,所以導致收斂誤差和分布誤差值很大.隨著群體機器人運動到群體形態(tài)附近,收斂誤差和分布誤差逐漸減小,直到0附近,即群體機器人最后移動到群體形態(tài)上和在群體形態(tài)上均勻分布.
圖7 在無障礙物的環(huán)境下,群體機器人包圍靜止目標時,兩評價指標隨時間步長變化情況
圖8 展示了群體機器人在含有障礙物的環(huán)境下包圍靜止目標的過程.通過對圖8(a)分析可以知道,當群體機器人剛發(fā)現(xiàn)目標時,由于群體機器人只探測出目標周圍一部分信息,所以此時群體形態(tài)尚處于雛形.隨著群體機器人向目標移動,探測到目標周圍的障礙物越來越多.群體形態(tài)受探測到障礙物的影響,逐步發(fā)生形變,使之適應目標周圍環(huán)境,如圖8(a)~8(d)所示.值得注意的是,由于群體機器人沒有類似與避障的傳感器,群體機器人避障全靠濃度梯度指引.本文提出的基因調(diào)控網(wǎng)絡模型使目標產(chǎn)生的濃度場和障礙物產(chǎn)生的濃度場呈現(xiàn)相反的表達狀態(tài),即離目標越近濃度越低,離障礙物越近濃度越高.由于群體機器人向濃度低的方向移動,就可以保證群體機器人在圍捕目標的同時避開障礙物.
圖8 群體機器人在含有障礙物的環(huán)境下包圍靜止目標的過程
圖9 展示本文提出的算法在障礙物環(huán)境中控制群體機器人包圍靜止目標時,群體機器人隨時間步長收斂到群體形態(tài)情況和群體機器人隨時間步長在群體形態(tài)均勻分布情況.通過對圖9(a)和圖9(b)分析發(fā)現(xiàn),由于剛開始時群體機器人沒有發(fā)現(xiàn)目標,導致沒有收斂誤差和分布誤差.隨著群體機器人逐步發(fā)現(xiàn)目標,并向目標移動,收斂誤差和分布誤差逐漸減小.但是由于目標周圍含有障礙物,在障礙物影響下,導致群體機器人不能完全收斂到群體形態(tài)上,如圖9(a)所示.又因為群體機器人是移動,群體機器人探測到目標周圍的環(huán)境越來越多,群體形態(tài)也會逐步發(fā)生形變,所以導致群體機器人無法完全在群體形態(tài)均勻分布,如圖9(b)所示.
圖9 在無障礙物的環(huán)境下,群體機器人包圍靜止目標時,兩評價指標隨時間步長變化情況
圖10 展示了群體機器人在含有障礙物的環(huán)境下包圍動態(tài)目標的過程.該場景在上一個場景的基礎上加入含有倒鉤的通道,其目的是驗證本文提出的方法動態(tài)生成群體形態(tài)的魯棒性,即如果本文提出的方法產(chǎn)生的群體形態(tài)不能適應該場景,則造成群體機器人陷入到倒鉤性障礙物中,導致群體機器人不能很好圍捕目標.圖10(a)~10(d)展示了當目標穿過含有倒鉤的通道時,本文提出的方法產(chǎn)生的群體形態(tài)自動調(diào)節(jié)其形態(tài)使之適應目標周圍環(huán)境,從而避免了群體機器人陷入到障礙物中.圖10(e)~10(i)展示了目標周圍出現(xiàn)不規(guī)則障礙物時,本文提出的方法產(chǎn)生群體形態(tài)也能自適應調(diào)節(jié)其形態(tài),從而圍捕目標的過程.
圖10 群體機器人在含有障礙物的環(huán)境下包圍動態(tài)目標的過程
圖11 展示本文提出的算法在障礙物環(huán)境中控制群體機器人包圍動態(tài)目標時,群體機器人隨時間步長收斂到群體形態(tài)情況和群體機器人隨時間步長在群體形態(tài)均勻分布情況.通過對圖11(a)和圖11(b)分析發(fā)現(xiàn),由于目標是運動的,目標周圍環(huán)境也是不停改變的.所以群體機器人探測到的目標環(huán)境也是時刻改變的,從而導致群體形態(tài)也是動態(tài)變化的.當目標周圍環(huán)境變化較大時,導致群體形態(tài)變化也是劇烈的,所以收斂誤差幅度較大,如圖11(a)所示.雖然群體形態(tài)變化較大,但是群體機器人始終在目標周圍分布了,所以分布誤差變化不大,如圖11(b)所示.
圖11 在無障礙物的環(huán)境下,群體機器人包圍靜止目標時,兩評價指標隨時間步長變化情況
本文提出一種基于合作自主定位的群體模式自動生成方法,用于群體機器人圍捕目標任務.在該方法中,群體機器人通過自身與鄰居機器人相互協(xié)作實現(xiàn)自主定位,并獲得目標和障礙物位置信息.然后,利用本文提出的基因調(diào)控網(wǎng)絡模型生成的群體形態(tài)引導群體機器人圍捕目標和躲避障礙物.該方法的最大優(yōu)點是在實際環(huán)境中,群體機器人不用定位傳感器來定位自身位置信息,避免了定位傳感器帶來的誤差對群體機器人圍捕目標時的影響.此外,該方法也使得群體機器人不需要方向感知傳感器和避障傳感器,方便了該方法移植到極簡群體機器人系統(tǒng)中.緊接著,通過多種仿真實驗驗證了本文提出的方法可以根據(jù)目標周圍環(huán)境的不同自動調(diào)節(jié)群體形態(tài),即圍捕目標的群體形態(tài)隨目標周圍障礙物的分布變化而自適應的改變,避免了目標逃逸.