何杏宇 王怡 楊桂松 賈明權(quán) 周玥 徐心玥
摘 要:現(xiàn)有多智能體系統(tǒng)網(wǎng)絡(luò)研究方法缺乏對局部網(wǎng)絡(luò)質(zhì)量與區(qū)域性任務(wù)需求之間的匹配分析,這將影響任務(wù)的完成效率和質(zhì)量,為此提出一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。首先,利用智能體移動狀態(tài)分析系統(tǒng)網(wǎng)絡(luò)的間歇連通性;然后,結(jié)合任務(wù)需求以及系統(tǒng)的間歇網(wǎng)絡(luò)連通性構(gòu)建基于主從模式的多智能體子網(wǎng)集合,進(jìn)而從三個方面評估子網(wǎng)集合的連通質(zhì)量;最后,提出基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動優(yōu)化模型,用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,在智能體移動距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最大化的多智能體移動策略,通過該策略形成多智能體網(wǎng)絡(luò)以執(zhí)行任務(wù)。實驗結(jié)果表明,該方法可以有效控制網(wǎng)絡(luò)連通質(zhì)量,維持任務(wù)完成率并提高智能體移動效用。
關(guān)鍵詞:多智能體系統(tǒng);任務(wù)需求;網(wǎng)絡(luò)連通性分析;網(wǎng)絡(luò)連通質(zhì)量
中圖分類號:TP393.03 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-3695(2023)10-037-3125-07
doi:10.19734/j.issn.1001-3695.2023.02.0042
Network connectivity quality control method based on matching task requirement
He Xingyu1a,1b,Wang Yi1a,Yang Guisong1a,Jia Mingquan2,Zhou Yue1b,Xu Xinyue1b
(1.a.School of Optical-Electrical & Computer Engineering,b.College of Communication & Art Design,University of Shanghai for Science & Technology,Shanghai 200093,China;2.Southwest China Institute of Electronic Technology,Chengdu 610036,China)
Abstract:The existing multi-agent network researches ignore the matching between qualities of local networks and the requirements of regional tasks,which influences task completion efficiency and quality.In view of this,this paper proposed a network connectivity quality control method based on matching task requirement.Firstly,this method analyzed the intermittent connectivity of multi-agent network by using states of agents.Secondly,it constructed a subnet set based on leader-follower model to execute tasks,according to the requirements of tasks and the intermittent connectivity of network,and it further evaluated the connectivity quality of the subnet set.Finally,this method designed a multi-agent mobility optimization model based on network connectivity quality,in which the maximum connectivity quality of subnet set represented to the network connectivity quality.Under the constraints of agents mobile distance and network connectivity quality,this model obtained multi-agent mobility strategy with optimal task completion rate.Experimental results verify that the proposed method can effectively control the network connectivity quality,maintain the task completion rate and improve the mobile utility of agents.
Key words:multi-agent system;task requirement;network connectivity analysis;network connectivity quality
0 引言
隨著通信控制、人工智能、工業(yè)制造等諸多領(lǐng)域的快速發(fā)展,多智能體系統(tǒng)已經(jīng)成為一個新的研究熱點。因具有低人力成本、快速處理大量數(shù)據(jù)、高效智能自主決策等優(yōu)點,被廣泛應(yīng)用于軍事作戰(zhàn)[1]、環(huán)境監(jiān)測[2]、智能交通[3]和智慧工廠[4]等場景。在上述場景中,多智能體形成連通的網(wǎng)絡(luò)以交互信息從而協(xié)同完成任務(wù)。為了保證任務(wù)完成效率和質(zhì)量,如何調(diào)整多智能體網(wǎng)絡(luò)的連通性以匹配任務(wù)需求是多智能體系統(tǒng)中的一個關(guān)鍵問題。從網(wǎng)絡(luò)連通性的角度分析,現(xiàn)有的多智能體網(wǎng)絡(luò)可以分為持續(xù)連通網(wǎng)絡(luò)和間歇連通網(wǎng)絡(luò)。
持續(xù)連通的多智能體網(wǎng)絡(luò)在執(zhí)行任務(wù)時具有可靠性和穩(wěn)定性,現(xiàn)有研究的目標(biāo)可分為維持網(wǎng)絡(luò)持續(xù)連通性和連通性約束下優(yōu)化多智能體協(xié)同執(zhí)行任務(wù)的過程。前者通過同步、跟蹤的方式保證網(wǎng)絡(luò)持續(xù)連通[5,6];后者在全局連通性[7~9]或局部連通性[10]的約束下,改變多智能體的網(wǎng)絡(luò)連通性以協(xié)同執(zhí)行任務(wù)。但是在實際執(zhí)行協(xié)同任務(wù)的過程中存在智能體移動性和惡劣環(huán)境等因素的限制,使多智能體網(wǎng)絡(luò)很難保持持續(xù)連通,同時持續(xù)連通網(wǎng)絡(luò)的部署維護(hù)成本高且智能體的移動距離受限,將導(dǎo)致其無法高效執(zhí)行任務(wù)。
為克服持續(xù)連通網(wǎng)絡(luò)中存在的問題,現(xiàn)有研究利用網(wǎng)絡(luò)的間歇連通性執(zhí)行任務(wù)。間歇連通的多智能體能夠靈活地組網(wǎng)以完成任務(wù),現(xiàn)有研究的目標(biāo)可分為實現(xiàn)多智能體共識[11,12]和探索任務(wù)環(huán)境以協(xié)同執(zhí)行任務(wù)[13~15]。前者為了解決間歇連通多智能體的信息滯后問題,在某種共識下智能體之間及時通信并共享信息以協(xié)同完成任務(wù);后者放寬智能體移動范圍,無須時刻保持多智能體的網(wǎng)絡(luò)連通性就能協(xié)同完成任務(wù)。但是,間歇連通的多智能體之間通信不穩(wěn)定,難以形成可靠的通信鏈路和穩(wěn)定的多智能體網(wǎng)絡(luò),這將影響任務(wù)完成效率。為了提高間歇連通網(wǎng)絡(luò)的穩(wěn)定性,現(xiàn)有研究提出了周期性間歇連通網(wǎng)絡(luò),該網(wǎng)絡(luò)通過控制網(wǎng)絡(luò)節(jié)點的移動軌跡來實現(xiàn)。文獻(xiàn)[16]提出了具有彈性共識的多智能體時變通信方法,多智能體沿著路徑移動,在組內(nèi)或組間形成周期性的通信。文獻(xiàn)[17,18]對間歇連通智能體的移動進(jìn)行約束,令智能體沿環(huán)形軌跡運動,使智能體之間的通信具有周期性。
然而,現(xiàn)有的周期性間歇連通網(wǎng)絡(luò)研究大多關(guān)注的是全局網(wǎng)絡(luò)連通性,較少關(guān)注局部網(wǎng)絡(luò)連通性以及局部網(wǎng)絡(luò)連通性與任務(wù)的匹配情況,這將影響多智能體的任務(wù)完成效率和質(zhì)量。多智能體網(wǎng)絡(luò)與以數(shù)據(jù)傳輸為主要目的的網(wǎng)絡(luò)不同,后者通過關(guān)注全局網(wǎng)絡(luò)連通性充分利用整個網(wǎng)絡(luò)中存在的數(shù)據(jù)傳輸路徑以提高數(shù)據(jù)傳輸性能,而前者是面向任務(wù)需求實現(xiàn)組網(wǎng),任務(wù)的執(zhí)行情況與覆蓋該任務(wù)的局部子網(wǎng)密切相關(guān)。
鑒于現(xiàn)有研究中缺乏針對任務(wù)需求匹配的局部網(wǎng)絡(luò)性能分析方法,本文提出了基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。根據(jù)任務(wù)所在位置和任務(wù)所需智能體數(shù)量來調(diào)整智能體的移動狀態(tài),令其形成匹配任務(wù)需求的多智能體子網(wǎng)集合以協(xié)同執(zhí)行任務(wù)。首先分析多智能體系統(tǒng)的間歇網(wǎng)絡(luò)連通性;然后,根據(jù)任務(wù)需求構(gòu)建基于主從模式的多智能體子網(wǎng)集合來執(zhí)行任務(wù),進(jìn)而從子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性和子網(wǎng)集合中智能體的負(fù)載三個方面評估子網(wǎng)集合的連通質(zhì)量;最后提出一種基于網(wǎng)絡(luò)連通質(zhì)量的多智能體移動優(yōu)化模型,用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,在智能體移動距離和網(wǎng)絡(luò)連通質(zhì)量的約束下最大化任務(wù)完成率。本文為了匹配多智能體局部網(wǎng)絡(luò)的質(zhì)量和區(qū)域性任務(wù)的需求,根據(jù)任務(wù)所在位置和所需智能體數(shù)量構(gòu)造基于主從模式的子網(wǎng)集合,由子網(wǎng)中智能體協(xié)同執(zhí)行任務(wù);為了保證任務(wù)完成效率和質(zhì)量,提出了一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。
1 系統(tǒng)模型
本文構(gòu)建了一個多智能體系統(tǒng)模型,多智能體之間形成周期性間歇連通網(wǎng)絡(luò)以執(zhí)行平臺發(fā)布的任務(wù),其應(yīng)用場景如圖1所示。其中,平臺根據(jù)任務(wù)需求和智能體的當(dāng)前位置對智能體的移動狀態(tài)進(jìn)行調(diào)整,以形成與任務(wù)需求匹配的周期性間歇連通子網(wǎng)集合。具體地,平臺從環(huán)境中收集任務(wù)信息和多智能體移動狀態(tài),分析多智能體網(wǎng)絡(luò)的連通質(zhì)量,在智能體移動距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最大化的多智能體移動狀態(tài);平臺將該移動策略傳遞給多智能體網(wǎng)絡(luò),多智能體網(wǎng)絡(luò)在執(zhí)行任務(wù)后向平臺反饋任務(wù)執(zhí)行結(jié)果。
1.1 智能體
系統(tǒng)中存在一組智能體,N個智能體構(gòu)成智能體集合為V={v1,v2,…,vi,…,vN}。其中,智能體的通信距離為Δ。這些智能體在時段Tk內(nèi)沿環(huán)形軌跡移動,形成周期性間歇連通的多智能體網(wǎng)絡(luò)。相比于在網(wǎng)絡(luò)中被視做一個隨機(jī)移動的點,沿環(huán)形軌跡移動的智能體將獲取更多的連通機(jī)會和更廣的連通范圍。在時段Tk-1的初始時刻tk-1采樣智能體移動狀態(tài)Sk-1,為匹配任務(wù)需求,在時刻tk智能體的移動狀態(tài)調(diào)整為Sk。在時刻tk,多智能體移動狀態(tài)的集合為Sk={sk1,sk2,…,ski,…,skN},其中,智能體vi的移動狀態(tài)ski由其所處環(huán)形軌跡的圓心位置oki和軌跡上的移動相位ωki組成,即ski={oki,ωki}。具體地,圓心位置oki∈L處于網(wǎng)格內(nèi)部,移動相位ωki={0°,90°,180°,270°}有四種狀態(tài)。對于任意智能體,有相同的軌跡半徑r和軌跡上智能體移動速度sp,且智能體沿順時針方向移動。
1.2 任務(wù)
在時刻tk,系統(tǒng)中存在一系列任務(wù),M個任務(wù)的集合為A(k)={ak1,ak2,…,akj,…,akM}。其中,任務(wù)akj所在位置為apkj,且需要ankj個智能體協(xié)同完成。在時段Tk,多智能體組成網(wǎng)絡(luò)執(zhí)行任務(wù)集合A(k)中的任務(wù)。為了可靠地完成任務(wù),多智能體網(wǎng)絡(luò)需要保證穩(wěn)定通信,即智能體之間連通時長超過τ。當(dāng)執(zhí)行任務(wù)akj的多智能體子網(wǎng)中存在圓心位置與任務(wù)位置重合的領(lǐng)隊智能體、與平臺直接連通的智能體,且子網(wǎng)中智能體的數(shù)量滿足任務(wù)需求時任務(wù)被完成。
1.3 平臺
本文搭建了集中控制平臺,平臺調(diào)整智能體的移動狀態(tài)以協(xié)同執(zhí)行任務(wù)。根據(jù)調(diào)整后多智能體的移動狀態(tài)分析多智能體的網(wǎng)絡(luò)連通性,從所有智能體中選擇部分智能體組成子網(wǎng)以協(xié)同執(zhí)行任務(wù),并將任務(wù)執(zhí)行結(jié)果傳遞回平臺。在調(diào)整的過程中,關(guān)注智能體的移動距離、任務(wù)完成率和網(wǎng)絡(luò)連通質(zhì)量以高質(zhì)量、高效率地完成任務(wù)。具體來說,為滿足時段Tk內(nèi)的任務(wù)需求,平臺在時刻tk調(diào)整智能體移動狀態(tài)為Sk,智能體在時段Tk內(nèi)按調(diào)整后的軌跡移動。另外,本文定義平臺所在位置為PPF,同時假設(shè)智能體調(diào)整移動狀態(tài)的時間忽略不計。
舉個例子,假設(shè)網(wǎng)格的大小為6×6,平臺所在位置為(3,3),如圖2中藍(lán)色方形所示(參見電子版)。存在智能體集合V={v1,v2,v3,v4,v5},如圖2中綠色圓形所示,其移動軌跡半徑為1個單位,軌跡上的移動速度為1周/Δt。平臺未發(fā)布任務(wù)時,智能體按照上一時段執(zhí)行任務(wù)的軌跡移動,如圖2(a)所示。在時刻tk,平臺發(fā)布任務(wù),為滿足任務(wù)需求,智能體移動狀態(tài)由圖2(a)調(diào)整為圖2(b),在時段Tk,智能體按照圖2(b)中的軌跡移動以協(xié)同完成任務(wù)。調(diào)整智能體的移動狀態(tài)時,考慮任務(wù)完成率和智能體的移動距離,關(guān)注執(zhí)行任務(wù)的子網(wǎng)的網(wǎng)絡(luò)連通質(zhì)量,形成滿足當(dāng)前任務(wù)需求的多智能體網(wǎng)絡(luò)。具體地,在時刻tk,平臺發(fā)布任務(wù)ak1,任務(wù)所在位置為(5,4),需要兩個連通的智能體協(xié)同完成,如圖中紅色三角形所示。分析圖2(a)中智能體與任務(wù)的距離,選擇智能體v2作為領(lǐng)隊直接執(zhí)行任務(wù)ak1。在時段Tk,為了滿足任務(wù)需求且減小智能體移動距離,智能體v2和v4組成子網(wǎng)在整個時段內(nèi)保持連通且與平臺連通以執(zhí)行任務(wù),智能體v1、v3和v5保持原有移動軌跡,如圖2(b)所示。此時,每個智能體完成任務(wù)ak1的移動距離分別為{0,1,0,2,0}。
為調(diào)整多智能體的移動狀態(tài)以保證任務(wù)完成效率和質(zhì)量,本文分析多智能體組成網(wǎng)絡(luò)協(xié)同執(zhí)行任務(wù)的情況。主要變量符號及含義如表1所示。
2 多智能體系統(tǒng)的間歇網(wǎng)絡(luò)連通性分析
為分析多智能體網(wǎng)絡(luò)的連通性,平臺根據(jù)智能體的移動狀態(tài)計算時段內(nèi)智能體之間的連通時長,篩選穩(wěn)定的智能體連通邊構(gòu)成穩(wěn)定通信的周期性間歇連通的多智能體網(wǎng)絡(luò),并獲得該網(wǎng)絡(luò)的連通矩陣。為執(zhí)行任務(wù),多智能體網(wǎng)絡(luò)中智能體移動狀態(tài)如圖3(a)所示,對應(yīng)的網(wǎng)絡(luò)連通圖如圖3(b)所示。
a)根據(jù)智能體的移動狀態(tài)Sk計算時段Tk內(nèi)智能體的位置。在時刻tk,智能體vi的環(huán)形軌跡圓心為oki、軌跡上移動相位為ωki、智能體軌跡半徑為r且在軌跡上的移動速度為sp。在時段Tk內(nèi)的任意時刻t,智能體vi的實時位置pti計算如下:
利用智能體的實時位置和智能體的通信距離判斷智能體之間的連通性。通過式(1)(2)計算時刻t智能體vi1和vi2的實時位置pti1和pti2。當(dāng)兩智能體之間的距離小于智能體的通信距離Δ,則認(rèn)為智能體vi1和vi2在該時刻連通,由此得到兩智能體連通的時刻。
b)本文定義了多智能體網(wǎng)絡(luò)的連通圖。在時段Tk,多智能體網(wǎng)絡(luò)的連通圖為Gk=(V,Ek),其中,節(jié)點集合V包含了N個多智能體,即V={v1,v2,…,vi,…,vN},邊集合Ek包含了任意兩節(jié)點之間的連通邊,即Ek={Ek1,2,Ek1,3,…,EkN-1,N}。其中,智能體vi1和vi2之間連通邊的集合為Eki1,i2={ei1,i2(ti1,i2,ti1,i2)},ti1,i2表示兩智能體開始連通的時刻,ti1,i2表示兩智能體結(jié)束連通的時刻。若兩智能體在一個時段內(nèi)多次連通,則集合中存在多條邊。
c)為了保證智能體之間通信的穩(wěn)定性,從多智能體網(wǎng)絡(luò)連通圖中篩選滿足智能體信息傳輸時長的連通邊,獲得穩(wěn)定通信的多智能體網(wǎng)絡(luò)的直接連通性。因此,本文定義了多智能體網(wǎng)絡(luò)的直接連通矩陣如式(3)所示。
其中:c(1)i1,i2(k)表示智能體vi1和vi2在該時段內(nèi)是否具有穩(wěn)定的直接連通性。如式(4)所示,如果在兩智能體連通邊的集合Eki1,i2中,最大連通時長的連通邊滿足智能體信息傳輸時長τ的要求,認(rèn)為兩智能體之間具有穩(wěn)定的直接連通性。
其中:cglobali1,i2(k)表示智能體vi1和vi2在該時段內(nèi)是否具有連通性。通過多智能體網(wǎng)絡(luò)的直接連通矩陣C(1)(k)的自乘,計算h跳連通矩陣C(h)(k),累加多跳連通矩陣中兩智能體之間的連通性,判斷智能體之間的連通性,如式(6)所示。
另外,在多智能體網(wǎng)絡(luò)的連通矩陣中智能體不存在自連通性,即連通矩陣對角線的值為0。
3 基于任務(wù)需求匹配的子網(wǎng)連通性質(zhì)量分析
3.1 基于主從模式的子網(wǎng)構(gòu)建
利用上文中多智能體網(wǎng)絡(luò)的連通矩陣Cglobal(k),從智能體集合V中選擇部分智能體組成多智能體子網(wǎng)以協(xié)同執(zhí)行任務(wù)。為了提高多智能體組網(wǎng)效率,本文基于主從模式構(gòu)建子網(wǎng),子網(wǎng)中包含了領(lǐng)隊智能體和追隨者智能體。
在時段Tk內(nèi)存在任務(wù)akj,定義執(zhí)行該任務(wù)的多智能體子網(wǎng)為(Gsub)kj=(Vkj,Ekj)。其中,子網(wǎng)中智能體的集合為VkjV,子網(wǎng)中智能體之間連通邊的集合為EkjEk。在子網(wǎng)的智能體集合中,包含了領(lǐng)隊智能體leaderkj和追隨者智能體集合followerkj。此外,為執(zhí)行任務(wù)集合A(k),從智能體集合中選擇多組形成智能體子網(wǎng)集合(Gsub)k。
3.1.1 領(lǐng)隊智能體
在時刻tk,為穩(wěn)定地執(zhí)行任務(wù)akj,要求調(diào)整移動狀態(tài)后領(lǐng)隊智能體leaderkj的圓心okleaderkj與任務(wù)位置apkj重合。因此,根據(jù)調(diào)整前智能體的位置pk-1i選擇調(diào)整距離最小的智能體作為領(lǐng)隊智能體,根據(jù)上一時段采樣的智能體移動狀態(tài)Sk-1,計算在時刻tk-1智能體的實時位置pk-1i。
在時刻tk,為執(zhí)行M個任務(wù)A(k),選擇領(lǐng)隊智能體集合Leaderk,如式(7)所示。為提高任務(wù)完成率并保證任務(wù)完成質(zhì)量,智能體可在不同子網(wǎng)中執(zhí)行任務(wù),但不能同時作為領(lǐng)隊智能體執(zhí)行多個任務(wù),即領(lǐng)隊智能體集合中元素不重復(fù)。
3.1.2 追隨者智能體
為執(zhí)行任務(wù)akj,在確定領(lǐng)隊智能體leaderkj,后選擇追隨者智能體集合followerkj與其組成子網(wǎng)(Gsub)kj執(zhí)行任務(wù)。在選擇追隨者智能體時,考慮子網(wǎng)中智能體之間的連通性、智能體的數(shù)量和追隨者智能體的多種選擇方式。
a)判斷子網(wǎng)的智能體集合Vkj中所有智能體是否具有連通性,如式(8)所示。對于子網(wǎng)智能體集合中任意智能體vi,利用式(4)判斷集合中是否有其他智能體v與其直接連通。
b)為了減少資源浪費并最大限度滿足任務(wù)需求,多智能體子網(wǎng)(Gsub)kj中智能體的數(shù)量不超過任務(wù)需求ankj,即追隨者智能體的數(shù)量不超過ankj-1。
c)為匹配任務(wù)需求,存在多種追隨者智能體followerkj的選擇方式。如圖4所示,假設(shè)任務(wù)a12需要四個智能體協(xié)同完成,其中,智能體v2作為領(lǐng)隊智能體leader12存在兩種追隨者智能體集合可以滿足任務(wù)需求,即智能體v1、v3和v4作為追隨者智能體集合follower12,或智能體v3、v4和v5作為追隨者智能體集合follower12。選擇哪種追隨者集合組成子網(wǎng)以執(zhí)行任務(wù),需要匹配多任務(wù)需求,評估執(zhí)行多任務(wù)的子網(wǎng)集合的連通質(zhì)量,將在后文詳細(xì)闡述。
3.1.3 判斷子網(wǎng)是否成立
在匹配任務(wù)需求前需要判斷子網(wǎng)是否成立,具體地,除了子網(wǎng)中智能體之間具有連通性和子網(wǎng)中存在領(lǐng)隊智能體外,還要求子網(wǎng)中存在與平臺穩(wěn)定連通的智能體,將完成的任務(wù)傳遞回平臺。
在時段Tk內(nèi),為獲取平臺與智能體的穩(wěn)定連通性,利用式(1)(2)計算智能體vi的實時位置,當(dāng)智能體位置pti和平臺位置pPF的距離小于智能體通信距離Δ時,智能體與平臺連通。據(jù)此可知,智能體與平臺在時刻tPF,i開始連通,在時刻tPF,i結(jié)束連通。為保證平臺與子網(wǎng)穩(wěn)定的連通性,要求智能體與平臺的連通時長超過信息傳輸時長τ。因此,在平臺與智能體穩(wěn)定的直接連通性(CPF,V)(1)(k)中,智能體vi與平臺穩(wěn)定的直接連通性(cPF,V)(1)PF,i(k)如式(9)所示。
綜上所述,從三個方面判斷多智能體子網(wǎng)(Gsub)kj是否能執(zhí)行任務(wù)akj,即子網(wǎng)中智能體具有連通性、存在領(lǐng)隊智能體leaderkj和與平臺穩(wěn)定連通的智能體vi,如式(10)所示。
3.2 基于任務(wù)需求匹配的子網(wǎng)連通性質(zhì)量評估
為分析局部網(wǎng)絡(luò)質(zhì)量與區(qū)域性任務(wù)需求之間的匹配情況,本文定義子網(wǎng)集合的連通質(zhì)量。子網(wǎng)集合的連通質(zhì)量除了與任務(wù)需求的匹配度有關(guān),子網(wǎng)的性能也對其有重要影響。具體地,網(wǎng)絡(luò)性能指標(biāo)包括網(wǎng)絡(luò)連通時長[19]、負(fù)載均衡[20]和網(wǎng)絡(luò)穩(wěn)定性[21]等。本文從子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性、子網(wǎng)集合中智能體的負(fù)載三個方面評估子網(wǎng)集合的連通質(zhì)量。
具體地,在當(dāng)前智能體移動狀態(tài)Sk下,子網(wǎng)集合(Gsub)k的連通質(zhì)量Q(Gsub)k受子網(wǎng)集合與任務(wù)需求的匹配度TND(Gsub)k、子網(wǎng)集合的穩(wěn)定性NS(Gsub)k以及子網(wǎng)集合中智能體的負(fù)載NL(Gsub)k的影響,子網(wǎng)集合的連通質(zhì)量越高,多智能體越能高質(zhì)量、高效率完成任務(wù)。參數(shù)α、β和γ調(diào)節(jié)上述三種因素對子網(wǎng)集合連通質(zhì)量的影響程度。
3.2.1 子網(wǎng)集合與任務(wù)需求的匹配度
子網(wǎng)集合與任務(wù)需求的匹配度TND(Gsub)k是指多智能體子網(wǎng)集合(Gsub)k滿足任務(wù)集合A(k)中任務(wù)需求的程度。其中,任務(wù)akj需要ankj個智能體協(xié)同完成,執(zhí)行該任務(wù)的多智能體子網(wǎng)(Gsub)kj中智能體數(shù)量為|Vkj|,任務(wù)需求和子網(wǎng)的匹配度為TND(Gsub)k,如式(12)所示。同時,子網(wǎng)集合應(yīng)可執(zhí)行該任務(wù),如式(13)所示。
當(dāng)多智能體子網(wǎng)集合(Gsub)k執(zhí)行任務(wù)集合A(k)中所有任務(wù)時,任務(wù)需求和子網(wǎng)集合的匹配度為TND(Gsub)k,如式(14)所示。
3.2.2 子網(wǎng)集合的穩(wěn)定性
子網(wǎng)的穩(wěn)定性NS(Gsub)k是指多智能體網(wǎng)絡(luò)中連通邊有一定的概率被破壞,在這種情況下子網(wǎng)集合執(zhí)行任務(wù)的情況。多智能體網(wǎng)絡(luò)中子網(wǎng)執(zhí)行任務(wù)時,如果某條連通邊因障礙物或網(wǎng)絡(luò)傳輸?shù)仍虮黄茐?,可能無法維持原有的任務(wù)完成效率。當(dāng)智能體vi1和vi2之間的連通邊ei1,i2(ti1,i2,ti1,i2)被破壞,子網(wǎng)(Gei1,i2sub)kj是否能執(zhí)行任務(wù)akj用T(Gei1,i2sub)kj表示,通過式(10)判定子網(wǎng)是否能執(zhí)行任務(wù)。
多智能體網(wǎng)絡(luò)中任意連通邊有一定概率pd被破壞,在這種情況下,多智能體子網(wǎng)集合(Gsub)k執(zhí)行任務(wù)時的網(wǎng)絡(luò)穩(wěn)定性用NS(Gsub)k表示,如式(15)所示。其中,需要利用多智能體網(wǎng)絡(luò)的連通矩陣Cglobal(k),統(tǒng)計多智能體網(wǎng)絡(luò)中連通邊的數(shù)量Enk,如式(16)所示。
3.2.3 子網(wǎng)集合中智能體的負(fù)載
子網(wǎng)集合中智能體的負(fù)載NL(Gsub)k是指智能體所在子網(wǎng)的數(shù)量。如果一個智能體參與過多任務(wù),該智能體需要傳輸大量數(shù)據(jù),將難以維持任務(wù)完成質(zhì)量,因此規(guī)定智能體的最大負(fù)載為Lmax。利用子網(wǎng)集合(Gsub)k計算智能體vi的負(fù)載L(Gsub)ki,進(jìn)而統(tǒng)計符合負(fù)載要求的智能體的比例NL(Gsub)k,如式(17)所示。
4 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動策略
4.1 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動優(yōu)化模型
本文對智能體的移動過程進(jìn)行建模,在智能體移動距離和多智能體網(wǎng)絡(luò)連通質(zhì)量的約束下最大化任務(wù)完成率。
本文用最優(yōu)的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量。具體地,在當(dāng)前智能體移動狀態(tài)Sk下,有多種子網(wǎng)集合的選擇方式,通過評估每種智能體子網(wǎng)集合的連通質(zhì)量求解連通質(zhì)量最優(yōu)的子網(wǎng)集合(Gsub)k。用該子網(wǎng)集合的連通質(zhì)量Q(Gsub)k表示多智能體網(wǎng)絡(luò)連通質(zhì)量Q(Gk)。
為執(zhí)行任務(wù)A(k),智能體的移動狀態(tài)從Sk-1調(diào)整為Sk的移動距離集合為D(Sk)={d(Sk)1,d(Sk)2,…,d(Sk)N}。在智能體的移動狀態(tài)Sk下,從多智能體網(wǎng)絡(luò)Gk中選擇連通質(zhì)量最優(yōu)的多智能體子網(wǎng)集合(Gsub)k來完成任務(wù),利用式(14)計算該子網(wǎng)集合和任務(wù)需求的匹配度TND(Gsub)k,即當(dāng)前狀態(tài)下多智能體的任務(wù)完成率TCR(Sk)。
多智能體移動優(yōu)化模型的優(yōu)化目標(biāo)是最大化任務(wù)完成率,得到最優(yōu)的多智能體移動策略。在智能體移動距離和網(wǎng)絡(luò)連通質(zhì)量的約束下求解任務(wù)完成率最優(yōu)的多智能體移動狀態(tài)(Sk),優(yōu)化目標(biāo)如下:
其中:約束式(20)表示智能體的最大移動距離為dmax,約束式(21)表示多智能體網(wǎng)絡(luò)連通質(zhì)量的閾值為Qthreshold,通過控制網(wǎng)絡(luò)連通質(zhì)量以保證任務(wù)完成質(zhì)量。
4.2 基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動優(yōu)化模型求解
為保證任務(wù)完成效率和質(zhì)量,獲得網(wǎng)絡(luò)連通質(zhì)量控制下任務(wù)完成率最優(yōu)的多智能體移動狀態(tài),本文設(shè)計了基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動優(yōu)化模型,采用能處理高復(fù)雜度組合問題的模擬退火算法求解。在求解過程中,為獲取多智能體網(wǎng)絡(luò)連通質(zhì)量,采用遺傳算法求解。
a)多智能體移動狀態(tài)編碼。采用實數(shù)編碼的方式對多智能體移動狀態(tài)編碼,將調(diào)整前多智能體移動狀態(tài)Sk-1編碼為Y(Sk-1),調(diào)整后多智能體移動狀態(tài)編碼為Y,狀態(tài)由移動軌跡圓心和移動相位組成,編碼的長度為3N,編碼方式為Y={(ok1(x),ok1(y),ωk1),…,(okN(x),okN(y),ωkN)}。具體如算法2所示。
b)初始化解狀態(tài)。為了加快收斂并提高算法效率,優(yōu)先選擇領(lǐng)隊智能體集合并固定領(lǐng)隊的圓心位置,在此基礎(chǔ)上形成多智能體的移動狀態(tài)。
c)計算多智能體網(wǎng)絡(luò)連通質(zhì)量。為篩選符合約束條件的解狀態(tài),需要求解當(dāng)前多智能體移動狀態(tài)下連通質(zhì)量最優(yōu)的子網(wǎng)集合和對應(yīng)連通質(zhì)量,即網(wǎng)絡(luò)連通質(zhì)量。詳細(xì)過程如算法1所示。
(a)子網(wǎng)集合編碼。采用0-1編碼的矩陣表示多智能體子網(wǎng)集合執(zhí)行任務(wù)的情況,矩陣X的行和列分別對應(yīng)N個智能體和M個任務(wù),矩陣中元素Xi,j為0或1。在矩陣X的第j列中,元素值為1的智能體的集合是執(zhí)行任務(wù)akj的多智能體子網(wǎng)。
(b)初始化種群。初始化種群是在搜索開始時生成一組染色體,種群規(guī)模為Popsize,其中染色體為X1~XPopsize。為執(zhí)行任務(wù)akj,根據(jù)當(dāng)前多智能體移動狀態(tài)Y分析網(wǎng)絡(luò)連通性,從領(lǐng)隊智能體leaderkj連通的智能體中,選擇追隨者智能體集合組成子網(wǎng)(Gsub)kj,進(jìn)而得到執(zhí)行任務(wù)A(k)的子網(wǎng)集合(Gsub)k,子網(wǎng)集合(Gsub)k編碼后即為一條染色體Xps。
(c)適應(yīng)度函數(shù)。分析染色體Xps的連通質(zhì)量,網(wǎng)絡(luò)連通質(zhì)量越大,適應(yīng)度越好。因此染色體Xps的適應(yīng)度函數(shù)計算為
算法1 網(wǎng)絡(luò)連通質(zhì)量求解算法
輸入:多智能體移動狀態(tài)集合Y。
輸出:當(dāng)前狀態(tài)下,最優(yōu)子網(wǎng)集合X,網(wǎng)絡(luò)連通質(zhì)量F1(X)。
1 初始化種群,產(chǎn)生滿足約束條件的染色體X1~XPopsize;
2 初始化迭代次數(shù),令iter=0;
3 根據(jù)式(23)計算種群中染色體的適應(yīng)度;
4 更新當(dāng)前最優(yōu)個體X;
5 采用輪盤賭方法選擇適應(yīng)度高的染色體;
6 對選擇的染色體進(jìn)行交叉操作;
7 對選擇的染色體進(jìn)行變異操作,即個體中的值有一定概率發(fā)生突變;
8 令iter=iter+1,達(dá)到閾值停止迭代,否則跳到步驟1;
9 輸出最優(yōu)子網(wǎng)集合X和對應(yīng)連通質(zhì)量,即網(wǎng)絡(luò)連通質(zhì)量F1(X)。
d)目標(biāo)函數(shù)。在求解最優(yōu)多智能體移動狀態(tài)的過程中,關(guān)注多智能體的任務(wù)完成率,計算最優(yōu)子網(wǎng)集合的任務(wù)完成率。為評價新解和當(dāng)前解的優(yōu)劣,設(shè)計目標(biāo)函數(shù)F2(Y),目標(biāo)函數(shù)計算為
算法2 多智能體移動優(yōu)化算法
輸入:任務(wù)集合A(k),調(diào)整前多智能體移動狀態(tài)集合Y(Sk-1)。
輸出:調(diào)整后最優(yōu)多智能體移動狀態(tài)集合Y。
1 根據(jù)式(7)選擇領(lǐng)隊智能體集合Leaderk,確定其調(diào)整后軌跡圓心;
2 初始化迭代溫度temp=temp(0),根據(jù)算法1計算網(wǎng)絡(luò)連通質(zhì)量,初始化滿足約束式(20)和(21)的解狀態(tài)Y;
3 初始化迭代次數(shù),令iter_temp=0;
4 對當(dāng)前解Y中部分元素進(jìn)行突變或交換,產(chǎn)生滿足約束式(20)和(21)的新解Y′,解的變換范圍滿足多智能體移動狀態(tài)的約束;
5 根據(jù)式(24)中目標(biāo)函數(shù)計算新解的增量ΔF2=F2(Y)-F2(Y′ );
6 若ΔF2<0,接受Y′ 作為新的當(dāng)前解,否則以exp{-ΔF2/temp}的概率接受新的當(dāng)前解;
7 令iter_temp=iter_temp+1,達(dá)到閾值停止迭代,否則跳到步驟1;
8 更新溫度,令溫度按照一定的比例逐漸減少,temp=temp·;
9 輸出最優(yōu)解Y。
在算法1中,計算染色體適應(yīng)度函數(shù)的時間復(fù)雜度為O(N2M),求解網(wǎng)絡(luò)連通質(zhì)量的時間復(fù)雜度為O(N2M·Popsize)。其中,迭代次數(shù)iter為常數(shù)。在算法2中,選擇領(lǐng)隊智能體集合的時間復(fù)雜度為O(NM),計算目標(biāo)函數(shù)的時間復(fù)雜度為O(N+M),求解最優(yōu)多智能體移動狀態(tài)集合的時間復(fù)雜度為O(N2M·Popsize·iter_temp)。其中,溫度temp更新到閾值的迭代次數(shù)為iter_temp,內(nèi)循環(huán)迭代次數(shù)iter_temp為常數(shù)。
5 實驗分析
本文通過上述基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動策略實現(xiàn)基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。為評價本文方法,在Python中對相關(guān)方法進(jìn)行實驗仿真,相關(guān)參數(shù)如表2所示。
5.1 對比方法和實驗指標(biāo)
本節(jié)將本文方法與現(xiàn)有的兩種方法進(jìn)行對比并進(jìn)行實驗仿真。其中,方法1是文獻(xiàn)[9]采用多智能體保持持續(xù)連通以執(zhí)行任務(wù)的方法,方法2是文獻(xiàn)[15]利用多智能體的間歇連通以執(zhí)行任務(wù)的方法。為了分析網(wǎng)絡(luò)連通質(zhì)量控制對本文方法的影響,將對比不考慮網(wǎng)絡(luò)連通質(zhì)量控制的多智能體周期性間歇連通執(zhí)行任務(wù)的情況,即方法3。
為了設(shè)置本文方法中網(wǎng)絡(luò)連通質(zhì)量的閾值,對比不同閾值下任務(wù)數(shù)量的變化對任務(wù)完成率的影響;為了驗證本文方法的有效性,從任務(wù)完成率、網(wǎng)絡(luò)連通質(zhì)量和多智能體移動效用三項指標(biāo)對本文方法和對比方法進(jìn)行評價,分析任務(wù)數(shù)量對實驗指標(biāo)的影響。具體地,任務(wù)完成率是指多智能體組成網(wǎng)絡(luò)完成任務(wù)的程度,通過最優(yōu)子網(wǎng)集合中智能體的數(shù)量除以任務(wù)需求得出;網(wǎng)絡(luò)連通質(zhì)量綜合分析多智能體組成網(wǎng)絡(luò)執(zhí)行任務(wù)的情況,通過結(jié)合子網(wǎng)集合與任務(wù)需求的匹配度、子網(wǎng)集合的穩(wěn)定性和子網(wǎng)集合中智能體的負(fù)載得出;智能體移動效用是指智能體移動一個單位距離得到的任務(wù)完成率,通過任務(wù)完成率除以平均每個智能體移動距離得出。
5.2 實驗結(jié)果分析
5.2.1 網(wǎng)絡(luò)連通質(zhì)量閾值分析
通過控制網(wǎng)絡(luò)連通質(zhì)量以提高任務(wù)完成質(zhì)量,網(wǎng)絡(luò)連通質(zhì)量閾值對任務(wù)完成率的影響如圖5所示。在實驗中,設(shè)置不同的網(wǎng)絡(luò)連通質(zhì)量閾值(即Q= 0.1、0.2、0.3、0.4、0.5、0.6)分別分析任務(wù)完成率,最終設(shè)置網(wǎng)絡(luò)連通質(zhì)量的閾值為0.6。
如圖5所示,隨著任務(wù)數(shù)量的增加,任務(wù)對智能體的需求增加,多智能體的任務(wù)完成率隨之降低。網(wǎng)絡(luò)連通質(zhì)量的閾值越高,多智能體網(wǎng)絡(luò)與任務(wù)需求的匹配度越高,任務(wù)完成率越高。當(dāng)Q=0.1時,難以對多智能體網(wǎng)絡(luò)產(chǎn)生有效約束,因此任務(wù)完成率較低;當(dāng)Q=0.2、0.3、0.4、0.5時,多智能體通過移動達(dá)到連通質(zhì)量的閾值較為容易,因此任務(wù)完成率相近,使多智能體網(wǎng)絡(luò)性能的控制提高不明顯;當(dāng)Q=0.6時,任務(wù)完成率有所提高。過低的網(wǎng)絡(luò)連通質(zhì)量使多智能體網(wǎng)絡(luò)的連通性無法滿足任務(wù)需求,任務(wù)完成率低;過高的網(wǎng)絡(luò)連通質(zhì)量要求多智能體網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定,即智能體相對聚集執(zhí)行任務(wù),同時要求多智能體網(wǎng)絡(luò)滿足任務(wù)需求,但環(huán)境中智能體數(shù)量固定,而智能體聚集導(dǎo)致分散的任務(wù)無法執(zhí)行。因此,網(wǎng)絡(luò)連通質(zhì)量的閾值在達(dá)到0.6后難以提高。
5.2.2 不同方法的任務(wù)完成率
本文方法與三種對比方法的任務(wù)完成率如圖6所示。隨著任務(wù)數(shù)量增加,任務(wù)所在范圍更廣、對智能體的需求更大,使各方法的任務(wù)完成率逐步下降。由圖6可知,本文方法的任務(wù)完成率略低于方法1的任務(wù)完成率,因為相比于本文方法,方法1的網(wǎng)絡(luò)連通性約束更強(qiáng),智能體在較大的范圍內(nèi)保持連通,更容易滿足任務(wù)需求;在方法2中,多智能體之間間歇連通,任務(wù)數(shù)量少時智能體靈活移動以獲得較高任務(wù)完成率,隨著任務(wù)數(shù)量增加,智能體無法組成滿足任務(wù)需求的多智能體網(wǎng)絡(luò),使任務(wù)完成率下降明顯;本文方法和方法3均為周期性間歇連通網(wǎng)絡(luò),任務(wù)完成率的降低趨勢相似。該網(wǎng)絡(luò)擴(kuò)展多智能體連通范圍,因此相較于方法2,本文方法和方法3的任務(wù)完成率下降趨勢平緩,但方法3沒有控制網(wǎng)絡(luò)連通質(zhì)量,難以高效匹配多智能體網(wǎng)絡(luò)和任務(wù)需求,導(dǎo)致無法提高任務(wù)完成率。
5.2.3 不同方法的網(wǎng)絡(luò)連通質(zhì)量
本文算法與三種對比方法的網(wǎng)絡(luò)連通質(zhì)量如圖7所示。在任務(wù)數(shù)量較少時,網(wǎng)絡(luò)連通質(zhì)量均大于0.6,隨著任務(wù)數(shù)量的增加,多智能體網(wǎng)絡(luò)難以在滿足任務(wù)需求的同時維持較高的網(wǎng)絡(luò)性能,因此本文算法和三種對比方法的網(wǎng)絡(luò)連通質(zhì)量不斷降低。由于本文方法設(shè)置網(wǎng)絡(luò)連通質(zhì)量的閾值為0.6,當(dāng)任務(wù)數(shù)量增加時,本文方法的網(wǎng)絡(luò)連通質(zhì)量下降后趨于平穩(wěn),實驗效果優(yōu)于對比方法。
在未控制網(wǎng)絡(luò)連通質(zhì)量時,隨著任務(wù)數(shù)量的增加,網(wǎng)絡(luò)逐漸難以滿足任務(wù)需求,網(wǎng)絡(luò)的穩(wěn)定性下降。方法1中多智能體保持持續(xù)連通,當(dāng)任務(wù)數(shù)量達(dá)到25時,多智能體網(wǎng)絡(luò)的穩(wěn)定性變化不明顯,智能體分布范圍相對變大,多智能體的負(fù)載更均衡,網(wǎng)絡(luò)連通質(zhì)量維持在0.45左右;方法2中多智能體之間間歇連通,當(dāng)任務(wù)數(shù)量達(dá)到20時,網(wǎng)絡(luò)穩(wěn)定性不再明顯降低,相較于方法1,該方法的網(wǎng)絡(luò)穩(wěn)定性和任務(wù)完成率更低,網(wǎng)絡(luò)連通質(zhì)量維持在0.35左右;方法3中的多智能體周期性間歇連通,隨著任務(wù)數(shù)量增加,多智能體網(wǎng)絡(luò)可以維持一定的穩(wěn)定性,但相較于持續(xù)連通網(wǎng)絡(luò)仍有一定劣勢,最終網(wǎng)絡(luò)連通質(zhì)量逐漸穩(wěn)定在0.4左右。
5.2.4 不同方法的智能體移動效用
本文算法與三種對比方法的智能體移動效用如圖8所示。由圖8可知,隨著任務(wù)數(shù)量的增加,本文方法的智能體移動效用實驗效果優(yōu)于對比方法。
在任務(wù)數(shù)量小于15時,本文方法和方法1、3中的網(wǎng)絡(luò)具有一定的連通性,隨著任務(wù)數(shù)量的增加,智能體移動相同距離可以執(zhí)行更多的任務(wù),從而使智能體移動效用增加;在任務(wù)數(shù)量大于15時,任務(wù)數(shù)量的增加導(dǎo)致任務(wù)完成率下降,智能體移動效用隨之下降。相比于方法1,本文方法移動更少的距離就可以組成子網(wǎng)執(zhí)行任務(wù),因此本文方法的智能體移動效用略高;而在方法3中,初始任務(wù)完成率較低,導(dǎo)致初始移動效用較低;在方法2中,任務(wù)數(shù)量較少時智能體移動效用達(dá)到了0.9,隨著任務(wù)數(shù)量的增加,移動效用不斷下降。由于間歇連通的智能體移動靈活且沒有連通性約束,在任務(wù)數(shù)量少時,靈活組網(wǎng)即可滿足任務(wù)需求,所以相較于本文方法有較高移動效用,但隨著任務(wù)數(shù)量增加,多智能體為了滿足任務(wù)需求產(chǎn)生較大移動成本,且因無連通性約束,多智能體移動后組網(wǎng)的效率降低,所以智能體移動效用降低。
6 結(jié)束語
為了保證任務(wù)完成效率和質(zhì)量,匹配多智能體局部網(wǎng)絡(luò)質(zhì)量和區(qū)域性任務(wù)需求,本文提出了一種基于任務(wù)需求匹配的網(wǎng)絡(luò)連通質(zhì)量控制方法。通過分析周期性間歇連通多智能體網(wǎng)絡(luò)的連通性,構(gòu)建基于主從模式的多智能體子網(wǎng)集合,進(jìn)而基于任務(wù)需求匹配評估子網(wǎng)集合的連通質(zhì)量。用最大的子網(wǎng)集合連通質(zhì)量表示多智能體網(wǎng)絡(luò)連通質(zhì)量,提出了基于網(wǎng)絡(luò)連通質(zhì)量控制的多智能體移動策略。實驗結(jié)果表明,本文方法有效保障了網(wǎng)絡(luò)連通質(zhì)量,維持了任務(wù)完成率,提高了智能體移動效用。在未來的工作中,將考慮分布式的多智能體組網(wǎng)方式,在動態(tài)變化的任務(wù)環(huán)境中使多智能體自適應(yīng)地組成子網(wǎng)以執(zhí)行任務(wù)。除此之外,為了對多智能體網(wǎng)絡(luò)連通質(zhì)量進(jìn)行更為準(zhǔn)確和全面的分析,還將考慮網(wǎng)絡(luò)異常流量[22]、網(wǎng)絡(luò)擁塞等其他因素對網(wǎng)絡(luò)連通質(zhì)量的影響。
參考文獻(xiàn):
[1]Basak A,Zaroukian E G,Corder K,et al.Utility of doctrine with multi-agent RL for military engagements[C]//Proc of Artificial Intelligence and Machine Learning for Multi-Domain Operations Applications IV.2022:1211323.
[2]Babic' A,Loncˇar I,Arbanas B,et al.A novel paradigm for underwater monitoring using mobile sensor networks[J].Sensors,2020,20(16):4615.
[3]Wang Yanan,Xu Tong,Niu Xin,et al.STMARL:a spatio-temporal multi-agent reinforcement learning approach for cooperative traffic light control[J].IEEE Trans on Mobile Computing,2022,21(6):2228-2242.
[4]Dornhfer M,Sack S,Zenkert J,et al.Simulation of smart factory processes applying multi-agent-systems:a knowledge management perspective[J].Journal of Manufacturing and Materials Processing,2020,4(3):89.
[5]Peng Zhouhua,Wang Dan,Li Tieshan,et al.Output-feedback cooperative formation maneuvering of autonomous surface vehicles with connectivity preservation and collision avoidance[J].IEEE Trans on Cybernetics,2020,50(6):2527-2535.
[6]Gu Nan,Wang Dan,Peng Zhouhua,et al.Observer-based finite-time control for distributed path maneuvering of underactuated unmanned surface vehicles with collision avoidance and connectivity preservation[J].IEEE Trans on Systems,Man,and Cybernetics:Systems,2021,51(8):5105-5115.
[7]Boldrer M,Bevilacqua P,Palopoli L,et al.Graph connectivity control of a mobile robot network with mixed dynamic multi-tasks[J].IEEE Robotics and Automation Letters,2021,6(2):1934-1941.
[8]Meng Shaofeng,Kan Zhen.Deep reinforcement learning-based effective coverage control with connectivity constraints[J].IEEE Control Systems Letters,2022,6:283-288.
[9]Afonso R J M,Maximo M R O A,Galvo R K H.Task allocation and trajectory planning for multiple agents in the presence of obstacle and connectivity constraints with mixed-integer linear programming[J].International Journal of Robust and Nonlinear Control,2020,30(14):5464-5491.
[10]Parasuraman R,Kim J,Luo Shaocheng,et al.Multipoint rendezvous in multirobot systems[J].IEEE Trans on Cybernetics,2020,50(1):310-323.
[11]Wang Cong,Liu Chenglin,Liu Shuai.Robust fixed-time connectivity-preserving consensus for second-order multi-agent systems with external disturbances[J].IET Control Theory & Applications,2020,14(17):2674-2681.
[12]Shang Yilun.Resilient consensus for robust multiplex networks with asymmetric confidence intervals[J].IEEE Trans on Network Science and Engineering,2021,8(1):65-74.
[13]Chapnevis A,Güven I,Njilla L,et al.Collaborative trajectory optimization for outage-aware cellular-enabled UAVs[C]//Proc of the 93rd IEEE Vehicular Technology Conference.Piscataway,NJ:IEEE Press,2021:1-6.
[14]Liu Zhiyu,Wu Bo,Dai Jin,et al.Distributed communication-aware motion planning for networked mobile robots under formal specifications[J].IEEE Trans on Control of Network Systems,2020,7(4):1801-1811.
[15]Dong He,Wu Nan,F(xiàn)eng Guangsheng,et al.Research on computing task allocation method based on multi-UAVs collaboration[C]//Proc of IEEE International Conference on Smart Internet of Things.Pisca-taway,NJ:IEEE Press,2020:86-93.
[16]Yu Xi,Saldaa D,Shishika D,et al.Resilient consensus in robot swarms with periodic motion and intermittent communication[J].IEEE Trans on Robotics,2021,38(1):110-125.
[17]Wei Cong,Yu Xi,Tanner H G,et al.Synchronous rendezvous for networks of active drifters in gyre flows[C]//Proc of the 14th International Symposium on Distributed Autonomous Robotic Systems.Cham:Springer,2019:413-425.
[18]Yu Xi,Hsieh M A.Synthesis of a time-varying communication network by robot teams with information propagation guarantees[J].IEEE Robotics and Automation Letters,2020,5(2):1413-1420.
[19]Piltyay S,Bulashenko A,Demchenko I.Wireless sensor network connectivity in heterogeneous 5G mobile systems[C]//Proc of IEEE International Conference on Problems of Infocommunications:Science and Technology.Piscataway,NJ:IEEE Press,2020:625-630.
[20]Wang Shaoqing,Yu Jiguo,Atiquzzaman M,et al.CRPD:a novel clustering routing protocol for dynamic wireless sensor networks[J].Personal and Ubiquitous Computing,2018,22(3):545-559.
[21]劉英杰,劉士虎,徐偉華.基于有效路徑拓?fù)浞€(wěn)定性的鏈路預(yù)測方法[J].計算機(jī)應(yīng)用研究,2022,39(1):90-95.(Liu Yingjie,Liu Shihu,Xu Weihua.Link prediction method based on topology stability of effective path[J].Application Research of Computers,2022,39(1):90-95.)
[22]Xia Yuanjun,Dong Shi,Peng Tao, et al.Wireless network abnormal traffic detection method based on deep transfer reinforcement learning[C]//Proc of the 17th International Conference on Mobility,Sensing and Networking.Piscataway,NJ:IEEE Press,2021:528-535.
收稿日期:2023-02-12;修回日期:2023-04-11基金項目:國家自然科學(xué)基金資助項目(61602305,61802257);上海市自然科學(xué)基金資助項目(18ZR1426000,19ZR1477600);南通市科技局社會民生計劃資助項目(MS12021060);浦東新區(qū)科技發(fā)展基金產(chǎn)學(xué)研專項資助項目(PKX2021-D10);敏捷智能計算四川省重點實驗室開放式基金資助項目
作者簡介:何杏宇(1984-),女,湖南岳陽人,副教授,碩導(dǎo),博士,主要研究方向為物聯(lián)網(wǎng)和移動群智計算;王怡(1996-),女,湖北十堰人,碩士研究生,主要研究方向為無人自主系統(tǒng)和群智計算;楊桂松(1982-),男(通信作者),河南漯河人,副教授,碩導(dǎo),博士,主要研究方向為物聯(lián)網(wǎng)與普適計算等(gsyang@ usst.edu.cn);賈明權(quán)(1982-),男,四川合江人,高級工程師,博士,主要研究方向為先進(jìn)智能計算;周玥(1999-),男,山東菏澤人,本科生,主要研究方向為無人自主系統(tǒng);徐心玥(2001-),男,上海人,本科生,主要研究方向為無人自主系統(tǒng).