趙 丹 溫廣輝
隨著萬物互聯(lián)時(shí)代的到來,以無中心、分權(quán)化為特點(diǎn)的多智能體分布式協(xié)同控制展現(xiàn)出強(qiáng)大的群體智能特性,因而成為現(xiàn)代工程系統(tǒng)的重要構(gòu)成方式[1].現(xiàn)代工程系統(tǒng)的規(guī)模逐漸擴(kuò)大,運(yùn)行環(huán)境極其復(fù)雜,面臨著高動(dòng)態(tài)、不確定性、惡劣環(huán)境、強(qiáng)電磁干擾等各種威脅.2019 年6 月,伊朗擊落美軍全球鷹無人機(jī)事件表明,利用電磁干擾可以造成無人機(jī)的通信中斷、控制失靈,甚至被擊落[2].因此,研究多智能體系統(tǒng)安全協(xié)同控制問題,快速準(zhǔn)確隔離攻擊的影響,提出彈性控制方案,提高多智能體系統(tǒng)在復(fù)雜環(huán)境中的生存能力和魯棒性,對多智能體系統(tǒng)在社會(huì)生產(chǎn)生活中的深入應(yīng)用具有重要意義[3-4].
攻擊檢測與隔離可以實(shí)現(xiàn)攻擊的預(yù)警與定位,是管控多智能體系統(tǒng)安全風(fēng)險(xiǎn)的重要環(huán)節(jié).利用觀測器對系統(tǒng)狀態(tài)進(jìn)行估計(jì),并與實(shí)際系統(tǒng)的運(yùn)行情況進(jìn)行對比,得到比較殘差,當(dāng)其超過一定閾值時(shí),則可預(yù)警攻擊的發(fā)生.卡爾曼濾波器、龍伯格觀測器、未知輸入觀測器、滑模觀測器、神經(jīng)網(wǎng)絡(luò)觀測器等已經(jīng)在多智能體系統(tǒng)的攻擊檢測中得到深入應(yīng)用[5-9].考慮到系統(tǒng)運(yùn)行過程中,僅測量輸出信息可以被獲取,因而提出了基于相對輸出測量的觀測器設(shè)計(jì)方法[10].當(dāng)多智能體系統(tǒng)中有多個(gè)個(gè)體遭受攻擊時(shí),則需要在攻擊檢測的基礎(chǔ)上進(jìn)行攻擊隔離與識(shí)別,進(jìn)一步找出具體遭受攻擊的個(gè)體.研究學(xué)者借助模型預(yù)測控制方法主動(dòng)調(diào)整控制輸入以隔離遭受攻擊的子系統(tǒng)[11].另一方面,有學(xué)者將攻擊隔離問題轉(zhuǎn)化為棧向量l0范數(shù)的最小化問題,通過枚舉法搜索所有可能的攻擊集合,從而完成攻擊隔離[12].可以利用壓縮感知方法將攻擊隔離轉(zhuǎn)化為凸優(yōu)化問題進(jìn)行求解[13].上述兩種算法的復(fù)雜度較高,文獻(xiàn)[14]采用分而治之的思想,通過分布式未知輸入觀測器和限定通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的方式完成攻擊隔離.
在黑客技術(shù)高度發(fā)達(dá)的今天,攻擊可能導(dǎo)致系統(tǒng)中的某些個(gè)體被“策反”,則應(yīng)盡可能確保正常個(gè)體不受攻擊的影響,以降級(jí)運(yùn)行方式完成既定協(xié)同控制任務(wù)[15].在僅知道系統(tǒng)中遭受攻擊個(gè)體最大數(shù)量的基礎(chǔ)上,文獻(xiàn)[15]提出了平均序列刪減(mean-subsequence-reduced,MSR) 算法,正常個(gè)體通過刪除所有極值鄰居的方式排除攻擊對其造成的影響,從而實(shí)現(xiàn)彈性協(xié)同.這種控制方式對系統(tǒng)通信拓?fù)涞倪B通冗余性要求較高,文獻(xiàn)[15]提出了圖的魯棒性概念來描述這種控制方式對通信拓?fù)浣Y(jié)構(gòu)的要求.隨后,文獻(xiàn)[16]引入可信節(jié)點(diǎn),并提出了圖的強(qiáng)魯棒性概念來降低系統(tǒng)對圖的要求.同時(shí),考慮到個(gè)體的計(jì)算能力和通信帶寬有限,研究學(xué)者通過提出事件驅(qū)動(dòng)的量化彈性控制算法來提高控制策略的實(shí)用性[17-18].此外,復(fù)雜戰(zhàn)場環(huán)境無法確保無人集群的穩(wěn)定通信,文獻(xiàn)[19]提出了圖的聯(lián)合魯棒性概念,來應(yīng)對時(shí)變通信情況下的彈性控制問題.值得注意的是,上述控制算法將鄰居的狀態(tài)信息作為刪除的指標(biāo),因此,只適用于積分器型的系統(tǒng).實(shí)際應(yīng)用中,多智能體系統(tǒng)的模型復(fù)雜,因此,需要進(jìn)行必要的改進(jìn).
對于一般多智能體系統(tǒng)模型,文獻(xiàn)[20]利用基于相對輸出測量的觀測器方法進(jìn)行攻擊檢測,使得某一智能體遭受的壞數(shù)據(jù)注入攻擊可以同時(shí)反映在其自身和鄰居的殘差上,并提出圖的可隔離性概念實(shí)現(xiàn)攻擊的零漏報(bào)和零誤報(bào).文獻(xiàn)[21]進(jìn)一步提出了隱蔽攻擊下的彈性穩(wěn)定控制算法.文獻(xiàn)[22]將上述攻擊檢測算法應(yīng)用到通信鏈路遭受攻擊情形下的彈性控制問題中.文獻(xiàn)[23]考慮智能化壞數(shù)據(jù)注入攻擊相互合謀的情況,在攻擊合謀能力不受任何約束的前提下解決了合謀攻擊的零漏報(bào)問題.
本文在攻擊的合謀能力受限的情況下,擬對MSR 類算法進(jìn)行改進(jìn),設(shè)計(jì)基于觀測器的攻擊檢測與隔離算法,使得系統(tǒng)更新過程中僅刪除已隔離鄰居的信息,并探討通信拓?fù)浣Y(jié)構(gòu)與零漏報(bào)攻擊隔離和彈性協(xié)同控制之間的關(guān)系,為構(gòu)建高彈性強(qiáng)抗毀的多智能體系統(tǒng)提供技術(shù)支持.相比于現(xiàn)有的研究成果,創(chuàng)新性總結(jié)如下: 1)文獻(xiàn)[15-19]提出的MSR類算法只適用于積分器型的系統(tǒng),本文所提出的基于攻擊隔離的彈性控制算法適用于一般高階系統(tǒng),具有更廣的適用范圍.2)文獻(xiàn)[23]未考慮攻擊合謀能力的約束,本文在攻擊局部合謀的前提下,降低了攻擊隔離算法所需的拓?fù)錀l件.
考慮由N 個(gè)智能體組成的多智能體系統(tǒng),其通信網(wǎng)絡(luò)結(jié)構(gòu)用無向圖G=(V,E)來描述,其中,V={1,2,…,N} 和E?V×V 分別表示智能體及其連邊的集合.如果存在連邊(i,j)∈E,則表示智能體i 和j 之間可以相互通信.圖G 的鄰接矩陣定義為A,其中,如果(i,j)∈E,則有aij>0,否則,aij=0.智能體i 的鄰居集合表示為,其中,分別為智能體的鄰居.智能體i 的內(nèi)鄰居集合表示為Ji={i}∪{Ni}.如果圖G 中任意兩個(gè)智能體之間均有一條連邊,則稱其是連通的.在圖G 中,環(huán)指的是開始和結(jié)束于同一智能體的封閉路徑,并用Ck表示由k 個(gè)智能體形成的環(huán).
考慮由N 個(gè)智能體組成的多智能體系統(tǒng),借助反饋線性化方法將系統(tǒng)的動(dòng)力學(xué)線性化[24],得到下列模型:
假設(shè)1 系統(tǒng)矩陣(A,B,C)能觀能控.
根據(jù)智能體是否遭受攻擊可以將系統(tǒng)中的智能體V 分為兩個(gè)子集,即正常智能體集合O 和遭受攻擊的智能體集合F,則有O∩F=?和|O|+|F|=N.根據(jù)文獻(xiàn)[15]給出遭受攻擊智能體的數(shù)量模型.
定義1 (F-整體攻擊模型) 如果集合F 中最多包含F(xiàn) 個(gè)智能體,則稱多智能體系統(tǒng)遭受了F-整體攻擊,即|F|≤F.
本文目標(biāo)是設(shè)計(jì)抗合謀攻擊的隔離算法確保隔離遭受攻擊的智能體,并提出基于攻擊隔離的彈性控制算法,使得正常智能體能夠完成協(xié)同一致任務(wù).
為了檢測智能體i 的內(nèi)鄰居Ji中是否存在攻擊,分別定義智能體i 的狀態(tài)一致性誤差為,輸出一致性誤差為,提出如下基于相對輸出信息的有限時(shí)間觀測器:
假設(shè)2 對于兩個(gè)遭受攻擊的智能體i 和j 而言,只有當(dāng)它們之間存在一條遭受攻擊的通路,即存在有限序列(i,i1),(i1,i2),…,(ik,j),m=1,2,…,k,且im∈F 時(shí),二者之間才能進(jìn)行合謀.
定義智能體i 的內(nèi)鄰居Ji的殘差形成的棧向量為,其l0范數(shù)定義為.安全指標(biāo)Si=1 表示智能體i 被隔離為遭受攻擊的智能體,Si=0 表示智能體i正常.智能體i 的信息集定義為,對兩個(gè)智能體i 和j 的信息集來說,若有,則稱.接下來給出抗合謀攻擊的分布式隔離算法,見算法1.
為確保算法1 能夠完成攻擊隔離,回顧文獻(xiàn)[23]中圖的(r,s)-可隔離性定義.
定義2(圖的(r,s)-可隔離性)對于給定的N個(gè)節(jié)點(diǎn)組成的圖G=(V,E),如果下邊3 個(gè)論述同時(shí)成立:
1)圖G 是連通的;
3)圖G 中所有的環(huán)都滿足Ck,k≥s;則稱圖G 是(r,s)-可隔離的.
通過如下引理說明算法1 可以使得每個(gè)智能體以分布式方式得到.
引理1 文獻(xiàn)[25]考慮由N 個(gè)智能體組成的系統(tǒng),其中,智能體i 的動(dòng)力學(xué)描述為:
接下來給出算法1 實(shí)現(xiàn)零漏報(bào)攻擊隔離的充分條件.
(3)相關(guān)配套設(shè)施不夠完善。就當(dāng)前我國畜牧養(yǎng)殖現(xiàn)狀來看,存在很多養(yǎng)殖場地址選擇不當(dāng)、相關(guān)配套設(shè)施不夠健全等問題。在選址的過程中沒能予以實(shí)地考察,這樣的后果就會(huì)直接導(dǎo)致養(yǎng)殖場的周邊環(huán)境惡劣,養(yǎng)殖條件不高,容易滋生細(xì)菌,致使動(dòng)物極易患病。
定理1 對于滿足假設(shè)1-2 的多智能體系統(tǒng)(1),在F -整體攻擊模型下,算法1 完成零漏報(bào)攻擊隔離的充分條件是圖G 是(F,6)-可隔離的.
證明: 文獻(xiàn)[25]的最大一致協(xié)議說明算法1 在(F,6)-可隔離圖中能夠確保每個(gè)智能體以分布式方式得到,保證了算法1 的分布式特性.
情況1) 中所有遭受攻擊智能體的隔離都早于正常智能體j .
圖1 情況1)下正常智能體與遭受攻擊智能體之間的關(guān)系圖Fig.1 The relationship between normal agentand the attacked ones under case 1)
圖2 攻擊在(F,6)-可隔離圖和假設(shè)2 條件下的兩種合謀方式Fig.2 Two kinds of ways of attack collusion under(F,6)-isolable graph and assumption 2 conditions
圖3 情況2)下智能體j 與遭受攻擊智能體之間的關(guān)系圖Fig.3 The relationship between agentand the attacked ones under case 2)
情況3)正常智能體j 與遭受攻擊智能體的關(guān)系與情況2)類似.差別在于,此時(shí),各個(gè)集合之間的關(guān)系如下:
情況3)的分析類似于情況2),此處略去.
所有遭受攻擊智能體的隔離都早于正常智能體.命題得證.
當(dāng)算法1 隔離所有遭受攻擊的智能體后,正常智能體通過斷開與遭受攻擊智能體通信連邊的方式來刪除遭受攻擊鄰居對其產(chǎn)生的影響.正常智能體在斷開與遭受攻擊鄰居的信息交互后,可采用文獻(xiàn)[26]提出的控制協(xié)議,具體如下:
接下來給出算法2 完成彈性一致的充分條件.
定理2 對于滿足假設(shè)1-2 的多智能體系統(tǒng)(1),在F -整體攻擊模型下,算法2 完成彈性一致的條件是下面兩個(gè)論述同時(shí)成立:
1)圖G 是(F,6)-可隔離的.
考慮由14 個(gè)智能體組成的多智能體系統(tǒng),其通信拓?fù)浣Y(jié)構(gòu)如圖4 所示.智能體的系統(tǒng)矩陣描述如下:
圖4 多智能體系統(tǒng)通信拓?fù)浣Y(jié)構(gòu)Fig.4 The communication topology for the multi-agent systems
圖5 智能體的殘差軌跡圖Fig.5 The residual trajectory for each agent
圖6 智能體的安全指標(biāo)圖Fig.6 The safety index for each agent
圖7 智能體的狀態(tài)一致性誤差軌跡圖Fig.7 The state consistency error trajectory for each agent
本文研究了多智能體系統(tǒng)遭受合謀攻擊下的彈性一致性問題.提出了基于分布式有限時(shí)間觀測器的抗合謀攻擊隔離算法,利用已隔離的智能體解耦攻擊間的合謀,并借助圖的隔離性確保攻擊的零漏報(bào).在此基礎(chǔ)上,提出基于攻擊隔離的彈性控制算法,在部分正常智能體被誤隔離的基礎(chǔ)上,實(shí)現(xiàn)所有正常智能體的彈性一致.通過數(shù)值仿真驗(yàn)證了所提算法的正確性.接下來將進(jìn)一步探討圖的可隔離性的等價(jià)條件,擴(kuò)展攻擊隔離算法的適用范圍.