曹 越,王 鵬,齊 薇
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,西安,710077)
近年來(lái),科技的進(jìn)步推動(dòng)了無(wú)人系統(tǒng)(如無(wú)人機(jī)、無(wú)人車、無(wú)人船/艇)迅猛發(fā)展。由多個(gè)無(wú)人系統(tǒng)基于相互間的交互協(xié)同組成一個(gè)編隊(duì)(如無(wú)人機(jī)群[1]、無(wú)人車隊(duì)[2]、無(wú)人船/艇隊(duì)[3]),可以實(shí)現(xiàn)無(wú)人系統(tǒng)執(zhí)行任務(wù)能力的質(zhì)的提升。在多無(wú)人系統(tǒng)執(zhí)行任務(wù)的過(guò)程中,組成指定隊(duì)形來(lái)對(duì)目標(biāo)進(jìn)行跟蹤(即多無(wú)人系統(tǒng)跟蹤與編隊(duì))是一種常見(jiàn)的應(yīng)用形式,已廣泛地體現(xiàn)在軍事和民用等領(lǐng)域(如戰(zhàn)場(chǎng)目標(biāo)偵察打擊、毀傷效果評(píng)估、協(xié)同運(yùn)輸、搜索救援等)中[4]。而相應(yīng)的多無(wú)人系統(tǒng)跟蹤與編隊(duì)問(wèn)題也已成為了當(dāng)前的研究熱點(diǎn),備受國(guó)內(nèi)外研究機(jī)構(gòu)與相關(guān)學(xué)者的重點(diǎn)關(guān)注[5-11]。
目前,針對(duì)多無(wú)人系統(tǒng)的跟蹤與編隊(duì)問(wèn)題,已涌現(xiàn)出了許多成熟的控制方法,也促生了許多新的控制思路及相應(yīng)的控制策略,其中多以分布式控制方式(即將整個(gè)無(wú)人系統(tǒng)的跟蹤與編隊(duì)問(wèn)題分解成由各無(wú)人系統(tǒng)獨(dú)立解決的控制子問(wèn)題)為主[6-8],例如文獻(xiàn)[6]采用的領(lǐng)航者-跟隨者法、文獻(xiàn)[7]利用的李雅普諾夫理論、文獻(xiàn)[8]采用的滑??刂频鹊?。以上方法相對(duì)忽略了無(wú)人系統(tǒng)的一些性能要求,而且無(wú)法解決一些具有物理約束的實(shí)際問(wèn)題。
預(yù)測(cè)控制是一種與上述策略不同的控制方法,其控制輸入一般通過(guò)滾動(dòng)求解一個(gè)涉及未來(lái)輸入、輸出(或狀態(tài)變量)的有限時(shí)域約束優(yōu)化問(wèn)題來(lái)計(jì)算獲得,而通過(guò)在優(yōu)化問(wèn)題中設(shè)計(jì)合適的目標(biāo)代價(jià)函數(shù)來(lái)反映控制性能,并對(duì)未來(lái)輸入、輸出(或狀態(tài)變量)加以約束限制,使得預(yù)測(cè)控制具備了優(yōu)化控制性能與處理物理約束的特殊能力,也因此成為解決多無(wú)人系統(tǒng)跟蹤與編隊(duì)問(wèn)題的一類針對(duì)性方法。目前,針對(duì)無(wú)人系統(tǒng)跟蹤與編隊(duì)問(wèn)題開(kāi)展分布式預(yù)測(cè)控制研究需要重點(diǎn)解決以下難題:首先為各無(wú)人系統(tǒng)構(gòu)造能夠保證其運(yùn)動(dòng)控制穩(wěn)定性的(魯棒)正定不變集,然后在此基礎(chǔ)上設(shè)計(jì)具有遞歸可行性保證的分布式控制實(shí)施算法[7-10]。
針對(duì)多無(wú)人系統(tǒng)跟蹤與編隊(duì)問(wèn)題,現(xiàn)有的分布式預(yù)測(cè)控制研究均需要滿足1個(gè)條件:假設(shè)跟蹤目標(biāo)時(shí)所形成的隊(duì)形與編隊(duì)指定的隊(duì)形一致且不違反無(wú)人系統(tǒng)的物理約束[8-11]。然而,在無(wú)人系統(tǒng)執(zhí)行實(shí)際任務(wù)時(shí),這一前提條件往往不容易滿足(如跟蹤目標(biāo)因約束影響而不可實(shí)現(xiàn)、編隊(duì)因障礙影響而不可保持等)??紤]以上實(shí)際情況,本文借鑒文獻(xiàn)[12]“在跟蹤預(yù)測(cè)控制中引入人工規(guī)劃目標(biāo)”的思路,通過(guò)在目標(biāo)代價(jià)函數(shù)中引入規(guī)劃目標(biāo)的方式,解決了跟蹤與編隊(duì)控制目標(biāo)不一致的問(wèn)題;進(jìn)一步通過(guò)在控制優(yōu)化問(wèn)題中附加規(guī)劃目標(biāo)約束的方式,確保規(guī)劃的目標(biāo)具有可實(shí)現(xiàn)性;最終基于預(yù)測(cè)控制方法為各無(wú)人系統(tǒng)構(gòu)造出具有遞歸可行性保證的控制優(yōu)化問(wèn)題并給出了相應(yīng)的控制實(shí)施算法。
主要符號(hào)
Na多無(wú)人系統(tǒng)中無(wú)人系統(tǒng)的個(gè)數(shù)
Na′ 多無(wú)人系統(tǒng)的指標(biāo)集合,即Na′={1,2,…,Na}
Ni無(wú)人系統(tǒng)i的鄰居集合
Xi無(wú)人系統(tǒng)i的狀態(tài)可容許集合
Ui無(wú)人系統(tǒng)i的控制輸入可容許集合
Rnn維的幾何空間
Rm×nm×n維的實(shí)數(shù)矩陣集合
I適維的單位矩陣
Inn維的單位矩陣
0nn維的零矩陣
01×n1×n維的零向量
x(t|k)k時(shí)刻對(duì)k+t時(shí)刻狀態(tài)x(k+t)的預(yù)測(cè)
N預(yù)測(cè)時(shí)域長(zhǎng)度
N整數(shù)集合{0,1,2,…,N-1}
N+整數(shù)集合{0,1,…,N}
N-整數(shù)集合{1,2,…,N-1}
考慮由Na無(wú)人系統(tǒng)所組成的多無(wú)人系統(tǒng),動(dòng)態(tài)方程為:
xi(k+1)=Aixi(k)+Biui(k),i∈Na′
(1)
式中:xi(k)=[pi(k);vi(k)]∈R2n與ui(k)∈Rm分別為無(wú)人系統(tǒng)i的狀態(tài)與控制輸入;pi(k)∈Rn與vi(k)∈Rn分別為無(wú)人系統(tǒng)i的位置與速度。
在每個(gè)無(wú)人系統(tǒng)的控制過(guò)程中,其狀態(tài)與輸入必須滿足以下約束:
(2)
(3)
注:式(2)與式(3)是狀態(tài)與輸入約束的通用描述形式,選擇狀態(tài)約束參數(shù)Φi,j=[In,0n](或Φi,j=[0n,In])即可描述對(duì)無(wú)人系統(tǒng)i的位置(或速度)約束,而選擇Φi,j=[01×(s-1),1,01×(n-s)]即可描述對(duì)無(wú)人系統(tǒng)i的第s維狀態(tài)約束。選擇類似形式的輸入約束參數(shù)Ψi,l即可對(duì)不同的輸入約束進(jìn)行描述。
被跟蹤目標(biāo)r為一個(gè)虛擬的無(wú)人系統(tǒng),其動(dòng)態(tài)方程為:
xr(k+1)=Arxr(k)+Brur(k)
(4)
式中:xr(k)=[pr(k);vr(k)]∈R2n與ur(k)∈Rm分別為目標(biāo)r的狀態(tài)與控制輸入;pr(k)∈Rn與vr(k)∈Rn分別為目標(biāo)r的位置與速度。
本文旨在控制多無(wú)人系統(tǒng)跟蹤到根據(jù)目標(biāo)r所指定的位置,并形成指定的編隊(duì)隊(duì)形,即:
(5)
(6)
根據(jù)以上指定的控制目標(biāo),可以為各無(wú)人系統(tǒng)i生成目標(biāo)代價(jià)函數(shù):
Ji(xir,uir,xi?,k)=
(7)
注:對(duì)于式(5)與式(6)中所指定的控制目標(biāo),現(xiàn)有研究成果均要求滿足跟蹤與編隊(duì)一致的條件,即
(8)
當(dāng)該條件不滿足時(shí),式(7)中的跟蹤目標(biāo)代價(jià)與編隊(duì)目標(biāo)代價(jià)無(wú)法同時(shí)趨于零,即無(wú)法同時(shí)實(shí)現(xiàn)跟蹤與編隊(duì)。
本文針對(duì)一致性條件(8)不滿足的情況,研究更為通用的跟蹤與編隊(duì)控制算法。
通常,各無(wú)人系統(tǒng)i利用其上一時(shí)刻的真實(shí)預(yù)測(cè)信息來(lái)構(gòu)造當(dāng)前時(shí)刻的假設(shè)預(yù)測(cè)信息,即:
(9)
根據(jù)假設(shè)預(yù)測(cè)狀態(tài)(9),可得相應(yīng)的狀態(tài)編隊(duì)預(yù)測(cè)偏差:
2.1 目標(biāo)代價(jià)函數(shù)重規(guī)劃
在無(wú)人系統(tǒng)執(zhí)行跟蹤與編隊(duì)的實(shí)際任務(wù)時(shí),跟蹤目標(biāo)所形成的隊(duì)形與編隊(duì)指定的隊(duì)形往往存在不一致,為了解決這一問(wèn)題,本文通過(guò)為各無(wú)人系統(tǒng)重新規(guī)劃控制目標(biāo)來(lái)對(duì)目標(biāo)代價(jià)函數(shù)進(jìn)行設(shè)計(jì)。
(10)
(11)
根據(jù)以上所構(gòu)造的目標(biāo)代價(jià)可知,令規(guī)劃目標(biāo)代價(jià)(10)最小,可實(shí)現(xiàn)對(duì)給定跟蹤與編隊(duì)之間的平衡;而令控制目標(biāo)代價(jià)(11)越小,各無(wú)人系統(tǒng)對(duì)規(guī)劃目標(biāo)的收斂性越高。因此,將以上兩項(xiàng)目標(biāo)代價(jià)合并,為各無(wú)人系統(tǒng)設(shè)計(jì)出最終的目標(biāo)代價(jià)函數(shù):
(12)
2.2 規(guī)劃目標(biāo)的約束設(shè)計(jì)
在實(shí)際問(wèn)題中,控制目標(biāo)可能受到環(huán)境、無(wú)人系統(tǒng)性能等因素影響而不可實(shí)現(xiàn),為了保證規(guī)劃控制目標(biāo)的可實(shí)現(xiàn)性,本小節(jié)對(duì)規(guī)劃的控制目標(biāo)進(jìn)行相應(yīng)的約束設(shè)計(jì)。
(13)
(14)
(15)
2.3 無(wú)人系統(tǒng)的終端約束設(shè)計(jì)
根據(jù)預(yù)測(cè)控制的常規(guī)方法,需要為各無(wú)人系統(tǒng)設(shè)計(jì)“三要素”(終端代價(jià)函數(shù)、終端約束集合與終端控制律)[13]。本文借鑒文獻(xiàn)[11]設(shè)計(jì)終端約束的思路為各個(gè)無(wú)人系統(tǒng)i設(shè)計(jì)實(shí)時(shí)的終端約束如下:
(16)
(17)
(18)
(19)
(20)
2.4 控制優(yōu)化問(wèn)題構(gòu)造與控制實(shí)施算法設(shè)計(jì)
對(duì)以上設(shè)計(jì)的代價(jià)函數(shù)與相關(guān)約束進(jìn)行整合,可為各個(gè)無(wú)人系統(tǒng)i構(gòu)造控制優(yōu)化問(wèn)題如下:
(21)
s.t.
xi(0|k)=xi(k)
(22)
xi(t+1|k)=Aixi(t|k)+Biui(t|k),t∈N
(23)
xi(t|k)∈Xi,t∈N-
(24)
ui(t|k)∈Ui,t∈N
(25)
(26)
(27)
(28)
(29)
相應(yīng)的自主式預(yù)測(cè)控制實(shí)施算法設(shè)計(jì)如下:
2.4.1 離線設(shè)置
2.4.2 在線實(shí)施
在每個(gè)在線時(shí)刻k≥0,各無(wú)人系統(tǒng)i執(zhí)行以下步驟:
為了便于對(duì)優(yōu)化問(wèn)題(21)~(29)進(jìn)行求解,本節(jié)給出一系列變換步驟來(lái)將該優(yōu)化問(wèn)題轉(zhuǎn)化成LMI形式,具體步驟如下:
1)應(yīng)用舒爾補(bǔ)引理,預(yù)測(cè)時(shí)域內(nèi)無(wú)人系統(tǒng)i的狀態(tài)約束(24)與輸入約束(25)分別等價(jià)于LMI:
(30)
(31)
2)應(yīng)用舒爾補(bǔ)引理,預(yù)測(cè)時(shí)域內(nèi)規(guī)劃目標(biāo)的狀態(tài)約束(28)與輸入約束(29)分別等價(jià)于LMI:
(32)
(33)
3)終端約束(26)中的約束條件(16)~(19)可分別由以下條件保證:
(34)
(Ai+BiKi(k))TPi(k)(Ai+BiKi(k))-
(35)
(36)
(37)
(38)
(39)
(40)
(41)
4)對(duì)目標(biāo)代價(jià)函數(shù)(21)進(jìn)行拆分,令:
(42)
(43)
(44)
應(yīng)用舒爾補(bǔ)引理,式(42)~(44)可分別等價(jià)于LMI:
(45)
(46)
(47)
其中:
j,…,l∈Ni
將式(34)與(42)~(44)代入目標(biāo)代價(jià)函數(shù)(21),可得其上界:
(48)
5)優(yōu)化問(wèn)題(21)~(29),可等價(jià)地轉(zhuǎn)化為以下LMI形式的優(yōu)化問(wèn)題:
(49)
s.t. (30)~(33),(38)~(41),(45)~(47)
注:約束(22)表示無(wú)人系統(tǒng)i在初始時(shí)刻的預(yù)測(cè)值,無(wú)需轉(zhuǎn)化為L(zhǎng)MI形式;約束(23)與(27)已經(jīng)分別包含在約束(24)與(28)轉(zhuǎn)化為L(zhǎng)MI形式的過(guò)程中,無(wú)需再單獨(dú)轉(zhuǎn)化。
本文通過(guò)一個(gè)仿真實(shí)例來(lái)驗(yàn)證自主式預(yù)測(cè)控制算法的有效性??紤]一個(gè)由3個(gè)無(wú)人系統(tǒng)組成的多無(wú)人系統(tǒng),各個(gè)無(wú)人系統(tǒng)的動(dòng)態(tài)方程為:
i∈Na′
(50)
多無(wú)人系統(tǒng)指定的狀態(tài)跟蹤與編隊(duì)偏差向量為:
給定跟蹤與編隊(duì)的權(quán)重參數(shù)為αi=1、ρi=0.5、βi=0.1,i∈Na′。在控制過(guò)程中,無(wú)人系統(tǒng)需要滿足以下物理約束:
(51)
(52)
設(shè)定規(guī)劃目標(biāo)的速度與輸入約束為:
(53)
(54)
在實(shí)施自主式預(yù)測(cè)控制實(shí)施算法中,利用MATLAB中的LMI工具箱(采用“mincx”命令)來(lái)求解優(yōu)化問(wèn)題。在整個(gè)仿真過(guò)程中,各個(gè)無(wú)人系統(tǒng)的優(yōu)化問(wèn)題均可求出最優(yōu)解。仿真結(jié)果見(jiàn)圖1~3。
從圖1可以看出,各無(wú)人系統(tǒng)與規(guī)劃目標(biāo)的位置軌跡最終重合在一起,多無(wú)人系統(tǒng)最終成功地跟蹤到了目標(biāo),各無(wú)人系統(tǒng)最終所形成的隊(duì)形介于跟蹤隊(duì)形與編隊(duì)隊(duì)形之間。以上結(jié)果顯示:各無(wú)人系統(tǒng)能夠收斂到規(guī)劃目標(biāo),而通過(guò)引入規(guī)劃控制目標(biāo)并對(duì)目標(biāo)代價(jià)函數(shù)進(jìn)行重新設(shè)計(jì)解決了跟蹤與編隊(duì)之間的不一致問(wèn)題。
圖1 各無(wú)人系統(tǒng)、規(guī)劃目標(biāo)與被跟蹤目標(biāo)的位置軌跡以及跟蹤與編隊(duì)的隊(duì)形圖
從圖2可以看出,在k=20時(shí),各無(wú)人系統(tǒng)便收斂到了規(guī)劃目標(biāo)。在k=30時(shí),所有無(wú)人系統(tǒng)都已經(jīng)跟蹤上了被跟蹤目標(biāo)。在整個(gè)跟蹤與編隊(duì)的過(guò)程中,各個(gè)無(wú)人系統(tǒng)的狀態(tài)以及規(guī)劃目標(biāo)的狀態(tài)均能夠滿足指定的狀態(tài)約束。
圖2 各無(wú)人系統(tǒng)速度、規(guī)劃速度與被跟蹤目標(biāo)速度的2-范數(shù)
從圖3可以看出,在整個(gè)多無(wú)人系統(tǒng)進(jìn)行跟蹤與編隊(duì)的過(guò)程中,各系統(tǒng)的輸入以及規(guī)劃目標(biāo)的輸入均未違反相應(yīng)的輸入約束,且最終均收斂到被跟蹤目標(biāo)的輸入。
圖3 各無(wú)人系統(tǒng)輸入、規(guī)劃目標(biāo)輸入與參考目標(biāo)輸入
本文針對(duì)多無(wú)人系統(tǒng)的跟蹤與編隊(duì)問(wèn)題設(shè)計(jì)了自主式預(yù)測(cè)控制算法,通過(guò)規(guī)劃出一致、可實(shí)現(xiàn)的控制目標(biāo)并令整個(gè)多無(wú)人系統(tǒng)實(shí)現(xiàn)該目標(biāo),最終解決多無(wú)人系統(tǒng)跟蹤與編隊(duì)控制目標(biāo)不一致及不可實(shí)現(xiàn)的問(wèn)題。本文的跟蹤與編隊(duì)控制算法設(shè)計(jì)均從單個(gè)無(wú)人系統(tǒng)自主進(jìn)行跟蹤與組成編隊(duì)的角度出發(fā),構(gòu)造的控制優(yōu)化問(wèn)題也是由各無(wú)人系統(tǒng)獨(dú)立求解,因此所給出的控制實(shí)施算法稱為自主式預(yù)測(cè)控制算法,該算法可以拓展應(yīng)用于由大規(guī)模無(wú)人系統(tǒng)所組成的無(wú)人集群進(jìn)行動(dòng)態(tài)編隊(duì)與拆分重組等問(wèn)題,具有較高的應(yīng)用價(jià)值。下一步將基于該算法,考慮由大規(guī)模無(wú)人系統(tǒng)所組成的無(wú)人集群避障的需求,解決其進(jìn)行動(dòng)態(tài)編隊(duì)與拆分重組等問(wèn)題。