王洪斌 高 靜 蘇 博 王躍靈
隨著海洋科學(xué)技術(shù)的進(jìn)步,自主水下航行器(Autonomous underwater vehicle,AUV)在各種水下作業(yè)得到廣泛應(yīng)用,如在海底探測、地形測繪和水下施工等[1-5].在復(fù)雜作業(yè)環(huán)境下,需要多AUVs協(xié)同作業(yè),提升作業(yè)效率,實(shí)現(xiàn)性能和指標(biāo),對(duì)一致性和編隊(duì)控制則提出更高的要求.其中多AUVs 編隊(duì)控制因具有作業(yè)范圍廣、效率高、容錯(cuò)性好等特點(diǎn)成為AUVs 系統(tǒng)重點(diǎn)研究方向.常用編隊(duì)協(xié)調(diào)控制方法有領(lǐng)航者-跟隨者法[6-8]、虛擬結(jié)構(gòu)法[9]和基于行為控制法[10]等,其中領(lǐng)航者-跟隨者法因其控制簡單、編隊(duì)隊(duì)形結(jié)構(gòu)實(shí)現(xiàn)難度低等優(yōu)點(diǎn),備受科研人員青睞.此方法是在多AUVs 編隊(duì)系統(tǒng)中指定其中某個(gè)AUV 為領(lǐng)航者,其他AUVs 則為跟隨者,領(lǐng)航者跟蹤預(yù)先設(shè)定的參考軌跡,每個(gè)跟隨者依據(jù)和領(lǐng)航者之間的位置誤差和速度誤差設(shè)計(jì)控制律,以一定的間隔距離與角度跟蹤領(lǐng)航者,從而實(shí)現(xiàn)期望的編隊(duì)目標(biāo).
多AUVs 編隊(duì)控制是一項(xiàng)具有挑戰(zhàn)性的工作.一方面,因其系統(tǒng)受限于有限的通信資源,傳統(tǒng)連續(xù)時(shí)間通信會(huì)導(dǎo)致通信資源和能量的浪費(fèi).為了有效的利用通信資源,事件觸發(fā)通訊機(jī)制[11-12]運(yùn)用而生.事件觸發(fā)控制是指只有當(dāng)單個(gè)智能體的某一個(gè)狀態(tài)變化量超過給定閾值時(shí),該智能體被觸發(fā)并與鄰居進(jìn)行信息傳輸,此方法能減少系統(tǒng)能耗和控制器的更新次數(shù).文獻(xiàn)[11]針對(duì)具有外部干擾的線性多智能體系統(tǒng),提出一種分布式事件觸發(fā)一致性協(xié)議,有效地減輕整個(gè)通信網(wǎng)絡(luò)的通信負(fù)擔(dān).文獻(xiàn)[12]討論了高階多智能體系統(tǒng)在外部擾動(dòng)作用下的時(shí)變編隊(duì)問題,提出一種事件觸發(fā)積分滑??刂撇呗?節(jié)約了能耗,且避免觸發(fā)時(shí)間序列的Zeno 行為.文獻(xiàn)[13]針對(duì)一類非嚴(yán)格反饋的多智能體系統(tǒng)一致性跟蹤問題,在考慮全狀態(tài)約束和指定性能的基礎(chǔ)上提出了一種事件觸發(fā)自適應(yīng)控制算法.
另一方面,編隊(duì)的收斂速度是多AUVs 編隊(duì)控制中的一個(gè)重要性能指標(biāo).理想的編隊(duì)控制應(yīng)在足夠短的有限時(shí)間內(nèi)完成所需編隊(duì).由于多數(shù)AUVs編隊(duì)控制是漸近穩(wěn)定的,基于收斂率的問題,有限時(shí)間[14-16]編隊(duì)控制的研究提高了系統(tǒng)的收斂速度.文獻(xiàn)[14]研究了基于有限時(shí)間擴(kuò)張狀態(tài)觀測器的水面船舶分布式編隊(duì)控制問題.文獻(xiàn)[15]考慮具有視線范圍和角度約束的自主水面船舶編隊(duì)問題,提出了一種容錯(cuò)有限時(shí)間領(lǐng)航-跟隨編隊(duì)控制方案.文獻(xiàn)[16]針對(duì)存在模型不確定性和環(huán)境擾動(dòng)的欠驅(qū)動(dòng)無人水面船舶編隊(duì)問題,提出一種自適應(yīng)有限時(shí)間擾動(dòng)觀測器,在有限時(shí)間內(nèi)達(dá)到既定的編隊(duì)目標(biāo).基于有限時(shí)間的編隊(duì)控制提高了編隊(duì)收斂速度,但其收斂時(shí)間取決于系統(tǒng)的初始狀態(tài),而初始狀態(tài)在實(shí)際工程中隨機(jī)變化,造成編隊(duì)的收斂時(shí)間的不確定性.固定時(shí)間穩(wěn)定理論[17-21]不僅可以提高系統(tǒng)收斂速度,而且其編隊(duì)系統(tǒng)的收斂時(shí)間與初始狀態(tài)無關(guān),僅取決于控制器的設(shè)計(jì)參數(shù),所以基于固定時(shí)間理論的控制器更符合實(shí)際系統(tǒng).
本文同時(shí)考慮多AUVs 系統(tǒng)受限于有限的通信資源以及編隊(duì)收斂速度慢等問題,提出一種基于事件觸發(fā)的AUVs 固定時(shí)間編隊(duì)控制方法.將分布式事件觸發(fā)機(jī)制引入多AUVs 編隊(duì)控制研究中,并且基于固定時(shí)間穩(wěn)定構(gòu)造出觸發(fā)函數(shù),設(shè)計(jì)出基于事件觸發(fā)的編隊(duì)控制器,保證系統(tǒng)全局固定時(shí)間有界性收斂,且收斂時(shí)間不受初始狀態(tài)的影響,既加快系統(tǒng)的收斂速度,又通過降低控制器的觸發(fā)頻次和通信次數(shù),提高對(duì)有限通信資源利用率,節(jié)約系統(tǒng)通信能量,同時(shí)證明無Zeno 行為;此外,在反步法中引入動(dòng)態(tài)面技術(shù)避免了 “微分爆炸”問題,降低了控制器的復(fù)雜性.
由2 個(gè)網(wǎng)絡(luò)結(jié)構(gòu)組成的AUV 隊(duì)列,如圖1 所示.每個(gè)跟隨AUV 都配備一個(gè)傳感器來接收相對(duì)位置和姿態(tài)信息.
圖1 領(lǐng)航-跟隨多AUVs 編隊(duì)示意圖Fig.1 The diagram of leader-follower formation of AUVs
假設(shè)所有AUV 都有固定的姿態(tài),則第i個(gè)AUV的水平面運(yùn)動(dòng)學(xué)及動(dòng)力學(xué)模型[22]為:
控制目標(biāo): 在假設(shè)1 下,對(duì)于模型(1),基于反步動(dòng)態(tài)面控制算法、固定時(shí)間控制理論和分布式事件觸發(fā)通訊機(jī)制為跟隨AUV 設(shè)計(jì)編隊(duì)控制律,使跟隨AUV 在安全距離內(nèi)跟蹤上領(lǐng)航AUV 的軌跡,完成編隊(duì)控制目標(biāo),同時(shí)保證所有閉環(huán)信號(hào)達(dá)到全局固定時(shí)間穩(wěn)定,即:
引理1[21].考慮如下系統(tǒng)x∈Rn:
式中,γ1、γ2、α、β均是正常數(shù),0<α <1,β>1.故系統(tǒng)在平衡點(diǎn)固定時(shí)間穩(wěn)定的,其收斂時(shí)間T有界且不依賴于系統(tǒng)的初始狀態(tài),T滿足不等式:
則系統(tǒng)是全局固定時(shí)間穩(wěn)定的,且收斂時(shí)間T滿足不等式(10).
3)若任意的x(t)滿足不等式:
則該系統(tǒng)是實(shí)際固定時(shí)間穩(wěn)定的,且存在正常數(shù)θ,0<θ <1,使得收斂時(shí)間T滿足:
本節(jié)基于反步動(dòng)態(tài)面控制算法,將分布式事件觸發(fā)控制策略引入到多AUVs 編隊(duì)控制策略中,設(shè)計(jì)編隊(duì)控制器,同時(shí)選擇合適的觸發(fā)函數(shù),保證系統(tǒng)達(dá)到全局固定時(shí)間穩(wěn)定,實(shí)現(xiàn)期望編隊(duì)控制的目標(biāo),其控制框圖如圖2 所示.
圖2 編隊(duì)跟蹤控制示意圖Fig.2 The diagram of formation control
考慮到多AUVs 系統(tǒng)受限于有限帶寬和有限通信資源,基于反步動(dòng)態(tài)面算法思想,構(gòu)造分布式事件觸發(fā)機(jī)制,對(duì)于每個(gè)跟隨AUV 給出基于狀態(tài)信息的觸發(fā)條件,當(dāng)狀態(tài)誤差滿足觸發(fā)條件時(shí)才被觸發(fā),有效地減少控制器更新頻率,降低通信資源的浪費(fèi).
用t0,t1,···來表示事件觸發(fā)時(shí)間序列,其中tk表示跟隨AUV 的觸發(fā)時(shí)間.控制器設(shè)計(jì)如下:
將事件觸發(fā)機(jī)制定義為:
式中,fi(t) 為觸發(fā)函數(shù).當(dāng)tk到達(dá)時(shí),fi(t)≥0,事件觸發(fā)控制器(17)被觸發(fā)更新.在兩次觸發(fā)時(shí)刻之間,控制器保持不變.
將測量誤差定義為:
在領(lǐng)航-跟隨編隊(duì)控制策略、反步動(dòng)態(tài)面控制算法和李雅普諾夫理論的基礎(chǔ)上,利用固定時(shí)間理論,基于事件觸發(fā)的編隊(duì)控制器的設(shè)計(jì)過程分2 步.
步驟1.定義位置跟蹤誤差為:
為了驗(yàn)證z1(t)的收斂性,構(gòu)造如下正定的李雅普諾夫函數(shù):
結(jié)合式(25)~ (26)、假設(shè)1 和Young's 不等式,對(duì)其求導(dǎo),可得:
進(jìn)一步可得:
由引理1~ 2,可得系統(tǒng)z1(t)是固定時(shí)間穩(wěn)定的.
步驟2.定義速度跟蹤誤差:
由式(33)和定義1 對(duì)V2(t)求導(dǎo),并依據(jù)假設(shè)1 和Young's 不等式,可得:
綜上,根據(jù)引理2,可得系統(tǒng)z2(t)是固定時(shí)間穩(wěn)定的.
定理1.考慮被控對(duì)象式(1),滿足假設(shè)1 條件下,將分布式事件觸發(fā)控制引入AUVs 編隊(duì)控制策略中,設(shè)計(jì)出基于事件觸發(fā)的控制器式(16),將觸發(fā)函數(shù)選擇為:
證明.為了驗(yàn)證整個(gè)多AUVs 編隊(duì)控制系統(tǒng)穩(wěn)定性,構(gòu)造如下李雅普諾夫函數(shù):
綜合式(25)~ (26)和式(33),對(duì)V(t)求導(dǎo),并依據(jù)Young's 不等式和定義1,可得:
事件觸發(fā)通訊機(jī)制的關(guān)鍵是排除Zeno 行為,若存在Zeno 行為會(huì)使其控制器被無限次觸發(fā),通過證明任意兩次觸發(fā)間隔{tk+1-tk,k ∈N}都存在一個(gè)正下界,即可說明事件觸發(fā)過程無Zeno 行為.
定理2.考慮多AUVs 編隊(duì)系統(tǒng)(1),根據(jù)假設(shè)2,對(duì)于任意的初始狀態(tài),在事件觸發(fā)控制器(16)和觸發(fā)條件(37)作用下,以任意兩次觸發(fā)時(shí)刻為端點(diǎn)的區(qū)間段,其區(qū)間長度{tk+1-tk,k ∈N}一定存在某一固定的正下界.
根據(jù)式(18)、式(22)、式(33)和假設(shè)2,得到如下不等式:
由式(27)和式(34)中正定的李雅普諾夫函數(shù),可得不等式:
為了說明本文提出的控制方法的有效性,本文對(duì)4 艘AUV 組成的系統(tǒng)進(jìn)行編隊(duì)控制的仿真研究.
3.2.1 本文算法的仿真實(shí)例
為了驗(yàn)證本文提出編隊(duì)控制策略的有效性和合理性,在相同條件下對(duì)兩種工況(見表1)進(jìn)行仿真驗(yàn)證,區(qū)別在于工況1 和工況2 取值于任意不同初始狀態(tài).其中AUV 0、AUV 1、AUV 2 和AUV 3 代表1 個(gè)領(lǐng)航者和3 個(gè)跟隨者.控制器參數(shù)選擇如下:k=diag{30,30,30},α1=β1=0.01,α2=2,β2=80,γ1=0.7,γ2=1.1.
工況1.依據(jù)本文提算法及上述參數(shù)對(duì)工況1中不同初始狀態(tài)(見表1) 進(jìn)行仿真,仿真結(jié)果如圖3~ 12 所示.
表1 跟隨 AUVs 的任意初始狀態(tài)Table 1 The arbitrary initial state of AUVs
圖3 為多AUVs 的運(yùn)動(dòng)軌跡,顯然在所提出的事件觸發(fā)編隊(duì)控制律下,跟隨AUV 在安全距離內(nèi)跟蹤上領(lǐng)航AUV,實(shí)現(xiàn)所需的編隊(duì)目標(biāo).圖4~ 5分別為每個(gè)運(yùn)動(dòng)方向上位置狀態(tài)和位置跟蹤誤差z1(t),z1(t)很好地收斂到原點(diǎn)附近.圖6~ 7 為速度跟蹤效果及其誤差z2(t),可以看出,在事件觸發(fā)編隊(duì)控制器作用下,2 秒內(nèi)所有跟隨AUVs 的速度很好地跟蹤上領(lǐng)航AUV 的速度,達(dá)到期望的收斂效果和控制精度.圖8~ 9 分別為跟隨AUVs 的虛擬控制器(t) 和控制輸入向量τf(t).圖10 給出在工況1 下所有跟隨AUVs 的事件觸發(fā)時(shí)刻示意圖,可以看出,每個(gè)AUV 的事件觸發(fā)時(shí)刻不在同一時(shí)刻,驗(yàn)證了本文設(shè)計(jì)的觸發(fā)機(jī)制是分布式的,從而降低網(wǎng)絡(luò)通信負(fù)擔(dān).此外,為了更加直觀說明引入事件觸發(fā)機(jī)制節(jié)約了通信資源,將工況1 下所有跟隨AUVs 的觸發(fā)次數(shù)統(tǒng)計(jì)結(jié)果在后續(xù)表2 中給出并進(jìn)行分析.
表2 跟隨者AUVs 的事件觸發(fā)次數(shù)和觸發(fā)率Table 2 Event-triggered and triggered ratios for follower AUVs
圖3 工況 1 下的軌跡Fig.3 The trajectory under working Condition 1
圖4 工況 1 下的位置Fig.4 The position under working Condition 1
圖5 工況 1 下的位置跟蹤誤差Fig.5 The position tracking error under working Condition 1
圖6 工況 1 下的速度Fig.6 The velocity under working Condition 1
圖7 工況 1 下速度跟蹤誤差Fig.7 The velocity tracking error under working Condition 1
圖8 工況 1 下的虛擬控制律Fig.8 The virtual control law under working Condition 1
圖9 工況 1 下的控制輸入Fig.9 The control input under working Condition 1
圖10 工況 1 下的事件觸發(fā)時(shí)刻仿真圖Fig.10 The triggered interval under working Condition 1
為進(jìn)一步說明基于事件觸發(fā)通訊機(jī)制的編隊(duì)控制器可節(jié)約有限的通信資源等性能,特給出工況1下AUV 1 的控制輸入和事件觸發(fā)時(shí)刻仿真圖,見圖11~ 12 所示.圖11 顯示連續(xù)通信和事件觸發(fā)通信下跟隨AUV 1 的實(shí)際控制輸入的變化情況,可以看出相比于未引入事件觸發(fā)的連續(xù)控制器c(t),基于事件觸發(fā)的控制器τf(t)出現(xiàn)分段情況,每一段的開始和結(jié)束時(shí)刻為AUV 1 的觸發(fā)時(shí)刻,τf(t)在觸發(fā)時(shí)刻更新,在觸發(fā)時(shí)刻之間保持為常數(shù)不變,從而減少因不必要的頻繁通信造成的資源浪費(fèi).由式(37) 生成的事件觸發(fā)時(shí)刻如圖12 所示,結(jié)合圖11 可看出在前2 秒觸發(fā)間隔較小,2 秒之后控制器逐漸變小,系統(tǒng)逐漸趨于穩(wěn)定,觸發(fā)時(shí)刻變得稀疏,這與預(yù)期的結(jié)果一致.說明本文將分布式事件觸發(fā)引入到AUVs 編隊(duì)控制中,降低了通信次數(shù)和控制器的更新頻次,提高了資源的利用率.
圖11 跟隨AUV 1 的控制輸入τf(t)Fig.11 The control input τ f(t) of AUV 1
圖12 跟隨 AUV 1 的事件觸發(fā)時(shí)刻Fig.12 The triggered interval of AUV 1
工況2.為了驗(yàn)證本文算法的正確性且系統(tǒng)收斂時(shí)間與初始狀態(tài)無關(guān),在相同參數(shù)條件下對(duì)工況2 中任意初始狀態(tài)(見表1)進(jìn)行仿真驗(yàn)證,仿真結(jié)果見圖13~ 17 所示.由圖13~ 17 可以看出,在初始狀態(tài)與期望狀態(tài)差別較大情況下,本文提出的基于事件觸發(fā)的AUVs 固定時(shí)間編隊(duì)控制算法的合理性.此外,根據(jù)工況1 和工況2 仿真結(jié)果驗(yàn)證了本文基于固定時(shí)間收斂算法在改善編隊(duì)系統(tǒng)收斂率的同時(shí)其收斂時(shí)間與初始狀態(tài)無關(guān),即在任意不同初始狀態(tài)下,編隊(duì)均在2 秒內(nèi)實(shí)現(xiàn)收斂.
圖13 工況2 下的軌跡Fig.13 The trajectory under working condition 2
圖14 工況 2 下的位置跟蹤誤差Fig.14 The position tracking error under working condition 2
圖15 工況 2 下速度跟蹤誤差Fig.15 The velocity tracking error under working condition 2
圖16 工況 2 下的控制輸入Fig.16 The control input under working condition 2
綜上所述,為了更直觀地說明引入事件觸發(fā)機(jī)制節(jié)約了通信資源,表2 給出在分布式事件觸發(fā)機(jī)制下,多AUVs 系統(tǒng)在10 秒內(nèi)控制器的觸發(fā)次數(shù)和觸發(fā)比率,由表2 數(shù)據(jù)結(jié)合圖10 和圖17 的不同工況下的觸發(fā)時(shí)刻圖以及圖11 不同通訊機(jī)制的控制器對(duì)比,可以看出,本文將事件觸發(fā)通訊機(jī)制引入到多AUVs 編隊(duì)控制中,降低了AUV 的采樣和控制器的更新次數(shù),改進(jìn)了連續(xù)通訊因不必要的通訊造成資源的浪費(fèi);在有限網(wǎng)絡(luò)帶寬內(nèi),減少信息通訊次數(shù)可以降低能耗.顯然,本文的基于事件觸發(fā)控制算法比連續(xù)通訊更能節(jié)省通訊資源.
圖17 工況 2 下的事件觸發(fā)時(shí)刻仿真圖Fig.17 The triggered interval under working condition 2
3.2.2 與比例-積分-微分控制算法的比較
基于工況2 中的AUV 1 給出的初始狀態(tài),將本文算法與傳統(tǒng)的PID 控制算法進(jìn)行比較,并給出比例-積分-微分控制算法(Proportional-integralderivative,PID)控制器如下:
圖18~ 19 描述了本文基于事件觸發(fā)的固定時(shí)間控制算法與PID 控制算法下的編隊(duì)位置跟蹤誤差和速度跟蹤誤差比較,由仿真結(jié)果可以看出,相比于本文算法,PID 控制算法存在瞬態(tài)性能不足,即編隊(duì)誤差在2 秒左右有一個(gè)峰值,說明本文所提出的算法不僅加快了編隊(duì)系統(tǒng)的收斂時(shí)間,還具有較好的瞬態(tài)性能和穩(wěn)態(tài)性能,可以更好地實(shí)現(xiàn)AUVs的編隊(duì).此外,表3 通過各個(gè)誤差信號(hào)的均方差D和平均值E給出本文控制算法和PID 算法的一個(gè)量化比較結(jié)果,進(jìn)一步直觀地驗(yàn)證了本文所提出的算法不僅改善了編隊(duì)的收斂時(shí)間,還提高了系統(tǒng)的控制性能,比PID 算法的系統(tǒng)控制性能更好.
圖18 跟隨 AUV 1 的位置跟蹤誤差Fig.18 The position tracking error of AUV 1
圖19 跟隨 AUV 1 的速度跟蹤誤差z2(t)Fig.19 The velocity tracking error of AUV 1
表3 本文算法和PID 算法的比較結(jié)果Table 3 Comparison results in the algorithm of proposed in paper and PID
本文提出一種基于事件觸發(fā)機(jī)制的多AUVs固定時(shí)間編隊(duì)控制算法,同時(shí)解決了多AUVs 編隊(duì)系統(tǒng)有限通信資源的限制以及編隊(duì)收斂速度慢的問題.基于反步動(dòng)態(tài)面控制算法,將分布式事件觸發(fā)通訊機(jī)制引入多AUVs 領(lǐng)航-跟隨編隊(duì)控制策略中,根據(jù)固定時(shí)間控制理論的思想,構(gòu)造出事件觸發(fā)函數(shù),設(shè)計(jì)出基于事件觸發(fā)的編隊(duì)控制器,保證編隊(duì)系統(tǒng)實(shí)現(xiàn)全局固定時(shí)間收斂.除了加快系統(tǒng)的收斂速度外,其收斂時(shí)間不受初始狀態(tài)的影響;同時(shí)通過減少控制器的更新頻次和通信次數(shù),降低系統(tǒng)通信能耗,提高對(duì)有限通信資源的利用率.