陳 碩,鄭年年,欒小麗,劉 飛
(江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇無錫 214122)
作為一種比較先進(jìn)且成熟的控制方案,魯棒模型預(yù)測控制(model predictive control,MPC)現(xiàn)已被成功應(yīng)用于各個(gè)領(lǐng)域[1–3].在RMPC(robust MPC)算法發(fā)展的過程當(dāng)中,為加強(qiáng)有界擾動(dòng)及約束作用下RMPC的魯棒性及穩(wěn)定性,Mayne等人在文獻(xiàn)[4–6]提出一種基于Tube的RTMPC(robust Tube-based MPC)方法,該方法根據(jù)線性系統(tǒng)疊加原理,將不確定性系統(tǒng)的動(dòng)態(tài)演進(jìn)分解為標(biāo)稱狀態(tài)動(dòng)態(tài)和誤差動(dòng)態(tài),控制作用中的標(biāo)稱分量保證標(biāo)稱狀態(tài)的收斂性,而對受擾狀態(tài)和標(biāo)稱分量之間誤差的線性反饋則保證擾動(dòng)帶來的影響收斂于一個(gè)不變集中.隨后國內(nèi)外學(xué)者將RTMPC拓展到了非線性[7]、參數(shù)不確定性[8]、參數(shù)時(shí)變[9]、切換系統(tǒng)[10]等;同時(shí)考慮系統(tǒng)的資源約束問題,將自觸發(fā)[11]、事件觸發(fā)[12]等與RTMPC相結(jié)合;也有學(xué)者圍繞經(jīng)濟(jì)優(yōu)化目標(biāo)問題,將RTMPC用于經(jīng)濟(jì)MPC[13]的研究.
上述關(guān)于RTMPC的研究成果主要針對以零設(shè)定點(diǎn)為跟蹤目標(biāo)的問題,但在實(shí)際工程應(yīng)用中,目標(biāo)值一般都設(shè)定在非零點(diǎn)處,因此需要在RTMPC的基礎(chǔ)上進(jìn)行優(yōu)化與改良,設(shè)計(jì)一種更加靈活的控制方案,能夠?qū)δ繕?biāo)值進(jìn)行跟蹤,使得被控狀態(tài)在有噪聲干擾下,收斂于以設(shè)定值為中心的區(qū)域.為了解決RTMPC的不足,很多學(xué)者提出了改良方案,如文獻(xiàn)[14–16],其中Lim′on等人指出了這些改進(jìn)方案的不足之處,并提出了一種分段常值跟蹤MPC方法[17],該方法在設(shè)定值發(fā)生變化時(shí),仍能保證系統(tǒng)狀態(tài)收斂到以期望的設(shè)定值為中心的鄰域內(nèi).之后,Lim′on等人結(jié)合文獻(xiàn)[5]中所提的魯棒Tube方法,將文獻(xiàn)[18]的跟蹤MPC拓展到有界擾動(dòng)下的魯棒跟蹤[17].Lim′on等人在文獻(xiàn)[17–18]中所采用的零空間參數(shù)本質(zhì)上與標(biāo)稱系統(tǒng)的一組穩(wěn)態(tài)(參考穩(wěn)態(tài))或參考輸入相對應(yīng),在線優(yōu)化以一步參考作為決策變量,由于每次在線優(yōu)化只得到一組決策參數(shù),即一步參考,導(dǎo)致控制器作用過強(qiáng),當(dāng)初始狀態(tài)距離設(shè)定點(diǎn)較遠(yuǎn)時(shí),容易喪失可行解.
本文受到Lim′on等人的啟發(fā),提出一種動(dòng)態(tài)參考規(guī)劃(dynamic reference programming,DRP)方法,并與RTMPC相結(jié)合,設(shè)計(jì)出一種新型的模型預(yù)測跟蹤方案,將多步參考輸入作為決策變量來設(shè)計(jì)控制器并實(shí)施在線滾動(dòng)優(yōu)化.多步參考輸入一方面用于控制器設(shè)計(jì)實(shí)現(xiàn)對最后一步參考穩(wěn)態(tài)點(diǎn)的跟蹤,另一方面作為決策變量為在線優(yōu)化提供了靈活的自由度,而約束滿足和遞歸可行性保障都轉(zhuǎn)化為對動(dòng)態(tài)參考的約束來實(shí)現(xiàn).另外,通過最小化標(biāo)稱預(yù)測軌跡和參考穩(wěn)態(tài)之間的距離,同時(shí)懲罰最后一步參考穩(wěn)態(tài)和設(shè)定點(diǎn)之間的距離,可確保閉環(huán)標(biāo)稱系統(tǒng)收斂于最優(yōu)跟蹤點(diǎn),也即在設(shè)定點(diǎn)可達(dá)情況下實(shí)現(xiàn)零誤差跟蹤,在設(shè)定點(diǎn)不可達(dá)的情況下跟蹤到距離設(shè)定點(diǎn)最近的允許位置.由于采取了RTMPC方案,實(shí)際受擾狀態(tài)收斂到以最優(yōu)跟蹤點(diǎn)為中心的有界正不變集中,實(shí)現(xiàn)最優(yōu)魯棒跟蹤.
對于具有加性擾動(dòng)的線性時(shí)不變系統(tǒng),可用狀態(tài)空間方程表示為
其中:xk ∈Rn表示在k,k ∈N[0,∞]時(shí)刻的n維狀態(tài),xk+1表示下一時(shí)刻的狀態(tài)采樣值,uk ∈Rm是m維的控制輸入,wk ∈Rn表示系統(tǒng)受到的外部擾動(dòng),并假設(shè)任意時(shí)刻的擾動(dòng)位于如下所述的凸多面體中:
其中W={w ∈Rn||wi|≤σi,i=1,2,···,n}.
另外,考慮系統(tǒng)(1)的狀態(tài)和控制輸入具有如下約束:
設(shè)計(jì)如下控制作用:
其中AK=A+BK.本文令A(yù)K為嚴(yán)格穩(wěn)定,在此條件下,狀態(tài)誤差的演進(jìn)是有界的,可以定義如下擾動(dòng)不變集(disturbance invariant set,DIS)[5].
定義1對于一個(gè)集合E ∈Rn,如果對任意的e∈R以及任意的w ∈W,都有AKe+w ∈E,那么集合W是不確定系統(tǒng)(1)的一個(gè)DIS.
本文利用MPC方案實(shí)現(xiàn)系統(tǒng)(1)的跟蹤問題,還需要考慮到在線滾動(dòng)優(yōu)化的遞歸可行性,因此本文RTMPC方案設(shè)計(jì)的具體任務(wù)和目的可以歸納為尋找控制作用,k≥0使得:I)保證約束條件(7)滿足;II)保證在線優(yōu)化的遞歸可行性;III)保證標(biāo)稱系統(tǒng)(5)收斂于.
當(dāng)標(biāo)稱系統(tǒng)(5)到達(dá)穩(wěn)態(tài)時(shí),存在如下關(guān)系:
此時(shí)動(dòng)態(tài)方程(5)退化為如下所述的代數(shù)方程:
Lim′on等在文獻(xiàn)[17]中將上述穩(wěn)態(tài)關(guān)系表示為如下的方程組:
利用線性方程組的求解理論,該方程的解為
其中M為齊次線性方程組(10)的一組基礎(chǔ)解系,因此每當(dāng)參數(shù)θ確定,便有一組穩(wěn)態(tài)與之對應(yīng),Lim′on等人基于此,設(shè)計(jì)了標(biāo)稱控制作用為
為了實(shí)現(xiàn)設(shè)定點(diǎn)的跟蹤,本文對標(biāo)稱系統(tǒng)(5)施加如下控制作用:
其中參考輸入r決定了最終系統(tǒng)的穩(wěn)態(tài)位置.假設(shè)是嚴(yán)格穩(wěn)定的,則當(dāng)系統(tǒng)最終到達(dá)穩(wěn)態(tài)時(shí),根據(jù)式(8),有
對比式(12)(15)可知
注1通過上述分析可以看出,Lim′on等人實(shí)施MPC優(yōu)化的決策變量θ實(shí)際上是參考輸入的一種等價(jià)表示,而每次優(yōu)化尋找一組最優(yōu)參數(shù)θ可以理解為尋找對應(yīng)某個(gè)穩(wěn)態(tài)的一步參考輸入.
聯(lián)立式(9)(15)可得
為了克服Lim′on等人方法的局限性,本文直接以參考輸入為決策變量,在k時(shí)刻進(jìn)行MPC優(yōu)化時(shí),令未來的控制作用為
上式中的動(dòng)態(tài)參考輸入需要滿足集合(18)的約束以及
其中1 ≤s≤N被定義為優(yōu)化時(shí)域.
注2本文以s步動(dòng)態(tài)參考作為MPC優(yōu)化的決策變量,相比于Lim′on等人的一步參考,步參考不僅可以增加MPC優(yōu)化問題的自由度,而且能有效降低控制器負(fù)擔(dān).另外,當(dāng)s=1時(shí),本文提出的控制器退化為Lim′on等人所提控制器的一種等價(jià)形式.
標(biāo)稱系統(tǒng)(5)在控制律(19)的作用下所形成的閉環(huán)標(biāo)稱系統(tǒng)為
則關(guān)于閉環(huán)系統(tǒng)(21)有如下引理:
引理1閉環(huán)系統(tǒng)(21)必然收斂于穩(wěn)態(tài)位置
證當(dāng)時(shí)間趨于無窮時(shí),標(biāo)稱系統(tǒng)(5)的狀態(tài)可以表示為
根據(jù)第2小節(jié)的問題描述以及上一節(jié)提出的基于DRP的跟蹤控制,可以設(shè)計(jì)基于DRP的RTMPC代價(jià)函數(shù)及約束條件為
其中權(quán)系數(shù)矩陣Q,R,T為正定矩陣,其中階段代價(jià)
定義2所給出的TIS中可以作為優(yōu)化問題P0(,rk)的終端約束集,集合元素既包括了標(biāo)稱狀態(tài)分量,又包括參考輸入分量r,由引理1可知,如果以r作為最后一步參考,閉環(huán)系統(tǒng)(21)可收斂于r對應(yīng)的穩(wěn)定狀態(tài)(r),因此定義2給出的TIS作用在幾何上可以理解為:狀態(tài)進(jìn)入一個(gè)以(r)為中心的一個(gè)不變集,從該集合出發(fā)的任何一個(gè)初始狀態(tài),在以r為參考輸入的狀態(tài)反饋控制作用下,狀態(tài)和輸入軌跡都將滿足約束(7),且狀態(tài)和輸入最終分別收斂于(r)和基于定義2,約束∈N[0,∞]可以轉(zhuǎn)化為
因此,優(yōu)化問題P0(,rk)中的無窮項(xiàng)約束被轉(zhuǎn)化為預(yù)測時(shí)域內(nèi)的有限項(xiàng)約束和終端約束,使得優(yōu)化問題可行.進(jìn)一步地,對代價(jià)函數(shù)(26)中的參數(shù)進(jìn)行設(shè)置.線性反饋取為線性二次型調(diào)節(jié)器(linear quadratic regulator,LQR)增益,其中Q,R為正定矩陣,令P為如下Riccati方程的解:
當(dāng)參數(shù)τ足夠大時(shí),可以對閉環(huán)系統(tǒng)(21)收斂到的穩(wěn)態(tài)(rk|k+s?1)和設(shè)定點(diǎn)之間的加權(quán)歐氏距離進(jìn)行充分懲罰,從而任意降低二者之間的距離,引導(dǎo)系統(tǒng)(21)盡可能地跟蹤.
根據(jù)式(25)可得如下推導(dǎo)關(guān)系:
其中最后一個(gè)等號(hào)的得出根據(jù)引理1.基于上述結(jié)論,本節(jié)提出基于DRP的RTMPC跟蹤目標(biāo)函數(shù)為
算法1:基于DRP的RTMPC實(shí)現(xiàn)最優(yōu)魯棒跟蹤
離線
第4步設(shè)置下一采樣時(shí)刻為k=k+1,測量狀態(tài)xk,返回執(zhí)行第2步.
本文將所提的控制器設(shè)計(jì)方案應(yīng)用到如下雙重積分器模型:
其中狀態(tài)和控制輸入受到約束
噪聲位于如下凸多面體中:
RTMPC方案中的相關(guān)參數(shù)選取為
圖1 DIS示意圖Fig.1 DIS schematic
系統(tǒng)的TIS和RTIS如圖2所示.
圖2 TIS及RTIS示意圖Fig.2 TIS and RTIS schematic diagram
圖3(a)中每一步紫色多邊形的大小和形狀由DIS決定,位置則由每一步的標(biāo)稱狀態(tài)決定,給定了每一步受擾狀態(tài)所在的魯棒Tube,限制了標(biāo)稱狀態(tài)和受擾狀態(tài)之間的距離范圍,而該Tube收斂于固定的位置,表明狀態(tài)最終收斂于以標(biāo)稱跟蹤點(diǎn)為中心的DIS中.圖3(b)可以看出不同擾動(dòng)實(shí)現(xiàn)下,狀態(tài)軌跡位于一定的范圍內(nèi).
圖3 狀態(tài)響應(yīng)軌跡Fig.3 State response trajectory
200次擾動(dòng)實(shí)現(xiàn)下的狀態(tài)終點(diǎn)分布如圖4所示.
從圖4可以看出,不同跟蹤目標(biāo)下狀態(tài)均收斂于以標(biāo)稱跟蹤點(diǎn)為中心的DIS中,當(dāng)設(shè)定點(diǎn)可達(dá)的時(shí)候,標(biāo)稱跟蹤點(diǎn)與設(shè)定點(diǎn)重合;當(dāng)設(shè)定點(diǎn)不可達(dá)時(shí),標(biāo)稱跟蹤點(diǎn)位于TIS的邊界上且距離設(shè)定點(diǎn)最近的位置,此時(shí)受擾狀態(tài)所收斂的集合位于RTIS的邊界,因此系統(tǒng)實(shí)現(xiàn)了最優(yōu)魯棒跟蹤.
圖4 不同跟蹤目標(biāo)下狀態(tài)分布Fig.4 State distribution under different tracking targets
另外,為了對比優(yōu)化時(shí)域s對本文所提跟蹤算法的影響,在不同s設(shè)置下,圖5給出了控制輸入位置及增量的變化.
從圖5可以看出,隨著s的增大,每一步控制輸入位置和增量都逐漸較小,也即當(dāng)優(yōu)化時(shí)域較大時(shí),控制作用的幅度和變化都較小,進(jìn)而驗(yàn)證了本文所提多步參考可以減輕控制器的負(fù)擔(dān).
圖5 不同優(yōu)化時(shí)域下控制輸入變化Fig.5 Control input changes in different optimization time domains
從表1可以看出,與Lim′on等人的一步參考比起來,多步參考輸入可以令控制作用負(fù)擔(dān)更小、每一步控制變化量更小,雖然同時(shí)也導(dǎo)致算法時(shí)間復(fù)雜度提升,但是從系統(tǒng)所消耗能量的角度來看,多步參考輸入的系統(tǒng)能量平均值減少.
表1 不同優(yōu)化時(shí)域下的平均能量Table 1 Average energy in different optimized time domains
為了驗(yàn)證控制方法的實(shí)用性,將本文所提RTMPC方法應(yīng)用于如圖6所示的DC–DC變換器電路.
圖6 DC–DC變換器的示意圖Fig.6 Schematic of DC–DC converter
系統(tǒng)的狀態(tài)約束集合為
RTMPC參數(shù)選取為
從圖7和圖8可以看出,當(dāng)本文所提方法用于DC–DC變換器時(shí),可以有效實(shí)現(xiàn)電路狀態(tài)的最優(yōu)魯棒控制,動(dòng)態(tài)軌跡在魯棒集合內(nèi),穩(wěn)定狀態(tài)分布在以設(shè)定點(diǎn)為中心的最優(yōu)魯棒不變集內(nèi).將本文所提方法與當(dāng)前DC–DC變換器常用的狀態(tài)反饋控制效果進(jìn)行對比,如圖9.
圖7 200次擾動(dòng)實(shí)現(xiàn)下的狀態(tài)軌跡Fig.7 State trajectories under 200 perturbations
圖8 Nsim=30時(shí)狀態(tài)分布Fig.8 State distribution when Nsim=30
圖9 狀態(tài)反饋和動(dòng)態(tài)參考規(guī)劃的對比軌跡Fig.9 Comparative trajectories of state feedback and dynamic reference programming
從圖9中可以看出,由于狀態(tài)反饋控制本質(zhì)上相當(dāng)于參考輸入為0的一步參考規(guī)劃,動(dòng)態(tài)參考規(guī)劃方案能夠在成功實(shí)現(xiàn)控制目標(biāo)的同時(shí),比狀態(tài)反饋控制更為緩和,這也意味著控制作用負(fù)擔(dān)會(huì)更小.
本文提出一種基于DRP的RTMPC用于受到有界擾動(dòng)系統(tǒng)的最優(yōu)魯棒跟蹤,該方案將多步參考輸入作為決策變量來設(shè)計(jì)控制器并實(shí)施MPC滾動(dòng)優(yōu)化.就在線優(yōu)化求解而言,多步參考可以降低控制器負(fù)擔(dān),同時(shí)使得優(yōu)化問題具有更靈活的自由度,當(dāng)初始狀態(tài)距離設(shè)定點(diǎn)較遠(yuǎn)時(shí),可通過增大優(yōu)化時(shí)域來保證約束滿足以及可行解的存在.就跟蹤性能而言,基于DRP的跟蹤控制保證了閉環(huán)標(biāo)稱系統(tǒng)的收斂性,MPC目標(biāo)函數(shù)則同時(shí)懲罰標(biāo)稱狀態(tài)軌跡和參考穩(wěn)態(tài)之間、以及最后一步參考穩(wěn)態(tài)和設(shè)定點(diǎn)之間的加權(quán)歐式距離,確保受擾狀態(tài)收斂到以最優(yōu)跟蹤點(diǎn)為中心的有界正不變集中,實(shí)現(xiàn)最優(yōu)魯棒跟蹤.仿真結(jié)果驗(yàn)證了該控制器的性能及優(yōu)勢,可以實(shí)現(xiàn)被控對象的最優(yōu)魯棒跟蹤.未來研究工作將結(jié)合系統(tǒng)的概率特性,研究基于DRP的隨機(jī)MPC跟蹤方法.