劉芬, 張克軍
(1.西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072; 2.延安大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院, 陜西 延安 716000;3.徐州工程學(xué)院 數(shù)理學(xué)院, 江蘇 徐州 221111)
迭代學(xué)習(xí)控制(ILC)[1]是一種簡單有效的學(xué)習(xí)控制策略,適用于在固定有限時間間隔內(nèi)重復(fù)運行的被控系統(tǒng)。在足夠的學(xué)習(xí)時間,可以用較少的先驗?zāi)P椭R和較少的在線計算來提高系統(tǒng)的跟蹤性能。基于其優(yōu)勢,ILC已經(jīng)成為研究熱點,廣泛應(yīng)用于移動機器人、工業(yè)過程控制、交通信號控制等多個領(lǐng)域[2-4]。2001年,Chen等[5]首次提出了PDα-型分數(shù)階迭代學(xué)習(xí)控制算法,在頻域內(nèi)討論了算法的收斂性,并將迭代學(xué)習(xí)控制的應(yīng)用范圍推廣到分數(shù)階系統(tǒng),即分數(shù)階迭代學(xué)習(xí)控制(FOILC)。FOILC除了具有傳統(tǒng)迭代學(xué)習(xí)控制的優(yōu)點外,還可以提高具有分數(shù)階特性的被控系統(tǒng)的性能。近年來,FOILC在時域方面取得了豐碩的成果,Lazarevic等[6-7]證明了PDα-型、開閉環(huán)PDα-型分數(shù)階迭代學(xué)習(xí)算法的收斂性和穩(wěn)定性。Li等[8-9]提出了幾種分數(shù)階迭代學(xué)習(xí)算法,并討論了其收斂性和穩(wěn)定性。lan等[10]研究了Dα-型分數(shù)階迭代學(xué)習(xí)算法的收斂性問題。
在上述FOILC設(shè)計過程中,一般都是假定所研究被控系統(tǒng)在每一次的迭代過程中初態(tài)都與期望初態(tài)一致。但是在實際問題中,系統(tǒng)的期望初始狀態(tài)通常是未知的,不可能保證初始狀態(tài)值等于期望的初始狀態(tài)值。因此,研究具有初始狀態(tài)偏差的系統(tǒng)控制算法的魯棒性是非常重要的。迄今為止,關(guān)于分數(shù)階系統(tǒng)的初態(tài)問題的研究還很少。對于一類具有固定初始狀態(tài)誤差的分數(shù)階線性定常系統(tǒng),文獻[11]首次提出了一種具有初始狀態(tài)學(xué)習(xí)的開閉環(huán)P型ILC算法,得到了算法收斂的充分條件。文獻[12]設(shè)計了具有初始狀態(tài)學(xué)習(xí)的開環(huán)和閉環(huán)P型ILC方案。文獻[13]將上述算法應(yīng)用于一類分數(shù)階非線性時滯系統(tǒng)。文獻[14]針對一類具有初始狀態(tài)漂移的分數(shù)階線性定常系統(tǒng),提出了一種新的修正PDα-型FOILC算法。
目前對分數(shù)階系統(tǒng)的跟蹤控制研究中,主要是利用λ-范數(shù)對跟蹤誤差進行測量。與λ-范數(shù)相比,Lebesgue-p范數(shù)更適合分析控制算法的學(xué)習(xí)行為[15-18]。
基于上述問題,本文針對一類具有任意初始狀態(tài)的分數(shù)階線性時不變系統(tǒng),提出了具有初始狀態(tài)學(xué)習(xí)的開環(huán)和開閉環(huán)PDα-型FOILC算法,并在Lebesgue-p范數(shù)意義下分析了算法的收斂性。
本節(jié)首先給出一些相關(guān)的數(shù)學(xué)知識。
定義1對于連續(xù)時變向量函數(shù)
f:[0,T]→Rn,(f(t)=[f1(t),f2(t),…,fn(t)]T)
則λ-范數(shù)和Lebesgue-p范數(shù)分別為
引理1[18]設(shè)函數(shù)g(t),h(t)(t∈[0,T])為勒貝格積分,若函數(shù)g(t)與h(t)的卷積
存在,則卷積積分的廣義Young不等式為
‖(g*h)(t)‖r≤‖g(t)‖q‖h(t)‖p
‖(g*h)(·)‖p≤‖g(t)‖1‖h(t)‖p
定義2Riemann-Liouville′s(R-L)的左側(cè)和右側(cè)分數(shù)階積分的定義為
式中,α>0,Γ(·)為Gamma函數(shù)。
Caputo左側(cè)和右側(cè)分數(shù)階微分的定義分別為
式中,α∈R+,[α]是α的整數(shù)部分。
性質(zhì)1[19]如果f(t)∈C[t0,∞),則
定義3[19]雙參數(shù)的Mittag-Leffler函數(shù)的定義為
特別地,當β=1時,單參數(shù)的Mittag-Leffler函數(shù)的定義為
引理3[15]設(shè)Φα,β(t)=tβ-1Eα,β(Atα),t∈[0,+∞),其中,α>0,β>0,A∈Cn×n,則
引理4[21]初值問題
等價于下面的積分方程
式中,A∈Cn×n,B∈Cn×p,0<α<1。
考慮一類分數(shù)階線性時不變系統(tǒng)
(1)
式中,t∈[0,T],α∈(0,1);xk(0)∈Rn,uk(t)∈Rp和yk(t)∈Rq分別為系統(tǒng)第k次重復(fù)操作的狀態(tài)向量、控制輸入向量和輸出向量;A∈Rn×n,B∈Rn×p和C∈Rq×n都為常數(shù)矩陣。
下面給出了分數(shù)階系統(tǒng)的一些基本假設(shè)。
(t∈[0,T])存在,且只存在期望的控制輸入和理想狀態(tài),使得
(2)
假設(shè)2CB為行滿秩矩陣。
對于分數(shù)階系統(tǒng)(1),首先考慮具有初始狀態(tài)學(xué)習(xí)的一階開環(huán)PDα-型分數(shù)階迭代學(xué)習(xí)控制算法
(3)
式中:Γp1和Γd1分別為比例和微分學(xué)習(xí)增益矩陣;ek(t)=yd(t)-yk(t)為系統(tǒng)第k次迭代時的跟蹤誤差。
眾所周知,系統(tǒng)運行中的反饋信息可以加速學(xué)習(xí)過程的收斂速度。因此,本文進一步研究了具有初始狀態(tài)學(xué)習(xí)的開閉環(huán)PDα-型分數(shù)階迭代學(xué)習(xí)控制算法。其表達式如下
(4)
式中,L=(Γp2+Γd2),Γp2,Γd2分別為比例和微分反饋增益矩陣。
顯然,當Γp2=Γd2=0時,控制算法(4)退化為具有初始狀態(tài)學(xué)習(xí)的一階開環(huán)PDα-型算法(3)。
定理1設(shè)分數(shù)階系統(tǒng)(1)滿足假設(shè)1~2,當控制律(3)作用于系統(tǒng)(1)時,若
ρ1=‖I-CBΓd1‖+
‖Φα,α(t)(BΓp1+ABΓd1)‖1<1
證明:根據(jù)引理4,系統(tǒng)(1)的狀態(tài)有如下表達式
(5)
因此
(6)
由引理2和引理3可以得到
(7)
把(7)式帶入(6)式,得
(8)
在(8)式兩邊同時取Lebesgue-p范數(shù),采用卷積積分的廣義Young不等式,可以得到
(9)
利用定理1的條件,取k→∞得到
因此,跟蹤誤差單調(diào)收斂到零,系統(tǒng)的輸出在Lebesgue-p范數(shù)意義下當k→∞時的[0,T]區(qū)間內(nèi)收斂到期望輸出。
定理證畢。
定理2假設(shè)分數(shù)階系統(tǒng)(1)滿足假設(shè)1~2,當控制算法(4)應(yīng)用于系統(tǒng)(1)時,若滿足條件:
1)ρ0=‖I-CBL‖<1,L=Γd1+Γd2,
2)ρ2ρ1<1
式中
則
證明將(4)式與(5)式結(jié)合,得到
(10)
與(7)式的推導(dǎo)類似,可以得出這樣的結(jié)論
(11)
和
(12)
將(11)式和(12)式代入(10)式可得
(13)
將t=0代入(12)式可得
(14)
在(14)式兩邊同時取范數(shù),可得
‖ek+1(0)‖≤ρ0‖ek(0)‖
(15)
式中,ρ0=‖I-CBΓd1-CBΓd2‖。
因此,根據(jù)條件1),可以得出結(jié)論
(16)
因此,表達式(13)采用這種形式
(17)
根據(jù)假設(shè)2可知,存在反饋增益微分矩陣Γd2,使得矩陣I+CBΓd2是非奇異矩陣。因此,在(17)式的兩邊左乘(I+CBΓd2)-1,兩邊同時取Lebesgue-p范數(shù),采用卷積積分的廣義Young不等式,可得
(18)
進一步
(19)
式中
γ=
(20)
根據(jù)定理2和引理5的條件,取k→∞,可以得出以下結(jié)論
(21)
定理證畢。
注3定理2的收斂條件ρ2ρ1<1不要求滿足ρ1<1或ρ2<1。因此,在控制算法(4)中,學(xué)習(xí)增益矩陣有了更多的選擇。
注4觀察定理1和定理2的證明,控制算法的收斂條件是充分的和不必要的。即當不滿足收斂條件時,在控制算法的作用下,系統(tǒng)的跟蹤誤差仍可能趨于零。
注5根據(jù)定理1和定理2的收斂條件,當滿足條件ρ2ρ1<ρ1<1時,開閉環(huán)PDα-型算法(4)的收斂速度比開環(huán)PDα-型算法(3)的收斂速度快。
考慮如下分數(shù)階線性連續(xù)時不變系統(tǒng)
(22)
系統(tǒng)(22)的重復(fù)操作區(qū)間設(shè)為[0,1]:所期望的輸出為yd(t)=0.8tsin2πt,t∈[0,1]。第一次迭代的初始狀態(tài)x1(0)是隨機選擇的,但不等于期望的初始狀態(tài)xd(0)。此外,初始控制輸入u1(t)(t∈[0,1])由Rand函數(shù)隨機生成。
設(shè)置控制算法(3)的相關(guān)參數(shù)為:Γp1=0.9,Γd1=1.6,計算可得ρ1=0.893 7<1,滿足定理1的收斂條件。
為了更好地說明所提出的具有初始狀態(tài)學(xué)習(xí)的開環(huán)PDα-型算法的性能,通過對比,采用了傳統(tǒng)的一階開環(huán)PDα-型算法。將傳統(tǒng)PDα-型算法應(yīng)用于具有任意初始狀態(tài)的系統(tǒng)(22)時,系統(tǒng)(22)在第4次和第12次迭代時的輸出以及從第1次迭代到第30次迭代的跟蹤誤差曲線分別如圖1和圖2所示。很明顯,隨著迭代次數(shù)的增加,系統(tǒng)輸出與期望輸出之間存在偏差。也就是說,系統(tǒng)的實際輸出不能準確地跟蹤給定的期望輸出,只能漸進地落在期望輸出的一個小鄰域內(nèi)。此時,在Lebesgue-2范數(shù)和上確界范數(shù)的意義下,系統(tǒng)在整個區(qū)間[0,1]的跟蹤誤差都是收斂有界的。
圖1 一階PDα-型控制算法跟蹤曲線 圖2 一階PDα-型控制算法的跟蹤誤差變化趨勢 圖3 初態(tài)學(xué)習(xí)的一階PDα-型控制算法跟蹤曲線
將提出的PDα-型算法(2)應(yīng)用于任意初始狀態(tài)的系統(tǒng)(22)時,系統(tǒng)(22)第4次和第12次迭代的輸出如圖3所示,跟蹤誤差如圖4所示。
圖4 初態(tài)學(xué)習(xí)的一階PDα-型控制算法的跟蹤誤差變化趨勢
顯然,系統(tǒng)的輸出可以完全跟蹤期望輸出,并且跟蹤誤差隨著迭代次數(shù)的增加單調(diào)收斂到零。以上結(jié)果表明,對于具有任意初始狀態(tài)的系統(tǒng)(22),所提出的算法(3)是可行和有效的。
控制算法(4)的相關(guān)參數(shù)設(shè)置為:Γp1=0.9,Γd1=1.9,Γp2=0.3,Γd2=2。計算可得ρ1=0.860 1<1,ρ2ρ1=0.670 2<1,ρ2ρ1<ρ1<1。顯然,滿足定理1和定理2中的收斂條件。
在上述條件下,將本文提出的PDα-型算法(3)和(4)分別應(yīng)用于任意初始狀態(tài)的系統(tǒng)(22),系統(tǒng)的跟蹤誤差如圖5所示。
圖5 算法(3)和算法(4)跟蹤誤差比較
可以看出,在Lebesgue-2范數(shù)意義下,隨著迭代次數(shù)的增加,本文算法(3)和(4)的跟蹤誤差單調(diào)地趨于零。此時,當算法(4)迭代7次時,跟蹤誤差達到誤差范圍0.004,而算法(3)需要11次迭代才能達到上述效果。因此,在給定適當?shù)膶W(xué)習(xí)增益下,算法(4)比算法(3)具有更快的收斂速度和更高的控制精度。
本文針對一類具有任意初始狀態(tài)的分數(shù)階線性連續(xù)系統(tǒng),為了消除任意初始狀態(tài)對系統(tǒng)的影響,提出了帶初始狀態(tài)學(xué)習(xí)的開環(huán)和開閉環(huán)PDα-型FOILC算法。在Lebesgue-p范數(shù)意義下,利用卷積積分的廣義Young不等式,討論了PDα-型算法的收斂性。理論分析和數(shù)值仿真表明,該PDα-型算法應(yīng)用于任意初始狀態(tài)系統(tǒng)時,隨著迭代時間的增加,跟蹤誤差單調(diào)收斂于零。
隨著迭代學(xué)習(xí)控制和分數(shù)階系統(tǒng)理論的進一步發(fā)展,還可以將分數(shù)階迭代學(xué)習(xí)控制應(yīng)用于分布參數(shù)系統(tǒng)、多智能體系統(tǒng)和切換系統(tǒng)的控制之中。