基于邊界層的一類不確定系統(tǒng)的迭代學習控制*
李向陽田森平
(華南理工大學 自動化科學與工程學院, 廣東 廣州 510640)
摘要:針對一類具有任意初態(tài)和非周期有界擾動的不確定非線性時變系統(tǒng),提出一種基于邊界層的迭代學習控制方法,將邊界層設(shè)計成一個具有剩余寬度的指數(shù)衰減函數(shù),通過邊界層把任意初態(tài)問題轉(zhuǎn)換為零初值迭代學習問題.針對周期和非周期不確定性擾動,分別設(shè)計周期項的學習律和非周期項的邊界學習律,然后在此基礎(chǔ)上給出了迭代學習控制算法.文中給出了相關(guān)定理,并應(yīng)用類Lyapunov方法給出了定理的詳細證明.仿真結(jié)果表明,所提出的算法是有效的,軌跡跟蹤誤差能收斂到邊界層.
關(guān)鍵詞:不確定系統(tǒng);迭代學習控制;初始狀態(tài)問題;邊界層;類Lyapunov方法
中圖分類號:TP273
doi:10.3969/j.issn.1000-565X.2015.03.016
文章編號:1000-565X(2015)03-0111-10
收稿日期:2014-09-29
基金項目:* 國家自然科學基金資助項目(61403142); 教育部博士點基金資助項目(20120172110026); 華南理工大學中央高?;究蒲袠I(yè)務(wù)專項資金資助項目-博士啟動項目(2014ZB0028)
作者簡介:黃道平(1961-),男,博士,教授,主要從事故障診斷、軟測量研究.E-mail: audhuang@scut.edu.cn
在迭代學習控制(ILC)的研究中,往往要求每次迭代的系統(tǒng)初始狀態(tài)和期望軌跡的初值一致[1],但是在實際應(yīng)用時,每次迭代學習不可避免地存在初始誤差,迭代學習控制的初始值問題是迭代學習控制研究的基本問題.解決初始值問題的方法有初始控制量校正和初始期望軌跡校正等.初始控制量校正方法又可分為壓縮映射方法[2-6]和類Lyapunov方法[7-8].初始期望軌跡校正的方法是在較小的初始時間區(qū)間上設(shè)計一段從零初始值到期望軌跡的過渡軌跡[4,9],過渡軌跡之后采用原來的期望軌跡.近年來,基于邊界層的初值問題解決方法也得到關(guān)注[10-11],基于邊界層的方法能兼顧跟蹤誤差的控制精度和初始過渡過程的控制量大小,方便實際應(yīng)用.
實際的被控對象往往是非線性時變的,除了有周期不確定項外,還有非周期擾動.對于周期不確定項,如果它滿足線性參數(shù)化條件,即不確定項可分解為一個與狀態(tài)無關(guān)的未知時變函數(shù)和一個與狀態(tài)有關(guān)的已知時變函數(shù)的乘積的形式,則可以應(yīng)用自適應(yīng)迭代學習方法來求解[9,12-17].如果周期不確定項不滿足線性參數(shù)化條件,則不能直接應(yīng)用上述自適應(yīng)迭代學習控制方法來求解,文獻[18]應(yīng)用模糊系統(tǒng)建模的方法把系統(tǒng)不確定項建模為滿足上述線性參數(shù)化形式,再采用自適應(yīng)迭代學習控制方法求解,同時建模誤差采用魯棒控制的方法來克服.對于系統(tǒng)不確定項不滿足線性參數(shù)化條件的迭代學習控制問題,文中提出一種直接對系統(tǒng)不確定項進行學習的迭代學習控制算法;另一方面,對于非周期擾動,一般擾動的界是有限的[18],根據(jù)該特點,提出了一種適合對非周期擾動的界進行學習的迭代學習控制方法.
1問題的提出
考慮如下2-D形式表示的不確定非線性時變系統(tǒng)的迭代學習控制:
?
(1)
假設(shè)1期望軌跡r1(t)在工作區(qū)間t∈[0,T]有n階導數(shù),且有
(2)
假設(shè)2f和b在r的鄰域D(r∈D?Rn)上有界且滿足局部Lipschitz連續(xù)條件,且b的符號保持不變.設(shè)x1、x2和x為D中系統(tǒng)任意狀態(tài),則有:
(3)
(4)
(5)
(6)
式中,Lf、fM、Lb、bm和bM為適當正數(shù).
假設(shè)3d為任意非周期有界擾動,有
(7)
式中dM(t)為擾動的界.
假設(shè)4xi(0,k)為系統(tǒng)狀態(tài)的任意初始值,即?i∈[1,n],xi(0,k)≠ri(0),ri(0)為期望軌跡的初始值,但有x(0,k)∈D.
定義跟蹤誤差為
ei(t,k)=xi(t,k)-ri(t)
(8)
則系統(tǒng)(1)的迭代學習控制問題是一個具有非零初始誤差和周期不確定性以及非周期擾動的迭代學習控制問題.
由式(8)可以定義滑動面S(t,k)為
(9)
式中:e=(e1,e2,…,en)T,為誤差向量;c=(c1,c2,…,cn)T,為Hurwitz多項式的系數(shù)向量,且取cn=1.由Hurwitz多項式的性質(zhì)有,當S(t,k)有界收斂時,ei(t,k)也有界收斂.由式(9)有
(10)
對于系統(tǒng)(1)的迭代學習控制,有初始值擾動和任意非周期有界擾動,為此引入邊界層方法來克服其擾動.
針對系統(tǒng)(1)的非零初始誤差,設(shè)計如下時變邊界層函數(shù):
S(t,k)+φ(t,k),S(t,k)<-φ(t,k)
(11)
式中,S(0,k)為滑動面函數(shù)的初始值,φ(t,k)為
(12)
式中:α>0,為衰減因子;δ>0,為跟蹤容許誤差.由式(11)所定義的修正滑動面Sφ(t,k)滿足零初始條件,即有
Sφ(0,k)=0
(13)
由式(11)有Sφ(t,k)的導數(shù)為
(14)
式中Iδ(S(0,k))為示性函數(shù),定義為
(15)
在上述邊界層基礎(chǔ)上可以設(shè)計系統(tǒng)(1)的迭代學習控制算法.
為實現(xiàn)對非周期擾動d(t,k)界的限幅學習,定義如下飽和函數(shù)
(16)
(17)
對于式(16)的飽和函數(shù),有如下引理1.
(18)
證明分3種情況證明.
證畢.
對于系統(tǒng)(1)的控制增益b(t,x),實際中總是可以對其獲得一個粗略的估計,可以以此為基礎(chǔ)進行控制算法設(shè)計.
假設(shè)5系統(tǒng)(1)的b(t,x)有一個符號相同的估計b0(t,x),且b0(t,x)同樣滿足式(5)和式(6).
對式(11)邊界層,設(shè)計如下限幅學習律實現(xiàn)對d(t,k)邊界的學習:
(19)
對系統(tǒng)(1)中f(t,x)和b(t,x)的迭代學習,定義如下綜合函數(shù):
(20)
并設(shè)計如下學習律對其進行學習:
v2(t,k)=v2(t,k-1)+γ2Sφ(t,k)
(21)
式中,γ2>0,為學習增益.
(22)
(23)
在上述式(19)和式(21)學習律基礎(chǔ)上,設(shè)計如下控制律對系統(tǒng)(1)進行迭代學習控制:
(24)
式中,β≥0,為控制律的反饋增益.
2.3收斂定理及其證明
基于式(19)和式(21)的學習律和式(24)的控制律有定理1.
定理1對于系統(tǒng)(1)的迭代學習控制,在時間區(qū)間t∈[0,T]上進行迭代學習控制,在滿足假設(shè)1-5前提下,采用式(19)和式(21)的學習律和式(24)的控制律,可以實現(xiàn)所要求的控制精度,即有下列結(jié)論.
(1)Sφ(t,k)有界,且有下式成立:
(25)
(2)S(t,k)有界,且有下式成立:
(26)
證明由式(10)和式(1)有
(27)
由式(14)有
(28)
結(jié)合式(27)和式(28)有
(29)
把式(24)的控制量代入式(29)并整理有
(30)
(31)
由式(12)有
(32)
考慮到式(32),由式(30)有
(33)
定義V(t,k)為如下類Lyapunov函數(shù)[19-21]:
(34)
式中,
(35)
先證明ΔV(t,k)的單調(diào)性,然后證明Sφ(t,k)的收斂性.由式(33)有
ΔV(t,k)=V(t,k)-V(t,k-1)=
(36)
式中,
把式(33)帶入Part0,并考慮零初始條件有
(37)
對Part1應(yīng)用(a-q)2-(a-h)2=-(q-h)2-2(q-h)(a-q)(式中a、q、h為實數(shù))有
由學習律式(19),上式中第2個積分的被積函數(shù)可化為
對上式應(yīng)用引理1有
把上式代入Part1有
(38)
對Part2應(yīng)用(a-q)2-(a-h)2=-(q-h)2-
2(q-h)(a-q)有
把學習律(21)代入上式Part2中有
(39)
把式(37)-(39)代入式(36)有
(40)
式中,
(41)
Part4可以化簡為
(42)
式(41)右邊取絕對值并考慮式(22)有
(43)
考慮到式(42)和式(43),由式(40)有
(44)
選取
(45)
則由式(44)有
(46)
由于b0與b具有相同的符號,因此ΔV(t,k)是隨k遞減的.
下面證明Sφ(t,k)的收斂性.先證明V(t,1)有界,V(t,k)第1次迭代值為
V(t,1)=ΔV(t,1)+V(t,0).
把式(36)中k=1的情況帶入上式,并采用獲得式(44)的推導方法可得
(47)
當滿足式(45)時,由式(47)和定義式(34)有
(48)
(49)
由于V(t,k)有界和收斂,則Sφ(t,k)也有界和收斂,從而e(t,k)和u(t,k)都有界和收斂.
由于
V(t,k)=(V(t,k)-V(t,k-1))+…+
(V(t,2)-V(t,1))+V(t,1),
重復(fù)應(yīng)用式(46)有
對上式兩邊取極限有
(50)
(51)
因此,根據(jù)式(15)有
即式(25)和式(26)成立.
證畢.
關(guān)于定理1的說明如下:
(1)隨著迭代次數(shù)增加,定理1的迭代學習控制算法是把滑動面誤差曲線S控制在邊界層[-φ,φ]內(nèi).φ(t,k)可以采用不同的形式,選擇δ>0,一方面可以避免計算過程中出現(xiàn)的數(shù)值不穩(wěn)定,另一方面可以減少控制量的抖動.
(2)在應(yīng)用定理1時,不要求像自適應(yīng)迭代學習控制那樣要求f(t,x)和b(t,x)滿足參數(shù)化條件,而且只需通過試驗數(shù)據(jù)對b(t,x)進行粗略估計,甚至可以直接根據(jù)式(6)取其邊界之間的常數(shù),如sgn(b(t,x))(bm+bM)/2,控制算法自動通過迭代學習補償未建模部分;當b(t,x)的估計誤差較大時,從式(45)可以看出,需要較大的反饋增益β才能保證時間域穩(wěn)定性.
(3)從定理1的證明過程中可以看出,只要γ1>0和γ2>0即可保證迭代域的收斂性,但是較大的γ1和γ2具有較快的收斂速度.為保證周期擾動的學習速度快于非周期擾動的學習速度,實際中可以選擇γ2>20γ1,這樣可使控制更加光滑和節(jié)能.
3仿真研究
考慮如下的二階非線性不確定系統(tǒng)[18]:
(52)
式中:
(53)
(54)
d(t,k)=d1sinω1+d2cosω2
(55)
其中,d1=rand,d2=rand,ω1=5rand,ω2=5rand.
式(52)-(55)中,x1(t,k)和x2(t,k)分別為倒立擺的角位移和角速度,g為重力加速度,mc為小車的質(zhì)量,m為擺的質(zhì)量,l為擺的半長度,u為擺的作用力.采用與文獻[18]相同的參數(shù)進行仿真,取mc=1,m=0.1,l=1,rand為輸出為0~1之間的隨機函數(shù).期望軌跡為
(56)
系統(tǒng)狀態(tài)初值為
(57)
圖1 J 1隨迭代次數(shù)k的變化規(guī)律 Fig.1 J 1 versus iterations k
圖2 S(t,k)與φ(t,k)隨時間的變化規(guī)律 Fig.2 S(t,k) and φ(t,k) versus time
圖3 第10次迭代后的r 1和x 1 Fig.3 r 1 and x 1 at the 10th iteration
圖4 第10次迭代后的r 2和x 2 Fig.4 r 2and x 2 at the 10th iteration
圖5 第10次迭代后的控制輸入u Fig.5 Control input u at the 10th iteration
仿真結(jié)果表明,隨著迭代次數(shù)的增加,系統(tǒng)軌跡的跟蹤誤差迅速減少,經(jīng)過10次迭代后的滑動誤差完全在邊界層以內(nèi),得到了滿意的效果.對比文獻[18]的圖1可以看出,文中方法具有更快的收斂速度.
4結(jié)語
文中提出了一種適合任意初始條件和任意有界干擾的基于邊界層的不確定系統(tǒng)的迭代學習控制方法,給出了相關(guān)算法定理,并應(yīng)用類Lyapunov方法給出了詳細證明,該算法不要求系統(tǒng)的不確定項滿足線性參數(shù)化條件,只需了解不確定部分的粗略估計和變化范圍,估計誤差通過迭代學習自動補償.仿真結(jié)果表明,文中提出的算法是有效的,比要求系統(tǒng)不確定項滿足線性參數(shù)化條件的自適應(yīng)迭代學習控制方法具有更好的適用性.
參考文獻:
[1]TianSen-ping,XieSheng-li,FuYu-li.Fastalgorithmofiterativelearningcontrol[J].JournalofSouthChinaUniversityofTechnology:NaturalScienceEdition,2002,30(5):37-40.
田森平,謝勝利,傅予力.一種新的迭代學習控制快速算法[J].華南理工大學學報:自然科學版,2002,30(5):37-40.
[2]PorterB,MohamedSS.Iterativelearningcontrolofpartiallyirregularmultivariableplantswithinitialimpulsiveaction[J].InternationalJournalofSystemsScience,1991,22(3):447-454.
[3]LeeHS,BienZ.Studyonrobustnessofiterativelearningcontrolwithnon-zeroinitialerror[J].InternationalJournalofControl,1996,64(3):345-359.
[4]孫明軒,黃寶健.迭代學習控制[M].北京:國防工業(yè)出版社,1999.
[5]ParkKH.Anaverageoperator-basedPD-typeiterativelearningcontrolforvariableintialstateerror[J].IEEETransactionsonAutomaticControl,2005,50(6):865-869.
[6]阮小娥,趙建永.具有初始狀態(tài)不確定性的非線性系統(tǒng)脈沖補償?shù)鷮W習控制[J].控制理論與應(yīng)用,2012,29(8):993-1000.
RuanXiao-e,ZhaoJian-yong.Pulsecompensatediterativelearningcontroltononlinearsystemswithinitialstateuncertainty[J],ControlTheory&Applications,2012,29(8):993-1000.
[7]SunMing-xuan,WangDan-wei.Iterativelearningcontrolwithinitialrectifyingaction[J],Automatica,2002,38(7):1177-1182.
[8]LiXD,ChowTWS,HoJKL,etal.Iterativelearningcontrolwithinitialrectifyingactionfornonlinearcontinuoussystems[J].IETControlTheoryandApplicaition,2009,3(1):49-55.
[9]孫明軒,嚴求真.迭代學習控制系統(tǒng)的誤差跟蹤設(shè)計方法[J].自動化學報,2013,39(3):251-262.
SunMing-xuan,YanQiu-zhen.Errortrackingofiterativelearningcontrolsystems[J].ActaAutomaticaSinica,2013,39(3):251-262.
[10]ChienChiang-ju,HsuChun-te,YaoChia-yu.Fuzzysystem-basedadaptiveiterativelearningcontrolfornonli-nearplantswithinitialstateerrors[J].IEEETransactionsonFuzzySystems,2004,12(5):724-732.
[11]何熊熊,秦貞華,張端.基于邊界層的不確定機器人自適應(yīng)迭代學習控制[J].控制理論與應(yīng)用,2012,29(8):1090-1093.
HeXiong-xiong,QinZhen-hua,ZhangDuan.Adaptiveiterativelearningcontrolforuncertainrobotbasedonboundarylayer[J].ContorlTheory&Applications,2012,29(8):1090-1093.
[12]YinChenkun,XuJian-xin,HouZhongsheng.AnILCschemeforaclassofnonlinearsystemswithtime-varyingparameterssubjecttosecond-orderinternalmodel[C]∥ProceedingsofJoint48thIEEEConferenceonDecisionandControland28thChineseControlConference.Shanghai:IEEE,2009:452-457.
[13]YinChenkun,XuJian-xin,HouZhongsheng.Ahigh-orderinternalmodelbasediterativelearningcontrolfornonlinearsystemswithtime-iteration-varyingparameters[J].IEEETransactionsonAutomaticControl,2010,55(11):2665-2670.
[14]朱勝,孫明軒,何熊熊.嚴格反饋非線性時變系統(tǒng)的迭代學習控制[J].自動化學報,2010,36(3):454-458.
ZhuSheng,SunMing-Xuan,HeXiong-Xiong.Iterativelearningcontrolofstrict-feedbacknonlineartime-varyingsystems[J].ActaAutomaticaSinica,2010,36(3):454-458.
[15]XuJX,YanR.Oninitialconditionsiniterativelearningcontrol[J].IEEETransactionsonAutomaticControl,2005,50(9):1349-1354
[16]ParkBH,KuntY,LeeJS.Adaptivelearningcontrolofuncertainroboticsystems[J].InternationalJournalofControl,1996,65(5):725-744.
[17]XuJian-xin.Recentadvancesiniterativelearningcontrol[J].ActaAutomaticaSinica,2005,31(1):132-142.
[18]ChienChiang-ju.Acombinedadaptivelawforfuzzyite-rativelearningcontrolofnonlinearsystemswithvaryingcontroltasks[J].IEEETransactionsonFuzzySystems,2008,16(1):40-51.
[19]XuJian-xin,XuJing.Oniterativelearningfromdifferenttrackingtasksinthepresenceoftime-varyinguncertainties[J].IEEETransactionsonSystems,Man,andCybernetics-PartB:Cybernetics,2004,34(1):589-597.
[20]ChiRonghu,HouZhongsheng,XuJianxin.AdaptiveILCforaclassofdiscrete-timesystemswithiteration-varyingtrajectoryandrandominitialcondition[J].Automatica,2008,44(8):2207-2213.
[21]XuJian-xin,YingTan.Acompositeenergyfunction-basedlearningcontrolapproachfornonlinearsystemswithtime-varyingparametricuncertainties[J].IEEETransactionsonAutomaticControl,2002,47(11):1940-1945.
BoundaryLayer-BasedIterativeLearningControlforaClassof
UncertainSystems
Li Xiang-yangTian Sen-ping
(SchoolofAutomationScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510640,Guangdong,China)
Abstract:For a class of uncertain nonlinear time-varying systems with arbitrary initial states and aperiodic bounded disturbance, an iterative learning control (ILC) method on the basis of boundary layer is presented. In this me-thod, boundary layer is designed as a decaying exponential function with residual width, the arbitrary initial state problem of ILC is transformed into a zero initial state problem by the designed boundary layer, and learning laws of periodic and aperiodic terms are designed for periodic and aperiodic disturbances, respectively. On the basis of these two laws, an ILC algorithm is presented, and the corresponding theorem is given with detail proof through Lyapunov-like approach. Simulated results show that the proposed algorithm is effective and is capable of converging trajectory tracking errors to boundary layer.
Keywords:uncertainsystem;iterativelearningcontrol;initialstateproblem;boundarylayer;Lyapunov-likeapproach
Foundationitems:SupportedbytheNationalNaturalScienceFoundationofChina(NSFC) (61403142)andthePh.D.ProgramsFoundationofMinistryofEducationofChina(20120172110026)
?通信作者: 邱禹(1988-),男,博士生,主要從事故障診斷研究.E-mail:qy-zq1988@163.com