陳凱杰 施卉輝 陳強
(浙江工業(yè)大學信息工程學院 杭州310023)
迭代學習控制(iterative learning control,ILC)對于有限區(qū)間內(nèi)的重復(fù)跟蹤問題有著良好的控制性能。早期的迭代學習控制方法主要包括P 型、D 型等學習算法[1-3],利用壓縮映射進行收斂性分析,但往往要求滿足全局Lipschitz 條件。基于Lyapunov-Like 的迭代學習控制算法[4-6]引起了大家的關(guān)注,該方法不但不受全局Lipschitz 條件限制,并且能更充分地利用已知系統(tǒng)信息。
傳統(tǒng)ILC 方法往往要求系統(tǒng)滿足初值一致條件[7-8],即系統(tǒng)狀態(tài)初值與期望軌跡初值嚴格一致。但是,在系統(tǒng)實際運行過程中,由于建模的不確定性、環(huán)境因素影響和機械精度不足等原因,系統(tǒng)初值一致條件不能被滿足。文獻[9]利用狀態(tài)初值設(shè)計誤差函數(shù)和時變邊界層函數(shù),并利用時變邊界層的衰減特性,實現(xiàn)系統(tǒng)誤差的漸近收斂。文獻[10]討論了ILC 中的5 種初值情況并提出了修正期望軌跡方法,利用系統(tǒng)初值和期望軌跡設(shè)置過渡軌跡,保證系統(tǒng)初值與修正后的期望軌跡初值一致。文獻[11]提出了誤差跟蹤方法,通過設(shè)計期望誤差軌跡和迭代學習控制器,保證誤差軌跡沿預(yù)設(shè)的期望誤差軌跡收斂。誤差跟蹤方法避免了對期望軌跡的依賴,當期望軌跡發(fā)生變化時,期望誤差軌跡的形式不發(fā)生改變。此外,對于接入點的位置和導數(shù)可以簡單設(shè)置為0,減小了計算量。文獻[12]利用定積分的起始點為0 的特點,構(gòu)造了積分形式的期望誤差軌跡。文獻[13]把誤差跟蹤方法推廣到更加一般的非線性嚴格反饋系統(tǒng),使得系統(tǒng)誤差沿著預(yù)設(shè)的誤差期望軌跡收斂到零附近一個很小的鄰域內(nèi)。
死區(qū)是一種很常見的非線性環(huán)節(jié),比如對于直流電機、伺服閥等,死區(qū)的存在會降低控制精度,限制控制性能,對控制設(shè)計增加難度。逆模型補償[14]通過直接加入死區(qū)的逆模型,從而抵消死區(qū)的影響。文獻[15]將線性死區(qū)擴展到了非對稱的死區(qū),并設(shè)計一種自適應(yīng)補償算法,實現(xiàn)對期望軌跡的精確跟蹤。文獻[16]針對一類具有非對稱致動器死區(qū)的多輸入多輸出系統(tǒng),提出了一種新型的近似模型,并設(shè)計魯棒自適應(yīng)律,實現(xiàn)誤差漸近收斂。文獻[17]針對帶有死區(qū)輸入非嚴格反饋系統(tǒng),提出一種有限時間在線最優(yōu)跟蹤控制算法,實現(xiàn)跟蹤誤差的有限時間收斂。但是,當系統(tǒng)為有限區(qū)間非參數(shù)不確定系統(tǒng)時,單一自適應(yīng)難以實現(xiàn)高精度的跟蹤控制。因此,本文采用迭代學習控制,通過迭代學習進一步提高精度。
基于上述討論,本文針對具有非對稱死區(qū)輸入的非參數(shù)不確定系統(tǒng),提出一種誤差跟蹤迭代學習控制算法,在指定區(qū)間內(nèi)實現(xiàn)對期望軌跡的高精度跟蹤。利用中值定理將非對稱死區(qū)轉(zhuǎn)換為線性形式,并利用徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)對系統(tǒng)的不確定性進行逼近。針對ILC 初值問題,設(shè)計新型期望誤差軌跡,使得系統(tǒng)迭代初始值可任意設(shè)置,放寬經(jīng)典ILC 的初值一致條件。此外,本文基于Lyapunov-Like 理論,構(gòu)造迭代學習控制器和組合自適應(yīng)律,實現(xiàn)跟蹤誤差沿預(yù)設(shè)的期望誤差軌跡收斂到0 的鄰域附近。
考慮一類具有非對稱死區(qū)輸入的非參數(shù)不確定系統(tǒng),其表達式為
其中,k(k=0,1,2,…) 表示迭代次數(shù),t∈[0,T]表示運行時間,T為迭代長度,xk=[x1,k,x2,k]T∈R2表示系統(tǒng)狀態(tài),f(x) 為未知光滑但有界的非線性函數(shù),f(x) 反映了系統(tǒng)中的非參數(shù)不確定性,b表示未知的常數(shù)控制增益且滿足b >0,yk∈R表示系統(tǒng)輸出,vk=vk(t) ∈R表示系統(tǒng)控制輸入,D(vk) 表示非對稱死區(qū)環(huán)節(jié),其模型具體為
其中,mr(vk)和ml(vk) 表示未知且光滑的非線性函數(shù),br >0和bl <0 為常數(shù),表示未知的死區(qū)寬度。如圖1 所示。
圖1 非對稱死區(qū)
本文控制目標是針對具有非對稱死區(qū)輸入的非參數(shù)系統(tǒng)式(1),設(shè)計誤差跟蹤迭代學習控制器vk,使得當?shù)螖?shù)k趨向無窮時,在任意初態(tài)下,實現(xiàn)系統(tǒng)輸出x1,k對期望軌跡xd的高精度跟蹤。
RBF 神經(jīng)網(wǎng)絡(luò)對未知的光滑非線性函數(shù)有良好的逼近作用,因此RBF 神經(jīng)網(wǎng)絡(luò)經(jīng)常被用于估計光滑的非線性函數(shù)。對于任意光滑的未知函數(shù)h(x),存在一個神經(jīng)網(wǎng)絡(luò)使得
其中,X∈ΩZ為輸入向量,ΩZ∈R為一緊湊子集;ε為逼近誤差,存在一個正常數(shù)εN,滿足| ε|≤εN;?(X)=[?1(X),…,?l(X)]T∈Rl為神經(jīng)網(wǎng)絡(luò)的基函數(shù),l(l >1) 為神經(jīng)網(wǎng)絡(luò)的節(jié)點數(shù);W?∈Rl為理想權(quán)重矩陣,定義為
其中,W∈Rl為權(quán)重矩陣,選擇高斯函數(shù)
其中,wi為中心點,ηi表示寬度。
定義跟蹤誤差如式(6)所示。
其中,xd表示期望輸出軌跡,表示期望軌跡的一階導數(shù)。
根據(jù)跟蹤誤差的定義,將系統(tǒng)式(1)轉(zhuǎn)換為誤差形式:
其中表示期望軌跡的二階導數(shù)。
在進行控制器設(shè)計和穩(wěn)定性分析之前,需要對死區(qū)環(huán)節(jié)進行如下假設(shè)。
假設(shè)1函數(shù)ml(vk)和mr(vk) 光滑且存在未知的正常數(shù)ml0、ml1、mr0和mr1,使得
考慮到ml(bl)=mr(br)=0,根據(jù)微分中值定理,非對稱死區(qū)環(huán)節(jié)式(2)可以重寫為
根據(jù)假設(shè)1 和式(10)~(14),可以證明時變參數(shù)mk和dk的有界性。
由此,可以將式(7)進一步寫成
注1當-bl=br,ml(vk)和mr(vk) 為常數(shù)時,非對稱死區(qū)環(huán)節(jié)式(2)表示為傳統(tǒng)的對稱線性死區(qū)。因此,非對稱死區(qū)更具有代表性,對非對稱死區(qū)進行研究具有理論意義。
傳統(tǒng)的迭代學習控制器設(shè)計需要系統(tǒng)滿足初值一致條件[6-7],具體為
式(18)需要在每次迭代中都要恒成立,即對?k成立。但是,系統(tǒng)在實際運行過程中,由于建模的不確定性、外部干擾、機械精度等原因,導致條件式(18)不能在任意次迭代中恒成立。
因此,本文設(shè)計了一種新型的期望誤差軌跡,有效避免了條件式(18)的限制,表達式如式(19)所示。
期望誤差軌跡式(19)滿足下列等式性質(zhì):
式(19)的構(gòu)造只需要知道系統(tǒng)的誤差初值e1,k(0) 及其導數(shù)的初值e2,k兩個信息,此外,接入點(t=Δ)的導數(shù)設(shè)置為0,簡化了期望誤差軌跡接入點時刻的導數(shù)信息。由于期望誤差軌跡的設(shè)置與期望軌跡xd無關(guān),因此對于不同的期望軌跡,期望誤差軌跡的形式無需改變。
圖2 反映了期望誤差軌跡的變化情況。當誤差軌跡跟蹤上期望誤差軌跡時,由于期望誤差軌跡在[Δ,T] 為0 誤差軌跡,因此狀態(tài)軌跡能在指定區(qū)間[Δ,T] 實現(xiàn)對期望軌跡的高精度跟蹤。對比式(18)和式(19),可以發(fā)現(xiàn)傳統(tǒng)迭代學習控制中是對系統(tǒng)狀態(tài)初值進行限制,而本文所提方法是通過限制期望誤差軌跡來避免限制系統(tǒng)狀態(tài)初值。期望誤差軌跡可以隨迭代變化,而系統(tǒng)狀態(tài)初值的精確重置由于環(huán)境因素難以保證。
圖2 期望誤差軌跡
對式(26)求導,得到:
定理1針對系統(tǒng)式(1),給定期望軌跡xd,設(shè)計期望誤差軌跡式(19),虛擬控制器式(24),實際控制器式(30),組合自適應(yīng)律式(31),跟蹤誤差在任意初態(tài)下沿著預(yù)設(shè)軌跡收斂以L2范數(shù)的形式收斂到0 點附近的鄰域內(nèi)。
證明定義復(fù)合能量函數(shù):
對式(33)進行求導,由第2 節(jié)的分析,可得:
證畢。
考慮如下系統(tǒng)[18]:
本節(jié)以一個具有死區(qū)輸入非參數(shù)不確定系統(tǒng)式(44)進行驗證所提誤差跟蹤迭代學習控制方法的有效性,并將本文所提方法(M1)與自適應(yīng)控制方法(M2)進行對比。
M1 為本文提出的誤差跟蹤迭代學習控制方法,包括期望誤差軌跡式(19)、虛擬控制器式(24)、實際控制器式(30)和組合自適應(yīng)律式(31)。
M2 為自適應(yīng)控制方法,其虛擬控制器和實際控制器分別設(shè)計為
γ為滿足γ >0 的常數(shù)。
系統(tǒng)期望軌跡設(shè)定為xd(t)=0.2cos(πt),系統(tǒng)的迭代長度設(shè)定為T=5 s,采樣時間為tc=0.001 s??刂破骱蛯W習律參數(shù)如表1 所示。
表1 參數(shù)表
仿真結(jié)果如圖3~圖7 所示。圖3 為M1 和M2 方法的狀態(tài)跟蹤效果圖??梢园l(fā)現(xiàn),當?shù)螖?shù)為50時,本文所提M1 方法比M2 方法具有更高的跟蹤精度。圖4 為M1 和M2 方法的誤差跟蹤效果圖,可以發(fā)現(xiàn)M1 方法的誤差能沿著預(yù)設(shè)的期望誤差軌跡收斂,并且穩(wěn)態(tài)誤差比M2方法更小。圖5為k=1、10、50 時的誤差跟蹤圖,從圖中可以看出,對于任意初值,誤差初值都能與期望誤差初值重合,從而避免了初值一致條件,與上述理論一致。圖6 給出了M1和M2 的控制信號與死區(qū)輸入,可以發(fā)現(xiàn),M1 和M2的實際輸入信號相差不明顯。圖7 反映了性能指標Jmax的變化情況,由圖可知,隨著迭代次數(shù)的不斷變化,本文所提方法M1 的最大誤差逐漸減小,控制精度不斷提高。綜合圖3~圖7,可以得到以下結(jié)論,針對具有死區(qū)輸入的非參數(shù)不確定系統(tǒng),本文所提方法M1 能實現(xiàn)在任意誤差下,誤差沿著期望誤差軌跡收斂,并且在指定區(qū)間[Δ,T] 上實現(xiàn)對狀態(tài)的高精度跟蹤。
圖3 狀態(tài)跟蹤效果(k=50)
圖4 誤差跟蹤效果圖(k=50)
圖5 在不同迭代次數(shù)中M1 的誤差跟蹤效果
圖6 控制信號和死區(qū)輸出
圖7 性能指標
本文針對一類具有死區(qū)輸入的非參數(shù)不確定系統(tǒng)構(gòu)造了一種誤差跟蹤迭代學習控制方法。通過設(shè)計新型期望誤差軌跡,放寬了傳統(tǒng)ILC 的初值一致條件,同時預(yù)設(shè)了誤差的收斂軌跡。利用RBF 神經(jīng)網(wǎng)絡(luò)對系統(tǒng)中的不確定性和死區(qū)參數(shù)進行估計,并設(shè)迭代學習控制器和組合自適應(yīng)律,使得誤差在指定區(qū)間內(nèi)收斂到0 附近一個很小的鄰域內(nèi)。最后,基于Lyapunov-Like 理論進行穩(wěn)定性分析,并通過仿真驗證該方法的有效性。