劉青,倪驍驊,郭祥東
(1.江蘇大學機械工程學院,江蘇鎮(zhèn)江 212013;2.鹽城工學院機械優(yōu)集學院,江蘇鹽城 224051;3.安徽理工大學機械學院,安徽淮南 232001)
近年來,對非線性觀測器的研究進展較大,如:高增益觀測器,輸出延時觀測器[1-2],但是傳統(tǒng)的狀態(tài)觀測器需要對被觀測對象進行精確的建模[3]而且抗干擾能力較差[4]。文中采用基于改進的BP神經(jīng)網(wǎng)絡的狀態(tài)觀測器逼近系統(tǒng)中未知的非線性部分,大大降低了對模型的依賴程度以
及狀態(tài)觀測器的復雜程度,并在神經(jīng)網(wǎng)絡的權值自適應律中加入了誤差修正項以增強系統(tǒng)的抗干擾性能。
另外,雖然機械手一般都裝有高精度傳感器測量關節(jié)位置,但是測得的角速度信號一般容易受到外界的干擾,使得機械手在高速運動或者大負載運行時出現(xiàn)超調(diào)抖動和爬行現(xiàn)象[5-6],故將該觀測器與反演控制相結合,將估計速度代替實際速度,可以避免實際中對速度信號的測量。
考慮如下MIMO非線性系統(tǒng):
式中:u∈Rn是系統(tǒng)的控制輸入;y∈Rl為系統(tǒng)的輸出;g(x,u)為系統(tǒng)中未知的非線性函數(shù);x為被觀察的狀態(tài)變量;A為Hurwitz矩陣。
基本的狀態(tài)觀測器設計為:
式中:x^為狀態(tài)x的估計值;G為狀態(tài)觀測器的增益;g^(x,u)為g(x,u)的估計值,由于三層BP神經(jīng)網(wǎng)絡可以以任意精度逼近任意的非線性函數(shù),采用BP神經(jīng)網(wǎng)絡對其進行逼近,則
式中:W與V分別為神經(jīng)網(wǎng)絡輸入層與隱層的權值向量;ε為BP網(wǎng)絡的逼近誤差,x-=[x u],σ(·)為隱層神經(jīng)元的傳遞函數(shù),通常是一個Sigmoidal函數(shù):
其中:Vi為權值矩陣V的第i行,)為的第i個元素。
假設理想權值W,V均有界且有:‖W‖F(xiàn)≤WM,‖V‖F(xiàn)≤VM,Sigmoidal函數(shù)也是有界的,即‖σ(Vx-)‖≤σM,那么g(x,u)可以通過下式來逼近的逼近可以表示為[7]:
定義狀態(tài)估計誤差為:x~=x-x^
由式(1)、(2)、(3)可得誤差狀態(tài)方程如下:
其中:
一旦神經(jīng)網(wǎng)絡的結構確定之后,則應該定義適當?shù)膶W習規(guī)則來訓練神經(jīng)網(wǎng)絡。BP神經(jīng)網(wǎng)絡結構簡單,并被廣泛地應用于分類、鑒定、觀測和控制問題中。文中基于改進的BP算法提出了一種新的學習規(guī)則,并通過Lyapunov直接法保證其穩(wěn)定性。權值自適應律基于改進的BP算法,為保證其魯棒性,可以添加與觀測誤差有關的修正項。因此,考慮文獻[8],基于傳統(tǒng)BP算法的權值自適應律可表達如下:
式中:ρ1,ρ2>0為修正因子;J=(1/2)(yTy)為目標函數(shù);η1,η2>0為BP算法的學習律。
那么,
其中m,m為隱層神經(jīng)元個數(shù)。式(9)應用動態(tài)反向傳播的方法以及非線性動態(tài)系統(tǒng)來求解梯度以及。但是這會使觀測器變得非常復雜而且使得實時實現(xiàn)該方法變得非常困難。因此文中使用梯度的靜態(tài)近似值,即令=0,將BP算法進行改進如下:
由式(7)、(8)、(10)可知:式(5)權值自適應律可改寫如下:
于是有定理:對于式(1)所示的系統(tǒng)以及式(4)所示的神經(jīng)網(wǎng)絡觀測器,如果神經(jīng)網(wǎng)絡權值的自適應律設計為式(11),那么系統(tǒng)的,即狀態(tài)估計誤差,權值估計誤差以及輸出誤差均有界。
證明:由式(11)知:
定義Lyapunov函數(shù)為:
以及權值W,V和Sigmoidal函數(shù)的有界性,可得如下不等式:
利用不等式:
以及式(13)可得:
其中,λmin為矩陣Q的最小特征值,K1=‖l2‖/2。
假設ρ1≥,ρ2≥(1/‖C‖)
因此,由式(13)和(15)可知:
由式(16)知,在半徑為b的空間球體即
下面分析權值誤差的有界性:式(12)可改寫如下:
通過合理的選擇矩陣Ac以及學習律η1,η2以及修正系數(shù)ρ1,ρ2可以減小估計誤差的上限b,以使系統(tǒng)達到更高的精度。
針對雙關節(jié)機械手,其狀態(tài)方程可以表示為
為了應用Backstepping方法,將狀態(tài)觀測器表示如下:
G=[g1g2],gi∈R2,針對式(1)所示的被控對象,采用神經(jīng)網(wǎng)絡狀態(tài)觀測器可以實現(xiàn)對角位移x1與角速度x2的逼近,因此可以采用估計值來代替實際值x1,x2,在控制中無需速度信號的測量。
對反演控制器進行設計:
第一步:引入新的誤差狀態(tài)向量:
其中x1d為機械手的期望運動軌跡;x2d為虛擬控制量。
故:
針對式(20)中的第一個子系統(tǒng),Lyapunov函數(shù)定義為:
求導得:
若e2=0,則第一個子系統(tǒng)穩(wěn)定。
第二步,設計控制律,使e2→0,由式(21)得
設計控制律為:
由于該控制系統(tǒng)是由神經(jīng)網(wǎng)絡觀測器和反演控制器構成,因此Lyapunov函數(shù)表達如下:
L=L0+L1+L2
由前面分析可知:L=L0+L1+L2≤0,即控制系統(tǒng)穩(wěn)定。
圖1 simulink主程序圖
Simulink框圖如圖1所示,圖2—3中虛線為采用神經(jīng)網(wǎng)絡狀態(tài)觀測器時機械手的位移,實線為采用已知機械手精確模型且不含有神經(jīng)網(wǎng)絡的狀態(tài)觀測器時機械手的位移。
圖2 關節(jié)1的觀測值與跟蹤結果
圖3 關節(jié)2的觀測值與跟蹤結果
通過比較由圖4可知,使用狀態(tài)觀測器后,系統(tǒng)的跟蹤性能略微下降,但是誤差能很快地收斂到0,仍具有很好的位置跟蹤性能。由圖5可知在使用狀態(tài)觀測器的情況下雖然開始時有略明顯波動,但同樣具有很快的響應速度。因此所設計的觀測器具有較好的收斂性能,該控制方法具有較強的跟蹤性能。
圖4 關節(jié)1的對比結果
圖5 關節(jié)2的對比結果
提出了針對MIMO非線性系統(tǒng)的神經(jīng)網(wǎng)絡狀態(tài)觀測器,基于改進的BP算法以及誤差修正項來設計神經(jīng)網(wǎng)絡權值的自適應律,并以此來保證狀態(tài)估計誤差的有界性。文中通過Lyapunov直接法分析了系統(tǒng)的穩(wěn)定性,仿真結果表明了該算法的有效性。
[1]BALL A A,KHALIL H K.High-gain Observers in the Presence of Measurement Noise:A Nonlinear GainApproach[C]//47th IEEE Conference on Decision and Control,Cancun,Mexico,2008:2288-2293.
[2]SUN Leping.Stability Criteria for Delay Differential Equation[J].Journal of Shanghai Teachers University,1998,27(3):1-6.
[3]姜寅令,齊績.神經(jīng)網(wǎng)絡型觀測器在二關節(jié)機械手中的應用[J].科學技術與工程,2011,11(6),1348-1350.
[4]ADBOLLUHI F,TULEBI H A,PUTEL R V.A Stable Neural Network Observer with Application to Flexible-joint Manipulators[C]//Proceedings of the 9thInternational Conference on Neral Information Processing,Stockholm,Sweden.2002:1910-1914.
[5]YOUNG H K,F(xiàn)RANK L,CHAOUKI T A.A Dynamic Recurrent Neural Network Based Adaptive Observer for a Class of Nonlinear Systems[J].Automatica,1997,33(8):1539-1543.
[6]閆茂德.僅利用位置測量信息的機械手魯棒滑模跟蹤控制[J].機械科學與技術,2011,20(4):531-534.
[7]姜寅令.滑模變結構控制方法在機器人軌跡跟蹤中的應用[D].大慶:東北石油大學,2011.
[8]LIU Jinkun.Radial Basis Function(RBF)Neural Network Control for Mechanical Systems[M].Beijing:Tsinghua U-niversity Press,2013:193-203.