李 光 符 浩
湖南工業(yè)大學(xué),株洲,412007
?
無模型機(jī)械臂BP神經(jīng)網(wǎng)絡(luò)狀態(tài)觀測(cè)及反演跟蹤控制
李光符浩
湖南工業(yè)大學(xué),株洲,412007
針對(duì)摩擦阻尼及模型參數(shù)不確定的情況,運(yùn)用反演控制設(shè)計(jì)策略,針對(duì)多連桿機(jī)械臂提出了一種基于神經(jīng)網(wǎng)絡(luò)觀測(cè)器的無模型軌跡跟蹤控制方法。運(yùn)用帶有修正項(xiàng)的自適應(yīng)BP神經(jīng)網(wǎng)絡(luò)觀測(cè)器對(duì)不可測(cè)狀態(tài)量進(jìn)行觀測(cè),同時(shí)對(duì)系統(tǒng)模型進(jìn)行在線逼近。在此基礎(chǔ)上設(shè)計(jì)了基于觀測(cè)狀態(tài)和逼近模型的反演跟蹤控制器, Lyapunov穩(wěn)定性理論證明了該控制器能夠保證跟蹤誤差的有界和閉環(huán)系統(tǒng)中所有信號(hào)的有界。跟蹤給定軌跡的仿真實(shí)驗(yàn)證明了該方法的有效性。
機(jī)械臂;狀態(tài)觀測(cè)器;BP神經(jīng)網(wǎng)絡(luò);反演控制
多連桿機(jī)械臂系統(tǒng)是一個(gè)復(fù)雜的多輸入多輸出非線性系統(tǒng),具有時(shí)變、強(qiáng)耦合和高度非線性的動(dòng)力學(xué)特性。實(shí)際工程應(yīng)用中,系統(tǒng)不可避免地存在大量的干擾與不確定性;同時(shí),考慮成本、硬件安裝等因素,全局狀態(tài)向量可測(cè)量也是難以實(shí)現(xiàn)的。因此,高魯棒性的控制器一直是機(jī)器人控制領(lǐng)域研究的重點(diǎn)。
文獻(xiàn)[1]用一種非線性干擾觀測(cè)器觀測(cè)系統(tǒng)的不確定性和干擾,設(shè)計(jì)了自適應(yīng)反演滑??刂撇呗?,在全局狀態(tài)向量可測(cè)、干擾為緩變量(即干擾項(xiàng)對(duì)時(shí)間的導(dǎo)數(shù)為0)的條件下,實(shí)現(xiàn)機(jī)械臂位置跟蹤控制。文獻(xiàn)[2]提出了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)輸出反饋控制方法,控制器由基于動(dòng)態(tài)補(bǔ)償器的輸出反饋、神經(jīng)網(wǎng)絡(luò)自適應(yīng)和魯棒三個(gè)控制項(xiàng)組成,基于系統(tǒng)的名義模型,可以完成對(duì)機(jī)械臂端點(diǎn)位置和速度的跟蹤控制。文獻(xiàn)[3-4]利用機(jī)械臂動(dòng)力學(xué)系統(tǒng)中慣性矩陣正定有界(包括其導(dǎo)數(shù)及逆同樣有界)的特性,分別提出了無模型的機(jī)械臂軌跡跟蹤控制策略。文獻(xiàn)[3]將神經(jīng)網(wǎng)絡(luò)作為控制器,利用非線性映射能力來逼近各種未知非線性項(xiàng),同時(shí)通過在控制律中加入魯棒項(xiàng)來消除逼近誤差。文獻(xiàn)[4]利用確定學(xué)習(xí)理論設(shè)計(jì)了一種新的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,不僅實(shí)現(xiàn)了閉環(huán)系統(tǒng)所有信號(hào)的最終一致有界,而且在穩(wěn)定的控制過程中保證了部分神經(jīng)網(wǎng)絡(luò)權(quán)值的收斂以及未知閉環(huán)系統(tǒng)動(dòng)態(tài)的局部逼近。以上研究均是基于系統(tǒng)全局狀態(tài)可測(cè)量的條件。
本文運(yùn)用反演控制設(shè)計(jì)方法,充分考慮系統(tǒng)不確定性和擾動(dòng)的實(shí)際情況,提出了一種無模型機(jī)械臂輸出反饋控制設(shè)計(jì)策略。應(yīng)用非線性系統(tǒng)觀測(cè)器的設(shè)計(jì)方法,首先設(shè)計(jì)了基于神經(jīng)網(wǎng)絡(luò)的輸出反饋速度狀態(tài)觀測(cè)器,權(quán)值自適應(yīng)律中修正項(xiàng)的引入提高了神經(jīng)網(wǎng)絡(luò)的逼近精度和魯棒性;之后將逼近模型直接運(yùn)用于反演控制設(shè)計(jì)過程,為避免反演法中對(duì)中間虛擬控制信號(hào)進(jìn)行求導(dǎo)計(jì)算而導(dǎo)致的系統(tǒng)方程微分項(xiàng)的膨脹問題,引入了動(dòng)態(tài)面控制技術(shù)[5-8]。
在計(jì)及連桿轉(zhuǎn)動(dòng)關(guān)節(jié)非線性阻尼的情況下,n連桿機(jī)械臂動(dòng)力學(xué)行為描述如下[9]:
(1)
機(jī)械臂動(dòng)力學(xué)方程(式(1))具有以下性質(zhì):矩陣H(q)的逆矩陣存在,并且H(q)和H-1(q)作為q的函數(shù)是一致有界的。
(2)
f(x)=-H-1(x1)[Vm(x1,x2)x2+τ1(x2)+G(x1)]
其中,0∈Rn×n為零矩陣,I∈Rn×n為單位矩陣。
在機(jī)械臂的實(shí)際工作中,由于負(fù)載的變化導(dǎo)致連桿質(zhì)心和質(zhì)量的不確定,難以獲得準(zhǔn)確的連桿慣性矩陣。同時(shí),連桿轉(zhuǎn)動(dòng)關(guān)節(jié)處的摩擦因數(shù)未知。因此,以上非線性函數(shù)向量f(·),g(·)是不確定的,在本文中假設(shè)完全未知。
2.1狀態(tài)觀測(cè)器設(shè)計(jì)
定義
F(x,τ)=f(x)+g(x)τ-τ
(3)
原系統(tǒng)的狀態(tài)空間表達(dá)式(式(2))可改寫為
(4)
分析動(dòng)態(tài)系統(tǒng)(式(4))可知,矩陣對(duì)(A,C)為可觀測(cè)對(duì)。以BP神經(jīng)網(wǎng)絡(luò)對(duì)未知非線性函數(shù)F(x,τ)進(jìn)行逼近,設(shè)計(jì)以下神經(jīng)網(wǎng)絡(luò)狀態(tài)觀測(cè)器:
(5)
根據(jù)前饋神經(jīng)網(wǎng)絡(luò)具有任意精度的逼近性能,對(duì)非線性項(xiàng)的逼近可以獲得相對(duì)較為理想的結(jié)果。在給定逼近誤差ε(·)>0的情況下,一定存在權(quán)值和閾值構(gòu)成的三層BP神經(jīng)網(wǎng)絡(luò)在誤差允許的范圍內(nèi)逼近非線性函數(shù)[10],即
(6)
(7)
(8)
參照文獻(xiàn)[11]選擇如下權(quán)值更新律:
(9)
其中,η1,η2為學(xué)習(xí)率,η1,η2>0;ρ1、ρ2為修正率,取小的正常數(shù)。
由式(4)~式(8)可得狀態(tài)觀測(cè)誤差方程:
(10)
其中,ξ(t)為有界誤差項(xiàng),即‖ξ(t)‖≤ξN。權(quán)值更新律(式(9))可以改寫為以下形式:
(11)
為對(duì)所設(shè)計(jì)的觀測(cè)器進(jìn)行穩(wěn)定性分析,構(gòu)造以下Lyapunov函數(shù):
(12)
其中,P為正定對(duì)稱矩陣,并滿足以下方程:
(13)
其中,Q為正定對(duì)稱矩陣。
將式(12)對(duì)時(shí)間求導(dǎo),得
(14)
將式(10)、式(11)和式(13)代入式(14),得
(15)
根據(jù)矩陣秩的定義和性質(zhì),有以下等式和不等式成立:
(16)
(17)
因此有
(18)
l1=‖PB‖ξN
l3=ρ1‖C‖l4=mη2‖CTCA0-1B‖
l6=ρ2‖C‖
其中,λmin(Q)為矩陣Q的最小特征值, li(i=1,2,…,6)均為大于0的常數(shù)。
式(18)進(jìn)一步可寫為
(19)
進(jìn)一步分析權(quán)值更新律式(11),其中第一式可改寫為
(20)
同理權(quán)值更新律(式(11))中第二式可改寫成
(21)
2.2反演控制器的設(shè)計(jì)
改寫觀測(cè)器式(5)第一式:
(22)
(23)
對(duì)時(shí)間求導(dǎo)得
(24)
利用式(22)第一式,有
(25)
(26)
(27)
式中,k1∈Rn×n為正定對(duì)角常數(shù)矩陣。
(28)
其中,β2∈Rn×n為濾波器的時(shí)間常數(shù)對(duì)角矩陣,且其對(duì)角元素均大于0。
因此,式(26)可改寫為
(29)
定義濾波誤差為
(30)
于是,其濾波誤差微分為
(31)
將式(27)、式(29)、式(30)代入式(24),可得
(32)
定義Lyapunov函數(shù):
(33)
對(duì)其求導(dǎo)并應(yīng)用式(32)得
(34)
對(duì)式(26)求導(dǎo),并利用式(22)第二式,得
(35)
定義Lyapunov函數(shù):
(36)
將上式對(duì)時(shí)間求導(dǎo),得
(37)
于是,設(shè)計(jì)控制律為
(38)
其中,k2∈Rn×n為正定常數(shù)矩陣。因此,式(37)可寫成
(39)
(40)
0 因此,有結(jié)論Ⅱ:對(duì)于多連桿機(jī)械臂系統(tǒng)(式(2)),其狀態(tài)變量由觀測(cè)器(式(8))獲得,應(yīng)用控制輸入(式(38)),則:① 狀態(tài)觀測(cè)值的跟蹤誤差有界,且收斂到原點(diǎn)的一個(gè)小鄰域內(nèi);② 結(jié)合結(jié)論Ⅰ,系統(tǒng)的實(shí)際跟蹤誤差e=y-yd收斂于可調(diào)的小鄰域上。 最終控制系統(tǒng)框圖如圖1所示。 圖1 控制系統(tǒng)框圖 為驗(yàn)證提出的控制策略的有效性,分別以單連桿和二連桿機(jī)械臂系統(tǒng)為對(duì)象來進(jìn)行仿真研究。 3.1單連桿機(jī)械臂 構(gòu)建觀測(cè)器中的三層BP神經(jīng)網(wǎng)絡(luò),其中隱含層節(jié)點(diǎn)取10,權(quán)值更新律(式(9))中的學(xué)習(xí)率和修正率分別為η=13 000 ,ρ=5。設(shè)計(jì)極點(diǎn)配置矩陣L,使得Hurwitz矩陣A0=A-LC的極點(diǎn)為P0=[-10+10i-10-10i],正定矩陣Q=diag(50)。 反演控制器參數(shù)設(shè)置如下: k1=k2=50,β2=0.8,桿轉(zhuǎn)角跟蹤連續(xù)信號(hào)yd=sint。 3.2二連桿機(jī)械臂 對(duì)應(yīng)動(dòng)態(tài)方程式(1)中各矩陣、向量為 H(q)= G(q)= 構(gòu)建觀測(cè)器中的三層BP神經(jīng)網(wǎng)絡(luò),其中隱含層節(jié)點(diǎn)取20,權(quán)值更新律(式(9))中的學(xué)習(xí)率和修正率分別為η1=η2=100 000,ρ1=ρ2=5。設(shè)計(jì)極點(diǎn)配置矩陣L,使得Hurwitz矩陣A0=A-LC的極點(diǎn)為P0=[-15+14i-15-14i-13+15i-13-15i],正定矩陣Q=diag(50)。 反演控制器參數(shù)設(shè)置如下:k1=k2=diag(50),β2=diag(0.8),桿轉(zhuǎn)角跟蹤連續(xù)信號(hào)yd=[sintcost-0.5]T。 單連桿系統(tǒng)仿真結(jié)果如圖2~圖4所示。從圖2可以看出,機(jī)械臂轉(zhuǎn)角能夠跟蹤期望的連續(xù)軌跡,角位移跟蹤誤差一致收斂于一個(gè)小的誤差,約為0.1%;圖3所示為對(duì)轉(zhuǎn)角關(guān)節(jié)速度的狀態(tài)估計(jì),所設(shè)計(jì)的觀測(cè)器能快速準(zhǔn)確地估計(jì)出系統(tǒng)不可測(cè)量的狀態(tài)向量;圖4所示為有界的關(guān)節(jié)控制輸入。 圖2 單連桿系統(tǒng)關(guān)節(jié)軌跡跟蹤 圖3 單連桿系統(tǒng)關(guān)節(jié)速度觀測(cè)值與期望值 圖4 單連桿系統(tǒng)關(guān)節(jié)控制輸入 二連桿系統(tǒng)仿真結(jié)果如圖5~圖10所示。從圖5、圖6可以看出,角位移跟蹤誤差一致收斂于一個(gè)小的誤差,約為2%;圖7、圖8所示為對(duì)轉(zhuǎn)角關(guān)節(jié)速度的狀態(tài)估計(jì),所設(shè)計(jì)的觀測(cè)器能快速準(zhǔn)確地估計(jì)出系統(tǒng)不可測(cè)量的狀態(tài)向量;圖9、圖10所示為有界的關(guān)節(jié)控制輸入。 圖5 二連桿系統(tǒng)關(guān)節(jié)1軌跡跟蹤 圖6 二連桿系統(tǒng)關(guān)節(jié)2軌跡跟蹤 圖7 二連桿系統(tǒng)關(guān)節(jié)1速度觀測(cè)值與期望值 圖8 二連桿系統(tǒng)關(guān)節(jié)2速度觀測(cè)值與期望值 圖9 二連桿系統(tǒng)關(guān)節(jié)1控制輸入 結(jié)合圖2~圖10,對(duì)比單連桿和二連桿的控制仿真結(jié)果,可以看到隨著系統(tǒng)復(fù)雜度增加(機(jī)械臂自由度的增加),調(diào)節(jié)BP神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)參數(shù),可以保證對(duì)不可測(cè)狀態(tài)的觀測(cè)精度和動(dòng)力學(xué)系統(tǒng)的在線逼近,并達(dá)到良好的軌跡跟蹤控制效果,同時(shí)觀測(cè)和控制的過渡時(shí)間并沒有明顯增加。 針對(duì)參數(shù)完全未知并存在外界干擾的多連桿機(jī)械臂系統(tǒng),提出了一種基于BP神經(jīng)網(wǎng)絡(luò)狀態(tài)觀測(cè)器的反演控制方案,觀測(cè)器和控制器的設(shè)計(jì)均不依賴系統(tǒng)的模型參數(shù),融合了狀態(tài)觀測(cè)、非線性系統(tǒng)逼近和軌跡跟蹤控制,具有較高的控制魯棒性。分別以單連桿和二連桿機(jī)械臂為例進(jìn)行了控制仿真分析,結(jié)果表明神經(jīng)網(wǎng)絡(luò)觀測(cè)器能快速準(zhǔn)確地對(duì)系統(tǒng)不可測(cè)速度向量進(jìn)行在線觀測(cè),同時(shí)完成對(duì)系統(tǒng)的逼近,基于觀測(cè)狀態(tài)量和逼近系統(tǒng)設(shè)計(jì)的反演控制器能夠?qū)崿F(xiàn)對(duì)期望軌跡良好的跟蹤。 [1]席雷平,陳自力,齊曉慧.基于非線性干擾觀測(cè)器的機(jī)器臂自適應(yīng)反演滑??刂芠J].信息與控制,2013,42(4):470-477. Xi Leiping,Chen Zili,Qi Xiaohui.Adaptive Backstepping Sliding Mode Control for Robotic Manipulator with Nonlinear Disturbance Observer[J].Information and Control,2013,42(4):470-477. [2]賈鶴鳴,宋文龍,郭少彬,等.基于神經(jīng)網(wǎng)絡(luò)的機(jī)械臂自適應(yīng)輸出反饋控制設(shè)計(jì)[J].應(yīng)用科學(xué)學(xué)報(bào),2013,31(4):427-433. Jia Heming,Song Wenlong,Guo Shaobin,et al.Adaptive Output Feedback Control of Manipulators Based on Neural Network[J].Jounal of Applied Sciences,2013,31(4): 427-433. [3]付濤,王大鎮(zhèn),弓清忠,等.改進(jìn)神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂频臋C(jī)器人軌跡跟蹤控制[J].大連理工大學(xué)學(xué)報(bào),2015,54(5):523-530. Fu Tao,Wang Dazhen,Gong Qingzhong,et al.Robitic Trajectory Tracking Control of Improved Neural Network Adaptive Sliding Mode Control[J].Journal of Dalian University of Technology,2015,54(5):523-530. [4]吳玉香,張景,王聰.機(jī)械臂的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制與學(xué)習(xí)[J].機(jī)械工程學(xué)報(bào),2013,49(15):42-48. Wu Yuxiang,Zhang Jing,Wang Cong.Adaptive Neural Network Control and Learning for Robot Manipulator[J].Journal of Mechanical Engineering,2013,49(15):42-48. [5]陳偉,盧京潮,袁燎原,等.基于高增益觀測(cè)器的航跡角自適應(yīng)反步控制[J].北京航空航天大學(xué)學(xué)報(bào),2013,19(9):1414-1420. Chen Wei, Lu Jingchao, Yuan Liaoyuan, et al. Adaptive Backstepping Control for Flight Path Angle Based on High Gain Observer[J].Journal of Beijing University of Aeronautics and Astronautics, 2013,19(9):1414-1420. [6]陳潔,周紹磊,宋召青.高超聲速飛行器迎角觀測(cè)器及控制器設(shè)計(jì)[J].北京航空航天大學(xué)學(xué)報(bào),2011,37(7):827-832. Chen Jie,Zhou Shaolei,Song Zhaoqing.Nonlinear Modelling and Open-loop Dynamatics Characteristics for One Hypersonic Aircraft[J].Journal of Beijing University of Aeronautics and Astronautics,2011,37(7):827-832. [7]李紅春.基于動(dòng)態(tài)面技術(shù)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制研究[D].揚(yáng)州:揚(yáng)州大學(xué),2007. [8]Yoo S J, Park J B, Choi Y H.Output Feedback Dynamic Surface Control of Flexible-joint Robots[J].International Journal of Control Automation and System,2008,6(2):223-233. [9]蔡自興.機(jī)器人學(xué)[M].2版.北京:清華大學(xué)出版社,2009. [10]徐志超,周玉國,于鳳滿.基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的非線性系統(tǒng)觀測(cè)器設(shè)計(jì)[J].微型機(jī)與應(yīng)用,2011,30(8):76-78. Xu Zhichao,Zhou Yuguo,Yu Fengman.Design of Observer for Nonlinear Systems Based on Improved Neural-network[J].Technique and Method,2011,30(8):76-78. [11]Abdollahi F,Talebi H A,Patel R V.A Stable Neural Network-based Observer with Application to Flexible-joint Manipulators[J].IEEE Transactions on Neural Networks,2006,17(1):118-129. (編輯陳勇) BP Neural Network State Observation and Backstepping Tracking Control of Model-free Robotic Manipulators Li GuangFu Hao Hunan University of Technology,Zhuzhou,Hunan,412007 A model-free trajectory tracking control algorithm was proposed for multi-link robotic manipulators with friction damping and model parameter uncertainties based on the backsteeping techniques. An adaptive BP neural network state observer with modification items was used to obtain the unmeasured states and approximated the system model online.Then,a backstepping tracking controller was developed, which took advantages of the observed state values and dynamics.Based on Lyapunov stability theory it is proved that presented controller can guarantee the tracking accuracy and all signals involved are bounded. Finally, it demonstrates that the strategy is effective by the simulation of tracking expected trajectory. robotic manipulator; state observer; BP neural network; backstepping control 2015-05-14 國家自然科學(xué)基金資助項(xiàng)目(61273157) TP241.3DOI:10.3969/j.issn.1004-132X.2016.07.002 李光,男,1963年生。湖南工業(yè)大學(xué)機(jī)械工程學(xué)院教授、博士。主要研究方向?yàn)閺?fù)雜機(jī)電一體化系統(tǒng)建模和控制。符浩(通信作者),男,1988年生。湖南工業(yè)大學(xué)機(jī)械工程學(xué)院碩士研究生。3 仿真分析
4 結(jié)語