沈曉斌,王斌銳,余 芮,崔小紅
(中國(guó)計(jì)量大學(xué) 機(jī)電工程學(xué)院,浙江 杭州 310018)
機(jī)器人關(guān)節(jié)是組成機(jī)械臂的最小組成單元,通常由電機(jī)、減速器、傳感器和驅(qū)動(dòng)器組成。由于諧波減速器體積小、質(zhì)量小、傳動(dòng)比大、負(fù)載能力強(qiáng),故機(jī)器人關(guān)節(jié)多采用諧波減速器。但諧波減速器、軸承等器件中存在非線(xiàn)性摩擦[1],使關(guān)節(jié)動(dòng)力學(xué)模型復(fù)雜,控制困難、效果不佳。
對(duì)于關(guān)節(jié)處存在的非線(xiàn)性摩擦,研究者們提出了許多摩擦模型,主要分為動(dòng)態(tài)摩擦模型和靜態(tài)摩擦模型。動(dòng)態(tài)摩擦模型能準(zhǔn)確描述關(guān)節(jié)處存在的摩擦力,較常用的模型為L(zhǎng)uGre模型。TAN等[2]使用LuGre模型為機(jī)械系統(tǒng)進(jìn)行摩擦建模,賀瑩等[3]為單關(guān)節(jié)伺服系統(tǒng)以L(fǎng)uGre模型進(jìn)行建模,但從建模過(guò)程可見(jiàn)實(shí)際測(cè)量難度較大,建模過(guò)程復(fù)雜,不利于實(shí)際工程應(yīng)用。在實(shí)際工程中較多使用靜態(tài)模型。靜態(tài)摩擦模型[4]包括庫(kù)倫摩擦模型、粘滯摩擦+庫(kù)倫摩擦模型、靜摩擦+粘滯摩擦+庫(kù)倫摩擦模型、Stribeck模型等。其中Stribeck模型能較精確描述靜態(tài)摩擦特性,較為常用。付建寧[5]等人在機(jī)器人關(guān)節(jié)建模時(shí)加入Stribeck摩擦模型,利用前饋進(jìn)行摩擦補(bǔ)償,提高關(guān)節(jié)控制精度,但存在建模不準(zhǔn)確的問(wèn)題,并且機(jī)器人關(guān)節(jié)處的摩擦特性還會(huì)受到其他許多因素的影響。如NEVMERZHITSKIY[6]、吳曉敏[7]等認(rèn)為摩擦特性應(yīng)與溫度有關(guān),需建立與溫度相關(guān)的摩擦模型;LIAO[8]、HAN[9]等認(rèn)為摩擦特性還應(yīng)與位置相關(guān),需建立與位置相關(guān)的摩擦模型。與溫度和位置相關(guān)的摩擦模型建模復(fù)雜、實(shí)現(xiàn)困難,且無(wú)法消除建模誤差。因此,本文考慮對(duì)摩擦模型的建模誤差進(jìn)行在線(xiàn)觀測(cè)和辨識(shí),以實(shí)現(xiàn)更精確的補(bǔ)償。
在機(jī)器人關(guān)節(jié)軌跡跟蹤控制方法中,常用的方法有PID(Proportional Integral Derivative)控制法、反饋線(xiàn)性化控制法、計(jì)算力矩控制法[10]以及與模糊控制、神經(jīng)網(wǎng)絡(luò)[11-12]等先進(jìn)控制算法結(jié)合的控制方法。如WANG等[13]在具有Stribeck摩擦建模的機(jī)器人系統(tǒng)中使用模糊PID控制,但模糊控制依賴(lài)于使用者的經(jīng)驗(yàn);CAMBERA等[14]使用反饋線(xiàn)性化控制法進(jìn)行柔性關(guān)節(jié)控制,但反饋線(xiàn)性化控制需系統(tǒng)的狀態(tài)量可觀測(cè)。計(jì)算力矩控制法基于系統(tǒng)的動(dòng)力學(xué)模型[15],算法簡(jiǎn)單實(shí)用,可應(yīng)用于實(shí)際機(jī)器人關(guān)節(jié)系統(tǒng)。但由于實(shí)際系統(tǒng)的精確動(dòng)力學(xué)模型很難得到,尤其是必須考慮非線(xiàn)性摩擦對(duì)系統(tǒng)的影響,因此JIANG等[16]在計(jì)算力矩控制的基礎(chǔ)上,加入自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)(Radial Basis Function徑向基)對(duì)未建模動(dòng)態(tài)進(jìn)行在線(xiàn)補(bǔ)償。但由于低速運(yùn)行時(shí)尤其是關(guān)節(jié)電機(jī)啟停時(shí),摩擦力出現(xiàn)較強(qiáng)的非線(xiàn)性,此時(shí)RBF不能很好地補(bǔ)償非線(xiàn)性摩擦。
在上述研究背景下,本文將在對(duì)非線(xiàn)性摩擦建?;A(chǔ)上,設(shè)計(jì)自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)對(duì)摩擦模型誤差和動(dòng)力學(xué)模型參數(shù)誤差等未建模動(dòng)態(tài)進(jìn)行在線(xiàn)觀測(cè),設(shè)計(jì)含摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制器。進(jìn)行摩擦建??山档湍P偷姆蔷€(xiàn)性程度,降低控制難度;自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單且具有逼近任意非線(xiàn)性函數(shù)的能力,結(jié)合權(quán)值自適應(yīng)律,能對(duì)摩擦模型誤差和動(dòng)力學(xué)模型參數(shù)誤差進(jìn)行有效在線(xiàn)逼近和觀測(cè);計(jì)算力矩控制法具有算法簡(jiǎn)單直觀、魯棒性好等特點(diǎn),并且容易應(yīng)用于實(shí)際系統(tǒng)。因此,將三者集成可提高關(guān)節(jié)控制精度。
本文首先基于Stribeck摩擦模型和拉格朗日方程,對(duì)機(jī)器人關(guān)節(jié)建立動(dòng)力學(xué)模型,并在模型中加入未建模動(dòng)態(tài),提高模型的準(zhǔn)確性;其次,通過(guò)實(shí)驗(yàn)測(cè)量及最小二次法對(duì)摩擦模型參數(shù)進(jìn)行辨識(shí);然后,利用自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)對(duì)摩擦建模誤差和動(dòng)力學(xué)模型參數(shù)誤差進(jìn)行在線(xiàn)觀測(cè),并補(bǔ)償?shù)接?jì)算力矩控制器中;最后,在自主設(shè)計(jì)的關(guān)節(jié)和測(cè)試平臺(tái)上,對(duì)所設(shè)計(jì)的控制器進(jìn)行了測(cè)試。
本文以自主設(shè)計(jì)的無(wú)刷直流伺服電機(jī)和諧波減速器構(gòu)成的單自由度機(jī)器人關(guān)節(jié)為研究對(duì)象,機(jī)器人關(guān)節(jié)三維樣機(jī)模型如圖1。
圖1 機(jī)器人關(guān)節(jié)樣機(jī)模型Figure 1 Prototype model of robot joint
將減速器按速度大小分為高速側(cè)和低速輸側(cè),電機(jī)軸為高速軸,諧波減速器輸出側(cè)軸為低速軸。通過(guò)分析,可得關(guān)節(jié)傳動(dòng)鏈機(jī)構(gòu)簡(jiǎn)圖如圖2。
圖2 關(guān)節(jié)傳動(dòng)機(jī)構(gòu)簡(jiǎn)圖Figure 2 Diagram of joint transmission mechanism
圖2中τmotor表示電機(jī)產(chǎn)生的電磁力矩,Nm;J1表示高速軸的轉(zhuǎn)動(dòng)慣量,kg·m2;τfm為高速端摩擦力矩,Nm;θm為高速端轉(zhuǎn)角,rad;τm為高速端輸出到力矩,低速端輸入力矩,Nm;τfr為低速端摩擦力矩,Nm;n表示減速比;J2表示低速軸轉(zhuǎn)動(dòng)慣量,kg·m2;q表示低速端轉(zhuǎn)角,rad;τr表示低速端輸出力矩,即負(fù)載力矩τload,Nm。
直流伺服電機(jī)產(chǎn)生的電磁力矩與電流成正比:
τmotor=Kmi。
(1)
式(1)中:Km為電機(jī)力矩常數(shù),Nm/A;i為電機(jī)電流,A。
通過(guò)分別對(duì)高速軸和低速軸建模,可得機(jī)器人關(guān)節(jié)的動(dòng)力學(xué)模型。
首先進(jìn)行高速軸建模。由輸入和輸出力矩平衡原理以及圖2所示機(jī)構(gòu)簡(jiǎn)圖,可得高速軸動(dòng)力學(xué)方程為
(2)
然后進(jìn)行低速軸建模。同理可得低速軸動(dòng)力學(xué)方程為
(3)
基于拉格朗日方程,負(fù)載τr可以表示為
(4)
假設(shè)諧波減速器剛度足夠大,忽略諧波減速器的變形,可得到高速軸轉(zhuǎn)角θm和低速軸轉(zhuǎn)角q的關(guān)系為
q=θm/n。
(5)
由式(1)到式(4)可得機(jī)器人關(guān)節(jié)的動(dòng)力學(xué)模型為
(6)
其中J=n2J1+J2表示等效轉(zhuǎn)動(dòng)慣量,kg·m2;τf=τfm+τfr/n表示高速端的等效摩擦力矩,kg·m2。
速度對(duì)摩擦的影響最大,因此本文在建立摩擦模型時(shí)只考慮與速度相關(guān)的摩擦力矩模型,忽略溫度、位置等其他因素對(duì)建模的影響。基于靜態(tài)摩擦模型中的Stribeck模型,關(guān)節(jié)摩擦力矩可表示為:
(7)
由式(1)和式(6)可得關(guān)節(jié)摩擦力矩τf與電機(jī)電流i的方程
(8)
當(dāng)機(jī)器人關(guān)節(jié)處在空載且勻速運(yùn)動(dòng)狀態(tài)下,電機(jī)產(chǎn)生的電磁力矩和摩擦力矩相等,可得
τf=Kmi。
(9)
由式(9)可計(jì)算得到高速端的等效摩擦力矩τf,τf中包含了τfm和τfr。
為了辨識(shí)摩擦模型的參數(shù),在自主研制的機(jī)器人關(guān)節(jié)上開(kāi)展參數(shù)辨識(shí)實(shí)驗(yàn)。關(guān)節(jié)傳動(dòng)系統(tǒng)主要由無(wú)刷伺服電機(jī)和諧波減速器組成,電機(jī)軸和減速器輸入軸直接相連。同時(shí),在關(guān)節(jié)的一側(cè)裝有旋轉(zhuǎn)編碼器,對(duì)關(guān)節(jié)的轉(zhuǎn)動(dòng)角度進(jìn)行測(cè)量。電機(jī)選用Kollmorgen的直流無(wú)框電機(jī)TBM7615A,諧波減速器選用蘇州綠的的LHSG-20-CL-120,編碼器選用北京金鋼科技的MBS磁編碼器,驅(qū)動(dòng)器使用Elmo的G-MOLWHI20/100SE。機(jī)器人關(guān)節(jié)的主要性能參數(shù)如表1。
表1 機(jī)器人關(guān)節(jié)主要性能參數(shù)Table 1 Main performance parameters of robot joint
實(shí)驗(yàn)方法:將機(jī)器人關(guān)節(jié)設(shè)置于空載狀態(tài),記錄不同速度下電機(jī)的輸出力矩。速度取值范圍為[-62.4,62.4] rad/s,其中當(dāng)速度大小范圍為(0,5.2) rad/s時(shí)步長(zhǎng)為0.52 rad/s、[5.2,52) rad/s時(shí)步長(zhǎng)為1.04 rad/s、[52,62.4] rad/s時(shí)步長(zhǎng)為5.2 rad/s。
在MATLAB中,利用實(shí)驗(yàn)測(cè)所得數(shù)據(jù),使用最小二乘法對(duì)正反兩個(gè)方向的摩擦模型參數(shù)進(jìn)行辨識(shí)。最終擬合的角速度-摩擦力矩?cái)M合曲線(xiàn)如圖3,辨識(shí)得到的參數(shù)如表2。
表2 摩擦模型參數(shù)辨識(shí)結(jié)果Table 2 Parameter identification results of friction model
由圖3可見(jiàn),使用摩擦模型對(duì)關(guān)節(jié)處的摩擦特性進(jìn)行建模仍具有一定的誤差,不能精確的描述。所以有必要對(duì)建模誤差進(jìn)行在線(xiàn)辨識(shí)和補(bǔ)償。
圖3 速度-摩擦力矩?cái)M合圖Figure 3 Velocity-friction torque fitting diagram
本文采用計(jì)算力矩控制法,對(duì)含非線(xiàn)性摩擦力的機(jī)器人關(guān)節(jié)進(jìn)行軌跡跟蹤控制器設(shè)計(jì)。同時(shí),結(jié)合自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)對(duì)摩擦模型誤差和動(dòng)力學(xué)模型參數(shù)誤差進(jìn)行在線(xiàn)觀測(cè)和補(bǔ)償。自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制的系統(tǒng)框圖如圖4。
圖4 控制系統(tǒng)框圖Figure 4 Control system block diagram
(10)
綜合考慮公式(10)中摩擦模型誤差和動(dòng)力學(xué)模型參數(shù)誤差等未建模動(dòng)態(tài),設(shè)含未建模動(dòng)態(tài)的機(jī)器人關(guān)節(jié)動(dòng)力學(xué)模型為
(11)
M(q)=M0(q)-ΔM,
G(q)=G0(q)-ΔG,
τjf=τjf0-Δτjf。
由式(11)給出的動(dòng)力學(xué)模型采用計(jì)算力矩控制法,可設(shè)計(jì)控制律如下:
(12)
假設(shè)f(·)已知時(shí),結(jié)合式(10)和式(12),可得到系統(tǒng)誤差方程為
(13)
式(13)中,kv為速度反饋增益系數(shù);kp為位置反饋增益系數(shù)。選擇合理的kv、kp即可使系統(tǒng)的閉環(huán)極點(diǎn)具有負(fù)實(shí)部,保證控制系統(tǒng)的穩(wěn)定性。
實(shí)際工程中f(·)往往是未知的,因此本文采用自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)方法進(jìn)行在線(xiàn)估計(jì)和補(bǔ)償。
采用的徑向基函數(shù)為高斯核函數(shù)
(14)
式(14)中,x為輸入向量;bi為第i個(gè)高斯徑向基函數(shù)寬度;ci為第i個(gè)神經(jīng)元高斯徑向基函數(shù)的中心向量。
RBF神經(jīng)網(wǎng)絡(luò)逼近的f(·)可表示為
(15)
由式(12)和式(15),可得本文所設(shè)計(jì)的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制器控制律為
(16)
設(shè)計(jì)自適應(yīng)律為
(17)
PA+ATP=-Q。
(18)
公式(18)給出了保證控制算法穩(wěn)定的控制參數(shù)約束條件。
為了驗(yàn)證方法的有效性,本文在自主研發(fā)的單自由度機(jī)器人關(guān)節(jié)上進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)裝置如圖5所示。其中控制器用于產(chǎn)生軌跡、接收反饋信號(hào)以及發(fā)送控制指令,計(jì)算機(jī)用于記錄實(shí)時(shí)軌跡、控制量等日志數(shù)據(jù)。
圖5 實(shí)驗(yàn)裝置圖Figure 5 Experimental device diagram
b=[5 5 5 5 5 5 5 5 5 5 5 5 5 5 5]。
中心向量為
其中,中心向量和基函數(shù)寬度的值是通過(guò)只含有計(jì)算力矩控制時(shí)的跟蹤誤差范圍以及實(shí)際實(shí)驗(yàn)調(diào)試效果確定的,因此這也是該方法的不足之處。
由于正反兩個(gè)方向摩擦模型參數(shù)數(shù)值相差較小,為了簡(jiǎn)化實(shí)驗(yàn)?zāi)P停瑢?duì)應(yīng)摩擦模型參數(shù)求平均值后可得摩擦模型為
本文實(shí)驗(yàn)主要涉及含摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制、無(wú)摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制、傳統(tǒng)計(jì)算力矩絡(luò)控制這三種控制方法的軌跡跟蹤實(shí)驗(yàn),圖6和圖7為關(guān)節(jié)輸出端跟蹤軌跡圖和誤差圖,圖8和圖9為關(guān)節(jié)輸出端的神經(jīng)網(wǎng)絡(luò)等效輸出。表3列出了系統(tǒng)在運(yùn)行200 s后角度誤差范圍對(duì)比。
圖6 軌跡跟蹤圖Figure 6 Trajectory tracking curves
圖7 角度軌跡誤差對(duì)比圖Figure 7 Comparison of angle tracking error curves
圖8 無(wú)摩擦建模時(shí)神經(jīng)網(wǎng)絡(luò)輸出Figure 8 Neural network output without friction modeling
圖9 含摩擦建模時(shí)神經(jīng)網(wǎng)絡(luò)輸出Figure 9 Neural network output with friction modeling
表3 角度軌跡跟蹤誤差對(duì)比Table 3 Comparison of angle tracking errors
圖6是傳統(tǒng)計(jì)算力矩控制、無(wú)摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制、含摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制軌跡跟蹤對(duì)比圖,圖7是三種控制方式的角度軌跡跟蹤誤差對(duì)比圖。從圖6的局部放大圖中可以看出在到達(dá)軌跡最值即速度為零時(shí)誤差較大,該部分的誤差主要是由于關(guān)節(jié)處存在摩擦引起的,在控制器輸出的控制力矩小于關(guān)節(jié)靜摩擦力時(shí),關(guān)節(jié)輸出軸將處于靜止?fàn)顟B(tài),導(dǎo)致無(wú)法跟蹤理想信號(hào)。傳統(tǒng)計(jì)算力矩控制和無(wú)摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制這兩種控制方法誤差較為明顯。雖然在傳統(tǒng)計(jì)算力矩控制器的基礎(chǔ)上加入自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償后,可以從圖7誤差對(duì)比圖中看出,當(dāng)達(dá)到穩(wěn)定時(shí)自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制器的誤差明顯減小,但是由于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力有限,仍然沒(méi)有能夠很好的補(bǔ)償關(guān)節(jié)處存在的非線(xiàn)性摩擦。經(jīng)過(guò)關(guān)節(jié)摩擦建模后,由圖6中的局部放大圖可以看出,當(dāng)進(jìn)行摩擦建模并補(bǔ)償時(shí)的響應(yīng)速度更快,摩擦帶來(lái)的影響大大減小。由圖7給出的跟蹤誤差對(duì)比也可以看出,在達(dá)到穩(wěn)定時(shí)跟蹤誤差明顯降低。
在200 s后跟蹤誤差基本趨于穩(wěn)定,由表3列出的軌跡跟蹤誤差范圍可得,含摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制追蹤誤差±1.83×10-3rad是無(wú)摩擦模型控制追蹤誤差±3.32×10-3rad的55.12%,是傳統(tǒng)計(jì)算力矩控制追蹤誤差±5.85×10-3rad的31.28%。
圖7可以看出,在加入自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償后,需要經(jīng)過(guò)200 s軌跡跟蹤誤差趨于穩(wěn)定狀態(tài)。引起該現(xiàn)象的主要原因是由于神經(jīng)網(wǎng)絡(luò)有一個(gè)學(xué)習(xí)的過(guò)程,經(jīng)過(guò)一段時(shí)間后學(xué)習(xí)完成誤差趨于穩(wěn)定。200 s的收斂時(shí)間相對(duì)較長(zhǎng),但是如果每次關(guān)機(jī)時(shí)記錄神經(jīng)網(wǎng)絡(luò)參數(shù),則在下一次開(kāi)機(jī)時(shí)并不需要重新學(xué)習(xí),因此200 s的收斂時(shí)間只會(huì)在神經(jīng)網(wǎng)絡(luò)第一次學(xué)習(xí)時(shí)出現(xiàn),并不影響后續(xù)使用過(guò)程中算法的性能。
本文基于拉格朗日方程和Stribeck模型對(duì)單自由度機(jī)器人關(guān)節(jié)進(jìn)行動(dòng)力學(xué)建模,并利用最小二乘法對(duì)摩擦模型參數(shù)進(jìn)行辨識(shí);基于含未建模動(dòng)態(tài)的機(jī)器人關(guān)節(jié)動(dòng)力學(xué)模型,設(shè)計(jì)了自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制器,實(shí)現(xiàn)關(guān)節(jié)角度軌跡跟蹤。理論分析和實(shí)驗(yàn)表明:
1)在動(dòng)力學(xué)模型中,加入非線(xiàn)性摩擦模型,降低了系統(tǒng)輸入輸出的非線(xiàn)性,提高了自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)對(duì)機(jī)器人關(guān)節(jié)動(dòng)力學(xué)模型未建模動(dòng)態(tài)的逼近能力;
2)選取合適的計(jì)算力矩參數(shù)以及李雅普諾夫方程中正定矩陣Q可以保證系統(tǒng)穩(wěn)定與收斂性;
3)本文設(shè)計(jì)的控制算法軌跡跟蹤精度優(yōu)于傳統(tǒng)計(jì)算力矩控制和無(wú)摩擦模型的自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)補(bǔ)償計(jì)算力矩控制。