姚文龍,龐 震,池榮虎,邵 巍,王華東
(青島科技大學(xué)a.自動(dòng)化與電子工程學(xué)院;b.信息科學(xué)技術(shù)學(xué)院,山東 青島 266061)
路徑跟蹤技術(shù)在機(jī)器人控制、無人駕駛車控制、無人機(jī)控制、機(jī)械臂跟蹤控制等領(lǐng)域有著廣闊的應(yīng)用前景[1-4]。其中,無人駕駛車技術(shù)除了在傳統(tǒng)家用汽車應(yīng)用較廣之外,也逐漸應(yīng)用在開采環(huán)境勘探、農(nóng)業(yè)生產(chǎn)、園區(qū)道路清掃等多個(gè)領(lǐng)域[5-6]。園區(qū)清掃車?yán)们鍜邎?chǎng)地固定的特點(diǎn),工作模式一般是設(shè)定清掃路線,定期自動(dòng)循環(huán)清掃、灑水,減輕了環(huán)衛(wèi)壓力。其中,自動(dòng)導(dǎo)航技術(shù)是園區(qū)清掃車自動(dòng)化運(yùn)行的關(guān)鍵技術(shù),主要包括環(huán)境感知、路徑規(guī)劃和路徑跟蹤三方面的研究?jī)?nèi)容[7]。本研究主要對(duì)園區(qū)道路清掃車的路徑跟蹤技術(shù)展開研究。
在實(shí)際研究中,清掃車的跟蹤路徑與時(shí)間呈現(xiàn)復(fù)雜的非線性關(guān)系,車輛系統(tǒng)本身也是復(fù)雜難建模的非線性系統(tǒng),因此,控制器的設(shè)計(jì)較為困難[8]。目前大多應(yīng)用兩輪或四輪的移動(dòng)機(jī)器人代替智能車輛展開研究[9-10],園區(qū)清掃車路徑跟蹤實(shí)際上就是智能移動(dòng)機(jī)器人的路徑跟蹤,即是指根據(jù)給定的期望路徑,自主調(diào)整前輪轉(zhuǎn)向,使穩(wěn)定跟蹤到期望路徑。葉長(zhǎng)龍等[11]基于4組并聯(lián)布置MY輪全方位移動(dòng)平臺(tái)和2自由度并聯(lián)舉升機(jī)組成的5自由度全方位移動(dòng)機(jī)器人,設(shè)計(jì)雙曲線濾波PD控制器進(jìn)行路徑跟蹤仿真,跟蹤誤差隨跟蹤時(shí)間減小而減小;劉美珍等[12]基于非完整輪式移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模性,設(shè)計(jì)路徑跟蹤的虛擬速度控制量,得到系統(tǒng)的持續(xù)激勵(lì)輸出,同時(shí)根據(jù)動(dòng)力學(xué)模型推導(dǎo)系統(tǒng)的不確定項(xiàng),采用高度非線性擬合特性的神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行估計(jì),得到模型力矩控制量,組成復(fù)合控制策略,提高控制精度;葛媛媛等[13]建立不確定非線性移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型,基于光滑非線性飽和函數(shù),建立自適應(yīng)模糊滑??刂破?并利用界定有界輸入有界輸出,保證系統(tǒng)穩(wěn)定收斂;宋立業(yè)等[14]利用Lyapunov函數(shù)設(shè)計(jì)了運(yùn)動(dòng)學(xué)控制器,并采用反演方法和積分滑模控制設(shè)計(jì)自適應(yīng)神經(jīng)滑模動(dòng)力學(xué)控制器,調(diào)節(jié)系統(tǒng)的控制參數(shù),提高了跟蹤精度。
上述方法都是在時(shí)間域上進(jìn)行控制系統(tǒng)設(shè)計(jì),然而,在園區(qū)清掃車實(shí)際工作中,主要在固定路段周期性重復(fù)進(jìn)行清掃、灑水等工作,具有很強(qiáng)的重復(fù)性特點(diǎn),對(duì)于循環(huán)運(yùn)行中的有效信息沒有充分利用。此外,隨著清掃垃圾的不斷增多,車身重量發(fā)生實(shí)時(shí)變化,由此帶來非重復(fù)不確定性擾動(dòng),使得控制系統(tǒng)的收斂速度和魯棒性都受影響。基于以上考慮,本工作提出利用迭代學(xué)習(xí)方法對(duì)園區(qū)清掃車路徑跟蹤控制展開研究,首先,將含非線性不確定項(xiàng)的清掃車非線性系統(tǒng)轉(zhuǎn)化為線性仿射數(shù)據(jù)模型;利用循環(huán)工作過程中得到的跟蹤誤差與控制輸入信號(hào),采用迭代差分估計(jì)算法估計(jì)非線性不確定項(xiàng),并設(shè)計(jì)基于投影算法的參數(shù)更新率,引入非重復(fù)時(shí)變擾動(dòng)的比例項(xiàng)和微分項(xiàng),得到基于智能PD迭代學(xué)習(xí)控制算法的路徑跟蹤控制器,實(shí)現(xiàn)對(duì)未知擾動(dòng)的有效估計(jì),提高控制系統(tǒng)收斂速度、增強(qiáng)控制算法對(duì)非重復(fù)時(shí)變擾動(dòng)的魯棒性。最后,仿真驗(yàn)證方法的可行性。
動(dòng)力學(xué)模型和運(yùn)動(dòng)學(xué)模型是車輛模型建立過程中最常用的兩種模型[15-16],動(dòng)力學(xué)模型要根據(jù)車輛在行駛過程中的受力情況,利用牛頓第二定律建立,但對(duì)于園區(qū)清掃車,隨著清掃垃圾的增多,車身重量不斷變化,無法建立精確的動(dòng)力學(xué)模型;運(yùn)動(dòng)學(xué)模型是從空間幾何的角度研究車輛的運(yùn)動(dòng)規(guī)律,包含車輛位置、航向角等參量,能夠提供系統(tǒng)的輸入輸出數(shù)據(jù),同時(shí)顯示了系統(tǒng)的非線性特征。園區(qū)清掃車一般低速行駛,可以忽略行駛中側(cè)滑等動(dòng)力學(xué)問題[17],因此采用運(yùn)動(dòng)學(xué)模型研究園區(qū)清掃車的路徑跟蹤問題。
目前,園區(qū)清掃車多為四輪電驅(qū)動(dòng)車輛,雙前輪控制車輛的轉(zhuǎn)向,雙后輪驅(qū)動(dòng)車輛行駛,本工作主要研究的是車輛的轉(zhuǎn)向控制,設(shè)計(jì)的控制系統(tǒng)輸出控制車輛的前輪轉(zhuǎn)動(dòng)。首先,給出車輛的運(yùn)動(dòng)學(xué)模型,如圖1所示。
圖1 園區(qū)清掃車路徑跟蹤運(yùn)動(dòng)學(xué)模型Fig.1 Kinematic model of track tracking of park sweeping car
在清掃車運(yùn)動(dòng)學(xué)模型研究中,考慮清掃車為一個(gè)整體,忽略車身長(zhǎng)度影響,取(x(t),y(t))為清掃車的中心點(diǎn)位置;ψ為清掃車行駛方向與坐標(biāo)橫方向的夾角,即清掃車的航向角;α為清掃車的前輪轉(zhuǎn)角,即轉(zhuǎn)向控制器輸出控制量,由圖1可知,車輛中心位置的運(yùn)行速度為
運(yùn)動(dòng)學(xué)約束方程為
由式(1)和式(2)可得
車輛的橫擺角速度w為
由式(4)得到清掃車的運(yùn)動(dòng)學(xué)模型:
由式(3)可以看出,前輪轉(zhuǎn)角控制系統(tǒng)是與之前車輛航向角和前輪偏轉(zhuǎn)角相關(guān)的非線性系統(tǒng),可以等效表示為
其中,ψ(k,i)和u(k,i)分別為系統(tǒng)的輸出和輸入;k為系統(tǒng)的迭代循環(huán)次數(shù),且k∈N*;i為系統(tǒng)的運(yùn)行時(shí)間,且i>0;f(…)為未知非線性函數(shù);nψ,nu為正整數(shù)。
針對(duì)園區(qū)清掃車運(yùn)動(dòng)學(xué)模型,提出如下幾點(diǎn)假設(shè):
假設(shè)1受車輛前輪最大偏轉(zhuǎn)角限制,非線性函數(shù)f(…)對(duì)于有界自變量是有界的。
假設(shè)2根據(jù)車輪橫擺角速度限制,非線性函數(shù)f(…)對(duì)控制輸入u(k,i)的偏導(dǎo)數(shù)是連續(xù)有界的,且偏導(dǎo)數(shù)的符號(hào)已知不變。
假設(shè)3式(4)所示非線性系統(tǒng)滿足廣義Lipschitz條件,即:當(dāng)Δu(k,i)≠0,b>0,存在:
當(dāng)系統(tǒng)滿足上述假設(shè)1~3時(shí),可將式(6)轉(zhuǎn)化為如下緊格式局部線性化數(shù)據(jù)模型:
其中,φ(k,i)=?f*/?u(k,i);
上述模型僅需要輸入輸出數(shù)據(jù),不僅考慮了額外的誤差信息,還加入非線性不確定項(xiàng)作為補(bǔ)償,消除清掃車轉(zhuǎn)向控制中的實(shí)時(shí)變化的不確定擾動(dòng)影響,需要對(duì)其進(jìn)行估計(jì)。
根據(jù)上述式(8)得到的緊格式局部線性化數(shù)據(jù)模型,由等價(jià)反饋原理得到
其中,λ>0為權(quán)重因子。
為提高控制器的魯棒性,設(shè)計(jì)智能PD型迭代學(xué)習(xí)控制方案,在上述控制算法中加入誤差反饋項(xiàng),其中跟蹤誤差為e(k,i+1)=ψd(k,i+1)-ψ(k,i+1),得到控制算法為
其中,kp,kd是學(xué)習(xí)增益。
在上述控制算法中,^ω(k,i),^φ(k,i)為ω(k,i),φ(k,i)的估計(jì)值,需要設(shè)計(jì)參數(shù)估計(jì)算法對(duì)其進(jìn)行估計(jì)。
對(duì)于φ(k,i),給出如下估計(jì)準(zhǔn)則:
將式(8)代入式(11)中,兩邊對(duì)φ(k,i)求偏導(dǎo),并令?J/φ(k,i)=0,得到φ(k,i)的估計(jì)值:
其中,ρ>0為權(quán)重因子;μ∈(0,1]為步長(zhǎng)因子。
ω(k,i)為未知非線性不確定項(xiàng),利用時(shí)間差分估計(jì)算法對(duì)其進(jìn)行估計(jì),如下:
綜上,基于緊格式局部線性化的智能PD型迭代學(xué)習(xí)控制方案如下:
其中,^φ(0,i)為^φ(k,i)的迭代初值;ε>0為一個(gè)極小的正值。
實(shí)際應(yīng)用中,根據(jù)園區(qū)清掃車工作環(huán)境,主要由直線路徑和曲線路徑組成,本仿真主要針對(duì)直線路徑跟蹤和曲線路徑跟蹤展開研究,若上述控制器設(shè)計(jì)方法可以取得較好效果,那么對(duì)于實(shí)際應(yīng)用中智能清掃車道路清掃工作的路徑跟蹤也是有效的。
假設(shè)清掃車的路徑跟蹤期望航向角為
其中,車輛的期望初始航向角為0,期望初始位置為(0,0),因此,仿真中,將跟蹤的初始條件設(shè)為ψ(k,0)=0,(x(k,0),y(k,0))=(0,0),第一次迭代時(shí)的控制輸入u(0,i)=0,在系統(tǒng)中加入非重復(fù)擾動(dòng),仿真時(shí)間n取500,控制器的參數(shù)主要包括:ρ=0.8,μ=0.9,η=0.4,kp=0.1,kd=0.5,仿真結(jié)果如圖2和圖3所示,分別為不同迭代次數(shù)下直線路徑跟蹤的航向角-時(shí)間曲線和位置路徑跟蹤曲線。
由圖2可以看出,隨著迭代次數(shù)的增加,車輛航向角與期望航向角之間的誤差不斷減小,在經(jīng)過10次迭代后,清掃車可以較好的跟蹤直線路徑的期望航線角變化,且擾動(dòng)影響下,仍穩(wěn)定跟蹤。圖3為不同迭代次數(shù)下的車輛位置路徑跟蹤曲線,通過對(duì)比可以看出:在2次、3次、5次迭代時(shí),車輛位置與期望跟蹤路線坐標(biāo)誤差不斷減小,在10次迭代時(shí),跟蹤誤差逐漸趨于0,實(shí)現(xiàn)了高精度的位置路徑跟蹤,且擾動(dòng)影響下,未出現(xiàn)明顯偏差,具有較強(qiáng)魯棒性。
圖2 不同迭代次數(shù)下的航向角-時(shí)間曲線Fig.2 Course angle-time curve under different iteration times
圖3 不同迭代次數(shù)下的車輛直線路徑跟蹤位置曲線Fig.3 Vehicle linear trajectory tracking position curve under different iteration times
假設(shè)清掃車的路徑跟蹤期望航向角為
在曲線跟蹤時(shí),采用與直線跟蹤時(shí)相同的初始條件、控制算法及參數(shù),車輛的期望初始航向角為0,期望初始位置為(0,0),因此,仿真中,將跟蹤的初始條件設(shè)為ψ(k,0)=0,(x(k,0),y(k,0))=(0,0),第一次迭代時(shí)的控制輸入u(0,i)=0,系統(tǒng)中加入非重復(fù)擾動(dòng)仿真時(shí)間n取550,選用與直線路徑跟蹤時(shí)相同的控制器參數(shù),仿真結(jié)果如圖4和圖5所示,分別為不同迭代次數(shù)下曲線路徑跟蹤的航向角-時(shí)間曲線和位置路徑跟蹤曲線。
由圖4可以看出,經(jīng)過不斷迭代,曲線路徑航向角的跟蹤誤差不斷減小,在10次迭代時(shí),基本可以較好的跟蹤車輛期望航向角曲線,且擾動(dòng)影響下,仍穩(wěn)定跟蹤;圖5為不同迭代次數(shù)下的車輛位置估計(jì)跟蹤曲線,通過對(duì)比可以看出:在2次、3次、5次迭代時(shí),車輛位置與期望位置跟蹤誤差不斷減小,在10次迭代時(shí),跟蹤誤差逐漸趨于0,系統(tǒng)是收斂的,且擾動(dòng)影響下,未出現(xiàn)明顯偏差,具有較強(qiáng)的魯棒性。
圖4 不同迭代次數(shù)下的航向角-時(shí)間曲線Fig.4 Course angle-time curve under different iteration times
圖5 不同迭代次數(shù)下的車輛曲線路徑跟蹤位置曲線Fig.5 Vehicle curve trajectory tracking position curve under different iteration times
兩種期望路徑的跟蹤仿真基本可以涵蓋園區(qū)清掃車實(shí)際應(yīng)用中的行駛路徑,仿真分析說明,迭代學(xué)習(xí)控制可以較好的利用清掃車循環(huán)運(yùn)行的信息,并且利用智能PD型迭代學(xué)習(xí)控制算法,提高了路徑跟蹤精度,可達(dá)到無偏差跟蹤,滿足路徑跟蹤的高精度要求。
園區(qū)清掃車主要是在園區(qū)固定路段周期性地循環(huán)清掃工作,具有很高的重復(fù)性特點(diǎn),利用循環(huán)運(yùn)行中的重復(fù)性信息,來不斷提高路徑跟蹤的控制精度,主要研究了基于迭代學(xué)習(xí)控制算法的園區(qū)清掃車路徑跟蹤控制問題。采用智能PD型迭代學(xué)習(xí)控制算法,引入非線性不確定項(xiàng)作為補(bǔ)償,消除清掃車轉(zhuǎn)向控制中的實(shí)時(shí)變化的不確定擾動(dòng)影響,具有很高的實(shí)際應(yīng)用價(jià)值。仿真研究表明,迭代學(xué)習(xí)控制可以較好的利用清掃車循環(huán)運(yùn)行的信息,提高路徑跟蹤的控制精度,且具有較強(qiáng)的抗擾能力,實(shí)現(xiàn)園區(qū)清掃車的高精度穩(wěn)定跟蹤控制。