孔國利,張璐璐
(鄭州工程技術(shù)學(xué)院 信息工程學(xué)院,河南 鄭州 450000)
雙輪倒立擺機(jī)器人(Two Wheeled Inverted Pendulum Robot,TWIPR)具有結(jié)構(gòu)簡單、操作靈活、機(jī)動(dòng)性高和油耗低等優(yōu)點(diǎn),使其受到了國內(nèi)外學(xué)術(shù)界和各領(lǐng)域的廣泛關(guān)注,如航空航天、高端裝備制造、智能機(jī)器人和工業(yè)過程等[1-2]。典型的TWIPR系統(tǒng)主要包括一對(duì)相同的車輪、底盤、驅(qū)動(dòng)器、倒立擺和運(yùn)動(dòng)控制單元等部分,其中運(yùn)動(dòng)控制單元的作用在于確保倒立擺機(jī)器人運(yùn)動(dòng)的準(zhǔn)確性和穩(wěn)定性。因此,研究對(duì)TWIPR進(jìn)行精確控制的方法成為需要解決的難題。
現(xiàn)有研究結(jié)果表明,TWIPR被普遍認(rèn)為是一種非線性且不穩(wěn)定的欠驅(qū)動(dòng)系統(tǒng),因而設(shè)計(jì)相應(yīng)的控制策略成為最具挑戰(zhàn)性的研究方向之一。目前,各種先進(jìn)的現(xiàn)代控制技術(shù)已經(jīng)被廣泛應(yīng)用于復(fù)雜的TWIPR系統(tǒng),如,PID控制器[3-4]、自適應(yīng)極點(diǎn)配置(Adaptive Pole Placement)控制器[5]和線性二次調(diào)節(jié)(Linear Quadratic Regulator,LQR)控制器[6]等。除此之外,滑模(Sliding Mode)控制器也被用于TWIPR系統(tǒng)的控制[7-8],該控制器所具有的強(qiáng)魯棒性可以有效解決由被控系統(tǒng)的參數(shù)變化和不確定性擾動(dòng)而造成的不利影響。為此,設(shè)計(jì)了一種高效的模型預(yù)測(cè)控制(Model predictive control,MPC)方法對(duì)不穩(wěn)定的TWIPR系統(tǒng)進(jìn)行準(zhǔn)確控制,利用過程的顯示模型對(duì)系統(tǒng)的性能進(jìn)行優(yōu)化。同時(shí),采用一種確定性的自回歸滑動(dòng)平均(Deterministic Autoregressive Moving Average,DARMA)模型對(duì)TWIPR系統(tǒng)進(jìn)行數(shù)學(xué)建模,而MPC控制器的設(shè)計(jì)則利用該TWIPR模型的一個(gè)線性狀態(tài)空間。通過與LQR控制器進(jìn)行比較,設(shè)計(jì)的MPC控制器能夠有效降低控制系統(tǒng)的均方根誤差,具有更強(qiáng)的優(yōu)越性和可靠性。
倒立擺系統(tǒng)的動(dòng)力學(xué)模型是通過直接對(duì)其物理學(xué)特性進(jìn)行運(yùn)動(dòng)機(jī)理分析而獲得的[9]。盡管可以簡單有效地建立TWIPR的動(dòng)力學(xué)模型,但是在建模過程中對(duì)非線性系統(tǒng)的簡化和線性化處理可能會(huì)降低建模精度。為了避免上述建模過程的不足,釆用了DARMA模型對(duì)倒立擺機(jī)器人進(jìn)行數(shù)學(xué)建模。采用牛頓-歐拉(Newton–Euler)方法建立TWIPR系統(tǒng)的數(shù)學(xué)模型,如圖1所示。
其中,TWIPR系統(tǒng)的運(yùn)動(dòng)位置和方向可以通過提供驅(qū)動(dòng)力矩的兩個(gè)獨(dú)立驅(qū)動(dòng)器獲得。設(shè)計(jì)的MPC控制器的目標(biāo)在于調(diào)節(jié)控制TWIPR系統(tǒng)的位移x,方位角θ和傾斜角α分別達(dá)到理想值xd,θd和0。假設(shè)車輪和地面之間沒有任何的相對(duì)滑動(dòng),作用于左右輪上的平衡力和力矩使其獲得運(yùn)動(dòng)方程,如式(1)所示。
式中:Mw、Iw—TWIPR 左右兩個(gè)車輪的質(zhì)量和轉(zhuǎn)動(dòng)慣量;Fl、Fr—左右車輪與平臺(tái)之間的相互作用力;Hl、Hr—作用在左右車輪上的摩擦力;dl、dr—左右車輪的外部作用力;θl、θr—在左右車輪的運(yùn)動(dòng)轉(zhuǎn)角;xl、xr—左右車輪在TWIPR運(yùn)動(dòng)方向上的位移;α、θ—倒立擺的傾斜角和車輛的方位角;r、m—車輪半徑和倒立擺質(zhì)量。
作用在倒立擺上沿x方向上的平衡力和繞重力中心點(diǎn)O的轉(zhuǎn)矩可以數(shù)學(xué)表示,如式(2)所示。
為了驗(yàn)證所建立的TWIPR模型的準(zhǔn)確性和預(yù)測(cè)控制器的有效性,需要搭建相應(yīng)的仿真系統(tǒng),主要由預(yù)測(cè)控制器和倒立擺模型兩部分組成。在通常情況下,MPC控制器需要預(yù)先設(shè)定參考軌跡,然后根據(jù)建立的TWIPR模型輸出反饋進(jìn)行反復(fù)校正,最終獲得最優(yōu)的預(yù)測(cè)控制量。這里的兩個(gè)倒立擺的模型參數(shù)均設(shè)置如下:m=95kg,M=44.5kg,Mw=6.55kg,IM=5kg·m2,Ip=137kg·m2,d=0.55m,l=1.026m,r=0.223m和Iw=0.17kg·m2??刂屏鞒虉D,如圖2所示。
國內(nèi)外常用的土壤重金屬污染程度評(píng)價(jià)方法有單因子污染指數(shù)法、地積累指數(shù)法、內(nèi)梅羅綜合指數(shù)法、潛在生態(tài)危害指數(shù)法[5],還有利用地質(zhì)統(tǒng)計(jì)學(xué)來評(píng)價(jià)重金屬污染空間特征及危險(xiǎn)性評(píng)價(jià)的方法[6-7]。這些評(píng)價(jià)方法各有優(yōu)缺點(diǎn),也有不同的適用性,沒有系統(tǒng)的分類及統(tǒng)一的標(biāo)準(zhǔn)[8]。本文欲考慮成巖過程的自然地質(zhì)作用對(duì)土壤重金屬背景值的變動(dòng)影響下來評(píng)價(jià)農(nóng)田土壤中重金屬的潛在生態(tài)危害,故選取地積累指數(shù)法及潛在生態(tài)危害指數(shù)法來對(duì)鈾礦尾礦庫周邊的農(nóng)田土壤重金屬污染狀況進(jìn)行綜合評(píng)價(jià)。
1.觀察組和對(duì)照組患者治療依從性比較:觀察組138例CP患者中治療依從性良好137例,良好率99.3%;對(duì)照組CP患者治療依從性良好116例,良好率84.1%。觀察組CP患者治療依從性顯著優(yōu)于對(duì)照組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。
聯(lián)立式(1)至式(3),可以得到TWIPR系統(tǒng)的運(yùn)動(dòng)方程。接下來,若定義狀態(tài)的六維矢量為[α α˙x v θ θ˙],則 TWIPR 系統(tǒng)的狀態(tài)空間方程可表示為矩陣,如式(4)所示。
做好雨污分流,有利于減少污水產(chǎn)生量,降低運(yùn)營成本,有利于降低垃圾堆體含水率,減少臭氣產(chǎn)生量,提高堆體穩(wěn)定性,是實(shí)現(xiàn)生活垃圾衛(wèi)生填埋的關(guān)鍵所在。
顯然,上式中的目標(biāo)函數(shù)具有如下的離散二次結(jié)構(gòu):
考慮到預(yù)測(cè)控制策略優(yōu)異的魯棒性和模型適應(yīng)性,對(duì)于TWIPR的穩(wěn)擺控制可以通過預(yù)測(cè)控制的方法來實(shí)現(xiàn)。設(shè)計(jì)的MPC算法主要包括三個(gè)共同元素,即預(yù)測(cè)模型,目標(biāo)函數(shù)和控制規(guī)則[10]。同時(shí),采用DARMA模型具有離散性和線性時(shí)變性,因而其狀態(tài)空間可表示,如式(6)所示。
致謝:感謝EvelyIle Barbin、Bj?rn Smestad及Hans Niels Jahnke在此文撰寫過程中給予的指導(dǎo)和幫助.
采用MATLAB軟件的Simulink模塊搭建設(shè)計(jì)的MPC控制器,其中MPC兩個(gè)獨(dú)立控制器的具體參數(shù)可分別通過求解式(6)和式(10)獲得。搭建的控制系統(tǒng)利用采樣時(shí)間為0.1s的零階保持器作為輸入信號(hào),同時(shí)加權(quán)矩陣,如式(11)所示。
MPC控制器利用解耦單元將τα和τθ轉(zhuǎn)換為車輪轉(zhuǎn)矩τr和τl,使TWIPR繞z軸和y軸的轉(zhuǎn)動(dòng)能夠被獨(dú)立控制,而其對(duì)應(yīng)的解耦單元設(shè)計(jì)為 tα=τl+τr和 tθ= τl-τr。因此,式(4)所描述的車輛狀態(tài)空間模型主要包括兩個(gè)解耦的子系統(tǒng),即倒立擺系統(tǒng)和轉(zhuǎn)動(dòng)系統(tǒng),可別表示為式(5)所示。
接下來,主要集中于利用模型預(yù)測(cè)控制策略設(shè)計(jì)兩個(gè)相互獨(dú)立的MPC控制器。
式中控制步長用m表示。同時(shí),通過對(duì)加權(quán)對(duì)稱矩陣Q(k)和R(k)的調(diào)節(jié)可使控制系統(tǒng)獲得特定的性能。此外,出于簡化公式的目的,下面將引入兩個(gè)新變量,如式(8)所示。
在沒有任何約束的條件下,僅且有唯一的U(k)使得J存在最小值。因此,若令上式的一階偏導(dǎo)數(shù)為0,則可以得到最小值2HU(k)-2F。若 H 存在逆矩陣,則式(8)的唯一解為 U*(k)=H-1F。顯然,若H正定,則H的逆H-1存在,這就確保了J的二階導(dǎo)數(shù)同樣正定,故U*(k)為最小值點(diǎn)。但是,若H可能為病態(tài)矩陣時(shí),則H的數(shù)值求逆過程應(yīng)當(dāng)盡量避免。此時(shí),可以采用將其等效為最小二乘問題進(jìn)行數(shù)值求解,最終獲得最小值U*(k)??紤]到當(dāng)加權(quán)矩陣為對(duì)角矩陣時(shí),其矩陣的平方根可簡單等效為所有對(duì)角元素的平方根。因此,最小值U*(k)是標(biāo)準(zhǔn)方程式(9)的解。
式中:ml2—TWIPR系統(tǒng)繞y軸的轉(zhuǎn)動(dòng)慣量;g、l—重力加速度和O點(diǎn)和重力中心點(diǎn)之間的距離。作用在平臺(tái)和倒立擺上的平衡力矩的數(shù)學(xué)表達(dá)式,如式(3)所示。
式中:“+”—矩陣的偽逆,從而有 U*(k)=Kε(k)為增益 K 和跟蹤誤差ε(k)的最優(yōu)控制過程。
我剛點(diǎn)燃那堆干柴,小屋的門突然被推開了,一個(gè)淋得透濕的姑娘閃了進(jìn)來,怯怯地問我:“大哥,天太冷了,我可以在您這兒烤烤火嗎?”我說:“當(dāng)然可以,你過來吧。”姑娘說:“謝謝大哥!你這兒還有點(diǎn)可以吃的東西嗎?我餓得慌?!蔽艺f:“有,在鍋里蓋著呢,但現(xiàn)在已經(jīng)涼透了,我這就去給你熱一下?!?/p>
圖2 TWIPR控制系統(tǒng)的流程圖Fig.2 Flow Chart of TWIPR Control System
式中:l—預(yù)測(cè)間隔的離散步長的數(shù)目。
正如前文所述,控制目標(biāo)是在各種干擾和外力條件下調(diào)節(jié)傾斜角α趨近于0。外力0.1sin(t)和階梯狀干擾應(yīng)用到TWIPR去驗(yàn)證設(shè)計(jì)控制器的正確性,并將設(shè)計(jì)的MPC控制器與文獻(xiàn)[6]中LQR控制器進(jìn)行比較,相關(guān)的仿真結(jié)果,如圖3~圖5所示。
MPC控制器和LQR控制器在相同加權(quán)矩陣的條件下的對(duì)比結(jié)果,如圖3~圖5所示。MPC控制器對(duì)于穩(wěn)定倒立擺系統(tǒng)要優(yōu)于LQR控制器。其中,MPC控制器對(duì)于梯狀干擾的傾斜角的響應(yīng)要比LQR控制器平穩(wěn)得多,而旋轉(zhuǎn)角的響應(yīng)則與LQR基本相當(dāng)。此外,由圖5可以看出,設(shè)計(jì)的MPC控制器相對(duì)于LQR控制器來說需要更小的控制輸入力矩。然后,分別計(jì)算MPC和LQR控制器的均方根誤差(means square error,MSE)用以評(píng)估兩種控制方法的性能,相關(guān)的仿真結(jié)果,如表1所示。
圖3 MPC和LQR控制器對(duì)梯狀干擾力的傾斜角響應(yīng)Fig.3 Tilt Angle Response of the MPC and LQR Controller to the Stepped Disturbance Force
圖4 MPC和LQR控制器對(duì)梯狀干擾力的旋轉(zhuǎn)角響應(yīng)Fig.4 Totation Angle Response of MPC and LQR Controller to the Ladder Disturbing Force
圖5 MPC和LQR控制器的左右輪驅(qū)動(dòng)力矩Fig.5 Left and Right Driving Torque of the MPC and LQR Controller
從表1結(jié)果可知,MPC控制器對(duì)于梯狀和正弦外力的傾斜角響應(yīng)的MSE分別為1.0313×10-6和1.1753×10-6,而LQR控制器對(duì)應(yīng)的響應(yīng)則為0.0132和0.0134。同時(shí),MPC控制器對(duì)于梯狀和正弦外力的旋轉(zhuǎn)角響應(yīng)的MSE分別為0.0158和0.0162,而LQR控制器對(duì)應(yīng)的響應(yīng)均為0.0263。顯然,在兩種外力驅(qū)動(dòng)的條件下,設(shè)計(jì)的MPC控制器的均方根誤差要明顯小于LQR控制器,尤其是對(duì)傾斜角的控制性能,其原因主要在于MPC控制器的前饋控制能夠有效補(bǔ)償可測(cè)干擾。
決策式句法分析模型的典型代表是移近—?dú)w約狀態(tài)轉(zhuǎn)移模型。移近—?dú)w約狀態(tài)轉(zhuǎn)移模型在分析過程中維護(hù)一個(gè)堆棧和一個(gè)隊(duì)列,堆棧用以存儲(chǔ)到目前為止所有的依存子樹,隊(duì)列存儲(chǔ)尚未被分析到的詞。堆棧頂端和隊(duì)列的頭部確定了當(dāng)前分析器的狀態(tài),依據(jù)該狀態(tài)決定進(jìn)行移進(jìn)、規(guī)約或者建立棧頂元素與隊(duì)首元素的依存關(guān)系的操作,從而轉(zhuǎn)入新的狀態(tài)。
表1 兩種控制器的均方根(MSE)誤差的比較Tab.1 Comparison of the Root Mean Square(MSE)Error of the Two Controllers
針對(duì)欠驅(qū)動(dòng)的雙輪倒立擺機(jī)器人(TWIPR)的非線性系統(tǒng),使用模型預(yù)測(cè)控制(MPC)策略設(shè)計(jì)了兩個(gè)相互獨(dú)立控制器。為了簡化TWIPR系統(tǒng)的非線性模型,在其不穩(wěn)定平衡點(diǎn)附近進(jìn)行線性化,然后利用解耦單元根據(jù)線性模型設(shè)計(jì)了兩個(gè)獨(dú)立MPC控制器,在存在梯狀干擾和兩個(gè)其他外部干擾的條件下,對(duì)設(shè)計(jì)的MPC控制器的有效性和可靠性進(jìn)行驗(yàn)證。最后,將設(shè)計(jì)的MPC控制器與線性二次調(diào)節(jié)(LQR)控制器進(jìn)行對(duì)比分析,通過引入控制器的均方根誤差(MSE)評(píng)估其性能。仿真結(jié)果表明:設(shè)計(jì)的MPC控制器相對(duì)于LQR控制器具有更好的有效性和可靠性。此外,由于MPC的控制前饋能夠在本質(zhì)上補(bǔ)償各種可測(cè)干擾,使MPC控制器的抗干擾性和魯棒性同樣強(qiáng)于LQR控制器。
校園足球研究的作者地域遍布在24個(gè)省、自治區(qū)和直轄市(見表6),地域分布廣泛,但地區(qū)差異明顯,分布不均衡.從表6可以看出,校園足球的研究主要集中在上海、北京、廣東、湖北、山東、江蘇和遼寧等地,共發(fā)文76篇,占發(fā)文總量的61.29%,與這些地區(qū)的經(jīng)濟(jì)文化發(fā)展水平高,足球運(yùn)動(dòng)開展活躍有關(guān).