劉瓏龍,于盛楠,高存臣
(中國海洋大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,青島 266100)
在機器人軌跡規(guī)劃的過程中會產(chǎn)生震蕩,造成額外能量消耗.而在定點運動中,不同的運動軌跡會造成不同程度的抖振.如何設(shè)計機器人的最優(yōu)軌跡優(yōu)化問題受到了工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注.傳統(tǒng)的機器人軌跡規(guī)劃多以運行時間指標(biāo)為目標(biāo),采用B 樣條插值對一系列離散路徑點擬合[1],在邊界層出現(xiàn)穩(wěn)態(tài)跟蹤誤差,運動平穩(wěn)性較差.近幾年,楊國軍等[2]對簡單遺傳算法進行了改進,將模糊原理應(yīng)用于遺傳算法,提出了一種基于模糊遺傳算法的機械手時間最優(yōu)軌跡規(guī)劃方案.王憲等[3]提出基于改進蟻群算法的機器人軌跡規(guī)劃,引入帶方向信息的全局啟發(fā)因子來提高最優(yōu)路徑的搜索效率.甘亞輝等[4]采用遺傳算法綜合考慮各機器人沿軌跡運動的安全性,運動代價以及運動約束,獲得了單個機器人規(guī)劃最優(yōu)的運動軌跡.付榮等提出了關(guān)節(jié)空間基于粒子群優(yōu)化[5]和自適應(yīng)遺傳算法[6]的時間最優(yōu)3-5-3多項式插值軌跡規(guī)劃算法,解決了由于多項式插值軌跡規(guī)劃具有階次高,沒有凸包性質(zhì)的缺點,難以應(yīng)用傳統(tǒng)優(yōu)化方法進行優(yōu)化的問題.王學(xué)琨等[7]針對六自由度關(guān)節(jié)型解耦機械臂在抓取目標(biāo)物體過程中出現(xiàn)的不穩(wěn)定性、快速性以及最大速度約束的問題,提出了一種利用DE算法優(yōu)化的時間最優(yōu)3-5-3多項式插值機械臂軌跡規(guī)劃算法.余陽[8],赫建立等[9]采用高次均勻B樣條插值,提出了基于遺傳算法的軌跡規(guī)劃方案,該方案比較理想化地兼顧了工業(yè)機器人工作效率與軌跡的平穩(wěn)性.劉一揚等[10]改進了遺傳算法的機器人運動軌跡跟蹤控制,在機器人運動軌跡滑模面設(shè)計一個跟蹤誤差的積分補償器,緩解了運動軌跡跟蹤控制在邊界層出現(xiàn)穩(wěn)態(tài)跟蹤誤差.鄧飆等[11]使用五次B樣條插值規(guī)劃軌跡,引入了罰函數(shù)處理約束條件,利用非支配排序遺傳算法(NSGA-II)對軌跡進行多目標(biāo)優(yōu)化,選擇了最為平滑且時間最優(yōu)的解作為最終解.殷鳳健等[12]利用三次樣條插值和自適應(yīng)遺傳算法對運動軌跡進行了時間最短優(yōu)化,并利用罰函數(shù)解決了系統(tǒng)運動的約束問題.對于固定時間頂點的最優(yōu)軌跡規(guī)劃問題的目標(biāo)函數(shù),求得了使得整個運動過程消耗最小的能量函數(shù).梁延德等[13]在每兩個相鄰的目標(biāo)點之間構(gòu)造分段數(shù)為7的三次樣條函數(shù),證明了此時的插值函數(shù)有能力描述時間最短的軌跡問題,并用BFGS 方法進行了優(yōu)化計算.
對于機器人可行軌跡的規(guī)劃問題,上述算法往往僅在以總時間為指標(biāo)的目標(biāo)函數(shù)上加上其他項,或者增大擬合多項式的次數(shù),增大樣條函數(shù)的次數(shù)上進行了改進.但是人工參與設(shè)置的參數(shù)過多,模型不穩(wěn)定以及擬合過沖導(dǎo)致運動軌跡震蕩的情況還未引起學(xué)者的足夠重視.
本文針對種群優(yōu)化算法中人工參數(shù)設(shè)置過多,模型訓(xùn)練過程不穩(wěn)定以及擬合過沖導(dǎo)致運動軌跡震蕩的情況,提出了一種基于滑模控制的改進差分進化(IDE)算法.該算法在變異階段之前增加篩選階段,求出了當(dāng)前群體的目標(biāo)函數(shù)值最優(yōu)(適應(yīng)度值最小)的個體、適應(yīng)度值最大的個體和所有個體的平均水平.在變異階段,取消了變異因子,采用適應(yīng)度值最小的個體和平均水平的個體提高種群中每一個個體的水平,用適應(yīng)度值最小的個體替換適應(yīng)度值最大的個體,加快收斂速度.取消了交叉階段,減少了交叉因子的兩個參數(shù).在插值方面,采用了保形分段三次 Hermite 插值,降低了插值函數(shù)光滑性的要求,避免了模型不穩(wěn)定以及擬合過沖導(dǎo)致運動軌跡震蕩的情況.通過仿真實驗和結(jié)果分析表明,本文給出的改進差分進化算法與傳統(tǒng)方法相比,該方法具有明顯的優(yōu)勢.
差分進化算法是基于群體智能理論的優(yōu)化算法,通過群體中個體間的合作與競爭更新群體,最終通過迭代更新,逼近最優(yōu)解,因此可用于智能化優(yōu)化搜索.標(biāo)準(zhǔn)差分進化算法是根據(jù)父代個體間的差分矢量進行變異,交叉和貪婪選擇更新個體.其基本思想是從某一隨機產(chǎn)生的初始群體開始,通過把種群中任意兩個個體的向量差加權(quán)后乘上變異因子與第三個個體求和來產(chǎn)生新個體,然后將新個體與當(dāng)代種群中某個預(yù)先決定的個體相比較,如果新個體的適應(yīng)度值優(yōu)于與之相比較的個體的適應(yīng)度值,則在下一代中就用新個體取代舊個體,否則舊個體仍保存下來,通過不斷地迭代運算,保留優(yōu)良個體,淘汰劣質(zhì)個體,引導(dǎo)搜索過程向最優(yōu)解逼近.
在優(yōu)化設(shè)計中,差分進化算法與傳統(tǒng)的優(yōu)化方法相比,具有以下主要特點:
(1)差分進化算法從一個群體(即多個點)而不是從一個點開始搜索,這是它能以較大的概率找到整體最優(yōu)解的主要原因.
(2)差分進化算法的進化準(zhǔn)則是基于適應(yīng)性信息的,無須借助其他輔助性信息(如要求函數(shù)可導(dǎo)或連續(xù)),大大地擴展了其應(yīng)用范圍.
(3)差分進化算法具有內(nèi)在的并行性,這使得它非常適用于大規(guī)模并行分布計算,減小時間成本開銷.
(4)差分進化算法采用概率轉(zhuǎn)移規(guī)則,不需要確定性的規(guī)則.
但是標(biāo)準(zhǔn)的差分進化算法也存在以下問題:
(1)變異階段隨機選取3個個體進行差分,然后加權(quán)求和求出新個體,進行貪婪選擇后,二選一保留原始個體或者用新個體替代原始個體.利用隨機選取的個體進行更新,沒有充分利用種群中表現(xiàn)最好的個體和種群總體的信息,收斂的速度和穩(wěn)定性有待提高.
(2)為了增大種群多樣性,采用變異因子和交叉因子或者隨迭代代數(shù)變化的自適應(yīng)變異因子和交叉因子,在增大種群多樣性,避免陷入局部最優(yōu)的同時引入了需要人工干預(yù)的兩個參數(shù)的取值范圍.人工干預(yù)參數(shù)的引入,使得調(diào)參對于結(jié)果的影響很大,這不利于算法的應(yīng)用和推廣.
標(biāo)準(zhǔn)差分進化算法是基于實數(shù)編碼的進化算法,整體結(jié)構(gòu)上與其他進化算法類似,由變異,交叉和選擇三個基本操作構(gòu)成.改進的差分進化算法取消了交叉操作,主要包括以下幾個步驟:
(1)生成初始群體
在n維空間里,隨機產(chǎn)生滿足約束條件的M個個體作為初始種群,第i(i=1,2,···,M)個個體表示如下:
(2)篩選操作
計算所有個體的適應(yīng)度值,對所有個體按照適應(yīng)度值進行排序,求出最大、最小適應(yīng)度值的個體和所有個體的平均值r=rij(0,1)
其中,.i=1,2,···,M其 中,xj,j=1,2,···n為M維的列向量,t為代數(shù).xbest(t)為當(dāng)前代中種群中最好的個體;xbad(t)為當(dāng)前代中種群中最差的個體;xmean(t)為當(dāng)前種群中所有個體的平均值;xbj(t))-xmean(t)為差分向量.
(3)變異操作
對所有個體進行的變異操作為:
對表現(xiàn)最差個體的操作為:
其中,xij(t)為上一代對應(yīng)的個體,rand為 [- 1 ,1] 之間的隨機數(shù);xbest(t)為當(dāng)前代中種群中最好的個體;xmean(t)為當(dāng)前種群中所有個體的平均值;xbj(t))-xmean(t)為差分向量.最后用種群中最好的個體代替種群中最差的個體.由于式(5)借鑒了當(dāng)前種群中最好的個體信息,因而可加快收斂速度.由于每次用表現(xiàn)最好的個體替換表現(xiàn)最差的個體,每次迭代之后,種群的平均水平得到較大的提高.隨著迭代次數(shù)的增多,種群中最好的個體和平均水平的個體的差分逐漸減小,種群的進化逐漸由粗放搜索轉(zhuǎn)化到細(xì)化搜索.
(4)選擇操作
為確定xij(t)是否成為下一代成員,首先判斷其是否超過閾值,采用公式(7)進行更新,然后采用評價函數(shù)f(xi1,xi2,···,xin),i=1,2,···,M進行比較:
其中,xj,j=1,2,···n為M維列向量.反復(fù)執(zhí)行步驟(2)~(4)操作,直至達到最大迭代代數(shù)T.
對于標(biāo)準(zhǔn)差分進化算法而言,為了取得理想的結(jié)果,需要對差分進化算法的各個參數(shù)進行合理的設(shè)置.針對不同的優(yōu)化問題,參數(shù)的設(shè)置往往也不同.另外,為了使差分進化算法的收斂速度得到提高,學(xué)者們針對差分算法的核心部分,變異向量的構(gòu)造形式提出了多種擴展形式,以適應(yīng)更廣泛的優(yōu)化問題.
(1)變異因子F
變異因子F是控制種群多樣性和收斂性的重要參數(shù).一般在[0,2]之間取值.變異因子F值較小時,群體的差異度減小,進化過程不會跳出局部極值,導(dǎo)致種群過早收斂.變異因子F值較大時,雖然容易跳出局部極值,但是收斂速度會減慢.一般可選在F=0.3~0.6.
(2)交叉因子cr
群體的交叉因子cr一般在[0 ,1]之間選擇,比較好的選擇應(yīng)在0.3左右,cr取值偏大,收斂速度會加快,但易發(fā)生早熟現(xiàn)象.
(3)群體規(guī)模M
群體所含個體數(shù)量M一般介于5D和10D之間(D為問題的維度),M越大,種群多樣性越強,獲得最優(yōu)解概率越大,但是計算時間更長,一般取 20~50.
(4)最大迭代代數(shù)T
最大迭代代數(shù)T一般作為進化過程的終止條件.迭代次數(shù)越大,最優(yōu)解越精確,但是計算的時間會越長,需要根據(jù)具體問題設(shè)定.
以上四個參數(shù)對差分進化算法的求解結(jié)果和求解效率都有很大的影響,因此要合理設(shè)定這些參數(shù)才能獲得較好的效果.
對于改進的差分進化算法僅需設(shè)定種群規(guī)模M和最大迭代代數(shù)T兩個參數(shù),減少了人工干預(yù),有利于模型的應(yīng)用和推廣.
對于機器人軌跡規(guī)劃中最優(yōu)軌跡規(guī)劃的滑??刂茊栴},為了將改進DE與標(biāo)準(zhǔn)DE進行對比,此處的種群規(guī)模M和最大迭代次數(shù)T的設(shè)置與標(biāo)準(zhǔn)DE中相同.
在控制系統(tǒng)的軌跡規(guī)劃中,為了使實際上生成的軌跡平滑,在保持理想軌跡接近參考軌跡的同時,還應(yīng)確保系統(tǒng)在運動過程中消耗的總能量盡可能小,可采用保形分段三次Hermite函數(shù)插值,并結(jié)合改進的差分進化方法來進行軌跡規(guī)劃.
考慮機械轉(zhuǎn)動的二階線性系統(tǒng)
其中,θ為角度,I為轉(zhuǎn)動慣量,b為粘性系數(shù),τ為控制輸入,d為加在控制輸入上的擾動,|d| ≤ η2.
通過差分進化方法,沿著參考路徑進行最優(yōu)規(guī)劃,從而保證系統(tǒng)運動在不偏離參考路徑的基礎(chǔ)上,采用滑??刂品椒?實現(xiàn)對最優(yōu)軌跡的跟蹤,使整個運動過程中消耗的能量最小.
引理 1.對V:[0,+∞)∈R,不等式方程
的解為:
其中,α為任意常數(shù)[14].
不失一般性,最優(yōu)軌跡可在定點運動-擺線運動軌跡的基礎(chǔ)上進行優(yōu)化.擺線運動的表達式如下:
其中,T是擺線周期;θ0和 θd分別是初始角度和目標(biāo)角度.由于差分進化算法是一種離散型算法,因此需要對連續(xù)型的參考軌跡式(10)進行等時間采樣,采樣時間間隔為,可得離散化參考軌跡為:
最優(yōu)軌跡能夠通過優(yōu)化與參考軌跡的偏差來間接得到.假設(shè)系統(tǒng)達到穩(wěn)定的最大允許時間為t=3TE,根據(jù)能量守恒定理,用非保守力做功來表示系統(tǒng)在運動過程中消耗的總能量,目標(biāo)函數(shù)為:
其中,ω為權(quán)值,ω ∈ (0,1);τ為控制輸入信號;s(t)=sd(t)=(θ-θr)為實際跟蹤軌跡θ 與理想軌跡θr的距離.
通過采用差分進化算法,優(yōu)化軌跡式(11),使目標(biāo)函數(shù)值最小,從而獲得最優(yōu)軌跡.標(biāo)準(zhǔn)差分進化算法的設(shè)定參數(shù)如下:最大迭代次數(shù)G,種群規(guī)模M,變異因子F,交叉因子cr.經(jīng)過差分進化算法可得到一組最優(yōu)偏差,進而得到最優(yōu)的離散軌跡如下:
隨著社會經(jīng)濟的快速發(fā)展,我國企業(yè)規(guī)模也不斷擴大,企業(yè)經(jīng)營環(huán)境也發(fā)生了變化,企業(yè)內(nèi)部財務(wù)管理及管理會計對企業(yè)經(jīng)營管理能力的提高也有了比以往更加重要的作用。然而受傳統(tǒng)觀念的影響,我國許多企業(yè)會計工作推行的是財務(wù)會計主外,管理會計主內(nèi),這種模式下,企業(yè)會計職能無法高效發(fā)揮,一定程度上阻礙了企業(yè)的發(fā)展?,F(xiàn)行經(jīng)濟形勢下,對企業(yè)財務(wù)會計與管理會計的結(jié)合的呼吁越來越高,企業(yè)應(yīng)當(dāng)加快財務(wù)會計與管理會計的結(jié)合,進而更好地提高企業(yè)管理效率,為企業(yè)帶來更好的經(jīng)濟效益。
為了獲得連續(xù)型的最優(yōu)軌跡,采用保形分段三次Hermite插值進行軌跡規(guī)劃,即用保形分段三次Hermite插值的方法對離散軌跡進行插值的邊界條件如下:
插值節(jié)點為:
將插值得到的連續(xù)函數(shù) θop(k)作為關(guān)節(jié)的最優(yōu)軌跡.定義跟蹤誤差為e=θop-θ,設(shè)計滑模函數(shù)為:
其中,c> 0為常數(shù),則
設(shè)計滑模控制律為:
其中,η1>0.
根據(jù)引理1中的不等式求解引理[15],解得
考慮簡單的被控對象
其中,r為 0 ~1之間的隨機值.
采用改進的差分進化算法設(shè)計最優(yōu)軌跡 θop,取權(quán)值 ω =0.5,種群規(guī)模M=30.分別通過DE和IDE不斷優(yōu)化4個插值點的縱坐標(biāo),直到達到滿意的優(yōu)化指標(biāo)或最大迭代代數(shù)為止,這里設(shè)定最大迭代代數(shù)T=90.跟蹤指令為 θd=0.5,采用 (15)中的滑模控制律,取c=30,η1=300,為了降低抖振,采用飽和函數(shù)代替符號函數(shù),取 Δ =0.05,η2=1.01.
2010年Weber設(shè)計了對縮放因子F進行了適應(yīng)性的調(diào)整[16]分布式 DE 算法 (FACPDE).2012 年文獻[17]提出了對F和C進行動態(tài)調(diào)整的分布式DE算法(DDE-PTS).將標(biāo)準(zhǔn) DE,IDE,FACPDE,DDE-PTS 與滑??刂葡嘟Y(jié)合,得到仿真結(jié)果如圖1~圖3所示.圖1為DE與IDE控制輸入信號圖,圖2為DE FACPDE,DDE-PTS與IDE控制輸入信號圖.圖1和圖2顯示了IDE相比DE,FACPDE和DDE-PTS對于消除抖振的效果更佳顯著.標(biāo)準(zhǔn)差分進化算法由于采用了三次樣條插值,要求曲線存在二階連續(xù)偏導(dǎo),更加平滑;由于要解決的問題中存在二階導(dǎo)數(shù),改進DE采用保形分段三次Hermite插值,對于二階導(dǎo)數(shù)僅要求存在,弱化了條件,防止了擬合過沖,使用范圍更廣.FACPDE,DDEPTS由于人工參數(shù)設(shè)置的影響,導(dǎo)致收斂過程中信號的不穩(wěn)定性.從圖3的適應(yīng)度函數(shù)曲線和圖4的目標(biāo)函數(shù)優(yōu)化的最優(yōu)軌跡效果圖中,可以看出,足夠長時間后,DE、FACPDE、DDE-PTS和IDE均可逼近最優(yōu)解且IDE優(yōu)化最優(yōu)軌跡求出最優(yōu)解的速度比DE,FACPDE和DDE-PTS更快.IDE由于在變異階段充分利用了群體中最優(yōu)個體的信息和種群的平均水平,收斂速度有了很大的提升.此外,IDE去掉了變異因子和交叉因子,僅需設(shè)置種群數(shù)目和最大迭代次數(shù)兩個參數(shù),減少了人為參與,算法的穩(wěn)定性得到很大程度的提高,有利于算法的使用和推廣.上述結(jié)果驗證了IDE算法在軌跡規(guī)劃方面的合理性和有效性.
本文研究了機器人的軌跡規(guī)劃問題,并提出了基于滑??刂频腎DE算法.該算法在變異階段充分利用了種群中表現(xiàn)最好的個體和種群中所有個體的信息,利用表現(xiàn)最好的個體的信息與平均水平的個體的差分引領(lǐng)種群迭代更新的方向,利用表現(xiàn)最好的個體替換表現(xiàn)最差的個體,加快了收斂速度.取消了變異階段的變異因子和交叉階段,去掉了變異因子和交叉因子兩個人工調(diào)整的參數(shù),增強了模型的穩(wěn)定性,有利于模型發(fā)推廣應(yīng)用.在擬合階段采用采用保形分段三次Hermite插值,避免了擬合過沖,降低了插值函數(shù)光滑性的要求,增大了算法的使用范圍.
圖1 DE 與 IDE 控制輸入信號圖
圖2 DE,FACPDE,DDE-PTS 與 IDE 控制輸入信號圖
圖3 適應(yīng)度函數(shù)曲線
圖4 最優(yōu)軌跡效果圖
本文工作表明,所提出的基于滑模控制的IDE算法對于機器人的定點運動-擺線運動軌跡的軌跡規(guī)劃是有效的,未來將繼續(xù)關(guān)注IDE算法在其他生產(chǎn)領(lǐng)域的應(yīng)用研究.