高江徽 魯力群 李輝
摘 要:在AGV(Automated Guided Vehicle)運行過程中,建立BP神經(jīng)網(wǎng)絡預測模型,對周圍環(huán)境的智能移動體的運動軌跡進行綜合動態(tài)預測和評估,結(jié)合納什均衡理論建立移動機器人運動決策模型,使得AGV在運行過程中建立類人判斷的能力即考慮AGV和其他移動智能體的相對位置的關(guān)系,對其他的移動智能體的預測價值可以有效的評估。文章通過構(gòu)建動態(tài)博弈模型求解灰色碰撞概率,可以高效的為AGV防撞提供合理的參考。
關(guān)鍵詞:AGV;BP神經(jīng)網(wǎng)絡;預測;灰色碰撞概率
中圖分類號:U467? 文獻標識碼:A ?文章編號:1671-7988(2020)03-226-04
前言
移動機器人AGV(Automated Guided Vehicle)運動在復雜的環(huán)境下存在著諸多的問題,無法有效的判斷其他移動智能體的運動意圖、無法根據(jù)周圍的環(huán)境進行導航方法的轉(zhuǎn)變。為了解決上述問題,陳海燕[1]將進行協(xié)作的機器人個體看成具備自治能力的移動智能體,然而并沒有解決機器人在運行中適應環(huán)境的問題。李洋[2]人提出將博弈論應用于多機器人目標追蹤中,這種方法是基于各個智能體都建立通訊的基礎(chǔ)上,無法應用于人與移動機器人共存的環(huán)境下。
為了解決上述問題,本文提出基于BP神經(jīng)網(wǎng)絡的AGV防撞避讓評估方法。本方法利用預測價值判斷避免過度主動跟蹤、不需要建立通訊和計算博弈雙方納什均衡點的位置及其灰色碰撞概率,為移動機器人的決策提供參考,可以在不失去預測準確性的前提下,計算量大幅度下降。
1 防撞方法模型描述
在AGV運行過程中,由于外界環(huán)境的影響,總是需要進行一系列的決策,來保證移動機器人平穩(wěn)有效的運行。AGV的一次決策過程分為兩個階段:預測分析階段和評估階段。在預測分析階段,AGV通過自身攜帶的傳感器計算自身位置和環(huán)境中其他物體位置的關(guān)系等進而分析自身與其他物體的碰撞可能性;在評估階段,分析他們的運動軌跡作出價值評估,當價值比較低時,對移動機器人運動意圖干擾較小,可不作考慮;當價值比較高時即對移動機器人運動意圖干擾比較大時,作為監(jiān)控預測對象,并且建立預測對象和移動機器人的博弈模型,通過基于BP神經(jīng)網(wǎng)絡構(gòu)建灰色碰撞概率模型來為AGV防撞避讓提供參考依據(jù)。
2 移動智能體軌跡預測及價值評估
2.1 基于BP神經(jīng)網(wǎng)絡預測模型
移動機器人AGV自身通過搭載的傳感器可以對周圍的智能移動體或人進行目標檢測和跟蹤以及運動數(shù)據(jù)讀取。在完成傳感器的數(shù)據(jù)獲取之后,利用AGV搭載的上位工控機對獲取來的數(shù)據(jù)進行融合并去除冗余數(shù)據(jù)。為了方便模型的建立與計算方便,我們把智能體歸為一類,以不同的編號表示不同的移動體。選取數(shù)據(jù)集中的方向、速度、加速度、橫向偏移為建模因子,對每個因子建立BP[3]神經(jīng)網(wǎng)絡來預測每個因子變化來完成軌跡預測,在實際的計算中可以簡化為對坐標點位的預測。
2.2 各影響因子的BP神經(jīng)網(wǎng)絡建立
BP神經(jīng)網(wǎng)絡的結(jié)構(gòu)如圖1所示,其結(jié)構(gòu)包含三層網(wǎng)絡結(jié)構(gòu):輸入層、隱含層和輸出層[4]。BP神經(jīng)網(wǎng)絡一共分為三層,第一層為輸入層,由信號源節(jié)點Xk(n=1,2,3…n)組成;第二層為隱藏層Hk(n=1,2,3…n),隱藏層中神經(jīng)元的變換函數(shù)非負線性函數(shù),該函數(shù)是局部相應函數(shù),要設置相應的隱藏層神經(jīng)元個數(shù);第三層為輸出層Yk(n=1,2,3…n),是對輸入模式做出的響應,輸出層是對線性權(quán)進行調(diào)整,采用的是線性優(yōu)化策略,學習速度較快。
慣性評估,是處于軌跡預測之前的階段,是在基于瞬時狀態(tài)下,以一小段時間為周期,對未來位置的趨勢進行的整體性評估,從宏觀來衡量AGV與其他移動智能體的關(guān)系。如圖4所示,A為AGV,B為其他移動智能體,A的速度為v0,B的速度為v1,則他們的相對速度為?v,且?v與相對位移方向存在夾角β。當β>0時,在宏觀慣性預測下不具備碰撞的條件,然而AGV在實際中,并不是以一個運動的點存在,而是一個有相當體積的物體存在,考慮預測數(shù)值本身的細微誤差,因此有必要設置一個安全圓距離。
如圖5所示,給AGV設置安全圓距離r,當夾角β=θ0時,慣性運動軌跡與安全距離圓相切,令θ0為臨界干擾角。當β>θ0時,宏觀上不具備碰撞的條件,即預測價值較低;當β≤θ0時,宏觀上具備碰撞的條件,即預測價值較高。
3 灰色碰撞概率求解
基于上文中已經(jīng)對其他移動智能體進行了價值評估和預測,接下來需要對潛在的碰撞點和碰撞概率進行求解,為AGV的決策提供依據(jù)。關(guān)于博弈在對于碰撞概率和碰撞位置,是逆向求解的結(jié)果。在周期預測時間T中,對于預測價值高的移動智能體進行了BP神經(jīng)網(wǎng)絡的預測,在周期T中取n個時間節(jié)點,可以得到預測點位置Pi (i=1,2,3…n);假設一個周期總的移動位移為lzong,每個內(nèi)移動的距離為li (i=1,2,3…n),有
,設真實的點位置為Ci (i=1,2,3…n),作第i個時間節(jié)點真實位置與預測位置的絕對值差?li,在求解納什平衡位置之前,需要對數(shù)據(jù)集的數(shù)據(jù)進行概率評價處理。由前文所述的部分,設
為近域系數(shù),將bi組成的數(shù)據(jù)集計為數(shù)據(jù)集H,以數(shù)據(jù)集H作為歷史數(shù)據(jù)集,建立基于時間序列的BP預測模型,預測未來的近域系數(shù)。
由上述部分,可以歸納出:
式中:?li為第i個時間節(jié)點真實位置與預測位置的絕對值差,bt為t時刻的近域系數(shù),lzong為一個周期內(nèi)總的位移距離,lt,t+1為t,t+1時刻的距離差。
對于納什平衡的計算過程,通過對移動智能體歷史數(shù)據(jù)的推演得到t時刻的預測位置,根據(jù)移動智能體的近域系數(shù)進行預測,得到t時刻的bt。
當t時刻,AGV的既定規(guī)劃路徑和安全域產(chǎn)生重合時,發(fā)生博弈[6],雙方存在對路徑的使用的矛盾,即發(fā)生碰撞。按照各自利益最大化原則,即既定規(guī)劃路徑和安全區(qū)域圓的初始焦點位置是博弈雙方的納什均衡位置。
有了納什均衡的位置,可以求解灰色碰撞概率。即在t時刻,AGV按照既定路徑運行時發(fā)生碰撞的概率即灰色碰撞概率為:
??????????????????????????????????????? (3)
式中:bt為近域系數(shù)。
在AGV的實際運行中,可以設定一個限定的概率值η,當P<η,AGV可以適當冒險,增加博弈帶來的風險;反之,AGV可以通過提前加速、減速或繞行改變既定規(guī)劃路線,來規(guī)避碰撞帶來的損失。
4 算例驗證
本次算例模擬場景選取T型路口,如圖6所示,由4個移動智能體和AGV構(gòu)成,使用計速器模擬數(shù)據(jù)采集,并對數(shù)據(jù)進行處理,作為數(shù)據(jù)的基礎(chǔ)庫。AGV由X前往Y,通過4個移動智能體隨意走動,來進行算例驗證。這里的驗證設計并沒有真正的AGV存在,算例驗證是為了說明相對位置與時間的關(guān)系對防撞評估造成的影響。
由圖6,經(jīng)過慣性預測和價值評估,只有4號移動智能體的預測價值更大,本文一秒為30時刻,取42個時刻為預測時間段的歷史數(shù)據(jù)集,以7個時刻為一個周期,預測AGV接下來7個時刻的橫縱坐標的位置,經(jīng)過BP神經(jīng)網(wǎng)絡的預測得的橫縱坐標預測結(jié)果,如圖7和圖8所示。4號移動智能體橫坐標值的維持在5.1-5.15m,縱坐標的變化區(qū)間在7.6-8.5m,預測效果較為平滑。
經(jīng)過對4號移動智能體進行價值評估和軌跡點預測,接下來需要對潛在的碰撞點的碰撞概率進行求解,為AGV的避讓決策提供依據(jù)。其近域系數(shù)如圖9所示。以前42個時刻(6個時刻周期)為近域系數(shù)的歷史數(shù)據(jù)集,得到接下來7個時刻下每一時刻對應位置的碰撞灰色碰撞概率。AGV可以利用此種方法通過加速、減速和繞行,甚至停止運行來減少碰撞的可能性。
圖9? 碰撞概率預測圖
5 結(jié)論
(1)通過構(gòu)建BP神經(jīng)網(wǎng)絡對目標移動智能體進行初步計算,有效地檢驗預測模型的有效性,進而獲取較為理想的
近域系數(shù)。
(2)通過對目標移動智能體的慣性軌跡預測與預測價值判斷,忽略預測價值較低的其他移動智能體,有效地減少了不必要的計算量,使得AGV運行更為高效。
(3)利用近域系數(shù)組成的歷史數(shù)據(jù)集,構(gòu)建基于BP神經(jīng)網(wǎng)絡預測模型,得到移動機器人在既定路徑軌跡t時刻的灰色碰撞概率,為AGV的運動避讓提供參考。
(4)不足之處在于,對于非線性位置關(guān)系的長期預測,不具有良好的魯棒性。
參考文獻
[1] 陳海燕.基于博弈論的多機器人個性化協(xié)作研究[D].中南大學, 2003.
[2] 李洋.基于合作博弈論的社會化多機器人協(xié)作方法研究[D].上海大學,2015.
[3] 吳微,陳維強,劉波.用BP神經(jīng)網(wǎng)絡預測股票市場漲跌[C]// Optimi -zation Method, Econophysics & Risk Management-proceedings of Ccast.2001.
[4] 李萍,曾令可,稅安澤等.基于MATLAB的BP神經(jīng)網(wǎng)絡預測系統(tǒng)的設計[J].計算機應用與軟件, 2008(04):155-156+190.
[5] 吳微,陳維強,劉波.用BP神經(jīng)網(wǎng)絡預測股票市場漲跌[J].大連理工大學學報,2001(01):12-18.
[6] 張菁,何友,彭應寧等.基于神經(jīng)網(wǎng)絡和人工勢場的協(xié)同博弈路徑規(guī)劃[J].航空學報,2019(3):223-233.