劉 鵬,于鎮(zhèn)滔,曾建潮,張 鵬,盧志剛,馬躍東
(1.中北大學,太原 030051;2.北方自動控制技術研究所,太原 030006)
“機器人士兵”已從科幻描述走向現實應用,其參戰(zhàn)可追溯到二戰(zhàn)時德軍研制的“歌利亞遙控炸彈”反坦克武器,以色列在巴黎航展上展出的“哈比”無人機武器能夠自主發(fā)現和摧毀敵方雷達,美國研制出被稱作“普羅拉”的機器人士兵。近來,為提升全球軍事競爭能力,各大國紛紛制定該國關于機器人戰(zhàn)略的發(fā)展規(guī)劃,美國在2013 年制定的發(fā)展規(guī)劃中將研制軍用機器人的費用大幅提高,提升美軍無人裝備的使用比例達到30%。德國2013 年推出“工業(yè)4.0”戰(zhàn)略,日本則于2015 年發(fā)布了“日本機器人新戰(zhàn)略”。我國也發(fā)布了《中國制造2025》規(guī)劃,明確提出突破智能機器人領域的關鍵技術,應對新形勢下的無人化、智能化挑戰(zhàn)。
隨著人工智能技術的發(fā)展,無人機器作戰(zhàn)系統(tǒng)將是未來戰(zhàn)爭中的沖鋒部隊,具有造價低、便于維護、出勤率高、時效性強等特點,“機器人”(包括無人車、無人機等作戰(zhàn)系統(tǒng))沖鋒陷陣是目前熱戰(zhàn)爭模式中的最優(yōu)方案,能夠做到真正的全天候待命。機器人部隊執(zhí)行任務時需要具有精確的敵我位置信息。
機器人的準確位置是其實現移動行走、環(huán)境感知、編隊導航的基礎,定位精度和實時性決定了其執(zhí)行任務的效果。機器人部隊作為步兵作戰(zhàn)輔助裝備,在城市巷戰(zhàn)復雜地形下可實現對敵火力干擾和壓制,但前提是能夠確定敵我雙方的位置。現階段關于機器人的研究多為單機器人的性能提升,與單一系統(tǒng)相比,多機器人具有冗余配置、并行計算等優(yōu)勢,通過協(xié)作可拓展感知范圍,擁有出色抗擾能力。這里針對機器人的可定位性和協(xié)同定位展開闡述。
已知彼此的精確方位是智能機器士兵執(zhí)行自主移動、導航規(guī)劃、任務分派等任務的基礎??啥ㄎ恍允菣C器人對位置實現準確定位能力的一種度量,機器人具有可定位性時方可設計各種定位算法。Roy 利用定位概率分布的熵值來描述海洋機器人的可定位性,此熵值為一維變量,反映了可定位整體性能,但無法刻畫定位時的方向性。Censi 用Fisher 信息矩陣來反映移動機器人定位的整體性能和方向性,但地圖信息的不確定性會影響到定位評估效果。對機器人相應柵格進行離散化,可將Fisher信息矩陣應用于概率柵格地圖,引入動態(tài)評估因子后可用動態(tài)Fisher 矩陣來評價定位性能。借助無線物聯(lián)網之間的可定位性原理,可利用判定多點協(xié)同定位方法給出智能機器系統(tǒng)可定位性條件。對機器人運動過程建立數學模型,采用Kalman 濾波與信息融合理論,來分析基于激光雷達的地圖匹配定位方法,從而分析出影響可定位性的主要因素。
機器人具有多個感知單元,執(zhí)行分布式高級算法,通過協(xié)作在惡劣環(huán)境、國防軍事領域已開始使用。機器人系統(tǒng)協(xié)同作業(yè)時,通過無線相互通信獲得鄰居的相對觀測量或運動信息,利用這些信息可提高機器人系統(tǒng)的定位精度。多機器人系統(tǒng)亦可使用便攜式路標法來提高每個機器人的定位精度,但觀測信息丟失會導致定位誤差增大,以致機器人迷失方向。裝配不同傳感器的異構機器人,采用任務分解與分配算法,使得各機器人物盡其用,更顯合作定位的優(yōu)勢。智能移動機器人的自主定位與導航規(guī)劃依賴于應用背景和實驗平臺,需要考慮綜合使用多機器人的感知信息來實現高效自主定位,進而考慮如何在避免任務沖突時實現多機器人的導航定位。任務分解及導航規(guī)劃的過程均需要考慮多機器人系統(tǒng)的可定位性問題,然而對定位能力和定位誤差的估計仍然是多機器人領域的難題之一。
多機器人定位模型主要有運動學方程建模和優(yōu)化問題建模兩類。針對不同的模型方程,應用不同的技術策略進行定位,具體架構如圖1 所示。
圖1 機器人定位框架
建立精準的運動方程和匹配合適的定位模型是機器士兵執(zhí)行任務的前提,為設計高效實時定位算法提供依據。
2.1.1 運動學方程建模
其中,p和p是待估計的移動機器人位置。
智能移動機器人根據建模原理的不同,對應著不同的定位算法,這里主要從信息融合與優(yōu)化的角度進行綜述。
2.2.1 基于信息融合
機器人系統(tǒng)根據所攜各類傳感器確定其在給定環(huán)境中的位姿時,由于傳感器與執(zhí)行器存在的隨機誤差會影響到定位精度,故可將信息融合策略用于機器人的自主定位。常用的融合估計方法分為最小二乘擬合法和貝葉斯型估計方法兩大類。前者以殘差平方總和最小為準則進行靜態(tài)數據處理,后者處理動態(tài)過程估計。
移動機器人的狀態(tài)方程與觀測方程一般用條件概率分布來描述,大部分移動機器人的定位算法都為貝葉斯估計算法的延伸,結構上均采用“預測-更正”兩步來實現。利用高斯分布來描述機器人狀態(tài)分布時的估計方法稱為高斯濾波算法,其代表是Kalman 濾波器?,F實建立的機器人模型為非線性形式,低非線性時使用形式簡潔、計算高效的擴展Kalman 濾波器;狀態(tài)局部非線性化程度高時,擴展Kalman 濾波器性能受限。對此,研究人員提出利用無跡Kalman 濾波和中心差分Kalman 濾波兩種算法進行移動機器人定位,它們避免了計算雅克比矩陣,雖提高了魯棒性,但容易導致數值不穩(wěn)定,此時可以將地圖數據庫信息作為約束條件,設計具有約束條件的濾波算法或平方根濾波算法進行定位。對于作戰(zhàn)機器士兵來說,需要已知實時態(tài)勢感知和位置,以粒子濾波為基礎的蒙特卡羅定位算法成為移動機器人領域流行的定位方法。粒子濾波算法是利用隨機采樣的樣本來近似機器人的狀態(tài)空間,可表示比高斯分布更廣泛的分布空間,適用于復雜環(huán)境的機器人定位。Fox 等人對馬爾科夫定位算法進行了擴展,利用概率分布來描述不同機器人的位姿信息,借助鄰居的額外信息重新定義得到新的概率分布,通過室內和室外環(huán)境的現場驗證得出該定位算法精度要高于其他定位算法精度的結論。多傳感器利用信息冗余來減小不同濾波算法的誤差協(xié)方差矩陣來提高定位精度,也可通過分布式計算來進行信息融合和定位。
除此之外,不同的定位策略可被引入到多機器人系統(tǒng)的同時定位與地圖構建問題中來,以改進現有機器人的定位與構圖算法精度。上述以Kalman濾波器、擴展Kalman 濾波器、粒子濾波為代表的算法使用前提是假設機器人當前狀態(tài)僅與前一時刻狀態(tài)有關,因此,這些定位算法可以統(tǒng)稱為馬爾可夫定位。當機器人狀態(tài)與之前所有時刻的狀態(tài)都相關時,便要考慮利用非線性優(yōu)化框架進行定位。
2.2.2 基于優(yōu)化算法
基于優(yōu)化理論的移動機器人系統(tǒng)定位方法和基于信息融合策略定位的思想不同。優(yōu)化方法是通過對待定位參數建立目標函數,機器人實際運行環(huán)境限制作為約束方程,通過優(yōu)化求解(解析法或數值法)目標函數的極值來得到各機器人的位置或姿態(tài)。根據建立的優(yōu)化模型(線性、非線性、隨機模型等),采用的優(yōu)化算法主要有:梯度下降法、滾動時域法、粒子群優(yōu)化,以及神經網絡、深度學習、分布式優(yōu)化等。不同的求解方法有著不同的優(yōu)缺點和使用范圍,實際采用的可行算法,由目標函數和約束條件來決定。下面對幾種常見算法的優(yōu)缺點和使用條件進行說明。
梯度下降法作為經典的優(yōu)化算法,被用于多機器人系統(tǒng)進行位姿確定。外置傳感器測量機器人之間的局部距離或相對方位信息,同時機器人根據內置傳感器得到的位姿估計值,來計算機器人間的相對距離或相對方位,利用測量值與估計值之間的均方差作為目標函數,求解該目標函數的極值獲得機器人的最佳估計位置。滾動時域估計是一種動態(tài)滾動式的優(yōu)化算法,此算法的優(yōu)化計算窗口為固定時間域長度,滾動更新機制設置為先入先出形式,考慮機器人間的狀態(tài)約束,性能指標函數由窗口開始時刻的機器人系統(tǒng)的位姿數據、窗內各時刻狀態(tài)噪聲與到達代價函數構成。通過最小化該性能指標函數得到時間窗結束時刻的多個機器人的位姿信息。智能機器人要像人一樣在未知環(huán)境中自主移動的關鍵是解決機器人在未知環(huán)境中的自我感知、識別以及定位等問題。在多機器定位系統(tǒng)中,利用深度學習算法進行目標識別,卷積神經網絡進行目標檢測。強化學習中神經網絡的Q- 學習控制策略與PID 控制方法相結合,使得海上半潛平臺機器人在未知海況下可尋找到最優(yōu)控制區(qū)間進而提高可靠性。神經網絡適用于非線性映射,并能輔助非線性濾波算法以提高濾波估計性能,但會存在收斂速度慢、計算復雜度高等問題。計算機視覺定位方法是通過圖像匹配或圖像分類的方式來實現機器人的定位,該方法無需未知環(huán)境中提前布置硬件設備,不受環(huán)境影響,可與其他定位方法進行組合使用來拓展機器人的定位范圍。
協(xié)同定位是在一個特定環(huán)境中存在已知節(jié)點(錨節(jié)點,即功能完善的節(jié)點)和未知節(jié)點,節(jié)點之間通過無線通信進行信息交互,也可利用外置傳感器進行測距、測向或鄰近探測,綜合利用過去的位置信息實現對未知節(jié)點當前位置的確定。協(xié)同定位的目標是通過節(jié)點間的協(xié)作提升單個或整體機器人節(jié)點的位置精度。該技術應用在無線傳感網絡、多機器人系統(tǒng)、水下自主航行器、戰(zhàn)機編隊及衛(wèi)星定位等領域。多機器人協(xié)同定位由Ryo 最早提出,基本思想為利用相鄰機器間的額外測量信息來提升整個機器人系統(tǒng)的定位精度和可靠性,應用場景如下頁圖2 所示。
圖2 多機器人協(xié)同定位
多機器人協(xié)同定位是保證多個移動智能機器人協(xié)作導航與環(huán)境探索的基礎。根據各自的功能和結構分為同構多移動機器人系統(tǒng)和異構多移動機器人系統(tǒng)。同構多移動機器人系統(tǒng)中各機器人的功能、結構、配置傳感器完全相同,一般采用并行運行方式,可在不同區(qū)域同時執(zhí)行任務;異構多移動機器人系統(tǒng)中各機器人的功能、結構、配置傳感器存在差異,通常采用“主-從”運行方式通過協(xié)作在不同區(qū)域同時執(zhí)行不同任務?,F有智能機器人系統(tǒng)協(xié)同定位方法主要有集中式處理和分布式處理兩類:集中式協(xié)同定位需要中心處理單元來接收和發(fā)送相關傳輸信息,中心處理機器人出現故障會引起整個系統(tǒng)定位失效;分布式處理時,每一個體的地位平等,單一個體的故障不會對整個系統(tǒng)產生影響。相比較而言,分布式定位方法是現在以及未來一段時間的研究熱點。定位的相對觀測量有:相對距離、相對方位和相對航向,這里將相對航向也視為方位類。
無線電測距傳感器具有高精度和低成本的特點,可在機器人上配置此傳感器,利用距離測量來進行目標定位。不考慮觀測站坐標誤差時,利用約束總體最小二乘法處理固定觀測站時差信息進行定位時精度較高,但存在噪聲和誤差時,定位精度下降。利用斜距離解析進行目標定位時,定位精度與坐標測量誤差相關,坐標測量誤差大,定位精度低。作為衡量均方誤差理論下限的克拉美-羅下界(Fisher 信息矩陣的逆),可以用來分析機器士兵間的相對位置結構對其定位精度的影響。針對多自主水下航行器移動長基線定位系統(tǒng),利用克拉美-羅下界和Fisher 信息矩陣,建立與隊形結構參數相關的定位性能評價函數,優(yōu)化該評價函數來得到最佳位置,當行列式最大時,多自主水下航行器具有最佳的編隊隊形。在此基礎上,文獻[8]探討了基于距離相關噪聲模型下的多自主水下航行器最優(yōu)隊形,以及協(xié)同定位性能與噪聲因子的敏感關系。進一步,文獻[1]研究目標定位精度與水面浮標到水下目標之間距離的關系,得到最優(yōu)定位幾何結構時的最優(yōu)距離。蒙特卡羅定位是多機器人協(xié)同定位的一種統(tǒng)計算法,借助獲取的相對位置信息,利用檢測模型的概率分布,融合自身位置信息和相對位置信息,從而得到高精度的全局位置信息。Howard在多機器人協(xié)同定位領域進行了大量研究,提出基于相對位置測量的協(xié)同定位方法,機器人之間的通信拓撲為完全圖,每個機器人對來自其他個體的測量信息利用粒子濾波估計位置,無需GPS、地圖等外部傳感器,適于未知復雜環(huán)境中多機器人之間的定位。但完全圖通信拓撲使得機器人定位時的計算量隨個體數目急劇增長,Howard 還提出用無線信號強度和分布式數值優(yōu)化等方法,來確定機器人之間的相對距離、角度和航向??突?梅隆大學開發(fā)的小型模塊化的異構機器人群,通過超聲波測距和最大似然估計法進行協(xié)同定位。Martinelli 建立對相對距離和角度同時適用的測量方程,利用擴展Kalman 濾波器處理協(xié)同定位方程。國防科技大學研究人員將該方程應用到雙輪差速移動機器人,得到更為實用的方程,進而利用非線性估計器進行協(xié)同定位,定位效果較好。
紅外雷達、被動雷達等被動探測系統(tǒng)具有探測距離遠、信號隱蔽性高等優(yōu)點,因而引起研究者的充分重視。被動探測系統(tǒng)用來觀測目標的方位角或俯仰角信息,該信息含有測量噪聲,需要多個傳感器協(xié)同估計目標的位置。一種常見的探測方式為雙機協(xié)同純角度被動探測,此方法在實際作戰(zhàn)中已有應用。Kalman 濾波算法用于雙觀測站被動跟蹤系統(tǒng)時,可得角度信息變化率與估計精度之間的關聯(lián)性。分析定位理論與僅含角度測量的單站目標跟蹤可知,跟蹤定位效果與觀測站運動軌跡相關,為了達到較高的跟蹤定位精度,觀測站機動加速度要高于目標機動的階次。僅有角度測量的多站目標跟蹤,當觀測站固定時,觀測站之間及觀測站與目標之間的幾何構型會影響跟蹤定位的精度;當觀測站運動時,合理規(guī)劃運動路徑后才能得到高精度的跟蹤定位精度。無錨節(jié)點的多機器人協(xié)同定位利用多邊法將定位后的機器人作為虛擬錨節(jié)點,該定位過程與機器人的組網結構相關。利用擴展Kalman 濾波器進行機器人的相對位姿測量時,同時需要機器人的位置和方位信息。相比于距離測量,一般相對方位容易測量,對方位傳感器并無特殊要求,相對方位能改善機器人定位的精度,為了兼顧機器人系統(tǒng)的定位精度和實時性,采用相對方位作為觀測量時協(xié)同定位的效果好。
多智能機器人平臺之間的協(xié)同定位理論和技術已經開展多年,取得了一定的研究成果。隨著通信技術、計算機技術和智能算法的發(fā)展,現有協(xié)同定位理論也面臨著理論約束和技術限制,需對未來機器人協(xié)同定位趨勢進行分析和判斷。
多機器人通過分布式的信息處理方式可提升單機器人的數據處理能力。我國協(xié)作機器人雖有進步,但與發(fā)達國家在機器人裝備水平的想象力方面還有一定差距。同時,現有多機器人系統(tǒng)協(xié)同定位技術存在下述問題:
1)復雜未知工作環(huán)境?,F有機器人理論與技術多是在提前預設環(huán)境中進行驗證,而實際戰(zhàn)場的態(tài)勢瞬息變化,這就需要智能自主的機器人在復雜未知環(huán)境中進行自我管理、自我規(guī)劃、自我探測。適應環(huán)境方面,多機器人協(xié)同系統(tǒng)明顯會優(yōu)于單個機器人系統(tǒng),但未考慮機器人協(xié)同時的真實環(huán)境狀態(tài)對協(xié)作定位的影響。
2)傳感器類型與融合方式。現有多機器人定位理論側重于定位算法的研究,以提高定位精度和實時性為目的。針對傳感器類型進行機器人協(xié)同定位融合算法的分析較少,尤其是對于異構機器人協(xié)同定位時不同機器人優(yōu)勢的發(fā)揮。
3)智能定位算法。現有多機器人協(xié)同定位時采用的算法比較成熟,對于智能算法在機器人戰(zhàn)隊中的運用較少。
理想的戰(zhàn)斗模式是單兵通過簡單指令實現對機器軍團的有效操控,這就要對機器人進行智能化設計,使其具有智能定位、導航、作戰(zhàn)等能力,作戰(zhàn)效能達到或接近人類士兵的水平。在機器人戰(zhàn)隊協(xié)同定位方面,可考慮下面研究方向:
1)強化對周圍環(huán)境的感知和適應能力。環(huán)境感知是機器人與周圍環(huán)境進行信息交互的前提,感知的目的是使機器人能夠更好地模仿人類去理解外界環(huán)境的態(tài)勢。根據作戰(zhàn)環(huán)境的不同,選擇微波雷達進行測距或激光雷達進行測角,雷達對周圍環(huán)境定位后可建立周圍環(huán)境的地圖模型,構建機器人對外界環(huán)境的理解系統(tǒng)。隨著視覺傳感器精度的提高,可利用相機對周圍環(huán)境進行感知,經過模式識別、圖像處理等方法處理來獲得周圍環(huán)境全面的信息。
2)聯(lián)合使用定位方法和協(xié)同方式。從信息融合的角度看,如何組合傳感器和選擇合理的融合結構,以保證融合系統(tǒng)發(fā)揮最大優(yōu)勢來滿足定位精度值得考慮。根據機器人配置傳感器精度和功能的不同,采用主-從式協(xié)同定位算法,建立運動學模型,分析模型特點并設計合適的定位算法,借助信息融合理論或最優(yōu)化技術來實現所有機器人的絕對位置。研究無全局定位裝置的多個體之間的自主協(xié)同定位技術,利用機器人之間無線傳輸的信息量,設計合理的定位算法來確定相對位置??紤]慣性導航裝置與其他測量信息之間的融合,結合分布式優(yōu)化技術來提高機器人之間的定位精度。
3)探索智能化協(xié)同目標定位與巡航控制。機器學習和人工智能等技術的發(fā)展促使無人系統(tǒng)的智能化成為趨勢。設計基于人工智能算法的未知環(huán)境下可引導、可信任、可進化的多機器人協(xié)同目標定位與巡航控制。借助深度學習算法對陌生區(qū)域進行環(huán)境感知與目標識別,進而通過強化學習來訓練自主控制策略,使機器人能夠模仿現實世界中的運動。
基于位置作戰(zhàn)是現代戰(zhàn)爭的突出特點,以機器人代替人類進行戰(zhàn)略突襲是戰(zhàn)爭形式轉變的趨勢之一。多機器人協(xié)同作戰(zhàn)是典型的基于位置的未來新型作戰(zhàn)單元,多機器人的協(xié)同定位精度直接影響著作戰(zhàn)的效果。從機器人系統(tǒng)的可定位性出發(fā),建立了兩種定位模型。針對不同模型,分析了現有多機器人協(xié)同定位系統(tǒng)常用的算法。多機器人之間是通過交換相對距離、角度等信息實現它們的導航、定位相關信息分享,采用最優(yōu)化理論和數據融合算法來確定不同機器人的位置信息。最后對多機器人系統(tǒng)協(xié)同定位時的問題和趨勢進行了闡述。