李曉東
甘肅建投重工科技有限公司 甘肅蘭州 730000
在現(xiàn)今社會(huì)人力成本不斷上升情況下,“機(jī)器換人”步伐的加快,公共服務(wù)類機(jī)器人作為一個(gè)新興產(chǎn)物可以節(jié)省人力,有效地降低經(jīng)營(yíng)成本。本文簡(jiǎn)單介紹了小型電動(dòng)全自動(dòng)導(dǎo)航掃路機(jī)器人的技術(shù)特點(diǎn),并且從技術(shù)角度說(shuō)明了服務(wù)類機(jī)器人的基本組成、基本功能、技術(shù)難點(diǎn)以及目前存在的問(wèn)題。
本文依據(jù)行動(dòng)導(dǎo)航方式將機(jī)器人分為有軌道與無(wú)軌道兩大類。
巡線行走,按鋪設(shè)導(dǎo)航磁條行走,定點(diǎn)布置RFID地標(biāo)點(diǎn),形成由點(diǎn)到線由線到面的數(shù)據(jù)地圖,在特殊位置,通過(guò)內(nèi)置RFID芯片觸發(fā)特殊指令識(shí)別地面RFID射頻編碼標(biāo)簽(能放置在指定位置或指定物品上,可以與閱讀器之間不直接接觸而進(jìn)行無(wú)線數(shù)據(jù)傳輸?shù)臄?shù)據(jù)通信標(biāo)簽)到指定標(biāo)簽位置停下,并按照對(duì)應(yīng)標(biāo)簽數(shù)據(jù)介紹相應(yīng)標(biāo)簽物品的情況或執(zhí)行標(biāo)簽數(shù)據(jù)中指定的動(dòng)作內(nèi)容(左轉(zhuǎn)、右轉(zhuǎn)、轉(zhuǎn)身、到達(dá)、返回等),此項(xiàng)技術(shù)算法容易,整體較為簡(jiǎn)單,成本較低,一般應(yīng)用于一定范圍內(nèi)的室內(nèi)場(chǎng)地。
與有軌道機(jī)器人不同的是,無(wú)軌道機(jī)器人沒(méi)有固定路徑,可以自主尋路以及避障,其一般具有自主學(xué)習(xí)能力,能在未知的環(huán)境里通過(guò)學(xué)習(xí),并能無(wú)碰撞地從給定起點(diǎn)到達(dá)指定目標(biāo),在前方有障礙物時(shí),根據(jù)不同的程序設(shè)定,可以選擇另行路徑或者繞行。目前較為成熟的與主流的導(dǎo)航定位系統(tǒng)有以下3種。
2.2.1 慣性導(dǎo)航定位技術(shù)
慣性導(dǎo)航定位系統(tǒng)(INS),物體做勻速度或者變速度直線運(yùn)動(dòng),其任意時(shí)刻的瞬時(shí)位置是決定于物體的初始位置、實(shí)時(shí)速度、運(yùn)動(dòng)的時(shí)間和運(yùn)動(dòng)的角度,實(shí)時(shí)速度又是取決于起始速度、實(shí)時(shí)加速度和加速時(shí)間決定,即:實(shí)時(shí)位置是對(duì)速度的積分,而速度又是對(duì)加速度的累計(jì)積分。如下列公式[1]:
式 中,ax、 ay、 az分 別 為x、y、z方 向的 加 速 度 ,vx0、 vy0、vz0分別為x、y、z方向的初始速度。
慣性導(dǎo)航系統(tǒng)就是利用此物理規(guī)律實(shí)現(xiàn)對(duì)物體的導(dǎo)航定位,它利用陀螺儀平臺(tái)建立自身的3D空間直角坐標(biāo)系,每個(gè)軸系分別有自身的加速度計(jì)可測(cè)量出各自方向的加速度,并對(duì)其進(jìn)行積分;疊加各自方向的初始位置,便可以測(cè)算出目標(biāo)載體在坐標(biāo)系中的基本位置和實(shí)時(shí)速度。此系統(tǒng)本身不依賴外部信息,也不向其他導(dǎo)航系統(tǒng)對(duì)外部輻射能量[2]。因此,系統(tǒng)的獨(dú)立性和隱蔽性較強(qiáng),也經(jīng)常應(yīng)用于隱形戰(zhàn)機(jī)和導(dǎo)彈導(dǎo)航中。
通過(guò)網(wǎng)格規(guī)劃,基于角動(dòng)量守恒理論設(shè)計(jì)計(jì)算,依據(jù)定軸性和進(jìn)動(dòng)性,即:慣性保持穩(wěn)定,同時(shí)反抗任何改變軸子的力量,又與外力矩方向相互垂直[3],導(dǎo)航更精準(zhǔn),能夠靈敏感應(yīng)方向、速度及坡度變化,靈活調(diào)整方向和路線。
然而,其缺點(diǎn)也非常明顯,無(wú)論慣性傳感器精確度有多高,由于陀螺儀與加速度計(jì)的誤差會(huì)隨著時(shí)間逐漸累積,而導(dǎo)航信息經(jīng)過(guò)時(shí)間積分而產(chǎn)生,定位誤差就會(huì)隨著時(shí)間增加而增大,長(zhǎng)期計(jì)算精度差;因此,一般情況下不單獨(dú)使用。
2.2.2 SLAM導(dǎo)航定位技術(shù)
SLAM(Simultaneous Localization and Mapping即時(shí)定位與地圖構(gòu)建)技術(shù)是目前較為主流的人工智能機(jī)器人與其他無(wú)軌道行走機(jī)械定位導(dǎo)航技術(shù)。簡(jiǎn)單來(lái)說(shuō),SLAM技術(shù)是指機(jī)器人在未知環(huán)境中,完成自身定位、構(gòu)建圖紙、路徑規(guī)劃的整套流程,從而實(shí)現(xiàn)機(jī)器人的自主導(dǎo)航。按照主流使用的不同種類傳感器分類可分為以下兩種SLAM解決方案,一是使用3D激光傳感器,通過(guò)傳感器內(nèi)置計(jì)算芯片以TOF為算法基礎(chǔ)測(cè)量相關(guān)數(shù)據(jù)信息,再者是使用單目或多目深度視覺(jué)傳感器,通過(guò)軟件與圖像處理算法為基礎(chǔ)測(cè)量相關(guān)數(shù)據(jù)信息,以下將分別介紹兩種不同傳感器的導(dǎo)航技術(shù)。
2.2.2.1 基于3D激光傳感器的SLAM定位系統(tǒng)
通過(guò)內(nèi)置3D激光雷達(dá)攝像頭向360°發(fā)送激光光束來(lái)獲取數(shù)據(jù),通過(guò)激光反射回來(lái)的時(shí)間(time of fly)來(lái)判斷障礙物距離機(jī)器人的距離信息,在根據(jù)配置的高精度編碼器與陀螺儀計(jì)算出自身移動(dòng)軌跡與移動(dòng)距離,可以在較為復(fù)雜的環(huán)境下繪制出已經(jīng)過(guò)路徑的實(shí)時(shí)地圖信息,實(shí)現(xiàn)實(shí)時(shí)定位,對(duì)于機(jī)器人來(lái)說(shuō)則是“測(cè)量四周環(huán)境與環(huán)境建模校對(duì)”(如圖1)。
圖1 基于3D激光傳感器的SLAM定位系統(tǒng)
2.2.2.2 基于單雙目傳感器的SLAM定位算法DPVT(直接參數(shù)化的視覺(jué)追蹤)
給定來(lái)自攝像機(jī)的一系列圖像,觀察由某些圖像表示的數(shù)據(jù)模型,通過(guò)圖像分析,視覺(jué)跟蹤與確定模型隨時(shí)間變化的參數(shù),根據(jù)視覺(jué)自我運(yùn)動(dòng)跟蹤整個(gè)場(chǎng)景,并從場(chǎng)景結(jié)構(gòu)的感知運(yùn)動(dòng)中推斷出視覺(jué)深度攝像機(jī)的運(yùn)動(dòng)。通過(guò)最小化密集像素成本函數(shù)的直接視覺(jué)跟蹤方法[7]。(“直接”是指根據(jù)模型參數(shù)與視頻幀之間的像素強(qiáng)度相關(guān)的函數(shù)來(lái)計(jì)算模型參數(shù)。直接方法的關(guān)鍵部分是一個(gè)生成模型,該模型可以根據(jù)給定的模型參數(shù)真實(shí)值來(lái)預(yù)測(cè)實(shí)時(shí)框架的外觀。)視覺(jué)跟蹤問(wèn)題的真實(shí)模型參數(shù)的有效方法是考慮與預(yù)測(cè)參數(shù)和真實(shí)視圖相關(guān)的光度成本函數(shù)的梯度,以適應(yīng)變化的參數(shù)。在迭代框架內(nèi),視頻圖像中每個(gè)像素與預(yù)測(cè)之間的殘差值直接對(duì)模型參數(shù)的精確估計(jì)形成線性約束。模型參數(shù)通常會(huì)隨著時(shí)間而平滑變化。
利用每個(gè)像素,可以最大化從圖像數(shù)據(jù)中提取的信息,并可以實(shí)現(xiàn)非常高精度的視覺(jué)跟蹤。當(dāng)然,某些像素不如其他像素提供更多信息。例如,在無(wú)紋理區(qū)域中梯度大小較小的像素,以及在一個(gè)或多個(gè)方向上具有區(qū)分梯度的像素(例如邊緣和拐角),都無(wú)法將參數(shù)約束在成本空間內(nèi)。
通常,由于模型的參數(shù)相對(duì)于像素觀測(cè)值而言過(guò)于參數(shù)化,因此直接參數(shù)化方法會(huì)隨著圖像質(zhì)量的下降而適度下降,并且可以在低圖像分辨率下運(yùn)行。以低分辨率估算參數(shù)通??梢蕴峁┚哂懈纳频氖諗刻匦缘臏?zhǔn)確結(jié)果。估計(jì)值可以進(jìn)一步用于在從粗到精策略中以更高的分辨率初始化估計(jì)值,從而有助于提高收斂性和計(jì)算效率。
單雙目里程計(jì)系統(tǒng)與立體系統(tǒng)一樣會(huì)遭受絕對(duì)姿態(tài)不確定性的增加,且因?yàn)榇嬖谄瞥叨鹊膯?wèn)題,不能僅憑單眼視覺(jué)確定物體的絕對(duì)大小。許多移動(dòng)設(shè)備上都使用非完整的約束來(lái)打破不確定的比例漂移[8]。普通的單雙目視覺(jué)測(cè)距系統(tǒng)在性能上仍然落后于立體激光3D系統(tǒng),特別是由于難以可靠地跟蹤足夠的高質(zhì)量特征來(lái)限制運(yùn)動(dòng),但是從具有高紋理級(jí)別的視頻流中可以獲得很好的效果。
基于單雙目傳感器的SLAM定位算法利用每一幀特征數(shù)據(jù)在約束參考系中生成系統(tǒng)軌跡。僅基于相對(duì)局部感測(cè)(如視覺(jué))的任何形式的運(yùn)動(dòng)估計(jì)一樣,也會(huì)隨著時(shí)間的流逝而偏離參考系,但是有助于得到可視化里程算法偏離絕對(duì)速率比[9]。在圖2中,藍(lán)色為單雙目SLAM視覺(jué)里程定位導(dǎo)航,綠色為真實(shí)規(guī)劃路徑。在每個(gè)一分鐘時(shí)長(zhǎng)內(nèi),顯示了軌跡的延伸,可以看到在每種情況下都與起始第一幀的地面真實(shí)路況對(duì)齊,但是隨著時(shí)間的推移,計(jì)算路徑會(huì)偏移真實(shí)路徑。
圖2 基于單雙目傳感器的SLAM
2.2.3 GPS導(dǎo)航定位技術(shù)
GPS導(dǎo)航定位技術(shù)與以上兩種技術(shù)的使用范圍相互之間各有重疊,但又有其各自的特點(diǎn),GPS技術(shù)全稱為全球定位系統(tǒng),目前廣泛應(yīng)用于軍事,科技,汽車定位與日常手機(jī)定位等領(lǐng)域,其基本構(gòu)成有三個(gè)部分:空間設(shè)備部分、地面控制部分和用戶設(shè)備部分。GPS目前只能在室外使用,在建筑物內(nèi)部、地下設(shè)施、海底等無(wú)信號(hào)或信號(hào)不穩(wěn)的環(huán)境中無(wú)法使用。目前提供民用的GPS建圖在導(dǎo)航精度最多只能達(dá)到米級(jí),且對(duì)于環(huán)境中突然出現(xiàn)的固定障礙物與移動(dòng)障礙物無(wú)法識(shí)別,不能達(dá)到實(shí)時(shí)更新的技術(shù)需求,而SLAM技術(shù)卻獨(dú)立于GPS技術(shù),可以在未知環(huán)境中自建地圖、自定位、姿態(tài)估計(jì)和自動(dòng)路徑規(guī)劃,在自身多維激光傳感器或者視覺(jué)傳感器的輔助下,可以識(shí)別未知環(huán)境中出現(xiàn)的固定障礙物與移動(dòng)障礙物,實(shí)時(shí)更新自建地圖,GPS定位技術(shù)目前主要是基于衛(wèi)星與地面接收站將信息反饋到客戶端。
2.2.4 SLAM導(dǎo)航定位、GPS導(dǎo)航定位與INS導(dǎo)航定位精度對(duì)比
由于INS導(dǎo)航定位系統(tǒng)單獨(dú)使用數(shù)據(jù)漂移量較大,精度較差,因此將GPS系統(tǒng)與INS系統(tǒng)結(jié)合使用與單雙目SLAM視覺(jué)里程系統(tǒng)進(jìn)行精度對(duì)比,SLAM系統(tǒng)以幀頻30 Hz的測(cè)量頻率估算幀間運(yùn)動(dòng)。圖3顯示了系統(tǒng)在大約5 min的道路上與地面GPS系統(tǒng)和INS自定位導(dǎo)航系統(tǒng)相比較測(cè)得的線速度和角速度。視覺(jué)里程表以30 Hz繪制,而GPS系統(tǒng)與INS自定位導(dǎo)航系統(tǒng)以1 Hz繪制。以通過(guò)對(duì)齊的幀之間的像素誤差平方和來(lái)衡量可靠性。可以得出,SLAM視覺(jué)里程計(jì)的測(cè)量精度緊隨GPS導(dǎo)航與INS自定位導(dǎo)航的融合系統(tǒng),并且SLAM視覺(jué)里程系統(tǒng)在本地測(cè)量上比GPS與INS測(cè)量更平滑,并且頻率采樣更高。
圖3 自定位導(dǎo)航方式的比較
2.2.5 INS、SLAM與GPS導(dǎo)航定位進(jìn)行系統(tǒng)融合的本地化定位
由于SLAM視覺(jué)定位,GPS定位與INS定位的優(yōu)缺點(diǎn)可以互補(bǔ),因此最優(yōu)策略是將三種導(dǎo)航定位系統(tǒng)相互融合,SLAM視覺(jué)測(cè)距算法提供了可靠、準(zhǔn)確和平滑的局部運(yùn)動(dòng)估計(jì),而GPS提供了固定在全局地圖上的粗略測(cè)量,INS導(dǎo)航系統(tǒng)確保了每個(gè)起始數(shù)據(jù)采樣點(diǎn)短期的靈敏性與獨(dú)立性。將多個(gè)測(cè)量數(shù)據(jù)融合在概率濾波器中,使用實(shí)時(shí)滑動(dòng)窗口優(yōu)化算法與圖形優(yōu)化的通用框架,以絕對(duì)GPS測(cè)量值、INS系統(tǒng)的起點(diǎn)數(shù)據(jù)積分值和SLAM相對(duì)視覺(jué)測(cè)距法測(cè)量值融合為相對(duì)于非漂移參考系的姿態(tài)實(shí)時(shí)組合估值[7][10]。在這種融合模式中,由于非連續(xù)姿態(tài)從未相互關(guān)聯(lián),因此新測(cè)量值對(duì)現(xiàn)有姿態(tài)的影響將隨著姿態(tài)保持時(shí)間而迅速減小。而絕對(duì)GPS測(cè)量會(huì)限制軌跡的整體姿態(tài),也即是大約10 s以上的姿態(tài)幾乎不會(huì)受到新測(cè)量數(shù)據(jù)的影響,所以可以認(rèn)為是固定的數(shù)據(jù)。通過(guò)在每次未固定頂點(diǎn)數(shù)據(jù)的總數(shù)達(dá)到閾值以上時(shí)固定圖中最后的數(shù)據(jù)頂點(diǎn),采用這種數(shù)據(jù)結(jié)構(gòu)和相對(duì)較小的數(shù)據(jù)規(guī)模,能夠非??焖俚睾喜⑿碌臏y(cè)量數(shù)據(jù),并且將結(jié)果完全約束在實(shí)時(shí)范圍內(nèi)。
圖4顯示了傳感器數(shù)據(jù)與算法融合后的最終軌跡,SLAM視覺(jué)導(dǎo)航系統(tǒng)軌跡(藍(lán)色)與單獨(dú)的GPS定位導(dǎo)航相比,SLAM視覺(jué)測(cè)距法和GPS的結(jié)合更準(zhǔn)確地反映了地面真實(shí)軌跡。從中可以看到,生成的系統(tǒng)與地面實(shí)況系統(tǒng)相差很小,并且在圖像的比例上很難區(qū)分它們。與單純SLAM系統(tǒng)相比,GPS、INS和SLAM的結(jié)合更加順暢,同時(shí)可以準(zhǔn)確捕獲移動(dòng)車輛通過(guò)回旋處的路徑。
圖4 傳感器數(shù)據(jù)與算法融合后的最終軌跡
第一個(gè)缺點(diǎn),該技術(shù)可使用的傳感器一般有:多維激光,單或多目深度視覺(jué)攝像傳感器,雷達(dá)、聲吶、超聲波傳感器等,激光類與視覺(jué)類受光照條件影響大,在強(qiáng)光源或鏡面反射物體較多的環(huán)境下精度會(huì)呈指數(shù)曲線下降,而聲吶與超聲波類傳感器能耗較高,且回傳速度較慢、漫反射環(huán)境下數(shù)據(jù)不穩(wěn)定,加濾波后數(shù)據(jù)不真實(shí)等問(wèn)題。
第二個(gè)缺點(diǎn),SLAM算法都是以環(huán)境或者圖像特征點(diǎn)為基礎(chǔ),目前高精度高像素的圖像或高采樣率激光掃描特征點(diǎn)提取和匹配計(jì)算量大,通常是多維矩陣的乘積或者迭代卷積[5][6],如公式1,所以對(duì)GPU要求很高,一般難以到達(dá)實(shí)時(shí)性處理要求,從而影響定位的效率與精度。
式中,yi為特征點(diǎn)i的三維空間坐標(biāo);P表示系統(tǒng)誤差協(xié)方差矩陣;X表示狀態(tài)向量。
無(wú)論是基于3D激光傳感器的SLAM定位計(jì)算,還是以單目或多目深度視覺(jué)傳感器通過(guò)軟件與圖像處理算法為基礎(chǔ)SLAM定位,如果是對(duì)于已知的工作環(huán)境,也可以預(yù)先在系統(tǒng)中加載圖紙信息,例如建筑物或者房屋的AUTOCAD圖紙;機(jī)器人通過(guò)自身訓(xùn)練系統(tǒng)與學(xué)習(xí)系統(tǒng)會(huì)匹配并且修正兩個(gè)數(shù)據(jù)來(lái)源,每次訓(xùn)練以構(gòu)建的路線,機(jī)器人將會(huì)檢測(cè)它所“看到”的和存儲(chǔ)于它“記憶”的圖紙(即預(yù)先加載的AutoCAD圖紙),從而得到最真實(shí)與最準(zhǔn)確的地圖信息。采用SLAM技術(shù)的導(dǎo)航機(jī)器人一般精度可達(dá)厘米級(jí)別。
機(jī)器人在人機(jī)交互中對(duì)于復(fù)雜結(jié)構(gòu)的語(yǔ)法語(yǔ)言在斷句劃分和提取關(guān)鍵字過(guò)程中容易產(chǎn)生歧義,且目前的機(jī)器人只能通過(guò)語(yǔ)氣詞簡(jiǎn)單判斷語(yǔ)氣,很難通過(guò)語(yǔ)調(diào)和微表情判斷對(duì)話者的當(dāng)前情感,在輸出過(guò)程中也是通過(guò)相應(yīng)語(yǔ)法拼接數(shù)據(jù)詞典中匹配單詞,基本沒(méi)有語(yǔ)調(diào)變化。
無(wú)軌機(jī)器人避障感知系統(tǒng),由于傳感器與程序優(yōu)化問(wèn)題或多或少存在掃描遺漏、激光散射或者光源吸收與圖像數(shù)據(jù)分辨率過(guò)大過(guò)小內(nèi)建圖紙存在部分錯(cuò)誤與盲區(qū)等問(wèn)題。
無(wú)論有軌或者無(wú)軌機(jī)器人在空間過(guò)小,移動(dòng)物體過(guò)多的復(fù)雜環(huán)境下效率大為降低。且只能執(zhí)行數(shù)據(jù)庫(kù)內(nèi)已有或固定流程程序,離標(biāo)準(zhǔn)意義的人工智能差距較大。
通過(guò)以上內(nèi)容針對(duì)目前主流自主定位與導(dǎo)航機(jī)器人的結(jié)構(gòu)組成、SLAM算法與技術(shù)難點(diǎn)進(jìn)行了簡(jiǎn)要分析介紹,相對(duì)來(lái)說(shuō),人類不僅可以通過(guò)視覺(jué)推斷出具有特定形狀物體的大概距離與剛性,而且同樣能夠推斷沒(méi)有特定形狀氣體,液體與其他透明物體的狀態(tài)與體積,而對(duì)于機(jī)器人的識(shí)別功能來(lái)說(shuō)這仍然是一大問(wèn)題,本文僅針對(duì)剛性物體的自主定位與導(dǎo)航技術(shù)算法為更多相關(guān)廠家做出了簡(jiǎn)單的技術(shù)算法參考指導(dǎo)。