沈陽理工大學自動化與電氣工程學院 中國科學院沈陽自動化研究所機器人學國家重點實驗室 楊小菊中國科學院沈陽自動化研究所機器人學國家重點實驗室 張 偉沈陽理工大學自動化與電氣工程學院 高宏偉 米海山
基于模糊神經(jīng)網(wǎng)絡的移動機器人避障研究
沈陽理工大學自動化與電氣工程學院 中國科學院沈陽自動化研究所機器人學國家重點實驗室 楊小菊
中國科學院沈陽自動化研究所機器人學國家重點實驗室 張 偉
沈陽理工大學自動化與電氣工程學院 高宏偉 米海山
移動機器人在復雜環(huán)境自主運行就必須具有較高的智能性。模糊神經(jīng)網(wǎng)絡技術(shù)結(jié)合了模糊邏輯與神經(jīng)網(wǎng)絡的優(yōu)點,充分發(fā)揮模糊控制的推理及神經(jīng)網(wǎng)絡的學習機制以增強機器人系統(tǒng)的智能性。本文采用超聲波紅外以及電子羅盤傳感器采集未知環(huán)境的信息,通過模糊神經(jīng)網(wǎng)絡信息融合實現(xiàn)機器人的自主避障。經(jīng)過仿真實驗驗證了該方法的有效性。
模糊神經(jīng)網(wǎng)絡;信息融合;移動機器人;避障
移動機器人是通過傳感器感知環(huán)境和自身位姿,在復雜環(huán)境自主決策,完成預期任務的機器人系統(tǒng)[1]。
避障不僅是移動機器執(zhí)行其他任務的前提與保障也是其智能化的重要標志。傳感器是增強移動機器人智能性的途徑,傳感器信息融合技術(shù)就發(fā)揮人大腦的作用,協(xié)調(diào)各個傳感器信息,充分利用多傳感器資源,以一定的優(yōu)化準則進行分析、評估與決策[2]。隨著國內(nèi)外學者對避障技術(shù)的重視,不斷提出多種避障融合算法,例如模糊控制、人工勢場發(fā)、神經(jīng)網(wǎng)絡等。每一種算法都有其獨有的特點,然而也具有局限性和適用性。
模糊控制模擬人的思維,對環(huán)境信息進行綜合分析,通過模糊理論總結(jié)出模糊控制規(guī)則。但模糊控制沒有自學習與自適應能力,并且要求設計者充分了解被控系統(tǒng)的物理特性,預定義有效的被控規(guī)則[3]。隨著系統(tǒng)不斷趨于復雜,模糊控制規(guī)則不但具有主觀性而且難于全面設計。人工神經(jīng)網(wǎng)絡具有學習機制,從傳感器采集的輸入輸出數(shù)據(jù)進行學習、訓練,以增強系統(tǒng)的容錯性[4]。然而神經(jīng)網(wǎng)絡不適于表示規(guī)則也難于確定網(wǎng)絡的初始值,增加訓練時間。因此將模糊控制與神經(jīng)網(wǎng)絡相結(jié)合,將模糊系統(tǒng)構(gòu)造神經(jīng)網(wǎng)絡結(jié)構(gòu),通過神經(jīng)網(wǎng)絡的訓練以提高系統(tǒng)的自適應性。
為使移動機器人安全、自主避開障礙物,首先,傳感器的布局必須合理,本系統(tǒng)的傳感器布局如圖1所示,采用超聲波及紅外傳感器獲取機器人左、前、右的障礙物距離信息,電子羅盤采集目標位置的方位信息。
將圖2 中的1號與2號超聲波的最小距離作為機器人左方障礙物信息,3號與4號超聲波最小距離為前方障礙物信息,5號與6號超聲波最小距離作為組右方距離信息。在超聲波的測量盲區(qū)以紅外傳感器為補充。
移動機器人的周圍環(huán)境分布雜亂,按照機器人的運行環(huán)境可以整理8中情形,如圖2所示。其中紅色小球表示障礙物,機器人周圍的虛線表示傳感器測距范圍。
圖1 傳感器的布局系統(tǒng)圖
圖2 障礙物的環(huán)境分類
移動機器人避障的決策與環(huán)境中障礙物的分布密切相關(guān)。將機器人本體正前方劃分為左、前與右三個目標方向,幫助機器人理解環(huán)境以作出避障決策。圖3為目標方向分區(qū)圖。
圖3 目標方向
為使移動機器人自主達目標位置。首先對超聲波與紅外傳感器獲取的環(huán)境信息分組預處理,然后和電子羅盤獲取的目標角度信息送入模糊神經(jīng)網(wǎng)絡控制器,融合出機器人周圍的環(huán)境信息。然后控制器發(fā)出控制決策指導機器人實時動作。完成避障任務。移動機器人避障控制結(jié)構(gòu)如圖4所示:
圖4 移動機器人避障的模糊神經(jīng)網(wǎng)絡控制結(jié)構(gòu)
Takagi-Sugeno 模型的模糊神經(jīng)網(wǎng)絡具有局部逼近的功能,不僅具有模糊推理的能力而且也有神經(jīng)網(wǎng)絡自學習的特性[5]。根據(jù) T-S 模糊標準模型,可以構(gòu)造如圖5的多輸入多輸出模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)圖。
模糊神經(jīng)網(wǎng)絡的各層的節(jié)點函數(shù)如下:
由于本文的初始隸屬度采用標準型函數(shù)而與實際環(huán)境有所差別,因此要對采集的不同環(huán)境信息進行學習。為保證機器人的實時性,選擇離散訓練方式對初始網(wǎng)絡進行修正。并將改善后的結(jié)果存儲與表格中,移動機器人在實際環(huán)境已查表的形式進行決策。離散訓練如圖6所示。
結(jié)合機器人的運行環(huán)境與避障特性,將輸入障礙物距離以及目標方向的模糊分割數(shù)定為3 ,即{"N","M","F"}={"近", "中","遠"},對應的論域[0~2m]。{"L"、"F"、"R"}= {"左","前","右"},對應的論域為[0,180°]。
依據(jù)機器人所處的環(huán)境的情形,構(gòu)造機器人的訓練樣本與測試樣本。利用模糊工具箱將訓練集生產(chǎn)初始網(wǎng)絡系統(tǒng),采用誤差反向傳播以及最小二乘法進行離散訓練。依據(jù)設定的控制參數(shù)作為終止離散訓練條件。整個系統(tǒng)的框圖如圖7所示。
圖5 模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)圖
圖6 模糊神經(jīng)網(wǎng)絡訓練
圖7 模糊神經(jīng)網(wǎng)絡系統(tǒng)結(jié)構(gòu)
通過不斷調(diào)整網(wǎng)絡參數(shù),將學習步長設定為0.01,通過58步訓練,誤差穩(wěn)定在設定值的范圍內(nèi)。圖8為訓練的均方差變化曲線。
圖8 訓練的均方誤差變化曲線
為了驗證訓練后的模糊神經(jīng)網(wǎng)絡與移動機器人避障模型是否一致,構(gòu)造30組測試樣本對網(wǎng)絡進行檢測,檢驗效果如圖9所示。
圖9 訓練檢測結(jié)果
圖10 模糊神經(jīng)網(wǎng)絡的避障仿真
圖9 中橫坐標表示為30組測試樣本序列,縱坐標表示為機器人的左右速度。檢測數(shù)據(jù)以藍色"+"表示,網(wǎng)絡輸出以紅色"*"表示。已從檢驗效果可以看出,訓練后的模糊神經(jīng)網(wǎng)絡很好地捕著到機器人避障模型,表明模糊神經(jīng)網(wǎng)絡融合融合了傳感器采集的數(shù)據(jù),實現(xiàn)機器人的避障功能。
在Matlab環(huán)境中設定初始位置為(0,0),并以菱形表示。目標位置(10,10),以三角形表示。環(huán)境中的障礙物以紅色小圓圈及正方形表示。移動機器人的避障軌跡藍色小點表示,避障的仿真如圖10所示。
從移動機器人的避障結(jié)果可以看出模糊神經(jīng)網(wǎng)絡能有效地融合超聲波、紅外傳感器以及電子羅盤的數(shù)據(jù),使機器人在外界環(huán)境自主避障,驗證了模糊控制與神經(jīng)網(wǎng)絡結(jié)合的有效性。
由于外界環(huán)境的未知性以及機器人避障模型的非線性因素,要提高機器人的避障精度,傳感器的配置以及融合算法的改進經(jīng)將是進一步深入研究的重點。
[1]倪小雷,卜佳俊。自主移動機器人混合式體系結(jié)構(gòu)的設計與實現(xiàn)[J]。計算機測量與控制,2006,14(11):1526-1528.
[2]潘泉,于昕,程詠梅,張洪才。信息融合理論的基本方法與進展[J]。自動化學報,2004,29(4):599-615
[3]李國勇。智能控制及其MATLAB實現(xiàn)[M]。北京:電子工業(yè)出版社,2005.261-280.
[4]楊娟,孫華,吳林。模糊神經(jīng)網(wǎng)絡信息融合方法在機器人避障中的應用[J]??刂评碚撆c應用,20052,4(2):22-24.
[5]孫增坼,徐紅兵?;赥-S模型的模糊神經(jīng)網(wǎng)絡[J]。清華大學學報(自然科學版),1997,37(3):18-26.
楊小菊(1989-),女,陜西漢中人,碩士研究生學歷,主要研究方向為移動機器人的多傳感器信息融合方法。
張偉
工業(yè)機器人機構(gòu)設計與性能分析研究,項目編號:2013020054.