金旺 易國洪 洪漢玉 陳思媛
摘要:針對現(xiàn)有障礙物檢測方法存在檢測精度和速度不足的問題,提出一種基于門控循環(huán)單元(Cated Recurrent Unit,GRU)的障礙物檢測方法。通過構建單向GRU網(wǎng)絡提取障礙物的幾何特征,結合障礙物的時序特征實現(xiàn)障礙物檢測。在GRU的基礎上,提出三種優(yōu)化模型注意力GRU模型、正則化CRU模型以及雙向GRU模型用于提高障礙物檢測精度或檢測速度。為了驗證所提方法的有效性,在真實采集的數(shù)據(jù)集上進行實驗,結果表明,相較于卷積神經(jīng)網(wǎng)絡,GRU網(wǎng)絡能夠以較高的精度和速度實現(xiàn)障礙物的檢測,其中,正則化CRU模型收斂速度更快,檢測速度更高,綜合性能最好。
關鍵詞:障礙物檢測;GRU;正則化;注意力機制;循環(huán)神經(jīng)網(wǎng)絡
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)33-0001-03
開放科學(資源服務)標識碼(OSID):
1 引言
障礙物檢測是自動駕駛和工業(yè)機器人等領域的關鍵技術,是確保汽車和機器人以及相關操作人員安全的重要手段。目前已有的障礙物檢測方法根據(jù)檢測工具可分為基于相機的檢測方法[1-6]以及基于激光雷達的檢測方法[7-10]。基于相機的檢測方法通常利用幀差法,通過判斷連續(xù)幀數(shù)據(jù)的差異來完成障礙物的檢測。該種方法檢測設備成本更低,檢測更為便捷,然而相機受環(huán)境因素影響較大,不利于室外環(huán)境的障礙物檢測。黃如林等[7]提出了一種基于多特征融合的障礙物檢測方法,利用激光雷達的脈沖回波寬度信息和障礙物輪廓信息描述障礙物特征,實現(xiàn)了大尺寸障礙物的檢測,但是該方法缺乏對尺寸較小障礙物的檢測能力;文獻[8-9]利用障礙物的幾何特征實現(xiàn)障礙物檢測,然而單一的幾何特征導致檢測準確率不高;Asvadi等[10]提出了一種基于體素和平面的三維感知系統(tǒng)用于障礙物檢測,通過結合障礙物的輪廓信息和地理位置信息實現(xiàn)障礙物的檢測,具有較高的檢測精度,然而三維感知系統(tǒng)檢測環(huán)境構建復雜,設備成本高。
時間序列是一組按照時間先后順序排列且內(nèi)部關聯(lián)的數(shù)列。通過對時間序列的分析,獲取障礙物的時序特征??紤]到障礙物數(shù)據(jù)的空間特征和時序特征,將循環(huán)神經(jīng)網(wǎng)絡(Re-current Neural Network.RNN)應用于障礙物檢測。RNN具有短期記憶的特點,當時間序列很長時,RNN難以將早期特征傳遞到后期步驟中,且RNN在反向傳播階段會出現(xiàn)梯度消失的問題。長短期記憶(Long Short-Term Memory,LSTM)模型彌補了RNN的梯度消失和梯度爆炸、長期記憶能力不足等問題,使得循環(huán)神經(jīng)網(wǎng)絡能夠真正有效地利用長距離的時序信息[11]。隨后,Stanford在2014年提出了GRU模型,相較于LSTM模型,GRU模型計算效率更高,參數(shù)規(guī)模更小,訓練速度更快。目前,GRU在語音識別和機器翻譯等領域取得了良好的效果[12-13],因此,將GRU應用于障礙物檢測領域具有充分的可行性。同時考慮到障礙物數(shù)據(jù)樣本集的規(guī)模較小的問題,為了防止出現(xiàn)過擬合的問題,引入正則化使模型稀疏。稀疏模型能夠去除大量冗余變量,使模型具有更好的解釋性。劉建偉等[14]對現(xiàn)有的正則化稀疏模型做了比較全面的總結。注意力機制能夠使模型更多的關注障礙物關鍵特征,進一步加強對障礙物的檢測。
為了在機器人運動過程中實現(xiàn)障礙物的檢測,確保機器人等設備的安全,首次將GRU模型應用于障礙物檢測領域,通過構建一個單向GRU網(wǎng)絡提取樣本中的障礙物特征,進而實現(xiàn)障礙物的檢測。為了改善障礙物的檢測精度和速度,在GRU網(wǎng)絡基礎上,提出三種GRU優(yōu)化模型,分別為注意力GRU模型、正則化GRU模型以及雙向GRU模型。最后,在真實采集的數(shù)據(jù)集中進行測試,實驗結果表明,GRU檢測法能夠很好地實現(xiàn)障礙物的檢測,增加正則化后,模型更為精煉,檢測速度更快,綜合性能最好。
2 障礙物檢測
2.1感興趣區(qū)域過濾
使用激光雷達作為障礙物檢測設備,由于激光雷達檢測范圍偏大的原因,通常會采集到不需要的數(shù)據(jù),稱之為噪聲點,而這會造成檢測結果造成偏差。例如,在自動駕駛領域,車輛行駛過程中,通常對車輛前方的障礙物進行檢測;在工業(yè)機器人領域,通常對機器人下方垂直方法進行障礙物檢測。 通過設置感興趣區(qū)域,確定激光雷達的檢測范圍,使用條件過濾的方法有效地去除噪聲點,消除噪聲對檢測結果造成的影響,同時也能夠減少計算量。
2.2 GRU檢測模型
通過搭建一個單向GRU網(wǎng)絡用以實現(xiàn)障礙物的檢測,GRU網(wǎng)絡結構圖如圖1所示。X表示輸入,h表示隱藏層狀態(tài),v為輸出。
GRU模型檢測算法如表1所示。步驟2構造了GRU單層的網(wǎng)絡結構,步驟3用于GRU單層結構的優(yōu)化,步驟4將優(yōu)化后的單層網(wǎng)絡結構拼接成完整的GRU網(wǎng)絡結構,步驟5計算GRU前向傳播的輸出值,得到輸出值outputs,經(jīng)過softmax,得到算法預測值和損失值。
2.3 GRU優(yōu)化模型
以往的研究結果表明,通過引入注意力機制,增加正則化或構建雙向循環(huán)網(wǎng)絡能夠有效提高GRU網(wǎng)絡在語音識別等任務中的性能?;谶@一原因,提出三種優(yōu)化的GRU模型,分別為注意力GRU模型、正則化GRU模型以及雙向GRU模型。
(1)注意力GRU模型
注意力機制是指通過訓練樣本數(shù)據(jù)中樣本點的重要程度來提取障礙物的關鍵特征。在GRU網(wǎng)絡的隱藏層中,引入注意力機制,計算各個輸入的注意力概率分布值,進一步提取障礙物的關鍵特征。注意力機制計算公式如下:
(2)正則化GRU模型
正則化方法通常指對權重系數(shù)進行懲罰,稱之為權重衰減。權重衰減通常使用L1范式或L2范式作為正則化項。L2權重衰減使最常見的形式,實驗中使用L2式對權重進行約束來對模型進行優(yōu)化。L2正則化計算公式如下:
式(3)中,w為網(wǎng)絡權重參數(shù),九為權衡參數(shù)。當九為0時表示沒有進行正則化,λ越大,對于w的正則化懲罰越大。
(3)雙向GRU模型
雙向GRU模型由兩個普通的GRU組成,包括一個正向的GRU和一個逆向的GRU。正向GRU利用過去的信息,逆向GRU利用未來的信息,這樣,在t時刻,既能使用t-1時刻的信息,又能使用t+1時刻的信息。一般而言,可使用信息越多,網(wǎng)絡預測準確率越高。
3 實驗及分析
3.1 實驗環(huán)境
實驗環(huán)境包括兩部分:數(shù)據(jù)采集和網(wǎng)絡訓練。數(shù)據(jù)采集平臺配置如下:操作系統(tǒng)Windowsl0,Intel Core i7-8750H@2.20GHZ六核處理器,8GB內(nèi)存,SICK TIM561雷達,運行環(huán)境.NET Framework4.5。網(wǎng)絡訓練實驗平臺配置如下:操作系統(tǒng)Ubuntu16.04,Intel Core i7-8750H@2.20GHZ六核處理器,8GB內(nèi)存,Nvidia GTX 1050Ti 4GB GPU,深度學習框架為ten-sorflow。
3.2 實驗數(shù)據(jù)集
在采集了激光雷達數(shù)據(jù)之后,需要將數(shù)據(jù)進行預處理使數(shù)據(jù)在(0,1)區(qū)間內(nèi),數(shù)據(jù)處理方法如式(4)所示,其中x表示預處理后得到的數(shù)據(jù),d和0表示獲取雷達距離值以及雷達射線與垂直平面的偏轉角。
通過閾值來確定樣本數(shù)據(jù)的標簽,設定閾值為0.8,當x大于0.8時,寫入0,表示非障礙物點,當x小于0.8時,寫入1,表示障礙物點。通過這種方式,構建一個訓練樣本數(shù)據(jù)集,數(shù)據(jù)集大小為1355。
3.3 網(wǎng)絡參數(shù)和評價指標
GRU網(wǎng)絡初始參數(shù)設置如下:學習率為le-3,隱藏層數(shù)和隱藏節(jié)點數(shù)分別為1和32,最大迭代次數(shù)為100,批量大小256。
性能評價指標主要有檢測精度,網(wǎng)絡訓練收斂速度,檢測速度。檢測精度是指障礙物檢測的準確率。網(wǎng)絡訓練收斂速度是指網(wǎng)絡收斂迭代輪次。檢測速度是指在1秒內(nèi)檢測數(shù)據(jù)的幀數(shù)。
3.4 障礙物檢測對比實驗及結果分析
障礙物檢測對比實驗在GRU網(wǎng)絡的基礎上,分別引入注意力機制(Attention)、正則化以及將單向GRU改為雙向GRU,進行對比實驗,網(wǎng)絡初始參數(shù)不變。同時,受文獻[15]啟發(fā),構建一個卷積神經(jīng)網(wǎng)絡( Convolutional Neural Networks,CNN)用于障礙物的檢測,與GRU方法進行對比實驗。表2顯示了所有對比實驗的結果。
從表2中可以看出:相較于CNN檢測方法,GRU檢測方法具有更高的檢測精度和檢測速度;相較于原始GRU模型,引入注意力機制后,檢測精度得到略微提升,但是檢測速度大幅下降;引入正則化后,檢測精度略微下降,但是檢測速度得到一定的提升;雙向GRU模型檢測精度沒有提升,然而檢測速度大幅下降。綜合考慮,確定正則化GRU方法為最佳的檢測方法,在檢測精度略微損失的情況下,檢測速度得到提升。正則化GRU檢測方法以較高的精度和速度實現(xiàn)障礙物的檢測,能夠滿足實際工業(yè)生產(chǎn)的需求。
圖2顯示了原始GRU模型和正則化GRU模型的訓練損失率。從圖2可以看出,相較于原始GRU模型,正則化GRU模型在訓練過程中收斂速度更快。
通過實驗分析可知,使用門控循環(huán)單元網(wǎng)絡能夠以較高的精度和速度實現(xiàn)的檢測障礙物,增加正則化后,縮減了模型的模型參數(shù)規(guī)模,提升了障礙物檢測速度,達到了障礙物檢測的實際需求。
4 結論與未來工作
本文提出了一種基于門控循環(huán)單元的障礙物檢測方法。通過門控循環(huán)單元構建特征向量矩陣以提取障礙物的特征,通過優(yōu)化對比實驗,確定正則化GRU為最優(yōu)的障礙物檢測方法,能夠以較高的檢測精度和速度實現(xiàn)障礙物的檢測。實驗結果證明,相較于卷積神經(jīng)網(wǎng)絡,基于門控循環(huán)單元的方法在障礙物檢測上具有更高的檢測精度以及檢測速度,引入正則化后,檢測速度更快。
目前,由于設備限制未能在自動駕駛車輛上進行實驗。缺乏如雨天、夜晚等不同環(huán)境下的障礙物樣本數(shù)據(jù),也對實驗結果造成一定的影響。因此,在未來的工作中,需要擴大樣本數(shù)據(jù)集的類別尤其是不同環(huán)境下的樣本數(shù)據(jù)。在自動駕駛車輛上的試驗也是未來重點研究的方向。
參考文獻:
[1]王錚,趙曉,佘宏杰,等.基于雙目視覺的AGV障礙物檢測與避障[J].計算機集成制造系統(tǒng),2018,24(2):400-409.
[2]楊磊,蔡紀源,任衍允,等.一種基于深度信息的障礙物檢測方法[J].計算機技術與發(fā)展,2015,25(8):43-47.
[3] Nissimov S.Goldberger J,Alchanatis V.Obstacle detection ina greenhouse enwronment using the Kinect sensor[J].Comput- ers and Electronics in Agriculture,2015,113:104-115.
[4]張晴晴,林強強.盲道區(qū)域中障礙物的視覺檢測方法[J].價值工程,2019,38(9):148-151.
[5]丁斗建,趙曉林,王長根,等.基于視覺的機器人自主定位與障礙物檢測方法[J].計算機應用,2019,39(6):1849-1854.
[6] Levi D,Carnett N.Fetaya E.StixeINet:a deep convolutional net-work for obstacle detection and road segmentation[C]//Proced-ings of the British Machine Vision Conference 2015.Swansea.British Machine Vision Association,2015:109.1-109.12.
[7]黃如林,梁華為,陳佳佳,等.基于激光雷達的無人駕駛汽車動態(tài)障礙物檢測、跟蹤與識別方法[J].機器人,2016,38(4):437-443.
[8]譚寶成,楊成.激光雷達動態(tài)障礙物檢測[J].西安工業(yè)大學學報,2015,35(3):205-209.
[9]張穗華,駱云志,王鈐,等.基于三維激光雷達的障礙物檢測方法研究[Jl.機電產(chǎn)品開發(fā)與創(chuàng)新,2016,29(6):14-17.
[10] Asvadi A,Premebida C,Peixoto P,et al.3D Lidar-based stat-ic and moving obstacle detection in driving environments:anapproach based on voxels and multi-region ground planes[J].Robotics and Autonomous Systems,2016,83:299-311.
[11]王鑫,吳際,劉超,等,基于LSTM循環(huán)神經(jīng)網(wǎng)絡的故障時間序列預測[J].北京航空航天大學學報,2018,44(4):772-784.
[12]蔣暢江,溫登峰,唐賢倫,等.基于改進型輕門控循環(huán)單元的語音識別[J].計算機工程與設計,2019,40(11):3265-3268,3356.
[13]段生月,王長坤,張柳艷.基于正則化GRU模型的洪水預測[J].計算機系統(tǒng)應用,2019,28(5):196-201.
[14]劉建偉,崔立鵬,劉澤宇,等.正則化稀疏模型[J].計算機學報,2015,38(7):1307-1325.
[15]張舜,郝泳濤.基于深度學習的障礙物檢測研究[J].電腦知識與技術,2019,15(34):185-187,193.
【通聯(lián)編輯:唐一東】
作者簡介:金旺(1995-).湖北天門人,碩士,主要研究方向為計算機視覺,三維物體識別;易國洪(1972-),男,副教授,碩士生導師,碩士,主要研究方向為軟件測試,大數(shù)據(jù);洪漢玉(1964-),男,教授,博士生導師,主要研究方向為圖像處理;陳思媛(1996—),女,碩士,主要研究方向為高并發(fā)通信,