張宏宏 甘旭升 毛億 楊春林 謝曉偉
摘 要:隨著低空空域改革的推進(jìn), 無人機(jī)離開隔離空域, 進(jìn)入低空融合空域執(zhí)行多樣化任務(wù)已成為發(fā)展趨勢(shì), 而低空動(dòng)態(tài)復(fù)雜融合空域給無人機(jī)造成嚴(yán)重威脅, 避障技術(shù)已成為無人機(jī)任務(wù)決策系統(tǒng)的關(guān)鍵環(huán)節(jié), 對(duì)保障無人機(jī)安全運(yùn)行、 提高作業(yè)效率起到重要作用。 本文首先對(duì)無人機(jī)避障的相關(guān)概念、 路徑評(píng)價(jià)指標(biāo)以及避障關(guān)鍵技術(shù)進(jìn)行闡述, 然后對(duì)基于優(yōu)化、 勢(shì)場(chǎng)和機(jī)器學(xué)習(xí)的避障算法進(jìn)行概念闡述、 優(yōu)缺點(diǎn)比較, 最后分析得出了制約無人機(jī)避障發(fā)展的挑戰(zhàn)、 研究重點(diǎn)和方向。
關(guān)鍵詞: 無人機(jī); 避障; 優(yōu)化; 勢(shì)場(chǎng); 機(jī)器學(xué)習(xí); 人工智能; 自主控制
中圖分類號(hào):??? V279; V249; TP18 ?文獻(xiàn)標(biāo)識(shí)碼:??? A文章編號(hào): 1673-5048(2021)05-0053-11
0 引? 言
隨著航空技術(shù)與自動(dòng)化技術(shù)的不斷發(fā)展, 無人機(jī)憑借其機(jī)動(dòng)性強(qiáng)、 成本低、 操作方便等特點(diǎn), 在軍事、 農(nóng)業(yè)、 交通、 公共管理等領(lǐng)域獲得廣泛應(yīng)用。 根據(jù)前瞻產(chǎn)業(yè)研究院發(fā)布的《2018-2023年中國(guó)無人機(jī)行業(yè)市場(chǎng)需求預(yù)測(cè)及投資戰(zhàn)略規(guī)劃分析報(bào)告》預(yù)測(cè), 我國(guó)民用無人機(jī)產(chǎn)品銷售和服務(wù)總體市場(chǎng)規(guī)模到2025年將達(dá)到750億元。 2016年, 國(guó)務(wù)院辦公廳在《關(guān)于促進(jìn)通用航空業(yè)發(fā)展的指導(dǎo)意見》中提出擴(kuò)大低空空域開放, 低空空域管理改革實(shí)現(xiàn)軍民融合[1]。 2018年, 國(guó)家空管委辦公室發(fā)布《無人駕駛航空器飛行管理暫行條例(征求意見稿)》[2], 無人機(jī)低空運(yùn)行成為當(dāng)前低空空域改革的重點(diǎn)。 隨著改革的推進(jìn), 無人機(jī)由視距內(nèi)人工遙控器操作發(fā)展為超視距遠(yuǎn)程網(wǎng)絡(luò)操作, 從而進(jìn)入融合空域執(zhí)行多樣化任務(wù)已成為當(dāng)前趨勢(shì)[3], 而制約無人機(jī)發(fā)揮更大效能的關(guān)鍵在于其是否具有可靠的避障能力。
1 無人機(jī)避障相關(guān)概念
低空融合空域內(nèi), 執(zhí)行特定任務(wù)的無人機(jī)與靜態(tài)建筑、 樹木障礙物、 動(dòng)態(tài)飛行器等共享同一空域, 當(dāng)空域內(nèi)流量過大時(shí), 極易發(fā)生危險(xiǎn)接近甚至空中撞擊事件, 帶來了安全隱患。 飛行沖突是指兩架航空器在橫向、 縱向或垂直方向上距離小于特定間隔, 使得航空器受到安全威脅的狀態(tài)[4]。 無人機(jī)避障是通過研究航空器在未來一段時(shí)間內(nèi)是否存在潛在沖突, 通過改變無人機(jī)運(yùn)行狀態(tài), 規(guī)劃出避免沖突的理想軌跡, 達(dá)到規(guī)避障礙物的過程, 目的是保證空域內(nèi)無人機(jī)與障礙物保持一定的安全距離[5]。 避障策略是無人機(jī)用于解決沖突的一系列動(dòng)作, 基本動(dòng)作包括變速(加速或減速)、 水平動(dòng)作(左轉(zhuǎn)或右轉(zhuǎn))和垂直動(dòng)作(爬升或下降)。 簡(jiǎn)單沖突場(chǎng)景時(shí), 一個(gè)簡(jiǎn)單的基本操作就可以避免碰撞, 但面對(duì)高密度、 高不確定性的復(fù)雜沖突環(huán)境時(shí), 需要結(jié)合基本動(dòng)作, 同時(shí)或依次進(jìn)行操作, 才能保證避障的有效性與最優(yōu)性。
由于無人機(jī)具有高機(jī)動(dòng)性、 自身性能約束等特點(diǎn), 因此在避障過程中需要考慮一系列條件:
(1) 安全約束: 安全運(yùn)行是無人機(jī)運(yùn)行的關(guān)鍵指標(biāo)之一, 指無人機(jī)與其他航空器的距離在任意時(shí)刻下都保持一定的安全間隔。
(2) 解脫實(shí)時(shí)性: 與中高空空域相比, 低空空域環(huán)境更加復(fù)雜, 執(zhí)行任務(wù)的飛行器種類更加多樣, 路徑更加不規(guī)則, 沖突概率相應(yīng)增大, 因此, 無人機(jī)避障策略計(jì)算時(shí)間要盡可能小, 滿足實(shí)時(shí)性約束, 以此來應(yīng)對(duì)具有高不確定的障礙物。
(3) 物理性能約束: 無人機(jī)的最大航程、 最小航段、 最小轉(zhuǎn)向速度、 飛行速度、 運(yùn)行高度、 過載等物理量受到自身動(dòng)力學(xué)性能約束, 因此, 在避障過程中必須考慮相關(guān)約束條件, 生成滿足動(dòng)力學(xué)性能約束的安全路徑。
(4) 執(zhí)行任務(wù): 無人機(jī)在避障過程中, 往往會(huì)偏離原路徑, 影響任務(wù)執(zhí)行效率, 因此, 在無人機(jī)沖突消解后, 需要考慮航跡恢復(fù)問題, 降低規(guī)避策略對(duì)無人機(jī)執(zhí)行任務(wù)的影響。
(5) 空間約束: 低空混合空域具有一定的空間限制, 包括禁飛區(qū)、 危險(xiǎn)區(qū)等嚴(yán)禁無人機(jī)進(jìn)入的空域, 同時(shí)復(fù)雜融合空域內(nèi)運(yùn)行的無人機(jī)需要考慮地理威脅因素, 包括建筑、 山體等障礙物對(duì)運(yùn)行軌跡的影響, 因此, 在解脫路徑生成時(shí)需要考慮空間約束條件。
另外, 無人機(jī)屬性、 性能差異等因素也應(yīng)予以考慮。
融合空域執(zhí)行任務(wù)的無人機(jī)系統(tǒng)應(yīng)具備一定的規(guī)避障礙物的能力, 如圖1所示, 在外部環(huán)境約束、 任務(wù)目標(biāo)和機(jī)動(dòng)性能的約束下, 地面/機(jī)載處理器需要實(shí)時(shí)生成避障策略, 并傳送給無人機(jī)飛行控制器, 通過動(dòng)力單元模塊實(shí)現(xiàn)沖突消解。
無人機(jī)避障問題的核心在于計(jì)算得到?jīng)_突解脫路徑, 因此, 求解獲取路徑的優(yōu)劣需要建立相應(yīng)指標(biāo)進(jìn)行評(píng)價(jià), 一般包括解脫路徑質(zhì)量與算法性能兩部分, 具體指標(biāo)如圖2所示。
作為無人機(jī)自主控制能力的關(guān)鍵技術(shù)之一, 避障技術(shù)受到國(guó)內(nèi)外學(xué)者的關(guān)注。 從智能控制的角度來看, 無人機(jī)是一個(gè)集綜合環(huán)境感知層、 決策控制層與操作執(zhí)行層為一體的智能控制系統(tǒng), 同時(shí), 無人機(jī)還是一個(gè)高度智能化的系統(tǒng), 其自主性、 適應(yīng)性與交互性的特征需要綜合多學(xué)科知識(shí)進(jìn)行技術(shù)實(shí)現(xiàn)。 由于運(yùn)行環(huán)境的高復(fù)雜性與不確定性, 無人機(jī)避障規(guī)劃研究的關(guān)鍵技術(shù)主要包括信息感知、 智能決策、 路徑規(guī)劃與運(yùn)動(dòng)控制等方面。
(1) 信息感知技術(shù)。 無人機(jī)要達(dá)到避障控制的目標(biāo), 首要考慮的問題就是獲取自身狀態(tài)信息及其周圍環(huán)境信息以指導(dǎo)下一步?jīng)Q策, 這些信息需要通過信息感知系統(tǒng)進(jìn)行獲取, 因此, 如何獲取相關(guān)信息成為無人機(jī)避障的關(guān)鍵技術(shù)之一。
(2) 智能決策技術(shù)。 無人機(jī)需要通過感知的自身狀態(tài)信息與環(huán)境信息進(jìn)行自主決策判斷, 確定合適的運(yùn)行模式, 并作出相應(yīng)的機(jī)動(dòng)決策策略。
(3) 路徑規(guī)劃技術(shù)。 無人機(jī)避障路徑規(guī)劃是根據(jù)智能決策給出的避障任務(wù)與實(shí)時(shí)環(huán)境變化, 為無人機(jī)提供可機(jī)動(dòng)策略空間與運(yùn)行引導(dǎo)的過程。 路徑規(guī)劃可分為全局規(guī)劃與局部規(guī)劃, 是無人機(jī)避障關(guān)鍵技術(shù)之一。
(4) 運(yùn)動(dòng)控制技術(shù)。 運(yùn)動(dòng)控制技術(shù)是根據(jù)當(dāng)前無人機(jī)自身狀態(tài)以及規(guī)劃出的避障路徑, 生成控制指令, 控制無人機(jī)精確、 快速跟蹤規(guī)劃出的路徑, 主要包括調(diào)向、 調(diào)速、 調(diào)高等控制動(dòng)作, 是無人機(jī)避障關(guān)鍵技術(shù)之一。
2 無人機(jī)避障方法
運(yùn)行中的無人機(jī)一旦檢測(cè)到飛行沖突, 立即解算避障路徑, 并驅(qū)動(dòng)機(jī)體按照安全路徑運(yùn)行。 當(dāng)前避障技術(shù)主要分為三類: 基于優(yōu)化、 勢(shì)場(chǎng)和機(jī)器學(xué)習(xí)的避障方法。
2.1 基于優(yōu)化的避障方法
基于優(yōu)化的避障方法思想源于最優(yōu)控制[6], 是根據(jù)已建立的無人機(jī)時(shí)域數(shù)學(xué)模型或頻域數(shù)學(xué)模型, 選擇一個(gè)容許的控制律, 使無人機(jī)按照約束的條件運(yùn)行, 并使某一性能指標(biāo)達(dá)到最優(yōu)的過程。 其特點(diǎn)在于從整個(gè)沖突態(tài)勢(shì)的演繹全局來考慮問題, 可用各類數(shù)值計(jì)算與現(xiàn)代優(yōu)化方法求解規(guī)避障礙的路徑。
2.1.1 數(shù)學(xué)優(yōu)化算法
針對(duì)已建立的無人機(jī)避障模型, 可利用各類數(shù)學(xué)優(yōu)化算法將最優(yōu)控制問題轉(zhuǎn)化為便于求解的模型, 從而生成解脫路徑。
(1) 非線性優(yōu)化方法
性能指標(biāo)或約束條件中包含非線性函數(shù)的問題稱為非線性優(yōu)化問題, 當(dāng)前用于無人機(jī)避障的非線性優(yōu)化方法有梯度下降法、 二次規(guī)劃法、 凸優(yōu)化法等。 陳偉鋒等[7]將避障問題轉(zhuǎn)化為最優(yōu)控制命題形式, 提出一種基于析取關(guān)系直接變換的動(dòng)態(tài)聯(lián)立求解方法, 并用Radau配置點(diǎn)的拉格朗日插值對(duì)最優(yōu)控制模型進(jìn)行離散化處理, 并通過對(duì)比驗(yàn)證了方法的有效性。 付其喜等[8]將無人機(jī)額外飛行距離作為優(yōu)化函數(shù), 首先基于隨機(jī)并行梯度下降法(Stochastic Parallel Gradient Descent,? SPGD)對(duì)初始解脫可行解進(jìn)行計(jì)算, 再利用序列二次規(guī)劃(Sequential Quadratic Programming,? SQP)求解最優(yōu)解脫航向。 王祝等[9]將無人機(jī)避障非凸問題轉(zhuǎn)化成一系列近似凸優(yōu)化子問題, 利用凸優(yōu)化法進(jìn)行求解, 得到兼具時(shí)效性與最優(yōu)性的解脫路徑。
(2) 混合整數(shù)線性/非線性規(guī)劃(Mixed Integer Linear/Nonlinear Programming,? MILP/ MINLP)
混合整數(shù)線性規(guī)劃方法是用整數(shù)約束無人機(jī)的控制指令(速度、 航向), 進(jìn)而通過線性規(guī)劃的方法對(duì)最優(yōu)航路進(jìn)行計(jì)算。 Radmanesh等[10] 提出一種有限范圍內(nèi)的動(dòng)態(tài)混合整數(shù)線性規(guī)劃算法, 降低了航路規(guī)劃計(jì)算量。 Turnbull等[11]提出基于MILP-MPC的避撞航路規(guī)劃算法, 對(duì)語言決策樹進(jìn)行訓(xùn)練, 訓(xùn)練后的模型被用于實(shí)時(shí)航路規(guī)劃。 Sarim等[12]在粗略航路規(guī)劃的前提下, 利用MILP對(duì)航路進(jìn)行精細(xì)處理, 生成最優(yōu)避障路徑。 Alonso-Ayuso等[13]利用多次滾動(dòng)時(shí)域方法將消解問題轉(zhuǎn)化為混合整數(shù)非線性規(guī)劃問題, 并進(jìn)一步線性化為MILP模型, 實(shí)現(xiàn)速度調(diào)整進(jìn)行避障。 張啟錢等[14]基于序列混合整數(shù)線性規(guī)劃, 提出同時(shí)可以選擇調(diào)速、 調(diào)向與調(diào)高的序列混合整數(shù)線性優(yōu)化(Sequential Mixed Integer Linear Optimization-Velocity Change,? Turn Change and Altitude Change,? SMILO-VTAC)模型, 解決了復(fù)雜低空多機(jī)沖突解脫問題。 采俊玲等[15]采用航向-速度解脫策略結(jié)合的混合整數(shù)非線性規(guī)劃(MINLP)模型, 實(shí)現(xiàn)空域內(nèi)航空器的避障。
(3) 動(dòng)態(tài)規(guī)劃法(Dynamic Programming,? DP)
動(dòng)態(tài)規(guī)劃的核心是基于貝爾曼最優(yōu)性原理, 根據(jù)基本遞推關(guān)系式, 不斷轉(zhuǎn)移決策過程, 將最優(yōu)化問題轉(zhuǎn)化為多步?jīng)Q策問題。 Denton等[16]將動(dòng)態(tài)規(guī)劃與樹形搜索結(jié)合, 計(jì)算出三維最優(yōu)地形回避航路。 Sunberg等[17]將多無人機(jī)沖突消解問題轉(zhuǎn)化為近似動(dòng)態(tài)規(guī)劃問題進(jìn)行求解。 Bousson[18]利用單網(wǎng)格點(diǎn)動(dòng)態(tài)規(guī)劃, 對(duì)飛行器避撞問題進(jìn)行最優(yōu)化求解。
基于數(shù)學(xué)優(yōu)化方法的避障路徑求解模型較為直觀, 易于理解, 但當(dāng)約束條件較為復(fù)雜時(shí), 求解難度增大, 計(jì)算量增加, 不能滿足實(shí)時(shí)性要求。 常見的基于數(shù)學(xué)優(yōu)化方法的避障算法適用場(chǎng)景與優(yōu)缺點(diǎn)如表1所示。
2.1.2 啟發(fā)式算法
啟發(fā)式算法是在可接受的計(jì)算成本下, 對(duì)近似最優(yōu)解進(jìn)行搜索的優(yōu)化算法, 在基于路徑規(guī)劃的避障領(lǐng)域應(yīng)用廣泛, 主要有群智能算法、 A*、 D*等。
智能算法是基于仿生學(xué)計(jì)算原理, 模擬群體生物行為協(xié)同搜索空間最優(yōu)解的過程。 對(duì)于高緯度、 非線性、 多約束的最優(yōu)化問題, 往往能夠收斂到最優(yōu)值。 在無人機(jī)路徑規(guī)劃中應(yīng)用廣泛, 同時(shí)也相應(yīng)解決了無人機(jī)避障問題。 常用算法有粒子群算法、 遺傳算法、 蟻群算法、 人工蜂群算法、 布谷鳥算法等。
(1) 粒子群算法(Particle Swarm Optimization,? PSO)
粒子群算法是模擬自然界中鳥群覓食現(xiàn)象, 通過種群迭代更新粒子位置和速度進(jìn)行搜索空間最優(yōu)解[19]。 Tang等[20]將多智能粒子濾波器用在未知環(huán)境路徑規(guī)劃求解上, 降低了計(jì)算量。 Zhuang等[21]將PSO與勒讓德偽譜法結(jié)合, 尋找更適合無人機(jī)運(yùn)行的軌跡。 Yan等[22]將PSO與路徑點(diǎn)制導(dǎo)算法結(jié)合, 生成低功耗、 更平滑的避撞路徑。 Lim等[23]將PSO與量子物理結(jié)合, 提出量子-粒子群優(yōu)化算法(Quantum Behavior Particle Swarm Optimization,? QPSO)生成光滑的無人機(jī)可飛路徑, 同時(shí)降低計(jì)算量、 提升效率。
(2) 遺傳算法(Genetic Algorithm,? GA)
遺傳算法是模擬自然界遺傳機(jī)理以及生物進(jìn)化過程, 通過基因的選擇、 交叉、 變異等操作, 實(shí)現(xiàn)對(duì)最優(yōu)值的搜索[24]。 余文曌等[25]將GA與彈性網(wǎng)絡(luò)結(jié)合, 降低搜索空間, 提高搜索效率。 Yan等[26]對(duì)GA模型進(jìn)行改進(jìn), 可以生成滿足航空器性能約束的解脫路徑, 降低運(yùn)行能耗。 何光勤等[27]將GA應(yīng)用在三維空間內(nèi)的避障, 將懲罰函數(shù)代入性能指標(biāo)中, 求解出的解脫路徑光滑性較好, 適合航空器運(yùn)行。
(3) 蟻群算法(Ant Colony Optimization,? ACO)
蟻群算法是模擬自然界中螞蟻覓食的生物行為而提出來的一種最優(yōu)化搜索算法, 具有并行計(jì)算、 魯棒性好的特點(diǎn), 在無人機(jī)避障領(lǐng)域應(yīng)用廣泛[28]。 Wu等[29]將回退、 死亡兩種策略加入到ACO中, 促使螞蟻以更大概率達(dá)到最優(yōu)目標(biāo)位置, 優(yōu)化了算法搜索能力。 Jiao等[30]提出了基于自適應(yīng)狀態(tài)轉(zhuǎn)移策略和自適應(yīng)信息素更新策略的改進(jìn)ACO算法, 強(qiáng)化信息素強(qiáng)度、 啟發(fā)信息對(duì)算法迭代優(yōu)化過程的重要作用, 提高了算法全局尋優(yōu)性。 Luo等[31]提出將信息素的優(yōu)劣區(qū)分開, 除去正常的信息素更新迭代, 額外強(qiáng)化效果好的信息素, 對(duì)提升算法收斂性起到一定作用。 張宏宏[28]等基于分割法, 以時(shí)間換取空間, 提高了蟻群算法的搜索能力。
(4) 人工蜂群算法(Artificial Bee Colony Algorithm,? ABC)
人工蜂群算法是模擬蜜蜂行為而提出的一種優(yōu)化算法。 Kang等[32]在蜂群采蜜階段加入Rosenbrock旋轉(zhuǎn)方向法, 避免了算法早熟收斂, 準(zhǔn)備率也有一定提升。 王淵等[33]在傳統(tǒng)ABC算法的基礎(chǔ)上, 改進(jìn)了跟隨蜂對(duì)雇傭蜂的選擇概率, 用最優(yōu)解引導(dǎo)迭代方向, 保證算法跳出局部最優(yōu)解。 Contreras-Cruz M A等[34]將ABC算法與進(jìn)化算法結(jié)合, 先由ABC算法進(jìn)行局部搜索, 再由進(jìn)化算法得出最優(yōu)解脫路徑。 Li等[35]將平衡性策略應(yīng)用到傳統(tǒng)ABC算法中, 在局部與全局之間實(shí)現(xiàn)平衡。
此外, 還有一些智能算法被用在無人機(jī)路徑規(guī)劃上, 實(shí)現(xiàn)避障, 如布谷鳥算法(Cuckoo Search,? CS)[36]、 鯨魚優(yōu)化算法(Whale Optimization Algorithm,? WOA)[37]、 蟻獅算法(Ant Lion Optimizer,? ALO)[38]、 鴿群算法(Pigeon-Inspired Optimization,? PIO)[39]、 螢火蟲算法(Firefly Algorithm,? FA)[40]、 烏賊算法[41]等。
(5)A*/D*算法
A*算法是一種圖搜索算法, 將啟發(fā)信息因素引入待求解問題目標(biāo)信息中, 使得搜索方向更加精準(zhǔn), 降低收斂時(shí)間。 A*算法支付代價(jià)為 f(n)=g(n)+h(n) , 其中 g(n) 表示航路代價(jià), ?h(n) 表示預(yù)測(cè)代價(jià)。 在搜索過程中, 將支付代價(jià)最小的節(jié)點(diǎn)插入路徑鏈表中, 完成對(duì)障礙物的規(guī)避。 馬云紅等[42]采用變步長(zhǎng)策略, 提高A*算法搜索效率, 同時(shí)生成一系列滿足UAV俯仰角、 偏航角等物理性能約束的可飛航線。 祁玄玄等[43]從目標(biāo)性擴(kuò)展、 目標(biāo)可見性判斷、 更換啟發(fā)函數(shù)、 改變擴(kuò)展節(jié)點(diǎn)選擇策略四個(gè)方面對(duì)A*算法進(jìn)行改進(jìn), 提高了算法的收斂效率, 優(yōu)化了路徑長(zhǎng)度。 宋雪倩等[44]將Dubins結(jié)合A*算法, 使用“向量共享”原理, 對(duì)解脫航向改變量進(jìn)行計(jì)算, 并進(jìn)行路徑重規(guī)劃, 可在短時(shí)間內(nèi)獲取連續(xù)飛行安全路徑。
針對(duì)復(fù)雜環(huán)境動(dòng)態(tài)變化的問題, 傳統(tǒng)A*算法難以應(yīng)用, 因此一些學(xué)者在A*算法的基礎(chǔ)上進(jìn)行改進(jìn), 典型的改進(jìn)算法有D*算法。 Ganapathy等[45]提出Enhanced D* Lite算法, 解決了穿越尖角障礙物產(chǎn)生的不安全路徑問題。 Stentz[46]提出分批次局部更新航跡代價(jià)圖的D*算法, 有效解決避障問題。 常見的基于啟發(fā)式典型算法的避障算法的適用場(chǎng)景與優(yōu)缺點(diǎn)如表2所示。
2.1.3 圖? 論
基于圖形的避障方法, 首先通過柵格化方法, 對(duì)環(huán)境進(jìn)行建模, 再利用搜索算法生成避障路徑, 完成全局沖突解脫, 常用方法有Dijkstra算法、 Voronoi圖、 隨機(jī)路標(biāo)圖法(Probabilistic Roadmap,? PRM)、 Dubins 曲線、 輪廓圖法(Silhouette)、 通視圖法(Visibility Graph)等。
Dijkstra算法是圖論中經(jīng)典最短路徑求法, 頂點(diǎn)代表航路點(diǎn), 邊代表可行路徑, 適用于邊權(quán)非負(fù)的二維靜態(tài)避障場(chǎng)景。 使用該算法的關(guān)鍵在于選取有效航跡點(diǎn), 縮短規(guī)劃時(shí)間[47-48]。 Voronoi圖根據(jù)障礙物分布情況, 畫出相鄰障礙物中垂線, 構(gòu)成圍繞障礙物的多邊形, 再對(duì)每條路徑進(jìn)行賦權(quán)值, 最優(yōu)搜索出代價(jià)最小的避障航路。 由于Voronoi圖能夠在飛行過程中有效降低支付代價(jià), 在無人機(jī)避障領(lǐng)域應(yīng)用廣泛[49-50]。 Dubins 曲線考慮無人機(jī)轉(zhuǎn)彎性能約束, 生成一條可飛的無人機(jī)解脫路徑[51-53]。 在復(fù)雜低空空域中, 搜索具有多個(gè)自由度的高維避障路徑的規(guī)劃問題往往代價(jià)較高, 因此, 可以放松一下弱約束條件, 尋求一種折中的搜索空間, 既能代表完備的環(huán)境信息, 又能有效提高搜索速度。 隨機(jī)路標(biāo)圖法(Probabilistic Roadmap,? PRM)基于這一原則, 對(duì)無人機(jī)解脫空間進(jìn)行搜索[54-55]。 常見的基于圖論的避障算法的適用場(chǎng)景與優(yōu)缺點(diǎn)如表3所示。
2.2 基于勢(shì)場(chǎng)和導(dǎo)航函數(shù)的避障方法
基于勢(shì)場(chǎng)的避障方法在空域內(nèi)構(gòu)造虛擬勢(shì)場(chǎng), 生成導(dǎo)航函數(shù), 將航空器的運(yùn)動(dòng)規(guī)律轉(zhuǎn)化為物體間力的作用結(jié)果, 是一種廣泛應(yīng)用的避障方式, 具有數(shù)學(xué)描述結(jié)構(gòu)簡(jiǎn)單、 美觀, 規(guī)劃算法快等特點(diǎn), 常見的算法有人工勢(shì)場(chǎng)法、 速度障礙法、 流函數(shù)法等。
2.2.1 人工勢(shì)場(chǎng)法
人工勢(shì)場(chǎng)法的基本思想是將復(fù)雜障礙環(huán)境轉(zhuǎn)化為一個(gè)勢(shì)場(chǎng), 障礙物產(chǎn)生的斥力Frep與目標(biāo)點(diǎn)產(chǎn)生的引力Fatt共同作用在無人機(jī), 合力Ftotal控制無人機(jī)運(yùn)動(dòng)狀態(tài), 達(dá)到局部避撞的效果, 如圖3所示。 管祥民等[56]結(jié)合蟻群算法與APF的優(yōu)點(diǎn), 提出改進(jìn)混合避障方法, 得出時(shí)效性與飛行更好的解脫路徑。 Yang等[57]提出了一種回歸搜索法, 用來改進(jìn)勢(shì)場(chǎng)函數(shù), 避免了陷入局部極小點(diǎn)的缺陷。 韓知玖等[58]提出改進(jìn)APF算法, 可在航空器動(dòng)力學(xué)約束的條件下, 生成路徑短、 平滑的最優(yōu)路徑。
2.2.2 速度障礙法
速度障礙法(Velocity Obstacle,? VO)是通過分析無人機(jī)與動(dòng)態(tài)障礙物之間的空間幾何關(guān)系, 計(jì)算避障所需的速度與航向。 如圖4所示, 無人機(jī)與動(dòng)態(tài)障礙物的速度分別為v1, v2, 速度障礙法將相對(duì)速度vR=v1-v2作為研究對(duì)象, 將位置障礙轉(zhuǎn)化為速度障礙。 若相對(duì)速度vR落在障礙錐中, 則存在沖突, 否則不存在。 無人機(jī)通過調(diào)整自身航向、 速度, 使得相對(duì)速度落在障礙錐之外, 實(shí)現(xiàn)沖突解脫。
張宏宏等[59]等基于速度障礙法, 對(duì)無人機(jī)避障應(yīng)調(diào)航向與速度進(jìn)行嚴(yán)格的理論推導(dǎo), 實(shí)現(xiàn)不同沖突場(chǎng)景下無人機(jī)自主選擇解脫策略實(shí)現(xiàn)避障。 Durand等[60]在速度障礙法的基礎(chǔ)上, 提出最優(yōu)互惠避碰(ORCA)算法, 使之適用于速度受限的飛機(jī)。 Bareiss等[61]對(duì)最優(yōu)互惠避碰(ORCA)模型進(jìn)行分析, 將所有基于速度障礙理論的避障策略歸納為泛速度障礙模型。 楊秀霞等[62]利用空間速度障礙球冠模型, 將三維空間內(nèi)的障礙映射到二維平面, 給出無人機(jī)避障的最優(yōu)航向決策, 具有一定的可行性與有效性。
2.2.3 流函數(shù)法(Stream Function, SF)
流函數(shù)法是將流體計(jì)算與規(guī)避障礙物相結(jié)合, 通過模擬自然界流水避石, 從起始點(diǎn)流向終點(diǎn)的現(xiàn)象而提出的避障方法, 因其可以快速生成光滑避碰路徑而受到學(xué)者關(guān)注, 如圖5所示。 梁宵等[63]采用旋轉(zhuǎn)評(píng)議矩陣與流線數(shù)據(jù)疊加模型, 解決了多障礙物任意位置存在的避障問題。 Daily等[64]通過對(duì)不同障礙物流函數(shù)進(jìn)行加權(quán)求和處理, 解決了多障礙物重疊時(shí)的避障問題。 王宏倫等[65]提出虛擬動(dòng)態(tài)目標(biāo)方法, 將無人機(jī)所受的性能約束轉(zhuǎn)化為虛擬障礙, 能在復(fù)雜環(huán)境下規(guī)劃出可飛的解脫航路。
常見的基于勢(shì)場(chǎng)和導(dǎo)航函數(shù)的避障算法適用場(chǎng)景與優(yōu)缺點(diǎn)如表4所示。
2.3 基于機(jī)器學(xué)習(xí)的避障方法
機(jī)器學(xué)習(xí)算法是將無人機(jī)避障問題轉(zhuǎn)化為一個(gè)決策問題, 通過與復(fù)雜動(dòng)態(tài)環(huán)境的信息反復(fù)交互, 選擇最優(yōu)或近最優(yōu)策略, 以實(shí)現(xiàn)其長(zhǎng)期目標(biāo)。 隨著智能化水平的不斷提升, 機(jī)器學(xué)習(xí)算法在無人機(jī)避障領(lǐng)域得到廣泛應(yīng)用, 常見方法有神經(jīng)網(wǎng)絡(luò)、 強(qiáng)化學(xué)習(xí)與深度強(qiáng)化學(xué)習(xí)。
2.3.1 神經(jīng)網(wǎng)絡(luò)
無人機(jī)避障導(dǎo)航控制是根據(jù)傳感器獲取的信息, 快速得到無人機(jī)應(yīng)采取的動(dòng)作, 其本質(zhì)是獲取狀態(tài)空間與動(dòng)作空間的映射關(guān)系[66]。 映射關(guān)系往往難以用精確的數(shù)學(xué)表示, 而神經(jīng)網(wǎng)絡(luò)是由大量非線性單元連接構(gòu)成的非線性復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu), 通過對(duì)人腦功能的控制與反饋功能進(jìn)行模擬, 形成的非線性映射系統(tǒng)[67]。 神經(jīng)網(wǎng)絡(luò)憑借其強(qiáng)大的學(xué)習(xí)與泛化能力、 非線性映射能力以及快速規(guī)劃能力, 在機(jī)器人動(dòng)力學(xué)以及導(dǎo)航控制領(lǐng)域得到廣泛應(yīng)用。
國(guó)內(nèi)外學(xué)者結(jié)合神經(jīng)網(wǎng)絡(luò)的特點(diǎn), 對(duì)無人機(jī)路徑規(guī)劃、 制導(dǎo)與避障控制進(jìn)行了大量研究。 王延祥等[68]提出擾動(dòng)流體動(dòng)態(tài)系統(tǒng)與神經(jīng)網(wǎng)絡(luò)結(jié)合的自適應(yīng)避障路徑生成算法, 能夠適應(yīng)環(huán)境的復(fù)雜性, 且具有較高的魯棒性。 Zhang等[69]基于神經(jīng)網(wǎng)絡(luò)模型, 不斷對(duì)無人機(jī)進(jìn)行離線訓(xùn)練, 找到符合約束條件的解脫路徑。 Choi等[70]采用機(jī)器學(xué)習(xí)框架, 提出了一種無人機(jī)雙層避障算法, 使得無人機(jī)以最小的支付代價(jià)避障多個(gè)障礙物, 得到滿足實(shí)時(shí)性和有效性的避障決策。
單一神經(jīng)網(wǎng)絡(luò)未能考慮訓(xùn)練與決策過程中的不確定性, 因此有學(xué)者將模糊邏輯理論與神經(jīng)網(wǎng)絡(luò)相結(jié)合, 用隸屬度代替不確定性的指標(biāo), 更符合實(shí)際情況, 具有較強(qiáng)的自學(xué)習(xí)與自適應(yīng)能力[71-72], 以適應(yīng)環(huán)境變化。
2.3.2 強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是將動(dòng)態(tài)規(guī)劃與監(jiān)督學(xué)習(xí)相結(jié)合的一種新型學(xué)習(xí)方法, 強(qiáng)調(diào)在于環(huán)境的交互中不斷學(xué)習(xí), 執(zhí)行“嘗試-失敗”機(jī)制, 通過反饋的評(píng)價(jià), 實(shí)現(xiàn)輸出最優(yōu)決策, 在無人機(jī)復(fù)雜避障決策問題得到應(yīng)用。 這種學(xué)習(xí)理念能夠通過獎(jiǎng)勵(lì)指標(biāo)最大化, 使得系統(tǒng)做出一系列決策, 而不需要人工干預(yù), 流程圖如圖6所示。 2005年,? Michels J等[73]將強(qiáng)化學(xué)習(xí)應(yīng)用在避障系統(tǒng)中, 通過訓(xùn)練模型預(yù)測(cè)合適的避障策略。 Xie等[74]基于Double DQN 算法, 實(shí)現(xiàn)了室內(nèi)場(chǎng)景自主避障。 Vamvoudakis等[75]也將強(qiáng)化學(xué)習(xí)應(yīng)用在智能體避障領(lǐng)域, 但實(shí)驗(yàn)表明樣本特征質(zhì)量的選擇影響避障效果。 鄒啟杰等[76]提出強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)快速探索隨機(jī)數(shù)的RL-RRT方法, 加快搜索速度, 實(shí)現(xiàn)解脫路徑多目標(biāo)決策優(yōu)化。 Kulkarni等[77]基于目標(biāo)驅(qū)動(dòng)內(nèi)在動(dòng)機(jī)的深度學(xué)習(xí)方法, 在實(shí)時(shí)環(huán)境中學(xué)習(xí)導(dǎo)向行為, 以提高復(fù)雜環(huán)境內(nèi)收斂速度。
目前, 強(qiáng)化學(xué)習(xí)在無人機(jī)避障領(lǐng)域已取得不錯(cuò)的進(jìn)展, 只需對(duì)環(huán)境樣本進(jìn)行訓(xùn)練, 便可得到避障模型, 同時(shí)具有規(guī)劃速度快的特點(diǎn), 但是, 當(dāng)運(yùn)行場(chǎng)景發(fā)生變化時(shí), 往往需要重新對(duì)模型進(jìn)行訓(xùn)練, 代價(jià)相對(duì)較高。
2.3.3 深度強(qiáng)化學(xué)習(xí)
深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,? DRL)是將強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)相結(jié)合, 通過強(qiáng)化學(xué)習(xí)與環(huán)境探索得到優(yōu)化目標(biāo), 通過深度學(xué)習(xí)獲取系統(tǒng)運(yùn)行機(jī)制, 用于表征和解決問題[78]。 作為機(jī)器學(xué)習(xí)中的研究熱點(diǎn), 該方法憑借深度學(xué)習(xí)的感知能力, 即使針對(duì)高維原始數(shù)據(jù)輸入, 也能獲取有效的控制決策。 基于深度強(qiáng)化學(xué)習(xí)的系統(tǒng)避障控制模型如圖7所示, 可分為基于值函數(shù)和基于策略梯度的深度強(qiáng)化學(xué)習(xí)算法。
(1) 基于值函數(shù)的深度強(qiáng)化學(xué)習(xí)算法
DQN(Deep Q-Learning)算法由DeepMind公司在NIPS2013上提出, 后于2015年在Nature上提出改進(jìn)版本[79]。 其核心思想是用神經(jīng)網(wǎng)絡(luò)來表征函數(shù)或者參數(shù)化動(dòng)作策略, 基于梯度對(duì)損失函數(shù)進(jìn)行優(yōu)化, 實(shí)現(xiàn)了“感知-動(dòng)作”的學(xué)習(xí)算法。 Lü等[80]提出了一種改進(jìn)的學(xué)習(xí)策略, 該策略基于不同學(xué)習(xí)階段對(duì)經(jīng)驗(yàn)深度和廣度的不同需求, 其中DQN計(jì)算Q值, 采用密集網(wǎng)絡(luò)框架。 在學(xué)習(xí)的初始階段, 創(chuàng)建一個(gè)經(jīng)驗(yàn)價(jià)值評(píng)價(jià)網(wǎng)絡(luò), 增加深度經(jīng)驗(yàn)的比例, 以更快地理解環(huán)境規(guī)則。 當(dāng)發(fā)生路徑漫游現(xiàn)象時(shí), 采用平行探索結(jié)構(gòu), 考慮漫游點(diǎn)等點(diǎn)的探索, 提高了經(jīng)驗(yàn)池的廣度。 劉慶杰等[81]采用改進(jìn)DQN算法克服了Q-learning表格式算法在連續(xù)狀態(tài)下導(dǎo)致內(nèi)存不足的局限性。 通過改進(jìn)獎(jiǎng)勵(lì)機(jī)制, 增加實(shí)時(shí)獎(jiǎng)懲作為補(bǔ)充, 解決學(xué)習(xí)耗時(shí)長(zhǎng)和訓(xùn)練不穩(wěn)定的問題。
DQN在無人機(jī)避障控制領(lǐng)域取得不錯(cuò)效果, 但其動(dòng)作空間是離散形式的, 不能實(shí)現(xiàn)連續(xù)的路徑生成。
(2) 基于策略梯度的深度強(qiáng)化學(xué)習(xí)算法
為實(shí)現(xiàn)連續(xù)的狀態(tài)空間和動(dòng)作空間, 梯度策略直接利用梯度參數(shù)優(yōu)化策略, 不計(jì)算執(zhí)行策略獲取的累計(jì)獎(jiǎng)勵(lì)值, 輸出完整動(dòng)作策略, 而不是輸出狀態(tài)動(dòng)作值函數(shù)。 最先廣泛應(yīng)用的是隨機(jī)策略搜索法中的區(qū)域信賴策略優(yōu)化算法(Trust Region Policy Optimization,? TRPO)。 該算法由Schulman等[82]提出, 通過進(jìn)行數(shù)據(jù)新舊策略分布評(píng)估, 應(yīng)用于無人機(jī)導(dǎo)航控制領(lǐng)域。 此外, 深度確定性策略梯度算法(Deep Deterministic Policy Gradient,? DDPG)[83]、 引導(dǎo)性策略梯度算法(Guided Policy Search,? GPS)[84-85]和分布式近似策略優(yōu)化算法(Distributed Proximal Policy Optimization,? DPPO)[86]等算法, 也在逐步應(yīng)用于無人機(jī)避障控制中。
但基于策略梯度的深度強(qiáng)化學(xué)習(xí)算法存在收斂難度大的問題, 具體在復(fù)雜障礙場(chǎng)景下的樣機(jī)試驗(yàn)還需進(jìn)一步研究。
3 無人機(jī)避障研技術(shù)的挑戰(zhàn)和研究方向
隨著低空空域改革的推進(jìn)以及人工智能、 信息技術(shù)的革新, 無人機(jī)相關(guān)新理論與新成果不斷涌現(xiàn), 其未來發(fā)展空間必將更加廣闊。
從無人機(jī)避障研究現(xiàn)狀以及未來發(fā)展趨勢(shì)來看, 當(dāng)前挑戰(zhàn)主要集中在:
(1) 無人機(jī)動(dòng)力學(xué)建模問題。 避障過程中, 多是將無人機(jī)簡(jiǎn)化成三自由度的質(zhì)點(diǎn), 忽略偏轉(zhuǎn)角、 俯仰角與滾轉(zhuǎn)角對(duì)運(yùn)行狀態(tài)的影響, 使得現(xiàn)在避障算法難以適應(yīng)高機(jī)動(dòng)性的無人機(jī), 導(dǎo)致實(shí)際無人機(jī)執(zhí)行任務(wù)時(shí)解脫路線與規(guī)劃路線存在偏差, 影響任務(wù)執(zhí)行效果。
(2) 機(jī)載傳感器誤差。 目前無人機(jī)解脫路徑模型中, 一般假設(shè)無人機(jī)可探測(cè)范圍內(nèi)障礙物的物理信息均可由理想機(jī)載傳感器獲取, 而較少考慮機(jī)載傳感器的實(shí)際性能與特性。 目前采用的紅外、 超聲波、 激光和視覺等主流避障方法, 難以精確探測(cè)復(fù)雜環(huán)境(例如煙霧等)。 同時(shí), 不同機(jī)載傳感器由于工作原理與性能指標(biāo)的差異, 存在信息融合效果差、 時(shí)間延遲、 測(cè)量誤差等問題, 對(duì)解脫路徑的生成造成一定影響。
(3) 環(huán)境建模問題。 目前的避障路徑規(guī)劃算法多數(shù)都是基于規(guī)則的理想障礙物的假設(shè), 而實(shí)際無人機(jī)運(yùn)行環(huán)境復(fù)雜多樣, 特別是復(fù)雜凹型障礙環(huán)境(例如U型障礙等)、 密集動(dòng)態(tài)障礙(例如大規(guī)模集群系統(tǒng))等場(chǎng)景的探測(cè)與描述, 還需要進(jìn)一步的探索。
(4) 算法實(shí)時(shí)性問題。 若環(huán)境信息是時(shí)變的, 避障算法就必須具有在線規(guī)劃能力。 算法的實(shí)時(shí)性與其應(yīng)用背景緊密聯(lián)系, 只有達(dá)到一定解算速度的實(shí)時(shí)性算法, 才可應(yīng)用于復(fù)雜動(dòng)態(tài)環(huán)境的在線重規(guī)劃, 否則, 只能應(yīng)用于離線規(guī)劃或局部重規(guī)劃。 當(dāng)前的避障算法一般通過對(duì)復(fù)雜系統(tǒng)進(jìn)行線性化與近似化處理, 實(shí)時(shí)性問題并沒有得到很好的解決。
(5) 組網(wǎng)通信。 當(dāng)前無人機(jī)之間通過無線通信方式進(jìn)行信息交換, 當(dāng)集群規(guī)模較小時(shí)尚可滿足需求, 但面對(duì)大范圍、 大規(guī)模集群高速飛行場(chǎng)景時(shí), 對(duì)組網(wǎng)通信的性能需求較大。 因此, 快速可靠的通信和組網(wǎng)仍是目前具有挑戰(zhàn)性的問題。
研究重點(diǎn)和方向主要集中在以下幾點(diǎn):
(1) 完善避障算法的實(shí)用性。 對(duì)于復(fù)雜環(huán)境建模, 必須通過具體測(cè)量或者使用準(zhǔn)確的三維地圖, 從而獲取可靠精確的數(shù)據(jù), 考慮復(fù)雜環(huán)境多因素對(duì)避障效果的影響, 利用數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。 針對(duì)具體型號(hào)的無人機(jī), 重點(diǎn)研究六自由度無人機(jī)在復(fù)雜環(huán)境下的避障算法, 考慮機(jī)載傳感器誤差等一系列約束條件, 對(duì)機(jī)載傳感器信息傳輸模型進(jìn)行細(xì)化, 針對(duì)不同性能傳感器設(shè)計(jì)不同的規(guī)劃方法, 實(shí)現(xiàn)無人機(jī)“感知-避撞”流程閉環(huán)。 同時(shí)在融合空域內(nèi), 無人機(jī)必須考慮無人機(jī)空中交通管理(Unmanned Air Traffic Management,? UTM)下的運(yùn)行規(guī)則, 充分結(jié)合環(huán)境建模和具體應(yīng)用背景, 設(shè)計(jì)出具有實(shí)用性的避障路徑。
(2) 融合多類型避障路徑算法。 融合不同類型的避障算法, 彌補(bǔ)現(xiàn)有單個(gè)方法的缺陷與不足, 是當(dāng)前的重要研究趨勢(shì)。 例如, 傳統(tǒng)避障規(guī)劃方法(基于優(yōu)化、 勢(shì)場(chǎng)等)可與機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)相結(jié)合, 優(yōu)勢(shì)互補(bǔ), 解決傳統(tǒng)避障算法中局部最優(yōu)等問題, 也在一定程度上彌補(bǔ)基于機(jī)器學(xué)習(xí)的避障規(guī)劃算法中的實(shí)時(shí)性差等問題。
(3) 多機(jī)協(xié)同避障。 由于單無人機(jī)的機(jī)動(dòng)區(qū)域很小, 一旦發(fā)生碰撞, 會(huì)影響臨近無人機(jī), 集群之間產(chǎn)生鏈?zhǔn)叫?yīng), 將造成任務(wù)失敗, 因此, 隨著無人機(jī)集群在戰(zhàn)術(shù)打擊、 目標(biāo)協(xié)同搜索、 多異構(gòu)平臺(tái)協(xié)同等復(fù)雜任務(wù)的廣泛應(yīng)用, 多機(jī)協(xié)同編隊(duì)避障主要研究在滿足多樣約束條件下, 將避障策略合理分配給各個(gè)有能力的無人機(jī)個(gè)體, 完成協(xié)同避障。 由于多機(jī)協(xié)同編隊(duì)避障對(duì)環(huán)境感知、 任務(wù)建模以及規(guī)劃方法都有較高的要求, 因此, 還需要進(jìn)一步的探索與研究。
(4) 設(shè)計(jì)合理的容錯(cuò)機(jī)制。 容錯(cuò)冗余機(jī)制是保障無人機(jī)系統(tǒng)運(yùn)行安全的重要環(huán)節(jié)。 當(dāng)前沒有對(duì)避障算法核心以及薄弱環(huán)節(jié)進(jìn)行容錯(cuò)機(jī)制設(shè)計(jì), 一旦解脫環(huán)節(jié)失效, 會(huì)造成不可預(yù)知后果。 因此, 在未來研究中要著重?zé)o人機(jī)機(jī)能失效時(shí)的容錯(cuò)機(jī)制設(shè)計(jì), 避免不可控事件發(fā)生。
(5) 規(guī)劃-控制一體化設(shè)計(jì)。 當(dāng)前學(xué)者將無人機(jī)避障路徑規(guī)劃與路徑控制區(qū)分開, 分別進(jìn)行建模研究, 而實(shí)際無人機(jī)是否精確跟蹤無人機(jī)規(guī)劃解脫路徑是當(dāng)前未解決的問題。 因此需要將無人機(jī)控制制導(dǎo)律融合到解脫路徑解算過程中, 實(shí)現(xiàn)規(guī)劃-控制一體化。
4 結(jié) 束 語
避障技術(shù)是反映無人機(jī)自主控制以及智能化水平的關(guān)鍵指標(biāo), 同時(shí)作為無人機(jī)任務(wù)決策規(guī)劃的核心模塊, 避障技術(shù)逐漸發(fā)揮其重要作用。 分析結(jié)論表明:
(1) 基于優(yōu)化的避障方法可以處理異常復(fù)雜的非結(jié)構(gòu)化約束以及各類難以近似處理的動(dòng)力學(xué)約束等問題, 其中數(shù)學(xué)優(yōu)化算法計(jì)算繁雜, 不易理解, 但可綜合考慮避障路徑的可靠性、 安全性與優(yōu)化性能。 啟發(fā)式算法一般實(shí)時(shí)性較差, 不適合在線避障規(guī)劃場(chǎng)景, 只適用于離線規(guī)劃或者全局的初始規(guī)劃等場(chǎng)景。
(2) 基于勢(shì)場(chǎng)和導(dǎo)航函數(shù)的避障方法可以快速生成避障路徑, 實(shí)時(shí)性好, 且路徑光滑, 但不能將各類約束條件加入到避障過程, 易陷入局部最優(yōu), 因此, 在局部規(guī)劃器中可優(yōu)先采用此類方法。
(3) 基于機(jī)器學(xué)習(xí)的避障方法規(guī)劃實(shí)時(shí)性與全局性均達(dá)到不錯(cuò)的效果, 且不依賴于環(huán)境先驗(yàn)信息, 但當(dāng)無人機(jī)處于連續(xù)狀態(tài)空間與動(dòng)作空間場(chǎng)景時(shí), 模型離線學(xué)習(xí)訓(xùn)練耗時(shí)長(zhǎng), 且不易收斂, 甚至難以完成訓(xùn)練。
從當(dāng)前發(fā)展現(xiàn)狀來看, 無人機(jī)避障工程實(shí)踐滯后于理論發(fā)展, 在下一步發(fā)展中, 應(yīng)致力于理論實(shí)踐化。
參考文獻(xiàn):
[1] 國(guó)務(wù)院辦公廳關(guān)于促進(jìn)通用航空業(yè)發(fā)展的指導(dǎo)意見[EB/OL]. (2016-05-17)[2021-01-10].http:∥www.gov.cn/zhengce/ content/2016-05/17/content_5074120.htm.
Instruction on Promoting the Development of General Aviation Industry from General Office of the State Council[EB/OL]. (2016-05-17)[2021-01-10].http:∥www.gov.cn/zhengce/ content/2016-05/17/content_5074120.htm. (in Chinese)
[2] 中國(guó)民航局. 無人駕駛航空器飛行管理暫行條例[EB/OL]. (2020-03-28)[2021-01-10]. https:∥wenku.baidu.com/view/ b36cc48bff4733687e21af45b307e87100f6f866.html.
Civil Aviation Administration of China. Interim Regulations on Flight Management of Unmanned Aircraft[EB/OL]. (2020-03-28) [2020-01-10]. https:∥wenku.baidu.com/view/ b36cc48bff4733687e21af45b307e87100f6f866.html. (in Chinese)
[3] 全權(quán),? 李剛,? 柏藝琴,? 等. 低空無人機(jī)交通管理概覽與建議[J]. 航空學(xué)報(bào),? 2020,? 41(1): 023238.
Quan Quan,? Li Gang,? Bai Yiqin,? et al. Low Altitude UAV Traffic Management: An Introductory Overview and Proposal[J]. Acta Aeronautica et Astronautica Sinica,? 2020,? 41(1): 023238.(in Chinese)
[4] Lanicci J,? Halperin D,? Shappell S,? et al. General Aviation Weather Encounter Case Studies[R]. Washington D C: Office of Aerospace Medicine,? 2012:1-12.
[5] 楊健. 無人機(jī)集群系統(tǒng)空域沖突消解方法研究[D]. 長(zhǎng)沙: 國(guó)防科學(xué)技術(shù)大學(xué),? 2016: 1-14.
Yang Jian. Study on the Airspace Conflict Resolution Problem of Unmanned Aerial Vehicle Swarm Systems[D]. Changsha: National University of Defense Technology,? 2016: 1-14.(in Chinese)
[6] Soler M,? Kamgarpour M,? Lloret J,? et al. A Hybrid Optimal Control Approach to Fuel-Efficient Aircraft Conflict Avoidance[J]. IEEE Transactions on Intelligent Transportation Systems,? 2016,? 17(7): 1826-1838.
[7] 陳偉鋒,? 邵之江. 基于析取關(guān)系直接變換的沖突解脫方法[J]. 航空學(xué)報(bào),? 2014,? 35(4): 1122-1133.
Chen Weifeng,? Shao Zhijiang. Direct Disjunction Transcription Based Conflict Resolution Approach[J]. Acta Aeronautica et Astronautica Sinica,? 2014,? 35(4): 1122-1133.(in Chinese)
[8] 付其喜,? 梁曉龍,? 張佳強(qiáng),? 等. 雙層優(yōu)化的多無人機(jī)合作式?jīng)_突探測(cè)與解脫[J]. 哈爾濱工業(yè)大學(xué)學(xué)報(bào),? 2020,? 52(4): 74-83.
Fu Qixi,? Liang Xiaolong,? Zhang Jiaqiang,? et al. Cooperative Conflict Detection and Resolution for Multiple UAVs Using Two-Layer Optimization[J]. Journal of Harbin Institute of Technology,? 2020,? 52(4): 74-83.(in Chinese)
[9] 王祝,? 劉莉,? 龍騰,? 等. 基于罰函數(shù)序列凸規(guī)劃的多無人機(jī)軌跡規(guī)劃[J]. 航空學(xué)報(bào),? 2016,? 37(10): 3149-3158.
Wang Zhu,? Liu Li,? Long Teng,? et al. Trajectory Planning for Multi-UAVs Using Penalty Sequential Convex Programming[J]. Acta Aeronautica et Astronautica Sinica,? 2016,? 37(10): 3149-3158.(in Chinese)
[10] Radmanesh M,? Kumar M,? Nemati A,? et al. Dynamic Optimal UAV Trajectory Planning in the National Airspace System via Mixed Integer Linear Programming[J]. Proceedings of the Institution of Mechanical Engineers,? Part G: Journal of Aerospace Engineering,? 2016,? 230(9): 1668-1682.
[11] Turnbull O,? Lawry J,? Lowenberg M,? et al. A Cloned Linguistic Decision Tree Controller for Real-Time Path Planning in Hostile Environments[J]. Fuzzy Sets and Systems,? 2016,? 293: 1-29.
[12] Sarim M,? Radmanesh M,? Dechering M,? et al. Distributed Detect-and-Avoid for Multiple Unmanned Aerial Vehicles in National Air Space[J]. Journal of Dynamic Systems,? Measurement,? and Control,? 2019,? 141(7): 071014.
[13] Alonso-Ayuso A,? Escudero L F,? Martín-Campo F J. A Mixed 0-1 Nonlinear Optimization Model and Algorithmic Approach for the Collision Avoidance in ATM[J]. Computers & Operations Research, 2012, 39(12): 3136-3146.
[14] 張啟錢,? 王中葉,? 張洪海, ?等. 基于SMILO-VTAC模型的復(fù)雜低空多機(jī)沖突解脫方法[J]. 交通運(yùn)輸工程學(xué)報(bào),? 2019,? 19(6): 125-136.
Zhang Qiqian,? Wang Zhongye,? Zhang Honghai,? et al. SMILO-VTAC Model Based Multi-Aircraft Conflict Resolution Method in Complex Low-Altitude Airspace[J]. Journal of Traffic and Transportation Engineering,? 2019,? 19(6): 125-136.(in Chinese)
[15] 采俊玲,? 張寧. 基于MINLP模型的飛機(jī)沖突解脫研究[J]. 重慶理工大學(xué)學(xué)報(bào):自然科學(xué),? 2020,? 34(2): 188-195.
Cai Junling,? Zhang Ning. Aircraft Conflict Resolution Study Based on Mixed Integer Nonlinear Programming Model[J]. Journal of Chongqing University of Technology: Natural Science,? 2020,? 34(2): 188-195.(in Chinese)
[16] Denton R V,? Jones J E. Demonstration of an Innovation Technique for Terrain Following/Terrain Avoidance—The Dynapath Algorithm[R]. IEEE NAECON Conference, 1985:522-529.
[17] Sunberg Z N,? Kochenderfer M J,? Pavone M. Optimized and Trusted Collision Avoidance for Unmanned Aerial Vehicles Using Approximate Dynamic Programming[C]∥IEEE International Conference on Robotics and Automation,? 2016: 1455-1461.
[18] Bousson K. Single Gridpoint Dynamic Programming for Trajectory Optimization[C]∥AIAA Atmospheric Flight Mechanics Conference and Exhibit,? 2005.
[19] 薛敏, 徐海成, 王碩. 基于粒子群優(yōu)化算法的無人艇路徑規(guī)劃[J]. 中國(guó)科技信息, 2018(24): 69-70.
Xue Min,? Xu Haicheng,? Wang Shuo. Path Planning of Unmanned Surface Vehicle Based on Particle Swarm Optimization Algorithm[J]. China Science and Technology Information,? 2018(24): 69-70. (in Chinese)
[20] Tang X L,? Li L M, ?Jiang B J. Mobile Robot SLAM Method Based on Multi-Agent Particle Swarm Optimized Particle Filter[J]. The Journal of China Universities of Posts and Telecommunications,? 2014,? 21(6): 78-86.
[21] Zhuang Y F,? Sharma S,? Subudhi B,? et al. Efficient Collision-Free Path Planning for Autonomous Underwater Vehicles in Dynamic Environments with a Hybrid Optimization Algorithm[J]. Ocean Engineering,? 2016,? 127: 190-199.
[22] Yan Z P,? Li J Y,? Zou J J,? et al. A Hybrid PSO-WG Algorithm for AUV Path Planning in Unknown Oceanic Environment[C]∥IEEE 8th International Conference on Underwater System Technology: Theory and Applications (USYS),? 2018: 1-6.
[23] Lim H S,? Fan S S,? Chin C K H,? et al. Constrained Path Planning of Autonomous Underwater Vehicle Using Selectively-Hybridized Particle Swarm Optimization Algorithms[J]. IFAC-PapersOnLine,? 2019,? 52(21): 315-322.
[24] 李平陽(yáng). 基于遺傳算法的無人機(jī)多目標(biāo)路徑規(guī)劃[J]. 農(nóng)業(yè)裝備與車輛工程,? 2019,? 57(1): 68-70.
Li Pingyang. Multiobjective Path Planning of Unmanned Aerial Vehicle Based on Genetic Algorithm[J]. Agricultural Equipment & Vehicle Engineering,? 2019,? 57(1): 68-70.(in Chinese)
[25] 余文曌,? 佘航宇,? 歐陽(yáng)子路. 基于彈性網(wǎng)格的改進(jìn)遺傳算法在無人艇路徑規(guī)劃中的研究[J]. 中國(guó)航海,? 2018,? 41(4): 101-105.
Yu Wenzhao,? She Hangyu,? Ouyang Zilu. Path Planning of Unmanned Surface Vehicle Based on Variable Mesh Improved Genetic Algorithm[J]. Navigation of China,? 2018,? 41(4): 101-105.(in Chinese)
[26] Yan S K,? Pan F. Research on Route Planning of AUV Based on Genetic Algorithms[C]∥IEEE International Conference on Unmanned Systems and Artificial Intelligence (ICUSAI),? 2019: 184-187.
[27] 何光勤, 朱一飛, 張才然. 基于遺傳算法的無人機(jī)三維航跡規(guī)劃研究[J].價(jià)值工程,? 2020, 39(7): 215-218.
He Guangqin,? Zhu Yifei,? Zhang Cairan. Research of 3D Flight Path Planning of UAV Based on Genetic Algorithm[J]. Value Engineering,? 2020,? 39(7): 215-218. (in Chinese)
[28] 張宏宏,? 甘旭升,? 李雙峰,? 等. 復(fù)雜低空環(huán)境下考慮區(qū)域風(fēng)險(xiǎn)評(píng)估的無人機(jī)航路規(guī)劃[J]. 儀器儀表學(xué)報(bào),? 2021,? 42(1): 257-266.
Zhang Honghong,? Gan Xusheng, ?Li Shuangfeng,? et al. UAV Route Planning Considering Regional Risk Assessment under Complex Low Altitude Environment[J]. Chinese Journal of Scientific Instrument,? 2021,? 42(1): 257-266. (in Chinese)
[29] Wu X X,? Wei G L,? Song Y,? et al. Improved ACO-Based Path Planning with Rollback and Death Strategies[J]. Systems Science & Control Engineering,? 2018,? 6(1): 102-107.
[30] Jiao Z Q,? Ma K,? Rong Y L,? et al. A Path Planning Method Using Adaptive Polymorphic Ant Colony Algorithm for Smart Wheelchairs[J]. Journal of Computational Science,? 2018,? 25: 50-57.
[31] Luo Q,? Wang H B,? Zheng Y,? et al. Research on Path Planning of Mobile Robot Based on Improved Ant Colony Algorithm[J]. Neural Computing and Applications,? 2020,? 32(6): 1555-1566.
[32] Kang F,? Li J J,? Ma Z Y. Rosenbrock Artificial Bee Colony Algorithm for Accurate Global Optimization of Numerical Functions[J]. Information Sciences,? 2011,? 181(16): 3508-3531.
[33] 王淵,? 孫秀霞,? 劉樹光,? 等. 基于改進(jìn)人工蜂群算法的多機(jī)飛行沖突解脫策略[J]. 空軍工程大學(xué)學(xué)報(bào):自然科學(xué)版,? 2014,? 15(3): 10-14.
Wang Yuan,? Sun Xiuxia,? Liu Shuguang,? et al. Research on Multi-Aircraft Confliction Resolution Based on a Modified Artificial Bee Colony Algorithm[J]. Journal of Air Force Engineering University: Natural Science Edition,? 2014,? 15(3): 10-14. (in Chinese)
[34] Contreras-Cruz M A,? Ayala-Ramirez V,? Hernandez-Belmonte U H. Mobile Robot Path Planning Using Artificial Bee Colony and Evolutionary Programming[J]. Applied Soft Computing,? 2015,? 30: 319-328.
[35] Li B,? Gong L G,? Yang W L. An Improved Artificial Bee Colony Algorithm Based on Balance-Evolution Strategy for Unmanned Combat Aerial Vehicle Path Planning[J]. The Scientific World Journal,? 2014,? 2014: 1-10.
[36] Xie C,? Zheng H Q. Application of Improved Cuckoo Search Algorithm to Path Planning Unmanned Aerial Vehicle[C] ∥Intelligent Computing Theories and Application,? 2016: 722-729.
[37] Wu J F,? Wang H L,? Li N,? et al. Path Planning for Solar-Powered UAV in Urban Environment[J]. Neurocomputing,? 2018,? 275: 2055-2065.
[38] Yao P,? Wang H L. Dynamic Adaptive Ant Lion Optimizer Applied to Route Planning for Unmanned Aerial Vehicle[J]. Soft Computing,? 2017,? 21(18): 5475-5488.
[39] Zhang B,? Duan H B. Three-Dimensional Path Planning for Uninhabited Combat Aerial Vehicle Based on Predator-Prey Pigeon-Inspired Optimization in Dynamic Environment[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics,? 2017,? 14(1): 97-107.
[40] 李鳳玲, 陳珊, 范興江, 等. 基于螢火蟲算法動(dòng)態(tài)未知環(huán)境的路徑規(guī)劃[J]. 自動(dòng)化與儀表,? 2019,? 34(6): 53-58.
Li Fengling,? Chen Shan,? Fan Xingjiang,? et al. Path Planning Based on Firefly Algorithm in Dynamic Unknown Environment[J].Automation & Instrumentation,? 2019,? 34(6): 53-58.
[41] 錢洲元,? 雷明. 面向無人機(jī)航跡規(guī)劃的自適應(yīng)烏賊算法[J]. 哈爾濱工業(yè)大學(xué)學(xué)報(bào),? 2019,? 51(10): 37-46.
Qian Zhouyuan,? Lei Ming. Adaptive Cuttlefish Algorithm for UAV Path Planning[J]. Journal of Harbin Institute of Technology,? 2019,? 51(10): 37-46.(in Chinese)
[42] 馬云紅,? 張恒,? 齊樂融,? 等. 基于改進(jìn)A*算法的三維無人機(jī)路徑規(guī)劃[J]. 電光與控制,? 2019,? 26(10): 22-25.
Ma Yunhong,? Zhang Heng,? Qi Lerong,? et al. A 3D UAV Path Planning Method Based on Improved A* Algorithm[J]. Electronics Optics & Control,? 2019,? 26(10): 22-25.(in Chinese)
[43] 祁玄玄,? 黃家駿,? 曹建安. 基于改進(jìn)A*算法的無人車路徑規(guī)劃[J]. 計(jì)算機(jī)應(yīng)用,? 2020,? 40(7): 2021-2027.
Qi Xuanxuan,? Huang Jiajun,? Cao Jianan. Path Planning for Unmanned Vehicle Based on Improved A* Algorithm[J]. Journal of Computer Applications,? 2020,? 40(7): 2021-2027.(in Chinese)
[44] 宋雪倩,? 胡士強(qiáng). 基于Dubins路徑的A*算法的多無人機(jī)路徑規(guī)劃[J]. 電光與控制,? 2018,? 25(11): 25-29.
Song Xueqian,? Hu Shiqiang. Dual-UAV Path Planning by Dubins-Path Based A* Algorithm[J]. Electronics Optics & Control,? 2018,? 25(11): 25-29.(in Chinese)
[45] Ganapathy V,? Yun S,? Chien T. Enhanced D* Lite Algorithm for Autonomous Mobile Robot [J]. International Journal of Applied Sciense and Technology,? 2011,? 1(1): 58-73.
[46] Stentz A. Optimal and Efficient Path Planning for Partially-Known Environments[C]∥IEEE International Conference on Robotics and Automation,? 1994: 3310-3317.
[47] 朱龍彪,? 王輝,? 王景良,? 等. 基于動(dòng)態(tài)時(shí)間窗的泊車系統(tǒng)路徑規(guī)劃研究[J]. 工程設(shè)計(jì)學(xué)報(bào),? 2017,? 24(4): 440-448.
Zhu Longbiao,? Wang Hui,? Wang Jingliang,? et al. Research on Path Planning of Parking System Based on Dynamic Time Window[J]. Chinese Journal of Engineering Design,? 2017,? 24(4): 440-448.(in Chinese)
[48] Maini P,? Sujit P B. Path Planning for a UAV with Kinematic Constraints in the Presence of Polygonal Obstacles[C]∥IEEE International Conference on Unmanned Aircraft Systems,? 2016: 62-67.
[49] Bhattacharya P,? Gavrilova M L. Roadmap-Based Path Planning-Using the Voronoi Diagram for a Clearance-Based Shortest Path[J]. IEEE Robotics & Automation Magazine,? 2008,? 15(2): 58-66.
[50] Han T,? Wu W C,? Huang C Q,? et al. Path Planning of UAV Based on Voronoi Diagram and DPSO[J]. Procedia Engineering,? 2012,? 29: 4198-4203.
[51] 李寰宇,? 陳延龍,? 張振興,? 等. 基于Dubins的無人機(jī)自動(dòng)避撞路徑規(guī)劃[J]. 飛行力學(xué),? 2020,? 38(5): 44-49.
Li Huanyu,? Chen Yanlong,? Zhang Zhenxing,? et al. UAV Collision Avoidance Path Planning Based on Dubins Method[J]. Flight Dynamics,? 2020,? 38(5): 44-49.(in Chinese)
[52] Zhu M N,? Zhang X H,? Luo H,? et al. Optimization Dubins Path of Multiple UAVs for Post-Earthquake Rapid-Assessment[J]. Applied Sciences,? 2020,? 10(4): 1388.
[53] Yan P,? Yan Z,? Zheng H X,? et al. A Fixed Wing UAV Path Planning Algorithm Based on Genetic Algorithm and Dubins Curve Theory[J]. MATEC Web of Conferences,? 2018,? 179: 03003.
[54] 曾國(guó)奇,? 趙民強(qiáng),? 劉方圓,? 等. 基于網(wǎng)格PRM的無人機(jī)多約束航路規(guī)劃[J]. 系統(tǒng)工程與電子技術(shù),? 2016,? 38(10): 2310-2316.
Zeng Guoqi,? Zhao Minqiang,? Liu Fangyuan,? et al. Multi-Constraints UAV Path Planning Based on Grid PRM[J]. Systems Engineering and Electronics,? 2016,? 38(10): 2310-2316.(in Chinese)
[55] Upadhyay A,? Shrimali K R,? Shukla A. UAV-Robot Relationship for Coordination of Robots on a Collision Free Path[J]. Procedia Computer Science,? 2018,? 133: 424-431.
[56] 管祥民,? 呂人力. 基于混合人工勢(shì)場(chǎng)與蟻群算法的多飛行器沖突解脫方法[J]. 武漢理工大學(xué)學(xué)報(bào): 交通科學(xué)與工程版,? 2020,? 44(1): 28-33.
Guan Xiangmin,? Lü Renli. Conflict Resolution Method for Multiple Aircraft Based on Hybrid Artificial Potential Field and Ant Colony Algorithm[J]. Journal of Wuhan University of Technology : Transportation Science & Engineering,? 2020, ?44(1): 28-33.(in Chinese)
[57] Yang X,? Yang W,? Zhang H J,? et al. A New Method for Robot Path Planning Based Artificial Potential Field[C]∥IEEE 11th Conference on Industrial Electronics and Applications (ICIEA),? 2016: 1294-1299.
[58] 韓知玖,? 吳文江,? 李孝偉,? 等. 一種改進(jìn)的動(dòng)力學(xué)約束人工勢(shì)場(chǎng)法[J]. 上海大學(xué)學(xué)報(bào): 自然科學(xué)版,? 2019,? 25(6): 879-887.
Han Zhijiu,? Wu Wenjiang,? Li Xiaowei,? et al. An Improved Artificial Potential Field Method Constrained by a Dynamic Model[J]. Journal of Shanghai University: Natural Science Edition,? 2019,? 25(6): 879-887.(in Chinese)
[59] 張宏宏,? 甘旭升,? 李昂,? 等. 基于速度障礙法的無人機(jī)避障與航跡恢復(fù)策略[J]. 系統(tǒng)工程與電子技術(shù),? 2020,? 42(8): 1759-1767.
Zhang Honghong,? Gan Xusheng,? Li Ang,? et al. UAV Obstacle Avoidance and Track Recovery Strategy Based on Velocity Obstacle Method[J]. Systems Engineering and Electronics,? 2020,? 42(8): 1759-1767.(in Chinese)
[60] Durand N. Constant Speed Optimal Reciprocal Collision Avoi-dance[J]. Transportation Research Part C: Emerging Technologies, ?2018,? 96: 366-379.
[61] Bareiss D,? van den Berg J. Generalized Reciprocal Collision Avoidance[J]. The International Journal of Robotics Research,? 2015,? 34(12): 1501-1514.
[62] 楊秀霞,? 張毅,? 周硙硙,? 等. 基于空間障礙球冠的UAV保角映射避碰決策[J]. 華中科技大學(xué)學(xué)報(bào): 自然科學(xué)版,? 2019,? 47(2): 127-132.
Yang Xiuxia,? Zhang Yi,? Zhou Weiwei,? et al. Spatial Optimal Collision Avoidance Decision for UAV Based on Spatial Obstacle Spherical Cap[J]. Journal of Huazhong University of Science and Technology: Natural Science Edition,? 2019,? 47(2): 127-132.(in Chinese)
[63] 梁宵,? 王宏倫,? 李大偉,? 等. 基于流水避石原理的無人機(jī)三維航路規(guī)劃方法[J]. 航空學(xué)報(bào),? 2013,? 34(7): 1670-1681.
Liang Xiao,? Wang Honglun,? Li Dawei,? et al. Three-Dimensional Path Planning for Unmanned Aerial Vehicles Based on Principles of Stream Avoiding Obstacles[J]. Acta Aeronautica et Astronautica Sinica,? 2013,? 34(7): 1670-1681.(in Chinese)
[64] Daily R,? Bevly D M. Harmonic Potential Field Path Planning for High Speed Vehicles[C]∥IEEE American Control Conference,? 2008: 4609-4614.
[65] 王宏倫,? 姚鵬,? 梁宵,? 等. 基于流水避石原理的無人機(jī)三維航路規(guī)劃[J]. 電光與控制,? 2015,? 22(10): 1-6.
Wang Honglun,? Yao Peng,? Liang Xiao,? et al. Three-Dimensional Path Planning for UAVs Based on Theory of Fluid Avoiding Obstacles[J]. Electronics Optics & Control,? 2015,? 22(10): 1-6.(in Chinese)
[66] Floreano D,? Mondada F. Evolutionary Neurocontrollers for Auto-nomous Mobile Robots[J]. Neural Networks,? 1998,? 11(7/8): 1461-1478.
[67] 方旭,? 劉金琨. 四旋翼無人機(jī)三維航跡規(guī)劃及跟蹤控制[J]. 控制理論與應(yīng)用,? 2015,? 32(8): 1120-1128.
Fang Xu,? Liu Jinkun. Three-Dimension Path Planning and Trajectory Tracking Control for Quadrotor Unmanned Aerial Vehicle[J]. Control Theory & Applications,? 2015,? 32(8): 1120-1128.(in Chinese)
[68] 王延祥,? 王宏倫,? 吳健發(fā),? 等. 基于流體擾動(dòng)算法與深度神經(jīng)網(wǎng)絡(luò)的無人機(jī)自適應(yīng)路徑規(guī)劃[J]. 無人系統(tǒng)技術(shù),? 2020,? 3(6): 50-58.
Wang Yanxiang,? Wang Honglun,? Wu Jianfa,? et al. Adaptive Path Planning for UAV Based on Interfered Fluid Algorithm and Deep Neural Network[J]. Unmanned Systems Technology,? 2020,? 3(6): 50-58.(in Chinese)
[69] Zhang Y Y,? Li S,? Guo H L. A Type of Biased Consensus-Based Distributed Neural Network for Path Planning[J]. Nonlinear Dynamics,? 2017,? 89(3): 1803-1815.
[70] Choi Y J,Jimenez H,Mavris D N. Two-Layer Obstacle Collision Avoidance with Machine Learning for More Energy-Efficient Unmanned Aircraft Trajectories[J]. Robotics and Autonomous Systems,2017,98:158-173.
[71] 邴麗媛,? 劉智,? 蔣余成. 基于模糊神經(jīng)網(wǎng)絡(luò)的電力巡線無人機(jī)避障技術(shù)研究[J]. 長(zhǎng)春理工大學(xué)學(xué)報(bào): 自然科學(xué)版,? 2017,? 40(3): 98-102.
Bing Liyuan,? Liu Zhi,? Jiang Yucheng. Research on Obstacle Avoidance Technology of Unmanned Aerial Vehicle in Power Line Inspection[J]. Journal of Changchun University of Science and Technology: Natural Science Edition,? 2017,? 40(3): 98-102.(in Chinese)
[72] Chang Y,? Wang Y Q,? Alsaadi F E,? et al. Adaptive Fuzzy Output-Feedback Tracking Control for Switched Stochastic Pure-Feedback Nonlinear Systems[J]. International Journal of Adaptive Control and Signal Processing,? 2019,? 33(10): 1567-1582.
[73] Michels J,? Saxena A,? Ng A Y. High Speed Obstacle Avoidance Using Monocular Vision and Reinforcement Learning[C]∥The 22nd International Conference on Machine Learning,? 2005: 593-600.
[74] Xie L H,? Wang S,? Markham A,? et al. Towards Monocular Vision Based Obstacle Avoidance through Deep Reinforcement Learning[EB/OL]. (2017-06-29)[2021-01-10]. https:∥www. researchgate.net/publication/318029385_Towards_Monocular_Vision_based_Obstacle_Avoidance_through_Deep_Reinforcement_Learning, 2017.
[75] Vamvoudakis K G,? Vrabie D,? Lewis F L. Online Adaptive Algorithm for Optimal Control with Integral Reinforcement Learning[J]. International Journal of Robust and Nonlinear Control,? 2014,? 24(17): 2686-2710.
[76] 鄒啟杰,? 劉世慧,? 張躍,? 等. 基于強(qiáng)化學(xué)習(xí)的快速探索隨機(jī)樹特殊環(huán)境中路徑重規(guī)劃算法[J]. 控制理論與應(yīng)用,? 2020,? 37(8): 1737-1748.
Zou Qijie,? Liu Shihui,? Zhang Yue,? et al. Rapidly-Exploring Random Tree Algorithm for Path Re-Planning Based on Reinforcement Learning under the Peculiar Environment[J]. Control Theory & Applications,? 2020,? 37(8): 1737-1748.(in Chinese)
[77] Kulkarni T D. Narasimhan K R,? Saeedi A,? et al. Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation[C]∥ 30th International Conference on Neural Information Processing Systems,? 2016: 3675-3683.
[78] Yang S L,? Xu Z G,? Wang J Y. Intelligent Decision-Making of Scheduling for Dynamic Permutation Flowshop via Deep Reinforcement Learning[J]. Sensors,? 2021,? 21(3): 1019.
[79] Mnih V,? Kavukcuoglu K,? Silver D,? et al. Human-Level Control through Deep Reinforcement Learning[J]. Nature,? 2015,? 518(7540): 529-533.
[80] Lü L,? Zhang S J,? Ding D R,? et al. Path Planning via an Improved DQN-Based Learning Policy[J]. IEEE Access,? 2019,? 7: 67319-67330.
[81] 劉慶杰,? 林友勇,? 李少利. 面向智能避障場(chǎng)景的深度強(qiáng)化學(xué)習(xí)研究[J]. 智能物聯(lián)技術(shù),? 2018,? 1(2): 18-22.
Liu Qingjie,? Lin Youyong,? Li Shaoli. Research on Deep Reinforcement Learning for Intelligent Obstacle Avoidance Scenarios[J]. Technology of IoT & AI,? 2018,? 1(2): 18-22.(in Chinese)
[82] Schulman J,? Levine S,? Moritz P,? et al. Trust Region Policy Optimization[EB/OL]. (2015-02-01)[2021-01-10]. https:∥www. researchgate.net/publication/272521272_Trust_Region_Policy_ Optimization,? 2015.
[83] Fan L Q,? Zhang J,? He Y,? et al. Optimal Scheduling of Microgrid Based on Deep Deterministic Policy Gradient and Transfer Learning[J]. Energies,? 2021,? 14(3): 584.
[84] Du J Y,? Fu J,? Li C. Guided Policy Search Methods: A Review[J]. Journal of Physics: Conference Series,? 2021,? 1748: 022039.
[85] Levine S,? Finn C,? Darrell T,? et al. End-to-End Training of Deep Visuomotor Policies[EB/OL]. (2015-04-01)[2021-01-10]. https:∥www.researchgate.net/publication/274572264_End-to-End_Training_of_Deep_Visuomotor_Policies, 2015.
[86] Heess N,? TB D,? Sriram S,? et al. Emergence of Locomotion Behaviours in Rich Environments[EB/OL]. (2017-07-01) [2021-01-10]. https:∥www.researchgate.net/ publication/ 318316001_ Emergence_of_Locomotion_ Behaviours_in_Rich_ Environments,? 2017.
Review of UAV Obstacle Avoidance Algorithms
Zhang Honghong1, 2, Gan Xusheng1, 2*, Mao Yi1, Yang Chunlin1, Xie Xiaowei3
(1. Air Traffic Control and Navigation College,? Air Force Engineering University,? Xian 710051,? China;
2. National Key Laboratory of Air Traffic Collision Prevention,? Xian 710051, China;
3. Equipment Management and UAV Engineering College,? Air Force Engineering University,? Xian 710051,? China)
Abstract: Along with the advancement of ?low-altitude airspace reform,? it has become a developing trend that UAV leaves the isolation airspace and gets into the fusion low-altitude airspace to perform diverse missions. A serious threat is brought to UAV in the low dynamic complex fusion airspace,? so the obstacle avoidance technology has become a key process in UAV mission decision-making system,? to ensure the safe operation of the UAV and to improve working efficiency. Firstly,? the relevant concepts,? path evaluation indexes and key technologies of UAV obstacle avoidance are described. Then, the concepts? of? obstacle avoidance algorithms based on optimization,? potential field and machine learning are? described,? and the advantages and disadvantages of these algorithms are compared. Finally,? the current challenges that restrict the development of UAV obstacle avoidance and the future research directions are proposed.
Key words: UAV; obstacle avoidance; optimization; potential field; machine learning; artificial intelligence; autonomous control