隨著技術(shù)的快速發(fā)展,無人機應用場景已從傳統(tǒng)的軍事偵察擴展到貨物運送、農(nóng)林監(jiān)測、環(huán)境保護、應急救援、測繪、消防滅火等領(lǐng)域。無人機具有成本低、使用靈活、適應性強等特點,能在復雜環(huán)境中完成多樣化任務(wù)。然而,無人機飛行環(huán)境具有高度不確定性,包含多種移動障礙物,這些障礙物的運動形式多種多樣且難以預測。這對無人機自主飛行能力提出了更高要求。因此,無人機如何實現(xiàn)安全、高效的自主飛行是當前研究領(lǐng)域亟須解決的難題。
實現(xiàn)復雜環(huán)境下無人機自主飛行的關(guān)鍵技術(shù)主要包括路徑規(guī)劃和飛行控制技術(shù)。路徑規(guī)劃負責為無人機生成從起點到目標點的安全、可行路徑,是無人機執(zhí)行任務(wù)的前提條件。飛行控制則負責實時調(diào)整無人機飛行姿態(tài)、飛行速度和飛行高度等變量,確保無人機按已規(guī)劃的路徑飛行。無人機完成路徑規(guī)劃后,利用控制算法實時調(diào)整飛行參數(shù),以保持穩(wěn)定的飛行。
在無人機執(zhí)行任務(wù)時,算法必須綜合考慮全局路徑優(yōu)化和局部路徑實時規(guī)劃,以確保所規(guī)劃的路徑安全可行。這種路徑規(guī)劃策略能讓無人機在復雜環(huán)境中順利完成任務(wù)。例如,在貨物運送場景中,無人機在高樓間穿梭,應避開各種障礙物,將貨物運送到目標點;在森林巡邏任務(wù)中,無人機需要應對不同高度密集樹木的干擾,同時快速調(diào)整路徑,規(guī)避樹木、移動物體、突發(fā)風險。
無人機路徑規(guī)劃技術(shù)
根據(jù)無人機起始位置、目標位置及周圍環(huán)境信息,算法生成一條安全可行的飛行路徑是無人機實現(xiàn)自主飛行的核心環(huán)節(jié)。根據(jù)任務(wù)需求、環(huán)境特征及算法設(shè)計,路徑規(guī)劃分為全局路徑規(guī)劃和局部路徑規(guī)劃兩類。全局路徑規(guī)劃以全環(huán)境信息為基礎(chǔ),適合在任務(wù)開始時規(guī)劃路徑,以保證全局路徑的最優(yōu)性和規(guī)劃的穩(wěn)定性,而局部路徑規(guī)劃則注重實時性和靈活性,能夠?qū)崟r應對環(huán)境變化。
全局路徑規(guī)劃方法
1.A*算法與改進A*算法
基于搜索的路徑規(guī)劃方法在全局路徑規(guī)劃領(lǐng)域占有重要地位。A*(Astar)算法因出色的性能被廣泛應用于無人機路徑規(guī)劃任務(wù)。它是一種基于啟發(fā)式搜索的圖搜索算法,結(jié)合了廣度優(yōu)先搜索的完備性和貪心算法的高效性,可在一個網(wǎng)格環(huán)境中尋找從起點到目標點的最短路徑,通過評估每個節(jié)點的代價函數(shù)來決定搜索順序,最終找到全局路徑的最優(yōu)解。A*算法適用于靜態(tài)環(huán)境中的全局路徑規(guī)劃,特別適用于城市低空飛行、室內(nèi)飛行等環(huán)境已知且變化較小的場景。在靜態(tài)環(huán)境中,A*算法能夠找到最短路徑。然而,其計算復雜度隨搜索空間的增大而增高。它在高維、動態(tài)環(huán)境中的應用受到一定限制,特別是需要頻繁計算路徑的實時任務(wù)場景,其計算效率較低。
為了提高計算效率,一些研究者提出了改進A*算法,在高維、動態(tài)環(huán)境中,改進A*算法通過增量式更新的方式,僅重新計算變化的路徑點信息,從而減小了重新搜索的負擔。該算法利用先前計算的路徑信息,優(yōu)化路徑搜索過程,減少了重復計算,提高了高維、動態(tài)環(huán)境下的應用效率。
2.RRT算法與改進RRT算法
與A*算法不同的是,基于采樣的路徑規(guī)劃方法不依賴于預定義的離散網(wǎng)格地圖。它在連續(xù)空間中隨機采樣來生成路徑,突破了傳統(tǒng)網(wǎng)格地圖的限制,適用于高維、動態(tài)環(huán)境下的路徑規(guī)劃任務(wù),尤其是動態(tài)環(huán)境下的避障任務(wù)。
快速探索隨機樹(RRT)算法是基于采樣的路徑規(guī)劃方法的代表之一,具有較高的計算效率。通過逐步擴展樹結(jié)構(gòu),RRT算法在搜索空間中隨機采集一個節(jié)點,并嘗試將該節(jié)點連結(jié)到樹上,通過不斷重復這種采樣過程,能構(gòu)建一條從起始點到目標點的可行路徑。RRT算法能在高維、動態(tài)環(huán)境中快速生成可行路徑。
在圖2中,綠色線條為RRT算法規(guī)劃的路徑;藍色線段和紅色節(jié)點組成了隨機樹結(jié)構(gòu)。然而,RRT算法生成的路徑通常不光滑,也不一定是全局最優(yōu)解,可能不適合無人機實際飛行。
為了解決上述問題,一些研究者提出了改進RRT算法。在RRT算法的基礎(chǔ)上,改進RRT算法增加了路徑優(yōu)化機制,適用于對路徑質(zhì)量要求較高且計算資源充足的任務(wù)。在擴展樹結(jié)構(gòu)的過程中,它不斷優(yōu)化已有路徑,并嘗試更新樹中的連結(jié),以使路徑逐步接近全局最優(yōu)解。通過這種迭代優(yōu)化,改進RRT算法最終生成一條既能滿足可行性要求,而且更加光滑、接近最優(yōu)解的路徑。但是,改進RRT算法的計算時間通常較長,尤其是高維、動態(tài)環(huán)境下的路徑優(yōu)化需要大量計算,在實際應用中,該算法往往需要在特定場景下進行路徑調(diào)優(yōu),以平衡路徑質(zhì)量和計算效率。
局部路徑規(guī)劃方法
1.動態(tài)窗口算法
動態(tài)窗口(DWA)算法是一種經(jīng)典局部路徑規(guī)劃方法,已在無人機飛行任務(wù)中廣泛應用。基于無人機位置、飛行速度和飛行方向等當前參數(shù),DWA算法在動態(tài)環(huán)境約束下生成一個會實時更新的速度空間,并從該速度空間中選取最優(yōu)速度組合來規(guī)劃局部路徑,通過評估多條可能的飛行路徑,結(jié)合啟發(fā)評估函數(shù)來選擇最優(yōu)路徑,從而確保無人機實現(xiàn)避障和目標跟蹤。由于DWA算法具有較低的計算復雜度,因此能夠在高維環(huán)境中快速生成路徑,適合實時性要求較高的路徑規(guī)劃任務(wù)。
DWA算法主要有二方面優(yōu)點。一是它在速度空間中搜索速度向量,以解決路徑規(guī)劃問題,避免了環(huán)境全局建模,最終在動態(tài)環(huán)境中迅速生成有效的局部路徑;二是能夠很好地結(jié)合無人機最大加速度、最大飛行速度等動力學約束,生成適合無人機飛行的軌跡。然而,DWA算法也存在一些局限性。首先,DWA算法在局部環(huán)境中進行路徑規(guī)劃,可能無法找到全局最優(yōu)路徑,尤其是包含障礙物的復雜環(huán)境下的路徑規(guī)劃;其次,DWA算法過度依賴啟發(fā)評估函數(shù),如果權(quán)重選擇不當,可能會導致DWA算法規(guī)劃的路徑無法滿足任務(wù)要求。為了應對這些問題,研究者們提出了一些改進方法,例如,在傳統(tǒng)DWA算法中引入預測模型,以提高避障能力和增強DWA算法的全局規(guī)劃能力。
2.時間彈性帶點算法
通過同時優(yōu)化路徑上各個離散路徑點的時間分布和空間位置,時間彈性帶點(TEB)算法能生成一條滿足無人機飛行約束和環(huán)境約束的平滑路徑,從而實現(xiàn)高效避障,特別適合處理高維、動態(tài)環(huán)境中的局部路徑規(guī)劃任務(wù)。眾所周知,DWA算法生成的路徑質(zhì)量通常不如TEB算法。TEB算法的優(yōu)勢主要體現(xiàn)在路徑質(zhì)量上,該算法采用優(yōu)化策略生成的局部路徑不僅平滑而且可行。然而,TEB算法依賴于非線性優(yōu)化方法,其計算復雜度較高,在高維、動態(tài)環(huán)境下應用時,可能面臨計算效率低的問題,無法滿足實時性要求。此外,TEB算法對初始路徑的依賴性較強,如果初始路徑質(zhì)量較差,可能會影響優(yōu)化結(jié)果。
在復雜環(huán)境中,TEB算法規(guī)劃路徑的計算能力需要顯著提升,實時規(guī)劃能力面臨著挑戰(zhàn)。于是,研究者提出了多種改進方法。一是引入多層優(yōu)化策略,以降低計算復雜度;二是結(jié)合強化學習方法,對初始路徑進行優(yōu)化,從而提高TEB算法在動態(tài)環(huán)境中的適應性;三是結(jié)合并行計算的TEB算法,引入多線程或GPU加速技術(shù),顯著提升了計算效率,使TEB算法在高維、動態(tài)環(huán)境中能夠滿足實時性要求。
無人機飛行控制技術(shù)
在高維、動態(tài)場景等復雜環(huán)境中,無人機飛行控制系統(tǒng)不僅要保證飛行精確性,還要應對環(huán)境中的風速變化、障礙物運動等因素。無人機需要根據(jù)傳感器數(shù)據(jù)調(diào)整飛行參數(shù),從而保證穩(wěn)定的飛行。在飛行過程中,無人機必須具備較強的環(huán)境適應性以應對障礙物、飛行軌跡改變等突發(fā)事件。因此,無人機飛控系統(tǒng)通常采用PID控制、狀態(tài)空間控制等多種方法實現(xiàn)避障、穩(wěn)定飛行等目標。隨著計算能力的提升和控制算法的發(fā)展,基于模型預測控制(MPC)的方法逐漸成為無人機控制領(lǐng)域的研究熱點。通過實時優(yōu)化控制參數(shù),MPC方法能解決動態(tài)環(huán)境中的復雜約束問題,適用于變化較大的復雜環(huán)境下的飛行控制。
經(jīng)典控制方法
1.PID控制算法
PID控制算法是最經(jīng)典且應用廣泛的控制方法之一。其基本內(nèi)涵是,算法計算目標值與當前狀態(tài)變量之間的誤差,并根據(jù)誤差的比例、積分和微分來調(diào)節(jié)控制輸出,從而使系統(tǒng)誤差趨于零。PID控制器結(jié)構(gòu)簡單,其比例項、積分項和微分項分別對應誤差大小響應、歷史誤差累積和誤差變化率預測。因此,PID控制器具有良好的魯棒性和響應速度。然而,PID控制算法也有一定的局限性,尤其在控制大范圍動態(tài)場景等復雜環(huán)境下的無人機飛行時,可能無法提供最優(yōu)控制效果。例如,當大范圍擾動或者動態(tài)約束出現(xiàn)時,PID控制器可能存在較大的超調(diào)量,從而影響無人機穩(wěn)定飛行。
2.狀態(tài)空間控制算法
由于無人機是多輸入多輸出系統(tǒng),通常,狀態(tài)空間模型對無人機飛行姿態(tài)和位置進行控制。狀態(tài)空間模型包括無人機飛行速度、位置、加速度、姿態(tài)角等多個狀態(tài)變量。在狀態(tài)空間變量中構(gòu)造一個代價函數(shù),狀態(tài)空間控制算法能夠計算狀態(tài)變量與控制量組成的代價函數(shù)值,從而得到無人機控制策略。在實際應用中,狀態(tài)空間控制算法可以確保無人機在擾動環(huán)境下保持穩(wěn)定的姿態(tài)。
PID控制算法和狀態(tài)空間控制算法已廣泛應用于無人機飛行控制。雖然這兩種算法在一定程度上能夠滿足飛行要求,但在控制動態(tài)場景等復雜環(huán)境下的飛行時,仍然存在一定的局限性。令人欣慰的是,隨著技術(shù)的發(fā)展,越來越多的優(yōu)化控制方法被提出并應用于無人機飛行控制,提升了無人機在動態(tài)場景等復雜環(huán)境下的適應性。
優(yōu)化控制方法
1.模型預測控制算法
模型預測控制(MPC)算法是一種基于系統(tǒng)模型的最優(yōu)控制方法。在每個控制周期內(nèi),基于當前狀態(tài)變量和預測模型,MPC算法對目標函數(shù)進行求解,從而得到未來一段時間的最優(yōu)控制輸入?yún)?shù)。在每個時間步長內(nèi),根據(jù)系統(tǒng)當前狀態(tài)變量,該算法對控制輸入?yún)?shù)進行優(yōu)化,并處理復雜的約束條件,從而適應環(huán)境動態(tài)變化。與經(jīng)典PID控制算法相比,MPC算法能處理非線性系統(tǒng)問題,在控制無人機飛行的過程中考慮飛行速度限制、航向角度約束、環(huán)境約束等多種約束條件。MPC算法的一個顯著優(yōu)勢是,它基于實時數(shù)據(jù)對控制輸入?yún)?shù)進行優(yōu)化,快速響應環(huán)境變化。在控制無人機飛行的過程中,MPC算法能夠根據(jù)無人機當前狀態(tài)變量、目標狀態(tài)變量及環(huán)境信息,生成最優(yōu)控制策略,實時調(diào)整控制控制輸入?yún)?shù),確保無人機沿著算法規(guī)劃的軌跡或預設(shè)軌跡飛行,避免與障礙物碰撞。
基于強化學習的優(yōu)化控制策略
強化學習是一種基于獎勵機制的機器學習方法。無人機感知環(huán)境信息,并利用機器學習架構(gòu),在虛擬環(huán)境中進行大量訓練和模擬,不斷與環(huán)境互動,逐步學習在不同環(huán)境下如何成功規(guī)避障礙物,最終獲得最優(yōu)控制策略。在復雜環(huán)境中,無人機采用經(jīng)典控制方法控制飛行,可能難以應對所有不確定因素,而利用強化學習方法,具有較強的自主飛行能力和環(huán)境適應能力。
路徑規(guī)劃與飛行控制策略組合運用
雖然經(jīng)典控制方法在簡單環(huán)境中具有較好的性能,但在動態(tài)場景等復雜環(huán)境中可能無法滿足高精度和強適應性的需求。MPC控制方法及基于強化學習的優(yōu)化控制策略能提供更為靈活和高效的解決方案,特別是在動態(tài)場景等復雜環(huán)境下,能有效提升無人機的自主性和魯棒性。優(yōu)化控制方法在每次迭代中都增加了碰撞是否發(fā)生的流程。如果碰撞沒有發(fā)生,則繼續(xù)控制無人機沿著軌跡飛行;如果碰撞發(fā)生,則針對這個碰撞,增加一個新的推力對控制輸入?yún)?shù)進行優(yōu)化。
在圖7中,路徑點分布在一條有障礙物的黑色路徑上,無人機在這條黑色路徑上飛行,會與障礙物發(fā)生碰撞。因此,無人機利用A*算法進行路徑搜索,得到一條藍色可行路徑,然后計算位于障礙物區(qū)域內(nèi)起始路徑點M的無人機的飛行速度方向,以這個速度方向為法向量,找到一個垂直于這個速度方向且過路徑點P的平面,再取向量v作為M點到P點的單位向量。在軌跡優(yōu)化過程中,無人機利用A*算法規(guī)劃的路徑結(jié)果,并結(jié)合B樣條曲線方法調(diào)整軌跡。B樣條曲線方法將路徑點M沿著向量v推到紅色路徑點Q的位置上,且路徑點Q不在障礙物區(qū)域內(nèi),按照這個方法,再將障礙區(qū)域內(nèi)黑色路徑上的其他路徑點向?qū)乃{色可行路徑點方向推,最終,為無人機規(guī)劃了一條紅色的可行路徑。
優(yōu)化控制算法可構(gòu)建由平滑項、碰撞項和動力學等構(gòu)成的目標函數(shù),進而對紅色可行路徑上的控制點飛行速度和加速度進行優(yōu)化求解,并采用相同的時間間隔,對最大飛行速度和最大加速度進行限制,以達到一個平滑效果。優(yōu)化控制算法檢查控制點速度及加速度值,如果控制點之間的時間分配不合理,會導致無人機位置、飛行速度和加速度的高階導數(shù)發(fā)生變化,控制點的速度和加速度值會突變,無人機沿軌跡飛行時會發(fā)生抖動。因此,優(yōu)化控制算法對目標函數(shù)進行求解,能得到無人機需要的控制參數(shù)。圖8為軌跡優(yōu)化與飛行控制策略組合運用示意圖。
在無人機軌跡優(yōu)化與飛行控制過程中,若規(guī)劃路徑上的控制點與障礙物發(fā)生碰撞,算法會生成新的權(quán)重項,并將權(quán)重項加入優(yōu)化目標函數(shù)中,然后依據(jù)更新后的目標函數(shù)重新優(yōu)化軌跡,不斷迭代,直至目標函數(shù)值收斂,最終得到一條既無碰撞又滿足各項需求的優(yōu)化軌跡。之后,算法運用最小二乘法算出新軌跡控制點上無人機的飛行速度及加速度初始值,再優(yōu)化新軌跡。此時,算法調(diào)整無人機到達每個控制點所需的時間,使新軌跡更貼近原軌跡,同時滿足光滑性、動力學約束等要求。
技術(shù)面臨的挑戰(zhàn)
盡管當前無人機路徑規(guī)劃與控制技術(shù)取得了顯著進展,但是這些技術(shù)在復雜環(huán)境下的應用仍面臨諸多挑戰(zhàn),尤其在不可預見的障礙物出現(xiàn)或環(huán)境變化時,往往反應遲緩,難以實時適應環(huán)境變化。一方面,高維、動態(tài)場景等復雜環(huán)境下的路徑規(guī)劃需要兼顧全局最優(yōu)性和局部實時性,這對算法計算效率和適應性提出了極高要求;另一方面,控制器需要考慮動力學約束和噪聲干擾等因素,控制精度與魯棒性如何提高是當前研究領(lǐng)域的重點課題。而多目標任務(wù)中的路徑規(guī)劃與協(xié)同控制問題進一步增加了技術(shù)實現(xiàn)的難度。
技術(shù)發(fā)展趨勢
基于現(xiàn)有研究現(xiàn)狀,未來無人機路徑規(guī)劃與控制技術(shù)將向以下方向發(fā)展。
首先,激光雷達、視覺傳感器等多源傳感器數(shù)據(jù)融合技術(shù)和慣性測量單元技術(shù)的蓬勃發(fā)展將為路徑規(guī)劃提供更準確的環(huán)境信息,進一步提升路徑規(guī)劃的精度和魯棒性,幫助無人機在復雜環(huán)境中做出正確的決策。
其次,強化學習、深度學習方法為路徑規(guī)劃、飛行控制提供了智能化解決方案。強化學習根據(jù)環(huán)境反饋的獎勵值評估無人機的行為,不斷迭代優(yōu)化飛行控制策略,從而提高無人機在復雜環(huán)境下的適應能力。
強化學習、深度學習、多源傳感器數(shù)據(jù)融合等技術(shù)的快速發(fā)展將顯著提升無人機在復雜環(huán)境中的自主性、穩(wěn)定性和可靠性,推動無人機在更廣泛的應用場景中更高效地完成飛行任務(wù)。