左青海,潘衛(wèi)軍,卓星宇,譚經(jīng)緯
(中國民用航空飛行學(xué)院空中交通管理學(xué)院,四川廣漢618307)
無人機(jī)感知與避撞方法研究
左青海,潘衛(wèi)軍,卓星宇,譚經(jīng)緯
(中國民用航空飛行學(xué)院空中交通管理學(xué)院,四川廣漢618307)
無人機(jī)與有人機(jī)的空域集成是無人機(jī)發(fā)展的一個關(guān)鍵問題。在此過程中,無人機(jī)感知與避撞系統(tǒng)扮演了一個至關(guān)重要的角色。感知與避撞的一項(xiàng)重要功能是保證無人機(jī)與其他航空器之間的安全間隔。首先介紹了無人機(jī)的分類以及應(yīng)用與運(yùn)行情況;其次,介紹了無人機(jī)感知與避撞系統(tǒng)的概念,對比分析了各類感知系統(tǒng)的特點(diǎn);最后,基于馬爾科夫決策過程提出了無人機(jī)避撞決策機(jī)制與避撞策略的生成方法。
無人機(jī);空域集成;感知與避撞;決策機(jī)制;避撞策略
無人機(jī),是由控制站管理的航空器,也稱遠(yuǎn)程駕駛航空器。無人機(jī)系統(tǒng)(UAS),也稱無人駕駛航空器系統(tǒng)(Remotely Piloted Aircraft Systems,RPAS),是指一架無人機(jī)、相關(guān)的遙控站、所需的指令與控制。根據(jù)無人機(jī)的重量等特征可將無人機(jī)作如表1所示的分類[1]。
表1 無人機(jī)的分類
注:(1)實(shí)際運(yùn)行中,I、II、III、IV、XI類分類有交叉時,按照較高要求的一類分類。
(2)對于串、并列運(yùn)行或者編隊(duì)運(yùn)行的無人機(jī),按照總重量分類。
(3)地方政府(例如當(dāng)?shù)毓膊块T)對于I、II類無人機(jī)重量界限低于本表規(guī)定的,以地方政府的具體要求為準(zhǔn)。
與有人機(jī)相比,無人機(jī)使用更加靈活、成本更低、人員傷亡風(fēng)險低,其在軍用和民用領(lǐng)域都表現(xiàn)出了較好的應(yīng)用前景。無人機(jī)可能引發(fā)的危害主要包括空中和地面撞擊,為保障飛行安全目前各國普遍采用將其與有人機(jī)隔離運(yùn)行的管理方式[2],這對空域資源造成極大浪費(fèi),也難以滿足無人機(jī)日益增長的應(yīng)用需求。無人機(jī)與有人機(jī)空域集成,即共享空域,是未來的發(fā)展趨勢,因而感知與避撞問題也成為制約無人機(jī)發(fā)展的關(guān)鍵挑戰(zhàn)之一。美國國家空域系統(tǒng)(NAS)的下一代空域系統(tǒng)計(jì)劃指出:“下一代空域?qū)⒅塾诶眯l(wèi)星使得航管員、飛行員、乘客、無人飛行器以及其它相關(guān)者能夠?qū)崟r地共享空域”。美國國防部也制定了空域集成計(jì)劃,計(jì)劃逐步將無人機(jī)融入共享空域[3-4]。
目前,有人機(jī)主要依靠二次雷達(dá)、機(jī)載應(yīng)答機(jī)、空中交通警戒與防撞系統(tǒng)(TCAS)等手段來防止空中相撞。與有人機(jī)不同,無人機(jī)系統(tǒng)只能單純的依靠無人機(jī)上所裝備的一系列傳感器來完成障礙規(guī)避,這個過程稱之為“感知與避撞”[5],實(shí)現(xiàn)這一過程的系統(tǒng)被稱之為“感知與避撞系統(tǒng)”。感知與避撞系統(tǒng)的定義是:感知與避讓是指看見、察覺或發(fā)現(xiàn)交通沖突或其他危險并采取適當(dāng)行動的能力。無人機(jī)感知與避讓系統(tǒng)是指無人機(jī)機(jī)載安裝的一種設(shè)備,用以確保無人機(jī)與其他航空器保持一定的安全飛行間隔,相當(dāng)于載人航空器的防撞系統(tǒng)[4-6]。由于視距范圍內(nèi)飛行的無人機(jī)通常由操作員人工執(zhí)行感知與避撞過程,本文研究的主要是超視距飛行的無人機(jī)感知與避撞方法。
目標(biāo)探測是避撞的基礎(chǔ),根據(jù)感知探測方式進(jìn)行分類,現(xiàn)有的感知與避撞系統(tǒng)可以基本分為兩類:協(xié)同式感知與避撞系統(tǒng)和非協(xié)同式感知與避撞系統(tǒng)。協(xié)同,意味著所有飛行器可通過共同的通信鏈路共享信息,它需要其他航空器也搭載同類型目標(biāo)檢測傳感器;非協(xié)同,則表示在空中的飛行器彼此間不通信,也就意味著只能采用主動檢測的方法。
典型的無人機(jī)感知與避撞系統(tǒng)其工作過程如圖1所示,決策機(jī)制根據(jù)傳感器提供的數(shù)據(jù)判斷是否需要改變飛行軌跡,避撞策略生成系統(tǒng)則在燃油經(jīng)濟(jì)性以及無人機(jī)空氣動力學(xué)基礎(chǔ)上,規(guī)劃避撞飛行路線;若采用協(xié)同式傳感器在生成避撞策略后會向其他航空器發(fā)送其意圖,通過飛行控制系統(tǒng)來執(zhí)行避撞操作;如果采用的是非協(xié)同式傳感器則在生成避撞策略后直接通過飛行控制系統(tǒng)執(zhí)行避撞操作。
圖1 感知與避撞系統(tǒng)結(jié)構(gòu)
由于小型無人機(jī)受載重、功耗等限制,實(shí)現(xiàn)小型無人機(jī)的感知與避撞操作面臨著更多的挑戰(zhàn)。在無人機(jī)上所使用的協(xié)同式與非協(xié)同式傳感器的技術(shù)特征對比表2所示[7]。
表2 協(xié)同式與非協(xié)同式傳感器比較
1.1 協(xié)同式感知與避撞系統(tǒng)
空中交通警戒與防撞系統(tǒng)和廣播式自動相關(guān)監(jiān)視(ADS-B)屬于協(xié)同式感知探測設(shè)備,能夠精確全面的獲取裝載同類設(shè)備的目標(biāo)飛機(jī)的狀態(tài)信息,但探測目標(biāo)受限,不能有效地檢測出地面目標(biāo)。
TCAS能夠探測在探測范圍內(nèi)裝有機(jī)載應(yīng)答機(jī)的任何飛機(jī),若目標(biāo)飛機(jī)也裝有TCAS還可以對沖突進(jìn)行協(xié)調(diào)避讓從而提高飛行的安全性,其最初設(shè)計(jì)是用于載人飛行,也可用于無人機(jī),但是,其昂貴的價格可能會妨礙TCAS在無人機(jī)領(lǐng)域的應(yīng)用。另外,由于無人機(jī)載荷限制十分苛刻,該系統(tǒng)在小型無人機(jī)上并不能直接使用。
ADS-B是一種相對較新的技術(shù),為防撞提供了巨大潛力。它不僅限于空-空監(jiān)視,其使用空-地通信并具有取代二次監(jiān)視雷達(dá)的潛力,采用類似于TCAS使用無線電信號發(fā)收發(fā)附近飛機(jī)的信息的方式,但ADS-B的一個重要且明顯的區(qū)別在于其信息交換的類型。每架飛機(jī)實(shí)時播報(bào)自己的身份、三維位置、速度、航向和意圖,這些信息是對于防撞系統(tǒng)非常有價值。隨著ADS-B的越來越小型化,該系統(tǒng)在未來會逐步應(yīng)用于無人機(jī)飛行。另外,可在機(jī)場周邊某些重要障礙物上安裝一套ADS-B系統(tǒng),來改善其不能探測地面障礙物這一不足。
1.2 非協(xié)同式感知與避撞系統(tǒng)
光電、聲學(xué)、紅外探測系統(tǒng)以及合成孔徑雷達(dá)、激光雷達(dá)等都屬于非協(xié)同型傳感器,不論探測目標(biāo)是否攜帶同樣的傳感器,它都能感知探測到視場范圍內(nèi)的空中及地面目標(biāo),但其探測性能受到無人機(jī)姿態(tài)影響而存在盲區(qū)。
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)作為一種主動探測設(shè)備,通過多雷達(dá)脈沖對目標(biāo)物成像[8]。無人機(jī)雷達(dá)近期研究進(jìn)展主要有:(1)由美國宇航局噴氣推進(jìn)實(shí)驗(yàn)室開發(fā)的可重構(gòu)極化L波段SAR,應(yīng)用于無人機(jī)系統(tǒng)[9],這是一種帶寬為80 MHz、有效距離為16 km的全極化雷達(dá);(2)一種輕重量(230 g)的X波段多普勒雷達(dá)系統(tǒng),開發(fā)應(yīng)用于檢測與識別微型無人機(jī)[10];(3)通用原子獵手B雷達(dá)原型,通常攜帶2~3個獨(dú)立雷達(dá)陣列,覆蓋航向上220°,高度上30°的范圍,且不限于特殊無人機(jī)機(jī)型[11]。SAR可在任何天氣條件下使用,但相比于光電系統(tǒng),其圖像獲取實(shí)時性較差。
激光雷達(dá)(LIDAR)作為一種遠(yuǎn)程感知技術(shù),已經(jīng)在無人機(jī)領(lǐng)域廣泛研究通過空間分布點(diǎn)精確坐標(biāo)的相關(guān)搜集來繪制目標(biāo)。它通過發(fā)射激光照射目標(biāo)并反射來測量距離,能夠識別3 km距離范圍內(nèi)的非垂直面以及小至直徑5 mm的物體。但是其視野受到限制。
光電系統(tǒng)(EO System)的傳感器目前已比較成熟,它所提供的信息不僅局限于用于圖像平面內(nèi)的目標(biāo)檢測與定位,由目標(biāo)在圖像平面中的位置所進(jìn)一步推斷出的相對航向信息可以用于評估碰撞危險(恒定的相對航向?qū)?yīng)于高風(fēng)險,而變化率大的相對航對對應(yīng)于低風(fēng)險)。此外,也可從中得到常用于控制目的距離信息并用于飛機(jī)機(jī)動。由于其優(yōu)越的綜合性能,基于光電系統(tǒng)的感知與避撞系統(tǒng)曾應(yīng)用于全球鷹等無人機(jī)[12],另外該系統(tǒng)對比較輕巧,常用于小型無人機(jī)[13]。但是,光電傳感方法仍面臨諸多問題,其中最顯著的挑戰(zhàn)源自于空中環(huán)境的不可預(yù)測和不斷變化的性質(zhì)。特別是,對于可見光光譜的光電傳感器,檢測算法必須能夠處理各種圖像的背景(從藍(lán)色天空云到雜亂的地面)、各種照明條件,以及可能的圖像偽影(例如鏡頭眩光)。另外,由于受到不可預(yù)知的氣動干擾和無人機(jī)的機(jī)動,加劇了相機(jī)傳感器的圖像抖動。對于圖像平面的檢測算法,圖像抖動引入不希望的噪聲分量,會對性能產(chǎn)生一定影響。
紅外系統(tǒng)(IR System)通過檢測物體所輻射的紅外線來感知潛在的物體。基于低分辨率(320*240像素)的紅外圖像的被動碰撞預(yù)警系統(tǒng),采用了自適應(yīng)技術(shù)以濾除測量噪聲[14]。與光電系統(tǒng)相比,它不需要可見光,在夜間也可以使用。但是紅外系統(tǒng)通常不適用于儀表氣象條件,需要和其他傳感器配合使用。
從螺旋槳飛機(jī)(聲源)所發(fā)射的信號包含一種施加到寬帶隨機(jī)分量上的強(qiáng)窄帶聲調(diào)。無人機(jī)上的聲學(xué)傳感器就是利用這種特性來檢測入侵飛機(jī)。相對于雷達(dá)或光電系統(tǒng),它們的遠(yuǎn)距離探測能力較差,其性能也會受惡劣氣候條件的影響而急劇降低。另外,在信號傳輸過程中會有時間延遲。
在接收到來自傳感器的數(shù)據(jù)后,由決策機(jī)制來決定是否重新規(guī)劃路徑以避免潛在危險。最直觀的是找到一個方法將飛行員決策特性應(yīng)用到無人機(jī)中。P.Narayan等人,介紹了基于直覺決策的認(rèn)知主導(dǎo)決策模型(RPDM)[15]。無人機(jī)感知與避撞決策方面的出版文獻(xiàn)并不多,可以采用一些用于無人機(jī)其他功能的算法到感知與避撞決策中來。接下來,文章將介紹馬爾科夫決策過程(Markov Decision Process,MDP)及其在無人機(jī)避撞中的應(yīng)用。
MDP是一個基于隨機(jī)模型的完善的框架,它通過將系統(tǒng)分離成有限個“狀態(tài)”和“行為”來生成優(yōu)化目標(biāo)函數(shù)的決策規(guī)則。在MDP的基礎(chǔ)上,一些學(xué)者已經(jīng)對無人機(jī)不確定性自主決策[16],無人機(jī)持久監(jiān)視一般健壯管理方法[17]和模型不確定性下的無人機(jī)規(guī)劃[18]分別進(jìn)行了研究。設(shè)計(jì)任務(wù)系統(tǒng)的健壯管理系統(tǒng)能夠選擇“行為”來抵消系統(tǒng)異常的不利影響[17]。
MDP包括一個容量為N的有限狀態(tài)空間s∈S和一個容量為M的行為空間a∈A,狀態(tài)轉(zhuǎn)換分布Psa=P(sk+1|sk,ak),它表示狀態(tài)s通過行為a轉(zhuǎn)換至狀態(tài)s'的概率。獎勵模型R(s,a)代表在狀態(tài)s并且采取行為a的所得到的獎勵值。
決策問題的解即為策略,它是S到A的一個映射,即π:S→A.對于任何一個策略,可以通過執(zhí)行該策略所獲得的長期回報(bào)來評價其優(yōu)劣。
對于任意策略π,定義其價值函數(shù)Vπ(s)為從狀態(tài)s開始并執(zhí)行策略的預(yù)期總回報(bào),則有
其中,R(s)表示初始狀態(tài)s的即時回報(bào),0≤γ<1,為折扣因子,表明了未來回報(bào)相較于當(dāng)前回報(bào)的重要程度。
最終的目的是找到使預(yù)期回報(bào)最大化的控制策略,即
值得強(qiáng)調(diào)的是,在MDP的一般公式的基礎(chǔ)上,對無人機(jī)的具體問題可以改寫成回報(bào)模型和目標(biāo)函數(shù)[17-19]。
無人機(jī)空中交通沖突時的避讓方法有兩種:調(diào)高度和變方向。調(diào)高度屬于垂直避讓,它仍保持航向,但需改變發(fā)動機(jī)推力和指配高度層;變方向?qū)儆谒奖茏?,它仍保持高度層,但會脫離指配航路[19]。
為了及時、高效地避讓,無人機(jī)必須能夠進(jìn)行自主決策并采取主動避撞措施進(jìn)行緊急避讓。無人機(jī)的實(shí)時位置及方向即為MDP中的“狀態(tài)”,而調(diào)高度以及變方向(包括上高度、下高度、左轉(zhuǎn)向、右轉(zhuǎn)向)相當(dāng)于MDP中的“行為”,在選擇方向之前,“感知與避撞”系統(tǒng)先感知自身以及地面和空中障礙物的“狀態(tài)”,基于當(dāng)前狀態(tài)s可計(jì)算出采取不同行為a而獲得的回報(bào)Vπ(s),通過前面的公式(1)-(4)可以得到一個使得預(yù)期回報(bào)最大的控制策略即為避撞策略[20-21]。
隨著無人機(jī)技術(shù)與應(yīng)用的極大發(fā)展,無人機(jī)與有人機(jī)集成空域成為制約無人機(jī)發(fā)展與空域優(yōu)化的一個重要問題,無人機(jī)感知與避撞技術(shù)是其中一個關(guān)鍵點(diǎn)。本文從無人機(jī)感知與避撞系統(tǒng)的概念及其分類著手,詳細(xì)比較了各感知與避撞傳感器的特點(diǎn),隨后給出了馬爾科夫決策過程的原理與及其在避撞中的應(yīng)用,通過機(jī)載計(jì)算機(jī)計(jì)算相關(guān)參數(shù),可以得到無人機(jī)的避撞策略。
為將非協(xié)同式傳感器用于無人機(jī)“感知與避撞系統(tǒng)”,相關(guān)人員做了很多努力。近期,也有學(xué)者提出將無人機(jī)搭載ADS-B以實(shí)現(xiàn)感知與避撞功能,不同感器技術(shù)具有各自優(yōu)缺點(diǎn),如何確定傳感器是否達(dá)到要求的統(tǒng)一的評價標(biāo)準(zhǔn)是一個很大的挑戰(zhàn),為提高超視距飛行的無人機(jī)感知與避撞性能,通常需要將幾種傳感器結(jié)合使用。無人機(jī)感知與避撞整個過程中,任何一個環(huán)節(jié)信息傳輸延遲都會降低整個系統(tǒng)的總體性能,如何提升系統(tǒng)的信息傳輸延遲穩(wěn)定性也是很重要的。
[1]中國民用航空局飛行標(biāo)準(zhǔn)司.AC-61-FS-2016-20R1民用無人機(jī)駕駛員管理規(guī)定[S].
[2]International Civil Aviation Organization.Circular 328 AN/ 190 Unmanned aircraft systems(UAS)[S].
[3]Stephen P.Cook,Dallas Brooks.A Quantitative Metric to Enable Unmanned Aircraft Systems to Remain Well Clear[J]. Air Traffic Control Quarterly,2016,23(2/3):137-156.
[4]United States Department of Defense(DoD).Version 2.0,Unmanned Aircraft System Airspace Integration Plan[S].
[5]畢紅哲,張洲宇,申功璋,等.無人機(jī)感知與規(guī)避技術(shù)研究進(jìn)展[J].電子測量與儀器學(xué)報(bào),2016(5):661-668.
[6]中國民用航空局飛行標(biāo)準(zhǔn)司.AC-61-FS-2013-20民用無人駕駛航空器系統(tǒng)駕駛員管理暫行規(guī)定[S].
[7]YU X,ZHANG Y M.Sense and avoid technologies with applicationstounmannedaircraftsystems:Reviewandprospects [J].Progress in Aerospace Sciences,2015,74(4):152-166.
[8]S.Lentilhac.UAVflightplanoptimizedforsensorrequirements [J].IEEE Aerospace&Electronic Systems Magazine,2010, 25(1):11-14.
[9]P.A.Rosen,S.Hensley,K.Wheeler.UAVSAR:new NASA airborne SAR system for research[J].IEEE Aerospace& Electronic Systems Magazine,2007,22(11):21-28.
[10]A.Moses,M.J.Rutherford,K.P.Valavanis.Radar-based detection and identification for miniature air vehicles[C]. Proceedings of the IEEE International Conference on Control Applications.Denver,USA,2011.
[11]M.P.Owen,S.M.Duffy,M.W.M.Edwards.Unmanned aircraft sense and avoid radar:Surrogate flight testing performance evaluation[C].IEEE Radar Conference.Ohio,USA,2011.
[12]J.D.Griffith,M.J.Kochenderfer,J.K.Kuchar.Electrooptical system analysis for sense and avoid[C].Proceedings of the AIAA Guidance,Navigation and Control Conference and Exhibit.Honolulu,Hawaii,2008.
[13]J.Kim,D.W.Lee,K.Cho,et al.Development of an electrooptical system for small UAV[J].Aerospace Science& Technology,2010,14(7):505-511.
[14]R.W.Osborne,Y.Bar-Shalom,P.Willett.Design of an adaptive passive collision warning system for UAVs[J].IEEE Transactions on Aerospace&Electronic Systems,2011,47
(3):2169-2189.
[15]P.Narayan,P.Wu,D.Campbell.Unmanning UAVs-addressing challenges in on-board planning and decision making[C]. Proceedings of the 1st International Conference on Humans Operating Unmanned Systems.Brest,F(xiàn)rance,2008.
[16]A.G.Shem,T.A.Mazzuchi,S.Sarkani.Addressing uncertainty in UAV navigation decision-making[J].IEEE Transactions on Aerospace&Electronic Systems,2008,44(1):295-313.
[17]B.Bethke,J.P.How,J.Vian.Group health management of UAV teams withapplications to persistent surveillance[C]. Proceedings of the American Control Conference.Seattle,US A,2008.
[18]L.F.Bertuccelli,A.Wu,J.P.How.Robust adaptive Markov decision processes:planning with model uncertainty[J].IEEE Control Systems Magazine,2012,32(5):96-109.
[19]王軍,蘇劍波,席裕庚.多傳感器信息融合及其應(yīng)用綜述[J].控制與決策,2001,16(5):518-522.
[20]S Ragi,EKP Chong,UAV Path Planning in a Dynamic Environment via Partially Observable Markov Decision Process [J].IEEE Transactions on Aerospace&Electronic Systems,2013,49(4):2397-2412
[21]K.P.Valavanis,G.J.Vachtsevanos.Handbook of Unmanned Aerial Vehicles:UAV Guidance Algorithms via Partially Observable Markov Decision Processes[M],Springer Science+ Business Media Dordrecht,2015:1775-1810.
Research on Sense and Avoiding Method of Unmanned Aircraft System
ZUO Qing-hai,PAN Wei-jun,ZHUO Xing-yu,TAN Jing-wei
(Civil Aviation Flight University of China,Guanghan Sichuan 618300,China)
Integrating Unmanned Aircraft System(UAS)into the National AirspaceSystem(NAS)with reliable and safe operations is a key issue as the development of UAS.Sense and Avoid system(SAA)of UAS plays an important role during this process.One important function of SAA is to ensure the safety separation between UAS and other aircraft.This paper investigates the classification,application and operation of UAS.Then we introduce the concept and classification of UAS SAA and compare the characteristics of various types of perception system. Finally,we propose the SAA decision mechanism and method of generating collision avoidance strategy in UAS based on Markov Decision Process(MDP).
unmanned aircraft system;sharing airspace;sense and avoid;decision mechanism;avoiding strategy
V249
A
1672-545X(2016)11-0065-05
2016-08-22
軍民航空管聯(lián)合運(yùn)行體系及效能評估研究(GKG201403001)
左青海(1993-),男,湖北孝感人,碩士,研究方向?yàn)榭罩薪煌ü芾?;潘衛(wèi)軍(1968-),男,湖北黃岡人,博士,教授,副院長,研究方向?yàn)榭罩薪煌ü芾怼⒂?jì)算機(jī)圖形圖像處理;卓星宇(1989-),男,四川成都人,碩士,研究方向?yàn)榭罩薪煌ü芾?;譚經(jīng)緯(1992-),男,四川成都人,碩士,研究方向?yàn)榭罩薪煌ü芾怼?/p>