鄧志剛,周桐慶,謝 瑩,肖曉強,徐 明,祁特立2(國防科技大學計算機學院,長沙40073)
2(75836部隊,廣州510000)
E-mail:419841480@qq.com
眾所周知,海上電磁環(huán)境日趨復雜,用頻沖突和干擾嚴重[1].此外,島上臺站選址、海上頻譜態(tài)勢生成、用頻設備的參數(shù)設置以及電子方案的擬制和優(yōu)化,都嚴重依賴于海上電磁環(huán)境信息[2].因此,準確獲取海面電磁環(huán)境信息,對海上形勢的分析有著十分重要的意義.
現(xiàn)有海上電磁環(huán)境監(jiān)測手段主要包括三種:
1)固定臺站監(jiān)測.主要依托島上建站對相關業(yè)務進行監(jiān)測,但有效監(jiān)測范圍往往只有幾十上百公里,對遠海目標失效,無法進行抵近式監(jiān)測并且成本高;
2)移動巡航監(jiān)測.在漁船上捆綁監(jiān)測設備記錄出海期間采集的數(shù)據(jù),待返航后進行分析處理,但該方法實時性不高,且無法有效判別目標輻射源的類型和實力;
3)空天衛(wèi)星監(jiān)測.利用衛(wèi)星覆蓋范圍廣的優(yōu)勢,可對大范圍區(qū)域進行監(jiān)測[3],但數(shù)據(jù)傳輸延遲較大,且對沿海面?zhèn)鞑サ碾姶挪ú幻舾?總的來說,現(xiàn)有監(jiān)測方式雖各具特點和優(yōu)勢,但普遍存在成本高、不實時和精度低的問題.
為此,本文以節(jié)能高效精準為首要目標,提出一種面向海上頻譜監(jiān)測的無人機調度方法—UAVSense,該方法通過指派無人機搭載頻譜感知設備,獲取目標區(qū)域整體的電磁環(huán)境信息.主要的挑戰(zhàn)有:
1)數(shù)據(jù)稀疏性問題.受成本限制,可搭載的無人機數(shù)量有限,進行頻譜監(jiān)測只能獲取少量位置點的樣本;
2)采樣點選取問題.任務執(zhí)行過程中,如何挑選采樣位置從而確定無人機監(jiān)測目標,缺乏先驗依據(jù);
3)任務快速收斂問題.當監(jiān)測精度達到一定閾值時任務終止,需要進行重點設計使得任務能夠快速達到高精度.
本文主要工作:
1)利用頻譜插值技術解決數(shù)據(jù)稀疏性問題.頻譜信號具有空間相關性,可利用頻譜插值技術對少量采樣點數(shù)據(jù)處理,以重建出整體電磁環(huán)境信息.
2)設計面向均衡覆蓋的首輪任務分配機制.定義數(shù)據(jù)覆蓋的價值,利用多粒度熵解決任務初始化階段采樣點的選取問題,確保采樣數(shù)據(jù)覆蓋的均衡性.
3)設計面向差異最小化的多時隙無人機調度算法.將監(jiān)測過程劃分成多時隙,通過對比相鄰時隙的重建結果,找出滿足一定約束條件的飛行目標.通過迭代處理,使得重建結果快速達到高精度.
4)基于MATLAB仿真模型,設置與傳統(tǒng)無人機調度算法的對比實驗,驗證UAVSense方法的性能.
后文內容安排如下:第2節(jié)將從無人機載頻譜監(jiān)測、頻譜插值技術、無人機航路規(guī)劃等三部分對相關工作的思路及缺陷進行介紹和分析;第3節(jié)將通過任務模型和無人機調度模型兩部分對關鍵問題進行描述,并通過定義任務質量,給出任務收斂條件;第4節(jié)將從面向均衡覆蓋的首輪任務分配機制和面向差異最小化的多時隙無人機調度算法兩部分,詳細介紹如何通過UAVSense方法完成任務;第5節(jié)將結合MATLAB仿真模型,設置與傳統(tǒng)無人機調度算法的對比實驗,驗證UAVSense具有低成本、實時、高精度的性能.
由于傳統(tǒng)模式受設備限制,頻譜監(jiān)測業(yè)務一直停留在地面應用階段.隨著無人機技術的成熟,人們開始研究無人機載頻譜監(jiān)測手段,將視角從二維空間擴展到三維空間.文獻[4,5,19]針對地面難以監(jiān)測高空電磁頻譜信號的現(xiàn)狀,設計并實現(xiàn)以無人機為平臺的空中監(jiān)測系統(tǒng),利用無人機搭載便攜式頻譜設備,對地面、空中航路、高層建筑上的信號進行監(jiān)測定位,使得頻譜監(jiān)測突破地理空間的限制.文獻[6]采用無人機監(jiān)測系統(tǒng)對不同類型的電磁信號進行測試,該系統(tǒng)的監(jiān)測結果在數(shù)量和質量上都要比地面監(jiān)測的好且性能穩(wěn)定.然而,上述工作主要針對監(jiān)測測向和干擾定位業(yè)務,尚未進行目標區(qū)域整體電磁環(huán)境信息獲取工作.文獻[20]實現(xiàn)園區(qū)環(huán)境下的電磁態(tài)勢生成,但由于受能源和成本的限制,難以實現(xiàn)大范圍的有效監(jiān)測.
由于頻譜信號具有空間相關性,統(tǒng)計學插值技術和頻譜監(jiān)測業(yè)務相結合逐漸形成頻譜插值技術,可通過樣本進行推測頻譜信息.文獻[7]、文獻[8]采用克里金技術預測發(fā)射機的覆蓋范圍,實驗證明該方法比傳統(tǒng)路徑損耗模型預測更準.文獻[9]對不同插值算法的性能進行對比,發(fā)現(xiàn)Ordinary Kriging(OK)、Universal Kriging(UK)和 Inverse Distance Weighting(IDW)三種算法性能較好.文獻[10-12]在進一步研究中發(fā)現(xiàn),UK算法的性能會隨著觀測點的減少而下降.IDW的權重系數(shù)僅取決于預測位置的距離倒數(shù),而僅用倒數(shù)函數(shù)來描述空間關聯(lián)程度很不準確.OK算法不僅考慮測量點之間的距離和整體空間排列,還以最小化估計誤差為目標得出最優(yōu)系數(shù),使得估計結果更科學、更接近于實際情況.然而,如何有效利用這些插值技術進行未知點信號特征的分析,需要結合場景深入討論和設計.
無人機進行頻譜監(jiān)測時,需要使用航路規(guī)劃算法.Z形搜索和螺旋式搜索是無人機航路規(guī)劃中較為經典的算法,后續(xù)很多工作都是基于兩者的改進.其中,Z形搜索無人機反復地從一邊移動到另一邊,由此增加梯度信息,其路徑呈之字形[22],由于重復覆蓋區(qū)域少、規(guī)劃簡單的特點被廣泛應用.螺旋式搜索無人機在前往目標區(qū)域時,按對數(shù)螺旋方程進行飛行,其路徑呈螺旋線形[23].文獻[17]提出一種啟發(fā)式函數(shù)來計算不平坦地形上兩個給定位置之間的能源成本,所提出的算法便是結合Z形虛擬路徑段來生成爬坡的能源成本.文獻[18]提出一種基于自然螺旋現(xiàn)象的二維連續(xù)優(yōu)化方法,利用對數(shù)螺旋的特征,將自然界中頻繁出現(xiàn)的聚焦螺旋現(xiàn)象近似于對數(shù)螺旋,從而擴展成多維螺旋模型,仿真結果驗證了該方法的有效性.然而,Z形搜索和螺旋式搜索方式,大多是在無人機出發(fā)前預設好的,并不適用于大多數(shù)實際應用場景.文獻[21]設計復雜環(huán)境下的無人機載頻譜監(jiān)測航路規(guī)劃算法,可以根據(jù)先驗知識獲取最佳測量位置和精確采樣結果,但未對完成實際監(jiān)測任務的成本進行討論.
圖1 一個多時隙無人機監(jiān)測例子(2架無人機、M區(qū)域被劃分為6*6的網格)Fig.1 A multi-slot UAV monitoring example(2 UAVs,M area is divided into 6*6 grids)
假設系統(tǒng)發(fā)布監(jiān)測任務如圖1所示.要求在時間跨度T內獲取M海域電磁信息,監(jiān)測結果需達到一定精度,即與真值的誤差不得高于某閾值.任務執(zhí)行期間,目標輻射源位置不 變,發(fā)射機參數(shù)恒定.將任務持續(xù)時間T劃分成相等的時隙,將目標區(qū)域M等分成若干個塊(M可看作一個位置矩陣).此時每個塊上的信號強度在監(jiān)測過程中是不變的,發(fā)射機信號在各個位置上的信號強度可組成一個真值矩陣,各個塊上的監(jiān)測數(shù)據(jù)可組成一個感知矩陣.因為在每個時隙無法感知到所有的塊,所以需要利用重建算法根據(jù)感知矩陣對未采樣點的數(shù)值進行估計,以恢復目標區(qū)域M的整體信號強度,得到的矩陣稱為重建矩陣.常用變量如表1所示.
表1 常用變量Table 1 Common variables
定義1.任務矩陣Mm×n,塊選擇矩陣Sm×n.任務區(qū)域 M 被等分成m×n份,當?shù)趇行j列的塊被選中時,Sij=1,否則,Sij=0.
定義2.真值矩陣Fm×n.Fij代表著塊Sij處的真實頻譜數(shù)據(jù),可將Fm×n視為真值.
定義3.感知矩陣Cm×n,Cij代表著塊Sij處的監(jiān)測頻譜數(shù)據(jù),假設監(jiān)測到的數(shù)據(jù)是真實可靠的,那么有Cij=Fij.可得C=FS,其中“”代表著兩個矩陣相同位置上的元素相乘.
定義4.重建矩陣 ^Fm×n.假設對感知矩陣Cm×n進行插值的算法為R,那么重建目標就是使^Fm×n近似等于真值矩陣Fm×n,即:
實際上,根據(jù)插值算法的原理,待估點l0處的預測值可以用下面公式計算:
其中,λi是待計算的權重值,F(xiàn)(li)是觀測點的數(shù)值.
定義5.任務質量Q.這里Q表示重建矩陣整體的準確率.對比相鄰時隙tn、tn+1重建矩陣中各個塊的數(shù)值.當前后數(shù)值差異滿足閾值thcomp時:
可認為該塊的重建效果達到預期.如此一來,不符合上述條件的位置塊可構成集合N(Q),那么總體的準確率需滿足:
其中,thend為系統(tǒng)根據(jù)先驗知識設定的閾值,當準確率Q不小于thend時,重建結果可供系統(tǒng)正常使用.將在實驗部分對閾值的選擇進行說明.
本文將使用無人機搭載便攜式頻譜監(jiān)測設備,對目標海域執(zhí)行監(jiān)測任務.假設無人機續(xù)航能力充足,能夠持續(xù)飛行直到任務結束,而且采樣數(shù)據(jù)能夠實時回傳到服務器進行處理(采用無人機組網技術,多媒體數(shù)據(jù)多跳實時回傳).在不同時隙的監(jiān)測目標塊是變化的,服務器將根據(jù)重建結果挑選合適的目標,并按照相鄰時隙軌跡約束條件對無人機進行動態(tài)調度.而且,任務初始化階段和后續(xù)任務的感知塊挑選在設計上有區(qū)別,需要根據(jù)相應規(guī)則按照不同的粒度對目標區(qū)域進行劃分.
定義6.物理劃分粒度g.為便于計算,假設目標區(qū)域M為正方形,總面積為S.根據(jù)無人機數(shù)量Un對M區(qū)域進行劃分的粒度設為g1,此時 M 區(qū)域按照該粒度劃分成g1×g1等份;根據(jù)需要描述的頻譜信號強度的塊面積,對M區(qū)域進行劃分的粒度設為g2,設塊面積大小為s0(s0與S單位相同),可得此時 R 區(qū)域按照該粒度劃分成g2×g2等份.
定義7.無人機軌跡約束.在g2粒度下,無人機在下一時隙可探測的目標塊,只能從與當前位置鄰近的八個塊中選取重建梯度較大的塊.假設每個塊的中心為最佳采樣點,可選擇的目標塊已標注,如圖2所示.
圖2 無人機下一時隙挑選感知目標的約束Fig.2 Constraints of the UAV sensing targets'selction in the next time slot
由于重建精度與采樣數(shù)據(jù)的分布密切相關,必須合理挑選感知目標,使得數(shù)據(jù)覆蓋均衡性更好.假設現(xiàn)有無人機Un=4架,任務區(qū)域為正方形,目標輻射源在中心位置,總面積S=100,需要描述頻譜信號強度的塊大小s0=1.那么,根據(jù)定義5可得出t1時隙的物理劃分粒度g1=2,t2時隙的劃分粒度g2=10.設計思路結合圖3詳細闡述.
如圖3(a)所示,在t1時隙,任務區(qū)域按照g1粒度劃分成2×2等份物理區(qū)間,即有4個正方形子區(qū)域.然后,按照圖3(b)所示,以r0=為距離區(qū)間,分別以O為圓心,以|O L1|、|OL2|、|OL3|為半徑畫圓,其中|O L3|=3 r0、|O L2|=2 r0、|OL1|=r0.可按照距離等級r0,將任務區(qū)域按與目標輻射源的距離范圍(即“r0距離粒度”),劃分得到圓O L1(距離區(qū)間:(0,r0))、圓環(huán)L1L2(距離區(qū)間(r0,2 r0))、L2L3(距離區(qū)間(2 r0,3 r0)),以及角塊L3L4(距離區(qū)間(3 r0,3)).
要使得重建收益高,應確保采樣數(shù)據(jù)集B覆蓋的均衡性E(B)足夠好,即使得采樣數(shù)據(jù)空間分布的熵最大.圖3的案例中,已經直觀地體現(xiàn)出不同粒度下的數(shù)據(jù)覆蓋特點:在圖3(a)和圖3(b)中,初始粒度g2=10×10下,四架無人機均采樣四個位置塊的數(shù)據(jù),但是在粗粒度g1=2×2下,前者只覆蓋1個子區(qū)域,而后者覆蓋4個子區(qū)域.由于在忽略環(huán)境、地形、人為因素等條件下,信號強度的衰減只與距離相關,等距離位置點的信號強度差異很小.因此,還要同時考慮r0距離粒度下的均勻分布.
圖3 首輪任務分配機制Fig.3 First-round task allocation mechanism
在任務初始化階段(即第一時隙t1),需要考察按g1物理粒度和r0距離粒度下的采樣數(shù)據(jù)集B覆蓋的均勻性E(B).綜合考慮在不同粒度劃分下采樣數(shù)據(jù)分布的均衡性,下面介紹一般計算公式:
其中,ni、ndi分別代表g1、r0粒度下的第 i個子區(qū)域.Eg1、Er0分別是g1、r0粒度下采樣數(shù)據(jù)空間分布的熵值.那么總體均勻性E(B)=Eg1+Er0.要使得 E(B)最大化,只需保證Eg1、Er0均最大即可.
圖3給出的例子中,在g1粒度下:Eg1(A)=0,Eg1(B)=2,Eg1(C)=1.5,Eg1(D)=2,顯然讓四架無人機與四個子區(qū)域一一對應的方式獲得的采樣數(shù)據(jù)更加均勻;在r0粒度下,Er0(B)=0,Er0(C)=1.5,Er0(D)=2,比較可知,當采樣點分布于不同距離區(qū)間時,采樣數(shù)據(jù)的均勻性最好.如此可見,在圖3中方案D的數(shù)據(jù)覆蓋的熵值最大、均衡性最好.
綜上,在任務初始化t1、t2時隙階段,需要將任務區(qū)域按無人機數(shù)量劃分物理區(qū)間,并根據(jù)無人機和中心目標輻射源的距離劃分距離區(qū)間,使得采樣點的選取在物理覆蓋和距離覆蓋上都均衡.
通過劃分時隙指派無人機對目標位置的頻譜信號強度進行監(jiān)測,到任務結束前已采樣位置的數(shù)據(jù)可認為保持不變.下一時隙,無人機不用再飛往已采樣的位置點,根據(jù)定義7中的無人機飛行軌跡約束條件,無人機也無法飛往不符合條件的位置.而且在未知真值信息的情況下,無法判斷當前重建結果的真值誤差是否已經達到系統(tǒng)給定的任務收斂標準thend.多時隙后滿足均衡覆蓋條件的位置塊有很多,怎樣選取監(jiān)測目標使重建結果能夠獲得高精度,讓監(jiān)測任務能夠快速完成,是多時隙無人機調度算法將要重點解決的問題.如算法1所示.下面將詳細介紹迭代處理過程.
在步驟1中,比較首輪任務結束后第th、th-1時隙的重建結果,得到重建梯度矩陣,找出梯度大于閾值thcomp的塊,一一存放在塊選擇矩陣SCMm×n中.統(tǒng)計矩陣SCMm×n中非零塊的總數(shù),根據(jù)定義5,計算出當前任務質量Q,與收斂閾值thend比較,判斷當前重建合格率是否大于任務收斂標準,如果滿足,監(jiān)測任務終止,否則進入步驟2.
在步驟2中,根據(jù)每個無人機UAVi的當前坐標Posi,計算每個無人機到矩陣SCMm×n的各個非零塊中心位置的距離,得到距離數(shù)組d.根據(jù)定義7中的無人機軌跡約束條件,下一
i時隙無人機只能飛行到與之相鄰的八個塊,可得到飛行距離約束條件,找出距離數(shù)組中滿足D條件
^的對應位置塊,將其坐標記錄在矩陣Gi中,即得到下一時隙無人機UAVi可以到達的位置塊,并將總數(shù)記錄在Num(G^i)中.監(jiān)測任務共派出Un架次無人機,共有N=∏Ui=n1Num(G^i)種排列組合.根據(jù)面向均衡覆蓋的首輪任務分配機制,找出N種排列組合中覆蓋熵最大的組合,作為下一時隙th+1的無人機飛行目標,得到采樣數(shù)據(jù)C(th+1),并通過插值算法R計算出該時隙下的重建結果F^th+1.返回步驟1,進行迭代處理,直到監(jiān)測任務終止.
雖然,在海面上沒有人為和自然的障礙物(包括山峰、樹木、建筑等)的遮擋,但是海上通信對電磁波損耗的預測,并不能簡單套用自由空間傳播模型.海上也會存在島礁,并充斥著很多不確定和動態(tài)變化的因素,主要包括天氣(晴雨、濕度、氣壓等)、海面狀況(海浪、海風)、折射(衍射、散射)、通信雙方的移動性以及地球曲率等等.到目前為止,尚沒有一個完整的海上電磁波傳播損耗模型,能夠綜合考慮上述因素.綜合文獻[53]-文獻[55],給出適合本文實驗環(huán)境下的海上目標輻射源生成模型:
其中PLpath表示海上路徑傳播損耗值;PL0是自由空間損耗值;PL1表示海面反射損耗;PLearth是超視距情況下地球曲率帶來的衍射損耗;α是用來矯正大氣和海況影響的參數(shù),該參數(shù)主要根據(jù)實測數(shù)據(jù)得來.根據(jù)該模型,可模擬輻射源信號強度.
一般來說,頻譜監(jiān)測設備距離輻射源超過10Km時,需要考慮地球曲率所帶來的影響.為簡化實驗,假定目標海域M面積大小為10Km*10Km,此時地球曲率可忽略,PLearth=0.在公式(7)中,矯正參數(shù)α可由實地測量可得,在本文仿真環(huán)境下,假定α=0.將輻射源設定在M區(qū)域的中心位置,發(fā)射機信號頻點30MHz,占用帶寬0.5 MHz,發(fā)射機功率10dB,天線高20米,監(jiān)測設備天線高10米.此時,可利用海上電磁環(huán)境生成模型,生成M區(qū)域整體的電磁信號強度,即實驗真值.假定利用Un=4架次無人機,分時隙 T={1,2,3,…,tn}進行監(jiān)測.
在定義5中已經提到,相關業(yè)務的監(jiān)測誤差控制在一定閾值內時,可認為監(jiān)測數(shù)據(jù)是可用的.假設每個位置點上的重建結果與真值對比,其誤差在10%以內為合格,要求整體真值合格率QT不小于任務終止條件thTend=90%.通過設置多組實驗,我們發(fā)現(xiàn),假設每個位置點相鄰時隙的重建梯度Δ不超過5%,整體重建合格率Q不小于thend=90%時,真值合格率QT達到任務終止條件.
如圖4所示,實驗分別設置基于Z形搜索算法、螺旋式搜索算法以及UAVSense三組對比實驗.第1時隙時,只得到一次重建結果,無法計算出重建梯度,后續(xù)任務中能夠通過對比相鄰時隙的重建結果得出重建梯度,并計算出重建合格率.通過對比三組實驗的重建誤差,可以發(fā)現(xiàn)螺旋式搜索算法要優(yōu)于Z字型搜索算法.在第2和第3時隙UAVSense方法的重建誤差要明顯比前兩者大,且收斂速度較慢.三種的性能還需進一步對比真值誤差,因為重建結果的真值誤差才是系統(tǒng)最為關心的指標.
通過對比三組實驗的真值誤差,可以發(fā)現(xiàn):
1)實時性方面,Z字型搜索算法和UAVSense方法收斂最快,二者的真值誤差均自第3時隙開始達到閾值以下,而螺旋式搜索算法的真值直到第7時隙都在閾值上下波動;
2)高精度方面,對比各時隙的真值誤差,Z字型搜索算法雖比螺旋式搜索算法精度都要高,但是與UAVSense方法相比,二者的真值誤差都要大很多;
3)低成本方面,由于將無人機載頻譜監(jiān)測與頻譜插值技術相結合,與現(xiàn)有海上電磁到相同監(jiān)測標準上,使用少量無人機進行采樣并通過頻譜插值技術重建出整體頻譜信息的方法,成本自然要低很多.并且,如果要提高監(jiān)測標準達到更高的精度,UAVSense方法能夠在更短的時隙內收斂,比Z形和螺旋式搜索算法成本更低.
圖4 真值誤差與重建誤差對比圖Fig.4 Comparison between truth error and reconstruction error
綜上,雖然UAVSense方法的重建誤差在任務執(zhí)行初期比另外兩組大,收斂相對緩慢,但正是因為該方法能夠根據(jù)重建結果實時進行調度,使得無人機采樣數(shù)據(jù)的重建真值收益更大.能夠在3個任務時隙內,以12%的采樣數(shù)據(jù)重建出完整的電磁環(huán)境信息,準確率高達99%,實現(xiàn)低成本、實時、高精度的目標.
熱圖[16]是矩陣中各個獨立數(shù)據(jù)的圖形化表示,不同數(shù)值對應不同顏色.單獨拿出對比實驗中性能更具優(yōu)勢的UAVSense方法.由于在第3時隙已經獲得較好的重建精度,因此取前三次重建結果繪制成數(shù)據(jù)熱圖,如圖5所示.
圖5 重建結果熱度對比圖Fig.5 Reconstruction result heat comparison
圖5 (d)是真值熱圖,圖5(a)、(b)、(c)分別是時隙1、2、3重建結果的熱圖.通過直觀體現(xiàn)重建矩陣中數(shù)據(jù)的分布情況,對比不同時隙的重建效果,發(fā)現(xiàn)重建結果與真值數(shù)據(jù)分布趨于吻合,圖5(c)的擬合程度最好.該熱圖更加直觀地體現(xiàn)出UAVSense方法較好的監(jiān)測結果.
本文提出一種面向海上頻譜監(jiān)測的無人機調度方法,能夠通過少量無人機載頻譜設備,對大范圍目標海域的基礎電磁環(huán)境信息進行監(jiān)測.首次將無人機載頻譜監(jiān)測與頻譜插值技術應用到大范圍海上頻譜監(jiān)測業(yè)務中,將有效提高監(jiān)測效率,大大節(jié)約成本;面向均衡覆蓋的首輪任務分配機制,能夠有效選擇初始化階段的監(jiān)測目標,確保采樣數(shù)據(jù)能夠更加均衡地覆蓋目標區(qū)域;面向差異最小化的多時隙無人機調度算法,能夠使重建結果快速收斂,達到高精度需求.與傳統(tǒng)無人機搜索方法的仿真對比實驗表明,UAVSense方法能夠同時滿足低成本、實時、高精度的特點.