• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      傳感器工作時(shí)長約束及輻射控制的調(diào)度方法

      2018-07-09 12:51:02喬成林段修生單甘霖王儉臣
      關(guān)鍵詞:代價(jià)時(shí)刻約束

      喬成林,段修生,單甘霖,王儉臣

      (1.陸軍工程大學(xué),河北 石家莊 050003;2.中國人民解放軍駐西北工業(yè)大學(xué)軍事代表室,陜西 西安 710065)

      0 引言

      多傳感器系統(tǒng)能從不同角度獲取目標(biāo)信息,為了滿足對(duì)多目標(biāo)的觀測(cè)要求,需要管理調(diào)度多傳感器資源[1-2]。傳統(tǒng)的傳感器調(diào)度研究中,通常以傳感器最大化目標(biāo)收益(如跟蹤誤差最小、信息增益最大)。然而,有源傳感器(如雷達(dá))在持續(xù)獲得量測(cè)時(shí)會(huì)向外發(fā)射電磁波,容易暴露自身位置,降低己方生存能力。為此,文獻(xiàn)[3-5]研究了目標(biāo)跟蹤中輻射控制問題,其以跟蹤精度為需求,當(dāng)不滿足精度需求時(shí),雷達(dá)開機(jī)獲得量測(cè),否則不開機(jī),以降低系統(tǒng)輻射。然而,該方法并沒有對(duì)雷達(dá)輻射進(jìn)行量化,實(shí)際上不同時(shí)刻的雷達(dá)輻射代價(jià)是不同的。隨后,文獻(xiàn)[6]在傳感器多模式調(diào)度中將輻射代價(jià)量化為固定值,并采用加權(quán)系數(shù)構(gòu)建基于輻射代價(jià)的目標(biāo)函數(shù),實(shí)現(xiàn)對(duì)智能目標(biāo)的精確跟蹤。相比于固定輻射代價(jià),文獻(xiàn)[7-9]提出采用截獲概率的熵實(shí)時(shí)量化輻射代價(jià)更具實(shí)用性。但是,使用截獲概率衡量輻射代價(jià)需要提前獲知敵方目標(biāo)窗函數(shù)參數(shù),這在實(shí)際中往往難以獲得[8]。

      此外在上述調(diào)度方法中,為了追求最大目標(biāo)收益,大多數(shù)調(diào)度方法中均存在傳感器頻繁切換問題,這不僅加快了傳感器能量耗損,更嚴(yán)重影響了分配方案的穩(wěn)定性[10]。文獻(xiàn)[11]在衛(wèi)星調(diào)度中提出設(shè)置交接次數(shù)閾值來避免頻繁切換,但容易錯(cuò)失最優(yōu)調(diào)度方案。文獻(xiàn)[12-13]通過在目標(biāo)優(yōu)化函數(shù)中引入切換代價(jià)以減緩頻繁切換,但是切換代價(jià)的設(shè)置往往由經(jīng)驗(yàn)值決定,可操作性不強(qiáng)。進(jìn)一步,文獻(xiàn)[14]研究了連續(xù)時(shí)間域傳感器調(diào)度問題,尋求最大切換次數(shù)約束下最優(yōu)調(diào)度序列,由于不考慮最小工作時(shí)間,其最優(yōu)調(diào)度序列中仍存在頻繁切換的缺陷。針對(duì)上述問題,提出傳感器工作時(shí)長約束及輻射控制的調(diào)度方法。

      1 系統(tǒng)模型及目標(biāo)優(yōu)化函數(shù)

      引入輻射度影響(Emission Level Impact, ELI)[15]量化傳感器輻射風(fēng)險(xiǎn),并將目標(biāo)跟蹤和輻射控制過程建立為統(tǒng)一的部分可觀馬爾可夫決策過程(Partially Observable Markov Decision Process, POMDP)。

      1.1 系統(tǒng)模型

      1) 傳感器調(diào)度動(dòng)作

      2) 系統(tǒng)狀態(tài)及狀態(tài)轉(zhuǎn)移

      系統(tǒng)狀態(tài)Sk由目標(biāo)運(yùn)動(dòng)狀態(tài)Xk和傳感器ELI狀態(tài)Ek組成,即

      (1)

      目標(biāo)狀態(tài)按照目標(biāo)狀態(tài)轉(zhuǎn)移方程轉(zhuǎn)移到下一時(shí)刻,即

      Xk+1=FkXk+1+Γk·vk

      (2)

      式(2)中,F(xiàn)、Γ和v分別為狀態(tài)轉(zhuǎn)移矩陣、噪聲增益矩陣以及零均值高斯噪聲。對(duì)于近似勻速運(yùn)動(dòng)(NCV,Nearly Constant Velocity)模型[7],則

      (3)

      式(3)中,I3表示3×3單位矩陣,符號(hào)?表示克羅內(nèi)克積。

      將傳感器ELI狀態(tài)量化為有限狀態(tài)集合{1,…,Ns},集合中每個(gè)值代表相應(yīng)的ELI狀態(tài)真值[14]。則當(dāng)調(diào)度傳感器n跟蹤目標(biāo)時(shí),可采用一個(gè)受控的狀態(tài)轉(zhuǎn)移矩陣描述其ELI狀態(tài)變化,即

      (4)

      3) 系統(tǒng)觀測(cè)及觀測(cè)矩陣

      系統(tǒng)觀測(cè)Zk由目標(biāo)狀態(tài)觀測(cè)ZXk和瞬間觀測(cè)威脅度ZEk組成,則

      (5)

      式(5)中,ZXk和ZEk分別表示傳感器跟蹤目標(biāo)時(shí)獲得的量測(cè)值及其對(duì)應(yīng)的瞬間觀測(cè)威脅度。

      在調(diào)度動(dòng)作作用下,假設(shè)傳感器n獲得目標(biāo)量測(cè)值。對(duì)于有源傳感器(如雷達(dá)),其量測(cè)值由斜距離r、方位角θ及高低角φ組成,即

      ZXk=hn(Xk)+w

      (6)

      式(6)中,hn(Xk)=[rk,θk,φk]T;

      同理,將瞬間觀測(cè)威脅度量化為有限狀態(tài)集合{1,…,Ms},集合中每個(gè)值對(duì)應(yīng)真實(shí)的瞬間威脅度??紤]到瞬間觀測(cè)威脅度與真實(shí)瞬間威脅度的關(guān)系[14],可用一組觀測(cè)矩陣來表示,即

      (7)

      1.2 目標(biāo)優(yōu)化函數(shù)

      考慮目標(biāo)跟蹤任務(wù)需求及傳感器應(yīng)用實(shí)際,不能為了最大限度的控制輻射,頻繁切換傳感器。為此,需要研究工作時(shí)長約束下傳感器調(diào)度問題,具體描述為

      假設(shè)存在N個(gè)傳感器資源ψ1,…,ψN,其工作時(shí)長約束為τ1,…,τN。為了不失一般性,假設(shè)在k時(shí)刻傳感器β已經(jīng)連續(xù)工作了τβ(τβ是其工作時(shí)長約束),則在下一時(shí)刻需要決策是否需要切換至其他傳感器。根據(jù)工作時(shí)長約束,k+1時(shí)刻可以繼續(xù)調(diào)度當(dāng)前傳感器,也可以切換到其他傳感器n(n≠β),但是一旦切換就必須至少工作τn。進(jìn)一步,以N=3(傳感器ψ1,ψ2,ψ3),τ1=τ2=3,τ3=4為例,不妨設(shè)截止k時(shí)刻傳感器ψ1已經(jīng)工作了3,則k+1時(shí)刻需要決策在第λ(1,2,3,…)切換,其對(duì)應(yīng)的調(diào)度方案可以是ψ2ψ2ψ2,ψ3ψ3ψ3ψ3,ψ1ψ2ψ2ψ2等。很明顯,由于工作時(shí)長約束,存在無窮多種調(diào)度方案,比較所有可能的調(diào)度方案是不切實(shí)際的。此外,考慮到越往后時(shí)刻的信息對(duì)當(dāng)前時(shí)刻的決策影響越小,為了簡化分析,并傾向于繼續(xù)調(diào)度當(dāng)前傳感器,進(jìn)一步減少切換次數(shù),調(diào)度策略制定如下

      不妨設(shè),k時(shí)刻傳感器β已經(jīng)連續(xù)工作了τβ:

      具體目標(biāo)優(yōu)化函數(shù)描述為

      s.t.ρt≤ρth,t=k+1,…,k+τn

      (8)

      式(8)中,ρt為t時(shí)刻目標(biāo)跟蹤精度,ρth為跟蹤任務(wù)需求對(duì)應(yīng)的精度閾值。

      進(jìn)一步分析可知,當(dāng)τn=1時(shí)即為傳統(tǒng)的無工作時(shí)長約束調(diào)度模型,這里是對(duì)τn>1場(chǎng)景的推廣。

      2 傳感器工作時(shí)長約束及輻射控制的調(diào)度方法

      由于系統(tǒng)狀態(tài)不能完全可觀,為了保持對(duì)目標(biāo)運(yùn)動(dòng)狀態(tài)和ELI狀態(tài)的持續(xù)更新,引入信念狀態(tài)bk=[bXk,bEk]T,其中bXk為目標(biāo)信念狀態(tài),bEk為ELI信念狀態(tài)[17]。則根據(jù)所有歷史信息及初始狀態(tài),得

      (9)

      式(9)中,X0和pX0為目標(biāo)初始狀態(tài)及狀態(tài)分布,E0和pE0為ELI初始狀態(tài)及狀態(tài)分布。

      2.1 目標(biāo)跟蹤精度預(yù)測(cè)

      依據(jù)貝葉斯濾波原理,目標(biāo)信念狀態(tài)更新包括預(yù)測(cè)和更新兩個(gè)階段,即預(yù)測(cè)階段為

      (10)

      更新階段為

      (11)

      1) 初始化

      目標(biāo)信念狀態(tài)中獲取狀態(tài)均值和方差

      (12)

      式(12)中,μXk和σXk分別是bXk的期望值和標(biāo)準(zhǔn)差。

      2) 時(shí)間更新

      (13)

      (14)

      式(13)、式(14)中,L為狀態(tài)維數(shù),w=[w0,…,w2L]T為權(quán)重向量。

      3) 量測(cè)更新

      (15)

      Pk+1=Pk+1|k-Kk+1|kPzz(Kk+1|k)T

      (16)

      其中,Pk+1|k、Sk+1和Ck+1分別是預(yù)測(cè)協(xié)方差,新息協(xié)方差和互協(xié)方差[18]。

      4) 更新目標(biāo)信念狀態(tài),預(yù)測(cè)跟蹤精度

      (17)

      (18)

      2.2 系統(tǒng)單步與多步輻射代價(jià)

      依據(jù)HMM濾波器,若已知k+1瞬間觀測(cè)威脅度,則可以獲知k+1時(shí)刻ELI信念狀態(tài)[19]。以調(diào)度傳感器n為例,其ELI信念狀態(tài)更新為

      (19)

      式(19)中,lk+1為k+1時(shí)刻瞬間觀測(cè)威脅度。

      進(jìn)一步,得

      (20)

      式(20)中,1為Ns維單位向量,符號(hào)⊙表示Hadamard積。

      定義k+1時(shí)刻傳感器n跟蹤目標(biāo)的單步輻射代價(jià)為其ELI信念狀態(tài)的期望,即

      (21)

      雖然k時(shí)刻無法準(zhǔn)確獲知k+1時(shí)刻的瞬間觀測(cè)威脅度,但是可以依據(jù)當(dāng)前時(shí)刻ELI信念狀態(tài)推導(dǎo)其分布概率,即

      (22)

      結(jié)合式(4)和式(7),得

      (23)

      因此,式(21)轉(zhuǎn)化為

      (24)

      則k+1時(shí)刻系統(tǒng)的單步輻射代價(jià)為

      (25)

      進(jìn)一步,k+h時(shí)刻系統(tǒng)的單步輻射代價(jià)為

      (26)

      則系統(tǒng)多步輻射代價(jià)為

      (27)

      式(27)中,ΨH為長度為H的傳感器調(diào)度序列。

      2.3 調(diào)度方法流程

      對(duì)于多傳感器系統(tǒng),不妨設(shè)k時(shí)刻傳感器β已經(jīng)工作了τβ(τβ是其工作時(shí)長約束),則結(jié)合目標(biāo)跟蹤精度預(yù)測(cè)及傳感器輻射代價(jià)預(yù)測(cè),式(8)目標(biāo)函數(shù)轉(zhuǎn)化為

      s.t.ρt≤ρth,t=k+1,…,k+τn

      (28)

      因此,工作時(shí)長約束及輻射控制下傳感器調(diào)度方法流程為:

      步驟1)初始階段。得到目標(biāo)的初始狀態(tài)X0和初始協(xié)方差矩陣P0;

      步驟2)預(yù)測(cè)跟蹤精度。由2.1節(jié)預(yù)測(cè)跟蹤目標(biāo)跟蹤精度;

      步驟3)計(jì)算輻射代價(jià)。由式(25)和(27)計(jì)算傳感器單步及多步輻射代價(jià);

      步驟4)傳感器調(diào)度。根據(jù)式(28)獲得跟蹤精度需求及工作時(shí)長約束下,具有最小輻射代價(jià)的傳感器;如果不存在可行解,則調(diào)度具有最小跟蹤誤差的傳感器;

      步驟5)重復(fù)步驟2)~4),直至任務(wù)結(jié)束。

      3 仿真實(shí)驗(yàn)

      考慮一個(gè)包含N=3個(gè)有源傳感器系統(tǒng),在三維空間內(nèi)跟蹤單個(gè)目標(biāo)。目標(biāo)初始位置為(8,50,5)km,傳感器位置分別為(0,0)km、(10,10)km和(0,10)km??紤]實(shí)際應(yīng)用,采樣間隔設(shè)為1 s,仿真總時(shí)間為60 s。仿真結(jié)果均為500次蒙特卡洛實(shí)驗(yàn)的平均。

      此外,ELI狀態(tài)量化為{1,2,3}(1代表較小值,2代表中等值,3代表較大值),瞬間觀測(cè)威脅度量化為{1,2,3}(1代表小增量,2代表中增量,3代表高增量)。為了不失一般性,假定傳感器3的測(cè)量噪聲最小,但其ELI狀態(tài)更易處于較高值。傳感器其他性能參數(shù)具體設(shè)置為:

      σr1=σr2=50 m,

      σθ1=σθ2=σφ1=σφ2=0.005 rad,

      σr3=10 m,σθ3=0.001 rad,σφ3=0.001 rad,

      仿真中,以工作時(shí)長約束τ1=τ3=3、τ2=4為例。同時(shí),為了驗(yàn)證本文調(diào)度方法的有效性,采用以下兩種常用調(diào)度策略進(jìn)行對(duì)比:1)最近調(diào)度策略(Closest Scheduling Policy,CSP)[7];2)無工作時(shí)長約束調(diào)度策略(Scheduling Policy without Timestep Constraint,SPTC)。

      3.1 不同閾值下,目標(biāo)均方根誤差對(duì)比

      圖1為不同閾值下,目標(biāo)均方根誤差(Root Mean Square Error,RMSE)對(duì)比。如圖所示,CSP根據(jù)傳感器與目標(biāo)距離調(diào)度最近的傳感器跟蹤目標(biāo),不同閾值下其跟蹤誤差幾乎不變,不能滿足跟蹤任務(wù)需求。相比于CSP,SPTC和本文方法均能跟蹤跟蹤任務(wù)需求調(diào)度合適的傳感器,由圖可知,在不同閾值下,SPTC和本文方法的RMSE曲線總體上均在閾值下方。進(jìn)一步,結(jié)合圖4可知,初始時(shí)刻由于目標(biāo)誤差較大,根據(jù)調(diào)度策略,其調(diào)度跟蹤誤差最小的傳感器以迅速滿足任務(wù)需求,符合實(shí)際應(yīng)用。

      3.2 不同閾值下,輻射代價(jià)與ELI值對(duì)比

      圖2和圖3分別為不同閾值下,歸一化累計(jì)輻射代價(jià)和歸一化累積ELI值對(duì)比。由圖2和圖4可知,由于CSP長時(shí)調(diào)度易處于高ELI值的傳感器(傳感器3),其歸一化累計(jì)輻射代價(jià)較高。而SPTC和本文方法能夠自適應(yīng)的選擇滿足任務(wù)需求且輻射代價(jià)小的傳感器跟蹤目標(biāo),其歸一化輻射代價(jià)要小于CSP。進(jìn)一步,結(jié)合圖4可知,相比于SPTC,本文方法以輻射代價(jià)稍有上升為代價(jià)有效避免了傳感器頻繁切換問題。此外,對(duì)比圖2和圖3可知,由于實(shí)際使用中不能獲知準(zhǔn)確的ELI,目標(biāo)函數(shù)(28)中的輻射代價(jià)設(shè)置為其期望值。結(jié)合仿真結(jié)果可知,輻射代價(jià)能夠有效地反映出真實(shí)的ELI值,驗(yàn)證了目標(biāo)函數(shù)的合理性。因此,本文方法能夠在工作時(shí)長約束下,有效地控制系統(tǒng)輻射。

      3.3 不同策略下,傳感器調(diào)度序列對(duì)比

      圖4為跟蹤精度閾值為100 m時(shí),CSP、SPTC及本文方法的傳感器調(diào)度序列。由圖可知,CSP一直選擇最近距離的傳感器跟蹤目標(biāo),而SPTC和本文方法能夠根據(jù)跟蹤任務(wù)需求自適應(yīng)的調(diào)度滿足要求的傳感器跟蹤目標(biāo)。進(jìn)一步,SPTC為了最大限度的降低系統(tǒng)輻射,頻繁的切換傳感器,嚴(yán)重不切合實(shí)際。相比之下,本文方法結(jié)合實(shí)際應(yīng)用,考慮工作時(shí)長約束,并根據(jù)輻射代價(jià)自適應(yīng)得控制傳感器工作時(shí)長,避免了頻繁切換問題。整個(gè)過程中,SPTC共發(fā)生了27次切換,而本文方法只有11次切換,平均切換時(shí)間間隔為5.5 s,更利于工程實(shí)現(xiàn)。

      4 結(jié)論

      本文提出了傳感器工作時(shí)長約束及輻射控制的調(diào)度方法??紤]跟蹤任務(wù)需求,在傳感器工作時(shí)長約束下,由傳感器輻射代價(jià)自適應(yīng)控制其工作時(shí)長。仿真結(jié)果驗(yàn)證了方法有效性和合理性,與CSP相比,本文方法能夠在滿足跟蹤任務(wù)需求下,獲得更小的輻射代價(jià);與無工作時(shí)長約束策略相比,本文方法在輻射代價(jià)稍有上升條件下,顯著降低了切換次數(shù),避免了頻繁切換問題,增強(qiáng)了系統(tǒng)穩(wěn)定性與實(shí)用性。

      參考文獻(xiàn):

      [1]Nayebi-Astaneh A,Pariz N,Naghibi-Sistani M. Adaptive node scheduling under accuracy constraint for wireless sensor nodes with multiple bearings-only sensing units[J]. IEEE Trans. on Aerospace and Electronic Systems,2015,51(2):1547-1557.

      [2]Kim Y,Bang H. Airborne multisensor management for multitarget tracking[C]//Proc. of the IEEE International Conference on Unmanned Aircraft Systems. us: IEEE, 2015:751-756.

      [3]吳巍,王國宏,雙煒,等. 多機(jī)載平臺(tái)多目標(biāo)跟蹤與輻射控制[J]. 系統(tǒng)工程與電子技術(shù),2012,34(3):495-501.

      [4]陳興凱,韓壯志,封吉平,等. 基于跟蹤精度的火控雷達(dá)網(wǎng)間歇開機(jī)控制策略[J]. 探測(cè)與控制學(xué)報(bào),2013 35(5):74-78.

      [5]吳衛(wèi)華,江晶,高嵐. 機(jī)載雷達(dá)輔助無源傳感器對(duì)雜波環(huán)境下機(jī)動(dòng)目標(biāo)跟蹤[J]. 控制與決策,2015,30(2):277-282.

      [6]楊海燕,尤政,王琳. 基于傳感器多模式調(diào)度的智能目標(biāo)跟蹤算法[J]. 控制理論與應(yīng)用,2012,29(9):1186-1192.

      [7]Zhang Z,Shan G. UTS‐based foresight optimization of sensor scheduling for low interception risk tracking[J]. International Journal of Adaptive Control and Signal Processing,2014,28(10):921-931.

      [8]Zhang Z,Shan G. Non-myopic sensor scheduling to track multiple reactive targets[J]. IET Signal Processing,2015,9(1):37-47.

      [9]張子寧,單甘霖,段修生. 基于部分可觀馬氏決策過程的多平臺(tái)主被動(dòng)傳感器調(diào)度[J]. 電子學(xué)報(bào),2014,42(10):2104-2109.

      [10]羅開平,姜維,李一軍. 傳感器管理述評(píng)[J]. 電子學(xué)報(bào),2010,38(8):1900-1907.

      [11]程洪瑋,王博,安瑋. 一種基于信息決策樹的低軌星座傳感器調(diào)度方法[J]. 電子學(xué)報(bào),2010,38(11):2630-2634.

      [12]Krishnamurthy V,Djonin D V. Optimal Threshold Policies for Multivariate POMDP in Radar Resource Management[J]. IEEE Transactions on Signal Processing,2009,57(10):3954-3969.

      [13]姜維,李一軍. 天基預(yù)警調(diào)度方法研究[J]. 系統(tǒng)工程理論與實(shí)踐,2012,32(9):2065-2077.

      [14]Wu X,Zhang K,Sun C. Optimal scheduling of multiple sensors in continuous time[J]. ISA Transactions,2014,53(3):793-801.

      [15]Krishnamurthy V. Emission management for low probability intercept sensors in network centric warfare[J]. Aerospace and Electronic Systems,IEEE Transactions on,2005,41(1):133-151.

      [16]Wu P,Li X,Kong J,et al. Heterogeneous multiple sensors joint tracking of maneuvering target in clutter[J]. Sensors,2015,15(7):17350-17365.

      [17]Charlish A,Hoffmann F. Anticipation in cognitive radar using stochastic control[C]//Proc. of the IEEE on Radar Conference,us: IEEE, 2015:1692-1697.

      [18]Roy A,Mitra D. Unscented kalman filter based multitarget tracking algorithms for airborne surveillance application[J]. Journal of Guidance,Control,and Dynamics,2016:1949-1966.

      [19]Krishnamuthy V,Evans R J. Hidden markov model multiarm bandits:A methodology for beam scheduling in multitarget tracking[J]. IEEE Transactions on Signal Processing,2001,49(12):2893-2908.

      猜你喜歡
      代價(jià)時(shí)刻約束
      冬“傲”時(shí)刻
      捕獵時(shí)刻
      “碳中和”約束下的路徑選擇
      約束離散KP方程族的完全Virasoro對(duì)稱
      愛的代價(jià)
      海峽姐妹(2017年12期)2018-01-31 02:12:22
      代價(jià)
      街拍的歡樂時(shí)刻到來了
      成熟的代價(jià)
      適當(dāng)放手能讓孩子更好地自我約束
      人生十六七(2015年6期)2015-02-28 13:08:38
      一天的時(shí)刻
      正镶白旗| 贵阳市| 武清区| 洛南县| 太仆寺旗| 马尔康县| 云林县| 重庆市| 晋江市| 深水埗区| 呼图壁县| 平遥县| 布拖县| 北海市| 阿图什市| 南华县| 惠东县| 海城市| 青龙| 西平县| 台州市| 布尔津县| 贵州省| 镇坪县| 汽车| 龙江县| 枣庄市| 伊宁县| 平湖市| 开封市| 安西县| 彩票| 黔西县| 南涧| 海口市| 鄂温| 苏尼特右旗| 綦江县| 宁海县| 禄丰县| 玉树县|