• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Cauchy-Schwarz散度的多傳感器控制

      2020-06-16 01:05:20楊小軍
      關(guān)鍵詞:散度后驗(yàn)濾波器

      吳 莎,楊小軍

      (長安大學(xué) 信息工程學(xué)院,陜西 西安 710064)

      0 引 言

      多目標(biāo)跟蹤多傳感器技術(shù)無論在軍事領(lǐng)域還是在民事領(lǐng)域均有廣泛的應(yīng)用,它可用于探測、跟蹤和攻擊、機(jī)器視覺等[1-2]。隨著目標(biāo)的增多,多傳感器對(duì)于目標(biāo)的跟蹤相較于單傳感器有著明顯的優(yōu)勢,它對(duì)于目標(biāo)信息的獲取有著重大的意義,提高了對(duì)目標(biāo)狀態(tài)估計(jì)的精確性和系統(tǒng)的可信度。由于通信和計(jì)算的限制,需要把每個(gè)傳感器控制在適當(dāng)?shù)奈恢茫拐麄€(gè)系統(tǒng)達(dá)到最優(yōu)。那么對(duì)于諸多傳感器采取合適的決策成為必要解決的問題。在大多數(shù)目標(biāo)跟蹤場景中,可以通過對(duì)傳感器的位置、方向等工作方式及參數(shù)進(jìn)行調(diào)控而獲得不同的量測數(shù)據(jù),從而提高傳感器檢測目標(biāo)的能力和系統(tǒng)的估計(jì)性能,實(shí)現(xiàn)整體系統(tǒng)優(yōu)化。

      1997年隨機(jī)有限集(random finite set,RFS)的提出,避免了多目標(biāo)跟蹤航跡關(guān)聯(lián)的復(fù)雜問題,它允許多傳感器多目標(biāo)濾波適應(yīng)統(tǒng)一的隨機(jī)集框架進(jìn)行數(shù)據(jù)融合[3]。其最大優(yōu)勢是可以將多目標(biāo)跟蹤和傳感器控制統(tǒng)一描述為一個(gè)貝葉斯框架下部分可觀測的馬爾可夫決策過程(partially observed Markov decision process,POMDP)[4]。但RFS不能對(duì)目標(biāo)進(jìn)行唯一標(biāo)識(shí),進(jìn)而Vo等學(xué)者在2013年提出帶標(biāo)簽隨機(jī)有限集(labeled random finite set,LRFS)的概念,并且提出了廣義帶標(biāo)簽的多伯努利(generalized labeled Multi-Bernoulli filter,GLMB)濾波器。δ-廣義帶標(biāo)簽的多伯努利(δ-GLMB)和帶標(biāo)簽的多伯努利(LMB)濾波器都是GLMB濾波器的特殊形式,GLMB和δ-GLMB因含有多組分量從而在迭代過程中呈指數(shù)形式增長導(dǎo)致計(jì)算復(fù)雜的問題,而LMB濾波器在定義中只包含一組組件,所以其在迭代過程中的假設(shè)分量呈線性增長,有效地解決了GLMB和δ-GLMB計(jì)算難的問題。由于LMB濾波器計(jì)算效率高,精確地產(chǎn)生目標(biāo)航跡而得到廣泛應(yīng)用。

      多傳感器管理是通過優(yōu)化決策對(duì)傳感器進(jìn)行配置。評(píng)價(jià)函數(shù)是產(chǎn)生決策集的重要指標(biāo)[5],評(píng)價(jià)函數(shù)可大致分為成本函數(shù)和回報(bào)函數(shù):成本函數(shù)主要包括估計(jì)目標(biāo)勢方差[6]、勢和狀態(tài)后驗(yàn)期望誤差(PEECS)[7]、最優(yōu)子模式分配(OSPA)距離[8]。成本函數(shù)在單目標(biāo)跟蹤中能發(fā)揮其性能,但在多目標(biāo)跟蹤中仍有一定挑戰(zhàn)?;貓?bào)函數(shù)是基于信息論的,在目標(biāo)跟蹤領(lǐng)域,基于信息論的傳感器控制的主要目的是為了通過與目標(biāo)環(huán)境的相互作用以減少目標(biāo)環(huán)境的不確定性,這種不確定性可以用信息熵來定性描述[9]。回報(bào)函數(shù)最常用一些信息散度,如Rényi散度、Kullback-Leibler(KL)散度和Cauchy-Schwarz(CS)散度。Hoang等人推導(dǎo)出兩種泊松點(diǎn)過程混合物的柯西-施瓦茨散度的封閉形式[10],因此與基于信息論的其他散度相比,CS散度在數(shù)學(xué)計(jì)算上更加簡單。文獻(xiàn)[11]的結(jié)果顯示CS和KL雖具有相似的計(jì)算趨勢,但CS的計(jì)算要快得多,特別是在維度高的情況下更高效,故選取CS散度作為評(píng)價(jià)函數(shù)對(duì)于多傳感器管理的研究更為合適。

      對(duì)于多目標(biāo)跟蹤多傳感器控制問題,傳感器的管理決策需要信息融合結(jié)果的支持,并通過對(duì)傳感器資源的合理調(diào)度來提高信息融合的質(zhì)量和效率[12]。廣義交叉協(xié)方差(GCI)被廣泛地應(yīng)用于分布式多傳感器多目標(biāo)跟蹤中,但其存在標(biāo)簽不一致的問題。在文獻(xiàn)[13-14]中解決此問題的方法是將目標(biāo)的標(biāo)簽在融合時(shí)去掉從而避免標(biāo)簽不一致帶來的影響。未帶標(biāo)簽的后驗(yàn)密度進(jìn)行GCI融合確實(shí)避免了標(biāo)簽對(duì)GCI信息融合的影響,但是因?yàn)槿サ袅藰?biāo)簽而不能產(chǎn)生跟蹤軌跡,因此文獻(xiàn)[15]提出了魯棒GCI融合(R-GCI),保留后驗(yàn)密度的標(biāo)簽,在不丟失目標(biāo)軌跡的情況下對(duì)信息進(jìn)行融合但卻不會(huì)因標(biāo)簽的錯(cuò)誤匹配對(duì)GCI融合產(chǎn)生影響,通過融合后的密度使傳感器的數(shù)據(jù)得到有效結(jié)合,實(shí)現(xiàn)了對(duì)目標(biāo)更好的估計(jì)[16]。

      文中在LMB濾波器框架下,通過選用最優(yōu)傳感器控制決策對(duì)目標(biāo)進(jìn)行更加精確的跟蹤。首先敘述了預(yù)備知識(shí):LMB濾波器、Cauchy-Schwarz散度、R-GCI多目標(biāo)密度融合準(zhǔn)則;然后講述LMB濾波器和CS散度的SMC執(zhí)行并給出多傳感器管理的具體算法步驟;最后通過仿真驗(yàn)證了提出的算法的有效性。

      1 預(yù)備知識(shí)和問題描述

      1.1 LMB濾波器

      LMB濾波器可以實(shí)現(xiàn)目標(biāo)跟蹤的要求,首先,對(duì)RFS加入標(biāo)簽將目標(biāo)的狀態(tài)擴(kuò)展為X={(xi,i)}(i=1,2,…,|X|),xi∈,i∈,為目標(biāo)狀態(tài)空間,是標(biāo)簽空間,|·|表示目標(biāo)的勢。LMB RFS可以用參數(shù){(r,p(·):∈)}完全表示,這里的r∈[0,1]是目標(biāo)標(biāo)簽的存在概率,p(·)是目標(biāo)狀態(tài)的概率密度函數(shù)。LMB RFS密度如下:

      (1)

      其中:

      (2)

      (3)

      (4)

      1.2 柯西-施瓦茲(CS)散度

      CS散度是基于內(nèi)積的柯西-施瓦茲不等式的對(duì)稱量測距離[18-19],其描述的是兩個(gè)密度函數(shù)f(x)和g(x)之間信息含量的差異性。CS散度的定義如下:

      (5)

      其中,f(X)和g(X)分別表示目標(biāo)預(yù)測密度和目標(biāo)后驗(yàn)密度,上式的積分是集積分。

      Hong等人在文獻(xiàn)[19]中提出泊松點(diǎn)過程的CS散度并證明了兩個(gè)泊松點(diǎn)過程之間的CS散度是它們各自強(qiáng)度函數(shù)之間距離的平方的一半,兩個(gè)泊松點(diǎn)過程的CS散度的公式表達(dá)為:

      (6)

      其中,G1和G2分別是泊松點(diǎn)過程預(yù)測密度和更新密度的強(qiáng)度函數(shù),K表示單目標(biāo)狀態(tài)的(超體積)測量單位。上述公式是計(jì)算兩個(gè)帶標(biāo)簽多伯努利密度之間的CS散度的基礎(chǔ),在第二部分會(huì)給出CS散度的具體計(jì)算。

      1.3 LMB多目標(biāo)概率密度的魯棒GCI融合

      Mahler提出次優(yōu)的廣義交叉協(xié)方差(generalized covariance intersection,GCI)準(zhǔn)則以解決最優(yōu)融合準(zhǔn)則在實(shí)際中計(jì)算昂貴且公共信息計(jì)算難的問題。GCI準(zhǔn)則如下:

      (7)

      其中,ωi是恒定權(quán)重,表示在融合過程中強(qiáng)調(diào)傳感器i的強(qiáng)度。式(7)中的后驗(yàn)密度是未帶標(biāo)簽的,文獻(xiàn)[15]提出了帶標(biāo)簽后驗(yàn)密度的魯棒GCI融合準(zhǔn)則。

      文獻(xiàn)[15]先定義了多標(biāo)簽的聯(lián)合條件概率密度:

      (8)

      帶標(biāo)簽的融合后驗(yàn)密度為:

      (9)

      (10)

      (11)

      多目標(biāo)的狀態(tài)是由N個(gè)傳感器進(jìn)行觀測,每個(gè)傳感器返回一組量測值,Zi是第i個(gè)傳感器返回的量測,量測空間為,設(shè)累積的量測集為:

      Ik=(Z1,…,ZN)∈

      (12)

      多傳感器控制問題可以轉(zhuǎn)化為部分可觀測馬爾可夫決策過程(POMDP),POMDP定義為一個(gè)6元組:

      Ψ={,,f(·|·),,g(·|·),R(u1,…,uN)}

      (13)

      在控制問題上,目標(biāo)函數(shù)R(u1,…,uN)采用CS散度,CS散度是用預(yù)測和后驗(yàn)多目標(biāo)密度距離之間的關(guān)系表示的:

      R(u1,…,uN)=DCS(π+,πs,u)

      (14)

      其中,π+是融合預(yù)測密度,πs,u是融合后驗(yàn)密度。最優(yōu)決策集是通過最大化目標(biāo)函數(shù)的期望值:

      (15)

      2 基于SMC的多目標(biāo)多傳感器控制問題求解

      文獻(xiàn)[20]中討論了三種抵消未來量測不確定性的方法,預(yù)測理想量測集(predicted ideal measurement set,PIMS)是其中能更好地產(chǎn)生傳感器管理決策的方法。故選用PIMS作為更新步驟中所需的假設(shè)量測。對(duì)于每個(gè)決策ui∈,利用每個(gè)狀態(tài)估計(jì)產(chǎn)生無噪聲和無雜波的量測,這樣的一組量測作為PIMS,用表示:

      (16)

      2.1 LMB濾波器的SMC執(zhí)行

      多目標(biāo)后驗(yàn)密度f(X|Z)可以通過一組隨機(jī)粒子Xj進(jìn)行近似,每個(gè)粒子都有合適的權(quán)重。目標(biāo)的帶標(biāo)簽多伯努利密度π={r,p},目標(biāo)的狀態(tài)密度p(x)可以用一組粒子集進(jìn)行近似:

      (17)

      其中,J是目標(biāo)采樣的粒子數(shù)目;ω是每個(gè)粒子的權(quán)重;δY(X)是狄利克雷函數(shù),當(dāng)X=Y時(shí)等于1,其他等于0。下面介紹LMB濾波器用SMC實(shí)現(xiàn)的預(yù)測和更新方程。

      預(yù)測:在這里考慮目標(biāo)的存活和新生兩種,所以LMB預(yù)測多目標(biāo)密度的參數(shù)可以表示為:

      (18)

      其中:

      (19)

      (20)

      ηS()=〈pS(·,),p(·)〉

      (21)

      更新:傳感器i將相應(yīng)的控制決策u∈和理想量測集應(yīng)用于濾波器更新,更新的LMB密度為:

      (22)

      根據(jù)文獻(xiàn)[22]得出的LMB更新方程,LMB密度的各個(gè)參數(shù)如下:

      (23)

      (24)

      其中:

      (25)

      (26)

      (27)

      (28)

      (29)

      2.2 基于SMC的R-GCI融合

      (30)

      將式(29)帶入式(13)和式(14)中,用粒子表示融合參數(shù):

      (31)

      (32)

      (33)

      2.3 CS散度的SMC實(shí)現(xiàn)

      結(jié)合上面LMB預(yù)測和更新方程對(duì)CS散度進(jìn)行SMC執(zhí)行。預(yù)測和更新的LMB強(qiáng)度函數(shù)為:

      (34)

      (35)

      對(duì)多目標(biāo)后驗(yàn)分布最有效的近似是多目標(biāo)分布的一階矩[22]。文獻(xiàn)[9]證明了關(guān)于兩個(gè)多伯努利強(qiáng)度函數(shù)的CS散度的公式表達(dá),由此得出兩個(gè)LMB密度的CS散度公式:

      (36)

      根據(jù)δ函數(shù)的積分特性,回報(bào)函數(shù)為:

      (37)

      采用逼近之后,問題(15)最優(yōu)決策的求解為:

      (38)

      其中,M是采樣的粒子數(shù)。

      綜上所述,由于積分計(jì)算難的問題,采用SMC逼近融合密度和CS散度以對(duì)最優(yōu)決策進(jìn)行求解,問題(15)的算法總結(jié)如下。

      算法1:濾波器迭代、融合和多傳感器控制算法。

      Step1:根據(jù)式(14)~式(17)的預(yù)測步進(jìn)行預(yù)測:預(yù)測

      Step2:計(jì)算回報(bào)函數(shù):

      (1)對(duì)于每個(gè)粒子X(j)∈T和控制決策(u1,…,uN)∈,計(jì)算理想量測集:

      (2)根據(jù)式(19)~式(25)更新LMB,并保存后驗(yàn)參數(shù)和粒子:

      (3)對(duì)于每個(gè)粒子X(j)∈T,每一個(gè)控制決策(u1,…,uN)∈的R-GCI融合:

      (4)計(jì)算每個(gè)回報(bào)函數(shù):DCS(π+,πu)→R(j)(u1,…,uN)。

      求解最優(yōu)問題(38)是對(duì)N個(gè)傳感器并行求解,這是一個(gè)NP難的問題,計(jì)算復(fù)雜度隨著傳感器個(gè)數(shù)的增加而呈指數(shù)增加,求解有很大的挑戰(zhàn)。而局部迭代搜索[23]是多項(xiàng)式難的問題,在實(shí)際中是可行的。故采用局部迭代搜索的方法尋找次優(yōu)解。

      算法2:局部迭代搜索算法。

      Step1:選擇一組初始決策。

      Step2:在初始解的鄰域內(nèi)搜索更好的解。

      (3)將余下的傳感器重復(fù)(1)、(2)的操作,直到所有的傳感器都重新選擇決策;

      (4)對(duì)每一個(gè)傳感器的決策都進(jìn)行選擇,直到窮舉完每個(gè)傳感器的最大決策數(shù),選取使回報(bào)函數(shù)最大的決策集。

      3 仿真分析

      pB=diag([50; 50; 50; 50; 6(pi/180)]T)2。

      傳感器測量的是具有噪聲的極坐標(biāo)矢量形式:

      其中,σD=10 000 m控制檢測概率的速率隨著范圍增大而減小。目標(biāo)的存活概率pS,k(x)=0.98,單位體積的平均雜波數(shù)目λc=12。

      傳感器平臺(tái)以8 m/s的恒定速度移動(dòng),但在預(yù)先指定的決策時(shí)間改變航向。每個(gè)傳感器允許的控制集合是ui=[-1800,-1500,…,00,…,1500,1800],樣本數(shù)量為M=103,測試場景由三個(gè)目標(biāo)和兩個(gè)傳感器組成,觀測時(shí)間是60 s,用兩個(gè)傳感器對(duì)三個(gè)目標(biāo)進(jìn)行跟蹤,每個(gè)傳感器每隔10 s做一次決策,10 s內(nèi)傳感器保持當(dāng)前運(yùn)動(dòng)方向不變,每次時(shí)間末重新決策,考慮是否改變傳感器的運(yùn)動(dòng)方向,在仿真時(shí)間60 s內(nèi),每個(gè)傳感器共做6次決策。局部濾波器是LMB濾波器,每個(gè)節(jié)點(diǎn)的GCI融合權(quán)重選取0.5。

      圖1 目標(biāo)的真實(shí)運(yùn)動(dòng)軌跡

      如圖1所示,目標(biāo)的起始和結(jié)束分別用○和△符號(hào)表示,每個(gè)目標(biāo)的出生和死亡時(shí)間不同,分別在圖中標(biāo)注,圖中兩個(gè)傳感器所在位置為初始位置。

      圖2 傳感器運(yùn)動(dòng)軌跡

      如圖2所示,帶箭頭的線為兩個(gè)傳感器的運(yùn)動(dòng)軌跡;由圖可看出兩個(gè)傳感器靠近目標(biāo)運(yùn)動(dòng),可知,提出的控制方法可以做出傳感器靠近目標(biāo)運(yùn)動(dòng)的正確決策。

      如圖3所示,對(duì)目標(biāo)的跟蹤性能,局部迭代的搜索法尋找的次優(yōu)解與窮舉法的最優(yōu)解的性能相近,而隨機(jī)決策對(duì)應(yīng)的OSPA距離峰值時(shí)間滯后且誤差大。所以,當(dāng)傳感器數(shù)量多且難以計(jì)算時(shí),用局部迭代搜索法替代窮舉法是可行的。

      圖3 OSPA距離對(duì)比

      4 結(jié)束語

      對(duì)多傳感器多目標(biāo)跟蹤問題,文中提出一種多傳感器最優(yōu)控制策略。選擇CS散度作為系統(tǒng)性能評(píng)價(jià)函數(shù),通過最大化回報(bào)函數(shù)實(shí)現(xiàn)多個(gè)傳感器的最優(yōu)控制。在隨機(jī)有限集框架下,采用LMB濾波器獲得多目標(biāo)的航跡估計(jì),并且基于保留標(biāo)簽的R-GCI融合準(zhǔn)則對(duì)多傳感器多目標(biāo)航跡估計(jì)進(jìn)行分布式融合?;赟MC逼近,得到多目標(biāo)概率密度之間CS散度的數(shù)值求解,并且給出基于SMC的LMB濾波器和R-GCI融合地逼近執(zhí)行。在此基礎(chǔ)上提出一種基于局部迭代搜索的傳感器控制策略的次優(yōu)算法。后續(xù)工作包括尋找更加有效的多傳感器航跡融合方法和優(yōu)化算法。

      猜你喜歡
      散度后驗(yàn)濾波器
      基于無擾濾波器和AED-ADT的無擾切換控制
      帶勢加權(quán)散度形式的Grushin型退化橢圓算子的Dirichlet特征值的上下界
      基于對(duì)偶理論的橢圓變分不等式的后驗(yàn)誤差分析(英)
      具有部分BMO系數(shù)的非散度型拋物方程的Lorentz估計(jì)
      貝葉斯統(tǒng)計(jì)中單參數(shù)后驗(yàn)分布的精確計(jì)算方法
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      開關(guān)電源EMI濾波器的應(yīng)用方法探討
      電子制作(2018年16期)2018-09-26 03:26:50
      H型群上一類散度形算子的特征值估計(jì)
      一種基于最大后驗(yàn)框架的聚類分析多基線干涉SAR高度重建算法
      H?rmander 向量場上散度型拋物方程弱解的Orlicz估計(jì)
      东乡| 密山市| 什邡市| 新疆| 登封市| 会同县| 海林市| 洛隆县| 武功县| 镇平县| 阿坝| 泊头市| 黔东| 西昌市| 格尔木市| 茂名市| 隆昌县| 福泉市| 蕉岭县| 北流市| 延吉市| 永川市| 松溪县| 石屏县| 安西县| 湖南省| 岳阳市| 巴东县| 海口市| 顺昌县| 汽车| 英山县| 景德镇市| 鄂伦春自治旗| 香港| 高邑县| 彭州市| 昔阳县| 吉首市| 东丰县| 天峨县|