衛(wèi)楊勇,徐世友,辛玉林,陳曾平
(國(guó)防科技大學(xué)ATR國(guó)防科技重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙410073)
基于分辨力增益的綜合識(shí)別傳感器管理方法?
衛(wèi)楊勇,徐世友,辛玉林,陳曾平
(國(guó)防科技大學(xué)ATR國(guó)防科技重點(diǎn)實(shí)驗(yàn)室,長(zhǎng)沙410073)
為提高目標(biāo)綜合識(shí)別的效能,需對(duì)綜合識(shí)別系統(tǒng)中多種傳感器資源進(jìn)行科學(xué)管理。在分析綜合識(shí)別中目標(biāo)優(yōu)先級(jí)和傳感器使用約束條件的基礎(chǔ)上,建立了利用分辨力增益作為傳感器資源管理優(yōu)化準(zhǔn)則的目標(biāo)函數(shù),提出了利用傳感器混淆矩陣的預(yù)測(cè)分辨力增益計(jì)算方法,并將粒子群優(yōu)化算法引入傳感器-目標(biāo)分配NP-hard問(wèn)題的求解中。仿真結(jié)果表明該方法合理高效。
綜合識(shí)別;傳感器管理;分辨力增益;混淆矩陣;粒子群優(yōu)化
現(xiàn)代戰(zhàn)爭(zhēng)中,戰(zhàn)場(chǎng)態(tài)勢(shì)瞬息萬(wàn)變,快速、精確、高效地識(shí)別目標(biāo)屬性是獲取戰(zhàn)場(chǎng)態(tài)勢(shì)的有力保證,采用單一傳感器很難實(shí)現(xiàn)對(duì)所有目標(biāo)的高置信度識(shí)別,需要充分利用多種傳感器各自的優(yōu)勢(shì),建立目標(biāo)綜合識(shí)別系統(tǒng)。
為提高目標(biāo)綜合識(shí)別系統(tǒng)的目標(biāo)識(shí)別效能,需要對(duì)多傳感器的使用進(jìn)行科學(xué)合理的管理。當(dāng)前,傳感器管理方面的研究大多針對(duì)目標(biāo)檢測(cè)跟蹤問(wèn)題[1-4],主要通過(guò)建立可量化的目標(biāo)函數(shù)對(duì)傳感器資源進(jìn)行管理,以使目標(biāo)檢測(cè)跟蹤的效能更優(yōu)。而目標(biāo)識(shí)別是較檢測(cè)跟蹤更高層次的信息處理,信息的不確定性及其合理描述使得綜合識(shí)別系統(tǒng)傳感器管理目標(biāo)函數(shù)的選取和量化更為困難,從而加大了傳感器管理的難度。文獻(xiàn)[5]針對(duì)目標(biāo)融合識(shí)別問(wèn)題,提出了基于不確定性推理和模糊控制策略的傳感器管理方法,但方法均是基于傳感器觀測(cè)預(yù)測(cè)已知的情況,對(duì)于管理過(guò)程中預(yù)測(cè)信息的獲取問(wèn)題沒有涉及。
本文針對(duì)目標(biāo)綜合識(shí)別系統(tǒng)多傳感器多目標(biāo)問(wèn)題的特點(diǎn),綜合考慮目標(biāo)優(yōu)先級(jí)和傳感器資源的使用約束條件,建立了基于分辨力增益的傳感器資源管理優(yōu)化模型;同時(shí),利用混淆矩陣表征傳感器識(shí)別性能,給出了綜合識(shí)別系統(tǒng)中傳感器對(duì)目標(biāo)識(shí)別的預(yù)測(cè)分辨力增益量化計(jì)算方法;在此基礎(chǔ)上,針對(duì)傳感器-目標(biāo)分配的組合爆炸現(xiàn)象,采用粒子群優(yōu)化算法實(shí)現(xiàn)分配策略的快速求解;最后,通過(guò)設(shè)定綜合識(shí)別場(chǎng)景,對(duì)該方法的性能進(jìn)行了仿真分析。
傳感器管理是一個(gè)控制過(guò)程,其核心是依據(jù)一定的最優(yōu)準(zhǔn)則,建立一個(gè)易于量化的目標(biāo)函數(shù),而后在傳感器使用約束條件下通過(guò)優(yōu)化目標(biāo)函數(shù)來(lái)選擇工作傳感器及其模式和參數(shù)[6]。
假定某目標(biāo)綜合系統(tǒng)包含S個(gè)基本傳感器,所在區(qū)域中有T個(gè)待識(shí)別目標(biāo)??紤]同一時(shí)刻可能不止一個(gè)傳感器分配給相同目標(biāo),因此引入偽傳感器[4]的概念,這樣在同一時(shí)刻至多有一個(gè)傳感器(基本傳感器或偽傳感器)分配給一個(gè)目標(biāo)。傳感器(基本傳感器或偽傳感器)i(i=1,2,…,2S-1)分配給目標(biāo)j(j=1,2,…,T)記為eij=1,否則eij=0,則由eij構(gòu)成(2S-1)×T階分配矩陣。同時(shí)設(shè)基本傳感器i最大同時(shí)量測(cè)目標(biāo)個(gè)數(shù)為li(i=1,2,…,S),J(i)為包含基本傳感器i的所有傳感器組合(基本傳感器和偽傳感器)的編號(hào)構(gòu)成的整數(shù)集合,由此得到目標(biāo)綜合識(shí)別系統(tǒng)多傳感器資源管理分配模型的約束條件為
目標(biāo)綜合識(shí)別系統(tǒng)中采用多傳感器的目的就是不斷獲取目標(biāo)環(huán)境信息,以減少對(duì)目標(biāo)環(huán)境特性認(rèn)識(shí)的不確定性。分辨力[7]是表征信息不確定性的一種有效方法,與信息熵不同之處在于其本身可度量信息量的大小,具有描述容易且較直接等固有優(yōu)勢(shì)。設(shè)一有限離散集合,其元素k(k=0,1,…,K)互斥,P(k)和Q(k)是關(guān)于元素k的兩個(gè)概率分布,則P(k)和Q(k)間的分辨力為
顯然,可以通過(guò)計(jì)算目標(biāo)識(shí)別前后的分辨力來(lái)表征信息量的變化。具體地,對(duì)于某目標(biāo),通過(guò)計(jì)算第n次識(shí)別的Dn和第n+1次識(shí)別前其分辨力預(yù)測(cè)期望值E(Dn+1|n),計(jì)算得到預(yù)測(cè)分辨力增益為ΔD =E(Dn+1|n)-Dn。ΔD越大對(duì)應(yīng)的目標(biāo)更需要傳感器對(duì)它做進(jìn)一步識(shí)別,這就是基于分辨力增益的傳感器資源分配的基本原則。
同時(shí),當(dāng)待識(shí)別目標(biāo)數(shù)目多,且傳感器資源有限時(shí),在分配過(guò)程中還需要綜合考慮目標(biāo)的優(yōu)先級(jí)[8]。設(shè)目標(biāo)j的優(yōu)先級(jí)系數(shù)為Aj,傳感器i對(duì)目標(biāo)j的分辨力增益表示為ΔDij,則傳感器資源分配問(wèn)題可描述為在滿足上述給出的約束條件下使目標(biāo)函數(shù)最大,即:
通過(guò)求取各傳感器與目標(biāo)分配組合所得的目標(biāo)函數(shù)值,從中選最大值所對(duì)應(yīng)的分配結(jié)果即為所求。
由第2節(jié)的分析可知,在利用分辨力增益構(gòu)造目標(biāo)函數(shù)的過(guò)程中,如何計(jì)算下一時(shí)刻傳感器i對(duì)目標(biāo)j的分辨力增益預(yù)測(cè)值是核心問(wèn)題。假設(shè)目標(biāo)屬于不同類型的先驗(yàn)概率P(h)已知,經(jīng)過(guò)n次量測(cè)后,各目標(biāo)屬于不同類型的后驗(yàn)概率相對(duì)于先驗(yàn)概率的分辨力為
注意到n-1次量測(cè)后,第n次量測(cè)的概率密度函數(shù)為
則分辨力一步預(yù)測(cè)的期望值為
因此,可得分辨力增益預(yù)測(cè)值為
容易看出,基于分辨力增益的傳感器資源分配求解是一個(gè)組合爆炸的NP-hard問(wèn)題。雖然傳統(tǒng)的數(shù)學(xué)規(guī)劃方法在理論上能得到最優(yōu)解,但受到問(wèn)題維數(shù)的制約往往不滿足實(shí)際要求。本文采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法[9]得到符合要求的滿意解。
PSO算法是由Kennedy和Eberhart在研究鳥類和魚類的群體行為基礎(chǔ)上于1995年提出的一種群智能算法,其基本思想是通過(guò)群體中個(gè)體之間的協(xié)作和信息共享來(lái)尋找最優(yōu)解。PSO算法同遺傳算法類似,是一種基于迭代的優(yōu)化工具,但沒有遺傳算法復(fù)雜的交叉以及變異過(guò)程。
在PSO中,每個(gè)優(yōu)化問(wèn)題的解被抽象為N維空間中沒有質(zhì)量和體積的粒子,每個(gè)粒子都有一個(gè)由待優(yōu)化函數(shù)決定的適應(yīng)值(fitness value)來(lái)決定其移動(dòng)方向及速度。每個(gè)粒子都有到目前為止本身找到的最優(yōu)解(pBest)和群體中所有粒子找到的最優(yōu)解(gBest),粒子通過(guò)跟蹤這兩個(gè)極值并采用如下公式來(lái)更新自己的位置[10]:
式中,Vid是粒子當(dāng)前速度,xid是粒子當(dāng)前的位置,pid是個(gè)體極值pBest,pgd是全局極值gBest,rand是(0,1)區(qū)間的隨機(jī)數(shù),c1和c2是學(xué)習(xí)因子,w是慣性
因子,表征了粒子上一次的速度對(duì)本次飛行速度的影響。粒子進(jìn)化過(guò)程中動(dòng)態(tài)改變慣性因子的取值可以有效改善PSO陷入局部最優(yōu)。這里給出一種常用的改進(jìn)策略[10],即速度更新公式中的慣性因子由最大慣性因子wmax線性減小到最小慣性因子wmin,計(jì)算式為
式中,iter為當(dāng)前迭代數(shù),itermax為總的迭代次數(shù)。
每一維粒子的速度都會(huì)被限制在最大速度Vmax以內(nèi),如果某一維速度更新后超過(guò)Vmax,那么這一維的速度就被限定為Vmax。則基于PSO的多傳感器資源管理分配算法的步驟如下:
Step 1:綜合考慮各因素,確定目標(biāo)的優(yōu)先級(jí)系數(shù)值,建立基于分辨力增益的傳感器資源管理目標(biāo)函數(shù)及其約束條件;
Step 2:初始化PSO算法的各項(xiàng)參數(shù),在約束條件確定的搜索范圍內(nèi)隨機(jī)初始化粒子的位置xid和速度Vid,粒子的維數(shù)可視為可供選擇的傳感器數(shù)目,即2S-1;
Step 3:根據(jù)傳感器資源管理優(yōu)化目標(biāo)函數(shù)計(jì)算每個(gè)粒子的適應(yīng)值;
Step 4:將每個(gè)粒子當(dāng)前的適應(yīng)值與其歷史最好值pBest進(jìn)行比較,如果優(yōu)于pBest,則將當(dāng)前的適應(yīng)值作為新的個(gè)體最優(yōu)pBest;同理,比較每個(gè)粒子的個(gè)體最優(yōu)值pBest和群體最優(yōu)值gBest,選出新的gBest;
Step 5:根據(jù)速度更新公式和位置更新公式更新每個(gè)粒子的速度Vid和位置xid;
Step 6:如果沒有達(dá)到迭代終止的條件,則轉(zhuǎn)到Step 3繼續(xù)執(zhí)行。否則,保存gBest,算法結(jié)束。
假定由兩個(gè)基本傳感器{s1,s2}組成的綜合識(shí)別系統(tǒng),系統(tǒng)觀測(cè)區(qū)域中有5個(gè)目標(biāo)(tar1,tar2,…,tar5)待識(shí)別,各目標(biāo)的優(yōu)先級(jí)系數(shù)分別為(0.5,0.5,1.0,1.0,1.5)。假設(shè)每個(gè)基本傳感器最多可同時(shí)作用于3個(gè)目標(biāo)上。將基本傳感器擴(kuò)展成包括偽傳感器在內(nèi)的3個(gè)傳感器,其中s1、s2是基本傳感器,s3={s1,s2}為偽傳感器。
假定有3種目標(biāo)類型A、B和C,由日常訓(xùn)練學(xué)習(xí)得到的各傳感器(含偽傳感器)識(shí)別各類型目標(biāo)的混淆矩陣為
前一時(shí)刻量測(cè)完畢,各目標(biāo)為不同類型(A、B、C)的概率如表1所示(上下為兩組)。
根據(jù)式(8)計(jì)算各傳感器對(duì)目標(biāo)的ΔD(ij)n,得到傳感器對(duì)目標(biāo)的一步預(yù)測(cè)分辨力增益值如表2所示(對(duì)應(yīng)表1中的兩組)。
由式(3)的目標(biāo)函數(shù),根據(jù)前一節(jié)基于PSO的多傳感器資源管理分配算法的步驟,在滿足約束條件下求得分配矩陣,進(jìn)而得到傳感器-目標(biāo)的分配結(jié)果。
根據(jù)問(wèn)題的復(fù)雜程度,選擇粒子群優(yōu)化算法的初始化參數(shù)為:粒子群中粒子的個(gè)數(shù)為10,wmax為0.9,wmin為0.4,c1=c2=2.05,Vmax為3.0,itermax為30。最終得到傳感器-目標(biāo)的分配結(jié)果分別為:tar1
按照此結(jié)果進(jìn)行分配所獲取總的預(yù)測(cè)分辨力增益值分別為9.396 7和8.176 5。由表1可知,對(duì)于目標(biāo)為何種類型而言,第二組數(shù)據(jù)較第一組更明確,也即第二組數(shù)據(jù)對(duì)于目標(biāo)類型信息的不確定性較小,最后能獲取總的預(yù)測(cè)分辨力增益也比第一組的小,這也符合分辨力表征信息量的本質(zhì)。
從仿真結(jié)果可以看出,第一組中,傳感器s1分配給目標(biāo)tar1和tar3,而在第二組中分配給了tar2和tar3,兩組的偽傳感器s3均分配給了tar5,第二組中的傳感器s2分配給了目標(biāo)tar4,這些分配均能使同一目標(biāo)的傳感器-目標(biāo)分配組合中預(yù)測(cè)分辨力增益最大。第一組中傳感器s2分配給目標(biāo)tar2和tar4,第二組中分配給了目標(biāo)tar1,雖然只能獲取次大預(yù)測(cè)分辨力增益,但是能使各傳感器獲取各目標(biāo)總的預(yù)測(cè)分辨力增益最大,且傳感器資源也得到了充分利用。總之,算法在滿足約束條件的前提下,總是試圖將傳感器分配給能得到更大預(yù)測(cè)分辨力增益的目標(biāo),也就是使之能得到更多的信息;同時(shí)能看到,性能最優(yōu)的偽傳感器s3均分配給了優(yōu)先級(jí)系數(shù)值最高的目標(biāo)tar5,即在一定程度上向優(yōu)先級(jí)高的目標(biāo)傾斜,這與實(shí)際要求也是一致的。
PSO算法進(jìn)化曲線如圖1所示,通過(guò)對(duì)100次仿真的每次迭代結(jié)果取平均可以看出,算法不失一般性且具有較快的收斂速度。同時(shí)仿真也表明,在更多傳感器和目標(biāo)的情況下,此方法也是高效可行的,是解決組合爆炸問(wèn)題的有效手段。
針對(duì)多傳感器-多目標(biāo)綜合識(shí)別問(wèn)題的特點(diǎn),本文將分辨力增益概念引入目標(biāo)綜合識(shí)別系統(tǒng)中的傳感器管理,提出了基于傳感器混淆矩陣的目標(biāo)函數(shù)量化計(jì)算方法,并利用PSO算法較好地解決了傳感器-目標(biāo)分配的NP-hard問(wèn)題。仿真結(jié)果表明該方法的合理性及高效性。對(duì)PSO算法的改進(jìn)以及其它期望分辨力增益計(jì)算方法的研究,是本文下一步的方向。
[1]Wegrzyn J,Kastella K.Intelligent Sensor Management to Minimize Detection Error[C]//Proceedings of SPIE.Orlando,F(xiàn)L:IEEE,2003:502-513.
[2]Maheswararajah S,Halgamuge S K,Premaratne M.Sensor Scheduling for Target Tracking by Suboptimal Algorithms[J]. IEEE Transactions on Vehicular Technology,2009,58(3):1467-1479.
[3]Aeron S,Saligrama V,Castanon D A.Efficient SensorManagement Policies for Distributed Target Tracking in Multihop Sensor Networks[J].IEEE Transactions on Signal Processing,2008,56(6):2562-2574.
[4]Nash JM.Optimal Allocation of Tracking Resources[C]//Proceedings of1977 IEEE Conference on Decision and Control including the 16th Symposium on Adaptive Processes and A Special Symposium on Fuzzy Set Theory and Applications. New Orleans,LA:IEEE,1977:1177-1180.
[5]王放.融合自動(dòng)目標(biāo)識(shí)別系統(tǒng)中的傳感器管理策略研究[D].長(zhǎng)沙:國(guó)防科技大學(xué),2004.
WANG Fang.Research on the Strategy of SensorManagement in Fusion Automatic Target Recognition System[D].Changsha:National University of Defense Technology,2004.(in Chinese)
[6]劉先省.傳感器管理方法研究[D].西安:西北工業(yè)大學(xué),2000.
LIU Xian-xing.Method′s Research of Sensor Management[D].Xi′an:Northwestern Polytechnical University,2000.(in Chinese)
[7]Kastella K.Discrimination Gain to Optimize Detection and Classification[J].IEEE Transactions on Systems,Man and Cybernetics(Part A:Systems and Humans),1997,27(1):112-116.
[8]鞠傳文,楊秀珍,王錫仁,等.多傳感器管理系統(tǒng)中的多目標(biāo)排序[J].電光與控制,2001(3):8-12.
JU Chuan-wen,YANG Xiu-zhen,WANG Xi-ren,et al.Sorting of Multi-target′s Threat in Multi-sensor Management System[J].Electronics Optics&Control,2001(3):8-12.(in Chinese)
[9]Kennedy J,Eberhart R.Particle Swarm Optimization[C]//Proceedings of the IEEE International Conference on Neural Networks.Piscataway,NJ:IEEE,1995:1942-1948.
[10]Shi Y,EberhartR.AModified Particle Swarm Optimizer[C]//Proceedings of the IEEE International Conference on Evolutionary Computation.Piscataway,NJ:IEEE,1998:69-73.
WEIYang-yong was born in Huangshi,Hubei Province,in 1986.He received the B.S.degree in 2009.He is now a graduate student.His research concerns sensor management for target integrated identification.
Email:gfcugwyy@163.com
徐世友(1978—),男,河北承德人,2008年獲博士學(xué)位,現(xiàn)為講師,主要研究方向?yàn)橥廨椛湓蠢走_(dá)系統(tǒng)、雷達(dá)目標(biāo)識(shí)別;
XU Shi-you was born in Chengde,HebeiProvince,in 1978. He received the Ph.D.degree in 2008.He is now a lecturer.His research interests include opportunistic illuminator radar,and radar target recognition.
辛玉林(1982—),男,山東濰坊人,2005年獲碩士學(xué)位,現(xiàn)為博士研究生,主要研究方向?yàn)槟繕?biāo)綜合敵我識(shí)別;
XIN Yu-lin was born in Weifang,Shandong Province,in 1982.He received theM.S.degree in 2005.He is currentlyworking toward the Ph.D.degree.His research direction is target integrated identification friend or foe.
陳曾平(1967—),男,福建福清人,1994年獲博士學(xué)位,現(xiàn)為教授、博士生導(dǎo)師,主要研究方向?yàn)槔走_(dá)目標(biāo)識(shí)別、電子系統(tǒng)中的信息獲取、處理與實(shí)現(xiàn)、電子系統(tǒng)可靠性等。
CHEN Zeng-ping was born in Fuqing,F(xiàn)ujian Province,in 1967.He received the Ph.D.degree in 1994.He is now a professor and also the Ph.D.supervisor.His research interests include radar target recognition,information acquisition,processing and implementation in electronic systems,the reliability of electronic systems,etc.
Integrated Identification Sensor Management Based on Discrim ination Gain
WEIYang-yong,XU Shi-you,XIN Yu-lin,CHEN Zeng-ping
(Automatic Target Recognition(ATR)National Defense Science and Technology Key Laboratory,National University of Defense Technology,Changsha 410073,China)
In order to improve the performance of integrated identification for targets,multi-sensor resources managementmay be needed in integrated identification system.In this paper the targetpriority and the restricted condition of sensors for integrated identification is analysed,and then an objective function regarding the discrimination gain as the rule ofmulti-sensor resourcesmanagement optimization is established.A computation method of discrimination gain utilizing sensor confusion matrix is proposed,and particle swarm optimization(PSO)algorithm is introduced into allocation NP-hard problem of sensor to target.The results show the rationality and efficiency of thismethod.
integrated identification;sensormanagement;discrimination gain;confusionmatrix;particle swarm optimization(PSO)
TP391;TP273
A
10.3969/j.issn.1001-893x.2011.11.003
衛(wèi)楊勇(1986—),男,湖北黃石人,2009年獲學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向?yàn)槟繕?biāo)綜合識(shí)別中的傳感器管理;
1001-893X(2011)11-0011-05
2011-07-15;
2011-09-02