張德華,郝昕源,張妮娜,魏 倩,劉 英
(1.河南大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,河南 開封 475004;2.武警綜保中心運(yùn)維室,陜西 西安 711700)
在分布式多傳感器多目標(biāo)數(shù)據(jù)融合系統(tǒng)中,傳感器系統(tǒng)偏差配準(zhǔn)的目標(biāo)是準(zhǔn)確估計(jì)并校正傳感器的固有系統(tǒng)偏差,為其后續(xù)的信息融合以及數(shù)據(jù)處理提供技術(shù)保障,其偏差配準(zhǔn)質(zhì)量將直接影響多傳感器多目標(biāo)數(shù)據(jù)信息融合系統(tǒng)的性能與可靠性。
傳統(tǒng)的系統(tǒng)偏差配準(zhǔn)算法有:① 基于最小二乘配準(zhǔn)算法,這種算法忽略了測量誤差,把誤差完全歸于系統(tǒng)誤差,且計(jì)算量也會隨著數(shù)據(jù)增多而劇增[1];② 基于極大似然算法,該算法只解決了二維模型,采用地球投影,存在模型不準(zhǔn)確的問題[2]。為了解決此問題,KARNIELY等[3]提出了用神經(jīng)網(wǎng)絡(luò)算法進(jìn)行系統(tǒng)偏差配準(zhǔn),由于采用梯度下降算法,存在收斂速度慢、易陷入局部最小值以及出現(xiàn)“鋸齒”現(xiàn)象等問題[4-6]。研究者不斷探索新的有效的網(wǎng)絡(luò)訓(xùn)練方法,有研究者提出了用粒子群算法(Partide Swarm Optimization,PSO)與網(wǎng)絡(luò)相結(jié)合的算法,但粒子群算法本身又存在進(jìn)化后期種群多樣性缺失的問題[7-8]。為了克服這個(gè)問題,有人提出將差分進(jìn)化算法與粒子群算法(Differential Evolution Particle Swarm Optimization,PSO-DE)相結(jié)合[9-14],但此方法在兩個(gè)種群全局最優(yōu)適應(yīng)度值相差較小時(shí),會出現(xiàn)不必要的信息交流誤差。
針對上述問題,筆者提出了一種融合優(yōu)化選擇策略的差分粒子群算法(Optimal Selection Particle Swarm Optimization-Differential Evolution-Weigthed Networks,OSPSO-DE-WN)。首先構(gòu)建一個(gè)用于計(jì)算系統(tǒng)偏差的權(quán)值網(wǎng)絡(luò)(Weighted Network,WN);然后對其網(wǎng)絡(luò)連接權(quán)值進(jìn)行優(yōu)化,得到最優(yōu)網(wǎng)絡(luò)連接權(quán)值,再將其輸入到權(quán)值網(wǎng)絡(luò),根據(jù)構(gòu)造的適應(yīng)度函數(shù),計(jì)算出最優(yōu)系統(tǒng)偏差;最后用其配準(zhǔn)目標(biāo)的傳感器量測。
筆者所提OSPSO-DE-WN算法首先構(gòu)建一個(gè)用于計(jì)算系統(tǒng)偏差的WN系統(tǒng)模型,然后用融合優(yōu)化選擇策略的全局最優(yōu)位置算法優(yōu)化更新網(wǎng)絡(luò)連接權(quán)值估計(jì),進(jìn)而得到最優(yōu)系統(tǒng)偏差估計(jì)值。權(quán)值網(wǎng)絡(luò)系統(tǒng)偏差估計(jì)模型結(jié)構(gòu)如圖1所示。
圖1 權(quán)值網(wǎng)絡(luò)模型圖
圖1中包含開始層、中間層和結(jié)束層的權(quán)值網(wǎng)絡(luò),網(wǎng)絡(luò)連接權(quán)值將層與層連接起來。將網(wǎng)絡(luò)輸入值輸入到開始層,通過權(quán)值網(wǎng)絡(luò)的相關(guān)加權(quán)及非線性運(yùn)算,將信息從開始層到中間層、然后再到結(jié)束層進(jìn)行層層傳遞,在網(wǎng)絡(luò)結(jié)束層將網(wǎng)絡(luò)輸出值進(jìn)行輸出。權(quán)值網(wǎng)絡(luò)的各層均由若干個(gè)端點(diǎn)組成,其中開始層和結(jié)束層的端點(diǎn)數(shù)由網(wǎng)絡(luò)輸入和網(wǎng)絡(luò)輸出的維數(shù)決定,中間層的端點(diǎn)數(shù)是根據(jù)經(jīng)驗(yàn)確定的。
假設(shè)有A類和B類傳感器量測點(diǎn)跡分別為Zi和Tz,表達(dá)式為
Zi=T+Bi+ni,i=1,2,…,M,
(1)
Tz=T+TB+Tn,
(2)
其中,T為目標(biāo)參考真實(shí)點(diǎn)跡,Bi和TB為傳感器系統(tǒng)偏差,ni和Tn為隨機(jī)噪聲,Zi代表第i個(gè)A類傳感器的量測值,M代表傳感器的總個(gè)數(shù),Tz代表B類傳感器的量測值。
A類傳感器精度較低,B類傳感器精度較高(TB和Tn值極小),將B類傳感器量測作為目標(biāo)參考真實(shí)狀態(tài),A類傳感器量測數(shù)據(jù)作為待配準(zhǔn)量測。WN系統(tǒng)偏差配準(zhǔn)的實(shí)質(zhì)就是將A的量測映射到B上。當(dāng)隨機(jī)誤差遠(yuǎn)小于系統(tǒng)偏差(即ni?Bi,Tn?TB)時(shí),隨機(jī)誤差可以被忽略,也就是要求網(wǎng)絡(luò)實(shí)現(xiàn)Zi=T+Bi逼近Tz=T+TB;若將A類傳感器量測Zi作為網(wǎng)絡(luò)輸入,則系統(tǒng)偏差Bi也就是Zi-Tz為網(wǎng)絡(luò)輸出。網(wǎng)絡(luò)的輸入和輸出可由如下描述:
網(wǎng)絡(luò)輸入為Zi=(xi(k),yi(k)),k=1,2,…,N,i=1,2,…,M。
(3)
網(wǎng)絡(luò)輸出為Bi=Zi-TZ=(xi(k),yi(k))-(x(k),y(k)) 。
(4)
而權(quán)值網(wǎng)絡(luò)模型結(jié)構(gòu)的數(shù)學(xué)描述為
(5)
(6)
(7)
?
(8)
(9)
綜上所述,網(wǎng)絡(luò)最終輸出值可表示為
(10)
OSPSO-DE-WN算法主要包括兩部分:① 用帶有優(yōu)化選擇策略的全局最優(yōu)位置算法優(yōu)化更新最優(yōu)網(wǎng)絡(luò)連接權(quán)值估計(jì);② 利用權(quán)值網(wǎng)絡(luò)計(jì)算系統(tǒng)偏差值,進(jìn)而得到最優(yōu)系統(tǒng)偏差估計(jì)值。具體的OSPSO-DE-WN算法框架如圖2所示。
圖2 OSPSO-DE-WN算法框架
由圖2可知,首先取某時(shí)刻的傳感器對目標(biāo)的量測值輸入到權(quán)值網(wǎng)絡(luò),計(jì)算出對應(yīng)的系統(tǒng)偏差值;然后,將系統(tǒng)偏差值輸入到文中所提算法中,通過遞推學(xué)習(xí)更新,得到此時(shí)刻最優(yōu)的網(wǎng)絡(luò)連接權(quán)值;最后,將最優(yōu)的網(wǎng)絡(luò)連接權(quán)值輸入到權(quán)值網(wǎng)絡(luò),計(jì)算出此時(shí)刻最優(yōu)的系統(tǒng)偏差估計(jì)值。
融合優(yōu)化選擇策略的全局最優(yōu)位置選擇如圖3所示。
圖3 融合優(yōu)化選擇策略的全局最優(yōu)位置選擇
首先,計(jì)算每個(gè)種群中個(gè)體的適應(yīng)度值并從中選出各種群中的最優(yōu)個(gè)體,若PSO算法種群最優(yōu)個(gè)體優(yōu)于DE種群,則可直接確定整個(gè)種群的全局最優(yōu)個(gè)體,即用PSO算法種群的最優(yōu)個(gè)體作為整個(gè)種群的全局最優(yōu)位置進(jìn)行整個(gè)種群的更新;若DE種群最優(yōu)個(gè)體優(yōu)于PSO算法種群最優(yōu)個(gè)體,則需要啟動優(yōu)化選擇策略來確定整個(gè)種群的全局最優(yōu)位置,即需計(jì)算2個(gè)最優(yōu)個(gè)體適應(yīng)度值的差值Df;然后判斷Df是否大于所設(shè)閾值df,若Df>df,則用DE種群最優(yōu)個(gè)體作為整個(gè)種群全局最優(yōu)位置,否則仍用PSO種群最優(yōu)個(gè)體作為整個(gè)種群全局最優(yōu)位置。這樣避免了在2個(gè)最優(yōu)個(gè)體適應(yīng)度值相差較小情況下,利用DE種群最優(yōu)個(gè)體進(jìn)行更新,不僅能加快收斂速度、節(jié)省算法運(yùn)行時(shí)間,同時(shí)減小了信息交流誤差。
(11)
由式(11)知,Et越小,種群分布越不均勻;Et越大,分布越均勻,種群多樣性越好。故差值閾值函數(shù)df的公式可設(shè)定為
(12)
(13)
同時(shí)為了評價(jià)粒子優(yōu)劣,筆者構(gòu)造了一個(gè)適應(yīng)度函數(shù)。適應(yīng)度值越小,說明參考真實(shí)值與系統(tǒng)偏差估計(jì)越接近,估計(jì)出的系統(tǒng)偏差越準(zhǔn)確。在系統(tǒng)偏差配準(zhǔn)中,目標(biāo)是得到最優(yōu)系統(tǒng)偏差估計(jì)。為此可構(gòu)造包含系統(tǒng)偏差估計(jì)和參考真實(shí)系統(tǒng)偏差在內(nèi)的適應(yīng)度函數(shù):
(14)
為了說明筆者所提OSPSO-DE-WN算法在不同軌跡上的可行性及有效性,分別選取在二維平面內(nèi)作非機(jī)動運(yùn)動和機(jī)動運(yùn)動的目標(biāo)進(jìn)行仿真驗(yàn)證。
目標(biāo)的運(yùn)動方程以及量測方程如下所示:
X(k+1)=FX(k)+μ(k) ,
(15)
Z(k)=HX(k)+B(k)+φ(k) ,
(16)
仿真場景1:假設(shè)目標(biāo)在二維平面內(nèi)作非機(jī)動運(yùn)動,則非機(jī)動運(yùn)動目標(biāo)的狀態(tài)轉(zhuǎn)移矩陣表示為
(17)
量測矩陣表示為
(18)
其中,T為采樣間隔,設(shè)置為2 s。X方向上的速度設(shè)置為3 m/s,Y方向上的速度設(shè)置為4 m/s。目標(biāo)狀態(tài)量X(k)的初始值X(0)設(shè)置為[100 m 3 m/s 200 m 4 m/s]T。X和Y方向上的傳感器系統(tǒng)偏差值分別設(shè)置為-3 m、5 m。
仿真場景2:假設(shè)目標(biāo)在二維平面內(nèi)作機(jī)動運(yùn)動,則機(jī)動運(yùn)動目標(biāo)的狀態(tài)轉(zhuǎn)移矩陣表示為
(19)
量測矩陣表示為
(20)
場景2中,w表示轉(zhuǎn)彎因子。T為采樣間隔,取為0.1 s。X(k)的初始值X(0)設(shè)置為[200 m 8 m/s 100 m 2 m/s]T,X和Y方向的系統(tǒng)偏差值分別設(shè)為-6 m、8 m。在1~100 s,目標(biāo)右轉(zhuǎn)彎運(yùn)動,w取值為0.18 rad/s,在101~200 s,目標(biāo)左轉(zhuǎn)彎運(yùn)動,w取值為-0.2 rad/s。
表1給出了OSPSO-DE-WN算法中各仿真參數(shù)的符號及其具體設(shè)置值。
仿真實(shí)驗(yàn)采用蒙特卡羅仿真形式,仿真次數(shù)設(shè)置為50次。采用的仿真環(huán)境為Intel i5,主頻為3.30 GHz,內(nèi)存為4.00 GB,仿真軟件為Matlab R2014a。
表1 仿真參數(shù)設(shè)置
為了證明筆者所提OSPSO-DE-WN算法的有效性和優(yōu)越性,基于前述所設(shè)置的仿真場景和參數(shù),并以系統(tǒng)偏差估計(jì)的均方根誤差值(RMSE值)作為算法精度的衡量指標(biāo),同時(shí)選擇PSO算法優(yōu)化WN(PSO-WN算法)、PSO-DE算法優(yōu)化WN(PSO-DE-WN算法)在非機(jī)動運(yùn)動目標(biāo)以及機(jī)動運(yùn)動目標(biāo)兩種場景下進(jìn)行對比分析驗(yàn)證。
首先,驗(yàn)證種群多樣性以及個(gè)體適應(yīng)度。以式(11)種群分布熵為衡量種群多樣性的指標(biāo),以式(14)適應(yīng)度函數(shù)為衡量最優(yōu)個(gè)體適應(yīng)度指標(biāo)。其仿真結(jié)果如圖4和圖5所示。
從圖4可以看出,隨著算法進(jìn)化代數(shù)的增加,筆者所提OSPSO-DE-WN算法的熵值在進(jìn)化代數(shù)為18的時(shí)候有一次微小的下降,之后幾乎穩(wěn)定不變。這不僅說明OSPSO-DE-WN算法比PSO-DE-WN算法和PSO-WN算法的種群分布更均勻,也說明OSPSO-DE-WN 算法的熵值是最大的,其種群多樣性更加豐富。
圖4 種群分布熵變化曲線
從圖5可以看出,OSPSO-DE-WN算法要比PSO-DE-WN算法和PSO-WN算法收斂速度快,而且經(jīng)過50次的迭代進(jìn)化,PSO-WN算法得到的最優(yōu)個(gè)體適應(yīng)度值為0.001 1;PSO-DE-WN算法得到的最優(yōu)個(gè)體適應(yīng)度值為4.763 1×10-4;OSPSO-DE-WN算法得到的最優(yōu)個(gè)體適應(yīng)度值為2.019 4×10-5。由式(14)適應(yīng)度函數(shù)可知,適應(yīng)度值越小,估計(jì)出的系統(tǒng)偏差值越接近于參考真實(shí)系統(tǒng)偏差值。這驗(yàn)證了OSPSO-DE-WN算法搜索到的適應(yīng)度值最小,最接近真實(shí)系統(tǒng)的偏差。
非機(jī)動目標(biāo)情況下,將作非機(jī)動運(yùn)動的目標(biāo)的量測值輸入到OSPSO-DE-WN算法、PSO-DE-WN算法和PSO-WN算法中,估計(jì)出系統(tǒng)偏差值,如圖6~圖9所示。
圖6和圖7分別為目標(biāo)非機(jī)動運(yùn)動下3種算法在X方向和Y方向上的實(shí)際輸出系統(tǒng)偏差值與參考真實(shí)系統(tǒng)偏差值的曲線圖。3種算法在X和Y方向上估計(jì)出的系統(tǒng)偏差最終均趨于期望輸出系統(tǒng)偏差值-3 m和5 m。PSO-WN算法在1~45 s之間出現(xiàn)明顯波動,45 s之后基本穩(wěn)定于參考真實(shí)系統(tǒng)偏差值附近。PSO-DE-WN算法在1~35 s之間出現(xiàn)明顯波動,35 s之后基本穩(wěn)定于參考真實(shí)系統(tǒng)偏差值附近。從圖6和圖7均可以看出,OSPSO-DE-WN算法大約在2 s時(shí)收斂迅速,之后并逐漸收斂于真實(shí)系統(tǒng)偏差值附近。這充分說明OSPSO-DE-WN算法成功避免了兩種群在最小適應(yīng)度值相差較小時(shí),因信息交換出現(xiàn)的不必要信息交流誤差,同時(shí)也使得收斂速度更快,其運(yùn)行時(shí)間也更短。
圖6 X方向上的系統(tǒng)偏差估計(jì)值
在蒙特卡羅仿真次數(shù)為50次,以及上述給定的仿真環(huán)境下,給出了3種算法的算法耗時(shí),如圖8所示,同時(shí)也給出了3種算法收斂步長的比較,如圖9所示。
圖8 3種算法的耗時(shí)
從圖8可以看出OSPSO-DE-WN算法的運(yùn)行時(shí)間要比PSO-WN算法、PSO-DE-WN算法的短;從圖9看出,OSPSO-DE-WN算法的收斂步長最小,進(jìn)一步證明了筆者所提OSPSO-DE-WN算法的收斂速度要比PSO-WN算法和PSO-DE-WN算法的快。
根據(jù)前述結(jié)果得出傳感器系統(tǒng)偏差估計(jì)值,利用該估計(jì)值對傳感器的量測值進(jìn)行系統(tǒng)偏差配準(zhǔn)。非機(jī)動運(yùn)動目標(biāo)下3種算法配準(zhǔn)前后的軌跡圖如圖10所示。系統(tǒng)偏差估計(jì)的平均均方根誤差如圖11所示。
圖10 非機(jī)動運(yùn)動目標(biāo)配準(zhǔn)前后軌跡
從圖10和圖11中可以看出,筆者所提算法在具有前述優(yōu)越性能的情況下,在非機(jī)動運(yùn)動目標(biāo)下配準(zhǔn)后的軌跡比PSO-DE-WN算法和PSO-WN算法更加接近于參考真實(shí)軌跡。由圖11可以更直觀地看出,OSPSO-DE-WN算法在X和Y方向上系統(tǒng)偏差估計(jì)的平均RMSE值與PSO-WN算法以及PSO-DE-WN算法相比,數(shù)量級減少了一個(gè)數(shù)量級即101,這證明了在非機(jī)動運(yùn)動目標(biāo)場景下筆者所提OSPSO-DE-WN算法的精度要高于PSO-WN算法和PSO-DE-WN算法的。
機(jī)動目標(biāo)情況下:將作機(jī)動運(yùn)動目標(biāo)的量測值輸入到OSPSO-DE-WN算法、PSO-DE-WN算法和PSO-WN算法中,仿真結(jié)果如圖12~圖17所示。
圖12 X方向上的系統(tǒng)偏差估計(jì)值
圖12和圖13分別表示機(jī)動運(yùn)動目標(biāo)下3種算法在X方向和Y方向上的實(shí)際輸出系統(tǒng)偏差值與參考真實(shí)系統(tǒng)偏差值的變化曲線圖??梢钥闯?,3種算法在X和Y方向上估計(jì)出的系統(tǒng)偏差最終均趨于期望輸出系統(tǒng)偏差值-3 m和5 m。PSO-WN算法在1~25 s之間出現(xiàn)明顯波動,25~40 s之間輕微波動,40 s之后基本穩(wěn)定于參考真實(shí)系統(tǒng)偏差值附近。但由于PSO-DE-WN算法融合了DE算法和PSO算法,使種群的多樣性增加,算法收斂速度變快。從圖12和圖13中也可以看出,在1~24 s之間出現(xiàn)波動,31 s之后基本穩(wěn)定于參考真實(shí)系統(tǒng)偏差值附近。OSPSO-DE-WN算法大約在2 s時(shí)收斂迅速,之后穩(wěn)定于參考真實(shí)系統(tǒng)偏差值附近。這充分說明OSPSO-DE-WN算法即使在機(jī)動運(yùn)動目標(biāo)情況下,也能有效避免兩種群在最小適應(yīng)度值相差較小時(shí),因信息交換出現(xiàn)的不必要信息交流誤差,同時(shí)運(yùn)行時(shí)間也更短即收斂速度更快。
設(shè)定蒙特卡羅仿真次數(shù)為50次,在前述仿真環(huán)境下,從圖14給出了3種算法的算法耗時(shí),同時(shí)圖15也給出了3種算法收斂步長。從圖14可以看出,OSPSO-DE-WN算法的運(yùn)行時(shí)間為266.4 s,要比PSO-WN算法和PSO-DE-WN算法的短。從圖15看出,OSPSO-DE-WN算法的收斂步長要比PSO-WN算法和PSO-DE-WN算法小得多。這進(jìn)一步驗(yàn)證了OSPSO-DE-WN算法的收斂速度最快。
圖14 3種算法的耗時(shí)
根據(jù)文中前部分得出的傳感器系統(tǒng)偏差估計(jì)值,利用該值對傳感器的量測值進(jìn)行系統(tǒng)偏差配準(zhǔn)。目標(biāo)機(jī)動運(yùn)動下3種算法配準(zhǔn)前后的軌跡如圖16所示。
從圖16中可以看出,筆者所提算法在具有前述優(yōu)越性能的情況下,在機(jī)動運(yùn)動目標(biāo)下配準(zhǔn)后的軌跡比PSO-WN算法、PSO-DE-WN算法更加接近于參考真實(shí)軌跡,使得系統(tǒng)偏差配準(zhǔn)能夠更好地進(jìn)行。從圖17可以更直觀地看出,OSPSO-DE-WN算法在X和Y方向上系統(tǒng)偏差估計(jì)的平均RMSE值與PSO-WN算法以及PSO-DE-WN算法相比,數(shù)量級減少了一個(gè)數(shù)量級即101,這充分說明在機(jī)動運(yùn)動目標(biāo)場景下,OSPSO-DE-WN算法的精度高于PSO-WN算法以及PSO-DE-WN算法的。
圖16 機(jī)動運(yùn)動目標(biāo)配準(zhǔn)前后軌跡
針對系統(tǒng)偏差模型難以構(gòu)建、粒子群算法出現(xiàn)種群多樣性變小和PSO-DE算法出現(xiàn)信息交流誤差的問題,筆者提出了一種帶有優(yōu)化選擇策略的差分粒子群算法優(yōu)化權(quán)值網(wǎng)絡(luò)的系統(tǒng)偏差配準(zhǔn)——OSPSO-DE-WN算法。該算法首先構(gòu)建了一個(gè)用于計(jì)算系統(tǒng)偏差的權(quán)值網(wǎng)絡(luò),然后采用改進(jìn)的優(yōu)化策略對WN網(wǎng)絡(luò)連接權(quán)值進(jìn)行優(yōu)化更新,最后得到系統(tǒng)的最優(yōu)偏差估計(jì)。實(shí)驗(yàn)結(jié)果表明,該算法適應(yīng)度值最小,無論在非機(jī)動運(yùn)動目標(biāo)還是機(jī)動運(yùn)動目標(biāo)運(yùn)動場景下,都可有效提高種群多樣性并避免信息交流誤差,極大提高了收斂速度以及運(yùn)算精度。