任東彥,孫明太,周利輝
(海軍航空工程學(xué)院青島校區(qū),山東青島 266041)
基于魯棒Kalman濾波的獵掃雷作戰(zhàn)過程建模及效果評(píng)估
任東彥,孫明太,周利輝
(海軍航空工程學(xué)院青島校區(qū),山東青島 266041)
針對(duì)混布雷陣在獵掃雷作戰(zhàn)效果評(píng)估中評(píng)估精度差的問題,采用時(shí)變帶未建模動(dòng)態(tài)系統(tǒng)對(duì)獵掃雷作戰(zhàn)過程建模,通過引入帶未知時(shí)變均值和方差陣的虛擬白噪聲來(lái)補(bǔ)償獵掃雷作戰(zhàn)數(shù)學(xué)模型建立過程中簡(jiǎn)化帶來(lái)的未知模型誤差,并采用魯棒Kalman濾波器對(duì)作戰(zhàn)效果進(jìn)行評(píng)估。仿真結(jié)果表明,該方法可有效改善Kalman濾波器的性能,對(duì)混布雷陣有很好的評(píng)估效果,評(píng)估過程和評(píng)估效果更貼近實(shí)際。
作戰(zhàn)效果評(píng)估;魯棒Kalman濾波器;虛擬噪聲補(bǔ)償技術(shù)
獵掃雷作戰(zhàn)效果評(píng)估是衡量反水雷作戰(zhàn)成功與否的根本標(biāo)準(zhǔn)。研究獵掃雷作戰(zhàn)效果評(píng)估問題時(shí),首先必須建立獵掃雷作戰(zhàn)過程數(shù)學(xué)模型。在這項(xiàng)工作中,必須全面考慮評(píng)估需求、已知條件和評(píng)估手段,深入了解作戰(zhàn)過程的本質(zhì)和具體過程,在合理簡(jiǎn)化的基礎(chǔ)上實(shí)現(xiàn)數(shù)學(xué)抽象,得到作戰(zhàn)過程最基本的規(guī)律;其次必須針對(duì)模型及相應(yīng)的觀測(cè)數(shù)據(jù),提出可靠的評(píng)估方法[1]。將復(fù)雜的獵掃雷作戰(zhàn)過程與現(xiàn)代最先進(jìn)的理論算法聯(lián)系起來(lái),可以充分利用這些理論成果,從而使獵掃雷作戰(zhàn)效果評(píng)估方法上升到理論高度。
獵掃雷作戰(zhàn)效果評(píng)估問題,歸根到底是誤差處理問題。獵掃雷作戰(zhàn)過程中涉及的數(shù)據(jù)很多,而每個(gè)數(shù)據(jù)都多少存在誤差,其中既有系統(tǒng)性的,又有隨機(jī)性的。如果所有數(shù)據(jù)的誤差情況都分別考慮,最終將導(dǎo)致評(píng)估模型過于復(fù)雜,其穩(wěn)定性、可靠性都難以得到充分保證,因此必須對(duì)其進(jìn)行簡(jiǎn)化[2-3]。但如果模型過于簡(jiǎn)化,必然導(dǎo)致評(píng)估結(jié)果不切實(shí)際,評(píng)估失去意義。本文考慮帶未建模動(dòng)態(tài) (即帶未知模型誤差)系統(tǒng)的自適應(yīng)Kalman濾波問題,相應(yīng)的自適應(yīng)Kalman濾波器叫做魯棒Kalman濾波器。采用改進(jìn)濾波器性能的虛擬噪聲補(bǔ)償技術(shù),通過引入帶未知時(shí)變均值和方差陣的虛擬白噪聲來(lái)補(bǔ)償獵掃雷作戰(zhàn)數(shù)學(xué)模型建立過程中簡(jiǎn)化帶來(lái)的未知模型誤差,對(duì)獵掃雷作戰(zhàn)過程建模,并采用相應(yīng)的Kalrmn濾波器對(duì)作戰(zhàn)效果進(jìn)行評(píng)估。
根據(jù)評(píng)估方法的不同,對(duì)獵掃雷作戰(zhàn)過程建立不同的數(shù)學(xué)模型。統(tǒng)計(jì)類評(píng)估技術(shù)從概率統(tǒng)計(jì)的角度,通過對(duì)觀測(cè)數(shù)據(jù)的處理,獲得評(píng)估對(duì)象的估計(jì)值。在這類技術(shù)中,必須對(duì)系統(tǒng)建立隨機(jī)模型,以便對(duì)觀測(cè)數(shù)據(jù)進(jìn)行處理。文獻(xiàn) [1]建立了如下獵掃雷作戰(zhàn)過程數(shù)學(xué)模型:
然而,獵掃雷作戰(zhàn)過程中需要考慮的因素很多,涉及的每個(gè)數(shù)據(jù)都多少存在誤差。上述模型在采用最優(yōu)Kalman濾波器進(jìn)行作戰(zhàn)效果評(píng)估時(shí),雖然計(jì)算方便,但由于建模過程的簡(jiǎn)化,直接導(dǎo)致評(píng)估結(jié)果由最優(yōu)退化為次優(yōu)。最優(yōu)Kalman濾波器要求精確已知系統(tǒng)的模型 (包括噪聲統(tǒng)計(jì)),然而在許多實(shí)際應(yīng)用問題中模型常常近似、帶有未知誤差[4-5]。這種未知的模型誤差叫做未建模動(dòng)態(tài),它是相對(duì)于假設(shè)存在系統(tǒng)的一個(gè)精確的模型而言的。帶未建模動(dòng)態(tài)系統(tǒng)的自適應(yīng)Kalman濾波器稱為魯棒Kalman濾波器,具有重要的工程應(yīng)用價(jià)值。未建模動(dòng)態(tài)可能來(lái)源于:對(duì)系統(tǒng)的機(jī)理沒有完全掌握,或由于簡(jiǎn)化模型帶來(lái)的未知模型誤差,或由于系統(tǒng) (過程)的時(shí)變性引起模型參數(shù)和噪聲統(tǒng)計(jì)的未知漂移。
考慮在一般狀態(tài)空間模型中,狀態(tài)轉(zhuǎn)移陣和觀測(cè)陣兩者均含有未知模型誤差的情形,通過引入帶未知時(shí)變?cè)肼暯y(tǒng)計(jì)的虛擬噪聲來(lái)補(bǔ)償模型誤差,把問題歸結(jié)為帶未知時(shí)變?cè)肼暯y(tǒng)計(jì)系統(tǒng)的自適應(yīng)Kalman濾波問題,利用時(shí)變?cè)肼暯y(tǒng)計(jì)估值器,采用帶未建模動(dòng)態(tài)系統(tǒng)的一種統(tǒng)一和通用的魯棒Kalman濾波技術(shù)——虛擬噪聲補(bǔ)償技術(shù)對(duì)獵掃雷作戰(zhàn)過程建模[2]。結(jié)合魯棒Kalman濾波技術(shù),建立改進(jìn)的獵掃雷作戰(zhàn)過程數(shù)學(xué)模型,過程如下:
參考式(1),獵掃雷作戰(zhàn)過程為線性離散隨機(jī)系統(tǒng):
假設(shè)系統(tǒng)是帶未知模型誤差系統(tǒng),即真實(shí)系統(tǒng)不是式(2),而是
其中,狀態(tài)轉(zhuǎn)移陣Φ(t)的誤差ΔΦ(t)和觀測(cè)陣H(t)的誤差ΔH(t)未知,但Φ(t)和H(t)已知。因此,即使噪聲統(tǒng)計(jì)已知,對(duì)帶模型誤差系統(tǒng)進(jìn)行常規(guī)Kalman濾波也會(huì)使濾波器性能變壞。為了補(bǔ)償模型誤差,將真實(shí)系統(tǒng)改寫為:
定義虛擬模型噪聲 ξ(t)和虛擬觀測(cè)噪聲η(t)為
虛擬噪聲ξ(t)補(bǔ)償了狀態(tài)模型誤差ΔΦ(t)x(t),虛擬噪聲η(t)補(bǔ)償了觀測(cè)方程誤差ΔH(t)x(t)。通常,模型誤差項(xiàng)ΔΦ(t),ΔH(t)相對(duì)于Φ(t),H(t)而言較小,因此,可近似假設(shè)虛擬噪聲ξ(t)和η(t)是帶未知時(shí)變?cè)肼暯y(tǒng)計(jì)的相互獨(dú)立的白噪聲:
于是,對(duì)真實(shí)系統(tǒng)(3)的濾波問題轉(zhuǎn)化為帶未知時(shí)變?cè)肼暯y(tǒng)計(jì)系統(tǒng)(4)的自適應(yīng)Kalman濾波問題。式(4)即為改進(jìn)的獵掃雷作戰(zhàn)過程數(shù)學(xué)模型。
在卡爾曼濾波技術(shù)中,當(dāng)對(duì)模型某一部分了解不深入,存在較大模型誤差,或系統(tǒng)模型及誤差為時(shí)變時(shí),會(huì)影響濾波精度,采用魯棒Kalman濾波器可以補(bǔ)償未知模型誤差。含有未建模動(dòng)態(tài)ΔΦ(t)和ΔH(t)的系統(tǒng)(4)應(yīng)用虛擬噪聲補(bǔ)償技術(shù)有如下Kalman 濾波器[2]:
上述方程組構(gòu)成了一個(gè)卡爾曼濾波器。標(biāo)準(zhǔn)的卡爾曼濾波器有一個(gè)重要特點(diǎn),即狀態(tài)轉(zhuǎn)移誤差方差陣Q(t)在濾波器中不是常數(shù),每次都必須重新計(jì)算。由于它受到被估計(jì)狀態(tài)X的影響,使標(biāo)準(zhǔn)卡爾曼濾波器退化為次優(yōu)。而魯棒Kalman濾波器狀態(tài)轉(zhuǎn)移誤差方差陣Q(t)和R(t)雖然也是時(shí)變的,但虛擬噪聲補(bǔ)償技術(shù)補(bǔ)償了未知模型誤差,相對(duì)來(lái)說有可能會(huì)提高估計(jì)精度,它的性能如何,必須通過仿真試驗(yàn)和實(shí)際應(yīng)用證明。
為使計(jì)算能正常開始,必須提供初始值X0/0和P0/0。通常根據(jù)歷史經(jīng)驗(yàn)和實(shí)際情況,可以確定比較合理的初始值,從而改善計(jì)算結(jié)果。但對(duì)初始值完全未知時(shí),魯棒Kalman濾波器仍然可以進(jìn)行,它可以根據(jù)不斷取得的觀測(cè)值,逐漸修正估計(jì)結(jié)果,并迅速接近真實(shí)情況。正因?yàn)槿绱耍诠こ躺辖?jīng)常針對(duì)初始值完全未知的情況,對(duì)X0/0取0值,對(duì)P0/0取一個(gè)比較大的值,經(jīng)過若干步計(jì)算后,初始值誤差的影響將會(huì)消失。
實(shí)際搜掃過程中,每當(dāng)搜掃工具對(duì)雷區(qū)完成一次作用后,便可得到一個(gè)新的觀測(cè)數(shù)據(jù),將這個(gè)新的觀測(cè)數(shù)據(jù)代入上述方程組,便可由上一個(gè)X和P計(jì)算出新的X和P,如此反復(fù),X就會(huì)逐漸逼近實(shí)際狀態(tài),從而了解目前雷區(qū)內(nèi)水雷的實(shí)際狀態(tài)。
情形1:設(shè)w(t)的均值q=0和方差Q=0.001已知,取初值(0|0)=[30 0 0],p=0.3,采用模型 (1)對(duì)獵掃雷作戰(zhàn)過程建模,可得最優(yōu)Kalman濾波器0(t|t)。
情形2:取帶誤差的模型,且取帶誤差的噪聲統(tǒng)計(jì)q=0,Q=0.001,取初值為(0|0)=[30 0 0],p=0.2,采用模型(1)對(duì)獵掃雷作戰(zhàn)過程建模,可得次優(yōu)Kalman濾波器s(t|t)。
情形3:取帶補(bǔ)償模型誤差系統(tǒng),采用模型(4)對(duì)獵掃雷作戰(zhàn)過程建模,可得魯棒Kalman濾波器(t|t)。其中ξ(t)為帶未知時(shí)變統(tǒng)計(jì)的虛擬白噪聲,取ξ(t)的均值和方差的初值為q^=0,Q^=0.001,仍取(0|0)=[30 0 0],p=0.3,搜掃概率誤差在-0.1~0.1之間,且b=0.9。
通過作戰(zhàn)過程的仿真,得到1組觀測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)。將這組觀測(cè)數(shù)據(jù)輸人到濾波方程中,得到估計(jì)值。最后計(jì)算出真實(shí)狀態(tài)和估計(jì)狀態(tài)之間的誤差。
由于本問題屬于小子樣估計(jì),相同條件下的仿真結(jié)果會(huì)呈現(xiàn)隨機(jī)變化,因此對(duì)每組不同條件,均仿真200組,求取其結(jié)果的均值和方差。表1列出估計(jì)維數(shù)為3,觀測(cè)誤差方差R為1.5的條件下,對(duì)不同情況進(jìn)行仿真后所得到的結(jié)果。
考慮在防御布雷作戰(zhàn)中,水雷定次不會(huì)太高。同時(shí),考慮到掃雷概率高的情況下,水雷會(huì)很快被掃除,仿真數(shù)據(jù)會(huì)迅速收斂。為了檢驗(yàn)評(píng)估算法的有效性,故對(duì)3種情形采用低概率情況下的3種雷陣進(jìn)行仿真,結(jié)果如下:
1)雷陣1~30枚定次為1次的水雷。
圖1 最優(yōu)濾波、次優(yōu)濾波和魯棒Kalman濾波的比較Fig.1 Compare of optimal filter,suboptimal filter and robust Kalman filter
2)雷陣2~10枚定次為1次的水雷+10枚定次為2次的水雷+10枚定次為3次的水雷。
圖2 最優(yōu)濾波、次優(yōu)濾波和魯棒Kalman濾波的比較Fig.2 Compare of optimal filter,suboptimal filter and robust Kalman filter
3)雷陣3~30枚定次為1次的水雷+30枚定次為3次的水雷。
圖3 最優(yōu)濾波、次優(yōu)濾波和魯棒Kalman濾波的比較Fig.3 Compare of optimal filter,suboptimal filter and robust Kalman filter
3種評(píng)估方法對(duì)3個(gè)雷陣的評(píng)估誤差均值統(tǒng)計(jì)信息如表1所示。
表1 3種典型雷陣的誤差均值統(tǒng)計(jì)信息表Tab.1 Statistical information ofmean error in three typicalmine obstacle
本文在全面考慮獵掃雷作戰(zhàn)效果評(píng)估需求和已知條件,深入解獵掃雷作戰(zhàn)過程本質(zhì)和具體過程的基礎(chǔ)上,結(jié)合虛擬噪聲補(bǔ)償技術(shù)對(duì)獵掃雷作戰(zhàn)過程建模,在合理簡(jiǎn)化的基礎(chǔ)上實(shí)現(xiàn)更貼近實(shí)際的數(shù)學(xué)抽象,并采用魯棒Kalman濾波技術(shù)對(duì)作戰(zhàn)效果進(jìn)行評(píng)估。仿真結(jié)果表明了該評(píng)估方法的有效性,尤其對(duì)混布雷陣有很好的評(píng)估效果,比最優(yōu)Kalman濾波器濾波精度更高。對(duì)比評(píng)估結(jié)果可看出,對(duì)實(shí)際雷數(shù)的估計(jì)結(jié)果,采用魯棒Kalman濾波技術(shù)與實(shí)際情況更為接近。
[1]馬愛民.獵掃雷作戰(zhàn)效果評(píng)估與控制[M].北京:國(guó)防工業(yè)出版社,2000:70-73.
[2]鄧自立.自校正濾波理論及其應(yīng)用——現(xiàn)代時(shí)間序列分析方法[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2003:179-181.
[3]周洪光,周璽,夏朗.反水雷武器系統(tǒng)作戰(zhàn)效能評(píng)估方法初探[J].水雷戰(zhàn)與艦船防護(hù),2010,18(4):32 -36.
ZHOU Hong-guang,ZHOU Xi,XIA Lang.Preliminary study on the operational efficiency evaluafion methods of MCM weapon system[J].Mine Warfare and Ship Self-Defence,2010,18(4):32 -36.
[4]黃賢源,隋立芬,范澎湃.幾種最優(yōu)濾波方法的分析和比較[J].測(cè)繪工程,2007,16(3):35 -38.
HUANG Xian-yuan,SUI Li-fen,F(xiàn)AN Peng-pai.Analyses and comparisons of some filtermethods[J].Engineering of Surveying and Mapping,2007,16(3):35 -38.
[5]李華,李慶民,劉君.一種基于遺傳算法的“正向”掃雷效果評(píng)估解法[J].探測(cè)與控制學(xué)報(bào),2007,29(6):36-40.
[6]洪星,宋元,馬愛民.馬爾可夫鏈用于掃雷作戰(zhàn)期望損失評(píng)估探討[J].兵工學(xué)報(bào),2006,27(6):1132 -1135.
HONG Xing,SONG Yuan,MA Ai-min.The applications of Markov chains to estimating expected casualties of naval mine-sweepin[J].Actaarmamentarll,2006,27(6):1132-1135.
Operationalmodeling and effect evaluation ofm ine-hunting and m ine-sweeping based on robust Kalman filter
REN Dong-yan,SUN Ming-tai,ZHOU Li-hui
(Qingdao Branch of Naval Aeronautical and Astronautical University,Qingdao 266041,China)
According to the bad precision of the interweaving mine obstacle in operational effect evaluation ofmine-hunting and mine-sweeping,the operational model of mine-hunting and mine-sweeping was established through using time-varying unmodeled dynamics system.The unknown error of math modeling which was predigested was compensated by fictitious noise compensation technique through introducing the unknown time-varyingmean and variance matrix,and the robust Kalman filter was used for operational effect evaluation.The simulation research testified that the method can effectively improve the performance of Kalman filter and have good operational effect for interweavingmine.The operational process and effectwasmuch more close to the fact.
operational effect evaluation;robust Kalman filter;fictitious noise compensation
TJ01
A
1672-7649(2014)04-0143-04
10.3404/j.issn.1672-7649.2014.04.031
2013-03-12;
2013-04-18
任東彥(1985-),男,博士研究生,主要從事海軍兵種及武器系統(tǒng)作戰(zhàn)仿真研究。