張志敏
(中國人民解放軍92941部隊44分隊,遼寧葫蘆島 125001)
不同類型和不等精度數(shù)據(jù)的融合是測量數(shù)據(jù)融合處理中的常見難題,也是研究的熱點問題[13]。測量數(shù)據(jù)融合處理的主要目的就是提高參數(shù)估計的精度,建立合適的數(shù)學(xué)處理模型,給出高效可靠的融合算法,建立既能夠適合數(shù)學(xué)處理,又能夠體現(xiàn)物理過程、工程特征的融合處理模型是關(guān)鍵。模型包括測量數(shù)據(jù)的模型和目標(biāo)軌跡模型,而測量數(shù)據(jù)建模又包括測量誤差建模與測量目標(biāo)真實信號建模。不同類型和不等精度數(shù)據(jù)是指觀測數(shù)據(jù)中關(guān)于待估參數(shù)的函數(shù)關(guān)系不同、各階導(dǎo)數(shù)也不同[45]。因此,針對不同類型不等精度的觀測數(shù)據(jù)的融合處理,使用不同的加權(quán)方法,會對參數(shù)估計結(jié)果造成較大的影響。因此針對不同的應(yīng)用背景研究適合的加權(quán)融合處理方法成為提高不同類型和不等精度數(shù)據(jù)的融合參數(shù)估計精度的關(guān)鍵。
對于線性回歸模型,已有文獻(xiàn) [6]證明了其參數(shù)估計,以及不等精度測量數(shù)據(jù)的唯一最優(yōu)加權(quán)原則 。但是對于非線性回歸模型,當(dāng)前的研究結(jié)果都是利用線性回歸模型的處理思維以及迭代算法,求解非線性回歸問題,在基于觀測數(shù)據(jù)的隨機(jī)誤差是獨立同分布等精度條件下推導(dǎo)的[7-9],不進(jìn)行加權(quán)處理,或直接采用線性模型的高斯-馬爾科夫定理對不同類型的觀測數(shù)據(jù)進(jìn)行加權(quán)處理,對于參數(shù)估計的精度的提高存在很大的局限性。非線性回歸模型的非線性程度會對參數(shù)估計的偏差、方差等因素產(chǎn)生影響,因此通過什么方法可以降低模型的非線性程度,成為長久以來非線性模型研究領(lǐng)域的難點。文獻(xiàn)[10]通過引入非線性模型的參數(shù)效應(yīng)曲率和固有曲率,使降低曲率相當(dāng)于降低模型非線性程度,采用曲率表征模型的非線性程度,目前該理論已成為非線性模型定量分析的理論基礎(chǔ),為非線性回歸模型的研究提供一種新的思路,極大地促進(jìn)了不同類型不等精度測量數(shù)據(jù)非線性融合的權(quán)值問題的研究。
對于不同種類的不等精度測量數(shù)據(jù)融合處理的權(quán)值與參數(shù)估計的問題,根據(jù)對參數(shù)估計偏差和均方誤差進(jìn)行分析的結(jié)論,從理論上證明了對于非線性模型在不同類型不等精度數(shù)據(jù)融合處理時,最優(yōu)融合權(quán)值不僅與數(shù)據(jù)本身精[6]度有關(guān),而且與模型的結(jié)構(gòu)、導(dǎo)數(shù)相關(guān)聯(lián),且線性模型高斯-馬爾科夫定理不再適用。給出了多結(jié)構(gòu)多元非線性融合模型的最優(yōu)權(quán)值與參數(shù)估計的計算方法,最后通過四個算例的對比驗證,可以證明該方法是有效可靠的。
針對參數(shù)βp×1的估計問題,假如有兩類線性測量數(shù)據(jù),其觀測方程如下所示:
對于兩類不等精度線性觀測數(shù)據(jù)融合模型 (1)-(2)的參數(shù)估計,構(gòu)造如下模型所示:
定理 1: 記 λi,1,λi,2,i=1,…,p分別為矩陣 XTX,ZTZ的特征值,那么融合模型的最優(yōu)權(quán)值和參數(shù)估計形式如下所示:
證明:1)由 (3)關(guān)于參數(shù)β求一階偏導(dǎo)數(shù),得到正規(guī)方程為:
因此,得到1)。
2)將 (4)式代入,并由模型 (1)、(2)的假設(shè),計算即可得到 (5)的第一式。
即定理1的結(jié)論3)成立。
定理1的結(jié)論3)具有重要的應(yīng)用價值。在處理實際問題時,(1)、(2)一般為不等精度的測量數(shù)據(jù),在這些數(shù)據(jù)的融合處理時,數(shù)據(jù)的加權(quán)對于數(shù)據(jù)處理精度具有重要影響。結(jié)論3)說明不等精度的線性觀測數(shù)據(jù)融合處理時唯一最優(yōu)融合權(quán)值由測量數(shù)據(jù)的精度決定,這本質(zhì)上仍然是線性模型最小二乘估計的Gauss-Markov定理。
在很多估計問題中,往往要考慮異類不等精度非線性觀測數(shù)據(jù)的融合處理[2]。這里,我們提出的異類數(shù)據(jù),具體指觀測數(shù)據(jù)關(guān)于待估參數(shù)的函數(shù)關(guān)系不同,因而它們的模型結(jié)構(gòu)也不一樣,參數(shù)估計的精度對其依賴程度自然也是不同的。則不同結(jié)構(gòu)的觀測數(shù)據(jù)的權(quán)值也應(yīng)該是不同的。
當(dāng)測量數(shù)據(jù)是待估參數(shù)的非線性函數(shù),由于非線性問題往往只有迭代解 (沒有解析解),估計的性質(zhì)與線性模型有本質(zhì)的不一樣。
考慮如下一元非線性模型 (18)的參數(shù)估計的偏差和方差:
對于模型 (10),為了得到其估計的性質(zhì),假設(shè):(i)f(t,β)關(guān)于參數(shù)β存在一階連續(xù)導(dǎo)數(shù),且:
(ii)f(t,β)關(guān)于參數(shù)β存在二階連續(xù)導(dǎo)數(shù),且:
條件 (i)、(ii)自然而又必要的,因為在假設(shè) (10)下,觀測向量關(guān)于參數(shù)的 Fisher信息陣為因此,就表示觀測中平均每個樣本所包含的有關(guān)參數(shù)的Fisher信息。對于模型 (10),我們有如下結(jié)論:
則參數(shù)估計的偏差和均方誤差就有如下所示近似:
由定理2可知,非線性模型的參數(shù)估計是有偏的,其偏差和方差的值不但與測量數(shù)據(jù)的精度有關(guān),而且同模型的一、二階導(dǎo)數(shù) (即模型的結(jié)構(gòu))有關(guān),則與模型曲率也有關(guān)系[2-3]。模型曲率可等價于函數(shù)的非線性程度,故降低模型曲率可以降低函數(shù)非線性程度,從而有效地改善非線性模型的參數(shù)估計效果。
為了方便討論,我們先只探究非線性回歸模型:
在線性約束模型 (2)(事實上,模型 (2)不僅可以當(dāng)作先驗信息,也可以當(dāng)作另一類系統(tǒng)的測量數(shù)據(jù))下的參數(shù)估計。根本上,兩類系統(tǒng)的測量數(shù)據(jù)融合的最優(yōu)權(quán)值問題,在參數(shù)估計均方誤差最小的準(zhǔn)則下,歸結(jié)為尋找ρ,使得極小值問題:
的解滿足MSE(β^)(ρ)=E||(β^)(ρ)- β||2=min[25]。
對于一元非線性模型,定理3提出了參數(shù)估計的偏差與均方誤差,定理4提出了最優(yōu)權(quán)值的存在性及其性質(zhì)。
當(dāng)ρ→+∞時,由第三項起始,之后的每項都是前兩項的高階無窮小量,又當(dāng)時,前面兩項之的和大于零,故存在ρ0>0,使當(dāng)>0,因而
因此對于極小值問題 (16)的求解,我們按如下的迭代方式,確定多結(jié)構(gòu)不同類型非線性測量數(shù)據(jù)融合的最優(yōu)權(quán)值及相應(yīng)的參數(shù)估計,算法步驟如下:
步驟2:由 (17)中的第二式,計算參數(shù)估計的均方誤差在處的值
步驟4:將ρ1賦值給ρ0,重復(fù)步驟1,根據(jù)給定的收斂準(zhǔn)則,重復(fù)上述四個步驟,一直迭代至收斂,此時的ρ1為最優(yōu)融合權(quán)值,為參數(shù)的最優(yōu)估計。
根據(jù)如下所示的多結(jié)構(gòu)多元非線性融合模型:
Vj=是上三角矩陣,的列向量是標(biāo)準(zhǔn)正交基。
定理5的證明過程類似于定理3和定理4,但此時由于參數(shù)是多維的,涉及到多元非線性函數(shù)的模型曲率求解,具體證明方法可參考文獻(xiàn)[6]。
步驟1:對于給定的一組權(quán)值 ρ(0),設(shè)定迭代初值β(0),使用觀測數(shù)據(jù)關(guān)于待估參數(shù)的函數(shù)式獲得到Fj(β(0));
步驟2:記ei為第i個分量為1,其他分量全為0的向量,根據(jù)設(shè)定數(shù)值微分的步長h(根據(jù)實際情況,一般可設(shè)定為h=10-6),計算Fj(β(0))梯度矩陣:
并對此進(jìn)行QR分解,得到矩陣Lj(β(0));
步驟3:由下式得到參數(shù)β的一次改進(jìn):
步驟4:對于給定的收斂閾值τ>0,如果|S(β(1))-S(β(0))|<τ,則迭代結(jié)束,令轉(zhuǎn)入Step5;否則,令β(0)=β(1),返回Step1;
算例1:設(shè)某物理量u真值為10,有不等精度的兩套設(shè)備對其進(jìn)行直接測量,分別得到100個高精度的觀測數(shù)據(jù) (均方根差為1),180個低精度的觀測數(shù)據(jù) (均方根差為4),共產(chǎn)生100組觀測數(shù)據(jù),得到的參數(shù)u的估計及方差見表1。(估計的根方差是對100組觀測數(shù)據(jù)統(tǒng)計得到。)
表1 四種估計的比較
在線性觀測數(shù)據(jù)融合處理時,唯一的最優(yōu)融合權(quán)值由測量數(shù)據(jù)的精度決定;求解極小值問題 (8)100次,得到均方誤差為0.061,估計是最優(yōu)的。
算例2(一元非線性融合模型的最優(yōu)權(quán)值與參數(shù)估計):
設(shè) f(tj,β) = 1+(5+tjβ)0.1,y(tj) = f(tj,β)+ε(tj),ε(tj)i~idN(0,0.052),z(si)=β+η(si),η(si)i.~i.dN(0,0.012),令tj=0.05 × (j- 1),j=1,…,300,si=2+0.1×(i-1),i=1,…,100,β的真值為8,產(chǎn)生50組觀測數(shù)據(jù)計算結(jié)果見表2,均方誤差與加權(quán)因子關(guān)系見圖1。
圖1 均方誤差和加權(quán)因子關(guān)系圖
當(dāng)采用線性模型的加權(quán)方式,即取權(quán)值ρ=0.052/0.012時,得到均方誤差為0.020;而當(dāng)ρ=1.80×0.052/0.012時,參數(shù)估計的均方誤差得到最小,其值為0.017。
表2 各種加權(quán)的參數(shù)估計結(jié)果對比
算例3(彈道目標(biāo)跟蹤)。
以連續(xù)波雷達(dá)和自主外測設(shè)備構(gòu)建多測距測速彈道目標(biāo)跟蹤系統(tǒng),假設(shè)有3個測量站,分別測量彈道目標(biāo)的距離R和速度R,測量值可以表達(dá)為:
假設(shè)各觀測量測量誤差服從高斯分布,且各觀測站的觀測量互不相關(guān),滿足獨立同分布條件:
仿真參數(shù)設(shè)置如下:各觀測量的采樣率為20 Hz,即t=0.05×j,j=1,…,600, 各測量站的站址坐標(biāo)為,i=1,2,3,彈道目標(biāo)在t時刻的狀態(tài)矢量可表示為利用理論彈道帶入公式(28)生成由彈道目標(biāo)的距離R和速度組成的觀測數(shù)據(jù)本例采用文獻(xiàn) [4]提出的節(jié)省參數(shù)建模方法,利用不等間距最優(yōu)節(jié)點的三次樣條函數(shù)對彈道進(jìn)行建模,采用最小二乘法對該非線性回歸模型的樣條系數(shù)和彈道參數(shù)進(jìn)行估計,ρ為最優(yōu)權(quán)值,仿真次數(shù)為100次。
仿真結(jié)果表明:當(dāng)ρ=0.122/0.0062時,MSER(ρ)=0.322 m,MSEV(ρ)=0.049 3 m/s; 當(dāng) ρ = 2.33 ×0.122/0.0062時,MSER(ρ),MSEV(ρ)達(dá)到最小值,其值分別為0.082 m,0.029 4 m/s??梢钥闯觯嘟Y(jié)構(gòu)多元非線性融合模型可以有效提高彈道目標(biāo)的估計精度。
算例4(多測速聯(lián)合定軌)
依靠同一時刻的N個(N≥6)以上的測速元,可以確定該時刻的軌道參數(shù) X(t)。以(xk,yk,zk),(k=1,2,..,N)為N個互不相同的測站在相同坐標(biāo)系下的站址坐標(biāo),N個測速可表示為:
上式就是聯(lián)系測速元與目標(biāo)位置和目標(biāo)速度的測量方程。對于是 N個互不相同的站址,Jacobi(雅克比)矩陣為:
表3 測速定軌結(jié)果與基準(zhǔn)軌道作差統(tǒng)計表
若雅克比矩陣是列滿秩矩陣,從而由反函數(shù)存在定理,可以有由式(1)唯一地確定軌道參數(shù):
假設(shè)各觀測量測量誤差服從高斯分布,且各觀測站的觀測量互不相關(guān),滿足獨立同分布條件:
圖2 平均加權(quán)定軌結(jié)果與基準(zhǔn)彈道減法統(tǒng)計圖(0.1 m/s的隨機(jī)誤差,左圖為位置,右圖為速度)
圖3 最優(yōu)加權(quán)定軌結(jié)果與基準(zhǔn)軌道減法統(tǒng)計圖(0.1 m/s的隨機(jī)誤差,左圖為位置,右圖為速度)
圖2和圖3分別為加0.1 m/s的隨機(jī)誤差條件下平均加權(quán)和最優(yōu)加權(quán)定軌結(jié)果與基準(zhǔn)彈道作差統(tǒng)計結(jié)果,由圖可知平均加權(quán)方式的差值波動較大,而最優(yōu)加權(quán)方式的波動較小。此外,從表中3均值和標(biāo)準(zhǔn)差的統(tǒng)計結(jié)論可以看出,采用非線性回歸模型最優(yōu)融合估計方式進(jìn)行多測速定軌可以不同測速元測量精度差異對定軌精度的影響,精度高于平均估計加權(quán)方式,滿足靶場試驗高精度測量系統(tǒng)定軌應(yīng)用需求。
測量數(shù)據(jù)的融合處理是提高數(shù)據(jù)處理精度的有效措施。本文研究了不等精度觀測數(shù)據(jù)融合的權(quán)值和參數(shù)估計問題。對于線性融合模型,其最優(yōu)權(quán)值由測量數(shù)據(jù)的精度唯一確定,這與經(jīng)典的Gauss-Markov定理是一致的;而對于非線性融合模型,通過參數(shù)估計的均方誤差的曲率矩陣表達(dá),建立了多結(jié)構(gòu)不等精度非線性回歸模型的最優(yōu)加權(quán)理論與算法,并給出了計算實例,結(jié)果表明:多結(jié)構(gòu)非線性回歸模型的加權(quán)數(shù)值會對參數(shù)估計精度產(chǎn)生非常大的影響,其最優(yōu)權(quán)值不僅僅和其他各類數(shù)據(jù)的測量誤差統(tǒng)計特性相關(guān)聯(lián),還與各類數(shù)據(jù)模型的結(jié)構(gòu),即模型曲率、樣本量的大小等有關(guān),從而由線性模型Gauss-Markov定理得到權(quán)值(僅與觀測數(shù)據(jù)精度有關(guān))不再是最優(yōu)的。