翁燁,邵德盛
(1.云南省地震局,云南 昆明 650200; 2.昆明理工大學(xué)國(guó)土資源與工程學(xué)院,云南 昆明 650093)
在經(jīng)典線性平差模型中,采用最小二乘求解未知參數(shù)稱為最優(yōu)線性無偏估計(jì),而在實(shí)際中因|BTPB|≈0導(dǎo)致法方程的參數(shù)解變得不穩(wěn)定,此時(shí)的法方程稱為病態(tài)方程[1]。最小二乘估計(jì)雖然是無偏估計(jì),但是在自變量相關(guān)性較強(qiáng)或者某些自變量變化范圍較大時(shí)的估計(jì)結(jié)果差強(qiáng)人意,基于對(duì)法方程系數(shù)矩陣的病態(tài)性考量,Hoerl和Kenard通過對(duì)法方程系數(shù)矩陣對(duì)角線上添加一個(gè)參數(shù)k得到了嶺估計(jì)[2,3],嶺估計(jì)目的在于按照正則化法則取目標(biāo)函數(shù)的最優(yōu)化選擇,達(dá)到減小均方誤差的同時(shí)提升參數(shù)的估計(jì)可信度[4]。嶺估計(jì)中主要是關(guān)于嶺參數(shù)的求解,因此嶺參數(shù)的選取至關(guān)重要,目前關(guān)于嶺參數(shù)的選取方法主要有嶺跡法、L-曲線法[5,6]、U-曲線法[7,8]、廣義交叉檢核法[9]。文獻(xiàn)[10]總結(jié)了8種求取嶺參數(shù)的方法、對(duì)含有較多自變量的大型回歸問題的解法進(jìn)行研究;文獻(xiàn)[11]提出了一種可以利用典則參數(shù)重復(fù)計(jì)算的方法,使得均方誤差逐步減小,該方法改進(jìn)了Hoerl和Kennard的相應(yīng)方法;文獻(xiàn)[12]提出了一種廣義嶺估計(jì)的直接解法,不需要計(jì)算嶺參數(shù)就可以直接求得具有最小均方誤差的解。文獻(xiàn)[13]闡述了在病態(tài)情形下對(duì)于病態(tài)矩陣的兩步解法。由于廣義嶺估計(jì)算法確定嶺參數(shù)太過繁雜,計(jì)算量龐大,而嶺估計(jì)對(duì)病態(tài)問題的參數(shù)改正考慮得不夠全面,缺乏針對(duì)性。本文在廣義嶺估計(jì)的基礎(chǔ)上將參數(shù)進(jìn)行分塊擬定,根據(jù)特征值的貢獻(xiàn)率確定分塊大小,按照法方程矩陣的病態(tài)性影響大小分類計(jì)算,將不同的對(duì)角線元素分塊添加嶺參數(shù)。在均方誤差下驗(yàn)證了新的嶺估計(jì)優(yōu)于狹義嶺估計(jì)和LS估計(jì),推導(dǎo)出新的嶺估計(jì)嶺參數(shù)選取方法,通過算例驗(yàn)證了該估計(jì)的可行性和適用性。
在線性模型[14]
(1)
中,L為觀測(cè)向量,B為系數(shù)矩陣,X為未知參數(shù),△為觀測(cè)向量的隨機(jī)誤差,Q已知正定矩陣且滿足Q=P-1,P為權(quán)矩陣。設(shè)G為正交方陣,使得GT(BTPB)G=Λ=diag(λ1,λ2,…,λt),λi(i=1,2,…,t)為法方程系數(shù)陣的t個(gè)特征根,引入典則參數(shù)α=GTX,并記A=BG。
典則參數(shù)α在模型(1)中的最小二乘估計(jì)和嶺估計(jì)分別為[14]:
(2)
(3)
廣義嶺估計(jì)的參數(shù)估計(jì)為:
(4)
廣義嶺估計(jì)的均方誤差為[14]:
(5)
(6)
本文在線性模型(1)上重新構(gòu)造嶺估計(jì),相對(duì)于式(3)做出改進(jìn):
(7)
(8)
(9)
(10)
(11)
=f1(k1)+f2(k2)+f3(k3)+f4(k1)+f5(k2)+f6(k3)=F(k)
(12)
(BTPB+GKGT)-1BTB(BTPB+GKGT)-1
(13)
(14)
(15)
(16)
(17)
(18)
圖1 嶺回歸參數(shù)估計(jì)
觀測(cè)值真值以及添加微小誤差后的觀測(cè)值Li 表1
模型參數(shù)X的計(jì)算結(jié)果表 表2
參數(shù)估計(jì)的協(xié)因數(shù)矩陣 表3
采用文獻(xiàn)[19]和[20]中的數(shù)值算例,含有5個(gè)未知數(shù),病態(tài)設(shè)計(jì)矩陣和觀測(cè)向量真值如下所示:
法矩陣N的條件數(shù)為cond(N)=2.084×104,嚴(yán)重病態(tài)性。嶺跡法得出的嶺參數(shù)k=0.10,如圖2所示。表4中顯示了求未知參數(shù)的LS估計(jì)、嶺估計(jì)以及本文方法的計(jì)算結(jié)果,新的嶺估計(jì)參數(shù)值的協(xié)因數(shù)矩陣如表5所示。
圖2 嶺跡法確定嶺參數(shù)
模型參數(shù)X的計(jì)算結(jié)果表 表4
參數(shù)估計(jì)的協(xié)因數(shù)矩陣 表5
通過算例1~2可以得出以下結(jié)論:
新的嶺估計(jì)可以有效地改善LS估計(jì)和狹義嶺估計(jì),提升參數(shù)估計(jì)的可信度。就算例一而言,新的嶺估計(jì)相比較LS估計(jì),殘差值和均方誤差值分別為:
均方誤差減小明顯,殘差增加也在可控范圍內(nèi)。相比較狹義嶺估計(jì),參數(shù)估計(jì)可信度也有一定的提升。在算例二中,新的嶺估計(jì)相比較LS估計(jì),殘差值和均方誤差值分別為:
因此本文新的嶺估計(jì)優(yōu)于LS估計(jì)和狹義嶺估計(jì)。
新的嶺估計(jì)相比較于LS估計(jì)和普通嶺估計(jì),對(duì)參數(shù)的估計(jì)更加貼近于真值,相比較LS估計(jì)、狹義嶺估計(jì)更加具有可信度;新的嶺估計(jì)相比較LS估計(jì)和嶺估計(jì)在均方誤差上有所改善,同時(shí)殘差值增加也在限制范圍內(nèi)。本文的廣義平差方法針對(duì)貢獻(xiàn)率較小的多數(shù)特征值有很大的改進(jìn)作用,能在一定要求范圍內(nèi)快速求解參數(shù)估計(jì)值。可以在大型病態(tài)矩陣中減少計(jì)算量,提高計(jì)算效率。