王仲鋒,周紅梅
(長春工程學(xué)院勘查與測繪工程學(xué)院,長春130021)
在解決諸如冪函數(shù)、指數(shù)函數(shù)、雙曲函數(shù)和S型曲線等非線性函數(shù)回歸分析問題時,傳統(tǒng)方法是通過換元化為線性函數(shù),按一元線性回歸和等權(quán)方式(俗稱擬線性回歸)求解被估計參數(shù)。如此做法將帶來嚴(yán)重的異方差問題[1-4],致使回歸參數(shù)無法使用。解決擬線性回歸中異方差問題的有效方法是采用加權(quán)回歸[2]和非線性最小二乘回歸[3]。然而,加權(quán)回歸和非線性最小二乘回歸通常存在殘差和不為零的問題。有些時候,建立回歸方程的目的并不側(cè)重于對個體進(jìn)行預(yù)測,而是側(cè)重于對總體進(jìn)行預(yù)測。例如,在林業(yè)上建立木材材積模型時主要用于區(qū)域立木材積的估產(chǎn)。在此種情況下,對于非線性材積模型,用殘差和為零的非線性最小二乘回歸法進(jìn)行數(shù)據(jù)處理,使模型的殘差和為零將會提高區(qū)域立木材積估產(chǎn)的精度。
本文利用10個樹種的建模(編表)數(shù)據(jù)、伯克霍特材積模型和山本和藏材積模型以及殘差和為零的非線性回歸分析法[1]進(jìn)行木材材積建模,并用10個樹種的驗表數(shù)據(jù)對所建模型進(jìn)行驗證,同時和用非線性最小二乘回歸法進(jìn)行數(shù)據(jù)處理的結(jié)果進(jìn)行比較,以驗證殘差和為零的非線性回歸分析法的可行性和優(yōu)越性。
對于非線性樣本回歸方程組
其中,
從左至右依次記式(2)中的矩陣為 e(k+1)、X(k)、和l(k),則式(2)可簡寫為
式(4)為線性化的誤差方程,當(dāng)Yi為等權(quán)(即ε~N(0,σ2I))觀測值時,根據(jù)最小二乘原理,可得
而
在不至于引起混淆的情況下,可把迭代結(jié)束后的式(4)簡寫為
顯然,由于式(7)中X的第一列的元素通常情況下不全為1,故即使在等權(quán)觀測情況下,非線性最小二乘回歸的被解釋變量觀測值之改正數(shù)(回歸的殘差)ei的代數(shù)和亦不為零,也就是說非線性最小二乘回歸通常是存在模型閉合差的。
令
則可利用式(7)構(gòu)建強制條件
將式(7)與式(12)聯(lián)立求解,根據(jù)附加限制條件的回歸原理,可重新求得
需要指出的是由于非線性回歸后W =XTl=XT(Y-)=-XTe=0,故實際計算時式(13)變成
實驗共使用了一個一元材積模型和一個二元材積模型,其形式如表1所列。
表1 實驗用的材積函數(shù)模型
10個樹種的編表與驗表數(shù)據(jù)分別見表2和表3,數(shù)據(jù)來自吉林省和龍林業(yè)局。
表2 10個樹種的編表數(shù)據(jù)
表3 10個樹種的驗表數(shù)據(jù)
表3 (續(xù))
根據(jù)10個樹種的編表數(shù)據(jù)、兩個模型和兩種方法求解的模型相對閉合差(殘差和的絕對值/總材積)見表4。
表4 編表數(shù)據(jù)回歸相對閉合差比較表/%
用10個樹種的驗表數(shù)據(jù)隊建立的模型進(jìn)行檢驗,算得的相對閉合差見表5。
表5 驗表相對閉合差比較表/%
2.5.1 建模結(jié)果分析
由表4可知,兩種數(shù)據(jù)處理方法建模時,非線性最小二乘回歸建模的相對閉合差明顯大于殘差和為零的非線性回歸建模的相對閉合差。10個樹種采用伯克霍特材積模型和非線性最小二乘回歸的相對閉合差在0.33%~4.46%之間,平均為1.55%,而采用殘差和為零的非線性回歸的相對閉合差在0.00%~0.07%之間,平均值為0.01%;10個樹種采用山本和藏材積模型和非線性最小二乘回歸的相對閉合差在0.02%~1.41%之間,平均值為0.61%,而采用殘差和為零的非線性回歸的相對閉合差在0.00%~0.06%之間,平均值為0.02%。兩種材積模型及兩種數(shù)據(jù)處理方法獲得的10個樹種的材積建模相對閉合差的比較見圖1~2。
圖1 伯克霍特材積模型建模的相對閉合差比較
圖2 三本和藏材積模型建模的相對閉合差比較
2.5.2 驗表結(jié)果分析
(1)由表5知,由10個樹種驗表數(shù)據(jù),采用伯克霍特材積模型和非線性最小二乘回歸的參數(shù)求解的材積相對閉合差在0.99%~12.82%之間,平均為4.30%,而采用殘差和為零的非線性回歸的相對閉合差在0.00%~13.37%之間,平均值為3.01%;采用山本和藏材積模型時,由非線性最小二乘回歸的參數(shù)求解的驗表材積相對閉合差在0.10%~6.97%之間,平均為1.83%,而采用殘差和為零的非線性回歸的參數(shù)求解的驗表材積相對閉合差在0.00%~7.44%之間,平均值為1.43%。兩種材積模型及兩種數(shù)據(jù)處理方法獲得的10個樹種的材積驗表相對閉合差的比較見圖3~4。
圖3 伯克霍特材積模型驗表的相對閉合差比較
圖4 三本和藏材積模型驗表的相對閉合差比較
(2)無論采用伯克霍特材積模型還是山本和藏材積模型,其中8個樹種用殘差和為零的非線性回歸方法獲得的驗表材積相對閉合差小于用非線性最小二乘回歸方法獲得的驗表材積相對閉合差,只有兩個樹種(云杉、色樹)的驗表材積相對閉合差是前一種方法的結(jié)果略大于后一種方法的結(jié)果。
無論伯克霍特材積模型還是山本和藏材積模型,當(dāng)用殘差和為零的非線性回歸方法求解模型參數(shù)時,無論參數(shù)的精度(限于篇幅文中未列出)還是材積估算的精度(以相對閉合差為指標(biāo))均總體高于用非線性最小二乘回歸方法求解模型參數(shù)時的參數(shù)精度和材積估算的精度。因此,殘差和為零的非線性回歸方法是適用于材積建模的一種較好的數(shù)據(jù)處理方法。
[1]王仲鋒,王琦.殘差和為零的非線性回歸法及其應(yīng)用[J].東北林業(yè)大學(xué)學(xué)報,2011(2):125-127.
[2]王仲鋒.加權(quán)線性回歸及其應(yīng)用[J].長春工程學(xué)院學(xué)報:自然科學(xué)版,2010(3):118-121.
[3]王仲鋒,馮仲科.林木生物量參數(shù)的非線性最小二乘解法研究[J].吉林農(nóng)業(yè)大學(xué)學(xué)報,2006(3):261-264.
[4]王仲鋒,馮仲科.幾種一元擬線性回歸中的問題與改進(jìn)措施[J].東北師大學(xué)報:自然科學(xué)版,2006(4):45-52.