劉 鋒,徐振樞,王利兵
(重慶理工大學數(shù)學與統(tǒng)計學院,重慶 400054)
小麥的機械強度受到小麥許多指標因素的影響,其中,小麥抗倒伏性對小麥生產(chǎn)至關重要[1-3]。小麥的抗倒伏性在小麥生長的不同時期可造成不同的影響。通過增強小麥的抗倒伏指數(shù),可以更有效地讓小麥成熟,從而增加小麥產(chǎn)量。本文主要用部分線性模型對小麥機械強度與小麥各參數(shù)之間的關系進行研究。
Engle(1986)[4]首先提出了半?yún)?shù)部分線性模型,其具體形式是:
其中:x=(x1,x2,…,xs)是隨機變量;xj,j=1,2,…,s是x的第j個分量;β是未知參數(shù)部分;g(·)是未知函數(shù)部分;ε為隨機誤差,隨機誤差部分需要滿足E(εi)=0,Var(εi)=σ2。本文就是要應用部分線性模型得到小麥抗倒伏指標中機械強度與小麥自身的指數(shù)之間的參數(shù)關系,進而進行分析。
對于上述的部分線性模型,需要對未知參數(shù)和未知函數(shù)部分進行估計。本文應用兩步估計算法對未知的函數(shù)進行估值,從而得到函數(shù)的形式。兩步估計算法[5]是通過將函數(shù)擬合得到對于未知部分的估計值。
模型為
對于該模型以變量T取條件期望,從而得到方程:
式(2)減去式(1)得到:
缺失數(shù)據(jù)是在生活與科研中經(jīng)常遇到的,由于部分原因導致了數(shù)據(jù)統(tǒng)計中出現(xiàn)了數(shù)據(jù)的缺失,進行分析時只能對一部分數(shù)據(jù)進行分析。
對于缺失數(shù)據(jù)的分析,首先設定缺失指示變量,即:
據(jù)此可以得出相應的缺失模型:
利用已知數(shù)據(jù)及上述模型,根據(jù)文獻[6]得到缺失數(shù)據(jù)的借補值。
本研究選取了2007、2008和2011年小麥數(shù)據(jù)(矮抗58,周麥18),包括小麥各節(jié)長度、粗度,單個小麥的重心高度、莖稈壁厚、穗重等對小麥抗倒伏性研究較為重要的指標。
可以看到,上述公式中莖稈鮮重與莖稈重心高度都可以通過測量得到,而機械強度往往不容易獲得,因此莖稈機械強度對于小麥抗倒伏性是非常重要的。
由于只有2007年的數(shù)據(jù)給出了具體的小麥機械強度測量數(shù)據(jù),因此首先就要進行數(shù)據(jù)分析和方程擬合,得到機械強度與各指標之間的函數(shù)關系,進而應用2008年與2011年的數(shù)據(jù)得到這2個年度小麥品種的機械強度。通過3個年度的數(shù)據(jù)比較,分析出矮抗58的抗倒性要強于周麥18的抗倒性。
2.1.1 周麥18分析
在2個小麥品種之中,周麥18這個小麥品種的各項指標不存在缺失,因此先分析該種小麥。
令:y為機械強度;x1為莖稈重心;x2為基部第5節(jié)長度;x3為基部第5節(jié)粗度;x4為基部第4節(jié)長度;x5為基部第4節(jié)粗度;x6為基部第3節(jié)長度;x7為基部第3節(jié)粗度;x8為基部第2節(jié)長度;x9為基部第2節(jié)粗度;x10為莖稈壁厚;x11為麥穗鮮重。
首先通過數(shù)據(jù)的相關性分析得到機械強度與主要指標之間的相關系數(shù)矩陣,見表1。
對小麥品種周麥18進行因子分析,結果表明,前2個成分的累積貢獻率達到0.801 56,因此取這2個成分進行分析。具體形式為:
由圖1、2可以看出:第1成分與機械強度之間存在著較強的線性關系,而第2成分與響應變量之間無法得到具體的函數(shù)形式。因此,用部分線性模型進行擬合,核函數(shù)選取為k(t)=15×(1-t2)2/16,窗寬選擇為h=0.911 423 5,利用兩步估計,得到擬合方程為
圖1 周麥18第1成分與機械強度之間的關系
圖2 周麥18第2成分與機械強度之間的關系
2.1.2 矮抗58分析
矮抗58的數(shù)據(jù)存在缺失,并且存在個別的異常數(shù)據(jù)。首先要對數(shù)據(jù)進行篩選,同時對缺失數(shù)據(jù)進行借補。將借補值填充到缺失值對應的部分進行分析。首先對機械強度與小麥各指標數(shù)據(jù)之間進行了相關系數(shù)分析,對數(shù)據(jù)進行標準化,得到矮抗58機械強度與主要指標之間的相關系數(shù)矩陣,見表2。
表2 矮抗58機械強度與主要指標之間的相關系數(shù)矩陣
通過因子分析得到對于矮抗58這個小麥品種機械強度與各個品種之間的關系。通過數(shù)據(jù)模擬可以得到前2個成分的累積貢獻率達到0.820 29,因此取這2個成分進行分析,其具體形式為:
接下來將得到的2個成分與小麥機械強度作散點圖,見圖3、4。
圖3 短抗58第1成分與機械強度之間的關系
圖4 短抗58第2成分與機械強度之間的關系
由圖3、4可以看出,小麥機械強度與第1成分有較為明顯的線性關系,而第2成分與小麥機械強度之間得不到具體的函數(shù)形式。核函數(shù)選取為k(t)=15×(1-t2)2/16,窗寬選擇為h=1.322 978,利用兩步估計,得到擬合方程為
將利用上述方法得到的模型應用到2007、2008年與2011年的數(shù)據(jù)之中,分別計算出2個小麥品種在這2個年度中樣品的機械強度。加上2007年數(shù)據(jù),結果見表3。
表3 3個年度2個小麥品種機械強度 kg
部分線性模型理論正在逐步推廣,其應用還不是很全面。部分線性模型是一種非參數(shù)模型,許多統(tǒng)計問題可以應用該模型進行求解。兩步估計算法在部分線性模型的估計中起到了舉足輕重的作用,它可以有效解決部分線性模型各個函數(shù)的估計問題,如本文中所應用的方法可以有效地解決“維數(shù)災禍”的問題。
本文將部分線性模型應用到小麥抗倒伏性的研究中,獲得了對小麥抗倒伏性起到關鍵作用的機械強度指標的計算方法,得到了所給定的小麥品種之中矮抗58的小麥抗倒伏性最強的結果。但由于數(shù)據(jù)給定的范圍較為有限,模型的精度還有待進一步的提高,還需要進一步研究。
[1]田保明,楊光圣,曹剛強.農(nóng)作物倒伏及其影響因素分析[J].中國農(nóng)學通報,2006,22(4):163-167.
[2]王勇,李斯深,李安飛,等.小麥種植抗倒性的評價和抗倒性裝的相關與通徑分析[J].西北植物學報,2000,20(1):79-85.
[3]余澤高,李志新,嚴波.小麥莖稈機械強度與若干形狀的相關性研究[J].農(nóng)業(yè)工程學報,2007,23(7):14-18.
[4]Engle R F,Granger C W J,Rice J,et al.Semiparametric estimates between weather and electricity sales[J].Journal of American Statistical Association,1986,80:310-319.
[5]封維波,劉瓊蓀.半?yún)?shù)模型中兩步估計與最小二乘估計的比較[J].統(tǒng)計與決策,2008(4):27-29.
[6]楊宜平,薛柳根,程維虎.響應變量存在缺失時部分線性模型的經(jīng)驗似然[J].高校應用數(shù)學學報,2010,25(1):43-52.