趙嘉琦 高阿芳 閆新洋 曾繁湫 李思源
(1.長(zhǎng)春工業(yè)大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,吉林 長(zhǎng)春 130012)
本文所用數(shù)據(jù)為吉林省長(zhǎng)春市試驗(yàn)農(nóng)田采集的真實(shí)有效數(shù)據(jù)。
農(nóng)田采集的數(shù)據(jù)各變量相互關(guān)聯(lián),量化分析可以避免數(shù)據(jù)之間存在復(fù)雜的共線性。主成分回歸模型先對(duì)主成分進(jìn)行分析,選取代表性的指標(biāo)替代原有指標(biāo),并反映原指標(biāo)較為全面的信息,且結(jié)果準(zhǔn)確無誤,具有典型性。
國內(nèi)外各研究者對(duì)農(nóng)業(yè)研究的指標(biāo)選取有所差異,通過資料的查詢及農(nóng)田實(shí)地的考察,選取異于常人的指標(biāo)進(jìn)行研究,如下表1為本文所選取的幾個(gè)指標(biāo)。
1.4.1 主成分
主成分分析是變量相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法,其步驟為:選擇最初研究指標(biāo);求其特征根與特征向量;查看kappa值,若大于100,先消除共線,再進(jìn)行下一步操作;通過碎石圖選取主成分個(gè)數(shù),為進(jìn)一步確定準(zhǔn)確的主成分個(gè)數(shù),查看特征值及累積貢獻(xiàn)率,若累積貢獻(xiàn)率大于80%,則選取前面相對(duì)應(yīng)的指標(biāo);獲取的結(jié)果結(jié)合實(shí)際情況進(jìn)行分析。
1.4.2 主成分回歸模型
(1)模型。
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+μ
(2)回歸分析。
運(yùn)用Python、R軟件錄入數(shù)據(jù),先進(jìn)行主成分分析,將獲得的主成分綜合加權(quán)并采用逆變換法,得到原始變量的綜合關(guān)系式。
表2 相關(guān)矩陣
由上表2,指標(biāo)間的相關(guān)系數(shù)矩陣數(shù)值可以看出變量間具有相關(guān)關(guān)系。為了降低數(shù)據(jù)維度,我們對(duì)指標(biāo)進(jìn)行因子提取,雖然這些指標(biāo)之間的單位相同,但為了后文數(shù)據(jù)的一致性,對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,并進(jìn)行因子分析。
圖1 碎石圖
從圖1中可以看出前3個(gè)主成分的提取對(duì)原變量信息的刻畫有顯著作用,為此我們抽取3個(gè)固定的因子數(shù)量,并得到下表。
由表3可知,前3個(gè)主成分X1、X2、X3的累積貢獻(xiàn)率為86.84%,大于80%。因此,對(duì)第三主成分以后的主成分完全可以忽略不計(jì),即取前3個(gè)為主成分代替原來的六個(gè)指標(biāo),起到了降維的作用。
表3 特征值及累積貢獻(xiàn)率
表4 主成分得分
求主成分的因子載荷矩陣,確定主成分與變量間的表對(duì)載荷矩陣的第i列的每個(gè)元素分別除以第i個(gè)特征根的平方根,就得到主成分分析的第 i個(gè)主成分的系數(shù),由此得到前3個(gè)主成分X1、X2、X3的線性組合為(X為標(biāo)準(zhǔn)化后的變量)。把系數(shù)和相應(yīng)的指標(biāo)相乘后再求和,可以得到最終的主成分的分公式:
F1=-0.287X1+0.550X2+0.137X3+0.198X4+0.602X5+0.526X6
F2=-0.014X1+0.051X2+0.672X3+0.665VBX4-0.202X5-0.249X6
F3=0.999X1+0.022X2+0.033X3-0.006X4+0.017X5+0.006X6
本文僅從單純的數(shù)量上考慮,以3個(gè)因子的方差貢獻(xiàn)率為權(quán)數(shù)。即:P=0.4F1+0.3F2+0.17F3
表5 主成分回歸
對(duì)具有代表性的主成分進(jìn)行回歸分析,從上表5中可以看出F1、F2、F3的P值均小于0.05,且調(diào)整后的R2為0.988,得出3個(gè)主成分可以表達(dá)98.88%的信息,其效果顯著,F(xiàn)1、F2、F3的回歸關(guān)系式為:Y=204.89+2.66F1+10.46F2+0.19F3
采用逆變換法,運(yùn)用代碼求原回歸模型,最終求得回歸方程為:Y=226.43+55.47X1-0.85X2-8.65X3-7.53X4+0.27X5+0.54X6
本文通過主成分回歸分析得出,左下拉桿鉸接點(diǎn)、左下拉桿傾角、右下拉桿傾角與耕深成正比例,右下拉桿鉸接點(diǎn)、左下拉桿、右下拉桿與耕深成反比例。在農(nóng)田地表溫度、酸堿度特定的條件下,耕深的深度決定糧食的產(chǎn)量。因此,在未來的農(nóng)田耕種中,可以通過給定的變量值不斷試驗(yàn)耕深,以求達(dá)到糧食產(chǎn)量的增加。