陸玉玲,謝錢姣,朱家明,李德政
(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
基于多元回歸對糧食產(chǎn)量的研究
陸玉玲,謝錢姣,朱家明,李德政
(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
為建立關于糧食產(chǎn)量的模型,并運用模型計算安徽省2020年化肥、農(nóng)藥使用量零增長時化肥利用率提高的百分點,利用時間序列分析預測得到了2015-2020年糧食產(chǎn)量、農(nóng)藥和化肥使用量,建立糧食產(chǎn)量與有效化肥使用量和農(nóng)藥使用量的回歸模型,并利用其解決化肥、農(nóng)藥使用量零增長時化肥利用率提高的百分點,運用MATLAB進行求解,得出化肥利用率提高的百分點為7.3%。
糧食產(chǎn)量;多元回歸;時間序列;MATLAB
糧食產(chǎn)量是我國第一產(chǎn)業(yè)的重要組成部分,是國家經(jīng)濟發(fā)展的基礎,受到多重因素的影響,比如農(nóng)藥使用量以及化肥使用量。有效的糧食產(chǎn)量預測可以為政府決策提供科學依據(jù),同時,在減少農(nóng)藥和化肥使用量下,如何實現(xiàn)糧食的高產(chǎn)出也是我們一直追求的目標。
近年來,隨著科技的不斷發(fā)展,糧食產(chǎn)量的預測方法也得到了不斷的發(fā)展。文獻[1]225-228+267采用了灰色預測模型預測糧食產(chǎn)量的變化趨勢,然后運用BP神經(jīng)網(wǎng)絡對灰色預測模型所得到的結果進行了修正,從而提高了預測精度。但是,此方法僅能提高單一的糧食產(chǎn)量預測精度。文獻[2]6-10利用支持向量機模型對糧食產(chǎn)量進行預測,提高了小樣本糧食產(chǎn)量預測精度。但此方法僅考慮糧食歷史產(chǎn)量數(shù)據(jù),沒有考慮到其他影響因素。文獻[3]429-433利用灰色預測和馬爾可夫預測模型相結合來對糧食產(chǎn)量進行預測,從而大大提高了糧食產(chǎn)量的預測精度。
為了便于解決和研究問題,提出以下幾條假設:(1)假設所有數(shù)據(jù)的來源真實可靠,具有科學性;(2)假設糧食產(chǎn)量只與化肥、農(nóng)藥的使用量及其利用率有關,不受其他因素的影響。
2.1 研究思路
首先,收集安徽省2005—2014年糧食產(chǎn)量、化肥施用量、農(nóng)藥使用量數(shù)據(jù),其次根據(jù)所收集到的數(shù)據(jù)建立時間序列的預測模型,并利用MATLAB軟件進行求解,從而得到安徽省在2015—2020年糧食產(chǎn)量、化肥施用量、農(nóng)藥使用量的具體數(shù)值。
2.2 研究方法
(1)數(shù)據(jù)收集
①根據(jù)國家統(tǒng)計局公布的官方數(shù)據(jù),將其倒入Excel中得到2005—2014年安徽省的糧食產(chǎn)量、化肥使用量、農(nóng)藥使用量指標的具體數(shù)據(jù)見表1。
表1 2005-2014年農(nóng)業(yè)相關數(shù)據(jù) (單位:萬噸)
②根據(jù)安徽省農(nóng)業(yè)委員會公布的數(shù)據(jù),我們可以得到2005—2014年安徽省的化肥利用率和農(nóng)藥利用率數(shù)據(jù),見表2。
表2 2005-2014年化肥、農(nóng)藥利用率
為了反映化肥與農(nóng)藥利用率變動的情形及其好壞趨向,根據(jù)表2中的數(shù)據(jù),做出化肥和農(nóng)藥利用率的雷達圖,如圖1所示。
圖1 化肥與農(nóng)藥利用率的雷達圖
(2)數(shù)據(jù)預處理
有效化肥使用量:指化肥使用量與化肥利用率的乘積。假設用H表示有效化肥使用量,則H=π1·π2,π1表示化肥使用量,π2表示化肥利用率。
根據(jù)化肥使用量和化肥利用率的數(shù)據(jù),運用EXCEL軟件計算得到2005—2014年安徽省各年的有效化肥使用量,見表3。
(3)模型的建立與求解
根據(jù)安徽省2005—2014年的糧食產(chǎn)量及化肥、農(nóng)藥的使用量,建立時間序列預測模型,[4]并結合MATLAB軟件,得到了2005—2014年的糧食產(chǎn)量及化肥、農(nóng)藥使用量的預測值,具體數(shù)據(jù)見表4。
表3 2005-2014年有效化肥使用量 (單位:萬噸)
表4 糧食產(chǎn)量、化肥和農(nóng)藥使用量預測值(單位:萬噸)
表5 2005-2014年糧食產(chǎn)量、化肥使用量和農(nóng)藥使用量實際與預測值(單位:萬噸)
2.3 結果分析
一般來說,相對誤差的絕對值在0.2以內(nèi)說明模型有較高的合理性,且相對誤差越小,模型的精度越高由表5中的數(shù)據(jù)可知,相對誤差的絕對值均在0.2以內(nèi),這說明建立的模型是相對合理的,可靠性較高。
3.1 研究思路
首先,根據(jù)表1中2005-2014年間各年的糧食產(chǎn)量、農(nóng)藥使用量和表3中2005-2014年間各年的有效化肥使用量的具體數(shù)據(jù),以糧食產(chǎn)量為因變量,有效化肥使用量和農(nóng)藥使用量為自變量,建立多元線性回歸模型,[5]利用MATLAB軟件進行求解得到回歸方程,并對模型進行檢驗。其次,根據(jù)方程,以2015年的化肥使用量為基準,在二者用量保持不變的情況下,求解2020年化肥利用率所提高的百分點。
3.2 具體過程和結果
(1)以2005年為第1年,分別用xt,yt,gt(t=1,2,…16)表示第t年的安徽省糧食產(chǎn)量、農(nóng)藥使用量,有效化肥使用量,它們之間的關系用公式表為:
xt=a0+a1yt+a2gt+εt
(2)矩陣形式
X=(x1,x2,…x10),
B=(β1,β2,…β10),
N=(ε1,ε2,…ε10)
則糧食產(chǎn)量與各變量的關系可用矩陣表示為:
(3)未知參數(shù)的估計值可以由最小二乘來估計,表示為:
所以可得回歸方程:
根據(jù)相關數(shù)據(jù),并結合MATLAB軟件得到第t年的糧食產(chǎn)量xt與第t年的農(nóng)藥使用量yt和有效化肥使用量gt之間的二元線性回歸方程為:
xt=1748.6985+14.1856gt-0.1075yt
可決系數(shù)為0.9665。
表6 多元線性回歸預測值相對誤差
由表6可知,相對誤差的絕對值均小于0.03,故模型的可靠度較高。
(5)對殘差進行正態(tài)性檢驗和t檢驗:由MATLAB運行結果可以知道,正態(tài)性檢驗的測試結果為0,說明殘差通過正態(tài)性檢驗,且t檢驗的測試結果為0,說明殘差通過t檢驗。因此模型的建立是比較合理的,利用此模型得到的數(shù)據(jù)和結論比較真實可靠。
(6)由表4可知2020年的糧食產(chǎn)量的預測值為3864.8萬噸,2015年的農(nóng)藥使用量的預測值為12.4107萬噸,2015年的化肥使用量預測值為351.0127萬噸,以2015年的糧食產(chǎn)量,農(nóng)藥、化肥使用量為基準,來求解2020年的化肥利用率。[6]
由于農(nóng)藥使用量零增長,將2020糧食產(chǎn)量和2015年農(nóng)藥使用量具體數(shù)值代入方程:
x16=1748.6985+14.1856g16-0.1075y11
求解得到2020年的有效化肥使用量為149.2666萬噸。
根據(jù)第t年化肥利用率ft、化肥使用量yt、有效化肥使用量gt之間的關系,即第t年化肥利用率為:
通過查閱中國農(nóng)業(yè)委員會公布的數(shù)據(jù),得到2015年化肥利用率為35.2%,所以2020年化肥利用率提高的百分點為42.5%-35.2%=7.3%。
在安徽省2020年實現(xiàn)化肥、農(nóng)藥使用量零增長的前提下,為了預測化肥利用率提高的百分點,本文建立了時間序列預測模型,根據(jù)相關數(shù)據(jù)預測得到了安徽省2015-2020年間各年的糧食產(chǎn)量、農(nóng)藥使用量以及化肥使用量的預測值,同時引入了有效化肥使用量這個概念,建立了糧食產(chǎn)量關于農(nóng)藥使用量和有效化肥使用量的二元線性回歸方程,并對模型進行了相對誤差檢驗,對殘差進行了正態(tài)性檢驗和t檢驗,從而可知模型具有較高的可靠性,但是本文只考慮了農(nóng)藥和化肥使用量對糧食產(chǎn)量的影響,沒有考慮其它因素的影響,故結果具有一定的誤差。此外,本文使用的時間序列預測模型不僅可以預測糧食產(chǎn)量,還可以與當前先進的科學技術相聯(lián)系應用于測量領域,比如多時相遙感圖像數(shù)據(jù)分析,即遙感時間序列分析,用于監(jiān)測各種資源動態(tài),通用性較強。
[1]林芳.灰色神經(jīng)網(wǎng)絡在糧食產(chǎn)量預測中的應用[J].計算機仿真,2012(4):225-228+267.
[2]向昌盛,周子英,武麗娜.糧食產(chǎn)量預測的支持向量機模型研究[J].湖南農(nóng)業(yè)大學學報(社會科學版),2010,(1):6-10.
[3]陳煥珍.基于灰色馬爾科夫模型的青島市糧食產(chǎn)量預測[J].計算機仿真,2013(5):429-433.
[4]羅鳳曼.時間序列預測模型及其算法研究[D].四川大學,2006.
[5]李瑩.基于時間序列與多元線性回歸綜合模型的農(nóng)村卷煙銷量預測[D].云南大學,2015.
[6]李亮科.生產(chǎn)要素利用對糧食增產(chǎn)和環(huán)境影響研究[D].中國農(nóng)業(yè)大學,2015.
Class No.:F323 Document Mark:A
(責任編輯:蔡雪嵐)
Study on Grain Yield Based on Multiple Regressions
Lu Yuling, Xie Qianjiao, Zhu Jiaming, Li Dezheng
(School of Statistics and Applied Mathematics, Anhui Finance and Economics University, Bengbu, Anhui 233030,China)
In order to establish the food production model and calculate the percentage increase of fertilizer utilization when the use of chemical fertilizers and pesticides achieve zero growth in Anhui Province in 2020, we used the time series analysis approach to predict the grain yield and the use of pesticide and fertilizer in 2015-2020. We established a regression model of grain yield and use of fertilizers and pesticides. Based on the model, we concluded that the utilization ratio of fertilizer is 7.3% solved by MATLAB.
grain yield;multiple regressions;time series;MATLAB
陸玉玲,本科學生,安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院。研究方向:數(shù)學與應用數(shù)學。 朱家明,碩士,副教授,安徽財經(jīng)大學統(tǒng)計與應用數(shù)學學院。研究方向:應用數(shù)學與數(shù)學建模。
國家自然科學基金(編號:11301001); 國家級大學生創(chuàng)新訓練計劃(編號:201510378470)。
1672-6758(2017)06-0090-4
F323
A