閆海霞 劉素兵 張 華
(西安理工大學(xué)高科學(xué)院 西安 710019)
農(nóng)業(yè)是一個(gè)國(guó)家的國(guó)民經(jīng)濟(jì)的基礎(chǔ),而糧食生產(chǎn)則是農(nóng)業(yè)的關(guān)鍵。因此,搞好糧食產(chǎn)量的預(yù)測(cè)十分重要[1~3]。預(yù)測(cè)糧食產(chǎn)量的方法有很多:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法[4],回歸分析法[5~6],灰色預(yù)測(cè)法[7~8]等?;疑到y(tǒng)是針對(duì)信息不完全的對(duì)象進(jìn)行研究,它克服了概率統(tǒng)計(jì)的弱點(diǎn),可以從有限的、離散的數(shù)據(jù)中找出規(guī)律,建立灰色系統(tǒng)模型,然后用它來(lái)進(jìn)行相應(yīng)的分析[9]。
灰色災(zāi)變預(yù)測(cè)模型[10~12]的特點(diǎn),關(guān)注數(shù)據(jù)序列中出現(xiàn)突高突低的數(shù)據(jù)所對(duì)應(yīng)的時(shí)刻,稱(chēng)為預(yù)測(cè)異常值或“災(zāi)變”點(diǎn)出現(xiàn)的時(shí)間。我國(guó)糧食作物主要以玉米、水稻、小麥為主,而小麥主要有春小麥[13~14]和冬小麥兩種。春小麥的抗旱能力強(qiáng),生長(zhǎng)周期短,適合春天播種,主要分布在冬季很冷的地方,開(kāi)春以后播種,秋季收獲。我國(guó)種植春小麥的地區(qū),主要是在長(zhǎng)城以北,如黑龍江、新疆、甘肅、山西和內(nèi)蒙古。本文研究我國(guó)春小麥產(chǎn)量,小麥產(chǎn)量會(huì)受到自然“災(zāi)害”的影響,比如降水太多會(huì)發(fā)生“澇災(zāi)”,降水太少又會(huì)出現(xiàn)“旱災(zāi)”,以及病蟲(chóng)災(zāi)害都會(huì)影響小麥產(chǎn)量[15]。本文將多項(xiàng)式模型與灰色災(zāi)變預(yù)測(cè)模型相結(jié)合,預(yù)測(cè)我國(guó)春小麥產(chǎn)量。
災(zāi)變預(yù)測(cè)[16]:定量求時(shí),是預(yù)測(cè)異常值或“災(zāi)變”點(diǎn)出現(xiàn)的時(shí)間。
原始數(shù)據(jù)序列,規(guī)定一個(gè)閾值(臨界值),把原始數(shù)據(jù)序列中大于該臨界值(上災(zāi)變)和小于該臨界值(下災(zāi)變)的數(shù)叫做異常值,將其選出來(lái)形成一個(gè)新的數(shù)據(jù)序列,該數(shù)據(jù)序列就被稱(chēng)為災(zāi)變序列。同時(shí)以這組數(shù)據(jù)中各個(gè)數(shù)據(jù)出現(xiàn)的對(duì)應(yīng)時(shí)刻(即做災(zāi)變映射)。組成災(zāi)變時(shí)刻序列(日期集)。利用日期集數(shù)據(jù)序列建立GM(1,1)模型進(jìn)行災(zāi)變預(yù)測(cè)。
多項(xiàng)式數(shù)據(jù)擬合,是依據(jù)原始數(shù)據(jù)散點(diǎn)圖,分析變量間的相關(guān)程度與相關(guān)關(guān)系,構(gòu)建多項(xiàng)式擬合方程,得到數(shù)據(jù)的擬合值,然后計(jì)算擬合殘差。殘差反應(yīng)了實(shí)際值與擬合曲線的偏離程度。本文以擬合殘差數(shù)據(jù)為依據(jù),在給定的臨界值基礎(chǔ)上找出異常值和異常值對(duì)應(yīng)時(shí)刻,利用殘差將原始數(shù)據(jù)分為兩大類(lèi):偏離較多的一類(lèi),偏離較少的一類(lèi)。偏離較多的數(shù)值點(diǎn)的日期作為災(zāi)變?nèi)掌邳c(diǎn),形成災(zāi)變序列,構(gòu)建GM(1,1)模型,預(yù)測(cè)出下一個(gè)或幾個(gè)災(zāi)變?nèi)掌邳c(diǎn),同時(shí)以跳變?nèi)掌邳c(diǎn)的原始數(shù)據(jù)構(gòu)建GM(1,1)模型,預(yù)測(cè)下一個(gè)或幾個(gè)災(zāi)變值。為更好地反應(yīng)原始序列的災(zāi)變點(diǎn)的變化趨勢(shì),不妨以殘差的正負(fù)符號(hào)將災(zāi)變點(diǎn)分為兩類(lèi):上災(zāi)變點(diǎn)和下災(zāi)變點(diǎn)。然后在分別使用GM(1,1)模型進(jìn)行預(yù)測(cè),對(duì)于偏離較少的點(diǎn),用原始序列中去除災(zāi)變點(diǎn)后的序列重新進(jìn)行數(shù)據(jù)擬合,同時(shí)也可用其預(yù)測(cè)未來(lái)的非災(zāi)變時(shí)刻的春小麥產(chǎn)量值。
總之,在進(jìn)行預(yù)測(cè)時(shí),如果預(yù)測(cè)點(diǎn)是灰色災(zāi)變模型預(yù)測(cè)出的災(zāi)變?nèi)掌邳c(diǎn),則由灰色模型預(yù)測(cè)災(zāi)變值,如果預(yù)測(cè)時(shí)刻不是災(zāi)變?nèi)掌邳c(diǎn),則用多項(xiàng)式函數(shù)預(yù)測(cè)。
灰災(zāi)變GM(1,1)模型與多項(xiàng)式擬合方程的具體步驟:
1)符號(hào)假設(shè)
2)建模方法
由原始數(shù)據(jù)序進(jìn)行擬合,得到三次多項(xiàng)式擬合公式和殘差序列。
若該點(diǎn)的殘差絕對(duì)值大于給定的臨界值,則認(rèn)為該點(diǎn)為災(zāi)變點(diǎn),否則為非災(zāi)變點(diǎn)。根據(jù)殘差的正負(fù)號(hào),將災(zāi)變點(diǎn)分為上災(zāi)變點(diǎn)(殘差值為正)和下災(zāi)變點(diǎn)(殘差值為負(fù))。將上災(zāi)變點(diǎn)日期和相應(yīng)原始數(shù)據(jù)災(zāi)變值分別組成災(zāi)變?nèi)掌谛蛄蠵0=(p(1),p(2),…,p(r)) 和 對(duì) 應(yīng) 的 災(zāi) 變 值 序 列=(X0(p(1)),…,X0(p(r)))。同理下災(zāi)變點(diǎn)日期和相應(yīng)原始數(shù)據(jù)災(zāi)變值分別組成災(zāi)變?nèi)掌谛蛄蠶0=(q(1),q(2),…,q(s)) 和 對(duì) 應(yīng) 的 災(zāi) 變 值 序 列=(X0(q(1)),…,X0(q(s)))。建立GM(1,1)模型。
3)GM(1,1)模型原理
由時(shí)間響應(yīng)函數(shù)來(lái)預(yù)測(cè),由于模型的預(yù)測(cè)值是數(shù)據(jù)處理后的預(yù)測(cè)值,所以需要對(duì)預(yù)測(cè)值進(jìn)行累減后就還原為原始數(shù)據(jù)系列x(0)的模擬預(yù)測(cè)值,即
采集到1995年~2014年我國(guó)春小麥產(chǎn)量(見(jiàn)表1),運(yùn)用本文的組合模型對(duì)我國(guó)春小麥產(chǎn)量進(jìn)行分析、擬合、預(yù)測(cè)。
表1 1995年~2014年我國(guó)春小麥產(chǎn)量(單位:萬(wàn)噸)
從數(shù)據(jù)表中看到2001年為缺省數(shù)據(jù),這里使用移動(dòng)平均法補(bǔ)足數(shù)據(jù),2001年的春小麥產(chǎn)量以664.54萬(wàn)噸計(jì)入計(jì)算方法中。使用Matlab軟件,對(duì)數(shù)據(jù)進(jìn)行三次多項(xiàng)式擬合,得到擬合方程:
對(duì)災(zāi)變?nèi)掌谛蛄泻蜑?zāi)變值序列,運(yùn)用GM(1,1)模型計(jì)算災(zāi)變?nèi)掌谛蛄蠵0、Q0和災(zāi)變值序列的 預(yù) 測(cè) 函 數(shù) P?0Yk+Y 、Q?0(k+) 和(k+)。
上災(zāi)變?nèi)掌诤蜕蠟?zāi)變值預(yù)測(cè)函數(shù)為
下災(zāi)變?nèi)掌谂c下災(zāi)變值預(yù)測(cè)函數(shù)為
從表2和表3看出,災(zāi)變灰色模型的擬合殘差比三次多項(xiàng)式擬合殘差小,說(shuō)明灰色災(zāi)變模型的擬合程度較好。
表2 上災(zāi)變點(diǎn)的三次多項(xiàng)式與GM(1,1)擬合結(jié)果比較
表3 下災(zāi)變點(diǎn)的三次多項(xiàng)式與GM(1,1)擬合結(jié)果比較
原始數(shù)據(jù)序列中除去災(zāi)變點(diǎn)數(shù)值的其他值為非災(zāi)變值,相應(yīng)日期點(diǎn)為非災(zāi)變?nèi)掌邳c(diǎn)T0=(2,6,7,10,11,12,13,14,16,17,18,19,10),用非災(zāi)變?nèi)掌邳c(diǎn)及相應(yīng)數(shù)值,重新使用三次多項(xiàng)式擬合,有
由R2顯然得出,對(duì)數(shù)據(jù)進(jìn)行分類(lèi)的擬合精度明顯得到改善。
使用新的模型對(duì)我國(guó)春小麥產(chǎn)量進(jìn)行預(yù)測(cè),由上下災(zāi)變時(shí)間點(diǎn)預(yù)測(cè)函數(shù)知道,下一個(gè)下災(zāi)變點(diǎn)是2017年,下一個(gè)上災(zāi)變點(diǎn)時(shí)間點(diǎn)是2004年。從數(shù)據(jù)表中可以看出2004年用多項(xiàng)式擬合劃分為非災(zāi)變點(diǎn),但是按照上下災(zāi)變點(diǎn)的劃分,2004年擬合殘差為正值,基本符合模型條件。2015年、2016年不是災(zāi)變點(diǎn),故使用三次多項(xiàng)式模型預(yù)測(cè),2017年為災(zāi)變點(diǎn),用下災(zāi)變預(yù)測(cè)函數(shù)預(yù)測(cè),2017年我國(guó)春小麥產(chǎn)量為667萬(wàn)噸。
總體來(lái)看我國(guó)春小麥產(chǎn)量,1995年~1999年春小麥產(chǎn)量相對(duì)穩(wěn)定,2000年由于種植面積減少,產(chǎn)量減少近35%,之后幾年小麥產(chǎn)量雖有起伏但相差不大,2001年缺省,2003年產(chǎn)量最低只有400萬(wàn)噸,2009年春小麥產(chǎn)量超過(guò)700萬(wàn)噸。本文通過(guò)分析春小麥產(chǎn)量的變化趨勢(shì),將三次多項(xiàng)式模型與灰色災(zāi)變模型相結(jié)合,首先對(duì)原始數(shù)據(jù)進(jìn)行篩選,將原始數(shù)據(jù)分類(lèi),組成災(zāi)變時(shí)間點(diǎn)序列,災(zāi)變是序列,非災(zāi)變值序列。同時(shí)對(duì)未來(lái)的災(zāi)變時(shí)間點(diǎn)及相應(yīng)的產(chǎn)量值進(jìn)行預(yù)測(cè),減少了單一模型的長(zhǎng)期預(yù)測(cè)誤差。
本文的灰色災(zāi)變多項(xiàng)式組合模型,在一定程度上能反應(yīng)我國(guó)春小麥產(chǎn)量的變化規(guī)律,符合我國(guó)經(jīng)濟(jì)發(fā)展情況,也提高了預(yù)測(cè)精度。當(dāng)然也存在不足,本文沒(méi)有考慮影響春小麥生長(zhǎng)的環(huán)境、氣候、病蟲(chóng)等方面,所以在預(yù)測(cè)上還是有一定的出入。