李 娜,孫穎娜,王 燁,杜 崇
(黑龍江大學 水利電力學院,哈爾濱 150080)
三江平原是我國重要的商品糧生產(chǎn)基地,降水量的多少直接影響著農(nóng)業(yè)的灌溉和發(fā)展,許多學者致力于精確地降水量預測研究。陳滬生等[1]應用小波與 ARIMA組合模型對黃山市年降水量進行預測,發(fā)現(xiàn)小波與 ARIMA組合模型預測結果較好。仲遠見等[2]和沈永梅等[3]改進了馬爾可夫鏈預測模型并應用到實例中,預測結果與實測資料相吻合。ARIMA-Markov組合預測模型是在ARIMA模型預測降水量的基礎上,借助馬爾可夫鏈縮小預測區(qū)間,提高降水量預測精度。模型在給出降水量預測值的同時,能夠提供降水量預測區(qū)間、狀態(tài)轉移概率、誤差波動幅度及波動趨勢等信息,該方法對水文序列長度要求不高,方法更加簡單有效[4-7]。本文利用三江平原紅衛(wèi)農(nóng)場1967—2009年年降水量數(shù)據(jù),建立基于自回歸滑動平均模型與馬爾可夫鏈的組合預測模型(ARIMA-Markov組合預測模型),對紅衛(wèi)農(nóng)場2009—2019年年降水量進行模擬預測。
紅衛(wèi)農(nóng)場是黑龍江省的一處國營農(nóng)場,隸屬于建三江農(nóng)場管理局。農(nóng)場位于三江平原東北部的完達山北麓、撓力河畔,南、北低洼,沼澤較多,中間平坦且土壤肥沃。氣候?qū)俸畮Т箨懠撅L氣候,平均年有效積溫2 300~2 400 ℃,平均年降水量550 mm,無霜期為130 d左右,適宜作物生長,具有生產(chǎn)優(yōu)質(zhì)水稻獨特優(yōu)勢。
紅衛(wèi)農(nóng)場總播種面積39 666.67 hm2,糧食總產(chǎn)36.83×104t。曾多次獲得“全國糧食生產(chǎn)先進場”稱號,并被農(nóng)業(yè)部授予“水稻標準化生產(chǎn)示范場”稱號[8]。多年來,紅衛(wèi)農(nóng)場憑借良好的生態(tài)環(huán)境和科學化種植,奠定了綠色產(chǎn)業(yè)的雄厚基礎。
ARIMA模型是將預測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列。模型被識別后從時間序列的過去值及現(xiàn)在值來預測未來值。該模型將非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程。ARIMA 模型適合預測線性、穩(wěn)定的時間序列,能夠有效去除序列的趨勢成分,使數(shù)據(jù)的隨機過程平穩(wěn)化。
ARIMA模型較為簡單,模型不需要借助其他外生變量,要求時間序列數(shù)據(jù)是穩(wěn)定的,或者是通過差分化后是穩(wěn)定的,只能預測線性關系,不能預測非線性關系。方法簡單易操作,但預測精度一般。
馬爾可夫鏈是對系統(tǒng)狀態(tài)用隨機變量表示的一種隨機過程。每一個階段的系統(tǒng)狀態(tài)都對應一定的概率(狀態(tài)概率),若系統(tǒng)某一階段狀態(tài)發(fā)生改變,就存在狀態(tài)轉移概率[9]。狀態(tài)轉移概率只與目前系統(tǒng)所處狀態(tài)有關,與之前狀態(tài)無關,具有這種離散狀態(tài)的隨機系統(tǒng)轉移過程被稱為馬爾可夫過程[10-11]。
馬爾可夫過程是馬爾可夫鏈預測的理論基礎。分析馬爾可夫過程的變化,主要研究鏈內(nèi)有限隨機過程的狀態(tài)及各個狀態(tài)之間的相互關系,再對鏈的未來狀況進行預測。Markov模型為
x(n)=x(0)Pn
(1)
式中:x(0)和x(n)分別為初始時刻和n時刻的狀態(tài)概率向量;P為狀態(tài)轉移概率矩陣。
狀態(tài)轉移概率指在事件的發(fā)展變化過程中,如果某一時刻的所在狀態(tài)為起點,那么未來某時刻發(fā)展為其它狀態(tài)的可能性。由狀態(tài)Ei轉為狀態(tài)Ej的狀態(tài)轉移概率P(Ei→Ej),表達式為
P(Ei→Ej)=P(Ej/Ei)=Pij
(2)
狀態(tài)轉移概率矩陣:設某事件有n個發(fā)展狀態(tài),即E1,E2,…,En。若由Ei轉變?yōu)镋j的狀態(tài)轉移概率記作P(Ei→Ej),那么矩陣
(3)
稱為狀態(tài)轉移概率矩陣。
Markov預測模型需要通過狀態(tài)劃分確定系統(tǒng)存在的狀態(tài),然后計算相應的狀態(tài)轉移概率矩陣,得出預測區(qū)間[12]。
Markov預測模型優(yōu)點為一個系統(tǒng)由一個狀態(tài)轉至另一個狀態(tài)的轉換過程中,存在著轉移概率,并且這種轉移概率可以依據(jù)其緊接的前一種狀態(tài)推算出來,與該系統(tǒng)的原始狀態(tài)和此次轉移前的馬爾可夫過程無關。缺點在于,理論上只能用于預測短期內(nèi)的數(shù)據(jù),而不適合用于系統(tǒng)中長期數(shù)據(jù)的預測。
基于對以上2種模型的分析,將ARIMA模型與馬爾可夫模型有效結合,充分發(fā)揮2種模型優(yōu)點,建立ARIMA-Markov組合預測模型,對年降水量進行預測,依據(jù)相對誤差,判定組合模型的精確度。
ARIMA-Markov組合預測模型建立的基本步驟:①建立ARIMA模型,計算相對誤差;②根據(jù)歸一化相對誤差序列劃分狀態(tài)區(qū)間,反歸一化處理得出Markov狀態(tài)區(qū)間(采用1∶0.618比例的黃金分割率法,計算系統(tǒng)存在的狀態(tài)區(qū)間[13-14]);③確定已有年份降水量數(shù)據(jù)所處的狀態(tài),應用Markov模型確定狀態(tài)轉移概率矩陣;④根據(jù)預測值在不同區(qū)間的概率確定預測值的取值范圍;⑤根據(jù)確定的取值范圍,取區(qū)間均值作為最后預測結果。
ARIMA-Markov組合預測模型的優(yōu)點在于:應用Markov模型對ARIMA模型預測的結果進行狀態(tài)區(qū)間劃分,根據(jù)狀態(tài)區(qū)間的狀態(tài)轉移概率得出最優(yōu)年降水量區(qū)間,取區(qū)間均值作為最終預測結果。它不同于應用ARIMA模型、Markov模型分別預測年降水量,取2種方法預測結果的均值作為最終預測結果的方法。
以紅衛(wèi)農(nóng)場1967—2009年年降水量數(shù)據(jù)率定模型參數(shù),2010—2019年年降水量數(shù)據(jù)進行模型檢驗。為使年降水量時間序列平穩(wěn)化,對其進行一階差分處理,經(jīng)過多次試驗,ARIMA(2,1,10)預測效果最佳,相關系數(shù)R2=0.388,相關系數(shù)偏低,故考慮二階差分處理。通過判斷ACF和偏ACF的拖尾性、截尾性進行參數(shù)評估,最終選取ARIMA(p,2,q)為ARIMA(0,2,1)模型最為合適[15-16]。
依據(jù)ARIMA(0,2,1)模型對紅衛(wèi)農(nóng)場1967—2009年年降水量數(shù)據(jù)進行擬合,預測2010—2019年年降水量,劃分年降水量狀態(tài)區(qū)間,并對相對誤差序列進行歸一化處理[17-18],預測檢驗結果與歸一化處理結果見表1。由表1可見,ARIMA模型預測年降水量均位于置信區(qū)間內(nèi),且與真實值差異較小,相對誤差最大為3.50%,最小為1.74%,平均為2.87%。計算出歸一化相對誤差均值為0.391 5,由此劃分[0,0.226 5], ( 0.226 5,0.618 0)和 [0.618 0,1] 3個狀態(tài)區(qū)間。反歸一化將各區(qū)間還原,其對應區(qū)間分別為[-0.035 0, -0.031 0], (-0.031 0,-0.024 1),[-0.024 1,-0.017 4]。
表1 ARIMA模型預測結果與誤差歸一化處理
根據(jù)劃分好的區(qū)間,確定對應年份所處的狀態(tài),求得狀態(tài)轉移概率矩陣(步長為1)為[19-20]
(4)
設q為原狀態(tài)區(qū)間的分界值,X(0)(t)為還原后的區(qū)間分界值,Q(0)(t)為預測值[21]。則
(5)
可以得到
(6)
根據(jù)式(6)計算2010—2019年年降水量,結果見表2。
表2 2010—2019年ARIMA-Markov模型預測結果
續(xù)表2
ARIMA模型與ARIMA-Markov模型預測結果精度見表3。由表3可見,ARIMA-Markov組合模型預測的相對誤差明顯低于ARIMA模型。依據(jù)ARIMA-Markov組合模型對紅衛(wèi)農(nóng)場2010—2019年年降水量預測,其預測值均以最大概率落在對應的預測區(qū)間內(nèi),相對誤差最大為3.42%,平均為1.34%。說明該模型應用于紅衛(wèi)農(nóng)場年降水量預測可行且有效。
表3 ARIMA模型與ARIMA-Markov模型預測結果比較
以三江平原紅衛(wèi)農(nóng)場43 a的年降水量資料,構建了ARIMA-Markov組合模型,并對紅衛(wèi)農(nóng)場 2010—2019年年降水量進行了預測。結果表明:ARIMA-Markov組合模型預測的最大相對誤差為3.42%,平均相對誤差為1.34%,預報精度令人滿意。組合模型在數(shù)據(jù)有限的情況下,簡便易操作,該組合模型不但能精確地預測年降水量,并能給出年降水量預測區(qū)間和其概率,其結果可為農(nóng)業(yè)生產(chǎn)及水資源規(guī)劃等決策工作提供科學的依據(jù)。