莊燕璇
摘要:本文基于廣州市1998年1月—2019年12月月度降水量數(shù)據(jù),對序列進(jìn)行建模分析和預(yù)測?;贏IC和BIC法則分別建立疏系數(shù)模型ARIMA((4,5,6,7,8),1,1)和綜合分析模型Xt=StIt,兩種模型對2018年數(shù)據(jù)的擬合情況為:疏系數(shù)模的預(yù)測相對誤差小于50%的比例為33.33%;而綜合分析模型為58.33%。因此采用綜合分析模型對廣州市2020年降水量數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測得出廣州市2020年1月的降水量為54.686 mm,但隨著預(yù)測期的延長,預(yù)測精度降低。
關(guān)鍵詞:廣州市降水量序列;AIC;BIC;ARIMA模型;綜合分析方法
降水量是衡量地區(qū)干旱程度的一個重要指標(biāo),它直接反映了自然界的變化。降水量的多少直接影響農(nóng)業(yè)生產(chǎn),與現(xiàn)在農(nóng)作物的生長周期和產(chǎn)量更是聯(lián)系密切。同時,降水量的年際變化趨勢直接制約著區(qū)域社會經(jīng)濟(jì)發(fā)展和生態(tài)生活環(huán)境,影響著區(qū)域水資源的調(diào)配管理。通過對數(shù)據(jù)擬合建立一個不錯的模型進(jìn)行短時間內(nèi)較精確的預(yù)測,有助于安排農(nóng)業(yè)生產(chǎn),注意防范洪澇災(zāi)害以及對水資源進(jìn)行調(diào)配,具有重大的現(xiàn)實(shí)意義。
張吉英[1]利用沈陽市2005年至2016年的降水量資料,建立了ARIMA(1,1,1)預(yù)測模型對沈陽市降水量進(jìn)行分析預(yù)測。張改紅[2]利用渭南市1953年至2013年的降水量資料,采用ARIMA模型對渭南市降水量趨勢進(jìn)行模擬分析,建立最優(yōu)降水量預(yù)測模型,該模型優(yōu)點(diǎn)為短期預(yù)測精度高。呂志濤[3]利用鄭州市1971年至2013年降水量資料,分別采用了二次多項(xiàng)式擬合、諧波分析法以及自回歸模型構(gòu)建了鄭州市降水量的預(yù)報(bào)模型,預(yù)報(bào)精度較高。
本文以廣州市為研究區(qū)域,利用1998年1月至2019年12月的廣州市降水量資料[4],分別建立ARIMA模型和綜合分析模型對廣州降水趨勢進(jìn)行分析,最后選擇最優(yōu)模型進(jìn)行預(yù)測應(yīng)用。
首先基于AIC和BIC法則分別建立疏系數(shù)模型ARIMA((4,5,6,7,8),1,1)和綜合分析模型Xt=StIt。接著根據(jù)模型對2018年的擬合結(jié)果選擇最優(yōu)模型,發(fā)現(xiàn)此背景下綜合分析方法優(yōu)于ARIMA模型。最后采用綜合分析模型對廣州市2020年的降水量數(shù)據(jù)進(jìn)行預(yù)測。
本文的創(chuàng)新點(diǎn)在于分別選取了ARIMA模型和綜合分析模型對降水量數(shù)據(jù)進(jìn)行分析,并通過對比預(yù)測效果挑選相對最優(yōu)模型對2020年降水量進(jìn)行預(yù)測。
1? ? 研究方法與理論分析
本章分為三節(jié),第一、二節(jié)分別簡要介紹ARIMA和綜合分析方法的一般形式和建模步驟;第三節(jié)則給出模型精度評估方法。
1.1 ARIMA模型
1.1.1 ARIMA模型的一般形式
(1.1)
1.1.2 ARIMA模型建模的大體步驟
一、對初始時間序列進(jìn)行平穩(wěn)性分析,利用ADF檢驗(yàn)對序列的平穩(wěn)性進(jìn)行檢驗(yàn)[5]。
若初始時間序列平穩(wěn),則接著進(jìn)行白噪聲檢驗(yàn);若初始時間序列不平穩(wěn),則對初始時間序列差分平穩(wěn)化后進(jìn)行白噪聲檢驗(yàn)。
若檢驗(yàn)結(jié)果顯示為非白噪聲序列,則擬合ARMA模型。
對擬合后的殘差序列進(jìn)行白噪聲檢驗(yàn),若殘差序列為白噪聲,則說明初始時間序列的信息被充分提取,即模型較好;若殘差序列為非白噪聲,則需要重新進(jìn)行擬合。
若ARIMA(p,d,q)模型中有部分自相關(guān)函數(shù)或部分平滑系數(shù)為零,那么該模型成為疏系數(shù)模型,記為ARIMA((p1,...,pm),d,(q1,...qn))。
1.2 綜合分析方法
1.2.1 將序列進(jìn)行混合模式分解
(1.2)
其中,Tt為趨勢效應(yīng)擬合,St為季節(jié)效應(yīng)擬合, It為隨機(jī)波動。
1.2.2 求出季節(jié)效應(yīng)擬合
假定時間序列 周期長度為m,則季節(jié)指數(shù)的計(jì)算公式如式(1.3)所示。
(1.3)
其中為每個周期內(nèi)的平均值,為總體均值。
1.2.3 對趨勢效應(yīng)Tt進(jìn)行擬合
對趨勢效應(yīng)常用以自變量為時間t的冪函數(shù)進(jìn)行擬合,即
(1.4)
1.2.4 對殘差序列擬合移動平均模型,以便充分提取相關(guān)信息
(1.5)
由(1.2)、(1.4)、(1.5)構(gòu)造模型如下:
(1.6)
1.3 精度評估
本文用兩個準(zhǔn)則來評估預(yù)報(bào)模型的精度。
一、相對誤差=,這是反映單個預(yù)測值精度的指標(biāo)。
二、平均絕對百分比誤差這是反映一組預(yù)測值精度的指標(biāo)。
其中,是時刻t的預(yù)測值,yi是時刻t的原始值,n是預(yù)測數(shù)。
2? ? 廣州月度降水量時序模型
2.1 ARIMA模型的應(yīng)用
2.1.1 序列觀察
本文對1998年1月—2019年12月264個廣州月度降水量進(jìn)行分析。本文用前240個數(shù)據(jù)參與建模,并用2018、2019年的數(shù)據(jù)檢驗(yàn)?zāi)P偷臄M合效果,最后對2020年進(jìn)行預(yù)測。
首先作時序圖如圖1所示。
由圖1可以看出該序列具有以下特點(diǎn):有明顯的非零均值,有一定的周期性,周期為12個月,說明該序列是非平穩(wěn)的。
因?yàn)榻邓繒r間序列是非平穩(wěn)時間序列,因此,我們先對初始時間序列進(jìn)行差分平穩(wěn)化后。
2.1.2 進(jìn)行1階差分
首先對原序列χt做1階差分,得到序列▽χt,接著進(jìn)行單位根檢驗(yàn)判斷序列▽χt的平穩(wěn)性。檢驗(yàn)結(jié)果見圖2。
由圖2可以看出,該序列單位根檢驗(yàn)的p值均小于0.0001。因此,在顯著性水平0.05下認(rèn)為序列▽χt是平穩(wěn)的。
2.1.3 擬合ARMA模型
根據(jù)2.1.2得出:序列▽χt是平穩(wěn)時間序列。因此可以采用ARMA模型來擬合序列▽χt。根據(jù)BIC準(zhǔn)則,本文選擇ARMA(8,1)模型來擬合序列▽χt。采用最小二乘法估計(jì)參數(shù),因?yàn)槟P虯RMA(8,1)的一些參數(shù)不顯著,所以需要重新估計(jì)。接著,逐步剔除掉模型中不顯著的參數(shù),直到模型剩下的參數(shù)均顯著為止。剔除的過程不在此處贅述,最后采用了無常數(shù)項(xiàng)的疏系數(shù)模型ARMA((4,5,6,7,8),1)來擬合序列▽χt。參數(shù)估計(jì)見圖3。
由圖3可以看出,變量“MA1,1”、“AR1,1”、“AR1,2”、“AR1,3”和“AR1,4”的t檢驗(yàn)的p值均小于0.05。因此,在顯著性水平0.05下可以認(rèn)為這5個參數(shù)顯著非零。而變量“AR1,5”的t檢驗(yàn)的p值為0.0537。因此在顯著性水平0.05下認(rèn)為該參數(shù)不顯著而在顯著性水平0.01下是顯著的。權(quán)衡了擬合后殘差的白噪聲檢驗(yàn)結(jié)果后決定將該參數(shù)加入模型中,即可用模型ARMA((4,5,6,7,8),1)來擬合序列 。
2.1.4 模型的檢驗(yàn)
為了檢驗(yàn)?zāi)P蛯π蛄?的擬合效果,我們首先對擬合后的殘差序列進(jìn)行白噪音檢驗(yàn),檢驗(yàn)結(jié)果見圖4。
由圖4可以看出,白噪聲檢驗(yàn)的p值均大于0.05。因此,在顯著性水平0.05下認(rèn)為殘差序列為白噪聲,說明該模型的擬合效果好。
所以通過對1998年1月—2017年12月廣州降水量月度數(shù)據(jù)進(jìn)行擬合并優(yōu)化得到的具體模型是:
(2.1)
接下來需要通過比較模型的生成數(shù)據(jù)與現(xiàn)實(shí)的測度數(shù)據(jù)來觀察模型對廣州降水量的擬合效果。利用模型對2018年及2019年的廣州降水量月度數(shù)據(jù)做外推預(yù)報(bào)并計(jì)算相對誤差見表1。
由表1可以看出廣州市2018年實(shí)際降水量與預(yù)測值的相對誤差的平均值為1.23,而2019年為14.07。2018年相對誤差在30%以內(nèi)的比例為33.33%,而2019年相對誤差在30%以內(nèi)的比例為25%。因此,可以看出該模型對2018年降水量的擬合效果比2019年的好,從而可以看出,該模型不適用于長期預(yù)測。
從預(yù)測結(jié)果可以得出以下結(jié)論:第一,疏系數(shù)模型模型作為廣州市降水量預(yù)測模型是可行的;第二,該模型適合短期預(yù)測,隨著預(yù)測的延長,預(yù)測的誤差將逐漸增大。
2.2 綜合分析方法的應(yīng)用
2.2.1 求出季節(jié)效應(yīng)擬合
一、計(jì)算季節(jié)指數(shù)
根據(jù)式(1.3)計(jì)算各月季節(jié)指數(shù)數(shù)據(jù)見表2。
由表2可看出,廣州降水量1月與2月較平穩(wěn),且降水量較少,3月—5月急速上升,5月—6月較為平穩(wěn),7月至12月呈現(xiàn)下降趨勢。其中1、2、3、10、11和12月的季節(jié)指數(shù)小于1,到12月時達(dá)到最低谷。4月—9月的季節(jié)指數(shù)均大于1,在六月達(dá)到最高峰。
3.2.2 對隨機(jī)波動It進(jìn)行擬合
2.2.1節(jié)已求出季節(jié)效應(yīng)擬合,下面以原時間序列值除以對應(yīng)的季節(jié)效應(yīng)擬合,得到的不包含季節(jié)效應(yīng)的隨機(jī)波動的綜合值,即:,圖5為序列{Xt/St}的時序圖。
由圖5可以看出,序列{Xt/St}基本消除了季節(jié)性,且不具有趨勢性,可以初步判定序列{Xt/St}是平穩(wěn)時間序列。
為了進(jìn)一步的判斷序列{Xt/St}的平穩(wěn)性,接著對其進(jìn)行單位根檢驗(yàn),檢驗(yàn)結(jié)果為在顯著性水平0.05下認(rèn)為該序列是平穩(wěn)時間序列。
2.2.3 對隨機(jī)波動 擬合ARMA模型
將隨機(jī)波動作為一個新的序列,按照1.1.2節(jié)介紹的方法建立ARMA模型來進(jìn)行擬合,根據(jù)BIC準(zhǔn)則:本文選擇ARMA(1,1)模型進(jìn)行建模。
接著,我們采用無常數(shù)項(xiàng)ARMA(1,1)模型擬合隨機(jī)波動序列{Xt/St},參數(shù)估計(jì)見圖6。
圖6? 隨機(jī)波動模型參數(shù)估計(jì)結(jié)果
由圖6可以看出,變量“MA1,1”和變量“AR1,1”的t檢驗(yàn)p值均小于0.0001。因此,在顯著性水平0.05下認(rèn)為該參數(shù)顯著非零。
隨機(jī)波動模型如下:
(2.2)
從而最終模型為:
(2.3)
2.2.4 模型檢驗(yàn)
為了檢驗(yàn)?zāi)P停?.3)的擬合效果,首先對擬合后的殘差序列進(jìn)行白噪音檢驗(yàn),檢驗(yàn)結(jié)果為在顯著性水平0.01下無法拒絕殘差序列為白噪聲。說明模型(2.3)提取信息充分,擬合效果較好。
為了對模型進(jìn)行檢驗(yàn),下面利用模型對于2018年及2019年的廣州降水量月度數(shù)據(jù)做外推預(yù)報(bào),得到的預(yù)報(bào)值見表3。
由表3可以看出廣州市2018年實(shí)際降水量與預(yù)測值的相對誤差的平均值為0.50,而2019年為7.00。2018年預(yù)測相對誤差在30%以內(nèi)的比例為33.33%,而2019年預(yù)測相對誤差在30%以內(nèi)的比例為25%。因此,可以看出該模型對廣州市2018年降水量的擬合效果比2019年的好,且該模型不適用于長期預(yù)測。
從預(yù)測結(jié)果可以得出以下結(jié)論:第一,綜合分析方法作為廣州市降水量預(yù)測模型是可行的;第二,該模型適合短期預(yù)測,隨著預(yù)測的延長,預(yù)測的誤差將逐漸增大。
2.3 兩種模型的對比與預(yù)測
根據(jù)2.1和2.2的分析,兩種模型均不適用于長期預(yù)測。因此,我們將根據(jù)兩種模型的短期預(yù)測效果即對2018年降水量的預(yù)測效果來判斷兩種模型的好壞,并用相對較好的模型來對廣州2020年的降水量進(jìn)行預(yù)測。
2.3.1 兩種模型的對比
本文通過兩個角度來對比兩種模型,其一是兩種模型預(yù)測精度的比較;其二是預(yù)測結(jié)果的整體規(guī)律比較。
2.3.1.1 預(yù)測精度比較
由表1和表3可以看出,采用ARIMA模型擬合的2018年降水量的相對誤差低于50%的占比33.33%;而采用綜合分析方法預(yù)測的相對誤差低于50%的占比為58.33%,比ARIMA模型高出25%。因此,從預(yù)測精度看,綜合分析方法要優(yōu)于ARIMA模型。
2.3.1.2 預(yù)測結(jié)果的整體規(guī)律比較
分別計(jì)算實(shí)際數(shù)據(jù)以及兩種模型擬合2018年降水量的平均數(shù)、中位數(shù)、極差,見表4。
由表4可得疏系數(shù)模型擬合值的平均數(shù)、中位數(shù)和極差與實(shí)測值的平均數(shù)、中位數(shù)和極差的差值分別均大于綜合分析方法。因此,從預(yù)測結(jié)果的整體規(guī)律看,綜合分析方法要優(yōu)于ARIMA模型。
綜上所述,我們認(rèn)為綜合分析方法更適用于擬合廣州市月降水量。
2.3.2 模型的預(yù)測
根據(jù)2018年1月—2019年12月觀測的實(shí)際值進(jìn)一步修正模型后,得到廣州市2020年1—12月降水量預(yù)測值及其置信區(qū)間,見表5。
從對2020年的預(yù)測結(jié)果上看,廣州市降水量仍然延續(xù)以往的發(fā)展規(guī)律。2020年1月—2月降水量小且平緩,3月—6月急速增長且在六月達(dá)到最高峰,然后6月—9月總體呈現(xiàn)急速下降的趨勢,但是7月—8月降水量增加,在10月—12月降水量較小且變化平緩。
3? ? 結(jié)論分析與建議
本文基于ARIMA((4,5,6,7,8),1,1)模型擬合廣州市降水量序列,所得到的模型BIC值為3001.104,AIC值為2980.245,而綜合分析模型為3048.52和3041.559。根據(jù)模型對2018年和2019年降水量數(shù)據(jù)的擬合結(jié)果得出兩種模型均只適用于短期預(yù)測。
最后根據(jù)模型對2018年的擬合結(jié)果選擇最優(yōu)模型。兩種模型對2018年數(shù)據(jù)的擬合情況為:疏系數(shù)模的預(yù)測相對誤差小于50%的比例為33.33%;而綜合分析模型為58.33%。疏系數(shù)模型擬合值的平均數(shù)、中位數(shù)和極差與實(shí)測值的差值均大于綜合分析模型。因此,采用綜合分析模型(2.3)對廣州市2020的降水量數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測結(jié)果見表5。但隨著預(yù)測期的延長,預(yù)測精度降低。建議在使用綜合分析模型預(yù)測年降水量時,盡量保證數(shù)據(jù)序列足夠的情況下,采用逐年實(shí)時校正的預(yù)測方法。然后參考預(yù)測的結(jié)果做出相應(yīng)的水資源調(diào)配以及防洪措施。
參考文獻(xiàn)
[1] 張吉英.基于ARIMA模型的沈陽市月降水量時間序列分析[J].內(nèi)蒙古水利,2019(6):13-14.
[2] 張改紅.基于ARIMA模型的渭南市降水量趨勢分析與預(yù)測[J].價值工程,2019,38(34):197-199.
[3] 呂志濤.時間序列分析方法在鄭州市降水量預(yù)報(bào)中的應(yīng)用[J].南水北調(diào)與水利科技,2014,12(4):35-37,56.
[4] 國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒(2020)[M].北京:中國統(tǒng)計(jì)出版社,2020.
[5] 王燕.應(yīng)用時間序列分析[M].北京:中國人民大學(xué)出版社,2005.