周宏偉+張夢(mèng)驍+高峰云+曾日桓+劉洋怡
摘 要:空氣相對(duì)濕度是體現(xiàn)氣候變化的一項(xiàng)重要指標(biāo),研究城市相對(duì)濕度指數(shù)可以反映城市的氣候變化狀況。本文利用ARMA模型對(duì)北京市2012~2015年空氣相對(duì)濕度的數(shù)據(jù)進(jìn)行分析,建立相應(yīng)的ARMA模型,再對(duì)建立的模型進(jìn)行殘差檢驗(yàn),并利用該模型對(duì)未來(lái)五個(gè)月進(jìn)行預(yù)測(cè),查看未來(lái)的空氣相對(duì)濕度變化趨勢(shì),體現(xiàn)模型優(yōu)劣,可以更好的進(jìn)行氣候變化研究。
關(guān)鍵詞:相對(duì)濕度預(yù)測(cè);時(shí)間序列分析;ARMA模型;Box-Jenkins方法
一、 引言
隨著全球氣候變化加劇,對(duì)于氣候變化、空氣質(zhì)量等的研究不斷得到深入,對(duì)于不同空氣質(zhì)量指標(biāo)衡量因素十分不同,相對(duì)濕度的高低在許多程度上直接反映了環(huán)境的好壞,相對(duì)濕度過(guò)高或者過(guò)低,對(duì)人自身和四周的環(huán)境都會(huì)產(chǎn)生不好的影響,而相對(duì)濕度作為一項(xiàng)能夠客觀真實(shí)反映氣候變化情況的重要指標(biāo),有必要進(jìn)行深入研究。
簡(jiǎn)單的AR模型與ARMA模型在短期預(yù)測(cè)上具有較高精度,且在理論上已趨于成熟,便于進(jìn)行數(shù)據(jù)統(tǒng)計(jì)與分析,更常用于擬合平穩(wěn)時(shí)間序列。本文以北京市為例,建立ARMA模型對(duì)空氣相對(duì)濕度數(shù)據(jù)進(jìn)行預(yù)測(cè)。
二、 數(shù)據(jù)來(lái)源
http://www.stats.gov.cn/tjsj/ndsj/ 中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局——中國(guó)統(tǒng)計(jì)年鑒。
三、 ARMA模型理論介紹與模型建立
1. ARMA模型理論介紹
自回歸移動(dòng)平均模型(Auto-Regressive and Moving Average Model)是ARMA模型的全稱(chēng),該種方法是一種十分重要的方法,對(duì)于時(shí)間序列數(shù)據(jù)研究來(lái)說(shuō),由自回歸模型(簡(jiǎn)稱(chēng)AR模型)與滑動(dòng)平均模型(簡(jiǎn)稱(chēng)MA模型)為基礎(chǔ)“混合”構(gòu)成,它是目前應(yīng)用最為廣泛的來(lái)擬合平穩(wěn)序列的模型,通過(guò)計(jì)算機(jī)程序的編寫(xiě)來(lái)進(jìn)行模型識(shí)別,它可以細(xì)分為自回歸(AR)模型、滑動(dòng)平均(MA)模型和自回歸移動(dòng)平均(ARMA)模型三大類(lèi)。
(1) AR模型 AR模型也稱(chēng)為p階自回歸模型,具有如下結(jié)構(gòu):
xt=φ0+φ1xt-1+φ2xt-2+…+φpxt-p+εt
上式中,p為自回歸模型階數(shù),φi為待定系數(shù),εt為模型誤差。當(dāng)φ0=0時(shí),該自回歸模型又稱(chēng)為中心化AR模型。非中心化AR序列也可以通過(guò)變換轉(zhuǎn)化為中心化AR序列。
(2) MA模型 MA模型稱(chēng)為移動(dòng)平均模型,具有如下結(jié)構(gòu):
xt=μ+εt-θ1εt-1-θ2εt-2-…-θqεt-q
上式中,q為模型階數(shù),θi為待定系數(shù),εt為模型誤差。當(dāng)μ=0時(shí),模型稱(chēng)為中心化MA模型。
(3) ARMA模型 ARMA模型稱(chēng)為自回歸移動(dòng)平均模型,具有如下結(jié)構(gòu):
xt=φ1xt-1+…+φpxt-p+εt-θ1εt-1-…θqεt-q
默認(rèn)條件與AR模型、MA模型相同。當(dāng)q=0時(shí),ARMA模型退化成AR模型,當(dāng)p=0時(shí),ARMA模型就退化成MA模型。
2. 數(shù)據(jù)處理與模型建立
根據(jù)2012~2015年的中國(guó)統(tǒng)計(jì)年鑒得到北京市近四年相對(duì)濕度數(shù)據(jù),建立ARMA模型如下。
首先繪制2012~2015年北京市相對(duì)濕度數(shù)據(jù)時(shí)序圖,如圖1所示:
圖1 相對(duì)濕度時(shí)序圖
由圖1可以認(rèn)為該時(shí)間序列可能是平穩(wěn)的,因此,需要通過(guò)對(duì)數(shù)據(jù)進(jìn)行純隨機(jī)性檢驗(yàn),檢驗(yàn)結(jié)果如下:
檢驗(yàn)結(jié)果表明在6階和12階延遲下的P值很小,遠(yuǎn)小于5%,所以我們可以有超過(guò)95%的把握認(rèn)為2012~2015年北京市空氣相對(duì)濕度時(shí)間序列不是白噪聲序列,所以可以對(duì)其進(jìn)行統(tǒng)計(jì)規(guī)律分析,建立ARMA模型來(lái)進(jìn)行數(shù)據(jù)分析。
根據(jù)ARMA(p,q)模型在上表中體現(xiàn)的的ACF與PACF理論能夠發(fā)現(xiàn),由圖2的自相關(guān)圖與偏自相關(guān)圖可知,可以認(rèn)為該時(shí)間序列自相關(guān)拖尾,偏自相關(guān)圖則可以認(rèn)為1階或3階截尾,選擇自相關(guān)模型時(shí),可選擇p=1或3。
建立AR(1)與AR(3)模型,對(duì)這兩個(gè)模型進(jìn)行參數(shù)估計(jì):
通過(guò)上述兩種參數(shù)估計(jì)方法擬合的模型分別為:
(1) AR(1)xt=0.6348xt-1+52.0392+εt
(2) AR(3)xt=0.5905xt-1+0.2653xt-2-0.3951xt-3+52.4373+εt
根據(jù)AIC準(zhǔn)則,由于AR(1)模型的AIC值為453.3,AR(3)模型的AIC值為450.12,所以AR(3)模型更加符合該時(shí)間序列模型。
四、 模型檢驗(yàn)與預(yù)測(cè)分析
1. 模型檢驗(yàn)
對(duì)于得到的AR(3)模型,通過(guò)參數(shù)估計(jì)方法得到具體模型,根據(jù)AIC準(zhǔn)則驗(yàn)證模型優(yōu)劣:
對(duì)于得到的AR(3)模型,進(jìn)行殘差檢驗(yàn)如圖3所示:
圖3-(2)說(shuō)明殘差之間不相關(guān),圖3-(3)說(shuō)明其p值在0.7~1之間,明顯大于橫線處0,05的值,通過(guò)Box-Jenkins方法得出其準(zhǔn)確p值為0.7635,p值大于0.05,即接受原假設(shè),可以認(rèn)為殘差是白噪聲序列,擬合的AR(3)模型通過(guò)檢驗(yàn)。
2. 模型預(yù)測(cè)
通過(guò)AR(3)模型對(duì)未來(lái)五個(gè)月的相對(duì)濕度進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖4所示:
由預(yù)測(cè)值可以發(fā)現(xiàn)在未來(lái)的五個(gè)月之內(nèi),北京市月平均空氣相對(duì)濕度將會(huì)有一個(gè)顯著的降低,在1~2月間相對(duì)濕度的降低非常明顯,同時(shí),我們發(fā)現(xiàn)這一降低的規(guī)律也十分符合之前數(shù)據(jù)的變化規(guī)律,說(shuō)明預(yù)測(cè)的數(shù)據(jù)能較好的反映北京市空氣相對(duì)濕度的變化情況,但是誤差的比例相應(yīng)增加,也在同時(shí)降低了預(yù)測(cè)的準(zhǔn)確度。
五、 結(jié)論與不足之處
本文以北京市2012~2015年月平均空氣相對(duì)濕度數(shù)據(jù)為研究對(duì)象,通過(guò)模型建立、模型檢驗(yàn)和模型數(shù)據(jù)預(yù)測(cè),確立以AR(3)模型為北京市月平均相對(duì)濕度的預(yù)測(cè)模型,最后得到的模型結(jié)果如下所示:
xt=0.5905xt-1+0.2653xt-2-0.3951xt-3+52.4373+εt
通過(guò)預(yù)測(cè)發(fā)現(xiàn),未來(lái)五個(gè)月北京市月平均相對(duì)濕度呈現(xiàn)下降趨勢(shì),但是在第五個(gè)月之后,由預(yù)測(cè)圖形顯示,北京市空氣相對(duì)濕度會(huì)有略微增長(zhǎng),但是這種增長(zhǎng)并不明顯,仍然需要通過(guò)對(duì)之后的更多數(shù)據(jù)進(jìn)行分析研究,繼續(xù)修正模型,再來(lái)進(jìn)行模型預(yù)測(cè),才能得出更好的預(yù)測(cè)結(jié)果。
對(duì)于時(shí)間序列分析過(guò)程可分為:數(shù)據(jù)平穩(wěn)性處理、模型識(shí)別(包括階數(shù)估計(jì)與參數(shù)估計(jì))、模型檢驗(yàn)與模型預(yù)測(cè)三個(gè)部分,通過(guò)R軟件能較好的擬合模型并預(yù)測(cè)未來(lái)值。
綜上,ARMA模型較好的解決了北京市月平均相對(duì)濕度的問(wèn)題,同時(shí)發(fā)現(xiàn)ARMA模型預(yù)測(cè)在實(shí)際中可以廣泛的利用,為更好的研究氣候情況提供了十分方便的工具。
但是本文仍然存在許多不足之處,由于ARMA模型對(duì)于短期預(yù)測(cè)才能有較好的結(jié)果,從表中的預(yù)測(cè)誤差也可以發(fā)現(xiàn),進(jìn)行預(yù)測(cè)的時(shí)間長(zhǎng)度越長(zhǎng),其對(duì)應(yīng)的預(yù)測(cè)誤差也會(huì)相應(yīng)的增大,導(dǎo)致預(yù)測(cè)的結(jié)果也會(huì)更加不準(zhǔn)確。
參考文獻(xiàn):
[1]王燕.應(yīng)用時(shí)間序列分析.中國(guó)人民大學(xué)出版社.2015(12).
[2]李姝敏;張勛塵.基于ARMA模型的蘭州市人口短期預(yù)測(cè)研究.《中國(guó)市場(chǎng)》,2015.
[3]劉薇.時(shí)間序列分析在吉林省GDP預(yù)測(cè)中的應(yīng)用.《東北師范大學(xué)碩士論文》,2008.
[4]ARMA模型.
作者簡(jiǎn)介:
周宏偉,張夢(mèng)驍,高峰云,曾日桓,劉洋怡,中國(guó)礦業(yè)大學(xué)(北京)理學(xué)院。endprint