李窈 于麗婷
(大連民族大學(xué),遼寧 大連 116600)
我國是一個擁有歷史悠久的農(nóng)耕文明的國家,隨著時間推移經(jīng)濟發(fā)展,如今我國的耕地面積排在世界第三,農(nóng)業(yè)人口約有三億。由于特殊的地理條件,我國人多地少,局部地區(qū)的地理位置特殊,大多的大型農(nóng)業(yè)設(shè)備無法投入使用,所以需要大量勞動力進行耕耘,這也導(dǎo)致了在自然災(zāi)害發(fā)生之后所帶來的結(jié)果是可預(yù)見的。
要實現(xiàn)對災(zāi)情的管控,就要從根源上分析解決問題,防災(zāi)減災(zāi)工作的完善程度是重要的一環(huán),災(zāi)后重建工作也是必須考慮到的問題。本文針對構(gòu)造ARIMA 模型,預(yù)測未來1 年受災(zāi)面積的大小,為未來防災(zāi)減災(zāi)工作盡可能的提供幫助。
表1 農(nóng)業(yè)受災(zāi)面積數(shù)據(jù)統(tǒng)計表 單位:千公頃
1.2.1 ARIMA 模型
去除不平穩(wěn)的時間序列的趨勢或者去除其局部水平以后會表現(xiàn)出序列一定的同質(zhì)性。同時也就能知道這一類型的非平穩(wěn)時間序列可以用差分處理將其轉(zhuǎn)換為穩(wěn)定的時間序列。這樣的時間序列也被稱為齊次非平穩(wěn)時間序列。其中齊次的階數(shù)是差分次數(shù)。
1.2.2 P 值介紹
需要測量樣品觀測數(shù)據(jù)和原假設(shè)假定的偏差值,要測量它的P 值。
如果原始假設(shè)是真的,則得到的樣本結(jié)果會像實際觀測結(jié)果那樣極端或更加極端的概率被稱為P 值。
P 值和原始假設(shè)是否正確的概率無關(guān)。只是一個與數(shù)據(jù)相關(guān)的概率。選擇的是5%的顯著性水平,如果原始假設(shè)是真的,這樣的數(shù)據(jù)發(fā)生只有5%的可能性。P 值越小,說明實際觀測到的數(shù)據(jù)與原假設(shè)之間的不一致程度越大,檢驗結(jié)果越顯著。
在P 值已知的條件下,將與其給定的顯著性水平α 值進行比較,就可以知道我們是否可以拒絕原假設(shè)。(下文中使用P值決策時,我們選擇的是顯著性水平為5%的情況,α 值為0.05,原假設(shè)為殘差序列為不相關(guān)的序列)如果P 值<α,拒絕原假設(shè);如果P 值>α,不拒絕原假設(shè)。
1.3.1 時間序列預(yù)處理
在繪制完序列的時序圖后,需要觀察序列是否為平穩(wěn)序列。序列的自相關(guān)圖是使用ACF 函數(shù)來描繪的,并且可以根據(jù)自相關(guān)圖的具體情況來確定序列的穩(wěn)定性。當自相關(guān)圖中的自相關(guān)系數(shù)快速衰減到0 時,序列是平穩(wěn)的,否則是不平穩(wěn)的。
首先,由圖1 可看出,農(nóng)業(yè)的受災(zāi)面積近40 年來明顯呈減少趨勢,自相關(guān)圖的自相關(guān)系數(shù)沒有快速衰減為0,所以這個序列是不平穩(wěn)的。因此,需要對序列進行差分提取,然后制作差分序列的時序圖。
圖1 全國受災(zāi)面積隨時間分布圖及自相關(guān)圖
差分的主要目的是消除數(shù)據(jù)的變動,使數(shù)據(jù)處于穩(wěn)定狀態(tài),更好的分析數(shù)據(jù)。如圖2 的樣本自相關(guān)函數(shù)圖來看,從自相關(guān)函數(shù)延遲一階之后,逐漸減小到兩倍的標準偏差范圍內(nèi)。序列通過一階差分后變得平穩(wěn),自相關(guān)圖也表明自相關(guān)系數(shù)在一階延遲之后迅速減少到0,也從另一方面驗證序列是平穩(wěn)的。
圖2 差分后全國受災(zāi)面積隨時間分布圖及自相關(guān)圖
1.3.2 模型識別及定階
如表2 所示,可以使用ACF 圖和PACF 圖來判斷模型的階數(shù)。在圖3 中,ACF 在lag=1 時截尾,即1 階之后快速減為0,即q=1;PACF 在lag=0 時拖尾,即0 階之后逐漸為0,即p=0,得到了模型為ARIMA(0,1,1)。
表2 模型的定階原則
圖3 差分后全國受災(zāi)面積自相關(guān)圖和偏自相關(guān)圖
2.1.1 殘差的正態(tài)性檢驗
可以根據(jù)殘差QQ 圖進行判斷。如果QQ 圖中的殘差幾乎分布在對角線附近,則與正態(tài)性假設(shè)一致。否則,模型中可能存在錯誤。
2.1.2 殘差的無關(guān)性檢驗
根據(jù)白噪聲定義可知,殘差值等于估計值減去真實值,被檢測序列應(yīng)該是一個不相關(guān)的序列。得到殘差后一般會使用LB統(tǒng)計量來檢驗殘差。
R 語言運行程序得到LB 檢驗結(jié)果:p-value=0.5829
由圖4 可知殘差絕大多數(shù)都落在了對角線附近,說明結(jié)果符合正態(tài)性假設(shè);因為P=0.5829>0.05,所以,我們沒有理由拒絕原始假設(shè),即殘差序列是一個不相關(guān)序列。驗證表明,殘差序列通過了白噪聲,并且模型的數(shù)據(jù)擬合充分,可以接著進行下一步預(yù)測。
圖4 殘差QQ 圖
根據(jù)表3 結(jié)論,預(yù)測結(jié)果中自動給出了置信區(qū)間水平為80%和95%的置信區(qū)間,最終得到2021 年全國受災(zāi)面積預(yù)測值為200126.76 千公頃,如圖5。
表3 2021 年全國受災(zāi)面積預(yù)測值表
圖5 2021 年全國受災(zāi)面積預(yù)測圖
我們用ARIMA 模型相應(yīng)的程序?qū)?018-2020 作了滾動預(yù)測, 即用2017 年以前的數(shù)據(jù)預(yù)測2018 年的值;用2018 年以前的數(shù)據(jù)預(yù)測2019 年的值;用2019 年以前的數(shù)據(jù)預(yù)測2020 的值。3 年平均絕對預(yù)測誤差為4.79%,誤差相對較小,可使用該模型對2021 年全國受災(zāi)面積進行預(yù)測,見表4。
表4 用ARIMA 方法對近3 年的滾動預(yù)測結(jié)果
3.1 本文運用了統(tǒng)計學(xué)時間序列下的ARIMA 模型進行預(yù)測,通過收集大量數(shù)據(jù)進行整合分析,建立數(shù)學(xué)模型并檢驗,最后進行預(yù)測,并將預(yù)測結(jié)果檢驗后得出絕對誤差在11%以內(nèi),可信度較高。
3.2 在全球氣候變暖、各種災(zāi)害頻發(fā)的大環(huán)境下,我國也是世界上受自然災(zāi)害影響比較嚴重的國家之一,特別近幾年來旱災(zāi)、水災(zāi)、臺風(fēng)頻發(fā),因此預(yù)測未來農(nóng)業(yè)受災(zāi)面積的走勢也可以對農(nóng)業(yè)災(zāi)害方面的防治有幫助。
3.3 我們可以多關(guān)注天氣預(yù)報,了解氣候的變化規(guī)律,依據(jù)規(guī)律合理規(guī)劃農(nóng)事活動。及時清理積水,加強排水系統(tǒng)的管理,調(diào)整農(nóng)業(yè)結(jié)構(gòu)。掌握溫度規(guī)律,合理搭配農(nóng)作物品種、安排播種期,可以選擇抗性較強的作物。