趙夢鴿 李林
摘 要:運用自回歸移動平均結合模型,即ARIMA法分析電力燃氣工業(yè)生產指數時間序列上的趨勢性規(guī)律,并進行預測。首先,對2000—2019 年的電力燃氣工業(yè)產值指數數據進行時間序列分析以及平穩(wěn)性處理。其次,通過模型的識別、診斷和檢驗,建立電力燃氣工業(yè)生產指數數據ARIMA模型,預測模型ARIMA(2,1,3)(2,1,1)12。最后,根據得到的ARIMA(2,1,3)(2,1,1)12模型對2018—2019年的電力燃氣設施數據進行預測,并將該模型預測結果與實際情況進行對比分析。結果表明,ARIMA 模型比較適用于隨機性較大的電力燃氣工業(yè)產值指數的趨勢預測,并且方法簡單。
關鍵詞:時間序列分析;電力燃氣工業(yè)生產指數;ARIMA 模型;趨勢預測
中圖分類號:F424? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2020)03-0030-07
引言
宏觀經濟研究有許多指標,其中工業(yè)生產指數常被用來預測工業(yè)經濟的發(fā)展趨勢。工業(yè)生產指數最早由美國聯邦儲備局于1922年12月編制,英、德、日等國緊隨其后,也開始陸續(xù)編制了工業(yè)生產指數。如今工業(yè)生產指數已成為世界各國研判經濟發(fā)展最強有力的指標,其中美國將工業(yè)生產指數作為反映經濟周期波動的重要標志,工業(yè)生產指數的上升幅度和下降幅度能夠準確地反映美國經濟增長和衰退的程度而在各個領域的工業(yè)產值中[1]。而電力燃氣是全社會消費的基本商品,一個國家或地區(qū)的電力消費是反映一國或一個地區(qū)總的經濟水平的重要方面[2]。因此,準確地跟蹤預測電力燃氣未來工業(yè)總產值的發(fā)展趨勢,適時調整工業(yè)總產值指數,以使國民經濟健康有序的發(fā)展,就顯得尤為重要。
近年來,我國也對工業(yè)生產進行了一些研究。2006年,姜慶華和趙麗萍應用ARIMA模型,對我國電力生產進行了預測研究[3];2011年,張磊和李慧民研究了ARIMA模型在我國建筑業(yè)總產值預測中的應用[4];李春林和王會巖基于干預ARIMA模型,對我國工業(yè)生產指數進行了預測[5];2012年,王蔚杰基于ARMA模型,并以我國工業(yè)生產總值指數為例,對經濟發(fā)展的預測進行了研究[6];2016年,李孟剛等基于ARIMA神經網絡模型,對工業(yè)生產指數進行了仿真研究[1];2017年,高鵬飛和段明圓利用殘差修正 GM(1,1),對上海未來三年工業(yè)產值進行預測[7];2019年,李琛、郭文利等就基于BP神經網絡,對北京夏季日最大電力負荷進行了預測[8]。綜合以上文獻可以發(fā)現,殘差修正 GM(1,1)預測模型未考慮到數據的季節(jié)性,神經網絡模型雖然能夠挖掘出變量間復雜的難用數學式表達的非線性關系,但它的不足是對線性數據的效果不如ARIMA模型。對于非平穩(wěn)的時間序列,普通的ARIMA模型通過d階差分已能很好地模擬其變化規(guī)律。但是,在處理存在明顯的季節(jié)性周期性變化的季節(jié)性序列時,乘積季節(jié)ARIMA模型是常用模型之一,該模型不僅考慮了不同周期中相同周期點之間的相關性,還考慮了相同周期內不同周期點之間的關系,通常比較符合時間序列觀測數據的實際情況[9]。經初步判斷,顯然電力燃氣產值是會隨季節(jié)變化而變化的,所以本文選用ARIMA乘積季節(jié)模型進行研究。
一、ARIMA模型簡介
(一)時間序列的平穩(wěn)性分析
時間序列是依賴時間 t 的一組隨機變量[4]。時間序列主要分為三類:一是純隨機序列(白噪聲序列),這時候可以停止分析,因為毫無規(guī)律可循;二是平穩(wěn)非白噪聲序列,它們的均值和方差是常數,對于這類序列,有成熟的模型來擬合,如AR、MA、ARMA等;三是非平穩(wěn)序列,一般都要先轉化為平穩(wěn)序列,再按照平穩(wěn)序列的算法進行擬合。可以選擇差分,如果差分后平穩(wěn)可以用ARIMA模型擬合。差分階數d和D可采用探究法和信息準則法常用來確定[10]。
(二)ARIMA模型原理
ARIMA模型有三種基本類型:自回歸模型(AR(p):auto-regresison)、移動平均模型(MA(q):movingaverage)和自回歸移動平均模型ARMA(p,q)。
(三)建立ARIMA預測模型
建立ARIMA模型進行預測的主要步驟如下:
1.對數據進行預處理。先是根據時間序列的散點圖、自相關函數和偏自相關函數圖初步判斷平穩(wěn)性,然后可以用 ADF即單位根檢驗去研究其方差、趨勢性以及季節(jié)性的規(guī)律。如果一個序列的平均值和方差始終為常數,則稱它為平穩(wěn)的;反之,則判斷該時間序列不平穩(wěn);如果自相關函數在前面少數幾個值后下降為 0,則序列是平穩(wěn)的;相反的,當自相關函數沒有變?yōu)?0,只是依次降低,認為序列不平穩(wěn)[14]。
2.對ARIMA模型的定階并進行參數預判。通常時間序列經差分平穩(wěn)后,由差分后序列的自相關、偏自相關函數圖可以預估p、q和P、Q。
3.通過檢驗來診斷模型的合理性。通常選用擬合優(yōu)度進行檢驗,對觀測值以及模型擬合值的殘差進行分析。當殘差序列不是白噪聲序列,則說明還有信息包含在相關的殘差序列中未被提取,模型其他參數不能完全代表建模對象的統計性質,即所建模型不是最終模型,此時可對殘差擬合更復雜的模型,以充分提煉資料的信息[15]。
4.采用已經建立的ARIMA(p,d,q)(P,D,Q)S模型做出預測。
二、工業(yè)產值指數ARIMA模型構建與應用
(一)變量及數據說明
運用好一種計量方法,數據支持十分重要。本文選取美國2000年1月至 2019年5月份電力燃氣產值指數時間序列數據為樣本,尋求適當的ARIMA模型,并做出相關預測。選取的變量電力燃氣的工業(yè)產值指數用industral? production表示,單位為index2012=100(以2012年為基期計算的定基指數)。①
(二)工業(yè)產值指數ARIMA模型構建
1.數據平穩(wěn)性處理。電力燃氣工業(yè)產值指數數據2000—2019年的時間序列(見圖 1)。
做原序列的自相關圖(見下頁圖2)和偏自相關圖(見下頁圖3),發(fā)現自相關圖存在周期性的波動。下頁表1是用ADF對數據的平穩(wěn)性檢驗,由結果可見,序列的ADF=-2.4333,分別大于1%、5%、10%這3個水平的臨界值,所以判斷該序列確定是不平穩(wěn)的。
由于原序列存在趨勢性以及季節(jié)性波動,所以先對原始下頁序列進行1階差分和1階季節(jié)差分。圖4是差分后的序列圖,可以粗略地判斷是平穩(wěn)序列。理論上,我們再次用ADF 檢驗,并得到下頁表2。由表 2 可知,差分處理后得到新序列ADF =-7.49201,明顯小于3個不同檢驗水平的臨界值,判斷此時數據平穩(wěn)。所以,ARIMA模型中d和D分別為1。
2.模型的識別。差分后的平穩(wěn)序列可以通過自相關,偏自相關圖,初步確定 p、q 和P、Q的取值。由圖5和圖6可見,ACF圖3階截尾和PACF圖2階截尾,因此預判p=2,q=3。當僅觀察時滯k=12(或4)和 24(或8)時,明顯不是 0 的偏自相關數個數為P,顯著不是 0的季節(jié)自相關數的數量為Q,因此P和Q分別取2和1。最后,初步確定所選取的模型為ARIMA(2,1,3)(2,1,1)12。
3.模型的診斷檢驗。首先,對已初步確定的ARIMA(2,1,3)(2,1,1)12模型的殘差做自相關檢驗,得到相應的自相關圖(見下頁圖7)。從圖7中明顯看到,殘差的自相關函數和偏自相關函數基本都在95%的置信區(qū)域內。因此,可認為ARIMA(2,1,3)(2,1,1)12模型估計結果的殘差序列不存在自相關。其次,對模型擬合統計結果(見下頁表3),平均絕對百分誤差(MAPE)為2.480在0—5范圍內,R2高達0.895。綜上所述,ARIMA(2,1,3)(2,1,1)12模型是合理的。
(三)模型的預測
根據上面的分析可知,本文建立的模型ARIMA(2,1,3)(2,1,1)12是合理的,可以用來進行預測。運用SPSS軟件,利用上述模型,對2018—2019年的電力及燃氣工業(yè)產值指數進行預測,并將ARIMA預測方法的預測值與實際電力和燃氣工業(yè)產值指數進行對比。通過圖8和下頁表4的比較可以明顯看出,模型的預測結果很好,其中一部分預測值與實際值的噪聲殘值很小,預測結果相對理想。
結語
本文用時間序列分析的ARIMA模型對電力燃氣產值指數變化情況進行了預測研究,得到以下結論。
第一,乘積季節(jié)性ARIMA模型是針對有季節(jié)性變動的時間序列提出的基本又實用的建模方法,該模型全面考慮了序列的趨勢及周期變化,并借助模型參數進行了量化表達,實用性很強,預測精準度高[16]。本文建立了結構為ARIMA(2,1,3)(2,1,1)12的模型,并且用該模型對2000—2019年電力燃氣產值指數進行了分析,并預測了2018—2019年6月電力燃氣產值指數的變化情況。模型預測結果顯示,預測值與實際值的平均絕對百分誤差(MAPE)為2.435,R2高達0.895,能很好地擬合原始序列的趨勢性和周期性。
第二,乘積季節(jié)性ARIMA 模型是基于自回歸和移動平均模型結合方法的進一步改進,對工業(yè)生產指數等一系列非平穩(wěn),趨勢性或季節(jié)性明顯的數據能做出相對準確的預測。但這種依靠單次分析構建的模型更適用短期預測。出于長期考慮,在實際工作中我們應不斷地收集和更新時間序列數據對已經構建的模型進行檢驗和修正。只有通過不斷修正或重新擬合預測模型,才能使模型更精確地反映當下實際情況。
參考文獻:
[1]? 李孟剛,周長生,連蓮,李文銳.基于ARIMA神經網絡的工業(yè)生產指數仿真研究[J].計算機科學,2016,(S2):554-556.
[2]? 魯從山.山東省社會用電量與生產總值指數的回歸分析[J].山東電力技術,2001,(2):16-18.
[3]? 姜慶華,趙麗萍.基于ARIMA模型的我國電力生產預測研究[J].價值工程,2006,(9):113-116.
[4]? 張磊,李慧民.ARIMA模型在我國建筑業(yè)總產值預測中的應用[J].企業(yè)經濟,2011,(11):93-96.
[5]? 李春林,王會巖.基于干預ARIMA模型的中國工業(yè)生產指數預測[J].統計與管理,2011,(1):73-74.
[6]? 王蔚杰.基于ARMA模型對經濟發(fā)展的預測——以我國工業(yè)生產總值指數為例[J].中國外資,2012,(14):188-190.
[7]? 高鵬飛,段明圓.利用殘差修正 GM(1,1)對上海未來三年工業(yè)產值進行預測[J].經濟研究導刊,2017,(33).
[8]? 李琛,郭文利,吳進,金晨曦.基于BP神經網絡的北京夏季日最大電力負荷預測方法[J].氣候與環(huán)境研究,2019,(1):135-142.
[9]? 李焱,高強,王勇,劉欣然.乘積季節(jié)模型在軟件老化評估中的應用研究[J].電子科技大學學報,2017,(3):583-587.
[10]? Peter J.B.,Richard A.D.TimeSeries:Theory and Methods[M].2nd ed.New York:Springer,2009.
[11]? 王一夫,陳松喬,陳安.[J].計算機工程與應用,2005,(19):170-173.
[12]? 張樹京,齊立心.時間序列分析簡明教程[M].北京:清華大學出版社,北方交通大學出版社,2003.
[13]? 李龍波.棉紡企業(yè)動態(tài)成本預測研究[D].貴州:貴州大學,2009.
[14]? 彭志行,鮑昌俊,趙楊.乘積季節(jié)模型在傷寒副傷寒發(fā)病預測中的應用探析[J].中華疾病控制雜志,2007,(6):560-563.
[15]? Dikey D.A.,Fuller W.A.D istribution of the estimators forauto-regressire time serieswith a unit root[J].Journal of theAmerican Statistical Association,2012,(74):427-431.
[16]? 李紅,潘東峰,郭忠琴.時間序列模型在醫(yī)院感染發(fā)生率擬合預測中的比較研究[J].中國衛(wèi)生統計,2013,(1):87-89.