張行行
摘要:根據(jù)新疆地區(qū)歷年GDP數(shù)據(jù)的特點,基于R語言,建立求和自回歸移動平均模型ARIMA(p,d,q)。通過對數(shù)和差分運算對數(shù)據(jù)進行平穩(wěn)化處理,根據(jù)自相關系數(shù)、偏自相關系數(shù)以及單位根檢驗判斷其平穩(wěn)性,選擇合適的ARIMA模型,進行預測和比較,得到較為滿意的結果。
關鍵詞:R語言 GDP ARIMA模型 新疆
一、引言
R語言[1]作為一款自由的開源軟件,不僅具有強大的統(tǒng)計分析功能和統(tǒng)計制圖功能,而且擁有強大的軟件包生態(tài)系統(tǒng),其源代碼可供我們直接查看并進行擴展而無需申請權限。所以近年來,R語言在學界和業(yè)界受到了越來越多的重視。在國外高校統(tǒng)計學科,R幾乎是一門必修的語言。新疆地處中國西北部,資源豐富,土地面積占全國的1/6,與8個國家毗鄰,是東西方文化的聚集地。同時它地處亞歐大陸腹地的十字大通道,是貿(mào)易互聯(lián)互通的通道,是新絲綢之路經(jīng)濟帶的核心建設區(qū)以及我國向西開放的重要門戶[2]。作為衡量地區(qū)經(jīng)濟發(fā)展的重要指標,GDP不僅可以反映一個地區(qū)的經(jīng)濟表現(xiàn),還是影響社會穩(wěn)定的重要因素。因此利用時間序列模型針對新疆GDP發(fā)展趨勢進行預測,對于制定經(jīng)濟發(fā)展目標、戰(zhàn)略規(guī)劃布局具有重要意義。
對于GDP的發(fā)展規(guī)律和預測一直是經(jīng)濟學家關注的熱點和難點,紀廣月[3]以廣東省2006-2011年GDP與第一、第二、第三產(chǎn)業(yè)的歷史數(shù)據(jù)為依據(jù),利用灰色關聯(lián)分析方法,建立灰色預測模型GM(1,1),對未來幾年的廣東省GDP進行了預測;JamesSpencerL等[4]利用210個國家1950-2015的人均GDP序列,建立了一個綜合模型,并允許每年更新數(shù)據(jù);張淑紅等[5]基于1978-2010年的人均GDP指數(shù)使用時間序列分析中的Box-Jenkins方法進行定階,建立了線性自回歸模型,得到了較好的擬合和預測結果;蘇玉華等[6]運用SAS8.0系統(tǒng)對1978-20006年廣西生產(chǎn)總值建立ARIMA模型,并做了預測分析;范玉妹等[7]利用EViews軟件應用ARMA模型對北京市人均GDP進行擬合,效果良好,并預測了2010年至2014年的數(shù)據(jù)。由于大多數(shù)研究使用SAS、Eviews或SPSS進行建模分析,使用R語言來分析的文章很少,本文應用R語言以新疆1985至2017年的GDP數(shù)據(jù)為樣本,對其進行統(tǒng)計分析,建立ARIMA(2,2,0)模型,并對2018-2020年新疆GDP進行預測,以期對經(jīng)濟政策目標制定者提供決策參考。
二、ARIMA模型理論概述
ARIMA模型本質(zhì)上是將差分運算與自回歸移動平均(ARMA)模型相結合,即利用差分運算使非平穩(wěn)序列顯示出平穩(wěn)序列的性質(zhì),再使用ARMA模型進行擬合。此模型可以有效提取非平穩(wěn)序列的確定性信息,彌補確定性因素分解方法的不足以及ARMA模型的局限性,進行精確有效地短期預測。ARIMA(p,d,q)模型的一般結構為:
式中
其中,d為差分階數(shù),p、q分別為模型中自回歸AR與移動平均MA的滯后期數(shù),、為多項式系數(shù),為白噪聲序列,為所選取的時間序列。通常情況下,ARIMA模型遵循如下分析步驟:
Step1:考察時間序列的特征,對其平穩(wěn)性進行檢驗;
Step2:平穩(wěn)化處理,利用對數(shù)或差分運算轉(zhuǎn)化為平穩(wěn)序列;
Step3:擬合ARMA模型,確定參數(shù);
Step4:進行白噪聲檢驗;
Step5:利用所建模型進行預測分析。
三、ARIMA模型實證分析
(一)數(shù)據(jù)資料
本文選取新疆改革開放以來的數(shù)據(jù),即1978至2015年的GDP數(shù)據(jù)(見表1)作為研究對象進行時間序列分析,基于R語言環(huán)境建立ARIMA(p,d,q)模型,并對2016—2017年的數(shù)據(jù)進行預測,與實際值進行比較;在此基礎上,對2018-2020年新疆GDP進行預測分析。
(二)判斷序列特征
為初步判斷GDP序列的特征和平穩(wěn)性,由表1看出,新疆是一個經(jīng)濟持續(xù)增長的經(jīng)濟體。從1985至2015年新疆GDP呈現(xiàn)明顯的上升趨勢,無周期性,為非平穩(wěn)序列。故需對數(shù)據(jù)進行平穩(wěn)化處理,使其滿足平穩(wěn)性和零均值的建模要求。
(三)序列的平穩(wěn)化處理
由于新疆GDP序列呈現(xiàn)出指數(shù)增長趨勢,故需對該序列取對數(shù)消除指數(shù)趨勢,并對其進行一階差分處理以消除線性趨勢,得到如圖2所示的時間序列圖。從圖2中可以觀察到:均值不為零,其趨勢性已基本消除,但是否為平穩(wěn)序列,需要進一步的平穩(wěn)性檢驗。
本文采用ADF單位根檢驗法來判斷序列的平穩(wěn)性,所得結果如表2所示。
檢驗結果顯示,新疆GDP對數(shù)差分序列的ADF檢驗P值均大于顯著性水平α=0.01、0.05,落在拒絕域外,不能顯著拒絕序列為非平穩(wěn)的原假設,說明該序列為非平穩(wěn)序列,故對其進行二次差分運算。檢驗結果表明所得ADF檢驗P值普遍小于顯著性水平α=0.01、0.05,顯著拒絕原假設,故二階差分后的對數(shù)序列為平穩(wěn)序列。
(四)擬合ARIMA(p,d,q)模型
由序列平穩(wěn)化的過程可知,ARIMA(p,d,q)模型中的差分階數(shù)d=2。自回歸階數(shù)p與移動平均階數(shù)q的確定可以通過樣本的自相關函數(shù)與偏自相關函數(shù)的觀察獲得。將經(jīng)過平穩(wěn)化處理后的新疆GDP時間序列命名為DGDP序列,并繪制自相關函數(shù)(ACF)和偏自相關函數(shù)(PACF)圖,如圖3所示。
從圖3中可以看出,二者均具有明顯的拖尾性,且自相關系數(shù)一階顯著不為零,一階之后都近似為零,偏自相關系數(shù)2階顯著不為零,2階之后都近似為零。因此可選擇的模型有ARIMA(2,2,1),ARIMA(2,2,0),ARIMA(1,2,1),ARIMA(1,2,0),對這四個模型分別進行評判和比較,見表4。
AIC準則是擬合模型的似然函數(shù)值與模型中未知參數(shù)個數(shù)的加權函數(shù),通過綜合考慮擬合模型的擬合精度和未知參數(shù)個數(shù)尋找相對最優(yōu)模型;SBC準則是AIC準則的改進,它將AIC函數(shù)中未知參數(shù)個數(shù)的懲罰權重由常數(shù)2變成了樣本容量的對數(shù)函數(shù)ln(n),解決了樣本容量趨于無窮大時AIC準則選擇的模型不收斂于真實模型的問題。公式如下:
其中,ML為極大似然函數(shù)值,n為樣本容量。在初選模型中,使得AIC或SBC函數(shù)達到最小的模型為相對最優(yōu)模型。顯然,由表4可知,ARIMA(2,2,0)優(yōu)于其他模型。用R3.4.4的box.test()函數(shù)對其進行殘差自相關檢驗,得到的P值都顯著大于α=0.05,可認為殘差序列為白噪聲序列,說明模型ARIMA(2,2,0)顯著有效。
(五)模型的預測和分析
為檢驗模型的預測效果,下面對新疆2016、2017年的GDP進行預測,并與實際值進行比較,數(shù)據(jù)來源《新疆統(tǒng)計年鑒2018》,結果如表5:
由對照表可知,預測結果與真實值相差在5%以內(nèi),用ARIMA(2,2,0)可以較好地擬合新疆GDP的實際值。
利用此模型對2018-2020年新疆GDP進行預測分析,其結果見表6:
四、結語
本文通過對新疆1978至2017年的GDP數(shù)據(jù)作為研究對象進行時間序列分析,結合R語言建立了ARIMA(2,2,0)模型,并通過一系列檢驗證明了其有效性,并對2018-2020年新疆GDP進行預測分析,從預測結果來看,新疆生產(chǎn)總值呈現(xiàn)出穩(wěn)步增長的趨勢,且增長率逐年提高。結論表明,所建立的ARIMA模型可以有效地擬合樣本數(shù)據(jù),預測未來走勢,具有較強的短期預測能力,從而為經(jīng)濟決策的制定和調(diào)整提供參考。
參考文獻:
[1]湯銀才.R語言與統(tǒng)計分析[M].高等教育出版社,2008.
[2]劉艷芝.“一帶一路”背景下的新疆經(jīng)濟發(fā)展研究[J].經(jīng)濟論壇,2016(02):30-32.
[3]紀廣月.基于灰色關聯(lián)分析的廣東省GDP與產(chǎn)業(yè)結構之間的關系及GDP預測的數(shù)學模型[J].數(shù)學的實踐與認識,2013(15):198-203.
[4]JAMES S L,GUBBINS P,MURRAY C J,et al. Developing a comprehensive time series of GDP per capita for 210 countries from 1950 to 2015[J]. Popul Health Metr,2012,10(1):12.
[5]張淑紅,楊萬才,武新乾.“十二五”時期河南省人均GDP預測[J].數(shù)理統(tǒng)計與管理,2014(03):394-399.
[6]蘇玉華,江偉.廣西生產(chǎn)總值的時間序列分析[J].賀州學院學報,2009(01):125-128.
[7]范玉妹,玄婧.ARMA算法在GDP預測中的應用[J].江南大學學報(自然科學版),2010(06):736-740.