宋平 邱燕玲
【摘要】眾所周知,GDP指的是國民生產總值、是衡量一個地區(qū)的綜合實力的指標。本文在時間序列分析和回歸分析的基礎上,由青海省1993到2016年的GDP數(shù)據為基礎,以R和SPSS軟件為基礎,對青海省的數(shù)據進行分析,對于建立的模型進行檢驗,在文章的末尾對青海省未來十年的GDP進行預測。
【關鍵詞】GDP ARIMA 最小二乘法 逐步回歸法 SPSS
一、問題導入
我們都知道,GDP是指一定時期內一個國家所有產值的總和,眾所周知,我們國家的GDP在最近幾年里一直持續(xù)平穩(wěn)增長,說明我國的經濟正在步入一個平穩(wěn)的時期,所以,在我看來用相關知識精準分析和預測GDP具有很重要的現(xiàn)實意義。
二、研究目的
第一,青海省是一個在全國范圍來說是一個比較落后的省,落后的原因有很多,其中包括第一產業(yè)、第二產業(yè)和第三產業(yè)不發(fā)達,人口較少,工業(yè)不發(fā)達等等。研究的目的是為了給青海省的發(fā)展提供一定的依據。
第二,目前,國家重點扶持的西部大開發(fā)項目就包括青海省、西藏自治區(qū)、新疆維吾爾族自治區(qū)等,很多大學生相應國家號召,投身于西部建設。研究的目的是看看國家的政策對青海省GDP有沒有顯著的影響。
第三,數(shù)據分析。利用1993到2016年的GDP數(shù)據對青海省的地區(qū)生產總值進行分析。利用時間序列、回歸分析、最小二乘的方法進行分析,建立相關的模型。最終預測青海省在最近十年GDP的增加值。
三、問題分析
(一)ARIMA模型對青海省GDP建模
首先GDP的增加值是隨著時間的變化而變化的,考慮到的方法就是利用時間與GDP之間的關系,建立模型,從而解決問題。
圖一表示隨著時間的變化GDP的增加值,從圖一可以看出GDP的增加值是一個不平穩(wěn)的時間序列,圖二表示的是一階差分的結果,圖三表示的是對數(shù)差分,圖四表示的是二階差分的結果,圖五表示的是三階差分的結果。
時序圖圖一顯示序列有線性趨勢,所以選擇差分來對數(shù)據進行一階差分。從圖二到圖五的結果來看,圖五顯示序列在均值附近波動,即三階差分在Dickey-Fuller在單位根檢驗中p值等于0.01,小于0.1,故否定原假設,接受備擇假設,認為三階差分后,時間序列變?yōu)槠椒€(wěn)序列。
圖六顯示除了延遲三階自相關系數(shù)顯著非零,其他階數(shù)的自相關階數(shù)均在2倍的標準差范圍內,顯示出很強的短期相關性,所以可以認為3階差分后序列平穩(wěn)。綜合考察自相關和偏自相關的屬性,可以認為自相關系數(shù)3階截尾,偏自相關系數(shù)拖尾,所以對原序列擬合ARIMA(0,3,1)和ARIMA(0,2,1),得到的擬合模型為
■和■
殘差序列白噪聲檢驗說明該模型顯著成立,即p值越大,相關性越弱,但是檢驗時ARIMA(0,2,1)的p值較大,綜合多種因素,說明ARIMA(0,2,1)對于序列擬合成功。
(二)最小二乘對青海省GDP建模
在現(xiàn)實生活中,影響一個地區(qū)GDP的因素有很多,例如,第一產業(yè)增加值、第二產業(yè)增加值、第三產業(yè)增加值、出口額等,本文選取8個解釋變量研究青海省GDPy,解釋變量為:χ1—第一產業(yè)增加值,χ2—第二產業(yè)增加值,χ3—第三產業(yè)增加值,χ4—出口額,χ5—社會消費品零售總額,χ6—固定資產投入,χ7—財政收入,χ8—煤炭居民消費水平,以如上8個變量為自變量做回歸,因而y對8個自變量的線性回歸方程為
其中假定■,且不相關,為了對數(shù)據更好的分析,用用R對數(shù)據進行線性回歸,
從回歸方程中可以看到,χ1,χ2,χ3,χ4,χ5,χ6,χ8對GDP的影響是正相關,χ7即是財政收入對GDP的影響為負相關,這與定性分析的結果是一致的,因為財政收入是要上交給國家的對地區(qū)GDP的影響只能為負值。結果如下表:
根據回歸估計的結果來看,回歸方程是顯著的,但是在進行檢驗的過程中可以看出回歸系數(shù)是不顯著的,從上表可以看出調整后的R2為0.9997,說明各因素對GDP的影響為正相關。模型擬合較為良好。
(三)逐步回歸對青海省GDP建模
逐步回歸的基本思想是有進有出。SPSS的逐步回歸是通過逐一建立多個模型實現(xiàn)的。在本文中有8個解釋變量,SPSS需建立兩個回歸模型。依據逐步回歸策略,第一個模型為一元線性回歸模型,并在此基礎上建立第二個模型。SPSS將自動輸出每個模型的結果。最后一個模型應是最終的分析結果。
根據上述模型可以看出第一個模型是以第一產業(yè)、第二產業(yè)、第三產業(yè)的解釋變量的三元線性回歸方程,判定系數(shù)為0.9993,回歸方程的估計標準誤差為19.81,第二個模型是以第一產業(yè)、第二產業(yè)、第三產業(yè)和社會消費品零售總額為解釋變量的四元線性回歸方程,其判定系數(shù)增加至0.9998,且調整大的判定系數(shù)也有所增加,回歸方程的標準誤差減少。從擬合優(yōu)度的角度看,第二個模型的擬合效果更佳。
上圖是回歸分析顯著性檢驗的結果,對于三元模型和四元模型總離差平方和沒有發(fā)生變化,只有四元模型的均方為3274616.482,三元模型的均方為4366155.309。若顯著檢驗水平為α為0.05,則因概率P-值小于α,拒絕回歸方程顯著性檢驗的原假設,即回歸系數(shù)不同時為0,解釋變量全體與被解釋變量間存在顯著的線性關系,選擇線性模型具有合理性。
如上圖第二列為回歸系數(shù),第三列為標準誤差,兩者相除得到第五列的統(tǒng)計量,第六列的t統(tǒng)計量觀測值對應的雙側概率P-值。對于第一個模型,因為第一產業(yè)、第二產業(yè)、第三產業(yè)、社會消費總額,所以首先進入四元線性回歸模型,這是統(tǒng)計量的觀測值為3849380.820,概率P-值近似接近為零。當顯著水平α為0.05,應拒絕回歸系數(shù)檢驗的原假設,認為第一產業(yè)、第二產業(yè)、第三產業(yè)與GDP有顯著線性關系,保留在模型中。此時,按照逐步回歸的策略,只有第一產業(yè)、第二產業(yè)、第三產業(yè)時效果并沒有因為因為剔除社會消費品總額發(fā)生變化。兩者回歸系數(shù)顯著性檢驗均顯著。此時建模結束。
四、三個模型對青海省GDP預測的結果
分別用ARIMA(0,2,1)、最小二乘法、逐步回歸法預測2015和2016的GDP進行預測:
將2015年和2016年的時間值與預測值相比較,三種方法的相對誤差都小于5%,即都可以用來做預測模型,ARIMA(0,2,1)在短期預測模型時,結果較為滿意,但是由于模型是經過二階差分建立的,如果作為長期預測的話,預測結果的準確性會較差一些,最小二乘法是我們最常用的方法,但是最小二乘法只能看到平均水平,逐步回歸預測是在三個方法里邊預測誤差最小的一個,但是最小二乘法跟逐步回歸法預測需要最近一年內的第一產業(yè)、第二產業(yè)、第三產業(yè)的數(shù)據來作為預測的關鍵指標,所以本文用時間序列的方法給出了最近10年青海省GDP的預測,結果如下:
從時間序列模型的預測結果來看,隨著時間的發(fā)展,青海省的GDP會逐年增加,又加之有西部大開發(fā),發(fā)展西部的戰(zhàn)略,這對青海省來說是一個良好的機遇,青海省的GDP會隨著時間的增加而增長,給青海省帶來新的發(fā)展機遇。
參考文獻
[1]Jonathan D.Cryer Kryer Kung-Sik Chan著潘紅宇等譯.2011.時間序列分析及應用[M].北京.機械工業(yè)出版社:40-160.
[2]王燕編著.2015.時間序列分析—基于R[M].北京.中國人民大學出版社:17-105.
[3]吳喜之編著.2016.應用回歸分析及分類—基于R[M].北京.中國人民大學出版社:12-106.
[4]薛微編著.2014.基于SPSS的數(shù)據分析[M].北京.中國人民大學出版社:215-273.
[5]王艷梅.山西省人均GDP的發(fā)展態(tài)勢.科學技術與工程[J].2012(18):4575-4577.
[6]魏寧.時間序列分析方法研究及其在陜西省GDP預測中的應用.西北農林科技大學[D].2010.
基金項目:受國家自然科學基金資助,文章序列號11471222。