(玉溪師范學(xué)院 數(shù)學(xué)與信息技術(shù)學(xué)院,云南 玉溪 653100)
考察能源消費量與經(jīng)濟增長及發(fā)展趨勢,進行經(jīng)濟統(tǒng)計研究和預(yù)測分析,可以反映經(jīng)濟發(fā)展與能源發(fā)展的趨勢,為相關(guān)部門提供更好的科學(xué)決策依據(jù).目前,常用的預(yù)測方法有定性預(yù)測法、回歸預(yù)測法和時間序列法.其中,定性預(yù)測是以主觀邏輯判斷為主的預(yù)測方法;回歸預(yù)測是以變量為基礎(chǔ)研究多個變量之間是否存在某一特定關(guān)系,是用一個或多個變量的值來預(yù)測因變量的值;時間序列預(yù)測是用過去時間序列進行統(tǒng)計分析來預(yù)測未來時間序列.
預(yù)測GDP的常用方法有時間序列預(yù)測、神經(jīng)網(wǎng)絡(luò)預(yù)測、灰色預(yù)測及各種組合模型.例如,王冬冬[1]利用1997年到2014年重慶市GDP數(shù)據(jù)基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型對重慶市2015年到2017年GDP做出預(yù)測,預(yù)測精度為97.01%,得到該模型具有較好的擬合效果.孫皖宇[2]分析2000年到2016年中國GDP季度數(shù)據(jù)并基于季節(jié)SARIMA模型對中國2017年各季度數(shù)據(jù)進行預(yù)測,得到GDP平均誤差為4.478 7%;未來我國GDP將持續(xù)增長,但增長率逐漸減少;且固定在7%左右,最為適合中國經(jīng)濟發(fā)展.王紅超、王紅蕾[3]利用我國2006年到2015年GDP數(shù)據(jù)采用二次指數(shù)平滑法與回歸分析相結(jié)合的方法,對我國2017年GDP進行預(yù)測.李佩、彭斯俊[4]為了提高組合預(yù)測的精度,提出了一種新的組合權(quán)重計算方法,該方法通過將平均絕對百分?jǐn)?shù)誤差(MAPE)和最小二乘法相結(jié)合來確定組合預(yù)測模型的權(quán)重值,并對湖北省GDP進行預(yù)測,預(yù)測結(jié)果表明該組合權(quán)重與單一權(quán)重相比,可將組合模型的預(yù)測精度提高約0.3%.李小月[5]利用1990~2010年中國GDP數(shù)據(jù),在建立ARIMA、多項式趨勢擬合模型和GM(1,1)模型基礎(chǔ)上,以誤差平方和最小為最優(yōu)準(zhǔn)則建立組合預(yù)測模型,并把它應(yīng)用于我國GDP的預(yù)測,所得結(jié)果誤差優(yōu)于三個模型的分別預(yù)測,表明組合預(yù)測模型在時間序列數(shù)據(jù)的預(yù)測中更有優(yōu)勢.然而,對于GDP預(yù)測,由于選取的地點、時間、預(yù)測分析方法不同,預(yù)測結(jié)果也多種多樣.相對而言,組合模型把各個獨立模型的優(yōu)勢進行整合,把信息利用率最大化,可以避免有效信息的浪費也能減少偶然因素對預(yù)測結(jié)果的影響,其預(yù)測精度相對較高[6,7],因此,組合模型在能源、GDP等預(yù)測中得到了廣泛應(yīng)用.例如,周揚等人建立BP神經(jīng)網(wǎng)絡(luò)與灰色GM的優(yōu)化組合模型對江蘇省未來15年煤炭和石油的需求量進行預(yù)測[6].王莎莎等人采用組合模型預(yù)測了中國GDP的發(fā)展情況[7].
當(dāng)前,云南省大力培育和發(fā)展煙草、生物資源、旅游、礦產(chǎn)、電力五大支柱產(chǎn)業(yè)群[8~12],五大支柱產(chǎn)業(yè)群已經(jīng)在云南省GDP中占有了較大份額,成為了云南省經(jīng)濟增長的重要保障.如何研究云南省經(jīng)濟增長情況及發(fā)展趨勢成為目前亟待解決的熱點問題.基于上述考慮,本文選取云南省能源消費量占比較大的煤炭、石油、一次電消費量的統(tǒng)計數(shù)據(jù),采用組合模型,即多元線性回歸與時間序列ARIMA預(yù)測模型來研究能源消費量與云南省GDP的關(guān)系,并對未來幾年云南省GDP進行分析及預(yù)測.
在處理實際問題時,影響一個變量Y的因素通常是有多個.如果有p個自變量,自變量為xi(i=1,…,p)與隨機變量Y之間存在相關(guān)關(guān)系,通常就意味著xi變量取定值后,Y便有相應(yīng)的值與之對應(yīng).線性回歸模型可以表示為:
Y=β0+β1x1+β2x2+…+βpxp+ε
(1)
其中,β0是常數(shù)項,ε是隨機誤差表示由于客觀原因沒有考慮到的其他因素,β1、β2…βp是回歸系數(shù).為了讓建立的模型能達到預(yù)期效果,必須保證選擇的自變量對因變量有顯著的影響,并且具有密切的相關(guān)性,同時自變量之間要有互斥性,自變量的統(tǒng)計數(shù)據(jù)也要完整.在得到多元線性回歸方程之后,需要對模型進行檢驗,即要測定模型的擬合度,通過對回歸方程、回歸系數(shù)的顯著性檢驗,判別多重共線性,才能得到擬合度較好的線性回歸模型.
時間序列是指一個依時間順序做成的觀察資料的集合.時間序列分析過程中最常用的方法是:指數(shù)平滑、自回歸、綜合移動平均及季節(jié)分解.本次實驗研究云南省GDP與能源消費量的關(guān)系,但能源消費量往往受到許多因素的制約,這些因素之間有著錯綜復(fù)雜的聯(lián)系,因此,運用結(jié)構(gòu)性的因果模型分析和預(yù)測能源消費量往往是比較困難的.
該預(yù)測模型對數(shù)據(jù)處理需要特別注意三點:一是對有缺失值的數(shù)據(jù)進行修補;二是將數(shù)據(jù)資料定義為相應(yīng)的時間序列;三是對時間序列數(shù)據(jù)的平穩(wěn)性進行計算觀察.根據(jù)時間序列的特征和分析的要求,選擇恰當(dāng)?shù)哪P瓦M行數(shù)據(jù)建模和分析,則需要預(yù)測年限的數(shù)據(jù)即可得到.
為研究云南省GDP值的變化與能源消費量的變化關(guān)系,根據(jù)1978年至2017年能源消費量數(shù)據(jù)統(tǒng)計,發(fā)現(xiàn)云南省能源消費量中煤炭、石油、一次電、天然氣消費量占比較大,其中煤炭、石油、一次電消費量又相對較大,所以本文研究云南省GDP與煤炭、石油、一次電消費量的關(guān)系.
分析1978年以來云南省地區(qū)GDP-y,選取煤炭消費量—x1、石油消費量—x2、一次電消費量—x3、能源消費總量—x4為自變量,數(shù)據(jù)如表1.
表1 云南省1978年~2017年GDP與能源消費量統(tǒng)計
續(xù)表1
數(shù)據(jù)來源:2018年《云南省統(tǒng)計年鑒》.
根據(jù)表1數(shù)據(jù),利用SPSS可畫出散點圖1:根據(jù)散點圖分布情況可以發(fā)現(xiàn)云南省煤炭消費量和GDP無線性關(guān)系,石油消費量和一次電消費量與GDP成線性關(guān)系,所以選擇線性模型進行建模.
根據(jù)上述散點圖分析可將1978年至2015年數(shù)據(jù)導(dǎo)入SPSS軟件,點擊變量視圖更改標(biāo)簽→分析→回歸→線性,煤炭消費量、石油消費量、一次電消費量為自變量,GDP為因變量,置信區(qū)間為95%水平,選擇逐步回歸分析法進行數(shù)據(jù)分析研究.
圖1 煤炭消費量、石油消費量以及一次電消費量與生產(chǎn)總值的關(guān)系圖
表2 模型參數(shù)及檢驗說明
表2中,a為預(yù)測變量(常量),一次電消費量;b為預(yù)測變量(常量),一次電消費量,石油消費量.模型1自變量為一次電消費量,模型2自變量為一次電消費量、石油消費量,因變量都為GDP,剔除了自變量煤炭消費量,符合散點圖預(yù)分析.根據(jù)R2可以判斷線性方程的擬合度,越接近1,說明方程的擬合度越好.模型2調(diào)整后R2為0.995,比模型1調(diào)整后R2(0.987)更接近1,且都在0.96以上,表明模型2的擬合度是最好的.
表3 模型顯著性檢驗
說明:a.因變量:GDP;b.預(yù)測變量(常量),一次電消費量;c.預(yù)測變量(常量),一次電消費量,石油消費量.
表3是方差分析數(shù)據(jù),F(xiàn)值是對整個回歸方程的顯著性檢驗,當(dāng)F對應(yīng)的顯著性值小于0.05時,回歸方程才有意義.從表中可以可看出兩個模型的F值對應(yīng)的顯著性值都小于0.05,說明各模型自變量綜合起來看對因變量是有顯著性影響的,模型可以使用.
表4 回歸系數(shù)及顯著性檢驗
說明:a.因變量:GDP.
表4給出了線性方程的回歸系數(shù)及顯著性檢驗,這里的t檢驗是對單個變量的顯著性檢驗,當(dāng)t對應(yīng)的顯著性值小于0.05時,回歸方程才有意義.從表中可以看出t對應(yīng)的顯著性值都為0,所以各個自變量單獨來看對因變量是有顯著影響的.B表示各個自變量在方程中的系數(shù).各自變量的B的95.0%置信區(qū)間都在10以下,說明各自變量并無較強的多重共線性.
根據(jù)分析結(jié)果,石油消費量、一次電消費量對GDP的影響是顯著的,并且各個變量之間也不存在較強的多重共線性,說明數(shù)據(jù)分析結(jié)果是有效的,建立的模型也是有意義的.相比較而言,模型2的擬合度更好,自變量顯著性更高.所以將表4中模型2的各自變量回歸系數(shù)代入線性回歸模型,得到回歸方程:
y=-651.407+2.248x2+2.454x3
(2)
將2016年、2017年石油和一次電消費量代入(2)式,檢測模型得到GDP值與實際值的對比如表5所示,可以看出誤差率在6.00%以下,在可接受范圍內(nèi).
表5 模型計算值與實際GDP值對比
再加入2016年和2017年數(shù)據(jù),并用以上相同的方法、步驟修正模型,可以得到修正模型:
y=-689.896+1.95x2+2.650x3
(3)
如圖2,將修正模型(3)式得到的GDP和實際GDP建立折線統(tǒng)計圖,擬合效果比較理想.
圖2 修正模型計算GDP值與實際GDP值擬合度
從上述分析中可得到云南省GDP預(yù)測模型為(3)式:
y=-689.896+1.95x2+2.650x3
為了應(yīng)用模型(3)式預(yù)測2018~2022年云南省GDP,還需預(yù)測2018~2022年的石油消費量、一次電消費量.下面利用時間序列ARIMA預(yù)測模型研究石油消費量、一次電消費量的預(yù)測模型.
根據(jù)自相關(guān)和偏相關(guān)圖判斷該數(shù)據(jù)是平穩(wěn)的,對原始序列建立(p,0,q)模型,經(jīng)過反復(fù)試驗確定模型為ARIMA(5,0,5),此時R2達到0.990,擬合程度較好.
石油消費量預(yù)測通過以上分析采用ARIMA(5,0,5)模型建模,得到以下預(yù)測值.
表6 石油消費量預(yù)測值
表6中,對于每個模型,預(yù)測從所請求估算期范圍內(nèi)的最后一個非缺失值之后開始,并結(jié)束于最后一個所有預(yù)測變量都有可用的非缺失值的周期,或者在所請求預(yù)測期的結(jié)束日期結(jié)束,以較早者為準(zhǔn).
從圖3中的擬合度對比圖可看出,該預(yù)測模型擬合度較好,可清晰看出石油消費量預(yù)測趨勢.
圖3 石油消費量預(yù)測擬合度對比圖
數(shù)據(jù)處理和石油消費量預(yù)測一樣,同樣將原始數(shù)據(jù)1978~2017年數(shù)據(jù)導(dǎo)入SPSS,通過同樣的方法可得到預(yù)測值.
根據(jù)自相關(guān)和偏相關(guān)圖判斷該數(shù)據(jù)是非平穩(wěn)的,進行了一次差分,得到差分序列自相關(guān)和偏相關(guān)圖都是拖尾的,因此可對原始序列建立(p,1,q)模型,經(jīng)過反復(fù)試驗確定模型為ARIMA(5,1,6),此時R2達到0.992,擬合效果較好.
一次電消費量預(yù)測通過以上分析采用ARIMA(5,1,6)模型建模,得到以下預(yù)測值.
表7 一次電消費量預(yù)測值
表7中,對于每個模型,預(yù)測從所請求估算期范圍內(nèi)的最后一個非缺失值之后開始,并結(jié)束于最后一個所有預(yù)測變量都有可用的非缺失值的周期,或者在所請求預(yù)測期的結(jié)束日期結(jié)束,以較早者為準(zhǔn).
圖4中擬合度對比圖可看出該預(yù)測模型擬合度較好,可清晰看出一次電消費量預(yù)測趨勢.
圖4 一次電消費量預(yù)測擬合度對比圖
GDP預(yù)測結(jié)果及分析分別把表6和表7中的2018~2022年石油消費量和一次電消費量帶入修正模型
y=-689.896+1.95x2+2.650x3,
(3)
得到2018年~2022年云南省地區(qū)GDP預(yù)測數(shù)據(jù)如下:
表8 修正模型GDP 預(yù)測值
(1)云南省未來石油消費量和一次電消費量依然處于上升水平,雖然有時會有波動,但總體波動不大.
(2)云南省一次電消費量還處于急速增長狀態(tài),未來一次電消費量應(yīng)會持續(xù)增加.
(3)云南省GDP值處于上升水平,但是增速相對緩慢.
(4)從本文的預(yù)測數(shù)據(jù)看,2019年GDP相對2018年GDP出現(xiàn)稍微下降趨勢,這為云南省制定下一步相應(yīng)政策提供了一定的數(shù)據(jù)依據(jù).需要說明的是,由于2019年出版的是2018年的統(tǒng)計年鑒,而在本文成文時年鑒中的數(shù)據(jù)只更新到2017年,從時效看稍顯滯后,但新出來的數(shù)據(jù)也能對本文預(yù)測結(jié)果做一個及時的驗證.
模型說明
(1)本文采用SPSS多元線性回歸模型和時間序列ARIMA預(yù)測模型組合來預(yù)測未來5年云南GDP值,具有較高的精確性和可靠性,為云南省制定相應(yīng)政策提供數(shù)據(jù)支持.
(2)ARIMA預(yù)測模型既能提取序列的確定性信息,又能提取其隨機性信息,提高了模型的擬合精度,具有確定性分析和隨機性分析的優(yōu)點.
(3)ARIMA預(yù)測模型,隨著預(yù)測時間的延長,預(yù)測誤差會逐漸增大,精度也會隨之下降,進而影響組合模型的精度.
(4)ARIMA預(yù)測模型具有較強的時間趨勢.