劉 翔
(上海交通大學(xué)安泰經(jīng)濟(jì)與管理學(xué)院, 上海 200052)
ARIMA模型全稱為差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡(jiǎn)記ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的著名時(shí)間序列預(yù)測(cè)方法,又被稱為Box-Jenkins模型或博克思-詹金斯法[1].其基本思想是:將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來(lái)近似描述這個(gè)序列,并認(rèn)為該序列蘊(yùn)含的規(guī)律還將持續(xù)遵循下去.這個(gè)模型一旦被識(shí)別后就可以從時(shí)間序列的過(guò)去值及現(xiàn)在值進(jìn)行外推預(yù)測(cè)未來(lái)值.因此,ARIMA模型在實(shí)證研究中被廣泛運(yùn)用于時(shí)間序列分析和模型預(yù)測(cè)領(lǐng)域.
ARIMA模型建模的對(duì)象是平穩(wěn)的時(shí)間序列,因此在對(duì)一個(gè)離散的單變量時(shí)間序列進(jìn)行建模分析時(shí),應(yīng)當(dāng)首先考察其平穩(wěn)性,再分析和判斷數(shù)據(jù)序列的生成過(guò)程.
根據(jù)平穩(wěn)時(shí)間序列生成機(jī)制的不同,ARIMA模型實(shí)際包含3種類型的模型[2]:
(1)自回歸模型(簡(jiǎn)稱AR模型): 模型為p階自回歸過(guò)程,簡(jiǎn)記為AR(p),用公式表示為
yt=φ1yt-1+φ2yt-2+…+φpyt-p+at
其中,{at}是滿足0均值和常數(shù)方差的白噪聲序列,φi為模型的待估參數(shù).
(2)移動(dòng)平均模型(簡(jiǎn)稱MA模型):
模型為q階移動(dòng)平均過(guò)程,簡(jiǎn)記為MA(q),用公式表示為
yt=at-θ1at-1-θ2at-2-…-θqat-q
其中,θi為模型的待估參數(shù),其它字母含義同上.
(3)自回歸移動(dòng)平均混合模型(簡(jiǎn)稱ARMA模型)
模型為自回歸移動(dòng)平均混合過(guò)程,簡(jiǎn)記為ARMA(p,q),用公式表示為
yt=φ1yt-1+φ2yt-2+…+φpyt-p+at-θ1at-1-θ2at-2-…-θqat-q
其中,字母含義同上.可以看到,ARIMA模型為自回歸AR模型和移動(dòng)平均MA模型的算數(shù)和,其中的I表示差分的逆運(yùn)算.
對(duì)于一個(gè)時(shí)間序列{yt}而言,構(gòu)建ARIMA模型的一般步驟為:
首先進(jìn)行單位根檢驗(yàn)或游程檢驗(yàn)其平穩(wěn)性,若非平穩(wěn)后通過(guò)d階差分作平穩(wěn)化處理;如果數(shù)據(jù)存在異方差,則需對(duì)數(shù)據(jù)進(jìn)行技術(shù)處理,直到處理后的數(shù)據(jù)的自相關(guān)函數(shù)值和偏相關(guān)函數(shù)值無(wú)顯著地異于零.
之后通過(guò)時(shí)間序列模型的識(shí)別規(guī)則判斷序列所屬類型并建立模型.若平穩(wěn)序列的偏相關(guān)函數(shù)是截尾的,而自相關(guān)函數(shù)是拖尾的,適合AR模型;若平穩(wěn)序列的偏相關(guān)函數(shù)是拖尾的,而自相關(guān)函數(shù)是截尾的,適合MA模型;若平穩(wěn)序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)均是拖尾的,則序列適合ARMA模型[3].
然后對(duì)該平穩(wěn)時(shí)間序列建立相應(yīng)的ARMA(p,q)模型,確定后的差分自回歸移動(dòng)平均模型整體表示為ARIMA(p,d,q),其中p為自回歸項(xiàng),q為移動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù).
最后對(duì)模型進(jìn)行參數(shù)估計(jì)并檢驗(yàn)參數(shù)是否具有統(tǒng)計(jì)意義,如有必要還需要進(jìn)行假設(shè)檢驗(yàn),診斷殘差序列是否為白噪聲.
以上步驟進(jìn)行完后,獲得與該時(shí)間序列匹配的ARIMA模型,并可以通過(guò)模型進(jìn)行趨勢(shì)預(yù)測(cè).
ARIMA模型在宏觀經(jīng)濟(jì)領(lǐng)域有很多重要的運(yùn)用,通常基于歷史數(shù)據(jù)構(gòu)建模型,并在置信區(qū)間內(nèi)對(duì)所分析經(jīng)濟(jì)對(duì)象的趨勢(shì)進(jìn)行判斷.本文將以中國(guó)服務(wù)貿(mào)易進(jìn)出口規(guī)模為分析對(duì)象,探討ARIMA這一模型工具的適用性.
服務(wù)貿(mào)易作為一種新興的貿(mào)易形式,在一定程度上代表了國(guó)家的經(jīng)濟(jì)發(fā)展水平.通常情況下,發(fā)達(dá)國(guó)家服務(wù)貿(mào)易在該國(guó)國(guó)際貿(mào)易中比重較大.多年以來(lái)我國(guó)利用對(duì)外貿(mào)易帶動(dòng)經(jīng)濟(jì)長(zhǎng)期增長(zhǎng),貨物貿(mào)易起著主導(dǎo)作用,而與之相對(duì)應(yīng)的服務(wù)貿(mào)易卻始終為逆差狀態(tài).但不可否認(rèn)服務(wù)貿(mào)易已經(jīng)成為我國(guó)經(jīng)濟(jì)新的增長(zhǎng)點(diǎn),從1982年到2010年,我國(guó)服務(wù)貿(mào)易規(guī)模的年均增長(zhǎng)速度達(dá)到17%[4].目前我國(guó)面臨著產(chǎn)業(yè)結(jié)構(gòu)調(diào)整的轉(zhuǎn)型困難,而大力發(fā)展服務(wù)業(yè)及服務(wù)跨國(guó)貿(mào)易是扭轉(zhuǎn)這一局面、實(shí)現(xiàn)經(jīng)濟(jì)成功轉(zhuǎn)型的突破點(diǎn)之一.
圖1 我國(guó)服務(wù)貿(mào)易規(guī)模ARIMA模型預(yù)測(cè)的基本流程
雖然服務(wù)貿(mào)易逆差在逐步縮小,但是由于受到越來(lái)越多不可控的國(guó)際因素的影響,目前我國(guó)服務(wù)貿(mào)易的增長(zhǎng)呈現(xiàn)較大的波動(dòng)性.因此,全面把握我國(guó)服務(wù)貿(mào)易的發(fā)展規(guī)律和未來(lái)走勢(shì)對(duì)于我國(guó)采取有利措施、保證服務(wù)貿(mào)易的持續(xù)穩(wěn)定發(fā)展具有重要的意義.為此,本文采用時(shí)間序列分析方法,從數(shù)量建模的角度揭示我國(guó)服務(wù)貿(mào)易的發(fā)展規(guī)律,重點(diǎn)探討ARIMA模型對(duì)貿(mào)易規(guī)模預(yù)測(cè)的適用程度.
根據(jù)建立ARIMA(p,d,q)模型的要點(diǎn),我國(guó)服務(wù)貿(mào)易規(guī)模預(yù)測(cè)的基本流程如圖1所示.
我國(guó)從1982年起正式將服務(wù)貿(mào)易納入商務(wù)和海關(guān)統(tǒng)計(jì)的范圍[5],本研究選取數(shù)據(jù)來(lái)源于國(guó)家統(tǒng)計(jì)局2011年出版的《中國(guó)統(tǒng)計(jì)年鑒(2010)》及中國(guó)商務(wù)部《中國(guó)服務(wù)貿(mào)易統(tǒng)計(jì)(2010)》提供的服務(wù)貿(mào)易數(shù)據(jù).為檢驗(yàn)?zāi)P偷暮篁?yàn)性,同時(shí)保證足夠的樣本數(shù)量范圍,本文選取中國(guó)1982~2008年的服務(wù)進(jìn)出口數(shù)據(jù)作為建模樣本,將2009和2010年貿(mào)易數(shù)據(jù)作為后驗(yàn)樣本來(lái)判斷模型估計(jì)的有效性.本文將我國(guó)服務(wù)貿(mào)易進(jìn)口額時(shí)間序列簡(jiǎn)記為M,出口額時(shí)間序列簡(jiǎn)記為X,進(jìn)出口總額時(shí)間序列簡(jiǎn)記為MX.
從圖2的服務(wù)貿(mào)易總額MX時(shí)間路徑中可以看出,原數(shù)據(jù)序列MX有著明顯的指數(shù)增長(zhǎng)趨勢(shì)(圖1a),為非平穩(wěn)序列.通過(guò)對(duì)數(shù)處理后,對(duì)數(shù)序列LMX表現(xiàn)為線性增長(zhǎng)趨勢(shì).為從統(tǒng)計(jì)意義上對(duì)序列的平穩(wěn)性進(jìn)行識(shí)別,對(duì)數(shù)據(jù)序列進(jìn)行單位根ADF檢驗(yàn).ADF檢驗(yàn)顯示對(duì)數(shù)序列LMX的t統(tǒng)計(jì)量的顯著性概率P=0.988,遠(yuǎn)大于α=0.05,接受零假設(shè),即序列顯著存在單位根.
圖2 服務(wù)貿(mào)易總額及其對(duì)數(shù)序列的時(shí)間路徑
為消除單位根的影響,對(duì)序列LMX進(jìn)行差分運(yùn)算,記為ΔLMX,再進(jìn)行平穩(wěn)性ADF檢驗(yàn).檢驗(yàn)結(jié)果表明LMX一階差分序列單位根仍存在,二階差分(序列記為Δ2LMX)后單位根不存在,時(shí)間序列為平穩(wěn)序列,即服務(wù)貿(mào)易總額對(duì)數(shù)序列LMX為二階單整序列.
在SAS統(tǒng)計(jì)軟件中對(duì)LMX的二次差分序列Δ2LMX進(jìn)行自相關(guān)(ACF)和偏相關(guān)(PACF)分析,結(jié)果如圖3所示.從圖3中可以看出,Δ2LMX的自相關(guān)圖在一階處是截尾的,而其對(duì)應(yīng)的偏相關(guān)圖是拖尾的,依此初步判斷序列LMX遵循的模型為ARIMA(0,2,1),屬于MA模型類型.
圖3 Δ2LMX序列的自相關(guān)圖和偏相關(guān)圖
為進(jìn)一步判斷模型類型,結(jié)合上述分析,本文分別嘗試用ARIMA(0,2,1)、ARIMA(0,2,1)、 ARIMA(1,2,1)、 ARIMA(1,2,2) 以及ARIMA(2,2,1)5個(gè)模型對(duì)序列LMX進(jìn)行擬合檢驗(yàn).結(jié)果顯示,只有ARIMA(0,2,1)和ARIMA(0,2,1)2個(gè)模型通過(guò)了參數(shù)檢驗(yàn),其余模型都存在估計(jì)參數(shù)檢驗(yàn)不顯著的情形,驗(yàn)證了我們之前關(guān)于序列屬于MA類型的判斷.兩模型的AIC值(赤池信息準(zhǔn)則Akaike Information Criterion)和SSR值(剩余平方和)如表1所示.
表1 模型估計(jì)的AIC值和SSR值
根據(jù)表1中模型估計(jì)的結(jié)果并考慮到建模的簡(jiǎn)約原則,對(duì)貿(mào)易總額的對(duì)數(shù)序列LMX擬采用ARIMA(0,2,1)模型進(jìn)行估計(jì),其結(jié)果通過(guò)了模型的殘差平穩(wěn)性檢驗(yàn),表明該模型合理,模型估計(jì)結(jié)果為:
lnMXt=0.985 8at-1+at
(1)
t值 (-37.325)R2=0.5
為了更全面地對(duì)服務(wù)貿(mào)易規(guī)模進(jìn)行擬合和預(yù)測(cè),分析服務(wù)貿(mào)易進(jìn)口和出口各自的變化規(guī)律,按照上述建模過(guò)程,分別對(duì)服務(wù)貿(mào)易進(jìn)口額時(shí)間序列Mt和出口額時(shí)間序列Xt建立模型.我國(guó)服務(wù)貿(mào)易進(jìn)口額Mt合理的ARIMA模型估計(jì)結(jié)果為:
ΔlnMt=0.195-0.564ΔlnMt-2+0.962at-2+at
(2)
t值 (4.707) (-4.740) (28.578)R2=0.451
同理,我國(guó)服務(wù)貿(mào)易出口額Xt合理的ARIMA模型估計(jì)結(jié)果為:
Δ2lnXt=-0.826Δ2lnXt-2+0.962at-2+at
(3)
t值 (-10.333) (-20.731)R2=0.545
利用上述建立的模型(1)、(2)和(3)式,分別對(duì)我國(guó)2009年和2010年服務(wù)貿(mào)易總額、進(jìn)口額以及出口額進(jìn)行外推預(yù)測(cè),預(yù)測(cè)結(jié)果如表2所示.
表2 2009~2010年中國(guó)服務(wù)貿(mào)易規(guī)模預(yù)測(cè)(單位:億美元)
表2表明,2009年和2010年我國(guó)的服務(wù)貿(mào)易總額分別為3 638億美元和4 345億美元,年增長(zhǎng)率均為19%,而歷史數(shù)據(jù)顯示由于服務(wù)貿(mào)易進(jìn)口的快速增加,模型根據(jù)這一內(nèi)在規(guī)律預(yù)測(cè)2009年和2010年服務(wù)貿(mào)易進(jìn)口增長(zhǎng)速度將達(dá)到26%的水平.
我們結(jié)合2009年和2010年的實(shí)際數(shù)據(jù)做一對(duì)比(表3),可以發(fā)現(xiàn)數(shù)據(jù)出現(xiàn)了較大的高估,偏差范圍為20%~30%.通過(guò)數(shù)據(jù)回溯可以發(fā)現(xiàn),由于全球金融危機(jī)對(duì)實(shí)體經(jīng)濟(jì)造成的滯后影響,2009年服務(wù)貿(mào)易近10年來(lái)出現(xiàn)了較大的負(fù)增長(zhǎng),較2008年降低了5.8%,服務(wù)貿(mào)易出口額甚至降低了12.2%.
表3 2009~2010年中國(guó)服務(wù)貿(mào)易規(guī)模及預(yù)測(cè)偏差對(duì)比(單位:億美元)
表4 2010年中國(guó)服務(wù)貿(mào)易規(guī)模及重估預(yù)測(cè)偏差對(duì)比(單位:億美元)
我國(guó)服務(wù)貿(mào)易在國(guó)際市場(chǎng)上并不具備貨物貿(mào)易那樣的優(yōu)勢(shì),當(dāng)全球經(jīng)濟(jì)處于下滑階段時(shí),作為幼稚產(chǎn)業(yè)并不具備抗擊風(fēng)險(xiǎn)的能力,因此偏離模型根據(jù)歷史數(shù)據(jù)估計(jì)的趨勢(shì).但區(qū)間估計(jì)彌補(bǔ)了點(diǎn)估計(jì)的不足,實(shí)際值基本上都在區(qū)間估計(jì)的范圍內(nèi),考慮到了突發(fā)變動(dòng)對(duì)序列趨勢(shì)的影響.
同時(shí)我們也可以看到,隨著年份的推移,2010年預(yù)測(cè)數(shù)據(jù)的精度相對(duì)2009年出現(xiàn)了更大的波動(dòng).我們嘗試將2009年的數(shù)據(jù)作為樣本構(gòu)建新的模型,并以新模型來(lái)預(yù)測(cè)2010年的數(shù)據(jù),結(jié)果如表4所示.
由于考慮了2009年的突變因素,數(shù)據(jù)序列內(nèi)在邏輯的變動(dòng)相應(yīng)改變了模型參數(shù)估計(jì),2010年預(yù)測(cè)偏差大幅降低,模型的參考價(jià)值提高.
模型預(yù)測(cè)的主要目的是在考慮隨機(jī)波動(dòng)的前提下對(duì)趨勢(shì)進(jìn)行模擬和分析,其預(yù)測(cè)結(jié)果不是為精確到細(xì)節(jié),而是作為參考指標(biāo)和判斷依據(jù).從上述構(gòu)建我國(guó)服務(wù)貿(mào)易進(jìn)出口規(guī)模ARIMA模型并進(jìn)行短期預(yù)測(cè)的過(guò)程中,模型從動(dòng)態(tài)角度反映出服務(wù)貿(mào)易規(guī)模的變動(dòng)趨勢(shì)和特點(diǎn),我們可以看到ARIMA這個(gè)重要的時(shí)間序列建模方法適用于很多縱向經(jīng)濟(jì)現(xiàn)象的定量分析,特別是經(jīng)濟(jì)體規(guī)模的變動(dòng)預(yù)測(cè),能夠幫助理解和擬合數(shù)據(jù)內(nèi)部隱藏的規(guī)律性.模型對(duì)歷史數(shù)據(jù)中包含信息做了充分吸收,相對(duì)于簡(jiǎn)單的增長(zhǎng)率平均法更加科學(xué)和有效.同時(shí)區(qū)間預(yù)測(cè)與點(diǎn)預(yù)測(cè)相結(jié)合,使得模型預(yù)測(cè)結(jié)果更加客觀嚴(yán)謹(jǐn).
但是從預(yù)測(cè)的理想程度上,本文也提出利用ARIMA模型進(jìn)行經(jīng)濟(jì)預(yù)測(cè)時(shí)的局限性:
(1)突發(fā)事件對(duì)數(shù)據(jù)序列趨勢(shì)的影響. 應(yīng)該注意的是ARIMA模型基于的原理是假設(shè)序列保持不變的趨勢(shì),置信區(qū)間雖然已經(jīng)包含了隨機(jī)波動(dòng)的范圍,但當(dāng)出現(xiàn)影響事件發(fā)展方向的“黑天鵝”事件時(shí),其預(yù)測(cè)將偏離真實(shí)情況.
(2)區(qū)間估計(jì)范圍過(guò)大. 根據(jù)本文中的研究樣本,在置信度為95%的情況下,區(qū)間估計(jì)相對(duì)于點(diǎn)估計(jì)值的變動(dòng)達(dá)到了±20%以上,最高的甚至達(dá)到±40%.對(duì)于宏觀經(jīng)濟(jì)變量來(lái)說(shuō),年增長(zhǎng)率10%已經(jīng)屬于較大的變化,因此區(qū)間估計(jì)范圍過(guò)大會(huì)使預(yù)測(cè)喪失其意義.
針對(duì)以上兩個(gè)局限性,本文給出如下建議:
(1)時(shí)間序列模型應(yīng)對(duì)數(shù)據(jù)進(jìn)行適時(shí)的動(dòng)態(tài)更新和調(diào)整,以便更好地反映和模擬內(nèi)在規(guī)律.
(2)適當(dāng)降低區(qū)間估計(jì)的范圍,以保證預(yù)測(cè)本身的價(jià)值.由于縮小置信區(qū)間會(huì)以降低置信水平為代價(jià),因此在構(gòu)造模型時(shí)需要在兩者間做一權(quán)衡.同時(shí),盡可能擴(kuò)大樣本數(shù)量,以保證在置信水平不變的前提下置信區(qū)間相對(duì)變窄.
參考文獻(xiàn)
[1] 王煒炘,杜金觀,伍尤桂,等.應(yīng)用時(shí)間序列分析[M]. 桂林:廣西師范大學(xué)出版社,1999:102-183.
[2] George E. P. Box, Gwilym M.Jenkins. 時(shí)間序列分析-預(yù)測(cè)與控制[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,1997:101-149.
[3] 張樹京,齊立心. 時(shí)間序列分析簡(jiǎn)明教程[M]. 北京:北方交通大學(xué)出版社,2003:24-59.
[4]中國(guó)商務(wù)部. 中國(guó)服務(wù)貿(mào)易(2010)[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,2011.
[5] 國(guó)家統(tǒng)計(jì)局. 中國(guó)服務(wù)貿(mào)易(2010)[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,2011.
[6] 姜 弘. 居民消費(fèi)價(jià)格指數(shù)的時(shí)間序列分析及預(yù)測(cè)[J]. 統(tǒng)計(jì)與決策,2009,4:26-33.
[7] 謝佳利,楊善朝,梁 鑫.我國(guó)CPI時(shí)間序列預(yù)測(cè)模型的比較及實(shí)證檢驗(yàn)[J]. 統(tǒng)計(jì)與決策,2008,6:74-82.
[8] 王振龍. 時(shí)間序列分析[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,2000.