劉佳,趙慧文,劉光榮
(空軍工程大學理學院,陜西西安710051)
基于SAS的非平穩(wěn)時間序列分析及實證研究
劉佳,趙慧文,劉光榮
(空軍工程大學理學院,陜西西安710051)
采用季節(jié)指數(shù)趨勢法,對具有季節(jié)變動的非平穩(wěn)時間序列(以某電腦公司的實際季度銷售記錄為例),利用統(tǒng)計分析系統(tǒng)SAS進行分析,并對該公司2009年的銷售情況進行了預測.與公司2009年度前三個季度的實際銷售數(shù)據(jù)進行對比,擬合效果令人滿意,證明該方法實用有效.
時間序列;SAS;非平穩(wěn)時間序列;季節(jié)指數(shù)趨勢法
在自然現(xiàn)象和經(jīng)濟現(xiàn)象中,人們?yōu)榱颂剿髂承┦挛锘蛳到y(tǒng)的運行規(guī)律,需要觀測所要研究的某種現(xiàn)象,從而得到一定順序的數(shù)據(jù)資料,通過分析這些數(shù)據(jù)資料,對事物或系統(tǒng)的未來發(fā)展進行預測或控制,這種方法稱為時間序列分析.從數(shù)學意義上講,對某一過程中的某一變量或一組變量X(t)進行觀察測量,在一系列時刻t1,t2,…,tN(t1<t2<…<tN)得到的有序數(shù)據(jù)集合X(t1),X(t2),…,X(tN),稱為時間序列[1].時間序列分析作為數(shù)理統(tǒng)計的一個分支,是一種利用具有“時間特性”的觀測數(shù)據(jù),根據(jù)研究對象的特征,發(fā)掘內(nèi)在規(guī)律,建立動態(tài)模型,并對之進行模式識別、參數(shù)估計,然后以此為依據(jù),對未來的行為進行科學的預測和控制的統(tǒng)計方法,在工程技術、經(jīng)濟管理、氣象學、地球物理學等方面有著廣泛的應用.面對實際問題,當數(shù)據(jù)很多時,如果沒有計算機程序,人們很難完成工作.SAS作為國際上最流行的統(tǒng)計分析系統(tǒng),在統(tǒng)計分析領域具有最權威的統(tǒng)計分析能力[2].本文利用SAS系統(tǒng)對電腦零售業(yè)時間序列數(shù)據(jù)進行建模.
電腦零售業(yè)是一個競爭非常激烈的產(chǎn)業(yè),其銷售量一方面決定于零售企業(yè)的產(chǎn)品供給能力,另一方面,買方市場的形成更大程度上受到消費市場的影響,由此可見零售業(yè)銷售量是由多種因素決定的[3].本文利用季節(jié)指數(shù)趨勢法,結(jié)合山東省泰安市某電腦公司的季度銷售數(shù)據(jù),建立模型,并運用該模型對該公司2009年銷售量進行預測.
時間序列分析是一種動態(tài)的數(shù)列分析,其目的在于掌握統(tǒng)計數(shù)據(jù)隨時間變化的規(guī)律.時間序列中每一時期的數(shù)值都是由許多不同的因素同時發(fā)生作用后的綜合結(jié)果.在進行時間序列分析時,人們通常將各種可能發(fā)生影響的因素按其性質(zhì)不同分成4大類:長期趨勢、季節(jié)變動、循環(huán)變動和不規(guī)則變動.根據(jù)時間序列所研究的依據(jù)不同,有如下分類[4-5]:
1)按所研究對象的多少,可分為一元時間序列和多元時間序列;
2)按時間的連續(xù)性,可分為離散時間序列和連續(xù)時間序列;
3)按序列的統(tǒng)計特性,可分為平穩(wěn)時間序列和非平穩(wěn)時間序列;
4)按序列的分布規(guī)律,可分為Gauss時間和Non-Gauss時間序列.
非平穩(wěn)時間序列是指時間序列呈現(xiàn)出明顯的趨勢性或周期性,此時就不能認為該序列是均值和方差不變的平穩(wěn)過程,而是非平穩(wěn)過程.研究這一非平穩(wěn)過程的主要理論基礎是Cramer分解定理[4-5].
Cramer分解定理任何一個時間序列{Xt}都可以分解為疊加的兩部分,其中一部分是由多項式?jīng)Q定的確定性趨勢成分,另一部分是平穩(wěn)的零均值誤差成分,即:
其中d<∞,β1,β2,…,βd為常數(shù)系數(shù),{εt}為一個零均值白噪聲序列,B為延遲算子,且有:
其中,E為數(shù)學期望,Θ(B)為自回歸系數(shù)多項式,εt為 t時刻對系統(tǒng)的隨機擾動(或噪聲).即,均值序列反映了{Xt}受到的確定性影響,而受到的隨機影響.
Cramer分解定理說明了任何一個序列的波動都可以視為同時受到了確定性影響和隨機影響的綜合作用.平穩(wěn)序列要求這兩方面的影響都是穩(wěn)定的,而非平穩(wěn)序列產(chǎn)生的機理則在于它所受到的這兩方面的影響至少有一方面是不平穩(wěn)的.
我們把因季節(jié)影響而出現(xiàn)變動的時間序列稱為具有季節(jié)變動的時間序列[4].季節(jié)變動是一種由于自然條件、消費習慣等因素的作用,使研究對象以一定時期為一周期呈現(xiàn)較有規(guī)律的上升、下降交替運動,通常表現(xiàn)為現(xiàn)象在一年內(nèi)隨著季節(jié)的更替而發(fā)生有規(guī)律的增減變化.季節(jié)變動分析就是為了確定季節(jié)變動指數(shù),將其影響消去,從而比較科學地對序列的發(fā)展做出預測.具有季節(jié)變動的時間序列,有水平趨勢和升降趨勢兩種情形.季節(jié)變動分析包括季節(jié)指數(shù)水平法和季節(jié)指數(shù)趨勢法兩種,剔除季節(jié)影響的時間序列稱為消除季節(jié)影響的時間序列.剔除季節(jié)影響后,一期與另一期的對比將更有意義,而且可以幫助我們確定時間序列是否存在趨勢[6].
如果時間序列{Xt}既存在季節(jié)變動,同時各年水平或同月(或季)水平呈現(xiàn)上升或下降趨勢,這時不能采用指數(shù)水平法,而應該采用季節(jié)指數(shù)趨勢法[7],其預測模型為:
其中,Tt是時間序列{Xt} 所測量出的長期趨勢,S代表季節(jié)因素,I代表不規(guī)則因素,St和It成分由相應的項目測量,其數(shù)值大于1表示它們的影響在趨勢之上,小于1則表示它們的影響在趨勢之下.
季節(jié)指數(shù)趨勢法的基本思路是:先分離出不含季節(jié)周期變動的長期趨勢,再計算季節(jié)指數(shù),最后建立預測模型[8].基本步驟如下.
1)以一年的季度數(shù)4或者月數(shù)12為k,對觀測值時間序列進行k項中心移動平均,形成新的序列{At} ,它體現(xiàn)出原始序列的長期趨勢Tt.這是因為中心移動平均消去了季節(jié)影響和短期內(nèi)不規(guī)則因素影響,所以中心移動平均得到的數(shù)據(jù)可以看做趨勢項.
2)將各期觀測值除以同期移動均值得到季節(jié)比率Dt(Dt=St· It),即:Dt=Xt/At.
3)將各年同季(或月)的季節(jié)比率平均,即得其季節(jié)指數(shù)St.季節(jié)比率平均可以消除不規(guī)則因素的變動.如有必要則還需規(guī)范化處理,所謂規(guī)范化是指季節(jié)之和要等于4,月份指數(shù)之和要等于12.
4)用時間序列{Xt} 的每個觀察值除以相應的季節(jié)指數(shù),消除時間序列的季節(jié)影響,得到時間序列的非季節(jié)影響序列{Tt} ,即:Tt=Xt/St.
表1 2004~2008年季度銷售數(shù)據(jù)
5)利用消除季節(jié)影響的線性趨勢預測值建立回歸模型:Tt=a+bt,進行回歸分析和白噪聲檢驗.
表1為山東省泰安市某電腦公司2004~2008年的實際銷售數(shù)據(jù),我們以此數(shù)據(jù)為基礎,對該時間序列進行分析預測.
首先編寫SAS程序,畫出該銷售量的散點,如圖1.程序如下所示:
由圖1知,該時間序列受長期趨勢和以年為周期的季節(jié)波動共同影響,因此要先考慮剔除趨勢,再分析季節(jié)特征.具體步驟如下.
1)對時間序列觀測值進行k項中心移動平均.由圖1所顯示的特征可知,應該選擇4項進行中心移動平均,得到中心化的移動平均數(shù)At,在“消除”了時間序列的季節(jié)和不規(guī)則波動之后,有非常明顯的趨勢.
2)將各期觀測值除以同期移動均值,得到季節(jié)比率Dt.數(shù)據(jù)的中心化移動平均值和季節(jié)比率如表2所示.
圖1 銷售量散點圖
3)將各年同季度的季節(jié)比率平均,得其季節(jié)指數(shù)St, 如表3.由表3中的數(shù)據(jù)可以看出:電腦銷售較好的季度在第二、三季度,季度指數(shù)分別為1.08和1.36;最差為第一季度,季度指數(shù)僅為0.77.
表2 季度銷售數(shù)據(jù)的中心化移動平均值和季節(jié)比率
表3 季度銷售數(shù)據(jù)的季節(jié)指數(shù)
4)用時間序列的每個觀察值除以相應的季節(jié)指數(shù),得到消除季節(jié)影響后的數(shù)據(jù),
即:Tt=Xt/St,如表2最后一列.
5)利用消除季節(jié)影響的數(shù)據(jù)建立回歸模型:Tt=a+bt,然后進行回歸分析和白噪聲檢驗,其SAS語句為:
由SAS進行回歸分析和白噪聲檢驗得到表4中所示的結(jié)果,由于P值小于0.001,可以看出模型是顯著的,利用上述參數(shù)估計得到回歸模型:
表4 回歸分析和白噪聲檢驗
利用SAS語句畫出消除季節(jié)影響后的季度銷售量折線圖,如圖2所示,由圖2中的趨勢得出趨勢模型(1)是適應的.SAS語句為:
6)進行預測和季節(jié)調(diào)整.
對同時具有趨勢和季節(jié)成分的時間序列進行預測的最后一步,是利用季節(jié)指數(shù)調(diào)整趨勢預測值.經(jīng)過回歸分析和白噪聲檢驗,過去20個季度的銷售資料對未來趨勢非常合適,則這個回歸模型方程可以用來推測未來季度時間序列的趨勢成分.分別將t=21,22,23,24帶入模型(1),得到2009年的電腦銷售量,這是未來4個季度的趨勢預測值,要想得到最終的預測值,必須用季節(jié)影響調(diào)整預測值,即:用預測值乘以季節(jié)指數(shù),如表5所示.
圖2 消除季節(jié)影響后的銷售量折線圖
表5 2009年季度銷售量預測
最后,通過繼續(xù)跟蹤2009年該公司前三個季度的實際銷售量發(fā)現(xiàn):第一季度的銷售量為132臺,第二季度的銷售量為161臺,第三個季度為242臺,實際結(jié)果與預期的相比,其誤差分別為4.35%、21.7%、3.2%.雖然第二個季度的差距相對較大,但是考慮受到經(jīng)濟危機這一特殊因素的影響,整個實證分析的結(jié)果還是令人滿意的.事實證明,該方法具有很好的實用性.
本文利用統(tǒng)計分析系統(tǒng)SAS中的REG和ARIMA過程,分別建立了季度銷售數(shù)據(jù)的預測模型,并得到了較好的預測效果.但銷售市場經(jīng)常會受到各種外界因素的影響,我們的預測數(shù)據(jù)只提供一種發(fā)展趨勢,不可能與實際銷量完全一致,誤差的存在是必然的,這也正反映了銷售市場的隨機性.
[1] Falk M.A first course on time series analysis:examples with SAS[M].Chair of Statistics,University of Würzburg,2006.
[2] 阮桂海.SAS統(tǒng)計分析大全[M].北京:清華大學出版社,2003.
[3] 黨姬男.ARMA時間序列模型在銷售預測中的應用[J].應用技術與研究,2009(4):55-57.
[4] 何書元.應用時間序列分析[M].北京:北京大學出版社,2003.
[6] 鮑爾曼,奧康奈爾.預測與時間序列[M].3版.北京:機械工業(yè)出版社,2003.
[7] 郭秀英,尹興國,張艷云.季節(jié)性波動時間序列預測的分解季節(jié)指數(shù)法[J].數(shù)理統(tǒng)計與管理,2000,19(6):60-65.
[8] 彭威,孫潔.基于季節(jié)指數(shù)趨勢法預測10086話務量[J].郵電設計技術,2009(6):62-65.
Nonstationary Time Series Analysis and Case Study Based on SAS
LIU Jia,ZHAO Hui-wen,LIU Guang-rong
(College of Science,Air Force Engineering University,Xi’an 710051,Shaanxi,China)
Seasonal index trend method is used to analyze the nonstationary time series with the seasonal variation(a co mputer company’s actual quarterly sales record)by the statistical analysis system,and its sales in 2009 is forecasted.Up to now,compared with the actual sales data of the year in the first three quarters,the fitting results are satisfactory,and the method is shown to be practical and effective.
time series;SAS;nonstationary time series;seasonal index trend method
F 830.9
A
1001-4217(2010)01-0048-06
2009-09-23
劉佳(1984-),女,山東濟寧人,教師,碩士.研究方向:數(shù)理統(tǒng)計.E-mail:liujia840229@163.com