王旭天 李政遠(yuǎn) 舒慧生
[摘要]汽車工業(yè)在國民經(jīng)濟(jì)中占有重要地位,準(zhǔn)確預(yù)測汽車銷量具有十分重要的意義。由于假日及其他因素影響,汽車的月度銷售數(shù)據(jù)表現(xiàn)出季節(jié)性的特征。文章選用我國2004年1月—2015年1月的汽車月度銷售數(shù)據(jù)為研究對象,構(gòu)建了具有季節(jié)調(diào)整的ARIMA模型并用于銷量預(yù)測,預(yù)測結(jié)果的平均相對誤差可控制在3%以內(nèi),模型合理有效,具有良好的參考價(jià)值。
[關(guān)鍵詞]ARIMA模型;汽車銷量;SARIMA預(yù)測
[DOI]10.13939/j.cnki.zgsc.2016.01.071
1 引 言
隨著我國經(jīng)濟(jì)的快速發(fā)展和居民生活水平的提高,汽車在人群中開始逐漸普及,成為許多人的生活必需品。與此同時(shí),汽車工業(yè)迅速發(fā)展,在國民經(jīng)濟(jì)中也扮演著越來越重要的角色,與機(jī)械電子、石油化工和建筑業(yè)一道構(gòu)成了我國經(jīng)濟(jì)的四大支柱產(chǎn)業(yè),因而如何對汽車銷量進(jìn)行準(zhǔn)確的預(yù)測具有重要意義。
ARIMA模型是20世紀(jì)70年代由博克斯和詹金斯提出的時(shí)間序列方法[1][2],所以又被稱為博克斯-詹金斯法,其全稱是自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model),包含移動平均過程(MA)和自回歸過程(AR)兩個部分。ARIMA模型發(fā)展至今理論已非常成熟,在實(shí)踐中應(yīng)用廣泛。如龔承剛,王夢等人將ARIMA模型運(yùn)用到了對湖北省城鄉(xiāng)居民收入差距的預(yù)測中,預(yù)測到未來三年湖北省的城鄉(xiāng)居民收入差距比仍處在較高水平。[3]薛蓓蓓運(yùn)用ARIMA模型對安徽省固定資產(chǎn)投資總額進(jìn)行了建模和預(yù)測,借助Eviews軟件給出了短期的預(yù)測值。[4]張麗,?;莘紝ARIMA模型運(yùn)用到了對我國CPI的分析預(yù)測中,對CPI月度數(shù)據(jù)的變化趨勢和季節(jié)性進(jìn)行了分析。[5]虞安和王忠采用引力模型和ARIMA模型對旅游人群進(jìn)行了預(yù)測,對城市管理和旅游秩序的維護(hù)工作提供了意見和建議。[6]
本文將以汽車工業(yè)協(xié)會公布的汽車銷量月度數(shù)據(jù)為研究對象,根據(jù)月度數(shù)據(jù)同時(shí)具有長期趨勢效應(yīng)、季節(jié)效應(yīng)和隨機(jī)波動的特點(diǎn),選取具有季節(jié)調(diào)整的ARIMA模型對汽車銷量進(jìn)行預(yù)測。
2 模 型
3 建模過程
建模的過程主要分為以下四步:
第一步:序列平穩(wěn)化。所研究的數(shù)據(jù)如果是非平穩(wěn)的,則不滿足建模的條件,需要先對數(shù)據(jù)進(jìn)行處理,在應(yīng)用中差分x=xt-xt-1是常用的方法,差分后還需要通過ADF檢驗(yàn)驗(yàn)證序列是否已經(jīng)平穩(wěn)化。
第二步:模型識別。在這個過程中,繪制樣本的自相關(guān)函數(shù)圖(ACF)和偏自相關(guān)函數(shù)圖(PACF),然后觀察時(shí)間序列樣本的自相關(guān)系數(shù)和偏相關(guān)系數(shù)的特征確定ARMA模型的階數(shù),模型階數(shù)的判斷標(biāo)準(zhǔn)如下:
第三步:模型擬合。在確定模型的階數(shù)后,需要對模型中的參數(shù)進(jìn)行估計(jì),這一步中常用的方法是最小二乘法,在實(shí)際的應(yīng)用中,可通過統(tǒng)計(jì)軟件求得擬合值。
第四步:模型診斷。為保證模型的有效性,需要對模型進(jìn)行殘差的白噪聲檢驗(yàn)。殘差的LB統(tǒng)計(jì)量近似服從自由度為m的卡方分布,若統(tǒng)計(jì)量的P值大于顯著性水平,可認(rèn)為殘差序列是純隨機(jī)序列,說明信息已被模型完全提?。环粗畡t說明有些信息未能被提取,模型還需改進(jìn)。為了保證模型的精簡性,還要對參數(shù)的顯著性進(jìn)行檢驗(yàn),剔除不顯著為零的參數(shù)。
4 實(shí)例分析
本文選取的研究數(shù)據(jù)為中國汽車工業(yè)協(xié)會公布的2004年1月—2015年1月全國汽車銷量月度數(shù)據(jù),原始數(shù)據(jù)如表2所示。在建模過程中,將2004年1月—2014年3月的銷售數(shù)據(jù)用于構(gòu)建模型,而將剩余數(shù)據(jù)將用于檢驗(yàn)?zāi)P偷念A(yù)測效果。
繪制汽車銷量走勢圖,如圖1所示。從圖中可以看出,我國的汽車銷量同時(shí)表現(xiàn)出波動趨勢和增長趨勢。由于春節(jié)假期因素的影響,每年2月都是全年的銷售淡季,與其他月相比較2月的汽車銷量大幅下滑。而從長期趨勢來看,汽車的銷量在逐年增長。
下一步對模型進(jìn)行識別,首先繪制{zt}的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF),如圖3所示。圖像表明在延遲12階處,自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都顯著非零;在延遲24階處,自相關(guān)系數(shù)完全落入了2倍標(biāo)準(zhǔn)差范圍以內(nèi),但是偏自相關(guān)系數(shù)仍然顯著非零。因此在季節(jié)自相關(guān)特征上,自相關(guān)系數(shù)截尾,而偏自相關(guān)系數(shù)拖尾。為了提取差分后序列的季節(jié)信息,可以使用ARMA(0,1)12模型。
然后再考慮模型的短期相關(guān)性,自相關(guān)系數(shù)和偏自相關(guān)系數(shù)在延遲2階后均快速衰減到2倍標(biāo)準(zhǔn)差之內(nèi),可以嘗試對p和q取不同的值,再根據(jù)SBC準(zhǔn)則選出相對最優(yōu)模型。在模型ARIMA(p,d,q)×(P,D,Q)12中,現(xiàn)在已知P=1,Q=1,以及d=1,D=1。在保持這四個參數(shù)不變的條件下,分別取p=1,2和q=0,1,2,SBC信息量的計(jì)算結(jié)果如表4所示。結(jié)果表明,當(dāng)p=1,q=0時(shí),SBC信息量相對最小。
5 結(jié) 論
在每月銷量的預(yù)測中,除了2014年12月的預(yù)測值與實(shí)際值偏差較大外,其余月份的預(yù)測偏差都控制在了3%以內(nèi),其中2014年6月、7月和10月的預(yù)測偏差更是控制在了1%以內(nèi),而預(yù)測值的平均絕對百分比誤差為MAPE=2.36,預(yù)測效果良好。
在年初由于春節(jié)假期的影響,汽車銷量往往較低,而在年末因汽車經(jīng)銷商為完成銷售指標(biāo)而開展各種促銷活動,汽車銷量出現(xiàn)高峰,汽車的銷售表現(xiàn)出明顯的季節(jié)性變化,選用具有季節(jié)調(diào)整的ARIMA模型是非常合理的。事實(shí)上在本例中SARIMA模型的預(yù)測偏差能夠控制在合理的范圍之內(nèi),該模型對汽車銷量預(yù)測活動具有良好的參考價(jià)值。
參考文獻(xiàn):
[1]博克斯,詹金斯,格雷戈里,等.時(shí)間序列分析:預(yù)測與控制[M].4版.北京:機(jī)械工業(yè)出版社,2011.
[2]王燕.應(yīng)用時(shí)間序列分析[M].3版.北京:中國人民大學(xué)出版社,2012.
[3]龔承剛,王夢,謝航.基于ARIMA模型的湖北省城鄉(xiāng)居民收入差距的預(yù)測[J].統(tǒng)計(jì)與決策,2014(15):94-97.
[4]薛蓓蓓.基于ARIMA模型:全社會固定資產(chǎn)投資總額預(yù)測[J].統(tǒng)計(jì)與決策,2014(15):141-143.
[5]張麗,?;莘?基于SARIMA模型的居民消費(fèi)價(jià)格指數(shù)預(yù)測分析[J].數(shù)理統(tǒng)計(jì)與管理,2013(1):1-6.
[6]虞安,王忠.基于ARIMA模型與時(shí)間序列的城市旅游傾向預(yù)測[J].統(tǒng)計(jì)與決策,2014(13):86-89.