胡涵清,沈 鵬,張澤圣,萬 妮
(北京信息科技大學 經(jīng)濟管理學院,北京 100192)
在中國走向世界、世界了解中國的大背景下,北京作為中國的首都,近年入境旅游業(yè)發(fā)展迅速,以入境旅游歷史數(shù)據(jù)為基礎,選取合適的模型進行北京市旅游需求規(guī)模的準確預測,具有重要意義。
從20世紀60年代開始,國內(nèi)外學者大量研究旅游人數(shù)預測,理論趨于成熟[1]。對于入境旅游人數(shù)的預測,吳良平等[2]基于帶虛擬變量的ARIMA模型研究了入境游客在中國的動態(tài)分布情況并做出預測。俞金國等[3]基于ARIMA模型對非典時期以后中國入境旅游人數(shù)復蘇情況進行了估計預測。陳鵬等[4]基于ARIMA模型對安徽省當?shù)厝刖陈糜稳藬?shù)進行預測。李乃文等[5]基于修正ARIMA模型預測中國入境旅游人數(shù)。鄧祖濤等[6]使用BP神經(jīng)網(wǎng)絡預測中國入境旅游人數(shù)。孫燕平等[7]對游客來源預測的神經(jīng)網(wǎng)絡方法做了介紹。王琳等[8]基于Elman神經(jīng)網(wǎng)絡對中國入境旅游人數(shù)進行動態(tài)預測。雷可為等[9]基于BP神經(jīng)網(wǎng)絡方法和ARIMA組合模型對中國入境游客人數(shù)進行預測。周成等[10]基于X-12-ARIMA和HP濾波法預測分析上海入境旅游市場的發(fā)展趨勢和程度。
對于旅游預測模型的比較,Cho Vincent[11]用均方根誤差(RMSE)與平均絕對百分比誤差(MAPE)作為指標,對神經(jīng)網(wǎng)絡、單變量自回歸滑動平均結合法以及指數(shù)平滑法相比較,發(fā)現(xiàn)神經(jīng)網(wǎng)絡的預測結果最好。Low Rob[12]發(fā)現(xiàn)使用神經(jīng)網(wǎng)絡預測非線性的游客行為的預測結果,比線性趨勢預測方法、自回歸滑動平均結合法及指數(shù)平滑法的預測結果,所計算的累計絕對誤差(AE)更低,均方根誤差(RMSE)更低。任來玲等[13]從定性方法、定量模型、人工智能方法3個維度對旅游預測模型進行分類介紹。
在入境旅游人數(shù)預測方面,學者側(cè)重于使用ARIMA模型、神經(jīng)網(wǎng)絡以及使用混合模型。ARIMA模型預測過程側(cè)重于擬合歷史數(shù)據(jù)的線性關系,而神經(jīng)網(wǎng)絡預測過程側(cè)重于學習數(shù)據(jù)的非線性規(guī)律。本文基于ARIMA模型和NARX 神經(jīng)網(wǎng)絡,分別對北京市入境旅游人數(shù)進行預測,進而比較模型預測結果,為北京市入境旅游人數(shù)預測的模型選擇提供一定的借鑒,為北京市旅游決策和管理提供參考。
北京市統(tǒng)計局職能之一是對區(qū)域發(fā)展及產(chǎn)業(yè)發(fā)展情況進行監(jiān)測評價,旅游行業(yè)的監(jiān)測是統(tǒng)計局的一個工作方向。本文使用的北京市1978—2018年入境旅游人數(shù)從北京市統(tǒng)計局網(wǎng)站中獲得(北京市統(tǒng)計局:http://tjj.beijing.gov.cn/tjsj/ndtjzl/2018ndtjzl_6949/ly_6698/201902/t20190220_417110.html),詳細記錄了歷年的入境旅游人數(shù)、來源分布、變化趨勢等數(shù)據(jù)。如表1所示。
1.2.1 ARIMA模型預測
自回歸滑動平均模型 ARIMA(p,d,q) 是研究時間序列的經(jīng)典預測模型,以自回歸模型(AR模型)與滑動平均模型(MA模型)為基礎,包括自回歸過程(AR)、滑動平均過程(MA)、自回歸滑動平均過程(ARMA)以及ARIMA過程。Eviews8是用以處理時間序列數(shù)據(jù)的時間序列軟件包。通過使用該軟件來進行ARIMA模型的預測及ADF檢驗、自相關與偏相關分析等。ARIMA模型的構建過程如下:
表1 北京市1978—2018年入境旅游人數(shù) 萬人次
1)檢驗時間序列數(shù)據(jù)的平穩(wěn)性。從原始時間序列data看,如圖1所示,數(shù)據(jù)上升趨勢明顯,但1989年、2003年受特定原因影響,旅游人數(shù)銳減,是顯著非平穩(wěn)序列。故先對1989年和2003年的數(shù)據(jù)進行異常值處理,以使研究真實有效進行。采用線性插值法得到1989年的入境旅游人數(shù)為110.2萬人次、2003年的入境旅游人數(shù)為312.9萬人次,更新原始時間序列。
2)確定階數(shù)d。
①對數(shù)變換,減小數(shù)據(jù)波動。進行對數(shù)運算seriesy=log(data),將原始序列data變換為具有線性趨勢的序列y,然后進行差分處理。
②差分運算,消除趨勢性。利用Eviews8軟件對時間序列數(shù)據(jù)y進行ADF檢驗,如圖2所示??梢钥闯?,ADF數(shù)值(-2.000 043)比下面的5% Test critical value(-3.526 609)數(shù)值大,表明接受存在一個單位根的原假設,序列數(shù)據(jù)是不平穩(wěn)序列數(shù)據(jù)。為得到其非平穩(wěn)的階數(shù)d,需要對其一階差分序列數(shù)據(jù)和二階差分序列數(shù)據(jù)進行ADF檢驗。
對y序列進行二階差分以后,ADF檢驗結果如圖3所示。ADF的數(shù)值為-4.124 047,小于1% Test critical value數(shù)值(-3.653 730),R-Squared值為 0.773 854,Durbin-Watson stat值為2.020 738,故可以拒絕單位根假設,表明經(jīng)過二階差分以后的序列y是平穩(wěn)序列,滿足ARIMA模型建模的基本要求。所以將ARIMA(p,d,q)模型中階數(shù)d確定為2。
3)模型的定階。在Eviews8對話框輸入seriesx=y-y(-2),生成經(jīng)過二階差分運算后的新序列x,從時間序列x圖形上看,其也是平穩(wěn)的序列,表明可以對時間序列x進行ARIMA模型分析。對新時間序列x分析自相關性與偏相關性,如圖4所示,進而得到ARIMA(p,d,q)模型中p,q階數(shù)。
分析可得,自相關1階截尾,故先設定q值等于1。針對原始時間序列data運用Eviews8嘗試不同的模型擬合,ARIMA(1,2,2)模型擬合結果如圖5所示。
4)模型的檢驗。利用Eviews8對建立的ARIMA(1,2,2)模型進行估計,由圖5可知,變量系數(shù)估計值均小于0.05,在5%顯著水平下均顯著。殘差分析結果如圖6所示,Q統(tǒng)計量的P值均大于0.05,并且ACF和PACF均沒有顯著異于零,表明殘差序列為白噪聲序列,ARIMA(1,2,2)模型的信息提取比較充分,整個模型擬合效果顯著有效。
5)預測。在Eviews8中選用“Forecast-Static forcast”方法對建立的ARMA(1,2,2)模型進行樣本內(nèi)預測,結果如圖7所示,Theil不相等系數(shù)為0.041 572,其中協(xié)方差比例為0.946 726,表明模型的預測結果比較理想,ARIMA模型預測具體數(shù)值見表2。
表2 基于ARIMA模型的北京市入境旅游人數(shù)預測值 萬人次
1.2.2 NARX 神經(jīng)網(wǎng)絡預測
按照北京市入境旅游人數(shù)的實際情況,創(chuàng)建3層 NARX 網(wǎng)絡模型,由一個輸入層、一個隱含層、一個輸出層組成。
1)數(shù)據(jù)的標準化處理及網(wǎng)絡訓練
利用式(1)對1978—2018年的北京市入境旅游人數(shù)統(tǒng)計數(shù)據(jù)進行標準化處理。
(1)
2)預測效果分析
利用NARX神經(jīng)網(wǎng)絡進行訓練,驗證集誤差在NARX神經(jīng)網(wǎng)絡訓練1次以后上升,表明訓練可以結束,數(shù)據(jù)集此時的誤差為0.003 997 6。
NARX神經(jīng)網(wǎng)絡預測效果可視化分析通過預測效果誤差圖進行。由圖8可見誤差線比較短。誤差自相關圖顯示:誤差在lag為0附近最大,其他情況均不超過置信區(qū)間,表明NARX神經(jīng)網(wǎng)絡預測效果較好,預測結果如表3所示。
表3 基于NARX神經(jīng)網(wǎng)絡的北京市入境旅游人數(shù)預測值 萬人次
兩種模型預測結果比較如圖9所示,從圖9中可以看出,這兩種模型都是有效的,但其差異并不明顯。
為了更好地反映兩種預測模型的有效性,按照預測結果評價準則,選用下列指標作為衡量指標。
①平均相對誤差絕對值(MMAPE),利用式(2)獲得。
(2)
②均方根誤差(RRMSE),利用式(3)獲得。
(3)
③均方百分比誤差(MMSPE),利用式(4)獲得。
(4)
表4 ARIMA和NARX模型產(chǎn)生的誤差
表4中的統(tǒng)計誤差測量結果說明了這兩種模型的預測效果。很明顯,NARX模型優(yōu)于ARIMA模型,從MAPE、RMSE、MSPE指標來看,使用NARX神經(jīng)網(wǎng)絡方法預測效果更好。
入境旅游是復雜的社會經(jīng)濟活動。本文將NARX神經(jīng)網(wǎng)絡與ARIMA模型應用到北京市入境旅游人數(shù)預測問題中,為北京市入境旅游人數(shù)預測的模型選擇提供參考,進而為北京市入境旅游產(chǎn)業(yè)布局提供決策依據(jù)。
NARX神經(jīng)網(wǎng)絡的應用,通過機器學習非線性的內(nèi)在影響規(guī)律,模擬預測效果更好。特殊年份應使用NARX神經(jīng)網(wǎng)絡進行預測。從比較結果可以看出,NARX神經(jīng)網(wǎng)絡因其具有一定的序列學習能力,總體誤差更小,可以提高入境旅游人數(shù)的預測精度。