高孝成 范英兵 肖鈞瑩
(黑河學(xué)院,黑龍江 黑河 164300)
隨著我國的綜合國力和經(jīng)濟(jì)水平的提升,人民的經(jīng)濟(jì)水平也有了很大的提高,人均可支配收入也在隨之增加,因此,促進(jìn)了我國國內(nèi)旅游人次的飛速增長,在旅游方面的花費(fèi)越來越高,旅游行業(yè)的收入在不斷持續(xù)增長,促進(jìn)了旅游行業(yè)的持續(xù)發(fā)展。國內(nèi)旅游行業(yè)的展開,帶動了我國經(jīng)濟(jì)的飛速發(fā)展。目前,旅游業(yè)的發(fā)展為我國經(jīng)濟(jì)的增長作出了具大貢獻(xiàn),并且成為我國消費(fèi)人口最多、收入最高、發(fā)展最快的產(chǎn)業(yè)。因此,在發(fā)展旅游業(yè)時(shí),各個(gè)國家、各地區(qū)都需根據(jù)該地旅游市場的預(yù)測,合理的規(guī)劃旅游行業(yè)的發(fā)展路線及開拓市場的速度,以實(shí)現(xiàn)利益最大化。
本文選取了1994—2019年我國國內(nèi)旅游人次的數(shù)據(jù)為樣本進(jìn)行分析,數(shù)據(jù)都來源于中國統(tǒng)計(jì)年鑒,樣本總數(shù)為26。根據(jù)這些樣本,構(gòu)建時(shí)間序列模型,預(yù)測2020年國內(nèi)旅游人次。
2.2.1 數(shù)據(jù)平穩(wěn)性檢驗(yàn)平穩(wěn)化處理
我國國內(nèi)旅游人次數(shù)據(jù)整體有持續(xù)上升的趨勢,并不具有零均值的特點(diǎn),方差也是不斷變化的,能夠初步斷定國內(nèi)旅游人數(shù)的時(shí)間序列是不平穩(wěn)的,有一定的趨勢性不平穩(wěn)。二階差分后序列記為DDX,由圖1可知,原始數(shù)據(jù)進(jìn)過二階差分后,序列趨于穩(wěn)定。同時(shí)根據(jù)單位根的檢驗(yàn)結(jié)果可知,ADF的相伴概率值為0.000,在0.05水平以內(nèi),統(tǒng)計(jì)量的值為-8.021,在0.05置信水平以下,因而初步能夠判斷二階差分后的國內(nèi)旅游人次時(shí)間序列數(shù)據(jù)是穩(wěn)定的。
圖1 二階差分序列圖
2.2.2 時(shí)間序列模型識別與定階
圖 2 自相關(guān)與偏自相關(guān)序列圖
由圖2可知,自相關(guān)序列呈現(xiàn)出拖尾狀態(tài),偏自相關(guān)序列呈現(xiàn)出截尾狀態(tài),由此可初步判斷為AR(1)。為得到最優(yōu)的模型,可將模型假設(shè)為這樣MA(q)、AR(p)、ARIMA(p,d,q),p=1,2,3;q=1,2,3,之后對模型進(jìn)行擬合。
表1 AIC和BIC值
從表1可知,模型MA(1)的AIC、BIC值最小,所以,ARMA(1,3)模型是最優(yōu)的,可以根據(jù)此模型進(jìn)行我國國內(nèi)旅游人次的預(yù)測,此時(shí)的數(shù)據(jù)是經(jīng)過對原始數(shù)據(jù)二階差分得到的,d=2,此時(shí)ARIMA(1,2,3)為最優(yōu)模型。
2.2.3 時(shí)間序列模型的參數(shù)估計(jì)
ARIMA(1,2,3)模型參數(shù)估計(jì)結(jié)果,如表2所示。
表2 參數(shù)估計(jì)值
2.2.4 時(shí)間序列模型精確度檢驗(yàn)
將最終確定下來的最優(yōu)模型進(jìn)行適應(yīng)性的檢驗(yàn),殘差自相關(guān)函數(shù)滿足 ,殘差自相關(guān)檢驗(yàn)表明ARMA(1,2,3)模型是合適的。同理 檢驗(yàn)表明ARIMA(1,2,3)模型是合適的。如圖3可知,2005年、2011年預(yù)測的誤差較大,整體的擬合效果較好。
圖3 真實(shí)值與擬合值圖
2.3.1 單因素支持向量機(jī)模型
本文選取1994—2019年國內(nèi)旅游人數(shù)數(shù)據(jù),利用python軟件構(gòu)建SVM模型進(jìn)行預(yù)測,1994—2000年國內(nèi)旅游人數(shù)數(shù)據(jù)為訓(xùn)練樣本,詳細(xì)的運(yùn)行過程是采用前五年的樣本數(shù)據(jù),預(yù)測下一年的國內(nèi)旅游人數(shù)的方法;以1999—2003年的樣本數(shù)據(jù)來預(yù)測2004年的國內(nèi)旅游人數(shù)。罰常數(shù)、核函數(shù)參數(shù)及不敏感損失函數(shù)參數(shù),即:C=10 000, =10。用優(yōu)化參數(shù)后的模型,擬合原始數(shù)據(jù),python輸出結(jié)果整理見表3和圖4。
由下頁表3可知,SVM預(yù)測的誤差較小,均在0.1%上下浮動,說明單因素SVM模型達(dá)到了高精度的標(biāo)準(zhǔn),模型擬合效果較好。
圖4 擬合效果圖
由圖4擬合效果圖,紅色線代表預(yù)測值,綠色線代表真實(shí)值,達(dá)到了很好地?cái)M合效果。
2.3.2 組合模型預(yù)測
其中eit——第i各模型第t個(gè)樣本的誤差,N——模型個(gè)數(shù)為N[3]。
由(1)計(jì)算可得出最優(yōu)加權(quán)系數(shù)k1=0.00850,k2=0.99149因此可得到組合模型如下:
y1代表ARIMA模型的預(yù)測值,y2代表SVM模型的預(yù)測值,ARIMA模型預(yù)測2020年國內(nèi)旅游人次為6 496.251萬,SVM模型預(yù)測的結(jié)果為6 605.324萬。將ARIMA模型和SVM模型的預(yù)測結(jié)果帶入上式可得到組合模型的預(yù)測值,如下頁表3所示。
將三種模型的預(yù)測效果進(jìn)行對比,下頁表3為三種模型預(yù)測的相對誤差值,由相對誤差值的大小可以看出,組合模型的預(yù)測效果最好精度最高。預(yù)測精度較低的模型是ARMA模型,誤差較大。
表3 模型預(yù)測相對誤差對比
根據(jù)本文研究得出以下結(jié)論:
支持向量機(jī)與時(shí)間序列組合模型預(yù)測2020年國內(nèi)旅游人次為6 604.396 6萬。
組合模型是國內(nèi)旅游人次預(yù)測的最好模型。組合模型結(jié)合了ARIMA模型的短期預(yù)測和SVM 模型能解決各個(gè)影響因素實(shí)際存在的時(shí)間累積效應(yīng),組合模型的精度是最高的,能夠很好的應(yīng)用于國內(nèi)旅游人次的預(yù)測。
SVM模型的預(yù)測效果要優(yōu)于ARIMA模型,由于國內(nèi)旅游人數(shù)時(shí)間序列數(shù)據(jù)是非平穩(wěn)的,有一定的趨勢性,因此SVM模型更加適合研究此問題,得出的誤差較小。
ARMA模型以傳統(tǒng)時(shí)間序列自相關(guān)分析為基礎(chǔ)的,以現(xiàn)在值和過去值推測未來的值,短期的預(yù)測結(jié)果精確度較高,但隨著時(shí)間的推移,誤差就會逐漸變大,難以達(dá)到很好的模擬效果,因此,在對國內(nèi)旅游人數(shù)進(jìn)行預(yù)測時(shí)不適合使用ARMA模型。
根據(jù)國內(nèi)旅游人次數(shù)據(jù)可以得出,我國國內(nèi)旅游人次數(shù)據(jù)是非平穩(wěn)的,呈現(xiàn)出持續(xù)增長的狀態(tài),因此我國國內(nèi)旅游市場的規(guī)模也會被不斷壯大,人均旅游消費(fèi)以及我國旅游行業(yè)的收入都將會有大幅度的提升,正符合了我國對旅游行業(yè)的支持及經(jīng)濟(jì)結(jié)構(gòu)的調(diào)整,預(yù)測結(jié)果較為可靠。