孫玲 達舉霞
摘要:甘肅省有絕美的自然地貌和獨特的絲路文化,擁有許多天然草場,草原碧綠,湖泊清澈的夏季景觀,多樣的地貌,大漠的風光,本文運用大數據方法分析各個因素數據,找出決定性因素,對甘肅旅游市場現狀、旅游資源特色和未來發(fā)展趨勢進行了剖析,做出了預測指標,并評價深度學習方法、灰色神經網絡等機器學習技術在不同周期下對旅游需求建模與預測中產生的效果。
關鍵詞:大數據?灰色神經網絡?Topsis方法?甘肅旅游
中圖分類號:F832.51??????????文獻標識碼:A
Analysis?on?the?Current?Situation?of?Tourism?in?Gansu?Province?Based?on?Network?Big?Data?Modeling
SUN?Ling??DA?Juxia
(Lanzhou?Resources?&?Environment?Voc-Tech?University,?Lanzhou,?Gansu?Province,?730021?China)
Abstract:?Gansu??Province?has?beautiful?natural?landforms?and?unique?Silk?Road?culture,?and?has?many?natural?grasslands,?summer?landscapes?with?green?grasslands?and?clear?lakes,?diverse?landforms?and?desert?scenery.?This?paper?uses?the?method?of?big?data?to?analyze?the?data?of?various?factors?and?find?out?the?decisive?factors,??analyze?the?present?situation,?the?characteristics?of?tourism?resources?and?the?future?development?trend?of?the?tourism?market?in?Gansu?and?make?prediction?indexes,?and??evaluate?the?effects?of?machine?learning?techniques?such?as?deep?learning?methods?and?grey?neural?network?on?tourism?demand?modeling?and?prediction?in?different?periods.
Key?Words:?Big?data;??Grey?neural?network;?Topsis?method;?Tourism?in?Gansu
1??國內外研究的現狀和趨勢
旅游需求的研究,吸引了大量的來自不同學科的研究人員,鑒于準確預測動態(tài)和復雜的旅游市場的重要性,在過去幾十年中,相關研究者發(fā)表了600多篇有關旅游需求建模和預測的論文,這些研究主要集中在模型構建和性能評估上,其中一些研究提出了新穎的混合模型或者使用了多種方法的組合。目前,人們普遍認為,預測旅游需求的量化方法可分為三類,分別是時間序列模型,計量經濟學模型,人工智能(AI)的模型。
時間序列模型推斷感興趣的變量的過去模式來預測未來值,常用的方法有包括UCM模型,ARIMA模型,GARCH模型等。計量經濟學模型通過使用權威的解釋變量以提高預測精度,例如經濟指標,氣候溫度指標,大數據指標和市場情緒指標。一些前沿的計量經濟學技術應用于旅游預測建模包括時變參數、混合數據抽樣和貝葉斯模型等。隨著AI技術的發(fā)展,許多相關的方法被引入到旅游需求建模與預測。這些方法包括人工神經網絡方法,核極限學習方法,粗糙集模型和支持向量回歸等。在大數據時代,大數據已成為開發(fā)基于AI的預測模型的重要驅動力。傳統(tǒng)預測方法中使用的數據通常是自然聚合的,具有時滯。而來自谷歌趨勢、谷歌分析和百度索引等來源的搜索引擎數據已成為旅游需求預測的新數據源。
現有的旅游需求研究主要集中與于ARIMA模型的應用,但是ARIMA模型并不總是優(yōu)于其他模型,近期的研究表明,一些基于機器學習技術的人工智能方法在預測性能上優(yōu)于傳統(tǒng)的時間序列模型與計量經濟學模型。Pai等在香港和臺灣的旅游需求預測中發(fā)現支持向量機的性能優(yōu)于ARIMA模型。Claveria?等的研究同樣驗證了支持回歸向量回歸,高斯過程回歸和神經網絡模型均優(yōu)于傳統(tǒng)方法。由于國際旅游的研究相對較少。同時,國內外該領域的研究者大多使用經濟學和管理學的理論開展研究,很少有學者結合優(yōu)化算法對于模型參數估計的應用。隨著AI技術的興起,優(yōu)化算法在模型效率提升中起到了關鍵作用,將機器學習技術與優(yōu)化算法相結合也是未來研究的趨勢之一。
2??預備知識
采用參與式觀察、深度訪談、問卷調查等方法整理出近幾年旅游景點營業(yè)額相關數據,從歷史數據中提取影響旅游的特征信息,建立旅游評價模型,選擇甘肅省6個相對較大的旅游景點,建立旅游景點營業(yè)額的月預測模型,并通過歷史數據評價該模型。
對于數據分析,我們選擇考慮旅游景點的需求頻數、景點的需求量、景點的變化趨勢、景點門票四個特征,對于大大小小取284個旅游景點,計算這些景點在每個月的具體收益額,月平均收益額以及歷史周期內的總和。選擇適當的目標,建立景點相關信息庫。
對于景點選擇,基于得到的景點信息庫,選擇影響較大的一些指標賦予權重,建立評價模型,按模型評分從高到底的順序選擇6種相對較大的旅游景點。
對于預測模型,基于調查歷史數據的時序性及特征信息較少的特點,選擇基于AI方法的時間序列預測模型,以及歷史數據作為訓練集和測試集來檢驗模型的預測結果。
3??模型的假設
由于部分旅游景點的收益額會受特殊原因的影響,比如,近兩年疫情的影響歷史數據失效,我們可以考慮正常情況下的歷史數據。
4??模型的建立與求解
4.1?景點的評價指標
查看177個月期間的歷史數據,從旅游景點的需求頻數、景點的需求量、景點的變化趨勢、景點門票四個角度,建立評價指標來衡量各個景點的關注度。
4.1.1?景點的需求頻數
4.1.2?景點的需求量
為第?i?個景點的月平均需求量。
4.1.3?變化趨勢
對于景點的趨勢,考慮需求量的相對變化量,即對第?i?個景點,我們計算其每一個月與前一個月之間需求量的差值。建立趨勢矩陣
其中為第?i?個景點在第?j?個月相對于第?j-1?個月需求量的改變量,其中
同時規(guī)定,即初始階段第一個月的變化量記為?0。
4.1.4?景點門票
價格是衡量景點重要性的一個核心因素,它影響到購買門票時的資金準備。通過歷史數據發(fā)現,有一部分景點門票在不同需求下的銷售單價有波動,為了方便計算,取其平均值作為銷售單價。記為第?i?個旅游景點的銷售單價。
4.2?基于熵權法的?Topsis?模型
基于熵權法對?Topsis?模型是一種常用的綜合評價方法,能充分利用原始數據的信息,客觀進行權重幅值,其結果能客觀地反映各評價方案之間的差距。該方法的步驟如下:數據標準化;進行歸一化處理;計算每個指標的信息熵,并計算信息效用值,并歸一化得到每個指標;計算信息效用值(信息熵冗余度);計算指標的權重系數。
4.3?灰色神經網絡預測模型
灰色神經網絡的拓撲圖如下:
其中,t為輸入參數序號為網絡輸入參數;為網絡權值;為網絡預測值;LA、LB、LC、LD分別表示灰色神經網絡的四層。
灰色神經網絡的學習流程如下:
(1)根據訓練數據特征初始化網絡結構,初始化參數?a,b,并根據a,b的值計算u。
(2)根據網絡權值定義計算。
(3)對每一個輸入序列(t,y(t)),t=1,2,3,...,N,計算每層輸出。
(4)計算網絡預測輸出與期望輸出的誤差,并根據誤差調整權值和閾值。
(5)判斷訓練是否結束,若否,返回步驟?3。
5??模型求解
利用?Excel?軟件以及?Matlab?R2019a?軟件對附件數據進行量化分析,得到?284個大大小小的旅游景點在?177?個月內的景點需求頻數,景點需求量,景點需求變化量以及景點門票。將這?284?個旅游景點相關信息匯總,得到?284?種方案,每一種方案由一個向量表示,它指某個景點對應的統(tǒng)計信息。然后利用?Matlab?軟件,通過基于熵權法的?Topsis?方法,對上述?284?個方案進行評價,選取評分最高的六個景點作為重點關注的景點。
綜上,再結合圖2可以看出,通過基于熵權法的?Topsis?評價模型,選取出的景點綜合考慮了景點的頻數、門票的影響,并沒有表現出某種特性的數值集中于某一區(qū)間的特性,比需求量、變化率以及起對某一特性的數值倒序排列的方法,更具有合理性。?基于歷史數據,使用灰色神經網絡作為景點需求的月預測模型,將模型能夠很好地追蹤需求量的變化趨勢。
6??結語
該文以當前的相關研究成果為基礎,理論上,緊緊圍繞大數據與人工智能的時代背景,將機器學習方法引入到旅游之中,基于甘肅省各市州旅游市場發(fā)展的現狀,調研了影響旅游市場發(fā)展的因素,建立有效的預測指標體系,開發(fā)高精度的預測模型,對未來甘肅省旅游市場的發(fā)展趨勢進行了分析與預測。實踐上,利用機器學習技術構建的高效預測模型有助于甘肅省旅游市場的合理規(guī)劃,避免過度開發(fā)以及開發(fā)欠缺,降低旅游需求各種波動帶來的負面影響。
參考文獻
[1]?SONG?H,QIU?R?T?R,PARK?J.?A?Review?of?Research?on?Tourism?Demand?Forecasting[J].Annals?of?Tourism?Research,2019,75:338-362.
[2]?韋瑾.基于網絡文本的民族旅游體驗特征研究[J].中國市場,2021(14):122-125.
[3]?李瓊.?旅游大數據與挖掘分析研究[J].?當代旅游:下旬刊,2018(5):104-106.
[4]?GAO?Y.A?Study?on?the?Satisfaction?of?Practice?and?the?Willingness?to?Stay?in?the?Post?of?Students?in?Tourism?Management?Major?Based?on?Big?Data?Analysis[J],Journal?of?Physics?Conference?Series,2021,1744(3):032070.
[5]?王強進.?基于大數據分析的智慧旅游研究[D].長春:長春工業(yè)大學,2021.
[6]LIM?C,MCALEER?M.Time?Series?Forecasts?of?International?Travel?Demand?for?Australia[J].?Tourism?Management,2002,23(4):389-396.
[7]DU?PREEZ?J,?WITT?S?F.?Univariate?Multivariate?Time?Series?Forecasting:?An?Application?to?International?Tourism?Demand[J].?International?Journal?of?Forecasting,?2003,19(3):435-451.
[8]CHAN?F,LIM?C,MCALEER?M.?Modelling?Multivariate?International?Tourism?Demand?and?Volatility[J].?Tourism?Management,2005,26(3):459-471.
[9]SONG?H,WITT?S?F.?Forecasting?International?Tourist?Flows?to?Macau[J].?Tourism?management,2006,27(2):214-224.
[10]王小川,史峰,郁磊等.MATLAB神經網絡43個案例分析[M].北京:北京航空航天大學出版社,2013.
[11]胡運權.?運籌學基礎及應用[M].7版.北京:高等教育出版社,2021.
[12]GIORDANO?F?R,FOX?W?P,HORTON?S?B.數學建模[M].原書5版.北京:機械工業(yè)出版社,2014.