張斌儒,王 浩,張超鋒,胡 蓉
(四川文理學(xué)院數(shù)學(xué)與財經(jīng)學(xué)院,四川達州635000)
?
①基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游需求預(yù)測研究進展
張斌儒,王浩,張超鋒,胡蓉
(四川文理學(xué)院數(shù)學(xué)與財經(jīng)學(xué)院,四川達州635000)
摘要:準(zhǔn)確預(yù)測旅游需求對旅游管理者和決策者分配有限的資源并制定科學(xué)的定價策略十分重要.對2009年以后基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游需求預(yù)測相關(guān)文獻進行評述.結(jié)論顯示,與基準(zhǔn)模型相比,加入網(wǎng)絡(luò)搜索數(shù)據(jù)的模型能顯著提高預(yù)測精度,并對將來進一步研究進行展望.
關(guān)鍵詞:網(wǎng)絡(luò)搜索;旅游需求;預(yù)測精度
0引言
隨著經(jīng)濟的增長,旅游需求呈現(xiàn)巨大的增長趨勢,特別是國家法定節(jié)假日的實施使得旅游市場潛力巨大.旅游需求的周期性和不確定性也給旅游管理者提出了挑戰(zhàn).一方面,短期內(nèi)迅速增長的旅游流不但對景區(qū)和航班等造成巨大的負擔(dān),旅游飯店的接待能力面臨巨大的考驗.另一方面,非假期客流驟減,這可能導(dǎo)致部分航班座位空缺,旅游飯店客房閑置,酒店入住率低等情況,使得資源不能得到有效的利用.因此,有必要對旅游需求進行更為精確的短期預(yù)測,以最大程度降低各種風(fēng)險和不確定性事件的發(fā)生,同時有利于旅游管理者進行科學(xué)決策.
為探究旅游需求建模與預(yù)測方法的研究進展,我們在谷歌學(xué)術(shù)、ScienceDirect、知網(wǎng)等數(shù)據(jù)庫上進行了文獻搜索,搜索的時間跨度為2009年1月到2015年3月.刪除重復(fù)文獻滯后識別出與網(wǎng)絡(luò)搜索數(shù)據(jù)相關(guān)的旅游需求建模與預(yù)測相關(guān)的20篇文獻.2008年以前很多學(xué)者對旅游需求預(yù)測相關(guān)的文獻進行了評述,包括Law 等(2007),[1]Crouch(1994),[2]Li等(2005),[3]Song和 Li(2008).[4]他們的主要工作集中在對模型和預(yù)測方法的評述上,本文主要對2009年以后利用網(wǎng)絡(luò)搜索數(shù)據(jù)進行旅游需求預(yù)測相關(guān)的文獻進行評述,從中識別出研究空白,為將來進一步研究提供必要的指導(dǎo).
1研究方法與進展
1.1傳統(tǒng)預(yù)測方法
在經(jīng)典文獻中學(xué)者主要采用兩類方法進行旅游需求預(yù)測.第一類為時間序列或統(tǒng)計的方法,[5]比如線性回歸,指數(shù)平滑法以及自回歸模型.第二類主要包括人工智能的方法,比如人工神經(jīng)網(wǎng)絡(luò),灰色理論,遺傳算法,蒙特卡洛模擬等方法.[6-8]傳統(tǒng)的時間序列模型以及相關(guān)模型發(fā)展很成熟并且廣泛應(yīng)用于旅游需求預(yù)測,其預(yù)測能力優(yōu)于其他方法.計算機技術(shù)的飛速發(fā)展促進了人工智能方法在旅游需求中的應(yīng)用.當(dāng)預(yù)測變量與被預(yù)測變量之間的關(guān)系為非線性的時候,神經(jīng)網(wǎng)絡(luò)法非常有用.近幾年也有學(xué)者利用支持向量回歸、隨機森林等方法預(yù)測旅游需求.[9]
盡管如此,這些預(yù)測方法有其局限性.首先,時間序列和統(tǒng)計分析方法依賴于一致的歷史模式和穩(wěn)定的經(jīng)濟結(jié)構(gòu).一旦發(fā)生劇烈的經(jīng)濟結(jié)構(gòu)突變甚至大規(guī)模的一次性事件可能會降低模型的預(yù)測能力,況且歷史數(shù)據(jù)的發(fā)布具有一定的滯后性.其次,人工智能方法復(fù)雜費時費力,并且需要大量的訓(xùn)練數(shù)據(jù).因此,有必要引進更有預(yù)測能力的預(yù)測變量來克服其缺陷.
1.2利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測社會經(jīng)濟活動
截至2014年6月,我國搜索引擎用戶規(guī)模達50749萬人,網(wǎng)民使用率為80.3%,是中國網(wǎng)民的第二大互聯(lián)網(wǎng)應(yīng)用;同時手機搜索引擎用戶規(guī)模達40583萬人,手機網(wǎng)民使用率達到77%,是除手機即時通信以外的第二大手機應(yīng)用(中國國家旅游局旅游統(tǒng)計).因此,隨著信息技術(shù)的發(fā)展以及互聯(lián)網(wǎng)的普及,網(wǎng)民會在搜索引擎上搜索相關(guān)信息,他們在互聯(lián)網(wǎng)上的各種行為產(chǎn)生了豐富的數(shù)據(jù),我們可以通過各種手段對這些數(shù)據(jù)進行追蹤,從而產(chǎn)生了新的研究方向:基于網(wǎng)絡(luò)搜索數(shù)據(jù)對經(jīng)濟活動等進行預(yù)測.
事實上,搜索引擎數(shù)據(jù)已經(jīng)被應(yīng)用于商業(yè),金融,經(jīng)濟等預(yù)測領(lǐng)域.Choi 和 Varian(2009)通過實證表明谷歌查詢數(shù)據(jù)對預(yù)測美國汽車銷量,住房銷售以及旅游趨勢等方面有很大的價值.[10]由于Choi 和 Varian在2009年所做的開創(chuàng)性工作,Ginsberg等(2009)利用搜索引擎數(shù)據(jù)進行流行病預(yù)測,他們的預(yù)測模型能夠提前兩周探測到流行病爆發(fā).[11]網(wǎng)絡(luò)搜索數(shù)據(jù)也能用于一般的經(jīng)濟活動預(yù)測,比如失業(yè)率預(yù)測,[12]消費預(yù)測以及電影票房預(yù)測等.[13,14]學(xué)者們的探索有力證實了網(wǎng)絡(luò)搜索數(shù)據(jù)在預(yù)測各種經(jīng)濟活動的價值.
1.3利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測旅游需求
近幾年,一些學(xué)者利用網(wǎng)絡(luò)搜索數(shù)據(jù)進行旅游需求預(yù)測,被預(yù)測變量包括景區(qū)客流、飯店接待人數(shù)、酒店入住率等.比如Choi 和 Varian (2012)應(yīng)用谷歌趨勢數(shù)據(jù)預(yù)測來自9個不同國家的來港游客量.通過將網(wǎng)絡(luò)搜索數(shù)據(jù)引入到自回歸(AR)模型,他們發(fā)現(xiàn)模型能得到好的擬合度,預(yù)測精度很高.[15]Pan等(2012)使用谷歌搜索查詢數(shù)據(jù)預(yù)測美國查爾斯頓旅游需求.他們通過引入與旅游目的地相關(guān)的查詢數(shù)據(jù)到帶有外生變量的自回歸移動平均模型(ARMAX),預(yù)測結(jié)果表明引入搜索引擎數(shù)據(jù)降低了平均絕對百分比誤差(MAPE),對預(yù)測客房需求有著顯著的貢獻.[16]Yang等(2015)利用搜索引擎查詢數(shù)據(jù)預(yù)測了中國旅游目的地海南的游客流量,比較了谷歌趨勢和百度指數(shù)的預(yù)測能力.結(jié)果顯示,對于中國來說,百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)具有更好的預(yù)測精度.在該文中作者使用了四階段過程進行關(guān)鍵詞選擇與過濾,并使用綜合加權(quán)法進行了指數(shù)合成,遺憾的是沒有說明合成指數(shù)是否最具有預(yù)測能力.[17]
預(yù)測酒店接待人數(shù)和酒店入住率十分重要,精確預(yù)測對酒店管理者分配有限的資源和制定定價策略十分重要(Weatherford and Kimes 2003).[6]Pan(2012)引入谷歌周度搜索數(shù)據(jù)預(yù)測酒店客房需求,結(jié)論認(rèn)為谷歌搜索數(shù)據(jù)能提高預(yù)測精度,而谷歌搜索數(shù)據(jù)所需成本很低.[16]Yang等(2014)應(yīng)用目的地營銷組織的網(wǎng)絡(luò)流量數(shù)據(jù)預(yù)測該目的地的酒店需求,結(jié)果顯示與基準(zhǔn)模型相比,基于ARMAX的模型預(yù)測精度得到了顯著提高.[18]
國內(nèi)學(xué)者在該領(lǐng)域也做了探索性的研究.黃先開等(2014)以北京故宮為例,探討了百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)與景區(qū)游客量之間的關(guān)系,并對景區(qū)游客量進行預(yù)測,結(jié)果表明加入百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)能提高模型的預(yù)測精度.[19]王煉和賈建明(2014)結(jié)合黃金周期間景區(qū)的游客數(shù)據(jù)和網(wǎng)絡(luò)搜索數(shù)據(jù),探討了網(wǎng)絡(luò)搜索數(shù)據(jù)在旅游需求預(yù)測中的作用.實證結(jié)果顯示兩者之間存在正相關(guān)關(guān)系,相對于基準(zhǔn)模型,基于網(wǎng)絡(luò)搜索數(shù)據(jù)的模型能顯著提高旅游需求預(yù)測的精度.[20]任樂和崔東佳(2014)以北京市國內(nèi)游客流量為例,揭示了網(wǎng)絡(luò)搜索數(shù)據(jù)與游客之間的相關(guān)關(guān)系.誤差修正模型表明加入網(wǎng)絡(luò)搜索數(shù)據(jù)有效提高了預(yù)測精度.[21]張斌儒等(2015)利用百度指數(shù)提供的關(guān)鍵詞數(shù)據(jù)預(yù)測海南省月度旅游收入,與基準(zhǔn)模型相比,提高了預(yù)測精度.[22]Prosper 和 Ryan (2015)基于谷歌搜索數(shù)據(jù)利用混合頻率抽樣回歸對加勒比海地區(qū)的旅游需求進行了預(yù)測,結(jié)果顯示預(yù)測精度顯著提高.[24]
從以上文獻我們可以看出:與傳統(tǒng)預(yù)測方法相比,引入網(wǎng)絡(luò)搜索數(shù)據(jù)作為預(yù)測變量能得到更為精確的預(yù)測,但基于網(wǎng)絡(luò)搜索數(shù)據(jù)的預(yù)測仍然在探索階段,主要體現(xiàn)在關(guān)鍵詞的選擇與過濾方面、指數(shù)合成方法以及模型選擇等.
2結(jié)論與展望
2.1數(shù)據(jù)頻率
學(xué)者主要使用周度或月度搜索數(shù)據(jù),較少使用日度數(shù)據(jù).事實上,大多學(xué)者使用了季度或月度數(shù)據(jù),因為這些數(shù)據(jù)可獲得性強.而更高頻率的數(shù)據(jù)的優(yōu)點是能為旅游需求趨勢提供實時性的信息.盡管如此,大多研究中使用搜索數(shù)據(jù)預(yù)測旅游需求會產(chǎn)生兩個問題.首先,更高頻率的數(shù)據(jù)很難獲得.其次,在某些情況下,我們可能面臨多頻率或混合頻率問題( Fondeur and Karamé(2013)).[23]處理混合頻率的一般方法都是將高頻率數(shù)據(jù)簡單轉(zhuǎn)化為低頻率問題,比如平均加權(quán)的方法(Choi and Varian (2012)).[15]然而,這種處理方法會導(dǎo)致高頻數(shù)據(jù)信息的損失.在文獻中,只有Prosper & Ryan (2015) 使用了宏觀經(jīng)濟研究中常用的混合頻率數(shù)據(jù)處理方法.[24]其實質(zhì)是對數(shù)據(jù)進行更為一般的加權(quán)轉(zhuǎn)換.
2.2關(guān)鍵詞選擇與指數(shù)合成
一般來說,不同的關(guān)鍵詞具有不同的搜索頻率,用于模型預(yù)測會得到不同的結(jié)果.所以關(guān)鍵詞的選擇與指數(shù)合成對模型的預(yù)測精度極為重要.盡管如此,如何從成千上萬的關(guān)鍵詞中進行關(guān)鍵詞選擇沒有一個系統(tǒng)的方法.大多數(shù)研究使用人工隨機選擇十余個關(guān)鍵詞作為預(yù)測變量.Choi 和 Varian (2009) 搜索關(guān)鍵詞“假期目的地/香港”是由于“香港”被收錄到谷歌趨勢里面的假期目的地的子類別中.[10]Yang 等 (2015) 利用四階段關(guān)鍵詞選擇步驟對百度指數(shù)和谷歌趨勢數(shù)據(jù)進行關(guān)鍵詞選擇,最后得到合成指數(shù)的關(guān)鍵詞.[17]但該方法得到的關(guān)鍵詞是否最具預(yù)測能力沒有說明.
2.3研究空白與展望
從上述文獻中可以識別出一些研究空白.首先,目前大多使用百度指數(shù)和谷歌趨勢數(shù)據(jù)進行旅游需求預(yù)測,除此之外,我們可以將數(shù)據(jù)來源擴展到博客、微博等利用大數(shù)據(jù)方法進行研究,探索這些數(shù)據(jù)對旅游需求的影響并分析游客的行為或進行旅游需求預(yù)測.大數(shù)據(jù)能夠彌補調(diào)查數(shù)據(jù)對象的抽樣問題的缺陷.使用大數(shù)據(jù)集能進一步提高預(yù)測精度和時效性以及模擬游客的活動,幫助旅游從業(yè)者更好的進行管理.其次,我們可以探索系統(tǒng)動態(tài)的關(guān)鍵詞選擇與合成方法,使得更為符合實際應(yīng)用,預(yù)測能力更強.第三,目前利用支持向量回歸進行旅游需求預(yù)測主要大多建立單變量的模型,在引入關(guān)鍵詞數(shù)據(jù)之后,可以考慮利用多變量的支持向量回歸模型進行旅游需求預(yù)測.第四,大多旅游需求時間序列具有周期性和季節(jié)性的特征,在預(yù)測時選擇合適的方法進行季節(jié)調(diào)整會增加預(yù)測精度.最后,可以利用大數(shù)據(jù)集探索旅游周期、預(yù)警研究、拐點等主題.總之,與基準(zhǔn)模型相比,如何建立模型進行更為精確的預(yù)測對學(xué)者來說是一種挑戰(zhàn).
參考文獻:
[1]Law,R.,Mok,H.and Goh,C.Data Mining in Tourism Demand Analysis:A Retrospective Analysis[M].Berliu:Springer-Verlag,2007:508-515.
[2]Crouch,G.I.The study of international tourism demand:A review of practice[J].Journal of Travel Research,1994(33):41-54.
[3]Li,G.,Song,H.,& Witt,S.F.Recent developments in econometric modeling and forecasting[J].Journal of Travel Research,2005(44):82-99.
[4]Song,H.,and G.Li.Tourism Demand Modelling and Forecasting:A Review of Recent Research[J].Tourism Management,2008(2):203-209.
[5]Song H Y,Witt S.Tourism demand modeling and forecasting[M].Oxford:Pergamon Press,2000:73-74.
[6]Weatherford,L.R.,S.E.Kimes.A comparison of forecasting methods for hotel revenue management[J].International Journal of Forecasting,2003(3):401-415.
[7]Abratt,R.,Nel,D.,Nezer,C.Role of the market maven in retailing-a general marketplace influencer[J].Journal of Business and Psychology,1995(1):31-55.
[8]Andrew W P,Cranage D A,Lee C K.Forecasting hotel occupancy rates with time series models:An empirical analysis[J].Journal of Hospitality & Tourism Research,1990(2):173-182.
[9]Tsaur,R.,Chan,S.Gray support vector regression model with applications to china tourists forecasting in Taiwan[J].international journal of information and management sciences,2014,(25):121-137.
[10]Choi,H.and Varian,H.A.L.Predicting thepresent with Google Trends[J].Economic Record,2009(88):2-9.
[11]Ginsberg,Jeremy,Matthew H.Mohebbi,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009(32):1012-1014.
[12]Askitas,N.,Zimmermann,K.Google econometrics and unemployment forecasting[J].Applied Economics Quarterly,2009(2):107-120.
[13]McLaren,N.,Shanbhogue,R.Using internet search data as economic indicators[J].Bank of England Quarterly Bulletin.2011(2),134-140.
[14]Hand,C.,Judge,G.Searching for the picture:Forecasting UK cinema admissions using google trends data[J].Applied Economics Letters,2012(11),1051-1055.
[15]Choi,H.,Varian,H.Predicting present with google trends[J].Economic Record,2012(S1):2-9.
[16]Pan,B.,D.C.Wu,H.Song.Forecasting hotel room demand using search engine data[J].Journal of Hospitality and Tourism Technology,2012(3):196-210.
[17]Yang X,Pan B,James A,et al.Forecasting chinese tourist volume with search engine data[J].Tourism Management,2015(46):386-397.
[18]Yang,Y.,Pan,B.,Song,H.Predicting hotel demand using destination marketing organization’S web traffic data[J].Journal of Travel Research.2014(5):1-15.
[19]黃先開,張麗峰,丁于思.百度指數(shù)與旅游景區(qū)游客量的關(guān)系及預(yù)測研究[J].旅游學(xué)刊,2013(11):93-101.
[20]王煉,賈建明.基于網(wǎng)絡(luò)信息搜索的旅游需求預(yù)測-來自黃金周的證據(jù)[J].系統(tǒng)管理學(xué)報,2014(3):345-350.
[21]任樂,崔東佳.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的國內(nèi)旅游客流量預(yù)測研究-以北京市國內(nèi)旅游客流量為例[J].經(jīng)濟問題探索,2014(4):67-73.
[22]張斌儒,黃先開,劉樹林.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游收入預(yù)測-以海南為例[J],經(jīng)濟問題探索,2015.
[23]Fondeur,Y.and F.Karamé.Can Google data help predict French youth unemployment?[J].Economic Modelling ,2013(30):117-125.
[24]Prosper F.Bangwayo-Skeete,Ryan W.Skeete.Can Google data improve the forecasting performance of tourist arrivals?Mixed-data sampling approach[J].Tourism Management,2015(46):454-464.
[責(zé)任編輯范藻]
Tourism Demand Forecasting Based on Web Search Query
ZHANG Binru,WANG Hao,ZHANG Chaofeng,HU Rong
(Mathematics and Finance-Economics School of Sichuan University of Arts and Sciences,Dazhou Sichuan 635000,China)
Abstract:The accurate prediction of the future tourism demand is critical to allocating limited resources and scientific decision-making for tourism manager and decision maker.A large number of review articles related to tourism demand modeling and forecasting have been conducted before 2008.This article mainly aims to review the published papers on tourism demand modeling and forecasting since 2009.The results showed that forecasting model with web search query data can improve forecasting accuracy compared to baseline model,and offer some prospects for further research in the future.
Key words:web search query; tourism demand; forecasting accuracy
收稿日期:①2015-07-01
基金項目:四川革命老區(qū)發(fā)展研究中心2014年度項目“紅色旅游對區(qū)域經(jīng)濟發(fā)展的影響及策略研究—以達州市張愛萍故居為例”(SLQ2014C-17)
作者簡介:張斌儒(1980—),男,四川南江人.講師,博士研究生,主要從事旅游經(jīng)濟與數(shù)量經(jīng)濟研究.
中圖分類號:F590
文獻標(biāo)志碼:A
文章編號:1674-5248(2016)02-0041-04