鄭蕙 李慶玲
基金項(xiàng)目:湖南省自然科學(xué)基金項(xiàng)目(青年基金)“基于網(wǎng)絡(luò)數(shù)據(jù)驅(qū)動(dòng)的景區(qū)客流遷移建模與預(yù)測(cè)研究”(基金號(hào):2018JJ3259);教育部產(chǎn)學(xué)研協(xié)同育人項(xiàng)目“數(shù)字孿生技術(shù)在旅游數(shù)據(jù)中心應(yīng)用與人才培養(yǎng)實(shí)踐(2020年第一批次)”。
21世紀(jì)后,我國(guó)旅游業(yè)開(kāi)始邁入大眾化旅游時(shí)代,中國(guó)旅游市場(chǎng)更加蓬勃發(fā)展,中國(guó)成為世界最大的國(guó)內(nèi)旅游市場(chǎng)、世界第一大國(guó)際旅游消費(fèi)國(guó)、世界第四大旅游目的地國(guó)家,呈現(xiàn)出“國(guó)內(nèi)旅游市場(chǎng)高速發(fā)展、入出境市場(chǎng)平穩(wěn)發(fā)展”的態(tài)勢(shì)。使用搜索引擎查詢(xún)、規(guī)劃旅游行程已經(jīng)成為越來(lái)越多人的選擇,并進(jìn)行了大量實(shí)證研究。國(guó)外利用網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè)的歷史最早可以追溯至2009年,研究者們通過(guò)對(duì)谷歌記錄的大量網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)進(jìn)行分析,構(gòu)建出基于谷歌搜索數(shù)據(jù)的監(jiān)測(cè)模型。國(guó)內(nèi)對(duì)于利用網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)進(jìn)行研究的起步相對(duì)較晚,也逐步建立了百度指數(shù)旅游相關(guān)數(shù)據(jù)與熱點(diǎn)旅游城市客流量之間的數(shù)據(jù)模型,成功預(yù)測(cè)景區(qū)客流量??偨Y(jié)國(guó)內(nèi)外的文獻(xiàn)后,可以看出雖然利用搜索引擎提供的網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)進(jìn)行學(xué)術(shù)研究的起步較晚,但是已經(jīng)發(fā)展得較為成熟,不僅相關(guān)研究數(shù)量眾多,更涵蓋了多個(gè)領(lǐng)域,其研究結(jié)果在多個(gè)領(lǐng)域得到了證實(shí),具有一定的實(shí)踐意義。
本文確定旅游六要素“吃、住、行、游、購(gòu)、娛”關(guān)鍵詞的取詞范圍,將關(guān)鍵詞地域限定于湖南省長(zhǎng)沙市,取“美食、住宿、地圖、旅游、特產(chǎn)、景點(diǎn)”為基準(zhǔn)關(guān)鍵詞,并在此基礎(chǔ)上加入“天氣”這一對(duì)旅游活動(dòng)重大影響的延伸關(guān)鍵詞,在基準(zhǔn)關(guān)鍵詞下拓展了“岳麓山”“橘子洲”“湖南省博物館”“長(zhǎng)沙工藝品”“長(zhǎng)沙臭豆腐”等一共12個(gè)關(guān)鍵詞數(shù)據(jù),借助百度指數(shù)查詢(xún)與長(zhǎng)沙市相關(guān)的旅游方面的關(guān)鍵詞,作為網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),查詢(xún)、統(tǒng)計(jì)、分析相關(guān)數(shù)據(jù)的搜索指數(shù)。通過(guò)查詢(xún)2008—2018年長(zhǎng)沙市統(tǒng)計(jì)局官網(wǎng)發(fā)布的多篇《長(zhǎng)沙統(tǒng)計(jì)年鑒》可知此期間長(zhǎng)沙市實(shí)際接待國(guó)內(nèi)游客數(shù)量的年度數(shù)據(jù),用Y表示,詳細(xì)數(shù)據(jù)如表1所示。
本文通過(guò)百度指數(shù)平臺(tái)收集了2008年1月1日—2018年12月31日范圍內(nèi)12個(gè)網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)的年度搜索指數(shù)。受平臺(tái)數(shù)據(jù)影響,2008年1月1日—2010年12月31日的搜索數(shù)據(jù)僅限于PC趨勢(shì)數(shù)據(jù),2011年1月1日以后數(shù)據(jù)為綜合搜索指數(shù)數(shù)據(jù)。在對(duì)前文提到的12個(gè)網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)進(jìn)行加總處理后,將美食、住宿、地圖、旅游、特產(chǎn)、景點(diǎn)、天氣、岳麓山、橘子洲、湖南省博物館、工藝品、臭豆腐12個(gè)關(guān)鍵詞分別記為X1,X2,X3,…,X11,X12,得到網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)。
通過(guò)SPSS進(jìn)行Pearson相關(guān)系數(shù)分析,對(duì)前文提到的網(wǎng)絡(luò)搜索指標(biāo)數(shù)據(jù)與長(zhǎng)沙市實(shí)際國(guó)內(nèi)游客數(shù)量進(jìn)行相關(guān)性分析(見(jiàn)表2)。Pearson相關(guān)系數(shù)有衡量線性關(guān)聯(lián)性程度的功能,相關(guān)系數(shù)的絕對(duì)值大小體現(xiàn)了變量之間的相關(guān)性強(qiáng)弱,相關(guān)系數(shù)的絕對(duì)值越大,相關(guān)性越強(qiáng)。相關(guān)系數(shù)越大,說(shuō)明網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)變化趨勢(shì)與長(zhǎng)沙實(shí)際國(guó)內(nèi)游客量變化相似程度之間越接近且相似。
將X記作網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),Xi(i= 1,2,3,……,n)記作時(shí)間序列數(shù)據(jù),用以表示每一年的網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),X—為網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),每年數(shù)據(jù)的平均值數(shù)據(jù),Y記作長(zhǎng)沙市年度實(shí)際國(guó)內(nèi)游客數(shù)量,Yi(i=1,2,3,……,n)記作時(shí)間序列數(shù)據(jù),Y—
記作Y每年數(shù)值的平均值數(shù)據(jù),rXY記作X、Y的Pearson相關(guān)系數(shù)。rXY絕對(duì)值越大,表示X與Y之間的相關(guān)性則越強(qiáng),rXY為正時(shí),X與Y之間為正相關(guān),反之則相反。0.8~1.0極強(qiáng)相關(guān);0.6~0.8強(qiáng)相關(guān);0.4~0.6中度程度相關(guān);0.2~0.4弱相關(guān),但相關(guān)系數(shù)的取值總是在-1.0~1.0。顯著性記為sig,sig=0.000說(shuō)明顯著性水平p值小于0.001,即相關(guān)系數(shù)在0.001水平顯著,水平越小,判定顯著性的證據(jù)就越充分。數(shù)據(jù)說(shuō)明,選定的網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)與長(zhǎng)沙市國(guó)內(nèi)游客量具有一定的相關(guān)性,相關(guān)系數(shù)越高則相關(guān)性越強(qiáng),相關(guān)系數(shù)可在一定程度上反應(yīng)長(zhǎng)沙市國(guó)內(nèi)游客量狀況;景點(diǎn)(X6)、特產(chǎn)(X5)、橘子洲(X9)占據(jù)相關(guān)系數(shù)的前三,呈現(xiàn)出極強(qiáng)的相關(guān)關(guān)系;工藝品(X11)、地圖(X3)相關(guān)系數(shù)為負(fù),說(shuō)明這2項(xiàng)數(shù)據(jù)與長(zhǎng)沙市國(guó)內(nèi)游客量相關(guān)性極弱,難以從這兩項(xiàng)數(shù)據(jù)判斷長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量。
本文采用主成分-逐步回歸分析法,結(jié)合長(zhǎng)沙市2008—2018年國(guó)內(nèi)游客數(shù)量數(shù)據(jù)以及根據(jù)百度指數(shù)搜索總結(jié)得出網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),進(jìn)行數(shù)據(jù)分析后建立預(yù)測(cè)模型,利用長(zhǎng)沙市2019年實(shí)際國(guó)內(nèi)游客數(shù)量數(shù)據(jù)對(duì)預(yù)測(cè)模型進(jìn)行檢驗(yàn),證明網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)與長(zhǎng)沙市實(shí)際國(guó)內(nèi)游客數(shù)量有相關(guān)關(guān)系,且能夠基于網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)預(yù)測(cè)游客數(shù)量,利用ARIMA預(yù)測(cè)模型對(duì)長(zhǎng)沙市未來(lái)5年內(nèi)的國(guó)內(nèi)游客數(shù)量計(jì)算預(yù)測(cè)值,做出2008—2024年長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量變化趨勢(shì)圖,并進(jìn)行相關(guān)分析。
(一)主成分分析
主成分分析指多個(gè)指標(biāo)經(jīng)過(guò)降維處理后轉(zhuǎn)化成少數(shù)幾個(gè)綜合指標(biāo)的方法,利用主成分分析能夠達(dá)到在確保數(shù)據(jù)信息損失最小的原則下,達(dá)到壓縮指標(biāo)個(gè)數(shù)、簡(jiǎn)化數(shù)據(jù)的目的。降維處理后的綜合變量依舊保留原始變量的眾多信息,且能夠使變量之間互不相關(guān)。本文一共收集了12個(gè)網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),由于原數(shù)據(jù)之間具有一定的相關(guān)關(guān)系,為了避免具有相關(guān)關(guān)系的變量數(shù)據(jù)太多而導(dǎo)致研究結(jié)果的信息重疊,本文將通過(guò)主成分分析處理原先的所有變量數(shù)據(jù),根據(jù)比較影響系數(shù)大小,得出綜合變量數(shù)據(jù)。
(二)逐步回歸分析
回歸分析是進(jìn)一步檢測(cè)變量之間相互依賴(lài)關(guān)系程度的一種統(tǒng)計(jì)分析方法。從相關(guān)分析的結(jié)論中得出,運(yùn)用SPSS軟件中的多元回歸分析方法對(duì)各重要指標(biāo)自變量與因變量進(jìn)行回歸分析,采用了較為常見(jiàn)的逐步回歸法,通過(guò)觀測(cè)所有變量順序進(jìn)入回歸方程式中,以期觀測(cè)各變量對(duì)回歸模型的影響是否顯著。
逐步回歸的基本思想是:一個(gè)一個(gè)引入變量,每引入一個(gè)變量時(shí),要對(duì)已選入的變量進(jìn)行逐個(gè)檢驗(yàn)。當(dāng)原引入的變量由于后面變量的引入而變得不再顯著時(shí),則剔除該變量。這個(gè)過(guò)程反復(fù)進(jìn)行,直到既無(wú)顯著的變量選入方程,也無(wú)不顯著自變量從回歸方程中剔除為止,使最后得到的解釋變量集為最優(yōu)。
在逐步回歸模型運(yùn)算中,以各個(gè)X為自變量,Y為因變量做線性逐步回歸,得到逐步回歸方程的檢驗(yàn)結(jié)果。利用SPSS進(jìn)行逐步回歸分析,計(jì)算結(jié)果如表3所示。
在表3的模型摘要中,主要計(jì)算了R,最主要是做R檢驗(yàn),R檢驗(yàn)表示:在模型擬合度檢驗(yàn)中,調(diào)整后的R2=0.984,說(shuō)明自變量可以解釋因變量98.4%的變異度,R2越接近1,則說(shuō)明模型的擬合效果越好,說(shuō)明在引用X6變量引用至回歸方程時(shí),網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)與長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量的擬合程度較高,網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)能夠很好反應(yīng)長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量。
(三)基于AMIRA預(yù)測(cè)模型的長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量趨勢(shì)
根據(jù)長(zhǎng)沙市2008—2019年實(shí)際國(guó)內(nèi)游客數(shù)量進(jìn)行AMIRA預(yù)測(cè)模型,預(yù)測(cè)長(zhǎng)沙市未來(lái)5年內(nèi)的游客數(shù)量,得到長(zhǎng)沙市2020—2024年國(guó)內(nèi)游客數(shù)量預(yù)測(cè)值,如表4所示。
根據(jù)長(zhǎng)沙市200—2019年實(shí)際國(guó)內(nèi)游客數(shù)量,基于AMIRA模型預(yù)測(cè)長(zhǎng)沙市2020—2024年國(guó)內(nèi)游客數(shù)量預(yù)測(cè)值,形成2008—2024年國(guó)內(nèi)游客數(shù)量變化趨勢(shì)圖,如圖1所示。
由圖1可以看出,在2008—2024年,長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量正處于不斷增長(zhǎng)的發(fā)展趨勢(shì)中,增長(zhǎng)勢(shì)頭良好,長(zhǎng)沙市旅游產(chǎn)業(yè)依舊具有較大的發(fā)展空間。
與長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量相關(guān)系數(shù)較高、聯(lián)系較為密切的是長(zhǎng)沙景點(diǎn)、長(zhǎng)沙特產(chǎn)、橘子洲、岳麓山、長(zhǎng)沙美食、長(zhǎng)沙臭豆腐、湖南省博物館、長(zhǎng)沙天氣這些網(wǎng)絡(luò)搜索關(guān)注度指標(biāo),相關(guān)系數(shù)越高表示旅游者在搜索旅游地相關(guān)信息的搜索頻率越高,體現(xiàn)了旅游者對(duì)此類(lèi)旅游信息的關(guān)注程度和消費(fèi)需求。從旅游六要素的類(lèi)型看,這些網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)主要涵蓋了游、購(gòu)、食3個(gè)方面,說(shuō)明旅游者尤其關(guān)注長(zhǎng)沙旅游產(chǎn)業(yè)以下幾個(gè)方面:①加大旅游景點(diǎn)建設(shè)力度,提升旅游服務(wù)卓越品質(zhì);②關(guān)注旅游購(gòu)物市場(chǎng),完善旅游購(gòu)物消費(fèi)機(jī)制;③推動(dòng)長(zhǎng)沙美食營(yíng)銷(xiāo),扶持長(zhǎng)沙特色美食發(fā)展。
本文收集了長(zhǎng)沙市2008—2018年國(guó)內(nèi)游客數(shù)量的數(shù)據(jù),并收集了相同年度范圍內(nèi)部分與長(zhǎng)沙旅游有關(guān)的“長(zhǎng)沙景點(diǎn)”“長(zhǎng)沙美食”等網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù),利用Pearson相關(guān)系數(shù)對(duì)這兩類(lèi)數(shù)據(jù)進(jìn)行研究分析后發(fā)現(xiàn),網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)與游客數(shù)量之間具有較強(qiáng)的相關(guān)關(guān)系。實(shí)證發(fā)現(xiàn),以長(zhǎng)沙市網(wǎng)絡(luò)搜索關(guān)注度指標(biāo)數(shù)據(jù)為自變量,利用主成分-逐步回歸預(yù)測(cè)模型能夠預(yù)測(cè)出長(zhǎng)沙市國(guó)內(nèi)游客數(shù)量的實(shí)際值,且預(yù)測(cè)效果良好,相對(duì)于利用傳統(tǒng)數(shù)據(jù)進(jìn)行的傳統(tǒng)預(yù)測(cè)模型結(jié)果準(zhǔn)確率更高,且時(shí)效性更強(qiáng)。
(作者單位:湖南工商大學(xué)旅游管理學(xué)院)