劉聰 楊陽 鄧洋陽
摘要:旅游體驗(yàn)正替代自然稟賦成為旅游出行選擇的主要考量因素。本文在分析傳統(tǒng)旅游體驗(yàn)測(cè)量方法的基礎(chǔ)上,研究提出一種基于數(shù)字足跡,通過數(shù)據(jù)采集、分句、篩選、抓取、匯總等過程實(shí)現(xiàn)半結(jié)構(gòu)化到結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化的旅游體驗(yàn)測(cè)量方法。本研究以九寨溝景區(qū)為例,通過對(duì)比實(shí)驗(yàn)的方式,實(shí)證比較了該方法與傳統(tǒng)人工分析方法的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果顯示基于數(shù)字足跡的方法能夠?qū)崿F(xiàn)對(duì)游客旅游體驗(yàn)的準(zhǔn)確測(cè)量。
關(guān)鍵詞:數(shù)字足跡;旅游體驗(yàn);測(cè)量方法
中圖分類號(hào):F59 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-4428(2019)09-0056-02
一、引言
改革開放以后,我國旅游業(yè)發(fā)展迅速,逐漸成為國民經(jīng)濟(jì)的重要支柱。悠久的歷史文化和豐富的自然資源是當(dāng)前旅游產(chǎn)業(yè)蓬勃發(fā)展的重要原因。初期依靠純粹自然稟賦吸引的游客數(shù)量趨于穩(wěn)定,我國的旅游業(yè)正進(jìn)入新的發(fā)展階段。旅游體驗(yàn)正替代傳統(tǒng)的自然稟賦成為游客旅游出行選擇的重要依據(jù)。提高旅游體驗(yàn)水平成為旅游產(chǎn)業(yè)進(jìn)一步發(fā)展的核心內(nèi)容。
旅游體驗(yàn)一詞早在20世紀(jì)70年代就已經(jīng)被提出。早期旅游體驗(yàn)被認(rèn)為是人們對(duì)現(xiàn)代生活困窘的一種積極回應(yīng)。也有學(xué)者將旅游體驗(yàn)定義為對(duì)旅游相關(guān)需求的滿足程度。隨著旅游體驗(yàn)被越來越重視,對(duì)旅游體驗(yàn)的量化成為當(dāng)前的迫切需求。已有研究大多數(shù)是采用向游客發(fā)放調(diào)查問卷的方式,通過對(duì)調(diào)查結(jié)果的量化分析實(shí)現(xiàn)對(duì)游客旅游體驗(yàn)水平的間接測(cè)量。這種方式的測(cè)量結(jié)果對(duì)問卷設(shè)計(jì)有較高要求。設(shè)計(jì)的調(diào)查問卷是否客觀和科學(xué)是保證測(cè)量結(jié)果準(zhǔn)確性的關(guān)鍵。另外。問卷發(fā)放的規(guī)模也會(huì)影響測(cè)量結(jié)果的精確度。
數(shù)字足跡描述的是數(shù)字工具使用過程中直接或間接產(chǎn)生的反映主體生活信息的數(shù)字記錄。游客的數(shù)字足跡為旅游體驗(yàn)的測(cè)量提供了新的數(shù)據(jù)來源。旅游體驗(yàn)被界定為對(duì)旅游相關(guān)需求的滿足程度,而游客的數(shù)字足跡中存在反映需求滿足情況的數(shù)字記錄。網(wǎng)絡(luò)點(diǎn)評(píng)是游客數(shù)字足跡的組成部分,是游客表達(dá)旅途感受的一種方式,也是游客主動(dòng)釋放出的關(guān)于旅游需求及滿足情況的信息。
相較于問卷調(diào)查,網(wǎng)絡(luò)點(diǎn)評(píng)這種游客主動(dòng)表示出的需求信息更具有客觀性和科學(xué)性?;诖耍疚脑诜治鼍W(wǎng)絡(luò)點(diǎn)評(píng)特征的基礎(chǔ)上,依托于當(dāng)前數(shù)據(jù)采集、文本分析和數(shù)據(jù)處理技術(shù),設(shè)計(jì)出一種旅游體驗(yàn)的測(cè)量方法,旨在為旅游體驗(yàn)的定量研究提供數(shù)據(jù)基礎(chǔ)。
二、數(shù)據(jù)特征分析
(一)旅游點(diǎn)評(píng)重復(fù)率高,句式簡單,結(jié)構(gòu)近似
點(diǎn)評(píng)源自游客在過去某個(gè)時(shí)間段在特定空間的經(jīng)歷,而外部環(huán)境在短期的變化非常小,這就造成很多相同的點(diǎn)評(píng)內(nèi)容。旅游點(diǎn)評(píng)的句子比較簡單,單個(gè)用戶的點(diǎn)評(píng)語句很多只有一條,并且單句的字?jǐn)?shù)也比較少。點(diǎn)評(píng)語句大多是一些口語化的表達(dá),簡單精練,意在讓瀏覽者直接理解所描述對(duì)象的狀態(tài)或特征。單句結(jié)構(gòu)通常采用名詞在前,接形容詞,兩者中間可能存在副詞。
(二)旅游點(diǎn)評(píng)對(duì)象具體,且范圍有限
旅游點(diǎn)評(píng)意在直接讓瀏覽者了解點(diǎn)評(píng)者的感受,所以語句表達(dá)都較為具體,對(duì)象非常明確,例如景色、天氣。由于旅游點(diǎn)評(píng)還是依賴于現(xiàn)實(shí)世界,旅游空間的構(gòu)成元素比較有限,并且游客的感官角度比較相似。所以點(diǎn)評(píng)的對(duì)象就非常具體和有限。
三、旅游體驗(yàn)測(cè)量方法
根據(jù)網(wǎng)絡(luò)旅游點(diǎn)評(píng)的特征,研究設(shè)計(jì)出如下測(cè)量游客旅游體驗(yàn)水平的方法。
基于游客旅游點(diǎn)評(píng)與游客的關(guān)系,以及網(wǎng)絡(luò)旅游點(diǎn)評(píng)的可得性,網(wǎng)絡(luò)旅游點(diǎn)評(píng)非常適合作為測(cè)量游客旅游體驗(yàn)的數(shù)據(jù)來源。樣本的獲取可以采用兩種方式,一種是與旅游點(diǎn)評(píng)網(wǎng)站溝通獲得網(wǎng)站后臺(tái)的原始數(shù)據(jù)。另一種是通過第三方工具從旅游點(diǎn)評(píng)的內(nèi)容頁面采集點(diǎn)評(píng)數(shù)據(jù)。該過程會(huì)形成一張包含所有旅游網(wǎng)絡(luò)點(diǎn)評(píng)的表,每一行均為一條點(diǎn)評(píng)記錄。
測(cè)量游客的旅游體驗(yàn)質(zhì)量需要建立旅游體驗(yàn)質(zhì)量評(píng)價(jià)指標(biāo)體系。早期旅游體驗(yàn)評(píng)價(jià)指標(biāo)體系的建立主要通過發(fā)放調(diào)查問卷的方式,而隨著通信技術(shù)的發(fā)展,已有學(xué)者提出數(shù)據(jù)足跡作為游客旅游行為的信息載體,可以作為建立旅游體驗(yàn)的評(píng)價(jià)指標(biāo)體系的數(shù)據(jù)來源,并建立了相應(yīng)的旅游體驗(yàn)的評(píng)價(jià)指標(biāo)體系。本研究沿用這一以網(wǎng)絡(luò)點(diǎn)評(píng)數(shù)據(jù)為基礎(chǔ),采用扎根理論,通過多層編碼的方式建立旅游體驗(yàn)的評(píng)價(jià)指標(biāo)體系的方法。除此之外,研究還需要通過詞頻分析建立相應(yīng)的數(shù)據(jù)字典,用于收集解釋反映評(píng)價(jià)指標(biāo)的各類詞匯,包括名詞、形容詞和副詞,并且為其分配了相應(yīng)的權(quán)重。該建模過程會(huì)形成兩張表,一個(gè)用于羅列不同評(píng)價(jià)指標(biāo)所對(duì)應(yīng)的名詞集合,另一個(gè)用于描述不同名詞、形容詞和副詞組合的分值。
網(wǎng)絡(luò)旅游點(diǎn)評(píng)數(shù)據(jù)量非常龐大,并且存在部分單個(gè)用戶多條點(diǎn)評(píng)短句,一條點(diǎn)評(píng)短句包括多個(gè)點(diǎn)評(píng)對(duì)象,長難句,詞匯拼寫錯(cuò)誤、句法錯(cuò)誤等情況。因此收集到的原始旅游網(wǎng)絡(luò)點(diǎn)評(píng)數(shù)據(jù)無法直接用于分析。需要一個(gè)預(yù)處理過程。該過程包括兩個(gè)步驟:第一步是分句,如果單個(gè)用戶一次點(diǎn)評(píng)內(nèi)容-包含多條點(diǎn)評(píng)語句,那么將其拆分為多條點(diǎn)評(píng)記錄,并且如果拆解后的點(diǎn)評(píng)記錄是并列句,那么將其拆分為多條簡單句,直至所有點(diǎn)評(píng)記錄都為單個(gè)簡單句為止。第二步是篩選,依照數(shù)據(jù)字典,對(duì)分句后的短句逐條篩查,選出其中包含有數(shù)據(jù)字典中記載的明確評(píng)價(jià)對(duì)象的短句。游客的網(wǎng)絡(luò)點(diǎn)評(píng)內(nèi)容依賴于現(xiàn)實(shí)世界,表述的基本是存在的共性問題或感受,并且網(wǎng)絡(luò)點(diǎn)評(píng)與寫文章不一樣,更多的是游客的口語化表述,重在簡單直觀的傳遞游客感受,因此具體的點(diǎn)評(píng)內(nèi)容和句式結(jié)構(gòu)都有非常高的重復(fù)率。相較于傳統(tǒng)的抽樣數(shù)據(jù),已有的研究強(qiáng)調(diào)點(diǎn)評(píng)數(shù)據(jù)的全樣本特征,即能夠收集到全部的數(shù)據(jù)。但是,相對(duì)于全數(shù)據(jù)分析,篩選過程能夠在大幅度減小測(cè)算難度的同時(shí),還能保證測(cè)算結(jié)果的準(zhǔn)確率。畢竟全數(shù)據(jù)分析中的難點(diǎn)集中在對(duì)復(fù)雜句型的分析,以及對(duì)個(gè)別詞匯語義的識(shí)別,而這些只占極少的部分。該預(yù)處理過程會(huì)優(yōu)化原始數(shù)據(jù)構(gòu)成的表,形成只有一列,每行都只有一個(gè)簡單句的新表。
雖然經(jīng)過預(yù)處理后的數(shù)據(jù)變得比較規(guī)整。但是對(duì)于這類半結(jié)構(gòu)化文本的量化分析依舊需要一個(gè)向結(jié)構(gòu)化轉(zhuǎn)變的過程。具體轉(zhuǎn)化過程采用的是分批次抓取的方法,依照詞頻分析建立的詞庫。依次抓取簡單句中的名詞、副詞和形容詞。該抓取過程會(huì)讓預(yù)處理后的表單,變更為表單包含四列數(shù)據(jù)的結(jié)構(gòu),第一列保留預(yù)處理后的簡單句,第二列為從前面保留的簡單句中抓取到的名詞,第三列為抓取的副詞,第四列為抓取的形容詞。
整個(gè)數(shù)據(jù)的處理到這里就基本完成,剩下的就是對(duì)照數(shù)據(jù)字典和分值表單,計(jì)算每一條簡單句對(duì)應(yīng)的分值。該過程會(huì)在原有表單中開辟出新的一列,用于闡釋該簡單句的得分情況。最后。再對(duì)每個(gè)評(píng)價(jià)指標(biāo)所對(duì)應(yīng)的所有簡單句的分值進(jìn)行匯總。得出相應(yīng)評(píng)價(jià)指標(biāo)的得分,進(jìn)而實(shí)現(xiàn)對(duì)游客旅游體驗(yàn)質(zhì)量的測(cè)量。
四、實(shí)驗(yàn)分析
根據(jù)已有構(gòu)建的旅游體驗(yàn)評(píng)價(jià)指標(biāo)體系,本研究選擇利用上述基于數(shù)字足跡的分析方法測(cè)算旅游體驗(yàn)的一級(jí)構(gòu)成指標(biāo),即住宿體驗(yàn)水平。實(shí)驗(yàn)選取九寨溝景區(qū)作為游客旅游體驗(yàn)的目的地,其附近的酒店旅館就成為制約游客住宿體驗(yàn)的最主要因素。通過對(duì)九寨溝周邊酒店的網(wǎng)絡(luò)點(diǎn)評(píng)內(nèi)容的分析能夠客觀的測(cè)算出游客的住宿體驗(yàn)水平。
本研究通過數(shù)據(jù)采集工具從攜程網(wǎng)采集了九寨溝附近幾家酒店的用戶點(diǎn)評(píng)數(shù)據(jù),選擇標(biāo)準(zhǔn)為點(diǎn)評(píng)記錄超過500條。通過詞頻分析歸納出5個(gè)反映住宿體驗(yàn)的二級(jí)指標(biāo),分別是地理交通、外部環(huán)境、服務(wù)水平、酒店設(shè)施。并分別建立與這些二級(jí)指標(biāo)相對(duì)應(yīng)的詞庫,基本結(jié)構(gòu)見表1。
采集到的原始點(diǎn)評(píng)數(shù)據(jù)無法直接用于分析,本研究對(duì)其進(jìn)行了必要的分句和篩選處理。首先,將包含逗號(hào)、多個(gè)句號(hào)的點(diǎn)評(píng)記錄提取出來,根據(jù)符號(hào)位置將其拆分為多條短句。重復(fù)上述過程,直至每行記錄都是簡單句為止。然后,將每條簡單句與名詞詞庫進(jìn)行比照,剔除掉不包含高頻名詞的簡單句。預(yù)處理過程見圖1。
經(jīng)過預(yù)處理的數(shù)據(jù)無法直接用于量化分析,本研究還利用抓取的方式將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。轉(zhuǎn)化后的數(shù)據(jù)結(jié)構(gòu)見表2.對(duì)照權(quán)重表,依次為每一條簡單句打分,分值區(qū)間為0至5分,其中0分最差,5分最優(yōu)。在此基礎(chǔ)上,將所有簡單句的分值加總,再平均。得到游客旅游體驗(yàn)的一級(jí)指標(biāo)住宿體驗(yàn)的得分。最終,得到九寨溝游客旅游體驗(yàn)的一級(jí)指標(biāo)住宿體驗(yàn)的得分為4.836分。
為了驗(yàn)證該方法的有效性,本研究同時(shí)還做了一組對(duì)比試驗(yàn)。利用隨機(jī)抽樣的方式,從樣本中抽取出300條點(diǎn)評(píng)記錄,采用人工分析的方式,對(duì)照權(quán)重表,依次計(jì)算出每條點(diǎn)評(píng)記錄的分值,最后再進(jìn)行匯總求平均值。這種方法得到的九寨溝游客旅游體驗(yàn)的一級(jí)指標(biāo)住宿體驗(yàn)的得分為4.815分,兩種方法的誤差只有0.4%。比照結(jié)果表明基于數(shù)字足跡的旅游體驗(yàn)測(cè)量方法有很高的準(zhǔn)確度。
五、研究結(jié)論
本研究在分析已有旅游體驗(yàn)測(cè)量方法和數(shù)字足跡特點(diǎn)的基礎(chǔ)上。提出一種基于數(shù)字足跡的旅游體驗(yàn)測(cè)量方法。經(jīng)過數(shù)據(jù)采集、預(yù)處理、抓取和評(píng)分等過程,將半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)對(duì)游客旅游體驗(yàn)評(píng)價(jià)指標(biāo)的測(cè)量。本研究還以九寨溝為例,實(shí)證檢驗(yàn)了該方法的測(cè)量結(jié)果,并通過對(duì)比實(shí)驗(yàn)的方式,比較了基于數(shù)字足跡的測(cè)量方法與傳統(tǒng)的人工逐條分析方法的效果。實(shí)驗(yàn)結(jié)果顯示新方法與人工方法的測(cè)量準(zhǔn)確度相差無幾,證明了基于數(shù)字足跡的旅游體驗(yàn)測(cè)量方法的有效性和準(zhǔn)確性。