俞俊男
【摘 要】隨著人們物質生活水平的不斷提升,對精神享受的重視程度逐漸增加,旅游作為一種普遍的休閑放松方式,受到越來越多人的認可與青睞,加之電子信息技術的發(fā)展,利用智能移動終端通過建立數(shù)學模型的方式,分析游客出行、消費的特征,預測游客的滿意度與市場需求,進而對游客對目的地的情感進行評價。基于此,本文將選擇五個旅游目的地,對游客的情感進行評價和分析。
【關鍵詞】大數(shù)據(jù);旅游目的地;情感評價法
一、引言
在以往傳統(tǒng)的旅游目的地分析中,主要采用定量模型的方式,通過設計調查問卷來獲取數(shù)據(jù)信息進行評價。而在大數(shù)據(jù)背景下,地理學家可以借助GIS與GPS等新技術,通過對個體行為與信息的采集,獲取到整個群體的空間規(guī)律與綜合評價,在互聯(lián)網(wǎng)中捕捉游客的滿意度、喜好、愉悅度等情感信息,進而獲取到游客對旅游目的地的整體評價。
二、游客情感研究
20世紀90年代,游客情感研究興起,主要側重于基本維度與因素界定方面,經(jīng)過學者的研究發(fā)現(xiàn),游客在旅行的過程中,既存在著正面情感也存在負面情感,二者相互交織、互為金拓,客戶滿意度作為游客情感中的一部分,能夠代表整體情感一項,但是在評估內容上存在諸多不確定性,也受到評估者自身感知能力的限制。而在實際旅游過程中,由于尚未建立專用于收集游客情感的詞庫,游客對于情感的分類方式又各不相同,例如有些游客表示的“驚訝”屬于負面情感,而“刺激”大部分屬于正面情感等,加之受到語言表達中連詞、副詞對于情感描述方面的影響,很容易產(chǎn)生誤判,因此需要對情感強度進行進一步準確把握。
三、旅游情感評價研究方法
本文構建了科學有效的游客情感分析模型,建立旅游情感評價專屬詞庫,選擇國內5個旅游目的地進行數(shù)據(jù)采集,分別為黃山、洛陽、焦作、成都與張家界,并且通過“UNWTO監(jiān)測數(shù)據(jù)”方式,對上述旅游場地的數(shù)據(jù)分析結果進行抓取和分析。
1、數(shù)據(jù)來源
在數(shù)據(jù)來源方面,主要選擇國內評論量較多的旅游電子商務門戶網(wǎng)站,經(jīng)過對團隊進行閱讀與分析后,選擇具有較高知名度與用戶群體的:去哪兒網(wǎng)、攜程網(wǎng)與途牛網(wǎng)。通過網(wǎng)絡爬蟲工具對評論進行抓取,截止到2017年底,共計抓取評論120731條。
2、模型構建
為了更加科學準確的對游客情感邏輯進行評估,在本次研究中通過建立游客情感分析模型的方式,采用詞匯匹配技術,收集旅行評論中的情感詞匯,包括正面和負面兩種,然后進行數(shù)學統(tǒng)計和分析,模型構建具體分為以下幾個步驟:
一是建立游客情感詞庫。本文采用的詞庫為知網(wǎng)發(fā)布的HowNet詞典,包括91016個中文詞語、85295個英文詞語,涉及到正面評價、負面評價、程度級別等多個類型。同時,采用人工閱讀篩選的方式,對旅游詞庫中的詞語進行進一步提煉,通過吃住行游購娛六個方面著手,共計獲取到正面詞匯與負面詞匯分別為317個與185個。
二是構建語義邏輯規(guī)則。首先,對于程度副詞來說,將其劃分為絕對與相對兩種類別,絕對詞能夠單獨體現(xiàn)出程度,而相對詞需要進行對比來表示程度。在程度上共計分為極量、高量、中量、低量四種類別,分別給予0.5-3的倍數(shù)級別。其次,在否定詞方面,對文本情感分析起到十分重要的作用,能夠對整個句子的情感傾向起到?jīng)Q定性作用,并且否定句存在“范圍”與“焦點”,并且同一個句子中可以包含不同的否定對象。另外,轉折連詞也將對情感產(chǎn)生一定的影響,分為“狹義轉折”與“廣義轉折”兩種,其中以俠義轉折為重點,如“雖然……但是……”“可是”等[1]。
三是情感乘數(shù)擬定。在社交網(wǎng)站中,公眾的表達可能會受到一定的限制,積極向上的表達將獲得更多社會的認同,因此在表達中將會不自覺的向著積極的方向表述,這將導致對負面情緒的判斷不夠科學,夸大正面評論的效果,因此需要對正負面詞匯的比例系數(shù)進行校正。在本文研究中選擇的5個數(shù)據(jù)采集地中,正面評論是負面評論的7.19倍,本文從實驗角度出發(fā)對誤差程度進行測定,并且擬定三個情感系數(shù),分別為3/4/5倍,當評論中正面評價與負面評價相比超過3/4/5倍時,此條評論才能夠被真正判定為是正面評論。
3、模型規(guī)則
在上述所構建的模型基礎上,根據(jù)游客在網(wǎng)站中發(fā)表的評論,對目的地進行評分情況進行判斷與分析。針對不同網(wǎng)站采用統(tǒng)一化的評分方式,分值從1到5,1為最低分,5為最高分,滿意程度由1到5是極其不滿意到非常滿意,在分值中以3為界限,4-5分屬于正面評論,3分屬于中性評論,1-2分屬于負面評論,采用的規(guī)則為:
(1)“詞頻法”主要是指抓取到的網(wǎng)友評論,對其中的中文分詞進行集合后,采用紙機統(tǒng)計的方式,劃分每個評論的正面與負面詞匯的數(shù)量,當正面與負面相比詞匯數(shù)為1.5倍時,則屬于正面評論;沒有超過1.5倍為中性評論,超過1.5倍屬于負面評論。
(2)“詞頻邏輯法”主要是指語義邏輯與詞頻統(tǒng)計相結合的情感分析,該規(guī)則被建立在上一規(guī)則的基礎上,并且以情感詞前后的詞性為參考標準,與系數(shù)相乘后,計算最終得分。當正面與負面詞匯單獨出現(xiàn)時,則正面得1分,負面得-1分。
四、評價研究的結果與校驗
本文共計選擇了5個旅游目的地,對游客情感的正面與負面評價進行分析,對于單個目的地來說,焦作的情感評價最為負面,獲取的正面評價比例最低,而負面評價比例最高。另外,采用“詞頻法”進行計算時,黃山獲得情感評價的正面比例最高,而采用“詞頻邏輯法”進行計算,則成都獲得的情感評價最高。從整體上來看,兩種規(guī)則對目的地的判斷中,正面評論占總體的比例處于不斷下降狀態(tài),但始終能夠保持在65%以上;中性比例則不斷增加。通過“UNWTO”對數(shù)據(jù)進行進一步深入分析和校驗。
1、單年度校驗
按照上述5個旅游目的地在情感判定規(guī)則中,正面評論的比例來看,對游客滿意度的方差計算公式為:
規(guī)則X與監(jiān)測結果的方差=
式中,Ai屬于第i個目的地中游客的滿意程度;Xi代表的是第i個目的地中正面評價的比例。
通過對兩個規(guī)則絕對方差結果的對比研究可知,第一種規(guī)則中絕對方差的數(shù)值最小,這將意味著其與監(jiān)測結果之間的距離最小,更能夠準確的測試出游客的真實情感。另外,第二種規(guī)則中存在較大的絕對方差值,這將意味著通過計算正負詞匯數(shù)量的方式進行情感判斷存在較大缺陷,因此不可行[2]。
2、多年度校驗
由于各個年份之間存在一定的變化,因此選擇進三年的監(jiān)測結果對5個目的地進行監(jiān)測,同樣采用計算公式的方式,求取年度絕對方差,計算公式為:
規(guī)則X與監(jiān)測結果的方差=
式中,Ai與Xi代表的含義同上;J代表監(jiān)測年限。
根據(jù)公式計算結構可知,三年內游客對目的地的滿意程度分析效果為第二種規(guī)則大于第一種,因此對于多年度校驗將采用第二種監(jiān)測方式,使其更接近與監(jiān)測結果。
五、結論
綜上所述,通過本文的調查研究可以得出以下結構,一是游客在線評論的情緒表達較為傾向于正面,不同年份中游客正面情緒表達的程度不同,但總體均高于64%;二是建立旅游情感專屬詞匯、情感乘數(shù)等有利于提升調查結果的科學性,縮減其中存在的誤差;三是在單年內差異校驗中,采用“詞頻法”規(guī)則效果要高于“詞頻邏輯法”;而在多年校驗中,采用“詞頻邏輯法”要更優(yōu)于“詞頻法”。
【參考文獻】
[1]李君軼,張妍妍.大數(shù)據(jù)引領游客情感體驗研究[J].旅游學刊,2017, 32(9):8-9.
[2]李藝.大數(shù)據(jù)時代背景下旅游目的地的營銷發(fā)展研究——以貴陽市為例[J]. 貴陽學院學報(社會科學版), 2017,12(2):39-43.