張成琳
摘? 要:海南獨特的地理位置、豐富的自然景觀和完善的旅游基礎(chǔ)設(shè)施,使得島內(nèi)自由行發(fā)展迅速。游記作為游客自由行經(jīng)歷的相對真實反映,挖掘其潛在規(guī)律對探索游客偏好和海南自由行特點具有重要價值。該文利用火車頭采集器采集馬蜂窩網(wǎng)站中海南自由行游記并分析游記文本,然后從旅游熱點、旅游時間和旅游線路3個方面總結(jié)出海南自由行的特點,為制定科學(xué)有效的海南旅游發(fā)展規(guī)劃提供參考。
關(guān)鍵詞:文本挖掘? 海南自由行? 路線特點
中圖分類號:G254 ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2019)11(b)-0249-02
隨著網(wǎng)絡(luò)群體年輕化及人們旅游觀念的轉(zhuǎn)變,走馬觀花式的觀光游逐漸向休閑度假深度游轉(zhuǎn)變,傳統(tǒng)跟團(tuán)游愈來愈不能滿足年輕人多樣化的旅游需求。與此同時,隨著國內(nèi)旅游者的旅游經(jīng)驗越來越豐富,且功能齊全、類別多樣的網(wǎng)站應(yīng)用使得人們獲取旅游信息更加便捷,信息技術(shù)的發(fā)展和旅游心態(tài)的轉(zhuǎn)變,讓自由行成為更理想的出游方式。
海南作為國際旅游島,擁有全國獨特的熱帶濱海和熱帶雨林資源,島內(nèi)遍布酒店、民宿,豐富的交通體系以及景區(qū)完善的基礎(chǔ)設(shè)施,使得景點可達(dá)性、食宿便捷性等各方面滿足游客需要,大力推動了自由行的發(fā)展。因此該文利用文本挖掘技術(shù),尋找海南自由行游客的旅游路線偏好,為海南未來旅游路線的制定及發(fā)展規(guī)劃提供一定的參考價值。
1? 數(shù)據(jù)獲取和分析
1.1 數(shù)據(jù)來源
游記是旅游者基于自身旅游體驗發(fā)表的相對原真性的記錄,數(shù)據(jù)完全由用戶產(chǎn)生,真實性強(qiáng),目前已成為了旅游者對景點和路線甄選的重要參考[1]。馬蜂窩作為以自由行為核心的旅游信息服平臺,更強(qiáng)調(diào)用戶原創(chuàng)內(nèi)容分享,具有主動性、真實性及個性化的特點[2]。所以該文從馬蜂窩中挖掘海南自由行的數(shù)據(jù)具有一定的樣本量和可信度。該文于2018年3月在馬蜂窩網(wǎng)站以“海南自由行”為標(biāo)簽搜索相關(guān)游記,游記網(wǎng)頁(https://www.mafengwo.cn/xc/12938/)共顯示530條信息,運(yùn)用火車頭采集器設(shè)定網(wǎng)址采集規(guī)則,最后采集到的有效游記有505個,即每個游記里面都有相應(yīng)的海南自由行線路,包括用戶ID、旅游者類型、出游天數(shù)、地方景點名稱等信息。
1.2 數(shù)據(jù)處理
該研究先用火車頭工具篩選出自由行經(jīng)過的海南各市縣,得到整體路線圖,設(shè)計內(nèi)容采集規(guī)則,運(yùn)用前后截取的方式采集游記中提到的地點。由于不同游客對相同地區(qū)的定位不同,如興隆和萬寧、三沙和西沙都屬于同一市縣,需要對數(shù)據(jù)進(jìn)行人工校驗處理,將同市縣的地點歸為一類。最后在505條旅游線路中得到各市縣出現(xiàn)次數(shù),如表1所示。
在篩選后的游記信息中,自由行僅在三亞一個地方的路線有397條,占比高達(dá)78.6%。其次,“三亞-海口”兩點一線有46條;傳統(tǒng)的海南島東線游也有30條,如表2所示。
接著,該文對游記中自由行天數(shù)進(jìn)行了數(shù)據(jù)統(tǒng)計,發(fā)現(xiàn)自由行4天和5天的路線最多,分別占比26.5%和24.4%。其次線路規(guī)劃天數(shù)較多的是3天、7天和6天,如表3所示。
最后,該文用火車頭工具對自由行到達(dá)的景區(qū)景點進(jìn)行抓取分析,結(jié)果顯示受游客歡迎的景點中,三亞排名前三的有蜈支洲島、亞龍灣、三亞灣,大三亞經(jīng)濟(jì)圈內(nèi)的保亭呀諾達(dá)熱帶雨林、檳榔谷也比較受歡迎,??趧t是騎樓老街、火山口國家地質(zhì)公園、紅樹林等提及較多,還有五指山市的五指山景區(qū)、文昌的銅鼓嶺和月亮灣、萬寧的興隆熱帶植物園、陵水的分界洲島、瓊海的博鰲鎮(zhèn)。此外??阽姌恰撞榇?、蔡家宅、博鰲鄉(xiāng)村公園、南波灣等知名度不高的地方也被提及。
2? 海南自由行現(xiàn)狀分析
2.1 旅游熱點一邊倒
三亞作為全國知名的熱帶度假天堂,自然而然也成為自由行游客們的首選場所。由數(shù)據(jù)可知,僅在三亞旅游的自由行游客占比達(dá)到78.6%,包含三亞的自由行線路更是占比97.4%,可見三亞是海南旅游者們最鐘情的地方,對比之下其余市縣景點顯得毫無生氣,使得海南自由行呈現(xiàn)一邊倒的局面。
2.2 自由行時間常規(guī)化
海南島作為獨立的島嶼,最快捷的方式就是搭乘飛機(jī)進(jìn)入,所以外省游客基本不會選擇一日游,在有限的數(shù)據(jù)中也未統(tǒng)計到一日游行程。自由行天數(shù)選擇最多的是4d和5d,是一個很常規(guī)的出游天數(shù),也在一定程度上反映出為何僅在三亞自由行的占比很高。因為短時間內(nèi)再去別地旅游會在路程上花費(fèi)很多時間,以及更多精力去安排行程。
2.3 自由行路線特點
海南自由行時間較充裕的一般會選擇環(huán)島旅游,而不僅僅在三亞周邊。所以其路線呈以下幾個特點。
(1)定點游。僅在三亞一個地方游玩是大多數(shù)游客的選擇,不僅因為三亞的知名度高,游玩景點多,可能大多數(shù)游客認(rèn)為三亞就是海南的形象代表。此外還有兩條線路是??谟魏臀牟?,根據(jù)游記發(fā)現(xiàn)是海南當(dāng)?shù)厝说淖杂尚小?/p>
(2)兩點一線?!昂??三亞”的兩點一線較為常見,一般行程時間在6d及以上才會選擇,線路相對來說比較簡單,瀏覽的就是兩地代表性景點。
(3)環(huán)東線。傳統(tǒng)的環(huán)東線自由行路線比較多,因為海南東線景點開發(fā)得比較完善,交通便捷,景點較多。自由行游客根據(jù)行程安排東線景點,特點都是以海口和三亞為首尾,中間選取瓊海、萬寧、陵水等景點。
(4)大三亞圈。這種線路以三亞為中心,游覽其周邊景點。大三亞旅游圈包括三亞、萬寧、陵水、保亭、五指山5個市縣。其中保亭呀諾達(dá)熱帶雨林、五指山景區(qū)是以熱帶雨林風(fēng)光為主,植被茂密,負(fù)氧離子含量高,在一定程度上與三亞單純的海灘風(fēng)光相彌補(bǔ)。
(5)東西環(huán)線。這種自由行路線對象都是資深游客或騎行愛好者,游玩時間充足,游玩地點較多,線路經(jīng)過海南東線和西線各市縣,路線不具有普遍性。在收集到的505條旅游線路中僅有3例。
3? 結(jié)語
自由行是游客們隨意選擇目的地觀光度假,但是大部分游客只選擇“三亞”或“三亞-海口”。說明其他目的地景區(qū)未能做好宣傳工作,沒有樹立品牌形象,知名度不高,缺乏吸引力。所以旅游相關(guān)人員要積極打造海南各地旅游品牌,提高知名度和美譽(yù)度。
該研究也存在一定的不足,數(shù)據(jù)源單一,樣本量較少,影響分析結(jié)果,在以后的研究中會繼續(xù)完善改進(jìn)。
參考文獻(xiàn)
[1] 呂琳露,李亞婷.游記文本中的知識發(fā)現(xiàn)與聚合——以螞蜂窩旅行網(wǎng)杭州游記為例[J].情報雜志,2017,36(7):176-181.
[2] 黃亞芬,全華.UGC型旅游網(wǎng)站對自助旅游者旅游決策影響分析——以螞蜂窩為例[J].云南地理環(huán)境研究,2017,29(2):17-21.