尹曾曾,毛端謙
(江西師范大學(xué)地理與環(huán)境學(xué)院,330022,南昌)
在網(wǎng)絡(luò)大數(shù)據(jù)盛行的背景下,基于位置的社交網(wǎng)絡(luò)數(shù)據(jù)受到越來(lái)越多的關(guān)注,許多學(xué)者都傾向于利用大數(shù)據(jù)來(lái)進(jìn)行旅游研究。用戶利用自己的社交網(wǎng)絡(luò)平臺(tái)即時(shí)發(fā)布自己的位置、想法、圖片、文字、表情等內(nèi)容和信息,這一過(guò)程稱為簽到(check-in)。游客在進(jìn)行旅游活動(dòng)的過(guò)程中會(huì)隨時(shí)將自己旅行的見(jiàn)聞傳送在手機(jī)或電腦等社交媒體客戶端上面與大家分享,也可以自愿選擇是否共享位置信息。這一過(guò)程完全是由游客的主觀意愿進(jìn)行的,可以充分體現(xiàn)游客在旅游過(guò)程中的想法和心情。新浪微博2019年第4季度財(cái)報(bào)顯示,2019年12月的月活躍用戶數(shù)為5.16億,較上年同期凈增約5 400萬(wàn);平均日活躍用戶數(shù)為2.22億,較上年同期凈增約2 200萬(wàn)??梢?jiàn)新浪微博的用戶量巨大,現(xiàn)勢(shì)性強(qiáng)大,活躍度充分,具有研究?jī)r(jià)值。
學(xué)者在研究利用社交媒體簽到大數(shù)據(jù)進(jìn)行分析的過(guò)程中,獲得了許多成果。在國(guó)外,用戶主要使用Twitter、Facebook、Flickr等社交網(wǎng)站數(shù)據(jù)發(fā)表自己的簽到地理位置數(shù)據(jù);在國(guó)內(nèi)則可以通過(guò)電腦、手機(jī)等多種移動(dòng)終端接入微信、新浪微博、騰訊微博、騰訊QQ等社交媒體,以文字、圖片、視頻等多媒體形式,實(shí)現(xiàn)信息的即時(shí)分享和傳播互動(dòng)。對(duì)于簽到大數(shù)據(jù)的研究主要集中在城市網(wǎng)絡(luò)及空間結(jié)構(gòu)、城市熱點(diǎn)區(qū)域挖掘、城市居民時(shí)空行為分析、旅游地演化模式等方面,例如Hollenstein[1]等利用Flicker位置數(shù)據(jù)來(lái)描述城市功能區(qū)劃,量化了定位和地理信息處理中誤差和不精確的性質(zhì);Li[2]等分析了加利福尼亞州Twitter數(shù)據(jù)和Flicker照片在時(shí)間和空間上的分布特征;Paldino[3]等利用人們?cè)诓煌攸c(diǎn)拍攝的帶有地理標(biāo)記的照片中的信息比較了世界上10個(gè)最受歡迎的城市的居民和游客的空間行為;韓華瑞[4]利用2014年1—11月的55 933個(gè)POI、5 820 136次微博簽到數(shù)據(jù)量分析湖北省微博簽到活動(dòng)空間差異;王曉夢(mèng)[5]以北京市城6區(qū)為例使用2012—2015年微博簽到數(shù)據(jù),結(jié)合問(wèn)卷調(diào)查與實(shí)地調(diào)研進(jìn)行2次糾偏,逐年提取北京市6城區(qū)商業(yè)熱點(diǎn)地區(qū);萬(wàn)穎樺[6]探討了江西省居民的微博活動(dòng)量的空間分布特征、不同類別興趣點(diǎn) POI ( Point of Interest) 微博簽到數(shù)據(jù)組成成分及其與人口的年齡結(jié)構(gòu)和性別結(jié)構(gòu)關(guān)系,并進(jìn)行可視化表達(dá);徐敏[7]等利用新浪微博簽到大數(shù)據(jù)研究城市旅游地的網(wǎng)絡(luò)結(jié)構(gòu)特征,分析旅游地節(jié)點(diǎn)的對(duì)外聯(lián)系強(qiáng)度,總結(jié)出復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)的演化模式。
由此可見(jiàn),對(duì)于利用簽到大數(shù)據(jù)進(jìn)行的研究大部分是以城市為研究區(qū)域,對(duì)城市的網(wǎng)絡(luò)結(jié)構(gòu)、熱點(diǎn)區(qū)域等內(nèi)容進(jìn)行分析,而在旅游方面的研究相對(duì)較少,尺度也大部分是以省、市、景區(qū)內(nèi)為研究基礎(chǔ)的,很少有研究像婺源縣這樣的鄉(xiāng)村旅游地的簽到數(shù)據(jù)特征的文獻(xiàn)。因此這為研究婺源鄉(xiāng)村旅游提供了一個(gè)新的方向,有利于婺源鄉(xiāng)村旅游的建設(shè)和發(fā)展。通過(guò)獲取婺源縣游客在新浪微博的簽到數(shù)據(jù),并對(duì)游客的時(shí)空分布模式以及個(gè)體特征進(jìn)行研究,有助于分析婺源游客的特征。之后婺源可以有針對(duì)性地對(duì)不同游客采取不同的策略,也有利于婺源完善自身的旅游形象,加快對(duì)婺源旅游的宣傳和營(yíng)銷,吸引更多的游客。
婺源縣位于江西東北地區(qū),土地面積2 967 km2,今屬江西省上饒市下轄縣,與皖、浙2省交界,東距浙江衢州120 km,北距安徽黃山市89 km,是一顆處于皖、浙、贛3省交界處的綠色明珠??h城森林覆蓋率達(dá)82%,是全國(guó)首批生態(tài)農(nóng)業(yè)旅游示范區(qū),是世界最大的文化生態(tài)公園。婺源以其文化和生態(tài)的優(yōu)勢(shì),被海內(nèi)外譽(yù)為“中國(guó)最美的鄉(xiāng)村”。并被國(guó)內(nèi)各大網(wǎng)站評(píng)定為“中國(guó)50個(gè)一生中必到的地方”和“中國(guó)十大踏青好去處”。2001年10月,婺源全域以“婺源文化與生態(tài)旅游區(qū)”獲評(píng)國(guó)家3A級(jí)旅游景區(qū),是唯一的一個(gè)以縣城為單位命名的國(guó)家3A級(jí)景區(qū)。2005年被《中國(guó)地理》雜志評(píng)為“中國(guó)最美的鄉(xiāng)村古鎮(zhèn)之一”。全縣共有一個(gè)5A級(jí)景區(qū)江灣景區(qū),還有篁嶺、李坑、汪口、思溪延村、大鄣山臥龍谷、靈巖洞、水墨上河等14個(gè)4A級(jí)景區(qū),還有一批精品景區(qū)和景點(diǎn)。婺源的景點(diǎn)多而分散,分布在縣城中心紫陽(yáng)鎮(zhèn)的東、西、北3個(gè)方向。
由于婺源縣作為以縣級(jí)為單位的3A級(jí)景區(qū),因此本文選取婺源的4A、5A級(jí)景區(qū)以及一些主要的景點(diǎn)、景區(qū)、旅游點(diǎn)、主要的交通樞紐點(diǎn)共99個(gè)作為旅游節(jié)點(diǎn)POI,并且記錄其經(jīng)緯度。在所有選取的POI位置所在的區(qū)域,分別選取X、Y最大值和最小值的矩形框內(nèi),X、Y每隔1 km獲取一個(gè)lat和lng,調(diào)用新浪微博“獲取附近地點(diǎn)”的API接口,獲取附近POI的微博簽到信息,獲取婺源縣從2011—2020年的旅游簽到數(shù)據(jù)共34 215條。之后對(duì)所獲取的數(shù)據(jù)進(jìn)行清洗和篩選,去除簽到位置不明確、海外簽到數(shù)據(jù)、無(wú)效簽到數(shù)據(jù)以及游客簽到可能性較小的地點(diǎn),例如學(xué)校、醫(yī)院、銀行、居民區(qū)、辦公樓等簽到數(shù)據(jù),最終獲得有效的婺源旅游簽到數(shù)據(jù)共24 712條,時(shí)間跨度為2012年1月1日至2020年6月1日。選擇所需要的旅游簽到信息和用戶具體信息,包括用戶昵稱、博文內(nèi)容、發(fā)布時(shí)間、簽到經(jīng)緯度地址、性別、所在地和注冊(cè)時(shí)間等。獲取的簽到數(shù)據(jù)樣本如表1。
表1 婺源縣旅游微博簽到數(shù)據(jù)樣本
2.1.1 總體簽到數(shù)量特征 由于微博簽到數(shù)據(jù)當(dāng)中的所在地(用戶歸屬地)只能顯示到市級(jí)單位,而婺源縣隸屬于江西上饒市,因此將歸屬地在江西上饒的都視為本地游客,其他城市的游客視為外地游客。根據(jù)對(duì)婺源縣獲取的有效旅游簽到數(shù)據(jù)進(jìn)行分析(圖1),本地游客的簽到總量為1 692,外地游客的簽到總量為23 020,簽到率分別為7%和93%。女生簽到總量為16 227,男生簽到總量為8 485,男女生簽到總量的比例約為1:2。從2012—2019年各年度簽到總量來(lái)看,基本上是呈現(xiàn)逐年遞增的現(xiàn)象,并且增長(zhǎng)的幅度也是逐年增大。只有2014年的簽到量是較上一年度下降的,其簽到量為1 036,低于2012年和2013年。簽到總數(shù)量最高的年份是2019年,簽到量為6 423。女生的簽到量每年都高于男生的簽到量,男女生簽到量最高的年份都是2019年,簽到比例也是1:2。外地游客的簽到量一直是遠(yuǎn)高于本地游客的簽到量,本地游客的簽到量呈現(xiàn)平穩(wěn)小幅上升的狀態(tài),外地游客的簽到量也和簽到總量一樣逐年遞增,只出現(xiàn)了2014年的一個(gè)小的下降拐點(diǎn)。雖然2020年的數(shù)據(jù)只到6月1日,但是可以看出2020年游客的簽到量遠(yuǎn)遠(yuǎn)達(dá)不到往年同期游客簽到的水平。由于新冠肺炎疫情的爆發(fā),婺源縣所有A級(jí)景區(qū)及旅游點(diǎn)都從1月25日開(kāi)始關(guān)閉,一直持續(xù)到2月下旬。經(jīng)市、縣文旅部門同意,決定于2月20日起婺源江灣、篁嶺、水墨上河、文公山、臥龍谷、靈巖洞、石門山峽谷、江嶺8個(gè)景區(qū)正式恢復(fù)對(duì)外開(kāi)放,其他景區(qū)也將按規(guī)定陸續(xù)開(kāi)放。雖然疫情過(guò)后逐漸復(fù)產(chǎn)復(fù)工,但是相對(duì)來(lái)說(shuō)2020年的游客簽到情況還是受到了較大的影響,游客出行沒(méi)有往年那么活躍,旅游的熱度也在一時(shí)間迅速降低。
圖1 2012-2020年婺源縣旅游簽到量分布情況
2.1.2 總體簽到密度特征 將獲取到的婺源縣旅游簽到用戶的簽到信息以及婺源縣主要的景點(diǎn)景區(qū)導(dǎo)入Arcgis當(dāng)中,可以看到婺源縣旅游簽到用戶的簽到具體位置都是圍繞在主要的景區(qū)景點(diǎn)周圍,包括具體的觀景點(diǎn)、酒店、重要交通樞紐點(diǎn)等簽到點(diǎn)。利用Arcgis的核密度分析工具和自然間斷點(diǎn)分級(jí)法對(duì)旅游簽到用戶的簽到具體密度進(jìn)行分析(圖2),可以看出簽到點(diǎn)較多的位置是在紫陽(yáng)鎮(zhèn),主要是因?yàn)樽详?yáng)鎮(zhèn)是婺源縣城的中心,也是整個(gè)婺源旅游的交通中心。一般游客都會(huì)先抵達(dá)這里,再出發(fā)前往不同的目的地。從游客簽到的熱點(diǎn)來(lái)看,游客簽到最多的TOP10個(gè)景區(qū)景點(diǎn)分別是理坑、思溪延村、石城楓葉、彩虹橋、江灣、李坑、江嶺、靈巖洞、篁嶺和曉起。最受歡迎的就是理坑,理坑景區(qū)是中國(guó)歷史文化名村、省級(jí)重點(diǎn)文物保護(hù)單位,被文人學(xué)者贊為“理學(xué)淵源”。其次是思溪延村,整個(gè)古村落以明清古村落為主,具有深厚的歷史文化內(nèi)涵。理坑、靈巖洞、彩虹橋、思溪延村是婺源北線旅游最具代表性的景點(diǎn),既有蘊(yùn)含深刻歷史文化底蘊(yùn)的古村落,又有豐富的自然美景,分布在“千年古鎮(zhèn)”清華鎮(zhèn)的周邊。婺源東線旅游是婺源縣旅游最受歡迎的路線——包括李坑、汪口、江灣、曉起、江嶺等地,還可以到篁嶺體驗(yàn)婺源獨(dú)一無(wú)二的曬秋活動(dòng)。東線旅游路線當(dāng)中包括了婺源保存最完好的徽州古建筑群,村落和景點(diǎn)基本上在一條道路之上,也有許多觀賞油菜花田的地點(diǎn)。而婺源西線旅游開(kāi)發(fā)時(shí)間較晚,包括嚴(yán)田古樟景區(qū)、亞洲最大的野生鴛鴦越冬棲息地鴛鴦湖景區(qū)和適宜體驗(yàn)婺源秋色的長(zhǎng)溪村都是較為安靜清幽的旅游地點(diǎn),相對(duì)來(lái)說(shuō)旅游的簽到熱度不高。
圖2 婺源縣游客微博簽到密度圖
為了更好地分析婺源縣的旅游簽到數(shù)據(jù),根據(jù)氣候劃分的方法進(jìn)行季節(jié)劃分,春季為3月、4月、5月,夏季為6月、7月、8月,秋季為9月、10月、11月,冬季為12月、1月、2月。圖3表明春秋季節(jié)的簽到率明顯高于冬夏季節(jié),春季是出游簽到最為頻繁的季節(jié),簽到率最高,達(dá)到了41%。每個(gè)季節(jié)外地游客簽到量都遠(yuǎn)高于本地游客簽到量,尤其是春季,外地游客簽到量達(dá)到春季游客簽到總量的94%。主要是因?yàn)榇杭镜慕瓗X萬(wàn)畝梯田油菜花海、篁嶺五彩鮮花小鎮(zhèn)、繽紛櫻花等景象是婺源鄉(xiāng)村旅游品牌的重要名片之一。每年的3—4月是婺源油菜花的花期,也是婺源旅游的最佳季節(jié)。秋季簽到率也是較高的,達(dá)到全年簽到量的35%。秋季的“曬秋人家”是婺源特色極強(qiáng)的一種農(nóng)俗景觀,也入選了“最美中國(guó)符號(hào)”。秋季石城和長(zhǎng)溪的紅楓葉指數(shù)較高,進(jìn)入攝影佳期,也是大眾觀賞比較好的時(shí)期。婺源北線的自然山脈、沿線公路、村落的紅葉更是吸引了許多游客進(jìn)行自駕觀賞游玩。冬季簽到量略低于夏季,簽到總量是4個(gè)季節(jié)當(dāng)中的最低點(diǎn),說(shuō)明游客在冬季出游的情況相對(duì)較少,活躍度較低。主要是因?yàn)槭艿綒夂虻挠绊?,冬季出游的交通不便。?duì)于本地游客來(lái)說(shuō),每個(gè)季節(jié)的簽到量相差并不大,簽到率也是春季最高,冬季最低。
圖3 婺源縣游客簽到數(shù)量季節(jié)性分布情況
將婺源縣2012—2020年的所有有效旅游簽到數(shù)據(jù)按照每年12個(gè)月份的簽到數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,獲取各個(gè)月份在每個(gè)年度的簽到占比情況。圖4顯示2012—2019年的每年3月、4月份是旅游簽到率都相對(duì)較高的月份,居于10%~30%之間。2012—2019年每年3月份和10月份的旅游簽到率相差并不大,占比率也較高,都在10%~25%之間。可以看出每年春秋季節(jié)的3月、4月和10月都是游客活躍度最高的月份,4月份簽到率最高的一年是2013年,達(dá)到29.35%。每年的1月、2月、6月、7月、8月、9月和12月的簽到率相對(duì)其他月份較低,都在10%以下。由于2020年只獲取到6月1日的簽到數(shù)據(jù),因此3月份和5月份的簽到率都相對(duì)較高,分別為34.97%和28.22%。
圖4 婺源縣2012—2020年各月份旅游簽到占比情況
在所獲取的婺源縣旅游簽到用戶信息當(dāng)中包括用戶ID、用戶的所在地、用戶性別、用戶注冊(cè)時(shí)間、用戶發(fā)文總量、用戶等級(jí)等各項(xiàng)具體信息,可以用來(lái)分析旅游簽到用戶的特征。為了分析婺源縣旅游簽到用戶的特征,選取用戶所在地、用戶性別、用戶注冊(cè)時(shí)間這3個(gè)內(nèi)容進(jìn)行簡(jiǎn)單地描述和分析,以獲取婺源縣簽到游客的特征。
2.4.1 游客來(lái)源特征 由于之前已經(jīng)將海外游客以及用戶歸屬地不明確的簽到信息進(jìn)行了篩選,因此這里分析的是婺源縣的國(guó)內(nèi)游客來(lái)源特征,共包括省份及直轄市34個(gè)(圖5)。游客來(lái)源地最為集中的10個(gè)地方分別是江西省內(nèi)、北京市、浙江省、上海市、廣東省、江蘇省、上饒本地、湖北省、福建省、山東省,這10個(gè)地方的游客客源量都超過(guò)1 000??梢?jiàn)婺源縣除了對(duì)于本省內(nèi)地區(qū)的游客吸引力較大,還對(duì)北京、浙江、上海、廣州等經(jīng)濟(jì)實(shí)力穩(wěn)定和旅游發(fā)展迅速的大城市的游客吸引力較強(qiáng)。而游客來(lái)源地較少的地方是香港、寧夏、澳門和青海等地區(qū),來(lái)自港澳地區(qū)的游客出行相對(duì)來(lái)說(shuō)沒(méi)有境內(nèi)游客那么便利,而寧夏和青海雖然處于中國(guó)境內(nèi),但是位于西北偏遠(yuǎn)地區(qū),距離婺源縣較為遙遠(yuǎn),旅游交通并不方便。對(duì)于這些地區(qū)的游客來(lái)說(shuō),將婺源當(dāng)作旅游目的地的意愿并不強(qiáng),也說(shuō)明婺源縣旅游對(duì)于這些地區(qū)的吸引力相對(duì)要弱一些。
圖5 婺源縣簽到客源分布情況
2.4.2 游客性別特征 婺源縣旅游簽到用戶的性別特征較為明顯(圖6),不同季節(jié)下不同性別的游客量差異較大,而且基本上都是女性游客量遠(yuǎn)高于男性游客量,說(shuō)明女性游客微博簽到的活躍度高于男性游客。并且從季節(jié)簽到頻率來(lái)看的話,男女性游客都呈現(xiàn)春秋季節(jié)簽到率高于冬夏季節(jié)的簽到率的趨勢(shì)。但是從季節(jié)分布上來(lái)看,冬季男女性游客的簽到量基本持平,夏季女性游客簽到量稍高于男性游客,春秋季節(jié)女性游客簽到量差不多是男性游客簽到量的2倍,女性游客的活躍度遠(yuǎn)遠(yuǎn)超過(guò)男性游客的活躍度。
圖6 2012-2020年婺源簽到用戶不同季節(jié)的性別特征對(duì)比圖
從游客注冊(cè)時(shí)間來(lái)看(圖7),最早開(kāi)始注冊(cè)新浪微博的時(shí)間是2009年,最新注冊(cè)時(shí)間是2020年。從微博門戶網(wǎng)站興起開(kāi)始就有用戶在新浪微博注冊(cè),并且在婺源縣的旅游景區(qū)景點(diǎn)打卡簽到。2009年男性注冊(cè)游客略多于女性注冊(cè)游客,距今來(lái)算注冊(cè)年限已達(dá)到11 a,是新浪微博的資深用戶。2009年的男女性注冊(cè)游客相對(duì)較少,主要是因?yàn)楫?dāng)時(shí)微博剛剛開(kāi)始運(yùn)營(yíng),還未進(jìn)入廣泛群眾的視野當(dāng)中。而從2010年開(kāi)始微博的概念得到了廣泛的傳播,各大門戶網(wǎng)站也在這一年紛紛開(kāi)通微博,中國(guó)的微博呈現(xiàn)高速增長(zhǎng)的態(tài)勢(shì)。同樣,就婺源縣旅游簽到用戶情況來(lái)看,2010年男女性游客微博注冊(cè)量猛增,男女性注冊(cè)游客都較2009年相比呈爆炸性增長(zhǎng)狀態(tài),2010年男女游客注冊(cè)總量是2009年的8倍,女性注冊(cè)游客從2009年的238人增加到2010年的2 880人,呈現(xiàn)10倍速增長(zhǎng)情況。2011年依然保持男女游客微博注冊(cè)量高增長(zhǎng)情況,男女性游客注冊(cè)數(shù)量都是從2009—2020年以來(lái)男女游客注冊(cè)數(shù)量的最高峰,女性注冊(cè)游客為3 757人,男性注冊(cè)游客為1 951人。2011年之后男女游客注冊(cè)量都呈現(xiàn)下降趨勢(shì),從2010—2016年都是女性注冊(cè)游客數(shù)量高于男性注冊(cè)游客,2017—2020年則是男性注冊(cè)游客數(shù)量稍高于女性注冊(cè)游客數(shù)量。
圖7 婺源縣微博簽到游客注冊(cè)時(shí)間的性別特征對(duì)比表
根據(jù)獲取的婺源縣旅游簽到大數(shù)據(jù)來(lái)看,可以簡(jiǎn)單分析游客簽到的特征和游客的具體信息特征。從總體游客簽到特征來(lái)看,婺源縣游客簽到總量基本呈現(xiàn)逐年遞增的狀態(tài),女性簽到總量高于男性簽到總量,外地游客簽到量遠(yuǎn)高于本地游客。婺源縣游客簽到密度分布不均,主要的簽到密集點(diǎn)基本上是集中在理坑、思溪延村、石城紅楓、彩虹橋、江灣、李坑、江嶺等重要的景區(qū)范圍內(nèi)。作為中國(guó)最美鄉(xiāng)村,婺源縣春季有萬(wàn)畝油菜花田、秋季有滿山紅楓林,以及保存完好的明清徽派古建筑群等這些自然的旅游名片為鄉(xiāng)村旅游的發(fā)展奠定了良好的基礎(chǔ)。從游客簽到季節(jié)性特征來(lái)看,春季是游客活躍度最高的季節(jié),3月份和4月份的簽到率相對(duì)更高。從簽到用戶的來(lái)源特征來(lái)看,除江西省內(nèi)用戶,大部分婺源縣簽到的外地游客是來(lái)自北京市、浙江省、上海市和廣東省等經(jīng)濟(jì)相對(duì)發(fā)達(dá)的地區(qū),香港、澳門、寧夏和青海等地區(qū)的用戶相對(duì)較少。從性別特征來(lái)看,女性用戶總體多于男性用戶,可以看出女性相對(duì)男性來(lái)說(shuō)更加活躍,在婺源旅游簽到的數(shù)量也較多,尤其是在旅游旺季,出游簽到的可能性更高。因此婺源要加快塑造良好的旅游形象的步伐,加大旅游宣傳力度,尤其是對(duì)距離較遠(yuǎn)地區(qū)加強(qiáng)宣傳,以吸引更多的客源。在線路設(shè)計(jì)和景區(qū)建設(shè)等方面盡可能地多滿足女性游客的需求,增強(qiáng)女性游客的重游意愿;同時(shí)也要加強(qiáng)對(duì)男性游客的關(guān)注,致力于吸引更多的男性游客。在婺源旅游春秋旺季時(shí)做好基礎(chǔ)設(shè)施建設(shè)和旅游安全防范工作,注重婺源旅游品牌推廣,將鄉(xiāng)村旅游品牌越做越好;冬夏淡季時(shí)推出更多的旅游活動(dòng),例如門票優(yōu)惠、項(xiàng)目免費(fèi)體驗(yàn)等,激起淡季游客的活躍性。