王 振,張志敏,李同飛,高 歌,禚保玲
(1.青島市城市規(guī)劃設(shè)計(jì)研究院,青島 266071;2.北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124;3.山東科技大學(xué) 交通學(xué)院,青島 266590)
國(guó)務(wù)院辦公廳2018年印發(fā)《國(guó)務(wù)院辦公廳關(guān)于促進(jìn)全域旅游發(fā)展的指導(dǎo)意見(jiàn)》,提出把促進(jìn)全域旅游發(fā)展作為推動(dòng)經(jīng)濟(jì)發(fā)展的重要抓手,以旅游業(yè)為優(yōu)勢(shì)產(chǎn)業(yè),統(tǒng)一規(guī)劃布局、優(yōu)化公共服務(wù)、加強(qiáng)綜合管理,有利于提升旅游業(yè)的現(xiàn)代化、品質(zhì)化、國(guó)際化,不斷滿足人民日益增長(zhǎng)的美好生活需要。青島,依山而居,與海相伴,是首批中國(guó)優(yōu)秀旅游城市,紅瓦綠樹(shù)、碧海藍(lán)天是城市最典型的特征。目前青島有110處2A級(jí)及以上景區(qū),嶗山風(fēng)景區(qū)為唯一的5A級(jí)景區(qū),海濱風(fēng)景區(qū)、海底世界、奧帆中心、極地海洋世界、石老人觀光園等24處為4A級(jí)景區(qū)(圖1)。全市旅游資源豐富,旅游業(yè)不僅是青島經(jīng)濟(jì)的支柱產(chǎn)業(yè),而且旅游服務(wù)體系健全,功能全面。
圖1 青島全市A級(jí)景區(qū)分布
國(guó)內(nèi)外學(xué)者以旅游景區(qū)為研究對(duì)象,通過(guò)景區(qū)統(tǒng)計(jì)數(shù)據(jù)、手機(jī)信令數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)等多種方式獲取客流數(shù)據(jù),分析游客出行行為特征和空間分布規(guī)律。馬斌斌等[1]運(yùn)用社交網(wǎng)絡(luò)大數(shù)據(jù),運(yùn)用核密度分析方法揭示旅游流的時(shí)空分布特征,揭示了旅游流軌跡和游客行為偏好,為科學(xué)規(guī)劃旅游線路提供了參考;賈鐵飛等[2]通過(guò)現(xiàn)場(chǎng)訪談獲取訪滬游客的時(shí)間和空間數(shù)據(jù),并依此探討旅游者的空間行為規(guī)律;MOU N等[3]以去哪兒網(wǎng)網(wǎng)站中公開(kāi)的游客網(wǎng)絡(luò)游記作為初始數(shù)據(jù),采集每篇游記的用戶ID(Identity Document)、游記ID、出發(fā)日期以及游覽景點(diǎn)的POI(Point of Interest)序列等信息,并通過(guò)一定的規(guī)則獲取游客游覽軌跡;陳方等[4]基于云南省公路包車數(shù)據(jù)和交通流數(shù)據(jù)分析全省范圍內(nèi)的旅游OD(Origin Destination)數(shù)據(jù),并進(jìn)行了旅游客流的空間行為模式識(shí)別,但忽略了自駕游等散客,樣本具有一定的局限性。以上研究均存在樣本量低、代表性差、時(shí)效性不足等諸多問(wèn)題。寧志中等[5]分析了2000年以來(lái)4個(gè)時(shí)間截面中國(guó)景區(qū)時(shí)空演變格局,但未考慮景區(qū)客流的影響,導(dǎo)致將旅游景區(qū)單體簡(jiǎn)化為空間點(diǎn)后分析的精度和準(zhǔn)確性降低。陳圣威等[6]通過(guò)建立旅游模型,并與閘機(jī)客流、視頻客流進(jìn)行對(duì)比,肯定了手機(jī)信令數(shù)據(jù)在游客流量監(jiān)控上的優(yōu)勢(shì),但同樣存在數(shù)據(jù)采樣頻率低、交通樞紐區(qū)域人流擾動(dòng)大等問(wèn)題。許丹丹等[7]基于南京智慧旅游監(jiān)測(cè)平臺(tái)數(shù)據(jù),分析了客流的年度變化、季節(jié)變化、時(shí)刻變化等不同時(shí)間尺度下的來(lái)寧客流時(shí)間分布特征,但無(wú)法進(jìn)行客流的軌跡追蹤,客流分析停留在景區(qū)層面上,缺少旅游出行OD的分析。羅秋菊等[8]采用網(wǎng)絡(luò)游記和照片作為“數(shù)字足跡”,提取游客的旅游時(shí)間和旅游節(jié)點(diǎn),深度剖析了入滇自駕游客的時(shí)空特征,為新數(shù)據(jù)應(yīng)用提供了參考。劉澤華等[9]選擇云南省典型景區(qū)為案例,分析黃金周內(nèi)客流時(shí)間分布特征,并研究了時(shí)間分布對(duì)區(qū)域空間結(jié)構(gòu)的響應(yīng)機(jī)制,但選擇不同時(shí)長(zhǎng)的假期進(jìn)行實(shí)證比較研究,可更好地揭示旅游客流的分布規(guī)律。李旭等[10]通過(guò)《中國(guó)旅游統(tǒng)計(jì)年鑒》等數(shù)據(jù),建立指標(biāo)評(píng)價(jià)體系,利用回歸模型分析入境游客目的地選擇偏好的主要影響因素。方家等[11]基于上海市手機(jī)信令數(shù)據(jù)對(duì)顧村櫻花節(jié)前后2周的客流進(jìn)行了對(duì)比,并嘗試對(duì)大客流進(jìn)行預(yù)警和跟蹤識(shí)別,但缺少個(gè)體屬性數(shù)據(jù),無(wú)法顯現(xiàn)個(gè)體時(shí)空行為。旅游客流數(shù)據(jù)大多來(lái)自機(jī)構(gòu)的統(tǒng)計(jì)靜態(tài)數(shù)據(jù),缺少出行個(gè)體的屬性信息,難以回溯個(gè)體出行軌跡。因此,本文以2018年十一黃金周期間的手機(jī)信令數(shù)據(jù)為基礎(chǔ),研究游客的軌跡出行鏈,并以此進(jìn)行客流的時(shí)間和空間分析。
手機(jī)信令數(shù)據(jù)是手機(jī)用戶在發(fā)生通訊活動(dòng)(通話、短信)或服務(wù)區(qū)切換(位置移動(dòng))等事件時(shí),被運(yùn)營(yíng)商的通信基站捕獲并記錄的數(shù)據(jù),通常包含個(gè)體ID、時(shí)間、空間位置等字段屬性,信令記錄發(fā)生的時(shí)間和頻率極不規(guī)則,與用戶的活躍程度密切相關(guān)。信令數(shù)據(jù)空間分辨率多為基站,一般為400~1000 m,時(shí)間分辨率則可精確到秒,經(jīng)脫密、脫敏等處理后可用于居民行為偏好、移動(dòng)軌跡分析、城鎮(zhèn)空間布局等研究。
筆者獲取了青島市全市范圍內(nèi)中國(guó)移動(dòng)用戶2018年的手機(jī)數(shù)據(jù),大小約為200 GB。數(shù)據(jù)字段主要包括:msid(加密處理后的設(shè)備唯一編碼)、Cell_ID(基站編號(hào))、LNG(經(jīng)度)、LAT(緯度)、Timestamp(時(shí)間戳)。運(yùn)用大數(shù)據(jù)處理平臺(tái)Hadoop,分析2018年十一黃金周期間手機(jī)信令定位數(shù)據(jù),得到游客時(shí)空分布指標(biāo)。
手機(jī)信令數(shù)據(jù)反推出行規(guī)律的核心在于獲取出行鏈,在算法中設(shè)置邊界條件,根據(jù)一定的判定原則進(jìn)行篩選,運(yùn)用多條件聯(lián)合判定方法提高識(shí)別的精度。在具體算法設(shè)計(jì)上,首先通過(guò)吳子嘯[12]提到的時(shí)空收斂算法得到所有出行個(gè)體的出行鏈數(shù)據(jù)。針對(duì)旅游客流出行鏈的識(shí)別,首先進(jìn)行數(shù)據(jù)預(yù)處理,包括無(wú)效數(shù)據(jù)、乒乓數(shù)據(jù)以及漂移數(shù)據(jù)的識(shí)別和剔除。其次針對(duì)手機(jī)用戶進(jìn)行邊界條件的確定和篩選,即邊界確認(rèn)、時(shí)間確認(rèn)、流動(dòng)人口篩選、過(guò)境人口篩選、有效記錄篩選等(圖2)。
圖2 數(shù)據(jù)處理技術(shù)路線
考慮到旅游景區(qū)尤其是A級(jí)景區(qū)一般都相對(duì)獨(dú)立,能夠通過(guò)既有邊界或者道路、山川、河流等圍合區(qū)域進(jìn)行界定,因此,只要用戶的手機(jī)在景區(qū)內(nèi)發(fā)生過(guò)基站觸發(fā),就提取該用戶在國(guó)慶期間所有的信令數(shù)據(jù)作為游客出行鏈備選數(shù)據(jù)集。同時(shí)由于景區(qū)范圍的開(kāi)放性和定位誤差的存在,景區(qū)基站定位的手機(jī)用戶可能包含周邊常住人口、過(guò)境人員以及工作人員等非旅游客流,基于此,本研究采取選取特定時(shí)段如國(guó)慶黃金周,篩除常住人口,僅保留流動(dòng)人口,剔除信令定位時(shí)間連續(xù)性較差、定位次數(shù)達(dá)不到相應(yīng)閾值的用戶等措施進(jìn)行解決景區(qū)定位數(shù)據(jù)中用戶屬性為非游客的問(wèn)題。進(jìn)一步,通過(guò)將游客出行鏈備選數(shù)據(jù)集按照空間聚類算法處理后即可得到游客個(gè)體出行鏈。
在具體的數(shù)據(jù)處理過(guò)程中,需要格外注意以下2個(gè)方面??紤]到分析對(duì)象為外地游客,前期分析成果中屬性為常住人口的用戶需從游客出行鏈備選數(shù)據(jù)集中刪掉,在保留的流動(dòng)人口中,同樣存在如商務(wù)、就醫(yī)等不同的出行目的,因此需要將整個(gè)國(guó)慶期間定位次數(shù)小于一定閾值的用戶作為非活躍的個(gè)體,其與游客自身流動(dòng)性較大的特征不符,需要將其剔除;針對(duì)同一個(gè)用戶,如果在景區(qū)內(nèi)定位的相鄰2條記錄時(shí)間差大于12 h,則可能為過(guò)境客流、通勤客流等,同樣需要將其從備選數(shù)據(jù)集中剔除。
考慮到青島濱海景區(qū)通常為免費(fèi)的自然岸線資源,分布具有集聚連綿的特點(diǎn),景區(qū)之間邊界不明顯,游客往往一并游覽多個(gè)景區(qū),為便于統(tǒng)計(jì)分析,將其按照灣區(qū)屬性劃分為青島灣景區(qū)、匯泉灣景區(qū)以及浮山灣景區(qū),以下簡(jiǎn)稱三灣區(qū)域(圖3)。研究以2018年青島市國(guó)慶期間的手機(jī)信令數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),通過(guò)現(xiàn)狀用地?cái)?shù)據(jù)、地圖查詢等手段劃定旅游景區(qū)空間邊界,運(yùn)用大數(shù)據(jù)處理算法進(jìn)行訪青游客的旅游行為空間特征分析。
圖3 三灣區(qū)域位置分布注:青島灣景區(qū)包含棧橋、海軍博物館、小青島景區(qū)等;匯泉灣景區(qū)包含匯泉廣場(chǎng)、第一海水浴場(chǎng)、八大關(guān)景區(qū)、中山公園等;浮山灣景區(qū)包含五四廣場(chǎng)、奧帆基地、銀海大世界等
青島的景區(qū)資源可以分為自然景觀類、人文景觀類和主題類景區(qū)。自然景觀類景區(qū)集中在沿海一線,如棧橋、太清宮、海水浴場(chǎng)、嶗山、小魚(yú)山等;人文景觀類以名人故居為主,如沈從文故居,洪深故居等;主題類公園如極地海洋世界、世園會(huì)、枯桃花藝生態(tài)園等。分析發(fā)現(xiàn),不同類型的景區(qū)客流呈現(xiàn)不同的時(shí)變特性,如圖4所示。自然景觀類景區(qū)按照距離市區(qū)遠(yuǎn)近可以分為兩類,一類位于距離市區(qū)較遠(yuǎn)的郊區(qū),客流分布曲線呈現(xiàn)單高峰形態(tài),峰值一般出現(xiàn)在12:00—14:00,如嶗山景區(qū)、珠山景區(qū);另一類為位于沿海一線的市區(qū)核心位置,雙高峰明顯,中午由于高溫、餐飲等因素,景區(qū)客流減少顯著,如石老人景區(qū)、唐島灣景區(qū)等。主題類景區(qū)分為室內(nèi)和室外兩種類型,其中室內(nèi)主題類景區(qū)門票相對(duì)較高,吸引的客流多為首次到訪,客流高峰時(shí)段集中在11:00—13:00,如極地海洋世界;與之相反,室外主題類景區(qū)門票相對(duì)較低,客流多分布在周邊區(qū)域,年票、月票占比較高,客流時(shí)間分布較為均衡,呈波浪起伏形態(tài),如枯桃花藝生態(tài)園。人文景觀類景區(qū)占地面積較小,同時(shí)手機(jī)信令基站覆蓋范圍一般在500 m左右,不能滿足對(duì)人文景觀類景區(qū)客流分析的精度要求,故不作分析。
來(lái)青游客以觀光旅游為主,高端休閑度假發(fā)展?jié)摿薮蟆;?018年國(guó)慶期間手機(jī)信令數(shù)據(jù)識(shí)別的近5萬(wàn)人次游客統(tǒng)計(jì)發(fā)現(xiàn),客流主要集中在海岸資源豐富、自然風(fēng)光優(yōu)美的三灣區(qū)域,約60%的游客會(huì)到訪棧橋、海軍博物館等青島灣標(biāo)志性景區(qū),一半左右的游客在浮山灣和匯泉灣打卡五四廣場(chǎng)、八大關(guān)、奧帆基地、中山公園等景點(diǎn),游客在欣賞美麗濱海風(fēng)景的同時(shí),缺少美好生活的體驗(yàn),持續(xù)性消費(fèi)和重復(fù)消費(fèi)的可能性較小。以“農(nóng)家樂(lè)”“民宿游”為主的度假游產(chǎn)品較為稀缺,難以把游客“留下來(lái)”,統(tǒng)計(jì)發(fā)現(xiàn)不足1/4的游客會(huì)選擇游覽“海上第一名山”嶗山風(fēng)景區(qū),僅有約13%的游客會(huì)經(jīng)膠州灣海底隧道到達(dá)西海岸新區(qū)游覽“亞洲第一灘”金沙灘景區(qū)。
從景區(qū)客流空間結(jié)構(gòu)上看,景區(qū)空間規(guī)劃需依托核心景區(qū),按照發(fā)展全域旅游的要求,部署基礎(chǔ)設(shè)施和公共服務(wù)設(shè)施,配置旅游產(chǎn)品和景區(qū),推進(jìn)“景城一體化發(fā)展”。通過(guò)手機(jī)信令數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),目前,3個(gè)灣區(qū)之間互動(dòng)效應(yīng)明顯,灣區(qū)客流出行量約占全域旅游出行總量的50%以上,其中匯泉灣與青島灣間的客流出行量最大,約占全域旅游出行量的25%,匯泉灣與浮山灣占比15%,浮山灣與青島灣占比為10%,如圖5所示。從開(kāi)發(fā)模式上看,整個(gè)區(qū)域需要統(tǒng)籌規(guī)劃、建設(shè)、管理和營(yíng)銷,按照全地域覆蓋、全資源整合、全領(lǐng)域互動(dòng)的原則,深入開(kāi)展全域旅游建設(shè);但從手機(jī)數(shù)據(jù)統(tǒng)計(jì)來(lái)看,在3個(gè)灣區(qū)客流的強(qiáng)大推力下,到訪其他景區(qū)諸如嶗山、青島極地海洋世界、金沙灘景區(qū)的旅游出行量占比僅為7%,6%和5.6%,因此外圍景區(qū)在強(qiáng)化自身吸引力的同時(shí),需更加注重景區(qū)之間的互動(dòng)作用。
圖5 旅游客流交換量分析
游客規(guī)模已經(jīng)不是衡量景區(qū)發(fā)展的唯一標(biāo)準(zhǔn),讓游客留下來(lái)、住下來(lái)更是核心要義。目前,青島城郊游客駐留時(shí)間較長(zhǎng),住宿、交通、娛樂(lè)、商業(yè)設(shè)施配套要求較高;城區(qū)游客集中在濱海岸線,受岸線保護(hù)影響,商業(yè)開(kāi)發(fā)難以滿足不同層次旅游群體消費(fèi)需求。分析發(fā)現(xiàn),游客平均訪問(wèn)景區(qū)數(shù)目為2.42個(gè),在城郊景區(qū)如大珠山風(fēng)景名勝區(qū)、青島羊毛溝花海濕地的平均駐留時(shí)間達(dá)7 h;浮山灣、青島灣、匯泉灣景區(qū)數(shù)量眾多,游客多以打卡拍照為主,“上車坐一坐,下車拍一拍”的跟團(tuán)游體驗(yàn)較差,統(tǒng)計(jì)手機(jī)信令數(shù)據(jù)發(fā)現(xiàn),游客目前平均逗留時(shí)間約為3 h。
高附加值旅游產(chǎn)品和特色服務(wù)項(xiàng)目相對(duì)缺乏,留不住客人,消費(fèi)難以帶動(dòng)。來(lái)青游客平均停留2.81 d,較上海市3.13 d來(lái)說(shuō)相對(duì)較短[4]。因此,青島需在大力發(fā)展全域旅游的同時(shí),堅(jiān)持規(guī)劃先行,在交通設(shè)施、機(jī)制創(chuàng)新、人才培養(yǎng)和特色產(chǎn)品培育等方面加大投入力度,努力讓游客在青“多消費(fèi)、多逗留”。
基于2018年國(guó)慶黃金周期間青島市手機(jī)信令數(shù)據(jù),運(yùn)用Hadoop處理平臺(tái)得到居民出行的出行鏈,通過(guò)分析景區(qū)客流的時(shí)間和空間分布特征得到以下結(jié)論。
1) 不同類型的景區(qū)呈現(xiàn)不同的時(shí)變特征,市區(qū)優(yōu)質(zhì)旅游資源呈現(xiàn)中心化聚集態(tài)勢(shì),3個(gè)灣區(qū)之間的旅游出行約占總出行的50%,龍頭帶動(dòng)作用顯著,但對(duì)外圍輻射力度不夠,導(dǎo)致來(lái)青游客駐留時(shí)間相對(duì)較短,平均為2.81 d,景區(qū)線路難以縱深拓展,應(yīng)多措并舉加強(qiáng)景區(qū)之間的互動(dòng)作用。
2) 市郊景區(qū)客流呈現(xiàn)單高峰形態(tài),“農(nóng)家樂(lè)”“民宿游”等旅游度假產(chǎn)品較為稀缺,難把游客“留下來(lái)”。
3) 與傳統(tǒng)方法相比,以手機(jī)信令數(shù)據(jù)為基礎(chǔ),以機(jī)器學(xué)習(xí)等算法為工具具有客觀、時(shí)效高、成本低的特點(diǎn),伴隨著旅游市場(chǎng)的不斷散客化、大眾化、網(wǎng)絡(luò)化,利用旅游個(gè)體數(shù)據(jù)進(jìn)行旅游時(shí)空特征分析研究對(duì)于景區(qū)管理和理論創(chuàng)新具有重要指導(dǎo)意義。但手機(jī)信令數(shù)據(jù)基站定位精度市區(qū)范圍在200~500 m之間,相鄰景區(qū)客流的識(shí)別尚不夠精確,下一步可結(jié)合百度、騰訊等互聯(lián)網(wǎng)企業(yè)基于GPS的位置定位數(shù)據(jù)(LBS)進(jìn)一步減小游客定位的誤差。