王晨雨 常雪松 潘運偉 董宇恒 王彬汕
古典園林的服務對象在當代發(fā)生了顯著變化,從歷史上為少數達官顯貴服務變成為當代為人民大眾服務。由于服務對象發(fā)生變化,所以知名園林景區(qū)在高峰期發(fā)生擁堵擁擠的現象屢見不鮮。頤和園是中國古典園林的杰出代表,是北京古都文化旅游的核心景區(qū)之一,目前也存在高峰超載、客流時空分布不均等問題。本文以網絡大數據為基礎,揭示了頤和園游人空間分布特點和游線組織特征:第一,頤和園游人分布呈現北多南少,東多西少的特點;第二,游人線路組織主要有5條,其中北宮門——佛香閣——東宮門一線比例最大;第三,北宮門與佛香閣,長廊西與石舫,南湖島與十七孔橋三組景點的關聯度最大。
頤和園是中國古典園林的杰出代表,坐落在北京西郊,占地約290 hm2,是三山五園的核心組成部分。頤和園2017年接待1 700萬人次游人(含免票游人),是北京接待游人最多的景區(qū)。如此大的客流給頤和園的游人管理帶來極大壓力。一是高峰超載,小長假和黃金周期間日均接待游人量一般超過12萬人次,遠遠超過《頤和園總體規(guī)劃》所核定的日容量6.1萬人次游人量。二是時空分布不均,突出表現為北多南少,東多西少,同時核心景點游人超載,給遺產保護帶來比較大的隱患。
目前,學術界對頤和園的客流不平衡問題的關注較少。黃瀟婷(2009)研究了頤和園六類客流流向,但對游人的時空分布特點研究不足。她還以GPS追蹤調查的數據為基礎,比較了其與傳統(tǒng)的活動日志調查方法的利弊。黎巎(2014)運用Agent模型探索頤和園全園客流預測與調控的方法。本文結合《頤和園風景區(qū)總體規(guī)劃》編制工作,重點介紹在頤和園中運用大數據研究客流的技術方法和主要結論。
(一)數據來源
以全網游記數據為基礎,包括攜程、馬蜂窩、去哪兒、同程、窮游和貓途鷹等旅游網站抓取頤和園相關的游記文本素材,得到50 00余篇游記,共約300萬字文本素材。
(二)技術流程
技術流程步驟包括數據抓取、數據清洗、軌跡抽取和軌跡分析幾個部分。
1.數據抓取
利用八爪魚等網頁爬蟲工具獲取頤和園游記數據。首先了解每個游記網站的網頁結構,利用XPath導航找準網頁中的標題、正文和其它結構化數據的節(jié)點位置,并在爬蟲軟件中設置自動翻頁、列表循環(huán)、詳細頁進入、文本定位和數據抓取等流程,通過Ajax(主要用于頁面的異步加載)、休眠時間和特殊錨點定位等動作調試流程無誤后,進行頤和園游記數據的自動采集和抓取。
2.數據清洗
對游記文本數據進行本地篩選處理。刪除重復內容,刪除按照正則表達式抽取出的網站模板和廣告等無效數據,刪除過短或純符號等無意義素材,最后共得到的5 000余篇(即5 000余條行程),共約300萬字游記素材,保存為純文本格式文件。
3.軌跡抽取
利用excel進行軌跡抽取。將已經掌握的全部頤和園景點和停留節(jié)點作為行內容,將每一條行程作為列內容,利用find函數查找每個節(jié)點是否出現在每條行程中,以及出現的具體字節(jié)位置,根據出現的字節(jié)位置進行排序構成單條行程中的游人軌跡。對5000條行程進行相同操作,形成5 000條游人軌跡。如圖1所示。
4.軌跡分析
以客流軌跡線路圖為基礎,對客流軌跡進行聚類分析、軌跡密度分析、關聯力分析。其中,聚類分析可獲取游人的主要游線,軌跡密度分析能夠反映游人的空間分布特點,關聯力分析可以揭示兩兩景點之間的聯系強度。
(一)客流軌跡
通過聚類分析,排除明顯不合理的線路“噪音”后,共得出5條主要線路如下。
線路1:東宮門—長廊—佛香閣—萬壽山—蘇州街—北宮門。
線路2:北宮門—蘇州街—萬壽山—佛香閣—石舫—仁壽殿—十七孔橋—新建宮門。
線路3:新建宮門—南湖島—石舫—長廊—仁壽殿—東宮門。
線路4:東宮門—長廊—石舫—長廊—東宮門。
線路5:南如意門—南湖島—文昌院—長廊—佛香閣—北宮門。
游人主要線路見圖1。
從客流軌跡反映的情況來看,主要有如下各個特點:線路1是游人選擇最多的游線,其次為線路4;經過西堤、山后地區(qū)的游覽線路比較少;游人出入口主要集中在北宮門、東宮門,新建宮門、南如意門次之。這些特點出現的主要原因在于地鐵4號線在北宮門設站,北京觀光三線的終點站也位于北宮門。東宮門是頤和園正門,一般游人會選擇東宮門出入頤和園,另外東宮門外有公交場站和停車場,游人來此也比較方便,因此,從東宮門出入的游人較多。新建宮門距離頤和園核心景點南湖島較近,因此,也有不少游人選擇從新建宮門出入。從南如意門出入的游人主要來自于長河、昆玉河游船的游人。
(二)客流密度
從客流軌跡密度來看,主要呈現如下幾個特點。
首先,頤和園客流整體呈現北密南疏,東多西少的特點。客流軌跡密度見圖2。
其次,圖2中的線路1是游人最多的一條線路,即北宮門—蘇州街—佛香閣—長廊—東宮門。
最后,所有游線都經過長廊一線,這也是造成長廊旅游高峰期較為擁堵的重要原因。除此之外,當地的熱門景點還有南湖島、玉瀾堂、東宮門等,在旅游旺季,過大的游客量給文物和遺產保護帶來較大壓力。
(三)景點關聯度
關聯景點反映的是游人線路組織過程中的景點聯系強度特征。從圖3反映的情況來看,主要有3組關聯度比較密切的景群,分別是北宮門—佛香閣、長廊西—石舫、南湖島—十七孔橋。此外,北宮門—石舫、北宮門—長廊西、北宮門—東宮門和新建宮門—十七孔橋等景點的聯系度也比較緊密。
景點間聯系越緊密,2個景點間聚集的游人密度就越高,基于微博數據所作的游人熱力圖也直接證明了這點(圖4)。上述3組關聯度比較強烈的景點,極易在旅游高峰期形成擁堵,需要相關人員在實際管理中妥善應對,以保障旅游安全和遺產安全。
本文以網絡大數據為基礎,揭示了頤和園游人空間分布特點和游線組織特征。作為一種新的技術方法,網絡大數據技術具有數據開放、展示直觀、費用低廉等優(yōu)點,能夠有效展示游人分布特征和游線組織形式,無論在古典園林規(guī)劃設計,還是在園林和公園管理方面都具有非常重大的意義。在古典園林規(guī)劃設計方面,其分析結果能夠為空間和線路調整提供支撐;在園林和公園管理方面,能夠促進古典園林和公園管理升級,從而提高游人的游覽品質。
網絡大數據在揭示游人空間部分方面具有一定優(yōu)勢,通過頤和園的案例可知,其也呈現出較好的效果。其不足之處在于以下幾點。第一,數據的有效性問題。目前一些旅游網站上存在營銷“軟文”的現象,即不是真實的游人所寫的文章,這部分數據會對結果產生影響,但影響到何種程度還有待于進一步研究。第二,網絡大數據雖能夠比較好地反映空間方面的特征,但不能反映時間特征,未來人們可以結合手機信令的實時數據進行進一步優(yōu)化。
(作者單位:北京清華同衡規(guī)劃設計研究院有限公司旅游與風景區(qū)規(guī)劃所)