任宇杰,郭乃靜,馬 坤,唐曉嵐
(南京林業(yè)大學(xué) 風(fēng)景園林學(xué)院,江蘇 南京210037)
隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)通信技術(shù)的快速發(fā)展改變了游客選擇旅游目的地的方式,互聯(lián)網(wǎng)出行模式極大增加了游客進行旅游活動的自主性,也使得中國旅游景區(qū)的受關(guān)注程度(熱度)的空間分布特征發(fā)生了巨大改變。為了適應(yīng)這一改變趨勢,以研究區(qū)域風(fēng)景區(qū)等級體系及其空間分布網(wǎng)絡(luò)為主要方向的旅游地理學(xué)科在研究方法與內(nèi)容兩方面取得了新的進展,集中表現(xiàn)為利用互聯(lián)網(wǎng)開放社區(qū)為平臺,結(jié)合數(shù)據(jù)分析處理技術(shù)對網(wǎng)絡(luò)世界中的虛擬空間和現(xiàn)實地理空間交叉研究。阮文奇等運用Ucinet6.0軟件、社會網(wǎng)絡(luò)分析法和引力修正模型計算福建省的旅游網(wǎng)絡(luò)權(quán)力,并結(jié)合旅游經(jīng)濟地位進行耦合分析[1];曲靜等提出“旅游數(shù)字足跡”的信息化概念,運用社會網(wǎng)絡(luò)法分析甘肅省外地散客旅游流的時空及網(wǎng)絡(luò)結(jié)構(gòu)特征[2];馬麗君等以網(wǎng)絡(luò)數(shù)據(jù)為切入點,計算研究了中國省際入境旅游經(jīng)濟增長空間關(guān)聯(lián)性[3];劉大均等抓取新浪微博用戶、博文信息,分析研究了中國旅游微博空間分布格局及影響因素[4]??傮w來說,大數(shù)據(jù)時代背景下,國內(nèi)外學(xué)者研究總結(jié)區(qū)域?qū)用媛糜位顒右?guī)律的較多,而利用新興的社交旅游平臺數(shù)據(jù)研究全國范圍內(nèi)專項旅游景區(qū)熱度空間分布特征的較少。
攜程旅游網(wǎng)是中國領(lǐng)先的社交旅游服務(wù)平臺,1999年成立于上海。網(wǎng)站注冊會員可以在交流互動平臺自由發(fā)表對旅游景區(qū)的評論和旅游日記,評價數(shù)據(jù)經(jīng)網(wǎng)站分類處理后可以為網(wǎng)站的其他瀏覽者提供較為客觀,準確的評價信息。截至到2017年11月,攜程旅游網(wǎng)活躍用戶數(shù)超過5 000萬?!奥糜喂ヂ陨鐓^(qū)”作為攜程網(wǎng)中最受用戶歡迎的板塊,已經(jīng)成為國內(nèi)影響力最大的旅游行為決策與熱度分析數(shù)據(jù)庫。國家地質(zhì)公園是由中華人民共和國國務(wù)院國土資源部正式批準授牌,用于保護珍貴、不可再生的地質(zhì)自然遺產(chǎn)的公園,一直以來都是游客出行的首選旅游目的地之一?;诖?,本文嘗試利用攜程旅游網(wǎng)的景區(qū)評價數(shù)據(jù),以國家地質(zhì)公園為例,對全國范圍內(nèi)的旅游景區(qū)熱度空間分布特征和結(jié)構(gòu)網(wǎng)絡(luò)進行初步探索。
本文借助網(wǎng)絡(luò)爬蟲工具(Python)對攜程旅游網(wǎng)“旅游攻略社區(qū)”中7個批次,241個國家地質(zhì)公園①截止至2017年9月,國土資源部一共公布七批共206家(其中1家位于香港特別行政區(qū))國家地質(zhì)公園。本文中涉及的241家國家地質(zhì)公園包含:205家(不包含港澳臺地區(qū))國土資源部公布的正式國家地質(zhì)公園和36家取得國家地質(zhì)公園資格的地質(zhì)公園(即國家地質(zhì)公園試點)。的共計120 914條用戶評價信息進行抓取、分類(本文研究案例中包含的數(shù)據(jù)大致分為13類:游友點評條、微博點評條數(shù)、公園團購項目數(shù)量、“去過”公園的人數(shù)、游客瀏覽總數(shù)、“想去”公園的人數(shù)、公園景色美觀度評分、推薦景觀的總次數(shù)、公園趣味性評分、公園性價比評分、公園票價、公園總體評分、公園特色服務(wù)評分),并對所有數(shù)據(jù)歸一化處理,公式如下
式中,Sij'為分類完成后第i類數(shù)據(jù)中第j個的歸一化處理結(jié)果,Sij為分類完成后第i類數(shù)據(jù)中第j個的數(shù)據(jù)采集值,max(Sij)為第i類數(shù)據(jù)中j個采集數(shù)據(jù)的最大值,對數(shù)據(jù)歸一化處理可以增加后期主成分分析法的科學(xué)性。
為了提高中國國家地質(zhì)公園熱度評價體系的科學(xué)性,首先要對歸一化處理過后的數(shù)據(jù)進行適用性檢驗,將統(tǒng)計數(shù)據(jù)帶入SPSS軟件,借助Bartlett球形鑒定和Kaiser-Meyer-Olkin檢驗方法分析檢驗計算[5]。檢測結(jié)果(見表1)KMO測量取樣適當(dāng)性為0.85,Bartlett的球形鑒定顯著性值為0.00,說明適合作為本研究的基礎(chǔ)數(shù)據(jù)。
表1 Bartlett球形鑒定和Kaiser-Meyer-Olkin檢驗結(jié)果
接著采用方差極大法對因子載荷矩陣實行正交旋轉(zhuǎn)以使因子具有命名解釋性并進行主成份分析,分析結(jié)果表明:采集的13類原始數(shù)據(jù)中可以進一步提取出公園直接人氣、公園潛在人氣、公園景觀美感度、公園性價比、公園趣味性、公園滿意度6個主成分(見表2)。且這6個主成分中:公園直接人氣、公園景觀美感度、公園性價比、公園滿意度在第一因子有較高載荷,可以較為明確地解釋國家地質(zhì)公園的熱度分布狀況[6]。
進一步分析熱度評級體系中四個主成份在回歸方程中的系數(shù),公園直接人氣、公園景觀美感度、公園滿意度三大成分的回歸方程系數(shù)為正值,公園性價比成分的回歸方程系數(shù)為負值。這反映出與國家地質(zhì)公園熱度關(guān)聯(lián)度較大的因素是公園直接人氣、公園景觀美感度和公園滿意度,而公園性價比則與國家地質(zhì)公園的熱度相關(guān)性不強。
表2 中國國家地質(zhì)公園熱度評價指標體系
為了探究中國國家地質(zhì)公園熱度等級結(jié)構(gòu),用SPSS軟件對統(tǒng)計數(shù)據(jù)進行K-means聚類分析,結(jié)果如圖1所示。由國家地質(zhì)公園熱度得分分布曲線,確定聚類數(shù)量為5個。以此為依據(jù)將國家地質(zhì)公園熱度劃分為5個等級:第一級包括4個國家地質(zhì)公園,熱度得分值在5.77~14.45之間,此等級國家地質(zhì)公園數(shù)量稀少,曲線曲率約為90°;第二等級的國家地質(zhì)公園有19處,熱度得分值在1.76~5.76之間,該等級國家地質(zhì)公園數(shù)量仍然較少,對應(yīng)分值曲線曲率接近60°;第三等級的國家地質(zhì)公園有30處,數(shù)量較前兩個等級稍有上升,熱度得分值在0.62~1.75之間,曲線曲率約為45°;第四等級包含49處國家地質(zhì)公園,熱度得分值在0.19~0.61之間,分值斜率約為30°,較為平緩,但下降幅度仍然較大;第五等級的國家地質(zhì)公園數(shù)量最大,達131個,熱度得分值都分布在0.61以下,這些國家地質(zhì)公園熱度得分值對應(yīng)的曲線斜率約等于0°,下降平緩。
以國家地質(zhì)公園發(fā)布批次劃分熱度等級結(jié)構(gòu),由圖2中柱狀分布可知,不同批次的國家地質(zhì)公園熱度存在顯著差異:前三批次國家地質(zhì)公園熱度較高且依次遞減,第四批次至第七批次的國家地質(zhì)公園熱度明顯低于前三批次,且沒有顯著的變化趨勢,均維持在0.3左右的較低水平左右。
圖1 中國國家地質(zhì)公園熱度綜合得分分布曲線
圖2 各批次中國國家地質(zhì)公園熱度綜合得分
在Bing地圖上統(tǒng)計中國7個批次,共計241個國家地質(zhì)公園的詳細地址,使用PowerMap軟件對其分布特征進行分析,生成國家地質(zhì)公園的空間分布圖和空間分布核密度圖(見圖3和圖4),可以發(fā)現(xiàn)中國國家地質(zhì)公園的總體空間分布具有以下特征:中國國家地質(zhì)公園的空間分布總體呈現(xiàn)“東密西疏”的空間分布特征,具有顯著的階梯狀分布格局。截至最新公布的第七批次國家地質(zhì)公園名單,分布于東部地區(qū)的國家地質(zhì)公園有78個,占有全國的32.4%;中部地區(qū)的國家地質(zhì)公園有95個,占有全國的39.4%;西部地區(qū)的國家地質(zhì)公園有68個,占有全國的28.2%。此外,中國國家地質(zhì)公園主要分布在胡煥庸線(黑河-騰沖線)以東,共計183個,占全國的75.9%,該線以西國家地質(zhì)公園數(shù)量稀少,共計58個,僅占全國的24.1%,可見中國國家地質(zhì)公園的分布與地理因素相關(guān)想較強。胡煥庸線是我國重要的人口地理分界線,該線東、西地區(qū)的地理環(huán)境因素差異明顯[7]。胡煥庸線以東地區(qū)自然環(huán)境相對較好,經(jīng)濟社會發(fā)展水平相對較高,人口稠密,旅游業(yè)發(fā)展水平較高,國家級公園、景區(qū)建設(shè)體系完善;而該線以西地區(qū)自然環(huán)境較為惡劣,經(jīng)濟社會發(fā)展水平較為滯后,人口分布稀疏,旅游發(fā)展水平較低,盡管地質(zhì)地貌類型豐富,但國家級公園、景區(qū)建設(shè)項目仍相對較少。
圖3 中國國家地質(zhì)公園空間分布
圖4 中國國家地質(zhì)公園空間分布核密度
將中國國家地質(zhì)公園的熱度得分值作為數(shù)據(jù)樣本輸入PowerMap軟件,計算中國范圍內(nèi)國家地質(zhì)公園熱度空間空間分布狀況。由圖5可知,國家地質(zhì)公園的熱度分布與數(shù)量空間分布特征基本一致,呈現(xiàn)“東密西疏”的分布形態(tài),但整體區(qū)域分布不平衡現(xiàn)象略有緩解。由核密度分析結(jié)果可知,中國國家公園熱度第一核心圈分布在中國東部和中部地區(qū)交界處,在安徽省周邊區(qū)域熱度達到最高,集聚范圍包含了浙江、安徽、河南、湖北等省份;四川、云南兩省構(gòu)成了中國國家地質(zhì)公園熱度次中心,其周圍區(qū)域包括云南、四川、貴州的西部區(qū)域地質(zhì)公園熱度總量和核心聚類體量僅次于中東部交界地區(qū),但總體區(qū)域面積規(guī)模略小于中東部交界處的第一核心圈。目前該次中心有向中國東部沿海區(qū)域擴展的趨勢;甘肅、青海省區(qū)域和新疆省區(qū)域的地質(zhì)公園熱度量較高,但沒有形成區(qū)域范圍內(nèi)的熱度聚類中心,且沒有與西部或中東部的中心熱度圈相連。同樣以胡煥庸線為分界,線兩側(cè)國家地質(zhì)公園熱度分布差異明顯的現(xiàn)象更加突出。胡煥庸線以西僅有新疆省一處分布了熱度較高的國家地質(zhì)公園。
總體而言,國家地質(zhì)公園的熱度分布狀況與國家自然、人文資源分布研究的結(jié)論相似,存在東西部分布差異,且隨著人口數(shù)量分布的遞減而降低,受區(qū)域人口總量影響較大?;诖髷?shù)據(jù)分析中國全國范圍內(nèi)國家地質(zhì)公園熱度分布情況可以準確反映中國自然資源分布不均,人口數(shù)量及區(qū)域開發(fā)水平不協(xié)調(diào)的問題。
圖5 中國國家地質(zhì)公園熱度核密度
中國的國家地質(zhì)公園因類型的不同,吸引游客關(guān)注量也有所差異,不同類型的游客對互聯(lián)網(wǎng)時代的旅游出行模式的參與度不同也會造成不同的國家地質(zhì)公園熱度空間分布特征。參照中國國家地質(zhì)公園名單中的地質(zhì)遺跡類型劃分,將中國國家地質(zhì)公園分為兩大類:第一類為自然景觀地貌類,包括以展示、保護巖溶地貌、砂巖地貌、丹霞地貌、冰川地貌等為目的建立的國家地質(zhì)公園;第二類為人文遺產(chǎn)類,包括以紀念地質(zhì)災(zāi)害遺跡、古生物化石發(fā)現(xiàn)地、古生物棲息地、金屬資源開采遺跡為目的建立的國家地質(zhì)公園。由數(shù)據(jù)統(tǒng)計結(jié)果可知,中國自然景觀地貌類國家地質(zhì)公園數(shù)量為159個,人文遺產(chǎn)類國家地質(zhì)公園數(shù)量為82個。
自然景觀地貌類國家地質(zhì)公園的熱度分布情況與國家地質(zhì)公園總體熱度分布格局基本一致,熱度高值分布在中東部地區(qū)交界處地區(qū)和西部地區(qū)。將159個自然景觀地貌類國家地質(zhì)公園的熱度得分值輸入PowerMap軟件,計算出其熱度空間空間分布狀況。由圖6可知,自然景觀地貌類國家地質(zhì)公園主要分布在中國地形地貌特色鮮明的省份。中東部交界處熱度較高的核心圈,地形地貌山谷縱橫,有天目山、黃山、九華山等名山,山脈間大小盆地、谷地鑲嵌其中,地勢由山地核心向谷地漸次下降,分別由中山、低山、丘陵、臺地和平原組成層狀地貌格局,且多呈北東向和近東西向展布,影響到浙江、安徽、河南等周邊省份[8];西部的四川、云南省區(qū)域大面積土地高低差參,縱橫起伏,一定范圍又有和緩的高原面;位于中國西部邊陲的新疆省則呈現(xiàn)山脈與盆地相間排列盆地與高山環(huán)抱的地形特色,喻稱“三山夾二盆”[9]。這些豐富的地形地貌景觀,也造成了我國中東部地區(qū)、西部地區(qū)高熱度國家地質(zhì)公園聚集的現(xiàn)象。由此可以看出,原始地形地貌景觀的特色性,是影響國家地質(zhì)公園熱度的一大重要因素。
圖6 中國自然景觀地貌類國家地質(zhì)公園熱度核密度
人文遺產(chǎn)類國家地質(zhì)公園熱度得分高的核心圈較少,僅有一處分布在中國東部地區(qū),熱度值也普遍較低。將82個人文遺產(chǎn)類國家地質(zhì)公園的熱度得分值輸入PowerMap軟件,計算中其熱度空間空間分布狀況。由圖7可知,全國范圍各個省份的人文遺產(chǎn)類國家地質(zhì)公園熱度核心圈數(shù)量少于中國國家地質(zhì)公園總體熱度核心圈數(shù)量。中東部交界處仍是唯一的熱度較高的核心圈。全國范圍內(nèi)其他地區(qū)國家地質(zhì)公園熱度分布情況與自然景觀地貌類國家地質(zhì)公園的熱度分布情況基本相似,呈現(xiàn)“東高西低”的分布形態(tài),但熱度數(shù)值普遍較低。由此可以看出,中國范圍內(nèi)自然景觀地貌類國家地質(zhì)公園的熱度遠高于人文遺產(chǎn)類國家地質(zhì)公園,優(yōu)美險峻的地質(zhì)地貌景觀比人文歷史氣息濃厚的遺跡景觀更受游客關(guān)注。
圖7 中國人文遺產(chǎn)類國家地質(zhì)公園熱度核密度
從國家地質(zhì)公園熱度的分布結(jié)構(gòu)來看,各個核心圈之間以及核心圈輻射范圍內(nèi)均存在等級、結(jié)構(gòu)和規(guī)模的差異。根據(jù)中國國家地質(zhì)公園熱度計算結(jié)果,以省份為單元對各等級的熱度核心圈進行賦值(賦值結(jié)果為1~9,數(shù)字越大核心圈等級越高,熱度值也越高)。由圖8可知,浙江、安徽省及其周邊省市范圍內(nèi)的中國中東部交界處是中國國家地質(zhì)公園熱度最高的一級核心圈,這與該地區(qū)的地形地貌豐富多變,景觀奇險優(yōu)美有直接關(guān)系,該核心圈內(nèi)自然地貌景觀類、人文遺產(chǎn)類國家地質(zhì)公園的熱度都極高;以云南省為中心的中國西部地區(qū)是中國國家地質(zhì)公園另一個一級熱度核心區(qū),該核心圈自然地貌景觀類國家地質(zhì)公園熱度極高,人文遺產(chǎn)類國家地質(zhì)公園的熱度相對較低,圈內(nèi)地質(zhì)景觀幽秘唯美,素有“彩云之南”的美稱,美感度極高的山水景觀是該地區(qū)國家地質(zhì)公園高的主要原因;河南、新疆兩省幅員遼闊,人口眾多,分布著數(shù)量突出的國家地質(zhì)公園,其中部分稀有地質(zhì)景觀更是達到世界級地質(zhì)景觀的級別,因此以這兩個省份為核心形成了中國國家地質(zhì)公園的兩大次級核心圈;中國東南沿海和東北部地區(qū)城市、經(jīng)濟發(fā)展水平高,也分布著中國國家地質(zhì)公園的六大三級核心圈。由圖9可知,中國各地區(qū)國家地質(zhì)公園核心圈的數(shù)量大致比例為“1∶1∶3∶7”,基本符合“K-中心點”聚類算法中較低等級核心圈數(shù)量K=3的分布趨勢[10],但每個國家地質(zhì)公園熱度核心圈的輻射范圍和關(guān)聯(lián)性較差,并沒有形成結(jié)構(gòu)網(wǎng)絡(luò)體系。以兩個一級核心圈為例,安徽地區(qū)核心圈與云南地區(qū)核心圈彼此較為孤立,且與新疆次級核心圈在地理位置和空間網(wǎng)絡(luò)上均沒有密切的聯(lián)系。
總體來說,中國國家地質(zhì)公園熱度分布結(jié)構(gòu)呈現(xiàn)以中東部交界地區(qū)、西部地區(qū)雙核心牽引其他次級核心發(fā)展的趨勢,彼此發(fā)展關(guān)聯(lián)性有待提高,整體等級結(jié)構(gòu)和輻射網(wǎng)絡(luò)仍與傳統(tǒng)中心地理論存在差距。此外,胡煥庸線兩側(cè)國家地質(zhì)公園核心圈數(shù)量分布結(jié)構(gòu)嚴重不均衡,線東側(cè)分布著2個一級核心、1個二級核心和6個三級核心,線西側(cè)僅分布著新疆地區(qū)1處二級核心,中國自然、人文資源東西部分布嚴重不均的問題在國家地質(zhì)公園熱度分布結(jié)構(gòu)中體現(xiàn)的尤為明顯。
圖8 中國國家地質(zhì)公園空間分布結(jié)構(gòu)等級
圖9 中國國家地質(zhì)公園核心圈分布結(jié)構(gòu)
通過對攜程旅游網(wǎng)中的國家地質(zhì)公園的游客景區(qū)評價大數(shù)據(jù)進行抓取,在建立中國國家地質(zhì)公園熱度評價指標體系的基礎(chǔ)上,計算了中國241個國家地質(zhì)公園的熱度并對其進行排名,以此為依據(jù)對中國國家地質(zhì)公園的空間分布結(jié)構(gòu)進行核密度分析,得到如下結(jié)論:
大數(shù)據(jù)樣本量大、信息內(nèi)涵豐富的特點可以有效縮小傳統(tǒng)研究中錯誤、虛假信息對研究結(jié)果的影響,提高研究的科學(xué)性。攜程旅游網(wǎng)的游客評價有助于分析研究中國國家地質(zhì)資源的空間分布和開發(fā)利用情況。通過借助Bing地圖和PowerMap軟件的可視化分析,發(fā)現(xiàn)中國國家地質(zhì)公園的熱度分布與其密度相關(guān)性較大,即國家地質(zhì)公園熱度較高的核心圈普遍分布在地質(zhì)公園廣布的地區(qū)。因此國家地質(zhì)公園的熱度分布與我國人口、資源分布情況類似,存在以胡煥庸線為界,線兩側(cè)國家地質(zhì)公園熱度分布不均的情況。說明中國對地質(zhì)景觀的保護、開發(fā)和利用主要受區(qū)域總體發(fā)展水平影響。我國遼闊的疆域與復(fù)雜的地形地貌也限制了不同地區(qū)國家地質(zhì)公園核心圈聯(lián)系網(wǎng)絡(luò)的建立。從地理分布角度分析,以大數(shù)據(jù)觀察為切入點對國家地質(zhì)公園進行研究可以為國家地質(zhì)資源的進一步保護、開發(fā)和利用提供思路和決策依據(jù),最終推動中國國家公園管理體系的建立。