屈 樹(shù) 學(xué),董 琪,秦 嘉 徽,劉 雨 思,張 晶
(首都師范大學(xué)地球空間信息科學(xué)與技術(shù)國(guó)際化示范學(xué)院,首都師范大學(xué)三維信息獲取與應(yīng)用教育部重點(diǎn)實(shí)驗(yàn)室/城市環(huán)境過(guò)程與數(shù)字模擬國(guó)家重點(diǎn)實(shí)驗(yàn)室培育基地/水資源安全北京實(shí)驗(yàn)室,北京 100048)
北京市“十四五”規(guī)劃綱要提出要將北京市建設(shè)成弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化和高品質(zhì)宜居之城[1],兩個(gè)目標(biāo)的受眾群體分別為游客和居民兩類(lèi)人群。城市游客和居民的主客關(guān)系影響城市的經(jīng)濟(jì)和文化發(fā)展,明晰二者的耦合關(guān)系有助于實(shí)現(xiàn)游客與居民的互利互惠[2]?;谖恢梅?wù)(Location Based Service,LBS)的海量地理大數(shù)據(jù)(如社交媒體、手機(jī)信令、共享單車(chē)等)為探究城市空間分異格局提供了新方式[3-5],其在城市空間分異的應(yīng)用研究主要有“人”和“地”兩種途徑[6]。學(xué)者們往往從“地”的角度探討固定場(chǎng)所的屬性趨同與分異(如功能分區(qū)[7]、空間交互作用[8]等),而把人產(chǎn)生的海量地理大數(shù)據(jù)看作一個(gè)整體,分配到研究單元中,但這種方式會(huì)忽略人作為城市主體其異質(zhì)性造成的城市分異現(xiàn)象。從“人”的角度出發(fā),識(shí)別相對(duì)均質(zhì)的人群并分析、比較特定人群的活動(dòng)特征,正作為研究城市空間分異的新方式受到越來(lái)越多的關(guān)注。近年來(lái),旅游地理研究者嘗試通過(guò)社交媒體等地理大數(shù)據(jù)提取游客和居民的活動(dòng)特征進(jìn)行人群識(shí)別,并進(jìn)行目的地挖掘[9,10]、文本主題挖掘[11]等探索。例如:Hasnat等基于用戶(hù)簽到坐標(biāo)提取5個(gè)特征進(jìn)行游客與居民分類(lèi)訓(xùn)練[12];Yang等基于用戶(hù)簽到坐標(biāo)、簽到時(shí)間間隔等特征利用K-means聚類(lèi)算法識(shí)別游客[13]。但與調(diào)查問(wèn)卷等傳統(tǒng)數(shù)據(jù)相比,社交媒體數(shù)據(jù)提供的信息更“薄”[14],從中難以提取到滿足人群識(shí)別差異的適量特征,從而影響識(shí)別精度;同時(shí),多數(shù)研究?jī)H對(duì)單一人群進(jìn)行識(shí)別與分析[15-18],或從簽到空間分布和簽到主題方面分析游客與居民的差異[13,19],較少考慮這兩種人群簽到地空間差異和類(lèi)型分異。
“微博”+“旅游”正成為當(dāng)代年輕人的主流出行模式[20],微博用戶(hù)在簽到地的真實(shí)態(tài)度與情感能反映用戶(hù)對(duì)簽到地的關(guān)注度。因此,本文基于微博簽到數(shù)據(jù),通過(guò)擴(kuò)充數(shù)據(jù)源獲取用戶(hù)更多的簽到信息,以此提取人群差異特征進(jìn)行游客和居民識(shí)別;通過(guò)局部莫蘭指數(shù)方法提取并比較游客和居民的顯著性簽到聚集區(qū)域,通過(guò)層次聚類(lèi)等方法對(duì)簽到聚集區(qū)進(jìn)行類(lèi)型劃分和差異比較,以期從宏觀角度挖掘游客與居民的空間分異格局,為旅游資源配置優(yōu)化、北京特色文化宣傳、游客與居民出行推薦等提供服務(wù),以及為建設(shè)高品質(zhì)宜居城市和打造中華優(yōu)秀傳統(tǒng)文化典范之城提供決策支持。
本文研究區(qū)為北京市主城區(qū)(東城區(qū)、西城區(qū)、海淀區(qū)、朝陽(yáng)區(qū)、豐臺(tái)區(qū)和石景山區(qū)),面積1 384.34 km2,為保證研究區(qū)域的連續(xù)性,未包含朝陽(yáng)區(qū)首都機(jī)場(chǎng)區(qū)域。城六區(qū)是首都“四個(gè)中心”功能的主承載區(qū)、國(guó)際一流和諧宜居之都建設(shè)的重要區(qū)域,也是疏解非首都功能的關(guān)鍵區(qū)域[21],探究城六區(qū)的城市空間分異對(duì)北京市的規(guī)劃與建設(shè)有重要意義。
本文以2016年4月15日至10月20日北京市六環(huán)內(nèi)1 577 273條微博簽到數(shù)據(jù)(無(wú)簽到地址和POI類(lèi)型屬性)為基礎(chǔ),提取研究范圍內(nèi)的用戶(hù)ID,借助微博開(kāi)放平臺(tái)API接口,獲取每位用戶(hù)2016年全年的個(gè)人簽到數(shù)據(jù)作為擴(kuò)充數(shù)據(jù)集(有簽到地址屬性),依托高德API接口,基于簽到地址進(jìn)行地理編碼和POI類(lèi)型編碼(采用高德一級(jí)分類(lèi),共23類(lèi))。最終,將基礎(chǔ)數(shù)據(jù)與擴(kuò)充數(shù)據(jù)依據(jù)用戶(hù)ID匹配,作為本研究數(shù)據(jù)源(表1),共獲取到26 205位用戶(hù)1 416 666條有效微博數(shù)據(jù),其中含經(jīng)緯度屬性數(shù)據(jù)555 638條,含簽到地址和POI類(lèi)型屬性數(shù)據(jù)235 717條。
表1 數(shù)據(jù)源示例Table 1 Samples of data sources
本研究技術(shù)流程(圖1)為:1)對(duì)原微博簽到數(shù)據(jù)進(jìn)行擴(kuò)充、清洗與融合等預(yù)處理,之后基于分類(lèi)算法對(duì)游客與居民進(jìn)行識(shí)別;2)基于局部莫蘭指數(shù)方法提取簽到聚集區(qū);3)基于簽到點(diǎn)的POI類(lèi)型對(duì)簽到聚集區(qū)進(jìn)行聚類(lèi);4)比較游客與居民兩類(lèi)人群簽到聚集區(qū)的差異及相似性。
圖1 研究框架Fig.1 Research framework
本研究中,游客為到某地短期游玩的人,對(duì)當(dāng)?shù)亓私獠簧?;居民為長(zhǎng)期居住在某地的常駐者,對(duì)當(dāng)?shù)剌^為了解。本文借助機(jī)器學(xué)習(xí)[22]中的特征工程[23]及分類(lèi)算法對(duì)游客與居民進(jìn)行識(shí)別,流程(圖2)包括:1)特征選擇。游客和居民在研究區(qū)內(nèi)外的停留時(shí)長(zhǎng)、簽到次數(shù)、簽到頻率及訪問(wèn)次數(shù)均有差異,本文借助擴(kuò)充后的微博簽到數(shù)據(jù)源,將用戶(hù)的簽到行為特征分為時(shí)間特征、空間特征和簽到比率特征3類(lèi)(表2),然后根據(jù)穩(wěn)定性選擇方法選取合適特征并帶入分類(lèi)器進(jìn)行訓(xùn)練。穩(wěn)定性選擇[24]方法將二次抽樣和選擇算法相結(jié)合,通過(guò)循環(huán)選擇不同的數(shù)據(jù)子集和特征子集并計(jì)算得分以尋找最佳特征,重要特征得分接近1,無(wú)用特征得分接近0。2)特征訓(xùn)練與建模。經(jīng)過(guò)特征選擇選出合適特征后,選取分類(lèi)效果最好的集成分類(lèi)器進(jìn)行特征訓(xùn)練并建立分類(lèi)模型,據(jù)此將數(shù)據(jù)分為游客簽到數(shù)據(jù)和居民簽到數(shù)據(jù)兩類(lèi)。
圖2 游客與居民識(shí)別技術(shù)路線Fig.2 Technical route for identifying tourists and residents
表2 微博簽到特征Table 2 Features of microblogging check-in
局部莫蘭指數(shù)(Anselin Local Moran′sI)(式(1))常用于識(shí)別具有統(tǒng)計(jì)顯著性低值、高值以及異常值的空間聚集區(qū)域[25,26]。本文通過(guò)規(guī)則格網(wǎng)劃分研究區(qū),將每個(gè)格網(wǎng)內(nèi)用戶(hù)簽到點(diǎn)數(shù)量作為統(tǒng)計(jì)值,利用該方法分別提取游客和居民的簽到聚集區(qū)域。
(1)
2.3.1 詞頻—逆文檔頻率(Term Frequency-Inverse Document Frequency,TF-IDF) TF-IDF是一種文本詞匯重要性統(tǒng)計(jì)方法[27],其考慮到某些重要且特殊的詞在文檔中出現(xiàn)的頻次不高,通過(guò)加權(quán)處理提高該詞匯權(quán)重,以更好地表征此文檔的特征,計(jì)算公式見(jiàn)式(2)。本文利用該方法提取研究單元特征,研究單元內(nèi)每個(gè)簽到點(diǎn)的POI類(lèi)型構(gòu)成一條詞匯,一個(gè)研究單元構(gòu)成一篇文檔,經(jīng)過(guò)TF-IDF處理后可得每個(gè)研究單元的特征向量。
(2)
2.3.2 層次聚類(lèi)及聚類(lèi)指標(biāo)評(píng)價(jià) 層次聚類(lèi)依據(jù)各聚類(lèi)要素間的距離(相似度)創(chuàng)建一棵有層次的嵌套聚類(lèi)樹(shù)。本文利用層次聚類(lèi)法進(jìn)行研究單元聚類(lèi),在獲取研究單元的簽到POI類(lèi)型特征后,通過(guò)自下向上的凝聚方法構(gòu)建聚類(lèi)樹(shù)進(jìn)行類(lèi)別劃分[28,29]。首先將每個(gè)聚類(lèi)要素當(dāng)作一個(gè)簇,然后計(jì)算任意兩簇間距離,距離指標(biāo)采用余弦相似度度量[29],為克服離群點(diǎn),簇間距離采用(類(lèi))平均距離;將最近的兩個(gè)簇合并、迭代處理,直到合并完所有簇。在聚類(lèi)完成后,應(yīng)用輪廓系數(shù)(SC)[30]、戴維森堡丁指數(shù)(DBI)[31]、Calinski-Harabasz(CH)[32]值3個(gè)指標(biāo)進(jìn)行聚類(lèi)結(jié)果評(píng)價(jià)。SC值越大,說(shuō)明聚類(lèi)效果越好;DBI越小,表明簇內(nèi)距離越小、簇間距離越大,聚類(lèi)效果越好;CH值越大,代表簇自身越緊密,簇間越分散,聚類(lèi)效果更優(yōu)。
在進(jìn)行人群分類(lèi)前,首先依據(jù)用戶(hù)簽到特征將2 000名用戶(hù)類(lèi)型的人工標(biāo)注數(shù)據(jù)構(gòu)成數(shù)據(jù)集,并選取75%樣本作為訓(xùn)練集,剩余25%作為測(cè)試集,隨后進(jìn)行特征選擇并采用10次10折交叉驗(yàn)證法進(jìn)行分類(lèi)訓(xùn)練與評(píng)估。由穩(wěn)定性特征選擇結(jié)果(圖3)可知,多數(shù)特征得分接近1,說(shuō)明依據(jù)經(jīng)驗(yàn)提取的游客與居民差異特征較合理。剔除較低得分特征(“京外簽到頻率”),最終選取“注冊(cè)地(是否為北京)”“京內(nèi)最大停留時(shí)長(zhǎng)”“京外最大停留時(shí)長(zhǎng)”“京內(nèi)重訪次數(shù)”“京外最大停留時(shí)長(zhǎng)地區(qū)重訪次數(shù)”“京外簽到數(shù)量”“京內(nèi)簽到數(shù)量”“京內(nèi)簽到頻率”“京外簽到數(shù)量/京內(nèi)簽到數(shù)量”9個(gè)特征帶入分類(lèi)器進(jìn)行訓(xùn)練。
圖3 特征重要性評(píng)估Fig.3 Assessment of feature importance
為獲取較好的分類(lèi)結(jié)果,選取準(zhǔn)確度(Accuracy)、精確度(Precision)、召回率(Recall)和F1值4個(gè)指標(biāo)對(duì)分類(lèi)結(jié)果進(jìn)行評(píng)估;同時(shí)選取K鄰近(KNN)、決策樹(shù)(DT)、支持向量機(jī)(SVM)、隨機(jī)森林(RF)、AdaBoost 5個(gè)分類(lèi)器對(duì)分類(lèi)結(jié)果進(jìn)行橫向比較(圖4),發(fā)現(xiàn)AdaBoost集成分類(lèi)器綜合分類(lèi)效果最佳,故將其作為最終分類(lèi)器對(duì)游客與居民進(jìn)行分類(lèi)。如圖5所示,總計(jì)識(shí)別出游客4 187名,居民22 018名,帶有經(jīng)緯度的簽到數(shù)據(jù)中游客18 803條,居民232 492條。將本文的分類(lèi)方法與前人方法進(jìn)行比較(表3),結(jié)果顯示本文方法各個(gè)評(píng)價(jià)指標(biāo)的數(shù)值均有提升。
圖4 不同分類(lèi)器分類(lèi)結(jié)果比較Fig.4 Comparison of classification results for different classifiers
圖5 2016年北京市城六區(qū)游客與居民簽到分布Fig.5 Check-in distribution of tourists and residents in six core districts of Beijing in 2016
表3 不同分類(lèi)方法結(jié)果比較Table 3 Comparison of classification results of different methods
利用規(guī)則格網(wǎng)進(jìn)行研究區(qū)劃分并提取簽到聚集區(qū),分別選取100 m、250 m、500 m及1 000 m格網(wǎng)進(jìn)行試驗(yàn)。提取結(jié)果顯示,1 000 m格網(wǎng)下的聚集區(qū)分布較寬泛,而100 m和250 m格網(wǎng)下結(jié)果較離散,500 m格網(wǎng)下結(jié)果理想,且研究表明,500 m是人類(lèi)日?;顒?dòng)較頻繁的范圍[33],因此本文選用500 m格網(wǎng)作為局部莫蘭指數(shù)的計(jì)算單元,空間關(guān)系則采用適合面狀要素的一階鄰接面進(jìn)行簽到聚集區(qū)提取(圖6)。
圖6 游客與居民簽到聚集區(qū)識(shí)別結(jié)果Fig.6 Identification results of check-in gathering areas for tourists and residents
總體看,游客和居民的簽到多集中在五環(huán)以?xún)?nèi),以故宮為中心,整體呈現(xiàn)出中心高、外圍低的空間格局。東、西城區(qū)更靠近中心,簽到量高;石景山區(qū)遠(yuǎn)離中心,關(guān)注度較少;海淀區(qū)和朝陽(yáng)區(qū)的簽到環(huán)東、西城區(qū)分布,離中心越遠(yuǎn)簽到量越低。豐臺(tái)區(qū)盡管在地理位置上鄰接?xùn)|、西城區(qū),但并未獲得微博用戶(hù)的高關(guān)注。游客在天安門(mén)、后海、三里屯周?chē)纬?個(gè)明顯的高密集簽到區(qū),簽到密度由中心向外圍逐漸降低;居民除以上高密集簽到區(qū)外,簽到聚集區(qū)更加分散,在海淀區(qū)各大高校范圍內(nèi)存在顯著的聚集區(qū)。
得到游客與居民簽到聚集區(qū)后,利用簽到點(diǎn)的POI類(lèi)型劃分簽到聚集區(qū)類(lèi)型,以挖掘游客與居民簽到聚集區(qū)的類(lèi)型差異。將每個(gè)研究單元的簽到POI類(lèi)型經(jīng)過(guò)TF-IDF向量化與L1正則化處理后進(jìn)行層次聚類(lèi)(圖7),可以看出游客與居民均在11類(lèi)時(shí)聚類(lèi)效果最佳,故將最終聚類(lèi)數(shù)設(shè)為11。
圖7 游客與居民聚類(lèi)結(jié)果評(píng)價(jià)Fig.7 Evaluation of clustering results of tourists and residents
完成聚類(lèi)后,統(tǒng)計(jì)游客和居民簽到聚集區(qū)類(lèi)型內(nèi)各POI類(lèi)型的占比情況,兩類(lèi)人群只在18種POI類(lèi)型上存在簽到行為(圖8),進(jìn)而對(duì)各聚集區(qū)類(lèi)型相似度進(jìn)行比較(圖9)??傮w看,游客與居民在1-8類(lèi)型上相似性很高,均由單一類(lèi)型主導(dǎo);9-11類(lèi)型為混合類(lèi)型,在9、10類(lèi)型游客偏向住宿服務(wù),居民偏向商務(wù)住宅,第11類(lèi)型主要為政府機(jī)構(gòu)及社會(huì)團(tuán)體,游客地名地址信息簽到較多,居民則為商務(wù)住宅。進(jìn)一步對(duì)比兩類(lèi)人群聚集區(qū)各類(lèi)型占比(圖10),發(fā)現(xiàn)二者均在類(lèi)型4簽到較多,該類(lèi)型以地名地址信息為主,且以“三里屯”“王府井”“五道口”等熱點(diǎn)地名為代表;二者在1、2、3、5、7、10類(lèi)型上簽到量差異明顯,在餐飲服務(wù)、風(fēng)景名勝及體育休閑服務(wù)主導(dǎo)的聚集區(qū)類(lèi)型上游客明顯多于居民,在科教文化服務(wù)及商務(wù)住宅主導(dǎo)的聚集區(qū)類(lèi)型上居民顯著多于游客。
圖8 游客與居民簽到聚集區(qū)類(lèi)型內(nèi)各POI類(lèi)型占比Fig.8 Proportion of POI types in the different types of check-in gathering areas for tourists and residents
圖9 游客與居民簽到聚集區(qū)類(lèi)型相似度評(píng)價(jià)Fig.9 Similarity evaluation of types of check-in gathering areas between tourists and residents
圖10 游客與居民簽到聚集區(qū)各類(lèi)型占比Fig.10 Proportion of different types of check-in gathering areas for tourists and residents
由游客與居民簽到聚集區(qū)各類(lèi)型的空間分布(圖11)并結(jié)合圖8可以看出,人群異質(zhì)性造成簽到聚集區(qū)的空間差異及簽到類(lèi)型分異。游客簽到聚集區(qū)類(lèi)型特征及分布較明顯,環(huán)故宮簽到類(lèi)型豐富且密集,外圍簽到聚集區(qū)類(lèi)型單一且離散。其中,以餐飲服務(wù)為主導(dǎo)的類(lèi)型區(qū)相對(duì)集中在三環(huán)內(nèi),周?chē)酁橘?gòu)物服務(wù)類(lèi)型;圓明園、奧林匹克森林公園、798藝術(shù)區(qū)、法華寺等風(fēng)景名勝區(qū)分布離散且多與科教文化服務(wù)類(lèi)型相鄰;此外,還有以北京西站、北京南站、北京站等為代表的交通設(shè)施服務(wù)類(lèi)型和以中國(guó)傳媒大學(xué)為代表的科教文化服務(wù)類(lèi)型等離散性聚集區(qū)類(lèi)型。居民簽到聚集區(qū)類(lèi)型呈顯著的地區(qū)特征,其中,海淀區(qū)以科教文化服務(wù)類(lèi)型為主,朝陽(yáng)區(qū)以商務(wù)住宅類(lèi)型為主,東、西城區(qū)主要是餐飲、購(gòu)物及風(fēng)景名勝等服務(wù)類(lèi)型。同時(shí)發(fā)現(xiàn),對(duì)于游客與居民,北京西站與北京南站均為相對(duì)獨(dú)立的聚集區(qū),用戶(hù)熱衷簽到的地區(qū)與這兩個(gè)火車(chē)站都有一定的距離,火車(chē)站孤立現(xiàn)象也從側(cè)面反映了其周邊服務(wù)不均衡問(wèn)題。
圖11 游客與居民簽到聚集區(qū)類(lèi)型分布Fig.11 Distribution of different types of check-in gathering areas for tourists and residents
對(duì)游客與居民簽到聚集區(qū)的POI類(lèi)型利用TF-IDF向量化并計(jì)算余弦距離,得到游客與居民共同簽到聚集區(qū)的相似性計(jì)算結(jié)果(圖12),取值范圍為[0,1],采用自然斷裂法將其分為7個(gè)等級(jí),值越大表明該地區(qū)兩類(lèi)人群的簽到類(lèi)型越相似。從圖12可知,兩類(lèi)人群在具有特定類(lèi)型的場(chǎng)所簽到相似性很高,如北京西站、北京南站等火車(chē)站,北京大學(xué)、中國(guó)傳媒大學(xué)等科教文化服務(wù)場(chǎng)所,國(guó)家體育場(chǎng)、798藝術(shù)區(qū)、五棵松等風(fēng)景名勝區(qū)。
圖12 游客與居民簽到聚集區(qū)內(nèi)POI類(lèi)型相似性度量Fig.12 Similarity measurement of POI types in check-in gathering areas for tourists and residents
本文以“三里屯”“中關(guān)村”“水立方”“亮馬橋”“天安門(mén)東”5類(lèi)典型地區(qū)為例,通過(guò)簽到類(lèi)型云圖(圖略)說(shuō)明游客與居民兩類(lèi)人群在相同聚集區(qū)內(nèi)簽到類(lèi)型差異。其中,三里屯地區(qū)游客主要集中于購(gòu)物、體育休閑、餐飲及住宿服務(wù),簽到類(lèi)型具體且與旅游關(guān)系密切;居民則在購(gòu)物及地名地址信息類(lèi)型簽到較多,“三里屯”這一地名地址信息類(lèi)型代表較寬泛,且多為用戶(hù)自主選擇,這也代表了居民對(duì)該地區(qū)較為熟悉。中關(guān)村地區(qū)游客與居民簽到類(lèi)型差異顯著,對(duì)游客主要提供科教文化與商務(wù)住宅類(lèi)型的服務(wù),對(duì)居民則主要為生活與購(gòu)物類(lèi)型的服務(wù)。水立方附近地區(qū)對(duì)游客主要提供體育休閑、生活及住宿類(lèi)型的服務(wù),但該地區(qū)的“盤(pán)古大觀”“IBM”等商務(wù)住宅類(lèi)型吸引了較多的居民簽到。亮馬橋地區(qū)附近眾多酒店為游客提供了住宿服務(wù),周邊大使館為其工作人員提供了商務(wù)及住宅服務(wù),盡管該地區(qū)簽到差異顯著,但其服務(wù)功能具有互補(bǔ)性。中關(guān)村和水立方兩地在旅游旺季是否會(huì)產(chǎn)生游客和居民的簽到“沖突”值得關(guān)注。此外,在天安門(mén)以東區(qū)域,游客多為餐飲及住宿活動(dòng),不太關(guān)注居民常去的“菖蒲河公園”,而這可以為旅游推薦提供參考。
由此可見(jiàn),人群異質(zhì)性導(dǎo)致相同地區(qū)提供的服務(wù)類(lèi)型也會(huì)產(chǎn)生差異,利用大數(shù)據(jù)進(jìn)行人群異質(zhì)性研究不僅可以挖掘地區(qū)間的類(lèi)型相似性,還可探索地區(qū)內(nèi)部提供的不同服務(wù)類(lèi)型,從而為找尋游客和居民這兩類(lèi)人群的“平衡點(diǎn)”提供幫助。
本文應(yīng)用社交媒體數(shù)據(jù),篩選出具有代表性的人群差異特征進(jìn)行游客與居民識(shí)別,其準(zhǔn)確性、召回率等分類(lèi)結(jié)果評(píng)價(jià)指標(biāo)較前人方法均有顯著提升,為人群分類(lèi)研究提供了參考。將簽到數(shù)據(jù)與簽到地的POI類(lèi)型結(jié)合,以用戶(hù)的簽到數(shù)量作為研究單元內(nèi)各個(gè)POI類(lèi)型的權(quán)重進(jìn)行聚類(lèi),為小尺度、細(xì)粒度研究單元的類(lèi)型劃分提供借鑒,并從簽到地類(lèi)型角度定量分析對(duì)比了北京市游客與居民的簽到差異,主要表現(xiàn)在以下方面:1)從簽到聚集區(qū)的空間分布看,游客比居民簽到更集中,但二者的簽到聚集區(qū)都呈現(xiàn)出以故宮為中心,北高南低、東高西低的分布格局。2)從簽到類(lèi)型看,游客簽到聚集區(qū)集中在故宮周邊以及圓明園、奧體中心等知名景點(diǎn);居民簽到較分散,但高校簽到量突出,體現(xiàn)了社交媒體使用偏向年輕化的特點(diǎn)。3)游客和居民在火車(chē)站、高校等單一的土地利用類(lèi)型區(qū)域簽到相似度較高,同時(shí)存在“三里屯”“中關(guān)村”等相似度較低的地區(qū),一方面體現(xiàn)這些地區(qū)為混合土地利用類(lèi)型,另一方面揭示了由人群異質(zhì)性產(chǎn)生的地區(qū)類(lèi)型偏好差異。通過(guò)研究這些差異不僅可以發(fā)掘一些潛在的景區(qū)進(jìn)行旅游推薦,而且可以為游客與居民之間的“主客關(guān)系”研究提供參考。
微博這一社交媒體數(shù)據(jù)提供了空間分異研究的宏觀視野,但代表的人群存在有偏性,所揭示的空間分異代表人群多為青年,且學(xué)生占比較大。今后可以考慮專(zhuān)門(mén)針對(duì)學(xué)生群體并結(jié)合感興趣區(qū)等數(shù)據(jù)進(jìn)行區(qū)域研究,此外,社交媒體數(shù)據(jù)蘊(yùn)涵的豐富文本內(nèi)容也是以后研究的重點(diǎn)。