楊 學 習,鄧 敏,劉 瑜
(1.中南大學地球科學與信息物理學院,湖南 長沙 410083;2.北京大學地球與空間科學學院遙感與地理信息系統(tǒng)研究所,北京 100871)
社會感知(social sensing)是通過多源地理時空大數據研究人類時空間行為特征,進而揭示社會經濟現(xiàn)象的時空分布格局、聯(lián)系及演化過程的理論和方法[1],其通過場所語義感知[2]、空間交互感知[3]、動態(tài)演化感知[4],充分挖掘多源時空大數據中蘊含的豐富人群時空間行為信息,與遙感數據互為補充。近年來,信息與通信和物聯(lián)網技術的快速發(fā)展,無線傳感器、手持智能終端設備等裝置的廣泛應用,以及人們對互聯(lián)網和移動通信網絡的依賴,產生了大量具有個體標記和時空語義信息的時空“大數據”(big geo-data)[5],使得長時間、高精度追蹤觀測個體的空間移動成為可能。伴隨大數據時代的來臨,全面涵蓋人類活動與地理環(huán)境信息的地理大數據突破了傳統(tǒng)目的性采樣數據在數據范圍、時空粒度與信息內涵等方面的局限,為“人—地”關系的全面認知帶來了全新的研究范式[6,7]。近年來,人工智能領域的技術進步為地理空間相關領域研究的智能化發(fā)展和融合創(chuàng)新帶來了新機遇和新挑戰(zhàn)[8]。地理空間智能(GeoAI)作為地理空間科學與人工智能相結合的交叉學科研究方向,有力提升了對于地理現(xiàn)象和地球科學過程的動態(tài)感知、智能推理和知識發(fā)現(xiàn)的能力[9]。因此,在地理大數據社會感知手段的支持下,探討地理空間智能的關鍵技術與應用,可為地理學研究提供有力的方法和技術支撐。
面向學科發(fā)展與行業(yè)需求,《地理與地理信息科學》組織了“社會感知與地理空間智能”專欄,邀請國內外從事時空大數據與社會感知的理論與方法、地理空間智能的前沿關鍵技術、時空大數據行為模式挖掘的理論與方法、時空大數據與社會感知的智慧城市應用研究的學者介紹相關研究進展、應用實例,以期總結成果和經驗,發(fā)現(xiàn)不足和問題,探索前沿和方向,推動大數據時代社會感知與地理空間智能的創(chuàng)新和發(fā)展。該專欄論文集中反映了當前社會感知與地理空間智能的研究動態(tài)和熱點方向。本文作為導讀論文,通過對相關論文的系統(tǒng)分析和綜述,總結了當前社會感知與地理空間智能的發(fā)展動態(tài),并結合新時代下的新需求、新挑戰(zhàn)和新機遇,對社會感知與地理空間智能未來的發(fā)展方向進行了初步探討。
“社會感知與地理空間智能”專欄包括15篇論文[10-24],內容涵蓋COVID-19疫情分析、群體行為分析、場所情緒刻畫、個性出行推薦、城市路網感知等,選擇的典型研究區(qū)既包括長三角城市群區(qū)域,也包括北京、廣州、武漢、長沙、成都、西寧等典型城市,選擇的研究數據主要包括社交媒體數據、手機信令數據、GPS軌跡數據、街景數據等,采用的信息處理方法涉及機器學習新理論以及地理模擬、空間統(tǒng)計、空間聚類等空間分析方法,系統(tǒng)地呈現(xiàn)了當前社會感知的研究進展。專欄論文具體介紹如下:
姜偉等[10]以新浪微博數據作為主要數據源,結合實地問卷調查,提出了疫情場景下城市內用戶群體多維情感響應時空特征分析框架。該框架重點構建了城市內用戶群體對于疫情的多維情感強度精確評估方法,并分析疫情情感響應的時空變化特征,解析情感響應的顯著影響因子。該文通過將社交媒體大數據與規(guī)則采樣“小數據”相結合,高效地解析了大規(guī)模城市內用戶群體的情感響應時空特征,為政府疫情相關政策制定提供理論基礎。
朱炤瑗等[11]通過構建COVID-19疫情防控期間的國家對抗和依賴關系交互網絡模型,提出一種基于時間序列聚類與空間統(tǒng)計的國家關系交互網絡演化模式探測方法。研究充分利用節(jié)點的網絡特征與空間屬性,有效發(fā)掘了疫情防控期間國家關系交互網絡節(jié)點的動態(tài)演化模式與空間分布特征,為公共衛(wèi)生危機事件中的國際關系研究提供參考。
游憩熱點的識別和空間特征解析是城市管理者理解居民游憩活動行為的重要依據,師浩辰等[12]以“社會感知”視角為切入點,以GPS眾包軌跡為數據源,提出基于“時、地、人”要素提取游憩熱點的新思路。通過“時、地”的雙重限定識別出每條軌跡的停留點,結合核密度分析與 “頭尾劃分”法提取停留點的高密度區(qū)域,并以道路為基礎整合表達游憩熱點的空間分布。
馮澤琪等[13]采用新浪微博社交媒體數據,通過用戶分類、微博情感分析、微博主題分析、微博負面情緒分析等進行旅游者的情緒感知,并將情緒因素與時空行為研究相結合,提出一套系統(tǒng)的游客微博文本分析方法。該研究可為建設旅游目的地游客輿情監(jiān)測、預警和管控系統(tǒng)提供借鑒。
屈樹學等[14]針對微博社交媒體大數據,利用機器學習算法區(qū)分游客與本地居民,進而采用空間分析算法挖掘游客與居民的行為差異,從人群異質性角度發(fā)現(xiàn)及揭示空間分異現(xiàn)象,研究結果可為旅游和規(guī)劃提供一定的參考。
王潤澤等[15]基于POI數據利用功能密度指數、功能優(yōu)勢指數識別城市混合用地功能,在此基礎上以騰訊位置大數據刻畫人口流動差異性和時空聚散模式,并區(qū)分為公共主導—聚散波動、商務主導—持續(xù)集聚、居住主導—持續(xù)集聚、綠地主導—聚散交替、商業(yè)主導—動態(tài)平衡和工業(yè)主導—先聚后散6種模式,為科學合理地制定國土空間規(guī)劃、完善配套設施建設等提供理論與實踐支撐。
吳濤等[16]提出一種基于眾源地理數據的個性化路線服務框架,通過將大眾對不同地點的偏好、時間與成本預算等信息映射到實際路網空間中,融合個人意向進行動態(tài)建模分析,從而為用戶提供合適且更具個性化的出行方案。
楊鴻海等[17]以手機信令數據作為數據源,研究西寧市居民在工作日和休息日的時空活動差異及POI設施空間分布對居民活動差異的影響。該研究從宏觀、時空動態(tài)的角度分析西寧市居民的時空行為,有助于理解工作日和休息日居民在城市空間的時空活動差異及影響機制,可為城市出行空間和基礎設施規(guī)劃提供參考。
郭鑫等[18]利用手機信令數據探索城市不同年齡群體活力空間分布模式,并從區(qū)位條件、交通可達性、建筑空間、功能空間和綠地景觀空間五方面構建建成環(huán)境影響指標體系,進而通過多元線性逐步回歸模型和多尺度地理加權回歸模型,實現(xiàn)建成環(huán)境對城市不同年齡群體活力時空異質性影響的定量刻畫。
肖通等[19]提出一種融合街景影像和手機信令數據的城市街道安全性評估方法,通過兩種類型數據反映的特征互補來減小“安全感知偏差”,從而有效刻畫研究區(qū)域街道真實安全性,并對低安全性區(qū)域提出針對性建議,研究結果可為城市街道合理規(guī)劃提供科學參考。
陶奕宏等[20]從微觀角度出發(fā),充分考慮地理區(qū)位、自然因素、社會經濟因素的影響,借助GIS空間分析技術與人工神經網絡挖掘不同類型智能體在城市擴展過程中的偏好差異,結合多期遙感影像,運用人工神經網絡—智能體模型—元胞自動機(ANN-ABM-CA)模型對城市擴展進行模擬,從而服務于城市可持續(xù)發(fā)展與國土空間規(guī)劃。
郭文峰等[21]從人群出行數據感知城市道路的角度出發(fā),采用共享單車GPS數據對城市歷史路網進行變化路段檢測與更新,提出一種分段—聚類—聚合增量軌跡數據自動生成道路方法。該文提出的基于局部路網更新的檢測—提取—更新思想,有效降低了路網數據更新成本,有助于快速感知城市交通路網動態(tài)。
湯恒等[22]利用百度指數數據表征信息流,進而分析長三角城市群網絡的中心性特征和影響信息流網絡形成的因子,進而發(fā)掘影響城市間關系的內在因素,為全面理解城市群的空間結構及其成因提供支持。
王鉞等[23]結合空間網絡分析模型與多尺度地理加權回歸模型,以成都市2020年二手住宅交易數據為研究對象,探究不同空間尺度下城市路網對住宅價格的影響機制及其間的差異,可為政府制定房地產市場的相關政策、房地產開發(fā)商的選址布局、城市交通規(guī)劃提供參考。
鐘怡然等[24]將高速公路智能監(jiān)控系統(tǒng)中的實體抽象為多粒度時空對象,并從時空參照、時空位置、空間形態(tài)、屬性特征、組成結構、關聯(lián)關系、行為能力和認知能力八方面的特征出發(fā),設計高速公路智能監(jiān)控系統(tǒng)概念數據模型,有助于監(jiān)控系統(tǒng)中實體及其復雜關系的組織與管理,以及支撐高速公路智能監(jiān)控系統(tǒng)的構建與應用。
地理時空大數據及其提供的社會感知手段,為信息地理學、人文地理學帶來了全新的研究范式,為地理規(guī)律的發(fā)現(xiàn)提供了重要的工具和手段,在“人—地”關系研究中發(fā)揮了重要作用。在取得這些進展的同時,同樣需要對當前社會感知面臨的問題進行冷靜的思考。
(1)社會感知提供了一種“由人及地”的研究范式,通過地理時空大數據蘊含的海量人群的時空行為信息,在蓬勃發(fā)展的地理空間智能算法的優(yōu)化驅動下,揭示空間要素的分布格局、地理單元的交互特征、地理場所的情感語義,可視為對城市精細化動態(tài)運行提供了一個“上帝視角”,在人工智能技術的支撐下,可望實現(xiàn)對設施的智能管理、人群出行的優(yōu)化調度,提高城市運行效率。但在城市系統(tǒng)高效運行的背后,如何平衡人們是否接受算法支配的倫理問題,是社會感知和人工智能研究面臨的重要挑戰(zhàn)。
(2)地理時空大數據豐富的信息內涵如何充分感知利用?多源地理時空大數據覆蓋的時段、空間或滲透人群存在明顯的差異,產生了多視角的感知。以城市人群交通活動為例,其活動信息蘊含于公交車、地鐵、出租車、私家車等不同交通方式,不同的出行方式反映了不同人群的出行規(guī)律,例如:公交或地鐵刷卡數據主要覆蓋出行相對規(guī)律的通勤者,出租車軌跡數據主要反映出租車出行者的規(guī)律,僅采用單一類型的出行數據獲得的人群交通活動研究成果往往有所偏頗。不同來源地理大數據如何實現(xiàn)對某一地理事實的共同反映和表征?多源地理時空大數據的深度融合是解決上述問題的重要途徑[25],即需要在統(tǒng)一的時空框架下,依據具體的應用需求對不同來源數據進行融合,實現(xiàn)不同時態(tài)、不同語義、不同尺度地理時空大數據的協(xié)同、信息派生與增值[26],進而采用多尺度建模、多視角協(xié)同、多特征認知與多特性表達等手段[27],基于不同來源的地理大數據對同一地理事實的表征進行深層次理解,發(fā)現(xiàn)不同來源地理時空大數據的一致性與互補性。
(3)如何破解“社會感知的結果多為驗證性的”這一困局。地理時空大數據及其提供的社會感知手段在人的行為模式挖掘等方面取得了一些新的認知成果,但是現(xiàn)有社會感知成果尚難以真正實現(xiàn)“未知知識”的發(fā)現(xiàn)。社會感知成果雖然使人們對“人—地”關系有了更加細化、定量化的認識,但是這些感知結果多是驗證性、常識性的。如何真正感知地理時空大數據背后隱含的、新穎的知識,取得諸如“胡煥庸線”的地理發(fā)現(xiàn),是大數據時代社會感知面臨的嚴峻挑戰(zhàn)。知識與數據雙重驅動的社會感知挖掘手段有望成為破解當前研究困局的重要方式,開放式、可擴展的地理知識圖譜的構建以及融合地理規(guī)律的機器學習模型的搭建是未來重要的研究方向。