張 帆,胡明遠(yuǎn),林 琿
1. 香港中文大學(xué)太空與地球信息科學(xué)研究所,中國 香港; 2. 北京大學(xué)遙感與地理信息系統(tǒng)研究所,北京 100871; 3. 香港中文大學(xué)深圳研究院,廣東 深圳 518057
虛擬地理試驗是指在虛擬地理環(huán)境中協(xié)同地進(jìn)行分析和模擬復(fù)雜地理過程、現(xiàn)象,并支持共同決策和知識信息共享的理論框架[1-3]。虛擬地理試驗將傳統(tǒng)試驗地理學(xué)中從野外考察觀測、實驗室環(huán)境物理模擬、地理過程數(shù)學(xué)建模等研究方法數(shù)字化、虛擬化,開拓了“虛實結(jié)合”試驗地理學(xué)的新方向[2,4-8]。
隨著虛擬地理試驗理論和方法的發(fā)展,各個地學(xué)相關(guān)領(lǐng)域在進(jìn)行應(yīng)用的同時[9-12],也對其提出了更高的要求。尤其是在以人為主要研究對象,針對個體、群體的空間認(rèn)知、人地關(guān)系耦合等方面,相關(guān)研究對其進(jìn)行了拓展,并發(fā)展了虛擬地理認(rèn)知試驗的理論框架[13]。虛擬地理認(rèn)知試驗一方面關(guān)注如何構(gòu)建虛擬地理環(huán)境,來快速引導(dǎo)個體認(rèn)識地理環(huán)境的地理對象、地理現(xiàn)象;另一方面,其更加關(guān)注如何在虛擬地理環(huán)境中開展面向個體對環(huán)境的感知、認(rèn)知,以及行為的試驗。虛擬地理認(rèn)知試驗的研究框架自提出以來,為空間綜合人文學(xué)與社會科學(xué)的研究提供了有力的工具、方法和思路[12,14-18]。
在關(guān)注人與環(huán)境相互作用的學(xué)科中,傳統(tǒng)的研究范式通過訪談、問卷、觀察等數(shù)據(jù)采集手段,與傳統(tǒng)的統(tǒng)計分析、案例分析來開展區(qū)域的實證研究,使得其試驗數(shù)據(jù)的規(guī)模、尺度、體量大大受限,研究結(jié)果難以泛化[19]。而當(dāng)前的虛擬地理認(rèn)知實驗參照心理學(xué)、認(rèn)知科學(xué)、神經(jīng)科學(xué)等領(lǐng)域的試驗方法,大多通過在虛擬地理環(huán)境中構(gòu)建試驗環(huán)境,主動地進(jìn)行上下文環(huán)境要素控制來觀測個體在不同上下文中的感知、認(rèn)知以及行為模式[13,20]。
隨著大數(shù)據(jù)時代的到來,海量個體認(rèn)知及行為數(shù)據(jù)為人地關(guān)系的研究提供了潛在的機(jī)會,同時也對虛擬地理認(rèn)知實驗提出了進(jìn)一步的要求——如何構(gòu)建新一代的虛擬地理認(rèn)知實驗范式,從海量個體數(shù)據(jù)中提取個體和空間、場所的交互模式,考慮空間分異和場所語義對個體行為模式的影響機(jī)制,挖掘其在不同尺度上相互作用的機(jī)理,從而系統(tǒng)地構(gòu)建地理知識工程。
從研究方法的角度,大數(shù)據(jù)的背景下的科學(xué)研究基本范式已經(jīng)從試驗歸納、模型推演、仿真模擬的階段,進(jìn)入了第4類研究范式——數(shù)據(jù)密集型科學(xué)研究(data-intensive scientific discovery)[21-22]。相比于傳統(tǒng)的實驗科學(xué)范式,數(shù)據(jù)密集型研究范式更加注重對規(guī)律的挖掘,弱化了對噪聲的對待。大數(shù)據(jù)時代下的數(shù)據(jù)規(guī)模性、多源性、復(fù)雜異構(gòu)性已經(jīng)超出了個體人腦的認(rèn)知和理解能力。而基于人工智能,數(shù)據(jù)挖掘等技術(shù)的“認(rèn)知計算”為在大數(shù)據(jù)中挖掘地理知識提供了潛在的途徑,為理解人們的認(rèn)知、感知和行為提供了有力的支持[23]。與認(rèn)知計算不同的是,虛擬地理認(rèn)知實驗更加關(guān)注在個體和空間、環(huán)境交互中產(chǎn)生的感知和行為數(shù)據(jù),旨在挖掘個體的認(rèn)知、感知和行為受空間因素影響的機(jī)理模式。
事實上,在大數(shù)據(jù)時代的背景下人們生活的物理、社會空間已經(jīng)被構(gòu)建成了一個巨大的虛擬實驗室,無時無刻地不在記錄著微觀個體、宏觀群體的感知認(rèn)知狀態(tài)、活動軌跡、行為模式,等等[24-25]。在移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和通信基礎(chǔ)設(shè)施的支持下,研究人員可以從大量數(shù)據(jù)源中獲取海量的個體認(rèn)知狀況、群體行為活動和情感感知信息。例如,利用出租車軌跡數(shù)據(jù)和手機(jī)信令數(shù)據(jù)進(jìn)行居民出行行為分析,討論環(huán)境空間各類屬性(用地功能格局、距離、尺度)與個體出行、人口遷移的影響[26-29];利用社交媒體簽到數(shù)據(jù)研究不同場所中個體的情感變化與事件關(guān)聯(lián)[30-31];利用POI興趣點(diǎn)數(shù)據(jù)挖掘在居民影響活動下的城市混合用地功能分布與演化等[32-33]。
大數(shù)據(jù)不但支持了對個體行為活動、認(rèn)知感知的記錄,同時也對個體活動的空間范圍、環(huán)境屬性、功能區(qū)劃進(jìn)行了描述。這種數(shù)據(jù)環(huán)境,潛在地構(gòu)建了新一代地理認(rèn)知實驗開展的基礎(chǔ)條件——可以嘗試在個體行為、認(rèn)知活動和其對應(yīng)的上下文中建立聯(lián)系,挖掘其相互影響的關(guān)鍵要素和機(jī)制。與此同時,虛擬地理環(huán)境本身提供了對真實地理過程模擬的方法,從自然現(xiàn)象模擬到社會行為模擬,為開展在大數(shù)據(jù)背景下的虛擬認(rèn)知實驗提供了基礎(chǔ)支持。
本文將詳細(xì)介紹數(shù)據(jù)密集型研究范式下的虛擬地理認(rèn)知實驗框架,闡述從環(huán)境心理學(xué)的視角,結(jié)合多源人類活動、城市環(huán)境大數(shù)據(jù)構(gòu)建實驗平臺的方法,進(jìn)而支持地理知識工程構(gòu)建的思路。第2節(jié)是一個在新一代虛擬地理認(rèn)知實驗框架下的案例分析。案例描述了如何利用表達(dá)城市視覺空間的海量街景數(shù)據(jù)及來源于眾包的評價數(shù)據(jù),結(jié)合深度學(xué)習(xí)和計算機(jī)視覺的方法,來挖掘影響個體情感感知的視覺要素。試驗發(fā)現(xiàn)了可視域中與個體對場景的情感維度-壓抑感具有較高相關(guān)性的視覺要素,如植被、建筑、墻體和車輛等,并通過多重線性回歸分析予以量化。最后,對本文所提出的實驗框架和案例分析進(jìn)行了總結(jié),并對未來的研究進(jìn)行了展望。
環(huán)境心理學(xué)中將人與環(huán)境的交互模式分為4種,分別是解釋(interpretive)、評估(evaluative)、操作(operative)和響應(yīng)(responsive)[34-35]。其中評估和解釋是個體對環(huán)境的認(rèn)知模式;響應(yīng)和操作是個體對環(huán)境的行為模式。從另一個角度看,解釋和操作體現(xiàn)了個體對環(huán)境的主動性,而評估和響應(yīng)則體現(xiàn)了個體被動地受環(huán)境的影響模式。如圖1所示,虛擬地理認(rèn)知實驗參照環(huán)境心理學(xué)中人與環(huán)境的交互模式,針對人地關(guān)系的理解開展試驗。
大數(shù)據(jù)背景下的虛擬地理認(rèn)知實驗,將利用海量大數(shù)據(jù)來支持人類活動行為模式的表達(dá)和地學(xué)試驗環(huán)境的構(gòu)建。與傳統(tǒng)的虛擬地理認(rèn)知實驗不同,新一代的虛擬地理認(rèn)知實驗不再主動構(gòu)建試驗環(huán)境,控制環(huán)境參數(shù)來進(jìn)行多次重復(fù)試驗對個體進(jìn)行研究,而是將現(xiàn)實環(huán)境的物理、社會空間作為一個虛擬實驗室。一方面通過對現(xiàn)實環(huán)境描述的大數(shù)據(jù)來獲得地學(xué)實驗環(huán)境的基本配置信息;另一方面,通過在現(xiàn)實環(huán)境中時時刻刻記錄著的人類活動行為大數(shù)據(jù),觀察被試個體及群體的感知認(rèn)知狀態(tài)、活動軌跡、行為模式等。
其中,人類活動行為模式的主要來源是居民在出行活動中主動發(fā)生和被動采集的數(shù)據(jù)。例如,在社交媒體和大眾點(diǎn)評中對周邊環(huán)境評估的認(rèn)知和情感的文字表達(dá),在地圖導(dǎo)航、公共交通和手機(jī)通話過程中留下的行為軌跡信息等。這些數(shù)據(jù)表達(dá)了個體、群體對上下文的認(rèn)知、情感和行為信息,而從中高效地挖掘出相應(yīng)的規(guī)律和模式需要借助由自然語言處理、計算機(jī)視覺和復(fù)雜性理論等領(lǐng)域支撐下的空間知識發(fā)現(xiàn)方法和認(rèn)知計算技術(shù)[23]。
在地學(xué)實驗環(huán)境的描述方面,本研究討論的地學(xué)實驗環(huán)境主要是指城市實體環(huán)境,而不是網(wǎng)絡(luò)虛擬環(huán)境。城市環(huán)境是人類活動的主要場所,同時也是人類活動大數(shù)據(jù)產(chǎn)生的主要環(huán)境。多源眾包(crowdsouring)的城市大數(shù)據(jù)同樣對城市的物理和社會環(huán)境進(jìn)行了刻畫。例如來源于谷歌、騰訊的街景數(shù)據(jù),密集地覆蓋了城市路網(wǎng)的每一個角落,完整地表達(dá)了城市的物理視覺空間?;诒姲腛penStreetMap地圖,精細(xì)地刻畫了不同尺度的城市路網(wǎng)、交通、建筑等信息。類似的,來源于地圖應(yīng)用服務(wù)的POI(point of interest)數(shù)據(jù),較直觀地反映了居民生活和出行的興趣點(diǎn)和需求,對地理場所的語義信息進(jìn)行了描述。簡而言之,透視城市空間的上下文大數(shù)據(jù),可以較全面、多尺度、多視角地表達(dá)和理解城市的物理視覺環(huán)境、空間結(jié)構(gòu)、功能格局等信息。
人類活動大數(shù)據(jù)和城市空間的上下文大數(shù)據(jù)構(gòu)成了數(shù)據(jù)密集型研究范式下的虛擬地理認(rèn)知實驗的數(shù)據(jù)基礎(chǔ),是開展虛擬地理認(rèn)知實驗的重要條件。一方面,城市上下文大數(shù)據(jù)為地學(xué)實驗環(huán)境的自然、社會和人文屬性提供了基礎(chǔ)性描述;另一方面,在認(rèn)知計算的支持下人們可以洞察在人類活動大數(shù)據(jù)中的居民認(rèn)知、情感和行為模式。而挖掘二者之間的相互作用模式、耦合關(guān)系和影響機(jī)制,以及如何表達(dá)、建模、模擬、預(yù)測人地相互作用模式等是新一代虛擬地理認(rèn)知實驗的主要目標(biāo)。更進(jìn)一步,區(qū)別于在其他心理學(xué)、環(huán)境科學(xué)、地球系統(tǒng)科學(xué)等領(lǐng)域的知識發(fā)現(xiàn)方法,新一代的虛擬地理認(rèn)知實驗旨在從地理學(xué)的視角來探索人地關(guān)系問題,嘗試挖掘在人類活動和空間場所的交互模式背后,由空間依賴性、空間異質(zhì)性、尺度效應(yīng)等地理學(xué)基本問題驅(qū)動的新知識,從而從人地關(guān)系傳統(tǒng)上支持地理知識工程的構(gòu)建。
本研究提供了一個在新一代虛擬地理認(rèn)知實驗框架下開展的案例分析。研究利用圖片數(shù)據(jù)和基于計算機(jī)視覺的圖片內(nèi)容理解技術(shù)來對實驗環(huán)境的基本配置信息進(jìn)行描述,同時利用來自于互聯(lián)網(wǎng)眾包的上百萬次評價數(shù)據(jù)作為被試產(chǎn)生的試驗數(shù)據(jù)。通過分析來自于眾包的街景壓抑感評價數(shù)據(jù),以及基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖片物體語義分割方法,試驗對影響個體對城市場景壓抑感的視覺要素進(jìn)行了挖掘。
MITMediaLab在2013年開始了“Place Pulse”項目[19]。項目首先采集了來自全球56個城市的11萬張街景影像,構(gòu)建了一個在web端的在線試驗平臺,邀請來自于全球的互聯(lián)網(wǎng)用戶來給街景圖片打分。在每次試驗中,要求志愿者回答諸如“以下哪張圖片看起來更壓抑的問題”。此試驗的網(wǎng)頁界面如圖2所示。
Place Pulse一共收集了來自全球超過8萬名互聯(lián)網(wǎng)用戶的100多萬次評價數(shù)據(jù),包括安全感、生機(jī)感、乏味感、富有感、壓抑感、美麗感等6個情感感知維度??紤]到其樣本數(shù)據(jù)和評分?jǐn)?shù)據(jù)的空間分布以及多樣性,Place Pulse數(shù)據(jù)庫中的評分?jǐn)?shù)據(jù)可以被認(rèn)為是一般個體對于城市風(fēng)貌的一般性評價。
為了量化表達(dá)街景圖片中的語義內(nèi)容,引入基于深度學(xué)習(xí)的場景語義分割(scene semantic segmentation)技術(shù)對圖片中的天空、建筑物、道路等信息進(jìn)行提取和量化表達(dá)。
場景語義分割是計算機(jī)視覺中的一個研究方向,旨在對圖片中的語義目標(biāo)進(jìn)行分割、識別和分類?;趥鹘y(tǒng)計算機(jī)視覺方法的準(zhǔn)確度一直受限于使用人工設(shè)計的或是淺層次和中等層次的視覺特征。而基于深度神經(jīng)網(wǎng)絡(luò)提取出來的圖像深度特征被認(rèn)為具有較強(qiáng)、較高效的表達(dá)能力,已經(jīng)在包括計算機(jī)視覺、自然語言處理等領(lǐng)域獲得了出色的表現(xiàn)[36]。
本試驗利用目前較高效的一個場景語義分割模型PSPNet[37],對街景圖片進(jìn)行語義分割。訓(xùn)練在ADE20K場景語義標(biāo)注數(shù)據(jù)庫[38]下的PSPNet模型,在150類場景物體的像素級分類中可以獲得80.04%的準(zhǔn)確度[37]。
向量中的每個維度表示了一個特定物體在圖片P中的像素點(diǎn)占比情況,可以認(rèn)為是場景P中的物體Oi在可視域中的面積占比。
y=β0+β1x1+β2x2+…+βn-1xn-1+e
(2)
式中,βi反映了解釋變量xi對響應(yīng)變量y的貢獻(xiàn)程度。試驗通過最小二乘法對βi進(jìn)行估計。
試驗采用MIT Place Pulse數(shù)據(jù)庫中來自于全球56個城市的110 988張街景影像數(shù)據(jù),每張街景數(shù)據(jù)都有對應(yīng)的壓抑感評分結(jié)果。共計81 630位在線志愿者參與了評分。
表1展示了個體場景壓抑感和場景要素回歸分析的試驗結(jié)果,列出了與個體壓抑感較相關(guān)的15類視覺要素,其中的***代表回歸系數(shù)顯著性檢驗的P值小于0.001。通過結(jié)果可以發(fā)現(xiàn),天空(0.211 9)、墻體(0.143 1)、建筑(0.129 1)等視覺要素在可視域中的面積與個體壓抑感呈正相關(guān)關(guān)系;樹木(-0.336 8)、盆栽(-0.150 9),草地(-0.131 7)等視覺要素在可視域中的面積與個體壓抑感有較顯著的負(fù)相關(guān)關(guān)系。
表1場景壓抑感和場景視覺要素關(guān)系的多重線性回歸分析結(jié)果
Tab.1Resultsofmultivariateregressionanalysisbetweensensesofdepressingandpresenceofvisualelements
視覺要素(visual elements)回歸系數(shù)β天空(sky)0.2119…墻體(wall)0.1431…建筑(building)0.1291…階梯(floor)0.1153…圍欄(fence)0.0985…橋(bridge)0.0828…土地(field)0.0696…??河流(river)-0.0345…汽車(car)-0.044…房屋(house)-0.0548…步行道(sidewalk)-0.0561…小徑(path)-0.0942…草地(grass)-0.1317…盆栽(plant)-0.1509…樹木(tree)-0.3368…
事實上,試驗結(jié)果整體上與在環(huán)境心理學(xué)、生態(tài)景觀學(xué)等領(lǐng)域的理論相呼應(yīng)[35,39]??梢曈蛑械木G色植被,如樹木、盆栽、草地等可以顯著地降低個體壓抑感。值得注意的是,人行道與小徑對壓抑感的降低也有一定的貢獻(xiàn),這個結(jié)果與文獻(xiàn)[40]主張的街道設(shè)計理念相呼應(yīng)。而視野中汽車與小房屋的出現(xiàn)某種程度上增加了場景中的生機(jī)感,從而降低了壓抑感。另一方面,可視域中的墻體、建筑、階梯、圍欄等人造地物往往使得人們感到壓抑。通過試驗結(jié)果可以發(fā)現(xiàn),如何建設(shè)人造地物來減少人造地物對個體情感感知的影響是一個需要城市設(shè)計等領(lǐng)域長期關(guān)注的問題;控制城市景觀中的人造地物和自然景觀的比例是構(gòu)建“可治愈環(huán)境(healing environment)”的關(guān)鍵要素。
圖1 大數(shù)據(jù)背景下的虛擬地理認(rèn)知實驗框架Fig.1 Framework of virtual geographic cognition experiment in big data era
圖2 MIT Place Pulse眾包數(shù)據(jù)采集平臺界面Fig.2 User interface of MIT Place Pulse data collection platform
圖3 試驗框架:基于街景壓抑感評分和場景視覺要素分割的認(rèn)知實驗方法Fig.3 Cognitive experiment based on depressing score of street view image and scene semantic segmentation
在與個體壓抑感呈正相關(guān)的視覺要素中,天空在可視域中的比例呈現(xiàn)了最高的相關(guān)性。天空作為自然景觀的一部分,往往給人帶來開闊而舒適的感受,相對而言,這個結(jié)論與直覺相違背。事實上,城市場景中大面積天空的出現(xiàn)的場景往往是高速公路和城際快速通道,這類場景伴隨著較少的植被和一定的人造地物,往往會使人感到壓抑。類似的,需要指出的另一個問題是,場景的構(gòu)成受到了很多自然的約束,場景中各個視覺要素的出現(xiàn)以及可視域中的比例并不相互獨(dú)立,這使得試驗在進(jìn)行回歸分析的過程中伴隨著解釋變量共線性的問題。這一點(diǎn)需要在未來的研究中得到關(guān)注。
針對如何在數(shù)據(jù)密集型科學(xué)研究范式下開展虛擬地理認(rèn)知實驗的問題,本研究提出了大數(shù)據(jù)背景下的新一代虛擬地理認(rèn)知實驗框架。傳統(tǒng)的虛擬地理認(rèn)知實驗參照心理學(xué)、認(rèn)知科學(xué)等領(lǐng)域的試驗方法,通過構(gòu)建虛擬環(huán)境,主動地進(jìn)行上下文環(huán)境參數(shù)控制,進(jìn)而利用多次重復(fù)試驗觀測個體的不同行為反應(yīng)。與此不同,新一代的虛擬地理認(rèn)知實驗將在環(huán)境心理學(xué)和認(rèn)知計算的理論支持下,將現(xiàn)實環(huán)境的物理、社會空間作為一個虛擬實驗室,從對現(xiàn)實環(huán)境描述的大數(shù)據(jù)來獲得地學(xué)實驗環(huán)境的基本配置信息。與此同時,通過在現(xiàn)實環(huán)境中實時記錄著的海量人類活動行為大數(shù)據(jù),來提取微觀個體、宏觀群體和空間、場所之間的相互影響模式,挖掘其在不同尺度上相互作用的機(jī)理,為系統(tǒng)地構(gòu)建地理知識工程提供方法支持。
與此同時,同樣需要在未來的研究中充分考慮利用大數(shù)據(jù)開展虛擬地理認(rèn)知實驗所帶來的問題。例如,大數(shù)據(jù)在采樣過程中帶來的有偏性、數(shù)據(jù)代表性、尺度依賴性、不確定性等問題,在新一代的虛擬地理認(rèn)知實驗中需要認(rèn)真對待。如何從多源異構(gòu)的、實時動態(tài)的、局部與全局的大數(shù)據(jù)中構(gòu)建合理模型,來挖掘人機(jī)物三元空間的交互模式,是在未來開展具體的研究中需要處理的具體問題。
本文同樣介紹了在提出的虛擬地理認(rèn)知實驗框架下的一項案例研究。研究為了探索個體情感與城市視覺環(huán)境的相關(guān)關(guān)系,通過分析十萬張街景影像數(shù)據(jù),以及來自于眾包的上百萬次街景的評價數(shù)據(jù),實現(xiàn)了對影響個體對場景壓抑感的視覺要素進(jìn)行了挖掘和量化。事實上,如何在最大化城市街道功能的前提下進(jìn)行城市街道布局,來保持街道活力、提高居民慢行環(huán)境可出行性、提高視覺環(huán)境舒適度等是城市規(guī)劃和城市設(shè)計一直關(guān)心的問題,本案例的研究結(jié)果可為相關(guān)領(lǐng)域的研究提供一定的參考。
本研究的案例一定程度上支持了本文提出的大數(shù)據(jù)背景下虛擬地理認(rèn)知實驗框架的合理性和有效性。案例利用海量個體情感數(shù)據(jù),結(jié)合統(tǒng)計分析模型對城市視覺環(huán)境影響個體的認(rèn)知問題進(jìn)行了探索。事實上,大數(shù)據(jù)一方面可以從不同的視角、不同的尺度重訪和驗證學(xué)科的先驗知識;另一方面,基于數(shù)據(jù)挖掘、深度學(xué)習(xí)、復(fù)雜性理論的認(rèn)知計算技術(shù)將為地學(xué)大數(shù)據(jù)的處理提供更多的手段,對虛擬地理認(rèn)知實驗提供更有力的方法支持,為人地關(guān)系的表達(dá)、建模、模擬等提供更高效的解決方案。
值得一提的是,本研究在針對“人地關(guān)系”的問題上,強(qiáng)調(diào)的是理解個體、群體與實體空間之間的相互作用模式,如居民與城市環(huán)境之間的相互影響模式等。在未來的研究中,同樣需要關(guān)注個體與社會虛擬空間之間的交互。例如,不同城市環(huán)境背景下的居民在社交媒體網(wǎng)絡(luò)中的認(rèn)知、情感和行為可能表現(xiàn)出一定的差異性,而虛擬社交媒體網(wǎng)絡(luò)空間的結(jié)構(gòu)、模式、格局同樣可能影響用戶在其實體城市環(huán)境的認(rèn)知、情感和行為。探索個體、群體與實體自然環(huán)境間和虛擬網(wǎng)絡(luò)環(huán)境之間的關(guān)系將進(jìn)一步幫助人們從更多的視角和更深的層次理解地理學(xué)中的“人地關(guān)系”。