史 宜
楊俊宴*
個體時空行為是指個體在不同時間所處的空間位置以及所進(jìn)行的行為,而行為個體在特定空間與特定時段分布的聚集強度稱為個體行為密度。如果將2006年《移動電話景觀:使用手機定位數(shù)據(jù)的城市分析》一文的發(fā)表作為手機信令數(shù)據(jù)介入城市研究的開端,那么個體行為密度與城市空間之間的關(guān)系就是規(guī)劃學(xué)者最早關(guān)注的問題。通過對米蘭[1-2]、羅馬[3-4]、紐約[5]、波士頓[6]、洛杉磯[7]等全球若干城市手機信令數(shù)據(jù)的研究,發(fā)現(xiàn)以手機基站為單元的手機通話量記錄(CDR)可以反映城市不同地區(qū)人群分布密度的動態(tài)變化。而隨著手機信令數(shù)據(jù)的引入,由于其具有CDR數(shù)據(jù)與SMG數(shù)據(jù)不具備的高取樣率(可記錄所有開機狀態(tài)下手機設(shè)備的定位信號)和高更新率(每5~10min進(jìn)行一次定位),手機信令數(shù)據(jù)成為城市研究中行為密度計算的更為精確的數(shù)據(jù)源。近年來,鈕心毅[8]使用手機信令數(shù)據(jù)計算上海中心城內(nèi)多個工作時段的用戶密度圖,從而進(jìn)行城市空間結(jié)構(gòu)的識別;王德[9]利用手機信令數(shù)據(jù)對上海南京東路、五角場和鞍山路3個商業(yè)中心消費者的空間分布進(jìn)行比較。綜合既有研究的成果,基于手機信令數(shù)據(jù)的行為密度計算方法不僅是信息化革命下對新數(shù)據(jù)類型的一種技術(shù)探索,而且已經(jīng)得到國內(nèi)外學(xué)界的驗證,成為當(dāng)下應(yīng)用于城市結(jié)構(gòu)和行為研究的最新科研方法。
手機信令動態(tài)數(shù)據(jù)是運營商記錄下來的手機用戶在移動通信網(wǎng)絡(luò)中活動時的位置信息,屬于非自愿提供數(shù)據(jù)。當(dāng)手機發(fā)生開機、關(guān)機、主叫、被叫、收發(fā)短信、切換基站或移動交換中心、周期性位置更新時,手機識別號、信令成功時間、當(dāng)時所處的信令小區(qū)編號均保存在手機信令數(shù)據(jù)中。
作為手機信令數(shù)據(jù)的獨有特征,信號基站是定位手機用戶空間位置的基本單元,手機通過信號基站與通信服務(wù)商的核心網(wǎng)進(jìn)行信令數(shù)據(jù)交換,而核心網(wǎng)記錄的是該時刻手機所處基站的編號及坐標(biāo),無法獲得用戶精確的坐標(biāo)定位。同樣作為信令匯總數(shù)據(jù),核心網(wǎng)可以記錄各個基站在每個時刻所服務(wù)的手機數(shù)量,但無法獲得這些用戶在基站服務(wù)范圍內(nèi)的準(zhǔn)確分布情況。因此,所有基于手機信令數(shù)據(jù)的城市空間研究,必須借助一定的計算方法來將以基站為單元的數(shù)據(jù)轉(zhuǎn)為具有更明確空間意義的數(shù)據(jù)格式。在既有的相關(guān)研究文獻(xiàn)中,已經(jīng)形成基于信令小區(qū)、基于柵格和基于空間差值等多種基于手機信令數(shù)據(jù)的行為密度算法,將手機用戶數(shù)量分配至信令小區(qū)[10-11]、柵格[1-4]等空間單元。這些行為密度計算方法是利用手機信令數(shù)據(jù)進(jìn)行人群活動分布研究的主要途徑,并在近年得到廣泛應(yīng)用,但對于城市景觀空間研究而言,既有行為密度計算方法存在以下兩大局限。
1)數(shù)據(jù)單元缺乏實際空間內(nèi)涵,封閉式的數(shù)據(jù)結(jié)構(gòu)難以與特定景觀要素相關(guān)聯(lián)。
既有計算方法在從以基站為單元的“點”數(shù)據(jù)向具有確定空間范圍的“面”數(shù)據(jù)轉(zhuǎn)化的過程中,都依賴某種抽象幾何圖形作為數(shù)據(jù)轉(zhuǎn)化的空間單元,例如基于信令小區(qū)、柵格等。抽象幾何區(qū)塊面積基本都在幾十公頃以上,在尺度上遠(yuǎn)遠(yuǎn)大于街區(qū)、地塊等城市景觀研究常用空間單元。由于劃分方式和空間尺度的差異,這些抽象幾何圖形所劃分的空間單元與真實城市中通過山體、河流、道路等邊界要素劃分的空間單元基本不存在交集,使得手機信令數(shù)據(jù)形成了一種封閉式的數(shù)據(jù)結(jié)構(gòu),難以與其他城市空間數(shù)據(jù)進(jìn)行關(guān)聯(lián)。在這種手機數(shù)據(jù)特殊結(jié)構(gòu)造成的隔離限制下,城市空間僅是襯在數(shù)據(jù)之下的底圖,行為密度數(shù)據(jù)難以實現(xiàn)真正的“空間落地”,無法對城市形態(tài)下特定范圍的城市綠地、景區(qū)等空間要素的行為密度進(jìn)行計算,這構(gòu)成了目前基于手機信令數(shù)據(jù)進(jìn)行城市空間研究的最大局限。
2)數(shù)據(jù)測算方法的精確性局限在宏觀尺度,在中觀與微觀尺度上精度明顯減低。
既有計算方法都含有人口地理分布服從正態(tài)分布的假設(shè)。數(shù)據(jù)服從正態(tài)分布是均值估計算法的基礎(chǔ),也是通過基站手機數(shù)據(jù)來推算整個城市人口動態(tài)分布的統(tǒng)計學(xué)前提。在近年國內(nèi)外基于手機數(shù)據(jù)的城市空間研究中,廣泛采用400m×400m、200m×200m甚至100m×100m的柵格來進(jìn)行行為密度計算,計算粒度的縮小,固然便于在空間中辨識計算結(jié)果,但也同時導(dǎo)致了較大計算誤差的出現(xiàn)。大量研究證明,只有在城市宏觀層面上,人口分布才是連續(xù)的、光滑的,而隨著研究尺度的縮小,人口的空間分布將出現(xiàn)越來越明顯的變異性,當(dāng)計算粒度在400、200與100m時,相對應(yīng)的變異幅度分別達(dá)到了27.1%、38.6%和50.5%[12]。這說明在中觀和微觀的研究尺度下,人口分布在正態(tài)分布以外出現(xiàn)的小尺度變異已經(jīng)使原有的人口密度測算方法出現(xiàn)嚴(yán)重的誤差。導(dǎo)致變異性的主要原因是建筑等人群活動空間在不同類型地段間的非均衡布局,城市景觀地段建筑密度普遍較低,傳統(tǒng)算法難以識別其與其他城市地段的差別,導(dǎo)致景觀地段行為密度計算出現(xiàn)較顯著的誤差。如何在中觀與微觀尺度上提高人口密度計算的精確性,目前尚未出現(xiàn)相應(yīng)的解決方法。
圖1 基于基站坐標(biāo)劃定基站小區(qū)范圍
針對既有計算方法的局限,本文提出了一種新的基于手機信令數(shù)據(jù)的人群行為密度計算方法,能夠更精確地處理中、微觀尺度下手機信令數(shù)據(jù)的空間轉(zhuǎn)化,更好應(yīng)對城市景觀地段的人群時空分布研究。
對于手機信令數(shù)據(jù)而言,只有手機向基站發(fā)送信令時,手機的用戶編號和坐標(biāo)信息才會被基站所記錄,因此在每個時刻基站僅能記錄其服務(wù)范圍內(nèi)一部分用戶的空間位置??紤]到手機信令數(shù)據(jù)的周期性更新特征,以小時為時間統(tǒng)計單位進(jìn)行各基站連接用戶數(shù)量匯總,并且以用戶在每小時內(nèi)停留時間最長的基站作為用戶在該小時唯一的基站編號進(jìn)行記錄。該匯總流程可以避免因手機信令更新的周期性造成的用戶統(tǒng)計遺漏,也可以防止因用戶在基站間移動造成用戶重復(fù)統(tǒng)計,能夠較好地反映手機用戶全天內(nèi)的宏觀空間軌跡。
信令小區(qū)是在手機通信網(wǎng)絡(luò)中以基站為中心形成的面狀服務(wù)區(qū)。在已知基站坐標(biāo)的情況下,使用泰森多邊形算法進(jìn)行信令小區(qū)范圍的計算。泰森多邊形算法是對空間平面的一種劃分方式,其特點是多邊形內(nèi)的任何位置離該多邊形樣點(如基站)的距離最近,離相鄰多邊形內(nèi)樣點的距離遠(yuǎn),且每個多邊形內(nèi)含且僅包含一個樣點。因泰森多邊形在空間剖分上的等分性特征,可用于解決最近點、最小封閉圓等問題,以及許多空間分析問題,如鄰接、接近度和可達(dá)性分析等。使用泰森多邊形算法計算每個基站服務(wù)的信令小區(qū)范圍,使每個信令小區(qū)范圍內(nèi)有且僅有一個基站,信令小區(qū)內(nèi)任一點與該基站的距離小于其他基站(圖1)。
將以手機基站為單元的手機信令數(shù)據(jù)轉(zhuǎn)化為以用地為單元的用戶空間分布數(shù)據(jù),是本算法的核心步驟,也是主要的難點所在。
圖2 三維活動空間的范圍界定
圖3 基于三維活動空間的行為密度算法與傳統(tǒng)算法的思路比較
正如上文所述,既有算法在將基于基站的人口數(shù)據(jù)分配至更小的柵格或其他空間單元時,算法中存在默認(rèn)前提:人口的空間分布在二維平面上呈正態(tài)分布特征。由于正態(tài)分布的微觀形態(tài)就是均勻分布,所以大部分研究將其簡化為以下分配規(guī)則:在同一基站內(nèi),人口分布與用地平面面積成正比。而本研究采用的算法則基于以下前提:人口的空間分布在三維活動平面上呈現(xiàn)正態(tài)分布特征,具體到基站尺度的微觀視角下,即同一基站內(nèi)人口分布與各用地內(nèi)的三維活動空間面積成正比。為進(jìn)行區(qū)別,將本算法稱為基于三維活動空間面積的算法,而將前人采用的以平面面積作為分配權(quán)重的稱作基于二維面積的算法。
本文所定義的三維活動空間指的是城市中主要人群活動的空間,由建筑空間和室外公共空間構(gòu)成,但不包括水面等人群難以進(jìn)入的公共空間(圖2)。而對于特定的城市片區(qū),三維活動空間面積可以表達(dá)為:
本文以三維活動空間面積而非二維用地面積作為分配權(quán)重,提出以下基于三維活動空間面積的手機用戶行為密度算法,公式為:
2種算法思想的差異可以用圖3進(jìn)行直觀的說明。假設(shè)某基站內(nèi)包含2塊相同面積的用地,用地A為某開敞綠地,用地B為某容積率為4.0、密度為1.0的商業(yè)用地。若基于傳統(tǒng)算法,則A綠地分配的人數(shù)與B商業(yè)用地相等,但相同活動面積上的人數(shù)是B用地的4倍;若基于新算法,則A綠地分配的人數(shù)是B商業(yè)用地的1/4,而相同活動面積上的人數(shù)與B用地相當(dāng)。很顯然,新算法描述的這種中微觀人群分布狀況更符合城市景觀研究中的實際情況。
應(yīng)用該算法,對研究范圍內(nèi)數(shù)量為j的手機基站n時段內(nèi)的信令數(shù)據(jù)進(jìn)行計算,將以基站為單元的數(shù)據(jù)格式有效轉(zhuǎn)化為以用地為單元的數(shù)據(jù)格式,獲得的行為密度數(shù)據(jù)的格式如表1所示。由于用地是城市研究領(lǐng)域常用的數(shù)據(jù)單元,同時也便于與綠地、景區(qū)、交通小區(qū)和行政區(qū)等數(shù)據(jù)單元進(jìn)行轉(zhuǎn)化,因此該算法為構(gòu)建融合人群活動、土地利用、交通組織等多源異構(gòu)數(shù)據(jù)的耦合分析平臺奠定了基礎(chǔ)。
根據(jù)基于三維活動空間的行為密度算法,對上海手機用戶動態(tài)分布進(jìn)行了計算。研究樣本為上海市域范圍內(nèi)約8 500個手機基站所記錄的2G用戶的信令數(shù)據(jù),數(shù)據(jù)取樣日期共8日,分別選取2015年春季、夏季、秋季和冬季各2天,每個季節(jié)選取工作日、節(jié)假日各1天。在計算過程中,以用地為空間單元,中心城區(qū)內(nèi)共有用地12 584個,平均用地面積為1.9hm2,城市中湖泊、河流、生態(tài)用地等行為難以進(jìn)入的區(qū)域作為不參評地區(qū);以小時為時間刻度,分別記錄每個空間單元每小時的行為密度數(shù)值,8個樣本日共記錄時間刻度192個,平均每小時記錄1 800萬用戶,峰值可達(dá)近2 000萬人。
根據(jù)行為密度的計算結(jié)果,可以對上海中心城區(qū)各個片區(qū)手機用戶規(guī)模的晝夜變化進(jìn)行統(tǒng)計。在上海中心城區(qū)范圍內(nèi),工作日全日各時段平均用戶數(shù)量為903.7萬人,最大值為960.8萬人,最小值為844.6萬人;節(jié)假日各時段平均用戶數(shù)量為897.1萬人,最大值為953.4萬人,最小值為841.1萬人;工作日與節(jié)假日用戶數(shù)量最大值均出現(xiàn)在18:00,最小值均出現(xiàn)在4:00。
上海中心城區(qū)內(nèi)公園綠地總面積約22.4km2。以春季某工作日為例,上海中心城區(qū)城市公園綠地手機用戶規(guī)模最小值出現(xiàn)在5:00,約為0.2萬人,人群規(guī)模在8:00—10:00迅速增加至6.5萬人,對應(yīng)了晨間公園綠地早鍛煉等活動;從10:00—15:00緩慢升高,這一時段為主要的工作時段,公園活動人群規(guī)模并沒有顯著的變化;15:00達(dá)到最大值,約為8.3萬人,至20:00緩慢下降至約5.0萬人,對應(yīng)了工作日下班后公園綠地的活動人群出現(xiàn)增加;人群規(guī)模在20:00后快速下降,對應(yīng)活動人群離開公園綠地并返回居所(圖4)。手機用戶規(guī)模的晝夜變化以及峰值分布,基本對應(yīng)了人群在工作日不同時段對城市公園綠地的使用特征。
而將上海中心城區(qū)城市公園綠地在春季工作日與節(jié)假日手機用戶規(guī)模的動態(tài)變化進(jìn)行對比。與工作日相同,節(jié)假日城市公園綠地手機用戶規(guī)模最小值出現(xiàn)在5:00,約為0.2萬人;人群規(guī)模在6:00—11:00開始顯著增加至6.9萬人,其中每個時刻的人數(shù)規(guī)模均高于同時段工作日;11:00—18:00人數(shù)變化很小,15:00達(dá)到最大值7.8萬人,但數(shù)值相比白天其他時段并不凸顯,這反映了節(jié)假日公園綠地人群活動相對較少受到工作通勤的影響;18:00之后公園綠地人群規(guī)模持續(xù)降低,并恢復(fù)到與工作日相似的曲線。比較工作日與節(jié)假日手機用戶規(guī)模的動態(tài)變化,在夜間公園綠地的人群規(guī)模非常相似且處于較低的水平,而在晝間,節(jié)假日人群規(guī)模的動態(tài)變化相對工作日而言在時間上分布更加均衡。
根據(jù)行為密度計算的結(jié)果,可以用地為空間單元,對每個用地的人口動態(tài)密度分別進(jìn)行計算,并將不同地段的人群分布進(jìn)行比較,獲得人群活動時空規(guī)律的直觀精確認(rèn)知。
以春季某工作日為例,上海中心城區(qū)內(nèi)公園綠地行為密度最高的地塊可達(dá)6萬人/km2,而密度最低的綠地密度則低于0.2萬人/km2。這說明在同一時段,不同公園綠地的行為活動密度也有巨大差異(圖5)。
本文提出基于三維活動空間面積的行為密度計算方法,本質(zhì)上是繼承既有研究中基于二維面積算法的數(shù)學(xué)思想,并將其放在城市三維空間視角中重新審視,從而建構(gòu)的一種適用于城市景觀研究的行為密度算法。新算法的主要改進(jìn)目標(biāo),就是提高基于手機信令數(shù)據(jù)的行為密度算法在城市中微觀尺度上的精確性,因此有必要借助實證案例比較2種算法及其計算結(jié)果的精確性,以檢驗新算法的可行性。
為了驗證本文對上海人口分布的計算結(jié)果,選擇具體地塊進(jìn)行人口密度實測,將計算結(jié)果與實測結(jié)果進(jìn)行對比。如圖6所示,A地塊為上海人民公園,是位于城市中心的大型城市綠地公園,面積約為11.3hm2,作為參照的B地塊為緊鄰人民公園的來福士廣場,為高容積率的商業(yè)商務(wù)街區(qū),面積約為1.7hm2,包含地面7層的商業(yè)中心和48層的甲級寫字樓。表2顯示了秋季某工作日14:00—15:00記錄的手機信令數(shù)據(jù)在2種不同算法處理下,A、B地塊的人口計算結(jié)果。
圖4 上海中心城區(qū)公園綠地春季工作日/節(jié)假日晝夜人群規(guī)模變化
圖5 某春季工作日上海公園綠地行為密度晝夜差異
圖6 基于三維活動空間的行為密度算法與傳統(tǒng)算法的計算結(jié)果比較
在基于傳統(tǒng)算法的結(jié)果中,A地塊(人民公園)在該時段有10 457.2人,平均每公頃活動空間內(nèi)有919.3人,相當(dāng)于每個籃球場大小的面積內(nèi)有38.6人;而B地塊(來福士廣場)在該時段有1 418.3人,平均每公頃活動空間內(nèi)有65.9人,相當(dāng)于其每個2 200m2的寫字樓標(biāo)準(zhǔn)層內(nèi)僅有14.5人。而在基于三維活動空間面積的算法結(jié)果中,A地塊(人民公園)在該時段有3 096.4人,平均每公頃活動空間內(nèi)有272.2人,該密度相當(dāng)于每個籃球場大小的面積內(nèi)有11.4人;而B地塊(來福士廣場)在該時段有6 469.5人,平均每公頃活動空間內(nèi)有300.8人,相當(dāng)于每個2 200m2的寫字樓標(biāo)準(zhǔn)層內(nèi)有66.2人。通過實際調(diào)查,人民公園在工作日下午的游客人數(shù)約為2 500~4 000人,在不舉辦大型集會活動時不會超過10 000人;而參考甲級寫字樓設(shè)計規(guī)范,來福士廣場2 200m2的寫字樓標(biāo)準(zhǔn)層可布置工作人員約100人,結(jié)合空置率、工作人員離開等因素的影響,工作時段各標(biāo)準(zhǔn)層的工作人員約為50~90人。比較2種算法的結(jié)果,傳統(tǒng)算法對于人民公園的人口密度計算值過高,而對來福士廣場地塊的人口計算值又遠(yuǎn)遠(yuǎn)低于一般商務(wù)寫字樓的運營狀態(tài),相比之下,基于三維活動空間面積的算法結(jié)果則更符合實際調(diào)查的結(jié)果,精確度更高(表2)。
表1 以用地為單元的行為密度數(shù)據(jù)格式
表2 基于三維活動空間的行為密度算法與傳統(tǒng)算法的計算結(jié)果比較
正如前文所述,基于手機數(shù)據(jù)的人口密度計算中誤差的重要來源是導(dǎo)致變異性的主要原因,是建筑等人群活動空間在不同類型地段間的非均衡性,城市景觀地段建筑密度與城市其他地段差異越大,景觀研究的空間單元尺度越小,變異性表現(xiàn)得越明顯,這使得變異性帶來的誤差在大尺度下并不顯著,而在景觀規(guī)劃常用中微觀研究尺度下,通過手機信令數(shù)據(jù)測算的人群行為密度數(shù)據(jù)與實際人群分布出現(xiàn)較明顯的誤差。
本研究提出的基于三維活動空間的行為密度算法,由于在面積權(quán)重中增加了建筑面積參數(shù),從而能更好識別城市景觀地段與其他城市地段的差異,應(yīng)對人群分布計算中景觀地段的特殊性。以上海為案例的實證結(jié)果表明,該算法不僅可以實現(xiàn)城市綠地、景區(qū)、濱水地段等具體景觀要素的時空間行為密度計算,同時也提升了中小尺度下基于手機數(shù)據(jù)進(jìn)行個體行為密度計算的精確性,對于城市大數(shù)據(jù)應(yīng)用于城市景觀研究與設(shè)計的方法創(chuàng)新具有一定的借鑒作用。
注:文中圖片均由作者繪制。