張亦漢,鐘欣梅,李建程
(1.廣東財(cái)經(jīng)大學(xué)地理與旅游學(xué)院,廣東廣州 510320;2.貴州師范大學(xué)中國(guó)南方喀斯特研究院,貴州貴陽 550001)
利用自行車借還記錄分析與挖掘空間位置信息
張亦漢1,鐘欣梅2,李建程1
(1.廣東財(cái)經(jīng)大學(xué)地理與旅游學(xué)院,廣東廣州 510320;2.貴州師范大學(xué)中國(guó)南方喀斯特研究院,貴州貴陽 550001)
目前,大多數(shù)基于個(gè)體空間位置信息的研究只能對(duì)個(gè)體活動(dòng)空間的特征進(jìn)行粗略的描述,而無法挖掘群體偏好和個(gè)體間的關(guān)系。本文結(jié)合利用時(shí)間地理學(xué)理論方法,對(duì)地理時(shí)空數(shù)據(jù)進(jìn)行分析和挖掘,得出個(gè)人活動(dòng)區(qū)域的規(guī)模、個(gè)人行為及其相關(guān)對(duì)象間的關(guān)系等。試驗(yàn)表明,利用廣東財(cái)經(jīng)大學(xué)三水校區(qū)的自行車借還記錄可以分析出學(xué)生的分布、地點(diǎn)間的聯(lián)系緊密程度、就餐偏好、課程安排及人際關(guān)系等情況。
空間位置信息;個(gè)體行為;時(shí)間地理;數(shù)據(jù)挖掘
目前,個(gè)體活動(dòng)行為過程的研究越來越受到國(guó)內(nèi)外學(xué)者的重視,逐漸形成了如時(shí)間地理學(xué)等的理論方法[1-2]。時(shí)間地理學(xué)是一種能夠有效分析個(gè)體活動(dòng)的方法。它認(rèn)為個(gè)體活動(dòng)只能在特定時(shí)間和特定地點(diǎn)發(fā)生,即遵守時(shí)間和空間的制約[3]。因此,一些學(xué)者根據(jù)個(gè)體受到的限制的不同將其分成如下幾類:①能力制約,受到個(gè)人自身能力(如休息、用餐等生理性需求)制約的一類;②組合制約,個(gè)體為了進(jìn)行某種活動(dòng)(如社交、聚會(huì)等)和其他人同時(shí)存在于某一特定場(chǎng)所;③權(quán)威制約,由于法律規(guī)范等把個(gè)體從某些特定時(shí)間和空間內(nèi)排除的一類。由于每個(gè)人活動(dòng)均受到空間和時(shí)間的約束,因此,一些學(xué)者通過時(shí)空棱柱把個(gè)人在時(shí)空活動(dòng)的制約用圖表示[4-7]。
有學(xué)者認(rèn)為個(gè)體行為的活動(dòng)空間還是研究城市社會(huì)空間的重要指標(biāo)[7-8]。研究個(gè)體行為常常采用問卷調(diào)查的方式。該方法也常常應(yīng)用于個(gè)人生活質(zhì)量、可達(dá)性、社會(huì)分異和社會(huì)公平等研究[9]。也有學(xué)者認(rèn)為該方式只考慮起點(diǎn)與終點(diǎn),卻忽略了居民出行穿過的區(qū)域,而這些被忽略的區(qū)域?qū)€(gè)體活動(dòng)有著極大影響[10]。近年來,基于GPS、手機(jī)等定位技術(shù)的移動(dòng)數(shù)據(jù)被應(yīng)用于居民日?;顒?dòng)與出行行為的研究中[11-12],但是這一技術(shù)需要電信運(yùn)營(yíng)商的支持。目前,大多數(shù)研究只能根據(jù)數(shù)據(jù)收集的結(jié)果對(duì)活動(dòng)空間的特征進(jìn)行粗略的描述,而無法挖掘個(gè)體之間的聯(lián)系,更為重要的是驗(yàn)證數(shù)據(jù)往往非常難以獲取。
因此,本文擬利用時(shí)間地理學(xué)概念及其理論,對(duì)地理時(shí)空數(shù)據(jù)進(jìn)行探討和分析,可得出描述區(qū)域的規(guī)模、個(gè)人的行為和研究對(duì)象之間的關(guān)系;并將這些理論和方法應(yīng)用到廣東財(cái)經(jīng)大學(xué)三水校區(qū)的自行車借還記錄中,分析學(xué)生的分布、地點(diǎn)間的聯(lián)系緊密程度、就餐偏好分析、課程安排及人際關(guān)系情況。
廣東財(cái)經(jīng)大學(xué)三水校區(qū)占地面積105 hm2,在校學(xué)生約有10 007人。宿舍樓有桃園、李園、杏園、桂園、紫園和竹園(如圖1所示)。校區(qū)的學(xué)生飯?zhí)枚寂R近宿舍,其中第一學(xué)生飯?zhí)?一飯)和第二學(xué)生飯?zhí)?二飯)最臨近李園,紫園次之,竹園最遠(yuǎn)。教學(xué)樓包括第一、第二教學(xué)樓和實(shí)驗(yàn)樓。
本文研究的樣本數(shù)據(jù)來自廣東財(cái)經(jīng)大學(xué)三水校區(qū)信息學(xué)院青年協(xié)會(huì)舉辦的“愛在單行”活動(dòng),該活動(dòng)分別在李園、竹園、實(shí)驗(yàn)樓、一飯和二飯?jiān)O(shè)置了自行車服務(wù)點(diǎn)。本文選取了2013年3月18日和21日兩天的自行車出借信息,分別提取學(xué)號(hào)、班級(jí)、自行車編號(hào)、借出時(shí)間和借出地點(diǎn)、歸還時(shí)間和歸還地點(diǎn)七項(xiàng)數(shù)據(jù),最終得到1130條信息作為樣本,將樣本記錄保存為Excel文件。
圖1 三水校區(qū)平面圖
1.自行車統(tǒng)計(jì)分布特征
根據(jù)自行車借出和歸還表(見表1)可以看出,總體而言各網(wǎng)點(diǎn)的自行車使用頻率不均衡。其中實(shí)驗(yàn)樓的總借車次數(shù)、總歸還次數(shù)明顯高于其他網(wǎng)點(diǎn)的借車次數(shù)和歸還次數(shù);其次是宿舍樓竹園、學(xué)生第一飯?zhí)谩⒌诙執(zhí)煤退奚針抢顖@。這主要因?yàn)閷?shí)驗(yàn)樓是學(xué)生上課和課外活動(dòng)(協(xié)會(huì)活動(dòng)和舞蹈等)比較多的場(chǎng)所,是學(xué)生集中的地方。此外,實(shí)驗(yàn)樓離食堂和宿舍區(qū)較遠(yuǎn),需要自行車這一代步工具。從表中還可推斷竹園宿舍區(qū)的學(xué)生人數(shù)比李園多。通過查閱相關(guān)資料,竹園有4棟宿舍樓,每棟有6層,休息時(shí)段內(nèi)每棟有816人。李園有3棟宿舍樓,每棟有6層,休息時(shí)段內(nèi)李園每棟宿舍樓有720人。這一資料也直接證明了本文的樣本數(shù)據(jù)能夠很好地反映實(shí)際情況。
表1 自行車借還記錄統(tǒng)計(jì)
2.網(wǎng)點(diǎn)間自行車流動(dòng)情況
由于出行距離、個(gè)人的需求及環(huán)境的影響,各網(wǎng)點(diǎn)間自行車流動(dòng)次數(shù)也不盡相同。從表2中可知,從紫園到實(shí)驗(yàn)樓的流動(dòng)頻率最高,其次是紫園借出并歸還的流動(dòng)情況;同時(shí)也可以發(fā)現(xiàn)宿舍區(qū)之間流動(dòng)頻率比較低,而宿舍區(qū)到實(shí)驗(yàn)樓和飯?zhí)玫念l率遠(yuǎn)遠(yuǎn)高于宿舍間的頻率。因此本文認(rèn)為學(xué)生借還車的目的主要是上課和就餐。
表2 網(wǎng)點(diǎn)間自行車流動(dòng)統(tǒng)計(jì)
3.就餐分析
筆者認(rèn)為并非所有到飯?zhí)玫娜硕际侨ゾ筒停虼吮疚闹袑?duì)數(shù)據(jù)進(jìn)行篩選。首先對(duì)樣本中的數(shù)據(jù)按借出地點(diǎn)和歸還地點(diǎn)進(jìn)行排序,找出借出地點(diǎn)和歸還地點(diǎn)一樣的數(shù)據(jù),以判斷出行人的行為為就餐。根據(jù)實(shí)地調(diào)查結(jié)果,本文認(rèn)為飯點(diǎn)時(shí)間分別是11∶20—12∶50和17∶00—19∶00。若借出時(shí)間和歸還時(shí)間的時(shí)間期間不在飯點(diǎn),則判斷這些人不是外出就餐,有可能是去拿快遞或到小賣部;否則判定他們的行為是就餐。經(jīng)過篩選后,得到如表3的結(jié)果。從表3可知,在飯點(diǎn)時(shí)間,二飯的人數(shù)比一飯的人數(shù)稍多,可以推斷二飯的規(guī)模比較大或飯菜更豐富、更符合學(xué)生的口味。通過實(shí)地調(diào)查,筆者發(fā)現(xiàn)第二飯?zhí)糜?層,其中一層為教師餐廳,而第一飯?zhí)弥挥卸?;相比第一飯?zhí)?,第二飯?zhí)糜休^多的風(fēng)味小炒,學(xué)生的可選性較大。此外,筆者還發(fā)現(xiàn)第二飯?zhí)秒x一教、二教和眾多宿舍區(qū)近,而第一飯?zhí)弥挥幸粋€(gè)門出入且地理位置較為偏僻。
表3 一飯和二飯自行車借出數(shù)據(jù)統(tǒng)計(jì)
4.上課分析
廣東財(cái)經(jīng)大學(xué)三水校區(qū)白天的上課時(shí)間為8∶30—10∶00、10∶15—11∶45、14∶00—15∶30和15∶45—17∶15。筆者選擇去實(shí)驗(yàn)樓的人為研究對(duì)象,對(duì)借出時(shí)間和歸還時(shí)間進(jìn)行排序,得出借出時(shí)間和歸還時(shí)間的間隔時(shí)長(zhǎng),再篩選和統(tǒng)計(jì)相關(guān)信息(見表4),最后分析每條數(shù)據(jù)的信息及借車人的行為。通過分析可以得出:①由于實(shí)驗(yàn)樓離宿舍較遠(yuǎn),上課時(shí)遲到的人數(shù)還是占較大的比重;②從人數(shù)分配上可以看出實(shí)驗(yàn)樓的主要功能是服務(wù)于教學(xué),而專門去實(shí)驗(yàn)樓辦事的人較少(總共有15人);③在實(shí)驗(yàn)樓安排課程的時(shí)間上,實(shí)驗(yàn)樓上午上課的人數(shù)(包括遲到的共有43人)比下午(包括遲到的共有78人)的人數(shù)多。
表4 3月18日自行車流動(dòng)時(shí)間分析
5.人際關(guān)系分析
在時(shí)間地理學(xué)中,個(gè)人和集體為了進(jìn)行某項(xiàng)活動(dòng)而必須同其他人同時(shí)存在于同一場(chǎng)所的制約被稱為結(jié)合限制,如社交、聚會(huì)等活動(dòng)。在本文樣本中存在著相同或相近的借出時(shí)間和歸還時(shí)間、借出地點(diǎn)和歸還地點(diǎn),借鑒結(jié)合限制的概念,筆者可以認(rèn)為這些數(shù)據(jù)反映了出行人之間的關(guān)系。筆者對(duì)18日樣本中的借出時(shí)間和歸還時(shí)間、借出地點(diǎn)和歸還地點(diǎn)進(jìn)行排序,隨機(jī)抽取78組借出地點(diǎn)和歸還地點(diǎn)相同、借出時(shí)間和歸還時(shí)間相近的數(shù)據(jù)。然后把這78組隨機(jī)分為兩組,每組各有39個(gè)樣本。第1組為訓(xùn)練樣本(見表5),此訓(xùn)練樣本中包含借出和歸還時(shí)間差、借出地點(diǎn)和歸還地點(diǎn)及關(guān)系。第2組為測(cè)試樣本,包含了借出和歸還時(shí)間差、借出地點(diǎn)和歸還地點(diǎn)。本文應(yīng)用Clementine數(shù)據(jù)挖掘軟件中的決策樹C5算法,對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行挖掘得出規(guī)則,然后應(yīng)用到測(cè)試樣本中,檢驗(yàn)規(guī)則的準(zhǔn)確性。
把規(guī)則應(yīng)用到測(cè)試樣本中,可得到分類結(jié)果。把該分類結(jié)果和真實(shí)情況對(duì)比,結(jié)果見表6。
由表6可知,決策樹挖掘的總精度達(dá)到36/39,約為92.3%,說明了本文中的訓(xùn)練樣本具有較高的可信度,同時(shí)也說明了采用數(shù)據(jù)挖掘方法能夠很好地從位置數(shù)據(jù)中挖掘出人際關(guān)系。通過分析數(shù)據(jù)還可以發(fā)現(xiàn),在借出地點(diǎn)和歸還地點(diǎn)相同的前提下,借出時(shí)間差和歸還時(shí)間差相近(在5 min以內(nèi))或相同的兩個(gè)出行人是存在著同學(xué)關(guān)系的。而借出時(shí)間差和歸還時(shí)間差相差較大(5 min以上)的,兩個(gè)出行人之間沒有明顯的關(guān)系。
表5 訓(xùn)練樣本示例
表6 人際關(guān)系挖掘精度
結(jié)合行為地理學(xué)和時(shí)間地理學(xué)概念及其理論,對(duì)地理時(shí)空數(shù)據(jù)進(jìn)行探討和分析,可得出區(qū)域的規(guī)模、個(gè)人的行為和研究對(duì)象之間的關(guān)系。通過將這些理論和方法應(yīng)用到廣東財(cái)經(jīng)大學(xué)三水校區(qū)的自行車借還記錄中,筆者得到如下結(jié)論:①?gòu)慕柽€地點(diǎn)的頻率可以推斷出該地點(diǎn)人員的分布相對(duì)多少;②從自行車借還記錄進(jìn)行分析,可以方便地得出任意兩個(gè)地點(diǎn)之間的聯(lián)系,本文得出宿舍區(qū)之間流動(dòng)頻率低,而宿舍區(qū)到實(shí)驗(yàn)樓和飯?zhí)玫念l率高,主要原因是學(xué)生借還車的主要目的是上課和就餐;③通過在飯點(diǎn)時(shí)間的人員分析,得出去第二學(xué)生飯?zhí)玫娜吮鹊谝伙執(zhí)玫娜硕啵饕且驗(yàn)榈诙執(zhí)靡?guī)模較大且離一教、二教和眾多宿舍區(qū)近;④通過在上課期間的分析,得出廣東財(cái)經(jīng)大學(xué)三水校區(qū)實(shí)驗(yàn)樓下午的課程比上午多;⑤運(yùn)用決策樹算法可以挖掘出人際關(guān)系的規(guī)則,把規(guī)則應(yīng)用到測(cè)試樣本中能夠得出較高的精度。
[1] 柴彥威.行為地理學(xué)研究的方法論問題[J].地域研究與開發(fā),2005,24(2):1-5.
[2] 周素紅,鄧麗芳.基于T-GIS的廣州市居民日常活動(dòng)時(shí)空關(guān)系[J].地理學(xué)報(bào),2010,65(12):1454-1463.
[3] 趙瑩,柴彥威,陳潔,等.時(shí)空行為數(shù)據(jù)的GIS分析方法[J].地理與地理信息科學(xué),2009,25(5):1-5.
[4] HAGERSTRAND T.What about People in Regional Science?[J].Paper of the Regional Science Association,1970,24(1):7-21.
[5] PRED A.Urbanization,Domestic Planning Problems and Swedish Geographical Research[J].Progress in Greography,1973,53(2):207-221.
[6] 柴彥威.時(shí)間地理學(xué)的起源、主要概念及其應(yīng)用[J].地理科學(xué),1998,18(1):65-72.
[7] 王家耀,魏海平,成毅,等.時(shí)空GIS的研究與進(jìn)展[J].海洋測(cè)繪,2004,24(5):1-4.
[8] CHAPIN F S.Human Activity Patterns in the City:Things People Do in Time and in Space[M].[S.l.]:John Wiley&Sons,1974:1-30.
[9] SCHONFELDER S,AXHAUSEN K W.Activity Spaces:Measures of Social Exclusion[J].Transport Policy,2003,10(4):273-286.
[10] AHAS R,MARK U.Location Based Services:New Challenges for Planning and Public Administration[J].Futures,2005,37(6):547-561.
[11] STOPHER P,F(xiàn)ITZGERALD C,XU M.Assessing the Accuracy of the Sydney Household Travel Survey with GPS[J].Transportation,2007,34(6):723-741.
[12] 申悅,柴彥威.基于GPS數(shù)據(jù)的北京市郊區(qū)巨型社區(qū)居民日?;顒?dòng)空間[J].地理學(xué)報(bào),2013,68(4):503-516.
Analysis and Mining of Location Information Based on Bike Records of Lending and Returning
ZHANG Yihan,ZHONG Xinmei,LI Jiancheng
P208
B
0494-0911(2014)07-0113-04
2013-10-11
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃“973”資助項(xiàng)目(2011CB707103);國(guó)家自然科學(xué)基金(41301408);廣東省自然科學(xué)基金(S2013040016071)
張亦漢(1985—),男,廣東五華人,博士,講師,研究方向?yàn)榈乩硇畔⒛P汀?/p>
張亦漢,鐘欣梅,李建程.利用自行車借還記錄分析與挖掘空間位置信息[J].測(cè)繪通報(bào),2014(7):113-116.
10.13474/j.cnki.11-2246.2014.0240