蘇躍江,陳先龍,吳德馨
(1.廣州市交通運(yùn)輸研究所,廣東 廣州 510627;2.廣州市交通規(guī)劃研究院,廣東 廣州 510030;3.同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實驗室,上海 201804)
城市交通綜合調(diào)查通常包括居民出行調(diào)查、公共交通調(diào)查、道路交通運(yùn)行調(diào)查、交通基礎(chǔ)設(shè)施盤點(diǎn)等內(nèi)容,是掌握城市交通運(yùn)行規(guī)律的基礎(chǔ)性工作。發(fā)達(dá)國家大型城市一般每隔5年開展一次綜合調(diào)查,中國北京、上海等城市從2000年開始均已形成5年一次大規(guī)模調(diào)查的工作機(jī)制,并在2014年均已完成第五次交通綜合調(diào)查工作。廣州市最近一次開展全市交通大調(diào)查是在2005年,距今已過去12年。期間,影響廣州市交通運(yùn)行的外部環(huán)境及內(nèi)部因素均發(fā)生較大變化,與2005年相比,城市建成區(qū)面積增長68.4%,常住人口和就業(yè)人口增長均超過40%,中小客車保有量約為2005年的3.5倍,公共汽(電)車運(yùn)營里程增長71%,地鐵運(yùn)營里程從35 km拓展至309 km。城市空間結(jié)構(gòu)和交通格局發(fā)生重大變化,進(jìn)而導(dǎo)致居民出行規(guī)律、交通供需特征等變化顯著,原有調(diào)查數(shù)據(jù)及結(jié)論已不能體現(xiàn)當(dāng)前交通特性,難以有效指導(dǎo)交通工作。因此,亟須盡早啟動新一輪交通綜合調(diào)查工作,為交通規(guī)劃、交通運(yùn)營管理以及交通政策和戰(zhàn)略等決策提供可靠依據(jù)。
大數(shù)據(jù)在交通領(lǐng)域的應(yīng)用為交通信息采集、監(jiān)測城市與交通系統(tǒng)的互動演變過程提供了重要的技術(shù)支持。文獻(xiàn)[1]基于手機(jī)信令數(shù)據(jù)映射至交通分析單元,經(jīng)預(yù)處理、匹配分析、數(shù)據(jù)去噪等一系列海量數(shù)據(jù)運(yùn)算處理,并在交通調(diào)查和交通規(guī)劃中進(jìn)行應(yīng)用;文獻(xiàn)[2]通過手機(jī)信令數(shù)據(jù)對上海市職住空間特征進(jìn)行分析;文獻(xiàn)[3]利用手機(jī)數(shù)據(jù)與家訪調(diào)查數(shù)據(jù)對比,并通過手機(jī)數(shù)據(jù)來判斷居住地和工作地;文獻(xiàn)[4]基于北京市公共交通IC卡數(shù)據(jù)對城市職住關(guān)系和通勤交通進(jìn)行研究;文獻(xiàn)[5]通過道路卡口車牌識別數(shù)據(jù)推斷快速路網(wǎng)匝道之間的OD;文獻(xiàn)[6]對大數(shù)據(jù)的信息采集、質(zhì)量控制、特征提取、關(guān)聯(lián)分析、模型建立、信息融合等方面進(jìn)行歸納;文獻(xiàn)[7]梳理城鄉(xiāng)規(guī)劃學(xué)科領(lǐng)域運(yùn)用大數(shù)據(jù)開展規(guī)劃研究的適應(yīng)性和局限性并建構(gòu)相關(guān)理論和方法;文獻(xiàn)[8]從“動、靜、顯、隱”4個維度揭示大數(shù)據(jù)的內(nèi)涵特征與應(yīng)用方法,并構(gòu)建大數(shù)據(jù)在城市規(guī)劃的應(yīng)用模式;文獻(xiàn)[9]利用大數(shù)據(jù)的分析方法有效支撐了《上海市城市總體規(guī)劃》的編制,并對大數(shù)據(jù)時代總體規(guī)劃編制技術(shù)與方法進(jìn)行探索。本文基于大數(shù)據(jù)資源優(yōu)勢,充分發(fā)揮傳統(tǒng)抽樣調(diào)查與大數(shù)據(jù)的互補(bǔ)融合,并以廣州市為案例進(jìn)行實證研究。
居民空間活動包含社會經(jīng)濟(jì)、地理空間、交通方式、活動場所和行為模式等5 個維度的屬性特征。傳統(tǒng)抽樣調(diào)查(包含普查、訪談、問卷等)往往是調(diào)查某一天或某一個時段居民個體的屬性和出行信息,基于調(diào)查信息統(tǒng)計樣本的社會經(jīng)濟(jì)信息(職業(yè)、收入等)、地理空間(居住地、就業(yè)地等)、出行信息(出行量、出行OD、交通方式等)、行為模式信息(出行意愿、出行時間價值、購車意愿等)等來分析個體空間活動的屬性特征,但很難確定連續(xù)和動態(tài)的空間活動特征。利用大數(shù)據(jù)連續(xù)的特征追蹤和海量數(shù)據(jù)使觀測個體的空間活動特征成為可能,利用手機(jī)信令數(shù)據(jù)和互聯(lián)網(wǎng)位置數(shù)據(jù)監(jiān)測居民的職住特征、利用GPS數(shù)據(jù)挖掘出租汽車乘客的空間活動特征、通過AFC數(shù)據(jù)挖掘軌道交通乘客的時空分布特征、利用互聯(lián)網(wǎng)地圖的路徑規(guī)劃數(shù)據(jù)挖掘不同區(qū)域通過道路網(wǎng)絡(luò)及公共交通網(wǎng)絡(luò)形成的交通可達(dá)性等均成為可能。結(jié)合傳統(tǒng)抽樣調(diào)查可以全面了解個體空間活動屬性,從而為城市規(guī)劃、城市治理等提供更精細(xì)化的數(shù)據(jù)支持。
傳統(tǒng)抽樣調(diào)查基于問卷的定制設(shè)計,采取當(dāng)面問詢的方式采集信息,其優(yōu)點(diǎn)是交通針對性強(qiáng)、采集信息準(zhǔn)確。然而,由于調(diào)查成本和人力的限制(即使采用智能設(shè)備采集也只是手段),使得其樣本量小、可重復(fù)性較弱,致使調(diào)查樣本可靠性存在問題,例如居民出行調(diào)查中由于存在沉默需求導(dǎo)致出行率偏低和出行時間分布不可靠、由于母體(人口總量)的不確定性導(dǎo)致抽樣無法做到均勻分布或隨機(jī)分布等問題(見表1)。
大數(shù)據(jù)挖掘具有連續(xù)、動態(tài)、數(shù)據(jù)量大等特點(diǎn),其優(yōu)點(diǎn)是產(chǎn)生的數(shù)據(jù)樣本量大,可以利用動態(tài)數(shù)據(jù)進(jìn)行重復(fù)分析。但是,大數(shù)據(jù)為衍生產(chǎn)品并非交通定制數(shù)據(jù),無法通過大數(shù)據(jù)獲取相關(guān)群體的行為、心理等信息,并且大數(shù)據(jù)往往是局部對象的全樣本,難以實現(xiàn)全對象關(guān)聯(lián),導(dǎo)致對城市現(xiàn)象揭示的片面性。很多數(shù)據(jù)挖掘分析需要假設(shè)條件才能確定,例如大多數(shù)城市由于票制政策一般只有公共交通IC 卡上車刷卡信息,需要通過出行鏈假設(shè)推斷用戶下車和換乘車站;由于基站的密度和輻射范圍,基于手機(jī)信令數(shù)據(jù)判斷的位置為模糊地址,也無法判定出行方式、出行目的等;利用手機(jī)信令數(shù)據(jù)分析一次出行與傳統(tǒng)抽樣調(diào)查出行存在差別,大數(shù)據(jù)的算法更需要多種情景和敏感性測試,同時基本所有大數(shù)據(jù)都不是全樣本,需要借助母體進(jìn)行擴(kuò)樣。
表1 傳統(tǒng)抽樣調(diào)查與大數(shù)據(jù)挖掘特點(diǎn)對比Tab.1 Characteristics of traditional sampling survey and big data exploration
2.1.1 北京市
1986年,北京市開展第一次交通綜合調(diào)查工作,調(diào)查內(nèi)容為7.2 萬戶的居民出行,調(diào)查成果為北京市交通規(guī)劃和建設(shè)管理服務(wù)并發(fā)揮重要的作用,首次利用調(diào)查數(shù)據(jù)分析了北京市居民的出行規(guī)律和時空分布,并開展公共交通線網(wǎng)的優(yōu)化研究工作等。時隔14年之后于2000年開展第二次交通綜合調(diào)查工作(之后每5年開展一次調(diào)查,并且從2002年開始每年開展一次小樣本調(diào)查工作,見圖1),調(diào)查涉及6.4 萬戶居民出行、道路流量、公共汽(電)車等4 大項11 小項,調(diào)查成果用于診斷居民出行需求和城市交通擁堵問題,支持全市交通模型構(gòu)建,為《北京交通發(fā)展綱要(2004—2020)》提供重要的數(shù)據(jù)支撐。2005年開展第三次調(diào)查工作,調(diào)查涉及居民出行、道路流量、軌道交通等6大項14小項,調(diào)查成果用于對北京市交通運(yùn)行、管理和發(fā)展趨勢進(jìn)行全面、系統(tǒng)的總結(jié)和判斷,為“十一五”綜合交通規(guī)劃、奧運(yùn)交通保障措施、奧運(yùn)后的交通行動計劃、相關(guān)的交通政策評估等提供重要的數(shù)據(jù)支持。2010年開展第四次調(diào)查工作,調(diào)查涉及居民出行、公共交通等11 大項16 小項,調(diào)查成果用于對北京城市交通發(fā)展新趨勢和特征進(jìn)行全面系統(tǒng)的總結(jié)和判斷,為制定“十二五”綜合交通規(guī)劃、緩解交通擁堵政策、《北京交通發(fā)展綱要(2014—2030年)》等提供重要的數(shù)據(jù)支持。2014年開展第五次交通綜合調(diào)查工作,調(diào)查內(nèi)容包含手機(jī)信令數(shù)據(jù)采集分析、居民出行調(diào)查、公共交通調(diào)查、道路流量調(diào)查、專項輔助調(diào)查、數(shù)據(jù)收集等6 大項17 小項,調(diào)查成果對支持城市總體規(guī)劃修編、軌道交通規(guī)劃和評估、京津冀都市圈一體化等提供重要的支持[10]。
2.1.2 上海市
1986年,上海市開展了第一次交通綜合調(diào)查工作,主要開展居民出行調(diào)查,調(diào)查成果用于第一輪上海市城市綜合交通規(guī)劃的編制,創(chuàng)建了上海市交通規(guī)劃模型,在內(nèi)環(huán)高架、楊浦大橋、延安路高架、地鐵二號線等項目的論證工作中起到較大的作用。1995年和2004年分別開展第二次和第三次交通綜合調(diào)查工作(之后每5年開展一次調(diào)查)。第二次調(diào)查成果對開展新一輪上海市城市總體規(guī)劃、綜合交通規(guī)劃、軌道交通網(wǎng)絡(luò)規(guī)劃以及城市交通發(fā)展白皮書等研究發(fā)揮了重要的作用。第三次調(diào)查成果對開展上海市綜合交通發(fā)展戰(zhàn)略、“十一五”綜合交通規(guī)劃,支持長三角都市圈的交通規(guī)劃以及世博會交通規(guī)劃等起到積極作用。2009年開展了第四次交通綜合調(diào)查工作,調(diào)查成果為“十二五”綜合交通規(guī)劃、綜合交通模型二期開發(fā)、世博會交通保障方案、新一輪交通發(fā)展白皮書編制等提供重要數(shù)據(jù)支撐。2014年開展第五次交通綜合調(diào)查工作,調(diào)查內(nèi)容包含交通設(shè)施普查及資料收集、人員出行調(diào)查、車輛使用調(diào)查、系統(tǒng)運(yùn)行情況調(diào)查、信息數(shù)據(jù)挖掘等5大項24小項,調(diào)查成果對支持城市總體規(guī)劃、“十三五”綜合交通規(guī)劃等規(guī)劃和決策支持提供重要的支撐。
圖1 北京市和上海市歷年交通綜合調(diào)查概況Fig.1 Overview of transportation comprehensive surveys in Beijing and Shanghai over the years
2.1.3 廣州市
1984年,廣州市開展第一次交通調(diào)查,主要調(diào)查居民出行和車流量,利用調(diào)查數(shù)據(jù)構(gòu)建城市交通模型,并在1998年和2003年開展了萬戶居民出行調(diào)查對交通模型進(jìn)行修正。2005年,開展了第二次交通調(diào)查,調(diào)查成果從不同側(cè)面反映居民出行需求,為研究交通演化規(guī)律,科學(xué)制定交通發(fā)展戰(zhàn)略、政策、技術(shù)法規(guī)提供重要的支撐。在調(diào)查數(shù)據(jù)及結(jié)論的支撐下,“十一五”期間形成了豐富的交通規(guī)劃研究成果,包括《廣州市綜合交通發(fā)展戰(zhàn)略(2010—2020年)》《廣州市綜合交通體系規(guī)劃(2011—2020年)》《廣州市軌道交通線網(wǎng)規(guī)劃(2040年)》《2010年廣州亞運(yùn)交通發(fā)展戰(zhàn)略規(guī)劃》等,對廣州市交通發(fā)展做出巨大的貢獻(xiàn),為促進(jìn)廣州市社會經(jīng)濟(jì)的快速發(fā)展起到至關(guān)重要的作用。2017年9月,廣州市開展第三次交通綜合調(diào)查工作,包含人員出行調(diào)查、交通系統(tǒng)運(yùn)行狀況調(diào)查、信息數(shù)據(jù)挖掘三大板塊。
1)調(diào)查范圍逐步擴(kuò)大。
隨著城鎮(zhèn)化進(jìn)程不斷發(fā)展,居民的時空分布特征隨著城市空間拓展而發(fā)生變化,這就要求調(diào)查范圍逐步擴(kuò)大,以全面了解居民的交通特征和出行需求。北京市調(diào)查范圍從中心區(qū)到中心區(qū)+重點(diǎn)地區(qū),再到全市直至京津冀區(qū)域,2014年第五次交通綜合調(diào)查的范圍擴(kuò)大至京津冀城市群,覆蓋北京市市域范圍,重點(diǎn)范圍為六環(huán)路以內(nèi),針對重點(diǎn)新城和邊緣集團(tuán)、重點(diǎn)鎮(zhèn)。上海市調(diào)查范圍從中心區(qū)到中心區(qū)+重點(diǎn)地區(qū),再到全市,2014年第五次交通綜合調(diào)查的范圍擴(kuò)大至全市。廣州市調(diào)查范圍從原八區(qū)建成區(qū)345 km2到市區(qū)(除增城和從化的10 個區(qū))3 719 km2,再到全市范圍7 434 km2,2017年第三次交通綜合調(diào)查范圍為全市范圍(見圖2)。
2)調(diào)查內(nèi)容逐漸增多。
北京、上海、廣州3 個城市分別經(jīng)歷了從最初的居民出行調(diào)查、查核線車流量調(diào)查逐漸發(fā)展到各種人員調(diào)查、各種交通方式調(diào)查、系統(tǒng)運(yùn)行調(diào)查以及社會經(jīng)濟(jì)、就業(yè)崗位、土地利用的普查等。3 個城市的調(diào)查項目數(shù)量分別實現(xiàn)從2項到17項、從6項到24項、從2項到15項的變化[11-12]。
3)調(diào)查抽樣率呈現(xiàn)逐步下降趨勢。
調(diào)查抽樣率北京市從第一次4.5%縮小至第五次0.8%,上海市從第一次2.0%縮小至第五次0.9%,廣州市從第一次3%縮小至第三次1.8%(見表2)。
4)新技術(shù)、新方法特別是交通大數(shù)據(jù)的使用。
圖2 廣州市三次交通綜合調(diào)查范圍變化Fig.2 Scope of the three transportation comprehensive surveys in Guangzhou
北京市在第五次交通綜合調(diào)查中利用GPS數(shù)據(jù)對居民出行及車輛出行調(diào)查進(jìn)行校核,利用視頻檢測數(shù)據(jù)校核道路流量調(diào)查,利用IC 卡數(shù)據(jù)挖掘和校核公共交通出行客流調(diào)查等。上海市在第五次交通綜合調(diào)查中利用綜合交通信息平臺數(shù)據(jù)分析干路擁堵時空分布,利用遙感技術(shù)分析交通用地,利用手機(jī)信息校核居民出行特征,利用車輛牌照識別數(shù)據(jù)挖掘車輛OD,利用IC卡數(shù)據(jù)分析公共交通客流特征,利用GPS數(shù)據(jù)挖掘車輛出行特征等。廣州市在第三次交通綜合調(diào)查中,利用智能化終端設(shè)備取代紙質(zhì)問卷,采用視頻拍攝方式取代人工調(diào)查,利用車牌識別數(shù)據(jù)挖掘交通特征,利用IC 卡數(shù)據(jù)挖掘公共交通出行特征和換乘特征,利用GPS數(shù)據(jù)挖掘出租汽車及貨運(yùn)車輛營運(yùn)特征,利用互聯(lián)網(wǎng)位置數(shù)據(jù)挖掘重要樞紐客流特征、典型建筑交通吸引特征、城市交通可達(dá)性,利用手機(jī)通信大數(shù)據(jù)挖掘職住分布、城際出行及軌道交通換乘特征等。
表2 北京、上海、廣州居民出行調(diào)查抽樣率演變Tab.2 Evolution of sample rates of resident travel surveys in Beijing,Shanghai and Guangzhou
圖3 廣州市第三次交通綜合調(diào)查框架Fig.3 Framework of the third transportation comprehensive survey in Guangzhou
廣州市2017年交通綜合調(diào)查包含人員出行調(diào)查、交通系統(tǒng)運(yùn)行狀況調(diào)查、信息數(shù)據(jù)挖掘3 大板塊15 小項:1)人員出行調(diào)查,包含居民出行、流動人口出行、樞紐問詢3項調(diào)查;2)交通系統(tǒng)運(yùn)行調(diào)查,目的是為調(diào)查提供抽樣母體并對人員出行調(diào)查提供校核,包含人口就業(yè)、土地利用以及道路流量、軌道交通出行、公共汽(電)車出行等6 項調(diào)查;3)信息數(shù)據(jù)挖掘,包含對公路交通信息、道路卡口車牌識別數(shù)據(jù)、公共交通IC卡數(shù)據(jù)、營運(yùn)車輛GPS數(shù)據(jù)、互聯(lián)網(wǎng)位置數(shù)據(jù)及手機(jī)通信數(shù)據(jù)等6 方面的數(shù)據(jù)挖掘。本次調(diào)查采用大數(shù)據(jù)挖掘和傳統(tǒng)交通調(diào)查并行模式(見圖3),目的是充分利用現(xiàn)有信息化資源,提高調(diào)查數(shù)據(jù)的廣度、精度及效率[13]。
1)強(qiáng)有力的調(diào)查組織框架。
本次調(diào)查范圍廣、規(guī)模大、專業(yè)性強(qiáng)、需提供協(xié)助的部門多,因此調(diào)查工作采用市交通工作領(lǐng)導(dǎo)小組統(tǒng)籌、多個職能部門協(xié)助、專業(yè)機(jī)構(gòu)提供技術(shù)支撐的組織形式,在市交通工作領(lǐng)導(dǎo)小組框架內(nèi),組建了市-區(qū)-街(鎮(zhèn))三級調(diào)查辦公室。其中,市調(diào)查辦公室設(shè)在市交通委員會,成員單位包括市交通委員會、公安局、民政局、統(tǒng)計局、教育局、旅游局、國土規(guī)劃委員會以及各區(qū)政府,主要負(fù)責(zé)總體統(tǒng)籌工作,并委托第三方機(jī)構(gòu)開展調(diào)查方案設(shè)計、調(diào)查培訓(xùn)等工作;區(qū)調(diào)查辦公室設(shè)在各區(qū)政府,主要負(fù)責(zé)配合指導(dǎo)本區(qū)各街(鎮(zhèn))調(diào)查辦公室工作;街(鎮(zhèn))調(diào)查辦公室設(shè)在各區(qū)街(鎮(zhèn)),主要負(fù)責(zé)組建調(diào)查隊伍,并配合第三方機(jī)構(gòu)開展具體的調(diào)查工作等。
2)充分利用相關(guān)部門既有統(tǒng)計資料。
通過相關(guān)部門固有的調(diào)查機(jī)制、日益完善的統(tǒng)計報表制度、手段多樣的信息采集技術(shù)形成系統(tǒng)的統(tǒng)計資料,有助于降低調(diào)查的人力、物力和財力成本。本輪調(diào)查充分協(xié)調(diào)采用相關(guān)部門既有統(tǒng)計資料,包括:市統(tǒng)計局人口普查、經(jīng)濟(jì)普查以及1%人口抽樣調(diào)查數(shù)據(jù),市教育局就學(xué)統(tǒng)計數(shù)據(jù),市旅游局旅游人口統(tǒng)計數(shù)據(jù),市公安局機(jī)動車登記數(shù)據(jù),廣州地鐵集團(tuán)地鐵運(yùn)營統(tǒng)計數(shù)據(jù)以及市交通委員會公共交通運(yùn)營統(tǒng)計數(shù)據(jù)等。
3)調(diào)查方案考慮不同數(shù)據(jù)關(guān)聯(lián)。
在調(diào)查方案設(shè)計階段考慮了不同數(shù)據(jù)之間的關(guān)聯(lián),并通過調(diào)查內(nèi)容設(shè)計強(qiáng)化數(shù)據(jù)之間的聯(lián)系,實現(xiàn)各個板塊之間相互補(bǔ)充、校核,方便后續(xù)綜合校核擴(kuò)樣工作(見圖4)。
4)采用新技術(shù)替代傳統(tǒng)人工調(diào)查,降低人工調(diào)查難度、提高調(diào)查效率。
人員出行信息采集采用智能化終端PDA設(shè)備取代紙質(zhì)問卷,采用最新的地理信息數(shù)據(jù)庫作為數(shù)據(jù)采集基礎(chǔ),系統(tǒng)在出行信息采集過程中實現(xiàn)了地址經(jīng)緯度準(zhǔn)確定位、自動邏輯糾錯、數(shù)據(jù)及時上傳、數(shù)據(jù)采集進(jìn)度查看以及指標(biāo)校核等功能,極大提高了調(diào)查效率、數(shù)據(jù)可靠性及后期數(shù)據(jù)的應(yīng)用廣度。車流量和載客率調(diào)查采用外業(yè)視頻拍攝+內(nèi)業(yè)軟件計數(shù)及人工抽檢的方式取代大規(guī)模人工外業(yè)調(diào)查,降低了人工調(diào)查實施難度,提高了安全性。軌道交通乘客出行調(diào)查在人工問詢的基礎(chǔ)上,高峰期采用微信二維碼開展調(diào)查。公共汽(電)車典型線路客流調(diào)查采用車載視頻監(jiān)控數(shù)據(jù)對人工調(diào)查結(jié)果進(jìn)行校核。
5)實施單位多專業(yè)聯(lián)合以及多數(shù)據(jù)綜合校核確保質(zhì)量。
①在完善的上層組織架構(gòu)下,實現(xiàn)調(diào)查工作多專業(yè)聯(lián)合。規(guī)劃研究單位和統(tǒng)計研究單位作為上一輪交通綜合調(diào)查組織實施單位,具有組織居民出行調(diào)查的經(jīng)驗,且后者憑借每年的專項統(tǒng)計調(diào)查與基層已形成良好的溝通機(jī)制;交通研究單位承擔(dān)交通綜合調(diào)查的前期研究工作,在公共交通、道路交通等特征調(diào)查方面具備豐富經(jīng)驗;第三方調(diào)查公司在居民出行的調(diào)查實施方面積累了大量的實踐經(jīng)驗。四家單位各盡其能,發(fā)揮各自特長和優(yōu)勢,最大限度地保證了調(diào)查工作圓滿完成。②交通大數(shù)據(jù)挖掘采用交通與信息技術(shù)跨界合作,包括交通研究單位、規(guī)劃研究單位、騰訊、聯(lián)通、交通數(shù)據(jù)中心等多專業(yè)聯(lián)合,充分利用統(tǒng)計數(shù)據(jù)、大數(shù)據(jù)與人工抽樣調(diào)查數(shù)據(jù)相互補(bǔ)充和校核,實現(xiàn)大數(shù)據(jù)充分挖掘,并與運(yùn)營商和互聯(lián)網(wǎng)企業(yè)實現(xiàn)較好的契合。例如針對手機(jī)數(shù)據(jù)運(yùn)營商和互聯(lián)網(wǎng)企業(yè)提供的樣本數(shù)據(jù),咨詢單位和運(yùn)營商聯(lián)合完成算法設(shè)計、測試工作,然后利用運(yùn)營商和互聯(lián)網(wǎng)企業(yè)的服務(wù)器運(yùn)算資源進(jìn)行數(shù)據(jù)挖掘并輸出統(tǒng)計級的分析結(jié)果。既實現(xiàn)運(yùn)營商和互聯(lián)網(wǎng)大數(shù)據(jù)信息不向外提供,又完成了科研機(jī)構(gòu)要求的分析結(jié)果,并且利用大型企業(yè)的運(yùn)算資源提高了整體計算效率。
大數(shù)據(jù)的重點(diǎn)并不在大,而在于其數(shù)據(jù)質(zhì)量和數(shù)據(jù)價值含量。數(shù)據(jù)質(zhì)量是基石,依托較好的質(zhì)量挖掘有用的數(shù)據(jù)才能發(fā)揮大數(shù)據(jù)的分析和決策作用。本次分析分別基于手機(jī)信令、互聯(lián)網(wǎng)位置、道路卡口車牌識別、高速公路流水、GPS等數(shù)據(jù)資源,挖掘傳統(tǒng)抽樣調(diào)查無法獲取的特殊指標(biāo)(見表3)。
多源數(shù)據(jù)相互補(bǔ)充與校核主要分為5 個步驟(見圖5):1)通過傳統(tǒng)抽樣調(diào)查得到樣本OD,結(jié)合職業(yè)、車輛擁有、年齡結(jié)構(gòu)、人口規(guī)模等因素,組合擴(kuò)樣得到分方式出行OD 分布;2)利用手機(jī)信令數(shù)據(jù)和互聯(lián)網(wǎng)位置數(shù)據(jù)進(jìn)行擴(kuò)樣(主要利用聯(lián)通用戶比例、不同年齡段手機(jī)用戶使用率、人口普查年齡結(jié)構(gòu)以及一人多機(jī)等屬性數(shù)據(jù)),獲取全方式OD 矩陣;3)以組合擴(kuò)樣的交通結(jié)構(gòu)拆分總體OD 矩陣,得到各方式的基礎(chǔ)OD 矩陣;4)獲取各方式OD 矩陣后,利用IC 卡數(shù)據(jù)、AFC 數(shù)據(jù)、GPS 數(shù)據(jù)分別校正公共汽(電)車、地鐵、出租汽車OD 矩陣分布(還將其作為公共交通OD 分布的約束條件進(jìn)行修正),并利用交通量和載客率調(diào)查結(jié)果、卡口數(shù)據(jù)、高速公路收費(fèi)數(shù)據(jù)進(jìn)行OD 反推,校正小汽車出行OD;5)利用GPS 調(diào)查和手機(jī)信令出行頻次校正沉默需求和出行時間分布。
圖4 廣州市第三次交通綜合調(diào)查傳統(tǒng)調(diào)查與大數(shù)據(jù)挖掘之間的關(guān)系Fig.4 Relationship between the traditional sampling survey and big data exploration in the third transportation comprehensive survey in Guangzhou
針對手機(jī)信令數(shù)據(jù)模糊(由于部分區(qū)域基站分散)的特點(diǎn),采用基站序列嵌入活動基站序列標(biāo)簽、空間核聚類、折返識別以及正向傳播與反向反饋相結(jié)合的駐點(diǎn)參數(shù)優(yōu)化技術(shù),提高了手機(jī)信令數(shù)據(jù)應(yīng)用于出行活動分析的可行性,并利用手機(jī)用戶的實際出行數(shù)據(jù)對結(jié)果進(jìn)行檢驗。結(jié)果表明,通過相關(guān)技術(shù)和算法融合,使得出行頻次的分析精度在95%以上。
4.2.1 重構(gòu)出行頻次分布
傳統(tǒng)抽樣調(diào)查中居民出行率存在沉默需求,例如2002年和2011年香港居民出行調(diào)查的沉默需求分別為32%和36%[14]、2014年北京居民出行調(diào)查的沉默需求約35%[15]。本次調(diào)查借助兩種方法來校核沉默需求:1)利用連續(xù)6 個月的手機(jī)信令數(shù)據(jù)進(jìn)行職住和駐點(diǎn)的分析以及敏感性測試,在此基礎(chǔ)上判斷出行駐點(diǎn)次數(shù),重構(gòu)出行頻次分布;2)借助互聯(lián)網(wǎng)企業(yè)(騰訊)定制開發(fā)APP,定時(每2 min 采集一個軌跡點(diǎn))采集居民的出行軌跡信息(從被調(diào)查的居民中抽選超過3 000名作為信息采集對象),利用駐點(diǎn)判斷以及敏感性測試確定出行頻次分布。通過綜合分析可知,利用GPS 調(diào)查志愿者和利用手機(jī)信令數(shù)據(jù)分析的出行頻次分布基本一致,與傳統(tǒng)抽樣調(diào)查有較大差別(見圖6),對比分析得出廣州市2017年居民出行調(diào)查的沉默需求為28.5%。
4.2.2 分解和校正不同出行目的的出行時間分布
樣本居民出行調(diào)查數(shù)據(jù)存在漏報、錯報等問題,可以利用GPS調(diào)查和手機(jī)信令出行頻次分布對沉默出行進(jìn)行校正,從而修正出行總量,但是具體出行特征仍然無法完全校核。因此,傳統(tǒng)抽樣調(diào)查存在以下問題:1)由于非通勤出行與通勤出行的時間差異性,非通勤出行漏報導(dǎo)致擴(kuò)樣的出行時間分布不夠精確,擴(kuò)大了高峰出行規(guī)模,降低了平峰出行規(guī)模;2)非通勤出行涉及多種出行目的,例如公務(wù)業(yè)務(wù)、探親訪友、生活購物、文娛等,非通勤出行的漏報直接導(dǎo)致出行目的擴(kuò)樣存在不均衡。通過綜合分析可知,利用手機(jī)信令數(shù)據(jù)分析的出行時間分布(包含出發(fā)時間分布與到達(dá)時間分布)與傳統(tǒng)入戶調(diào)查樣本數(shù)據(jù)的出行時間分布有較大差異,特別是在早晚高峰期間(見圖7)。結(jié)合AFC,IC卡和GPS等統(tǒng)計數(shù)據(jù)的客流時間分布分析,利用手機(jī)信令數(shù)據(jù)校核出行時間分布更可靠、更合理。
圖5 大數(shù)據(jù)在廣州市交通綜合調(diào)查中的綜合校核作用Fig.5 The role of big data in comprehensive verification in Guangzhou's transportation comprehensive survey
圖6 基于不同數(shù)據(jù)源的出行頻次分布對比Fig.6 Distribution of travel frequency based on different data sources
圖7 樣本調(diào)查和基于手機(jī)信令的出行時間分布差異Fig.7 Differences in the data of travel time distribution between sampling survey and cellular signaling-based method
傳統(tǒng)抽樣調(diào)查與大數(shù)據(jù)技術(shù)的共同目標(biāo)都是最大可能地還原并揭示城市交通特征。傳統(tǒng)抽樣調(diào)查往往依據(jù)樣本數(shù)據(jù)分析建立模型和修正模型,表現(xiàn)為因果關(guān)系,更加注重未來;而大數(shù)據(jù)分析是通過更大樣本的連續(xù)數(shù)據(jù)進(jìn)行相關(guān)性分析和敏感性測試,再建立模型測試分析結(jié)果,大數(shù)據(jù)分析技術(shù)在證據(jù)鏈不足條件下可能形成模糊但全面、因而正確的判斷,表現(xiàn)為關(guān)聯(lián)關(guān)系,更加注重現(xiàn)狀。大數(shù)據(jù)分析技術(shù)的出現(xiàn)并非否定了傳統(tǒng)抽樣調(diào)查(如交通調(diào)查、意愿調(diào)查)的必要性以及傳統(tǒng)的理論和方法,規(guī)劃設(shè)計人員需要思考和研究如何利用各種數(shù)據(jù)的優(yōu)勢彌補(bǔ)不足,將大數(shù)據(jù)技術(shù)融入交通系統(tǒng)分析體系中提煉信息特征,實現(xiàn)各種大數(shù)據(jù)資源與傳統(tǒng)抽樣調(diào)查的樣本數(shù)據(jù)的有機(jī)融合。在此之前,必須更加注重大數(shù)據(jù)質(zhì)量、算法以及數(shù)據(jù)之間融合,更應(yīng)該重視大數(shù)據(jù)應(yīng)用方法和理論體系的構(gòu)建。數(shù)據(jù)質(zhì)量是基石,數(shù)據(jù)算法是核心,數(shù)據(jù)融合是創(chuàng)新,理論體系的構(gòu)建才是根本。本文在總結(jié)北京、上海、廣州歷年交通綜合調(diào)查演變的基礎(chǔ)上,梳理傳統(tǒng)抽樣調(diào)查與大數(shù)據(jù)挖掘分析的關(guān)系和差別?;趶V州市交通綜合調(diào)查的框架和特點(diǎn),重點(diǎn)分析大數(shù)據(jù)在廣州市第三次交通綜合調(diào)查中的作用。隨著新技術(shù)快速發(fā)展,未來服務(wù)供給模式將從原有的增加供給服務(wù)向按需服務(wù)或者需求響應(yīng)服務(wù),甚至出行即服務(wù)模式轉(zhuǎn)變,大數(shù)據(jù)將在城市治理和交通管理中發(fā)揮更重要的作用。