張欣環(huán), 吳一昊, 吳金洪, 許明明, 毛程遠
(1.浙江師范大學 道路與交通工程研究中心,浙江 金華 321004;2.金華市公安局 交通警察支隊,浙江 金華 321000;3.寧波市公共交通客運管理局,浙江 寧波 315040)
公交客流分析是公交出行需求辨識、線網(wǎng)評估與優(yōu)化,以及公交優(yōu)先發(fā)展政策制定和實施的基礎(chǔ).乘客出行、公交線網(wǎng)客流數(shù)據(jù)的傳統(tǒng)調(diào)查方法成本較高,受限于調(diào)查技術(shù)和調(diào)查誤差,精度難以保證,已有的單源數(shù)據(jù)(IC卡等)都不同程度地存在一定的局限性.現(xiàn)階段,公交IC卡、GPS系統(tǒng)的推廣使用,使得低成本的自動化采集海量多源數(shù)據(jù)成為可能,并為公交客流特征的提取奠定了良好的數(shù)據(jù)基礎(chǔ).
目前,對公交客流特征的研究過于單一和理論化,且大多應用于廣義公交領(lǐng)域:蔡文學等[1]提出基于公交線網(wǎng)、GPS數(shù)據(jù)等多源數(shù)據(jù)構(gòu)建公交旅行時間計算模型;呂玉坤[2]挖掘多源海量數(shù)據(jù),推導出公交乘客的出行鏈模型;田源[3]以公交車GPS、IC卡數(shù)據(jù)為主,構(gòu)建了以站點、路段和線路為準則層面的公交評價指標體系;余慶等[4]以深圳市為案例,基于公交IC卡、微博簽到數(shù)據(jù)等多源數(shù)據(jù),構(gòu)建了公交客流規(guī)模模型;王俊兵等[5-8]以IC卡、AFC等數(shù)據(jù)為主,關(guān)聯(lián)匹配各項數(shù)據(jù)后提取公共交通出行鏈,進而對公交客流進行分析.可以看出,目前還沒有一套完整的常規(guī)公交多源數(shù)據(jù)處理方法,難以獲取完整的客流信息;缺乏對常規(guī)公交數(shù)據(jù)整體深度挖掘和應用的研究,不適用于實際應用.
本文通過對多源異構(gòu)數(shù)據(jù)的匹配與處理,構(gòu)建客流特征分析的數(shù)據(jù)基礎(chǔ);在客流特征信息提取過程中,提出了在判別過程中的合理匹配閾值、識別刷卡站點及匹配出行起訖點的方法與流程,建立基于多源數(shù)據(jù)的常規(guī)公交客流識別模型,充分考慮提取方法實際應用的可行性,所得成果有利于提高常規(guī)公交服務的可靠性,可實現(xiàn)乘客個體出行過程的再現(xiàn)并完成常規(guī)公交客流特征提取分析,對于后期公交運營計劃的調(diào)整、城市出行結(jié)構(gòu)的優(yōu)化具有重要的理論意義和應用價值.
通常,常規(guī)公交IC卡數(shù)據(jù)共有多個字段,包含了車輛編號、刷卡時間、刷卡時的經(jīng)緯度等信息.根據(jù)不同的統(tǒng)計分析目的,從原始數(shù)據(jù)庫中抽取部分字段進行后續(xù)的融合、推斷.公交IC卡刷卡數(shù)據(jù)記錄了每位乘客單次乘車刷卡的詳細信息,本次研究提取金華市2018年3月1日全天的出行記錄,全天共有6.3萬余條記錄,數(shù)據(jù)結(jié)構(gòu)如表1所示.
表1 公交IC卡部分數(shù)據(jù)
車載GPS終端實時采集公交定位數(shù)據(jù),原始數(shù)據(jù)中每條記錄包含了車輛編號、經(jīng)緯度、行程編號等多個信息.根據(jù)分析要求,從數(shù)據(jù)倉庫中選擇不同字段數(shù)據(jù)進行預處理.結(jié)合GPS、IC卡、線路站點等數(shù)據(jù)可以推斷上下站點、公交OD等信息.從原始數(shù)據(jù)中提取的公交車GPS數(shù)據(jù),包含6個字段(車輛編號、車牌號、經(jīng)度、緯度、時刻及所屬線路等),可以實時跟蹤車輛所處位置.
為進一步進行后續(xù)分析,本文將公交GPS數(shù)據(jù)(共計304萬條記錄)作進一步處理,獲得車輛到離站信息表(約14.5萬條記錄,數(shù)據(jù)結(jié)構(gòu)如表2所示),這些記錄包括車輛編號、對應線路、上下行、站點編號、站點名稱、到離站時間等信息.
表2 公交車輛到離站數(shù)據(jù)
本次調(diào)查總共覆蓋了732臺公交車輛全天到離站數(shù)據(jù),涵蓋140條線路(市區(qū)70條,城鄉(xiāng)70條),線路抽樣率80%(市區(qū)100%,城鄉(xiāng)67%),未覆蓋線路客流占全天客流的比例僅為4.3%,基本實現(xiàn)全市公交線路全覆蓋.
2.1.1 數(shù)據(jù)處理流程
數(shù)據(jù)處理流程如下:
1)基于ArcGIS的公交網(wǎng)絡的拓撲表達;
2)結(jié)合GPS數(shù)據(jù)獲得每一個IC刷卡點對應的公交線路行車路徑(Pattern)、在公交網(wǎng)絡上的位置(偏移量);
3)針對每一個公交線路行車路徑估算出車輛的進、出站時間,從而得到每個路段(transit link)上的旅行時間和站點停留時間;
4)將所有的路段旅行時間、站點停留時間一一對應到(分配到)公交網(wǎng)絡上.
2.1.2 基本時間特征
根據(jù)公交車輛運行特點,將公交車在相鄰站點間運行的時間進行分解,刷卡間隔分布如圖1所示,且具有以下特征:
圖1 刷卡間隔分布
1)站內(nèi)最短刷卡間隔時間的平均值:根據(jù)每個站點站內(nèi)最短刷卡間隔時間tmin(i,i),求得它們的平均值tmean(i,i).數(shù)據(jù)分析中,“IC卡刷卡數(shù)據(jù)是否發(fā)生在同一站點”為關(guān)鍵點,通常用刷卡間隔作為判斷依據(jù).本調(diào)查中,抽取部分線路共4 265例刷卡間隔有效數(shù)據(jù),得tmean(i,i)為22.5 s.
2)相鄰站點間最短刷卡間隔時間的平均值:根據(jù)相鄰站點間最短刷卡間隔時間tmin(i,i+1),求得它們的平均值tmean(i,i+1).如圖1虛線所示,數(shù)據(jù)基本呈正態(tài)分布,得tmean(i,i+1)為163.7 s.
3)判斷依據(jù):可在兩曲線重疊部分選取一個特定值,作為判斷“IC卡刷卡數(shù)據(jù)是否發(fā)生在同一站點”的依據(jù),因此刷卡間隔取72.0 s作為判斷閾值較為合適.
2.2.1 上車站點判斷
上車站點的判斷是完成進一步的乘客出行特征分析的前提和數(shù)據(jù)準備,是公交IC數(shù)據(jù)處理的關(guān)鍵環(huán)節(jié).本文在對IC卡數(shù)據(jù)特點進行分析的基礎(chǔ)上,應用Oracle軟件編程解決了上車站點判斷問題.
1)數(shù)據(jù)準備.本文以其中一日刷卡數(shù)據(jù)作為基本分析數(shù)據(jù)段.在數(shù)據(jù)分析之前,需要從數(shù)據(jù)倉庫內(nèi)的各類數(shù)據(jù)表中進一步對數(shù)據(jù)進行提取和篩選,只需提取需要用到的字段數(shù)據(jù).
2)判斷流程.
①判斷思路.為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點及下車站點.其中上車站點的推算較為簡單,先對IC卡數(shù)據(jù)進行時間聚類,將所有刷卡數(shù)據(jù)歸類到各個站點;通過IC卡、GPS數(shù)據(jù)表中的“刷卡時間”進行匹配,查找時間上最近的刷卡點;再結(jié)合公交線網(wǎng)GIS站點坐標,進行空間匹配.最終確定刷卡乘客的上車站點,如圖2所示.
圖2 數(shù)據(jù)處理流程
②判斷步驟.
步驟1:聚類分析.提取數(shù)據(jù)、排序后進行聚類處理,以刷卡間隔作為聚類依據(jù),間隔較短的刷卡數(shù)據(jù)作為一組.
步驟2:最短刷卡間隔.設(shè)t(m,n)為任意兩組數(shù)據(jù)刷卡間隔,min[t(m,n)]為最短間隔,當min[t(m,n)]大于“相鄰站點間最短刷卡間隔min[t(i,i+1)]”時聚類停止[9].根據(jù)金華市常規(guī)公交基礎(chǔ)設(shè)施、刷卡數(shù)據(jù)等信息,本文取min[t(i,i+1)]為72.0 s.
步驟3:停靠時刻推算.公交車??繒r刻取公交車到達站點時刻與離開站點時刻的中間時刻,可用下式表示:
(1)
式(1)中:tS(n,i)表示公交車n在i站點的??繒r刻;tA(n,i)表示公交車n到達i站點的時刻;tD(n,i)表示公交車n離開i站點的時刻;tDW(n,i)表示公交車n在i站點的停留時間.
步驟4:時空匹配.計算站點??繒r刻后,搜索與該??繒r刻最接近的IC卡,進而獲取該卡刷卡點的空間位置SW(i)(由刷卡時的經(jīng)緯度坐標表示);進一步搜索與該刷卡點SW(i)在空間上最接近的站點ST(i)(站點經(jīng)緯度數(shù)據(jù)在線網(wǎng)數(shù)據(jù)庫中獲取),當min(|SW(i)-ST(i)|)≤D時(|SW(i)-ST(i)|和D為空間距離,D可根據(jù)不同站臺設(shè)計尺寸確定,本案例取15 m),所取ST(i)對應的公交站點就被認為是刷卡站點,即上車站點.
2.2.2 數(shù)據(jù)剔除與歸并
當公交車在紅燈前或遇到交通事件時停止,且同時有乘客刷卡時,其數(shù)據(jù)表現(xiàn)形式就會與在公交站點發(fā)生的刷卡事件相同,在處理數(shù)據(jù)的過程中,極易將其認為是站點的停留時間.因此,在數(shù)據(jù)分析前需要將該部分數(shù)據(jù)剔除.
其判斷方法及步驟同確定上車站點時的類似.不同的是最后一步的判斷標準,即
D=min(|SW(i)-ST(i)|)>D0.
(2)
式(2)中,D0為一固定值,可取線路上公交站臺最大長度(本文取15 m).當D>D0時,即認為該部分數(shù)據(jù)不是站點停留時間,應當將其作為旅行時間的一部分,并將其從停留時間內(nèi)剔除,歸并到路段旅行時間內(nèi).
為匹配出公交乘客出行OD,需要推算出刷卡乘客的上車站點及下車站點.原則上,城市居民一日內(nèi)公交出行具有規(guī)律性,本文采用“基于出行鏈下車站點推導”方法進行下車站點推算[10].結(jié)合上、下車站點的信息,最終獲取公交OD數(shù)據(jù),如表3所示.根據(jù)上下車站點算法,結(jié)合VBA編程,實現(xiàn)對于多次刷卡乘客的公交出行OD的分析.本文最終共獲得1.74萬人次一日內(nèi)4.09萬次的公交出行OD記錄,占全日公交出行總次數(shù)的23.1%.經(jīng)擴算后,得到常規(guī)公交出行OD.數(shù)據(jù)顯示:江南與江北之間的出行比例大于江北、江南各自東西向的出行,也說明公交方式在長距離出行中具有一定的優(yōu)勢.
表3 公交OD部分數(shù)據(jù)
截止2018年6月,金華市公交集團共有營運車輛1 061臺,全部運營車輛均配備GPS監(jiān)控設(shè)備及IC卡刷卡裝置,并可實時存儲GPS數(shù)據(jù)及刷卡數(shù)據(jù);營運線路共計175條,2017年市區(qū)公交分擔率為20.2%,與國內(nèi)其他城市相比稍顯滯后[11].
本文以金華市普通工作日(2018年3月1日)的常規(guī)公交多源數(shù)據(jù)為算例:一張IC卡對應一位乘客,結(jié)合IC、GPS、線路站點、調(diào)度數(shù)據(jù)等多源數(shù)據(jù),獲取乘客公交出行特征、線網(wǎng)客流特征,統(tǒng)計分析常規(guī)公交客流特征.
3.2.1 總體出行特征
對分析時段內(nèi)所有IC卡(含BRT、市區(qū)公交、
郊區(qū)公交)數(shù)據(jù)進行統(tǒng)計:
1)乘客組成:50%以上的公交乘客為本市居民,郊區(qū)線路中暫住人員、外來人員占比較高.
2)支付方式:IC卡使用率偏低,近6成乘客仍使用投幣方式,公交客源不穩(wěn)定.
3)出行目的:公交乘客出行以上下班、生活購物為主.
3.2.2 出行時間分布
1)日出行時耗:公交日出行時間為39 min,平均乘車時間為26 min.金東區(qū)與婺城新區(qū)之間的平均出行時間為55~65 min,出行時間較長.
2)客流時間分布:根據(jù)當日分時段IC卡的數(shù)據(jù)統(tǒng)計,早晚高峰系數(shù)分別為14.1%和13.2%(7:15—8:15為早高峰,16:45—17:45為晚高峰);平峰時段的客流量為高峰時段的45.0%左右,客流時間分布如圖3所示.
圖3 客流出行時間分布
3.2.3 出行空間分布
公交乘客出行主要集中在東關(guān)、西關(guān)、江南、湖海塘等區(qū)域,一環(huán)內(nèi)公交出行量占比82.4%.金東區(qū)塊公交出行量約6 500人次;婺城區(qū)等新區(qū)公交出行總量偏低,占全市公交出行量的比重較少.東西兩翼公交出行總量僅維持在1 800人次左右.
在全市范圍內(nèi)選擇72條線路,乘距統(tǒng)計信息顯示,公交乘客平均乘次站點個數(shù)為12站,平均乘次起終點站間距為7.32 km,居民公交乘車距離較大.城區(qū)線路中有超過16.1%的公交線路乘客“平均站距/線路單程”的值高于0.5.這部分線路未來可以采用大站快車的形式提高運行效率.
3.3.1 集散點客流特征
通過IC卡數(shù)據(jù)選取公交客流較大的11個站點,統(tǒng)計各站點高峰乘降情況(早高峰時段7:15—9:15,晚高峰時段16:45—18:45).從公交客流集散點上下客人數(shù)匯總可以看出,金華站公交站點客流量最大,其次為人民廣場和金華商城.
集散點客流數(shù)據(jù)顯示:在早高峰時段(7:15—8:15),江北的上車乘客人數(shù)多于下車乘客人數(shù),在晚高峰時段(17:00—18:00),江南呈現(xiàn)出上車乘客人數(shù)多于下車人數(shù)的特征,而江北的樞紐站——金華站和汽車東站,則呈現(xiàn)出上車人數(shù)多于下車人數(shù)的現(xiàn)象.
3.3.2 線網(wǎng)客流特征
目前,市區(qū)公交主流向及其斷面流量如圖4所示,八一南街、八一北街為南北向主干道,集中了39.2%的全日公交客流;與其他橋梁相比,通濟橋斷面公交客流量最大(占43.2%的全日公交客流),雙龍大橋的交通量和公交車流量排名第二,這2座橋為連接江南江北的主要交通走廊.通濟橋公交車占總交通量的比例低于7.0%,卻承載了30.0%的公交客流,雙龍大橋公交車交通量占總交通量的2.45%,分擔了10.18%的載客量.雙溪西路、人民路為東西走向次一級的公交走廊,全天雙向運量約19 500人次.
圖4 斷面客流分布圖
公交服務水平對吸引乘客出行具有重要作用.結(jié)合乘客問詢調(diào)查統(tǒng)計有以下特點:
1)公交換乘:結(jié)合IC卡分析顯示,公交出行的換乘系數(shù)為1.15,很好地滿足了大城市中城市換乘系數(shù)不大于1.5的規(guī)范要求.
2)服務半徑:公交出行時間長短對吸引乘客出行具有重要作用,金華市公交站點分布情況較好,居民步行10 min的距離內(nèi)就有公交服務(10 min以內(nèi)占比84%),并且下車后也只需10 min就可到達目的地(10 min以內(nèi)占比87%).但是,各項數(shù)據(jù)表明,站點500 m服務半徑未達到90%,覆蓋率有進一步提高的空間.
3)運行速度:公交線路高峰時段的平均行程速度是20.1 km/h,平峰時段的平均行程速度為23.4 km/h,最低運行車速為13.2 km/h(K27路);K9路、K15路、K20路、K24路、K35路、K53路、Y6路等公交線路,由于運營線路主要集中在中心區(qū),因此,平均車速均低于15 km/h;郊區(qū)的線路,如游7路、K1路、318路等,運營速度較高.
4)滿載率:選取各跨江斷面進行公交高峰滿載率調(diào)查,共獲得34條城區(qū)線路的高峰時段滿載率數(shù)據(jù),如表4所示.高峰時段金華城區(qū)公交線路的負荷度平均值為0.51,還未達到飽和,高峰時段滿載率為0.6~0.7,較為適中.高峰時段滿載率過高會降低乘客的乘坐舒適性,導致乘客向其他出行方式轉(zhuǎn)移,惡化出行結(jié)構(gòu).
表4 高峰時段滿載率
5)乘客滿意度:公交意愿調(diào)查結(jié)果顯示,61%的乘客認為金華常規(guī)公交的總體情況良好,只有2%的乘客對公交系統(tǒng)表示不滿.乘客認為,金華公交系統(tǒng)主要存在以下問題:等車時間太長、線路繞行過多、沒有直達車、末班車收車過早、車速較慢等.
將多源信息融合技術(shù)應用于城市常規(guī)公交領(lǐng)域,實現(xiàn)對乘客的出行特征精準描述,探求城市常規(guī)公交系統(tǒng)的規(guī)律性,有利于找出常規(guī)公交存在的問題并進行改善,以提高乘客的出行體驗.
利用公交IC卡、GPS等多源數(shù)據(jù)獲取金華市常規(guī)公交客流數(shù)據(jù),有利于后期公交運營計劃的改善、公交線網(wǎng)的調(diào)整、城市出行結(jié)構(gòu)的優(yōu)化.案例表明:基于多源數(shù)據(jù)的常規(guī)公交客流特征分析方法可行,其分析結(jié)果較傳統(tǒng)方法成本低,且實時性好,可以有效提高后續(xù)常規(guī)公交系統(tǒng)的分析評估精度.