張 頌 陳學(xué)武 陳崢嶸
(東南大學(xué)江蘇省交通規(guī)劃與管理重點實驗室1) 南京 210096) (江蘇省城市規(guī)劃設(shè)計研究院2) 南京 210036)
描述公交出行空間分布的公交OD矩陣在城市公交規(guī)劃、公交線網(wǎng)優(yōu)化以及公交運營調(diào)度中都有著廣泛的應(yīng)用[1].傳統(tǒng)的獲取公交站點OD的方法是通過大規(guī)模的抽樣調(diào)查[2-3],如車上乘客問卷調(diào)查、跟車調(diào)查、小票法等.這些人工調(diào)查方法不僅繁瑣,而且耗費人力、物力和財力;由于現(xiàn)場調(diào)查工作量非常大,調(diào)查員工作水平參差不齊,導(dǎo)致獲得的公交站點OD矩陣與實際情況存在偏差;另外從調(diào)查實施到完成公交站點OD矩陣需要較長一段時間[4],因此得到的調(diào)查數(shù)據(jù)生命周期很短且不能及時反映實際的公交出行情況.
公交IC卡信息包含了大量公交客流信息,可以利用IC卡的信息分析公交刷卡乘客的出行特征[5].我國部分城市智能公交系統(tǒng)發(fā)展較好,可以通過對公交IC卡和車輛自動定位(AVL)系統(tǒng)的數(shù)據(jù)融合分析,來推導(dǎo)乘客上下車站點,獲取公交OD量.然而受諸多因素限制,現(xiàn)階段大部分城市的大部分公交線路尚未配備GPS系統(tǒng),只能得到公交IC卡上車刷卡數(shù)據(jù),在此前提下,一般都是根據(jù)公交IC卡刷卡時間的模糊聚類分析結(jié)果,結(jié)合行車計劃表,來進行公交站點的識別[6].
由于道路交通狀況的不確定性,行車計劃表與公交車輛實際運營,往往存在較大的誤差,這時公交車上下站點的識別就無法完成或者識別結(jié)果存在較大的偏差.針對這種情況,本文通過對公交IC卡數(shù)據(jù)的深入分析,提出一種適用范圍更廣、實用性更強的新方法,僅僅基于公交IC卡數(shù)據(jù)來完成公交站點OD矩陣的推導(dǎo),以便提高公交OD獲取的效率和質(zhì)量.
本文提出的OD矩陣推導(dǎo)算法使用的基礎(chǔ)數(shù)據(jù)包含2大類:一類是核心數(shù)據(jù),包括IC卡刷卡記錄表、公交站點編號表;一類是公交靜態(tài)數(shù)據(jù),包括線路參數(shù)表、正交換乘參數(shù)表.其中,IC卡刷卡記錄表可直接從外部數(shù)據(jù)庫導(dǎo)入,其余數(shù)據(jù)表需進行補充調(diào)查獲取數(shù)據(jù)并人工錄入.
線路參數(shù)表包括以下字段:記錄編號、線路編號、行車方向、發(fā)車間隔、車輛單程時間、站點行程時間臨界值.其中車輛單程時間是指運營車輛完成線路單程運營所花費的時間.站點行程時間臨界值是指線路內(nèi)各相鄰站點之間的平均最小行駛時間.
定義正交換乘為2條公交線路之間有且僅有1個站點供下車乘客換乘另1條公交,見圖1.圖1中,線路1與線路2有且僅有1個站點S14(S24)相交,供下車乘客完成換乘,所以線路1與線路2互為正交換乘線路,站點S14(S24)為正交換乘站點.通過實地調(diào)查與公交線網(wǎng)基礎(chǔ)資料分析,就可以得到某條線路的正交換乘線路表.正交換乘參數(shù)表包括以下字段:正交換乘站點、正交換乘線路、換乘判斷臨界時間.換乘判斷時間是指換乘前線路行程時間與在換乘站點換乘耗時之和,可以利用線路單程平均運行時間及居民平均出行時耗來確定換乘判斷時間.
圖1 公交線路正交換乘示意圖
城市公交系統(tǒng)中,絕大部分公交線路都是按照固定模式來運營,即公交車輛從起點站出發(fā)沿途??棵總€站點,到達終點站后停留一段時間后,折返運行.在公交IC卡數(shù)據(jù)庫中提取某日1條線路的全天所有的刷卡記錄,按車輛編號聚類,以刷卡序列號為X軸、刷卡時間為Y軸建立二維坐標系,此時某一運行車輛全天刷卡記錄大致呈階梯狀分段分布,見圖2.對其他車輛全天刷卡記錄進行相同排列,趨勢基本相符.說明該線路車輛從始發(fā)站A出發(fā)到達終點站B后,稍作休整,即從B站點出發(fā),繼續(xù)運營返回A站點之后,在A站點休息較長時間,重新從A站點出發(fā)做往返運營.從圖2中可以初步判斷該車輛運營共計6個往返班次.
圖2 某一公交車輛1d的刷卡記錄按時間排列
基于公交IC卡數(shù)據(jù)推導(dǎo)公交站點OD矩陣包括5個主要步驟.
1)首先采集公交IC卡的刷卡數(shù)據(jù),以此數(shù)據(jù)為基礎(chǔ)建立公交IC卡刷卡數(shù)據(jù)庫,此數(shù)據(jù)庫包括核心數(shù)據(jù)信息和公交靜態(tài)參數(shù)信息.
2)對步驟1中得到的數(shù)據(jù)進行預(yù)處理,剔除運行時間范圍外的無效數(shù)據(jù)、錯誤數(shù)據(jù)、重復(fù)數(shù)據(jù)等,并按車輛運行時間先后順序排列刷卡數(shù)據(jù),識別不同車次的刷卡記錄.
3)依據(jù)步驟2中得到的數(shù)據(jù),判斷各條線路各乘客的上車站點,包括:①刷卡數(shù)據(jù)按不同班次聚類;②同一班次內(nèi)的不同站點刷卡記錄聚類;③對滿足正交換乘條件的站點刷卡數(shù)據(jù)進行上車站點匹配;④對剩余刷卡數(shù)據(jù)完成上車站點匹配.
4)依據(jù)步驟1和步驟2得到的數(shù)據(jù),判斷各條線路各乘客的下車站點,包括:①對滿足正交換乘條件的站點刷卡數(shù)據(jù)進行下車站點匹配;②對滿足回程條件的站點刷卡數(shù)據(jù)進行下車站點匹配.
5)依據(jù)上述步驟匹配出的乘客刷卡記錄的上車站點、下車站點,生成公交站點OD矩陣,導(dǎo)入數(shù)據(jù)庫.
1.4.1 刷卡數(shù)據(jù)按不同班次聚類 為了更加深入、準確地挖掘所需信息,對圖2進行局部放大,見圖3.將每隔若干個階梯出現(xiàn)的一次較大時間間隔,記為一個GAP,其時間長度為tGi,兩相鄰GAP間的時間間隔記作TGi-1,Gi.
圖3 刷卡數(shù)據(jù)聚類分析示意圖
按以下步驟對某車輛不同班次的刷卡記錄進行區(qū)分.
1)如果 TGi≥Td,且 TGi-1,Gi∈[Tstr-,Tstr+],則GAPi-1與GAPi之間的刷卡記錄為一個班次的完整刷卡記錄.
2)如果Td>TGi≥,且 TGi-1,Gi∈[Tstr-,則 GAPi-1與 GAPi之間的刷卡記錄為一個班次的完整刷卡記錄.
其中:Td為首末站??繒r間;Tstr為車輛單程時間.
1.4.2 同一班次內(nèi)的不同站點刷卡記錄聚類按以下步驟對同一班次內(nèi)的不同站點刷卡記錄進行區(qū)分.
公交車輛從始發(fā)站出發(fā)沿途停靠每個站點,持有公交IC卡乘客在各站點上車刷卡.在圖2中,2GAP之間的刷卡記錄時間呈階梯狀分布,相鄰階梯的時間間隔記為一個STA,其時間長度為tSi,兩相鄰STA 間的時間間隔記作tSi-1,Si.Tw為站點平均??繒r間;Tsct為站點行程時間臨界值.
將1個站點對應(yīng)的所有刷卡記錄作為一個類,按以下3種情況進行判斷,完成刷卡數(shù)據(jù)的站點聚類.
1.4.3 正交換乘站點上車站點推導(dǎo) 通過刷卡記錄站點聚類后,對站點類Sj中的每一條刷卡記錄Ni,根據(jù)刷卡記錄Ni的公交卡編號字段(kbh),在該線路的所有正交線路的刷卡數(shù)據(jù)庫中查詢該卡號同一天的刷卡記錄Nj,如果記錄Nj的刷卡時間小于Ni刷卡時間,且刷卡時間間隔小于換乘判斷臨界時間,則標定該線路的此刷卡記錄對應(yīng)的上車站點為對應(yīng)的正交換乘站點,依次完成正交換乘站點刷卡數(shù)據(jù)匹配,并將已匹配的站點類Sj作為基本類,其他未匹配的站點類作為待定類.
1.4.4 其余站點類的上車站點推導(dǎo) 經(jīng)過前述步驟后,剩余站點的刷卡數(shù)據(jù)匹配可以利用最大相似原理進行判斷.首先將已完成匹配的正交換乘站點的刷卡記錄作為基本類,其余站點的刷卡數(shù)據(jù)作為待定類.比較站點間刷卡時間間隔與站點間標準行程時間的偏差,以完成其余站點刷卡數(shù)據(jù)匹配.見圖4.
圖4 其他站點類上車站點推導(dǎo)過程
參照圖4,具體推導(dǎo)過程如下.
對于通過上述步驟聚類后的數(shù)據(jù),令tij表示類j的第一次刷卡時間與類i的最后一次刷卡時間的差值(類i所對應(yīng)站點類處于類j所對應(yīng)站點類的上游);Tab表示實際中站點a至站點b的標準行程時間.已完成匹配的換乘站點的刷卡記錄作為基本類,兩相鄰基本類之間(或起終點與基本類之間)的部分稱為類段,一個類段所包含的類的數(shù)量稱為該類段的容量.對于容量為M的類段,其對應(yīng)的待定站點數(shù)量為N(由于某些站點可能沒有刷卡記錄,所以顯然有M小于等于N),其第m個類的判斷值xk計算如下.
1)若為第一個類段,則xk=(tmR-Tkr)2,k=1,…,N.取最小的xk,其對應(yīng)的m和k滿足最大相似匹配條件.即類m的所有刷卡記錄對應(yīng)的上車站點為Sk.
2)若為中間類段,則xk=(tLm-Tl(l+k))2+(tmR-T(l+k)r)2,k=1,…,N.取最小的xk,類 m的所有刷卡記錄對應(yīng)的上車站點為Sl+k.
3)若為最后一個類段,則xk=(tLm-Tl(l+k))2,k=1,…,N.取最小的xk,類 m 的所有的刷卡記錄對應(yīng)的上車站點為Sl+k.
式中:L(R)分別表示類的左(右)臨基本類;l(r)分別表示基本類L(R)所對應(yīng)的正交換乘站點;tlm(tmR)為左(右)臨基本類與m類的刷卡時間間隔;Tl(l+k)(Tkr)為待定站點與左(右)臨正交換乘站點之間的標準行程時間.
1.4.5 刷卡記錄下車站點匹配
1)利用正交換乘匹配 利用正交換乘匹配來準確判斷下車站點,與前文利用正交換乘匹配判斷上車站點類似.完成上車站點匹配后,對數(shù)據(jù)庫中的每一條刷卡記錄Ni,根據(jù)刷卡記錄Ni的公交卡編號字段(kbh),在該線路的所有正交線路的刷卡數(shù)據(jù)庫中查詢同一天該卡號的刷卡記錄Nj,如果記錄Nj的刷卡時間大于Ni刷卡時間,且刷卡時間間隔小于換乘判斷時間,則標定該線路的此刷卡記錄對應(yīng)的下車站點為對應(yīng)的正交換乘站點,依次完成對當日該線路所有刷卡數(shù)據(jù)的下車站點匹配.
2)利用回程匹配 由于公交線路的運營特征,持有公交IC卡的絕大部分公交出行乘客都屬于通勤交通,決定了公交出行在線路的選擇上和客流的分布上具有一定的規(guī)律性和穩(wěn)定性.圖5展示了4種常見的通勤乘客出行鏈,可以看出這些乘客的上車站點和下車站點具有對稱性,因此還可以利用回程來進行下車站點匹配.
圖5 典型的通勤公交乘客出行鏈
首先抽取某條線路1d的所有刷卡數(shù)據(jù),按卡號和刷卡時間排序,然后提取出同一張卡在同一條線路有偶數(shù)條刷卡數(shù)據(jù)的記錄,第奇數(shù)次刷卡記錄與第偶數(shù)次刷卡記錄對應(yīng)的上車站點互為對方的下車站點.
1.4.6 公交站點OD矩陣生成
通過上述步驟分析計算,可以得到每條IC卡刷卡記錄對應(yīng)的上車站點和下車站點.從而計算某公交線路LINE在日期DAY的站點OD矩陣
式中:n為線路站點個數(shù);aod為站點o到站點d的交通量,其值等于通過上述算法計算得到的“上車站點為O,下車站點為D”的記錄的數(shù)量.將統(tǒng)計得到的公交站點OD矩陣導(dǎo)入數(shù)據(jù)庫中,并匯總各日各線路的站點OD矩陣,就可以得到公交線網(wǎng)站點OD矩陣.
以某城市3路公交為例,線路大致呈東西走向,共有17個站點,線路途經(jīng)市中心主要商業(yè)區(qū),運營時間為06:30~22:30.
選取2008年3月3日(星期一)的刷卡記錄,經(jīng)過數(shù)據(jù)清理及預(yù)處理后,得到有效IC卡刷卡記錄共計28 700條,按本文算法,通過補充調(diào)查取Td=10min,Tstr=60min,Tsct=3.5min,Tw=60 s,通過推導(dǎo)算法,可以判斷出上車站點的記錄有19 084條,判斷出下車站點的記錄共13 784條,上車站點、下車站點均推導(dǎo)出的記錄8 982條,匯總出的公交OD矩陣.(表略).
利用2008年3月常州市公交調(diào)查中所獲得的數(shù)據(jù),檢驗上述算法的精度.調(diào)查數(shù)據(jù)包括高峰時段內(nèi)的6個班次的公交車經(jīng)過所有公交站點的乘客總乘降量和公交站點OD矩陣,將人工調(diào)查得到的公交站點OD矩陣和通過上述算法推導(dǎo)的OD矩陣分別換算成各站點上下客流量占總乘降量的比例,二者在分布上的吻合程度達到87.11%和71.18%,見圖6,表明該算法與實際調(diào)查所得公交站點OD有相當大的一致性.
圖6 IC卡推導(dǎo)結(jié)果與人工調(diào)查數(shù)據(jù)對比
本文的方法僅基于公交IC卡系統(tǒng)數(shù)據(jù),數(shù)據(jù)要求比較簡單,數(shù)據(jù)的采集依靠設(shè)備自動完成,節(jié)省大量人力、物力調(diào)查,實時性和準確性也較高,研究成果可為分析公交網(wǎng)絡(luò)OD矩陣提供基礎(chǔ)和技術(shù)支持.
隨著城市居民使用公交IC卡的比例增加,利用公交IC數(shù)據(jù)獲得的公交OD會更加貼近實際情況.因此,基于IC卡數(shù)據(jù)推導(dǎo)公交站點OD矩陣的方法將會得到廣泛應(yīng)用.
[1]ZHAO J,RAHBEE A,WILSON N H M.Estimating a rail passenger trip origin-destination matrix using automatic data collection Systems[J].Computer Aided Civil and Infrastructure Engineering,2007,22(5):376-387.
[2]朱曉宏,丁衛(wèi)東,孫泰屹.公交客流信息采集技術(shù)研究[J].城市車輛,2005(1):55-56.
[3]高桂鳳,魏 華,嚴寶杰.城市公交服務(wù)質(zhì)量可靠性評價研究[J].武漢理工大學(xué)學(xué)報:交通科學(xué)與工程版,2007,31(1):140-143.
[4]BAGCHI M,WHITE P R.What role for smart.card data from bus systems[J].Proceedings of the Institution of Civil Engineers:Municipal Engineer,2004,157(3):39-46.
[5]安 萌,陳學(xué)武,蘆方強.公交站點OD小票法的應(yīng)用研究[C].濟南:第四屆智能交通年會,2008:706-712.
[6]戴 霄.基于公交IC信息的公交數(shù)據(jù)分析方法研究[D].南京:東南大學(xué),2006.