陳 君,楊東援
(1.西安建筑科技大學(xué)土木工程學(xué)院,西安 710055;2.同濟(jì)大學(xué) 交通運(yùn)輸工程學(xué)院,上海 201804)
近年來公交智能調(diào)度系統(tǒng)在國內(nèi)外開始廣泛應(yīng)用,為判斷公交卡乘客的上車站點(diǎn)提供了新的數(shù)據(jù)來源.本文以南寧市為例,研究在公交智能調(diào)度條件下,判斷公交卡乘客上車站點(diǎn)的方法.
智能公交系統(tǒng)的原始數(shù)據(jù)為系統(tǒng)運(yùn)行所產(chǎn)生,具有多源和海量的特點(diǎn).筆者對南寧市智能公交系統(tǒng)的運(yùn)營管理進(jìn)行了調(diào)研,并采集了南寧市公交IC卡收費(fèi)系統(tǒng)和公交智能調(diào)度系統(tǒng)運(yùn)營的原始數(shù)據(jù),包括公交IC卡數(shù)據(jù)、公交GPS數(shù)據(jù)、公交站點(diǎn)坐標(biāo)數(shù)據(jù)和公交運(yùn)行記錄數(shù)據(jù).
數(shù)據(jù)組織是按照一定的方式和規(guī)則對數(shù)據(jù)進(jìn)行歸并、存儲、處理的過程[5].本文采用數(shù)據(jù)倉庫技術(shù)完成這一過程,建立研究工作的數(shù)據(jù)分析平臺,如圖1所示.在此平臺上,開發(fā)程序來測試和驗(yàn)證提出的算法.
圖1 智能公交數(shù)據(jù)分析平臺建立Fig.1 Establishment of APTS data analysis platform
本文通過將公交 IC卡數(shù)據(jù)、公交 GPS數(shù)據(jù)、公交站點(diǎn)坐標(biāo)和公交運(yùn)行記錄4種數(shù)據(jù)進(jìn)行關(guān)聯(lián)來判斷公交卡乘客的上車站點(diǎn).這4種數(shù)據(jù)源主要字段之間的關(guān)聯(lián)關(guān)系,如圖2所示.
圖2 4種數(shù)據(jù)源的關(guān)聯(lián)關(guān)系Fig.2 Association of four data sources
本文提出的公交卡乘客上車站點(diǎn)判斷方法包括3個(gè)基本步驟.
那巖鷹翼展過丈,黑羽灰斑,帶著巖石般的厚重紋路,看上去身軀極為結(jié)實(shí)。它抓著一條黑蟒,那黑蟒有成人手臂粗細(xì),七八尺長,在鋼鉤般的鷹爪下一動不動地耷拉著,頗為瘆人。
Step 1確定刷卡時(shí)公交車輛的坐標(biāo).
(1)初步篩選.
將公交IC卡數(shù)據(jù)與公交GPS數(shù)據(jù)進(jìn)行關(guān)聯(lián),篩選刷卡時(shí)公交車輛的可能坐標(biāo).
南寧市公交IC卡數(shù)據(jù)的“刷卡時(shí)間”字段精確到“分”,沒有“秒”的記錄.例如“08:35:45”記錄為“08:35:00”,采用了截尾記錄方式.公交GPS數(shù)據(jù)的“時(shí)間”字段值精確到“秒”,這樣在刷卡這1 min的第0~59 s之間的GPS數(shù)據(jù),以及刷卡這1 min前后時(shí)間最接近的GPS數(shù)據(jù),都可能是與刷卡時(shí)間相匹配的GPS數(shù)據(jù).
將IC卡數(shù)據(jù)的線路編號、車輛編號、刷卡日期、刷卡時(shí)間4個(gè)字段與公交GPS數(shù)據(jù)進(jìn)行匹配,得到備選的公交GPS數(shù)據(jù).
(2)最終確定.
由于每條公交IC卡記錄可能對應(yīng)幾條備選的公交GPS數(shù)據(jù),這樣需要在這幾條備選數(shù)據(jù)中,確定出與刷卡時(shí)間最接近的公交GPS數(shù)據(jù).公交車停靠在站點(diǎn)時(shí),速度為0,在離站點(diǎn)較近時(shí)車速較低.因此,可以通過比較備選公交GPS數(shù)據(jù)的“瞬時(shí)車速”值,來確定最接近刷卡時(shí)間的公交GPS數(shù)據(jù).取備選數(shù)據(jù)中瞬時(shí)車速最小這一條數(shù)據(jù)的“經(jīng)度”和“緯度”值作為刷卡時(shí)公交車輛的坐標(biāo).如果備選的幾條GPS數(shù)據(jù)中,出現(xiàn)相同的最小瞬時(shí)車速時(shí),取與刷卡這1 min第30 s最近的GPS數(shù)據(jù).
Step 2公交車輛運(yùn)行上、下行方向的確定.
將公交IC卡數(shù)據(jù)與運(yùn)行記錄數(shù)據(jù)關(guān)聯(lián)確定刷卡時(shí)公交車輛運(yùn)行的上、下行方向(從主站駛向副站為下行,反之為上行).
Step 3刷卡時(shí)公交車輛的坐標(biāo)與站點(diǎn)坐標(biāo)匹配.
用已得到的刷卡時(shí)公交車輛坐標(biāo)與相應(yīng)線路、相應(yīng)方向的公交站點(diǎn)坐標(biāo)進(jìn)行匹配,最終得到刷卡時(shí)的公交站點(diǎn),也就是上車站點(diǎn).
公交智能調(diào)度系統(tǒng)每隔一定的時(shí)間間隔接收一條公交車輛的GPS坐標(biāo)數(shù)據(jù).公交GPS坐標(biāo)數(shù)據(jù)的時(shí)間間隔長度將影響上車站點(diǎn)的判斷精度.如果公交GPS數(shù)據(jù)的時(shí)間間隔過大,得到刷卡時(shí)公交車輛坐標(biāo)超出上車站點(diǎn)與相鄰站點(diǎn)之間間距的1/2時(shí)(圖3中的允許誤差范圍L),將會出現(xiàn)上車站點(diǎn)判斷錯誤,如圖3所示.
圖3 公交GPS數(shù)據(jù)坐標(biāo)允許誤差范圍示意Fig.3 Schematic of allowable error scope of bus GPS data coordinates
因此,有必要對影響判斷上車站點(diǎn)精度的公交GPS數(shù)據(jù)時(shí)間間隔長度進(jìn)行分析.假設(shè)城市公交站點(diǎn)平均間距為500 m,公交GPS坐標(biāo)數(shù)據(jù)的精度在10 m范圍以內(nèi).這種條件下,允許的誤差范圍為480 m(500-10×2).公交車按照25 km/h平均車速行駛480 m需要69.12 s.假定公交在站點(diǎn)的平均停站時(shí)間為20 s,則公交GPS數(shù)據(jù)的時(shí)間間隔t超過89.12 s(69.12+20)時(shí),允許誤差范圍L以內(nèi)可能出現(xiàn)沒有GPS數(shù)據(jù)可以匹配的情況.時(shí)間間隔超過89.12 s的1倍時(shí),則一定會出現(xiàn).由此可知,在一般情況下,89.12 s為公交GPS數(shù)據(jù)的最大允許時(shí)間間隔T.
南寧市公交IC卡數(shù)據(jù)的刷卡時(shí)間記錄精確到分,而實(shí)際刷卡時(shí)間在這1 min的第0~59 s之間.最有利的情況是刷卡時(shí)間恰好是這1 min的第0 s,這時(shí)公交GPS數(shù)據(jù)的時(shí)間間隔只要小于最大允許時(shí)間間隔T(89.12 s),就不會產(chǎn)生匹配錯誤.最不利情況是公交IC卡數(shù)據(jù)的“刷卡時(shí)間”值與實(shí)際刷卡時(shí)間相差60 s,這時(shí)公交GPS數(shù)據(jù)的時(shí)間間隔小于29.12 s(89.12-60)才不會產(chǎn)生上車站點(diǎn)的判斷錯誤.以下分別對最不利情況和最有利情況的上車站點(diǎn)判斷正確率進(jìn)行計(jì)算.
隨機(jī)抽取南寧市2008年12月1日2路公交“001151”號公交車全天的GPS數(shù)據(jù)進(jìn)行時(shí)間間隔長度的統(tǒng)計(jì)分析,時(shí)間間隔t在29.12 s以內(nèi)的時(shí)間間隔總時(shí)長占所有公交GPS數(shù)據(jù)總時(shí)長的比例為68.45%,這部分?jǐn)?shù)據(jù)全部能夠正確匹配.公交GPS數(shù)據(jù)的時(shí)間間隔t大于29.12 s時(shí),仍能夠正確匹配到上車站點(diǎn)的概率為29.12/t,經(jīng)過計(jì)算能夠正確判斷的比例為21.57%.因此,在最不利情況下,上車站點(diǎn)判斷的正確概率為90.02%(68.45%+21.57%).以此方法,再求出最有利情況下判斷的正確率.GPS數(shù)據(jù)時(shí)間間隔在89.12 s以內(nèi)的時(shí)間間隔時(shí)長占公交GPS數(shù)據(jù)總時(shí)長的比例為99.3%,大于89.12 s時(shí)的公交GPS數(shù)據(jù)仍能夠正確判斷的概率為0.15%.在最有利情況下,上車站點(diǎn)判斷正確的概率為99.45%(99.3%+0.15%).
以上分析可知,公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到秒時(shí),上車站點(diǎn)判斷的準(zhǔn)確率為最有利情況的準(zhǔn)確率,即為99.45%;公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到分,且不采用瞬時(shí)車速進(jìn)行輔助判斷時(shí),上車站點(diǎn)判斷的準(zhǔn)確率為最有利和最不利情況的平均值,即為94.74%.
考慮到南寧市公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到分,對判斷上車站點(diǎn)的準(zhǔn)確率有一定影響.本文提出采用“公交車停靠在站點(diǎn)時(shí),瞬時(shí)速度為0”這一特征進(jìn)行輔助判斷來提高上車站點(diǎn)的判斷精度.以下對瞬時(shí)車速輔助判斷的影響進(jìn)行分析.
首先對公交GPS數(shù)據(jù)瞬時(shí)車速本身的數(shù)據(jù)質(zhì)量進(jìn)行分析,通過將公交GPS數(shù)據(jù)的相鄰坐標(biāo)點(diǎn)之間的行程車速值與這兩個(gè)相鄰坐標(biāo)點(diǎn)的瞬時(shí)車速均值進(jìn)行比較來確定.隨機(jī)抽取了2008年12月1日下午14時(shí)南寧市2路公交“001147”號公交車的GPS數(shù)據(jù),分別計(jì)算行程車速與瞬時(shí)車速均值.對兩種車速值進(jìn)行相關(guān)性分析,兩者的相關(guān)性系數(shù)為0.90,樣本均值相差僅為5.24%,說明瞬時(shí)車速與行程車速值整體上很接近,可以推斷瞬時(shí)車速的總體數(shù)據(jù)質(zhì)量很高.
考慮瞬時(shí)車速的數(shù)據(jù)質(zhì)量及其它影響因素,假設(shè)采用瞬時(shí)車速進(jìn)行輔助判斷后,有80%的IC卡數(shù)據(jù)最終能夠匹配到與刷卡時(shí)間最接近的公交GPS數(shù)據(jù).這樣有80%的IC卡數(shù)據(jù)判斷的正確率為99.45%(與3.2節(jié)中最有利條件下的正確率相同),剩余20%的正確率取3.2節(jié)中最有利和最不利情況的平均值,為94.74%.因此,采用瞬時(shí)車速進(jìn)行輔助判斷后,上車站點(diǎn)判斷的準(zhǔn)確率為98.45%(99.45%×80%+94.74%×20%).
以南寧市智能公交系統(tǒng)數(shù)據(jù)環(huán)境為例,提出基于智能調(diào)度數(shù)據(jù)的公交IC卡乘客上車站點(diǎn)判斷算法如下.
Step 0 取出1條IC卡數(shù)據(jù),按IC卡數(shù)據(jù)的“線路編號”和“車輛編號”字段值查找相應(yīng)線路、車輛的公交GPS數(shù)據(jù).
Step 1將該條IC卡數(shù)據(jù)時(shí)間與相應(yīng)線路和車輛的GPS數(shù)據(jù)的時(shí)間進(jìn)行比較,找到該條IC卡數(shù)據(jù)刷卡時(shí)間1 min內(nèi)的GPS數(shù)據(jù),以及這1 min前、后時(shí)間最接近的各1條GPS數(shù)據(jù),作為備選GPS數(shù)據(jù).
Step 2取備選GPS數(shù)據(jù)中瞬時(shí)速度最小的數(shù)據(jù)為刷卡時(shí)的GPS數(shù)據(jù).如果存在備選GPS數(shù)據(jù)中的瞬時(shí)車速最小值相同,則取相同最小值中最接近刷卡時(shí)間這1 min第30 s的數(shù)據(jù).
Step 3根據(jù)IC數(shù)據(jù)的線路編號、車輛編號、刷卡時(shí)間,在運(yùn)行記錄數(shù)據(jù)表里查找刷卡車輛的所屬班次,根據(jù)班次確定上行、下行方向.
Step 4計(jì)算刷卡時(shí)公交車輛坐標(biāo)與相應(yīng)線路、相應(yīng)方向(上行或下行)所有站點(diǎn)坐標(biāo)的空間直線距離,距離最小的站點(diǎn)為上車站點(diǎn),將站點(diǎn)編號和站點(diǎn)名稱作為新的字段值寫入到IC卡數(shù)據(jù)表中.
Step 5重復(fù)Step0~Step4,直到所有刷卡記錄全部獲得上車站點(diǎn).
以上算法采用VB.NET語言編程實(shí)現(xiàn)[6].
圖4 部分計(jì)算結(jié)果Fig.4 Partial computing results
以南寧市2008年12月1日(星期一)~12月5日(星期五)57條智能調(diào)度線路的978 077條公交IC卡數(shù)據(jù)為算例,對本文提出的算法進(jìn)行測試和分析.算法程序運(yùn)行的計(jì)算機(jī)硬件環(huán)境為雙核2.8 GHz CUP,1 GB內(nèi)存,300 GB硬盤.每個(gè)工作日的公交IC卡數(shù)據(jù)(約20萬條)約8 h完成運(yùn)算.算法程序的部分運(yùn)算結(jié)果,如圖4所示,字段描述如表1所示.
本算例5個(gè)工作日共計(jì)978 077條公交IC卡數(shù)據(jù)中,最終判斷出上車站點(diǎn)的記錄為899 174條,比例為91.93%.8.07%的公交IC卡數(shù)據(jù)未能判斷出上車站點(diǎn),經(jīng)過分析是由于公交GPS信號受到干擾、公交GPS設(shè)備出現(xiàn)故障及少量時(shí)段公交智能調(diào)度系統(tǒng)未使用,從而導(dǎo)致公交GPS數(shù)據(jù)或運(yùn)行記錄數(shù)據(jù)缺失.5個(gè)工作日的運(yùn)算結(jié)果統(tǒng)計(jì),如表2所示.
表1 運(yùn)算結(jié)果數(shù)據(jù)字段描述Table 1 Fields description of computing results
表2 運(yùn)算結(jié)果統(tǒng)計(jì)Table 2 Statistics of computing results
本文提出對智能公交系統(tǒng)的4種原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)來判斷公交卡乘客上車站點(diǎn).通過分析,公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到秒時(shí),應(yīng)用這種方法判斷公交卡乘客上車站點(diǎn)的準(zhǔn)確率為99.45%;公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到分,且不采用瞬時(shí)車速進(jìn)行輔助判斷,準(zhǔn)確率為94.74%;公交IC卡數(shù)據(jù)的刷卡時(shí)間精確到分,并采用瞬時(shí)車速進(jìn)行輔助判斷,準(zhǔn)確率達(dá)到98.45%.本文對提出的算法進(jìn)行了程序?qū)崿F(xiàn),并以南寧市57條智能公交調(diào)度線路的5個(gè)工作日的海量數(shù)據(jù)對算法進(jìn)行了測試,有91.93%的公交卡數(shù)據(jù)成功確定出了上車站點(diǎn).未能判斷出上車站點(diǎn)的原因是公交GPS數(shù)據(jù)或運(yùn)行記錄數(shù)據(jù)缺失.隨著公交智能調(diào)度系統(tǒng)性能的完善,運(yùn)營數(shù)據(jù)缺失情況會進(jìn)一步減少,能夠判斷出公交卡乘客上車站點(diǎn)的比例還能得到繼續(xù)提高.
[1]Bagchi M,Gleave S D,White P.Use of public transport smart card data for understanding travel behavior[C].Strasbourg, France: European Transport Conference,2003.
[2]陳學(xué)武,戴霄,陳茜.公交IC卡信息采集、分析與應(yīng)用研究[J].土木工程學(xué)報(bào),2004,37(2):105-110.[CHEN X W,DAI X,CHEN Q.Approach on the information collection,analysis and application of bus intelligent card[J].China Civil Engineering Journal,2004,37(2):105-110.]
[3]戴霄.基于公交IC信息的公交數(shù)據(jù)分析方法研究[D].南京:東南大學(xué),2006.[DAI X.Research on transit data analysis based on bus intelligent card information[D].Nanjing:Southeast University,2006.]
[4]Chen Jun.Validity research of Judging boarding stop by cluster analysis smart card data[C]//The International Conferenceon Remote Sensing,Environmentand Transportation Engineering,2011.
[5]朱德利.SQL Server 2005數(shù)據(jù)庫管理與應(yīng)用高手修燒煉指南[M].北京:電子工業(yè)出版社,2007.[ZHU D L.SQL Server 2005 database management and application ofpractice guidelines[M]. Beijing:Electronics Industry Press,2007.]
[6]Schneider D.Visual Basic 2005程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2007.[Schneider D.Visual Basic 2005 programming[M].Beijing:Tsinghua University Press,2007.]