張騰月,翁小雄
(華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)
基于收費(fèi)數(shù)據(jù)的高速公路行程時(shí)間可靠性估計(jì)模型
張騰月,翁小雄
(華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)
高速公路收費(fèi)數(shù)據(jù)易于獲取,且蘊(yùn)含多種交通信息。本文利用收費(fèi)數(shù)據(jù)分析高速公路客貨車行程時(shí)間分布,提出客貨車行程時(shí)間分布的差異,分別構(gòu)建客貨車行程時(shí)間可靠性估計(jì)模型,并對模型進(jìn)行試驗(yàn)分析。利用MATLAB對直接求取的客貨車行程時(shí)間和模型求取的客貨車行程時(shí)間進(jìn)行正態(tài)分布和對數(shù)正態(tài)分布曲線擬合,結(jié)果表明:客貨車的行程時(shí)間分布均符合正態(tài)分布;利用本文模型求取的行程時(shí)間分布比直接使用出入口收費(fèi)站時(shí)間差求取的行程時(shí)間分布具有更小的SSE和RMSE以及更大的R-square。最后,對客貨車行程時(shí)間的可靠性區(qū)間,即置信區(qū)間進(jìn)行比較,結(jié)果表明:在同一置信水平下,利用本文模型求解的行程時(shí)間具有更小的行程時(shí)間區(qū)間分布,即更好的穩(wěn)定性。
高速公路收費(fèi)數(shù)據(jù);行程時(shí)間;可靠性估計(jì);正態(tài)分布;對數(shù)正態(tài)分布
交通擁擠不僅會對經(jīng)濟(jì)產(chǎn)生負(fù)面影響,同時(shí)也會帶來生活質(zhì)量下降、資源浪費(fèi)、環(huán)境污染等各種問題。隨著我國經(jīng)濟(jì)突飛猛進(jìn)的發(fā)展,全國車輛保有量也呈現(xiàn)持續(xù)上升的趨勢,但由于我國高速公路時(shí)空分布的差異性,高速公路常發(fā)性擁擠問題日益突出,因此需要對高速公路行程時(shí)間分布特征進(jìn)行研究,以便為道路決策者和使用者提供可靠的行程時(shí)間,合理控制出行,以減少交通擁擠或事故的發(fā)生。
目前,國內(nèi)外學(xué)者對高速公路行程時(shí)間的研究主要是利用GPS數(shù)據(jù)[1]、鋪設(shè)線圈檢測器數(shù)據(jù)[2]等設(shè)施。然而,新增檢測設(shè)施成本高、維護(hù)不便且維修不及時(shí)容易引起信息缺失。高速公路行程時(shí)間的研究需要持續(xù)性完整的數(shù)據(jù)作為支撐,而我國高速公路采用封閉式收費(fèi),可以在不新增檢測設(shè)施建設(shè)投入的情況下,實(shí)現(xiàn)對高速公路行程時(shí)間的準(zhǔn)確估算,恰恰滿足這一要求,所以利用高速公路收費(fèi)數(shù)據(jù)對高速公路行程時(shí)間進(jìn)行估計(jì)既可行又有現(xiàn)實(shí)意義。
國內(nèi)外學(xué)者在行程時(shí)間的分布上也做了相關(guān)研究。Arezoumandi[3]通過分別分析伽馬分布、最大極值分布、Log-logistic概率分布、對數(shù)正態(tài)分布及威布爾分布與一天行程時(shí)間數(shù)據(jù)的擬合程度,得到了可變限速情形下行程時(shí)間的分布服從對數(shù)正態(tài)分布。朱彥等[4]使用浮動車數(shù)據(jù)計(jì)算出城市快速路各路段在不同時(shí)段的行程時(shí)間,再采用統(tǒng)計(jì)分析方法得出目標(biāo)路段在相同時(shí)段下行程時(shí)間的分布規(guī)律,并對相同時(shí)段不同路段、相同路段不同時(shí)段的行程時(shí)間分布測度進(jìn)行對比分析。王翔等[5]提出收費(fèi)數(shù)據(jù)補(bǔ)全算法,解決了當(dāng)收費(fèi)站間缺少收費(fèi)數(shù)據(jù)而無法獲取行程時(shí)間的問題。
上述方法在研究高速公路行程時(shí)間的時(shí)候,按照車型來研究或者不分車型來研究,未考慮客貨類型的差異性。因此,本文以高速公路收費(fèi)數(shù)據(jù)為依托,利用SPSS統(tǒng)計(jì)分析軟件對高速公路客貨車行程時(shí)間的時(shí)空分布規(guī)律進(jìn)行研究,提出客貨車行程時(shí)間分布的時(shí)空差異性,以高速公路MTC和ETC數(shù)據(jù)進(jìn)行融合[6],構(gòu)建客貨車不同的行程時(shí)間估計(jì)模型。最后,利用MATLAB對客貨車行程時(shí)間進(jìn)行正態(tài)分布和對數(shù)正態(tài)分布的分布擬合[7],并比較其置信區(qū)間。
我國高速公路采用封閉式收費(fèi)方式,在高速公路出入口均設(shè)置收費(fèi)站。早期按照車型和行駛里程收費(fèi),但隨著新形勢的變化,國家對現(xiàn)行多年的收費(fèi)政策做了重大改革和調(diào)整,改為按照計(jì)質(zhì)量收費(fèi)的方式進(jìn)行,即“標(biāo)準(zhǔn)車型、標(biāo)準(zhǔn)裝載、標(biāo)準(zhǔn)收費(fèi);標(biāo)準(zhǔn)車型、超額裝載、超額收費(fèi)”的原則實(shí)施,更加充分地體現(xiàn)了通行費(fèi)收取的公平性、合理性和科學(xué)性。收費(fèi)數(shù)據(jù)結(jié)構(gòu)如表1所示,在出入口客貨標(biāo)識中,0表示啟用計(jì)質(zhì)量收費(fèi)前未加區(qū)分的車輛,1表示客車,2表示貨車。
表1 收費(fèi)數(shù)據(jù)結(jié)構(gòu)
海量的數(shù)據(jù)蘊(yùn)含豐富的信息,但由于采集設(shè)備不穩(wěn)定、數(shù)據(jù)傳輸?shù)牟豢煽?、?shù)據(jù)存儲不合理等因素導(dǎo)致數(shù)據(jù)質(zhì)量亦不容樂觀。同時(shí),研究內(nèi)容的不同也會引起數(shù)據(jù)使用者所需數(shù)據(jù)結(jié)構(gòu)的不一致。因此,在分析數(shù)據(jù)前對數(shù)據(jù)進(jìn)行按需抽取、過濾篩選、數(shù)據(jù)修復(fù)等操作就顯得尤為重要。收費(fèi)數(shù)據(jù)預(yù)處理流程圖如圖1所示。
圖1 收費(fèi)數(shù)據(jù)預(yù)處理流程圖Fig.1 The preprocessing flow chart of toll data
本文對廣州某高速公路路段2015年12月15日客貨車行程時(shí)間分布進(jìn)行分析,采用四分位法進(jìn)行數(shù)據(jù)預(yù)處理,5 185條收費(fèi)數(shù)據(jù)中有271條數(shù)據(jù)不滿足要求,剩余4 914條數(shù)據(jù)。其中上下四分位點(diǎn)的差值B=M0.75-M0.25=134,數(shù)據(jù)篩選區(qū)間A=[M0.25-1.5B,M0.75+1.5B]=[58,594],客貨車篩選前后行程時(shí)間分布圖如圖2和圖3所示,可以看出客貨車行程時(shí)間存在時(shí)空差異性。
圖2 客貨車行程時(shí)間分布圖Fig.2 Travel time distribution for passenger car and freight car
圖3 四分位法處理后的客貨車行程時(shí)間分布圖Fig.3 Travel time distribution for passenger car and freight car processed by quartiles
對站間距離3.9 km的某兩個(gè)站間數(shù)據(jù)進(jìn)行四分位法篩選后的客貨車行程時(shí)間分布圖如圖3所示。從圖3中可以看出:
(ⅰ)在空間分布上,客車的行程時(shí)間普遍低于貨車的行程時(shí)間,具體來看00:00:00—06:00:00,客車的行程時(shí)間區(qū)間為2.5~4 min,貨車的行程時(shí)間區(qū)間為4~5.5 min;06:00:00—15:00:00,客車的行程時(shí)間區(qū)間為3.5~5.5 min,貨車的行程時(shí)間區(qū)間為4~7 min;15:00:00—19:00:00,客車的行程時(shí)間區(qū)間為5.5~7.5 min,貨車的行程時(shí)間區(qū)間為7~9.5 min;19:00:00—23:59:59,客車的行程時(shí)間區(qū)間為3~5 min,貨車的行程時(shí)間區(qū)間為4~7 min。
(ⅱ)在時(shí)間分布上,00:00:00—06:00:00,貨車的流量較大,因?yàn)樨涇囃ǔR归g行車;07:30:00—10:00:00,客貨車的行程時(shí)間均呈上升趨勢,早高峰出現(xiàn)在09:00:00—10:30:00;13:00:00—15:00:00客貨車的行程時(shí)間持續(xù)呈現(xiàn)上升的趨勢,在15:00:00—19:00:00行程時(shí)間趨于穩(wěn)定,迎來了晚高峰,在這段時(shí)間內(nèi),客車流量明顯多于貨車流量;19:00:00—23:59:59客貨車的流量較晚高峰明顯下降。
3.1 客貨車行程時(shí)間的求取
在求取兩收費(fèi)站間行程時(shí)間的過程中,會出現(xiàn)在統(tǒng)計(jì)周期內(nèi)沒有車輛經(jīng)過導(dǎo)致行程時(shí)間無法求取或車輛偏少[8]導(dǎo)致行程時(shí)間隨機(jī)性較大的情況,這些因素都會成為行程時(shí)間分布求取的障礙。鑒于此,本文提出進(jìn)行上下游遞推求取和直接按照所求收費(fèi)站間經(jīng)過車輛求取并舉,并在同一統(tǒng)計(jì)周期內(nèi)利用四分位法對行程時(shí)間進(jìn)行篩選,對滿足條件的行程時(shí)間進(jìn)行平均的方法對兩收費(fèi)站間的行程時(shí)間進(jìn)行推導(dǎo)。
駛?cè)牒婉傠x高速公路收費(fèi)站匝道的行程時(shí)間不同,故兩收費(fèi)站間的行程時(shí)間可表述為駛?cè)朐训赖男谐虝r(shí)間、主線行程時(shí)間、駛離匝道的行程時(shí)間3個(gè)部分組成,即:
對上游而言,推導(dǎo)公式如下:
假設(shè)在第k個(gè)統(tǒng)計(jì)周期中,收費(fèi)站上游滿足條件的收費(fèi)站有m個(gè),則:
(1)
同理,對下游而言,假設(shè)在第k個(gè)統(tǒng)計(jì)周期中,收費(fèi)站下游滿足條件的收費(fèi)站有n個(gè),則:
(2)
則廣義上,兩收費(fèi)站間行程時(shí)間可以表示為:
3.2 客貨行程時(shí)間的差異
駛?cè)胧召M(fèi)站時(shí),由于車輛在駛?cè)朐训罆r(shí)有起步加速階段和勻速階段,但起步加速階段時(shí)間ta很短,此處忽略不計(jì),將車輛近似看做勻速運(yùn)動,車速以該收費(fèi)站限制標(biāo)牌所示速度Vin(i)計(jì),Lin(i)為收費(fèi)站i的匝道長度,t表示客貨車類型,其中t=p代表客車,t=c代表貨車,即:
駛離收費(fèi)站時(shí),行程時(shí)間主要包括車輛正常行駛時(shí)間和人工收費(fèi)(MTC)排隊(duì)時(shí)間,由于ETC車道往往通行時(shí)間較少,客車的排隊(duì)延誤時(shí)間由MTC與ETC車道車輛的行程時(shí)間差彌補(bǔ),而貨車只有MTC數(shù)據(jù),則:
其中在第k個(gè)周期內(nèi),客車的TMTC(r,i)和TETC(r,i)應(yīng)符合:tk≤TMTC(r,i)≤tk+1且tk≤TETC(r,i)≤tk+1;且在不同的統(tǒng)計(jì)周期內(nèi),求取|TMTC-TETC|的分布以確定其上下閾值[9],對滿足條件的數(shù)據(jù)進(jìn)行MTC和ETC數(shù)據(jù)融合,對不滿足條件的利用閾值進(jìn)行修復(fù)即可。
以2015年12月15日廣州某高速公路連續(xù)9個(gè)收費(fèi)站的收費(fèi)數(shù)據(jù)為依據(jù),分別利用直接計(jì)算兩收費(fèi)站時(shí)間差和利用本文第3節(jié)中提到的模型計(jì)算相同2個(gè)收費(fèi)站的行程時(shí)間,以統(tǒng)計(jì)周期15 min求取客貨車行程時(shí)間分布,比較分布擬合的優(yōu)劣以及行程時(shí)間置信區(qū)間的大小。
利用SPSS直接求取的客車行程時(shí)間分布圖和利用模型求取的客車行程時(shí)間分布圖,如圖4和圖5所示。
利用MATLAB對直接求取的行程時(shí)間和利用模型求取行程時(shí)間進(jìn)行分布擬合,擬合結(jié)果比較如表2所示。從表2中可以看出:
①對客車的行程時(shí)間進(jìn)行分布擬合時(shí),正態(tài)分布的擬合[10]具有更小的SSE和RMSE(即誤差更小),以及更大的R-square[11](即正態(tài)分布擬合的相似度更高);
②在利用真實(shí)收費(fèi)數(shù)據(jù)確定了客車行程時(shí)間分布的前提下,對模型求取的方法和直接求取的方法進(jìn)行對比,結(jié)果表明:模型求取的結(jié)果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的結(jié)果擬合度更高。
對客車行程時(shí)間的置信區(qū)間進(jìn)行求取并比較,如表3所示。從置信區(qū)間可以看出:模型求取的區(qū)間長
圖4 直接求取的客車行程時(shí)間Fig.4 Travel time for passenger car calculated directly
圖5 模型求取的客車行程時(shí)間Fig.5 Travel time for passenger car calculated by model
擬合方法SSE直接求取模型求取RMSE直接求取模型求取R?square直接求取模型求取正態(tài)分布194.594.53.6013.240.5150.9006對數(shù)正態(tài)分布19698.873.6143.3140.51150.896
表3 客車置信區(qū)間表
度為165.12,直接求取的區(qū)間長度為178.68。模型求取相對于直接求取的置信區(qū)間更小,即模型求取的客車行程時(shí)間分布更穩(wěn)定。
正態(tài)分布的置信區(qū)間:
p=[μ-x1-α/2σ,μ+x1-α/2σ]。
查標(biāo)準(zhǔn)正態(tài)分布表可知:置信水平為95%,分位數(shù)x1-α/2為1.96。
利用SPSS直接求取的貨車行程時(shí)間分布圖和利用模型求取的客車行程時(shí)間分布圖如圖6和圖7所示。
利用MATLAB對直接求取的貨車行程時(shí)間和利用模型求取貨車行程時(shí)間進(jìn)行分布擬合,擬合結(jié)果比較如表4所示。從表4中可以看出:
①對貨車的行程時(shí)間進(jìn)行分布擬合時(shí),正態(tài)分布的擬合具有更小的SSE和RMSE(即誤差更小),以及更大的R-square(即正態(tài)分布擬合的相似度更高);
②對貨車直接求取法進(jìn)行對數(shù)正態(tài)分布擬合時(shí),出現(xiàn)R-square為負(fù)的情況,說明直接求取的貨車行程時(shí)間不適合使用對數(shù)正態(tài)分布擬合。
③在利用真實(shí)收費(fèi)數(shù)據(jù)確定了貨車行程時(shí)間分布的前提下,對模型求取的方法和直接求取的方法進(jìn)行對比,結(jié)果表明:模型求取的結(jié)果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的結(jié)果擬合度更高。
對貨車行程時(shí)間的置信區(qū)間進(jìn)行求取并比較,如表5所示,模型求取的區(qū)間長度為234.92,直接求取的區(qū)間長度為290.58。模型求取相對于直接求取的置信區(qū)間更小,即模型求取的貨車行程時(shí)間分布的置信區(qū)間更穩(wěn)定。
圖6 直接求取的貨車行程時(shí)間Fig.6 Travel time for freight car calculated directly
圖7 模型求取的客車行程時(shí)間Fig.7 Travel time for freight car calculated by model
擬合方法SSE直接求取模型求取RMSE直接求取模型求取R?square直接求取模型求取正態(tài)分布175.7094.824.4193.2460.55840.8470對數(shù)正態(tài)分布659.50102.108.5613.368-0.65720.8352
表5 貨車置信區(qū)間表
本文依托高速公路收費(fèi)數(shù)據(jù),分析客貨行程時(shí)間的時(shí)空差異性,分別構(gòu)建了基于收費(fèi)數(shù)據(jù)的高速公路客貨行程時(shí)間估計(jì)模型。本文第3節(jié)模型的提出主要針對在實(shí)際道路條件限制下無法通過實(shí)驗(yàn)直接求取路段行程時(shí)間的情況,對路段行程時(shí)間的估計(jì)。在本文第4節(jié)中,分別將客貨車直接求取的行程時(shí)間分布和模型求取的行程時(shí)間分布進(jìn)行分布擬合并比較其概率性分布區(qū)間。結(jié)果表明:利用真實(shí)車輛收費(fèi)數(shù)據(jù)對客貨車行程時(shí)間分布進(jìn)行擬合,在確定為正態(tài)分布的前提下,對客車的行程時(shí)間進(jìn)行分布擬合時(shí),利用本文模型求取正態(tài)分布擬合的優(yōu)越性R-square為0.900 6;對貨車的行程時(shí)間進(jìn)行分布擬合時(shí),利用本文模型求取正態(tài)分布也有較好的擬合效果,R-square為0.847 0。正態(tài)分布下的本文模型求取的客車置信區(qū)間長度為165.12; 貨車置信區(qū)間長度為234.92。從數(shù)據(jù)中可以看出正態(tài)分布下本文模型求取的客車行程時(shí)間分布相比貨車的行程時(shí)間分布具有更好的擬合效果以及更好的穩(wěn)定性。造成這種現(xiàn)象的原因可能是由于貨車數(shù)據(jù)過少,701條貨車收費(fèi)數(shù)據(jù)經(jīng)過四分位法篩選后的一天數(shù)據(jù)僅有675條,而客車篩選后的數(shù)據(jù)有4 234條。后續(xù)工作進(jìn)一步將車型考慮在內(nèi),研究不同車型行程時(shí)間分布的相似性和差異性,為行程時(shí)間分布的研究提供數(shù)據(jù)支撐。
[1] 常安德. 基于GPS浮動車的路段行程時(shí)間采集方法研究[D].長春:吉林大學(xué),2009.
[2] 劉克. 高速公路的路段行程時(shí)間估計(jì)與預(yù)測方法研究[D].北京:北京交通大學(xué),2013.
[3] AREZOUMANDI M. Estimation of travel time reliability for freeways using mean and standard deviation of travel time[J]. Journal of Transportation Systems Engineering and Information Technology, 2011, 11 (6):74-84. DOI:10.16097/j.cnki.1009-6744.2011.06.024.
[4] 朱彥,曹彥榮,杜道生.城市快速路行程時(shí)間的統(tǒng)計(jì)分析與預(yù)測[J].交通運(yùn)輸工程與信息學(xué)報(bào),2009,7(1):93-97,103.
[5] 王翔,陳小鴻,楊祥妹. 基于K最近鄰算法的高速公路短時(shí)行程時(shí)間預(yù)測[J]. 中國公路學(xué)報(bào),2015,28(1):102-111.
[6] 趙建東,王浩,劉文輝. 高速公路旅行時(shí)間的自適應(yīng)插值卡爾曼濾波預(yù)測[J]. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(2):109-115.
[7] 楊曉光,張汝華,儲浩,等. 基于高速公路收費(fèi)系統(tǒng)的交通信息采集與處理基本問題研究[J]. 系統(tǒng)工程,2004,22(11):4-11.
[8] 楊慶芳,馬明輝,梁士棟,等. 基于收費(fèi)數(shù)據(jù)的高速公路交通狀態(tài)判別方法[J]. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(12):51-57,76.
[9] 趙建東,王浩,劉文輝,等. 基于收費(fèi)數(shù)據(jù)的高速公路站間旅行時(shí)間預(yù)測[J]. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,41(12):1849-1854. DOI:10.3969/j.issn.0253-374x.2013.12.014.
[10] 胡尚瑜,丁九成,李秋勝. 基于Bootstrap方法的近地風(fēng)剖面參數(shù)分析[J]. 廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,40(4):856-861. DOI:10.13624/j.cnki.issn.1001-7445.2015.0856.
[11] 李長城,文濤,劉小明,等. 基于高速公路收費(fèi)數(shù)據(jù)的行程時(shí)間可靠性模型研究[J]. 公路交通科技,2014,31(12):110-115. DOI:10.3969/j.issn.1002-0268.2014.12.018.
(責(zé)任編輯 黃 勇)
Reliability Estimation Model of Freeway Travel Time Based on Toll Data
ZHANG Tengyue,WENG Xiaoxiong
(School of Civil Engineering and Transportation, South China University of Technology,Guangzhou Guangdong 510640, China)
Mass freeway toll data contain various traffic information and are readily available. This paper analyzes the difference of travel time distributions of freeway passenger car and freight car and constructs different reliability estimation models for them. Then the paper fit above data with normal and lognormal distributions using MATLAB. The result shows that it’s acceptable to analyze the distributional characteristics of travel time for passenger car and freight car with normal distribution. The SSE, RMSE, and R-square of travel time distribution are better by model method than those by direct method. Finally, the reliability interval of both types of cars are compared and the result shows that it is more stable with model method under the same probability.
freeway toll data; travel time; reliability estimation; normal distribution; lognormal distribution
10.16088/j.issn.1001-6600.2016.04.011
2016-04-21
國家自然科學(xué)基金資助項(xiàng)目(51308227);廣東省交通運(yùn)輸廳科技項(xiàng)目(科技-2015-02-076)
翁小雄(1958—),女,浙江杭州人,華南理工大學(xué)教授,博導(dǎo)。E-mail: ctxxweng@qq.com
U491
A
1001-6600(2016)04-0070-08