邵長橋, 郭 杰, 劉小明
(北京工業(yè)大學(xué)交通工程北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100124)
密度- 速度、密度- 流量、速度- 流量關(guān)系被稱為交通流基本模型,其在交通流理論研究和應(yīng)用中具有重要的作用. 一是可以通過建立交通流模型來刻畫交通流運(yùn)行規(guī)律,為交通預(yù)測和控制提供方法;二是可以根據(jù)交通流模型對交通流特征參數(shù)進(jìn)行估計(jì),例如應(yīng)用基本圖模型估計(jì)道路設(shè)施通行能力、臨界速度等[1],為交通規(guī)劃和運(yùn)行分析提供基礎(chǔ)參數(shù). 正是鑒于交通流基本模型的重要性,研究人員在交通流模型和模型參數(shù)標(biāo)定方面進(jìn)行了大量研究,不斷地尋求預(yù)測或估計(jì)精度更高的建模方法. 最早的交通流模型可以追溯到格林息爾治提出的線性密度- 速度模型[2]. 其后,研究人員提出了眾多交通流模型,并不斷用觀測數(shù)據(jù)對交通流模型進(jìn)行驗(yàn)證,以選擇出更好的模型[3-12]. 一方面,研究人員通過引入更多的參數(shù)來提高模型的靈活性和適用性,如Van Aerde等[10]在速度- 車頭間距(密度)模型中引入了4個參數(shù),Wang等[11]在密度- 速度曲線模型中引入了5個參數(shù). 另一方面,研究人員對單結(jié)構(gòu)模型提出了質(zhì)疑,認(rèn)為其不能同時刻畫非擁堵和擁堵狀態(tài)下交通流特性,并提出了分段的密度- 速度模型[13],如馬曉龍等[14]基于生長曲線原理建立了Logistic密度- 速度關(guān)系模型,并應(yīng)用實(shí)測數(shù)據(jù)對模型參數(shù)進(jìn)行了標(biāo)定.
然而,交通流模型對數(shù)據(jù)擬合不充分的原因不僅僅是模型選擇的問題,還與模型參數(shù)估計(jì)方法以及觀測數(shù)據(jù)特征有關(guān)[13-16]. Qu等[15]認(rèn)為用最小二乘方法來估計(jì)模型參數(shù)會忽視觀測數(shù)據(jù)“樣本”分布不均衡性對模型參數(shù)估計(jì)影響,提出了加權(quán)最小二乘估計(jì)方法,并進(jìn)一步指出了模型與數(shù)據(jù)擬合程度不理想不僅僅是模型問題,也與觀測數(shù)據(jù)分布和估計(jì)方法有關(guān). 張輝等[16]和林豪等[17]從提高模型對觀測數(shù)據(jù)擬合的角度,分別應(yīng)用k均值聚類最小二乘方法與層次聚類最小二乘法來提高模型估計(jì)精度,研究結(jié)果說明了模型對數(shù)據(jù)擬合程度不僅與模型有關(guān),還與參數(shù)估計(jì)方法有關(guān). Rakha等[18]考慮了流量、速度、密度3個基本變量的觀測誤差,提出了基于全變量偏差平方和最小的估計(jì)方法,但沒有給出最優(yōu)解的理論證明,并且該方法需要開發(fā)專用算法,不便于推廣和應(yīng)用. Shao等[19]綜合考慮了因變量和自變量的觀測誤差,對Van Aerde模型[10]進(jìn)行了修正,并給出了模型參數(shù)的極大似然估計(jì)方法,驗(yàn)證了新模型對觀測數(shù)據(jù)具有更高的擬合精度. Zhang等[20]在Qu等[15]的工作基礎(chǔ)上,提出了對樣本數(shù)據(jù)重構(gòu)的方法來克服觀測數(shù)據(jù)不均衡性對單段交通流模型參數(shù)估計(jì)的影響. Zhang等[21]同樣考慮速度、密度觀測數(shù)據(jù)的不均衡性對密度- 速度關(guān)系模型參數(shù)估計(jì)的影響,提出了應(yīng)用排序重構(gòu)樣本的方法對模型參數(shù)進(jìn)行了標(biāo)定. Neila等[22]考慮了擁堵和非擁堵狀態(tài)下交通數(shù)據(jù)的散布情況,提出了基于數(shù)據(jù)特征的交通流基本圖模型參數(shù)標(biāo)定方法.
通過文獻(xiàn)查閱發(fā)現(xiàn),已有的宏觀交通流模型以及參數(shù)估計(jì)更多地考慮了單一模型(即密度- 速度、密度- 流量和速度- 流量關(guān)系模型中的一個)的估計(jì)精度問題[15-20],僅有少數(shù)的文獻(xiàn)注意到三者之間的內(nèi)在關(guān)系對模型參數(shù)估計(jì)的影響[23-24],特別是其衍生模型估計(jì)和預(yù)測精度下降問題. Duncam[23]注意到了基于經(jīng)驗(yàn)的密度- 速度關(guān)系模型變換得到的速度- 流量模型存在擬合精度下降現(xiàn)象問題,但沒有給出解決方法. Castillo[24]在對密度- 速度模型參數(shù)標(biāo)定時,考慮了密度- 流量模型擬合優(yōu)度問題,但沒有對模型參數(shù)估計(jì)效果進(jìn)行論證;沒有考慮速度、流量的量綱對模型參數(shù)估計(jì)的影響. 正是鑒于上述問題,本文假定速度、流量、密度中一個變量為自變量,另兩個變量為因變量,提出了聯(lián)合模型參數(shù)估計(jì)方法,構(gòu)造了優(yōu)化目標(biāo)函數(shù),并基于Castillo-Benítez、Van Aerde模型和實(shí)測數(shù)據(jù)驗(yàn)證了聯(lián)合模型參數(shù)估計(jì)方法可提高模型對實(shí)測數(shù)據(jù)的擬合精度.
為了刻畫交通流動態(tài)特性,Lighthill、Whitham和Richards根據(jù)流體力學(xué)理論和流量守恒定律提出了著名的LWR模型[25-26].
(1)
并且滿足基本關(guān)系式
q=k·v
(2)
式中:q為流量,輛/h;k為密度,輛/km;v為區(qū)間平均速度.
研究表明,連續(xù)流設(shè)施的交通流存在平衡狀態(tài)[9],其速度- 密度關(guān)系可以用連續(xù)函數(shù)[2-11]表示
v=f(k,β)
(3)
式中:f(k,β)為密度函數(shù);β為模型參數(shù)(或參數(shù)向量).由式(2)(3)可以得到密度- 流量關(guān)系式
q=f1(k,β)
(4)
式中f1(k,β)=k·f(k,β).在實(shí)際應(yīng)用中,往往會出現(xiàn)這樣的問題:由觀測數(shù)據(jù)(ki,vi)(i=1,2,…,n)估計(jì)理論模型(3)中參數(shù)β(其估計(jì)用表示),把代入模型(4)可得到的經(jīng)驗(yàn)?zāi)P蛁=f1(k,),但q=f1(k,)對實(shí)測數(shù)據(jù)擬合程度較低.其主要原因是是基于速度- 密度(v-k)關(guān)系模型估計(jì)的,并沒有考慮密度- 流量(q-k)關(guān)系.
由式(3)可得到速度- 密度關(guān)系模型:k=f-1(v,β)(f-1(·)為f(·)的逆函數(shù)),把其代入式(2)則可得到記q=v·f-1(v,β).記f2(v,β)=v·f-1(v,β),則速度- 流量(q-v)模型可表示為
q=f2(v,β)
(5)
傳統(tǒng)的交通流模型參數(shù)標(biāo)定主要是采用最小二乘法(包括非線性最小二乘法),優(yōu)化目標(biāo)為因變量觀測數(shù)值與其估計(jì)值的總偏差平方和最小.為了敘述的方便,本文先介紹單一模型優(yōu)化目標(biāo)函數(shù),然后再給出聯(lián)合模型優(yōu)化目標(biāo)函數(shù)的構(gòu)造方法.
單一模型參數(shù)優(yōu)化目標(biāo)函數(shù)法就是選擇式(3)(4)或式(5)中的一個模型對參數(shù)標(biāo)定,然后應(yīng)用q=k·v求出另外1個或2個關(guān)聯(lián)模型.根據(jù)自變量和因變量的選擇,可分為以下3種情形.
1) 流量總偏差平方和最小
一般用于速度- 流量或密度- 流量宏觀模型參數(shù)估計(jì).模型假設(shè)速度v或密度k為自變量,交通流量q為因變量,其優(yōu)化目標(biāo)和約束條件為
(6)
s.t.qi=f1(ki,β),i=1,2,…,n
(7a)
或
s.t.qi=f2(vi,β),i=1,2,…,n
(7b)
式中:qi、i分別為流量的第i觀測值與估計(jì)值;ki為密度的第i觀測值;vi為速度的第i觀測值;f1(·)、f2(·)分別為密度- 流量函數(shù)、速度- 流量函數(shù);β為模型參數(shù).應(yīng)用式(6)作為優(yōu)化目標(biāo),其假設(shè)誤差主要來自于因變量q,而自變量v或k是可精確測量或測量誤差是可忽略的.
2) 速度總偏差平方和最小
一般用于流量- 速度或密度- 速度宏觀模型參數(shù)估計(jì).模型假設(shè)k或q為自變量,v為因變量,基于最小二乘法的參數(shù)估計(jì)優(yōu)化目標(biāo)函數(shù)和約束條件為
(8)
s.t.vi=f(ki,β),i=1,2,…,n
(9a)
或者
(9b)
式中:vi、i分別為速度的第i觀測值與估計(jì)值;f(·)、f2(·)分別為密度- 速度函數(shù)、速度- 流量函數(shù);β為模型參數(shù).
同樣,應(yīng)用式(8)作為優(yōu)化目標(biāo),則只考慮了因變量v的觀測誤差,而忽略了自變量k或q的觀測誤差.
3) 密度(車頭間距)總偏差平方和最小
該方法常用于標(biāo)定基于跟馳理論導(dǎo)出的速度- 密度關(guān)系模型[19],其假設(shè)密度(或車頭間距)為因變量,速度為自變量.優(yōu)化目標(biāo)函數(shù)和約束條件為
(10)
s.t.ki=f-1(vi,β),i=1,2,…,n
(11a)
或
(11b)
式中ki、i分別為密度的第i觀測值與估計(jì)值.
單一模型參數(shù)優(yōu)化方法的特點(diǎn)是模型中只有一個自變量和一個因變量,并假設(shè)誤差主要是來自于因變量.其優(yōu)點(diǎn)是模型參數(shù)標(biāo)定方法相對簡單,其不足是參數(shù)估計(jì)過程忽略了變量之間關(guān)聯(lián)性,沒有考慮衍生模型或變換模型的估計(jì)精度[24].
針對單一模型參數(shù)優(yōu)化方法存在的不足,可考慮聯(lián)合模型參數(shù)優(yōu)化方法.例如,文獻(xiàn)[26]假定速度v、流量q是密度k的函數(shù):v=f(k,β),q=k·f(k,β),建議對k-v模型v=f(k,β)進(jìn)行參數(shù)估計(jì)時,同時考慮k-q模型q=k·f(k,β)的估計(jì)精度.根據(jù)速度、流量、密度三者關(guān)系以及模型參數(shù)估計(jì)需要,構(gòu)建聯(lián)合模型參數(shù)優(yōu)化目標(biāo)函數(shù)
(12a)
s.t.vi=f(ki,β),i=1,2,…,n
qi=f1(ki,β)
或
(12b)
s.t.vi=f(ki,β),i=1,2,…,n
qi=f1(ki,β)
或
(12c)
或
(12d)
式(12a)和式(12b)是把密度作為自變量,流量和速度作為因變量,采用了2個因變量總的偏差和作為優(yōu)化目標(biāo);式(12c)和式(12d)采用了2個因變量總的偏差和的幾何平均值為優(yōu)化目標(biāo),在后文中會發(fā)現(xiàn),可利用式(2)對式(12a)和式(12b)進(jìn)一步化簡.式(12a)和式(12c)沒有考慮不同變量量綱的影響,式(12b)和式(12d)考慮了數(shù)據(jù)量綱的影響.同樣,以速度作為自變量,流量和密度作為因變量來構(gòu)造聯(lián)合模型參數(shù)優(yōu)化目標(biāo)函數(shù).
注意到qi=kivi和i=kii,式(12d)可進(jìn)一步表示為
(13)
從上面給出的優(yōu)化目標(biāo)函數(shù)可發(fā)現(xiàn),式(6)~(10)是以單個交通流變量估計(jì)精度作為模型參數(shù)估計(jì)準(zhǔn)則,沒有考慮密度、速度、流量3個變量之間的相關(guān)性;式(12a)~(12d)以2個交通流變量估計(jì)精度作為模型估計(jì)準(zhǔn)則,考慮了流量、速度、密度三者之間的關(guān)聯(lián)性.特別地,優(yōu)化目標(biāo)函數(shù)式(12d)可以結(jié)合加權(quán)最小二乘方法對模型參數(shù)進(jìn)行估計(jì).
同樣的方法可以以速度為自變量,流量和密度為自變量構(gòu)造優(yōu)化目標(biāo)函數(shù),其將在案例分析中介紹.
本研究以Castillo-Benítez模型[9]和Van Aerde模型[10]參數(shù)標(biāo)定為例來說明單一模型、聯(lián)合模型參數(shù)優(yōu)化方法對模型估計(jì)精度的影響.Castillo-Benítez模型首次引入了阻塞波波速來刻畫擁堵對交通流的影響而受到關(guān)注[9],Van Aerde模型概括了Greenshields模型和Pipes模型的優(yōu)點(diǎn),并適用于刻畫不同的交通設(shè)施的交通特性[27].
Castillo-Benítez密度- 速度模型[9]為
(14)
式中:vf為自由流速度,km/h;kj為阻塞密度,輛/km;wj為阻塞波波速,km/h.根據(jù)模型式(14)的特點(diǎn),采用聯(lián)合模型參數(shù)優(yōu)化目標(biāo)函數(shù)
(15a)
s.t.qi=kii,i=1,2,…,n
正如前所敘述,式(15a)可進(jìn)一步表示為
(15b)
(15c)
Van Aerde模型[10]為
(16)
(17a)
s.t.i=ivi,i=1,2,…,n
(17b)
(17c)
根據(jù)上邊的論述,模型(14)與模型(16)的優(yōu)化目標(biāo)函數(shù)分別為式(15c)和式(17c),可以采用模型變換的方式,將問題轉(zhuǎn)化為非線性最小二乘估計(jì)問題.
在回歸分析理論中,常用判定系數(shù)R2來度量模型對觀測數(shù)據(jù)的擬合程度,R2值越大,說明模型對觀測數(shù)據(jù)擬合程度越好.為了說明聯(lián)合優(yōu)化函數(shù)式(15a)和式(17a)或式(15b)與式(17b)對模型擬合效果的影響,本研究應(yīng)用加權(quán)判定系數(shù)度量模型擬合優(yōu)度,定義加權(quán)判定系數(shù)為
(18)
(19)
(20)
式中:vi、i分別為速度觀測值和估計(jì)值,km/h;qi、i分別為流量觀測值和估計(jì)值,輛為實(shí)測速度均值,為實(shí)測流量數(shù)據(jù)的均值,輛/h.
判定系數(shù)度量了模型對觀測數(shù)據(jù)的擬合程度.為了進(jìn)一步量化模型估計(jì)精度,并考慮到交通流觀測數(shù)據(jù)的隨機(jī)性,本文同時應(yīng)用平均相對誤差(mean absolute percentage error,MAPE)和平方根誤差(root mean squared error,RMSE)來度量觀測值和估計(jì)值差異[28],式(21)、式(22)分別給出了流量估計(jì)的平均相對誤差估計(jì)和平方根誤差計(jì)算公式.
(21)
(22)
同樣,可以給出速度、密度估計(jì)的平均絕對百分比誤差和平方根誤差.平均絕對百分比誤差越小,說明模型對變量估計(jì)精度越高.
為了比較單一模型和聯(lián)合模型參數(shù)優(yōu)化方法對交通流宏觀模型參數(shù)估計(jì)的影響,分別應(yīng)用實(shí)測數(shù)據(jù)對Castillo-Benítez和Van Aerde模型進(jìn)行參數(shù)估計(jì).所用數(shù)據(jù)由北京市交通管理局提供,其為北京市西二環(huán)路官員橋附近主路微波檢測數(shù)據(jù).數(shù)據(jù)采集時間為2017年11月13—15日,數(shù)據(jù)采集間隔為2 min.應(yīng)用SAS軟件[29]中的非線性回歸分析模塊中的Levenberg-Marquart方法對模型參數(shù)進(jìn)行了估計(jì),為了說明聯(lián)合模型估計(jì)效果,同時也給出了單一模型參數(shù)估計(jì)結(jié)果.表1、2分別是2個模型采用單一模型、聯(lián)合模型參數(shù)優(yōu)化方法給出的模型參數(shù)估計(jì)結(jié)果.
表1 Castillo-Benítez模型參數(shù)估計(jì)結(jié)果比較
2) 對于Castillo-Benítez模型而言,單一模型優(yōu)化結(jié)果對應(yīng)的速度估計(jì)與流量估計(jì)MAPE分別為19.8%和18.7%,速度和流量估計(jì)的RMSE分別為6.7 km/h和181.0輛/h;相應(yīng)的聯(lián)合模型優(yōu)化計(jì)算的速度和流量估計(jì)MAPE為10.0%和10.0%,速度和流量估計(jì)的RMSE分別為7.3 km/h和167.3 輛/h.因此,對于Castillo-Benítez模型而言,聯(lián)合估計(jì)在一定程度上犧牲了原來單一模型給出的速度估計(jì)精度,但提高了流量估計(jì)精度,速度的RMSE從6.7 km/h提高為7.3 km/h,流量RMSE從181.0 輛/h減少到167.3 輛/h.
表2 Van Aerde模型參數(shù)估計(jì)結(jié)果比較
3) 圖1給出了基于標(biāo)定的Castillo-Benítez模型估計(jì)的交通流參數(shù)與實(shí)測數(shù)值散點(diǎn)圖.其中,圖1(a)和圖1(b)是基于單一優(yōu)化模型估計(jì)得到的速度和流量估計(jì)值與實(shí)測數(shù)值散點(diǎn)圖,可以發(fā)現(xiàn)估計(jì)值與實(shí)測值擬合程度并不理想;圖1(c)和圖1(d)分別是應(yīng)用聯(lián)合模型計(jì)算的速度和流量估計(jì)值與實(shí)測數(shù)值散點(diǎn)圖;圖1(e)和圖1(f)分別是應(yīng)用單一模型與聯(lián)合模型計(jì)算的密度- 速度、密度- 流量估計(jì)值與實(shí)測數(shù)值對比散點(diǎn)圖.由圖1可以發(fā)現(xiàn),相對于單一優(yōu)化模型估計(jì)而言,聯(lián)合模型優(yōu)化方法得到的估計(jì)值與實(shí)測值擬合程度改善明顯,特別是對于高密度交通狀態(tài)下,聯(lián)合估計(jì)結(jié)果與實(shí)測數(shù)據(jù)更接近.
圖1 基于Castillo-Benítez模型的變量估計(jì)值和實(shí)測值散點(diǎn)圖Fig.1 Plots of field data and estimated value from Castillo-Benítez model
5) 對于Van Aerde模型而言,單一模型優(yōu)化法計(jì)算的密度和流量MAPE分別為16.4%和16.3%,密度和流量估計(jì)的RMSE分別為9.0輛/h 和 684.0輛/h;聯(lián)合模型優(yōu)化法計(jì)算MAPE值為14.2%和14.2%,密度和流量估計(jì)的RMSE數(shù)值分別為9.7 輛/km和387.5 輛/h.因此,對于Van Aerde模型而言,聯(lián)合估計(jì)在一定程度上“犧牲”了原來單一模型給出的密度估計(jì)精度,密度RMSE從9.0 輛/km提高為9.7 輛/km,但提高了流量估計(jì)精度,流量RMSE從684.0 輛/h減少到387.5 輛/h.
6) 圖2給出了基于標(biāo)定的Van Aerde模型估計(jì)的交通流參數(shù)與實(shí)測數(shù)值散點(diǎn)圖.其中,圖2(a)和圖2(b)分別為單一模型優(yōu)化法估計(jì)的密度和流量值與實(shí)測值散點(diǎn)圖,圖2(c)和圖2(d)分別為聯(lián)合模型優(yōu)化法估計(jì)的密度和流量值與實(shí)測數(shù)值散點(diǎn)圖,圖2(e)和圖2(f)分別是應(yīng)用單一模型與聯(lián)合模型計(jì)算的速度- 密度、速度- 流量估計(jì)值與實(shí)測數(shù)值對比散點(diǎn)圖.由圖2可知,相對于單一模型而言,聯(lián)合模型參數(shù)估計(jì)值與實(shí)測值擬合程度稍有改善,但與Castillo-Benítez模型估計(jì)結(jié)果不同的是,對于非擁堵狀態(tài)下,聯(lián)合模型估計(jì)結(jié)果與實(shí)測數(shù)據(jù)更接近.
圖2 基于Van Aerde模型的變量估計(jì)值和實(shí)測值散點(diǎn)圖Fig.2 Plots of field data and estimated value from Van Aerde model
從以上結(jié)果可以發(fā)現(xiàn),對Castillo-Benítez模型而言,聯(lián)合模型參數(shù)估計(jì)方法顯著提高了流量的估計(jì)精度;對于Van Aerde模型而言,模型精度有所提高,參數(shù)估計(jì)誤差有所改善.
1) 從聯(lián)合模型估計(jì)精度角度,提出了交通流基本模型聯(lián)合模型參數(shù)估計(jì)方法.
2) 研究結(jié)果表明,估計(jì)聯(lián)合模型參數(shù)估計(jì)方法在一定程度上“犧牲”單一變量估計(jì)精度的基礎(chǔ)上,但提高了模型整體的估計(jì)精度.
3) 從實(shí)測數(shù)據(jù)驗(yàn)證結(jié)果來看,模型估計(jì)精度的提高與模型選擇有關(guān),這也說明了模型選擇和參數(shù)估計(jì)方法影響了模型對實(shí)測數(shù)據(jù)擬合精度.
4) 聯(lián)合模型估計(jì)效果評價指標(biāo)還需要進(jìn)一步研究.本研究只討論了給定的交通流模型以及目標(biāo)函數(shù)形式下模型估計(jì)效果,沒有討論其他交通流模型以及目標(biāo)函數(shù),以后的研究中可進(jìn)一步考慮優(yōu)化目標(biāo)、參數(shù)估計(jì)方法對交通流模型參數(shù)估計(jì)精度的影響.