馬晨浩,宇仁德,胡婧暉,步玫
(山東理工大學(xué) 交通與車輛工程學(xué)院, 山東 淄博255049)
從交通運(yùn)輸部發(fā)布的《2019年交通運(yùn)輸行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)》獲悉,截至2019年年底,全國公路總里程達(dá)到501.25萬km,高速公路總里程達(dá)14.96萬km[1],高速擴(kuò)張的道路網(wǎng)絡(luò)使汽車出行方式成為首選,然而汽車事故的發(fā)生率和死亡人數(shù)依然居高不下。變道是駕駛員經(jīng)常執(zhí)行的機(jī)動(dòng)操作,由于汽車車速較快且變道過程中周圍環(huán)境復(fù)雜多變,因此發(fā)生事故的概率比較高。根據(jù)美國道路交通事故的統(tǒng)計(jì)數(shù)據(jù),在美國,汽車變道所引起的道路交通事故占警方報(bào)告的撞車事故的5%、死亡人數(shù)的0.5%[2]。如何在復(fù)雜的交通環(huán)境下高效準(zhǔn)確地預(yù)測汽車變道是否安全成為了一大難題,而其中越線時(shí)間的預(yù)測對(duì)于汽車變道安全至關(guān)重要。對(duì)越線時(shí)間的研究將為汽車變道安全問題提供一種新的思路和方法,也對(duì)輔助駕駛系統(tǒng)和無人駕駛系統(tǒng)的安全性預(yù)測有一定的參考價(jià)值。
近年來,對(duì)于汽車變道行為的研究主要在變道行為分析、變道影響因素、變道決策模型、變道執(zhí)行模型4個(gè)層面。伍淑莉等[3]基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長短時(shí)記憶網(wǎng)絡(luò)(LSTM)的理論研究,提出了一種基于LSTM 的智能車變道行為預(yù)測模型。張穎達(dá)[4]基于NGSIM軌跡數(shù)據(jù)建立多項(xiàng)式模型,選取多個(gè)誤差指標(biāo)對(duì)不同階數(shù)下變道橫向移動(dòng)軌跡擬合效果進(jìn)行評(píng)價(jià),并且分別利用時(shí)間對(duì)數(shù)模型和雙隱含層神經(jīng)網(wǎng)絡(luò)對(duì)變道時(shí)間進(jìn)行預(yù)測。王暢等[5]以Jula提出的換道安全性模型為基礎(chǔ),結(jié)合營運(yùn)客車的換道行為特征,通過分析換道進(jìn)程結(jié)束后客車需要與周圍車輛保持的安全距離,建立適合于營運(yùn)客車的換道安全性識(shí)別模型,并利用真實(shí)數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,并且從換道軌跡具有相似性的特點(diǎn)出發(fā),建立換道越線時(shí)間預(yù)測模型。王雪松等[6]基于上海自然駕駛實(shí)驗(yàn)采集的駕駛員行為以及車輛運(yùn)行數(shù)據(jù),對(duì)比分析不同類型道路上駕駛員的變道特征。Wang等[7]提出了一種基于隱馬爾可夫模型(HMM)的兩階段換道模型。Xu等[8]提出了一種基于V2X的駕駛員輔助系統(tǒng)(HM4LCP)的混合式車道變更預(yù)測模型。Wang等[9]提出了一種新的基于變道行為的客車變道安全識(shí)別模型。Chen等[10]提出了一種基于車輛軌跡數(shù)據(jù)集的公路車輛變道行為關(guān)鍵特征選擇和風(fēng)險(xiǎn)預(yù)測的研究框架。綜上所述,目前對(duì)于汽車變道越線時(shí)間的預(yù)測研究相對(duì)較少,忽視了變道越線時(shí)間對(duì)于變道安全的影響,因此對(duì)于汽車變道越線時(shí)間的預(yù)測研究有一定的意義。
NGSIM(next generation simulation即美國聯(lián)邦高速公路管理局啟動(dòng)的下一代交通仿真工程)數(shù)據(jù)是為交通微觀模擬研究和開發(fā)收集的比較詳細(xì)和準(zhǔn)確的現(xiàn)場數(shù)據(jù),能夠?yàn)槠囎兊佬袨榈难芯刻峁┍憷?。本文選取I-80路段車輛軌跡數(shù)據(jù)集為研究數(shù)據(jù),監(jiān)測區(qū)域示意圖如圖1所示,7臺(tái)同步數(shù)碼攝像機(jī)安裝在高速公路旁一棟30層樓的樓頂上(圖2),記錄了通過監(jiān)測區(qū)域的車輛。
圖1 I-80監(jiān)測區(qū)域示意圖
(a)安裝在樓頂?shù)臄?shù)字?jǐn)z像機(jī) (b)7臺(tái)攝像機(jī)各自的覆蓋區(qū)域
為了消除變道微觀特性對(duì)于后續(xù)研究的影響,首先將處于6、7、8號(hào)車道內(nèi)的數(shù)據(jù)剔除;因?yàn)楸疚倪x取汽車作為研究對(duì)象,所以將摩托車和貨車的數(shù)據(jù)剔除;另外,考慮到汽車車型的影響,僅以中型汽車為標(biāo)準(zhǔn)篩選汽車車長為3.6~4.9 m的數(shù)據(jù),上述步驟只需通過Excel即可完成。下一步利用Python編程按照車道發(fā)生變換的原則篩選出變道汽車的ID。因?yàn)槠嚸孔儞Q一次車道,程序輸出一次ID,且向右變道輸出為+1,向左變道輸出為-1,所以可篩選出向左且單次變道的汽車(同一輛車在不同時(shí)段發(fā)生變道只選擇一次)共435輛。
為了減弱采集到的原始數(shù)據(jù)中噪聲對(duì)于后續(xù)模型訓(xùn)練的影響,提高數(shù)據(jù)繪成曲線的光滑度,采用Matlab中的smooth函數(shù)(yy=smooth(y,method))對(duì)軌跡數(shù)據(jù)進(jìn)行平滑處理。通過對(duì)比smooth函數(shù)中各種方法的平滑效果,選擇移動(dòng)平均法moving處理汽車的橫向坐標(biāo)和速度數(shù)據(jù),選擇loess局部回歸法(加權(quán)線性最小二乘和一個(gè)二階多項(xiàng)式模型)處理汽車的加速度數(shù)據(jù),并根據(jù)汽車縱向間距與平滑后的橫向坐標(biāo)數(shù)據(jù)修正每一幀(0.1 s)的車頭時(shí)距。以40號(hào)車為例,橫向坐標(biāo)的平滑處理結(jié)果如圖3所示。
圖3 40號(hào)車橫向坐標(biāo)的平滑處理圖
本研究以汽車變道過程中橫向位置發(fā)生單向連續(xù)改變所需的時(shí)間作為變道持續(xù)時(shí)間。對(duì)于向左變道的汽車,在圖3中可直觀看到有幾段橫向坐標(biāo)連續(xù)減小的圖像,再根據(jù)車道線的位置可以很快判斷哪一段是所需的變道數(shù)據(jù)段。另外,通過觀察發(fā)現(xiàn),變道數(shù)據(jù)段是所有滿足條件的數(shù)據(jù)段中橫向坐標(biāo)變化最大的一段。根據(jù)以上原則進(jìn)行Matlab編程,提取每輛車變道數(shù)據(jù)的時(shí)間點(diǎn)。
以上述時(shí)間點(diǎn)為條件,將某輛車變道過程中的數(shù)據(jù)組提取出來,同時(shí)提取鄰近車輛的數(shù)據(jù),并進(jìn)行相應(yīng)的平滑處理,最終得到不同汽車的車組變道總數(shù)據(jù)。在每組車組變道總數(shù)據(jù)中按車道發(fā)生變換的時(shí)間點(diǎn),將每輛變道車的越線時(shí)間作為因變量,選擇符合條件的前99組進(jìn)行后續(xù)研究。
本研究將原車道橫向位移量X、汽車變道初始速度v、與原車道前車初始縱向間距ΔY0、與原車道前車初始速度差Δv0、與目標(biāo)車道后車初始縱向間距ΔY1、與目標(biāo)車道后車初始橫向間距ΔX1、與目標(biāo)車道后車初始速度差Δv1、與目標(biāo)車道前車初始縱向間距ΔY2、與目標(biāo)車道前車初始橫向間距ΔX2、與目標(biāo)車道前車初始速度差Δv2共10個(gè)自變量作為變道越線時(shí)間的潛在影響因素。統(tǒng)計(jì)所有車組變道總數(shù)據(jù)中以上10個(gè)自變量的值對(duì)應(yīng)1.4中相應(yīng)的越線時(shí)間。
本文嘗試分別利用多元線性回歸和多元非線性回歸的方法進(jìn)行擬合并比較,選出一個(gè)效果最佳的函數(shù)表達(dá)式。
由于自變量的個(gè)數(shù)比較多,因此選擇利用Spss軟件中逐步回歸的方法篩選自變量,其工作原理為:對(duì)自變量進(jìn)行逐個(gè)引入,每引入一個(gè)變量就對(duì)已經(jīng)引入的所有自變量進(jìn)行顯著性檢驗(yàn);當(dāng)之前引入的某個(gè)自變量不再顯著的時(shí)候就會(huì)對(duì)其進(jìn)行剔除,直至沒有任何一個(gè)自變量引入或者剔除時(shí)為止[11]。得到的多元線性模型為
T=0.432X+0.132Δv0-0.016ΔY2-
0.166Δv2+4.743,
(1)
輸出結(jié)果見表1—表3。
表1 模型系數(shù)表
表2 模型摘要
表3 模型方差分析表
從逐步回歸分析輸出的表2中可以看出,模型的精度為 0.567,說明模型的擬合效果較差。但從表3中可以看出,顯著性為0.000,小于假設(shè)的顯著性水平0.05,表明模型的線性關(guān)系仍顯著,模型具有實(shí)際意義。從表1的模型系數(shù)表中可以發(fā)現(xiàn),各個(gè)系數(shù)的顯著性值均小于0.05,表明自變量的系數(shù)均顯著大于0,從而模型仍可用于對(duì)變道越線時(shí)間的預(yù)測。
鑒于多元線性模型的擬合優(yōu)度較低,從物理學(xué)角度分析發(fā)現(xiàn),逐步回歸模型剔除的某些自變量實(shí)際上可能對(duì)變道越線時(shí)間的影響較大,導(dǎo)致模型在預(yù)測上出現(xiàn)較大的偏差。例如,汽車變道初始速度v從實(shí)際經(jīng)驗(yàn)上看對(duì)變道越線時(shí)間一定會(huì)產(chǎn)生較大的影響。為了對(duì)變道越線時(shí)間進(jìn)行更精確的預(yù)測,下面通過灰色關(guān)聯(lián)度分析判斷各個(gè)自變量對(duì)因變量的影響程度,找出影響程度最高的自變量。
3.1.1 自變量的無量綱化
為了排除自變量之間單位不同對(duì)機(jī)理模型描述客觀規(guī)律的影響,使用標(biāo)準(zhǔn)化方法將原始數(shù)據(jù)組標(biāo)準(zhǔn)化為均值為0、方差為1且接近于正態(tài)分布的數(shù)據(jù)組。標(biāo)準(zhǔn)化方法的公式如下:
Xi′(k)=(Xi(k)-u)/δ
(i=1,…,11;k=1,…,99),
(2)
式中:i為數(shù)據(jù)列的列數(shù)(1是因變量,2~11為自變量,下同);k為每組數(shù)據(jù)列中的數(shù)據(jù)個(gè)數(shù);Xi(k)為因變量和自變量數(shù)據(jù)列的各個(gè)原始數(shù)據(jù);u為此變量數(shù)據(jù)列的平均值;δ為此變量的標(biāo)準(zhǔn)差;Xi′(k)為標(biāo)準(zhǔn)化后對(duì)應(yīng)的數(shù)據(jù)[11]。
3.1.2 關(guān)聯(lián)度計(jì)算
將無量綱化后的越線時(shí)間數(shù)據(jù)列作為參考數(shù)據(jù)列,其余自變量的數(shù)據(jù)列分別作為比較數(shù)據(jù)列,利用下式計(jì)算參考數(shù)據(jù)列和各比較數(shù)據(jù)列曲線之間的差值大?。?/p>
Δi(k)=丨Xi′(k)-X1′(k)丨
(i=2,…,11;k=1,…,99)。
(3)
兩級(jí)最大差與最小差分別為:
Δ(max)= maximaxkΔi(k),
(4)
Δ(min)= miniminkΔi(k),
(5)
則可求得某車參考數(shù)據(jù)列與比較數(shù)據(jù)列之間的關(guān)聯(lián)系數(shù)為
γiy(k)=(Δ(min)+ρΔ(max))/
(Δi(k)+ρΔ((max))
(i=2,…,11;k=1,…,99),
(6)
式中ρ為分辨系數(shù),其意義在于避免Δi(k)過大而造成的數(shù)據(jù)失真,用來提高關(guān)聯(lián)系數(shù)之間的差異顯著性,ρ的取值范圍為 0~1,一般取ρ=0.5[11]。
為了對(duì)因變量和各自變量進(jìn)行整體比較,對(duì)每列自變量關(guān)聯(lián)系數(shù)值求平均值,得到參考數(shù)據(jù)列與比較數(shù)據(jù)列之間的關(guān)聯(lián)度。
3.1.3 關(guān)聯(lián)度排序
根據(jù)以上步驟進(jìn)行Matlab編程得到每個(gè)自變量與因變量之間的關(guān)聯(lián)度如下:
γ2y=0.725 7,γ3y=0.729 2,γ4y=0.772 8,
γ5y=0.786 9,γ6y=0.749 1,γ7y=0.728 9,
γ8y=0.662 3,γ9y=0.760 6,γ10y=0.752 2,
γ11y=0.765 4。
因此關(guān)聯(lián)度從高到低為:Δv0、ΔY0、Δv2、ΔY2、ΔX2、ΔY1、v、ΔX1、X。
在建立多元非線性模型之前,為了能夠篩選出具有相關(guān)關(guān)系的自變量,減少自變量的個(gè)數(shù),對(duì)10個(gè)自變量進(jìn)行相關(guān)性分析,然后對(duì)相關(guān)關(guān)系較強(qiáng)的自變量進(jìn)行兩兩之間的曲線擬合,判斷它們之間是否具有對(duì)應(yīng)關(guān)系;若有即可通過剔除其中一個(gè)自變量,精簡自變量個(gè)數(shù)[11]。
基于所要研究的自變量均為連續(xù)型變量,選擇Spss中的Pearson相關(guān)性分析方法,輸出的相關(guān)性表見表4(篇幅有限,只截取一部分)。
表4每行中上邊的數(shù)字代表相關(guān)性系數(shù),下邊的數(shù)字代表顯著性系數(shù)。從表4發(fā)現(xiàn),ΔY0、Δv0這兩個(gè)自變量與其他自變量的相關(guān)性系數(shù)均低于0.4,屬于低度線性相關(guān),因此將ΔY0和Δv0作為單獨(dú)自變量進(jìn)行非線性回歸。另外,有些兩兩因素之間本就存在一定的關(guān)系,例如X0是求解ΔX1時(shí)的條件,雖然它們顯著性和相關(guān)性都比較強(qiáng),但無需對(duì)它們進(jìn)行曲線擬合(如表中紫色部分)。按照表4,將對(duì)v、ΔY2等兩兩一組的自變量(如表中紅色部分)進(jìn)行曲線擬合。
表4 Pearson相關(guān)性分析表
本研究采用Matlab中的cftool工具箱來進(jìn)行曲線擬合。通過不斷擬合觀察每組自變量之間的函數(shù)關(guān)系可知,擬合優(yōu)度R2均在0.5左右,達(dá)不到曲線擬合的要求。綜合考慮自變量關(guān)聯(lián)度的大小,在對(duì)越線時(shí)間進(jìn)行擬合時(shí),應(yīng)該優(yōu)先考慮關(guān)聯(lián)度較高的自變量對(duì)越線時(shí)間的影響。
3.3.1 數(shù)據(jù)的處理和篩選
為降低極端數(shù)據(jù)對(duì)訓(xùn)練數(shù)據(jù)效果的影響,保證訓(xùn)練和測試數(shù)據(jù)的隨機(jī)性,將99組數(shù)據(jù)中越線時(shí)間、目標(biāo)車道變道時(shí)間、總變道時(shí)間過大或過小的9組數(shù)據(jù)刪除,再將剩余數(shù)據(jù)按訓(xùn)練數(shù)據(jù)∶測試數(shù)據(jù)=2∶1的比例劃分,其中測試數(shù)據(jù)選擇中間的30組數(shù)據(jù)。
3.3.2 確定回歸模型
Matlab中的beta=nlinfit(x,y,model,beta0)函數(shù)是進(jìn)行多元非線性回歸常用的函數(shù),其中:x為自變量,可以是多個(gè)自變量;y為因變量,只能有一個(gè);model是函數(shù)模型;beta0是模型系數(shù)的初值;beta是求得的模型系數(shù)。另外,對(duì)于model函數(shù)模型,直接使用內(nèi)聯(lián)函數(shù)model=inline(′y1′,′beta′,′x′)建立,y1是回歸模型的函數(shù)表達(dá)式。
由于沒有可供參考的回歸模型,只能根據(jù)典型的函數(shù)模型如冪函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)等不斷嘗試。10個(gè)自變量都與橫向距離、縱向距離、速度這3種指標(biāo)有關(guān),而且在保證擬合效果的情況下,自變量越少,模型的運(yùn)算速度也會(huì)越快;因此,先選擇上述3種指標(biāo)中關(guān)聯(lián)度最高的ΔY0、Δv0、ΔX2作為擬合所用的自變量。經(jīng)過反復(fù)嘗試,得到以下3種函數(shù)模型表達(dá)式可用于數(shù)據(jù)擬合:
%model1=inline(′beta(1)+beta(2).*
exp(beta(3)./x(:,1))+beta(4).*x(:,2)+
beta(5).*x(:,3)′,′beta′,′x′),
(7)
%model2=inline(′beta(1)+beta(2).*
x(:,1)+beta(3).*x(:,2)+beta(4).*x(:,3)+
beta(5).*x(:,1).*x(:,3)+beta(6).*x(:,2).*x(:,3)′,′beta′,′x′),
(8)
%model3=inline(′beta(1)+beta(2).*
exp(beta(3)./x(:,1))+beta(4).*exp(beta(5)./
x(:,2))+beta(6).*exp(beta(7)./x(:,3))′,
′beta′,′x′),
(9)
對(duì)于擬合的效果,采用擬合度指標(biāo)Rnew來表示,Rnew越接近1,表示擬合效果越好。Rnew的表達(dá)式如下:
(10)
式中:y1為擬合越線時(shí)間;y為真實(shí)越線時(shí)間。
求得利用上述3種模型擬合測試數(shù)據(jù)的Rnew值分別為0.938 2,0.932 2,0.934 4,擬合優(yōu)度值均接近1。但是通過計(jì)算每輛車越線時(shí)間擬合誤差(y1-y)的大小會(huì)發(fā)現(xiàn),這3種模型擬合30組測試數(shù)據(jù)的誤差在[-1,1]的均只在40%左右,在[-0.5,0.5]的更是低于30%。對(duì)于越線時(shí)間來說,擬合誤差在[-0.5,0.5]的擬合效果比較好,由于真實(shí)越線時(shí)間是從圖像中按照一定的規(guī)則提取出來的,所以在[-1,1]的擬合誤差也可以接受,而超出這一范圍的則會(huì)對(duì)汽車變道安全產(chǎn)生不利影響;因此,排除這3種模型并且重新采用自變量中關(guān)聯(lián)度最高的ΔY0、Δv0、ΔY2、ΔX2、Δv2來進(jìn)行擬合。同樣地,經(jīng)過反復(fù)嘗試和測試,得到擬合效果最好且擬合誤差較小的函數(shù)模型表達(dá)式為
y1=6.3829-0.00504.*x(:,1)+0.1355.*x(:,2)-
0.0052.*x(:,3)-0.2668.*x(:,4)-0.1048.*
x(:,5)-0.0082.*x(:,1).*x(:,4)。
(11)
越線時(shí)間真實(shí)值與擬合值對(duì)比圖如圖4所示,越線時(shí)間真實(shí)值與擬合值誤差如圖5所示。(圖5中兩條綠色虛線是y=0.5和y=-0.5)。
圖4 越線時(shí)間真實(shí)值與擬合值對(duì)比圖
圖5 越線時(shí)間真實(shí)值與擬合值誤差圖
利用此模型擬合測試數(shù)據(jù)的Rnew值為0.981 4,接近于1。從圖5中可以看出,30組測試數(shù)據(jù)的誤差在[-1,1]的達(dá)到25組,占比83%,且其中絕大部分處于[-0.5,0.5],在誤差為0處上下浮動(dòng),擬合效果符合要求。因此,該模型通過了驗(yàn)證,可用于對(duì)汽車變道越線時(shí)間的預(yù)測。
變道越線時(shí)間預(yù)測是汽車變道主動(dòng)安全技術(shù)的一大關(guān)鍵,本文利用多元非線性回歸的方法,構(gòu)建了一種越線時(shí)間預(yù)測模型,該模型能夠有效預(yù)測汽車變道越線時(shí)間,預(yù)測有效率達(dá)到83%。本研究仍有以下不足之處:越線時(shí)間是指定規(guī)則下提取出的,與實(shí)際相比會(huì)有誤差,影響后續(xù)擬合效果;未考慮到駕駛員以及車流量、路面狀態(tài)、天氣情況等因素對(duì)越線時(shí)間的影響,今后可以做進(jìn)一步的研究;此外,預(yù)測有效率有待進(jìn)一步提高,以提升模型的實(shí)用價(jià)值。