楊 達 ,楊 果 ,羅 旭 ,唐顏東 ,3,徐利華 ,蒲 云
(1. 西南交通大學(xué)交通運輸與物流學(xué)院, 四川 成都 610031;2. 公安部交通管理科學(xué)研究所, 江蘇 無錫 214151;3. 四川智慧高速科技有限公司, 四川 成都610041)
行為決策是智能網(wǎng)聯(lián)汽車實現(xiàn)自動控制的重要組成[1-6],也是該領(lǐng)域的研究熱點. 車輛通過信號交叉口時,其行為會受到信號燈和周圍車輛的影響,如果不能準(zhǔn)確預(yù)判通行條件,得到的決策結(jié)果會導(dǎo)致通行效率低、闖紅燈甚至引發(fā)交通事故.
目前,智能網(wǎng)聯(lián)汽車領(lǐng)域有關(guān)車輛通過信號交叉口的研究,主要關(guān)注簡單交通環(huán)境下的輔助駕駛速度規(guī)劃,研究目的大多為降低排放和燃油消耗[7-12],或者提高通行效率[13-16],涉及到的車輛行為是一些基本規(guī)則. 在行為決策層面,現(xiàn)有的智能網(wǎng)聯(lián)汽車將一般道路場景的決策方法應(yīng)用到信號交叉口,也有少部分學(xué)者專門研究在信號交叉口這種特殊復(fù)雜場景下的行為決策,只考慮信號燈影響時,Park等[17]根據(jù)信號、車速、交叉口大小和車輛與停車線的距離構(gòu)建了簡單的停止/通過決策算法;Zhou等[18]提出了基于強化學(xué)習(xí)的跟馳模型來獲取合適的駕駛行為;Liu等[19]基于行駛規(guī)則,在各種轉(zhuǎn)向條件下構(gòu)建了不同信號燈色時的決策流程圖;蘇沖等[20]將動作序列劃分為不同的行為狀態(tài),建立了各種工況下的狀態(tài)遷移圖. 考慮周圍車輛影響時,學(xué)者們主要解決各方向車輛之間的沖突,在機器學(xué)習(xí)、運籌優(yōu)化等方面進行探索,Gadepally等[21]利用隱馬爾可夫模型從連續(xù)的濾波中觀測中估計駕駛員行為,為行為決策提供有效依據(jù);Beaucorps等[22]根據(jù)人類駕駛員的錄音數(shù)據(jù)建立有其他車輛存在場景下的無信號交叉口和環(huán)形路決策算法;杜明博[23]提出基于有限狀態(tài)機的駕駛場景轉(zhuǎn)換模型,構(gòu)建基于ID3決策樹的駕駛行為決策模型;de Campos等[24]量化每輛車為避免潛在碰撞而配置的自由度,用成本函數(shù)和局部約束條件解決車輛之間的協(xié)調(diào)問題;Alonso等[25]根據(jù)靠近交叉口車輛的狀態(tài)信息構(gòu)建車輛優(yōu)先通行圖結(jié)構(gòu),以此來解決不同方向車輛之間的沖突;宋威龍等[26]設(shè)計了基于模糊邏輯的駕駛員類型判別模型,根據(jù)其他車輛的行駛意圖和駕駛員激進程度建立了決策規(guī)則;Makarem等[27]提出了一種分散式模型預(yù)測控制方法,對具有預(yù)定路徑的車輛引入線性二次最優(yōu)控制器,加入線性約束來避免碰撞.
從以上回顧可以發(fā)現(xiàn),無論是否在車聯(lián)網(wǎng)環(huán)境下,現(xiàn)有智能車輛在信號交叉口的控制研究主要集中在速度控制層面,在行為決策層面只有很少的研究,鮮有對通行決策策略的研究,考慮的行駛環(huán)境也非常單一,沒有把周圍車輛的干擾納入考慮范圍,特別是前車對智能網(wǎng)聯(lián)汽車的行駛空間有顯著影響[28-29]. 如果不考慮前車狀態(tài),只考慮自身狀態(tài)和信號燈,會使車輛在判斷通過/不通過問題上有局限性,容易產(chǎn)生兩難區(qū). 鑒于此,本文關(guān)注的是車聯(lián)網(wǎng)環(huán)境下智能網(wǎng)聯(lián)汽車在信號交叉口的行為決策問題,為了讓車輛準(zhǔn)確控制運動,從微觀交通流的本質(zhì)出發(fā),基于信號時間信息,利用Gipps跟馳理論預(yù)測前方車輛的狀態(tài)和判斷自身通過條件,同時加入換道行為來尋求更優(yōu)的決策結(jié)果,從而構(gòu)建一種智能網(wǎng)聯(lián)汽車直行通過信號交叉口的決策模型.
當(dāng)前車路協(xié)同技術(shù)還未成熟,本文研究的交通環(huán)境是非協(xié)同控制的車聯(lián)網(wǎng)環(huán)境,通過交叉口的智能網(wǎng)聯(lián)主車輛SV (subject vehicle)只能通過車聯(lián)網(wǎng)獲取信號信息和其他車輛的位置、速度等,并根據(jù)信號燈色和時間、前車行駛意圖做出相應(yīng)的決策. 考慮一般情況,將信號燈情況分為綠燈(倒計時未出現(xiàn))、黃燈、紅燈、綠燈倒計時,只要車輛在可識別到信號燈范圍內(nèi),就啟動決策;當(dāng)識別到的是紅燈或黃燈,則做出停車的決策;當(dāng)識別到的是綠燈(倒計時未出現(xiàn)),則繼續(xù)按照跟馳狀態(tài)行駛;當(dāng)識別到的是綠燈倒計時,則識別自身在當(dāng)前車道是領(lǐng)頭車還是跟隨車,并結(jié)合前車行駛意圖判斷能否在綠燈結(jié)束前通過停止線,若不能通過,則根據(jù)換道時間模型判斷換道后能否通過,再做出相應(yīng)的決策. 車輛的行為決策流程如圖1所示.
圖1 信號交叉口行為決策流程Fig. 1 Behavior decision process at signalized intersection
預(yù)測前方車輛未來的狀態(tài),本質(zhì)就是判斷車輛是否能夠在綠燈倒計時間內(nèi)通過停止線,這取決于車輛在倒計時間內(nèi)走過的距離和倒計時間結(jié)束時的位置. 在交叉口,車輛為了追求高效行駛,都保持在跟馳狀態(tài),本文采用Gipps跟馳模型[30]來表征前后車行駛狀態(tài)的相互影響.
1.2.1 Gipps跟馳模型
Gipps跟馳模型屬于安全距離模型,其基本思想是尋找一個特定的跟馳距離,當(dāng)前車緊急剎車時,如果后車與前車的跟馳距離小于該特定距離,就有可能發(fā)生碰撞. 在交叉口,根據(jù)為避免與其前車(車輛n-1)發(fā)生追尾所需保證的安全距離,可以得到跟馳車(車輛n)行駛的安全速度,如式(1).
式中:T為車輛n的反應(yīng)時間;bn為車輛n的最大制動減速度;sn車輛n的效用尺寸,其值等于車身長度;vn(t)為車輛n的速度;xn(t)為車輛n沿行駛方向的位置;t為時間.
Gipps跟馳模型根據(jù)運動學(xué)推導(dǎo),具有明確的物理意義,能較好地體現(xiàn)出行駛速度因素在跟馳過程中的影響,可以真實地模擬車輛之間的跟隨行為,在交通仿真中有著廣泛應(yīng)用,如英國交通部的SISTM模型、美國的CARSIM模型等,是交通流理論的核心內(nèi)容之一.
1.2.2 車輛狀態(tài)預(yù)測
以反應(yīng)時間作為車輛決策間隔,領(lǐng)頭車是位置最靠近交叉口停止線的車輛,將領(lǐng)頭車編號為PV1,其行為不受其他車輛的影響. 通過Gipps跟馳模型,可以計算出跟馳車輛在反應(yīng)時間后的速度,再結(jié)合初始的速度和位置可以得到車輛在反應(yīng)時間后的位置. 求得領(lǐng)頭車經(jīng)過每個反應(yīng)時間后的速度和位置后,則可以通過遞推方法依次求得其后的所有跟隨車輛在每個反應(yīng)時間后的速度和位置.
按照與交叉口距離從小到大的順序?qū)λ熊囕v進行編號,依次為PV1,PV2, ···,PVn, 用vP,1,vP,2, ···,vP,n分別表示其速度,xP,1,xP,2, ···,xP,n分別表示其沿行駛方向的位置. 設(shè)所有車輛在初始時刻t0的位置為xP,1(t0),xP,2(t0), ···,xP,n(t0),速 度 為vP,1(t0),vP,2(t0), ···,vP,n(t0),從初始時刻開始的第k(k= 1, 2, ···)個反應(yīng)時間后的車輛狀態(tài)如下:
1) 當(dāng)n= 1時,
2) 當(dāng)n> 1時,
車輛SV通過車聯(lián)網(wǎng)獲取到信號燈信息后,首先需要判斷能否在當(dāng)前車道通過交叉口,根據(jù)其前方是否有車輛,可將SV分為領(lǐng)頭車和跟隨車.
1.3.1 SV為領(lǐng)頭車
當(dāng)SV為領(lǐng)頭車,其行駛行為不受其他車輛的影響,設(shè)SV在當(dāng)前位置為xP,S(t0),速度為vP,S(t0),可以計算出SV先勻加速行駛,后勻速行駛到綠燈結(jié)束時刻的位置:
式中:等號右邊第2項為車輛SV勻加速行駛的距離;第3項為按最大限速值勻速行駛的距離;tg(t0)為當(dāng)前綠燈剩余時長;vlim為道路最大限速值;amax為車輛的最大舒適加速度.
設(shè)xstop為停止線位置,可得到車輛SV在綠燈結(jié)束時刻與停止線的位置差為
1.3.2 SV為跟隨車
當(dāng)SV為跟隨車,其行為決策結(jié)果受到前方車輛行為的影響,假設(shè)SV在未來按照Gipps跟馳模型行駛,那么可以用該模型描述其行駛狀態(tài)并進行預(yù)測. 車輛SV每隔一個反應(yīng)時間進行一次決策,可以得到車輛走完剩余綠燈時間需要進行h次決策,如式(6).
根據(jù)式(2)和式(3),可以得到當(dāng)前車道中車輛SV之前的每輛車在綠燈信號結(jié)束時刻的位置為xP,n(t0+hT),車輛SV在綠燈信號結(jié)束時刻的位置為xP,S(t0+hT),如圖2 (圖中x、y分別為車輛的縱向、橫向位置),根據(jù)車輛位置和交叉口停止線位置,可以判斷每輛車是否能夠在綠燈結(jié)束時通過停止線.
圖2 車輛位置Fig. 2 Position of vehicles
式中:ΔxP,n為第n輛車在綠燈結(jié)束時刻與停止線的位置差.
SV在綠燈結(jié)束時刻與停止線的位置差 ΔxP,S也可由式(7)計算得出. 根據(jù)SV為領(lǐng)頭車和跟隨車的兩種情況分別判斷,若 ΔxP,S>0,則SV在綠燈結(jié)束時刻不能通過停止線;如果 ΔxP,S≤0,則SV在綠燈結(jié)束時刻能夠通過停止線.
1.4.1 SV換道時間模型
當(dāng)SV不能在當(dāng)前車道通過時,可以尋求相鄰車道的換道通行方案,在對換道策略進行評估時,最主要的考慮因素就是換道帶來的時間損失,故以下分析換道過程的時間計算方法,SV換道的運動過程如圖3所示.
參考Yang等[31]的研究,將車輛的換道軌跡描述為多項式曲線,假設(shè)車輛換道開始時的橫縱向位置均為0、導(dǎo)航角處于水平狀態(tài)、車輛在換道結(jié)束時的縱橫向位置分別為xf和yf,以此來計算SV換道執(zhí)行時間. SV換道執(zhí)行時間為換道行駛的路程與平均速度的比值,如式(8).
式中:
1.4.2 目標(biāo)車道前車通過條件判斷
若目標(biāo)車道的前車數(shù)量太多,會導(dǎo)致:1) SV沒有換道空間,即車輛不能從當(dāng)前位置開始換道;2) SV換道后通過停止線的概率減小. 所以,本文認(rèn)為如果目標(biāo)車道上遠(yuǎn)離交叉口的最后一輛車位置在與SV平行的道路橫向截面之后,則目標(biāo)車道前車不能通過停止線;如果該車在與SV平行的道路橫向截面之前,則目標(biāo)車道有前車;如果目標(biāo)車道上與SV平行的的道路橫向截面之前沒有車輛,則目標(biāo)車道無前車.
在換道過程中,目標(biāo)車道前車保持為跟馳行駛狀態(tài),對其進行編號,依次為LV1,LV2, ···,LVm. 與前述計算當(dāng)前車道的車輛狀態(tài)相同的思路,可以得到目標(biāo)車道前面的車輛在綠燈結(jié)束時刻與停止線的位置差為
式中:xL,m(t0+hT)為目標(biāo)車道前面的車輛LVm在綠燈結(jié)束時刻的位置.
1.4.3 SV換道后通過條件判斷
有了換道時間后,可以計算出換道過程經(jīng)歷的反應(yīng)時間個數(shù)為h1=tS/T,從而得到SV在換道結(jié)束時刻的速度和位置如式(14).
SV換道結(jié)束后,后續(xù)階段的通過條件判斷和前述在當(dāng)前車道的方法類似,從SV換道結(jié)束后的狀態(tài)開始計算,如果目標(biāo)車道沒有前車,SV可以加速行駛,可以根據(jù)式(4)計算其在綠燈結(jié)束時刻的位置;如果目標(biāo)車道有前車,SV只能跟隨前車行駛,可以根據(jù)式(3)計算其在綠燈結(jié)束時刻的位置,最后得到SV在綠燈結(jié)束時刻與停止線的位置差ΔxL,S. 如果 ΔxL,S>0,則SV換道后在綠燈結(jié)束時刻不能通過停止線;如果 ΔxL,S≤0,則SV換道后在綠燈結(jié)束時刻可以通過停止線.
給定所有車輛當(dāng)前的狀態(tài)數(shù)據(jù)(車輛位置、速度)、車輛固定屬性(最大舒適加速度、最大制動減速度)、道路屬性(最大限速值、車道寬度、交叉口停止線位置、綠燈倒計時間),可以模擬出SV在剩余綠燈時間內(nèi)的行駛過程. 本文考慮一般情況,場景設(shè)置為SV前方有車輛,相鄰車道前方有車輛,通過配置車輛位置和當(dāng)前綠燈剩余時間參數(shù)來構(gòu)建不同的交通環(huán)境,以此來評估模型的決策能力,分析車輛的行為決策過程和速度變化.
搭建不同的場景來評價模型的決策能力,設(shè)置兩個不同綠燈倒計時間10.0 s和14.0 s的場景,分別為場景1和場景2,在兩個場景中道路限速值為60 km/h,停車線位置為300 m,最大舒適加速度為2 m/s2,最大制動減速度為3 m/s2. 在其他設(shè)置都相同的條件下,使用基于規(guī)則的現(xiàn)有決策模型和本文決策模型分別仿真車輛的運行,得到車輛行駛過程中的決策結(jié)果,兩個場景如圖4、圖5所示.
圖4 場景1決策過程對比Fig. 4 Comparison of decision-making process for scenario 1
圖5 場景2決策過程對比Fig. 5 Comparison of decision-making process for scenario 2
在場景1下,由對比可知:在車輛靠近信號交叉口的前階段,現(xiàn)有模型和本文模型都做出減速停車的決策,說明本文模型具有和現(xiàn)有模型一致的基本決策能力,在后階段越來越靠近停止線時,在現(xiàn)有模型做出減速停車決策的情況下,本文模型做出直行跟馳的決策,即前者決策出不能通過交叉口,而后者預(yù)測出可以通過,說明本文模型能捕獲到微小的交通狀態(tài)變化,有使得決策結(jié)果更加精確的優(yōu)勢,從而提高車輛的通過效率. 在場景2中,增加了綠燈倒計時間長度,車輛使用本文模型的決策結(jié)果就一直為直行跟馳,這也符合綠燈時間越長,車輛通過交叉口概率越大的交通規(guī)律,說明本文模型能應(yīng)用到實際的車輛運行控制中.
2.3.1 當(dāng)前綠燈剩余時間
將當(dāng)前綠燈剩余時間作為變化量,分別以20.0,19.0,···,1.0 s的剩余時間來構(gòu)建場景,場景的主要參數(shù)設(shè)置見表1.
表1 不同綠燈剩余時間的場景輸入Tab. 1 Scene input information for different green lightcountdown time
選取3個典型決策過程和速度變化結(jié)果如圖6所示,當(dāng)前綠燈剩余時間較短時,SV既不能在當(dāng)前車道通過也不能換道,每次決策只能是停車;當(dāng)前綠燈剩余時間在10.0 s和13.0 s之間時,SV在前階段計算出不能在當(dāng)前車道通過停止線,故做出了換道決策,換道之后的階段做出了直行加速決策;當(dāng)前綠燈剩余時間較長時,SV就一直做出直行跟馳決策.綜合以上分析,綠燈剩余時間每增加一個單位,SV在當(dāng)前綠燈周期通過交叉口的概率可提升20%,車輛面對不同的當(dāng)前綠燈剩余時間時做出的決策有較大差異.
圖6 不同綠燈剩余時間的決策過程和速度變化Fig. 6 Decision-making process and speed change of different remaining time of green light
2.3.2 當(dāng)前車道車輛位置
將當(dāng)前車道車輛位置作為變化量,設(shè)置當(dāng)前車道前車和車輛SV的不同位置來構(gòu)建場景,場景的主要參數(shù)設(shè)置見表2.
表2 不同當(dāng)前車道車輛位置的場景輸入Tab. 2 Scene input information for different vehicle positions in current lane
選取3個典型決策過程和速度變化結(jié)果如圖7所示,當(dāng)前車道車輛與停止線的距離大于220 m時,SV不能在綠燈倒計時間內(nèi)通過,故一直做出減速停車的決策;當(dāng)頭車位置在160~220 m時,SV在前階段有換道的決策,換道之后的階段做出了直行加速的決策;當(dāng)前車道車輛與停止線的距離小于160 m時,SV可以在當(dāng)前車道通過停止線,故一直做出直行跟馳的決策. 由此可知,不同的前車和SV自身位置得到的決策結(jié)果有較大差異.
圖7 不同當(dāng)前車道車輛位置的決策過程和速度變化Fig. 7 Decision process and speed change of different vehicle positions in current lane
1) 本文以周圍車輛對智能網(wǎng)聯(lián)汽車的影響為研究重點,以行駛時間和行駛路程作為通行條件計算依據(jù),建立智能網(wǎng)聯(lián)汽車在信號交叉口的行為決策方法,讓其利用前車狀態(tài)對執(zhí)行各種行為的條件進行了超前判斷,并得到準(zhǔn)確的決策結(jié)果.
2) 仿真結(jié)果表明,決策模型可以使車輛根據(jù)車聯(lián)網(wǎng)獲取的信號倒計時間、車輛位置和速度狀態(tài),對交叉口停止線附近車輛的通過、停車和換道行為之間做出準(zhǔn)確的選擇,解決了前車不確定行為帶來的決策困難問題,對智能網(wǎng)聯(lián)汽車的實際控制具有指導(dǎo)意義.
3) 本研究考慮了車輛直行時的情況,當(dāng)車輛有轉(zhuǎn)向需求時,不同車道上車輛的狀態(tài)和其他進口道車輛的沖突對決策也具有不可忽略的影響,未來研究關(guān)注的是車輛在交叉口有不同轉(zhuǎn)向需求時的行為決策問題.