蘭鳳崇,劉迎節(jié),陳吉清,劉照麟
(1.華南理工大學(xué)機(jī)械與汽車工程學(xué)院,廣州 510640;2.華南理工大學(xué),廣東省汽車工程重點(diǎn)實(shí)驗(yàn)室,廣州 510640)
旁車切入(cut-in)是車輛道路行駛中的常見場(chǎng)景,例如:旁車變道加塞、匝道進(jìn)主路匯流、道路施工引起的并道等。根據(jù)美國(guó)交通部下屬機(jī)構(gòu)美國(guó)國(guó)家公路交通安全管理局提出的37 種預(yù)碰撞情況的分類,切入場(chǎng)景是最危險(xiǎn)的預(yù)碰撞情況之一[1]。如何提高車輛在此類場(chǎng)景中的行車安全性和舒適性是智能車輛決策規(guī)劃功能開發(fā)中的重要問(wèn)題。
面向切入場(chǎng)景的智能駕駛車輛的決策規(guī)劃研究主要集中在車輛根據(jù)旁車切入狀態(tài)所產(chǎn)生的碰撞風(fēng)險(xiǎn)進(jìn)行主動(dòng)避撞。Graham 等[2]根據(jù)主車與旁車的位置計(jì)算安全距離,將其作為參考值,建立了碰撞危險(xiǎn)預(yù)警系統(tǒng)。Minderhoud 等[3]提出了基于碰撞安全時(shí)距的主動(dòng)避撞控制策略。Jansson 等[4]考慮駕駛員操作特性和測(cè)量誤差,對(duì)碰撞危險(xiǎn)評(píng)估模型進(jìn)行優(yōu)化。主動(dòng)避撞式的切入場(chǎng)景決策規(guī)劃具有較強(qiáng)的單一性,即使主車擁有絕對(duì)的路權(quán),在行為決策上也只能進(jìn)行減速避讓,雖能最大程度地保證車輛行駛的安全性,但存在頻繁誤減速和逼停等問(wèn)題,舒適性較差,且在一定程度上影響了主車的通行效率。因此已有研究將博弈理論運(yùn)用到多車參與場(chǎng)景的決策規(guī)劃中,以期得到更加豐富的車輛交互行為。
自動(dòng)駕駛汽車在道路上的行為會(huì)影響到其他車輛駕駛員的行為,同樣也會(huì)受到其他車輛駕駛員行為的影響,尤其是在多車參與的車輛交互場(chǎng)景中。動(dòng)態(tài)博弈理論最能體現(xiàn)這種相互依賴關(guān)系。它在車輛的規(guī)劃和對(duì)其他駕駛員行為的預(yù)測(cè)之間構(gòu)建一種強(qiáng)烈的耦合關(guān)系[5],通過(guò)求解耦合關(guān)系下的車輛運(yùn)動(dòng)模型,來(lái)獲得更多的交互可能性。胡益愷等[6]基于主從博弈構(gòu)建結(jié)合路權(quán)的車輛博弈模型,提高車輛在高車流密度環(huán)境中的決策穩(wěn)健性。Cleac′h等[7-8]建立基于車輛運(yùn)動(dòng)學(xué)的控制模型,提出博弈論規(guī)劃框架,在線估計(jì)其他所謂智能體的目標(biāo)函數(shù)參數(shù),研究復(fù)雜自動(dòng)駕駛場(chǎng)景下的多車交互決策規(guī)劃。Fridovich-keil 等[9]在迭代線性二次調(diào)節(jié)器(ILQR)的基礎(chǔ)上,計(jì)算局部納什均衡解,通過(guò)動(dòng)態(tài)規(guī)劃求解離散時(shí)間耦合的黎卡提方程,解決重復(fù)的線性二次博弈問(wèn)題,算法可以在3 個(gè)智能體參與的路口決策規(guī)劃場(chǎng)景進(jìn)行避撞規(guī)劃;Fisac 等[10]提出一種分層博弈的自動(dòng)駕駛軌跡規(guī)劃算法,將動(dòng)態(tài)博弈進(jìn)行層次分解,上層具有簡(jiǎn)化動(dòng)力學(xué)的長(zhǎng)期戰(zhàn)略博弈,下層具有完整動(dòng)態(tài)及簡(jiǎn)化信息結(jié)構(gòu)的短距離戰(zhàn)術(shù)博弈,從而達(dá)到實(shí)時(shí)控制的效果。
將博弈理論運(yùn)用到自動(dòng)駕駛車輛的決策規(guī)劃中,能夠提高車輛在復(fù)雜場(chǎng)景下的交互能力,使車輛擁有更多的行為選擇,但多數(shù)基于博弈理論的決策規(guī)劃算法通過(guò)實(shí)時(shí)輸出車輛的控制信號(hào)來(lái)改變車身姿態(tài),對(duì)于計(jì)算平臺(tái)的要求較高。重點(diǎn)追求多車之間運(yùn)動(dòng)行為的交互性,對(duì)車輛的行駛場(chǎng)景特點(diǎn)關(guān)注不夠,缺少對(duì)車輛可行域的合理性限制,車輛的行為決策被擴(kuò)展到一個(gè)過(guò)于廣泛的范圍,且未考慮車輛運(yùn)動(dòng)學(xué)的限制,車輛可能會(huì)產(chǎn)生幅度過(guò)大的偏駛和轉(zhuǎn)向等動(dòng)作。這在切入場(chǎng)景下可能會(huì)導(dǎo)致主車運(yùn)動(dòng)不穩(wěn)定,產(chǎn)生難以預(yù)料的危險(xiǎn)行為。因此,迫切需要對(duì)自動(dòng)駕駛車輛的切入場(chǎng)景進(jìn)行深入研究,建立切入場(chǎng)景下主旁車博弈決策規(guī)劃模型,保證合理可靠的軌跡規(guī)劃,提高通行能力、安全性、類人性和舒適性。
本文中通過(guò)分析主旁車的運(yùn)動(dòng)關(guān)系,建立切入場(chǎng)景下主旁車運(yùn)動(dòng)狀態(tài)聯(lián)合模型,確定切入場(chǎng)景中存在交互沖突的車輛狀態(tài);使用分層動(dòng)態(tài)博弈決策與避障軌跡規(guī)劃框架,設(shè)計(jì)基于危險(xiǎn)預(yù)判的安全性收益函數(shù)和考慮駕駛行為的舒適性收益函數(shù),使得到的行為決策解既保證自動(dòng)駕駛車輛避免與切入車輛發(fā)生碰撞,同時(shí)具有類人性和舒適性;搭建博弈決策規(guī)劃聯(lián)合仿真平臺(tái),實(shí)現(xiàn)智能駕駛車輛在切入場(chǎng)景中更具合理、豐富的交互行為。
旁車切入是指主車在正常行駛中,相鄰車道的旁車與主車產(chǎn)生行為交互,并變換至主車所在車道,對(duì)主車的行駛產(chǎn)生影響的行為。它區(qū)別與在旁車的換道過(guò)程中理論上不會(huì)對(duì)主車產(chǎn)生影響的簡(jiǎn)單換道動(dòng)作,如旁車在主車前方距離很遠(yuǎn)且速度較快的換道,此類場(chǎng)景下主車無(wú)須針對(duì)旁車改變運(yùn)動(dòng)策略即可滿足規(guī)劃要求。切入涉及到主、旁車的運(yùn)動(dòng)狀態(tài)的相互改變和影響,建立切入場(chǎng)景下車輛的運(yùn)動(dòng)狀態(tài)形式和車輛之間的交互關(guān)系是解決智能車輛決策規(guī)劃問(wèn)題的重要前提。本文中以存在潛在沖突的切入場(chǎng)景為研究對(duì)象,對(duì)主-旁車不同狀態(tài)下的切入場(chǎng)景進(jìn)行分類,建立主-旁車運(yùn)動(dòng)模型,探究切入場(chǎng)景下主、旁車之間的行為交互對(duì)各自運(yùn)動(dòng)狀態(tài)的影響。
切入場(chǎng)景下的旁車換道行為會(huì)導(dǎo)致主車與旁車之間的碰撞風(fēng)險(xiǎn),主車須依據(jù)規(guī)劃要求更新運(yùn)動(dòng)策略。按照不同的主、旁車初始位置關(guān)系,旁車的切入場(chǎng)景可細(xì)分為旁車從主車后方進(jìn)行加速超車而后切入和旁車在主車前方以較近距離進(jìn)行切入兩種類型,如圖1 所示。場(chǎng)景中的主車和旁車存在明顯的沖突關(guān)系,主車和旁車之間的決策行為影響各自車輛的狀態(tài),具有很強(qiáng)的交互性。主車原有的運(yùn)動(dòng)狀態(tài)和方式會(huì)因?yàn)榕攒嚨那腥雱?dòng)作而發(fā)生變化,雙方會(huì)根據(jù)對(duì)方的行為選擇而改變自身的決策,從而實(shí)現(xiàn)一種新的平衡方式。
圖1 切入場(chǎng)景下的雙車狀態(tài)
為分析切入場(chǎng)景下的主旁車運(yùn)動(dòng)關(guān)系,確定旁車的運(yùn)動(dòng)狀態(tài),選擇半車模型對(duì)場(chǎng)景內(nèi)的主旁車輛運(yùn)動(dòng)進(jìn)行描述,如圖2 所示。其中取車輛沿車道線的行駛方向?yàn)閄軸,與之垂直的方向?yàn)閅軸,建立地面全局坐標(biāo)系X-O-Y。以車輛質(zhì)心G為中心,行進(jìn)方向?yàn)閤軸,與之垂直的方向?yàn)閥軸,建立車身坐標(biāo)系x-G-y,車輛的橫擺角為φ,考慮到切入過(guò)程中的速度較低,可以忽略車輛的側(cè)向滑動(dòng),認(rèn)為橫擺角近似等于車輛航向角。根據(jù)車輛在場(chǎng)景內(nèi)的運(yùn)動(dòng)特性和交互關(guān)系,將其視為一個(gè)整體系統(tǒng),以主車在本車道的變速運(yùn)動(dòng)和旁車的切入變道為運(yùn)動(dòng)狀態(tài)形式,建立系統(tǒng)的運(yùn)動(dòng)狀態(tài)方程為
圖2 以地面固定坐標(biāo)系表示的車輛運(yùn)動(dòng)
式中:下標(biāo)e、s 分別代表主車和旁車;m為車輛總質(zhì)量;I為車輛繞質(zhì)心的轉(zhuǎn)動(dòng)慣量;L為車輛軸距;X、Y、φ分別表示車輛在地面固定坐標(biāo)系下的坐標(biāo)和橫擺角;θ為車輛航向角;δ為前輪轉(zhuǎn)向角;Cf,s、Cr,s分別為旁車前輪和后輪的側(cè)偏剛度;lf,s、lr,s分別為旁車質(zhì)心到前后輪的縱向距離。
由于切入場(chǎng)景多發(fā)生在道路曲率變化不大的路段,考慮到交規(guī)限制與行車安全,主車可設(shè)定為在本車道內(nèi)的縱向變速運(yùn)動(dòng),用速度函數(shù)ve(t)來(lái)描述主車的運(yùn)動(dòng)狀態(tài)。旁車的動(dòng)作是一個(gè)換道切入行為,根據(jù)主旁車雙方的沖突關(guān)系,旁車的運(yùn)動(dòng)軌跡會(huì)受主車的運(yùn)動(dòng)狀態(tài)改變而發(fā)生變化,其狀態(tài)較為復(fù)雜,涉及到車輛的橫向和縱向的位置姿態(tài)和速度變化,選擇用速度vs(t)和車輛橫擺角φs進(jìn)行描述。
車輛切入場(chǎng)景中的旁車作為切入的行為主體,其運(yùn)動(dòng)狀態(tài)發(fā)生變化勢(shì)必會(huì)影響主車的行為決策,同時(shí)主車狀態(tài)的改變又會(huì)反作用到旁車,此場(chǎng)景中車輛天然的存在運(yùn)動(dòng)行為的沖突性和耦合性[11],在此過(guò)程中既存在對(duì)立面也需要相互之間的妥協(xié),是一個(gè)交互博弈的過(guò)程。這種交互特性與非合作博弈游戲相似,主、旁車需要進(jìn)行“友好”的競(jìng)爭(zhēng)來(lái)決定切入場(chǎng)景下的通行順序。將博弈理論運(yùn)用于自動(dòng)駕駛車輛的切入場(chǎng)景決策規(guī)劃中,會(huì)使系統(tǒng)更具類人性,行為決策更加合理。在保證主車和旁車行駛意圖的前提下,自動(dòng)駕駛車輛對(duì)切入場(chǎng)景的決策規(guī)劃以盡可能減少二者相互影響為目標(biāo)。通過(guò)分析主、旁車在場(chǎng)景下的行為策略,得到博弈均衡解。將切入場(chǎng)景下的動(dòng)態(tài)博弈規(guī)劃分兩層進(jìn)行。首先行為決策層通過(guò)求解最大化收益函數(shù)進(jìn)行戰(zhàn)略級(jí)的行為決策博弈。而在軌跡規(guī)劃層,以給定的駕駛行為為邊界條件,基于車輛間距構(gòu)建避障約束條件,以參數(shù)化軌跡的空間曲率和切向矢量的時(shí)間分量輔助構(gòu)建車輛動(dòng)力學(xué)約束,建立軌跡規(guī)劃的數(shù)學(xué)模型。
以非合作博弈模型為基礎(chǔ)建立切入場(chǎng)景下的主、旁車交互博弈模型:
式中:N代表參與者數(shù)量,包含主車和旁車兩個(gè)智能體;Ai為智能體i的策略所構(gòu)成的集合;Ri為智能體i的回報(bào)/收益函數(shù)。
分別定義ae和as為主車和旁車的切入行為決策,Ae和As分別為主車和旁車的決策集合。分別為Ae={減速,加速}和As={切入,避讓},兩車博弈的所有可能策略結(jié)果如表1所示。
表1 雙方博弈的策略結(jié)果
在博弈過(guò)程中,智能體通過(guò)選擇合適的策略,使收益函數(shù)最大化,得到納什均衡解[12-14]。系統(tǒng)處于某一時(shí)刻下的納什均衡解對(duì)于雙方來(lái)說(shuō),都是當(dāng)前狀態(tài)下的最優(yōu)策略解,即雙方分別在對(duì)方給定的策略下不愿調(diào)整自己的策略。在納什均衡中,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。對(duì)于切入場(chǎng)景下的動(dòng)態(tài)博弈問(wèn)題,如果主車和旁車都選擇快速完成各自的動(dòng)作,造成的結(jié)果是兩車存在碰撞的風(fēng)險(xiǎn);如果主車和旁車都選擇謙讓對(duì)方,主-旁車將會(huì)處于一個(gè)僵持的狀態(tài),影響通行性能降低交通流效率;如果主車選擇減速,旁車選擇切入,主-旁車到達(dá)了一個(gè)協(xié)商下的平衡,這種情況就是切入博弈系統(tǒng)的一個(gè)納什均衡解;同樣地,主車選擇加速脫離切入場(chǎng)景,旁車選擇避讓,這種情況也是一個(gè)納什均衡解。非合作切入博弈的車輛i納什均衡解滿足條件:
意味著如果旁車使用納什均衡解下的,主車的最優(yōu)選擇是,這對(duì)旁車同樣成立,構(gòu)成了納什均衡[15]。求解這個(gè)模型的目標(biāo)是獲得一組策略,從而最大化每個(gè)智能體的收益,得到非合作博弈的納什均衡解。
借助于建立的博弈系統(tǒng)運(yùn)動(dòng)學(xué)模型,用模型預(yù)測(cè)的思想,對(duì)切入場(chǎng)景下系統(tǒng)未來(lái)一段時(shí)間內(nèi)的收益進(jìn)行預(yù)測(cè),求解得到博弈模型的納什均衡解,輸出系統(tǒng)當(dāng)前狀態(tài)下的最優(yōu)決策解。
具有完全理性行為的車輛博弈問(wèn)題,博弈系統(tǒng)的納什均衡解由系統(tǒng)收益函數(shù)所決定。為了得到更具類人合理性和安全性的切入場(chǎng)景下的行為決策解,須對(duì)主、旁車的收益函數(shù)進(jìn)行優(yōu)化。連續(xù)非線性的狀態(tài)方程增大了問(wèn)題求解難度,為此對(duì)上述系統(tǒng)運(yùn)動(dòng)學(xué)方程進(jìn)行離散化,得到系統(tǒng)在t時(shí)刻的狀態(tài)為
式中:f(·)表示對(duì)切入系統(tǒng)連續(xù)狀態(tài)微分方程的離散化映射關(guān)系;ut-Δt表示(t-Δt)時(shí)刻車輛的控制輸入{a,δ},即車輛加速度和前輪轉(zhuǎn)角。根據(jù)系統(tǒng)的動(dòng)力學(xué)模型計(jì)算未來(lái)幀的預(yù)測(cè)收益,得到當(dāng)前狀態(tài)下博弈系統(tǒng)的納什均衡解,根據(jù)決策結(jié)果進(jìn)行主車和旁車的軌跡規(guī)劃。車輛完成循跡后進(jìn)行下一狀態(tài)的博弈規(guī)劃,自動(dòng)駕駛車輛在M個(gè)時(shí)間段內(nèi)的總收益為
解決潛在的動(dòng)態(tài)博弈問(wèn)題并不意味著自動(dòng)駕駛車輛會(huì)變得更有攻擊性,其駕駛行為最終將取決于設(shè)計(jì)者指定的優(yōu)化目標(biāo)。以自動(dòng)駕駛車輛在行駛過(guò)程中避免與切入車輛發(fā)生碰撞的安全性收益和車輛行駛舒適性收益作為車輛在切入場(chǎng)景中的具有類人性的決策目標(biāo)。
2.3.1 考慮危險(xiǎn)預(yù)判的安全性收益
人類駕駛員無(wú)法像車載傳感器一樣擁有精確的感知能力,對(duì)危險(xiǎn)碰撞區(qū)域進(jìn)行準(zhǔn)確的計(jì)算,影響人類駕駛員進(jìn)行切入博弈決策更多來(lái)源于心理對(duì)危險(xiǎn)的預(yù)判,這種預(yù)判通常通過(guò)觀察車輛車速、加速度和航向角來(lái)分析。定義安全性收益RA為
式中:ve和vs分別表示切入博弈開始主車和旁車某個(gè)時(shí)刻下的車速;anext和φnext分別表示主車在下一時(shí)刻所采取的加速度策略和方向轉(zhuǎn)角策略;d為兩車的相對(duì)距離。
2.3.2 基于駕駛行為的舒適性收益
對(duì)正常駕駛汽車來(lái)說(shuō),大幅改變當(dāng)前車輛行駛狀態(tài)的行為動(dòng)作會(huì)降低舒適性,因此在切入場(chǎng)景的博弈中,應(yīng)盡可能地保持車輛當(dāng)前的行駛狀態(tài)。切入博弈系統(tǒng)的狀態(tài)可以由系統(tǒng)整體速度和系統(tǒng)的姿態(tài)兩個(gè)狀態(tài)量進(jìn)行描述,將系統(tǒng)速度函數(shù)的方差JD=De+Ds作為舒適性收益的第1項(xiàng):
式中:De、Ds分別表示主、旁車的速度方差;t0為開始規(guī)劃時(shí)刻;tf為旁車完成換道動(dòng)作橫擺角減為0的時(shí)刻;ve(t)、vs(t)、ve(0)、vs(0)分別表示主、旁車的速度函數(shù)及其初速度。
同時(shí),考慮到主車在車道內(nèi)做直線運(yùn)動(dòng),選擇旁車實(shí)際切入角與當(dāng)前速度下的理想切入角差值Jθ作為舒適性收益的第2項(xiàng):
式中:tm為旁車經(jīng)過(guò)車道線的時(shí)刻;θr為理想切入角;θs為實(shí)際切入角。旁車的理想切入角是關(guān)于速度的函數(shù):
切入博弈場(chǎng)景的舒適性收益RC為系統(tǒng)狀態(tài)量在當(dāng)前時(shí)刻到tf時(shí)刻的改變量之和:
通過(guò)切入博弈所得到的行為策略,對(duì)車輛的運(yùn)動(dòng)軌跡進(jìn)行局部路徑規(guī)劃和速度規(guī)劃。從整體上看,切入車軌跡是一個(gè)固定形式的換道軌跡,使用參數(shù)化曲線方程能有效地描述切入軌跡,同時(shí)還可以提高博弈決策與規(guī)劃的速度。但在切入博弈過(guò)程中,切入車的運(yùn)動(dòng)軌跡會(huì)因?yàn)閮绍嚨男袨榻换ザl繁變化,因此使用帶有可變曲率參數(shù)的Sigmoid 函數(shù)來(lái)近似表達(dá)旁車切入時(shí)的局部路徑軌跡:
式中:W為車道寬度;k為旁車切入軌跡曲線中點(diǎn)處的切入角控制系數(shù),控制旁車的切入角變化,切入軌跡中點(diǎn)定義為(xm,0)。
主旁車的運(yùn)動(dòng)狀態(tài)關(guān)系影響k值的變化,引起切入軌跡的曲率發(fā)生變化。旁車的切入角度φs(xm)=arctan是Sigmoid 曲線在其變道軌跡中點(diǎn)(xm,0)處切線的傾斜角,因此可以通過(guò)對(duì)車輛切入角的控制來(lái)反映旁車切入時(shí)的決策博弈變化,如圖3所示。
圖3 不同切入角下的Sigmoid曲線軌跡
切入場(chǎng)景下的主、旁車行為決策的博弈解,在長(zhǎng)期范圍內(nèi)可以看作給定的駕駛行為。在進(jìn)行主、旁車的軌跡規(guī)劃時(shí),以此為邊界條件。對(duì)旁車的換道曲線軌跡方程,即式(11)的S(x)求導(dǎo)得
S′(x)表示不同k值對(duì)應(yīng)的切入角度的正弦,也即切入軌跡的斜率,如圖4 所示。則切入車輛在任意一段區(qū)間[x1,x2]上的曲線(路徑)長(zhǎng)度S12為
圖4 車輛切入過(guò)程參數(shù)
由于無(wú)積分項(xiàng)解析解,以旁車的換道軌跡中點(diǎn)xm為界限分段,用指數(shù)函數(shù)y=peqx擬合S′(x),p和q均為k的函數(shù),則可表達(dá)為
將式(15)和式(16)代入式(14)可得
通過(guò)擬合參數(shù)識(shí)別得到參數(shù)p、q與變曲率Sigmoid參數(shù)k的關(guān)系為
為保證規(guī)劃軌跡的安全性和可跟蹤性,須對(duì)主、旁車的運(yùn)動(dòng)軌跡關(guān)系進(jìn)行約束限制,主、旁車相對(duì)運(yùn)動(dòng)關(guān)系如圖5 所示。t0表示切入博弈規(guī)劃的開始時(shí)刻,tm表示旁車切入換道動(dòng)作完成一半的時(shí)刻,t0到tm對(duì)于主車來(lái)說(shuō)是變速運(yùn)動(dòng)的過(guò)程,對(duì)于旁車來(lái)說(shuō)是合理進(jìn)行切入的過(guò)程。dc為旁車準(zhǔn)備切入前的變速過(guò)程的位移,主車和旁車的運(yùn)動(dòng)軌跡已通過(guò)參數(shù)化方程進(jìn)行了行為邊界條件的限制,在整個(gè)過(guò)程中的軌跡規(guī)劃須保證兩車的安全性,且能用統(tǒng)一的表達(dá)式來(lái)描述不同決策行為下的車輛規(guī)劃。
圖5 旁車切入過(guò)程兩車相對(duì)運(yùn)動(dòng)關(guān)系
以tm時(shí)刻車輛系統(tǒng)的狀態(tài)作為切入博弈規(guī)劃的約束條件,主、旁車在換道中點(diǎn)時(shí)刻tm的位置關(guān)系與速度關(guān)系為
式中:下標(biāo)m 表示旁車切入至兩車道中心線的時(shí)刻;d表示車輛的縱向位移;dε為不同速度下的安全距離;l表示車長(zhǎng)。
博弈理論的基本假設(shè)要求參與者是個(gè)人理性的,即參與者會(huì)根據(jù)自己的下一步動(dòng)作行為所產(chǎn)生的價(jià)值大小進(jìn)行決策。在真實(shí)切入場(chǎng)景下對(duì)于理性駕駛員的假設(shè)存在一定的風(fēng)險(xiǎn)性,考慮到無(wú)法對(duì)旁車的行為決策做出絕對(duì)準(zhǔn)確的判斷,本文采用對(duì)旁車幾何外形輪廓進(jìn)行膨脹化處理的方法,擴(kuò)大主車在進(jìn)行軌跡規(guī)劃時(shí)碰撞檢測(cè)的范圍,規(guī)避決策誤差風(fēng)險(xiǎn)[16],如圖6所示。
圖6 旁車幾何外形膨脹化
將切入場(chǎng)景下博弈軌跡規(guī)劃方法分為戰(zhàn)略級(jí)的決策求解和戰(zhàn)術(shù)級(jí)的軌跡規(guī)劃。首先根據(jù)主車當(dāng)前的環(huán)境觀測(cè)建立主、旁車的切入博弈整體系統(tǒng)模型,根據(jù)所建立的目標(biāo)函數(shù),從當(dāng)前時(shí)刻向前推演系統(tǒng)的博弈參與者的整體收益,求解收益最大化,得到切入博弈系統(tǒng)的納什均衡解:
式中:a*為切入博弈場(chǎng)景下的均衡解;Ae為主車的決策結(jié)果;As為旁車的決策結(jié)果。決策的值為車輛的加速度和前輪轉(zhuǎn)角,ai=ui∈{ai,δi},根據(jù)決策值進(jìn)行兩車的軌跡規(guī)劃,同時(shí)考慮車輛的碰撞約束條件和車輛的動(dòng)力學(xué)約束條件。
從t0時(shí)刻開始進(jìn)行切入場(chǎng)景的博弈軌跡規(guī)劃,系統(tǒng)根據(jù)當(dāng)前主車和旁車的狀態(tài),在每個(gè)時(shí)間步長(zhǎng)j下都面臨選擇收益值R最高的行為決策的博弈優(yōu)化問(wèn)題,所提出的博弈決策規(guī)劃算法如表2所示。
表2 博弈算法流程
為探討動(dòng)態(tài)博弈切入場(chǎng)景規(guī)劃算法的有效性和實(shí)時(shí)性,借助于Carsim 和Simulink 搭建兩車博弈的仿真切入場(chǎng)景。圖7 為聯(lián)合仿真模型結(jié)構(gòu)示意圖,通過(guò)聯(lián)合兩個(gè)Carsim模型獲得主車和旁車的運(yùn)動(dòng)狀態(tài)信息,切入博弈規(guī)劃模塊根據(jù)兩輛車的初始狀態(tài)信息進(jìn)行戰(zhàn)略決策的求解,根據(jù)當(dāng)前博弈模型的納什均衡解進(jìn)行戰(zhàn)術(shù)級(jí)的運(yùn)動(dòng)軌跡規(guī)劃,發(fā)送給兩車的控制模塊進(jìn)行循跡。
圖7 兩車切入博弈場(chǎng)景聯(lián)合仿真模型
在Carsim 中搭建兩車道的仿真場(chǎng)景,考慮到控制精度對(duì)于實(shí)時(shí)性要求較高,規(guī)劃的頻率設(shè)定為10 Hz,控制的頻率設(shè)定為100 Hz,保證車輛控制能夠?qū)σ?guī)劃軌跡進(jìn)行跟蹤。切入場(chǎng)景中的車輛做小轉(zhuǎn)角運(yùn)動(dòng),且橫向位置的控制精度要比縱向位置精度更高,以保證安全性。本文選擇精度較高的LQR 算法進(jìn)行橫向控制,魯棒性較好的PID 算法進(jìn)行縱向控制,具體的車輛參數(shù)配置信息如表3所示。
表3 參數(shù)配置
通過(guò)不斷調(diào)整主車與旁車的初始狀態(tài),能夠得到4 種切入場(chǎng)景下主、旁車交互博弈的不同結(jié)果,如圖8 所示。切入博弈決策規(guī)劃算法增加了自動(dòng)駕駛車輛在切入場(chǎng)景下與旁車的交互能力,擁有更多的行為選擇。
主、旁車初始狀態(tài)的不同會(huì)影響切入場(chǎng)景下的最終博弈結(jié)果。圖8(a)設(shè)定的初始條件為主車落后旁車3 m,旁車以18 km/h 的速度進(jìn)行切入,主車以25 km/h的速度保持勻速行駛,博弈規(guī)劃算法所得到的最終結(jié)果為:主車進(jìn)行加速擺脫,旁車進(jìn)行減速切入。由于主車的初始速度較高,主車在旁車準(zhǔn)備切入時(shí)會(huì)嘗試加速擺脫,旁車?yán)^續(xù)切入的收益已經(jīng)小于取消切入的收益。圖8(b)中的初始條件為主車以18 km/h 的速度在旁車后方8 m 勻速行駛,旁車以15 km/h 的速度進(jìn)行切入,博弈規(guī)劃算法得到的最終結(jié)果為:主車進(jìn)行減速避讓,旁車加速切入。主車由于旁車的相對(duì)速度快,在旁車準(zhǔn)備切入時(shí)選擇避讓。圖8(c)中兩車相距3 m,主車在前設(shè)定以15 km/h 的速度行駛,旁車以29 km/h 的速度準(zhǔn)備進(jìn)行超車切入,博弈規(guī)劃算法得到的最終結(jié)果為:主車減速避讓,旁車進(jìn)行切入。主車在旁車加速超車的過(guò)程中,沒有選擇大幅提高車速進(jìn)行擺脫。圖8(d)中兩車相距6 m,主車以15 km/h 的速度在旁車前方6 m 勻速行駛,旁車以18 km/h 的速度進(jìn)行超車切入,博弈規(guī)劃算法得到的最終結(jié)果為:主車加速擺脫,旁車在主車后方完成切入動(dòng)作。從博弈規(guī)劃的結(jié)果可以看出,所有條件下的切入博弈決策解都是當(dāng)前狀態(tài)下的最優(yōu)解,能夠保證車輛安全地進(jìn)行交互。主車在處理旁車的切入行為中,不同于常規(guī)自動(dòng)駕駛車輛的減速避讓,其決策行為更具有類人性,會(huì)根據(jù)自身的狀態(tài)對(duì)切入旁車進(jìn)行加速擺脫或減速避讓,這更符合人類駕駛員的駕駛習(xí)慣和風(fēng)格。
圖8 4種切入博弈規(guī)劃結(jié)果
選擇上述博弈規(guī)劃中的主車擺脫切入旁車場(chǎng)景(a)和主車避讓切入旁車場(chǎng)景(b)進(jìn)行博弈規(guī)劃算法的實(shí)時(shí)性驗(yàn)證。針對(duì)兩種切入博弈場(chǎng)景,在Carsim中關(guān)聯(lián)主、旁車的車輛物理模型,聯(lián)合Simulink 建立了切入場(chǎng)景下主、旁車博弈規(guī)劃與運(yùn)動(dòng)控制模型。
主車擺脫旁車切入過(guò)程中二者運(yùn)動(dòng)狀態(tài)關(guān)系如圖9 所示。當(dāng)旁車準(zhǔn)備切入時(shí),主車的初始速度相對(duì)較高,未選擇減速來(lái)避讓切入的旁車,而是通過(guò)短時(shí)間的加速,駛離了旁車的切入?yún)^(qū)域。在整個(gè)過(guò)程中二者未發(fā)生碰撞,主車作為此場(chǎng)景的先行者,安全且高效地通過(guò),如圖10所示。
圖9 主車擺脫切入旁車
圖10 主車擺脫旁車切入過(guò)程
主車避讓旁車切入場(chǎng)景中,主車的起始位置位于旁車的后方,當(dāng)旁車進(jìn)行切入時(shí),主車受制于旁車的速度和二者之間的距離,為避免碰撞,選擇減速避讓旁車。主車進(jìn)行小幅度減速,沒有因?yàn)榕攒嚱嚯x的切入發(fā)生急減速,如圖11(a)所示。主車減速避讓切入旁車過(guò)程展示出主車面臨旁車切入時(shí)與旁車的博弈交互,減速是此狀態(tài)下的最優(yōu)選擇,兩車始終保持安全的橫向距離,如圖11(b)所示。主車的行為決策邏輯符合人類駕駛員在切入場(chǎng)景的主觀判斷,規(guī)劃的空間軌跡能夠保證兩車之間不發(fā)生碰撞,如圖12所示。
圖11 主車避讓切入旁車
圖12 主車避讓旁車近距離切入過(guò)程
仿真測(cè)試結(jié)果證明了切入博弈規(guī)劃算法能滿足車輛運(yùn)動(dòng)控制的實(shí)時(shí)性要求,在多種條件下都能決策規(guī)劃出最優(yōu)的解決方案。與傳統(tǒng)自動(dòng)駕駛車輛處理旁車切入單一行為決策的邏輯不同,切入博弈規(guī)劃更具有類人性,在保證安全性的前提下,車輛的通行效率因?yàn)椴煌腥雸?chǎng)景下的行為選擇增多而提高。
在切入博弈過(guò)程中主車的行駛舒適性主要通過(guò)車輛的縱/側(cè)向加速度來(lái)衡量。以常用取值范圍內(nèi)的車輛縱、側(cè)向加速度任意占比定義一個(gè)加速度狀態(tài),將主車每個(gè)加速度狀態(tài)的持續(xù)時(shí)間進(jìn)行累加,繪制加速度作用時(shí)間密度圖[17],作為車輛舒適度的衡量標(biāo)準(zhǔn),如圖13 所示。高亮區(qū)域?yàn)橹鬈嚨目v向加速度與側(cè)向加速度的范圍以及各自的作用時(shí)間,圖中的矩形框?yàn)椤笆孢m矩形”,兩個(gè)仿真場(chǎng)景下的車輛加速度被控制在-0.8~0.8 m/s2之間,根據(jù)ISO 2631—1國(guó)際標(biāo)準(zhǔn)[18],這個(gè)范圍內(nèi)的加速度屬于較舒適,且加速度的分布較為集中,沒有出現(xiàn)大范圍的變動(dòng)。
圖13 場(chǎng)景仿真過(guò)程中主車的加速度密度圖
綜上所述,以動(dòng)態(tài)博弈為模型進(jìn)行的決策規(guī)劃可使車輛在縱向和橫向上都有一個(gè)較好的舒適性,有效降低了車輛出現(xiàn)異常減速和逼停的發(fā)生幾率。
(1)將切入場(chǎng)景視為一個(gè)兩車博弈模型,對(duì)存在博弈的切入場(chǎng)景進(jìn)行了精細(xì)化的劃分,基于車輛的運(yùn)動(dòng)學(xué)模型,建立主-旁車博弈規(guī)劃模型,模型求解通過(guò)分層的方法,使用戰(zhàn)略決策和戰(zhàn)術(shù)路徑規(guī)劃兩個(gè)層面進(jìn)行切入場(chǎng)景下車輛之間的博弈交互規(guī)劃,加快模型的求解速率。
(2)在博弈系統(tǒng)模型的基礎(chǔ)上,根據(jù)車輛切入時(shí)的交互特征,采用Sigmoid 函數(shù)作為旁車切入軌跡曲線方程,通過(guò)單一參數(shù)描述兩車切入博弈的交互影響,簡(jiǎn)化了軌跡規(guī)劃流程。
(3)通過(guò)Carsim-Simulink 的聯(lián)合仿真表明,切入博弈規(guī)劃算法能夠使車輛在面對(duì)切入場(chǎng)景時(shí),根據(jù)兩車的初始狀態(tài)的不同,進(jìn)行多樣的舒適性決策與規(guī)劃,且能達(dá)到控制的實(shí)時(shí)性要求。本文中模型的提出對(duì)于提高輔助駕駛系統(tǒng)或自動(dòng)駕駛系統(tǒng)在強(qiáng)交互場(chǎng)景下的安全性和舒適性具有重要意義。