魏吉敏
(長(zhǎng)沙智能駕駛研究院有限公司, 長(zhǎng)沙 410218)
隨著城市發(fā)展越來越快,城市內(nèi)的車輛也越來越多,交通變得日益擁堵,傳統(tǒng)的信號(hào)燈控制方法越來越不能滿足城市發(fā)展的需要. 自從1960年計(jì)算機(jī)開始應(yīng)用于交通信號(hào)燈的控制,到目前出現(xiàn)了不同類型的交通信號(hào)控制系統(tǒng),其中最著名的是英國(guó)研制的SCOOT系統(tǒng)、澳大利亞的SCATS系統(tǒng)等. 國(guó)外的交通信號(hào)控制系統(tǒng)功能強(qiáng)大,在設(shè)計(jì)階段考慮周全,因而價(jià)格較貴. SCOOT系統(tǒng)通過埋設(shè)在上游路口的車輛檢測(cè)器跟蹤車輛的運(yùn)動(dòng)情況,通過有優(yōu)化程序找出信號(hào)配時(shí)參數(shù)的最佳組合. SCATS系統(tǒng)的車輛檢測(cè)器安裝在停車線上,通過實(shí)測(cè)的飽和度值來選擇不同的信號(hào)周期、綠信比、相位差,從而達(dá)到實(shí)時(shí)控制交通信號(hào)燈的目的. 目前國(guó)內(nèi)主要交通信號(hào)控制系統(tǒng)有青島海信的HICON系統(tǒng)和深圳的SMOOTH系統(tǒng),這些系統(tǒng)憑借著價(jià)格優(yōu)勢(shì)廣泛應(yīng)用于國(guó)內(nèi)城市的交叉路口,用于緩解城市的交通狀況[1].
目前信號(hào)燈控制方式主要可分為三大類:固定配時(shí)控制、感應(yīng)式配時(shí)控制、自適應(yīng)配時(shí)控制. 固定配時(shí)控制方法是采集歷史的交通流量數(shù)據(jù)計(jì)算出不同相位需要的配時(shí),該方法假設(shè)整個(gè)信號(hào)周期內(nèi)通行需求是保持不變的. 而實(shí)際情況不同時(shí)間段的通行需求往往在不斷地變化,因此固定配時(shí)控制方式遠(yuǎn)遠(yuǎn)不能滿足實(shí)際通行的需求. 感應(yīng)式配時(shí)控制方法通過感應(yīng)線圈等獲取車輛的信息,采用簡(jiǎn)單的邏輯來做出信號(hào)控制決策. 目前大部分自適應(yīng)配時(shí)控制方法依靠一些傳感器如(攝像頭、感應(yīng)線圈)來獲取車輛的狀態(tài)信息,從而自適應(yīng)調(diào)節(jié)交通信號(hào)燈的配時(shí)[2]. 但這些傳感器存在以下缺點(diǎn):①只能檢測(cè)出車輛在某一固定點(diǎn)的狀態(tài)信息(如位置、速度、加速度). 而車輛是在不斷的運(yùn)動(dòng). ②維護(hù)成本高. 當(dāng)某一個(gè)方向的傳感器出現(xiàn)故障時(shí)對(duì)整個(gè)系統(tǒng)的性能造成很大的影響. 前面提到的SCOOT系統(tǒng)、SCATS系統(tǒng)等都采用上述傳感器實(shí)現(xiàn)自適應(yīng)配時(shí)控制方式,但是這些自適應(yīng)配時(shí)控制系統(tǒng)不支持網(wǎng)聯(lián)車輛的信息接入.
隨著無線通信技術(shù)的發(fā)展,網(wǎng)聯(lián)車輛可通過DSRC、LTE- V等通信方式與其他車輛通信(V2V)、與道路基礎(chǔ)設(shè)施通信(V2I). 通過利用V2I技術(shù)可獲得整個(gè)交叉路口完整的實(shí)時(shí)的車輛狀態(tài)信息(如位置、速度、加速度等). 安裝在交叉路口的路側(cè)單元(RSU)通過利用這些車輛的實(shí)時(shí)狀態(tài)信息,可做出更優(yōu)的信號(hào)配時(shí)策略. 目前有越來越多的學(xué)者在研究V2X(包含了V2V,V2I,V2N)通信技術(shù)對(duì)交通信號(hào)控制的積極作用. Yiheng Feng等[3]研究表明:當(dāng)1輛網(wǎng)聯(lián)車或者部分網(wǎng)聯(lián)車由于通信故障不能與道路基礎(chǔ)設(shè)施通信時(shí)會(huì)導(dǎo)致道路網(wǎng)聯(lián)車的滲透率下降,但是不會(huì)對(duì)路口的信號(hào)控制造成很大影響,這樣就可避免傳統(tǒng)的自適應(yīng)配時(shí)方法因?yàn)閱蝹€(gè)傳感器出故障導(dǎo)致整個(gè)系統(tǒng)不能正常運(yùn)行的缺陷. Chen Cai等[4]在論文中提出的方法通過V2I通信方式獲取車輛的位置和速度數(shù)據(jù),通過動(dòng)態(tài)規(guī)劃的方法控制紅綠燈使得車輛的行程時(shí)間最短. 論文[5-6]提出通過交叉路口的的車輛與車輛之間的通信(V2V)形成1個(gè)自組織交通信號(hào)控制系統(tǒng),該自組織系統(tǒng)采用虛擬紅綠燈替代實(shí)體紅綠燈從而增加整個(gè)路口的交通流量. 目前還有學(xué)者提出采用強(qiáng)化學(xué)習(xí)的方法來實(shí)現(xiàn)交叉路口的信號(hào)燈控制,從而減少車輛的排隊(duì)長(zhǎng)度[7-8]. 針對(duì)未來網(wǎng)聯(lián)車輛數(shù)量越來越多的情況,如何利用V2X通信技術(shù)優(yōu)化路口的信號(hào)配時(shí)、提升路口的通行效率、降低車輛在路口的等待時(shí)間、提升人們的出行體驗(yàn)是未來需要解決的問題,針對(duì)上述問題本文提出了基于實(shí)時(shí)網(wǎng)聯(lián)車輛信息的交叉路口信號(hào)配時(shí)優(yōu)化方法.
普通的十字交叉路口的相位(見圖1)根據(jù)交通流的方向一般可分為4個(gè). 傳統(tǒng)的交叉路口動(dòng)態(tài)配時(shí)方法通過在進(jìn)入交叉路口的上游路段某一固定位置設(shè)置感應(yīng)線圈來檢測(cè)車輛. 本文提出的基于V2I的交叉路口信號(hào)控制方法是在交叉路口紅綠燈桿上的路側(cè)感知單元(RSU),它能與安裝在車輛上的車載單元(OBU)通過DSRC/LTE- V通信. RSU可通過信號(hào)控制機(jī)來控制紅綠燈的相位. RSU與OBU之間的通信方式為廣播通信. RSU可獲取整個(gè)交叉路口車輛的實(shí)時(shí)狀態(tài)信息. 文中的交叉路口每個(gè)方向包含1個(gè)直行車道、1個(gè)左轉(zhuǎn)車道. 每個(gè)方向右轉(zhuǎn)車道對(duì)應(yīng)的紅綠燈一直為綠色常亮,本研究暫不考慮右轉(zhuǎn)車道對(duì)交叉路口交通流的影響. 對(duì)交叉路口的交通流進(jìn)行相位劃分時(shí)有通行沖突的交通流是不能劃分成一組,基于上述原則,單個(gè)十字交叉路口可分為4個(gè)相位:南北直行、南北左轉(zhuǎn)、東西直行、東西左轉(zhuǎn).
圖1 交叉路口車道示意圖
自1980年開始人工神經(jīng)網(wǎng)絡(luò)得到快速發(fā)展,它通過模擬人的生物神經(jīng)系統(tǒng),使得神經(jīng)網(wǎng)絡(luò)具備聯(lián)想記憶、非線性映射、分類識(shí)別和優(yōu)化計(jì)算等能力. 目前神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于信息處理、自動(dòng)化、工程、經(jīng)濟(jì)、醫(yī)學(xué)等領(lǐng)域[8]. 人工神經(jīng)網(wǎng)絡(luò)根據(jù)結(jié)構(gòu)可分為前饋神經(jīng)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò). 典型的3層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下:
在前饋神經(jīng)網(wǎng)絡(luò)中隱含層接收輸入層的結(jié)果并輸出至輸出層,整個(gè)神經(jīng)網(wǎng)絡(luò)中并未有反饋,一種單向多層結(jié)構(gòu),每一層包含多個(gè)神經(jīng)元,同層的神經(jīng)元之間沒有互相連接. 典型的前饋神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò). 交叉路口的交通流具有很強(qiáng)的隨機(jī)性和非線性,很難用精確的數(shù)學(xué)模型進(jìn)行表示,而神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力[9],因而適應(yīng)于交通信號(hào)的配時(shí)控制.
遺傳算法自從20世紀(jì)六七十年代由美國(guó)Michigan大學(xué)的John Holland與其同事和學(xué)生提出來,到目前為止已經(jīng)形成了完整的理論和方法. 遺傳算法的基本思想是隨機(jī)生成初代種群,按照適者生存和優(yōu)勝劣汰的原理,逐代生成更優(yōu)解. 在每一代種群中根據(jù)個(gè)體的適應(yīng)度大小挑選個(gè)體,并通過遺傳學(xué)的遺傳算子進(jìn)行組合交叉和變異,生成出新的種群. 通過上述過程下一代種群通過自然進(jìn)化比前一代種群更加適應(yīng)環(huán)境,末代種群中的最優(yōu)個(gè)體經(jīng)過解碼可作為問題的最優(yōu)解[10].
遺傳算法的主要流程如下:
1)隨機(jī)生成1組初始種群;
2)計(jì)算種群中每個(gè)個(gè)體的適應(yīng)度函數(shù);
3)根據(jù)個(gè)體的適應(yīng)度函數(shù)值來決定哪些個(gè)體能保留;
4)將保留的個(gè)體采用交叉和變異的方法生成新的種群;
5)返回步驟2)直至停止的條件滿足.
由于遺傳算法適用于解決全局優(yōu)化問題,允許使用非常復(fù)雜的適應(yīng)度函數(shù),傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法容易在優(yōu)化過程中陷入局部最小,而遺傳算法是一種類全局最優(yōu)方法,將遺傳算法與神經(jīng)網(wǎng)絡(luò)結(jié)合起來,不但能發(fā)揮神經(jīng)網(wǎng)絡(luò)的非線性映射能力同時(shí)可使得神經(jīng)網(wǎng)絡(luò)能很快地收斂. 因而遺傳算法在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中得到廣泛的應(yīng)用[10].
路側(cè)單元(RSU)通過DSRC/LTE- V通信方式與交叉路口的車輛上的車載單元(OBU)通信,從而獲取車輛的位置信息和速度信息,通過匹配RSU中存儲(chǔ)的交叉路口的地圖信息,可計(jì)算出交叉路口每一輛車所在的車道,當(dāng)同一車道離路口停止線車輛的速度都小于5 km/h時(shí),則認(rèn)定這些車輛正在排隊(duì),通過計(jì)算該車道最遠(yuǎn)的排隊(duì)車輛至路口停止線的距離,可得到該車道的排隊(duì)長(zhǎng)度. 通過上述方式可獲得交叉路口每個(gè)車道對(duì)應(yīng)的排隊(duì)長(zhǎng)度.
(1)
本文中神經(jīng)網(wǎng)絡(luò)的輸入為4組紅綠燈相位對(duì)應(yīng)的車道的最大排隊(duì)長(zhǎng)度,其計(jì)算如式(1).公式中L1,…,L8分別表示十字路口車道1~8的車輛排隊(duì)長(zhǎng)度.I1,…,I4分別表示神經(jīng)網(wǎng)絡(luò)的輸入.神經(jīng)網(wǎng)絡(luò)的輸出為4組紅綠燈相位對(duì)應(yīng)的綠燈時(shí)長(zhǎng)T1,…,T4.由于RSU的計(jì)算能力不能滿足神經(jīng)網(wǎng)絡(luò)計(jì)算的需求在交叉路口側(cè)增加邊緣計(jì)算單元(MEC),神經(jīng)網(wǎng)絡(luò)和遺傳算法的計(jì)算在MEC中實(shí)現(xiàn). 整個(gè)基于網(wǎng)聯(lián)的交叉路口動(dòng)態(tài)配時(shí)系統(tǒng)的數(shù)據(jù)流向 (見圖2).
圖2 基于網(wǎng)聯(lián)的交叉路口動(dòng)態(tài)配時(shí)系統(tǒng)數(shù)據(jù)流圖
傳統(tǒng)的訓(xùn)練神經(jīng)網(wǎng)絡(luò)參數(shù)的方法有梯度下降法、牛頓法、Levenberg-Marquardt算法、柯西- 牛頓法等. 這些方法通過定義一個(gè)目標(biāo)函數(shù),通過對(duì)目標(biāo)函數(shù)進(jìn)行求導(dǎo),不斷地迭代使目標(biāo)函數(shù)值不斷地減少,直至迭代結(jié)束找到合適的神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置. 對(duì)應(yīng)交叉路口的神經(jīng)網(wǎng)絡(luò)動(dòng)態(tài)配時(shí)方法,常用的目標(biāo)函數(shù)為交叉路口車輛的行程時(shí)間最短、交叉路口車輛的等待時(shí)間最短、交叉路口的排隊(duì)長(zhǎng)度最短等. 這些目標(biāo)函數(shù)與交叉路口的不同相位的綠燈時(shí)長(zhǎng)之間存在復(fù)雜的非線性關(guān)系,不能用精確的數(shù)學(xué)公式表示,因而不能通過對(duì)上述目標(biāo)函數(shù)求導(dǎo)獲取配時(shí)所對(duì)應(yīng)神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置. 上述原因?qū)е鲁R?guī)的訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法不能對(duì)交叉路口配時(shí)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練. 由于遺傳算法不需要對(duì)目標(biāo)函數(shù)進(jìn)行求導(dǎo),本論文通過遺傳算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù).
為了驗(yàn)證本論文提出的方法,交叉路口交通流仿真通過SUMO實(shí)現(xiàn),仿真效果圖如圖3所示. SUMO是一款開源微觀交通流仿真軟件,它能有效地模擬十字交叉路口的交通流. 本次研究設(shè)置交叉路口的南北方向和東西方向?qū)?yīng)的車流量約為400 pcu/h,南北左轉(zhuǎn)和東西左轉(zhuǎn)對(duì)應(yīng)的車流量約為200 pcu/h. 選取的仿真時(shí)長(zhǎng)為1 h,在1 h內(nèi)車輛出現(xiàn)的方向是隨機(jī)的. 交叉路口紅綠燈的配時(shí)算法在MATLAB 2018b中實(shí)現(xiàn). 遺傳算法訓(xùn)練前饋神經(jīng)網(wǎng)絡(luò)參數(shù)通過GOAT工具箱實(shí)現(xiàn). 整個(gè)仿真系統(tǒng)的框架如圖4所示. 在仿真系統(tǒng)中每隔1個(gè)紅綠燈周期獲取1次整個(gè)周期內(nèi)不同相位對(duì)應(yīng)車道的最大排隊(duì)長(zhǎng)度,通過配時(shí)計(jì)算出下一周期不同相位綠燈時(shí)長(zhǎng). 本次實(shí)驗(yàn)所有的實(shí)驗(yàn)車輛都為網(wǎng)聯(lián)車輛,路側(cè)的RSU可實(shí)時(shí)獲取道路上所有網(wǎng)聯(lián)車輛的位置、速度等車輛信息.
圖3 SUMO仿真效果圖
圖4 動(dòng)態(tài)配時(shí)仿真框架圖
文中神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置見表1和遺傳算法的參數(shù)設(shè)置見表2.
表1 前饋神經(jīng)網(wǎng)絡(luò)的參數(shù)
表2 遺傳算法的參數(shù)
為了對(duì)比采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)的動(dòng)態(tài)配時(shí)方法的效果,本論文選擇兩種不同適應(yīng)度函數(shù).
適應(yīng)度函數(shù)1如式(2)所示
(2)
適應(yīng)度函數(shù)2如式(3)所示
(3)
式中Tω表示交叉路口平均每輛車的等待時(shí)間.
本文提出的動(dòng)態(tài)配時(shí)方法與固定配時(shí)方法的效果對(duì)比見表3. 其中固定配時(shí)方法根據(jù)韋伯斯特公式計(jì)算出東西直行和南北直行的綠燈時(shí)長(zhǎng)為42 s,東西左轉(zhuǎn)和南北左轉(zhuǎn)對(duì)應(yīng)的綠燈時(shí)長(zhǎng)為22 s,對(duì)應(yīng)的周期時(shí)長(zhǎng)為140 s. 遺傳算法是根據(jù)上一周期的車輛排隊(duì)長(zhǎng)度來計(jì)算下一次的配時(shí)方案,因此其在仿真過程中的計(jì)算的配時(shí)方案是在不斷地調(diào)整. 通過SUMO仿真可得到仿真過程中不同的配時(shí)方法計(jì)算出平均車輛等待時(shí)間見表3.
表3 不同配時(shí)方法的車輛平均等待時(shí)間對(duì)比表 s
由表3可得到與固定配時(shí)方案對(duì)比,選用適應(yīng)度函數(shù)1的神經(jīng)網(wǎng)絡(luò)配時(shí)方案能減少7.45%平均車輛等待時(shí)間;選用適應(yīng)度函數(shù)2的神經(jīng)網(wǎng)絡(luò)配時(shí)方案能減少5.53%平均車輛等待時(shí)間.
本論文通過V2I技術(shù)構(gòu)建了單個(gè)十字交叉路口基于網(wǎng)聯(lián)車輛信息的信號(hào)燈動(dòng)態(tài)配時(shí)方法,該方法通過網(wǎng)聯(lián)車輛的信息計(jì)算出路口的排隊(duì)長(zhǎng)度做成神經(jīng)網(wǎng)絡(luò)的輸入,不同相位的綠燈時(shí)長(zhǎng)作為神經(jīng)網(wǎng)絡(luò)輸出,并通過遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù). 最后搭建了SUMO、MATLAB聯(lián)合仿真驗(yàn)證平臺(tái)用于驗(yàn)證本論文提出的信號(hào)配時(shí)方法的有效性. 仿真實(shí)驗(yàn)結(jié)果表明:采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)配時(shí)方法能減少十字交叉路口的平均車輛等待時(shí)間.