溫峻峰,李 鑫,張浪文
(1.中科天網(廣東)科技有限公司,廣東 廣州 510070;2.華南理工大學自動化科學與工程學院,廣東 廣州 510640)
近年來,智能交通系統(tǒng)得到迅猛發(fā)展并趨于成熟。智能交通系統(tǒng)的運用能很好地調節(jié)交通運行,降低城市交通的擁堵程度和提高路網運行的效率[1-2]。智能交通系統(tǒng)是通過整合各種先進的技術,采集實時的交通數據,分析當前的交通情況,利用一定的控制方法對交通系統(tǒng)進行科學合理的控制[3-5]。智能交通系統(tǒng)的實現,需要基于對道路未來的擁堵情況的預測。
針對交通流的預測,已有諸多成果出現。裴玉龍、王曉寧利用神經網絡對交通流預測模型進行了研究,分析了各種因素對交通的影響[6]。苑文江將廣義神經網絡應用于交通流的預測,在傳統(tǒng)的神經網絡的基礎上,構造了一種新的智能神經元模型[7]。Tharam S.Dillon針對現實世界中交通流的時變性、隨機性等特性,研究了智能粒子群算法[8]。趙建玉、賈磊等提出了基于粒子群優(yōu)化算法的神經網絡模型。該模型以神經網絡為基礎,提高了模型的預測精度[9]。針對交通飽和度的預測,一種基于基因遺傳算法的最小支持向量回歸方法被提出[10]。針對短時交通流的預測,唐智慧等提出基于交互式模型的短時交通流預測方法[11],孫靜怡等提出了考慮大型車因素的支持向量機短時交通狀態(tài)預測模型[12]。
上述研究成果主要集中在對車流量的預測,而交通飽和度是對交通流量等多種交通數據的綜合體現,能夠很好地表征道路的擁堵狀況。因此,本文通過開展車道飽和度預測建模方法研究,以期對道路未來的擁堵狀況進行預測,指導合理選擇出行時機,為道路間協調運行做好鋪墊。該研究是實現智能交通系統(tǒng)的重要一環(huán)。
在城市交通路網中,通過信號燈可以合理控制車流,最大化路網運行效率。信號周期對交通狀況有著很大的影響。周期越長,越多的車輛能夠在一個周期中通過路口,路網的運行效率也就更高。在一個控制周期內,車道運行有多種相位。在實際的交通系統(tǒng)中,通常采取四相位的控制方式,即整個路口車道在一個信號周期內共有四種不同的組合運行方式。相位數目的增加會使得路口交通的靈活性增加,提高路網運行效率。但相位數過多,會導致車輛等待時間過長,容易引起擁堵。
飽和度由于能夠衡量在一個綠燈時間內未浪費的時間,即有車輛通過的時間與整個綠燈時間之比,因此可以表征道路擁堵狀況。交通越擁堵,綠燈時車輛通過的數目就越多,相應的飽和度值也就越大。由此可見,擁堵程度與飽和度成正比關系。本文選取飽和度作為預測對象,以預測未來的交通狀況。
飽和度S的計算公式為:
(1)
式中:g為綠燈時間;T為車道空閑時間;n為通過的車輛數;MF為每小時最大(即道路滿載時)流量;t為車輛通過檢測器的平均時間。
在已有的交通狀況的預測研究中,選取折合車流量為預測對象。折合車流量CF在一定程度上能衡量交通的擁堵程度。CF的計算公式如下:
(2)
飽和度概念考慮了不同車輛型號對交通狀況會產生的影響。車流量衡量的是通過路口的車輛的數目,一輛大卡車和一輛小出租車對車流量的貢獻是相同的,但它們造成的交通擁堵程度不同。因此,本文開展車道飽和度預測建模方法的研究。
作為目前先進的城市信號交通控制系統(tǒng),悉尼自適應交通控制系統(tǒng)能對交通系統(tǒng)數據進行實時采集與處理,能采集相應車道的相位起始時間、相位長度、信號周期長度、車流量、綠燈時長等交通數據?;谶@些原始數據,能夠計算出該車道的折算飽和度。悉尼自適應交通控制系統(tǒng)的數據格式如表1所示。
表1 數據格式Tab.1 Formats of data
交通數據由安裝在各個車道的傳感器檢測、采集得到,并傳給中央的計算機控制系統(tǒng)。交通路口各項參數數據如圖1所示。
由圖1可知,在某些時間點,飽和度的變化非常急劇,在高峰期時段,甚至有些點的飽和度突然變?yōu)?。從實際考慮,這幾乎是不可能的。這是由于硬件設施發(fā)生故障,所帶來數據丟失和異常問題。本文首先進行數據進行預處理,用數據濾波方法解決數據缺失、異常等問題。
本文考察某路口前后信號周期車道飽和度如圖2所示。其最大飽和度之差為50輛,縱坐標是該飽和度之差出現的頻率。
圖1 交通路口各項參數數據Fig.1 Parameter data of traffic intersection
圖2 前后信號周期車道飽和度示意圖Fig.2 Traffic lane saturation of frant and back signal cycle
由圖2可知,飽和度之差為50輛對應的頻率極小??紤]到在相鄰的兩個信號周期之間的飽和度不可能發(fā)生很大的變化,需要將出現很大的飽和度之差的點的數據剔除掉。本文剔除異常信號周期數據,并采用剔除數據前后一個信號周期飽和度的平均值代替異常點數據。數據處理結果如圖3所示。
圖3 數據處理結果Fig.3 Data processing results
由于交通系統(tǒng)采集的數據有12種(如表1),如果將這些數據都選為模型輸入,將會使得建模極其復雜,而且可能會發(fā)生數據冗余問題,因此需要對輸入數據進行選擇。主成分分析法采用的是一種數據降維的思路,在原始的變量中提煉出部分關聯性很弱的變量。這部分變量攜帶著原始變量的大部分特征。利用這部分的變量代替原始變量進行運算,可提升運算速度。
對于一個樣本,有p個變量x1,x2,…,xp。則n個樣品的數據矩陣為:
(3)
第一步:標準化處理。其計算公式為:
(4)
第二步:計算樣本相關系數矩陣R。
(5)
經過標準化的變量的相關系數為:
(6)
第三步:用相關方法求出相關系數矩陣R的特征值(λ1,λ2,…,λp),以及相對應的特征向量ai=(ai1,ai2,…,aip),i=1,2,…,p。
第四步:提取出能夠最大程度含括原始變量數據信息量的變量。
在主成分分析中,得到的主成分的方差大小不一。這意味著它們所擁有的信息量也不相同。因此,只需要提取出擁有較大信息量的成分,剔除掉其余成分,則提取出的成分在很大程度上能代表原始變量。本文首先計算出每個成分的貢獻率,通過貢獻率的大小來確定主成分。其中,貢獻率的計算公式如下:
(7)
貢獻率可以用來衡量相應成分攜帶原始變量特征的比例大小。其值越大,說明該成分所攜帶的原始變量的特征就越多,在一定程度上更能代表原始數據。一般通過設定一個閾值來確定主成分。本文選取閾值為95%,即提取出來的變量所包括的信息量為原來的95%。
第五步:計算主成分得分。用相關計算公式計算出每個主成分的得分Fij(i=1,2,…,n;j=1,2,…,p),構成主成分得分矩陣Ψ:
(8)
第六步:根據主成分得分,選擇相關參數代替原始的變量。所得到的數據保留了原始數據大部分的特征,因此可以用于代替原始變量進行分析,并且不失準確性。
支持向量回歸能夠較好地解決小樣本、高維數、非線性和局部極小點等實際問題。本文將采用支持向量回歸方法,對交通車道飽和度進行預測建模。在線性回歸中,對于一個給定的樣本數據,假設其對應的最優(yōu)超平面方程為:
f(x)=wTx+b
(9)
式中:f(x)為模型輸出;x為模型輸入;w、b為模型系數。
為了確定w,需要求解如下的優(yōu)化問題:
(10)
式中:A為輸入樣本數據;Y為輸出樣本數據;ξ和ξ*為松弛變量;e為有n維數據的向量;ε和C分別是松弛因子和懲罰系數。
在實際中,采用上述線性回歸方法時,精度難以達到要求。因此,引入非線性回歸求解,其回歸方程為:
f(x)=K(xT,AT)w+b
(11)
式中:K為核矩陣,矩陣各個元素Kij-k(xi,xj),k(xi,xj)為核函數。
使用拉格朗日乘子,將上述優(yōu)化問題轉換成其對偶問題:
(12)
本文先求出對偶問題的解,再利用對偶解求解出原始規(guī)劃的解,最后求得回歸方程。
在粒子群優(yōu)化算法中,每個問題的潛在解都可以看成搜索空間中的一個飛行物,將其定義為粒子。每個粒子都有著其相應的適值。該適值可以通過特定的函數計算。同時,每個粒子的屬性中還擁有一個速度。該速度決定著粒子在空間里前進的速率和方向,以確定粒子的具體位置。本文根據其適值確定一個最優(yōu)粒子;其他粒子根據最優(yōu)粒子來調整速度,在整個空間找尋最佳的解。粒子群優(yōu)化算法流程如圖4所示。
圖4 粒子群優(yōu)化算法流程圖Fig.4 Flowchart of PSO algorithm
通過主成分分析,本文選擇折合車流量、信號周期長度、綠燈時長為模型輸入。利用這些交通數據,能夠直接或間接地影響車道飽和度(即交通擁堵狀況),建立飽和度預測模型,并利用粒子群優(yōu)化算法對模型參數進行尋優(yōu)。
選擇一段時間的訓練數據(包括700組輸入輸出數據)。首先,對該數據進行濾波。然后,基于最小支持向量機方法建立預測模型。利用該模型預測結果與實測數據相比較,給出車道流飽和度預測的對比圖,說明該模型具有較好的擬合效果。車道飽和度預測結果(訓練數據)如圖5所示。
圖5 車道飽和度預測結果(訓練數據)Fig.5 Prediction results of traffic lane saturation (training data)
進而,本文選擇另一段時間的數據,以驗證所建立預測模型的有效性。測試集預測結果(測試數據)如圖6所示。
圖6 測試集預測結果(測試數據)Fig.6 Prediction results of the test set(testing data)
從圖6可以看出,該模型對于測試集的預測精度較高,與訓練集的結果相近;預測數據與實際數據的差異不大,擬合程度較高。由此說明了該預測模型的有效性。
本文引入實測交通數據,基于主成分分析方法選擇折合車流量、信號周期長度、綠燈時長作為模型輸入,對城市交通車道飽和度建立了預測模型。所建立的預測模型基于支持向量回歸方法,可利用粒子群優(yōu)化算法對模型參數進行尋優(yōu),并通過數據仿真驗證了所提出方法的有效性。本文結果對道路未來的擁堵狀況進行預測,指導合理選擇出行時機,對道路間協調運行具有一定的參考意義。