錢坤 張建 婁歡 任勇 夏婷婷
摘要:目前,城市道路交通擁堵問題是亟待解決的城市管理難題之一,而交通流擁堵的預(yù)測對城市的交通管理至關(guān)重要。交通流密度是交通流狀態(tài)的重要指標(biāo),交通流密度的預(yù)測對交通流狀態(tài)的預(yù)測具有重要的意義。本文采用模糊信息粒化和支持向量機(jī)的組合模型對交通流的擁堵情況進(jìn)行預(yù)測,通過數(shù)據(jù)降噪、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)信息?;忍幚?,然后利用支持向量機(jī)(SVM)分類回歸預(yù)測模型對處理后的數(shù)據(jù)進(jìn)行回歸預(yù)測,預(yù)測結(jié)果較為精確,可以很好地預(yù)測交通流飽和度的發(fā)展趨勢和區(qū)間范圍,對交通管理具有很高的參考價值。
關(guān)鍵字:模糊信息?;?;支持向量機(jī);小波變換;數(shù)據(jù)標(biāo)準(zhǔn)化;交通流擁堵預(yù)測
Abstract:At present, traffic congestion is one of the challenges in urban management, while, prediction of traffic congestion is essential to traffic management. Traffic density is an important indicator of the traffic flow, density prediction of traffic flow is of important significance. This article uses a combined model of fuzzy information granulation and support vector machine to predict the traffic congestion, we carry out denoising, data normalization, data information granulation before using support vector machine to accomplish classification and regression prediction, prediction results is accurate. The model does better in prediction of trend and range of traffic density and has high reference value for traffic management.
Keywords: Fuzzy Information Granulation; Support Vector Machine; Wavelet Transform; Data Normalization; Congestion Prediction.
1 引 言
城市道路擁堵問題是大城市管理中主要的社會難題之一,嚴(yán)重影響城市居民的出行效率,特別是近些年來,盡管完成了一大批城市道路基礎(chǔ)設(shè)施的建設(shè),但是交通基礎(chǔ)設(shè)施的建設(shè)很難滿足交通需求的發(fā)展速度,城市交通的供需矛盾依然嚴(yán)峻。然而,交通基礎(chǔ)設(shè)施的建設(shè)不僅嚴(yán)重浪費(fèi)社會資源,同時由于建設(shè)周期長,很難及時有效地緩解交通供需矛盾,因此,交通管理和決策勢必成為較為經(jīng)濟(jì)合理有效的路徑,進(jìn)而,有效的交通狀態(tài)預(yù)測為交通管理提供科學(xué)有效的支撐顯得尤為重要。
城市道路交通流狀態(tài)的預(yù)測是智能交通一項(xiàng)重要的研究內(nèi)容,根據(jù)交通流的平均速度、流量、密度和道路飽和率等評價指標(biāo)將交通流劃分為不同的狀態(tài),例如Stutz C等利用多元型聚類(FCMP)方法以速度為指標(biāo)將交通流基本圖分為自由流、密集流、擁擠流、阻塞流4個區(qū)域;廖瑞輝等利用云—支持向量機(jī)模型在交通流量、車輛速度、交通密度指標(biāo)預(yù)測基礎(chǔ)上評定交通流的狀態(tài)并建立了交通擁堵預(yù)警機(jī)制; poriklif等直接在壓縮域提取擁擠特征,利用高斯混合隱馬爾可夫模型來檢測交通狀況。
城市道路交通流密度是交通流狀態(tài)評價的重要指標(biāo),為簡單起見,本文僅對交通流密度進(jìn)行預(yù)測分析,而交通流量、車輛速度等指標(biāo)預(yù)測分析和交通流密度預(yù)測分析原理相同,在此不做過多分析。
2 交通流擁堵預(yù)測建模
本文把交通流擁堵預(yù)測模型分為數(shù)據(jù)降噪、數(shù)據(jù)標(biāo)準(zhǔn)化、模糊信息?;突貧w分析預(yù)測四個組成部分,以下針對每一部分進(jìn)行詳細(xì)闡述。
2.1 數(shù)據(jù)降噪處理
城市道路交通系統(tǒng)主要受交通出行、道路條件和交通管理等因素的影響,因此在一定的道路條件和交通管理情況下,城市道路交通隨著出行早晚高峰而呈現(xiàn)相對穩(wěn)定的變化規(guī)律;然而,交通系統(tǒng)是人車路環(huán)境綜合作用的復(fù)雜系統(tǒng),因此城市道路交通因人車路環(huán)境隨機(jī)因素的影響呈現(xiàn)隨機(jī)性波動。對道路交通流的狀態(tài)基本規(guī)律預(yù)測需要減弱隨機(jī)性波動的影響,因此需要對數(shù)據(jù)進(jìn)行降噪處理。
數(shù)據(jù)降噪方法主要包括基于時域或空間域的方法和基于頻率域的方法,基于時域或空間域的方法常用的有: N點(diǎn)平均濾波、中值濾波、標(biāo)準(zhǔn)高斯濾波及自適應(yīng)濾波;基于頻率域的方法常用的有:傅立葉變換和小波變換。
傅立葉變換是在整體上將信號分解為不同頻率分量 ,只能在頻率域范圍內(nèi)表述,而缺乏局域性信息,小波變換對信號進(jìn)行多層次分解,在各個層次選擇閾值,對噪聲成分進(jìn)行抑制,更加靈活。本文采用數(shù)據(jù)小波變換處理來降低隨機(jī)性造成的數(shù)據(jù)噪聲。
小波變換分析能夠針對某時間段內(nèi)的信號的頻率信息,即對時間序列信號采取多層分解策略,每一步分解得到分解信號的低頻部分和高頻部分,逐步分解N層就會得到最終的低頻信息和每層產(chǎn)生的N層高頻信息。
該方法能夠很好地解決Z-Score標(biāo)準(zhǔn)化方法存在的變異程度上的差異相同的不足。標(biāo)準(zhǔn)化的數(shù)據(jù)通過分析運(yùn)算后,將分析運(yùn)算得到的結(jié)果進(jìn)行逆向標(biāo)準(zhǔn)化處理即可把結(jié)果恢復(fù)到標(biāo)準(zhǔn)化之前的量綱。
綜上所述,本文不存在數(shù)據(jù)變量間變異程度上差異的比較,選擇Z-Score標(biāo)準(zhǔn)化方法對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
2.3 模糊信息粒化
信息粒是一些相似度、功能性、接近性、一致性以及可識別性元素的集合,信息?;菍⒀芯繑?shù)據(jù)整體分解為離散的信息粒的過程,信息?;饕P陀谢诖植诩碚摰哪P?、基于模糊集理論的模型和基于商空間理論模型,這三種模型具備不同的特點(diǎn)又在功能上相互補(bǔ)充。
交通流擁堵狀態(tài)的界定存在一定的模糊性,同時由于城市交通系統(tǒng)受出行、道路條件以及交通管理等因素影響,交通流是人車路和環(huán)境的綜合影響,呈現(xiàn)不確定性,然而,相鄰較短時間段內(nèi)交通流的狀態(tài)又呈現(xiàn)相對的穩(wěn)定性,因此我們對數(shù)據(jù)進(jìn)行模糊信息?;幚?,每個信息粒代表某個時間段的模糊性和不確定性。
模糊信息粒化分為時間窗口劃分和時間窗口模糊化兩個步驟,對交通流密度數(shù)據(jù)進(jìn)行時間窗口劃分時,假定交通流的在5min時間段內(nèi)保持相對穩(wěn)定,其時間窗口 ;針對?;蟮臅r間窗口模糊化常用的基本形式包括高斯型、拋物線型、三角形和梯形,在此采用較為簡單的三角形模糊粒子,其隸屬函數(shù)形式如式(7):
(7)
數(shù)據(jù)經(jīng)過模糊信息?;罂梢杂梢幌盗械男畔⒘?代表,其中,a表示相應(yīng)時間窗口原始數(shù)據(jù)的最小值,m代表相應(yīng)時間窗口原始數(shù)據(jù)的平均水平,b表示相應(yīng)時間窗口原始數(shù)據(jù)的最大值。
2.4 數(shù)據(jù)回歸預(yù)測
數(shù)據(jù)回歸分析模型除了傳統(tǒng)的線性和非線性回歸分析等方法之外,應(yīng)用較為廣泛的還有人工神經(jīng)網(wǎng)絡(luò)模型、決策樹模型、貝葉斯分類器和支持向量機(jī)模型。
支持向量機(jī)(SVM)用于模式分類和非線性回歸分析,對原始數(shù)據(jù)通過特定的核函數(shù)映射的高維空間,使得在高維空間達(dá)到線性可分的目的,其主要思想是建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣最大化,是結(jié)構(gòu)風(fēng)險最小化的近似體現(xiàn),在分類和回歸預(yù)測問題上支持向量機(jī)能夠提供好的泛化性能,然后,將分類問題轉(zhuǎn)化為二次規(guī)劃問題,因此能夠得出全局最優(yōu)解,進(jìn)而避免了存在局部極值的弊端。
基于上述支持向量機(jī)的優(yōu)勢,本文采用支持向量機(jī)進(jìn)行回歸分析建模,該回歸分析模型分為兩步,第一步利用歷史數(shù)據(jù)對模型進(jìn)行學(xué)習(xí)訓(xùn)練,第二步利用第一步訓(xùn)練好的模型對未來數(shù)據(jù)進(jìn)行回歸預(yù)測分析。
3 仿真分析
我們基于上述模型在Matlab8.0和LibSVM-3.11工具包環(huán)境中進(jìn)行編程實(shí)現(xiàn),并針對交通流一天內(nèi)每分鐘密度數(shù)據(jù)進(jìn)行仿真分析,我們把一天1 440個交通流密度數(shù)據(jù)?;癁?88個信息粒數(shù)據(jù),利用前287個數(shù)據(jù)對回歸預(yù)測模型進(jìn)行訓(xùn)練學(xué)習(xí),利用訓(xùn)練好的模型對最后一個信息粒進(jìn)行預(yù)測分析。
圖1表示的是對交通流密度原始數(shù)據(jù)進(jìn)行小波變換降噪處理前后的對比圖,灰色線圖表示未經(jīng)降噪處理的交通流密度的曲線圖,藍(lán)色線圖表示交通流密度經(jīng)過小波變換降噪后的曲線圖,對比發(fā)現(xiàn),小波變換能夠?qū)煌髅芏葦?shù)據(jù)很好地降噪處理。
對降噪處理的數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理以消除量綱的影響,接下來對標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行模糊信息?;:畔⒘;玫降男畔⒘0總€時間窗口的最大最小值和均值,由此對信息粒的最大最小值以及均值分別做回歸預(yù)測分析,核函數(shù)采取徑向基核函數(shù),支持向量機(jī)的懲罰函數(shù)參數(shù)和核函數(shù)參數(shù)的尋優(yōu)采取網(wǎng)格搜索的算法。
圖2表示回歸預(yù)測模型的訓(xùn)練效果圖和最大最小值和均值預(yù)測值的點(diǎn)線圖,橫縱標(biāo)表示一天24小時的時間序列,縱坐標(biāo)是交通流密度的取值。(a)展示的是支持向量機(jī)回歸預(yù)測模型的訓(xùn)練效果圖,從圖中可以看出,回歸預(yù)測模型訓(xùn)練后的預(yù)測結(jié)果能夠跟訓(xùn)練數(shù)據(jù)貼合得很緊密,由此可以看出支持向量機(jī)回歸預(yù)測模型能夠?qū)煌髅芏茸龊芎玫幕貧w預(yù)測;(b)表示交通流密度預(yù)測的最大最小值以及均值,發(fā)現(xiàn)預(yù)測的均值全部包含在最大最小值組成的取值區(qū)間內(nèi),最大最小值和均值的預(yù)測值能夠很好地展示原始數(shù)據(jù)的發(fā)展趨勢。
圖3表示交通流密度預(yù)測的最大最小值之差,橫坐標(biāo)表示一天時間序列,縱坐標(biāo)range是最大最小值之差構(gòu)成的交通流密度取值區(qū)間的范圍,即 , 分別表示交通流密度預(yù)測的最大最小值,其中,誤差 的占80.6%,由此可見模型能夠準(zhǔn)確地預(yù)測交通流密度的取值區(qū)間。
表1是基于模糊信息?;椭С窒蛄繖C(jī)組合模型對未來1個時間段內(nèi)交通流密度的預(yù)測值和實(shí)際值以及預(yù)測相對誤差的信息表,對比最大值最小值以及均值的實(shí)際值和預(yù)測值可以得出,相對誤差在10%左右,模型的預(yù)測結(jié)果較為精確,能夠很好地預(yù)測交通流密度的發(fā)展趨勢和取值區(qū)間。
4 結(jié) 語
本文對城市道路交通流密度的歷史數(shù)據(jù)進(jìn)行建模分析,從數(shù)據(jù)去噪聲處理到數(shù)據(jù)標(biāo)準(zhǔn)化處理,然后模糊信息?;玫叫畔⒘#詈罄弥С窒蛄繖C(jī)對信息粒進(jìn)行回歸預(yù)測,由仿真分析可知,基于模糊信息粒化的支持向量機(jī)模型在交通流密度預(yù)測中的效果較佳,實(shí)際值和預(yù)測值的誤差基本可以控制在10%左右,從而能夠獲得城市道路交通流密度的發(fā)展趨勢,此外,該模型能夠獲得城市道路交通流密度的變化區(qū)間,對交通管理的決策具有很大的參考意義。
主要參考文獻(xiàn)
[1]Stutz C, Runkler T A. Classification and Prediction of Road Traffic Using Application-Specific Fuzzy Clustering[J]. IEEE Transactions on Fuzzy Systems,2002, 10(3):297 - 308.
[2] Porikli, Li F X. Traffic Congestion Estimation Using Hmm Models Without Vehicle Tracking[J].Intelligent Vehicles Symposium,2004IEEE:188 - 193.
[3]廖瑞輝,周晶.基于云-支持向量機(jī)的道路交通擁擠預(yù)警模型[J].系統(tǒng)工程,2015, 33(4):149-153.
[4]潘洋宇,李東波,童一飛.基于小波技術(shù)的數(shù)據(jù)降噪[J].機(jī)械設(shè)計, 2006,23(1):31-33.
[5]何韜,梁棟,李瑤.小波變換在電力諧波分析中的應(yīng)用[J].計算機(jī)技術(shù)與發(fā)展,2007, 17(1):229-232.
[6]張鈸,張鈴.問題求解理論及應(yīng)用[M].北京:清華大學(xué)出版社,1990.
[7]Zadeh L A.Towards a Theory of Fuzzy Information Granulation and its Centrality in Human Reasoning and Fuzzy Logic[J].Fuzzy Sets and Systems,1997,19(1):111-117.
[8]史峰,王小川,郁磊,李洋.Matlab神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京:北京航空航天大學(xué)出版社,2009.