劉振輝
【摘 要】針對現(xiàn)代交通中的一個重要問題:交通擁堵,現(xiàn)提出概念對交通狀況進(jìn)行實(shí)時(shí)準(zhǔn)確的預(yù)測,即能有效的緩解交通擁堵。本文提出采用多模型融合的方式,對由官方提供的數(shù)據(jù)進(jìn)行了仿真實(shí)驗(yàn),首先通過數(shù)據(jù)預(yù)處理去除噪聲數(shù)據(jù),隨后進(jìn)行四個方向的特征構(gòu)造,分別為:道路基本信息、短時(shí)間內(nèi)道路上下游數(shù)據(jù)、幾天前此時(shí)刻的交通數(shù)值、基本時(shí)間特征,再通過xgboost模型與lightbm兩種算法進(jìn)行訓(xùn)練加權(quán)融合進(jìn)行交通預(yù)測,通過實(shí)驗(yàn)仿真驗(yàn)證該方法能夠準(zhǔn)確的進(jìn)行道路交通流量的實(shí)時(shí)預(yù)測。
【關(guān)鍵字】智能交通;xgboost;lgbm
中圖分類號: U491.14 文獻(xiàn)標(biāo)識碼: A 文章編號: 2095-2457(2018)02-0221-002
【Abstract】in view of one of the important problems in modern transportation: traffic jam, the concept of real-time and accurate prediction of traffic condition is put forward, which can effectively relieve traffic congestion.
Proposed in this paper with the method of multi-model fusion, has carried on the simulation to the data provided by the official, first by data preprocessing to remove noise data, then the characteristic structure of four directions, respectively is: the road basic information, in a short period of time road traffic of upstream and downstream data, a few days ago, the time value, the basic time characteristics, and then by xgboost model and lightbm two traffic prediction algorithm to train the weighted fusion, through the experiment result indicates that the method can accurately in real-time prediction of road traffic flow.
【Key words】Intelligent transportation;Xgboost;LGBM
0 引言
智能交通系統(tǒng)(Intelligent Transportation System)簡稱ITS[1],早在上個世紀(jì)就已經(jīng)提出這個概念,它是將多學(xué)科多技術(shù)領(lǐng)域進(jìn)行融合的系統(tǒng)?,F(xiàn)代智能交通也是基于ITS的開發(fā),如今對于交通擁堵的措施依然是采用觀察到擁堵,再進(jìn)行交通交管,所造成的問題就是響應(yīng)時(shí)間長,采取措施有延遲,并不能準(zhǔn)確的進(jìn)行有效的控制,先通過歷史數(shù)據(jù)可以準(zhǔn)確的預(yù)測出接下來時(shí)刻的多道路的交通流量變化,可以做到提前預(yù)防,并且多多路段的預(yù)測,可以實(shí)現(xiàn)對癥下藥,對正確的上游路段或者下游路段采取措施。隨著計(jì)算能力的提高,人工智能的飛速發(fā)展,今年來對于交通流量的預(yù)測也成為交通部門的重點(diǎn)研究問題。
短時(shí)交通流量預(yù)測,近幾年中對應(yīng)推出的算法也有很多種[2-7],但由于數(shù)據(jù)封鎖,計(jì)算能力的限制,對交通流量預(yù)測能力也限制在一定的程度。本文針對由官方提供的實(shí)時(shí)的132條道路的3,4,5,6四個月每個時(shí)刻的實(shí)時(shí)交通數(shù)據(jù),進(jìn)行仿真實(shí)驗(yàn)最終實(shí)驗(yàn)提高對交通流量的準(zhǔn)確預(yù)測。
1 數(shù)據(jù)預(yù)處理
根據(jù)真實(shí)交通流量數(shù)據(jù),我們需要預(yù)先做數(shù)據(jù)預(yù)處理去掉噪聲數(shù)據(jù),幾個月里有特殊節(jié)假日前后對交通流量影響較大,根據(jù)國家的法定假日時(shí)間去掉節(jié)假日以及前一天和后一天的數(shù)據(jù),以及針對離群值過大的數(shù)據(jù)和峰值偏差過大的數(shù)據(jù)也采用舍棄防止影響總體預(yù)測效果,針對缺失值采用取平均值補(bǔ)全策略。
2 特征提取
本文對交通數(shù)據(jù)提取特征主要分為四方面:
i、道路基本信息,包括道路的長度寬度,以及道路的等級
ii、根據(jù)歷史數(shù)據(jù)k天前的交通流量數(shù)據(jù)構(gòu)造時(shí)間數(shù)據(jù)特征
iii、為短時(shí)的交通流量信息,與每條道路相連的其他道路的交通流量信息構(gòu)造特征
iv、基本時(shí)間特征,針對時(shí)間序列構(gòu)造滑動窗口構(gòu)造時(shí)間信息特征,滑動窗口變相增加樣本數(shù)據(jù)量,增加預(yù)測精度
3 模型訓(xùn)練及融合
本文采用根據(jù)已有的算法進(jìn)行加權(quán)融合構(gòu)造訓(xùn)練模型,首先根據(jù)4類構(gòu)造的特征每一類都做出相應(yīng)的模型,根據(jù)特征的類型分為離散型和連續(xù)型,針對連續(xù)型特征本文采用改進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,針對離散型特征本文采用XGBOOST與LIGHTGBM兩種新型改進(jìn)梯度提升樹算法分別進(jìn)行預(yù)測,將兩類算法算法的預(yù)測結(jié)果進(jìn)行BAGGING提高精度,再根據(jù)多種算法的預(yù)測結(jié)果進(jìn)行加權(quán)融合,權(quán)重系數(shù)采用線下訓(xùn)練集合的正確率做系數(shù),正確率越高的模型權(quán)重值越大,最終融合多個模型最終得到預(yù)測的結(jié)果。
4 結(jié)論
經(jīng)過試驗(yàn)得到較高的準(zhǔn)確率,通過構(gòu)造的準(zhǔn)確率函數(shù)對比原有的基本時(shí)間序列處理算法,ARM以及神經(jīng)網(wǎng)絡(luò)算法決策樹類基本的算法,采用加權(quán)融合的策略,有效的提升了預(yù)測的準(zhǔn)確度。對于未來我們可以根據(jù)更加多的數(shù)據(jù)訓(xùn)練處更加有效更加智能的預(yù)測系統(tǒng),為智能交通提供準(zhǔn)確的道路預(yù)測信息。(下轉(zhuǎn)第170頁)
(上接第221頁)
【參考文獻(xiàn)】
[1]Rosen D A,Mammano F J,F(xiàn)avout R.An electronic route-guidance system for highway vehicles.Vehicular Technology, IEEE Transactions on,1970,19(1):143-152.
[2]Schvaneveldt R W. Pathfinder associative networks: Studies in knowledge organization. Ablex Publishing,1990.
[3]Figueiredo L,Jesus I,Machado J,Etal.Towards the development of intelligent transportation systems Intelligent Transportation Systems.2001,88:1206-1211.
[4]張婉琳.遺傳算法優(yōu)化支持向量機(jī)的交通流量預(yù)測[J]. 激光雜志,2014,35(12):116-119.
[5]韋凌翔.基于RVM和ARIMA的短時(shí)交通流量預(yù)測方法研究[D].長安大學(xué),2016.
[6]許麗.基于多源數(shù)據(jù)的通勤高峰期交通流量預(yù)測方法[D].西南交通大學(xué),2017.
[7]劉寧.基于組合模型的佳通流量預(yù)測方法[D].華東理工大學(xué),2010.