沈富鑫,邴其春,張偉健,胡嫣然,黃 河
(1. 青島理工大學(xué) 機械與汽車工程學(xué)院,山東 青島 266520;2. 青島市交通運輸公共服務(wù)中心,山東 青島 266100)
及時、精確的交通流預(yù)測不僅是智能交通控制和交通疏導(dǎo)的關(guān)鍵,而且準(zhǔn)確的預(yù)測結(jié)果在為出行者提供實時、有效的交通運行信息的同時,也緩解了嚴重的交通擁堵現(xiàn)象,縮短了人們的出行時間。隨著社會的進步以及計算機信息技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)模型因具有較好的容錯功能和強大的學(xué)習(xí)能力而被應(yīng)用于各行各業(yè),它展現(xiàn)出來的較好的魯棒性和非線性映射等優(yōu)良的特征特別適合交通流預(yù)測,受到了國內(nèi)外專家學(xué)者的廣泛關(guān)注和研究。不同類型神經(jīng)網(wǎng)絡(luò)的運用及其參數(shù)選擇成為研究的2個主要內(nèi)容[1-3]。為了有效提高交通流預(yù)測的精度,Wang等[4]及Zhu等[5]將交通、信息、通信等領(lǐng)域的理論與神經(jīng)網(wǎng)絡(luò)模型進行結(jié)合,結(jié)果表明,組合后神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度大幅提高。黃文明等[6]將改進的人工蜂群算法用于確定徑向基函數(shù)(RBF)網(wǎng)絡(luò)隱含層中心值和單元數(shù),訓(xùn)練建立的模型,利用獲取的4 d交通流實測數(shù)據(jù)進行驗證,證實了模型的有效性。姚志洪等[7]為了優(yōu)化信號配置,構(gòu)建了基于神經(jīng)網(wǎng)絡(luò)的小時間粒徑交通流預(yù)測模型,經(jīng)過多次實例驗證,平均預(yù)測誤差減小8.3%。錢偉等[8]將灰色算法與極限學(xué)習(xí)機(ELM)神經(jīng)網(wǎng)絡(luò)相結(jié)合,使短時交通流預(yù)測結(jié)果有了很大的改善。田瑞杰等[9]對實時數(shù)據(jù)和實例數(shù)據(jù)分別進行建模預(yù)測,構(gòu)建了反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)與時間序列相結(jié)合的模型,該模型可以有效地控制預(yù)測誤差。
隨著交通流混沌理論的不斷發(fā)展和創(chuàng)新,研究者提出了許多基于混沌理論的短時交通流預(yù)測方法。劉建華[10]聯(lián)合相空間重構(gòu)參數(shù)與支持向量回歸(SVR)參數(shù)進行優(yōu)化,構(gòu)建了相空間重構(gòu)與SVR相結(jié)合的預(yù)測模型,實測數(shù)據(jù)仿真驗證了該模型的優(yōu)良性能。李松等[11]利用遺傳算法(GA)對BPNN的權(quán)值和閾值進行優(yōu)化,優(yōu)化、訓(xùn)練后的模型經(jīng)過典型混沌序列的驗證,表現(xiàn)出了較強的非線性擬合能力和更高的預(yù)測精度。薛潔妮等[12]利用混沌時間序列建立短時交通流預(yù)測模型,驗證結(jié)果表明,該模型具有較高的預(yù)測精度,同時可以滿足實時性要求。景輝鑫等[13]利用灰色模型對交通流數(shù)據(jù)進行累加處理,以減少交通流數(shù)據(jù)隨機波動對預(yù)測結(jié)果產(chǎn)生不利影響,構(gòu)建灰色ELM神經(jīng)網(wǎng)絡(luò)模型,進一步提高了預(yù)測的精度。向昌盛等[14]利用小波分析將網(wǎng)絡(luò)流量分解成不同特征的網(wǎng)絡(luò)流量分量,然后對網(wǎng)絡(luò)流量分量的混沌特性進行分析、重構(gòu)建模與預(yù)測,經(jīng)實驗驗證,該方法預(yù)測結(jié)果穩(wěn)定,預(yù)測精度較高。雖然人工智能算法在實際應(yīng)用中取得了一定成果,但是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型收斂慢,網(wǎng)絡(luò)結(jié)構(gòu)較難確定,容易產(chǎn)生局部最小值,泛化能力較弱;雖然支持向量機適應(yīng)于小樣本,但是關(guān)鍵參數(shù)難以確定;這些問題嚴重影響著模型的推廣應(yīng)用。
針對上述方法模型的不足,為了更好地優(yōu)化模型重要參數(shù),達到模型全局最優(yōu),本文中對交通流序列信號進行混沌特性分析和識別,對混沌的交通流序列進行相空間重構(gòu);利用粒子群算法對模型中的參數(shù)進行優(yōu)化,構(gòu)建回聲狀態(tài)網(wǎng)絡(luò)(ESN)模型;提出基于ESN模型的短時交通流混沌預(yù)測方法。
相空間重構(gòu)(PSR)是混沌時間序列處理過程中非常關(guān)鍵的步驟,其本身就是一種用于研究系統(tǒng)動力學(xué)行為的方法[15],被廣泛應(yīng)用于復(fù)雜運輸系統(tǒng)的研究。依據(jù)Takens[16]提出的嵌入延遲定理,選取最佳延遲時間τ和嵌入維數(shù)m就能夠獲得一個新的系統(tǒng),并且此新系統(tǒng)能保持與原來系統(tǒng)相同的動態(tài)性能。設(shè)長度為N的交通流時間序列為{x(i),i=1,2,…,N},該序列重構(gòu)后對應(yīng)的相空間為
X(i)=(x(i),x(i+τ),…,x[i+(m-1)τ])。
(1)
對交通流時間序列進行適當(dāng)?shù)南嗫臻g重構(gòu),選取最適宜的嵌入維數(shù)和延遲時間是實現(xiàn)重構(gòu)目標(biāo)的關(guān)鍵。經(jīng)過長期研究和經(jīng)驗積累,研究者提出了多種確定嵌入維數(shù)和延遲時間的方法。這些方法在實現(xiàn)重構(gòu)過程中都有各自的優(yōu)勢。Kim等[17]提出的C-C法不僅可以使用輸入關(guān)聯(lián)積分函數(shù)同時估計延遲時間和嵌入窗寬,而且具有計算量小、操作簡單、抗干擾性強等諸多重要優(yōu)點,得到了廣泛的理論研究和實際應(yīng)用。由此,在相空間重構(gòu)的過程中,當(dāng)確定延遲時間τ和嵌入維數(shù)m時,采用具有明顯優(yōu)點的C-C法進行分析。
C-C法在運行過程中的主要基本原理是依靠時間序列中的關(guān)聯(lián)積分函數(shù),估計延遲時間τ和估算延遲時間窗τw=(m-1)τ,進而獲得嵌入維數(shù)m。關(guān)聯(lián)積分函數(shù)為
(2)
將時間序列{x(i),i=1,2,…,N}劃為t個互不相同或者互不相關(guān)的子序列,定義時間序列的檢驗統(tǒng)計量為
(3)
當(dāng)N→∞時,
(4)
(5)
(6)
(7)
ESN是一種新型的時間遞歸狀態(tài)神經(jīng)網(wǎng)絡(luò)[18],因在時間序列預(yù)測中表現(xiàn)出的卓越性能而受到廣大專家學(xué)者的關(guān)注。ESN模型結(jié)構(gòu)如圖1所示。
u(n)—輸入層激活向量,n為某特定時刻;x(n)—隱層激活向量;y(n)—輸出層激活向量;Win—神經(jīng)元輸入層-隱層連接權(quán)重矩陣;Wout—輸出連接權(quán)重矩陣。
ESN模型包括3個組成部分,即回聲輸入控制層、隱層控制層和回聲輸出控制層。含有K個輸入神經(jīng)元的輸入層激活向量為u(n)(n為某特定時刻),含有F個隱層神經(jīng)元的隱層激活向量為x(n),含有L個輸出神經(jīng)元的輸出層激活向量為y(n)。模型中輸入層激活向量、隱層激活向量及輸出層激活向量在某特定時刻n的值分別為
u(n)=(un(n),u2(n),…,uK(n))T,
(8)
x(n)=(x1(n),x2(n),…,xF(n))T,
(9)
y(n)=(y1(n),y2(n),…,yL(n))T。
(10)
與其他遞歸神經(jīng)網(wǎng)絡(luò)稍有不同,ESN是經(jīng)過改良和創(chuàng)新的新型遞歸神經(jīng)網(wǎng)絡(luò),具有很強的適應(yīng)能力。隨機連接的遞歸網(wǎng)絡(luò)通過調(diào)整內(nèi)部權(quán)值的特性實時記憶數(shù)據(jù),大幅簡化了遞歸網(wǎng)絡(luò)訓(xùn)練的過程[19]。ESN的狀態(tài)方程為
(11)
在ESN模型中,儲備池結(jié)構(gòu)是最重要的核心結(jié)構(gòu),本質(zhì)也是一種隨機運動產(chǎn)生的遞歸結(jié)構(gòu),共有4個需要待完善優(yōu)化的基本參數(shù):1)儲備池內(nèi)部網(wǎng)絡(luò)連接權(quán)矩陣的譜半徑(SR)。SR既是內(nèi)部連接權(quán)重函數(shù)矩陣絕對值的最大特征值,又是保證整個網(wǎng)絡(luò)安全穩(wěn)定的重要參數(shù)。2)儲備池的規(guī)模G。G越大,則整個網(wǎng)絡(luò)模型對動態(tài)的描述越準(zhǔn)確。3)儲備池的輸入單元尺度(IS),即單元尺度控制因子。正常來說,網(wǎng)絡(luò)模型需要處理的對象尺度越大,則IS通常越大。4)儲備池的稀疏程度(SD)。SD主要用于表示在不同儲備池中相互連接的2個神經(jīng)元所占總神經(jīng)元個數(shù)的比值,數(shù)值越大,說明線性逼近能力越強。
在對ESN模型的這4個參數(shù)進行優(yōu)化的方法選擇中,交叉驗證法、網(wǎng)格搜索法等是目前較常用的多參數(shù)優(yōu)化方法,但是這些參數(shù)優(yōu)化方法在實際計算中仍存在技術(shù)缺陷,比如計算量相對較大、運算耗時過長等。遺傳算法是一種高效的網(wǎng)絡(luò)全局最優(yōu)搜索計算方法,不僅可以有效地避免網(wǎng)絡(luò)搜索模型陷入局部最優(yōu)狀況,還具有可以通過自適應(yīng)控制搜索求得最佳解等優(yōu)點。為了更好地獲取儲備池中的最優(yōu)參數(shù),選擇遺傳算法對儲備池中的參數(shù)進行優(yōu)化。遺傳算法的具體步驟如下:
1)初始化儲備池參數(shù)編碼與遺傳算法參數(shù),并采用二進制的方式對4個待優(yōu)化參數(shù)進行編碼,建立儲備池參數(shù)與遺傳算法參數(shù)的映射關(guān)系,并隨機產(chǎn)生初始種群。
2)通過計算確定個體的適應(yīng)度。利用遺傳算法進行選擇操作的唯一標(biāo)準(zhǔn)就是適應(yīng)度函數(shù)的確定,根據(jù)已有研究確定適應(yīng)度函數(shù)值積累的經(jīng)驗,適應(yīng)度函數(shù)值選用平均絕對百分比誤差(MAPE)的倒數(shù)。
3)根據(jù)適應(yīng)度優(yōu)化函數(shù)的確定值,在變異的個體中選擇適應(yīng)度較高的染色體,然后隨機交換各種不同染色體基因的交叉概率,對互換后的染色體基因變異概率重新進行編碼處理,觀察是否滿足設(shè)定的條件。
4)重復(fù)以上步驟,直到滿足結(jié)束條件。
遺傳算法參數(shù)尋優(yōu)流程圖如圖2所示。
圖2 遺傳算法參數(shù)尋優(yōu)流程圖
為了改善驗證結(jié)果的可靠性,本文中的實驗數(shù)據(jù)來源于上海市南北高架快速路感應(yīng)線圈采集到的實測交通流數(shù)據(jù),為全天24 h、連續(xù)5 d的實測交通流數(shù)據(jù)。以每5 min一次的采集周期,共獲取1 440個實際交通流數(shù)據(jù)。連續(xù)5 d的交通流量如圖3所示。
圖3 上海市南北高架快速路感應(yīng)線圈采集到的連續(xù)5 d的交通流量
曲線
通過計算關(guān)聯(lián)維數(shù)并觀察關(guān)聯(lián)維數(shù)是否達到飽和,識別交通流時間序列是否存在混沌特性。在隨機序列和混沌序列中,關(guān)聯(lián)維數(shù)都會隨著嵌入維數(shù)的增加而增大,但是隨著嵌入維數(shù)增至一定程度,混沌序列中的關(guān)聯(lián)維數(shù)會趨于飽和[20]。圖5所示為交通流時間序列的lnC(r)與lnr的關(guān)系曲線。由圖可知,lnC(r)與lnr的關(guān)系曲線隨著嵌入維數(shù)的增加而逐漸趨于平行,達到飽和狀態(tài),由此可以說明,交通流時間序列存在很強的混沌特性。
r—相鄰域的半徑;C(r)—關(guān)聯(lián)積分函數(shù)。
采用遺傳算法對ESN模型的4個參數(shù)設(shè)定分別進行二次尋優(yōu)。遺傳算法的4個參數(shù)設(shè)定配置如下:變異種群發(fā)生規(guī)模為20,交叉發(fā)生概率的閾值為0.8,變異發(fā)生概率的閾值為0.1,最大迭代次數(shù)為100。將前4 d的數(shù)據(jù)作為訓(xùn)練樣本訓(xùn)練ESN模型,為了表述方便,采用預(yù)測結(jié)果的MAPE表示遺傳算法參數(shù)尋優(yōu)的過程,結(jié)果如圖6所示。建立模型的最優(yōu)參數(shù)如下:儲備池規(guī)模G為50,儲備池內(nèi)部網(wǎng)絡(luò)連接權(quán)矩陣的SR為0.672,輸入比例因子IS為0.248,儲備池的SD為0.085 2。
MAPE—平均絕對百分比誤差。
為了驗證所構(gòu)建的ESN模型在交通流預(yù)測方面的精確度,以第5天的288個實測數(shù)據(jù)作為測試樣本,與模型的預(yù)測結(jié)果進行對比分析。圖7所示為上海市南北高架快速路段東側(cè)主線檢測器NBDX16(2)、西側(cè)主線檢測器NBXX10(1)交通流量實測值與預(yù)測值的擬合效果,其中NBDX、NBXX分別為南北高架東線、南北高架西線,16、10為監(jiān)測斷面編號,2、1為車道編號。從圖中可以看出,本文中構(gòu)建的ESN模型預(yù)測結(jié)果與實測數(shù)據(jù)相比較具有較高的擬合度,充分證實了本文中方法的有效性,可以應(yīng)用于實際短時交通流的預(yù)測。
(a)東側(cè)主線檢測器NBDX16(2)
在短時交通流預(yù)測的幾種經(jīng)典模型中,BPNN、小波神經(jīng)網(wǎng)絡(luò)(WNN)和支持向量機(SVM)是最常用的預(yù)測模型,與ESN模型同屬于人工智能算法,因此具有同類型方法可比性。本文中選取BPNN、WNN、SVM這3種模型作為對比方法,對比方法中的參數(shù)均為通過遺傳算法優(yōu)化獲得的最優(yōu)參數(shù)。在這3種預(yù)測模型中,模型構(gòu)成或設(shè)定參數(shù)如下:BPNN模型的隱層數(shù)為1,隱層神經(jīng)元的個數(shù)為50,激勵函數(shù)為Sigmoid函數(shù);WNN模型的隱層數(shù)為1,隱層的神經(jīng)元個數(shù)為20,隱含層采用Morlet作為激勵函數(shù);SVM模型的懲罰因子λ=32,核函數(shù)參數(shù)γ=0.5。
采用平均絕對誤差(MAE)值xMAE、MAPE值xMAPE和均等系數(shù)(EC)值xEC這3個指標(biāo)進行對比分析,即
(12)
(13)
(14)
表1所示為本文中方法和其他3種不同方法在短時交通流預(yù)測結(jié)果的對比。從表中可以看出,本文中方法預(yù)測的MAE為7.21,MAPE為6.74%,EC為0.963,充分說明了本文中方法的優(yōu)越性。由此再次證明,本文中構(gòu)建的ESN模型在短時交通流預(yù)測效果上優(yōu)于其他對比方法。在MAPE方面,本文中構(gòu)建的ESN模型平均預(yù)測精度比SVM模型的提高35.9%,比WNN模型的提高42.1%,比BPNN模型的提高45.6%。
表1 4種模型的預(yù)測效果對比
為了提高短時交通流預(yù)測的精度,本文中利用C-C法獲取相空間重構(gòu)的延遲時間和嵌入維數(shù),構(gòu)建了ESN模型應(yīng)用于短時交通流預(yù)測,通過實例驗證和對比分析,得到以下主要結(jié)論:
1)為了更好地為出行者提供合理準(zhǔn)確的出行路徑,為交通管控提供基礎(chǔ)保障,本文中提出的ESN模型在短時交通流預(yù)測精度上有進一步提升,經(jīng)過驗證可以為以后的交通流系統(tǒng)研究提供借鑒。
2)用實際采集到的數(shù)據(jù)與模型預(yù)測的結(jié)果進行對比分析,實驗結(jié)果顯示:本文中提出的ESN模型的預(yù)測結(jié)果與實際值擬合效果較好,在誤差和擬合度2個方面均優(yōu)于SVM模型、WNN模型和BPNN模型。
3)現(xiàn)實中的交通系統(tǒng)是不斷變化和各因素相互影響的動態(tài)系統(tǒng),既有人參與,又有其他許多不確定影響因素,而現(xiàn)有研究只針對單一的參數(shù)進行預(yù)測,沒有考慮交通系統(tǒng)之間各參數(shù)的相互影響和多變性,因此以后對交通流系統(tǒng)的研究應(yīng)考慮各參數(shù)之間的相互影響,并且向多變量相空間重構(gòu)條件下的交通流預(yù)測方向發(fā)展。