彭桐歆,韓 勇,王 程,張志浩
(1.中國(guó)海洋大學(xué)信息科學(xué)與工程學(xué)院,山東青島 266100;2.青島海洋科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室區(qū)域海洋動(dòng)力學(xué)與數(shù)值模擬功能實(shí)驗(yàn)室,山東青島 266237;3.青島市市北區(qū)黨建引領(lǐng)基層治理推進(jìn)中心,山東青島 266000)
隨著傳感器技術(shù)的飛速發(fā)展,記錄人們?nèi)粘P袨榈某鞘袝r(shí)空大數(shù)據(jù)如公交卡數(shù)據(jù)、出租車(chē)軌跡等越來(lái)越豐富。這些數(shù)據(jù)可以模擬和預(yù)測(cè)人類(lèi)的活動(dòng)模式,揭示人類(lèi)社會(huì)活動(dòng)及其運(yùn)動(dòng)規(guī)律,為構(gòu)建智能交通系統(tǒng)(Intelligent Transportation System,ITS)提供可靠支持。通過(guò)分析地鐵站的歷史刷卡記錄,對(duì)不同站點(diǎn)的短時(shí)客流量進(jìn)行預(yù)測(cè),不僅能方便出行者規(guī)劃線路,而且能為管理部門(mén)調(diào)度車(chē)次提供依據(jù),對(duì)促進(jìn)智慧城市的建設(shè)具有重要的現(xiàn)實(shí)意義。
城市交通客流量預(yù)測(cè)的研究歷程可歸結(jié)為統(tǒng)計(jì)學(xué)方法、傳統(tǒng)機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法3 個(gè)階段。統(tǒng)計(jì)學(xué)方法包括差分整合移動(dòng)平均自回歸模型(Autoregressive Integrated Moving Average Model,ARIMA)[1]及其變體模型[2-3]、邏輯回歸模型(Logistic Regression,LR)[4]、卡爾曼濾波[5]等。統(tǒng)計(jì)學(xué)方法能捕獲時(shí)空序列中的線性特征,但對(duì)數(shù)據(jù)中的非線性特征卻無(wú)法提取。因此,研究人員引入了傳統(tǒng)機(jī)器學(xué)習(xí)方法,傳統(tǒng)機(jī)器方法包括決策樹(shù)、聚類(lèi)、貝葉斯方法、支持向量機(jī)、最大期望算法、Adaboost、人工神經(jīng)網(wǎng)絡(luò)等。ZHANG 等[6]采用支持向量機(jī)(Support Vector Machine,SVM)對(duì)交通流量進(jìn)行預(yù)測(cè),LI等[7]融合季節(jié)性ARIMA和SVR 對(duì)地鐵客流量進(jìn)行預(yù)測(cè),取得較好的結(jié)果。此外,還有不少研究人員在交通客流量預(yù)測(cè)上采用貝葉斯方法[8]、BP 神經(jīng)網(wǎng)絡(luò)[9]、隨機(jī)森林[10]等方法,均取得了良好的結(jié)果。
然而在大數(shù)據(jù)時(shí)代,復(fù)雜且龐大的時(shí)空數(shù)據(jù)使建立特征工程的難度增加。相比統(tǒng)計(jì)學(xué)和傳統(tǒng)機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一個(gè)分支,它利用深度神經(jīng)網(wǎng)絡(luò)來(lái)解決特征表達(dá)的過(guò)程。深度神經(jīng)網(wǎng)絡(luò)是一種相對(duì)特殊的神經(jīng)網(wǎng)絡(luò),它包含較多的隱含人工神經(jīng)網(wǎng)絡(luò)層,可以學(xué)習(xí)復(fù)雜的非線性關(guān)系,以減小特征工程的復(fù)雜度。ZHAΟ 等[11]利用長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)進(jìn)行交通流量預(yù)測(cè)。LI 等[12]提出基于殘差LSTM 的交通流量預(yù)測(cè)方法,顯式建模特征維度之間的依賴(lài)關(guān)系。ZHANG 等[13]利用結(jié)構(gòu)相對(duì)簡(jiǎn)單的門(mén)控循環(huán)單元(Gated Recurrent Units,GRU)預(yù)測(cè)交通流。ZHANG等[14]將城市范圍的時(shí)空流量序列表達(dá)為規(guī)則格網(wǎng)數(shù)據(jù),以小時(shí)、天和周的周期提取歷史觀察值,并送入多層卷積神經(jīng)網(wǎng)絡(luò)(Conventional Neural Networks,CNN)進(jìn)行建模。ZHAΟ 等[15]提出混合深度學(xué)習(xí)模型ResNet-CNN1D,對(duì)青島市地鐵客流量進(jìn)行建模預(yù)測(cè)。
在現(xiàn)有的研究中,單純使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[16-17]只能捕獲數(shù)據(jù)的時(shí)間特征,使用單一的CNN[18-19]只能捕獲數(shù)據(jù)的空間特征,部分模型缺乏對(duì)流量數(shù)據(jù)時(shí)空特征的捕獲,且忽視了歷史周期片段對(duì)目標(biāo)時(shí)刻的影響。此外,現(xiàn)有研究主要集中在如何將深度學(xué)習(xí)模型應(yīng)用于短時(shí)交通流量預(yù)測(cè),忽略了對(duì)模型的優(yōu)化研究。交通流量典型的特征之一是交通峰值,現(xiàn)有模型對(duì)峰值的捕捉能力不夠,極少關(guān)注天氣、空氣狀況等多源外部信息。
為精準(zhǔn)預(yù)測(cè)短時(shí)地鐵客流量,本文構(gòu)建一種混合深度學(xué)習(xí)模型ResGRUMetro,通過(guò)融合殘差神經(jīng)網(wǎng)絡(luò)(Residual Neural Network,ResNet)提取交通流量的空間特征,運(yùn)用GRU 提取流量的時(shí)間特征。該模型將近鄰、日、周周期模式的時(shí)間片流量數(shù)據(jù)作為輸入,利用混合深度學(xué)習(xí)模型挖掘數(shù)據(jù)的時(shí)空特征,使用加權(quán)平方誤差(Weighed Square Error,WSE)對(duì)模型損失函數(shù)進(jìn)行改進(jìn),加大對(duì)交通流量序列峰值處誤差的懲罰,提高模型對(duì)交通流量中峰值的預(yù)測(cè)能力。此外,模型耦合天氣、空氣質(zhì)量、節(jié)假日等外部因子,改進(jìn)模型整體預(yù)測(cè)精度,得到目標(biāo)時(shí)刻所有站點(diǎn)的客流量預(yù)測(cè)結(jié)果。
本文擬解決的問(wèn)題為利用混合深度學(xué)習(xí)模型對(duì)特定時(shí)間片的地鐵客流量作精準(zhǔn)預(yù)測(cè)。地鐵客流量受歷史時(shí)段客流量的影響,也受天氣等外部因素的影響,該預(yù)測(cè)問(wèn)題如圖1 所示,可用公式表示為:
圖1 預(yù)測(cè)問(wèn)題定義Fig.1 Definition of the prediction problem
其中:Fprediction為預(yù)測(cè)問(wèn)題;f為解決預(yù)測(cè)問(wèn)題的混合深度學(xué)習(xí)模型;X為歷史客流量輸入;Ε為外部因子輸入;W為可學(xué)習(xí)權(quán)重。
歷史客流輸入包括近鄰、日周期和周周期模式的3 部分歷史客流量數(shù)據(jù),應(yīng)用3 種不同周期的模式能夠更好地研究地鐵客流的周期性及周期時(shí)間片對(duì)目標(biāo)時(shí)刻客流的影響,以達(dá)到更精準(zhǔn)的預(yù)測(cè)。近鄰模式表示最接近預(yù)測(cè)時(shí)刻的若干時(shí)間片數(shù)據(jù),日周期和周周期模式與目標(biāo)時(shí)刻處于相同時(shí)間片,但在日或周的周期循環(huán)中。如預(yù)測(cè)目標(biāo)是周六上午7:00~7:10 的地鐵網(wǎng)絡(luò)中各站點(diǎn)的進(jìn)出站客流量,那么近鄰模式的輸入就是最接近周六上午7:00 的若干時(shí)間片的客流量,日周期模式的輸入是前N天每天上午7:00~7:10 的客流量,周周期模式的輸入是前N周每周周六上午7:00~7:10 的客流量。3 種模式的輸入可用式(2)表示:
其中:Xt表示第t個(gè)時(shí)間片的客流量數(shù)據(jù),即目標(biāo)時(shí)間片客流量;IC、ID和IW分別表示近鄰、日周期和周周期模式的歷史觀測(cè)數(shù)據(jù);IC、ID和IW中的時(shí)間片的數(shù)量分別是c、d和w;一天的時(shí)間片總數(shù)是n。
地鐵客流量是典型的時(shí)空數(shù)據(jù),其時(shí)間特征表現(xiàn)在歷史客流量對(duì)預(yù)測(cè)時(shí)間點(diǎn)客流量的影響,空間特征表現(xiàn)為前一站或前幾站的客流量對(duì)當(dāng)前站點(diǎn)的影響。因此,深度學(xué)習(xí)預(yù)測(cè)模型需考慮地鐵客流量的時(shí)空屬性。本文提出的混合深度學(xué)習(xí)模型簡(jiǎn)稱(chēng)ResGRUMetro,其結(jié)構(gòu)如圖2 所示。模型包括3 個(gè)部分,第1 部分用于捕獲空間特征,將CNN 與殘差單元(Residual Units,ResUnits)融合,構(gòu)建ResNet,第2 部分主要利用GRU挖掘時(shí)間特征。此外,利用LSTM 耦合溫度、空氣質(zhì)量等外部因子。作為第3部分改善模型預(yù)測(cè)的整體能力。最后利用參數(shù)矩陣融合的方式,將時(shí)空特征和外部特征融合輸出,通過(guò)激活函數(shù)得到最終預(yù)測(cè)值。為更好地捕捉客流量的峰值,設(shè)計(jì)WSE 作為損失函數(shù)反向傳播訓(xùn)練,加強(qiáng)對(duì)流量峰值的捕獲。
圖2 ResGRUMetro模型結(jié)構(gòu)Fig.2 Structure of ResGRUMetro model
CNN 是一類(lèi)包含卷積計(jì)算且具有深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),擅長(zhǎng)處理具有類(lèi)似于網(wǎng)格結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),例如時(shí)間序列數(shù)據(jù)和圖像數(shù)據(jù),CNN 將其分別看作是在時(shí)間軸上經(jīng)過(guò)有規(guī)律地采樣形成的一維網(wǎng)絡(luò)和二維像素網(wǎng)格。每個(gè)CNN 單層網(wǎng)絡(luò)包括卷積、非線性變換、下采樣3 個(gè)部分,每層的輸入輸出為一組向量構(gòu)成的特征圖,CNN 通過(guò)Kernel 系統(tǒng)逐層對(duì)輸入信號(hào)完成映射,并對(duì)提取的特征進(jìn)行非線性映射。最后,通過(guò)下采樣階段對(duì)前兩步得到的特征信息進(jìn)行采樣。圖3 是一個(gè)在二維向量上進(jìn)行卷積運(yùn)算的例子,圖中僅處理全位于圖像中的輸入,由圖3 可以說(shuō)明輸出張量是由輸入張量通過(guò)卷積得到的。就地鐵客流量而言,每個(gè)地鐵站有由歷史客流量組成的特征向量,為捕捉地鐵站間的空間關(guān)聯(lián)特征,將地鐵網(wǎng)絡(luò)數(shù)據(jù)轉(zhuǎn)換為二維圖像,水平軸表示時(shí)間,垂直軸代表地鐵站,每個(gè)位置的值為歷史地鐵客流量,通過(guò)對(duì)圖像執(zhí)行卷積來(lái)進(jìn)行預(yù)測(cè)。
圖3 卷積示例圖Fig.3 Convolution example diagram
傳統(tǒng)CNN 無(wú)法達(dá)到較深結(jié)構(gòu),隨著隱藏層的增加,會(huì)出現(xiàn)梯度消失、網(wǎng)絡(luò)退化、梯度爆炸等問(wèn)題,損害模型的學(xué)習(xí)能力本文將殘差結(jié)構(gòu)融入到CNN 中,構(gòu)建ResCNN 單元。一個(gè)典型的ResCNN 單元的結(jié)構(gòu)如式(3)所示:
其中:XL為第L個(gè)殘差單元的輸入;XL+1為第(L+1)個(gè)殘差單元的輸出;Fr是殘差函數(shù)。
殘差結(jié)構(gòu)的原理是學(xué)習(xí)關(guān)于XL的殘差函數(shù)Fr,文中1 個(gè)ResCNN 單元由2 個(gè)堆疊的CNN 層和1 個(gè)捷徑連接組成,如圖4 所示。本文采用ReLU 作為殘差結(jié)構(gòu)中的激活函數(shù),通過(guò)堆疊若干個(gè)ResCNN 單元,形成一個(gè)殘差網(wǎng)絡(luò)ResNet,以達(dá)到更深層的特征獲取。
圖4 ResCNN 單元結(jié)構(gòu)Fig.4 Structure of ResCNN unit
為建模交通客流量在時(shí)間維度上的依賴(lài),考慮利用RNN 的循環(huán)機(jī)制,但傳統(tǒng)RNN 很難保持長(zhǎng)期的依賴(lài)性,且存在梯度消失、梯度爆炸的問(wèn)題[20]。LSTM 和GRU 是具有特殊結(jié)構(gòu)的RNN,通過(guò)門(mén)控機(jī)制有針對(duì)性地保留信息,能夠?qū)W習(xí)時(shí)間跨度相對(duì)較長(zhǎng)的依賴(lài)關(guān)系,解決傳統(tǒng)RNN 存在的問(wèn)題。相較于LSTM,GRU 在保持LSTM 原有效果的前提下有更簡(jiǎn)單的結(jié)構(gòu)和更快的學(xué)習(xí)速度,因此本文采用GRU捕獲交通客流量的時(shí)間特征。GRU 的結(jié)構(gòu)如圖5 所示,1 個(gè)GRU 單元包含2 個(gè)門(mén),即重置門(mén)和更新門(mén),重置門(mén)用來(lái)丟棄與預(yù)測(cè)無(wú)關(guān)的歷史信息,更新門(mén)用于控制歷史狀態(tài)信息對(duì)當(dāng)前時(shí)刻的影響程度,更新門(mén)的值越大,狀態(tài)信息保留越多。
圖5 GRU 單元結(jié)構(gòu)Fig.5 Structure of the GRU unit
具體傳播公式如式(4)所示:
其中:Rt、Zt、和Ht分別為 重置門(mén)、更新門(mén)、當(dāng) 前時(shí)刻的候選隱藏狀態(tài)和隱藏狀態(tài);WXR、WXZ和WXH分別為輸入層到重置門(mén)、更新門(mén)和隱藏狀態(tài)的權(quán)重矩陣;WHR、WHZ和WHH分別為隱藏狀態(tài)到重置門(mén)、更新門(mén)和另一隱藏狀態(tài)的權(quán)重矩陣;bR、bZ、bH分別為更新門(mén)、重置門(mén)和候選隱藏狀態(tài)的偏置向量;Ht-1為歷史時(shí)刻的隱藏狀態(tài);Xt為當(dāng)前時(shí)刻的原始輸入;σ表示激活函數(shù);⊙表示哈達(dá)瑪積。
外部因素包括天氣、重大事件、空氣質(zhì)量等影響人們的出行計(jì)劃,進(jìn)而對(duì)地鐵客流量產(chǎn)生影響。例如,暴風(fēng)雨天氣會(huì)降低人們的出行欲望,節(jié)假日等重大事件會(huì)使城市交通迎來(lái)新的高峰,空氣質(zhì)量較差的日子人們大概率選擇居家活動(dòng),這些外部因素潛移默化地影響人們的出行決策。目前,只有部分客流量預(yù)測(cè)模型引入了外部因素,且對(duì)空氣質(zhì)量的關(guān)注相對(duì)較少。本文選取的11 個(gè)外部指標(biāo)可以分為3 類(lèi),包括天氣狀況(最高氣溫、最低氣溫、是否陰雨)、特殊事件(是否節(jié)假日)和空氣質(zhì)量(AQI、PM2.5、PM10、NΟ2、CΟ、Ο3、SΟ2濃度),利用LSTM網(wǎng)絡(luò)對(duì)這些因子的時(shí)間序列進(jìn)行分析,捕捉外部因子影響特征,優(yōu)化模型預(yù)測(cè)精度。
由于3 個(gè)組成部分對(duì)預(yù)測(cè)結(jié)果的影響程度不同,本文采用參數(shù)矩陣方法對(duì)3 個(gè)部分進(jìn)行融合。參數(shù)矩陣方法由ZHANG 等[21]提出,具體步驟為:
1)初始化參數(shù)矩陣,矩陣元素值范圍為[0,1];
2)各部分原始輸出與矩陣做哈達(dá)瑪積運(yùn)算后相加融合;
3)通過(guò)迭代訓(xùn)練獲得最小損失值的方式并確定最優(yōu)權(quán)重。具體如式(5)所示:
其中:Ο表示模型的最終輸出;⊙表示哈達(dá)瑪積;W1、W2和W3表示可學(xué)習(xí)權(quán)重;Ο1、Ο2和Ο3分別是模型前3 個(gè)部分的輸出;σ是相應(yīng)的激活函數(shù)。
短時(shí)交通流量預(yù)測(cè)是一種典型的回歸問(wèn)題,研究人員普遍采用均方誤差(Mean Square Error,MSE)作為訓(xùn)練的損失函數(shù)。MSE 是對(duì)所有樣本預(yù)測(cè)值和真實(shí)值的方差取平均值,所有樣本在計(jì)算誤差時(shí)均會(huì)被附以相同的權(quán)重,它更側(cè)重于誤差的整體計(jì)量。然而在真實(shí)生活中,無(wú)論是對(duì)于出行者或是交通的管理者而言,都更加關(guān)注交通時(shí)序的峰值,以方便對(duì)出行時(shí)間進(jìn)行合理規(guī)劃及線路車(chē)次管理。MSE 采用算數(shù)平均的方式,難以有針對(duì)性地滿(mǎn)足對(duì)于交通時(shí)序峰值的精準(zhǔn)預(yù)測(cè)。為解決此問(wèn)題,本文設(shè)計(jì)了一種面向短時(shí)交通流量時(shí)間序列預(yù)測(cè)的損失函數(shù)加權(quán)平方誤差,使其更加關(guān)注對(duì)于交通流量序列峰值的預(yù)測(cè)誤差,從而起到對(duì)損失函數(shù)進(jìn)行優(yōu)化的效果。WSE 的計(jì)算過(guò)程如式(6)所示:
WSE 在計(jì)算損失時(shí)根據(jù)交通流量的大小為預(yù)測(cè)誤差賦予不同權(quán)重,加大了對(duì)交通流量時(shí)間序列峰值處誤差的懲罰,這使得神經(jīng)網(wǎng)絡(luò)在反向傳播時(shí),會(huì)更加關(guān)注峰值處的預(yù)測(cè)和誤差,最終在交通流量峰值處取得更為精確的預(yù)測(cè)。
數(shù)據(jù)選自2015 年4 月上海市地鐵進(jìn)出站刷卡數(shù)據(jù),共有289 個(gè)站點(diǎn),覆蓋全市14 條地鐵線,平均每天有900 萬(wàn)條刷卡記錄。據(jù)市民活動(dòng)情況,本文選取6:40~23:00 為目標(biāo)時(shí)間段進(jìn)行客流量研究,以10 min 為時(shí)間切片,即每10 min 統(tǒng)計(jì)一次客流量,則30 天內(nèi)共劃分出2 940 個(gè)時(shí)間片。外部因子中的天氣數(shù)據(jù)來(lái)自天氣網(wǎng)數(shù)據(jù),以h 為單位的空氣質(zhì)量數(shù)據(jù)來(lái)自中國(guó)環(huán)境監(jiān)測(cè)總站提供的城市空氣質(zhì)量實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)。訓(xùn)練數(shù)據(jù)來(lái)自4 月1 日~4 月23 日,驗(yàn)證數(shù)據(jù)來(lái)自4 月24 日和4 月25 日(含1 個(gè)工作日和1 個(gè)非工作日),測(cè)試數(shù)據(jù)來(lái)自4 月26 日~4 月30 日(含4 個(gè)工作日和1 個(gè)非工作日)。
為評(píng)估模型預(yù)測(cè)效果,選用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、加權(quán)平均絕對(duì)百分比誤差(Weighed Mean Absolute Percentage Error,WMAPE)進(jìn)行量化分析,誤差計(jì)算公式為:
本文實(shí)驗(yàn)在GPU 平臺(tái)運(yùn)行,運(yùn)行環(huán)境為python3.6,利用python 的第三方庫(kù)scikit-learn、Keras和TensorFlow 搭建交通流量預(yù)測(cè)模型。以10 min 為時(shí)間間隔統(tǒng)計(jì)流量數(shù)據(jù),通過(guò)多次實(shí)驗(yàn)測(cè)試和調(diào)參,對(duì)模型的卷積核尺寸、CNN 神經(jīng)元個(gè)數(shù)、殘差單元個(gè)數(shù)、CRU 神經(jīng)元個(gè)數(shù)進(jìn)行討論,結(jié)果如圖6 所示。需說(shuō)明的是由于MAE、WMAPE 指標(biāo)波動(dòng)較小,這里僅用RMSE 進(jìn)行比較判斷。最終模型的超參數(shù)設(shè)置:卷積核大小為3×3;3 層CNN 神經(jīng)元個(gè)數(shù)均為128;殘差單元個(gè)數(shù)分別均為16,2 層GRU 神經(jīng)元的個(gè)數(shù)均為256,根據(jù)經(jīng)驗(yàn)設(shè)置3 層LSTM 神經(jīng)元,個(gè)數(shù)分別為256、128、64;輸入數(shù)據(jù)周周期模式、日周期模式和近鄰模式時(shí)間切片分別為7、1、1;在模型訓(xùn)練過(guò)程中,學(xué)習(xí)率為1×10-3,迭代次數(shù)為600 次,使用驗(yàn)證集早停策略以避免過(guò)擬合,采用Adam 優(yōu)化器,損失函數(shù)為WSE。
圖6 本文模型的超參數(shù)調(diào)參Fig.6 Optimal hyperparameters of model in this paper
分別以10 min、20 min 和30 min 為時(shí)間間隔進(jìn)行流量統(tǒng)計(jì),將本文提出的ResGRUMetro模型與已有經(jīng)典模型進(jìn)行比較,驗(yàn)證模型的預(yù)測(cè)性能?;鶞?zhǔn)模型包括1 個(gè)統(tǒng)計(jì)學(xué)方法、1 個(gè)機(jī)器學(xué)習(xí)方法和4 個(gè)深度學(xué)習(xí)方法。
1)線性回歸分析LR[22]:一種統(tǒng)計(jì)學(xué)方法,用于確定兩種及以上變量間的依賴(lài)關(guān)系。
2)支持向量機(jī)PSVR[23]:一種機(jī)器學(xué)習(xí)方法,scikit-learn 核函數(shù)類(lèi)型為“poly”。
3)卷積神經(jīng)網(wǎng)絡(luò)CNN[24]:一種深度學(xué)習(xí)方法。
4)ResNet:加入殘差單元的卷積神經(jīng)網(wǎng)絡(luò)[21]。
5)門(mén)控循環(huán)單元GRU[25],深度學(xué)習(xí)方法。
6)ResNet+GRU:ResGRUMetro模型除去天氣因子和WSE 損失函數(shù)。
對(duì)比實(shí)驗(yàn)結(jié)果如表1 所示。
表1 地鐵站客流量預(yù)測(cè)實(shí)驗(yàn)結(jié)果Table 1 Experiment results of passenger flow prediction for metro stations
由表1 可知,本文提出的ResGRUMetro模型在MAE、RMSE 和WMAPE 這3 種指標(biāo)上較其他方法均取得了較優(yōu)的結(jié)果。深度學(xué)習(xí)方法整體優(yōu)于統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法,考慮時(shí)空特征的深度學(xué)習(xí)方法結(jié)果優(yōu)于僅考慮空間特征的深度學(xué)習(xí)方法。
以10 min 切片具體分析,相比LR 模型,ResGRUMetro模型 的MAE 相對(duì)減少了8.62%,RMSE相對(duì)減少了30.70%,WMAPE 相對(duì)減少了2.17 個(gè)百分點(diǎn),這可能是因?yàn)長(zhǎng)R 模型只能捕捉時(shí)間序列中的線性關(guān)系,對(duì)于非線性特征難以捕獲。將ResGRUMetro模型與PSVR 對(duì) 比,ResGRUMetro的MAE相對(duì)減少了8.17%,RMSE 相對(duì)減少了24.43%,WMAPE 相對(duì)減少了2.20 個(gè)百分點(diǎn),這說(shuō)明ResGRUMetro在交通流量預(yù)測(cè)上的效果優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型。與僅捕捉空間關(guān)聯(lián)特征的CNN 和ResNet 對(duì)比,與僅捕捉時(shí)間關(guān)聯(lián)特征的GRU 對(duì)比,ResGRUMetro均取得了較好的效果,這體現(xiàn)了時(shí)空混合模型的優(yōu)越性。相比ResNet+GRU 模型,ResGRUMetro的MAE 相對(duì)減少了2.94%,RMSE 相 對(duì)減少了3.86%,WMAPE 相對(duì)減少了0.56 個(gè)百分點(diǎn),表明引入天氣因子以及改進(jìn)的損失函數(shù)能提高模型預(yù)測(cè)能力。
為直觀展示ResGRUMetro模型捕獲峰值的能力,本文討論了在特定站點(diǎn)下不同時(shí)間片的進(jìn)出流量預(yù)測(cè)情況。徐家匯是上海中央活動(dòng)區(qū)之一,也是上海十大商業(yè)中心之一,日進(jìn)出客流量較大,具有一定研究意義,因此選取徐家匯地鐵站作為研究對(duì)象。
圖7 是徐家匯站4 月26 日~4 月28 日(含1 個(gè)非工作日和2 個(gè)工作日)不同時(shí)間切片預(yù)測(cè)值與真實(shí)值的比較結(jié)果。由圖7 可知,各時(shí)間切片ResGRUMetro模型預(yù)測(cè)結(jié)果與真實(shí)值擬合較好,且在峰值的捕獲上有優(yōu)越性。為進(jìn)一步驗(yàn)證使用WSE作為損失函數(shù)對(duì)于ResGRUMetro捕獲峰值特征的改進(jìn),選取以MSE 作為損失函數(shù)的ResGRUMSE模型作為基準(zhǔn)模型,與以WSE 作為損失函數(shù)的模型ResGRUWSE進(jìn)行對(duì)比實(shí)驗(yàn)。計(jì)算了所有站點(diǎn)的模型誤 差,結(jié)果如表2 所示。由表2可知,ResGRUWSE模型的MAE 和RMSE 均優(yōu)于ResGRUMSE模型,但WMAPE 稍有不足。以10 min 切片為例,與ResGRUMSE模型相 比,ResGRUWSE模型的MAE 相對(duì)減少了2.89%,RMSE 相對(duì)減少了3.13%,WMAPE 相對(duì)增加了0.28 個(gè)百分點(diǎn)。MAE 是衡量模型性能的最基本的方法,實(shí)驗(yàn)結(jié)果表明,在所有時(shí)間切片下ResGRUWSE模型均具有較低的MAE 值,表明其具備良好的預(yù)測(cè)性能。RMSE 可以放大模型中的較大偏差,RMSE 越小則證明ResGRUWSE模型的穩(wěn)定性越好。但ResGRUWSE模型具有低MAE、低RMSE 與高WMAPE,表明預(yù)測(cè)誤差可能主要來(lái)自流量數(shù)據(jù)中的低值,而不是來(lái)源于峰值。
表2 不同損失函數(shù)模型的預(yù)測(cè)實(shí)驗(yàn)結(jié)果Table 2 Experimental results of models with different loss function
圖7 在不同時(shí)間切片下徐家匯站進(jìn)出客流預(yù)測(cè)結(jié)果Fig.7 Prediction results of passenger inflow and outflow for Xujiahui metro station in different time intervals
為進(jìn)一步分析ResGRUMSE和ResGRUWSE模型在不同大小流量處的預(yù)測(cè)誤差,將不同時(shí)間切片的流量數(shù)據(jù)分別劃分為4 個(gè)流量階段,分別對(duì)這4 個(gè)階段繪制誤差柱狀圖,如圖8 所示??梢钥闯鲈诹髁扛叻咫A段,ResGRUWSE的表現(xiàn)明顯優(yōu)于ResGRUMSE,而流量低峰階段ResGRUWSE的表現(xiàn)略差于ResGRUMSE,這可能是由于損失函數(shù)WSE 使模型更加關(guān)注流量序列中的峰值,從而在一定程度上弱化了對(duì)低值處的關(guān)注程度。在真實(shí)生活中,無(wú)論是對(duì)出行者亦或是交通的管理者而言,均更加關(guān)注交通流量時(shí)間序列的峰值,以方便出行時(shí)間的合理規(guī)劃及車(chē)輛調(diào)度。雖然從總體上看,ResGRUWSE模型的WMAPE 并非最低,但是它具有較低的MAE 與RMSE,能夠更精準(zhǔn)地預(yù)測(cè)交通流量中的峰值,整體預(yù)測(cè)能力也較強(qiáng)。
圖8 不同流量階段客流預(yù)測(cè)誤差Fig.8 Prediction error of passenger flow in different flow stage
針對(duì)短時(shí)地鐵客流量預(yù)測(cè)問(wèn)題,本文從模型優(yōu)化的角度出發(fā),提出一種混合深度學(xué)習(xí)模型ResGRUMetro。將卷積神經(jīng)網(wǎng)絡(luò)與殘差單元相結(jié)合,用于捕捉流量的空間特征,并利用門(mén)控循環(huán)單元捕捉流量的時(shí)間特征。為改進(jìn)模型的預(yù)測(cè)能力,耦合天氣、空氣質(zhì)量等外部因子,在模型訓(xùn)練上使用加權(quán)平方誤差作為損失函數(shù),提升模型流量峰值的預(yù)測(cè)能力。此外,探究ResGRUMetro模型在特定站點(diǎn)不同時(shí)間切片下的預(yù)測(cè)能力,對(duì)比以MSE 和WSE 作為損失函數(shù)的模型預(yù)測(cè)效果,并量化不同流量階段的預(yù)測(cè)誤差。實(shí)驗(yàn)結(jié)果表明,與LR、PSVR、CNN 等經(jīng)典模型對(duì)比,ResGRUMetro具有較低的MAE、RMSE 和WMAPE 與較高的預(yù)測(cè)精度。下一步將尋找更長(zhǎng)時(shí)間的交通流量序列對(duì)模型進(jìn)行驗(yàn)證,并將混合模型應(yīng)用于交通流量的多步預(yù)測(cè)問(wèn)題中,以提高模型的魯棒性。