梁強(qiáng)升,許心越,劉利強(qiáng)
(1.廣州地鐵集團(tuán)有限公司 運(yùn)營(yíng)事業(yè)總部,廣東 廣州 510330;2.北京交通大學(xué) 軌道交通控制與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100044)
城市軌道交通以其運(yùn)量大、速度快、可靠性高等運(yùn)行特點(diǎn),已成為人口密集大城市的首選交通方式[1]。我國(guó)城市軌道交通建設(shè)快速增長(zhǎng),誘發(fā)了客流的急劇上升[2],導(dǎo)致軌道交通擁擠、服務(wù)質(zhì)量下降。因此,如何分析管理城市軌道交通客流,特別是把握客流的短時(shí)變化規(guī)律已成為運(yùn)營(yíng)管理者提高城市軌道交通運(yùn)行效率、緩解擁堵、提高服務(wù)質(zhì)量迫切需要解決的問(wèn)題[3]。
城市軌道交通客流短時(shí)預(yù)測(cè)方法主要分為經(jīng)典的統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型。經(jīng)典的統(tǒng)計(jì)模型主要包括自回歸綜合移動(dòng)平均(ARIMA)和指數(shù)平滑模型,在早期得到了廣泛的應(yīng)用[4]。例如,NI等[5]將線性回歸和ARIMA 模型相結(jié)合對(duì)紐約地鐵的短期客流進(jìn)行了預(yù)測(cè)。WILLIAMS 等[6]基于季節(jié)ARIMA 模型預(yù)測(cè)交通流量。然而,這些統(tǒng)計(jì)方法大多屬于線性的時(shí)間序列模型,無(wú)法捕捉客流的非線性變化,導(dǎo)致其進(jìn)行短時(shí)客流預(yù)測(cè)的誤差較大[7]。
為解決這一非線性預(yù)測(cè)難題,機(jī)器學(xué)習(xí)方法應(yīng)運(yùn)而生。機(jī)器學(xué)習(xí)方法包括支持向量機(jī)、貝葉斯網(wǎng)絡(luò)、k-鄰近算法、人工神經(jīng)網(wǎng)絡(luò)等。例如,SUN等[8]提出了一種小波-支持向量機(jī)混合方法對(duì)北京地鐵系統(tǒng)的換乘客流進(jìn)行預(yù)測(cè)。ROOS 等[9]提出了一種利用不完整歷史觀測(cè)數(shù)據(jù)預(yù)測(cè)短期客流的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)方法。JIAO等[10]提出了一種基于貝葉斯組合和非參數(shù)回歸的改進(jìn)卡爾曼濾波模型來(lái)預(yù)測(cè)北京地鐵13 號(hào)線高峰時(shí)段的客流。WEI 等[11]將經(jīng)驗(yàn)分解模式與前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合對(duì)短期客流進(jìn)行預(yù)測(cè),結(jié)果表明該模型的預(yù)測(cè)精度優(yōu)于ARI?MA 模型。LI 等[12]提出用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)單站客流。然而,所有這些模型都基于淺層結(jié)構(gòu),無(wú)法捕獲數(shù)據(jù)中的復(fù)雜非線性關(guān)系[13-14]。
近年來(lái),循環(huán)神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)、門控遞歸單元神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)由于在捕捉時(shí)空關(guān)系方面具有優(yōu)越的性能而受到廣泛重視[15-17]。在時(shí)間預(yù)測(cè)方面,循環(huán)神經(jīng)網(wǎng)絡(luò)利用輸入序列和時(shí)間步長(zhǎng)之間的連續(xù)反饋來(lái)獲得時(shí)間相關(guān)性;而長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和門控遞歸單元神經(jīng)網(wǎng)絡(luò),可以處理比循環(huán)神經(jīng)網(wǎng)絡(luò)更長(zhǎng)的序列[18]。同時(shí),長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和門控遞歸單元神經(jīng)網(wǎng)絡(luò)都可以借助門控機(jī)制解決循環(huán)神經(jīng)網(wǎng)絡(luò)中的梯度消失和梯度爆炸問(wèn)題[17]。在空間預(yù)測(cè)方面,由于卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)共享機(jī)制和連接稀疏性,使得卷積神經(jīng)網(wǎng)絡(luò)具有很好的空間信息特征。因此,結(jié)合長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)、門控遞歸單元神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行客流預(yù)測(cè)時(shí),可以綜合考慮客流的時(shí)空特征。例如,DU 等[19]提出一種深度不規(guī)則卷積殘差長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)對(duì)城市交通客流進(jìn)行預(yù)測(cè)。DO 等[20]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)和門控遞歸神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流量,該模型可以有效地提取動(dòng)態(tài)時(shí)空特征。然而,這些既有的模型僅適用于單條線路的客流預(yù)測(cè),無(wú)法考慮路網(wǎng)間的客流特征,難以實(shí)現(xiàn)對(duì)路網(wǎng)的客流預(yù)測(cè)。
近年來(lái),一種擅長(zhǎng)解決這類網(wǎng)絡(luò)空間相關(guān)性問(wèn)題的圖卷積神經(jīng)網(wǎng)絡(luò)方法被提出,并得到了廣泛關(guān)注。YU 等人[21]采用圖卷積神經(jīng)網(wǎng)絡(luò)提取路網(wǎng)的空間相關(guān)性,從而對(duì)交通速度進(jìn)行預(yù)測(cè)。雖然圖卷積神經(jīng)網(wǎng)絡(luò)被證明具有較強(qiáng)的預(yù)測(cè)精度和可解釋性,但如何結(jié)合城市軌道交通自動(dòng)售檢票系統(tǒng)(AFC)和時(shí)刻表數(shù)據(jù)利用圖卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行短時(shí)客流預(yù)測(cè)的研究尚屬空白。
綜上,本文提出了一種新的融合循環(huán)門控單元的時(shí)空?qǐng)D卷積神經(jīng)網(wǎng)絡(luò)(GCGRU)模型來(lái)預(yù)測(cè)城市軌道交通的短時(shí)客流。本方法提出使用圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)描述短時(shí)客流的空間特征,特別是提出了基于旅行時(shí)間的鄰接矩陣構(gòu)建方法,并進(jìn)一步融合循環(huán)門控單元描述客流間的時(shí)間特征,形成了考慮客流時(shí)空演化關(guān)系的城市軌道交通短時(shí)客流預(yù)測(cè)模型,具有較強(qiáng)的預(yù)測(cè)精度和可解釋性。
設(shè)城市軌道交通網(wǎng)絡(luò)用1 個(gè)加權(quán)有向圖G=(V,E)表示:V為城市軌道交通車站集合,E為線路區(qū)間集合。設(shè)鄰接矩陣為A,矩陣中各個(gè)元素的值代表每2 個(gè)站點(diǎn)間的旅行時(shí)間;設(shè)站點(diǎn)特征矩陣為X:其中X的行數(shù)N為站點(diǎn)數(shù)量,列數(shù)P為車站的特征屬性(即時(shí)間步長(zhǎng))。歷史進(jìn)站量為每個(gè)車站的特征屬性,xi是每個(gè)站點(diǎn)在第i個(gè)時(shí)間步長(zhǎng)的進(jìn)站量。
不同車站類型(樞紐、通勤、商業(yè)等)和土地性質(zhì)差異會(huì)產(chǎn)生不同的客流導(dǎo)向,導(dǎo)致不同站點(diǎn)在不同時(shí)段有不同的客流特征。土地性質(zhì)及站點(diǎn)類型等因素造成進(jìn)出站量的變化,并可通過(guò)進(jìn)站量來(lái)反映這些變化,因此進(jìn)站量常被作為主要輸入變量進(jìn)行出站量的預(yù)測(cè)。
某一車站的客流經(jīng)過(guò)列車運(yùn)輸分散到路網(wǎng)各個(gè)相關(guān)車站,不同車站的客流經(jīng)過(guò)特定列車運(yùn)輸?shù)竭_(dá)同一個(gè)目的車站,因此車站的進(jìn)站客流會(huì)影響到其他車站的出站客流。本文根據(jù)城市軌道交通路網(wǎng)中各站點(diǎn)的歷史進(jìn)站量來(lái)預(yù)測(cè)未來(lái)的出站量。因此,城市軌道交通短時(shí)客流預(yù)測(cè)問(wèn)題可轉(zhuǎn)化為根據(jù)鄰接矩陣A和節(jié)點(diǎn)的進(jìn)站客流量特征矩陣X來(lái)學(xué)習(xí)映射函數(shù)f,即
本節(jié)提出面向數(shù)據(jù)驅(qū)動(dòng)的短時(shí)客流預(yù)測(cè)方法分為2 部分:①用來(lái)提取序列空間特征的圖卷積神經(jīng)網(wǎng) 絡(luò)GCN (Graph Convolutional Networks)神經(jīng)網(wǎng)絡(luò);②用來(lái)提取時(shí)間特征的門控遞歸單元神經(jīng)網(wǎng)絡(luò)GRU(Gate Recurrent Unit)神經(jīng)網(wǎng)絡(luò)。第1 部分的輸出作為第2 部分GRU 的輸入。具體模型框架如圖1所示。
圖1 模型框架
2.2.1 空間圖卷積網(wǎng)絡(luò)模型
圖中G=(V,E)具有2 種特征:節(jié)點(diǎn)特征和結(jié)構(gòu)特征(節(jié)點(diǎn)之間的依賴關(guān)系)。GCN 神經(jīng)網(wǎng)絡(luò)有2 種:一種基于頂點(diǎn)域或空間域,另一種基于頻域或譜域。本文采用基于空間域的GCN 來(lái)學(xué)習(xí)圖的結(jié)構(gòu)特征。
GCN 模型有2 個(gè)輸入:鄰接矩陣A和進(jìn)站客流特征矩陣X。鄰接矩陣A的表達(dá)式為
式中:tij為乘客從車站i到車站j的平均旅行時(shí)間。
GCN 的層與層之間的傳播方式可表示為
式中:H(l),H(l+1)分別為第l層和第(l+1)層的特征矩陣;g為斜坡激活函數(shù);為鄰接矩陣與單位矩陣的和,=A+I;為的度矩陣;W(l)為第l層的權(quán)矩陣。初始層H(0)的特征矩陣為進(jìn)站客流量特征矩陣X,且g和可由下面公式計(jì)算
由于GCN 層的最佳數(shù)量是2~3,本文選取2層GCN模型,故可將式(3)重新表述為
2.2.2 GRU模型
GRU用以捕捉預(yù)測(cè)數(shù)據(jù)間的時(shí)間信息,它有2個(gè)門:更新門(表示為zt)和重置門(表示為rt),如圖2所示。更新門決定了客流預(yù)測(cè)保留多少以前的狀態(tài),重置門決定了新輸入與前一狀態(tài)融合的程度。更新門的值越大,則前一個(gè)時(shí)間步長(zhǎng)內(nèi)的信息被帶入的就越多。重置門的值越小,則前一時(shí)間步長(zhǎng)內(nèi)的信息越容易被忽略。
圖2 GRU的計(jì)算圖
GRU的輸入用矩陣X′=[x′t-P+1,x′t-p+2,...,x′t]表示,是H(2)(GCN模型的輸出)的轉(zhuǎn)置矩陣。
每個(gè)GRU的狀態(tài)計(jì)算如下。
式中:Wrh,Wrx,Wzh,Wzx,Whh,Whx為加權(quán)矩陣,控制著隱藏層到相應(yīng)的輸入的連接;ht-1為第t-1個(gè)時(shí)間步長(zhǎng)的隱藏狀態(tài);br,bz,為偏置項(xiàng);為當(dāng)前記憶內(nèi)容;ht是第t個(gè)時(shí)間步長(zhǎng)的隱藏狀態(tài),也是GRU 的輸出;σ是sigmoid 函數(shù),σ和tanh 是由以下公式定義的非線性激活函數(shù)。
2.2.3 損失函數(shù)
在模型訓(xùn)練過(guò)程中,目標(biāo)是城市軌道交通網(wǎng)絡(luò)實(shí)際客流量與預(yù)測(cè)值之間的誤差最小化,即模型的損失函數(shù)為
本文提出的模型具有以下優(yōu)點(diǎn):
(1)可以通過(guò)鄰接矩陣學(xué)習(xí)城市軌道交通網(wǎng)絡(luò)系統(tǒng)中各站點(diǎn)之間的空間相關(guān)性,解決了傳統(tǒng)CNN 模型不能預(yù)測(cè)網(wǎng)絡(luò)層次客流的問(wèn)題。目前應(yīng)用于道路網(wǎng)絡(luò)層次的GCN 都是基于地理距離來(lái)構(gòu)建鄰接矩陣,而本文基于旅行時(shí)間來(lái)構(gòu)建鄰接矩陣,能更準(zhǔn)確地學(xué)習(xí)各站點(diǎn)之間的空間關(guān)系。
(2)采用的GRU 模型通過(guò)更新門和重置門對(duì)歷史客流信息進(jìn)行篩選,以解決序列之間的依賴關(guān)系,實(shí)現(xiàn)對(duì)較長(zhǎng)時(shí)間序列的精準(zhǔn)預(yù)測(cè)。此外,GRU 中的2 個(gè)門控單元均采用了非線性函數(shù),能夠有效識(shí)別客流中的復(fù)雜非線性關(guān)系。
(3)本模型結(jié)合GCN和GRU模型可以實(shí)現(xiàn)城市軌道交通全網(wǎng)的時(shí)空客流預(yù)測(cè),與傳統(tǒng)只考慮時(shí)間關(guān)系的模型相比,本模型的預(yù)測(cè)精度更高、解釋性更強(qiáng)。此外,本模型采用數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)學(xué)習(xí)城市軌道交通網(wǎng)絡(luò)中的時(shí)空關(guān)系,具有較強(qiáng)的穩(wěn)定性和魯棒性。
選取廣州地鐵6 個(gè)重要的就業(yè)型站點(diǎn)為例,對(duì)客流預(yù)測(cè)模型進(jìn)行有效性驗(yàn)證。所選取的車站具有客流量較大或是重要的換乘站等特點(diǎn),即:客村、楊箕、珠江新城、體育西路、公園前、琶洲,如圖3所示。預(yù)測(cè)數(shù)據(jù)采用2017年5月15日至5月27日的廣州地鐵路網(wǎng)數(shù)據(jù)、AFC 數(shù)據(jù)(見(jiàn)表1)和時(shí)刻表數(shù)據(jù),這些數(shù)據(jù)含周末的客流量?;谝陨蠑?shù)據(jù)構(gòu)建預(yù)測(cè)模型相關(guān)的2個(gè)矩陣。
(1)描述城市軌道交通車站間空間關(guān)系的6×6鄰接矩陣。矩陣的行表示車站,矩陣中的值為乘客在站與站之間的平均旅行時(shí)間,可由時(shí)刻表數(shù)據(jù)確定。
圖3 典型的廣州地鐵車站示意圖
(2)描述每個(gè)車站進(jìn)站和出站客流隨時(shí)間變化的特征矩陣和標(biāo)簽矩陣。矩陣的行表示一個(gè)時(shí)間步長(zhǎng)內(nèi)各站點(diǎn)的客流量,列表示在不同時(shí)間段內(nèi)各站點(diǎn)的客流量。其中:客流量是根據(jù)AFC 數(shù)據(jù)進(jìn)行15 min粒度統(tǒng)計(jì)后的量。進(jìn)一步利用最小-最大規(guī)范化技術(shù),將矩陣內(nèi)的數(shù)值規(guī)范化到[0,1]范圍內(nèi)。
表1 AFC數(shù)據(jù)樣本
選取均方根誤差(SRMSE)、平均絕對(duì)誤差(SMAE)、精度(SACC)、決定系數(shù)(R2)和可釋方差得分(SVar)5 個(gè)評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)模型的性能,它們的計(jì)算公式如下。
在上述評(píng)價(jià)指標(biāo)中,SRMSE和SMAE都是用來(lái)度量預(yù)測(cè)誤差的,兩者都是絕對(duì)指標(biāo),且值越小,預(yù)測(cè)性能越好。SACC,R2和SVar都是相對(duì)指標(biāo),值越大,預(yù)測(cè)性能越好。
GCGRU 模型的超參數(shù)主要包括學(xué)習(xí)率、批大小、訓(xùn)練次數(shù)、隱藏單元數(shù)和正則化參數(shù)。在本次實(shí)驗(yàn)中,學(xué)習(xí)率初始值設(shè)為0.001,并用Adam 優(yōu)化器自動(dòng)優(yōu)化;批量大小一般設(shè)置成2 的n次方,批量大小越大,模型精度越低、訓(xùn)練速度越快,通過(guò)手動(dòng)調(diào)節(jié)并綜合考慮精度和訓(xùn)練速度,最終將其設(shè)為64;當(dāng)訓(xùn)練次數(shù)達(dá)到2 000 時(shí),模型的精度不再上升,因此將訓(xùn)練次數(shù)設(shè)為2 000;將λ分別設(shè)定為0,0.1,0.01,0.001,0.001 5,0.002,當(dāng)λ為0.001 5 時(shí),模型精度達(dá)到最高,因此將λ設(shè)置為0.001 5。以上參數(shù)對(duì)模型5 個(gè)評(píng)價(jià)指標(biāo)的影響都很小,因此不再進(jìn)一步分析。
由于隱藏單元數(shù)對(duì)深度學(xué)習(xí)模型的5 個(gè)評(píng)價(jià)指標(biāo)有很大的影響[14],因此本文對(duì)不同數(shù)量隱藏單元下的GCGRU 模型進(jìn)行了實(shí)驗(yàn)(分別設(shè)定8,16,24,32),以獲取最優(yōu)的隱藏單元數(shù)。實(shí)驗(yàn)結(jié)果如圖4所示。隨著隱藏單元數(shù)的增加,SRMSE和SMAE先減少后增加,SACC,R2和SVar的值呈現(xiàn)相反的變化趨勢(shì)。當(dāng)隱藏單元數(shù)為24 時(shí),SRMSE和SMAE達(dá)到最小,SACC,R2和SVar的值同時(shí)達(dá)到了最大。因此,最優(yōu)的隱藏單元數(shù)為24。
圖4 不同隱藏單元數(shù)下評(píng)價(jià)指標(biāo)的變化
選取以下模型作為基線模型進(jìn)行對(duì)比分析。
(1)ARIMA 模型是典型的時(shí)間序列模型,擅于處理時(shí)間序列數(shù)據(jù)。該模型有3個(gè)整數(shù)型的參數(shù)p,d,q,該模型通過(guò)自動(dòng)遍歷不同的p,d,q組合,確定最優(yōu)組合為:p=1,d=1,q=1。
(2)支持向量機(jī)(SVR):SVR 是經(jīng)典的機(jī)器學(xué)習(xí)模型,它利用歷史數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,得到輸入和輸出之間的關(guān)系,因此常用于預(yù)測(cè)客流。選取帶有線性核的SVR模型作為比較模型。
(3)前饋神經(jīng)網(wǎng)絡(luò)(BP): BP 模型是基本的神經(jīng)網(wǎng)絡(luò)模型,能夠處理非線性關(guān)系。BP 模型有學(xué)習(xí)率(自動(dòng)調(diào)節(jié))、批量大小、訓(xùn)練次數(shù)、正則化系數(shù)λ以及隱藏單元數(shù)5 個(gè)參數(shù),其調(diào)節(jié)過(guò)程與3.3節(jié)所敘方法一樣。調(diào)參結(jié)果為:批量大小為64,訓(xùn)練次數(shù)為2 000,λ為0.001 5,隱藏單元數(shù)為24。
(4)GRU:GRU 是深度學(xué)習(xí)模型,具有捕捉時(shí)間信息的能力。GRU 的參數(shù)與BP模型一樣,調(diào)節(jié)結(jié)果為:批量大小為64,訓(xùn)練次數(shù)為2 000,λ為0.001 5,隱藏單元數(shù)為24。
本文在不同預(yù)測(cè)步長(zhǎng)下利用以上各種模型進(jìn)行了客流預(yù)測(cè),結(jié)果見(jiàn)表2。
3.4.1 整體預(yù)測(cè)結(jié)果
首先,將本文提出的GCGRU 模型與其余4 個(gè)模型(ARIMA,SVR,BP 和GRU 模型)的SRMSE進(jìn)行了比較,不同模型的SRMSE比較結(jié)果如圖5所示。對(duì)于15 min 的預(yù)測(cè)步長(zhǎng),GCGRU 的SRMSE分別比ARIMA,SVR,BP和GRU 模型的SRMSE降低了80.5%,77.4%,33.7%和28.9%。因此,本文提出的GCGRU 比4 個(gè)對(duì)比模型的預(yù)測(cè)誤差都低。
圖5 5個(gè)模型的均方根誤差比較結(jié)果
其次,將GCGRU 模型與不具備時(shí)間信息捕捉能力的非線性模型(SVR 和BP 模型)進(jìn)行了比較分析。從表2中可以看出,SVR 模型的SACC太小以至于可被忽略,因此,只將GCGRU 模型的精度SACC與BP 模型和GRU 模型進(jìn)行對(duì)比,如圖6所示。對(duì)于15 min 的預(yù)測(cè)步長(zhǎng),GCGRU 模型的SACC分別比BP 模型和GRU 模型的SACC提高了10.4%和8.1%。因此,本文提出的GCGRU 模型比SVR模型和BP模型的預(yù)測(cè)精度都高。
圖6 模型精度比較
最后,將GCGRU 模型與不具備空間信息捕捉能力的GRU模型進(jìn)行了對(duì)比,結(jié)果如圖7和圖8所示。對(duì)于15,30,45 和60 min 的預(yù)測(cè)時(shí)間步長(zhǎng),GCGRU 模型的SRMSE比GRU 模型分別降低了28.9%,21.4%,29.8%和29.8%,SACC分別提高了8.1%,6.3%,10.9% 和10.6%。因此,GRU 和GCN 融合模型實(shí)現(xiàn)了數(shù)據(jù)中時(shí)空關(guān)系的高效挖掘,預(yù)測(cè)效果比既有的GRU模型好。
表2 GCGRU模型和基線模型預(yù)測(cè)性能的比較結(jié)果
圖7 GCGRU模型與GRU模型的均方根誤差比較
圖8 GCGRU模型與GRU模型的預(yù)測(cè)精度比較
綜上,與所有基線模型相比,本文提出的GCGRU模型在不同的評(píng)價(jià)指標(biāo)和預(yù)測(cè)時(shí)間步長(zhǎng)情況下的表現(xiàn)性能都最好。
3.4.2 單個(gè)車站預(yù)測(cè)性能
將GCGRU 模型與GRU 模型在每個(gè)車站的預(yù)測(cè)性能進(jìn)行了進(jìn)一步的比較分析,得到圖9和圖10。由圖可知,對(duì)于每個(gè)車站而言,GCGRU 模型的SRMSE比GRU 模型的都低,R2GRU 模型的也高;特別在公園前車站,GCGRU 模型與GRU 模型的SRMSE差距最大,前者相對(duì)于后者降低了47.8%;在體育西路車站,GCGRU 模型與GRU 模型的R2差距最大,前者相對(duì)于后者提升了23.9%。此外,GCGRU 模型預(yù)測(cè)結(jié)果中琶洲站的SRMSE最高,R2最低。這主要是因?yàn)榕弥捃囌靖浇姓褂[中心,經(jīng)常會(huì)有展覽活動(dòng),因此預(yù)測(cè)效果不是很好,未來(lái)需要進(jìn)一步挖掘時(shí)空關(guān)系和外在因素。
圖9 GCGRU模型和GRU模型在不同車站的均方根誤差比較
圖10 GCGRU模型和GRU模型不同車站決定系數(shù)比較
圖11為6 個(gè)車站的2017年5月客流擬合圖。由圖可知:琶洲站和珠江新城站的客流呈單峰趨勢(shì),且都為早高峰;其余車站都呈現(xiàn)早晚雙峰趨勢(shì)。進(jìn)一步分析,在琶洲站,GRU 模型在高峰時(shí)期的預(yù)測(cè)值比真實(shí)值低,如圖11(c)所示;而在楊箕站,GRU 模型在高峰時(shí)期的預(yù)測(cè)值又比真實(shí)值高,如圖11(e)所示。因此,GCGRU 模型的預(yù)測(cè)效果優(yōu)于GRU模型。
圖11 不同車站的客流擬合曲線圖
3.4.3 鄰接矩陣影響
為了驗(yàn)證旅行時(shí)間鄰接矩陣的有效性,將GC?GRU 模型與地理鄰接矩陣的模型進(jìn)行了比較。令基于地理鄰接矩陣的模型為GCGRU*,比較GC?GRU 與GCGRU*在不同預(yù)測(cè)步長(zhǎng)下的SRMSE與SACC,如圖12所示。針對(duì)15,30,45 和60 min 的預(yù)測(cè)步長(zhǎng),GCGRU 比GCGRU*的SRMSE分別減少了6.1%,2.7%,2.4%和5.3%;SACC分別增加了0.8%,1.0%,1.0% 和3.0%。由此可見(jiàn),GCGRU 的預(yù)測(cè)性能更好,因此基于旅行時(shí)間構(gòu)建的鄰接矩陣更適合于城市軌道交通網(wǎng)絡(luò)的短期客流預(yù)測(cè)。
圖12 GCGRU與GCGRU*預(yù)測(cè)的均方根誤差和精度比較
本文提出了1 種新的融合循環(huán)門控單元的時(shí)空?qǐng)D卷積神經(jīng)網(wǎng)絡(luò)模型(GCGRU)來(lái)預(yù)測(cè)城市軌道交通短時(shí)客流。循環(huán)門控單元用以提取時(shí)間特征,圖卷積神經(jīng)網(wǎng)絡(luò)用以提取空間特征。以廣州地鐵路網(wǎng)6 個(gè)車站的短時(shí)客流預(yù)測(cè)為例進(jìn)行模型的有效性驗(yàn)證。結(jié)果表明,該模型的預(yù)測(cè)性能優(yōu)于ARI?MA,SVR,BP 和GRU 等基線模型,對(duì)于整體預(yù)測(cè)結(jié)果來(lái)說(shuō),精度至少提高了6.3%,最多可提高80.5%。對(duì)于單站客流預(yù)測(cè)結(jié)果來(lái)說(shuō),精度至少提高了1.4%,最多可提高23.9%。因此,本文提出的模型能夠有效地刻畫各車站客流間的時(shí)空演化關(guān)系,具有精度高、解釋性強(qiáng)等特點(diǎn),可以較好地為城市軌道交通日??土鹘M織和管理提供輔助決策。
本文提出的模型是1 個(gè)靜態(tài)的空間卷積網(wǎng)絡(luò)模型,其鄰接矩陣不會(huì)隨著時(shí)間而改變。但實(shí)際上,各站點(diǎn)之間的空間關(guān)系會(huì)隨時(shí)間變化。因此未來(lái)可嘗試將動(dòng)態(tài)的GCN與GRU相結(jié)合來(lái)預(yù)測(cè)客流。本文提出的模型目前只考慮了鄰接矩陣和進(jìn)站客流對(duì)出站客流的影響。實(shí)際上,出站客流還受到周期、時(shí)段以及天氣等因素的影響,未來(lái)可將這些因素考慮到模型中,以提高模型精度。此外,未來(lái)本模型還可以考慮應(yīng)用在進(jìn)站量預(yù)測(cè)上。