摘要: 地鐵乘客流量預(yù)測(cè)是智能交通系統(tǒng)的重要環(huán)節(jié),當(dāng)前大多數(shù)預(yù)測(cè)模型較少對(duì)地鐵乘客流量進(jìn)行時(shí)空相關(guān)性建模,且未考慮空氣質(zhì)量等天氣因素帶來(lái)的影響,存在地鐵乘客流量預(yù)測(cè)準(zhǔn)確度不高的問(wèn)題。針對(duì)以上問(wèn)題,提出基于注意力機(jī)制的時(shí)空長(zhǎng)短期記憶(ASTLSTM)網(wǎng)絡(luò)的地鐵乘客流量短時(shí)預(yù)測(cè)模型。首先,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;然后,利用注意力機(jī)制與圖卷積網(wǎng)絡(luò)(GCN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)相融合,挖掘地鐵數(shù)據(jù)中的時(shí)空相關(guān)性,并通過(guò)長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)來(lái)提取空氣質(zhì)量數(shù)據(jù)中的外部特征;最后,通過(guò)特征融合得到地鐵乘客流量預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,ASTLSTM模型與LSTM、Conv LSTM等典型模型相比,在短期的地鐵乘客流量預(yù)測(cè)上都有較高的準(zhǔn)確度。
關(guān)鍵詞: 地鐵乘客流量預(yù)測(cè); 時(shí)空特征; 注意力機(jī)制; 圖卷積神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào): TP389.1
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1671-6841(2024)05-0055-07
DOI: 10.13705/j.issn.1671-6841.2023040
Short-term Forecast of Subway Passenger Flow Based on ASTLSTM
TIAN Zhao1,2, CHENG Yujie1,2, ZHANG Qianzhong1,2, NIU Yajie1,2, LIU Wei1,2, YANG Yanfang3,4
(1.School of Cyber Science and Engineering, Zhengzhou University, Zhengzhou 450002, China;
2.Zhengzhou Key Laboratory of Blockchain and Data Intelligence, Zhengzhou 450002, China;
3.Academy of Transportation Sciences, Beijing 100029, China; 4.Key Laboratory of Transport
Industry of Big Data Application Technologies for Comprehensive Transport, Beijing 100029, China)
Abstract: The prediction of subway passenger flow was an important part of the intelligent transportation system. Currently, most existing prediction models had limited modeling of the spatiotemporal correlation of subway passenger flow and could not take into account the impact of weather factors such as air quality, resulting in low accuracy in predicting subway passenger flow. To address these issues, a short-term prediction model of subway passenger flow based on the attention mechanism of spatio-temporal long short-term memory network (ASTLSTM) was proposed. Firstly, data preprocessing was performed. Then, attention mechanism was combined with graph convolutional network (GCN) and convolutional neural network (CNN) to mine the spatiotemporal correlation in subway data. External features from air quality data were extracted using long short-term memory (LSTM) network. Finally, feature fusion was performed to obtain the final prediction results for subway passenger flow. The experimental results showed that the ASTLSTM model had higher accuracy in short-term prediction of subway passenger flow compared to typical models such as LSTM and Conv LSTM.
Key words: subway passenger flow forecast; temporal and spatial characteristics; attention mechanism; graph convolutional networks
0 引言
隨著我國(guó)城市經(jīng)濟(jì)的迅猛增長(zhǎng)與地鐵交通工程的蓬勃發(fā)展,人們的出行更加方便快捷。但乘坐地鐵人數(shù)的激增與復(fù)雜的地鐵交通線路,給地鐵造成了極大的運(yùn)載壓力,同時(shí)導(dǎo)致一些安全事故[1]。因此,準(zhǔn)確預(yù)測(cè)地鐵乘客流量可以為地鐵交通管理者提供有力的數(shù)據(jù)支撐,從而有效緩解交通擁堵的狀況。
目前針對(duì)客流量預(yù)測(cè)的研究中,傳統(tǒng)機(jī)器學(xué)習(xí)模型有最大期望算法、決策樹(shù)[2]、支持向量機(jī)[3]、隨機(jī)森林[4]等。Zhang等[5]提出使用隨機(jī)森林與支持向量回歸算法來(lái)預(yù)測(cè)交通流量。李麗輝等[6]通過(guò)使用隨機(jī)森林算法進(jìn)行客流量預(yù)測(cè),取得了較好的效果。
如今正處于大數(shù)據(jù)時(shí)代,龐大復(fù)雜的交通數(shù)據(jù)導(dǎo)致從數(shù)據(jù)中提取特征的難度增加,傳統(tǒng)的機(jī)器學(xué)習(xí)模型提取特征及挖掘數(shù)據(jù)中的時(shí)空相關(guān)性效果并不理想,而深度學(xué)習(xí)模型可以自動(dòng)提取特征并挖掘數(shù)據(jù)的時(shí)空相關(guān)性。如何將深度學(xué)習(xí)應(yīng)用于地鐵乘客流量預(yù)測(cè)等時(shí)空序列預(yù)測(cè)問(wèn)題,引起了研究人員的關(guān)注。趙建立等[7]針對(duì)這一問(wèn)題,提出基于CNN與殘差網(wǎng)絡(luò)相融合的預(yù)測(cè)模型。Zhu等[8]提出基于RNN-GCN和BRB的交通流預(yù)測(cè)模型。陳俊彥等[9]提出一種基于注意力機(jī)制和多圖視角圖神經(jīng)網(wǎng)絡(luò)的軌道交通客流量預(yù)測(cè)方法MGCNSTA。Guo等[10]提出一種預(yù)測(cè)模型ASTGCN,該模型主要對(duì)交通流數(shù)據(jù)按照近鄰周期、日周期、周周期規(guī)律進(jìn)行劃分,引入基于注意力機(jī)制的時(shí)空?qǐng)D卷積神經(jīng)模型對(duì)客流量進(jìn)行預(yù)測(cè),取得了較好的成績(jī)。趙昱博[11]提出基于Conv-LSTM的短時(shí)交通流量預(yù)測(cè)模型,通過(guò)捕獲交通流的時(shí)空特征來(lái)預(yù)測(cè)實(shí)際客流量。Zhang等[12]提出了ResLSTM的深度學(xué)習(xí)模型,在網(wǎng)絡(luò)規(guī)模上預(yù)測(cè)城市軌道交通的短期客流。Yang等[13]通過(guò)將注意力機(jī)制引入LSTM,成功進(jìn)行交通流預(yù)測(cè)。
在現(xiàn)有的研究中,仍面臨挑戰(zhàn)。
1) 由于地鐵乘客流量具有時(shí)空相關(guān)性的特點(diǎn),僅靠單一的循環(huán)神經(jīng)網(wǎng)絡(luò)或圖神經(jīng)網(wǎng)絡(luò)很難有效對(duì)地鐵乘客流量數(shù)據(jù)的時(shí)空特征進(jìn)行提取,從而影響預(yù)測(cè)的準(zhǔn)確度。
2) 在地鐵乘客流量短時(shí)預(yù)測(cè)中,空氣質(zhì)量等非時(shí)空因素對(duì)地鐵乘客流量的影響也非常重要,然而現(xiàn)有的研究很少關(guān)注這些外部特征。
3) 在地鐵乘客流量短時(shí)預(yù)測(cè)中,目前大多數(shù)研究?jī)H針對(duì)乘客總?cè)藬?shù)進(jìn)行預(yù)測(cè),并未考慮將進(jìn)站與出站人數(shù)分開(kāi)預(yù)測(cè)。
因此,本文構(gòu)建基于ASTLSTM的地鐵乘客流量短時(shí)預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)地鐵乘客流量的多步預(yù)測(cè),提升模型預(yù)測(cè)準(zhǔn)確度。
1 ASTLSTM地鐵乘客流量預(yù)測(cè)
本文提出基于ASTLSTM的地鐵乘客流量短時(shí)預(yù)測(cè)模型,其結(jié)構(gòu)如圖1所示。模型由四部分組成。
1) 數(shù)據(jù)預(yù)處理。通過(guò)對(duì)輸入的地鐵乘客流量數(shù)據(jù)以及空氣質(zhì)量數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,并將其按照近鄰周期、日周期、周周期規(guī)律進(jìn)行切片,最后進(jìn)行批量歸一化操作,將非數(shù)據(jù)轉(zhuǎn)化為訓(xùn)練所需的歐氏數(shù)據(jù)。
2) 時(shí)空特征提取。通過(guò)基于注意力機(jī)制的GCN和CNN來(lái)挖掘地鐵乘客流量數(shù)據(jù)中的動(dòng)態(tài)時(shí)空特征。
3) 外部特征提取。通過(guò)基于注意力機(jī)制的LSTM來(lái)捕獲空氣質(zhì)量等外部特征,從而提升模型預(yù)測(cè)的準(zhǔn)確度。
4) 特征融合。利用特征融合方式,對(duì)提取的時(shí)空特征以及外部特征進(jìn)行特征融合,最終得到地鐵乘客流量預(yù)測(cè)值。
1.1 數(shù)據(jù)預(yù)處理
1.1.1 數(shù)據(jù)清洗
數(shù)據(jù)質(zhì)量會(huì)直接影響模型預(yù)測(cè)的準(zhǔn)確度,因此需要對(duì)異常數(shù)據(jù)檢查和修復(fù)。1) 有明顯的邏輯錯(cuò)誤數(shù)據(jù),例如同一用戶在相鄰時(shí)間內(nèi)不可能有連續(xù)兩次入站或出站記錄,可通過(guò)兩次記錄的時(shí)間差來(lái)剔除錯(cuò)誤數(shù)據(jù)。2) 如同一用戶在同一時(shí)間有多條重復(fù)的入站或出站記錄,可通過(guò)刪除相同的數(shù)據(jù)來(lái)清理冗余數(shù)據(jù)。3) 數(shù)據(jù)采集過(guò)程中,經(jīng)常存在數(shù)據(jù)缺失現(xiàn)象,可采用差值法進(jìn)行缺失值填充。
1.1.2 數(shù)據(jù)切片
城市軌道交通網(wǎng)絡(luò)被表示為G=(V,E,A)。其中:V={V1,V2,…,Vn}表示地鐵的站點(diǎn);E表示站點(diǎn)之間具有連通性的邊集。鄰接矩陣表示為A=aij,aij可用0或1來(lái)表示兩站點(diǎn)之間是否相連通。對(duì)于特征矩陣Xt∈Rn×m,n為地鐵站點(diǎn)數(shù),m為節(jié)點(diǎn)的特征數(shù)量。
由于地鐵乘客流量數(shù)據(jù)具有時(shí)間周期性的特點(diǎn),為有效提取其周期性特征,本文考慮在預(yù)處理階段將地鐵歷史流量數(shù)據(jù)沿著時(shí)間軸截取長(zhǎng)度為Ic、Id、Iw,分別作為近鄰組件、日周期組件和周周期組件的輸入。
預(yù)測(cè)窗口Ip是由其對(duì)應(yīng)的近鄰周期序列Ic、日周期序列Id以及周周期序列Iw作為輸入預(yù)測(cè)出來(lái)的。假定預(yù)測(cè)窗口序列為Ip,p為預(yù)測(cè)窗口的大小,t0是預(yù)測(cè)點(diǎn)對(duì)應(yīng)的編號(hào),o為一小時(shí)中的數(shù)據(jù)點(diǎn)個(gè)數(shù),q為一天中的數(shù)據(jù)點(diǎn)個(gè)數(shù),q=24×o,r為一周中 的數(shù)據(jù)點(diǎn)個(gè)數(shù),r=7×q。近鄰周期序列Ic、日周期序列Id和周周期序列Iw分別表示為
Ic=(Xt0-c×o+1,…,Xt0-o+o),
Id=(Xt0-d×q+1,…,Xt0-q+p),
Iw=(Xt0-w×r+1,…,Xt0-r+p)。
1.1.3 數(shù)據(jù)歸一化 在進(jìn)行訓(xùn)練之前,對(duì)地鐵乘客流量數(shù)據(jù)進(jìn)行歸一化處理。本文采用Z-score歸一化,過(guò)程為
x′=x-mean(x)std(x),
式中:mean(·)是數(shù)據(jù)的均值;std(·)是數(shù)據(jù)的標(biāo)準(zhǔn)差。
1.2 時(shí)空特征提取
1.2.1 空間特征提取
GCN是一種能夠直接作用于圖并且利用其結(jié)構(gòu)信息的卷積神經(jīng)網(wǎng)絡(luò),從而能夠用于提取地鐵乘客流量數(shù)據(jù)中的空間特征,GCN傳遞信息過(guò)程如圖2所示。GCN通過(guò)將卷積定理應(yīng)用于圖,完成節(jié)點(diǎn)之間的信息傳播與聚合,在處理交通流數(shù)據(jù)中取得較好的效果。
在地鐵乘客流量數(shù)據(jù)中,不同地理位置的交通狀況會(huì)相互影響,具有高度的空間動(dòng)態(tài)性。因此,在GCN之上引入注意力機(jī)制,來(lái)提取空間維度中的動(dòng)態(tài)相關(guān)性。本文分別對(duì)近鄰周期序列、日周期序列、周周期序列進(jìn)行空間特征提取。
為動(dòng)態(tài)提取地鐵乘客流量的空間相關(guān)性,這里以近鄰周期序列為例,構(gòu)建空間注意力系數(shù)Satt,
Satt=Vs⊙σ((IcW1)W2(W3Ic)T+bs),
式中:W1∈Rl、W2∈Rl×m、W3∈Rm、Vs∈Rn×n、bs∈Rn×n均為待學(xué)習(xí)參數(shù);W1為近鄰周期序列段的權(quán)重;W2為地鐵乘客流量數(shù)據(jù)的特征權(quán)重;W3為近鄰周期序列段維度和特征維度之間交互的權(quán)重;n為地鐵站點(diǎn)數(shù);l為近鄰周期序列長(zhǎng)度;m為節(jié)點(diǎn)的特征數(shù)量;Ic為前文劃分的近鄰周期序列;σ為ReLU激活函數(shù);⊙是Hadamard乘積。
1.2.2 時(shí)間特征提取
CNN在訓(xùn)練時(shí),利用其局部權(quán)值可共享的特性,從地鐵乘客流量數(shù)據(jù)中提取特征并進(jìn)行學(xué)習(xí),從而降低網(wǎng)絡(luò)的復(fù)雜性,有效緩解關(guān)系的過(guò)度擬合問(wèn)題。由于地鐵乘客流量數(shù)據(jù)中,在不同時(shí)刻下各個(gè)節(jié)點(diǎn)之間的影響各不相同。因此在CNN基礎(chǔ)上,引入注意力機(jī)制來(lái)衡量不同節(jié)點(diǎn)輸入特征以及不同時(shí)刻輸入特征的重要性程度,從而提取時(shí)間維度中的動(dòng)態(tài)相關(guān)性。
為提取不同時(shí)間上的動(dòng)態(tài)相關(guān)性,對(duì)時(shí)間維度上的標(biāo)準(zhǔn)卷積層進(jìn)行堆疊,通過(guò)合并相鄰時(shí)間切片上的信息來(lái)更新節(jié)點(diǎn),主要步驟與空間特征提取相同。
綜上所述,利用基于注意力機(jī)制的GCN與CNN相結(jié)合,能夠準(zhǔn)確提取地鐵乘客流量數(shù)據(jù)中的時(shí)空特征。
1.3 外部特征提取
天氣、空氣質(zhì)量等因素也會(huì)影響地鐵乘客流量預(yù)測(cè)的結(jié)果。例如在暴雨、風(fēng)雪等惡劣天氣下,人們極大概率會(huì)待在家中,且較差的空氣質(zhì)量也會(huì)降低人們的出行概率。目前,只有部分文獻(xiàn)的地鐵乘客流量預(yù)測(cè)模型引入空氣質(zhì)量因素。因此,將空氣質(zhì)量引入模型,利用LSTM對(duì)這些空氣質(zhì)量數(shù)據(jù)的時(shí)間序列進(jìn)行分析,從而提取外部特征,來(lái)達(dá)到優(yōu)化模型準(zhǔn)確度的目的。
由于注意力機(jī)制是通過(guò)概率分配的方法,對(duì)比較重要的信息給予較多的關(guān)注度,減少甚至忽略無(wú)關(guān)信息的影響,有利于模型預(yù)測(cè)。因此,在LSTM上引入注意力機(jī)制,用分配概率方法取代原來(lái)的隨機(jī)分配,通過(guò)結(jié)合多種結(jié)構(gòu)有效挖掘數(shù)據(jù)間的內(nèi)在規(guī)律,最終提高預(yù)測(cè)準(zhǔn)確度?;谧⒁饬C(jī)制的LSTM模型如圖3所示。
基于注意力機(jī)制的LSTM的計(jì)算過(guò)程為
St=σ(WtXt+bt),
Yt=softmax(St)⊙Xt,
式中:Wt、bt是可學(xué)習(xí)參數(shù);Xt是空氣質(zhì)量數(shù)據(jù);σ為ReLU激活函數(shù);St為相關(guān)注意力關(guān)系;⊙是Hadamard乘積。
1.4 特征融合輸出
將提取的時(shí)空特征與外部特征進(jìn)行特征融合,取得地鐵乘客流量預(yù)測(cè)結(jié)果。地鐵流量數(shù)據(jù)中有非常明顯的周期關(guān)系,空氣質(zhì)量等外部因子對(duì)預(yù)測(cè)結(jié)果也有影響,這些特征對(duì)每個(gè)節(jié)點(diǎn)的影響權(quán)重也各不相同,特征融合的具體步驟如下。
步驟1 對(duì)權(quán)重參數(shù)矩陣進(jìn)行初始化操作,矩陣值范圍為[0,1];
步驟2 將權(quán)重參數(shù)矩陣與組件的輸出進(jìn)行Hadamard,之后相加求和;
步驟3 在訓(xùn)練過(guò)程中找出最小損失值來(lái)確定權(quán)重參數(shù),
Y^=Ww⊙Y^w+Wd⊙Y^d+Wc⊙Y^c+Wt⊙Y^t,
式中:⊙是Hadamard乘積;Ww、Wd、Wc、Wt分別是周周期、日周期、近鄰周期以及空氣質(zhì)量組件的權(quán)重參數(shù);Y^w、Y^d、Y^c、Y^t分別是周周期組件、日周期組件、近鄰周期組件以及空氣質(zhì)量組件輸出結(jié)果。
2 實(shí)驗(yàn)部分
2.1 實(shí)驗(yàn)數(shù)據(jù)
為評(píng)估本文提出的模型性能,使用杭州2019年1月的地鐵數(shù)據(jù)集進(jìn)行分析,這些數(shù)據(jù)包含杭州81個(gè)地鐵站約7 000萬(wàn)條的交通數(shù)據(jù),地鐵數(shù)據(jù)及數(shù)據(jù)結(jié)構(gòu)如表1所示。對(duì)地鐵數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗后,將原始數(shù)據(jù)匯總成時(shí)間間隔為15 min的數(shù)據(jù)樣本??諝赓|(zhì)量數(shù)據(jù)則全部來(lái)自中國(guó)環(huán)境監(jiān)測(cè)總站,空氣質(zhì)量數(shù)據(jù)結(jié)構(gòu)如表2所示。
本次實(shí)驗(yàn)采用Python3.7編程語(yǔ)言實(shí)現(xiàn),并在macOS12.4操作系統(tǒng)下運(yùn)行。在訓(xùn)練模型的過(guò)程中,采用Adam梯度優(yōu)化算法,學(xué)習(xí)率為0.001。模型最小預(yù)測(cè)時(shí)長(zhǎng)為15min,最大預(yù)測(cè)時(shí)長(zhǎng)為2h。為 驗(yàn)證本文所提模型的優(yōu)越性,本文選取LSTM、Conv LSTM模型與ASTLSTM模型作對(duì)比,采用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)作為誤差分析指標(biāo)。
MAE=1n∑ni=1y^i-yi,RMSE=1n∑ni=1y^i-yi2,
其中:yi表示第i個(gè)交通數(shù)據(jù)樣本的實(shí)際乘客流量;y^i表示第i個(gè)交通數(shù)據(jù)樣本的預(yù)測(cè)乘客流量;n為樣本數(shù)。
2.2 實(shí)驗(yàn)結(jié)果
本次實(shí)驗(yàn)數(shù)據(jù)樣本的時(shí)間間隔為15 min,分別將預(yù)測(cè)窗口個(gè)數(shù)設(shè)定為1、4和8,用來(lái)預(yù)測(cè)未來(lái)15 min、1 h和2 h的站點(diǎn)流量,實(shí)現(xiàn)多點(diǎn)預(yù)測(cè)功能。將本文模型與其他模型進(jìn)行比較,以1 h預(yù)測(cè)為基準(zhǔn),驗(yàn)證模型的預(yù)測(cè)性能。地鐵乘客流入量與流出量預(yù)測(cè)誤差結(jié)果如表3所示,本文提出的模型在各方面均取得較優(yōu)的結(jié)果。以地鐵流入客流量為例進(jìn)行分析,相比LSTM模型,ASTLSTM模型的MAE減少了20.36%;與Conv LSTM模型相比,減少了14.66%。這可能是因?yàn)長(zhǎng)STM模型與Conv LSTM模型僅從時(shí)間維度提取地鐵數(shù)據(jù)特征,效果遠(yuǎn)低于從時(shí)間和空間兩個(gè)維度提取地鐵數(shù)據(jù)特征的模型。除此之外,ASTLSTM-No W模型是未引入空氣質(zhì)量訓(xùn)練的模型,ASTLSTM是引入空氣質(zhì)量訓(xùn)練的模型。因此,引入外部因子空氣質(zhì)量后,模型的誤差減少了3.94%,證明空氣質(zhì)量因素對(duì)模型準(zhǔn)確度的提升有一定促進(jìn)作用。
選取某一站點(diǎn)進(jìn)行地鐵乘客流量預(yù)測(cè)分析,圖4中(a)和(b)分別表示該預(yù)測(cè)站點(diǎn)在未來(lái)1h的流入量和流出量的整體預(yù)測(cè)結(jié)果。從圖4中可以看出,無(wú)論是在早高峰、中平峰還是晚高峰,本文提出的模型對(duì)乘客流入量與流出量的預(yù)測(cè)值較為準(zhǔn)確,擬合效果較好。同時(shí)也可看出ASTLSTM模型的預(yù)測(cè)結(jié)果明顯優(yōu)于Conv LSTM模型的預(yù)測(cè)結(jié)果。
本文分別對(duì)未來(lái)15min、1h和2 h進(jìn)行地鐵乘客流量預(yù)測(cè),預(yù)測(cè)的誤差結(jié)果如圖5所示。從中明顯看出隨著預(yù)測(cè)時(shí)長(zhǎng)的增長(zhǎng),ASTLSTM模型的預(yù)測(cè)誤差相較Conv LSTM模型,誤差增長(zhǎng)幅度較小。
同時(shí),從圖中可以發(fā)現(xiàn)預(yù)測(cè)未來(lái)15 min客流量的結(jié)果要優(yōu)于預(yù)測(cè)未來(lái)2 h的客流量結(jié)果。但是也存在缺點(diǎn),由于每次只能預(yù)測(cè)未來(lái)15 min的結(jié)果,那么如果想預(yù)測(cè)某站點(diǎn)一天內(nèi)6:00—22:00的客流量,就需要(22-6)×60÷15=64次引入模型計(jì)算,這樣的操作非常不方便,從而導(dǎo)致預(yù)測(cè)效率非常低下。因此可以考慮使用預(yù)測(cè)時(shí)長(zhǎng)為1 h或者2 h,其中1 h的預(yù)測(cè)時(shí)長(zhǎng)僅需要16次計(jì)算,2 h的預(yù)測(cè)時(shí)長(zhǎng)需要8次計(jì)算,使得預(yù)測(cè)效率大幅提升。針對(duì)ASTLSTM模型,與預(yù)測(cè)15 min時(shí)長(zhǎng)的MAE相比,預(yù)測(cè)時(shí)長(zhǎng)在1 h和2 h的MAE分別增加10.69%和18.16%,但預(yù)測(cè)效率分別提高75%和87.5%。因此,如果對(duì)預(yù)測(cè)準(zhǔn)確度要求很高時(shí),可以選擇15 min預(yù)測(cè)時(shí)長(zhǎng);如果想節(jié)省效率,可以采用2 h預(yù)測(cè)時(shí)長(zhǎng);如果想同時(shí)兼顧兩者,可以選擇1 h預(yù)測(cè)時(shí)長(zhǎng)。
與Conv LSTM模型相比,無(wú)論在15min、1h還是2h的地鐵乘客流量預(yù)測(cè),ASTLSTM模型預(yù)測(cè)結(jié)果與真實(shí)值擬合較好,即使在高峰期也可以保持較好的預(yù)測(cè)性能。隨著預(yù)測(cè)時(shí)長(zhǎng)的增加,ASTLSTM模型預(yù)測(cè)誤差上升幅度比Conv LSTM模型平穩(wěn)。圖6、圖7分別代表該預(yù)測(cè)站點(diǎn)在未來(lái)15min、2h的流入量和流出量的預(yù)測(cè)結(jié)GxX01TT7SthcOVixH3x4ZCKzKb9eVAMimVvcPYvmkT0=果。
3 結(jié)論
本文提出ASTLSTM模型來(lái)提高地鐵乘客流量短時(shí)預(yù)測(cè)的準(zhǔn)確度。通過(guò)將時(shí)空注意力機(jī)制和時(shí)空卷積結(jié)合起來(lái),并引入外部因子空氣質(zhì)量,有效提升預(yù)測(cè)的準(zhǔn)確度。
通過(guò)對(duì)比實(shí)驗(yàn),ASTLSTM模型與LSTM和Conv LSTM相比,在多步預(yù)測(cè)上具有較低的MAE、RMSE以及較高的預(yù)測(cè)準(zhǔn)確度。同時(shí),引入空氣質(zhì)量的ASTLSTM模型明顯優(yōu)于未引入空氣質(zhì)量的模型。
本文雖引入空氣質(zhì)量來(lái)提升模型預(yù)測(cè)準(zhǔn)確度,但還有一些重要因素沒(méi)有考慮進(jìn)去,例如站點(diǎn)所處位置的城市區(qū)域信息、發(fā)生事件等信息,后續(xù)工作將通過(guò)引入這些相關(guān)因素繼續(xù)優(yōu)化模型,并將模型應(yīng)用于其他交通預(yù)測(cè)場(chǎng)景,例如高速公路車(chē)流量預(yù)測(cè)等。
參考文獻(xiàn):
[1] 王瑞山, 靳瀾濤. 地鐵場(chǎng)所踩踏事故的生成特征與風(fēng)險(xiǎn)治理: 2008年以來(lái)15起典型事故的考察[J]. 中國(guó)人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2016, 32(4): 141-148.
WANG R S, JIN L T. Generation characteristics and risk management of stampede accidents in subway places—investigation of 15 typical accidents since 2008[J]. Journal of People′s public security university of China (social sciences edition), 2016, 32(4): 141-148.
[2] CHARBUTY B, ABDULAZEEZ A. Classification based on decision tree algorithm for machine learning[J]. Journal of applied science and technology trends, 2021, 2(1): 20-28.
[3] 楊曉敏. 改進(jìn)灰狼算法優(yōu)化支持向量機(jī)的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 電子測(cè)量與儀器學(xué)報(bào), 2021, 35(3):ynIgswxLENQASY6iF87cgvJKk6OJI+5BXsO8nI3kSuM= 211-217.
YANG X M. Improved gray wolf algorithm to optimize support vector machine for network traffic prediction[J]. Journal of electronic measurement and instrumentation, 2021, 35(3): 211-217.
[4] ZIMMERMAN N, PRESTO A A, KUMAR S P N, et al. A machine learning calibration model using random forests to improve sensor performance for lower-cost air quality monitoring[J]. Atmospheric measurement techniques, 2018, 11(1): 291-313.
[5] ZHANG L Z, ALHARBE N R, LUO G C, et al. A hybrid forecasting framework based on support vector regression with a modified genetic algorithm and a random forest for traffic flow prediction[J]. Tsinghua science and technology, 2018, 23(4): 479-492.
[6] 李麗輝, 朱建生, 強(qiáng)麗霞, 等. 基于隨機(jī)森林回歸算法的高速鐵路短期客流預(yù)測(cè)研究[J]. 鐵道運(yùn)輸與經(jīng)濟(jì), 2017, 39(9): 12-16.
LI L H, ZHU J S, QIANG L X, et al. Study on forecast of high-speed railway short-term passenger flow based on random forest regression[J]. Railway transport and economy, 2017, 39(9): 12-16.
[7] 趙建立, 石敬詩(shī), 孫秋霞, 等. 基于混合深度學(xué)習(xí)的地鐵站進(jìn)出客流量短時(shí)預(yù)測(cè)[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2020, 20(5): 128-134.
ZHAO J L, SHI J S, SUN Q X, et al. Short-time inflow and outflow prediction of metro stations based on hybrid deep learning[J]. Journal of transportation systems engineering and information technology, 2020, 20(5): 128-134.
[8] ZHU H L, XIE Y W, HE W, et al. A novel traffic flow forecasting method based on RNN-GCN and BRB[J]. Journal of advanced transportation, 2020, 2020: 1-11.
[9] 陳俊彥, 黃雪鋒, 韋俊宇, 等. 基于多圖時(shí)空注意力的軌道交通客流預(yù)測(cè)模型[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版), 2023, 55(4): 39-45.
CHEN J Y, HUANG X F, WEI J Y, et al. A prediction method of rail transit passenger flow based on multi-graph spatial and temporal attention[J]. Journal of Zhengzhou university (natural science edilCe0XvgvQsXdnKO11/G1fj7sRbSUNVu5+Z7ltAEc6LQ=tion), 2023, 55(4): 39-45.
[10]GUO S N, LIN Y F, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]∥Proceedings of the AAAI Conference on Artificial Intelligence. Alto Palo: AAAI Press, 2019: 922-929.
[11]趙昱博.基于Conv-LSTM的短時(shí)交通流量預(yù)測(cè)方法[C]∥第十五屆中國(guó)智能交通年會(huì).深圳:中國(guó)工信出版集團(tuán), 2020:344-352.
ZHAO Y B. Short-term traffic flow prediction method based on Conv-LSTM[C]∥The 15th China Intelligent Transportation Annual Conference. Shenzhen: China Industry and Information Publishing Group, 2022: 344-352.
[12]ZHANG J L, CHEN F, CUI Z Y, et al. Deep learning architecture for short-term passenger flow forecasting in urban rail transit[J]. IEEE transactions on intelligent transportation systems, 2021, 22(11): 7004-7014.
[13]YANG B L, SUN S L, LI J Y, et al. Traffic flow prediction using LSTM with feature enhancement[J]. Neurocomputing, 2019, 332: 320-327.