• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      城市軌道交通車站短時客流機器學習預測方法

      2022-09-27 12:55:10胡明偉施小龍吳雯琳何國慶
      深圳大學學報(理工版) 2022年5期
      關鍵詞:客流車站預測

      胡明偉,施小龍,吳雯琳,何國慶

      1)深圳大學土木與交通工程學院,廣東深圳 518060;2)深圳大學濱海城市韌性基礎設施教育部重點實驗室,廣東深圳 518060;3)深圳大學未來地下城市研究院,廣東深圳 518060;4)深圳大學深圳市地鐵地下車站綠色高效智能建造重點實驗室,廣東深圳518060

      根據(jù)中華人民共和國交通運輸部官方統(tǒng)計數(shù)據(jù)顯示,截至2022-06-30,中國開通運營地鐵的城市總計51個,開通運營城市軌道交通線路277 條,運營里程9 067 km,實際開行列車279萬列次,完成客運量17.8 億人次,進站量10.8 億人次[1].隨著國內各大城市軌道交通建設的日趨成熟,地鐵線路由簡單的單條線路逐步擴大成網(wǎng)絡狀,車站客流量隨之急劇增加,使整個地鐵系統(tǒng)的客流組織管理錯綜復雜,給地鐵運營部門帶來極大挑戰(zhàn).通過分析地鐵系統(tǒng)收集的海量歷史客流數(shù)據(jù)對車站短時客流進行預測,可以提前掌握乘客的出行規(guī)律.短時客流預測結果不僅可以幫助乘客躲避交通擁堵,還能為管理部門制定決策、運營管理及合理配置資源提供數(shù)據(jù)支撐,從而提高整個軌道系統(tǒng)的運行效率,實現(xiàn)軌道交通智慧化運營.

      短期客流預測方法包括基于統(tǒng)計學理論的客流預測方法、基于機器學習的客流預測方法和基于多模型融合的客流預測方法.近年來基于數(shù)據(jù)驅動的機器學習模型,如支持向量機、貝葉斯以及神經(jīng)網(wǎng)絡等,在智能交通領域特別是短期交通客流預測方面已取得較好效果.SUN等[2]提出一種基于貝葉斯算法的交通流預測模型,此模型可用于完整或有缺失的交通流數(shù)據(jù)集.CHANG等[3]提出一種基于k近鄰算法的交通流預測模型,并在實際數(shù)據(jù)集上進行多次實驗,結果表明,該模型適應于波動性大、不穩(wěn)定的交通流.JEONG等[4]提出一種基于支持向量機的交通流預測模型,與其他模型不同,此模型可以在線學習模型權重參數(shù),根據(jù)實際數(shù)據(jù)進行參數(shù)更新,達到提升預測效果的目的.傅貴等[5]基于支持向量機建立短時交通流預測模型,引入核函數(shù)對交通流數(shù)據(jù)進行預處理,通過中國廣州市交通流檢測系統(tǒng)的實際數(shù)據(jù),驗證模型的可行性和有效性.付宇等[6]基于地鐵車站客流,結合日期、時段、天氣及活動時間等外部客流特征,構建基于極限梯度提升(extreme gradient boosting,XGBoost)算法的大型活動期間地鐵客流預測模型.

      不同預測模型各具優(yōu)缺點,對場景的適應性也不同.基于多模型融合的客流預測模型可以綜合各個模型的優(yōu)點,建立預測性能佳、適應性好的預測模型.LI 等[7]對交通流數(shù)據(jù)進行特征分析,并以客流特征作為輸入,分別構建支持向量機預測模型和差分自回歸移動平均(autoregressive integrated moving average,ARIMA)預測模型,并將模型進行融合.SHI 等[8]提出基于XGBoost 和貝葉斯算法融合的列車到站延遲預測模型,基于可能影響下一站列車到達的11個特征建立XGBoost預測模型,利用貝葉斯優(yōu)化算法對XGBoost 的超參數(shù)進行調優(yōu),并通過實際案例表明該模型具有良好的預測效果.譚滿春等[9]構建ARIMA 模型和神經(jīng)網(wǎng)絡的組合模型,通過ARIMA 模型捕獲變量之間的線性關系,同時利用神經(jīng)網(wǎng)絡捕獲變量之間的非線性關系.

      傳統(tǒng)預測模型難以實現(xiàn)準確的短時客流預測,多數(shù)研究都是在預測模型算法上進行改進,沒有從乘客出行特征角度展開深入研究,也沒有綜合考慮時間、空間及外部影響因素對乘客的影響.本研究針對地鐵短時客流預測問題,研究乘客出行規(guī)律,基于機器學習算法,結合軌道交通客流特征,建立輕量的梯度提升機(light gradient boosting machine,LightGBM)、長短期記憶(long short-term memory,LSTM)及LightGBM-LSTM 融合模型,與ARIMA 和XGBoost 模型進行比較,并通過杭州地鐵的歷史自動售票系統(tǒng)(automatic fare collection,AFC)刷卡數(shù)據(jù)進行驗證,結果表明,基于LightGBM-LSTM融合模型預測性能更佳,對于不同類型車站的適應性更好.

      1 短時客流預測模型構建

      利用Python 編程語言在Sklearn 機器學習平臺上搭建基于LightGBM 的短時客流預測模型,模型構建流程如圖1.首先將預處理好的地鐵進出站客流數(shù)據(jù)按照預先設定的比例拆分為訓練集和測試集;LightGBM 模型核心參數(shù)及控制參數(shù)初始化后,將訓練數(shù)據(jù)作為輸入數(shù)據(jù)對LightGBM 模型進行訓練,同時在劃分好的測試集上進行檢驗,計算得到初始預測結果和預測誤差;在預測誤差基礎上,對模型參數(shù)進行調節(jié),從而得到精度更高的預測模型;若模型測試結果達到預期要求則停止訓練,輸出預測模型;最后,利用訓練好的預測模型對未來時段的客流進行預測.利用Python編程,在Tensorflow 平臺上建立基于LSTM 算法的短時客流預測模型,主要構建步驟與LightGBM模型大體相同.

      由于LightGBM 模型依靠人工挖掘的特征訓練得到合適的模型,LSTM 模型擅長處理高維時空數(shù)據(jù)特征,挖掘潛在時空特征,因此,利用決策樹將兩個單一的模型進行融合,以構建預測精度更高的LightGBM-LSTM 融合模型,其融合框架如圖2.可見,LightGBM與LSTM的融合框架包括:①數(shù)據(jù)預測處理及特征工程.因為地鐵進出站客流受時間、空間及天氣因素影響,需將復雜的影響因素進行特征工程工作,在原始數(shù)據(jù)中挑選合適的數(shù)據(jù)特征,便于預測模型訓練.②基于LightGBM 和LSTM 模型的構建.利用模型融合中的學習法進行模型集成,選用決策樹作為次級學習器,構建LightGBMLSTM 融合預測模型.通過Stacking 學習法將訓練得到的多個初級學習器進行預測,將預測生成的新數(shù)據(jù)用于訓練次級學習器,其具體過程可掃描文末右下角二維碼查看圖S1.

      圖2 LightGBM與LSTM模型融合框架Fig.2 LightGBM and LSTM model fusion framework.

      2 案例研究

      2.1 數(shù)據(jù)預處理

      本研究數(shù)據(jù)集選用杭州市地鐵2019-01-02 至2019-01-25的地鐵AFC刷卡數(shù)據(jù).由于AFC系統(tǒng)及一些人為因素,收集的原始AFC刷卡數(shù)據(jù)存在異常值或空值.其中,異常值主要包括:①進出站信息不完整,僅包含進站或出站記錄之一;②進出站的地鐵站為同一站點;③進出站時間邏輯混亂;④乘客的旅行時間過長或過短.因此,根據(jù)預定義的算法先對原始數(shù)據(jù)進行清洗,將臟數(shù)據(jù)處理成滿足質量要求的合理數(shù)據(jù).當判定某些數(shù)據(jù)為噪聲數(shù)據(jù)時,對其進行剔除.

      地鐵車站客流量定義為在統(tǒng)計周期內到達地鐵車站的乘客數(shù)量.其中,短時客流的統(tǒng)計周期T可根據(jù)實際需求進行調整,通常為5、10 或15 min.地鐵AFC數(shù)據(jù)記錄了乘客的進出站刷卡信息,若要在近7 000 萬條交易記錄中,獲取不同時間粒度的地鐵進出站客流量,需要對進出客流做進一步提取,為此,本研究所設計的算法流程如圖4.

      圖3 地鐵車站客流提取算法流程Fig.3 Algorithm flow of subway station passenger flow extraction.

      2.2 客流特征分析

      地鐵進出站客流是變化的動態(tài)流,其影響因素包括營運時間、前序客流、地鐵車站及其他外部數(shù)據(jù)[10].地鐵站點進出站客流在不同時間呈現(xiàn)不同的規(guī)律.利用地鐵車站進出客流提取算法得到每個車站的日進站客流、出站客流及總客流,其中,時間粒度選用1 個完整運營日,2019-01-02 至2019-01-25杭州市地鐵全路網(wǎng)客流量分布可掃描文末右下角二維碼查看圖S2.可見,杭州地鐵全路網(wǎng)的日總客流量呈現(xiàn)以7 d為周期的變化過程.

      利用k-means 算法對杭州地鐵日進出站客流進行聚類分析,以總客流量作為聚類特征.k-means聚類算法將運營日期劃分為3 大類客流特征日,如表1.

      表1 k-means算法的運營日劃分結果Table 1 Operation day division results by k-means algorithm

      當前時刻進出站客流量不僅與歷史進出站客流有關,也受到前序時段客流量的影響.為充分挖掘客流分布的時間特征,將前5個預測時段的客流也作為時間特征進行相關性分析.計算得到前5個時段的皮爾遜相關系數(shù)分別為0.95、0.87、0.66、0.41及0.23.

      不同地鐵站點的進出站客流存在較大差異,因此,將特征相似的地鐵站點劃分為一類展開研究.本研究采用k-means 聚類方法對杭州地鐵進行站點類型劃分,選取客流的形態(tài)特征、基本統(tǒng)計特征及時間分布特征作為聚類特征.其中,形態(tài)特征選用極大值點,基本統(tǒng)計特征選用偏度和峰度;時間分布特征選用客流時段分布均衡系數(shù)和高峰小時系數(shù),具體數(shù)據(jù)可掃描文末右下角二維碼查看表S1.

      杭州地鐵中的80個車站聚類后被劃分為5大類型,分別為工作型、居住型、居住工作混合型、購物型及交通樞紐型車站.外部環(huán)境因素也會對乘客的出行選擇產(chǎn)生一定影響,本研究選取天氣和空氣質量作為外部環(huán)境影響因素,采集杭州市2019-01-02至2019-01-25的天氣和空氣質量數(shù)據(jù),結果可掃描文末右下角二維碼查看補充材料表S2 和表S3.將不同特征變量輸入預測模型中,得到不同因素對乘客出行的影響.

      根據(jù)已構建的數(shù)據(jù)預處理算法,按照預測模型訓練學習的需要,本研究采用留出法將數(shù)據(jù)集劃分為訓練集、測試集和預測集.其中,2019-01-02至2019-01-20 的樣本數(shù)據(jù)用于訓練;2019-01-21 至2019-01-24 的樣本數(shù)據(jù)用于測試;2019-01-25 的樣本數(shù)據(jù)用于驗證模型的實際預測效果.

      應用LightGBM、LSTM 及LightGBM-LSTM 融合模型進行客流預測,并增加ARIMA和XGBOOST模型作為對照組.最后,根據(jù)聚類得到的站點類型,選取5 個代表車站進行模型預測結果分析.其中,居住類站點選取濱康路站作為代表案例;工作類站點選取盈豐路站;居住工作混合類站點選取九堡站;購物觀光類車站選取龍翔橋站;交通樞紐類車站選取杭州東站.采用2019-01-25的以10 min為時間粒度的進、出站客流量進行模型驗證.

      3 結果與討論

      3.1 評價指標

      3.1.1 平均絕對誤差

      平均絕對誤差(mean absolute error,MAE)可直觀反映平均誤差值大小,計算為

      其中,yi為真實值;為預測值;n為樣本個數(shù)MAE值越小,表明模型性能越好.

      3.1.2 均方根誤差

      均方根誤差(root mean square error,RMSE)對于一些異常值比較敏感,可以直觀表示預測值與真實值的平均偏離程度.RMSE 值越小,表明預測值與真實值越接近,預測模型的性能越好.RMSE 可計算為

      3.1.3 平均絕對百分誤差

      平均絕對百分誤差(mean absolute percentage error,MAPE)是相對誤差的變形,不僅可反映真實值和預測值間的誤差,還能反映誤差占真實值的百分比.MAPE 值越小,表明預測值越接近真實值,預測模型精度越高、性能越好.MAPE可計算為

      3.2 居住類型車站客流預測結果分析

      居住類車站(濱康路站)的進出站客流預測評價結果見表2.濱康路站位于居民區(qū),周圍土地的功能較單一,大多為居民小區(qū)類型用地.濱康路站進出客流趨勢具有明顯的潮汐特性,表現(xiàn)為單峰特征,客流在早高峰上班時間涌入.由表2可見,基于機器學習的模型表現(xiàn)整體好于傳統(tǒng)時間序列模型.由于機器學習模型考慮了時間、空間及天氣等多種特征,模型輸入?yún)?shù)更復雜,因此,模型的時間成本更高.在單一機器學習模型中,LSTM 模型表現(xiàn)最好.基于LightGBM-LSTM的融合模型在進站客流預測中,以MAE=7.041、RMSE=9.398 及MAPE=15.75%的指標綜合表現(xiàn)最好;在出站客流預測中則以MAE=9.845、RMSE=13.029 及MAPE=17.99%的指標綜合表現(xiàn)最好.

      表2 居住類車站(濱康路站)的進出站客流預測結果評價Table 2 Evaluation of passenger flow forecast results of residential station (Binkang Road Station)

      3.3 工作類型車站客流預測結果分析

      工作類車站(盈豐路站)進出站客流預測評價結果見表3.作為工作類型車站,盈豐路地鐵站周圍土地的功能多為居住類型.盈豐路地鐵站進出客流趨勢具有明顯的潮汐特性,與居住類車站類似都呈現(xiàn)單峰特征,但不同的是工作類車站的早高峰主要為出站客流,晚高峰主要為進站客流.

      表3 工作類車站(盈豐路站)進出站客流預測結果評價Table 3 Evaluation of passenger flow prediction results of work station (Yingfeng Road Station)

      由表3 可見,相較于LightGBM 和LSTM 模型,基于XGBoost 算法的模型較難適應工作類車站的客流特征,預測結果不理想.基于LightGBM-LSTM的融合模型在進站客流預測中,以MAE=13.927、RMSE=20.141及MAPE=15.53%在所有模型中的綜合表現(xiàn)最好;在出站客流預測中則以MAE=12.417、RMSE=18.935及MAPE=13.37%綜合表現(xiàn)最好.

      3.4 居住-工作混合類型車站客流預測分析結果

      居住工作混合類車站(九堡站)進出站客流預測評價結果見表4.作為混合類車站,九堡站位于綜合功能用地區(qū)域內,周圍的土地功能更豐富,既有居住類用地也有工作類用地.九堡站的潮汐特性為雙峰特征,既有早高峰也有晚高峰.

      由表4可見,基于LightGBM-LSTM 的融合模型在進站客流預測中,以MAE=12.014、RMSE=14.469 及MAPE=13.02%的指標在所有模型中綜合表現(xiàn)最好;在出站客流預測中則以MAE=12.987、RMSE=16.588及MAPE=13.44%綜合表現(xiàn)最好.

      表4 居住工作混合類車站(九堡站)進出站客流預測結果評價Table 4 Evaluation of passenger flow forecast results of residential and working mixed station(Jiubao Station)

      3.5 購物類型車站客流預測結果分析

      購物類車站(龍翔橋站)進出站客流預測結果評價見表5.作為購物類車站,龍翔橋站位于公用設施密集區(qū)域,周圍有旅游景點或大型商場.龍翔橋站的出站客流主要分布在上午,進站客流主要分布在下午到晚上.

      由表5 可見,在單一機器學習模型中,3 個模型的效果相差不大.基于LightGBM-LSTM的融合模型在進站客流預測中,以MAE=52.768、RMSE=71.115及MAPE=9.36%的指標在所有模型中綜合表現(xiàn)最好;在出站客流預測中則以MAE=62.354、RMSE=86.111及MAPE=12.72%綜合表現(xiàn)最好.

      表5 購物類車站(龍翔橋站)進出站客流預測結果評價Table 5 Evaluation of passenger flow forecast results of shopping station(Longxiangqiao Station)

      3.6 交通樞紐類型車站客流預測結果分析

      交通樞紐類車站(杭州東站)進站客流預測結果評價見表6.作為交通樞紐車站,杭州東站位于火車站和高鐵站區(qū)域.杭州東站的客流時間分布無明顯規(guī)律性,全天的進出站客流無明顯波峰或波谷,但是進出站客流量都很大.

      表6 交通樞紐類車站(杭州東站)進站客流預測結果評價Table 6 Evaluation of inbound passenger flow forecast results of transportation hub station(Hangzhou East Railway Station)

      由表6 可見,基于LightGBM 和LSTM 模型的預測效果比基于XGboost 模型好.LightGBM-LSTM 融合模型在進站客流預測中,以MAE=118.406、RMSE=150.96及MAPE=12.85%的指標在所有模型中綜合表現(xiàn)最好;在出站客流預測中則以MAE=82.256、RMSE=102.623及MAPE=8.37%綜合表現(xiàn)最好.

      結語

      本研究提出一種地鐵客流數(shù)據(jù)預處理算法,可有效識別和修復地鐵客流異常數(shù)據(jù),并根據(jù)需求對不同時間粒度的車站進出客流進行提取,為客流特征分析以及模型構建奠定了數(shù)據(jù)基礎.考慮天氣和空氣質量影響因素,建立基于LightGBM 算法和基于LSTM 網(wǎng)絡的短時客流預測模型,并利用決策樹將兩個模型進行融合,提出LightGBM-LSTM的融合客流預測模型.構建ARIMA和XGBoost作為實驗對照模型,驗證本預測模型的準確性.對杭州地鐵的進、出站客流短時預測案例進行驗證,選取居住類車站、工作類車站、居住工作混合類車站、購物類車站及交通樞紐類車站為代表,分別進行基于MAE、RMSE 及MAPE 指標的模型預測結果準確性評價,結果表明,基于多特征的機器學習模型能夠較好預測地鐵車站的短時客流,為地鐵車站客流預測提供新思路,但是單一模型對于不同類型車站的預測效果波動較大;基于多模型融合的LightGBMLSTM 模型可以綜合單一模型的優(yōu)點,預測性能更佳,對于不同類型車站的適應性也更好.本研究尚未將融合后的模型與其他融合模型進行精度比較,這將是下一步工作的重點.

      猜你喜歡
      客流車站預測
      客流增多
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      車站一角
      不必預測未來,只需把握現(xiàn)在
      熱鬧的車站
      幼兒畫刊(2016年9期)2016-02-28 21:01:10
      熱鬧的車站
      啟蒙(3-7歲)(2016年10期)2016-02-28 12:27:06
      北京信息科技大學學報(自然科學版)(2016年5期)2016-02-27 06:31:37
      人工免疫算法在電梯客流時段劃分的應用
      荣昌县| 响水县| 娱乐| 历史| 石棉县| 辉县市| 鄂托克旗| 嘉祥县| 蓬安县| 永康市| 偃师市| 济宁市| 淮滨县| 茂名市| 柘城县| 建水县| 延长县| 延川县| 出国| 辽宁省| 勐海县| 丰宁| 武平县| 绥化市| 红河县| 鲁山县| 襄垣县| 绥化市| 黔西县| 寻甸| 石景山区| 阿鲁科尔沁旗| 城口县| 怀来县| 西城区| 固阳县| 巴林右旗| 依安县| 东乌珠穆沁旗| 米易县| 卢龙县|