冷 彪,曾加貝
(1.北京航空航天大學 計算機學院,北京 100191;2.北京航空航天大學深圳研究院,廣東 深圳 518057)
2011年,北京市地鐵路網(wǎng)日均客運量為 598萬人次,占全市公交運輸?shù)?35%。預計到 2015年日均客運量將增至 1 000萬人次。因此,分析、預測和掌握北京地鐵客流實時數(shù)據(jù),為線路和車站的客流組織與優(yōu)化提供數(shù)據(jù)支撐,提高地鐵規(guī)劃、設計和建設的科學決策水平,提高運營管理決策的實時性和高效性,進而提高北京地鐵的運營服務水平和運營效率具有重要意義。
目前,北京地鐵采用全網(wǎng)一票通和一卡通無障礙換乘機制,自動售檢票系統(tǒng)僅能獲取乘客的 OD(Origin-destination) 數(shù)據(jù),即進出站數(shù)據(jù),無法獲取乘客的換乘信息。由于相同進站和出站之間有多種出行線路,僅根據(jù)乘客的 OD 數(shù)據(jù)無法確定其具體出行方案,因此必須采用北京市軌道交通清分管理中心清分方法[1]才能詳細分析北京軌道交通路網(wǎng)中的詳細客流數(shù)據(jù),包括換乘站的換乘客流和車站的站內(nèi)客流等。由于大部分客流預測方法不具備北京地鐵票卡清分的特點,而只能利用乘客的 OD 數(shù)據(jù)對車站的進站和出站客流量進行預測,此類算法稱做面向車站的客流預測模型。這類預測模型主要包括基于線性系統(tǒng)理論的預測方法、基于非線性系統(tǒng)理論的預測方法和基于組合模型的預測方法。其中,基于線性系統(tǒng)理論的預測方法計算較簡單,但對于較復雜的交通系統(tǒng),其預測效果不甚理想。基于非線性系統(tǒng)理論的預測方法體現(xiàn)了交通系統(tǒng)的非線性特點,準確性相對較高,但計算復雜度高,理論基礎尚不成熟。面向路網(wǎng)的客流預測模型因具備地鐵票卡清分的特點,利用實時 OD 數(shù)據(jù)不僅能對車站的出站客流進行預測,而且還能對換乘車站的換乘客流和站內(nèi)客流進行預測。
主要有3種面向車站的客流預測方法:歷史平均預測法、基于最小二乘支持向量機時間序列預測法和分峰段混合預測法。這3類方法僅能利用 OD數(shù)據(jù)對車站進站客流和出站客流進行預測。
1.1.1 歷史平均預測法
歷史平均預測法屬于基于線性系統(tǒng)理論的預測方法,其主要是利用歷史 OD 數(shù)據(jù)計算平均值,計算的復雜度較低。
設時間序列為{Xt}={Xt-p,Xt-p+1,…,Xt-1},其觀測序列為{xt}={xt-p,xt-p+1,…,xt-1},并且 p=mn,其中:p 表示歷史時間序列里共有 p個點,周期為 n,歷史時間序列中共有 m個周期。則 xi的預測值 yt為:
1.1.2 基于最小二乘支持向量機時間序列預測法
基于最小二乘支持向量機時間序列預測法屬于基于非線性系統(tǒng)理論的預測方法,其通過訓練學習歷史 OD 數(shù)據(jù),調(diào)整模型中的核心參數(shù),但計算復雜度較高。
非線性自回歸模型為:
式中:yt?R;xt?Rn是回歸向量[yt-1,yt-2,…,yt-p];貝葉斯項 b?R;ω?Rnh是未知高維系數(shù)向量。函數(shù)映射φ:Rn→Rnh將原始的輸入向量 xt映射成一個高維向量 φ(xt)?Rnh。
約束優(yōu)化問題使用的成本函數(shù)[2]為:
式中:γ 為規(guī)范化常數(shù)。約束優(yōu)化問題可應用拉格朗日算子計算,最終解可表述為:
最小二乘法支持向量機[2]的訓練過程,主要包括選擇核參數(shù)、規(guī)范化常數(shù) γ 和回歸量。在研究中用 10 倍交叉驗證核參數(shù)和規(guī)范化常數(shù)?;貧w量的選擇需大量樣本信息,在交叉驗證的基礎上,用貪心算法剔除無用的延遲信息。在每次貪心算法的剔除信息階段,如果回歸的交叉驗證均方誤差增加,則剔除該回歸量。
1.1.3 分峰段混合預測法
分峰段混合預測法主要根據(jù)地鐵客流出行峰段的特點,將歷史平均預測法和基于最小二乘支持向量機時間序列預測法相結合,屬于組合模型預測方法。通過對歷史OD數(shù)據(jù)進行分析,歷史平均預測法在客流量較小時準確度較高,而最小二乘支持向量機方法對客流量大時具有較高的準確度。因此,可以根據(jù)北京地鐵客流出行峰段將兩種方法結合進行混合預測。設某項客流信息歷史 t 天的時間序列為:
其中,每天有 n 項,即周期為 n。則第 t+1天的全天預測值為{ ytn+p},p=1,2,…,n。
式中:Pe1為早低峰和晚低峰;Pe2為早高峰、平峰和晚高峰為最小二乘支持向量機的預測函數(shù)。
基于概率樹全路網(wǎng)預測方法的核心是以北京地鐵票卡清分方法為基礎,根據(jù)乘客 OD 數(shù)據(jù)中進站位置和時間信息,預測其出站位置和時間。全路網(wǎng)的客流預測模型利用古典概率方法,統(tǒng)計分析學習歷史 OD 數(shù)據(jù)的進出站位置特點,為指定時間段每一車站建立出站概率樹,用于預測查詢。下面介紹概率樹的生成方法及預測出站位置的查詢方法,詳細內(nèi)容參考文獻[3]。
1.2.1 概率樹
概率樹的每個節(jié)點 n 都有一個屬性值,可稱之為節(jié)點概率 pn,即節(jié)點 n 以概率 pn被選中。二叉樹中的每個非葉節(jié)點 n 含有一個屬性,為分叉概率qn,qn決定下一步是查詢節(jié)點 n 的左子樹還是右子樹。葉節(jié)點指向一個位置站,并且沒有分叉概率。
對于一個給定的位置站 sO,乘客從sO進站,可能的出站位置為集合 SD:
抵達每個出站位置的概率集合為 PD:
生成概率樹的原則是被選擇的概率越大,則該出站位置所在的深度越小。
1.2.2 預測算法
已知概率樹T(t,sO),可預測出站位置SD。出站時間則需要根據(jù)進站位置、進站時間、出站位置及選擇的有效路徑 path0,模擬乘客進站、等車、上車、下車、換乘、出站等,從而算出其出站時間,可描述為tD=M (sO,tO,sD,path0)。
以 2009年11月25日—2010年1月20日的9個星期三的北京地鐵歷史客流 OD 數(shù)據(jù)和票卡清分數(shù)據(jù)為基礎,利用歷史平均預測法、基于最小二乘支持向量機時間序列預測法、分峰段混合預測法,以及基于概率樹全路網(wǎng)預測模型等方法對西單和國貿(mào)兩個典型車站在 2010年1月27日的進站客流、出站客流、換乘客流和站內(nèi)客流進行預測。
采用國際通用的預測評判標準相對平均誤差(RME) 和均方誤差 (MSE) 對預測結果進行分析:
式中:xi為實際值;?ix為預測值;N 為預測時間點個數(shù)。
首先,利用4種預測方法對西單和國貿(mào)站進站客流和出站客流進行預測。對整體預測結果的分析如表1所示,表2詳細描述了多種預測方法對國貿(mào)站 8:00—9:00 早高峰出站客流的預測結果。實驗結果表明,在面向車站的客流預測模型中,分峰段混合預測法能較好地根據(jù)歷史OD 數(shù)據(jù)對車站的進出站客流進行預測,并優(yōu)于面向全路網(wǎng)的客流預測方法。
由于面向車站的客流預測模型無法利用 OD 客流數(shù)據(jù)對換乘車站的換乘客流進行預測,故僅利用面向全路網(wǎng)的客流預測模型對西單和國貿(mào)站的換乘客流進行客流預測,其整體預測結果如表3所示,表4描述了平峰時段對西單站換乘客流的預測結果。實驗結果表明,由于早高峰、平峰和晚高峰3個時間段的換乘客流比較集中,此3個峰段的預測結果優(yōu)于其他峰段。
表1 西單和國貿(mào)站進站和出站客流預測結果
表2 國貿(mào)站早高峰出站客流的預測結果
利用基于概率樹全路網(wǎng)預測方法對西單和國貿(mào)站的站內(nèi)客流量進行預測,由于國貿(mào)站的客流量比西單站大,因此該方法對國貿(mào)站的站內(nèi)客流量的預測結果比西單站精準,RME 為12.66%,如圖1所示,西單站的預測結果 RME 為 25.81%。
通過對西單和國貿(mào)站客流預測結果的研究,可以看出針對車站的進出站客流預測,分峰段混合預測法具有較好的預測結果。針對車站的換乘客流和站內(nèi)客流,面向車站的預測模型因不具備北京地鐵票卡清分的特點,故無法進行相關的客流預測,而只有面向全路網(wǎng)的預測模型能解決相應的客流預測問題,且基于概率樹全路網(wǎng)預測方法能利用實時OD 數(shù)據(jù)進行準確的換乘客流和站內(nèi)客流預測。由此可見,分峰段混合預測法和基于概率樹全路網(wǎng)預測方法能根據(jù)北京地鐵的特點,對車站內(nèi)各種客流量進行預測,針對性強。
表3 基于概率樹全路網(wǎng)預測方法的西單和國貿(mào)站換乘客流預測結果 %
表4 基于概率樹全路網(wǎng)預測方法的西單站平峰換乘客流預測結果
圖1 基于概率樹全路網(wǎng)預測方法國貿(mào)站的站內(nèi)客流預測曲線圖
[1]北京市軌道交通指揮中心. 北京市軌道交通清分管理中心清分方法研究[R]. 北京:北京市軌道交通指揮中心,2007.
[2]M. Espinoza,T. Falck,Johan A. K. Suykens,et al. Time Series Prediction Using LS-SVMs [C]// Proceedings of the European Symposium on Time Series Prediction. Espoo:Multiprint Oy/ Otamedia, 2008:187-196.
[3]曾加貝. 軌道交通客流預測與疏散建模研究[D]. 北京:北京航空航天大學,2011.