謝嘉琦 鄒喜華 汪小勇 畢文峰 華志辰
(1.西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院, 610031, 成都; 2.卡斯柯信號有限公司, 200072, 上?!蔚谝蛔髡?, 碩士研究生)
許多城市軌道交通線路采用了全自動運行系統(tǒng)。全自動運行系統(tǒng)不僅可以保障列車的運行安全,有效提升線路的折返效率,還可以減輕運維作業(yè)的工作量[1]。與傳統(tǒng)有人駕駛城市軌道交通線路相比,列車進站自動停車功能是全自動運行線路的優(yōu)勢之一。在列車進站自動停車的過程中,停車精度是衡量列車是否停準(zhǔn)的一個重要指標(biāo)。
影響列車停車精度的因素主要有以下幾點:首先是列車自身因素,ATO(列車自動運行)系統(tǒng)會給空氣制動系統(tǒng)設(shè)定一個預(yù)壓力,以提高空氣制動的響應(yīng)速度,從而導(dǎo)致列車實際的制動力偏高[2];其次,考慮到故障-安全原則,ATO會對制動系統(tǒng)設(shè)定一個空氣制動余量,這個余量會導(dǎo)致列車實際制動力略大于所需值;再次,在線路方面,某些車站的線路曲線半徑過小,以及露天線路天氣的影響、各站點應(yīng)答器的安裝差異、站臺門的對位差異等因素,都會在一定程度上影響列車的停車精度[3]。
國內(nèi)外關(guān)于ATO模式下列車停車控制的研究主要集中在兩大方面:優(yōu)化控制算法和機器學(xué)習(xí)方法。由于城市軌道交通線路投入運營后基本不會更改列車運行的控制算法,且停車過程的建模較為困難,因此,優(yōu)化控制算法在城市軌道交通中的適用性不強。在機器學(xué)習(xí)方法的相關(guān)研究中,文獻[4]對停車過程中列車的速度、位置等信息進行建模,對比了CNN(卷積神經(jīng)網(wǎng)絡(luò))和DNN(全連接神經(jīng)網(wǎng)絡(luò))兩種算法的優(yōu)劣。文獻[5]利用多種數(shù)據(jù)挖掘算法(如Ridge回歸、RBF(徑向基函數(shù))神經(jīng)網(wǎng)絡(luò)等)構(gòu)建了列車停車精度的預(yù)測程序。文獻[6]采用了機器學(xué)習(xí)中的Boosting回歸算法對列車停車精度進行了回歸預(yù)測。
城市軌道交通的運維人員通過收集長期的列車停車精度數(shù)據(jù),根據(jù)數(shù)據(jù)每日的變化趨勢,手動對列車停車的追蹤目標(biāo)點進行調(diào)整。這種做法工作量大、效率低下,嚴(yán)重影響了生產(chǎn)效率。因此,迫切需要找到一種有效的方法,通過對歷史大數(shù)據(jù)進行分析,找出隱藏其中的數(shù)據(jù)規(guī)律,為列車進站自動停車精度提供輔助預(yù)測,用以指導(dǎo)車輛運維人員進行參數(shù)配置。
本文提出一種列車進站自動停車精度的預(yù)測方法。該方法采用Weibull分布參數(shù)擬合每期的停車精度分布,得到分布擬合結(jié)果后,構(gòu)建LSTM(長短期記憶)網(wǎng)絡(luò)算法模型。在此基礎(chǔ)上,采用成都某地鐵線路列車的歷史數(shù)據(jù)對模型進行訓(xùn)練和驗證,對預(yù)測模型的分布參數(shù)進行回歸預(yù)測。在工程應(yīng)用上,城市軌道交通車輛運維人員將列車實時的停車精度數(shù)據(jù)序列輸入到模型后,模型將自動預(yù)測列車在下一個車站的停車精度,運維人員從而可以通過手動移動列車的追蹤目標(biāo)點來確保列車精確停車。
圖1為列車進站自動停車精度預(yù)測分析的主要流程。該流程主要包括以下5個步驟。
步驟1:數(shù)據(jù)清洗。運維人員獲得現(xiàn)場停車日志后,提取出列車停車精度的記錄信息,并對其中無效的數(shù)據(jù)予以去除。
步驟2:對列車停車精度數(shù)據(jù)進行預(yù)處理。根據(jù)城市軌道交通一線員工的工作經(jīng)驗,將列車停車精度的歷史數(shù)據(jù)以1 d為1個統(tǒng)計周期進行預(yù)處理(如數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換等)。
步驟3:采用Weibull最小極值分布法和Weibull最大極值分布法對每個統(tǒng)計周期的數(shù)據(jù)進行擬合,得到對應(yīng)的分布參數(shù);對比分析這兩種分布的擬合度,得到對應(yīng)參數(shù)的時間序列。
步驟4:構(gòu)建LSTM預(yù)測模型。在已獲得的時間序列基礎(chǔ)上,采用LSTM網(wǎng)絡(luò)算法構(gòu)建列車進站自動停車精度的LSTM預(yù)測模型;對模型進行驗證評估,并對下一個統(tǒng)計周期的分布參數(shù)進行預(yù)測。
步驟5:預(yù)測模型的應(yīng)用。通過預(yù)測獲得的下一個統(tǒng)計周期的分布參數(shù),綜合評估下一個統(tǒng)計周期列車停車精度調(diào)整的偏差值。
圖1 列車進站自動停車精度預(yù)測分析算法框架
目前,主要采用兩種方法對Weibull分布進行參數(shù)擬合:最大似然估計法和矩估計法。本文經(jīng)過大量的實踐驗證后,采用簡單有效的最大似然估計法對Weibull分布進行參數(shù)估計。Weibull分布的最大似然函數(shù)為:
L(x1,x2,x3,…,xi,α,β)=
(1)
式中:
由于車次數(shù)一般少于車組數(shù),因此,首先需將車組號對應(yīng)的最佳匹配車次進行補全,依次加1,作為車組號最佳匹配車次參考。車組Ti與車次Fj的匹配度Cij的計算公式如下:
L——Weibull分布的最大似然函數(shù);
x1,x2,x3,…,xi——各維度的數(shù)據(jù)值,i為停車精度的維度;
α、β——Weibull分布擬合參數(shù);
n——自然數(shù)序列。
式(1)兩邊取對數(shù),可得:
lnL(x1,x1,x1,…,x1;α,β)=
(2)
(3)
求解上式(3),即求得α和β。
從圖2 a)可以看出,這些數(shù)據(jù)在整體分布上具有正態(tài)分布的特點。采用Alpha分布、Weibull分布(包括Weibull最大極值分布、Weibull最小極值分布)及Laplace分布對數(shù)據(jù)進行擬合,得到的擬合結(jié)果如圖2 b)所示。其中,Weibull分布擬合效果最好。因此,本文采用Weibull分布對該線列車后續(xù)每一個統(tǒng)計周期的數(shù)據(jù)進行擬合并分析。
a) 整體停車精度分布
b) 分布擬合
根據(jù)列車運行計劃,該列車在1 d內(nèi)停靠站臺的次數(shù)為534次。該列車的歷史數(shù)據(jù)統(tǒng)計了256 d,以1 d為1個統(tǒng)計周期,則將歷史數(shù)據(jù)劃分為256期,即有256個數(shù)據(jù)樣本。對每1期數(shù)據(jù)采用Weibull分布進行擬合,可得到Weibull分布擬合尺度參數(shù)和形狀參數(shù)的時間序列。由于數(shù)據(jù)過多,為便于展示,本文僅列出第1期、第50期、第100期、第150期、第200期及第250期的數(shù)據(jù)樣本,以及這些樣本對應(yīng)的分布參數(shù),如表1所示。
利用多層網(wǎng)絡(luò)搜索法,尋找LSTM網(wǎng)絡(luò)最佳擬合參數(shù)的三維圖,3個維度分別是窗口長度l、學(xué)習(xí)率η、狀態(tài)大小Sstate。對這3個維度進行量綱一化處理,可以得到最佳的擬合參數(shù)分別為:l=3,η=0.012 84,Sstate=4.573 5。
表1 列車停車精度的Weibull分布參數(shù)
圖3是測試集上對Weibull最小極值分布和Weibull最大極值分布的形狀參數(shù)和尺度參數(shù)的預(yù)測結(jié)果。這兩個參數(shù)均具有周期化波動的趨勢,傳統(tǒng)的機器學(xué)習(xí)方法不適用于處理這類預(yù)測問題。并且,本文所研究的數(shù)據(jù)是一維的時間序列,而在時間序列的預(yù)測方面,基于RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))的LSTM網(wǎng)絡(luò)有較好的效果,因此,構(gòu)建基于RNN的LSTM預(yù)測模型。由圖3可看出,量綱一化后得到的列車停車精度分布預(yù)測效果與各統(tǒng)計周期下的現(xiàn)場原始數(shù)據(jù)分布基本吻合。由此可以得出結(jié)論:LSTM預(yù)測模型能夠較好地捕捉尺度參數(shù)和形狀參數(shù)的變化趨勢,并可準(zhǔn)確地預(yù)測后續(xù)統(tǒng)計周期的參數(shù)值。
a) 最小極值尺度參數(shù)預(yù)測
b) 最小極值形狀參數(shù)預(yù)測
c) 最大極值尺度參數(shù)預(yù)測
d) 最大極值形狀參數(shù)預(yù)測
圖4為LSTM預(yù)測模型最小極值尺度參數(shù)的均方誤差值ERMS,以及預(yù)測值分布和實際值分布的相似度MS的計算結(jié)果。由圖4可知,隨著訓(xùn)練輪數(shù)的增加,ERMS大為降低,在100輪左右ERMS下降到0.043 7并趨于穩(wěn)定。這說明模型訓(xùn)練比較充分,可滿足統(tǒng)計學(xué)角度對ERMS的要求。形狀參數(shù)和尺度參數(shù)時間序列的預(yù)測效果較好,從而驗證了LSTM預(yù)測模型的有效性。
從分布相似性的角度看,預(yù)測值分布和實際值分布的相似性均值EAR為0.942 6,且每一個統(tǒng)計周期的MS均大于0.9。這說明LSTM預(yù)測模型具有較好的普遍適用性和有效性。
a) ERMS隨訓(xùn)練次數(shù)的變化情況
b) 預(yù)測值分布與真實值分布的MS
本文通過對成都某地鐵線列車停車精度的歷史數(shù)據(jù)進行數(shù)據(jù)分割和數(shù)據(jù)預(yù)處理,對獲得的256個樣本序列采用Weibull分布的方式對樣本數(shù)據(jù)進行擬合,獲得了Weibull最大極值分布的尺度參數(shù)和形狀參數(shù),以及Weibull最小極值分布的尺度參數(shù)和形狀參數(shù)。采用對時間序列預(yù)測表現(xiàn)良好的LSTM算法對這4個參數(shù)值的時間序列進行訓(xùn)練,在100輪訓(xùn)練后用測試集對參數(shù)值進行驗證,其均方誤差ERMS滿足統(tǒng)計學(xué)的要求。因此,本文研究得到的LSTM預(yù)測模型對列車停車精度的預(yù)測有效且準(zhǔn)確。