曾 壹,陳 峰,金博匯
(1.中國鐵道科學(xué)研究院集團(tuán)有限公司研究生部,北京 100081;2.中國鐵道科學(xué)研究院集團(tuán)有限公司通信信號(hào)研究所,北京 100081;3.國家鐵路智能運(yùn)輸系統(tǒng)工程技術(shù)研究中心,北京 100081;4.北京市華鐵信息技術(shù)開發(fā)總公司,北京 100081)
列車在運(yùn)行線路內(nèi)受到異物侵入、設(shè)備故障、調(diào)度因素或惡劣天氣影響后,會(huì)出現(xiàn)非預(yù)期的運(yùn)行時(shí)分偏差,即晚點(diǎn)現(xiàn)象。晚點(diǎn)不僅會(huì)影響本列車的按圖開行,還會(huì)在區(qū)段內(nèi)以晚點(diǎn)傳播的方式擴(kuò)散。記錄初始晚點(diǎn)發(fā)生的時(shí)間、地點(diǎn)與類型,并對(duì)晚點(diǎn)傳播的路徑進(jìn)行分析,對(duì)調(diào)度員掌握特定時(shí)間內(nèi)區(qū)段晚點(diǎn)情況,提高行車調(diào)度指揮質(zhì)量具有重要的意義。
國內(nèi)外學(xué)者在實(shí)績運(yùn)行圖的分析方面進(jìn)行了大量的研究,可劃分為已有初始晚點(diǎn)數(shù)據(jù)的規(guī)律統(tǒng)計(jì)、運(yùn)行線實(shí)績數(shù)據(jù)的晚點(diǎn)傳播分析以及列車運(yùn)行時(shí)分預(yù)測(cè)三類。初始晚點(diǎn)的規(guī)律統(tǒng)計(jì)研究采用概率分布模型的方式,將調(diào)度區(qū)段的晚點(diǎn)時(shí)長概率分布建模為對(duì)數(shù)正態(tài)分布[1]、負(fù)二項(xiàng)分布[2]、相位型擬合分布[3]、指數(shù)分布[4]等概率分布模型,模型參數(shù)通過極大似然估計(jì)、Kolmogorov-Smirnov檢驗(yàn)與Wasserstein間距等度量標(biāo)準(zhǔn),完成數(shù)據(jù)擬合的實(shí)現(xiàn)與驗(yàn)證。晚點(diǎn)傳播分析的相關(guān)研究圍繞初始晚點(diǎn)定位與晚點(diǎn)傳播鏈的數(shù)學(xué)和仿真方法開展。其中,數(shù)學(xué)方法包括決策樹判定[5]、最長傳播徑路探索[6-7]等;仿真分析則通過累積記錄初始晚點(diǎn)發(fā)生時(shí)列車運(yùn)行位置的極大加代數(shù)推算實(shí)現(xiàn)[8-9]。由于列車在區(qū)段的開行事件存在關(guān)聯(lián)關(guān)系,大范圍列車運(yùn)行時(shí)分預(yù)測(cè)的數(shù)據(jù)樣本需要進(jìn)行分類處理,減少事件關(guān)聯(lián)導(dǎo)致的干擾,具體方法有卷積變換[10]、貝葉斯推理網(wǎng)絡(luò)[11-12]等。小范圍預(yù)測(cè)則通過機(jī)器學(xué)習(xí)算法[13-14]、最小修剪方差估計(jì)[15-16]的方法推測(cè)晚點(diǎn)恢復(fù)時(shí)間或區(qū)間運(yùn)行時(shí)間。
本文在充分研究上述文獻(xiàn)的前提下,設(shè)計(jì)了一種列車初始晚點(diǎn)、連帶晚點(diǎn)的分類方法,同步推算得到了晚點(diǎn)的傳播鏈。在晚點(diǎn)情況分類數(shù)據(jù)樣本的基礎(chǔ)上,進(jìn)一步提出基于神經(jīng)網(wǎng)絡(luò)的晚點(diǎn)預(yù)測(cè)模型,實(shí)現(xiàn)了調(diào)度區(qū)段內(nèi)晚點(diǎn)時(shí)長的有效預(yù)測(cè),并對(duì)不同樣本大小與允許誤差條件下的模型推算效果進(jìn)行了比較分析。
在調(diào)度指揮業(yè)務(wù)中,列車在車站、區(qū)間的運(yùn)行按照運(yùn)行線的形式進(jìn)行標(biāo)示。運(yùn)行線由從屬于同一車次的節(jié)點(diǎn)v按照經(jīng)由車站的先后順序排列構(gòu)成,各節(jié)點(diǎn)包含運(yùn)輸業(yè)務(wù)的計(jì)劃信息,包括列車在車站的到達(dá)時(shí)間、出發(fā)時(shí)間、占用股道等內(nèi)容。由于相同或不同車次列車在各車站的業(yè)務(wù)存在時(shí)序差異,根據(jù)計(jì)劃執(zhí)行時(shí)間的先后順序,前方節(jié)點(diǎn)v與后方節(jié)點(diǎn)v′的時(shí)間關(guān)系可表示為有向連接的線段e(v,v′)。在一個(gè)班次內(nèi),所有有向線段的連接即構(gòu)成了列車開行計(jì)劃,可描述為有向圖G=(V,E),其中V、E分別為全部節(jié)點(diǎn)v、有向弧e的集合。由于運(yùn)輸規(guī)劃與實(shí)際完成情況存在差異,節(jié)點(diǎn)v具備計(jì)劃時(shí)間T(v)與實(shí)績時(shí)間Tadjust(v)兩類時(shí)間屬性,有向弧e對(duì)應(yīng)的時(shí)間長度也同理可記做T(v,v′)與Tadjust(v,v')。
列車對(duì)線路中各類股道、區(qū)間設(shè)備的使用必須依據(jù)運(yùn)輸組織要求,滿足開行方案規(guī)定的時(shí)序限制。當(dāng)列車在區(qū)段內(nèi)發(fā)生晚點(diǎn)后,由于后續(xù)節(jié)點(diǎn)受到時(shí)序條件約束,時(shí)刻表會(huì)出現(xiàn)偏移,晚點(diǎn)時(shí)分在運(yùn)行線內(nèi)部或站間傳播,在有向圖模型內(nèi)表現(xiàn)為初始晚點(diǎn)沿著有向弧擴(kuò)散的過程。按照時(shí)序限制的具體條件分類的有向弧e(v,v′),e∈E如表1所示,l、i、m分別表示車次、車站編號(hào)、會(huì)車車次。其中時(shí)序條件根據(jù)有向弧節(jié)點(diǎn)關(guān)系又分為同車與同站兩類,用于記錄節(jié)點(diǎn)內(nèi)部晚點(diǎn)傳播的范圍。
表1 有向弧的時(shí)間關(guān)系類型
列車在受到非預(yù)期車流、施工、機(jī)車設(shè)備故障或不適當(dāng)調(diào)度指揮的影響后,會(huì)在區(qū)間或車站產(chǎn)生時(shí)刻表延誤。延誤發(fā)生后,列車通過區(qū)間趕點(diǎn)、車站早開、待避非晚點(diǎn)車的方式,能夠緩解部分晚點(diǎn)現(xiàn)象。路網(wǎng)內(nèi)的實(shí)績數(shù)據(jù)中包含了晚點(diǎn)的產(chǎn)生、恢復(fù)與傳播過程,且不同類型過程可以同時(shí)發(fā)生在單個(gè)有向弧內(nèi)。晚點(diǎn)靜態(tài)分析方法必須建立在列車運(yùn)行狀態(tài)的準(zhǔn)確判斷之上,才能排除路網(wǎng)內(nèi)復(fù)雜的干擾數(shù)據(jù)影響,得到初始晚點(diǎn)及其傳播路徑。為此,本文提出計(jì)劃時(shí)間飽和度的概念如下
P=
(1)
由式(1)可知,飽和度小于1時(shí),晚點(diǎn)列車的有向弧相關(guān)計(jì)劃的執(zhí)行時(shí)間超過了預(yù)定時(shí)間,列車受到初始或連帶晚點(diǎn)影響低速運(yùn)行或延時(shí)停站。飽和度大于1時(shí),晚點(diǎn)列車計(jì)劃的執(zhí)行時(shí)間小于預(yù)定時(shí)間,列車處于加速趕點(diǎn)或車站早開的狀態(tài)。飽和度等于1時(shí),晚點(diǎn)列車按照預(yù)定時(shí)間運(yùn)行,晚點(diǎn)在路網(wǎng)內(nèi)傳播。由于運(yùn)輸組織的需要,列車在非營業(yè)站存在提前發(fā)車,并在到達(dá)營業(yè)站前主動(dòng)降速的運(yùn)行策略。該過程內(nèi)的列車計(jì)劃執(zhí)行時(shí)間與預(yù)定時(shí)間存在差值,但不存在晚點(diǎn)傳播現(xiàn)象,此時(shí)計(jì)劃時(shí)間飽和度為0。如列車在車站通過,有向弧的計(jì)劃與實(shí)績時(shí)間長度均為0,計(jì)劃時(shí)間飽和度按照1的情況處理。
列車有向弧的計(jì)劃時(shí)間飽和度不僅反映了當(dāng)前列車的運(yùn)行狀態(tài),還可以表現(xiàn)晚點(diǎn)傳播的狀態(tài)。當(dāng)飽和度大于或等于1時(shí),列車處于正在緩解晚點(diǎn),但晚點(diǎn)仍舊存在的狀態(tài)中,此時(shí)的時(shí)刻表擾動(dòng)沿著有向弧傳播,并不斷減少。當(dāng)飽和度小于1并大于0時(shí),列車在區(qū)間內(nèi)受到正常行車之外的因素影響,導(dǎo)致晚點(diǎn)增加。當(dāng)有向圖的實(shí)績長度Tadjust(v,v′)<0時(shí),表示列車的開行順序相對(duì)原運(yùn)行計(jì)劃發(fā)生了變動(dòng),具體情況包括計(jì)劃會(huì)讓的取消,列車待避等,時(shí)刻表擾動(dòng)從后向列車向前方列車傳播。
運(yùn)行圖內(nèi)晚點(diǎn)與其傳播鏈的反向搜索流程依據(jù)有向弧的內(nèi)部節(jié)點(diǎn)關(guān)系與飽和度分析展開,局部范圍的晚點(diǎn)分析操作步驟陳述如下。
(1)檢查屬于選定車次且內(nèi)部節(jié)點(diǎn)關(guān)系為同車的有向弧,計(jì)算飽和度,同車關(guān)系節(jié)點(diǎn)依據(jù)計(jì)劃時(shí)刻順序,由先至后依次確定各弧線內(nèi)的列車運(yùn)行狀態(tài)與晚點(diǎn)傳播情況。所有檢測(cè)到的晚點(diǎn)增加情況按照發(fā)生的位置,標(biāo)記為區(qū)間初始晚點(diǎn)與車站初始晚點(diǎn)。
(2)檢查屬于選定車次且內(nèi)部節(jié)點(diǎn)關(guān)系為同站的有向弧,計(jì)算飽和度,同站關(guān)系節(jié)點(diǎn)依據(jù)計(jì)劃時(shí)刻順序,由后至先依次確定各弧線內(nèi)的列車運(yùn)行狀態(tài)與晚點(diǎn)傳播情況。如果初始晚點(diǎn)前方有向弧的飽和度大于1,可認(rèn)為該晚點(diǎn)來源于其他列車,為連帶晚點(diǎn)。如果后向追蹤飽和度小于0,按照前向追蹤的情況判定晚點(diǎn)情況。
(3)檢索搜索范圍內(nèi)所有完成檢查的有向弧和節(jié)點(diǎn),即可確定初始晚點(diǎn)的時(shí)長與位置,并根據(jù)晚點(diǎn)傳播狀態(tài)和方向,得到晚點(diǎn)傳播鏈。
以某調(diào)度區(qū)段晚間開行的3個(gè)車次為對(duì)象的分析結(jié)果如圖1所示。圖中節(jié)點(diǎn)包含信息依次為車次編號(hào)、車站站碼與晚點(diǎn)時(shí)分,有向弧的標(biāo)示依次為晚點(diǎn)增量與計(jì)劃時(shí)間飽和度。指向節(jié)點(diǎn)內(nèi)部的有向弧表示列車在車站的到開。部分同站關(guān)系的有向弧不存在晚點(diǎn)情況,在圖1中未繪制。
圖1 晚點(diǎn)傳播鏈的有向圖模型表示
通過對(duì)圖1中的所有列車應(yīng)用步驟1檢查可知,列車1,2,3在車站3010分別發(fā)生了6,4,1 min的晚點(diǎn)。晚點(diǎn)隨后各車內(nèi)部節(jié)點(diǎn)傳播,列車1在車站3009通過早開的方式緩解晚點(diǎn),而列車2,3在鄰接的區(qū)間趕點(diǎn)恢復(fù)時(shí)刻表。繼續(xù)應(yīng)用步驟2檢查,3個(gè)車次的列車在車站3010存在追蹤時(shí)間過飽和現(xiàn)象,3個(gè)晚點(diǎn)增量之間存在傳播關(guān)系,標(biāo)記在列車2,3的初始晚點(diǎn)應(yīng)為車站連帶晚點(diǎn)。最后,檢索所有有向弧和節(jié)點(diǎn)信息可知,初始晚點(diǎn)在車站3010發(fā)生,連帶晚點(diǎn)傳播到列車2,3的節(jié)點(diǎn)內(nèi),得到圖1所示的晚點(diǎn)傳播鏈。將步驟中的選定車次擴(kuò)大到當(dāng)天開行的全部列車,即可將當(dāng)天全部計(jì)劃信息區(qū)分為無晚點(diǎn)、初始晚點(diǎn)、連帶晚點(diǎn)3種情況。
晚點(diǎn)時(shí)長預(yù)測(cè)模型建立在晚點(diǎn)分類數(shù)據(jù)的基礎(chǔ)上,通過廣泛應(yīng)用于分類識(shí)別的反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行各類晚點(diǎn)情況的數(shù)據(jù)預(yù)測(cè)。由于大風(fēng)、泥石流、地震等自然災(zāi)害或危及鐵路行車安全的重大事故[17]等大規(guī)模晚點(diǎn)致因不具有明顯的規(guī)律性。模型只針對(duì)在運(yùn)輸組織計(jì)劃、運(yùn)用車輛、站內(nèi)設(shè)備和線路設(shè)施不發(fā)生明顯變化的前提下的中小規(guī)模晚點(diǎn)進(jìn)行預(yù)測(cè)。
神經(jīng)網(wǎng)絡(luò)是一種通過多個(gè)節(jié)點(diǎn)之間的權(quán)重配置與激活函數(shù)構(gòu)成的數(shù)據(jù)擬合模型,分為輸入層、隱藏層和輸出層,如圖2所示[18]。根據(jù)求解問題的規(guī)模,網(wǎng)絡(luò)可具備多個(gè)隱藏層。神經(jīng)網(wǎng)絡(luò)內(nèi)部節(jié)點(diǎn)之間存在相互的連接關(guān)系,每條連接線代表上一層輸入值的權(quán)重。根據(jù)數(shù)據(jù)擬合或數(shù)值縮放的需要,節(jié)點(diǎn)使用logSig函數(shù)作為激活函數(shù),將結(jié)果輸出到下一層網(wǎng)絡(luò)。
圖2 三層神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)通過改變內(nèi)部權(quán)重調(diào)整輸出,直至計(jì)算結(jié)果與樣本間的誤差降低到滿足要求為止的過程,稱為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。反向傳播是一種有效的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方式,將輸出值與樣本值的差異按照神經(jīng)連接傳遞并求導(dǎo),分層得到每個(gè)權(quán)重的調(diào)整量并實(shí)現(xiàn)誤差的梯度下降。分別設(shè)輸入層、隱藏層的參數(shù)變化量為Δwij、Δwjk,采用logSig激活函數(shù)的三層神經(jīng)網(wǎng)絡(luò)權(quán)重調(diào)整量計(jì)算方法[19]可表述如式(2)。為加快擬合速度,公式內(nèi)各變量均進(jìn)行了歸一化處理。
(2)
中小規(guī)模初始晚點(diǎn)時(shí)長的預(yù)測(cè)模型采用反向傳播神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并根據(jù)有向圖的節(jié)點(diǎn)特性進(jìn)行了改進(jìn)設(shè)計(jì)。
圖3 同車、同站節(jié)點(diǎn)的前向時(shí)序關(guān)系
(3)
式中,I、J、K分別為輸入層、隱藏層、輸出層的節(jié)點(diǎn)數(shù)量;a為可調(diào)整參數(shù),為1-10之間的整數(shù)。
為驗(yàn)證模型預(yù)測(cè)效果,算例采用北京鐵路局調(diào)度區(qū)段半個(gè)月的行車數(shù)據(jù)制作。使用晚點(diǎn)分類方法處理后的樣本情況如表2所示,各項(xiàng)數(shù)據(jù)為相應(yīng)分類下的有向圖節(jié)點(diǎn)個(gè)數(shù)。
表2 調(diào)度區(qū)段樣本數(shù)據(jù)分類結(jié)果
預(yù)測(cè)模型的檢驗(yàn)方法為首先通過歷史樣本組建神經(jīng)網(wǎng)絡(luò),然后使用網(wǎng)絡(luò)預(yù)測(cè)后一天的晚點(diǎn)情況,比較晚點(diǎn)類型的預(yù)測(cè)值與行車數(shù)據(jù)并記錄匹配程度,允許誤差為5 min。
為檢驗(yàn)神經(jīng)網(wǎng)絡(luò)在不同數(shù)據(jù)條件下的預(yù)測(cè)性能,各區(qū)段的行車數(shù)據(jù)被劃分為時(shí)間連續(xù)且大小不同的樣本如表3所示。由于3 d以上行車數(shù)據(jù)受到更多突發(fā)因素影響,模型輸出的規(guī)律性不顯著,本文未做進(jìn)一步研究。
表3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本的劃分
由于神經(jīng)網(wǎng)絡(luò)內(nèi)部權(quán)重的初始配置存在隨機(jī)性,誤差達(dá)到可接受范圍后,網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)的擬合情況存在差異。為保證預(yù)測(cè)的有效性,實(shí)驗(yàn)中用于判定后一天晚點(diǎn)情況的神經(jīng)網(wǎng)絡(luò)均達(dá)到90%以上的樣本擬合度。
模型對(duì)單份樣本進(jìn)行有效組網(wǎng)后預(yù)測(cè)晚點(diǎn),為驗(yàn)證預(yù)測(cè)結(jié)果的可靠性,實(shí)驗(yàn)先對(duì)單份樣本進(jìn)行10次組網(wǎng)預(yù)測(cè),后取準(zhǔn)確度的無加權(quán)平均值與標(biāo)準(zhǔn)差作為該樣本的最終性能判定指標(biāo)。根據(jù)樣本數(shù)據(jù)量大小,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率存在微小調(diào)整,隱藏層固定為10個(gè)節(jié)點(diǎn)。
根據(jù)上述步驟進(jìn)行的模型預(yù)測(cè)準(zhǔn)確率與標(biāo)準(zhǔn)差結(jié)果如圖4、圖5、表4所示,N為按照天數(shù)表示的樣本大小。
圖4 區(qū)段1的模型預(yù)測(cè)準(zhǔn)確率
圖5 區(qū)段2的模型預(yù)測(cè)準(zhǔn)確率
圖4、圖5、表4的結(jié)果表明,訓(xùn)練樣本大小為1 d時(shí),模型預(yù)測(cè)的準(zhǔn)確率和穩(wěn)定性最佳。由于路網(wǎng)內(nèi)出現(xiàn)車輛設(shè)備故障、鄰臺(tái)接入車晚點(diǎn)的突發(fā)情況,預(yù)測(cè)模型在相應(yīng)日期的準(zhǔn)確率出現(xiàn)下降。不同允許誤差下的準(zhǔn)確率如表5所示。
表4 模型預(yù)測(cè)的標(biāo)準(zhǔn)差
表5 不同允許誤差下的預(yù)測(cè)成功率
提出了一種列車運(yùn)行實(shí)績數(shù)據(jù)的初始晚點(diǎn)、連帶晚點(diǎn)分類與晚點(diǎn)傳播鏈構(gòu)建方法,并在此基礎(chǔ)上建立了神經(jīng)網(wǎng)絡(luò)晚點(diǎn)預(yù)測(cè)模型。數(shù)據(jù)實(shí)驗(yàn)的結(jié)果表明,模型在允許誤差為5 min時(shí)準(zhǔn)確率為85.5%。由于神經(jīng)網(wǎng)絡(luò)模型無法很好的擬合路網(wǎng)內(nèi)部數(shù)據(jù)的復(fù)雜關(guān)聯(lián)關(guān)系,路網(wǎng)內(nèi)出現(xiàn)突發(fā)事件后,模型準(zhǔn)確度會(huì)不可避免地出現(xiàn)下降,應(yīng)用能夠完整表述并擬合復(fù)雜關(guān)系的模型,如強(qiáng)化學(xué)習(xí)、隨機(jī)森林算法擬合建模,才能實(shí)現(xiàn)更高的預(yù)測(cè)率。
鐵道標(biāo)準(zhǔn)設(shè)計(jì)2019年3期