莊 河,何世偉,戴楊鋮
(1.西南交通大學 交通運輸與物流學院,四川 成都 610031; 2.中國鐵路總公司 運輸局,北京 100844;3.北京交通大學 交通運輸學院,北京 100044)
高速鐵路列車具有很高的正點率,但當受到設備故障、惡劣天氣、突發(fā)事件等因素影響時,也會出現列車到達車站時刻偏離計劃運行圖的情況,因此需要對列車運行計劃進行調整。
高速鐵路列車運行調整具有約束條件復雜、優(yōu)化指標多、實時性高、動態(tài)性強等特點。文獻[1—3]采用基于列車到發(fā)車站時刻等決策值的方法進行列車運行調整優(yōu)化;文獻[4]構建了以最小化等待時間及最小化中高速列車總旅行時間的雙目標優(yōu)化模型,采用分支定界法與束搜索算法相結合的方法求解;文獻[5]設計了基于替代圖的列車運行調整計劃編制模型及優(yōu)化方法;文獻[6]針對高速鐵路列車運行調整復雜性高的特點,采用貪婪算法進行實時列車調整;文獻[7]建立列車到發(fā)時刻與進路同步優(yōu)化的高速鐵路列車運行調整整數規(guī)劃模型,設計了基于優(yōu)先級規(guī)則的調度調整啟發(fā)式算法;文獻[8—9]采用以列車運行順序為關注對象的序優(yōu)化方法;文獻[10—11]分別采用禁忌搜索算法和遺傳算法進行列車運行調整。這些研究推進并豐富了列車運行計劃調整的優(yōu)化方法體系,數學模型也具有直觀的優(yōu)點,但由于這類數學模型變量多、構模與算法復雜,加上問題的動態(tài)性,很難得到令人滿意的解,因此,亟須研究提出高速鐵路列車運行計劃調整的新方法。
策略是指對將來任意可能的狀態(tài)可采取的行動的集合[12-13],如在生產調度工作中,可推遲加工設備的開、完工時間,可調整加工設備的加工順序等。高速鐵路列車運行調整優(yōu)化問題與一般生產調度優(yōu)化相通,如調度員確定相鄰的相互沖突列車是順晚、還是在前方站或后方站越行,就類似于生產調度的策略?;诓呗缘膬?yōu)化方法是指以策略而非傳統(tǒng)決策值為對象的優(yōu)化方法。有學者基于策略研究了高速鐵路列車運行調整問題:文獻[14]提出將客運專線列車運行調整問題轉化為車間調度問題,并針對局部調整和大面積調整分別提出了實用可行的調整策略模型及算法。這些基于策略的研究成果,進一步拓展了高速鐵路列車運行調整問題研究的思路,但多采用固定策略的仿真分析方法,使得各種調度策略之間缺乏銜接性和關聯(lián)性,也無法保證解的優(yōu)化質量。馬氏決策過程模型通過揭示不同狀態(tài)下優(yōu)化策略與轉移概率和獲得報酬的關系,解決各種調度策略之間的銜接性和關聯(lián)性問題,并在保證解的優(yōu)化質量前提下簡化計算過程,在很多領域得到了較好的應用[12-13]。因此,可基于馬氏決策過程模型和策略優(yōu)化方法研究高速鐵路列車運行調整問題。
本文構建高速鐵路列車運行調整問題的馬氏決策過程模型;給出列車運行調整行動的最優(yōu)策略條件,設計模型求解的策略優(yōu)化方法;結合實際案例,將策略優(yōu)化方法的求解結果與傳統(tǒng)模型優(yōu)化算法、人工調整方法的結果進行對比,以驗證馬氏決策過程模型和策略優(yōu)化方法的正確性和有效性。
定義如下概念和參數:將高速鐵路行車調度員對列車進行調整的時間點稱為決策時刻,令T為所有決策時刻的集合,且T={0,1,2,…,e,…,E},E為階段數或總時刻點數。在每個決策時刻e,設相鄰且存在沖突的列車所在位置為狀態(tài)ζe,S為高速鐵路行車組織中列車的常見沖突狀態(tài)集合,也稱為狀態(tài)空間,ζe∈S,S={1,2,3},其中“1”表示前、后列車同速,因前行列車晚點而導致的沖突(簡稱同速列車沖突),“2”表示前面為高速列車,后面為中速列車,前行列車晚點導致的沖突(簡稱高中速列車沖突),“3”表示前面為中速列車,后面為高速列車,前行列車晚點導致的沖突(簡稱中高速列車沖突)。
在狀態(tài)ζe下,行車調度員可采取的調整措施稱為行動a,A(ζe)為所有行動的集合,a∈A(ζe),A(ζe)={1,2,3},其中“1”表示后行列車順晚(簡稱順晚),“2”表示后行列車在沖突區(qū)間的前方站越行前行列車(簡稱前方站越行),“3”表示后行列車在沖突區(qū)間的后方站越行前行列車(簡稱后方站越行)。
在任意決策時刻e,狀態(tài)為ζe,采取行動a后,下一個決策時刻系統(tǒng)所處的狀態(tài)由概率分布p(·|ζe,a) 決定,以此時列車加權總晚點時間作為調度員采取行動將獲得的報酬r(ζe,a),當報酬為正值時,表示列車調整的目標有改善(即加權總晚點時間減少),為負值時表示列車調整的目標進一步惡化。由于高速鐵路列車運行調整決策過程符合馬氏決策過程的重要特征,即列車狀態(tài)的轉移概率和報酬僅僅依賴于當前的狀態(tài)和調度員采取的行動,而不直接依賴于以前的情況,則高速鐵路列車運行調整問題的馬氏決策過程模型為
{T,S,A(ζe),p(·|ζe,a),r(ζe,a)}
(1)
對于馬氏決策過程模型,有如下定義[12]。
定義1:如果狀態(tài)空間下的函數f滿足對每個ζe∈S有f(ζe)∈A(ζe),即f:S→A(ζe),則稱f為確定性決策規(guī)則,也稱為決策函數;全體決策函數所組成的集合記為F。
定義2:1個決策函數序列π=(f0,f1,f2,…,fe,…),fe∈F,e∈T,稱為(確定性)1個馬氏決策策略,其中fe是決策時刻e的決策函數,不依賴于決策時刻e以前系統(tǒng)的歷史;全體馬氏策略所組成的集合記做Πm,稱為馬氏策略類。
由于給定調整范圍(時段、區(qū)間和列車數)的高速鐵路列車運行調整優(yōu)化問題屬于有限狀態(tài)、可數行動的情形,對其最優(yōu)策略的結構有如下定理。
定理1的證明參見文獻[15]。
定理2:1個馬氏決策策略π=(f0,f1,f2,…,fe,…)∈Πm是1個最優(yōu)策略的充要條件是:每個決策規(guī)則在每個可實現的歷史上都要采取最優(yōu)的行動。
定理2的證明參見文獻[13]。
定理3:在出現大面積列車晚點時,若所有列車本身均無故障,且所有列車晚點均未超過最大可接受晚點時間,則應采用列車順晚依次開行的行動。
定理3的證明如下。
在決策時刻0,列車有3種沖突狀態(tài),即ζ0={1,2,3}。
狀態(tài)1(ζ0=1,即同速列車沖突)如圖1所示,2列列車的運行線為平行線。假設列車i晚點而列車j不晚點,并假設列車i在k+1站的晚點時間為tw,則對于后面的列車j,可根據車站間隔時間將其調整至當前可行的最早到達時間,調整時間為tx;因為之后對這2列車均可以通過壓縮區(qū)間運行時間和車站停留時間來恢復其正點運行,故應采用列車順晚依次開行的行動,不考慮列車越行。另一方面,假設列車i和列車j均晚點,此時,tx不僅可調整余地小,而且也不符合考慮列車越行問題的基本條件(晚點均未超過最大可接受時間),故應采用列車順晚依次開行的行動,不考慮列車越行。
狀態(tài)2(ζ0=2,即高中速列車沖突)如圖2所示,前行的高速列車i在k+1站晚點tw,tx為中速列車j在k+1站的預計到達時間與高速列車i的實際到達時間之差,Idd為車站不同時到達最小間隔時間。若tx>Idd,則列車j不需要進行調整,否則,根據車站間隔時間把列車j調整至當前可行的最早到達時間即可,故應采用列車順晚依次開行的行動,不考慮列車越行;之后列車i和列車j同樣可以通過壓縮區(qū)間運行時間和車站停留時間來恢復正點運行。這種沖突對后車帶來的連帶晚點影響最為輕微,若后行列車也晚點,則應采用列車順晚依次開行的行動,更無需考慮列車越行。
圖1 同速列車順晚依次開行
圖2 高中速列車順晚依次開行
狀態(tài)3(ζ0=3,即中高速列車沖突)如圖3所示,若前行的中速列車i在k+1站發(fā)生晚點,與后行的高速列車j在區(qū)間發(fā)生沖突,在不改變列車到發(fā)順序的前提下,后行高速列車j只能根據車站間隔時間進行調整(減速慢行),調整時間tx。由圖3可以發(fā)現,這種調整會大大限制列車j在區(qū)間的運行速度,并且下一區(qū)間依然會受到列車i的牽制,帶來連帶晚點影響。但根據定理3:對于大面積列車晚點,所有列車自身均無故障,且所有列車晚點均未超過最大可接受時間,此時由于后續(xù)高速列車也同樣晚點,導致tx大大減少,甚至為0,因此,該情況下仍應采用列車順晚依次開行的行動,無需考慮列車越行。只有當后行的高速列車晚點時間超出最大可接受時間時,才有必要考慮列車越行。
圖3 中高速列車順晚依次開行
綜上,在決策時刻0時,對于列車沖突的3種沖突狀態(tài)ζ0,所采取的最優(yōu)行動均為列車順晚依次開行。
采用同樣的分析方法可得,在任意決策時刻e,對于列車沖突的3種狀態(tài)ζe,所采取的最優(yōu)行動仍為列車順晚依次開行。
由此可得,在0,1,2,…,e,…,E序列決策時刻中,對于列車沖突的3種沖突狀態(tài),所采取的最優(yōu)行動均為列車順晚依次開行。
根據定理1和定理2,1個決策策略是最優(yōu)策略的充要條件就是每個決策規(guī)則在每個可實現的歷史上都要采取最優(yōu)的行動,由于上述討論的每個行動均為最優(yōu)且符合最優(yōu)平穩(wěn)策略的條件,故定理3得證。
當前行列車出現嚴重晚點或列車晚點超過最大可接受時間,而后行列車運行沒有晚點或者晚點較少,不符合列車順晚依次開行行動的最優(yōu)策略條件時,就需要考慮相鄰沖突列車間的越行問題。在討論列車越行行動前,先給出如下定義。
定義4:在狀態(tài)ζe下,若2列列車在區(qū)間發(fā)生沖突,對于后行列車是在前方站越行(行動2,a=2)還是在后方站越行(行動3,a=3),是由采取該行動所獲得的行動報酬決定的,行動報酬較大的行動則為狀態(tài)ζe下的最優(yōu)行動。
在決策時刻e,列車沖突狀態(tài)ζe=3時,即中高速列車沖突,如圖4所示。設t0為后行列車與前行列車在i站的預計到達時間之差;Iff為車站不同時發(fā)車最小間隔時間;ti和tj分別為列車i和列車j的區(qū)間運行時分,則有ti>tj(注:也可能前行列車為故障限速運行列車或嚴重晚點列車);li和lj分別為列車i和列車j的等級(或權重)。下面分t0 圖4 狀態(tài)ζ時列車沖突基本情況圖 當t0 由圖5可知,2種越行行動都可以疏解區(qū)間的沖突。分別計算2種越行行動下的報酬Tk和Tk+1,即列車i和列車j在區(qū)間內的加權總旅行時間(自在k站到達起直至從k+1站發(fā)車時止的時間),分別為 Tk=lj(tj+Idd-t0)+li(Idd+Iff+ti) (2) Tk+1=lj(ti+Idd-t0)+li(ti+Idd+Iff) (3) 圖5 當t0 已知ti>tj,故Tk 同時,列車j無論是在k站越行還是在k+1站越行,列車i離開k+1站的時間相同,即對下一個狀態(tài)的后行列車影響是相同的,則列車j在k站進行越行為最優(yōu)行動。 當t0≥Idd時,列車在k站或k+1站的越行行動如圖6所示。 圖6 當t0≥Idd時列車在k站或k+1站的越行行動 由圖6可知,與圖5情況不同之處在于,若列車在k站越行,則只需調整列車i即可,列車j完全不受干擾。分別計算此時的Tk和Tk+1,即 Tk=ljtj+li(t0+Iff+ti) (4) Tk+1=lj(ti+Idd-t0)+li(ti+Idd+Iff) (5) 令Tk≤Tk+1,由式(4)和(5)可得 (6) 令Tk>Tk+1,由式(4)和式(5)可得 (7) 基于定理2和列車越行行動有如下推論。 推論:在高速鐵路列車運行調整過程中,采取相應調整行動,使前后兩相鄰存在潛在沖突的列車其關系始終滿足條件1或條件3,且在任意狀態(tài)下采取的列車越行行動均為最優(yōu)行動,即每個決策規(guī)則要求在每個可實現的歷史都應采取列車越行行動,則這些行動對應的馬氏決策策略是1個最優(yōu)策略。 應該看到,在高速鐵路行車調度決策過程中,如果采取相應調整行動,使前后兩相鄰存在潛在沖突的列車其關系滿足條件2時,盡管其出現概率很小,但理論上并不能保證后續(xù)優(yōu)化行動序列對應的策略為最優(yōu)策略,此時,可以分別計算不同越行行動在前方站和后方站的報酬,采取多步的狀態(tài)遞歸方法,再比較其優(yōu)劣,從中選擇更優(yōu)化的行動序列。 3.1.1矩陣的建立 假定在調整時段內某個區(qū)段上有K個車站、N列列車,定義如下矩陣。 列車越行矩陣O=(oi,k)N×(K-1),矩陣元素oi,k為第i行第k列位置上的數據,取第k個運行區(qū)間內按時間順序排在第i位的列車編號,i∈{1,…,N},k∈{1,…,K-1}。如圖7所示:列車越行矩陣的第1列數據1,2,3分別對應第1個運行區(qū)間內按時間順序的列車編號1,2,3;第2列數據2,1,3分別對應第2個運行區(qū)間內按時間順序的列車編號2, 1, 3;可見,列車1和列車2的位置順序交換了,這是因為在k=2站列車1被列車2越行;依次類推,可以得到整個區(qū)段中的列車越行矩陣。 列車i在k站的到、開時刻矩陣X=(xi,k)N×(2K-2),其中,xi,2k-1為列車i在k站的到達時刻,xi,2k為列車i在k站的出發(fā)時刻,k=1,2,…,K-1。 圖7 區(qū)段內列車越行矩陣圖示 3.1.2極大加代數法推算列車運行時刻表 采用文獻[16]給出的基于極大加代數和矩陣的列車時刻表遞推算法,可以快速推算在確定越行順序和無沖突列車條件下,由狀態(tài)ζe到狀態(tài)ζe+1所有列車在不同車站的到發(fā)時刻。 (1)第1列車在其經過k站時的到發(fā)時刻x1,2k和x1,2k+1,以及各次列車按照最小發(fā)車間隔在始發(fā)站的始發(fā)時刻xi,1的計算式分別為 (8) k=2,…,K; xi,1=Iff(i-1);i=2,…,N (9) (2)后續(xù)列車在k站的到達時刻xoi,k,2k和發(fā)車時刻xoi,k+1,2k+1的計算式分別為 k=1,2,…,K-2;i=2,3,…,N (10) xoi-1,k+1,2k+1+Iff) k=1,2,…,K-2;i=2,3,…,N (11) (3)后續(xù)列車在終到站K的到達時刻xoi,K-1,2K-2的計算式為 (12) i=2,3,…,N (4)定義yi,K為列車i到達終點站K的圖定終到時刻,所有列車的總加權晚點時間tall的計算式為 (13) 根據上文的理論和計算公式,設計的高速鐵路列車運行調整策略優(yōu)化方法步驟如下。 Step1:從調整初始時刻開始,按照基本圖的越行矩陣,運用式(8)—式(11)計算各次列車(含初始晚點列車)在各站的到發(fā)時刻,并按照時間先后順序,同步比較相鄰列車在各站的到發(fā)時刻是否存在沖突,若存在沖突,則令e=0, 轉Step2;否則轉Step6。 Step2:對于系統(tǒng)狀態(tài)ζe,根據沖突列車是否出現嚴重晚點或列車晚點是否超過最大可接受時間的情況,判斷其是否符合2.2節(jié)給出的列車順晚依次行動的最優(yōu)策略條件,若符合則轉Step3,否則轉Step4。 Step3:采取順晚行動疏解沖突狀態(tài)ζe,列車越行矩陣保持不變,轉Step5。 Step4:根據2.3節(jié)給出的列車越行行動的最優(yōu)策略條件,采取相應越行行動疏解沖突狀態(tài)ζe,同時修改列車越行矩陣。 Step5:按照新的列車越行矩陣,運用式(8)—式(11)計算各次列車在后續(xù)各站的到發(fā)時刻,并按照時間先后順序,同步比較相鄰列車在各站的到發(fā)時刻是否存在沖突。若存在新的相鄰沖突列車,則令e=e+1,轉Step2;否則轉Step6。 Step6:計算所有列車的總加權晚點時間tall,輸出結果,計算結束。 選取京滬高速鐵路德州東至徐州東區(qū)段下行方向為例,該時段列車密度相對密集,前行列車出現晚點后對后續(xù)列車運行將產生較大影響。該區(qū)段共有8個車站,依次為德州東、濟南西、崔馬莊(線路所)、泰安、曲阜東、滕州東、棗莊、徐州東站,對應車站編號為k=1,2,…,8;調整時段選取某天的13:00—17:00;調整時段內基本列車運行圖采用實際的運行圖,如圖8所示,列車按照進入該調整區(qū)段的時間先后編號為1~37(具體車次見圖8);其中,區(qū)間運行時間、車站間隔時間、列車運行時刻表、列車停站情況可參見京滬高速鐵路列車運行圖資料[18]。 由于此次調整不存在中速列車,假定5號列車(G325)、12號列車(G133)、19號列車(G29)、21號列車(G3)、27號列車(G141)、35號列車(G35)這6列列車為重點列車,列車等級為2.5,其余列車等級為1.25。隨機產生8個列車晚點算例,其中,第1—第7個算例對應于不同的單列列車晚點情形,第8個算例對應于由于天氣異常需要臨時限速,從而導致多列車晚點情形,且臨時限速200 km·h-1;晚點列車編號n,限速區(qū)間編號h(對應車站h到車站h+1的區(qū)間,經過該區(qū)間的列車由于限速等原因假定均晚點一定時間)和晚點列車所在車站的編號均見表1。 圖8 調整區(qū)段的基本列車運行圖 分別采用人工調整、傳統(tǒng)的優(yōu)化模型方法和本文的策略優(yōu)化方法進行列車運行調整,采用主頻為2.5 GHz的聯(lián)想Y480電腦計算,策略優(yōu)化調整的平均時間約為5 s,而優(yōu)化模型計算時間約為6 min,計算運行圖調整方案的列車總加權晚點時間,結果也列于表1中。以算例4為例,對應列車3在車站4的晚點,列車晚點運行圖人工調整方案如圖9所示,采用本文的模型和策略優(yōu)化方法調整得到的列車運行圖如圖10所示。由于采用了越行的調整方式(注:圓圈處為沖突列車位置),較人工方案加權晚點時間減少5 min。 由表1、圖9和圖10結果可以看出,表1最后2列數據完全相同,表明采用策略優(yōu)化方法與傳統(tǒng)數學模型的優(yōu)化結果相同,且能取得較人工調整方法更好的優(yōu)化效果,而較傳統(tǒng)數學優(yōu)化模型方法,又可大大提高問題的求解效率,這說明策略優(yōu)化方法具有優(yōu)良的計算性能,能滿足高速鐵路行車調度決策系統(tǒng)開發(fā)的需要。 表1 采用不同列車運行調整方法時不同算例的列車總加權晚點時間 圖9 列車晚點運行圖人工調整方案 圖10 策略優(yōu)化后的列車運行圖 本文運用馬氏決策過程模型和策略優(yōu)化方法研究了高鐵列車運行調整問題,通過設立相鄰且存在沖突的列車所在的位置為狀態(tài),選擇列車順晚、前方站越行、后方站越行等調度員可采取的調整措施作為行動,采用列車加權總晚點時間作為行車調度員獲得的報酬,構建了高速鐵路列車運行調整問題的馬氏決策過程模型;給出了列車順晚開行和越行調整行動的最優(yōu)策略條件。在此基礎上,設計了策略優(yōu)化方法。以某高速鐵路區(qū)段為例,假設多種典型晚點情況進行調整,通過人工調整、傳統(tǒng)數學模型優(yōu)化方法與本文的策略優(yōu)化方法的比較,表明策略優(yōu)化方法能取得較人工調整方法更好的優(yōu)化效果,較傳統(tǒng)的數學模型優(yōu)化方法可大大提高求解效率,從而驗證了高速鐵路列車運行調整馬氏決策過程模型和策略優(yōu)化方法的有效性,也為進一步深化研究列車運行調整的快速有效方法提供了解決問題的新途徑。 [1]CORDEAU J, TOTH P, VIGO D. A Survey of Optimization Models for Train Routing and Scheduling[J]. Transportation Science,1998, 32 (4):380-404. [2]ANDREA D’Ariano,DARIO Pacciarelli,MARCO Pranzo. A Branch and Bound Algorithm for Scheduling Trains in a Railway Network[J]. European Journal of Operational Research,2007, 183 (2):643-657. [3]CAPRARA A,FISCHETTI M,TOTH P. Modeling and Solving the Train Timetabling Problem[J]. Operations Research,2002,50(5):851-861. [4]ZHOU Xuesong,ZHONG Ming. Bicriteria Train Scheduling for High-Speed Passenger Railroad Planning Applications[J]. European Journal of Operational Research, 2005,167(3):752-771. [5]王濤, 張琦; 趙宏濤, 等. 基于替代圖的列車運行調整計劃編制及優(yōu)化方法[J]. 中國鐵道科學,2013,34(5):126-133. (WANG Tao,ZHANG Qi,ZHAO Hongtao,et al. A Method for Generation and Optimization of Train Operation Adjustment Plan Based on Alternative Graph[J]. China Railway Science,2013,34(5):126-133. in Chinese) [6]KRASEMANN J T. Design of an Effective Algorithm for Fast Response to the Re-Scheduling of Railway Traffic during Disturbances[J].Transportation Research Part C,2012,20(1):62-78. [7]季學勝,孟令云.列車到發(fā)時刻與進路同步優(yōu)化的高速鐵路列車運行調整模型[J].中國鐵道科學,2014,35(4) ): 117-123. (JI Xuesheng,MENG Lingyun. Train Operation Adjustment Model for Synchronously Optimizing Train Arrival/Departure Time and Route on High Speed Railway Network[J]. China Railway Science,2014,35(4): 117-123. in Chinese) [8]陳雍君,周磊山.基于序優(yōu)化方法的列車運行調整算法研究[J].鐵道學報,2010,32(3):1-8. (CHEN Yongjun,ZHOU Leishan. Study on Train Operation Adjustment Algorithm Based on Ordinal Optimization [J]. Journal of the China Railway Society,2010,32(3):1-8. in Chinese) [9]李曉娟,韓寶明,李得偉,等.基于轉換極大代數和序優(yōu)化的高速列車運行調整方法[J].中國鐵道科學,2013,34(6):124-130. (LI Xiaojuan, HAN Baoming, LI Dewei,et al. Method for High-Speed Train Operation Adjustment Based on Switching Max-Plux-Linear System and Ordinal Optimization[J].China Railway Science, 2013,34(6):124-130. in Chinese) [10]董守清,王進勇,閆海峰. 雙線鐵路列車運行調整的禁忌搜索算法[J]. 中國鐵道科學,2005,26(4):114-119. (DONG Shouqing,WANG Jinyong,YAN Haifeng. Tabu Search for Train Operation Adjustment on Double-Track Line[J]. China Railway Science,2005,26(4):114-119. in Chinese) [11]王宏剛,張琦,王建英,等. 基于遺傳算法的高速鐵路行車調整模型[J]. 中國鐵道科學,2006,27(3):96-100. (WANG Honggang, ZHANG Qi, WANG Jianying, et al. GA-Based Model of Train Operation Adjustment forHigh-Speed Railway[J]. China Railway Science,2006,27(3):96-100. in Chinese) [12]WHITE D J. Markov Decision Processes[M]. Chichester:Wiley Press, 1993. [13]董澤清, 劉克. 無界報酬折扣半馬氏模型最優(yōu)策略的結構[J]. 中國科學:A輯,1985,15(11):975-985. (DONG Zeqing,LIU Ke. Structure of Optimal Policy for Semi Markov Model with Unbounded Reward and Discount [J]. Scientia Sinica:A Edition,1985,15(11):975-985. in Chinese) [14]石雨.客運專線列車運行調整的策略、模型與算法[D]. 北京: 北京交通大學,2010. (SHI Yu. Strategies Models and Algorithms of Train Operation Adjustment for the Passenger Dedicated Railway [D]. Beijing: Beijing Jiaotong University,2010. in Chinese) [15]BLACKWELL D. Discrete Dynamic Programming[J]. Annals of Mathematical Statistics,1962,33:719-726. [16]李傳賓. 基于矩陣表示和極大代數法的高鐵周期列車運行圖編制方法研究[D]. 北京:北京交通大學,2012. (LI Chuanbin. Research on Periodic Timetabling for the Trains on High-Speed Railway Using Matrix Representation and Max-Plus Algebra Theory[D]. Beijing: Beijing Jiaotong University,2012. in Chinese) [17]端嘉盈.高速鐵路開通后既有繁忙干線運能計算及分析方法研究[D].北京:北京交通大學,2013. (DUAN Jiaying. Research on the Carrying Capacity Calculation and Analysis Method of Existing Busy Main-Line after the High-Speed Railway Opened[D]. Beijing: Beijing Jiaotong University,2013. in Chinese) [18]中國鐵路總公司.鐵運函[2011]328號 關于公布京滬高速鐵路列車運行圖的通知[S].北京:中國鐵路總公司,2016.3 策略優(yōu)化方法
3.1 基于極大加代數和矩陣的列車到發(fā)時刻計算方法[16-17]
3.2 策略優(yōu)化方法的實現
4 算例分析
4.1 實例概況
4.2 調整計算結果
5 結 論