袁 強(qiáng), 武 旭, 胡思繼, 段清亮
(1.北京交通大學(xué)交通運(yùn)輸學(xué)院, 北京 100044;2.中國(guó)鐵路濟(jì)南局集團(tuán)有限公司濟(jì)南調(diào)度所, 山東濟(jì)南 250001)
高速鐵路列車(chē)跨線(xiàn)運(yùn)行是我國(guó)高速鐵路網(wǎng)常見(jiàn)的客運(yùn)組織方式,承擔(dān)不同客運(yùn)專(zhuān)線(xiàn)之間的客流輸送。因高速鐵路跨線(xiàn)列車(chē)具有便捷旅客出行、減少換乘次數(shù)、縮短旅行時(shí)間、服務(wù)質(zhì)量高等優(yōu)點(diǎn),受到廣大旅客的青睞。為滿(mǎn)足跨線(xiàn)客流的運(yùn)輸需求及充分利用高速線(xiàn)的運(yùn)輸能力,我國(guó)高速鐵路采用“高速線(xiàn)上本線(xiàn)列車(chē)和跨線(xiàn)列車(chē)共線(xiàn)運(yùn)行”的運(yùn)輸組織模式,即高速線(xiàn)路上除了運(yùn)行本線(xiàn)高速列車(chē)外,還運(yùn)行一定比例的由銜接車(chē)站接入的跨線(xiàn)列車(chē)。本線(xiàn)列車(chē)和跨線(xiàn)列車(chē)共線(xiàn)運(yùn)行的運(yùn)輸組織模式在實(shí)現(xiàn)客流運(yùn)輸直達(dá)性、減少旅客換乘問(wèn)題的同時(shí),對(duì)高速鐵路的行車(chē)組織造成了一定影響。文獻(xiàn)[1]研究表明,從天津站、濟(jì)南站、徐州站接入京滬高速線(xiàn)的跨線(xiàn)列車(chē)平均晚點(diǎn)概率分別為53.6%、37.2%、70.6%,跨線(xiàn)列車(chē)到達(dá)正點(diǎn)率不容樂(lè)觀。在高速線(xiàn)負(fù)荷較高時(shí),跨線(xiàn)列車(chē)進(jìn)入高速線(xiàn)晚點(diǎn)較多,必將產(chǎn)生列車(chē)運(yùn)行之間的沖突[2]。在繁忙干線(xiàn)上,如果在運(yùn)輸過(guò)程中不能有效地控制晚點(diǎn)傳播,將會(huì)造成大規(guī)模的連帶晚點(diǎn),影響高速線(xiàn)正常行車(chē),對(duì)時(shí)效性要求很高的高速鐵路運(yùn)營(yíng)造成極大的負(fù)面影響。隨著我國(guó)高速鐵路網(wǎng)規(guī)模的擴(kuò)大,跨線(xiàn)列車(chē)運(yùn)行的比例將會(huì)越來(lái)越高[3]。從高速線(xiàn)客運(yùn)質(zhì)量提升的角度出發(fā),鐵路企業(yè)必須重視跨線(xiàn)列車(chē)的晚點(diǎn)問(wèn)題,掌握跨線(xiàn)列車(chē)晚點(diǎn)分布規(guī)律,為研究列車(chē)晚點(diǎn)傳播及優(yōu)化運(yùn)輸組織等提供基礎(chǔ)。因此,有必要對(duì)高速鐵路跨線(xiàn)列車(chē)的晚點(diǎn)時(shí)長(zhǎng)分布模型進(jìn)行研究。
列車(chē)晚點(diǎn)分布一直是國(guó)內(nèi)外學(xué)者研究的問(wèn)題。既有研究主要圍繞普速鐵路,基于實(shí)績(jī)數(shù)據(jù)分析列車(chē)晚點(diǎn)、列車(chē)晚點(diǎn)分類(lèi)等方面研究列車(chē)晚點(diǎn)問(wèn)題。文獻(xiàn)[4]總結(jié)出普速鐵路列車(chē)晚點(diǎn)服從負(fù)指數(shù)分布。文獻(xiàn)[5]運(yùn)用數(shù)理統(tǒng)計(jì)分析的方法驗(yàn)證了列車(chē)晚點(diǎn)分布與負(fù)指數(shù)分布吻合。長(zhǎng)期以來(lái),國(guó)內(nèi)外關(guān)于列車(chē)晚點(diǎn)分布模型的研究比較薄弱,且受限于難以獲得列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),學(xué)者們常假設(shè)晚點(diǎn)分布模型[6]進(jìn)行理論分析。在基于列車(chē)實(shí)績(jī)數(shù)據(jù)研究列車(chē)晚點(diǎn)方面,文獻(xiàn)[7]基于京滬高鐵一個(gè)半月的列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),分析列車(chē)區(qū)間運(yùn)行時(shí)間與發(fā)車(chē)晚點(diǎn)的關(guān)系,以及列車(chē)停站時(shí)間與到達(dá)晚點(diǎn)的關(guān)系。文獻(xiàn)[8]基于高速列車(chē)實(shí)績(jī)運(yùn)行數(shù)據(jù),繪制了高速列車(chē)晚點(diǎn)分布曲線(xiàn)。在科學(xué)研究中,分類(lèi)研究是常用方法之一,通過(guò)分類(lèi)將問(wèn)題細(xì)致化和微觀化。文獻(xiàn)[9]基于英國(guó)普速鐵路列車(chē)運(yùn)行晚點(diǎn)數(shù)據(jù),對(duì)所有列車(chē)晚點(diǎn)數(shù)據(jù)和各條線(xiàn)路列車(chē)晚點(diǎn)數(shù)據(jù)進(jìn)行分類(lèi)研究。文獻(xiàn)[10]基于廣鐵集團(tuán)高速列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),對(duì)不同致因下的高速鐵路列車(chē)初始晚點(diǎn)分布模型進(jìn)行分類(lèi)研究,但并未從本線(xiàn)和跨線(xiàn)角度對(duì)列車(chē)到達(dá)晚點(diǎn)進(jìn)行分類(lèi)研究。既有研究中,關(guān)于高速鐵路本線(xiàn)和跨線(xiàn)列車(chē)晚點(diǎn)的分類(lèi)研究較少,且既有的關(guān)于列車(chē)晚點(diǎn)分布的研究存在兩個(gè)問(wèn)題:一是列車(chē)晚點(diǎn)分布模型可以很好的擬合列車(chē)晚點(diǎn)數(shù)據(jù),但無(wú)法解釋該晚點(diǎn)模型產(chǎn)生的機(jī)理;二是既有的列車(chē)晚點(diǎn)分布研究都假設(shè)用于擬合的所有列車(chē)晚點(diǎn)數(shù)據(jù)都服從同一分布,但又沒(méi)有通過(guò)任何擬合前的分析來(lái)保證同一分布的假設(shè)條件能夠得到滿(mǎn)足。因此,為解決以上問(wèn)題,本文基于京滬高速鐵路列車(chē)運(yùn)行實(shí)際數(shù)據(jù),從本線(xiàn)和跨線(xiàn)角度分類(lèi),使用超統(tǒng)計(jì)理論對(duì)跨線(xiàn)列車(chē)晚點(diǎn)的機(jī)理及晚點(diǎn)時(shí)長(zhǎng)分布模型進(jìn)行研究。
通常列車(chē)晚點(diǎn)是列車(chē)在運(yùn)行過(guò)程中受到設(shè)備因素、環(huán)境因素和人為因素等方面的影響后逐漸累積的延遲。相比于本線(xiàn)列車(chē),跨線(xiàn)列車(chē)受各種因素的影響更為顯著。設(shè)T是跨線(xiàn)列車(chē)在運(yùn)行過(guò)程中受到各種因素影響后到達(dá)晚點(diǎn)時(shí)長(zhǎng)t的集合。集合T的時(shí)間序列如圖1所示,從時(shí)間序列圖中可以明顯看出跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布是一個(gè)復(fù)雜的非平穩(wěn)隨機(jī)過(guò)程,且存在異常晚點(diǎn)頻繁出現(xiàn)的情況,較本線(xiàn)列車(chē)晚點(diǎn)情況復(fù)雜,對(duì)于具有此類(lèi)特性的過(guò)程,可采用超統(tǒng)計(jì)理論建立分布統(tǒng)計(jì)模型[11]。
圖1 跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)序列
超統(tǒng)計(jì)理論[12](Superstatistics)是統(tǒng)計(jì)力學(xué)或統(tǒng)計(jì)物理學(xué)的一個(gè)分支,致力于研究非線(xiàn)性和非平衡系統(tǒng),其特征在于使用多個(gè)不同的統(tǒng)計(jì)模型的疊加來(lái)實(shí)現(xiàn)期望模型的非線(xiàn)性[13]。目前,超統(tǒng)計(jì)理論已成為一個(gè)強(qiáng)大的工具來(lái)描述復(fù)雜系統(tǒng),已經(jīng)在物理學(xué)[14]、醫(yī)學(xué)[15]、工程學(xué)[16]等復(fù)雜系統(tǒng)中得到廣泛應(yīng)用。超統(tǒng)計(jì)理論將復(fù)雜的非平衡系統(tǒng)現(xiàn)象模擬為兩個(gè)隨機(jī)變量的模型的疊加,一個(gè)對(duì)應(yīng)相對(duì)微觀的平衡系統(tǒng),每個(gè)子系統(tǒng)(或者單元)內(nèi)部平衡,且服從確定的概率分布;另一個(gè)對(duì)應(yīng)緩慢變化的參數(shù)β,服從一定的統(tǒng)計(jì)分布f(β)。通過(guò)兩層分布模型的疊加,得出整個(gè)復(fù)雜系統(tǒng)的分布模型。
當(dāng)研究對(duì)象是整條線(xiàn)路的跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)分布時(shí),可以將該研究對(duì)象定義為一個(gè)宏觀層的系統(tǒng),那么該宏觀層的系統(tǒng)包含若干個(gè)相對(duì)微觀的單元(車(chē)站),每個(gè)車(chē)站都服從同一類(lèi)型的分布模型,僅有環(huán)境參數(shù)的差異,該環(huán)境參數(shù)是隨車(chē)站環(huán)境及宏觀系統(tǒng)所處的路網(wǎng)環(huán)境的變化而緩慢變化的參數(shù)β,且服從一定的統(tǒng)計(jì)分布。因此,該宏觀系統(tǒng)可以使用超統(tǒng)計(jì)理論來(lái)建模。對(duì)于單個(gè)車(chē)站,在較短的時(shí)間范圍內(nèi),車(chē)站的環(huán)境參數(shù)β可以看作是一個(gè)定值,列車(chē)到達(dá)晚點(diǎn)服從一個(gè)確定的分布規(guī)律(負(fù)指數(shù)分布),此時(shí)這種狀態(tài)為一種平衡狀態(tài)。但在較長(zhǎng)的時(shí)間尺度下,該參數(shù)不是固定不變的,是隨時(shí)間變化而有所波動(dòng)的。當(dāng)車(chē)站環(huán)境或宏觀系統(tǒng)所處的路網(wǎng)環(huán)境發(fā)生變化,原來(lái)的平衡狀態(tài)被打破,變?yōu)槲蓙y的、有異常晚點(diǎn)值出現(xiàn)的現(xiàn)象,列車(chē)運(yùn)行秩序偏離列車(chē)運(yùn)行時(shí)刻表,產(chǎn)生了更為復(fù)雜的非平衡狀態(tài),這時(shí)就需要列車(chē)調(diào)度員采取適當(dāng)?shù)恼{(diào)整措施來(lái)使列車(chē)運(yùn)行恢復(fù)正常。一段時(shí)間后,車(chē)站又重新達(dá)到一個(gè)新的平衡狀態(tài),環(huán)境參數(shù)發(fā)生改變,以此類(lèi)推。將一個(gè)平衡態(tài)到另一個(gè)平衡態(tài)之間經(jīng)歷的時(shí)間記為τ,那么在較長(zhǎng)的時(shí)間尺度T(T?τ)上,由多個(gè)較小時(shí)間尺度的車(chē)站平衡系統(tǒng)組成該宏觀層的跨線(xiàn)列車(chē)晚點(diǎn)復(fù)雜系統(tǒng),如圖2所示,該復(fù)雜系統(tǒng)可以使用超統(tǒng)計(jì)理論來(lái)建模。在超統(tǒng)計(jì)理論中,微觀平衡系統(tǒng)建模是跨線(xiàn)列車(chē)晚點(diǎn)宏觀系統(tǒng)建模的基礎(chǔ),因此首先以單個(gè)車(chē)站為研究對(duì)象,對(duì)微觀平衡系統(tǒng)進(jìn)行建模。
圖2 宏觀層跨線(xiàn)列車(chē)晚點(diǎn)復(fù)雜系統(tǒng)
從微觀角度,運(yùn)用統(tǒng)計(jì)分析方法對(duì)單個(gè)車(chē)站跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)時(shí)長(zhǎng)進(jìn)行分析,在正常情況下,列車(chē)的到達(dá)晚點(diǎn)時(shí)長(zhǎng)分布可以用負(fù)指數(shù)分布很好地描述[17],給定車(chē)站環(huán)境參數(shù)的條件概率分布為
P(t|β)=βe-β t
(1)
式(1)為較短時(shí)間尺度內(nèi)微觀平衡系統(tǒng)的列車(chē)晚點(diǎn)分布模型。t表示列車(chē)實(shí)際到達(dá)時(shí)刻與圖定到達(dá)時(shí)刻之差,即列車(chē)晚點(diǎn)時(shí)長(zhǎng)(單位:min)。P(t|β)表示短時(shí)間內(nèi)單個(gè)車(chē)站在環(huán)境參數(shù)β給定的條件下,列車(chē)晚點(diǎn)時(shí)長(zhǎng)t的概率密度。β是短時(shí)間內(nèi)的車(chē)站環(huán)境參數(shù),是一個(gè)受車(chē)站設(shè)施設(shè)備、車(chē)站的運(yùn)營(yíng)環(huán)境(車(chē)站突發(fā)事件、車(chē)站工作人員罷工)、線(xiàn)路設(shè)備故障、惡劣天氣、暑期客流等方面綜合影響的正值參數(shù),且該參數(shù)具有時(shí)空不均勻性,即同一時(shí)間段的不同車(chē)站或同一車(chē)站在不同時(shí)間段的平衡狀態(tài)下的環(huán)境參數(shù)有所差異。車(chē)站環(huán)境參數(shù)β可由該車(chē)站對(duì)應(yīng)時(shí)間尺度內(nèi)的列車(chē)晚點(diǎn)數(shù)據(jù)擬合進(jìn)行確定。
列車(chē)到達(dá)晚點(diǎn)分布始終遵循“小晚點(diǎn),大概率;大晚點(diǎn),小概率”[18]的原則。不同環(huán)境參數(shù)β下的列車(chē)晚點(diǎn)分布曲線(xiàn)如圖3所示,對(duì)于給定的晚點(diǎn)時(shí)長(zhǎng)t,β值越大,列車(chē)發(fā)生較大晚點(diǎn)值的概率越小,意味著大多數(shù)跨線(xiàn)列車(chē)能夠較及時(shí)地到達(dá)車(chē)站,反之β值越小,表示列車(chē)發(fā)生較大晚點(diǎn)值的概率變大,到達(dá)車(chē)站的列車(chē)平均晚點(diǎn)值增大。
圖3 不同環(huán)境參數(shù)的列車(chē)晚點(diǎn)分布曲線(xiàn)
時(shí)間維度上,單個(gè)車(chē)站的環(huán)境是隨時(shí)間推移而不斷變化的,由于波動(dòng)的環(huán)境參數(shù)β的存在,使得長(zhǎng)時(shí)間尺度的單個(gè)車(chē)站的列車(chē)到達(dá)晚點(diǎn)分布模型為疊加統(tǒng)計(jì)變量分布模型;空間維度上,不同車(chē)站環(huán)境各異,這些環(huán)境差異最終都反映在各個(gè)車(chē)站波動(dòng)的環(huán)境參數(shù)上。對(duì)于整條高速線(xiàn)路的跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)分布,雖然不同車(chē)站有環(huán)境參數(shù)的差異,但都服從同一類(lèi)型的分布模型,因此用第二層模型描述空間和時(shí)間兩個(gè)維度的環(huán)境參數(shù)β的概率分布,用f(β)表示。那么在長(zhǎng)時(shí)間尺度上,宏觀層跨線(xiàn)列車(chē)晚點(diǎn)分布模型為兩層模型的疊加。故高速鐵路跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)的邊際分布為
(2)
構(gòu)建第二層模型f(β),Xi(i=1,2,3,…,n)為n個(gè)不同的高斯隨機(jī)變量,可以將環(huán)境影響的波動(dòng)參數(shù)β看成來(lái)自不同影響因素Xi的累積,則有
(3)
假設(shè)這些影響因素相互獨(dú)立,并且服從均值為0的正態(tài)分布,則β服從自由度為n的2-分布。
(4)
β0為波動(dòng)參數(shù)β的均值,計(jì)算公式為
(5)
將式(1)、式(4)帶入式(2),得到高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)的邊際分布為
(6)
p(t)~(1+b(1-q)t)1/(1-q)
(7)
在復(fù)雜宏觀系統(tǒng)的建模過(guò)程中,運(yùn)用超統(tǒng)計(jì)理論的思想,從列車(chē)晚點(diǎn)機(jī)理中產(chǎn)生了跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布的q-指數(shù)分布模型,見(jiàn)式(7)。q-指數(shù)函數(shù)是非廣延熱力學(xué)中常用的一種變形函數(shù),最早由Tsallis[19]提出,因此也被稱(chēng)為T(mén)sallis統(tǒng)計(jì)量。q-指數(shù)函數(shù)被定義為eq(x)=(1+b(1-q)x)1/(1-q),是一個(gè)正偏態(tài)分布函數(shù),其中1+b(1-q)x≥0,q是熵指數(shù)[20],1 圖4 不同熵指數(shù)q的q-指數(shù)分布概率密度函數(shù) 本文的列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)來(lái)源于鐵路客戶(hù)服務(wù)中心(12306網(wǎng)站)。從12306網(wǎng)站獲取2018年9月1日—2018年9月30日京滬高速鐵路各站的列車(chē)圖定到達(dá)時(shí)間、實(shí)際到達(dá)時(shí)間等基本信息,經(jīng)過(guò)數(shù)據(jù)處理后得到京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)數(shù)據(jù)。京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)散點(diǎn)圖如圖5所示,橫坐標(biāo)為9月1日—9月30日京滬高速鐵路列車(chē)到達(dá)車(chē)站的晚點(diǎn)記錄序號(hào),縱坐標(biāo)為列車(chē)晚點(diǎn)時(shí)長(zhǎng),由列車(chē)晚點(diǎn)時(shí)長(zhǎng)散點(diǎn)圖可以看出京滬高速鐵路列車(chē)晚點(diǎn)數(shù)據(jù)在較小的晚點(diǎn)時(shí)長(zhǎng)附近有較強(qiáng)的密集性,同時(shí)也存在較大的晚點(diǎn)值區(qū)域20~60 min和晚點(diǎn)異常值區(qū)域60~180 min。圖6是京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)以1 min為間隔的頻數(shù)分布直方圖,橫坐標(biāo)表示列車(chē)晚點(diǎn)時(shí)長(zhǎng),縱坐標(biāo)為晚點(diǎn)時(shí)長(zhǎng)出現(xiàn)的頻數(shù),列車(chē)晚點(diǎn)最大值為175 min,最小值為1 min。 圖5 京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)散點(diǎn)圖 圖6 京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖 從京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)中篩選出京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù),進(jìn)行跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)的分布特性及模型研究。京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖如圖7所示,比較京滬高速鐵路列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖和跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖可以看出,京滬高速鐵路列車(chē)晚點(diǎn)的異常值很大程度來(lái)源于京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)。晚點(diǎn)異常值的出現(xiàn)使得跨線(xiàn)列車(chē)晚點(diǎn)分布具有厚尾性,且跨線(xiàn)列車(chē)晚點(diǎn)樣本數(shù)據(jù)的峰度為43.15,標(biāo)準(zhǔn)正態(tài)分布的峰度等于3,43.15>3,表明跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布具有“尖峰厚尾”性??缇€(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)的厚尾性可使用Q-Q圖來(lái)檢驗(yàn)。當(dāng)被檢驗(yàn)的數(shù)據(jù)符合所參照的分布時(shí),Q-Q圖中各點(diǎn)近似一條直線(xiàn);若Q-Q圖的上端右偏離該直線(xiàn)(向下傾斜),則表示被檢驗(yàn)的樣本數(shù)據(jù)相對(duì)參照的分布來(lái)說(shuō)右尾具有厚尾性[22]。關(guān)于分布是否具有厚尾性一般都是與指數(shù)分布的尾部相比較而給予判斷[23]。參照指數(shù)分布,跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)數(shù)據(jù)的Q-Q圖如圖8所示,可以看出Q-Q圖的中部較接近直線(xiàn),但上端右偏離直線(xiàn),向下傾斜,表明其尾端比指數(shù)分布的尾端要厚,即跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)數(shù)據(jù)具有明顯的尖峰厚尾特點(diǎn)。 圖7 京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖 圖8 跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)數(shù)據(jù)Q-Q圖 基于跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)特征,結(jié)合超統(tǒng)計(jì)理論分析列車(chē)晚點(diǎn)機(jī)理建立了q-指數(shù)分布模型后,還需對(duì)模型的擬合優(yōu)度和精度進(jìn)一步檢驗(yàn)。 由京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)直方圖(圖7)的分布形狀及其分布特性檢驗(yàn)結(jié)果可以判斷出跨線(xiàn)列車(chē)的晚點(diǎn)分布曲線(xiàn)具有正偏態(tài)、尖峰厚尾的分布特征,即頻數(shù)分布的峰度較高且向左偏移,長(zhǎng)尾向右側(cè)延伸并存在冪律的漸近衰減。依據(jù)直方圖外輪廓曲線(xiàn)與總體的概率密度函數(shù)曲線(xiàn)接近的原理及概率統(tǒng)計(jì)相關(guān)理論可知,符合正偏態(tài)、尖峰厚尾分布規(guī)律的分布函數(shù)包括Weibull分布、Lognormal分布、Power分布等。對(duì)跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)進(jìn)行非線(xiàn)性回歸擬合,以擬合優(yōu)度R-square作為模型選擇的標(biāo)準(zhǔn),分別對(duì)q-指數(shù)分布、Power分布、Lognormal分布、Weibull分布及常用于建模普速鐵路列車(chē)晚點(diǎn)的指數(shù)分布等5個(gè)模型進(jìn)行對(duì)比,跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)擬合情況如圖9所示,圖中的藍(lán)色點(diǎn)為跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù),橫坐標(biāo)表示跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng),縱坐標(biāo)表示對(duì)應(yīng)晚點(diǎn)時(shí)長(zhǎng)的頻率,不同分布模型的擬合優(yōu)度數(shù)值結(jié)果見(jiàn)表1。 (a)q-指數(shù)分布模型擬合 (b)Power分布模型擬合 (c)Lognormal分布模型擬合 (d)Weibull分布模型擬合 (e)指數(shù)分布模型擬合 (f)5類(lèi)分布模型擬合圖9 非線(xiàn)性回歸擬合 曲線(xiàn)擬合的優(yōu)劣可以用誤差平方和、均方根誤差、擬合優(yōu)度R-square來(lái)衡量。誤差平方和、均方根誤差越小,越接近0,R-square越接近1,表明曲線(xiàn)擬合效果越好[24]。通過(guò)比較擬合優(yōu)度的數(shù)值結(jié)果發(fā)現(xiàn)q-指數(shù)模型、Power模型、Lognormal模型、Weibull模型、指數(shù)分布模型都有較大的R-square值,均具有較好的擬合優(yōu)度,其中q-指數(shù)分布模型的擬合優(yōu)度最佳。 表1 跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)非線(xiàn)性回歸擬合結(jié)果 在進(jìn)行跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)的非線(xiàn)性回歸擬合時(shí),以上5類(lèi)分布模型都具有較大的R-square值,雖然R-square值較大,但模型的精度是否可行還需通過(guò)假設(shè)檢驗(yàn)進(jìn)行判斷。常用的假設(shè)檢驗(yàn)方法有卡方檢驗(yàn)法和K-S檢驗(yàn)法。卡方檢驗(yàn)法是分區(qū)間來(lái)檢驗(yàn)經(jīng)驗(yàn)分布函數(shù)f(xi)與理論分布函數(shù)g(xi)之間的偏差,若采用卡方檢驗(yàn)法對(duì)跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)進(jìn)行檢驗(yàn),需將晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)進(jìn)行區(qū)間劃分,統(tǒng)計(jì)區(qū)間內(nèi)的實(shí)際頻數(shù)與理論頻數(shù),并將理論頻數(shù)不足5的區(qū)間進(jìn)行合并處理,整個(gè)檢驗(yàn)過(guò)程依賴(lài)區(qū)間劃分,且當(dāng)區(qū)間的實(shí)際頻數(shù)與理論頻數(shù)偏差較小時(shí),并不意味著單個(gè)樣本數(shù)據(jù)點(diǎn)的實(shí)際頻數(shù)與理論頻數(shù)偏差較小,即無(wú)法確定每個(gè)樣本數(shù)據(jù)點(diǎn)的精確的擬合情況。與卡方檢驗(yàn)法相比,K-S檢驗(yàn)法不是分區(qū)間來(lái)計(jì)算偏差,而是對(duì)每個(gè)樣本數(shù)據(jù)點(diǎn)都檢驗(yàn)經(jīng)驗(yàn)分布f(xi)與理論分布g(xi)之間的偏差,具有較高的精確性。因此,采用精確性較高的K-S檢驗(yàn)法對(duì)京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)。 K-S檢驗(yàn)法的全稱(chēng)是Kolmogorov-Smirnov檢驗(yàn)法,是一種非參數(shù)檢驗(yàn)方法。該檢驗(yàn)方法基于累積分布函數(shù),用以檢驗(yàn)一個(gè)經(jīng)驗(yàn)分布f(xi)與另一個(gè)理論分布g(xi)是否相同或兩個(gè)經(jīng)驗(yàn)分布是否相同。分別將q-指數(shù)模型、Power模型、Lognormal模型、Weibull模型、指數(shù)模型作為理論分布,采用K-S檢驗(yàn)確定模型的精度是否滿(mǎn)足要求。以跨線(xiàn)列車(chē)晚點(diǎn)樣本數(shù)據(jù)是否服從q-指數(shù)分布的K-S檢驗(yàn)為例,設(shè)原假設(shè)H0:跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)服從q-指數(shù)分布;備擇假設(shè)H1:跨線(xiàn)列車(chē)晚點(diǎn)數(shù)據(jù)不服從q-指數(shù)分布。 表2 模型的Kolmogorov-Smirnov檢驗(yàn)準(zhǔn)確度 由計(jì)算結(jié)果可知,q-指數(shù)分布模型、Power分布模型與經(jīng)驗(yàn)分布的最大偏差均小于K-S檢驗(yàn)的臨界值,因此接受原假設(shè),從理論上講,q-指數(shù)模型和Power模型都可以用來(lái)建??缇€(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)。但相比較Power分布模型,q-指數(shù)分布模型有較大的R-quare和較小的偏差。目前,隨著高速鐵路成網(wǎng)運(yùn)營(yíng)及高速線(xiàn)路客流的持續(xù)增長(zhǎng),我國(guó)部分高速鐵路通過(guò)能力已處于十分緊張的狀態(tài),在這種線(xiàn)路能力緊張的狀態(tài)下,列車(chē)晚點(diǎn)分布模型越精確,越有利于提高高速鐵路運(yùn)行質(zhì)量分析的精度,同時(shí)也有利于提高高速鐵路實(shí)際調(diào)度指揮及運(yùn)行圖鋪畫(huà)水平。因此,從跨線(xiàn)列車(chē)晚點(diǎn)分布模型的精確性及模型產(chǎn)生的機(jī)理角度綜合考慮,q-指數(shù)分布模型eq,b,c(t)=(1+b(1-q)t)1/(1-q)作為跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布模型較優(yōu)。 采用非線(xiàn)性最小二乘法來(lái)估計(jì)京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布模型中的參數(shù)q和b,得參數(shù)值q=1.191,b=-0.465 5。不同線(xiàn)路跨線(xiàn)列車(chē)晚點(diǎn)分布模型中的參數(shù)是有差異的,但參數(shù)確定的方法類(lèi)似。實(shí)際中也可通過(guò)對(duì)比q值大小反映列車(chē)運(yùn)行秩序的好壞,較小的q值表明列車(chē)運(yùn)行秩序較好。 基于京滬高速鐵路列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù),運(yùn)用超統(tǒng)計(jì)理論,建立基于超統(tǒng)計(jì)理論的跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布模型,得出如下結(jié)論: (1)當(dāng)研究對(duì)象是整條線(xiàn)路的跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)分布時(shí),可以將其分析定義為一個(gè)宏觀層系統(tǒng),該宏觀層系統(tǒng)包含若干個(gè)相對(duì)微觀的單元(車(chē)站)。對(duì)于單個(gè)車(chē)站,在較短時(shí)間尺度內(nèi),列車(chē)到達(dá)晚點(diǎn)服從含有車(chē)站環(huán)境參數(shù)β的負(fù)指數(shù)分布,將其定義為微觀平衡系統(tǒng);在較長(zhǎng)時(shí)間尺度下,車(chē)站環(huán)境是隨時(shí)間推移而不斷變化的,由于波動(dòng)的環(huán)境參數(shù)β的存在,長(zhǎng)時(shí)間尺度的單個(gè)車(chē)站的列車(chē)到達(dá)晚點(diǎn)分布為疊加統(tǒng)計(jì)變量分布模型。在空間維度上,不同車(chē)站環(huán)境各異,這些環(huán)境差異最終都反映在各個(gè)車(chē)站波動(dòng)的環(huán)境參數(shù)上。因此,當(dāng)研究對(duì)象是整條高速線(xiàn)的跨線(xiàn)列車(chē)到達(dá)晚點(diǎn)分布時(shí),第一層模型為描述微觀平衡系統(tǒng)的含有波動(dòng)參數(shù)β的負(fù)指數(shù)分布模型,第二層模型為描述空間和時(shí)間兩個(gè)維度波動(dòng)的環(huán)境參數(shù)β的概率分布,那么在長(zhǎng)時(shí)間尺度上,宏觀層跨線(xiàn)列車(chē)晚點(diǎn)分布模型為兩層模型的疊加。通過(guò)微觀的平衡系統(tǒng)和波動(dòng)參數(shù)兩層分布模型的疊加,得出整個(gè)復(fù)雜系統(tǒng)的q-指數(shù)分布模型。 (2)以京滬高速鐵路列車(chē)運(yùn)行實(shí)績(jī)數(shù)據(jù)為依據(jù),對(duì)跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)樣本數(shù)據(jù)進(jìn)行非線(xiàn)性回歸擬合,以擬合優(yōu)度值作為模型選擇的標(biāo)準(zhǔn),確定與京滬高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)樣本數(shù)據(jù)較擬合的分布模型。數(shù)據(jù)擬合結(jié)果表明q-指數(shù)分布、指數(shù)分布、Weibull分布、Power分布、對(duì)數(shù)正態(tài)分布等5個(gè)模型都具有較好的擬合性。進(jìn)一步使用擬合準(zhǔn)確度為D0.05水平下的K-S假設(shè)檢驗(yàn)法對(duì)具有較大擬合優(yōu)度值的q-指數(shù)分布模型、指數(shù)分布模型、Weibull分布模型、Power分布模型、對(duì)數(shù)正態(tài)分布模型的精度進(jìn)行檢驗(yàn)。將模型的K-S檢驗(yàn)結(jié)果結(jié)合目前高速鐵路對(duì)列車(chē)晚點(diǎn)分布模型精確性需求,確定出使用q-指數(shù)分布建模高速鐵路跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布。 本文使用超統(tǒng)計(jì)理論分析跨線(xiàn)列車(chē)晚點(diǎn)時(shí)長(zhǎng)分布規(guī)律,得到的跨線(xiàn)列車(chē)晚點(diǎn)分布模型不僅能夠較好地?cái)M合列車(chē)晚點(diǎn)數(shù)據(jù),且模型產(chǎn)生的機(jī)理能夠得到較好的解釋。3 數(shù)據(jù)分析
4 q-指數(shù)函數(shù)的擬合優(yōu)度與精度檢驗(yàn)
4.1 非線(xiàn)性回歸擬合
4.2 分布模型的K-S檢驗(yàn)
5 結(jié)論