呂五一 劉仍奎 張秋艷 吳霞
(1.北京交通大學交通運輸學院,北京 100044;2.中國鐵道科學研究院集團有限公司電子計算技術研究所,北京 100081)
軌道幾何狀態(tài)是反映軌道質量的重要指標。軌道幾何形位偏差過大會引起軌道不平順,從而影響行車安全、行車速度和乘坐舒適性[1]。現(xiàn)階段軌道交通運營企業(yè)對于軌道幾何狀態(tài)的管理比較粗放,維修管理模式主要以周期修、故障修為主[2]。通過科學的手段掌握軌道幾何狀態(tài),準確預測其狀態(tài)劣化趨勢,可為管理者優(yōu)化維修計劃提供更智慧的決策支持,實現(xiàn)維修模式向預防修、狀態(tài)修的轉變。
軌道整體不平順的評價方式為:采用軌檢車每兩個月對軌道的左右軌向、左右高低、水平、軌距和三角坑7 項軌道幾何參數(shù)進行檢測,計算每200 m 軌道單元的各單項軌道幾何參數(shù)的標準差之和,即軌道質量指數(shù)(Track Quality Index,TQI)[3]。TQI 值越大表明軌道整體越不平順,質量狀態(tài)越差。各軌道交通運營企業(yè)的企業(yè)規(guī)范規(guī)定了相應的TQI管理值。如果某軌道單元區(qū)段的TQI 值低于相應的管理值,說明該區(qū)段整體軌道質量狀態(tài)合格(TQI 合格),否則說明該區(qū)段整體軌道質量狀態(tài)失格(TQI失格)。
目前,國內外對于軌道幾何狀態(tài)預測的研究主要可分為三大類,分別為機理類模型、統(tǒng)計方法類模型和機器學習類模型。
機理類模型主要是在軌道動力學等理論的基礎上,通過室內模擬仿真試驗研究車輛與軌道之間的作用關系來預測軌道幾何狀態(tài)。文獻[4]建立了具有二系懸掛的車輛-軌道耦合動力學模型并與軌道下沉變形相聯(lián)系,利用計算機仿真技術研究移動車輛荷載下軌道的累積下沉量和軌道狀態(tài)變化來預測軌道不平順的發(fā)展趨勢。
統(tǒng)計方法類模型又可分為隨機性統(tǒng)計模型和確定性統(tǒng)計模型。隨機性統(tǒng)計模型將軌道幾何狀態(tài)劣化視為一個隨機過程,通?;谲壍缼缀螤顟B(tài)歷史檢測數(shù)據(jù)利用概率性方法構建軌道狀態(tài)劣化預測模型。文獻[5]考慮了影響軌道幾何劣化的因素在軌道全生命周期內的不確定性,建立預測軌道幾何劣化的貝葉斯模型。確定性統(tǒng)計模型通常利用回歸分析等方法,基于軌道狀態(tài)歷史檢測數(shù)據(jù)建立軌道狀態(tài)與其影響因素之間的函數(shù)關系來預測軌道幾何狀態(tài)。文獻[6]構建了軌道不平順短期狀態(tài)預測模型(TI-SRPM),對軌道單元區(qū)段相鄰兩次維修周期之間的未來一個軌檢車檢測周期內的各項軌道幾何形位要素的每日峰值進行了預測。
隨著大數(shù)據(jù)技術的發(fā)展,機器學習類模型被引入軌道交通基礎設施管理研究領域。文獻[7]利用主成分分析法分析了影響軌道幾何狀態(tài)的關鍵因素,并利用支持向量機(Support Vector Machine,SVM)、線性判別分析、隨機森林等機器學習方法對軌道幾何病害進行了預測。文獻[8]利用人工神經(jīng)網(wǎng)絡和支持向量回歸預測了直線和曲線上的軌距偏差值。
上述模型各有優(yōu)缺點和獨特的適用場景,由于影響軌道幾何劣化的異質性因素較多,難以保證模型的普遍適用性。本文首先從概率分布方法、回歸分析方法、機器學習分類方法三個不同的角度,分別利用Gamma 過程、二項logistic 回歸、支持向量機構建三個TQI預測模型,然后利用Stacking集成學習算法將這三個模型進行組合,形成新的TQI預測集成模型。
以200 m 軌道單元為研究對象,利用多次歷史TQI 檢測數(shù)據(jù),預測其TQI 值是否會在下一次檢測前劣化為失格狀態(tài)。
集成學習的基本原理是構建并結合多個個體學習器來完成指定的學習任務。與單個學習器相比,集成學習器通常有更好的預測性能和泛化性能,即適用于新樣本的能力。集成學習器預測效果的好壞取決于每個個體學習器的準確性和多樣性。準確性是指個體學習器的預測精度。多樣性是指各個體學習器之間應該存在一定的差異,即好而不同,從而實現(xiàn)不同個體學習器的強強聯(lián)合及優(yōu)勢互補[9]。因此在構建集成模型時,選擇概率分布方法、回歸分析方法和機器學習分類方法來構建預測軌道區(qū)段不平順質量狀態(tài)的個體學習器,選擇Stacking 集成學習法進行集成。Stacking 算法是Wolpert于1992年提出的一種集成學習算法[10]。不同于Boosting和Bagging等采用相同分類算法訓練出單個學習器的集成學習算法,Stacking算法通過結合多種不同學習算法以保證個體學習器的多樣性,往往具有更高的預測精度和更低的過擬合風險[11]。
模型整體結構如圖1所示。
圖1 模型整體結構
為研究TQI 隨時間的劣化程度,用變量ηT表示軌道單元區(qū)段檢測時刻T時的TQI 合格或失格,變量ηT+1表示軌道單元區(qū)段檢測時刻T+ 1 時的TQI 合格或失格,并根據(jù)軌道單元區(qū)段連續(xù)兩次檢測的TQI 值定義變量Y。ηT和Y的取值分別為
本文只考慮當前TQI 處于合格狀態(tài)的某特定200 m 軌道區(qū)段是否會在未來一個檢測周期內劣化為失格狀態(tài),Y=2 和Y=3 的情況不在本文研究范圍內。因此,Y根據(jù)下一次檢測時TQI合格或失格取值,即
處于不同位置的軌道單元區(qū)段,即使承受相同的列車荷載,其軌道幾何狀態(tài)的劣化規(guī)律也各不相同[1]。這是由于軌道幾何狀態(tài)的劣化受到眾多因素的影響,包括軌道所在線路的地質類型、平縱斷面、最大允許速度以及軌道的通過總重、軌道部件的規(guī)格型號等。以往的研究一般考慮異質性因素較少,例如只考慮通過總重等。本文為發(fā)揮機器學習處理高維數(shù)據(jù)的優(yōu)勢,在建模時充分考慮異質性因素的影響,選取曲線半徑、最大坡度、道床類型、鋼軌類型和是否處于加減速區(qū)段5種具有代表性的異質性因素作為軌道區(qū)段的特征屬性,提高軌道幾何劣化規(guī)律建模的準確性。
對于某200 m 軌道單元,設置模型構建所需的變量。
①X1:相鄰兩次TQI檢測值的差。
②X2:當前TQI檢測值與管理值的差。
③X3:軌道單元內最小曲線半徑R的變換值。對于小半徑曲線,即R≤800 m 時,取X3= 1-R/800;當R>800 m時,取X3=0。
④X4:軌道單元內最大坡度G的變換值。X4=G/Gmax,Gmax為所有軌道區(qū)段中最大坡度值。
⑤X5:道床類型。對于整體道床,X5=1;對于碎石道床,X5=0。
⑥X6:判斷鋼軌是否為50 kg/m 鋼軌,若是,則X6=1,否則X6=0。
⑦X7:判斷鋼軌是否為60 kg/m 鋼軌,若是,則X7=1,否則X7=0。
⑧X8:判斷軌道單元是否處于臨近車站的加減速區(qū)段,若是,則X8=1,否則X8=0。
自1975年被引入可靠性研究領域以來,Gamma過程經(jīng)常被用于描述嚴格單調的隨機劣化過程,如磨損、疲勞、腐蝕等[12]。在本模型中,模型的輸入變量為某200 m 軌道單元當前TQI 值與管理值的差X2,輸出為下一次檢測時失格(Y=1)的概率。
假設相鄰兩次TQI 檢測值的差X1服從形狀參數(shù)v>0且尺度參數(shù)u>0的Gamma過程{ }X1(t),t≥0 ,t為TQI累積劣化時間,則其概率密度函數(shù)為
Gamma 過程{X1(t),t≥0} 的均值和方差分別為E(X1) =v/u,V(X1) =v2/u。利用極大似然估計方法對參數(shù)v和u進行求解。假設X1的歷史檢測數(shù)據(jù)為x1k,k= 1,2,...,n,其似然函數(shù)Ln為
v和u的極大似然估計值由lnLn和lnLn解出。由此可以計算出當前狀態(tài)為合格的某特定200 m軌道區(qū)段的TQI 在下一次檢測時達到失格狀態(tài)的概率P(Y= 1 ),即
式中:FX1為Gamma過程的分布函數(shù)。
為構建集成模型,假設P(Y= 1)>0.5時,Y=1。
二項logistic 回歸模型屬于概率型回歸,作為廣義線性回歸模型的一類,主要用于描述和推斷二分類因變量與一組解釋變量的關系,在許多科研領域已得到非常廣泛的應用[9]。利用二項logistic 回歸輸出0/1 值的特性構建logistic回歸模型。模型輸入為某200 m軌道單元的特征變量X2,X3,...,X8,輸出為下一次檢測時TQI合格或失格(Y)。模型表達式為
式中:β0為常數(shù)項;β2,β3,...,β8依次為變量X2,X3,...,X8的回歸系數(shù)。
與Gamma 過程類似,利用TQI 歷史檢測數(shù)據(jù)采用極大似然估計法對logistic回歸模型的參數(shù)進行估計。
支持向量機是在結構風險最小化原則和統(tǒng)計學習理論基礎上提出的一種應用較為廣泛的機器學習分類算法[9]。SVM的核心是要尋找最優(yōu)的劃分超平面(ω,b),ω為劃分超平面的法向量,決定了超平面的方向;b為位移項,決定了劃分超平面與原點之間的距離,使得樣本空間中距離超平面最近的訓練樣本到超平面的距離最大。當訓練樣本線性不可分時,SVM 可利用核函數(shù)將樣本特征從原始空間映射到高維空間,使得樣本在高維特征空間內線性可分,本文核函數(shù)采用徑向基函數(shù)。為了有效避免過擬合,采用軟間隔支持向量機模型以允許某些樣本不滿足約束。
模型的約束條件為
式中:xi為第i個樣本的特征向量,xi=(X2,X3,...,X8);Yi為第i個樣本的標簽
通過對訓練樣本進行學習,求解得出ω和b,而后輸入X2,X3,...,X8,即可得到模型輸出Y。
Stacking 集成學習算法是一種常用的通過某個個體學習器來結合其余個體學習器的集成學習方法。被結合的個體學習器稱為初級學習器,用于結合的個體學習器稱為次級學習器。
Stacking 集成方法的基本原理是先利用初級學習算法和初始數(shù)據(jù)集訓練出初級學習器,然后利用次級學習算法和初級學習器產生的新數(shù)據(jù)集來訓練次級學習器。將初級學習器的輸出作為新數(shù)據(jù)集中樣例的輸入特征,初始樣本的標記仍然作為樣例標記[9]。Stacking算法的偽代碼參見文獻[9]。
本文將Gamma 過程和SVM 作為初級學習算法,將二項logistic 回歸作為次級學習算法,構建基于Stacking 的軌道幾何狀態(tài)短期預測集成模型。模型結構如圖2所示。
圖2 Stacking集成學習模型結構
選取北京地鐵1號線實測數(shù)據(jù),對Stacking集成學習模型進行訓練與測試。
北京地鐵1號線上下行各31.04 km,共分為310個200 m 軌道單元區(qū)段。采集從2016年10月21日至2019年4月19日間的16 次TQI 檢測數(shù)據(jù)和相應的線路設備數(shù)據(jù),結合QB(J)BDY(A)XL003—2015《工務維修規(guī)則》規(guī)定的TQI 管理值(表1)對數(shù)據(jù)進行預處理,并剔除維修擾動的影響,得到4672 個樣本。采用分層隨機抽樣,按照3∶1 的比例將樣本劃分成訓練集和測試集。訓練集包括3504 個樣本,測試集包括1168個樣本。
表1 軌道質量指數(shù)(TQI)管理值
模型的求解主要利用Python3.0 中的scikit-learn包來完成。選擇分類正確率和接受者操作特性(Receiver Operating Characteristic curve,ROC)曲線下方的面積大小AUC 值(Area Under Curve)作為模型的評價指標。分類正確率表示被正確預測類別的樣本數(shù)占樣本總數(shù)的比例,體現(xiàn)模型整體的分類精度。AUC 值通常被用來判斷二分類器的好壞,通過計算模型ROC 曲線下的面積得到。AUC 值綜合體現(xiàn)出了模型的正例分類精度和反例分類精度,其取值一般在0.5 ~1,越接近1 說明學習器的分類效果越好[13]。利用訓練集樣本對所建立的模型進行訓練學習,并對測試集樣本進行預測,而后與實際歷史數(shù)據(jù)進行對比,計算出模型預測結果的分類正確率和AUC 值。各模型的預測結果見表2。
表2 不同模型預測結果
從表2可以看出,Stacking集成模型的分類正確率和AUC值較其他模型均有顯著提升。說明Stacking集成模型能夠更加準確地預測TQI 變化趨勢,同時具有更優(yōu)的泛化性能。Stacking 集成模型能夠較好地對短期的軌道幾何狀態(tài)進行預測,可以有效地輔助管理者針對安全風險高的軌道區(qū)段提前采取維修措施,從而保障軌道交通的安全平穩(wěn)運行,為管理者更好地掌握軌道質量狀態(tài)提供了一種新的思路。
本文從概率分布方法、回歸分析方法和機器學習分類方法三個不同的角度構建了三個TQI 預測模型,利用Stacking 集成學習技術將三個單一模型進行組合,形成了新的TQI 預測集成模型。在模型的建立過程中選擇了多種影響軌道交通TQI 劣化的異質性因素,以提高建模的科學性。
利用北京地鐵1號線的實測數(shù)據(jù)對所建模型進行訓練和測試,通過對比不同模型的分類正確率和AUC值,驗證了本文建立的模型有效且具有較高的預測精度。
在未來的研究中將進一步研究利用該模型預測軌道局部不平順問題以及使該模型與維修優(yōu)化模型結合,為軌道的維修養(yǎng)護提供科學依據(jù)。