譚力天,陳 昕,李澎東
(湖南中車時代通信信號有限公司,湖南 長沙 410005)
基于通信的列車運行控制系統(tǒng)(communication based train control, CBTC)主要包括列車自動駕駛(automatic train operation, ATO)、列車自動防護(automatic train protection, ATP)、區(qū)域控制器(zone controller, ZC)、聯(lián)鎖(computer interlocking, CI)、列車自動監(jiān)控(automatic train supervision, ATS)及數(shù)據(jù)通信系統(tǒng)(data communication system, DCS)等子系統(tǒng)[1-2]。在系統(tǒng)運行過程中,各子系統(tǒng)間數(shù)據(jù)實時交互,會產(chǎn)生大量的日志數(shù)據(jù)。由于子系統(tǒng)記錄日志數(shù)據(jù)具有專業(yè)性,使得數(shù)據(jù)分析成為一項繁重、復雜的專業(yè)工作。目前對運行數(shù)據(jù)的分析與CBTC 系統(tǒng)故障定位不僅嚴重依賴工作人員專業(yè)技能,同時只能被動地等待問題出現(xiàn)后以時間點去定位故障位置,處理問題效率低但對工作人員專業(yè)技能要求高。
目前,在故障診斷方面,故障診斷專家系統(tǒng)應用人類專家的知識和解決問題的方法,通過建立知識庫與推理機,實現(xiàn)確定性故障診斷[3],其被應用到ZPW2000A型無絕緣移頻閉塞設(shè)備的故障診斷,通過歸納常見故障類型及特征,實現(xiàn)專家系統(tǒng)功能模塊的構(gòu)建[4];小波分析和深度信念網(wǎng)絡(luò)概念被引入到列車牽引系統(tǒng)故障診斷之中,在離線機車記錄分析中發(fā)揮了作用[5];模糊Petri網(wǎng)絡(luò)模型與神經(jīng)網(wǎng)絡(luò)算法的結(jié)合應用,實現(xiàn)了故障診斷算法的動態(tài)自適應,提高了故障診斷的準確度[6];而統(tǒng)計學方法適用于大數(shù)據(jù)系統(tǒng),其基于多向保局投影[7]進行過程監(jiān)控故障診斷,利用統(tǒng)計學特性將過程監(jiān)控的故障數(shù)據(jù)投影到統(tǒng)計模型中,從而獲得故障特征[8]?;诮y(tǒng)計學的模型故障診斷方法主要包括貢獻圖法、結(jié)構(gòu)化殘差法、信號重構(gòu)法和模式分類法[9],其中模式分類法是通過統(tǒng)計方法獲得故障的表征模式,由于不同的故障在特性上通常具有相似性,通過建立故障信息庫,可以采用模式分類方法對故障進行分類。統(tǒng)計學馬爾可夫模型是以簡單的表述解決復雜的問題,自20 世紀80 年代開始被陸續(xù)成功地應用于語音識別、機器翻譯、拼寫糾錯、圖像處理和基因序列分析等多個領(lǐng)域[10-11]。文獻[3-4]中故障診斷專家系統(tǒng)需要搭建知識庫與推理機進行故障診斷,較統(tǒng)計學方法復雜;文獻[5-6]在實時故障診斷方面應用較統(tǒng)計學方法還不成熟;而統(tǒng)計學方法應用成熟可靠,其大數(shù)據(jù)特性適用范圍廣,并已經(jīng)在城市軌道交通領(lǐng)域列車自動監(jiān)控方面取得應用。為此,本文提出一種基于統(tǒng)計學模型的故障診斷方法,以實現(xiàn)對城軌CBTC 信號系統(tǒng)故障的快速、準確定位。
針對CBTC 系統(tǒng)故障,相應系統(tǒng)的運營或售后服務(wù)人員憑借自身的經(jīng)驗和知識,通過分析故障時間段內(nèi)日志數(shù)據(jù)來進行維護和故障分析。在實際維護過程中,各子系統(tǒng)間的配合和運營或售后人員的技術(shù)水平直接影響故障分析的效率和準確性,在很多情況下需要研發(fā)人員介入分析。運營或售后人員及研發(fā)人員需依靠培訓或?qū)W習來提高技術(shù)水平,易受到人員流動或成長周期等因素影響,成本較高、成效較慢。
CBTC 系統(tǒng)是地鐵運營中的“大腦”,需各子系統(tǒng)密切聯(lián)系、相互協(xié)作,使得故障現(xiàn)象表征子系統(tǒng)和實際故障子系統(tǒng)可能不一致,單獨分析子系統(tǒng)不能及時定位故障,需要多個子系統(tǒng)專業(yè)人員的相互配合,效率低,通用性不強。
在CBTC 系統(tǒng)運行過程中產(chǎn)生的大量日志數(shù)據(jù)只有在系統(tǒng)故障時才會用來進行分析,系統(tǒng)正常運行過程中大量數(shù)據(jù)被保存但未被充分利用,造成數(shù)據(jù)的“浪費”,而采用統(tǒng)計學模型對日常數(shù)據(jù)進行分析處理,利用數(shù)據(jù)特性建立對應模型,通用性較強,適用范圍較廣,不僅可以快速定位系統(tǒng)故障,還可以提供一定的故障預警。
CBTC 系統(tǒng)是由多個子系統(tǒng)構(gòu)成的復雜系統(tǒng),子系統(tǒng)間相互協(xié)作,保障列車正常運行。CBTC 系統(tǒng)故障的原因較為復雜和多樣,各子系統(tǒng)都具有相應的日志記錄作為故障分析的基礎(chǔ)。CBTC 系統(tǒng)各子系統(tǒng)關(guān)聯(lián)關(guān)系如圖1 所示。
圖1 CBTC 子系統(tǒng)間關(guān)聯(lián)關(guān)系Fig. 1 Subsystem association of the CBTC system
DCS 提供圖1 中各子系統(tǒng)設(shè)備間安全、可靠的數(shù)據(jù)交互。列車運行速度控制級別由低到高分別為聯(lián)鎖控制級別(IXLC)、點式列車控制級別(ITC)和連續(xù)列車控制級別(CTC),其中CTC 級別下列車運行效率最高,是正常運營過程中最常用的級別。ZC 是在CTC級別下的核心設(shè)備,本文以ZC 為例進行故障分類分析。
為快速定位故障原因,對所有涉及ZC 并在ZC 中有異?,F(xiàn)象的故障進行分類,并利用統(tǒng)計學進行建模。基于現(xiàn)場,涉及ZC 的關(guān)聯(lián)故障主要有:(1)列車與ZC 通信故障,ZC 表現(xiàn)為將該車置為安全態(tài);(2)CI與ZC 通信故障,ZC 表現(xiàn)為將該CI 涉及軌旁設(shè)備置為安全態(tài);(3)相鄰ZC 與ZC 通信故障,ZC 表現(xiàn)為將該相鄰ZC 涉及并與本ZC 相關(guān)聯(lián)的軌旁設(shè)備置為安全態(tài);(4)軌旁設(shè)備故障,ZC 表現(xiàn)為將該軌旁設(shè)備涉及移動授權(quán)計算按安全態(tài)處理;(5)列車升級CTC相關(guān)設(shè)備故障,ZC 表現(xiàn)為該列車始終無法升級為CTC級別;(6)列車運行異常,ZC 表現(xiàn)為將該列車置為安全態(tài);(7)ZC 軟件故障,ZC 表現(xiàn)為涉及范圍內(nèi)的列車非正常置為安全態(tài);(8)ZC 硬件故障,ZC 表現(xiàn)為設(shè)備狀態(tài)置為安全態(tài)。
統(tǒng)計學模型依賴于所采用的樣本數(shù)據(jù),樣本數(shù)據(jù)越全面、充分,對應的模型越準確。針對地鐵運營的特性,隨著其運營里程的增長,設(shè)備故障數(shù)據(jù)樣本逐漸增多,其可用性和全面性也越佳,則越有利于提高統(tǒng)計學模型的性能。
假定某一故障出現(xiàn)的概率為一條件概率值P(S),認為該故障受w1, w2, …, wn共n 個不同事件共同影響,則該故障出現(xiàn)的概率P(w1, w2,…, wn)按照條件概率公式展開后為
其中,P(w1)表示第一個事件發(fā)生的概率;P(w2|w1) 表示在已知第一個事件發(fā)生的條件下,第二個事件發(fā)生的概率;以此類推,P(wn|w1, w2,…, wn-1)表示在已知前n-1 個事件的發(fā)生條件下,第n 個事件發(fā)生的概率。
實際應用時,到第三個事件,其條件概率P(w3|w1, w2)的計算就已較為復雜并且會花費較多資源。為了解決這種不利局面,馬爾可夫提出了相應的簡化模型,即針對復雜的條件概率問題,假設(shè)任意事件wi(i=1, 2, …, n)的條件概率只同其前一個事件wi-1有關(guān),于是P(S)可以表示為
式(2)為統(tǒng)計學二元模型??紤]到時間和空間的資源消耗與模型精確性間的平衡,本文采用二元模型。
在ZC 關(guān)聯(lián)故障分析中,只考慮當故障前提條件發(fā)生時故障概率的統(tǒng)計,即ZC 關(guān)聯(lián)故障分類與實際故障原因之間的概率統(tǒng)計關(guān)系。
根據(jù)大數(shù)定理,以采樣數(shù)據(jù)觀察結(jié)果作為統(tǒng)計學概率計算基礎(chǔ)。由于統(tǒng)計觀察結(jié)果存在局限性,那么有這樣一種可能性,即在觀察結(jié)果中雖未出現(xiàn)某一故障,但是從概率角度不能認為這種情況不會發(fā)生。首先,采用古德-圖靈方法對出現(xiàn)次數(shù)非常少(少于經(jīng)驗閾值)的條件事件減小條件概率,經(jīng)過上述處理后的概率稱之為相對頻度;其次,為了保證所有條件概率之和為1,同時為了避免在統(tǒng)計過程中出現(xiàn)未發(fā)生故障的概率為0 的情況,需保證訓練用數(shù)據(jù)樣本的全面性和充分性,并為統(tǒng)計沒有出現(xiàn)的事件進行條件概率分配,即補償相對頻度??ù耐吮芊ㄊ且环N概率平滑方法,模型訓練時采用該方法處理零概率問題,并采用概率擬合的方式對統(tǒng)計學概率進行連續(xù)平滑,具體處理表示為
式中:wi-1——故障原因;wi——故障現(xiàn)象;f()——統(tǒng)計學相對頻度;fg()——統(tǒng)計學采用古德-圖靈估計后的相對頻度;Q(wi-1)——估計補償相對頻度;N——統(tǒng)計學頻次;T—相應閾值,統(tǒng)計頻次不小于閾值,則認為概率估計與相對頻度一致。
訓練過程如下:
(1)數(shù)據(jù)預處理。首先明確選用數(shù)據(jù)的可靠性和有效性,而后以隨機抽樣的方法選擇數(shù)據(jù)樣本。
(2)訓練參數(shù)調(diào)整。為保證訓練結(jié)果符合上文概率要求,適當選擇式(3)中的T 值(經(jīng)驗值一般在8~10 之間,可根據(jù)實際情況做調(diào)整),保證概率估計曲線平滑。
本文以ZC 關(guān)聯(lián)故障為例建立故障診斷統(tǒng)計學模型,以故障時刻前后1 h 數(shù)據(jù)作為故障數(shù)據(jù)樣本,通過確定故障分類,構(gòu)建故障診斷系統(tǒng)的測試集,測試所有故障分類。對應ZC 關(guān)聯(lián)故障總結(jié):(1)w11為列車-ZC 通信故障,w12為列車安全態(tài);(2)w21為CI-ZC 通信故障,w22為該CI 涉及軌旁設(shè)備置為安全態(tài);(3)w31為相鄰ZC-ZC 通信故障,w32為該相鄰ZC 涉及與本ZC相關(guān)聯(lián)的軌旁設(shè)備置為安全態(tài);(4)w41為軌旁設(shè)備故障,w42為將該軌旁設(shè)備涉及移動授權(quán)計算按安全態(tài)處理;(5)w51為列車升級CTC 相關(guān)設(shè)備故障,w52為該列車無法升級為CTC 級別;(6)w61為列車運行異常,w62為將該列車置為安全態(tài);(7)w71為ZC 軟件故障,w72為涉及ZC 范圍內(nèi)的列車非正常置為安全態(tài);(8)w81為ZC 硬件故障,w82為設(shè)備狀態(tài)置為安全態(tài)。
本文采集數(shù)據(jù)樣本隨機選取調(diào)試運行階段ZC 系統(tǒng)一個月內(nèi)的運行數(shù)據(jù),在所有樣本中隨機選擇800 組作為訓練數(shù)據(jù)樣本,隨機選擇其中的75%為訓練數(shù)據(jù),25%為測試樣本驗證訓練結(jié)果,盡可能完整地包括了本文所定義的所有ZC 關(guān)聯(lián)故障類型。用古德-圖靈方法對ZC 硬件故障統(tǒng)計概率為0 的事件進行了處理,利用卡茨退避法獲得ZC 關(guān)聯(lián)故障的數(shù)據(jù)統(tǒng)計概率(圖2)。圖中通過概率平滑處理曲線擬合,縱坐標為相對頻次,表示故障統(tǒng)計的概率擬合;橫坐標為故障分類。
圖2 故障概率分布擬合曲線Fig. 2 Fitting curve of fault probability distribution
在長沙軌道交通4 號線調(diào)試運行階段對本文方法進行驗證應用,通過對8 類ZC 關(guān)聯(lián)故障進行測試,201 組故障診斷測試結(jié)果如表1 所示。通過驗證,可以看到其中列車-ZC 通信故障、CI-ZC 通信故障、相鄰ZC-ZC 通信故障和ZC 硬件故障的分類診斷準確率均為100%,統(tǒng)計學方法模型對通信類故障、硬件類故障識別率最高;而對列車運行異常和ZC 軟件故障的分類診斷準確率較低,其中ZC 軟件故障診斷準確率最低只有84.21%,由于ZC 軟件故障在故障總體分布中所占比例較低,導致部分該類故障易被誤判,本驗證應用給調(diào)試運行提供了有效數(shù)據(jù)支撐和判斷依據(jù)??梢娀诮y(tǒng)計學的故障診斷模型可以較好地定位故障,有利于提高調(diào)試或維護人員的工作效率。
表1 ZC 關(guān)聯(lián)故障分類測試結(jié)果Tab. 1 Test results of ZC associated fault classification
本文提出了一種基于統(tǒng)計學模型的故障診斷方法,并以ZC 關(guān)聯(lián)故障為例,通過統(tǒng)計學方法提取故障樣本數(shù)據(jù),建立并訓練故障診斷模型。在長沙軌道交通4 號線調(diào)試運行階段的驗證應用表明,該故障診斷模型可以用于CBTC 系統(tǒng)故障診斷快速定位。在智慧城市建設(shè)中,城市軌道交通的智能化運維是一種趨勢。在提高故障診斷的準確性、快速性、實時性和適用范圍,實現(xiàn)系統(tǒng)高度集成、大數(shù)據(jù)分析、調(diào)度綜合統(tǒng)籌等方面,統(tǒng)計學方法是未來維護智能化的有效手段。同時,對于在統(tǒng)計學中分布概率值在總體分布中占比較低的分類,其故障診斷正確率較低的問題,下一步可以在本文所提方法的基礎(chǔ)上應用模式識別法來提高故障診斷正確率。