向清河 黃 鋮 朱東飛
(1.武漢地鐵集團(tuán)有限公司, 430030, 武漢; 2.株洲中車時代電氣股份有限公司, 412001, 株洲∥第一作者, 正高級工程師)
地鐵列車的車載數(shù)據(jù)處理系統(tǒng)主要包括牽引、網(wǎng)絡(luò)、制動、門控、輔助、空調(diào)、信號、PIS(乘客信息系統(tǒng))等子系統(tǒng)。部分車載子系統(tǒng)的信息僅能在司機室實時顯示,列車狀態(tài)與故障無法實時傳輸?shù)降孛妫y以精準(zhǔn)掌控列車在途狀態(tài);記錄數(shù)據(jù)依賴回庫人工下載,缺乏自動高效的下載手段;故障診斷專業(yè)性強、軟件繁雜獨立,無法實現(xiàn)故障的關(guān)聯(lián)分析,疑難雜癥判定時間冗長;列車故障大多數(shù)采取事后處理,造成的損失已無法挽回,嚴(yán)重者還可能造成不良社會影響(如清客、救援等);對車輛設(shè)備或部件的狀態(tài)難以準(zhǔn)確評估,維修方式大多數(shù)采用計劃修,而針對列車全生命周期的維護(hù)成本則居高不下;針對地鐵列車運營管理決策缺乏足夠的數(shù)據(jù)與分析結(jié)果支撐。
基于上述地鐵車輛的運營現(xiàn)狀,針對武漢地鐵,構(gòu)建列車信息聯(lián)控平臺。該平臺應(yīng)包含以下基本功能:
1) 車地?zé)o線通信:采集車載數(shù)據(jù),并將其實時傳輸至地面系統(tǒng)。
2) 大數(shù)據(jù)集群服務(wù):接入和解析車載數(shù)據(jù),數(shù)據(jù)存儲與查詢,數(shù)據(jù)挖掘。
3) 實時監(jiān)視:線路級、車輛級及子系統(tǒng)級狀態(tài)監(jiān)視,實時故障報警,故障環(huán)境數(shù)據(jù)回傳。
4) 故障診斷:快速定位故障原因,給出故障處置措施。
5) 健康管理:列車健康評估、列車部件剩余使用壽命的預(yù)測,故障預(yù)警,數(shù)據(jù)回溯分析。
地鐵列車信息聯(lián)控平臺包括車載系統(tǒng)和地面系統(tǒng)兩大部分[1]。車載數(shù)據(jù)通過車地?zé)o線通信通道,實現(xiàn)從車載系統(tǒng)到地面系統(tǒng)的傳輸。平臺總體結(jié)構(gòu)如圖1所示。
注:ATO為列車自動運行;ATP為列車自動防護(hù);HVAC為空調(diào)系統(tǒng);EDCU為電子門控單元。
該平臺中,車載數(shù)據(jù)處理裝置通過信息服務(wù)網(wǎng)或其他擴展接口采集車輛關(guān)鍵系統(tǒng)和設(shè)備的數(shù)據(jù),并對其進(jìn)行整理、解析及存儲,同時提供整車統(tǒng)一維護(hù)端口,應(yīng)用4G(第4代移動通信技術(shù))/WLAN(無線局域網(wǎng))等無線通信技術(shù),構(gòu)建車地實時傳輸系統(tǒng),實現(xiàn)全息化列車狀態(tài)的動態(tài)跟蹤監(jiān)控,支撐地面系統(tǒng)的智能化應(yīng)用;大數(shù)據(jù)集群負(fù)責(zé)接入、解析及存儲車載實時數(shù)據(jù)和記錄數(shù)據(jù),并集成數(shù)據(jù)挖掘功能,為智能應(yīng)用終端提供服務(wù);智能應(yīng)用終端提供針對列車的實時狀態(tài)監(jiān)視、故障診斷、車輛健康管理等智能化應(yīng)用功能。
為了使車輛運營人員掌握更多、更準(zhǔn)確的實時車載信息,提高運營管理效率,車載數(shù)據(jù)采集覆蓋了牽引、制動、輔助、車門、旅客信息、空調(diào)、網(wǎng)絡(luò)、走行等多個子系統(tǒng),實現(xiàn)車輛數(shù)據(jù)的融合和處理;以數(shù)據(jù)為基礎(chǔ),結(jié)合整車邏輯,對數(shù)據(jù)進(jìn)行預(yù)處理,實現(xiàn)對故障的識別和預(yù)警。
另外,數(shù)據(jù)形式包括實時數(shù)據(jù)與離線文件數(shù)據(jù),實時數(shù)據(jù)又包含實時狀態(tài)數(shù)據(jù)與實時故障數(shù)據(jù)。因此,在車地數(shù)據(jù)傳輸通道層面,實時數(shù)據(jù)和關(guān)鍵性數(shù)據(jù)通過4G與地面交互,且這些數(shù)據(jù)通過安全生產(chǎn)網(wǎng)進(jìn)行傳輸,記錄文件數(shù)據(jù)通過庫內(nèi)通道與地面交互。車地?zé)o線通信總體設(shè)計如圖2所示。
圖2 車地?zé)o線通信總體設(shè)計Fig.2 Overall design of vehicle-wayside wireless communication
在車地?zé)o線通信傳輸策略方面,針對實時狀態(tài)數(shù)據(jù), 采用 UDP(用戶數(shù)據(jù)包協(xié)議)固定周期向地面系統(tǒng)發(fā)送列車狀態(tài)報文,其中車載部分為客戶端,地面部分為服務(wù)器。針對故障報警數(shù)據(jù),同樣采用 UDP向地面系統(tǒng)發(fā)送故障報警報文。當(dāng)故障狀態(tài)發(fā)生變化時,車載部分立即將故障代碼信息發(fā)送到地面數(shù)據(jù)服務(wù)器,按重發(fā)固定次數(shù)來執(zhí)行,每次間隔固定時間,確保地面系統(tǒng)及時獲取故障信息。
2.3.1 地面系統(tǒng)技術(shù)架構(gòu)的設(shè)計原則
武漢地鐵列車信息聯(lián)控平臺的設(shè)計出發(fā)點是針對城市軌道交通的大容量、高速率及多種類的大數(shù)據(jù)進(jìn)行實時和批處理分析,通過分析及診斷結(jié)果,結(jié)合領(lǐng)先的數(shù)據(jù)可視化方案,為日常城市軌道交通車輛的運維提供實時狀態(tài)監(jiān)視、故障診斷、故障預(yù)警及車輛健康評估等實用功能。因此,本系統(tǒng)最大的特征是一個針對不同類型使用者的大數(shù)據(jù)處理、分析及展示的信息聯(lián)控系統(tǒng),且高性能與高可靠性是整個系統(tǒng)設(shè)計中需要著重關(guān)注與解決的方面?;谏鲜龇治?,本系統(tǒng)采用微服務(wù)架構(gòu)來實現(xiàn)[2]。微服務(wù)架構(gòu)是近年來被成功應(yīng)用到大型高并發(fā)系統(tǒng)的一種軟件系統(tǒng)架構(gòu),其特點如下:
1) 通過拆分服務(wù)的方式實現(xiàn)系統(tǒng)的組件化。 將傳統(tǒng)的單塊系統(tǒng)進(jìn)行拆分、解耦,形成一些細(xì)粒度的、可獨立演進(jìn)的組件。
2) 去除復(fù)雜的進(jìn)程通信機制,使用輕量級的通信方法(如REST(表征性狀態(tài)轉(zhuǎn)移)API(應(yīng)用程序編程接口)),業(yè)務(wù)邏輯由每個服務(wù)來處理。
3) 通過服務(wù)微小化,增強了系統(tǒng)的敏捷性;以及增加了新功能、應(yīng)對變化需求的能力。
4) 技術(shù)上,不同的微服務(wù)也可以采用不同的技術(shù)來實現(xiàn)??沙浞职l(fā)揮各種技術(shù)的優(yōu)勢,例如:Java是強類型面向?qū)ο笳Z言,有著很好的生態(tài)圈,適合開發(fā)整體的業(yè)務(wù)邏輯;python在數(shù)據(jù)分析、機器學(xué)習(xí)領(lǐng)域有著很好的應(yīng)用,適合開發(fā)預(yù)測性分析引擎服務(wù)等。
2.3.2 地面系統(tǒng)技術(shù)分層架構(gòu)設(shè)計
武漢地鐵列車信息聯(lián)控平臺的架構(gòu)有3層構(gòu)成:
1) 平臺層:使用容器技術(shù)來抽象隔離底層的硬件及操作系統(tǒng),使上層服務(wù)和中間件不需關(guān)注具體使用的硬件,只需指定每個服務(wù)所需的資源。通過容器編排平臺,進(jìn)一步簡化了資源的分配及調(diào)度,便于實現(xiàn)按需增減硬件資源。
2) 中間件層:提供上層應(yīng)用所需要的基礎(chǔ)服務(wù),如HDFS (大數(shù)據(jù)存儲引擎)、關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、分布式的數(shù)據(jù)流式及批處理引擎、消息隊列等。借助于平臺層的容器及編排系統(tǒng)做到自動部署,通過API,使得數(shù)據(jù)庫及消息隊列與其他應(yīng)用服務(wù)進(jìn)行交互。
3) 應(yīng)用服務(wù)層:實現(xiàn)整個系統(tǒng)的業(yè)務(wù)功能,采用微服務(wù)來拆分業(yè)務(wù),減少業(yè)務(wù)間的耦合度;每個微服務(wù)部署在單獨的容器內(nèi),可以獨立伸縮,滿足不同的業(yè)務(wù)量需求,具有很好的彈性。微服務(wù)可以自動注冊、自動發(fā)現(xiàn),可以負(fù)載均衡,也便于管理及監(jiān)控。
2.3.3 地面系統(tǒng)技術(shù)業(yè)務(wù)架構(gòu)設(shè)計
從業(yè)務(wù)功能角度來看,地面系統(tǒng)技術(shù)架構(gòu)(見圖3)包括:前端Web(萬維網(wǎng))應(yīng)用,后端微服務(wù)群,大數(shù)據(jù)處理分析平臺,數(shù)據(jù)接入與儲存服務(wù)。整個架構(gòu)以中央的各類微服務(wù)集群為中心,以大數(shù)據(jù)分析處理平臺為基礎(chǔ),共同完成整個系統(tǒng)的功能。
注:Docker為一個開源的、輕量級的容器引擎;HDFS為被設(shè)計成適合運行在通用硬件上的分布式文件系統(tǒng);MySQL為關(guān)系型數(shù)據(jù)庫管理系統(tǒng);Hbase為一個分布式的、面向列的開源數(shù)據(jù)庫;Oracle為甲骨文公司的一款關(guān)系數(shù)據(jù)庫管理系統(tǒng)。
微服務(wù)群是整個系統(tǒng)的核心,實現(xiàn)了系統(tǒng)的所有業(yè)務(wù)。每個業(yè)務(wù)實現(xiàn)成一個微服務(wù),以單實體或多實體的形式運行。單實例或多實例的使用取決于業(yè)務(wù)的負(fù)載,也可以根據(jù)負(fù)載的變化動態(tài)伸縮。邏輯上每個微服務(wù)都配有自身專用的數(shù)據(jù)庫,物理層面上可以將其部署到同一個數(shù)據(jù)庫系統(tǒng)中。
大數(shù)據(jù)分析及處理平臺為上層業(yè)務(wù)服務(wù)提供數(shù)據(jù)支撐,對基礎(chǔ)數(shù)據(jù)進(jìn)行存儲和分析,生成各種業(yè)務(wù)數(shù)據(jù)表供上層業(yè)務(wù)使用,以提高業(yè)務(wù)數(shù)據(jù)使用的效率和提升用戶體驗。
前端Web應(yīng)用獨立于后臺服務(wù),使用Angular框架來實現(xiàn)SPA(單頁應(yīng)用架構(gòu))。使用Angular作為前端Web應(yīng)用的底層框架,做到前端Web應(yīng)用充分的組件化,以層級方式來組織頁面組件,配合Angular的前端路由機制,能很好地滿足前端的可定制化頁面。
2.4.1 實時監(jiān)視模塊設(shè)計
實時監(jiān)視系統(tǒng)覆蓋了列車的各大系統(tǒng),包括牽引系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、制動系統(tǒng)、信號系統(tǒng)、輔助電源系統(tǒng)、門控系統(tǒng)、空調(diào)系統(tǒng)、乘客信息系統(tǒng)等,可實現(xiàn)遠(yuǎn)程狀態(tài)監(jiān)視、環(huán)境數(shù)據(jù)回傳等功能。
該模塊可實時監(jiān)測軌道交通線路上所有列車的總體情況:各列車基于地圖的位置分布,列車運行狀態(tài),列車健康狀態(tài),列車的基本信息。系統(tǒng)總覽界面顯示單線路在線/離線列車統(tǒng)計、各列車故障統(tǒng)計、列車可用率、運行里程統(tǒng)計、載客人流統(tǒng)計及能耗統(tǒng)計等。
該模塊可實時監(jiān)測單臺車所有狀態(tài),查看當(dāng)前列車位置、當(dāng)日運行里程統(tǒng)計/總里程統(tǒng)計、速度、網(wǎng)壓等關(guān)鍵實時數(shù)據(jù)的波形曲線,各子系統(tǒng)當(dāng)前的健康狀態(tài),整車實時健康狀態(tài),以及當(dāng)前列車故障報警、預(yù)警等。并在地面同步車載司機屏,實現(xiàn)車載監(jiān)視與地面監(jiān)視數(shù)據(jù)同步,有助于地面人員實時掌握列車運行工況以及司機的操作情況。
2.4.2 故障診斷模塊設(shè)計
列車運行故障的誘發(fā)原因較為復(fù)雜,同時會產(chǎn)生大量的伴生故障與次生故障,導(dǎo)致故障癥狀錯綜復(fù)雜,且根據(jù)人工經(jīng)驗難以確認(rèn)真實的故障原因。
本系統(tǒng)基于電氣原理,結(jié)合專家規(guī)則與故障診斷邏輯,對故障發(fā)生時的伴生現(xiàn)象及相關(guān)信號量進(jìn)行深入分析,以建立每一類故障的診斷模型。
收集大量的現(xiàn)場數(shù)據(jù),通過挖掘算法提取各個故障的關(guān)鍵特征量,結(jié)合故障模型生成故障波形,通過大數(shù)據(jù)訓(xùn)練得到故障的診斷算法。
建立專家知識庫,存儲歷史故障的解決方案。梳理了TCMS(列車控制與管理系統(tǒng)),以及牽引系統(tǒng)、輔助變流系統(tǒng)、充電機等主要部件全部故障的故障樹、故障處理措施及故障關(guān)聯(lián)變量等。
在該系統(tǒng)中以故障樹的形式展示故障原因及處置意見,并在列車原理圖中標(biāo)注故障發(fā)生位置,以提高故障處理效率。用戶處置故障后,系統(tǒng)可根據(jù)用戶的處置情況對模型和算法進(jìn)行自適應(yīng)調(diào)整,使其在使用過程中日益趨近真實。具體流程如圖4所示。
圖4 故障診斷模塊設(shè)計流程Fig.4 Design process of fault diagnosis module
2.4.3 健康管理模塊設(shè)計
對列車當(dāng)前運行里程、使用年限、運行趟次及各接觸器開關(guān)閉合次數(shù)等設(shè)計參數(shù)進(jìn)行統(tǒng)計匯總,并與行業(yè)規(guī)范制定的設(shè)計壽命進(jìn)行對比,對達(dá)到臨界值的參數(shù)進(jìn)行標(biāo)注提醒。
依托大數(shù)據(jù)技術(shù),對設(shè)備的歷史運行狀態(tài)及故障數(shù)據(jù)進(jìn)行挖掘,建立設(shè)備的故障預(yù)警模型,實現(xiàn)設(shè)備狀態(tài)的實時預(yù)警。
建立列車各個子系統(tǒng)/部件的健康模型,設(shè)計健康評估算法。根據(jù)故障嚴(yán)重程度等級,對車輛運營影響、故障擴散范圍及故障發(fā)生次數(shù)等因素進(jìn)行扣分;根據(jù)列車的檢修、部件更換等操作進(jìn)行相應(yīng)的回分,得到各子系統(tǒng)/部件的健康評分。
根據(jù)健康評估分?jǐn)?shù)自動提供不同的處置建議,如維修、更換等;結(jié)合各子系統(tǒng)/部件的健康評分及處置建議,對各子系統(tǒng)/部件進(jìn)行用戶評估,為后續(xù)子系統(tǒng)/部件的維護(hù)提供建議。將各子系統(tǒng)/部件的模型進(jìn)行整合,得到列車的健康評估算法模型,計算得出整車的健康狀態(tài)評分,并提供相應(yīng)的處理意見,如檢修、繼續(xù)運營等。
基于各子系統(tǒng)/部件的健康狀態(tài)分析,生成線路級/單車的健康趨勢統(tǒng)計,并能夠查詢單個維度對當(dāng)前子系統(tǒng)/部件的健康評分影響。
用戶可以通過線路級實時監(jiān)視模塊快速查看當(dāng)前線路各列車的位置分布,使得所在站點或區(qū)間一目了然。選擇列車后可了解列車運行狀態(tài)、列車健康狀態(tài),以及列車的基本信息;用戶還可以通過實時監(jiān)控統(tǒng)計來了解線路的整體運營情況,包括在線/離線列車統(tǒng)計、列車故障統(tǒng)計、列車可用率、運行里程統(tǒng)計、載客人流統(tǒng)計及能耗統(tǒng)計等。
可根據(jù)用戶查詢條件,查看列車的故障診斷列表,包括線路、車型、車號、車廂、子系統(tǒng)、故障碼、故障等級、故障名稱、故障發(fā)生時間、故障處置狀態(tài)等信息。針對某條具體故障,選擇“故障診斷”,系統(tǒng)根據(jù)相關(guān)診斷模型進(jìn)行故障診斷,展示故障診斷過程,得出故障診斷結(jié)果。診斷界面顯示故障處理措施分布與步驟,該步驟按照診斷結(jié)論進(jìn)行優(yōu)先級排列。
用戶通過列車健康狀態(tài)總覽界面可查看各車輛的總體健康狀態(tài),該界面還可以顯示當(dāng)前可用且正常的車輛數(shù)、總運行里程,以及當(dāng)前所有車輛各自的健康狀態(tài)。通過選擇“單車”可進(jìn)入單車的健康檔案,主要包括單車運行里程、運行趟次及綜合載重等基礎(chǔ)統(tǒng)計信息。
對列車當(dāng)前運行里程、使用年限、運行趟次及各接觸器開關(guān)閉合次數(shù)等設(shè)計參數(shù)進(jìn)行統(tǒng)計匯總,并與行業(yè)規(guī)范制定的設(shè)計壽命進(jìn)行對比,對達(dá)到閾值的參數(shù)進(jìn)行提醒與預(yù)警信息推送。
列車健康狀態(tài)總覽界面可自動回放各個時刻整車狀態(tài)邏輯診斷的情況。可選擇當(dāng)日任意時刻開始回放,同時可以選擇某個故障點并展示當(dāng)前故障點的邏輯診斷情況。
本文基于武漢地鐵車輛運營維護(hù)的現(xiàn)狀與需求,提出了列車信息聯(lián)控平臺,并對該平臺建設(shè)的設(shè)計思路、實現(xiàn)過程、功能展示進(jìn)行了闡述。該系統(tǒng)在武漢地鐵進(jìn)行試點應(yīng)用后,帶來了如下積極的影響:一是通過無線通信技術(shù),將列車車載系統(tǒng)狀態(tài)信息實時傳輸?shù)降孛?,使控制中心實時掌握地鐵運營線路上每列列車的設(shè)備運行狀態(tài);二是構(gòu)建了一套故障診斷專家?guī)?,?dāng)出現(xiàn)故障時,后臺專家系統(tǒng)可通過遠(yuǎn)程診斷給出故障類型、故障原因,并及時提供應(yīng)對措施,確保地鐵運營安全與高效;三是通過TCMS數(shù)據(jù)遠(yuǎn)程在線監(jiān)測和智能分析,實現(xiàn)列車的健康管理,包括列車實時數(shù)據(jù)的回溯、列車故障統(tǒng)計、關(guān)鍵部件的壽命預(yù)測等內(nèi)容。后續(xù)希望能夠基于該平臺,不斷迭代優(yōu)化專家診斷庫,對多車數(shù)據(jù)進(jìn)行關(guān)聯(lián)碰撞分析,探索基于設(shè)計參數(shù)的壽命預(yù)測;基于大數(shù)據(jù)的壽命預(yù)測方法,持續(xù)幫助節(jié)省人力并降低運營成本,優(yōu)化設(shè)備能耗,提高運營管理效率和運營服務(wù)水平。