程 亮,王少華
高鐵因其安全、快速、準時的特性,成為了現(xiàn)代社會不可或缺的出行方式,我國全路每天運行3 000 多列動車組。動車組司機操控信息分析系統(tǒng)(EMU Engineer Operation Analysis System,EOAS)車載設備作為動車組重要行車設備,其運用狀態(tài)直接影響車輛運用效率,然而現(xiàn)有維護手段已逐漸無法滿足高標準、嚴要求的車載設備運用保障要求。
故障預測與健康管理(Prognostics Health Management,PHM)是為了滿足設備自主保障、自主診斷提出的重要理念,相關技術的發(fā)展也較為成熟,因此在EOAS 系統(tǒng)的維護管理中引入PHM技術,建立安全狀態(tài)診斷和預測系統(tǒng),提升EOAS設備的可靠性,對提高設備維修維護效率、降低成本起到了關鍵作用[1]。
隨著EOAS 車載設備數(shù)量的快速增長,以及部分EOAS 車載設備逐漸進入維修周期,僅依靠人力和機務故障報修系統(tǒng)進行設備維護,其及時性、有效性顯然無法保證,具體表現(xiàn)在以下幾方面[2]。
1)無法及時準確掌握故障。電務部門作為電務車載設備的維護單位,主要通過機務故障報修系統(tǒng)獲取車載設備故障信息,而機務故障報修系統(tǒng)存在著大量的重復報修、無效報修,無法準確有效地反映出EOAS 車載設備的故障狀態(tài),并且人工篩選有效信息,時間上相對滯后,不能及時掌握設備的故障狀態(tài),無法有效開展設備維護。
2)缺乏音視頻設備監(jiān)測手段。EOAS 司機室攝像頭、前置攝像頭、拾音器、線路相機等音視頻設備的狀態(tài)檢測依賴于二級修和故障修時人工上車檢測,在單個檢修周期內(nèi)不能及時發(fā)現(xiàn)設備異常,所以無法便捷、有效地進行音視頻設備監(jiān)測。
3)缺乏轉儲裝置維護手段。隨著動車組開行頻次的增加,EOAS 轉儲裝置的插卡頻次越來越高,造成較高的設備損耗,導致在報修故障中出現(xiàn)的轉儲裝置接觸類問題日漸增多,但目前缺乏轉儲裝置運用趨勢分析和故障預判手段。
為解決電務檢修人員無法及時掌握EOAS 設備故障、缺乏故障檢測和預判手段等痛點問題,基于PHM 技術,通過開發(fā)專用檢測設備,運用圖像識別和大數(shù)據(jù)分析,研制基于PHM 技術的EOAS健康管理和故障預測系統(tǒng)(以下簡稱“系統(tǒng)”),系統(tǒng)設計目標如下。
1)設備狀態(tài)實時監(jiān)測與故障分析。系統(tǒng)應具備EOAS 車載設備各插板、轉儲裝置等部件工作狀態(tài)的實時采集、監(jiān)測功能,并結合機務部門提報的報修單信息,進行數(shù)據(jù)綜合分析,生成故障報警。
2)視頻設備自動檢測。系統(tǒng)應對EOAS 車載司機室攝像頭、前置攝像頭、線路攝像機等設備的拍攝圖案進行抓圖展示,自動識別出攝像頭圖案的黑屏、白屏、花屏狀態(tài),并基于圖像識別算法進行圖像異常檢測,同時生成報警,提高檢測效率。
3)設備檢修閉環(huán)管理。對既有EOAS 車載設備轉儲裝置進行硬件優(yōu)化:支持掛卡槽插卡次數(shù)計數(shù),便于及時掌握掛卡槽的損耗情況;支持無線傳輸通信功能,利用專用的車載設備檢修手持終端進行無接觸式EOAS 車載設備檢測、拍照、檢修記錄回傳以及自動回執(zhí)報修單,實現(xiàn)設備檢修作業(yè)的閉環(huán)管理。
4) 設備故障趨勢分析。結合實時采集的EOAS 設備狀態(tài)數(shù)據(jù)以及上車檢修過程的檢測數(shù)據(jù),通過大數(shù)據(jù)分析,實現(xiàn)關鍵部件的性能判斷和趨勢預判[3]。
系統(tǒng)總體架構見圖1,由路局健康管理服務器、電務車間工區(qū)數(shù)據(jù)處理存儲工作站、用戶終端、數(shù)據(jù)轉儲裝置、手持檢測終端等組成[4]。
圖1 系統(tǒng)總體架構
1)路局健康管理服務器包括應用服務器和數(shù)據(jù)庫,部署在路局機房,主要實現(xiàn)EOAS 車載設備狀態(tài)數(shù)據(jù)、機務報修單數(shù)據(jù)的采集抽取、預處理、數(shù)據(jù)存儲、挖掘分析,同時進行系統(tǒng)基礎數(shù)據(jù)維護、操作權限控制,實現(xiàn)電務工區(qū)數(shù)據(jù)存儲工作站與用戶終端的交互功能。
2)電務工區(qū)數(shù)據(jù)存儲工作站部署在電務車間工區(qū),主要實現(xiàn)音視頻檢測數(shù)據(jù)、檢修計劃數(shù)據(jù)、設備檢修結果數(shù)據(jù)的存儲和調(diào)閱。
3)用戶終端包括健康管理終端和視頻設備監(jiān)測終端,部署在電務車間工區(qū)。其中,健康管理終端用于訪問系統(tǒng)采集的監(jiān)測數(shù)據(jù)、報警數(shù)據(jù)和檢修作業(yè)數(shù)據(jù);視頻設備檢測終端用于訪問車載各攝像頭視頻圖片數(shù)據(jù)和圖像異常報警數(shù)據(jù)。
4)手持終端用于電務檢修工區(qū)人員上車進行EOAS設備檢測、檢修和數(shù)據(jù)下載。
系統(tǒng)的軟件設計采用B/S 架構,自下而上劃分為數(shù)據(jù)采集層、數(shù)據(jù)存儲層、數(shù)據(jù)分析層、健康管理運用層4層[5],軟件架構見圖2。
圖2 軟件架構
1)數(shù)據(jù)采集層。通過系統(tǒng)間數(shù)據(jù)自動接入和人工錄入等方式,獲取系統(tǒng)所需的車載設備狀態(tài)、音視頻數(shù)據(jù)、報修單數(shù)據(jù)、EOAS交路數(shù)據(jù)等。數(shù)據(jù)采集層適配了不同類型的采集接口,通過車地傳輸通道發(fā)送至地面設備;通過接入機務故障報修系統(tǒng),定時采集機務提報的報修數(shù)據(jù),包括報修車號、故障時間、故障類型等信息;通過標準化模板支持檢修任務單數(shù)據(jù)的導入。
2)數(shù)據(jù)存儲層。將采集數(shù)據(jù)根據(jù)業(yè)務運用特性,進行格式分類、組織,形成符合要求的數(shù)據(jù),并按類別存儲。對于調(diào)閱頻繁的熱數(shù)據(jù),使用非關系型數(shù)據(jù)庫Redis 存儲;對于分析后的結果數(shù)據(jù)采用關系型數(shù)據(jù)庫存儲。
3)數(shù)據(jù)分析層。采用多種分析模型和PHM分析結構對各類數(shù)據(jù)進行挖掘及應用。對車載設備狀態(tài)數(shù)據(jù)、機務報修單數(shù)據(jù),通過關聯(lián)規(guī)則、多維分析、模型可視化的方式進行處理,能夠將車載設備的原始狀態(tài)信息與報修單中的設備故障匹配,呈現(xiàn)設備故障的規(guī)律和趨勢。
4)健康管理運用層。按照運用業(yè)務劃分為不同的功能模塊,在既有列控車載動態(tài)監(jiān)測及傳輸系統(tǒng)(Dynamic Monitoring System,DMS)客戶端軟件上進行健康管理功能模塊開發(fā),并通過DMS 客戶端訪問系統(tǒng),方便電務管理和設備維護人員的使用。
系統(tǒng)主要具備故障報警自動分析、音視頻設備檢測、實時監(jiān)測設備狀態(tài)、設備檢修閉環(huán)管理、故障預測分析等功能[4],見圖3。
圖3 系統(tǒng)功能
系統(tǒng)通過列控車載動態(tài)監(jiān)測及傳輸系統(tǒng)的車地實時傳輸通道,采集EOAS車載主機CPU板、EOASCOMM 插板、DUMP 插板、WTD/DRWTD 插板、CIR 插板、轉儲裝置、司機室攝像頭、前置攝像頭、線路攝像機、拾音器等設備狀態(tài)以及板卡間的通信狀態(tài),結合動車組的行車場景,自動對設備狀態(tài)數(shù)據(jù)進行設備故障判斷、分析,形成實時故障報警[6]。同時系統(tǒng)從EOAS 故障報修系統(tǒng)同步機務部門提報的EOAS 報修單,將報修單內(nèi)車載設備故障結合實時設備檢測狀態(tài)進行關聯(lián)分析。把機務提報的問題主要分為設備故障、外部數(shù)據(jù)異常、數(shù)據(jù)邏輯處理3 類。其中,設備故障需由電務檢修人員使用手持終端,按計劃車載設備故障處理,任務下發(fā)時系統(tǒng)會給出故障處置建議,可為檢修人員提供參考;外部數(shù)據(jù)異常一般為接口設備類問題,可反饋至相關設備維護單位協(xié)同處理;數(shù)據(jù)邏輯處理為EOAS設備車、地軟件類問題,電務檢修人員無需上車進行硬件設備故障處理。
系統(tǒng)通過列控車載動態(tài)監(jiān)測及傳輸系統(tǒng)周期性采集各類攝像機圖像,并把圖像數(shù)據(jù)傳輸至健康管理服務器。系統(tǒng)采用圖像識別技術對圖像黑屏、白屏、花屏等進行自動識別并報警[7]。電務工作人員可通過視頻設備監(jiān)測終端篩選日期、車號、攝像頭類型等條件,查詢到圖像報警列表詳情以及報警頻次。系統(tǒng)支持圖像異常時刻和最新圖像同屏對比顯示,便于工作人員分析判斷。
系統(tǒng)能夠查看EOAS 車載主機設備各板卡和音視頻設備的實時狀態(tài),并以示意圖形式動態(tài)展示,便于維護人員及時、直觀地掌握各設備的工作狀態(tài),為及時安排故障設備檢修作業(yè)提供依據(jù)。
系統(tǒng)可生成車載設備類故障檢修計劃,及檢修問題的排查建議,維護工區(qū)工作人員通過手持終端按設備檢修流程進行任務領取和上車檢修,作業(yè)完成后通過手持終端將檢修數(shù)回傳,實現(xiàn)檢修作業(yè)閉環(huán)管理。
手持終端采用便攜式設計,內(nèi)置專用無線模塊及APP 軟件,在司機室附近,可以自動連接升級版EOAS 車載轉儲裝置的內(nèi)置專用無線網(wǎng)絡,實現(xiàn)無接觸式設備檢測、數(shù)據(jù)下載等功能。
利用EOAS 實時監(jiān)測所采集的狀態(tài)數(shù)據(jù)、機務故障報修數(shù)據(jù)及無接觸檢測終端采集的檢測數(shù)據(jù),根據(jù)故障類別、故障所屬范圍(動車組車端、動車所、電務段)等維度,進行設備故障數(shù)據(jù)的統(tǒng)計和趨勢分析。
1)設備故障統(tǒng)計。統(tǒng)計設定時間段內(nèi)各部門配屬車輛的EOAS 設備故障情況,根據(jù)設備故障類型查看分布情況,并支持按照車端故障數(shù)量統(tǒng)計排序。
2)故障增長率統(tǒng)計??蓪σ欢螘r間內(nèi)的車載設備類故障按照最近12 月的月度環(huán)比增長率進行分析和比較,并統(tǒng)計最近2 年的月度同比增長率,方便管理人員掌握車載設備故障的整體發(fā)展趨勢。
3)作業(yè)情況統(tǒng)計??山y(tǒng)計設定時間段內(nèi)車載設備類故障的處置情況,方便管理人員及時掌握故障的檢修維護處理情況。
4)故障趨勢預判。結合EOAS 各插板、部件狀態(tài)和使用情況,通過大數(shù)據(jù)計算,對EOAS 轉儲裝置卡槽壽命到期進行預警。并且系統(tǒng)可對EOAS車載設備故障進行趨勢分析,識別故障頻次較高車端、故障頻率較高類型,提前進行故障預警[8]。
利用圖像識別技術,對司機室攝像機、前置攝像機、線路攝像機等的圖像進行識別和異常報警?;赟obel 算子的邊緣檢測,對圖像模糊度進行計算,同時結合閾值和邏輯判斷進行圖像黑屏、白屏、花屏的識別[9]。
Sobel 算子作為一種在圖像處理中廣泛使用的邊緣檢測算法,通過計算圖像灰度函數(shù)在橫向和縱向上的梯度大小來檢測圖像的邊緣。邊緣是圖像中灰度值快速變化的區(qū)域,這些變化通常對應于物體與背景之間、不同物體之間或物體結構的細節(jié)。對圖像中邊緣線的檢測是圖像分割與特征提取的基礎,通過計算像素灰度值的變化速度,可以確定該像素是否位于邊緣上。
Sobel算子使用橫向和縱向兩個方向的卷積核,分別計算像素灰度值在橫向和縱向上的梯度大小,根據(jù)梯度大小反映了該像素所處位置的邊緣強度。將圖像中每個像素的梯度大小與預先設定的閾值進行比較,確定該像素是否位于邊緣上。在實際應用中,通常使用一些邏輯判斷方法來確定圖像的邊緣。例如,將相鄰像素的梯度大小進行比較,如果相差較大,則認為它們構成邊緣,否則不構成邊緣[10]。
原圖像素點的橫向梯度Gx為
原圖像素點的縱向梯度Gy為
式中:A為原始圖像。
通過Gx和Gy可以得到圖像的整體梯度幅值G為
式3可以簡化為
根據(jù)式4,計算出每個像素點的G值,最后對整個圖像的全部G值求和作為整張圖像的模糊度M。M值越大,說明圖像的邊緣信息越少,圖像越模糊;M值越小,說明圖像的邊緣信息越多,圖像越清晰。系統(tǒng)識別的黑屏、白屏和花屏均為模糊度較高的圖像。將樣本圖像分為正常和非正常兩大類,分別計算出兩類圖像的M均值M1和M2,將M1和M2作為兩類的分界線,可區(qū)分出正常圖像和非正常圖像,再根據(jù)非正常圖像的RGB 值可進一步分辨出黑屏、白屏和花屏。
系統(tǒng)周期性采集攝像機視頻圖片,利用配置了GPU 運算能力的服務器進行輔助圖像識別,識別結果顯示在視頻設備檢測終端。如圖4 所示根據(jù)當前登錄用戶所在組織的配屬車輛信息進行默認車輛展示,如果用戶設置有關注車輛,則默認顯示關注車輛的當天抓圖信息,否則按照左側車輛列表展示最新3 個車端數(shù)據(jù)。左側車號列表顏色顯示規(guī)則:最近24 h 存在抓圖信息的標注綠色,超過30 天無圖片信息的標注紅色。如圖5 所示,系統(tǒng)可有效識別黑屏、白屏、花屏異常,形成報警數(shù)據(jù),并按照車號、時間、相機類型、報警類型、運行端進行關聯(lián)查詢。
圖4 圖像抓拍識別
圖5 報警車輛
系統(tǒng)采用風險矩陣分析法定量計算風險項的風險值,評估EOAS 設備故障的安全風險等級。風險矩陣法是一種常用的風險評估方法,它通過比較項目的各個風險因素,從而確定各因素的風險等級,最后計算得出項目的總風險值。基于此,科學劃分風險等級,分析風險發(fā)生的可能性與嚴重程度的關系,權衡風險可接受尺度,流程如下。
Step 1識別風險。首先,需要識別出可能造成事故后果的風險因素:整機風險、板卡風險、模塊風險、人員風險、操作風險等。
Step 2確定風險級別。風險等級從高到低劃分為重大安全風險、較大安全風險、中等安全風險、一般安全風險,分別用紅、橙、黃、藍4 種顏色標示。
Step 3評估事故發(fā)生的概率。對于每個風險因素,評估其發(fā)生的概率,采用5 種等級標識:很可能、可能但不經(jīng)常、可能性很小/完全意外、很不可能/可以設想、極不可能。
Step 4定量計算風險值。建立風險矩陣,計算每個風險因素的風險值。矩陣的行表示風險的概率,列表示風險的嚴重程度。
Step 5計算總風險值。將所有風險因素按照其風險值進行排序,可使用加權平均等方法計算所有風險的數(shù)值總和,即為項目的總風險值。
系統(tǒng)于2022 年12 月在南京電務段南京動車所投入應用。系統(tǒng)支持對列控車載動態(tài)監(jiān)測及傳輸系統(tǒng)車載設備的檢測,可一機多用,故僅需購置一套系統(tǒng)即可替代傳統(tǒng)檢修方式中電務檢修車間分別采購的EOAS 綜合測試臺和DMS 綜合測試臺,兼顧了對EOAS、DMS 車載設備的檢測,采購成本可減少約50%。同時,利用系統(tǒng)具備的實時監(jiān)測、自動診斷等功能,檢修人員遠程操控即可完成設備的功能檢測,取代了傳統(tǒng)人工攜帶檢測工裝上車的方式,提高了檢測效率,降低人工作業(yè)成本和檢測耗時。
基于PHM 技術的EOAS 健康管理和故障預測系統(tǒng)提升了電務部門對EOAS 車載設備維護效能,進一步豐富了EOAS車載設備檢維手段,為EOAS車載設備狀態(tài)監(jiān)測提供了解決方案,可以有效提高設備異常情況從發(fā)現(xiàn)到處置的及時性、準確性,助力保障設備運行的可靠性和安全性。接下來,將繼續(xù)挖掘既有數(shù)據(jù)利用深度,通過AI 學習訓練,建立更多種不同故障類型的故障模型,提升系統(tǒng)診斷與預判的精準度和及時性。