王艷輝,蘇宏明,李 曼,賈利民,李宇杰,楚柏青
(1.北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100044;2.北京交通大學 交通運輸學院,北京 100044;3.中交星宇科技有限公司 科技研發(fā)中心,北京 100088;4.北京市地鐵運營有限公司 技術(shù)部,北京 100088)
隨著城市軌道交通運營規(guī)模的不斷擴大,安全風險問題日益突顯。城市軌道交通運營環(huán)境密閉性強,設施、設備的人員布設密度高,一旦發(fā)生局部故障或突發(fā)事件,很可能影響整個運營系統(tǒng),處置不當將會造成重大的人身財產(chǎn)損失[1]。因此國家層面對城軌運營安全提出非常高的要求,相繼印發(fā)《風險分級管控和隱患排查治理》[2]《城市軌道交通運營期間安全技術(shù)規(guī)范》[3]等政策文件,著重提倡風險的主動防控治理,堅持超前防范、關口前移,從而最大限度地避免運營安全事故的發(fā)生。
近些年,在城軌行業(yè)逐步興起的風險防控信息化平臺是一種以規(guī)范、高效、科學的風險管控理念為基礎,結(jié)合互聯(lián)網(wǎng)技術(shù)對業(yè)務流程進行優(yōu)化的管理新方法,能夠及時發(fā)現(xiàn)并治理運營中存在的風險?,F(xiàn)階段,如何運用信息化平臺實現(xiàn)運營安全保障,是國內(nèi)各家城軌運營公司普遍重點關注的問題之一[4]。廈門地鐵針對供電系統(tǒng)引進安全管理平臺,保障了供電運行和檢修的工作效率[5]。哈爾濱地鐵提出,利用高集成手段建設智能監(jiān)控、報警防災、智能電力系統(tǒng)全面融合的信息化平臺,全面提升地鐵運營預警預報功能,實現(xiàn)高效聯(lián)動與快速反應[6]。福州地鐵針對地鐵施工過程,設計開發(fā)了基于B/S 模式的城市軌道交通安全管控信息平臺,實現(xiàn)了風險巡查、風險響應等施工操作的信息化管理[7]。烏魯木齊地鐵針對人員安全和治安防護設計地鐵安防集成平臺,實現(xiàn)了地鐵全線安防子系統(tǒng)的綜合管理[8]。南京地鐵設計了安全管理一體化信息系統(tǒng),實現(xiàn)了不同部門之間的信息化統(tǒng)籌管理為管理者提供了及時的決策輔助[9]。
現(xiàn)行的信息平臺在城軌運營安全保障中發(fā)揮了極大作用,但仍然存在一定優(yōu)化空間,主要體現(xiàn)為:以各部門下獨自運行的信息平臺為主,缺乏全局級別的城軌運營風險信息一體化平臺,信息難以集成和共享,易造成信息孤島現(xiàn)象;以應用于施工過程的安全管理平臺為主,缺乏針對運營過程的風險管理信息系統(tǒng),且系統(tǒng)不能實現(xiàn)自由配置,靈活性差;以基于被動安全的運營安全平臺為主,多僅針對發(fā)生的故障進行安全信息統(tǒng)計分析,易造成“小故障、大影響”現(xiàn)象,缺乏主動開展風險防控,防患于未然。
從超前防范故障和事故的角度出發(fā),本文將風險主動防控的核心理念歸納為風險辨識、風險分析、風險治理和風險監(jiān)督反饋4 個環(huán)節(jié)構(gòu)成的閉環(huán)管理過程,并分別確立各環(huán)節(jié)的具體操作流程;在此基礎上設計風險主動防控平臺,明確平臺的邏輯架構(gòu)、功能架構(gòu)、業(yè)務流程和數(shù)據(jù)關系;最后將平臺應用于實踐,采取端-邊-云一體化和微服務系統(tǒng)架構(gòu)進行開發(fā),基于北京城市軌道交通路網(wǎng)數(shù)據(jù)進行部署應用,證實平臺的應用效果。
風險是發(fā)生不幸事件的概率,是一種不良后果的可能性與嚴重程度的組合[10]。風險管理是安全管理的高級階段,是將風險造成的影響降到最低的管理過程。作為風險管理的最終目的,風險主動防控通過事前主動性的管理和預防,提前辨識并判斷風險的狀態(tài),進而治理風險關鍵節(jié)點并阻斷其可能傳播路徑,從源頭處防范風險。
如圖1 所示,風險主動防控的核心理念可歸納為風險辨識、風險分析、風險治理和風險監(jiān)督反饋4個環(huán)節(jié)構(gòu)成的閉環(huán)管理過程,4個環(huán)節(jié)環(huán)環(huán)相扣、相互依托,共同完成風險主動防控工作,并經(jīng)過不斷反饋學習,提高整體的風險主動防控能力。事實上,將風險主動防控閉環(huán)管理理念引入城軌運營安全管理信息平臺,建立規(guī)范的業(yè)務管理流程,已被認為是實現(xiàn)運營零事故最好的方法。
圖1 風險主動防控閉環(huán)管控理念
城軌組分節(jié)點是指參與運營過程中的各個組成成分,為了便于統(tǒng)計分析,對城軌組分節(jié)點按照“人”“機”“環(huán)”“管”合理抽象并歸類。其中:“人”類組分節(jié)點指的是參與城市軌道交通系統(tǒng)運營的所有人員,人的不安全行為是造成城軌運營事故的重要原因;“機”類組分節(jié)點是城軌運營系統(tǒng)內(nèi)部的組分節(jié)點,主要包括參與運營過程的所有設備設施;“環(huán)”類組分節(jié)點是城軌運營系統(tǒng)外部的組分節(jié)點,主要包括會對運營過程產(chǎn)生影響的所有因素;“管”類組分節(jié)點是指城軌運營過程中影響城軌正常運行的規(guī)章制度、政策法規(guī)和調(diào)度管理等。
風險辨識是風險主動防控閉環(huán)管理的第一步。城軌運營中的風險辨識可表現(xiàn)為按照一定方法直觀地發(fā)現(xiàn)那些可能產(chǎn)生和傳播風險、且具有較大風險因素的組分節(jié)點辨識為風險點,并將其列為重點監(jiān)測對象。風險點的辨識示意圖如圖2 所示。圖中:下層結(jié)構(gòu)表示城軌運營組成成分節(jié)點;上層結(jié)構(gòu)表示從組分節(jié)點中辨識出的風險點。并不是所有的組分節(jié)點都可能產(chǎn)生和傳播風險,故風險點數(shù)量必然少于組分節(jié)點數(shù)量。
圖2 風險點辨識示意圖
為了更全面地辨識風險點,需要從風險管理角度對城軌公司工作人員的安全排查工作(如工作人員對設施設備的每日巡檢等)進行完善,在充分調(diào)研城軌運營公司日常設施設備排查記錄、歷史事故等數(shù)據(jù)的基礎上,主觀和客觀相結(jié)合地進行風險點辨識。以如下3類組分節(jié)點作為重點考察對象,并將其辨識為需要日常重點監(jiān)測的風險點。
1)曾造成過事故的組分節(jié)點
梳理歷史事故報告,為避免類似事故/事件再次發(fā)生,將報告中出現(xiàn)過的組分節(jié)點判斷為風險點,即
式中:m為統(tǒng)計得到的事故記錄總數(shù);si為0-1 變量,當遍歷的第i個事故記錄中存在當前正在辨識的組分節(jié)點pk(k為組分節(jié)點編號,k=1,2,…,n,其中n為辨識過程中所統(tǒng)計的組分節(jié)點總數(shù))時取值為1,反之取值為0。
2)故障次數(shù)較高的組分節(jié)點
梳理歷史維修記錄,識別在維修過程中故障次數(shù)較高的組分節(jié)點,將記錄中大于統(tǒng)計故障次數(shù)平均值的組分節(jié)點判斷為風險點,即
3)關聯(lián)度較高的組分節(jié)點
重點關注運營過程中與其他組分關聯(lián)度較高、極易造成/受到影響導致狀態(tài)改變的組分節(jié)點,根據(jù)在實際運營過程中對周圍組分造成/受到影響的次數(shù),將造成/受到影響次數(shù)大于平均的節(jié)點判斷為風險點,即
可認為,風險點處于異常狀態(tài)時,能量的意外釋放及相互傳播影響會造成事故的發(fā)生。因此風險點擁有穩(wěn)定及不穩(wěn)定2 種狀態(tài)?;谀芰恳馔忉尫诺娘L險點狀態(tài)轉(zhuǎn)移機制如圖3所示,當施加能量超過風險點可承受閾值/受到超過其承受閾值的其他風險點的能量傳遞時,則認為此時風險點的安全屏障失效,能量將失去控制,導致風險點轉(zhuǎn)化為不穩(wěn)定狀態(tài)[11]。
圖3 風險點狀態(tài)轉(zhuǎn)移機制
針對風險點狀態(tài)改變閾值,認為風險點狀態(tài)值越大其內(nèi)部能量越混亂,越容易向其他風險點傳播風險,由此提出風險點狀態(tài)值計算方法,不穩(wěn)定狀態(tài)和穩(wěn)定狀態(tài)可分別按照式(4)和式(5)計算。
風險點之間存在著相互作用關系,當風險點處于不穩(wěn)定狀態(tài)時,即觸發(fā)風險點狀態(tài)轉(zhuǎn)移機制,從而須對與其關聯(lián)的風險點狀態(tài)進行再次評估。抽象得到風險傳播模型如圖4所示。
圖4 風險傳播模型
根據(jù)圖4 揭示的源風險點傳播內(nèi)在影響機理,當需要再次評估風險狀態(tài)時,可結(jié)合傳播過程中影響的范圍和觸發(fā)的風險點重要度不同,重新評估風險狀態(tài)的級別。
風險分析結(jié)果不僅可用于了解風險傳播路徑,還能指導風險治理。風險治理包括根因風險治理和可控風險治理,前者指對源風險點進行維修、更替等,后者指對傳播路徑或預測出傳播路徑上功能重要的關鍵節(jié)點進行治理。
先根據(jù)風險點的傳播范圍對城軌運營系統(tǒng)全局風險進行分級,再按照對應等級制定相應的治理調(diào)控策略,指導源頭處和傳播路徑處開展針對性風險治理,從而有效避免重大事故的發(fā)生。整理得到風險分析結(jié)果對應治理策略見表1。
表1 風險分析結(jié)果對應治理策略
在城軌運營公司中,一般由安全管理部門實時監(jiān)督整個風險主動防控工作,查看相關員工具體負責的風險點狀態(tài)和風險巡檢、處置的執(zhí)行情況、總體完成率等。由此,建立風險監(jiān)督反饋機制如圖5所示?;趯v史事故和未遂事件的學習反饋,建立得到風險管控檔案;風險點數(shù)據(jù)庫根據(jù)管控檔案及時更新,并將風險點位置、負責人等基礎信息及時反饋于管控檔案;風險點治理策略根據(jù)風險點數(shù)據(jù)庫識別得到的關鍵風險點信息及時更新,并將風險點歷史治理維護信息反饋于數(shù)據(jù)庫;管控檔案、風險點數(shù)據(jù)庫、風險點治理策略三者形成閉環(huán)管理,能夠有效避免重大事故的發(fā)生;另外,還可根據(jù)實際不斷對業(yè)務流程進行重組,修訂公司風險點管控策略,摒棄冗余的流程,優(yōu)化得到最直接有效的操作流程。
圖5 風險監(jiān)督反饋機制示意圖
1)平臺邏輯架構(gòu)
設計風險主動防控平臺時,為實現(xiàn)全部組分和業(yè)務流程的自由配置,采用“1+1+1”模式,將整體平臺劃分為“基礎平臺+風險防控平臺+大數(shù)據(jù)中心”,構(gòu)建得到的平臺邏輯架構(gòu)如圖6 所示。平臺采取分層模式,從下到上依次是基礎層、應用層、模型層和展示層,共4層;基礎平臺對應邏輯架構(gòu)基礎層,可實現(xiàn)不同運營公司基礎信息的自由靈活配置,增強了平臺的可移植性;應用層、模型層和展示層共同組成風險防控平臺,可實現(xiàn)城軌風險主動防控的各項功能和圖形界面展示;城軌大數(shù)據(jù)中心則負責接入管理平臺運算所需的各種數(shù)據(jù)。
圖6 “1+1+1”模式風險主動防控平臺邏輯架構(gòu)
對平臺邏輯架構(gòu)中的各層詳細說明如下。
(1)基礎層針對我國不同城軌運營公司的不同組織架構(gòu)、部門職能、崗位信息、員工配置、線路站點和設施設備等,采取完全自由配置的模式,可以實現(xiàn)平臺在不同公司下的靈活通用。
(2)應用層主要包括對風險點、風險傳播、風險預案、業(yè)務流程和歷史事故的管理。其中:風險點由基礎層的組分配置管理按照一定的規(guī)則模型辨識提取而來;應用層最核心的功能是對風險傳播分析的管理和基于經(jīng)驗的風險預案的觸發(fā),執(zhí)行對應的業(yè)務流程,并通過下發(fā)工單將風險處置責任落實到個人;總結(jié)分析歷史事故,進而補充完善風險點,實現(xiàn)風險主動防控的閉環(huán)管理。
(3)模型層提供包括風險點識別模型、風險傳播模型、系統(tǒng)綜合評估模型和事故反演模型,為應用層提供模型和算法的支撐。
(4)展示層提供圖形化展示,包括:基礎層形成的組分間的拓撲網(wǎng)絡、應用層的風險傳播預測路線、業(yè)務處置的流程圖、個人工單的執(zhí)行首頁、系統(tǒng)全局風險狀態(tài)和處置結(jié)果分析等。
主動防控平臺是多部門、多業(yè)務、多應用的模式,為了更好地融合、集成和應用多源異構(gòu)數(shù)據(jù),構(gòu)建元數(shù)據(jù)標準體系,形成管理接口和數(shù)據(jù)互操作技術(shù)體系,完成對數(shù)據(jù)的接入、解析、清洗轉(zhuǎn)化、存儲及數(shù)據(jù)安全分區(qū)管理。通過大數(shù)據(jù)中心,平臺實現(xiàn)對各個監(jiān)測點(包括供電系統(tǒng)、工務、機電系統(tǒng)、車輛、線路、橋梁、隧道、行車調(diào)度、通信信號和運營環(huán)境等)的全部安全數(shù)據(jù)接入,實現(xiàn)了整個風險主動防控平臺的數(shù)據(jù)保障。
2)平臺功能架構(gòu)
為使平臺閉環(huán)管理整個風險防控業(yè)務,滿足運營公司風險管理和工作人員不同功能需求,平臺設計采取開放式、模塊式、集成化的思路,得到10個功能模塊如圖7 所示。其中:為了實現(xiàn)平臺的自由靈活性,將基礎平臺設計為4個功能模塊,實現(xiàn)具體的線路、站點、車輛、設施設備、機構(gòu)和人員等配置;風險防控平臺則通過配置合理的業(yè)務流程,實現(xiàn)風險辨識、傳播分析、治理和事故統(tǒng)計一系列功能的集成。
圖7 城軌運營風險主動防控平臺功能架構(gòu)
3)平臺業(yè)務流程
既往許多城軌運營事故都是由于管理上的疏忽或者員工的不規(guī)范操作造成的,面對這一情況,如今多數(shù)企業(yè)采取了加強人員安全管理的培訓或罰款等措施,這顯然是不合理的[12]。只有建立標準的業(yè)務流程,將安全管理連接到每一個具體組分和每一個負責的工作人員,組織所有的員工全程參與風險主動防控管理,創(chuàng)造一個規(guī)范化、信息化的風險管理環(huán)境和團隊,這樣才能將事故的發(fā)生的概率降為最低[13]?;谶@一思路,重新描述運營風險主動防控的業(yè)務流程,將用戶分為安全管理部門和現(xiàn)場執(zhí)行部門2 個用戶群,其中前者只需要對管控過程進行任務下達和監(jiān)督,后者只需要進行任務執(zhí)行和上報,通過兩者分工協(xié)作,完成整個風險辨識、風險分析、風險治理和風險監(jiān)督反饋業(yè)務流程。平臺詳細平臺業(yè)務流程如圖8所示。圖中:實線和虛線分別表示平臺的正向業(yè)務流程和負向業(yè)務反饋。圖8 體現(xiàn)了不同功能下對應用戶需要執(zhí)行的操作(其中管控平臺指系統(tǒng)自行操作)。這一業(yè)務流程設計旨在將基礎理論落實到公司風險管控實際中,最終實現(xiàn)流程的標準化,并為平臺的設計提供技術(shù)支撐。
圖8 風險主動防控業(yè)務流程圖
4)平臺數(shù)據(jù)關系
平臺數(shù)據(jù)關系如圖9 所示,展示了平臺業(yè)務功能間數(shù)據(jù)的傳遞關系。數(shù)據(jù)中心定時輸入2 類數(shù)據(jù),分別為故障日志和節(jié)點狀態(tài),再分別將這2 類數(shù)據(jù)保存到故障記錄表和節(jié)點狀態(tài)表中;狀態(tài)監(jiān)測功能可以從節(jié)點狀態(tài)表中獲取數(shù)據(jù),用以構(gòu)建風險傳播鏈,將預測的結(jié)果保存到風險分級表中,并將異常狀態(tài)和處置策略展示給管控人員;故障記錄分析功能從記錄表里獲取故障記錄進行分析,得到分析結(jié)果并將其進行歸檔,以便反饋學習,不斷更新風險點,最終實現(xiàn)風險主動防控過程中數(shù)據(jù)流通的閉環(huán)。
圖9 平臺數(shù)據(jù)關系設計
考慮采取端-邊-云一體化進行平臺部署,架構(gòu)如圖10 所示。其中:“端”指智能終端,即主動防控平臺業(yè)務的客戶端和手持端;“邊”指將計算擴展到靠近客戶端、設備端的地方,盡量避免網(wǎng)絡延時等問題[14],由車站/車輛段和線路現(xiàn)場人員或傳感器上傳風險數(shù)據(jù),員工通過平臺手持端或客戶端接收指令;“云”指云計算,通過云終端進行數(shù)據(jù)的處理。
圖10 端--邊--云協(xié)同架構(gòu)
平臺采用便于開發(fā)維護、易于水平擴展、整體可用性強[15]的微服務架構(gòu)進行設計。平臺部署需要的3 個服務器分別為:應用服務器,負責運行平臺的應用邏輯部分,完成平臺的接入處理,進行數(shù)據(jù)轉(zhuǎn)換等工作;網(wǎng)絡服務器,對必要的功能提供瀏覽器/服務器模式(B/S)的訪問;數(shù)據(jù)服務器,運行平臺需要的數(shù)據(jù)庫程序。
平臺以北京市城市軌道交通路網(wǎng)為應用背景,已經(jīng)在地鐵大廈3層調(diào)度指揮中心進行了成功部署,接入太平湖數(shù)據(jù)中心,完成了整體的調(diào)試與功能測試。平臺主界面如圖11所示。用戶可以通過主界面察覺整個路網(wǎng)的風險辨識、分析和治理情況,及時對各個子公司和部門出現(xiàn)的風險情況進行監(jiān)督反饋管理,從而實現(xiàn)風險的閉環(huán)管理與主動防控。
圖11 主動防控平臺主界面
從應用范圍來看,平臺在北京地鐵運營一公司的15條線路和300余座車站試運行后,大大簡化了管理者和工作人員風險管控操作的流程,解決了城軌運營風險數(shù)據(jù)量大、機理復雜且實時性強等問題,且具有較高的安全性和穩(wěn)定性,便于管理和維護。
從數(shù)據(jù)處理情況來看,平臺已經(jīng)辨識并錄入的“人”“機”“環(huán)”“管”各類風險點共591 個,推演得到風險路徑58 條,有效提供風險處置預案268例,大大降低了因人為、技術(shù)和設備原因?qū)е碌陌踩鹿蕽撛诎l(fā)生率。
本文剖析了風險主動防控的理念,形成以風險辨識、風險分析、風險治理和風險監(jiān)督反饋為閉環(huán)的風險防控4 個階段,設計并研發(fā)了以機構(gòu)管理、組分管理、路網(wǎng)配置、風險點管理、業(yè)務流程管理、風險傳播管理、事故管理、風險評價和風險處置等功能為一體的風險主動防控平臺,完成了城軌運營風險主動防控閉環(huán)管理的信息化和智能化,為日常風險管控和決策提供支持。同時,針對國內(nèi)城市軌道交通運營單位的安全管理工作基本處于各自為營的狀態(tài),重復、低水平的投入現(xiàn)象較為普遍的問題,平臺建立了標準的業(yè)務流程和數(shù)據(jù)關系,讓風險預控的責任精確到每個崗位的每一個工作流程,同時讓每一個風險點都做到“標準清晰、責任清晰”。通過將傳統(tǒng)的巡檢工單、人工監(jiān)察的安全作業(yè)方式與現(xiàn)代信息技術(shù)結(jié)合,讓安全預控管理更規(guī)范、更智能。經(jīng)過部署測試,平臺具備較好的靈活性和安全性,預留的許多接口,還可支持未來更多業(yè)務的融合擴展,具有一定的應用價值和前景。