王如濤,郭寶靈,李國(guó)榮,張 莉
(新疆油田公司,新疆 克拉瑪依 834000)
石西油田作業(yè)區(qū)SCADA系統(tǒng)自建成以來(lái)已運(yùn)行20年,實(shí)現(xiàn)了油區(qū)井站3萬(wàn)多點(diǎn)工況數(shù)據(jù)的集中監(jiān)控與管理,在生產(chǎn)監(jiān)控管理方面積累了豐富的經(jīng)驗(yàn),并有效總結(jié)了傳統(tǒng)報(bào)警管理存在的不足。目前生產(chǎn)監(jiān)控系統(tǒng)采用以數(shù)據(jù)點(diǎn)為基礎(chǔ)的閾值報(bào)警機(jī)制,利用系統(tǒng)采集的實(shí)時(shí)數(shù)據(jù)與設(shè)置的閾值進(jìn)行實(shí)時(shí)比對(duì),超出閾值范圍即時(shí)推出相應(yīng)類型的報(bào)警信息并基于相應(yīng)提醒。然而,同一個(gè)數(shù)據(jù)點(diǎn)在數(shù)據(jù)未恢復(fù)到閾值正常范圍內(nèi)時(shí)會(huì)根據(jù)持續(xù)進(jìn)行重復(fù)報(bào)警,大幅增加報(bào)警數(shù)量、提高報(bào)警處理工作量及復(fù)雜度,且有效報(bào)警、重要報(bào)警容易被冗余報(bào)警淹沒(méi),生產(chǎn)異常處理及時(shí)率大幅降低。而隨著監(jiān)控參數(shù)點(diǎn)位的日益增加,硬件系統(tǒng)老化以及軟件系統(tǒng)限制,不斷出現(xiàn)系統(tǒng)運(yùn)行緩慢、運(yùn)行錯(cuò)誤、服務(wù)器頻繁死機(jī)、閾值推薦算法讀取速度慢、寫入報(bào)警限值長(zhǎng)等問(wèn)題,導(dǎo)致報(bào)警處理效率較低,影響生產(chǎn)監(jiān)控及預(yù)警判斷,已不能滿足監(jiān)控報(bào)警需求。
報(bào)警管理是一個(gè)過(guò)程,通過(guò)這一過(guò)程實(shí)現(xiàn)報(bào)警的監(jiān)測(cè)、管理和工程化,從而保證安全、可靠的操作??茖W(xué)合理的報(bào)警管理可以確保報(bào)警系統(tǒng)發(fā)揮應(yīng)有的保護(hù)功能,防止嚴(yán)重事件的發(fā)生,提高生產(chǎn)安全性。工程設(shè)備與材料用戶協(xié)會(huì)(EEMUA)與1999年發(fā)布了EEMUA191關(guān)于報(bào)警管理的行業(yè)指南,美國(guó)儀表自動(dòng)化協(xié)會(huì)(ISA)和國(guó)際電工協(xié)會(huì)(IEC)先后與2009年和2014年發(fā)布了ANSI/ISA18.2和IEC62682關(guān)于流程工業(yè)的報(bào)警系統(tǒng)管理標(biāo)準(zhǔn)。國(guó)內(nèi)很多工業(yè)行業(yè)已經(jīng)重視報(bào)警管理策略和實(shí)施方法,并在實(shí)際中取得了一定的經(jīng)驗(yàn)和成效。在油氣生產(chǎn)行業(yè),目前主流的報(bào)警管理模式是以數(shù)據(jù)點(diǎn)為基礎(chǔ)的閾值報(bào)警模式(設(shè)置低低報(bào)、低報(bào)、高報(bào)、高高報(bào)四個(gè)界限值),生產(chǎn)監(jiān)控系統(tǒng)采集的實(shí)時(shí)數(shù)據(jù)與設(shè)置閾值進(jìn)行對(duì)比,超出閾值范圍推出相應(yīng)的報(bào)警提醒。由于同一參數(shù)(點(diǎn)位)在連續(xù)采集周期內(nèi)會(huì)形成的多條重復(fù)報(bào)警,監(jiān)控人員需定時(shí)反復(fù)分析確認(rèn),同時(shí)大量合理工況由于閾值設(shè)置不合理存在誤報(bào)現(xiàn)象,導(dǎo)致報(bào)警處理效率較低,影響生產(chǎn)安全。報(bào)警雜多的幾種情況如表現(xiàn)所示。
表1 雜多報(bào)警分類統(tǒng)計(jì)
石西油田基于多年的生產(chǎn)監(jiān)控經(jīng)驗(yàn),不斷探索報(bào)警合理性管理方法,提出“報(bào)警事件閉環(huán)管理”模式,核心是為了通過(guò)降低誤報(bào)警和重復(fù)報(bào)警數(shù)量來(lái)不斷提升報(bào)警管理可用性,以達(dá)到如下預(yù)期:
● 在工藝過(guò)程波動(dòng)時(shí)幫助監(jiān)控操作員操作,讓監(jiān)控操作員有更多的精力關(guān)注生產(chǎn)過(guò)程;
● 減少生產(chǎn)工藝過(guò)程故障停工,有效延長(zhǎng)生產(chǎn)運(yùn)行時(shí)長(zhǎng),提高生產(chǎn)潛力,降低生產(chǎn)運(yùn)維成本;
● 在工藝過(guò)程波動(dòng)時(shí)避免生產(chǎn)監(jiān)控系統(tǒng)超載運(yùn)行,確保生產(chǎn)監(jiān)控系統(tǒng)能夠長(zhǎng)期穩(wěn)定運(yùn)行、不宕機(jī);
● 幫助及時(shí)發(fā)現(xiàn)問(wèn)題,準(zhǔn)確定位生產(chǎn)異常;
● 識(shí)別出可以改進(jìn)的工藝,為下步工藝改造及技術(shù)措施調(diào)整指引方向;
● 及時(shí)發(fā)現(xiàn)需要維護(hù)的儀表,提高儀表健康度,延長(zhǎng)儀表壽命,提升數(shù)據(jù)質(zhì)量;
● 識(shí)別出在工藝過(guò)程、控制和操作方面需要改進(jìn)的地方。
“報(bào)警事件閉環(huán)管理”模式主要包括如下內(nèi)容:
1)報(bào)警的解析與歸檔。以“事件”為核心的報(bào)警規(guī)則,“事件”是指對(duì)應(yīng)的現(xiàn)場(chǎng)工藝生產(chǎn)上出現(xiàn)異常而產(chǎn)生的提示信息。這種異常信息的全生命周期包括產(chǎn)生、發(fā)展、處理、關(guān)閉四個(gè)階段,最終回歸正常。提出以“事件”為核心的理念,就是對(duì)報(bào)警進(jìn)行解析歸類,將所有與該事件有關(guān)的報(bào)警全部進(jìn)行匯聚,系統(tǒng)不再反復(fù)彈出報(bào)警信息,用戶可以集中處理一個(gè)問(wèn)題。這樣的歸類方法,將上百條報(bào)警匯總成一條報(bào)警事件,有利于監(jiān)控人員進(jìn)行查看與處理有利于事后記錄,進(jìn)行復(fù)盤總結(jié)。
表2 接續(xù)歸類原則描述
2)實(shí)時(shí)報(bào)警管理。報(bào)警管理與報(bào)警解析規(guī)則緊密相關(guān),以往報(bào)警量特別大的時(shí)候,監(jiān)控人員無(wú)法從大量的報(bào)警中快速定位有效報(bào)警,從而導(dǎo)致報(bào)警管理功能不可用。而為了避免生產(chǎn)現(xiàn)場(chǎng)出現(xiàn)嚴(yán)重異常情況,只能花費(fèi)極大的精力對(duì)重點(diǎn)對(duì)象的重要參數(shù)進(jìn)行定時(shí)曲線翻閱,試圖通過(guò)分析重點(diǎn)參數(shù)的變化趨勢(shì)分析生產(chǎn)異常,但收效甚微。而提出以“事件”為核心的報(bào)警管理機(jī)制后,報(bào)警必須滿足消警條件(數(shù)據(jù)回歸到正常范圍內(nèi))才會(huì)消除,避免監(jiān)控人員單純?yōu)榱私档蛨?bào)警量而隨意關(guān)閉、刪除報(bào)警信息導(dǎo)致有效報(bào)警的漏報(bào)問(wèn)題。同時(shí),為了區(qū)分報(bào)警的重要性及處理狀態(tài),對(duì)報(bào)警進(jìn)行了多維度的分類管理:一方面,按報(bào)警生命周期劃分為活動(dòng)報(bào)警、確認(rèn)報(bào)警、已消報(bào)警三種狀態(tài),不同的狀態(tài)采用不同的頁(yè)面進(jìn)行分類管理;另一方面,根據(jù)生產(chǎn)工藝特征劃分參數(shù)重要性級(jí)別,通過(guò)緊急、重要、一般三個(gè)層級(jí)實(shí)現(xiàn)活動(dòng)報(bào)警重要性的劃分,能夠及時(shí)區(qū)分報(bào)警的重要性,提高報(bào)警處理及時(shí)性,降低生產(chǎn)風(fēng)險(xiǎn)。例如,監(jiān)控人員對(duì)于儀表異常導(dǎo)致的數(shù)據(jù)偏差(如落零問(wèn)題),可以通過(guò)“已確認(rèn)”的方式進(jìn)行分類,方便將核心問(wèn)題展示在“活動(dòng)的報(bào)警”窗口,提醒監(jiān)控與管理人員進(jìn)行關(guān)注;而在“活動(dòng)的報(bào)警”窗口,利用不同顏色區(qū)分報(bào)警的嚴(yán)重級(jí)別進(jìn)行標(biāo)注提醒,針對(duì)不同參數(shù)進(jìn)行分類和優(yōu)先級(jí)別處理。
表3 實(shí)時(shí)報(bào)警管理機(jī)制
3)報(bào)警事件閉環(huán)管理系統(tǒng)處理流程(圖1)。將同一參數(shù)(點(diǎn)位)在連續(xù)采集周期內(nèi)形成的多條閾值報(bào)警記錄進(jìn)行分析歸并成一條報(bào)警事件在活動(dòng)報(bào)警中提示處理,監(jiān)控人員根據(jù)“活動(dòng)報(bào)警”提醒逐一對(duì)事件進(jìn)行分析,判斷報(bào)警原因(現(xiàn)場(chǎng)工藝異常、閾值設(shè)置不合理、誤報(bào)),當(dāng)工藝異常時(shí)及時(shí)通知相關(guān)人員現(xiàn)場(chǎng)處理,閾值設(shè)置不合理通過(guò)報(bào)警閾值智能推薦功能設(shè)置合理閾值,誤報(bào)時(shí)通過(guò)人工確認(rèn)將報(bào)警信息歸入“已確認(rèn)報(bào)警”界面,若出現(xiàn)報(bào)警類型(低低報(bào)、低報(bào)、高報(bào)、高高報(bào))變更后重新觸發(fā)至“活動(dòng)報(bào)警”界面,再次按報(bào)警處理流程進(jìn)行分析處理,整個(gè)流程遵循自動(dòng)關(guān)閉報(bào)警機(jī)制,在流程中的任一環(huán)節(jié),實(shí)時(shí)監(jiān)控采集數(shù)據(jù)一旦符合報(bào)警關(guān)閉規(guī)則,自動(dòng)關(guān)閉報(bào)警。(“活動(dòng)報(bào)警”和“已確認(rèn)報(bào)警”界面中的事件恢復(fù)正常后自動(dòng)跳轉(zhuǎn)至“已關(guān)閉報(bào)警”界面中,方便后期查詢。)
圖1 報(bào)警事件閉環(huán)管理系統(tǒng)處理流程
石西油田將“以數(shù)據(jù)點(diǎn)為基礎(chǔ)的報(bào)警機(jī)制”改進(jìn)為“以事件為基礎(chǔ)的報(bào)警機(jī)制”,邁出了油田報(bào)警管理的新步伐,極大地提高了報(bào)警處理工作的效率。主要效果體現(xiàn)在如下幾個(gè)方面:
1)報(bào)警數(shù)量指數(shù)級(jí)下降,減少行動(dòng)決策花費(fèi)的時(shí)間。報(bào)警的解析歸類,杜絕了事件重復(fù)報(bào)警,使監(jiān)控人員由“不斷處理閾值報(bào)警”轉(zhuǎn)變?yōu)椤凹刑幚硎录?bào)警”的模式,工作量得到大幅度下降,漏報(bào)嚴(yán)重生產(chǎn)異常的概率進(jìn)一步降低。據(jù)統(tǒng)計(jì),每天的報(bào)警數(shù)量由以前每天的1萬(wàn)多條下降在100-300條之間,分區(qū)塊處理之后,每個(gè)監(jiān)控人員面對(duì)的報(bào)警數(shù)量不超過(guò)50條/天。通過(guò)大幅降低報(bào)警數(shù)量,以保證監(jiān)控操作員集中注意力在有效的、重要的報(bào)警,及時(shí)作出正確的響應(yīng)。
圖2 報(bào)警信息管理
2)誤報(bào)警數(shù)量得到有效控制。事件報(bào)警機(jī)制在活動(dòng)報(bào)警中引入邏輯判斷,當(dāng)報(bào)警事件通過(guò)人工落實(shí)確認(rèn)為誤報(bào)時(shí),將其歸入確認(rèn)報(bào)警中,在當(dāng)前報(bào)警類型下不再出現(xiàn)報(bào)警提示。同時(shí),標(biāo)記的誤報(bào)警信息會(huì)推送至相關(guān)技術(shù)人員,督促其盡快修改閾值,確保報(bào)警及時(shí)恢復(fù)正常。而通過(guò)誤報(bào)警信息的逐漸積累,能夠成為報(bào)警閾值修正改進(jìn)的有力參考,為下步閾值自動(dòng)推薦模型的近一步優(yōu)化提供數(shù)據(jù)服務(wù)。
3)引入自動(dòng)消警機(jī)制,能夠利用實(shí)時(shí)采集的數(shù)據(jù)自動(dòng)甄別監(jiān)測(cè)對(duì)象實(shí)時(shí)狀態(tài),當(dāng)數(shù)據(jù)恢復(fù)至合理運(yùn)行范圍內(nèi)時(shí)可實(shí)現(xiàn)已產(chǎn)生報(bào)警的自動(dòng)處置,大幅降低監(jiān)控人員處置因?yàn)樯a(chǎn)波動(dòng)產(chǎn)生的偶發(fā)性異常問(wèn)題處置時(shí)間,提升報(bào)警管理效率。同時(shí)基于自動(dòng)消警機(jī)制,可有效識(shí)別出頻繁抖動(dòng)的報(bào)警,對(duì)于頻繁抖動(dòng)的報(bào)警需要多加注意,分析報(bào)警抖動(dòng)是屬于工藝運(yùn)行不穩(wěn)定還是閾值設(shè)置不合理造成導(dǎo)致的數(shù)據(jù)頻繁抖動(dòng)報(bào)警,針對(duì)不同的原因要及時(shí)采取相應(yīng)的管理措施。
4)閾值設(shè)置快速準(zhǔn)確。報(bào)警閾值智能推薦功能,模仿專家對(duì)故障的判斷過(guò)程,依據(jù)歷史數(shù)據(jù)的波動(dòng)規(guī)律推薦報(bào)警值,讓規(guī)則的設(shè)置與調(diào)整有據(jù)可依,更加符合實(shí)際生產(chǎn)工藝規(guī)律。截止到目前為止,石西油田建議與優(yōu)化了50%以上的參數(shù)報(bào)警范圍,成功地將以往注水壓力、注水流量、油井載荷等參數(shù)設(shè)定了合理的報(bào)警值,將原來(lái)掛起的參數(shù)重新進(jìn)入報(bào)警流程,提高了監(jiān)控的全面性、有效性與安全性。
表4 傳統(tǒng)報(bào)警與事件報(bào)警處理效果對(duì)比
1)建立了以事件為中心的閉環(huán)報(bào)警管理機(jī)制,監(jiān)控報(bào)警數(shù)量與質(zhì)量得到有效控制,同時(shí)報(bào)警事件是基于關(guān)閉規(guī)則進(jìn)行消警,避免了人為干預(yù)和誤操作,提高了整體的安全系數(shù),監(jiān)控操作員的報(bào)警管理滿意度大幅提升。報(bào)警管理的核心就是通過(guò)報(bào)警提醒監(jiān)控操作員響應(yīng),在第一時(shí)間將問(wèn)題進(jìn)行處置,避免處理不及時(shí)帶來(lái)的生產(chǎn)潛在隱患,但如果監(jiān)控操作員對(duì)現(xiàn)行的報(bào)警管理機(jī)制不敏感,則所有的設(shè)計(jì)將毫無(wú)意義。
2)通過(guò)生產(chǎn)過(guò)程實(shí)時(shí)監(jiān)測(cè)經(jīng)驗(yàn)積累與歸納總結(jié),進(jìn)一步探索生產(chǎn)監(jiān)控運(yùn)行模式,優(yōu)化監(jiān)控崗位操作規(guī)程,大幅提高分析判斷問(wèn)題準(zhǔn)確率,有效輔助決策下達(dá)到位,動(dòng)態(tài)指揮,使油田精細(xì)化管理水平進(jìn)一步提高。
3)報(bào)警事件閉環(huán)管理機(jī)制在石西油田已進(jìn)行推廣深化應(yīng)用,并取得了良好的實(shí)際效果,在行業(yè)內(nèi)具有廣泛的推廣價(jià)值,為后續(xù)基于參數(shù)趨勢(shì)、聯(lián)動(dòng)分析等復(fù)雜模型分析相關(guān)的智能報(bào)警管理機(jī)制的發(fā)展奠定良好基礎(chǔ)。同時(shí),隨著近年來(lái)大數(shù)據(jù)挖掘、分布式計(jì)算、云平臺(tái)等技術(shù)的快速提升,順應(yīng)兩化融合的發(fā)展趨勢(shì),積極探索智能理論和技術(shù)在石油行業(yè)的應(yīng)用潛力,逐步實(shí)現(xiàn)智能化報(bào)警管理,實(shí)現(xiàn)報(bào)警信息的自動(dòng)智能全生命周期管理,做到更高層級(jí)的無(wú)人化值守。