張棟良,陳 森,賈帥兵,張勝利
(1.上海電力大學(xué)自動(dòng)化工程學(xué)院,上海 200090;2.國(guó)家電投集團(tuán)平頂山熱電有限公司,河南 平頂山 467036;3.國(guó)核自?xún)x系統(tǒng)工程有限公司,上海 200241)
作為發(fā)電廠(chǎng)的神經(jīng)中樞,分散控制系統(tǒng)的可靠運(yùn)行關(guān)系到電力生產(chǎn)的安全與經(jīng)濟(jì)效益。而隨著智能化電廠(chǎng)的發(fā)展,電廠(chǎng)精細(xì)化檢修成為電廠(chǎng)工業(yè)過(guò)程的維護(hù)運(yùn)行目標(biāo)和發(fā)展趨勢(shì)。傳統(tǒng)的分散控制系統(tǒng)(Distributed Control System,DCS)可靠性研究方法往往是對(duì)DCS 的結(jié)構(gòu)分析或可靠性試驗(yàn)[1-2],即在實(shí)際應(yīng)用之前用概率理論方法實(shí)現(xiàn)。而通過(guò)實(shí)時(shí)和歷史信息數(shù)據(jù)的結(jié)合進(jìn)行數(shù)據(jù)挖掘和集成判斷DCS設(shè)備的當(dāng)前運(yùn)行狀況、其健康程度以及可靠性狀況可為電廠(chǎng)DCS 的精細(xì)化檢修以及狀態(tài)檢修提供手段[3]?,F(xiàn)有的多數(shù)DCS系統(tǒng)都能夠通過(guò)自檢提供實(shí)時(shí)的控制設(shè)備狀態(tài)參數(shù)[4],如控制器的處理器負(fù)荷、內(nèi)存占用率等,但對(duì)于DCS 系統(tǒng)可靠性的深層次指標(biāo),如系統(tǒng)中各設(shè)備的平均故障間隔時(shí)間(Mean Time Between Failwres,MTBF)、失效率λ(t)、可靠度R(t)、可用率等標(biāo)志系統(tǒng)健康度和可靠性的指標(biāo)尚未形成在線(xiàn)評(píng)價(jià)體系。這些評(píng)價(jià)將在DCS 系統(tǒng)的長(zhǎng)期運(yùn)行中起到運(yùn)維指導(dǎo)的作用從而提高DCS 系統(tǒng)的可靠性,避免由DCS 本身的故障帶來(lái)的電力生產(chǎn)事故。
要進(jìn)行可靠性評(píng)價(jià)計(jì)算需要采集DCS 系統(tǒng)發(fā)生異常的大量時(shí)間信息,如控制單元(Control Unit,CU)主輔狀態(tài)切換時(shí)間,DCS 系統(tǒng)AI、AO、DI、DO、RTD、TC 輸入輸出卡件等報(bào)警信息、故障信息,以及故障、報(bào)警發(fā)生的時(shí)間、頻次,DCS 系統(tǒng)的主備電源系統(tǒng)切換、報(bào)警、掉電等信息以及發(fā)生的時(shí)間,DCS 網(wǎng)絡(luò)系統(tǒng)狀態(tài)變化及網(wǎng)絡(luò)掉線(xiàn)等信息及發(fā)生的時(shí)間,網(wǎng)絡(luò)交換機(jī)端口信息、交換機(jī)CPU 使用率、內(nèi)存使用率及網(wǎng)絡(luò)掉線(xiàn)及發(fā)生的時(shí)間。通過(guò)以上信息的獲取和記錄,實(shí)時(shí)和歷史信息數(shù)據(jù)結(jié)合進(jìn)行數(shù)據(jù)挖掘和集成判斷DCS 設(shè)備的當(dāng)前運(yùn)行狀況,可靠性狀況,并通過(guò)有效地評(píng)價(jià)為電廠(chǎng)DCS 的精細(xì)化檢修以及狀態(tài)檢修提供可視化手段。
DCS 在線(xiàn)可靠性監(jiān)測(cè)與評(píng)估系統(tǒng)可按照設(shè)備狀態(tài)信息采集、設(shè)備級(jí)可靠性指標(biāo)計(jì)算、系統(tǒng)級(jí)可靠性評(píng)價(jià)三個(gè)層次來(lái)設(shè)計(jì)與實(shí)現(xiàn),如圖1所示。
圖1 DCS系統(tǒng)在線(xiàn)可靠性監(jiān)測(cè)與預(yù)評(píng)估系統(tǒng)體系結(jié)構(gòu)
在設(shè)備狀態(tài)信息采集層,能反映DCS 系統(tǒng)可靠性的多源基礎(chǔ)信息通過(guò)多種渠道進(jìn)行采集和存儲(chǔ),內(nèi)容包括:
1)控制單元的CPU 負(fù)荷率、內(nèi)存占用率、離線(xiàn)時(shí)間、主備切換時(shí)間等;
2)I/O 卡件的故障、報(bào)警、離線(xiàn)、異常等事件的時(shí)間;
3)電源模塊的電壓、掉電、報(bào)警和切換等事件的時(shí)間;
4)網(wǎng)絡(luò)交換機(jī)的CPU 負(fù)荷、內(nèi)存占用率、各端口吞吐率、離線(xiàn)時(shí)間等;
5)人機(jī)接口的CPU 負(fù)荷率、內(nèi)存使用率、CPU溫度、硬盤(pán)占用率、離線(xiàn)時(shí)間等。
在設(shè)備級(jí)可靠性指標(biāo)計(jì)算層,利用基礎(chǔ)設(shè)備狀態(tài)信息的采集,利用可靠性相關(guān)指標(biāo)的概率統(tǒng)計(jì)計(jì)算方法,計(jì)算單臺(tái)設(shè)備的可靠性指標(biāo),內(nèi)容包括控制單元、I/O卡件、電源模塊、網(wǎng)絡(luò)交換機(jī)、人機(jī)口等設(shè)備的可靠度、失效率、可用率、平均故障間隔時(shí)間、可靠性等級(jí)等。
在設(shè)備級(jí)可靠性指標(biāo)的計(jì)算的基礎(chǔ)上,根據(jù)設(shè)備權(quán)重、依賴(lài)關(guān)系等對(duì)DCS 系統(tǒng)進(jìn)行可靠性評(píng)價(jià)。系統(tǒng)級(jí)可靠性性評(píng)價(jià)的工作包括DCS 狀態(tài)的可視化、系統(tǒng)可靠性的實(shí)時(shí)在線(xiàn)評(píng)估、系統(tǒng)可靠性報(bào)表以及系統(tǒng)維護(hù)建議。
DCS 可靠性在線(xiàn)監(jiān)測(cè)與評(píng)估系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。在不影響DCS 系統(tǒng)安全運(yùn)行的前提下,可靠性監(jiān)測(cè)與評(píng)估系統(tǒng)通過(guò)以太網(wǎng)經(jīng)防火墻分別與DCS 系統(tǒng)的OPC Server 相連,并通過(guò)DCOM 協(xié)議、SNMP 協(xié)議[5]、RPC 協(xié)議[6-7]等獲取相應(yīng)的DCS數(shù)據(jù)庫(kù)中點(diǎn)信息[8-9]。
圖2 DCS可靠性在線(xiàn)監(jiān)測(cè)與評(píng)估系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)
在DCS 可靠性監(jiān)測(cè)與評(píng)估系統(tǒng)中,獲取的信息存儲(chǔ)于實(shí)時(shí)數(shù)據(jù)庫(kù),由監(jiān)控畫(huà)面子程序進(jìn)行顯示;由歷史記錄子程序進(jìn)行存儲(chǔ);由可靠性評(píng)估子程序進(jìn)行實(shí)時(shí)可靠性計(jì)算。
在可靠性分析中,產(chǎn)品分為可修復(fù)產(chǎn)品和不可修復(fù)產(chǎn)品,DCS系統(tǒng)部件出現(xiàn)故障會(huì)影響其功能實(shí)現(xiàn),但經(jīng)維修可以恢復(fù),屬于可修復(fù)產(chǎn)品?;诳煽啃愿怕手笜?biāo)計(jì)算公式計(jì)算平均故障間隔時(shí)間、失效率、可靠度等,再根據(jù)相關(guān)的行業(yè)標(biāo)準(zhǔn)[10]建立DCS設(shè)備可靠性評(píng)價(jià)的模型和算法。
平均故障間隔時(shí)間是指在產(chǎn)品生命周期內(nèi)每?jī)纱喂收祥g隔的工作時(shí)間的平均值。
式中:ti為第i次故障發(fā)生的時(shí)間;N為產(chǎn)品生命周期內(nèi)的總故障次數(shù)。
可靠度是指系統(tǒng)在設(shè)計(jì)技術(shù)范圍內(nèi),能夠完成預(yù)定功能的概率。數(shù)學(xué)定義為:在零時(shí)刻投運(yùn)的某部件在(0,t)內(nèi)不失效的概率。t時(shí)刻產(chǎn)品的可靠度為
式中:N0為產(chǎn)品總數(shù);Nf(t)為t時(shí)刻故障產(chǎn)品數(shù)目??煽慷仁墙y(tǒng)計(jì)概率,是時(shí)間的函數(shù),0≤R(t)≤1。
失效率是指產(chǎn)品運(yùn)行到t時(shí)刻后,單位時(shí)間內(nèi)發(fā)生故障的數(shù)量與t時(shí)刻完好的數(shù)量之比。t時(shí)刻產(chǎn)品的失效率為
在偶然失效期內(nèi)
對(duì)于DCS 系統(tǒng)來(lái)說(shuō),電子設(shè)備壽命服從指數(shù)分布,故失效率λ為常數(shù),可靠度為
對(duì)DCS 各設(shè)備的運(yùn)行情況進(jìn)行監(jiān)測(cè)和記錄,并在設(shè)備運(yùn)行數(shù)據(jù)的基礎(chǔ)上對(duì)各設(shè)備的可靠性進(jìn)行評(píng)價(jià),評(píng)價(jià)算法如下。
第一步,計(jì)算DCS 的CU、卡件、電源等設(shè)備的平均故障間隔時(shí)間
式中:tMTBFx為單個(gè)設(shè)備x的平均故障間隔時(shí)間;tMTBF0為設(shè)備初始的平均故障間隔時(shí)間;ti(i=2,3,…,n)為設(shè)備的第i次故障時(shí)間;t0為設(shè)備投入運(yùn)行的時(shí)間點(diǎn)。
平均故障間隔時(shí)間的計(jì)算就是對(duì)幾次故障的間隔時(shí)間取平均值,對(duì)其計(jì)算分為兩種情況:一是設(shè)備投運(yùn)后還未發(fā)生故障,此時(shí),設(shè)備的平均故障間隔時(shí)間用初始平均故障間隔時(shí)間tMTBF0表示;二是設(shè)備投運(yùn)后發(fā)生一次及以上故障,則將設(shè)備的平均故障間隔時(shí)間代入式(6)求解,實(shí)現(xiàn)對(duì)初始平均故障間隔時(shí)間的替代。
第二步,計(jì)算DCS 的CU、卡件、電源等設(shè)備的失效率。CU、卡件和電源均屬于電子元件,壽命服從指數(shù)分布,指數(shù)分布的失效率為常數(shù)且與平均故障間隔時(shí)間互為倒數(shù),故其計(jì)算公式如式(4)所示。
第三步,利用式(2)計(jì)算DCS的CU、卡件、電源等設(shè)備的可靠度??煽慷戎档拇笮》从沉嗽O(shè)備正常完成其預(yù)定功能的概率大小。
第四步,評(píng)價(jià)DCS 的CU、卡件、電源等設(shè)備的可靠性等級(jí)。根據(jù)電力行業(yè)相關(guān)標(biāo)準(zhǔn),建立設(shè)備可靠性等級(jí)評(píng)估體系,如式(7)所示。
式中:Ei為被評(píng)估設(shè)備的可靠性分值;ESi為被評(píng)估設(shè)備的標(biāo)準(zhǔn)分值,定為100;∑n(1,n)Edi表示被評(píng)估設(shè)備的扣分值,是指設(shè)計(jì)、基建、生產(chǎn)階段被評(píng)估設(shè)備未達(dá)到要求所扣的分值之和,本評(píng)價(jià)系統(tǒng)中,認(rèn)為各階段設(shè)備均達(dá)要求,扣分值為0;RE為被評(píng)估設(shè)備的可靠度值,即第三步所計(jì)算出的R(t);PE為被評(píng)估設(shè)備預(yù)期的可靠度值,DCS系統(tǒng)屬于A 類(lèi)設(shè)備,故值為1;LE被評(píng)估設(shè)備的壽命系數(shù),設(shè)計(jì)壽命年限內(nèi)為1,年限外為0.9Yr-Yd,其中,Yr為設(shè)備運(yùn)行年數(shù),Yd為設(shè)計(jì)壽命年限本評(píng)價(jià)算法中,認(rèn)為被評(píng)估設(shè)備均在壽命年限,該值為1;TE為被評(píng)估設(shè)備的重要性類(lèi)別,DCS 系統(tǒng)屬于A 類(lèi)設(shè)備,故值為1;ME重要設(shè)備重復(fù)性故障系數(shù),本評(píng)價(jià)系統(tǒng)中定該值為1。
第五步,計(jì)算DCS 系統(tǒng)整體可靠度,這一步的計(jì)算是利用上一步單個(gè)設(shè)備可靠性分值和相關(guān)標(biāo)準(zhǔn)[11]中源于各設(shè)備在DCS 中加權(quán)系數(shù)表來(lái)進(jìn)行計(jì)算。
DCS 在線(xiàn)可靠性監(jiān)測(cè)與評(píng)價(jià)系統(tǒng)在某火電廠(chǎng)的兩套DCS 上進(jìn)行了現(xiàn)場(chǎng)實(shí)施,通過(guò)OPC 協(xié)議與DCS 的DA-Server 進(jìn)行連接,實(shí)現(xiàn)了對(duì)DCS 各系統(tǒng)設(shè)備的實(shí)時(shí)監(jiān)測(cè)與在線(xiàn)評(píng)價(jià)。部分功能畫(huà)面如下。
主界面:通過(guò)邏輯配置模塊對(duì)控制單元、輸入輸出卡件、人機(jī)接口站、電源和網(wǎng)絡(luò)在畫(huà)面上進(jìn)行搭建,實(shí)現(xiàn)對(duì)各設(shè)備監(jiān)控總畫(huà)面,如圖3所示,對(duì)于每一對(duì)控制單元,用綠色表示主站,用藍(lán)色表示從站,用紅色表示故障,點(diǎn)擊控制單元的按鈕可進(jìn)入查看每個(gè)控制單元的詳細(xì)狀態(tài)信息。每對(duì)控制單元按鈕下方有對(duì)應(yīng)卡件和電源模塊的狀態(tài)顯示按鈕,如果有故障用紅色表示,若無(wú)用灰色表示,點(diǎn)擊卡件或電源的按鈕可以查看對(duì)于應(yīng)站的卡件或電源的狀態(tài)。
圖3 DCS在線(xiàn)可靠性監(jiān)測(cè)與評(píng)價(jià)系統(tǒng)主界面
控制單元狀態(tài)監(jiān)測(cè):可以監(jiān)測(cè)CU 負(fù)荷率及內(nèi)存使用率、溫度,部分功能如圖4 所示。每個(gè)控制單元用兩個(gè)圓點(diǎn)表示兩個(gè)通信網(wǎng)絡(luò)的狀態(tài),綠色表示正常,紅色表示斷網(wǎng),用棒圖表示CPU 負(fù)荷和內(nèi)存占用率,用實(shí)時(shí)趨勢(shì)曲線(xiàn)表示CPU 的溫度。右上方表示4 個(gè)電源模塊的狀態(tài),綠色表示正常、紅色表示故障。右下角的表格顯示設(shè)備的失效率、平均故障間隔時(shí)間、設(shè)備可靠度以及可靠度評(píng)級(jí)。
圖4 控制單元狀態(tài)監(jiān)測(cè)
卡件狀態(tài)監(jiān)測(cè):可以監(jiān)測(cè)各卡件異常狀態(tài)信息,部分功能如圖5 所示。其中用綠色表示卡件正常,紅色表示卡件故障或異常,藍(lán)色表示卡槽空置,右下角的表格顯示卡件的失效率、平均故障間隔時(shí)間、設(shè)備可靠度以及可靠度評(píng)級(jí)。
圖5 卡件狀態(tài)監(jiān)測(cè)
系統(tǒng)可靠性報(bào)表:如圖6所示,通過(guò)第3節(jié)所述計(jì)算方法,得出階段性的可靠性評(píng)估結(jié)果,包括分類(lèi)設(shè)備如控制單元、卡件、人機(jī)接口、電源等的故障信息、可靠度、平均故障間隔時(shí)間;系統(tǒng)整體可靠性評(píng)級(jí)和檢修建議等。
圖6 DCS可靠性監(jiān)測(cè)與評(píng)估狀態(tài)報(bào)表
DCS 可靠性監(jiān)測(cè)預(yù)評(píng)估系統(tǒng)通過(guò)對(duì)設(shè)備的負(fù)荷、溫度等參數(shù)和異常、失效事件記錄形成長(zhǎng)期的監(jiān)測(cè),再根據(jù)行業(yè)標(biāo)準(zhǔn)和概率統(tǒng)計(jì)原理建立可靠性評(píng)估模型,對(duì)DCS 系統(tǒng)的各項(xiàng)可靠性指標(biāo)進(jìn)行在線(xiàn)計(jì)算,從而實(shí)現(xiàn)了DCS 系統(tǒng)的健康狀態(tài)評(píng)估。通過(guò)DCS 可靠性監(jiān)測(cè)與在線(xiàn)評(píng)估系統(tǒng)的現(xiàn)場(chǎng)實(shí)施,實(shí)現(xiàn)了DCS 健康狀態(tài)和可靠性的在線(xiàn)量化監(jiān)測(cè),為DCS的設(shè)備維護(hù)提供了依據(jù),進(jìn)而避免了因DCS故障引起的機(jī)組停運(yùn)等事故。