葛智平,郭濤,石耀武,張世才,雒煥強,李強,李喬森
(甘肅電力科學(xué)研究院,甘肅蘭州 730050)
DCS(分散控制系統(tǒng))是以通信網(wǎng)絡(luò)為紐帶,集顯示、操作、管理控制為一體的多級計算機網(wǎng)絡(luò)控制系統(tǒng)。隨著科學(xué)技術(shù)的不斷進步,DCS系統(tǒng)在我國電力行業(yè)得到廣泛應(yīng)用,特別是憑借其高度的可靠性、強大的功能以及靈活的配置在電廠熱控系統(tǒng)中占據(jù)重要的位置,兼有控制分散、管理集中的優(yōu)點[1]。因此,DCS系統(tǒng)的可靠性至關(guān)重要,直接關(guān)系到電廠機組運行的安全性和經(jīng)濟性[2]。
DCS系統(tǒng)有一個完善的網(wǎng)絡(luò)通訊系統(tǒng),該網(wǎng)絡(luò)系統(tǒng)可以及時、準確地完成數(shù)據(jù)在DCS各相關(guān)子系統(tǒng)之間的傳遞,從而使得各子系統(tǒng)能夠有效結(jié)合,組成一個有機的整體。DCS網(wǎng)絡(luò)系統(tǒng)作為電廠的中樞神經(jīng),一旦發(fā)生故障,輕則發(fā)生DCS系統(tǒng)局部死機,對機組的安全運行帶來影響,重則引起整個DCS網(wǎng)絡(luò)通訊癱瘓,機組跳閘,甚至影響到電網(wǎng)的安全[3]。然而,由于電廠控制系統(tǒng)、工況的復(fù)雜性和其他諸多因素的影響,DCS網(wǎng)絡(luò)故障不可避免,因此,DCS網(wǎng)絡(luò)故障診斷與預(yù)防成為DCS系統(tǒng)發(fā)展的一個方向[4]。本文針對某火電廠DCS系統(tǒng)網(wǎng)絡(luò)出現(xiàn)的異常情況,通過分析事故過程中所采取的應(yīng)急措施、故障排查方法、故障處理手段等因素,提出了DCS系統(tǒng)網(wǎng)絡(luò)優(yōu)化措施,探討從網(wǎng)絡(luò)安全層面確保了DCS系統(tǒng)穩(wěn)定可靠運行的技術(shù)手段。
DCS系統(tǒng)在各大型工業(yè)控制系統(tǒng)中的廣泛應(yīng)用,促使DCS系統(tǒng)各著名廠商也不斷改進自己的產(chǎn)品以適應(yīng)市場的發(fā)展需求,各廠商除了推出自己典型DCS系統(tǒng)外,還根據(jù)自己軟件的特點以及客戶的需求設(shè)計適應(yīng)性更強的DCS系統(tǒng)[5-8]。
該火電廠采用的是??怂共_公司的I/A Series控制系統(tǒng)。該系統(tǒng)中通過高速冗余以太網(wǎng),將各功能子組(包括操作員站W(wǎng)P、工程師站AW、控制器CP等)連接構(gòu)成一體控制單元。
該控制網(wǎng)絡(luò)中采用的智能交換機是美國凱創(chuàng)公司生產(chǎn),型號為A2H124-24FX。網(wǎng)絡(luò)按功能劃分為三個部分:公用系統(tǒng)、1號機組及2號機組。一對互為熱備用的交換機SW001A和SW001B組成公用系統(tǒng)網(wǎng)絡(luò),主要負責(zé)電廠水循環(huán)系統(tǒng)、數(shù)字化電廠以及脫銷處理系統(tǒng)的數(shù)據(jù)通訊和監(jiān)控。1號機組和2號機組網(wǎng)絡(luò)分別有兩對交換機,1號機組內(nèi)的交換機有 SW101A、SW101B、SW102A、SW102B,2 號機組內(nèi) 的 交 換 機 為 SW201A、SW201B、SW202A、SW202B,兩個功能子組分別完成單元機組的控制功能。整個DCS網(wǎng)絡(luò)采用樹形結(jié)構(gòu),尋址方式為快速生成樹協(xié)議。依靠智能交換機的自動尋址功能,實現(xiàn)數(shù)據(jù)交換,對電廠各環(huán)節(jié)完成實時監(jiān)控。
2013年3月16日7時16分,發(fā)電部運行人員發(fā)現(xiàn)1、2號機組DCS系統(tǒng)畫面中的運行參數(shù)同時全部變?yōu)椤?”,設(shè)備運行狀態(tài)顯示異常,只能從數(shù)字屏幕上監(jiān)視到機組有功功率、主汽溫度、主汽壓力三個參數(shù),所有操作員站、工程師站、歷史站全部掉線,DCS系統(tǒng)各CP控制站面板顯示故障運行,運行人員在操作員站無法進行監(jiān)視和操作。
事故發(fā)生后,電廠立即啟動DCS故障事故應(yīng)急預(yù)案,熱控人員查找事故原因,運行各級人員采用人盯設(shè)備的方法,運行值班員就地監(jiān)視1、2號爐側(cè)(所有給煤機煤量,送風(fēng)機、引煤機、一次風(fēng)機、空預(yù)器)和機側(cè)(除氧器水位、熱井水位、小機轉(zhuǎn)速、主機轉(zhuǎn)速、定冷水箱水位、閉式水箱水位、主機潤滑油壓力、密封郵箱油位)情況,及時匯報相關(guān)設(shè)備運行參數(shù)的變化,做事故停機準備。
熱控人員與DCS廠家人員溝通后,初步判斷為網(wǎng)絡(luò)通訊故障,開始故障排查工作。先后斷開與數(shù)字化電廠的光纖通道、交換機SO101A、SW101B電源故障并未消除。8時25分DCS系統(tǒng)還是無法恢復(fù)且1號機組主汽溫變化無法調(diào)整,手動MFT、手動汽機跳閘、手動滅磁、手動解列發(fā)電機出口開關(guān)后,1號機組停運,惰走時間57min。熱控人員試圖斷開2號機組與公用交換機之間的所有光纖端口,但部分光纖無法拔出。斷開根交換機SW201A電源,故障未消除。斷開SW001A電源后,發(fā)現(xiàn)2號機大屏顯示功率信號突降為0MW,立即手動MFT、手動汽機跳閘、手動滅磁、手動解列發(fā)電機出口開關(guān)后,2號機組停運,惰走時間60min。
1、2號機組停機后,手動啟動主機交流油泵、頂軸油泵。就地檢查主機交流油泵、高壓備用密封油泵、頂軸油泵運行正常。檢查入網(wǎng)控制開關(guān)、滅磁開關(guān)斷開,廠用快切動作正常。檢查主汽門、高中壓調(diào)門,中主門關(guān)閉、各抽氣逆止門關(guān)閉、高排逆止門關(guān)閉、高排通風(fēng)閥開啟。檢查所有磨煤機,給煤機跳閘,一次風(fēng)機跳閘,減溫水電動門全部關(guān)閉。且汽輪機轉(zhuǎn)速到零后,手動投入盤車運行也正常?;謴?fù)SW001A交換機電源供電,斷開SW001B交換機電源后,故障消失,1、2號機組盤面DCS系統(tǒng)畫面恢復(fù)操作,監(jiān)視功能正常。更換了SW001B備用交換機,恢復(fù)公用交換機SW001A和SW001B與1號、2號機組根交換機的網(wǎng)絡(luò)連接,DCS系統(tǒng)運行正常。
從故障的現(xiàn)象綜合分析原因,由于運行中的公用DCS系統(tǒng)網(wǎng)絡(luò)根交換機SW001B異常故障,直接導(dǎo)致該交換機上RSTP協(xié)議(快速生成樹協(xié)議)正常關(guān)閉的端口被非正常的啟用,在網(wǎng)絡(luò)中生產(chǎn)了數(shù)據(jù)回路,大量的數(shù)據(jù)包通過這個回路被不斷的轉(zhuǎn)發(fā)。
同時,經(jīng)確認該交換機在進行現(xiàn)場軟件組態(tài)時,沒有對相應(yīng)端口進行正確的配置,缺少了應(yīng)該在交換機端口上配置Broadcast的數(shù)據(jù)流量限制功能,該功能在數(shù)據(jù)包大流量轉(zhuǎn)發(fā)時能及時限制流量負荷。由于設(shè)置錯誤,致使大量的數(shù)據(jù)包被發(fā)至整個控制網(wǎng)絡(luò)中,數(shù)據(jù)包積累,最終導(dǎo)致整個網(wǎng)絡(luò)的癱瘓。因此,明確了本次網(wǎng)絡(luò)故障的原因是,當(dāng)且僅當(dāng)出現(xiàn)RSTP端口被非正常啟用并且無數(shù)據(jù)流量限制功能的情況下,產(chǎn)生了網(wǎng)絡(luò)數(shù)據(jù)風(fēng)暴,造成網(wǎng)絡(luò)癱瘓。
網(wǎng)絡(luò)流量能直接反應(yīng)網(wǎng)絡(luò)性能的好壞,合理的流量控制策略至關(guān)重要[9],應(yīng)該在交換機端口上配置數(shù)據(jù)流量限制功能,防止數(shù)據(jù)被大量的轉(zhuǎn)發(fā)導(dǎo)致網(wǎng)絡(luò)通訊堵塞。如此以來,即使DCS系統(tǒng)網(wǎng)絡(luò)出現(xiàn)虛擬斷點閉合或節(jié)點網(wǎng)絡(luò)接口故障時,也不會因為向網(wǎng)絡(luò)大量發(fā)送數(shù)據(jù)而造成網(wǎng)絡(luò)負荷劇增,杜絕事故情況的惡化。
該火電廠采用的I/A Series控制系統(tǒng)是通過智能交換機和光纖通道,采用快速生成樹協(xié)議組成DCS系統(tǒng)網(wǎng)絡(luò),交換機擔(dān)負著儲存轉(zhuǎn)發(fā)數(shù)據(jù)的任務(wù),在整個網(wǎng)絡(luò)系統(tǒng)中占有重要的地位,尤其是公用系統(tǒng)網(wǎng)絡(luò)的一對核心交換機以及每臺機組網(wǎng)路內(nèi)部的根交換機,必須滿足整個系統(tǒng)網(wǎng)絡(luò)運行的要求,DCS系統(tǒng)網(wǎng)絡(luò)交換機需要定期做功能升級[10]。
針對此次網(wǎng)絡(luò)故障,完善網(wǎng)絡(luò)交換機系統(tǒng)在線監(jiān)測及報警功能軟件,發(fā)現(xiàn)問題及時處理,從而防止事故范圍擴大。此外,針對此次故障產(chǎn)生的原因,該交換機廠家建議使用LPA功能,LPA是以太網(wǎng)標(biāo)準協(xié)議之一。使用此功能可以有效防止極端情況下網(wǎng)絡(luò)回路的產(chǎn)生,為網(wǎng)絡(luò)安全提供多重保護。
根據(jù)DCS控制系統(tǒng)CRT畫面顯示情況可以推測,當(dāng)整個網(wǎng)絡(luò)產(chǎn)生回路之后,數(shù)據(jù)被不斷轉(zhuǎn)發(fā)產(chǎn)生重復(fù),畫面失去正常監(jiān)控功能,導(dǎo)致整個網(wǎng)絡(luò)通訊紊亂。從這方面因素考慮并結(jié)合近期電廠設(shè)計時采用的主流網(wǎng)絡(luò)結(jié)構(gòu)[11],可以對現(xiàn)有的網(wǎng)絡(luò)通訊結(jié)構(gòu)做調(diào)整。
公用系統(tǒng)、1號機組和2號機組之間處于對等地位,是完全獨立的分支控制系統(tǒng),1號機組根交換機和2號機組的根交換機分別改為熱備用關(guān)系,然后三個子系統(tǒng)均獨立接入數(shù)字化電廠,并設(shè)置獨立的單向隔離裝置。每個分支控制系統(tǒng)都占據(jù)獨立的虛擬網(wǎng)段,未經(jīng)路由設(shè)置無法進行跨網(wǎng)絡(luò)相互訪問,虛擬網(wǎng)段設(shè)置的主要目的是保證各個分支控制系統(tǒng)之間不受干擾,保護各自的獨立性。采用此種結(jié)構(gòu)優(yōu)點是,除了能保證1、2號機組之間數(shù)據(jù)很好的物理隔離外,公共網(wǎng)絡(luò)易于擴展而形成一個功能豐富的公用系統(tǒng)。
加強DCS控制網(wǎng)絡(luò)的監(jiān)測及狀態(tài)評估工作[12],如光纖連通狀態(tài)、老化程度以及網(wǎng)絡(luò)數(shù)據(jù)流量等與網(wǎng)絡(luò)通信質(zhì)量相關(guān)項目,對DCS通訊網(wǎng)絡(luò)進行定期的運維,保證網(wǎng)絡(luò)系統(tǒng)安全可靠運行。對交換機而言,開展日常維護工作,定期查看交換機負荷量和接口燈狀態(tài)。同時,需要加大對系統(tǒng)檢修維護管理人員的培訓(xùn),提高檢修工藝水平。
電廠DCS系統(tǒng)網(wǎng)絡(luò)的首要任務(wù)就是保證通訊網(wǎng)絡(luò)的高可靠性,造成網(wǎng)絡(luò)故障的因素很多,如網(wǎng)絡(luò)結(jié)構(gòu)故障、硬件故障、軟件故障、電源故障及人為因素導(dǎo)致的故障等。對該火電廠此類網(wǎng)絡(luò)故障采取的處理措施主要從交換機端口配置、交換機軟件升級和網(wǎng)絡(luò)結(jié)構(gòu)方面進行了相應(yīng)的功能優(yōu)化,并且建議定期妥善維護保養(yǎng)DCS系統(tǒng)網(wǎng)絡(luò),確保控制系統(tǒng)穩(wěn)定運行,減小事故發(fā)生的概率,提高故障情況下通訊網(wǎng)絡(luò)自動隔離故障點的能力,使該火電廠的DCS系統(tǒng)網(wǎng)絡(luò)的安全可靠性得到切實提高。通過對此類故障問題的應(yīng)對及處理方案研究,希望能對DCS系統(tǒng)網(wǎng)絡(luò)故障診斷有一定的借鑒意義,推動DCS系統(tǒng)通訊網(wǎng)絡(luò)進一步完善。
[1]肖 軍.DCS及現(xiàn)場總線技術(shù)[M].北京:清華大學(xué)出版社,2011.
[2]鄭揚帆.DCS的通訊網(wǎng)絡(luò)分析及提高可靠性方法[J].自動化博覽,2004,(4):58 -62.
[3]賴紅嬌.關(guān)于 DCS系統(tǒng)網(wǎng)絡(luò)故障探討[J].電氣傳動,2010,(27):339 -340.
[4]鐘永春,郭慧玲.發(fā)電廠DCS常見故障分析與預(yù)防[J].科技致富向?qū)В?012,(27):86.
[5]電力行業(yè)熱工自動化技術(shù)委員會.火力發(fā)電廠分散控制系統(tǒng)典型故障應(yīng)急處理預(yù)案艾默生 Ovation系統(tǒng)[M].北京:中國電力出版社,2012.
[6]電力行業(yè)熱工自動化技術(shù)委員會.火力發(fā)電廠分散控制系統(tǒng)典型故障應(yīng)急處理預(yù)案國電智深EDPF-NT Plus系統(tǒng)[M].北京:中國電力出版社,2012.
[7]電力行業(yè)熱工自動化技術(shù)委員會.火力發(fā)電廠分散控制系統(tǒng)典型故障應(yīng)急處理預(yù)案??怂共_I/A系統(tǒng)[M].北京:中國電力出版社,2012.
[8]電力行業(yè)熱工自動化技術(shù)委員會.火力發(fā)電廠分散控制系統(tǒng)典型故障應(yīng)急處理預(yù)案ABB Symphony系統(tǒng)[M].北京:中國電力出版社,2012.
[9]Yu M,Wang L,Chu T,et al.Stabilization of networked control systems with data packet dropout and network delays via switching system approach[J].IEEE Conference on Decision and Control,2004(43):3539 -3544.
[10]王淑江.網(wǎng)絡(luò)升級與改造實戰(zhàn)指南[M].北京:電子工業(yè)出版社,2012.
[11]張勁松.以太網(wǎng)交換機快速生成樹協(xié)議的研究與實現(xiàn)[D].成都:西南交通大學(xué),2002.
[12]沐 或.熱工DCS系統(tǒng)常見故障分析及處理措施[J].寧夏師范學(xué)院學(xué)報,2011,(6):50-54.