胡宇卿
【摘 要】 隨著電力調(diào)度應(yīng)用系統(tǒng)的不斷增加和擴展,目前已建成并投運的系統(tǒng)主要有SCADA/EMS系統(tǒng)、電能量采集系統(tǒng)、集控中心監(jiān)控系統(tǒng)、數(shù)據(jù)網(wǎng)傳輸系統(tǒng)、電力調(diào)度生產(chǎn)管理系統(tǒng)(DPMS)、二次防護系統(tǒng)、二次系統(tǒng)網(wǎng)絡(luò)傳輸平臺等。自動化人員為了保證各系統(tǒng)的安全穩(wěn)定運行必須定期對設(shè)備進行逐一、逐項巡視,日常運維工作量與故障處理復雜度不斷增加。由于沒有高效的技術(shù)手段對系統(tǒng)設(shè)備的運行狀態(tài)進行監(jiān)控,目前僅通過傳統(tǒng)人工方式管理,導致系統(tǒng)運行維護工作效率低下,延長了故障處理時間,降低系統(tǒng)可靠性,不利于電力系統(tǒng)的安全生產(chǎn)。
【關(guān)鍵詞】 機房 集中 智能監(jiān)控 設(shè)備
1 引言
電力自動化系統(tǒng)涵蓋范圍廣,專業(yè)系統(tǒng)眾多,是由多種硬件、軟件共同構(gòu)成的一個復雜的運行系統(tǒng),監(jiān)管這樣的系統(tǒng),需時刻關(guān)注大量繁雜數(shù)據(jù):設(shè)備運行狀況、網(wǎng)絡(luò)流量、數(shù)據(jù)采集負載等。這些數(shù)據(jù)數(shù)量巨大,分布分散,且格式不一,可理解性差。對運維人員來說,用各系統(tǒng)自帶平臺查看運行信息費時費力,往往容易因湮沒在大量的運行數(shù)據(jù)中而遺漏重要信息,導致對系統(tǒng)中出現(xiàn)的異常故障無法準確識別、及時響應(yīng),延遲了故障相應(yīng)時間,并可能導致故障擴大,直接影響電力系統(tǒng)的安全穩(wěn)定運行。
2 日常運維主要問題
(1)運維人員需定時進機房對分布在不同機柜內(nèi)的設(shè)備逐一、逐項巡視,加重了運維人員的工作量和壓力。
(2)由于運維人員巡視周期性不連續(xù),設(shè)備出現(xiàn)故障時往往需要等到下個巡視周期才能發(fā)現(xiàn)。
(3)運維人員在處理故障時,由于沒有整體動態(tài)的系統(tǒng)運行信息,很大程度上依賴值班運維人員的經(jīng)驗水平,且對異常故障的處理,缺乏有效的手段。另一方面由于對已發(fā)生的異常故障缺少分析總結(jié),沒有將一些典型故障處理整理形成大數(shù)據(jù),在系統(tǒng)運行分析、處理缺陷等工作時缺少決策依據(jù),延長了故障處理時間,對系統(tǒng)安全穩(wěn)定運行帶來隱患。
3 集中智能監(jiān)控系統(tǒng)的結(jié)構(gòu)與功能
集中智能監(jiān)控主要是采集與自動化業(yè)務(wù)系統(tǒng)相關(guān)的設(shè)備運行狀態(tài)信息,包括機房服務(wù)器、小型機、UPS、系統(tǒng)主機、網(wǎng)絡(luò)設(shè)備等。系統(tǒng)結(jié)構(gòu)設(shè)計符合電力系統(tǒng)二次安全防護體系要求,在II區(qū)、III區(qū)設(shè)置采集服務(wù)器,通過合理的通訊方式,以串口通訊、網(wǎng)絡(luò)通訊或其他通訊方式采集各系統(tǒng)設(shè)備的相關(guān)信息,數(shù)據(jù)采集、分析服務(wù)器通過SNMP等方式對被管理設(shè)備運行狀態(tài)進行實時采集、分析處理。將分析結(jié)果在II區(qū)內(nèi)以C/S方式展示,并將III區(qū)用戶關(guān)心的結(jié)果數(shù)據(jù)穿過正反向隔離等裝置,在III區(qū)以B/S方式呈現(xiàn),系統(tǒng)結(jié)構(gòu),(如圖1所示)
數(shù)據(jù)采集、分析服務(wù)器:數(shù)據(jù)采集子系統(tǒng)通過各種不同接口適配器,從各種被管理對象處采集信息,進行相應(yīng)處理、報警,并存儲在數(shù)據(jù)庫中。信息采集包括交換機、路由器、小型機、服務(wù)器、UPS等。
服務(wù)器、小型機:系統(tǒng)為UNIX、LINUX、WINDOWS等平臺,信息采集為主機運行狀態(tài)相關(guān)的所有信息,采集信息包括電源、風扇、網(wǎng)卡、內(nèi)存、CPU、磁盤空間、日志文件、重要進程、服務(wù)、端口等。接口可以是網(wǎng)絡(luò)、RS485/232等,信息采集方式可以采用Agent代理、SNMP協(xié)議。
路由器、交換機:網(wǎng)絡(luò)設(shè)備監(jiān)視包括路徑發(fā)現(xiàn)、網(wǎng)絡(luò)流量、設(shè)備性能。接口可以是網(wǎng)絡(luò)、RS485/232等,信息采集方式可以采用Agent代理、SNMP協(xié)議等,采集信息包括:累計運行時間、CPU利用率、內(nèi)存利用率、端口狀態(tài)、鏈路狀態(tài)、日志文件、網(wǎng)絡(luò)流量、丟包率等。
UPS電源:UPS設(shè)備采用Modbus等協(xié)議,接口可以是網(wǎng)絡(luò)、RS485/232等,采集信息包括:市電中斷、轉(zhuǎn)旁路、模塊故障等。
安全設(shè)備:包括防火墻、專用隔離裝置等。
4 集中智能監(jiān)控技術(shù)應(yīng)用的意義
通過調(diào)度機房設(shè)備智能監(jiān)控技術(shù)的應(yīng)用:(1)改變了以往運維人員挨個機柜逐一、逐項巡視設(shè)備運行參數(shù)的傳統(tǒng)方式,提升了日常巡視的高效性。(2)由于智能監(jiān)控系統(tǒng)的實時性,使得運維人員無需進入機房巡視便能第一時間發(fā)現(xiàn)設(shè)備出現(xiàn)的異常、故障告警,提升了故障響應(yīng)的及時性。(3)借助智能監(jiān)控系統(tǒng)平臺自身強大的數(shù)據(jù)庫存儲、分析功能,將一些典型故障處理整理形成大數(shù)據(jù),給運維人員提供參考決策依據(jù)。使得運維人員在處理典型故障時,更容易對故障的進行分析、定位處理,縮短了故障處理時間,提升了處理缺陷的準確性。同時后續(xù)可根據(jù)需要進行功能擴展,接入機房相關(guān)設(shè)備,如:精密空調(diào)、視頻探頭、溫度感應(yīng)器、火災報警器等。
5 結(jié)語
隨著調(diào)度機房設(shè)備集中智能監(jiān)控技術(shù)的應(yīng)用,維護人員不僅能夠以更加安全、可靠、高效的新模式管理機房運行設(shè)備,同時也進一步提升了電力調(diào)度自動化系統(tǒng)的日常運行管理整體水平。
參考文獻:
[1]李穎.機房監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)[J].中國科技信息,2010(13).
[2]王銘銘,李衛(wèi)華.B/S機房監(jiān)控系統(tǒng)的開發(fā)與實現(xiàn)[J].現(xiàn)代計算機(專業(yè)版),2005(07).
[3]白榮建.機房監(jiān)控的設(shè)計原則和現(xiàn)存問題[J].中國傳媒科技,2009(09).
[4]駱文忠.電力二次系統(tǒng)安全防護體系運行分析[J].寧夏電力,2008(S1).