[林勝龍]
動(dòng)環(huán)監(jiān)控系統(tǒng)是電信通信系統(tǒng)及近年大量建設(shè)的互聯(lián)網(wǎng)數(shù)據(jù)中心極其重要的支撐系統(tǒng)。經(jīng)過(guò)30多年的發(fā)展,大大減輕動(dòng)力維護(hù)人員的工作強(qiáng)度,提升業(yè)務(wù)效率。但經(jīng)過(guò)多年的建設(shè)和使用發(fā)現(xiàn)仍存在忽略的隱患及改善的問(wèn)題。對(duì)這些問(wèn)題的重視才能避免偶然性致命的故障。
電信機(jī)房除接入網(wǎng)設(shè)備間、無(wú)線基站外,監(jiān)控系統(tǒng)數(shù)據(jù)傳輸網(wǎng)絡(luò)已全面使用城域網(wǎng)傳輸。但在某些局站特別是偏遠(yuǎn)中小型局站,動(dòng)環(huán)監(jiān)控傳輸網(wǎng)絡(luò)與營(yíng)業(yè)廳或辦公網(wǎng)絡(luò)共用匯聚交換機(jī)。而部分匯聚交換機(jī)使用無(wú)保障的交流供電。在設(shè)計(jì)時(shí)未能考慮到一旦出現(xiàn)市電停電,發(fā)電機(jī)又無(wú)法及時(shí)自啟動(dòng)時(shí),通過(guò)此類(lèi)型交換機(jī)接入的監(jiān)控系統(tǒng)將全面癱瘓。維護(hù)人員不能及時(shí)判斷監(jiān)控系統(tǒng)的通信故障是網(wǎng)絡(luò)故障引起的還是由于電力系統(tǒng)故障引起的。
在監(jiān)控系統(tǒng)規(guī)劃設(shè)計(jì)時(shí),應(yīng)考慮監(jiān)控系統(tǒng)上聯(lián)接口應(yīng)接入到有電源保障、可靠性高的核心網(wǎng)絡(luò)設(shè)備中,且監(jiān)控系統(tǒng)其他網(wǎng)絡(luò)接入設(shè)備均應(yīng)使用UPS(Uninterruptible Power System,不間斷電源)保障或電池保障的直流設(shè)備供電。保證即使出現(xiàn)市電故障或電源設(shè)備故障,在故障初期能及時(shí)反映出現(xiàn)場(chǎng)的實(shí)際問(wèn)題。改造方案如圖1所示,原有動(dòng)環(huán)監(jiān)控交換機(jī)至接入交換機(jī)的虛線連接拆除,改為動(dòng)環(huán)監(jiān)控系統(tǒng)交換機(jī)到匯聚交換機(jī)的實(shí)現(xiàn)。
圖1 動(dòng)環(huán)監(jiān)控系統(tǒng)網(wǎng)絡(luò)改造圖
在建設(shè)動(dòng)環(huán)監(jiān)控系統(tǒng)時(shí),監(jiān)控系統(tǒng)自身的電源均來(lái)自UPS或高頻開(kāi)關(guān)電源。在大型的通信局站或IDC(Internet Data Center,互聯(lián)網(wǎng)數(shù)據(jù)中心),由于規(guī)模較大建設(shè)周期長(zhǎng),設(shè)備分批投入使用。監(jiān)控系統(tǒng)亦隨著被監(jiān)控設(shè)備的增加而不斷擴(kuò)大,監(jiān)控采集設(shè)備也增多。因?yàn)榻ㄔO(shè)時(shí)間的差異及工程項(xiàng)目大小不同。在設(shè)計(jì)上容易忽略或缺失監(jiān)控電源容量的考慮。監(jiān)控施工單位往往就近接入原有的監(jiān)控設(shè)備電源,從而形成整個(gè)監(jiān)控系統(tǒng)通過(guò)單一的總電源獲取電能。隨著監(jiān)控設(shè)備增多,設(shè)備老化,容易出現(xiàn)單點(diǎn)故障,最終整個(gè)監(jiān)控系統(tǒng)因?yàn)槟硞€(gè)設(shè)備故障而崩潰。改造前監(jiān)控系統(tǒng)供電方案如圖2所示。
圖2 單一供電的動(dòng)環(huán)監(jiān)控系統(tǒng)
針對(duì)這個(gè)問(wèn)題,在規(guī)劃監(jiān)控系統(tǒng)時(shí)應(yīng)作出安排?,F(xiàn)在通信電源系統(tǒng)已采用分散供電為主。一個(gè)局站已具有多套電源系統(tǒng)。在進(jìn)行配套電源系統(tǒng)監(jiān)控接入時(shí),亦應(yīng)當(dāng)增加監(jiān)控系統(tǒng)的電源分布,使監(jiān)控系統(tǒng)形成多個(gè)供電點(diǎn),減少各個(gè)監(jiān)控子系統(tǒng)的范圍,從而減少監(jiān)控系統(tǒng)掉電的風(fēng)險(xiǎn)范圍。改造后供電方案如圖3所示。
此外動(dòng)環(huán)監(jiān)控系統(tǒng)十分重要的監(jiān)測(cè)設(shè)備是低壓設(shè)備,特別是市電進(jìn)線系統(tǒng)。近年來(lái)低壓配電設(shè)備均配備智能電量?jī)x表(簡(jiǎn)稱(chēng)智能電表)提供給監(jiān)控系統(tǒng)獲取市電數(shù)據(jù)。而設(shè)計(jì)監(jiān)控系統(tǒng)時(shí),忽略了一個(gè)因素。大部分智能電表取電來(lái)自監(jiān)測(cè)的市電。當(dāng)市電掉電時(shí),智能電表也因此失電而無(wú)法工作。對(duì)監(jiān)控系統(tǒng)而言只能監(jiān)測(cè)到智能電表通信故障,而不是直接的市電的電量信息。同樣柴油發(fā)電機(jī)的低壓配電柜也存在類(lèi)似問(wèn)題。
圖3 分散供電的動(dòng)環(huán)監(jiān)控系統(tǒng)
對(duì)于智能電表的上述問(wèn)題,應(yīng)從智能電表電源入手。對(duì)于重要或全部的智能電表供電應(yīng)來(lái)自有保障的監(jiān)控系統(tǒng)電源。即使在設(shè)備電源關(guān)閉或不工作時(shí),監(jiān)控系統(tǒng)仍能監(jiān)測(cè)當(dāng)時(shí)的電量數(shù)據(jù)。
設(shè)備的數(shù)量亦隨之大幅增加,監(jiān)控系統(tǒng)的測(cè)點(diǎn)數(shù)量也大幅增加。監(jiān)控系統(tǒng)并發(fā)處理告警的能力是否足夠,對(duì)監(jiān)控系統(tǒng)在關(guān)鍵時(shí)刻運(yùn)行有很大影響。如遇到極端氣候?qū)е麓竺娣e停電,單一局站或區(qū)域并發(fā)數(shù)千條告警時(shí),系統(tǒng)告警判別能力,上報(bào)時(shí)間是否及時(shí),是否出現(xiàn)遺留和延誤都需要在設(shè)計(jì)時(shí)考慮及投入使用前測(cè)試確認(rèn)。
在建設(shè)監(jiān)控系統(tǒng)選擇監(jiān)控系統(tǒng)供應(yīng)商時(shí),應(yīng)考慮根據(jù)其網(wǎng)絡(luò)及軟件架構(gòu),內(nèi)部數(shù)據(jù)處理方式,判斷其提供的監(jiān)控軟件和架構(gòu)是否具有大規(guī)模并發(fā)告警的處理能力,并在驗(yàn)收時(shí)通過(guò)模擬進(jìn)行測(cè)試確認(rèn)。大規(guī)模并發(fā)告警不常見(jiàn),但一旦出現(xiàn)如系統(tǒng)能力不足將直接導(dǎo)致系統(tǒng)癱瘓。
隨著企業(yè)的減員增效,人員壓縮、運(yùn)維制度的改變導(dǎo)致同一機(jī)房存在不同管理人員的情況。目前監(jiān)控系統(tǒng)難于分離出不同維護(hù)單位的數(shù)據(jù)。同時(shí),維護(hù)和管理體系中的人員也有各自的數(shù)據(jù)需求。維護(hù)人員更關(guān)心設(shè)備運(yùn)行的實(shí)時(shí)數(shù)據(jù)、狀態(tài)和告警等信息。管理人員更著重設(shè)備的容量、負(fù)荷、資源和系統(tǒng)的趨勢(shì)信息。
如果監(jiān)控軟件平臺(tái)使用監(jiān)控?cái)?shù)據(jù)與用戶前端界面無(wú)需緊密關(guān)聯(lián)的方式。用戶前端界面可以根據(jù)業(yè)務(wù)需求和人員需求進(jìn)行設(shè)備的選擇配置。靈活地配置出不同人員終端監(jiān)控不同的設(shè)備數(shù)據(jù)。
一般監(jiān)控系統(tǒng)以動(dòng)環(huán)設(shè)備方式顯示運(yùn)行數(shù)據(jù),未能顯示出設(shè)備間的關(guān)系及層次影響關(guān)系。需要使用人員對(duì)現(xiàn)場(chǎng)設(shè)備和環(huán)境比較熟悉。但作為軟件系統(tǒng)如果能減少使用人員分析的時(shí)間,從而縮短故障處理的時(shí)間,可以提高系統(tǒng)的利用價(jià)值。
監(jiān)控系統(tǒng)應(yīng)可以根據(jù)需求切換不同的應(yīng)用界面,如告警出來(lái)時(shí)可提供供電拓?fù)鋱D有助維護(hù)人員評(píng)估當(dāng)前設(shè)備故障影響的范圍并選擇適當(dāng)?shù)膫溆梅桨附鉀Q問(wèn)題。后續(xù)透過(guò)切換設(shè)備詳細(xì)測(cè)點(diǎn)分析及定位問(wèn)題設(shè)備的故障原因。
無(wú)論IDC機(jī)房或傳統(tǒng)機(jī)房都會(huì)經(jīng)常性的對(duì)設(shè)備進(jìn)行保養(yǎng)、維護(hù)、維修、工程改造等各種固定的或臨時(shí)性的設(shè)備關(guān)停。如中央空調(diào)系統(tǒng)、柴油發(fā)電機(jī)組機(jī)油更換、電池更換、UPS或直流電源電池充放電測(cè)試、高低壓設(shè)備維護(hù)等。在進(jìn)行這方面操作時(shí),難免會(huì)觸發(fā)監(jiān)控系統(tǒng)的告警。為避免因?yàn)榫S護(hù)或工程原因帶來(lái)的告警影響正常設(shè)備的監(jiān)控,監(jiān)控軟件應(yīng)實(shí)現(xiàn)在維護(hù)或工程狀態(tài)的設(shè)備快速屏蔽。并且對(duì)已屏蔽設(shè)備,有故障設(shè)備,正常通信的設(shè)備應(yīng)能有所區(qū)別顯示。此外已屏蔽告警的設(shè)備應(yīng)有時(shí)間段設(shè)置,避免脫離維護(hù)或工程狀態(tài)的設(shè)備長(zhǎng)期處于屏蔽狀態(tài)而脫離監(jiān)控保護(hù)。
隨著電信企業(yè)對(duì)通信機(jī)房及設(shè)備節(jié)能越來(lái)越重視,早期建設(shè)的監(jiān)控系統(tǒng)更著重采集被監(jiān)測(cè)設(shè)備的運(yùn)行狀態(tài)和數(shù)據(jù)的采集,而忽視設(shè)備能耗的數(shù)據(jù)采集。到現(xiàn)在增加節(jié)能系統(tǒng)需采集電能數(shù)據(jù)時(shí),由于動(dòng)環(huán)系統(tǒng)或設(shè)備未在新建時(shí)加裝智能電表,設(shè)備投入使用后加裝智能電表往往需要停電才能實(shí)現(xiàn),給在用設(shè)備帶來(lái)風(fēng)險(xiǎn)。特別時(shí)IDC機(jī)房,由于用戶不同或重要程度不用,服務(wù)器設(shè)備不是所有設(shè)備都是雙電源保障。即使配備裝電源設(shè)備,客戶亦不輕易容許任何一路電源斷電。為改造帶來(lái)困難。
在新建機(jī)房時(shí),考慮節(jié)能系統(tǒng)需要,中央空調(diào)主機(jī)、各類(lèi)水泵、水塔、風(fēng)機(jī)、精密空調(diào)、機(jī)房IT用電的配電柜配備電能計(jì)量功能的智能電表。同時(shí)為方便維護(hù)及維修。對(duì)智能電表的操作或更換應(yīng)無(wú)需斷開(kāi)配電開(kāi)關(guān)即可操作。另一方面目前IDC建設(shè)亦重視PUE值的計(jì)算,各系統(tǒng)的智能電表測(cè)量令系統(tǒng)PUE值的計(jì)算更準(zhǔn)確。
節(jié)能系統(tǒng)對(duì)中央空調(diào)運(yùn)行數(shù)據(jù)采樣其中一項(xiàng)是要采集中央空調(diào)中的水流量數(shù)據(jù)。該數(shù)據(jù)在原有動(dòng)環(huán)監(jiān)控系統(tǒng)中極少進(jìn)行采樣,即使是中央空調(diào)主機(jī)設(shè)備廠家也很少能提供。因?yàn)樵黾铀髁繖z測(cè)數(shù)據(jù)往往需要對(duì)水管進(jìn)行破壞性加裝傳感器,即使使用超聲波的水流量傳感器也因?yàn)閮r(jià)格高昂,而且不破壞水管也要破壞水管的保溫層而難于實(shí)施。所以在新建中央空調(diào)系統(tǒng)時(shí)需將水量流量檢測(cè)納入監(jiān)控系統(tǒng)采樣清單中。
對(duì)節(jié)能系統(tǒng)來(lái)說(shuō),高耗電的設(shè)備主要是空調(diào)設(shè)備,要實(shí)現(xiàn)節(jié)能又要保障機(jī)房溫度在合適范圍內(nèi),這就要求業(yè)務(wù)機(jī)房安裝溫濕度監(jiān)控設(shè)備應(yīng)在兼顧性能和造價(jià)基礎(chǔ)上確定安裝位置和數(shù)量。為提高機(jī)房送冷的效率,目前業(yè)務(wù)機(jī)房已大量使用冷熱通道封閉系統(tǒng)。溫濕度監(jiān)測(cè)設(shè)備應(yīng)均勻分布,高效地實(shí)現(xiàn)接近實(shí)際的空間溫度采樣。
動(dòng)環(huán)監(jiān)控系統(tǒng)從最初的實(shí)現(xiàn)動(dòng)力設(shè)備運(yùn)行監(jiān)控、環(huán)境監(jiān)控功能,逐步趨向附加更多的增值功能。利用過(guò)動(dòng)環(huán)監(jiān)控網(wǎng)絡(luò)及數(shù)據(jù)采樣,實(shí)現(xiàn)節(jié)能、設(shè)備的資源管理、監(jiān)控?cái)?shù)據(jù)分發(fā)。從單一的設(shè)備監(jiān)控,向智能設(shè)備巡檢,立體化展示、監(jiān)控?cái)?shù)據(jù)的大數(shù)據(jù)分析、專(zhuān)家系統(tǒng)故障分析方向發(fā)展。所有這些增值功能都需要建立在前端數(shù)據(jù)采集完備,準(zhǔn)確的基礎(chǔ)上。在動(dòng)環(huán)監(jiān)控系統(tǒng)規(guī)劃建設(shè)時(shí),應(yīng)根據(jù)未來(lái)的這些功能需求特點(diǎn),做好設(shè)計(jì)規(guī)劃。在當(dāng)前資金受限時(shí),需要考慮未來(lái)增加功能時(shí)預(yù)留接口,能快速簡(jiǎn)便的實(shí)現(xiàn)。
特別是監(jiān)控軟件方面,現(xiàn)場(chǎng)維護(hù)人員與管理人員的需求同時(shí)兼顧好?,F(xiàn)場(chǎng)維護(hù)人員更希望直觀快捷的定位問(wèn)題所在,最好能提供問(wèn)題的原因和解決方法。管理人員則希望了解設(shè)備總體運(yùn)行情況,掌握設(shè)備的利用率,設(shè)備資源情況,維護(hù)人員處理故障的效率考核等。另一方面如IDC使用服務(wù)的用戶也會(huì)有獲取租用機(jī)房或機(jī)柜的設(shè)備環(huán)境運(yùn)行情況的需求。監(jiān)控軟件系統(tǒng)設(shè)計(jì)時(shí)應(yīng)考慮提供靈活的軟件接口實(shí)現(xiàn)數(shù)據(jù)的分發(fā),又要保證系統(tǒng)的效率和安全。
電信企業(yè)除了功能需求外,系統(tǒng)投資方面也提出了越來(lái)越高的要求。如何經(jīng)濟(jì)地投入實(shí)現(xiàn)最多的功能,避免重復(fù)的設(shè)備投入也是在規(guī)劃時(shí)統(tǒng)籌考慮的。各動(dòng)力系統(tǒng)設(shè)計(jì)時(shí)都獨(dú)立的進(jìn)行,而動(dòng)環(huán)監(jiān)控時(shí)貫穿在各個(gè)系統(tǒng)之間的,在設(shè)計(jì)時(shí)考慮監(jiān)控接入問(wèn)題對(duì)節(jié)約投資是大又可為的。如配電柜哪些必須采用智能電表,哪些可以采集機(jī)械電表等最大節(jié)約投資及減少后期改造式的投入。