呼倫貝爾市人才流動人事考試中心 李全忠
計算機機房運行物理環(huán)境自動監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)
呼倫貝爾市人才流動人事考試中心 李全忠
計算機機房是保證信息系統(tǒng)可靠運行非常重要的一個環(huán)節(jié),它的必須保證能為放置于其中的各種設(shè)備提供一個安全可靠的物理環(huán)境,動力供應。這些物理環(huán)境的保證都是通過計算機機房的各種輔助設(shè)備的安全可靠運行實現(xiàn)的。本文較詳細說明了實現(xiàn)計算機機房安全運行物理環(huán)境自動監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)的原理,并且在了呼倫貝爾市勞動保障數(shù)據(jù)機房得到了成功的應用。
計算機機房;物理環(huán)境;安全運行;自動監(jiān)控
計算機機房是為用于電子信息處理、存儲、交換完成信息處理過程的各類電子信息設(shè)備提供運行環(huán)境的場所。對電力、溫濕度、新風等特理環(huán)境參數(shù)有著極其嚴格的要求,必須依據(jù)《國家電子信息系統(tǒng)機房設(shè)計規(guī)范》要求的相應計算機機房等級提供符合標準的運行環(huán)境物理參數(shù)。一旦機房環(huán)境的輔助設(shè)備出現(xiàn)故障,將會使電力、溫濕度、新風等參數(shù)偏離正常值,直接影響計算機系統(tǒng)的正常運行,對數(shù)據(jù)傳輸、存儲的可靠性構(gòu)成威脅。如事故嚴重又不能及時處理,就可能損壞硬件設(shè)備,造成嚴重后果。需要實時交換的數(shù)據(jù)機房,管理更為重要,一旦系統(tǒng)故障,造成的經(jīng)濟損失是不可估量的。目前國內(nèi)普遍缺乏機房環(huán)境設(shè)備的專業(yè)管理人員,在許多地方的機房不得不安排軟件人員或者不太熟悉機房設(shè)備員值班維護,這對機房的安全運行無疑又是一個不利因素。
因此,隨著工控技術(shù)的發(fā)展和管理水平的提高,實現(xiàn)機房動力環(huán)境集中監(jiān)控管理是一個必然的趨勢。計算機機房物理環(huán)境的集中監(jiān)控系統(tǒng),就是為解決機房設(shè)備的統(tǒng)一監(jiān)控,實現(xiàn)機房的無人職守,減輕計算機機房維護人員負擔,提高了計算機機房動力環(huán)境及物理環(huán)境的可靠性,保證事故的及時發(fā)現(xiàn)、準確定位,同時對系統(tǒng)設(shè)備的歷史日志進行記錄和管理,為設(shè)備的日后維護提供重要的參考,因而機房物理環(huán)境自動監(jiān)控系統(tǒng)對機房的科學管理有特殊的意義。
本文闡述的機房物理環(huán)境自動監(jiān)控系統(tǒng)可對配電系統(tǒng)、UPS、柴油發(fā)電機、蓄電池組、開關(guān)電源、空調(diào)、漏水、消防、保安等設(shè)備做統(tǒng)一的集中監(jiān)控,另外在技術(shù)條件許可的前提下,可以根據(jù)用戶的要求定制監(jiān)控任務,對機房的上下限溫度、濕度、供電參數(shù)進行實時采集。
整個機房安全運行自動監(jiān)控系統(tǒng)遵循系統(tǒng)工程原理進行設(shè)計,綜合運用分布處理架構(gòu)、Client/Server組織形式、數(shù)據(jù)管理技術(shù)、多媒體的表現(xiàn)方法、工控領(lǐng)域的模塊化組態(tài)設(shè)計技術(shù)、人工智能計算機輔助決策技術(shù),采用先進的軟、硬件設(shè)備,進行系統(tǒng)集成,保證系統(tǒng)在可靠性、實時性、開放性、易用性等方面滿足設(shè)備及環(huán)境監(jiān)控的需要,總體設(shè)計依據(jù)以下基本的原則:可靠、穩(wěn)定、實用、功能完整、操作簡便、安全性、系統(tǒng)開放性、具有擴展性、網(wǎng)絡化功能。
原則1:可靠性
系統(tǒng)硬件以專業(yè)的工業(yè)監(jiān)控產(chǎn)品為主,包括主機、采集模塊都要有嚴格的質(zhì)量保證,確保性能的可靠性,MFB>20萬小時。
原則2:實用性
在系統(tǒng)功能上力求實用,在保證功能完整的基礎(chǔ)上來豐富畫面的靈活性和人性化。
原則3:功能完整
在系統(tǒng)功能上,盡量要利用現(xiàn)有成熟技術(shù),確保系統(tǒng)的功能完整,如在原有聲光報警的方式上,增加利用電話語音技術(shù)而開發(fā)的電話語音報警系統(tǒng),利用多媒體語音系統(tǒng)開發(fā)的現(xiàn)場語音報警系統(tǒng)系統(tǒng);歷史記錄查詢功能,所有歷史曲線、報警記錄均可查詢,數(shù)據(jù)記錄時間根據(jù)硬盤容量可存儲數(shù)年;故障處理技術(shù)支持文件,以便在故障發(fā)生時管理人員能夠迅速作出1個判斷,為減輕損害盡可能節(jié)約寶貴時間;提升機房動力環(huán)境設(shè)備安全管理水平、提高管理效率,建立人員全面負責跨科目負責,能夠全面監(jiān)測機房。
原則4:操作簡便
結(jié)合實際使用的需求組成集中監(jiān)控系統(tǒng),將所有功能操作簡便化,使用戶只需填寫“YES”“NO”或“1、2、3….”即可完成大部分管理功能。
原則5:安全性
在所有涉及登錄和修改系統(tǒng)參數(shù)、系統(tǒng)報警與否、啟動和關(guān)閉監(jiān)控系統(tǒng)等操作均需要密碼才可執(zhí)行,而且根據(jù)管理權(quán)限可以設(shè)置不同的管理級別。
原則6:系統(tǒng)的開放性
系統(tǒng)采用COM技術(shù),配有設(shè)備自動連接向?qū)?,支持多種現(xiàn)場總線、PLC、智能儀表、采集板、智能模塊、變頻器等;全面支持OPC標準,可與任何支持該接口的硬件完美通訊;內(nèi)嵌SQL Server系統(tǒng),支持開放式數(shù)據(jù)接口(ODBC),自由管理各種標準的數(shù)據(jù)庫,除COM外還提供動態(tài)數(shù)據(jù)交換(DDE),很方便用戶利用PC機豐富的軟件資源擴充系統(tǒng)的功能。
原則7:具有擴展性
通對智能和非智能設(shè)備通過通訊或加裝硬件的方式很容易實現(xiàn)系統(tǒng)的擴容,而且對不同種設(shè)備、不同的廠家輕易實現(xiàn)集成和后期集成,包括機房的保安監(jiān)控系統(tǒng)、門禁監(jiān)控系統(tǒng)、供配電系統(tǒng)、UPS系統(tǒng)、柴油機系統(tǒng)、有源諧波濾波系統(tǒng)、精密空調(diào)系統(tǒng)、溫濕度檢測系統(tǒng)、漏水檢測系統(tǒng)、消防報警系統(tǒng)等。
原則8:網(wǎng)絡化
提供基于廣域網(wǎng)和局域網(wǎng)的B/S/S模式的網(wǎng)絡化監(jiān)控,參數(shù)瀏覽及監(jiān)控功能。
系統(tǒng)由遠程用戶計算機、環(huán)境監(jiān)控主機(服務器)、計算機網(wǎng)絡、智能模塊、遠程模塊、協(xié)議轉(zhuǎn)換模塊、信號處理模塊、多設(shè)備驅(qū)動卡及智能設(shè)備等組成。(詳見圖1)
現(xiàn)場結(jié)構(gòu)主要采用RS485工業(yè)監(jiān)控總線為主要傳輸模式,采用TCP/IP與串行協(xié)議混合集成的為補傳輸方式,系統(tǒng)整體采用開放式結(jié)構(gòu),支持各種傳輸網(wǎng)絡,三層客戶機/服務器(Client/Server)體系結(jié)構(gòu),“三層”是將應用功能分為表示層、功能層和數(shù)據(jù)層3部分??蛻艚K端(網(wǎng)絡端Client)與服務器(現(xiàn)場端Server)之間的通信方式為符合TCP/IP標準的自定義數(shù)據(jù)包。
圖1 計算機機房特理環(huán)境自動監(jiān)控系統(tǒng)結(jié)構(gòu)圖
監(jiān)控主機是本地系統(tǒng)的監(jiān)控中心,在WIN2000運行在環(huán)境下。根據(jù)用戶需要可監(jiān)控低壓配電系統(tǒng)、UPS電源系統(tǒng)、空調(diào)系統(tǒng)、環(huán)境系統(tǒng)等運行狀態(tài)及環(huán)境系統(tǒng)狀態(tài),以數(shù)據(jù)的形式進入各自的RS485總線后,接入監(jiān)控主機的設(shè)備驅(qū)動板。
要求監(jiān)控主機365*24小時工作,監(jiān)控主機系統(tǒng)必須可靠,應采用專業(yè)工控機為監(jiān)控主機,如果系統(tǒng)要求更可靠,可以采用雙機熱備方式。由端口數(shù)據(jù)處理量不大,因此對監(jiān)控主機的配置要求不高但是必須穩(wěn)定。
數(shù)據(jù)采集模塊用于采集監(jiān)控模擬量、開關(guān)量等信號,將信號傳輸給監(jiān)控主機。數(shù)據(jù)采集包括模擬量采集模塊(模擬量采集單元Q-7000C),智能開關(guān)量采集模塊(數(shù)據(jù)采集模塊Q-7000D),監(jiān)控輸出模塊包括開關(guān)量及模擬量監(jiān)控輸出模塊(數(shù)據(jù)轉(zhuǎn)換單元Q-7000C)。數(shù)據(jù)采集與監(jiān)控模塊一般采用RS485通訊接口,可以遠傳。傳感器模塊用于采集現(xiàn)場環(huán)境數(shù)據(jù),為系統(tǒng)處理提供依據(jù),協(xié)議轉(zhuǎn)換模塊為智能設(shè)備及儀表提供接入系統(tǒng)的標準接口。
客戶機(也可稱為網(wǎng)絡分機),用于機房管理員實時讀取、查閱監(jiān)控的數(shù)據(jù)。通過TCP/IP與主機建立通訊,傳輸途徑不限。設(shè)備一般可以是普通電腦、工控機、或移動訪問,其實質(zhì)為安裝了訪問軟件的PC電腦。
以系統(tǒng)組成結(jié)構(gòu)圖為主線,按監(jiān)控的設(shè)備(詳見表1)依次對各部分進行詳細分解設(shè)計。由于本文以實現(xiàn)對各終端設(shè)備的集中監(jiān)控為主,所以重點闡述自主監(jiān)控服務器開始到終端的監(jiān)控,對于局域網(wǎng)及廣域部分不做說明。
表1 監(jiān)控明細表
表2
表3 專用空調(diào)監(jiān)控系統(tǒng)內(nèi)容及配置表
4.1.1 市電運行監(jiān)控
通過在總輸入柜加裝2臺德國西門子全參數(shù)電量監(jiān)測儀,可以對市電3相電壓、電流、功率、頻率、電度等常規(guī)電量進行監(jiān)測,通過對市電運行參數(shù)的實時監(jiān)測,可以準確記錄并且保存,對于電壓波動、停電、缺相、失壓等異常情況記錄、打印、并通知相關(guān)管理人員。
4.1.2 開關(guān)狀態(tài)監(jiān)控
監(jiān)視UPS輸入柜、輸出柜內(nèi)主開關(guān)和支路開關(guān)狀態(tài)。對于機房內(nèi)重要的配電開關(guān),因為每路開關(guān)都分別負擔著重要設(shè)備的供電,一旦開關(guān)跳閘,會造成很大的影響,實時監(jiān)測有利于異常情況準確定位、及時處理,遠程報警。
實現(xiàn)方式是通過配電柜開關(guān)的輔助接點引信號至開關(guān)量采集模塊,即“0、1”狀態(tài)量采集模塊,然后由監(jiān)控主機集中采集監(jiān)控,實現(xiàn)的要點是各空開必須留有余量點,以備監(jiān)控開關(guān)量模塊使用。
柴油發(fā)電機作為機房備用電的一個重要組成部分,其日常維護完好與否直接關(guān)系著主機房后備電力的應急供應,油機必須始終處于待機狀態(tài)。而其位置一般遠離機房,所以其工作狀態(tài)必須通過遠程實現(xiàn)實時監(jiān)控。以防止柴油機故障或蓄電池耗盡的緊急情況油機造成發(fā)電機不能啟動,對其監(jiān)控十分必要。
實現(xiàn)方式是通過中大型的柴油發(fā)電機按標準工控協(xié)議提供的遠程監(jiān)控編程接口,按照其約定的數(shù)據(jù)通迅方式將油機電壓、電流、頻率、功率、引擎溫度、水溫、蓄電池狀態(tài)等重要特性進行實時監(jiān)測,周時可以通過編制按鈕遠程起停油機。
對UPS的運行參數(shù)和狀態(tài)進行實時監(jiān)控,實現(xiàn)方式是通過對UPS主機的通迅接口加裝協(xié)議轉(zhuǎn)換器,在監(jiān)控機上按UPS約定的通迅方式進行通訊軟件的開發(fā),將每組UPS的整流器、逆變器、電池、旁路、負載等五部分的運行狀態(tài)與參數(shù)通過網(wǎng)絡傳至監(jiān)控中心,集中監(jiān)控,異常的遠程報警。顯示采取圖表及流程圖方式(提取的參數(shù)見表2)。
通過空調(diào)的智能接口實現(xiàn)對ALTUS精密機房智能空調(diào)的實時監(jiān)控,監(jiān)控空調(diào)各部件(壓縮機、風機、加熱器、加濕器、去濕器、濾網(wǎng)等)的運行狀態(tài)與參數(shù),并可遠程修改設(shè)置與開關(guān)空調(diào)。
對于ATLAS空調(diào)一般通過監(jiān)控系統(tǒng)可以獲得如下數(shù)據(jù)及報警(參見表3)
對于面積大的機房,必須有漏水報警系統(tǒng)。水敏探頭易布置在機房地板下易出水點周圍,確保一旦漏水報警的可靠性,檢測方式有多種,可以根據(jù)使用環(huán)境的不同自由選擇。
本設(shè)計中采用法國TTK線纜式漏水檢測系統(tǒng)。系統(tǒng)本身包括:漏水監(jiān)控器、漏水感應線及其他輔助設(shè)備,系統(tǒng)可檢測感應線上任何點的漏水位置并有語音報警。感應線纜為特種橡膠制成,抗腐蝕,抗酸堿。系統(tǒng)功能完善,對感應線有斷線報警功能。系統(tǒng)還可檢測機房潔凈度,當感應線上的塵埃集結(jié)到一定厚度,系統(tǒng)會報警提示管理人員清洗感應線纜。當任意點漏水發(fā)生時,水流經(jīng)過感應線纜,在極短的時間內(nèi)(40S)之內(nèi)發(fā)生告警。同時,集中監(jiān)控系統(tǒng)通過數(shù)字變量模塊采集報警信息,計算機房集中監(jiān)控系統(tǒng)準確的將報警信息彈出同時電話報警,以便及時消除隱患,避免巨大損失。
對于面積較大的機房,由于氣流及設(shè)備分布的影響,溫濕度值會有較大的區(qū)別,根據(jù)主機房實際面積,按照平均分布的原則設(shè)置溫度、濕度探測器最后以總線方式匯總至集中監(jiān)控系統(tǒng),以確保主機房溫濕度監(jiān)控的準確度。同時,不要遺忘在UPS配電間、柴油發(fā)電間溫濕度一體化傳感器。通過RS485總線將實時的各探頭所在位置的溫度,傳回集中監(jiān)控系統(tǒng),當超過設(shè)定值自動進行本地和遠程電話同時報警。
利用廠家提供的基于標準工控協(xié)議,根據(jù)其規(guī)定的通迅控制方法,實現(xiàn)對新風機的遠程起??刂?、運行參數(shù)獲取、故障報警信息的集中獲取。
消防報警系統(tǒng)是一套完整的系統(tǒng),按國家消防有關(guān)規(guī)定,基于消防系統(tǒng)的特殊性,必須獨立運行。所以在集中監(jiān)控系統(tǒng)中對消防系統(tǒng)只是作為一個補充,即在系統(tǒng)原有配置不動,只從報警監(jiān)控器將開關(guān)信號引入監(jiān)控主機,搭載整體監(jiān)控系統(tǒng)報警平臺,配合消防系統(tǒng)實現(xiàn)遠程的記錄和電話報警。
按照計算機房和消防系統(tǒng)設(shè)計的有關(guān)規(guī)范要求,計算機機房的空調(diào)、新風、排風系統(tǒng)應與自動消防系統(tǒng)具備系統(tǒng)聯(lián)動功能?;谙老到y(tǒng)的特殊性、可靠性要求,這種聯(lián)動必須由消防自動控制系統(tǒng)自身實現(xiàn)。所以在設(shè)計機房物理環(huán)境自動監(jiān)控系統(tǒng)時,切不可基于集中監(jiān)控系統(tǒng)實現(xiàn)新風、空調(diào)、排風系統(tǒng)的聯(lián)動,只能對報警信號采集,同時實現(xiàn)輔助報功能。
由于每個機房的場地、輔助設(shè)備不盡相同,所以在進行集中監(jiān)控系統(tǒng)設(shè)計首先要依據(jù)計算機的機房的規(guī)范確定其等級,了解計算機機房的設(shè)計及輔助設(shè)備選型,進行實地現(xiàn)場考察。同設(shè)備廠商進行接洽,了解設(shè)備的接口標準、控制協(xié)議做好系統(tǒng)組態(tài)的前期準備。盡可能將設(shè)備廠家提供的故障報錯原因、故障處理措施,在告警發(fā)生時詳盡描述彈出,以便值班人員能夠得到即時的技術(shù)支持。
集中監(jiān)控系統(tǒng)所有使用的協(xié)議轉(zhuǎn)換器、電纜、開關(guān)量模塊、監(jiān)控主機等全部硬件設(shè)備選擇品牌時一定要慎重,基本要求平均無故障時間要大于20萬小時。對于要求特別高的A級機房,為了確保集中監(jiān)控系統(tǒng)可靠性,還應采取Watch Dog等防死機技術(shù),關(guān)鍵的監(jiān)控主機、轉(zhuǎn)換模塊應采取冗余方式構(gòu)建。
基于電話語音告警CTI技術(shù)。采用電話CALL CETER技術(shù)、數(shù)字語音轉(zhuǎn)換技術(shù),對各種設(shè)備的報警及專家處理提示采用語音系統(tǒng)。報警產(chǎn)生時,系統(tǒng)會自動撥打所設(shè)置的號碼(手機、BB機自動留言、電話),采用語音通知有關(guān)人員,并將告警做報表記錄,并且可以回撥到監(jiān)控主機查詢報警及電話通知情況。
采取C/S/S模式的實現(xiàn)基于WEB發(fā)布方式遠程監(jiān)視機房運行情況,當發(fā)電話報警時管理可以通互聯(lián)網(wǎng)或是專網(wǎng)終端進行報警信息的查詢,以便及時采取合適的處置措施。
在安全管理方面,要通過劃分、配置操作權(quán)限,實現(xiàn)系統(tǒng)安全管理,并且以次做管理人員操作日志,確保系統(tǒng)運行安全。
機房安全運行自動監(jiān)控系統(tǒng)的投入對勞動保障數(shù)據(jù)中心機房的安全管理有了極大的提高,對勞動保障數(shù)據(jù)系統(tǒng)可靠的運行和管理提供了可靠的保障,實現(xiàn)了計算機機房無人職守。
[1]李華.MCS-51系列單片機實用接口技術(shù)[M].北京:北京航天航空大學出版社,1993.
[2]何立民.單片機應用技術(shù)選編<1>[M].北京:北京航天航空大學出版社,1993.
李全忠(1974—),男,內(nèi)蒙古扎蘭屯人,大學本科,電子工程師,呼倫貝爾市勞動保障數(shù)據(jù)中心副主任,研究方向:工業(yè)自動化控制應用,政務信息系統(tǒng)規(guī)劃、設(shè)計、實施建設(shè)。