盧方建
(陽(yáng)江市婦幼保健院,廣東 陽(yáng)江 529500)
zabbix 設(shè)備監(jiān)管系統(tǒng)是一個(gè)基于WEB 界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級(jí)的開源解決方案。zabbix 能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng);并提供靈活的通知機(jī)制以讓系統(tǒng)管理員快速定位/解決存在的各種問(wèn)題。zabbix 由2 部分構(gòu)成,zabbixserver 與可選組件zabbixagent。
zabbixserver 可以通過(guò)SNMP,zabbixagent,ping,端口監(jiān)視等方法提供對(duì)遠(yuǎn)程服務(wù)器/網(wǎng)絡(luò)狀態(tài)的監(jiān)視,數(shù)據(jù)收集等功能,它可以運(yùn)行在Linux,Solaris,HP-UX,AIX,F(xiàn)reeBSD,OpenBSD,OSX 等平臺(tái)上。
我院采用獨(dú)立zabbixserver 模式,不對(duì)監(jiān)控設(shè)備安裝zabbixagent,通過(guò)開通監(jiān)控設(shè)備的SNMP 端口來(lái)進(jìn)行管理,zabbixserver 服務(wù)器旁路接入到內(nèi)網(wǎng)核心交換機(jī)。設(shè)備監(jiān)控系統(tǒng)分配與業(yè)務(wù)數(shù)據(jù)不沖突的新網(wǎng)段,針對(duì)每一個(gè)被監(jiān)控的設(shè)備都分配一個(gè)新的唯一的管理IP,所有設(shè)備都需要一個(gè)新的網(wǎng)線接管理端口,匯聚到一臺(tái)獨(dú)立的交換機(jī)中,以便統(tǒng)一管理。
各樓層網(wǎng)絡(luò)交換機(jī),每周進(jìn)行兩次人工巡查,通過(guò)到設(shè)備現(xiàn)場(chǎng)打開弱電井的門,觀察設(shè)備的信號(hào)燈是否正常來(lái)判斷運(yùn)作是否正常;還有被動(dòng)地接收業(yè)務(wù)科室的反饋,如果哪層病區(qū)出現(xiàn)網(wǎng)絡(luò)不通,特別是成片的網(wǎng)絡(luò)故障,就要考慮可能是層樓交換機(jī)出故障,然后人工到現(xiàn)場(chǎng)排查,通過(guò)使用網(wǎng)線和筆記本電腦接入設(shè)備管理端口,登錄管理界面來(lái)查看設(shè)備狀態(tài),如果出現(xiàn)異常,就手動(dòng)重啟設(shè)備,如果問(wèn)題依舊,就聯(lián)系設(shè)備供應(yīng)商提供技術(shù)支援。
信息中心機(jī)房的服務(wù)器,每天兩次人工機(jī)房巡查,通過(guò)各服務(wù)器的背面的網(wǎng)線信號(hào)燈和服務(wù)器前的故障信號(hào)燈來(lái)判斷服務(wù)器是否運(yùn)行正常,信號(hào)燈只是一個(gè)正常與否的提醒,如果出現(xiàn)異常顏色燈,或者燈光異常閃爍,也需要通過(guò)網(wǎng)線接入服務(wù)器的管理端口和連接筆記本電腦來(lái)排查故障具體情況。筆記本需要設(shè)定和服務(wù)器同一網(wǎng)段,再接入通過(guò)web 登錄到管理界面,查看詳情。網(wǎng)絡(luò)管理端口因設(shè)備品牌的不同而不同,例如HPE服務(wù)器的是iLO端口,H3C 服務(wù)器的是HDM 端口,華為服務(wù)器和交換機(jī)以及聯(lián)想服務(wù)器都是MGMT 端口。
各樓層的交換機(jī)設(shè)備和信息中心機(jī)房的服務(wù)器都通過(guò)接通了管理端口的網(wǎng)線組成一個(gè)管理網(wǎng)絡(luò),通過(guò)布置zabbixserver 服務(wù)器來(lái)統(tǒng)一管理。zabbix是一個(gè)強(qiáng)大的設(shè)備監(jiān)管系統(tǒng),采用B/S 模式,任何一臺(tái)內(nèi)網(wǎng)終端,都可以通過(guò)瀏覽器web 登錄到管理平臺(tái)上,方便高效。所有要監(jiān)控的設(shè)備都在平臺(tái)上注冊(cè),成為一臺(tái)目標(biāo)主機(jī)。平臺(tái)通過(guò)SNMP 端口,讀取交換機(jī)或者服務(wù)器上的運(yùn)行情況,必要時(shí)可進(jìn)行如重啟、關(guān)機(jī)等管理操作,同時(shí)還會(huì)對(duì)設(shè)備的歷史狀態(tài)進(jìn)行保留,運(yùn)行日志進(jìn)行保存。如果設(shè)備出現(xiàn)了故障警報(bào),之前要去到現(xiàn)場(chǎng)查看信號(hào)燈,但是現(xiàn)在只需在平臺(tái)上輸入該主機(jī)的管理IP 或者主機(jī)名,搜索定位到該主機(jī),就能看到主機(jī)的所有告警信息,并為信息劃分嚴(yán)重等級(jí):信息、警告、一般嚴(yán)重、嚴(yán)重和災(zāi)難。搜索時(shí)候也可以通過(guò)嚴(yán)重等級(jí)加以篩選,只留下嚴(yán)重和災(zāi)難的信息,以便我們迅速定位到緊急處理點(diǎn)。
除了zabbixserver 提供的web 管理平臺(tái),還可以遠(yuǎn)程登錄設(shè)備的維護(hù)管理界面。每一臺(tái)設(shè)備都分配了一個(gè)與之相應(yīng)的管理ip,在任一臺(tái)內(nèi)網(wǎng)終端輸入管理ip,通過(guò)輸入預(yù)設(shè)的賬號(hào)口令,就能登錄該設(shè)備的管理界面,一般情況下,我們先在消息匯總的zabbix 管理平臺(tái)查看消息,如果某臺(tái)主機(jī)出現(xiàn)故障,需要查看詳情,就通過(guò)管理ip 登錄該服務(wù)器管理界面來(lái)看詳情。例如我們有一臺(tái)pacs 數(shù)據(jù)服務(wù)器出現(xiàn)了一個(gè)嚴(yán)重問(wèn)題,系統(tǒng)描述是“Systemstatusisincriticalstate”意思是“系統(tǒng)狀態(tài)為緊急狀態(tài)”,這是一個(gè)籠統(tǒng)的描述,所以我們進(jìn)入服務(wù)器管理界面,以HPE 的服務(wù)器為例,Gen9 版本,一般都是看SystemInformation 一欄,這里能看到系統(tǒng)狀態(tài)信息總覽,“storge”和“smartstoragebatterystatus”狀態(tài)都是“DEGRADED”,就表明設(shè)備存儲(chǔ)的智能存儲(chǔ)電池出現(xiàn)了“降級(jí)、退化”,可能電池電量不足了,也可能損壞了,這種情況會(huì)導(dǎo)致存儲(chǔ)隨時(shí)會(huì)出現(xiàn)工作異常,數(shù)據(jù)丟失,從而影響業(yè)務(wù)正常運(yùn)作。
zabbix 還支持告警消息郵件發(fā)送功能,通過(guò)設(shè)置用戶中的“報(bào)警媒介”,把需要通知的郵箱加進(jìn)去,接收的時(shí)間,和事件的嚴(yán)重程度都可以選擇,一般運(yùn)維人員選擇到一般嚴(yán)重,主任則選擇到嚴(yán)重和災(zāi)難,這樣比較合理。
Zabbix 設(shè)備監(jiān)管系統(tǒng)功能強(qiáng)大,操作簡(jiǎn)單,在不影響服務(wù)器和交換機(jī)正常運(yùn)行的前提下,達(dá)到很好的監(jiān)控效果,是我單位整體信息化設(shè)備管理的重要工具,系統(tǒng)能降低我們?nèi)肆Τ杀荆岣吖收习l(fā)生的反應(yīng)時(shí)間和應(yīng)急能力,雖然不能完全依賴和代替人工,但是也可適當(dāng)降低機(jī)房巡查頻率。系統(tǒng)還有很多功能還沒發(fā)掘,相信在不斷深入的探索應(yīng)用,將會(huì)發(fā)揮更大的作用。