鄭 凱,李秉哲
(1.山東黃河河務(wù)局信息中心,山東 濟南 250011;2.濟南黃河河務(wù)局供水局,山東 濟南 250032)
隨著信息技術(shù)的不斷完善和廣泛應(yīng)用,加快了山東黃河信息化建設(shè)進程,黃河人的工作方式發(fā)生了巨大變化,各項工作對信息化的依賴程度越來越強,隨之而來的運維管理孤島現(xiàn)象也日益突出,嚴重影響了治黃業(yè)務(wù)的開展,運維工作的“一站式”信息化管理平臺急需建立。
目前,山東黃河信息通信系統(tǒng)網(wǎng)絡(luò)重要機房包括山東黃河信息中心機房、省局網(wǎng)管中心機房和濼口通信站機房,機房里各種各樣的IT硬件設(shè)備,不同類型的系統(tǒng)需要維護,沒有統(tǒng)一的管理平臺,現(xiàn)有的管理工具功能太分散,只能對應(yīng)單點功能,不能實現(xiàn)信息的共享。
山東黃河目前的運維處理方式主要依靠人工運維,機房管理大都采用工作人員定時巡查的方式,這種方式不能時時全面監(jiān)控和掌握機房及系統(tǒng)情況,由于系統(tǒng)業(yè)務(wù)多,人員數(shù)量、精力有限,缺乏真正的主動問題管理,以及性能趨勢預(yù)測和應(yīng)急準(zhǔn)備,管理效率低下。
雖然部分管理系統(tǒng)設(shè)置了各種管理流程,但許多是通過執(zhí)行人員人工操作來完成的,沒有實現(xiàn)自動化管理過程。服務(wù)管理流程的不完善和基本執(zhí)行失敗的重復(fù),使員工應(yīng)接不暇,導(dǎo)致了管理效率低下。
傳統(tǒng)的運維方式只能解決當(dāng)前故障,沒有完善的、規(guī)范化的流程控制管理工具,缺少統(tǒng)一、規(guī)范的指導(dǎo)文檔,很難實現(xiàn)信息系統(tǒng)的統(tǒng)一管理和資源共享。
通過構(gòu)建綜合運維管理平臺建設(shè),可以實現(xiàn)現(xiàn)有機房內(nèi)所有監(jiān)控硬件設(shè)備的集中整合,實現(xiàn)數(shù)據(jù)的統(tǒng)一獲取和處理,通過集中式的管理模式對山東黃河信息化中心的機房環(huán)境和信息化系統(tǒng)中的存儲設(shè)備、服務(wù)器、網(wǎng)絡(luò)交換機、OA辦自動化系統(tǒng)、數(shù)據(jù)庫等的運行狀態(tài)進行統(tǒng)一的監(jiān)控管理,實現(xiàn)機房的無人值守,維護人員能夠全面掌握信息系統(tǒng)的運行狀態(tài),增強運維綜合管理能力。
構(gòu)建機房動力環(huán)境監(jiān)測系統(tǒng),實現(xiàn)對溫度、濕度、煙感、水浸等資源的統(tǒng)一監(jiān)控,并結(jié)合基礎(chǔ)資源的監(jiān)控管理,實現(xiàn)對機房的物理環(huán)境與業(yè)務(wù)服務(wù)的一體化管理,并提供告警和報表功能。
綜合運維監(jiān)控系統(tǒng)通過集中式的管理模式對機房環(huán)境和信息化系統(tǒng)中的服務(wù)器、網(wǎng)絡(luò)交換機、業(yè)務(wù)應(yīng)用系統(tǒng)等設(shè)備的運行狀態(tài)進行統(tǒng)一的監(jiān)控管理和信息系統(tǒng)資源管理,提供有效評價運維質(zhì)量的數(shù)據(jù)統(tǒng)計分析,確保達到“時時監(jiān)控、及時告警、協(xié)同分析、定期統(tǒng)計”的目的,增強運維綜合管理能力。
1)基礎(chǔ)設(shè)施監(jiān)控平臺。通過SNMP等協(xié)議完成對多個機房的傳輸系統(tǒng)、IP層網(wǎng)絡(luò)設(shè)備進行監(jiān)控,對網(wǎng)絡(luò)設(shè)備的基本信息、可用性、性能、配置等指標(biāo)進行采集和管理,幫助管理人員及時發(fā)現(xiàn)故障以及故障隱患。支持配置管理、網(wǎng)絡(luò)拓撲管理、IP地址管理等。平臺主要有網(wǎng)絡(luò)設(shè)備監(jiān)控管理、服務(wù)器監(jiān)控管理、數(shù)據(jù)庫監(jiān)控管理、中間件監(jiān)控管理、J2EE應(yīng)用服務(wù)器監(jiān)控管理、基礎(chǔ)應(yīng)用平臺管理、存儲監(jiān)控管理、綜合可視化等功能。
2)應(yīng)用監(jiān)控平臺。應(yīng)用監(jiān)控平臺從業(yè)務(wù)視角對信息化資源進行管理,提供一頁式業(yè)務(wù)運行概覽視圖,將信息化健康指數(shù)、業(yè)務(wù)雷達實時掃描、業(yè)務(wù)卡片集中在一個頁面內(nèi)進行顯示,通過這個頁面可以了解整體業(yè)務(wù)的健康走勢、業(yè)務(wù)實時運行狀況、告警信息、健康度、繁忙度和可用性等信息。平臺主要包括業(yè)務(wù)服務(wù)概覽、業(yè)務(wù)雷達、業(yè)務(wù)卡片、業(yè)務(wù)服務(wù)一覽、應(yīng)用診斷、指標(biāo)列表、業(yè)務(wù)告警、業(yè)務(wù)應(yīng)用分析、IT健康指數(shù)等功能。
日常維護管理是通過監(jiān)控系統(tǒng)的各項設(shè)備,對流量信息進行分析,對IP資源進行管理,自動完成對選定設(shè)備指標(biāo)的巡檢工作,幫助管理員梳理頻繁變化的虛擬化資源,快速判斷用戶網(wǎng)絡(luò)接入的問題所在,支持對windows日志和syslog日志的監(jiān)控管理,可生成面向運維分析和服務(wù)管理的統(tǒng)計分析,協(xié)助領(lǐng)導(dǎo)層的管理決策。平臺主要包括:告警中心、流量分析、IP地址管理、網(wǎng)絡(luò)配置管理、自動巡檢、資源掃描、日志監(jiān)控管理、端到端追蹤、統(tǒng)計報表等功能。
綜合運維管理平臺的應(yīng)用,將山東黃河駐濟信息通信專網(wǎng)內(nèi)的各個機房動力環(huán)境以及計算機網(wǎng)絡(luò)、數(shù)據(jù)庫、業(yè)務(wù)應(yīng)用等都統(tǒng)一納入到一個監(jiān)控平臺中來,對各種不同來源的數(shù)據(jù)實行統(tǒng)一權(quán)限控制;實現(xiàn)了資源管理系統(tǒng)、業(yè)務(wù)過程和關(guān)鍵業(yè)務(wù)指標(biāo)的監(jiān)控,能及時發(fā)現(xiàn)業(yè)務(wù)異常和問題,可持續(xù)提升系統(tǒng)能力,切實提高了工作效率。