呂德奎 崔艷軍
摘要:隨著信息化系統(tǒng)建設(shè)發(fā)展,IT設(shè)備不斷增加,部門業(yè)務(wù)捆綁的日益緊密帶來了管理分散、信息孤島等問題。基于面向?qū)ο蟮脑O(shè)計思想,分析了IT設(shè)備管理對象、IT設(shè)備與部門業(yè)務(wù)的聯(lián)系,詳細設(shè)計了消息服務(wù)總線、面向?qū)ο髷?shù)據(jù)庫以及平臺功能等關(guān)鍵技術(shù),設(shè)計并實現(xiàn)了自動化綜合運維監(jiān)管平臺。實際應(yīng)用表明,平臺具有靈活的可擴展能力,為定制化開發(fā)提供了有力的數(shù)據(jù)支持,提高了綜合監(jiān)管的靈敏度,降低了開發(fā)成本。
關(guān)鍵詞:信息運維;消息總線;對象數(shù)據(jù)庫;關(guān)鍵監(jiān)控指標
DOIDOI:10.11907/rjdk.151167
中圖分類號:TP319
文獻標識碼:A 文章編號:16727800(2015)006009103
基金項目基金項目:
作者簡介作者簡介:呂德奎(1983-),男,山東菏澤人,碩士,中國電子科技集團公司第二十八研究所工程師,研究方向為公安領(lǐng)域信息化建設(shè);崔艷軍(1988-),女,山東菏澤人,碩士,中國電子科技集團公司第二十八研究所助理工程師,研究方向為公安領(lǐng)域信息化建設(shè)。
0 引言
我國信息系統(tǒng)建設(shè)發(fā)展很快,不乏如ERP、CRM、財務(wù)、營銷等核心軟件,電信、電力、公安等單位更是建設(shè)了多達上百個正在運行的應(yīng)用系統(tǒng)。隨著政府、企事業(yè)信息部門建設(shè)需求的不斷拓展,新的系統(tǒng)陸續(xù)上線投入運行。信息化在提升核心競爭力的同時,對其基礎(chǔ)軟硬件環(huán)境的支撐能力也提出了越來越高的要求。一方面提供信息服務(wù)的IT軟硬件種類與數(shù)量不斷增加;另一方面,IT軟硬件的運行和企事業(yè)各部門業(yè)務(wù)的捆綁越來越緊密。IT軟硬件承擔(dān)的責(zé)任越來越重,對信息部門的系統(tǒng)安全、運營和維護管理也提出了更高要求,迫切需要綜合性、自動化的綜合運維監(jiān)管系統(tǒng)[12]對其進行支撐。
自動化綜合運維監(jiān)管平臺是一個一體化、綜合性的監(jiān)控與調(diào)度平臺,涉及服務(wù)器、中間件、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、安全設(shè)備、數(shù)據(jù)庫等基礎(chǔ)設(shè)備與軟件的實時運行狀況及統(tǒng)計分析,平臺建設(shè)目標是建立一個穩(wěn)定、高效、靈活的信息系統(tǒng)運行監(jiān)控和調(diào)度管理平臺,為企業(yè)各信息系統(tǒng)正常運行提供有力支撐,提高運行效率及服務(wù)質(zhì)量,降低運營成本。
本文利用面向?qū)ο笏枷?,提出了適用于多行業(yè)信息部門的綜合運維監(jiān)管平臺。對系統(tǒng)設(shè)計目標作了闡述,對架構(gòu)和功能進行了詳細設(shè)計。在某大型物聯(lián)網(wǎng)示范園進行了應(yīng)用,較好地解決了信息調(diào)度管理分散、管理效率不高的問題,為類似工程提供了建設(shè)思路。
1 設(shè)計目標及原則
1.1 設(shè)計目標
系統(tǒng)目標可分解為3個層次:
(1)實時性:①實時掌握信息設(shè)備、信息系統(tǒng)的運行情況;②及時發(fā)現(xiàn)故障與異常,并迅速定位,盡快解決;③及時發(fā)現(xiàn)入侵、病毒等安全問題及安全隱患,并迅速響應(yīng);④通過運行分析,調(diào)整運行策略,提高系統(tǒng)運行效率;⑤通過安全分析,調(diào)整安全策略,提高系統(tǒng)安全性。
(2)可靠性:①通過流程保證故障、異常、隱患由合適的人采用合適的方式閉環(huán)處理;②促進巡檢、變更工作的標準化、規(guī)范化;③通過流程運行考核,促進運維質(zhì)量和運維效率的提高。
(3)指導(dǎo)性:①優(yōu)化現(xiàn)有信息基礎(chǔ)設(shè)施運行性能;②提升系統(tǒng)安全性,降低安全風(fēng)險;③預(yù)測并計劃信息基礎(chǔ)設(shè)施需求;④考核并不斷提升服務(wù)水平。
1.2 設(shè)計原則
(1)充分利用現(xiàn)有產(chǎn)品及技術(shù)。在信息運維領(lǐng)域,已有大量的指導(dǎo)理論以及適用于不同管理域的各種產(chǎn)品,從管理域的角度可分為:網(wǎng)絡(luò)管理產(chǎn)品、系統(tǒng)(主機、數(shù)據(jù)庫、中間件)管理產(chǎn)品、應(yīng)用管理產(chǎn)品、安全管理產(chǎn)品等。上述產(chǎn)品分別在網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用與安管等領(lǐng)域提供了成型的解決方案。系統(tǒng)設(shè)計一方面要汲取現(xiàn)有的技術(shù)與經(jīng)驗,另一方面要兼顧已有系統(tǒng)實際,在現(xiàn)有產(chǎn)品與技術(shù)的基礎(chǔ)上,創(chuàng)新構(gòu)建自動化綜合運維監(jiān)管平臺。
(2)充分利用已有項目建設(shè)經(jīng)驗。這些項目奠定了理論與實踐基礎(chǔ),積累了建設(shè)實施經(jīng)驗。
2 系統(tǒng)設(shè)計
本文從基礎(chǔ)設(shè)備、應(yīng)用系統(tǒng)和數(shù)據(jù)資產(chǎn)3個方面進行統(tǒng)一設(shè)計,采用面向?qū)ο蟮脑O(shè)計思想、開放式的SOA架構(gòu)[3],該模式一方面支持異構(gòu)數(shù)據(jù)源,另一方面最大限度地把物理模型轉(zhuǎn)為邏輯模型,適用于多廠家數(shù)據(jù)集成,具備靈活的動態(tài)擴展性。
2.1 頂層架構(gòu)設(shè)計
根據(jù)已有IT運維系統(tǒng)建設(shè)成功經(jīng)驗,結(jié)合本平臺的特點以及未來信息化發(fā)展預(yù)測,需建立一個與業(yè)務(wù)無關(guān)的綜合集成服務(wù)框架,在此之上構(gòu)建綜合視圖、專項監(jiān)控視圖、管理人員視圖等分類業(yè)務(wù)功能組件,以達到快速響應(yīng)業(yè)務(wù)需求變更的目的。平臺分層架構(gòu)如圖1所示。
統(tǒng)一消息服務(wù)總線:提供消除不同應(yīng)用之間的技術(shù)差異,讓不同的應(yīng)用服務(wù)器協(xié)調(diào)運作,實現(xiàn)不同服務(wù)之間的通信與整合;統(tǒng)一信息庫:提供統(tǒng)一的監(jiān)控對象屬性配置數(shù)據(jù)、數(shù)據(jù)字典索引和各類關(guān)鍵績效指標數(shù)據(jù)(KPI);統(tǒng)一查詢視圖:在統(tǒng)一信息庫基礎(chǔ)上建立統(tǒng)一的Oracle視圖數(shù)據(jù)管理,簡化邏輯轉(zhuǎn)換;監(jiān)管對象化管理:依據(jù)邏輯視圖上的監(jiān)管對象對各類IT設(shè)備資產(chǎn)進行組件化開發(fā);統(tǒng)一展現(xiàn):通過權(quán)限或席位分配,不同角色訪問不同監(jiān)管對象組件。
2.2 消息服務(wù)總線設(shè)計
SOA系統(tǒng)有3種基礎(chǔ)組件:消息服務(wù)總線、信息轉(zhuǎn)換/處理引擎和數(shù)據(jù)存儲庫,其中因為消息服務(wù)總線是所有其它組件交互的中介,所以是最重要的組成部分。本文通過使用消息服務(wù)總線,為ERP、CRM等應(yīng)用提供一個平臺,實現(xiàn)無關(guān)的服務(wù)接口,可以在不更改或少量更改代碼的情況下,以一種無縫的非侵入方式使企業(yè)已有的系統(tǒng)具有全新的服務(wù)接口,如圖2所示。
消息服務(wù)總線是一種通信工具,可以在機器之間互相傳輸消息、文件等。本文利用消息總線把各被監(jiān)控對象產(chǎn)生的指標數(shù)據(jù)向消息總線發(fā)出,由消息接收方進行數(shù)據(jù)接收、轉(zhuǎn)換以及保存到數(shù)據(jù)庫操作。為了避免消息丟失,平臺對消息總線提供了一定的持久化存儲和災(zāi)備功能。
2.3 面向?qū)ο髷?shù)據(jù)庫設(shè)計
面向?qū)ο髷?shù)據(jù)庫[4],把面向?qū)ο蟮姆椒ê蛿?shù)據(jù)庫技術(shù)結(jié)合起來,可以使數(shù)據(jù)庫系統(tǒng)的分析、設(shè)計最大程度地與人們對客觀世界的認識相一致。本系統(tǒng)中采用Hibernate和Oracle相結(jié)合的形式實現(xiàn)面向?qū)ο髷?shù)據(jù)庫存儲。
根據(jù)要管理的基礎(chǔ)設(shè)備、應(yīng)用系統(tǒng)和數(shù)據(jù)資產(chǎn)3大類數(shù)據(jù),采用模型化細化為:網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、存儲設(shè)備、機房動力設(shè)備、機房消防設(shè)備、門禁、安全設(shè)備、中間件、數(shù)據(jù)庫以及應(yīng)用系統(tǒng)等10類模型,并采用Hibernate對象與Oracle數(shù)據(jù)表進行相互映射。相對不變的內(nèi)容,如采購時間、設(shè)備名稱等以對象靜態(tài)屬性的方式存在數(shù)據(jù)庫表內(nèi),采用橫表實現(xiàn);另外一些變化頻繁的,如服務(wù)器的CPU利用率、磁盤利用率、應(yīng)用系統(tǒng)使用狀況等內(nèi)容以關(guān)鍵指標(KPI)的形式保存在數(shù)據(jù)庫表內(nèi),采用總表實現(xiàn)。關(guān)鍵指標和模型對象之間采用字典進行索引與管理,模型對象產(chǎn)生的數(shù)據(jù)稱為資產(chǎn)數(shù)據(jù),關(guān)鍵指標產(chǎn)生的數(shù)據(jù)分為實時數(shù)據(jù)和歷史數(shù)據(jù)兩類,關(guān)系表如圖3所示。
2.4 自動化運維功能設(shè)計
根據(jù)信息化系統(tǒng)建設(shè)特點,自動化綜合運維將10類模型數(shù)據(jù)統(tǒng)一監(jiān)管、綜合展現(xiàn),實現(xiàn)相關(guān)性影響分析等功能。本文在運用面向?qū)ο笏枷雽T運維資源進行對象模型化拆分、屬性信息規(guī)劃后,結(jié)合平臺建設(shè)目標,從最終用戶角度把平臺應(yīng)用細分如下幾大功能區(qū):
(1)運行監(jiān)管。以圖形視圖和頁面相結(jié)合的方式,綜合展現(xiàn)信息運維的不同緯度實施監(jiān)控,包括:網(wǎng)絡(luò)拓撲、網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)鏈路、網(wǎng)絡(luò)端口、數(shù)據(jù)庫、中間件、服務(wù)器等實時運行指標數(shù)據(jù)及對象模型的屬性配置數(shù)據(jù)。
(2)應(yīng)用監(jiān)管。主要從系統(tǒng)運行、業(yè)務(wù)數(shù)據(jù)的層面,對公司重要的業(yè)務(wù)系統(tǒng)進行統(tǒng)一監(jiān)管。監(jiān)管的業(yè)務(wù)系統(tǒng)內(nèi)容主要包括:系統(tǒng)配置數(shù)據(jù)、性能數(shù)據(jù)、關(guān)鍵指標、在線人數(shù)、業(yè)務(wù)拓撲關(guān)系等反映業(yè)務(wù)系統(tǒng)運行和實用化現(xiàn)狀的信息。
(3)安全監(jiān)管。通過監(jiān)管安全事件數(shù)量、病毒感染機器種類、最新漏洞統(tǒng)計、地域風(fēng)險等數(shù)據(jù),反映園區(qū)設(shè)備與系統(tǒng)運行的安全狀況。
(4)機房監(jiān)管。通過監(jiān)管機房的動力設(shè)備、環(huán)境設(shè)備、門禁等資源的實時溫度、濕度、門禁異常等指標,反映機房當(dāng)前運行的安全狀況。
(5)運維監(jiān)管。從企業(yè)運維的角度出發(fā),通過運維服務(wù)時產(chǎn)生的工作單、工單解決率、工單解決時長等關(guān)鍵指標,綜合分析以反映企業(yè)運維現(xiàn)狀。
3 實際應(yīng)用
物聯(lián)網(wǎng),即“物物相聯(lián)之網(wǎng)”,指通過射頻識別(RFID)、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定的協(xié)議,把物與物、人與物進行智能化連接,進行信息交換和通信,以實現(xiàn)智能化識別、定位、跟蹤、控制和管理的一種新興網(wǎng)絡(luò)。物聯(lián)網(wǎng)不是一種物理上獨立存在的完整網(wǎng)絡(luò),而是架構(gòu)在現(xiàn)有互聯(lián)網(wǎng)或下一代公網(wǎng)或私網(wǎng)基礎(chǔ)上的聯(lián)網(wǎng)應(yīng)用和通信,強調(diào)智能應(yīng)用。
南京某大型物聯(lián)網(wǎng)示范園建設(shè)了一套面向主題的大型統(tǒng)一信息庫,主要集成10大類模型關(guān)鍵監(jiān)控指標數(shù)據(jù)于一體,基本實現(xiàn)了信息運維工作的規(guī)范和統(tǒng)一。在此基礎(chǔ)上,進行了平臺的實際應(yīng)用,采集了多個原始關(guān)鍵指標:服務(wù)器指標數(shù)20余個、數(shù)據(jù)庫指標數(shù)30余個、中間件指標50余個、網(wǎng)絡(luò)設(shè)備類指標近100個等。通過對原始關(guān)鍵數(shù)據(jù)的進一步分析,平臺實現(xiàn)了設(shè)備類之間的關(guān)聯(lián)統(tǒng)計、關(guān)聯(lián)分析、故障定位和綜合展現(xiàn)。
設(shè)備采集到的信息通過搭建好的局域網(wǎng)或廣域網(wǎng),將信息上傳至網(wǎng)管服務(wù)器。通過與IT綜合管理系統(tǒng)實時聯(lián)動,利用智能分析和影響度關(guān)聯(lián)技術(shù),將機房環(huán)境中的溫濕度、漏水、電源、UPS、煙霧、視頻監(jiān)控、消防及門禁等,與用戶的網(wǎng)絡(luò)設(shè)備、應(yīng)用、服務(wù)等IT 資源關(guān)聯(lián)在一起,并完整集成到業(yè)務(wù)模型。通過智能業(yè)務(wù)模型,系統(tǒng)將自動對各項業(yè)務(wù)以及承載業(yè)務(wù)的各個設(shè)備、服務(wù)器、應(yīng)用等資源進行全面分析,在業(yè)務(wù)結(jié)構(gòu)中清晰反映機房環(huán)境對整體業(yè)務(wù)的影響程度。任何一個業(yè)務(wù)中的細小變化和端倪,都能通過系統(tǒng)實時組合成數(shù)據(jù)或信息,進行實時直觀展現(xiàn),如整體業(yè)務(wù)健康度、可用率等。當(dāng)機房環(huán)境出現(xiàn)異常時,系統(tǒng)則會根據(jù)不同的異常等級進行告警,并通過多種告警方式及時通知運維人員,從而保障各設(shè)備、業(yè)務(wù)系統(tǒng)的高效運行,大大降低了業(yè)務(wù)系統(tǒng)運行風(fēng)險。
系統(tǒng)將采集的數(shù)據(jù)在IT綜合管理系統(tǒng)的監(jiān)控指標列表中集中展示。通過指標一覽,可以直觀了解各指標的類型、當(dāng)前值、當(dāng)前狀態(tài)、異常規(guī)則、監(jiān)控頻度等。不僅如此,用戶還可以通過增加示意圖元、示意鏈路的方式建立示意拓撲圖來模擬機房實際物理環(huán)境,將機房環(huán)境實時展現(xiàn)。通過機房示意拓撲圖,可以了解到機房環(huán)境中的溫度、濕度、漏水、煙霧探測、視頻、消防設(shè)備、空調(diào)與門禁等設(shè)備的運行情況和分布情況。另外,還可以根據(jù)每個示意圖元的顏色狀態(tài)來判斷該設(shè)備的異常等級情況。當(dāng)設(shè)備發(fā)生故障時,在機房示意拓撲圖上可以直觀看到相關(guān)設(shè)備的異常提示,直接點擊異常設(shè)備則可以自動關(guān)聯(lián)到該設(shè)備的詳細信息。
通過建立綜合運維監(jiān)管系統(tǒng),本平臺主要解決了以下幾個關(guān)鍵問題:
(1)基于面向主題的統(tǒng)一信息庫,解決了數(shù)據(jù)管理分散的問題。在此之前,各個部門、各個業(yè)務(wù),根據(jù)自身需要建立了越來越多的應(yīng)用系統(tǒng),采購了大量的IT設(shè)備,這些設(shè)備和應(yīng)用系統(tǒng)運行環(huán)境各異、管理部門分散,很難做到集中管理、集中運維,通過此綜合監(jiān)管平臺建設(shè),在一定程度上解決了管理分散的問題。
(2)基于展現(xiàn)視圖組件化構(gòu)建,解決了不同管理層次的數(shù)據(jù)展示需求。綜合監(jiān)管平臺涉及大量的跨部門、跨平臺的各類監(jiān)控數(shù)據(jù),系統(tǒng)面向?qū)ο髲墓靖鲗宇I(lǐng)導(dǎo)到基層一線運維人員及管理員等,通過組件化的視圖實現(xiàn)方式,針對不同的人員實現(xiàn)不同的展現(xiàn)需要。
(3)基于統(tǒng)一信息庫面向?qū)ο髷?shù)據(jù),解決了故障根源定位、故障影響范圍分析等問題。每個設(shè)備告警或系統(tǒng)運行告警,均不同程度影響其它設(shè)備運行,通過建立綜合監(jiān)管平臺,采用面向?qū)ο笾黧w監(jiān)控數(shù)據(jù),能夠很方便地梳理出告警的根源、產(chǎn)生原因以及解決方案建議,甚至能夠分析出告警的影響范圍。
4 結(jié)語
本文探討了數(shù)字化園區(qū)綜合監(jiān)管運維系統(tǒng)的對象化建設(shè)問題。把監(jiān)控設(shè)備資產(chǎn)與軟件進行對象模型化處理,一方面有利于與第三方廠家進行數(shù)據(jù)集成,另一方面有利用適應(yīng)各種復(fù)雜的桌面終端展現(xiàn)應(yīng)用。各行各業(yè)在信息化建設(shè)達到一定標準后,發(fā)展方向和發(fā)展重點即轉(zhuǎn)入綜合監(jiān)管平臺建設(shè),這是信息化建設(shè)的一個重要階段性標志。隨著綜合應(yīng)用的日益成熟,綜合監(jiān)管建設(shè)技術(shù)也將更加先進、應(yīng)用也將更加深入、綜合性也會更強。
參考文獻:
[1]壽增.調(diào)度自動化運維監(jiān)管系統(tǒng)的設(shè)計與應(yīng)用[J].電力信息與通信技術(shù), 2014(2):2629.
[2]孫建慶.信息系統(tǒng)運維綜合監(jiān)管平臺設(shè)計[J].電力信息化,2009(3):125128.
[3]劉翔,劉家紅.基于SOA架構(gòu)的公安應(yīng)用集成平臺的研究與實現(xiàn)[J].計算機工程與設(shè)計,2007(18):2830.
[4]陸寧,馬智亮.利用面向?qū)ο髷?shù)據(jù)庫與關(guān)系數(shù)據(jù)庫管理IFC數(shù)據(jù)的比較[J].清華大學(xué)學(xué)報:自然科學(xué)版,2012(6):119123.
責(zé)任編輯(責(zé)任編輯:杜能鋼)