宋昊爽
(石化盈科信息技術(shù)有限責(zé)任公司 北京100007)
隨著信息化快速發(fā)展,尤其是近幾年以信息化帶動(dòng)工業(yè)化、以工業(yè)化促進(jìn)信息化的高層次深度“兩化融合”,信息化已經(jīng)成為企業(yè)集團(tuán)追求可持續(xù)新型發(fā)展模式的重要推力,眾多企業(yè)集團(tuán)已然將信息化上升并作為發(fā)展戰(zhàn)略的重要組成部分。隨之而來的是,企業(yè)集團(tuán)各種生產(chǎn)運(yùn)營、經(jīng)營管理的信息系統(tǒng)越來越多,企業(yè)集團(tuán)的IT資源越來越龐大,結(jié)構(gòu)越來越復(fù)雜,企業(yè)集團(tuán)信息管理部門的運(yùn)維服務(wù)工作面臨前所未有的挑戰(zhàn):如何在有限成本支付的約束下,有效運(yùn)營和管理這些IT資源,提供高質(zhì)量的IT服務(wù),以保障企業(yè)集團(tuán)生產(chǎn)經(jīng)營業(yè)務(wù)正常開展,并為企業(yè)集團(tuán)塑造具有獨(dú)特優(yōu)勢(shì)的競(jìng)爭(zhēng)力。這就必然要求IT運(yùn)營監(jiān)控管理服務(wù)工作本身必須先實(shí)現(xiàn)信息化,必須建立一套與之相配套的IT運(yùn)營監(jiān)控管理技術(shù)平臺(tái),改變?cè)蟹稚⒌摹⒈粍?dòng)的、低效的運(yùn)維管理模式,為企業(yè)集團(tuán)IT資源的集中維護(hù)提供技術(shù)工具、管理手段,切實(shí)提供有效(general)、經(jīng)濟(jì)(economy)、可靠(reliability)、安全(security)(即 GERS)的信息化服務(wù)。
近年來,建設(shè)與應(yīng)用IT運(yùn)營監(jiān)控平臺(tái)也成為眾多企業(yè)集團(tuán)信息管理部門的共識(shí),并為企業(yè)集團(tuán)IT運(yùn)營監(jiān)控管理工作提供了有力支撐。它主要是指對(duì)企業(yè)集團(tuán)各種IT資源的運(yùn)行狀態(tài)進(jìn)行集中監(jiān)控管理,全面可視化展現(xiàn)IT資源的分布與連接關(guān)系,實(shí)時(shí)監(jiān)控IT資源的運(yùn)行狀態(tài),進(jìn)行故障關(guān)聯(lián)處理并準(zhǔn)確定位故障根源,對(duì)IT資源性能趨勢(shì)進(jìn)行量化科學(xué)分析,實(shí)現(xiàn)集中的、主動(dòng)的、高效的IT運(yùn)營管理體系,最終保障企業(yè)集團(tuán)信息基礎(chǔ)架構(gòu)和各種業(yè)務(wù)應(yīng)用的可用性。
隨著數(shù)據(jù)中心、云計(jì)算、物聯(lián)網(wǎng)等新興信息技術(shù)的大行其道,企業(yè)集團(tuán)IT運(yùn)營監(jiān)控管理平臺(tái)本身如何適應(yīng)這些新的技術(shù)環(huán)境、如何對(duì)新技術(shù)架構(gòu)下的IT資源進(jìn)行運(yùn)營和監(jiān)控,成為目前企業(yè)集團(tuán)IT運(yùn)營監(jiān)控管理平臺(tái)建設(shè)和應(yīng)用時(shí)面臨的主要問題與重要挑戰(zhàn)。而要適應(yīng)這些新的IT 環(huán)境,“云化”、“立體化”、“智能化”、“一體化”和“共享服務(wù)化”是IT運(yùn)營監(jiān)控管理平臺(tái)的必然發(fā)展趨勢(shì)和變革方向。
云計(jì)算是企業(yè)集團(tuán)IT的資源池,同時(shí)也是一種IT服務(wù)的新模式,它可以創(chuàng)建和提供應(yīng)用、平臺(tái)以及基礎(chǔ)架構(gòu)等各種公共服務(wù)。由于云計(jì)算具有“要什么、有什么;要什么、給什么”、“優(yōu)化IT資源,實(shí)現(xiàn)按需分配”的優(yōu)勢(shì),已經(jīng)成為信息技術(shù)發(fā)展勢(shì)不可擋的潮流?!督?jīng)濟(jì)學(xué)家》認(rèn)為“云計(jì)算將催生出巨大的力量與財(cái)富”,美林證券預(yù)測(cè):“這股沖擊波將引發(fā)1 600億美元的科技海嘯”。在我國,云計(jì)算應(yīng)用近階段將以政府、電信、教育、醫(yī)療、金融、石油石化和電力等行業(yè)為重點(diǎn),總體投資將從2010年的167.31億元增長到2013年的1 174.12億元,年均復(fù)合增長率達(dá)到91.5%?!丁笆濉眹覒?zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》中更是明確提出:“到2015年,要初步形成符合國情的應(yīng)用模式、標(biāo)準(zhǔn)規(guī)范和安全可靠的產(chǎn)業(yè)體系”。國內(nèi)一些重要企業(yè)集團(tuán)如中國移動(dòng)、中國石化、國家電網(wǎng)等也分別在“十二五”期間規(guī)劃建設(shè)各種基礎(chǔ)云、測(cè)試云、業(yè)務(wù)云。
云計(jì)算資源都要集中于云數(shù)據(jù)中心環(huán)境中,它對(duì)IT運(yùn)營監(jiān)控管理平臺(tái)的直接影響,體現(xiàn)在以下兩個(gè)方面。
一方面要求IT運(yùn)營監(jiān)控管理平臺(tái)從傳統(tǒng)IT資源的管理逐步提升到對(duì)云計(jì)算環(huán)境下的物理資源、虛擬資源、業(yè)務(wù)應(yīng)用的運(yùn)營監(jiān)控管理,如圖1所示。要能幫助運(yùn)維管理人員很好地了解當(dāng)前云計(jì)算環(huán)境的運(yùn)行狀態(tài):有多少虛擬機(jī)正在運(yùn)行?這些云計(jì)算配置是什么樣子?虛擬化環(huán)境是否存在瓶頸?應(yīng)用程序是否被合理分配到虛擬機(jī)?哪些部門使用哪些資源?需要再為虛擬化投入多少資源……
另外一方面,IT運(yùn)營監(jiān)控管理平臺(tái)本身也要 “云化”,也就是說IT運(yùn)營監(jiān)控管理平臺(tái)本身也要逐步遷移并運(yùn)行部署到云數(shù)據(jù)中心、云計(jì)算環(huán)境中,如圖2所示。
傳統(tǒng)認(rèn)為,信息系統(tǒng)結(jié)構(gòu)主要涉及兩個(gè)層次:基礎(chǔ)設(shè)施層和應(yīng)用層?;A(chǔ)設(shè)施層主要是指支撐應(yīng)用系統(tǒng)運(yùn)行的網(wǎng)絡(luò)、安全、服務(wù)器、負(fù)載均衡、存儲(chǔ)等基礎(chǔ)設(shè)施。應(yīng)用層則是指數(shù)據(jù)庫、中間件和ERP、OA及各種生產(chǎn)運(yùn)營、經(jīng)營管理等應(yīng)用軟件系統(tǒng)本身。而在新的虛擬化和云計(jì)算環(huán)境下,除傳統(tǒng)意義上理解的基礎(chǔ)設(shè)施層和應(yīng)用層外,還有另外兩個(gè)層次:數(shù)據(jù)中心基礎(chǔ)環(huán)境層和虛擬化層?;A(chǔ)環(huán)境層是指包括數(shù)據(jù)中心在內(nèi)的配電、UPS、暖通、溫濕度、漏水、布線、機(jī)柜、門禁等基礎(chǔ)環(huán)境和相關(guān)設(shè)施設(shè)備。虛擬化層則是指從物理機(jī)到虛擬機(jī)的轉(zhuǎn)化層。
在云計(jì)算環(huán)境下,IT運(yùn)營監(jiān)控管理平臺(tái)對(duì)應(yīng)也要涉及4個(gè)層次,如圖3所示。對(duì)數(shù)據(jù)中心基礎(chǔ)環(huán)境的狀態(tài)、性能、故障統(tǒng)一監(jiān)控管理,對(duì)支撐應(yīng)用系統(tǒng)運(yùn)行的基礎(chǔ)設(shè)施通斷狀態(tài)、時(shí)延、配置、性能等進(jìn)行統(tǒng)一監(jiān)控管理,對(duì)虛擬機(jī)的配置、容量、性能、故障以及虛擬機(jī)與物理機(jī)的關(guān)聯(lián)關(guān)系進(jìn)行統(tǒng)一監(jiān)控管理,從最終用戶角度,以業(yè)務(wù)為中心對(duì)業(yè)務(wù)系統(tǒng)的可用性、響應(yīng)時(shí)間、業(yè)務(wù)處理效率、處理質(zhì)量、交易數(shù)量等進(jìn)行統(tǒng)一監(jiān)控管理。以上4個(gè)監(jiān)控管理層次中,以業(yè)務(wù)應(yīng)用監(jiān)控為核心,并相互關(guān)聯(lián)、相互支撐,形成一個(gè)有機(jī)整體,切實(shí)實(shí)現(xiàn)對(duì)云環(huán)境下的數(shù)據(jù)中心的全面、多層次、立體式的運(yùn)營監(jiān)控管理服務(wù)。
云計(jì)算技術(shù)下的IT資源無疑比傳統(tǒng)IT設(shè)備的運(yùn)維管理更加復(fù)雜,如果只是單純依靠手工方式來管理,顯然無法滿足對(duì)服務(wù)的動(dòng)態(tài)調(diào)整,也就無法充分體現(xiàn)云計(jì)算的優(yōu)勢(shì)。IT運(yùn)營監(jiān)控管理平臺(tái)要適應(yīng)云計(jì)算環(huán)境,就要朝著智能化方向發(fā)展,成為一個(gè)擁有設(shè)備維護(hù)管理經(jīng)驗(yàn)、綜合優(yōu)化經(jīng)驗(yàn)、故障處理經(jīng)驗(yàn)、性能分析經(jīng)驗(yàn)、主動(dòng)性預(yù)防性維護(hù)經(jīng)驗(yàn)、資源管理經(jīng)驗(yàn)等的運(yùn)營監(jiān)控管理平臺(tái),實(shí)現(xiàn)由低效率的人工處理為主向高效率的自動(dòng)處理為主的轉(zhuǎn)化,實(shí)現(xiàn)故障或問題自動(dòng)發(fā)現(xiàn)、自動(dòng)定位、自動(dòng)處理等功能。云數(shù)據(jù)中心IT運(yùn)營監(jiān)控管理平臺(tái)的智能化至少要體現(xiàn)以下幾個(gè)方面,如圖4所示。
·云資源(計(jì)算資源、內(nèi)存資源、存儲(chǔ)資源等)的智能匹配、部署、分配。
·云服務(wù)的智能編排、部署建立、動(dòng)態(tài)調(diào)整、持續(xù)優(yōu)化。
·云資源運(yùn)行的自動(dòng)化分析、過濾、關(guān)聯(lián)、定位故障根源,自動(dòng)提供預(yù)測(cè)、預(yù)警信息,自動(dòng)發(fā)現(xiàn)隱患問題。
·云資源故障的智能化處理,分析所出現(xiàn)故障的特征,自動(dòng)匹配對(duì)應(yīng)的解決方案,并進(jìn)行自動(dòng)處理和恢復(fù)。
·云資源作業(yè)計(jì)劃的自動(dòng)執(zhí)行,配置和標(biāo)準(zhǔn)化核查的自動(dòng)化,云資源數(shù)據(jù)的統(tǒng)一化、規(guī)范化管理。
·云資源運(yùn)行數(shù)據(jù)的縱向、橫向分析,從縱向看本身特殊性的變化,從橫向看普遍性的變化,自動(dòng)提供優(yōu)化方案。
云數(shù)據(jù)中心的IT運(yùn)營監(jiān)控管理分3個(gè)方面:監(jiān)視、管理和控制,如圖5所示,“監(jiān)、管、控”三者緊密關(guān)聯(lián),邏輯上是一條龍過程,并形成閉合環(huán)路。監(jiān)視的結(jié)果作為依據(jù)來分析、決策和指導(dǎo)IT運(yùn)維工作的進(jìn)行;IT運(yùn)維工作本身需要綜合管理來進(jìn)行規(guī)范和控制;自動(dòng)化運(yùn)維操作將運(yùn)維工作中大量、重復(fù)的勞動(dòng)批量控制,自動(dòng)完成,以節(jié)省人力成本,提高效率。需要監(jiān)視運(yùn)維服務(wù)工作的質(zhì)量和結(jié)果來進(jìn)一步觀察和判斷是否符合工作預(yù)期。
監(jiān)視是我們的眼睛,幫助我們透視和認(rèn)清基礎(chǔ)環(huán)境、基礎(chǔ)設(shè)施、虛擬層、應(yīng)用層等整個(gè)云數(shù)據(jù)中心IT環(huán)境,是我們的情報(bào)來源;運(yùn)維管理是我們的大腦,幫助我們思考、制定決策和完成流程控制和管理,是我們的情報(bào)分析和決策中心;控制是我們的雙手,完成自動(dòng)化批量處理,是我們的實(shí)施手段。由此,可以說IT運(yùn)維監(jiān)控管理平臺(tái)的“監(jiān)、管、控”,是有序的一條龍、閉環(huán)過程。
IT“監(jiān)、管、控”一體化運(yùn)維,就是真正實(shí)現(xiàn)一條龍過程和達(dá)到閉合環(huán)路的目的。在IT“監(jiān)、管、控”一體化運(yùn)維模式下,當(dāng)監(jiān)視管理發(fā)現(xiàn)故障并產(chǎn)生告警后,如滿足相應(yīng)的過濾和觸發(fā)條件,自動(dòng)觸發(fā)運(yùn)維流程管理生成相應(yīng)的任務(wù),運(yùn)維管理依據(jù)任務(wù)信息和運(yùn)維人員預(yù)先設(shè)置好的關(guān)聯(lián)條件,自動(dòng)尋找、識(shí)別和匹配自動(dòng)化運(yùn)維中的操作腳本,實(shí)現(xiàn)自動(dòng)和快速的故障操作處理,由此實(shí)現(xiàn)從發(fā)現(xiàn)故障到解決故障的IT運(yùn)維全自動(dòng)化,并自動(dòng)完成運(yùn)維操作日志記錄,以備事后查詢和審計(jì)。IT運(yùn)營監(jiān)控管理的一體化不是IT運(yùn)維工作中簡(jiǎn)單的維護(hù)過程的改變,而是IT運(yùn)維管理工作方式的根本變革,是現(xiàn)代IT運(yùn)維管理的重要發(fā)展趨勢(shì)。
云計(jì)算為最終用戶提供的是一種服務(wù)。隨著云計(jì)算提供的服務(wù)日漸增多,企業(yè)集團(tuán)IT管理部門要保持競(jìng)爭(zhēng)力并提供業(yè)務(wù)價(jià)值,必須實(shí)現(xiàn)IT運(yùn)營監(jiān)控管理的共享服務(wù)。共享服務(wù)是在知識(shí)經(jīng)濟(jì)的大背景下產(chǎn)生的。知識(shí)經(jīng)濟(jì)是現(xiàn)代主流經(jīng)濟(jì),在這個(gè)時(shí)代,知識(shí)成為推動(dòng)社會(huì)發(fā)展和人類進(jìn)步的最主要的因素,知識(shí)正代替昔日的土地等自然資源、金融資本,成為最重要的資源。對(duì)于企業(yè)集團(tuán)IT管理部門來講,對(duì)運(yùn)維知識(shí)的管理,或者說對(duì)以運(yùn)維知識(shí)為中心的核心能力的管理成為知識(shí)經(jīng)濟(jì)時(shí)代IT服務(wù)成敗的關(guān)鍵。知識(shí)管理的核心是實(shí)現(xiàn)IT管理部門顯性知識(shí)和隱性知識(shí)的共享,運(yùn)用集體的智慧提高信息管理部門的應(yīng)變和創(chuàng)新能力。運(yùn)營監(jiān)控管理的共享服務(wù)需要在組織模型和運(yùn)作模式上進(jìn)行變革,具體涉及組織結(jié)構(gòu)、業(yè)務(wù)范圍界定、運(yùn)作模式、績效管理等內(nèi)容,更需要建立一個(gè)標(biāo)準(zhǔn)化的運(yùn)營監(jiān)控管理服務(wù)體系。
總之,IT運(yùn)營監(jiān)控管理向 “云化”、“立體化”、“智能化”、“一體化”和“共享服務(wù)化”的變革與發(fā)展,是建立與云數(shù)據(jù)中心環(huán)境下相適應(yīng)、相匹配運(yùn)維管理體系的必然要求,是保障云數(shù)據(jù)中心持續(xù)、穩(wěn)定、可靠、安全運(yùn)行的中心要?jiǎng)?wù)的必要要求,是實(shí)現(xiàn)云計(jì)算“優(yōu)化IT資源,實(shí)現(xiàn)按需分配”根本目標(biāo)的必然要求。
1 姚有真.云計(jì)算及其發(fā)展趨勢(shì).通信管理與技術(shù).2011(4)
2 (美)布賴恩·伯杰倫.共享服務(wù)精要.北京:中國人民大學(xué)出版社,2004
3 (美)卓蘇拉,(美)歐爾,(美)佩吉,張猛譯.云計(jì)算與數(shù)據(jù)中心自動(dòng)化.北京:人民郵電出版社,2012
4 《智慧數(shù)據(jù)中心》編委會(huì).智慧數(shù)據(jù)中心.北京:電子工業(yè)出版社,2011