文/鄭 強 江肖強 牟星亮 云 霞
浙江大學: 以標準化體系實踐IT運維服務
文/鄭 強 江肖強 牟星亮 云 霞
當前,隨著數(shù)字化校園工程建設,國內愈來愈多的高校已經具備相當堅實的計算機網(wǎng)絡基礎、相當完備的信息化應用系統(tǒng),并對高校的行政管理、科研活動、教育教學和文化生活進行全面支撐,產生越來越重要的作用。然而,對高校而言,如何提高基礎設施和應用系統(tǒng)的高可靠性和可用性、如何保證專業(yè)的服務支持能力、如何有效提高解決問題的效率、如何保證用戶的滿意率以及如何控制運維服務管理成本等等有關構建IT運維服務體系的問題,依然是當前迫切需要解決的實際問題。
以完善的運維服務制度流程為基礎
制定完善可行的運維管理制度和規(guī)范,確定各項運維活動的標準流程和相關崗位設置等,使運維人員在制度和流程的規(guī)范和約束下協(xié)同操作。
以先進成熟的運維管理平臺為手段
建立統(tǒng)一的運維管理平臺,通過對各類運維事件的全面采集、處理與分析,實現(xiàn)運維服務工作的智能化和高效率。
以專業(yè)多元的運維服務梯隊為保障
運維服務的順利實施離不開高素質的運維服務團隊,結合高校實際,吸收社會化公司參與合作建立多元的專業(yè)運維服務梯隊是有效利用技術手段做好運維服務工作的前提。
運維服務體系涉及運維服務管理對象、運維活動角色及運維管理組織結構、運維服務管理流程、運維服務支撐系統(tǒng)和運維服務五個要素,其總體框架如圖1所示。
圖1 總體框架
IT運維管理對象:
主要包括IT基礎設施、IT應用系統(tǒng)、IT用戶和IT供應商,也包括從事IT運維活動的部門和人員。
IT運維活動角色:
指從事IT運維活動的部門或具體工作人員,一般包括IT運維服務提供者、使用者以及管理者三類角色。
IT運維管理流程:
指聯(lián)系IT運維服務提供者、使用者以及管理者間開展規(guī)范協(xié)同工作的機制和方法。管理流程一般覆蓋IT運維服務的規(guī)劃、設計、運行和持續(xù)改進等環(huán)節(jié),本文主要涉及支撐IT運維服務運行階段的相關流程。管理流程的信息化可借助IT運維服務支撐系統(tǒng)實現(xiàn)。
IT運維支撐系統(tǒng):
是支撐各運維角色按規(guī)定流程開展IT運維活動的信息化系統(tǒng)。支撐系統(tǒng)既要支持IT運維服務提供者對IT運維管理對象進行管理,又要支持IT運維服務提供者按照商定的服務級別方便地向使用者提供IT運維服務;同時,要支持IT運維服務管理者對整個IT運維服務的考核、監(jiān)督和評估。
IT運維服務:
是IT運維服務提供者向IT運維服務使用者提供的服務產品,運維服務質量應可度量,服務提供方式應符合規(guī)定的流程。IT 運維服務的自動化實施需要依靠IT運維服務支撐系統(tǒng)。
運維管理制度
為提供規(guī)范、安全、可靠的運維服務,IT運維服務需制定一套科學、完整、詳細的運維服務管理制度。包括完善的管理組織結構,明確的崗位職責、人員素質能力要求、工作流程等方面。如人員管理規(guī)范、資源管理和儲備規(guī)范、事件響應規(guī)范、問題管理規(guī)范、監(jiān)督管理規(guī)范、質量管理規(guī)范、信息安全管理規(guī)范、知識庫管理規(guī)范、服務臺管理規(guī)范等。
運維服務系統(tǒng)平臺
1.IT監(jiān)控系統(tǒng)
面向網(wǎng)絡、主機、數(shù)據(jù)庫、存儲備份、中間件、應用系統(tǒng)記錄各類運行相關信息,并按可視化視圖呈現(xiàn)有關的功能、性能和故障情況。
2.服務臺
面向系統(tǒng)故障和用戶問題進行統(tǒng)一受理、統(tǒng)一咨詢、統(tǒng)一服務以及統(tǒng)一調度,各類故障和問題分別由運維服務梯隊不同層級著手解決,但統(tǒng)一由服務臺向用戶反饋。
3.運維管理系統(tǒng)
圖2 自主型社會化運維服務模式
提供不同層級運維服務人員的不同界面,對運維服務流程按生成的電子工單進行處理或反饋。
4.運維知識庫
通過整合日常運維數(shù)據(jù)、合作單位的技術資源和解決方案,實現(xiàn)對運維服務全程進行有效的內容提示。知識庫包括知識檢索、知識維護與管理等,通過Web方式向請求對象提供查詢和檢索,也可通過服務臺即時響應用戶請求。
服務目錄和服務級別管理
1. 服務目錄管理
定義和管理所提供的服務內容及服務目標,促使服務提供者和服務受益者之間建立一種長期穩(wěn)固的關系。
2. 服務級別管理
提供服務級別設計與管理功能,使能夠量化服務級別指標、構建合適的服務級別協(xié)議,服務級別引擎通過對量化指標進行監(jiān)控,保證服務級別協(xié)議履行,服務級別監(jiān)控統(tǒng)計功能反映服務級別協(xié)議當前以及歷史執(zhí)行情況。
運維隊伍建設
1.隊伍組建
針對IT資源現(xiàn)狀以及對技術支持的需求,組成各類別運維服務團隊,集中開展運維服務工作。
2.人員管理
對各層級的運維服務人員,應制定一套切實可行的管理辦法,包括人員配置、職責劃分、人員培訓、人員考核等。通過科學管理和激勵機制,充分調動各級運維服務人員的工作積極性和責任心。
運維模式確立
運維核心業(yè)務、關鍵任務仍然由學校自主掌握,對服務臺、接入層有線網(wǎng)絡、POE以下WIFI無線網(wǎng)絡、流程化的信息系統(tǒng)維護等交由社會化公司服務。自主型社會化服務模式如圖2所示。
運維管理制度
遵照ISO20000、CoBIT、ITIL v3等相關標準,結合高校自身實際,制定運維管理制度和規(guī)范。制度內容涵蓋監(jiān)控管理、機房管理、網(wǎng)絡管理、資產管理、系統(tǒng)和應用管理、存儲和備份管理、技術服務管理、安全管理、文檔管理以及人員管理等。
1.監(jiān)控管理:明確監(jiān)控對象、頻度、監(jiān)控工具、基本要素、預警規(guī)范和流程、臺賬管理等。
2.機房管理:明確機房準入規(guī)范、審批流程、業(yè)務登記、巡檢規(guī)范及頻度、臺賬管理等。
3.網(wǎng)絡管理:包括網(wǎng)絡準入管理、網(wǎng)絡配置管理、網(wǎng)絡權限設計與管理、網(wǎng)絡配置審計等。
4. 資產管理:包括資產編號登記、出入庫管理、地域委托管理、報廢報損流程等。
5.系統(tǒng)和應用管理:包括對主機、數(shù)據(jù)庫、中間件、應用系統(tǒng)的配置管理、權限設計與管理、配置審計等。
6.存儲和備份管理:包括數(shù)據(jù)備份管理和備份設備管理、數(shù)據(jù)完整性檢查等。
7.技術服務管理:包括故障處理規(guī)范、故障處理流程設計和變更、技術培訓、配置權限分配、配置審計及重大故障的應急預案等。
8.安全管理:包括網(wǎng)絡、主機、數(shù)據(jù)庫、中間件、應用軟件、數(shù)據(jù)安全管理及安全事故應急處理預案。
運維服務系統(tǒng)平臺
1.IT監(jiān)控系統(tǒng)
綜合的IT監(jiān)控系統(tǒng)面向網(wǎng)絡、主機、數(shù)據(jù)庫、存儲備份、中間件、應用系統(tǒng)的運行相關信息,產生在線運行情況、運行性能和功能事件的報表,并由告警機制通過IT監(jiān)控系統(tǒng)關聯(lián)呈現(xiàn),經由服務臺、運維管理系統(tǒng)、運維知識庫發(fā)布到各類運維服務相關角色,統(tǒng)一服務。
2.服務臺
面向系統(tǒng)故障和用戶問題進行統(tǒng)一受理、統(tǒng)一咨詢、統(tǒng)一服務以及統(tǒng)一調度,分網(wǎng)絡(微信、微博、QQ和郵件等)和座席響應兩種方式。各類故障和問題分別由運維服務梯隊不同層級著手解決,但統(tǒng)一由服務臺向用戶反饋。
3.運維管理系統(tǒng)
建立對運維服務全過程進行流程驅動并配置分析報表輔助決策的運維管理系統(tǒng),使運維服務更加有序,角色職責更加清晰,使運維服務全生命周期的支持信息更加完整、暢通、透明,能有效提高解決問題的速度和質量、實現(xiàn)服務知識儲備,能更好地進行指標優(yōu)化和績效管理,可持續(xù)地改進服務,整體提高運維服務的工作效率和綜合質量。
4.運維知識庫
把寶貴的經驗或教訓從運維服務人員的頭腦中沉淀、固化并進行共享,是提高整體運維服務技能、增強單位凝聚力的重要手段。知識維護既要防止變成“空庫”,又要及時審核,防止變?yōu)椤袄鴰臁薄?/p>
知識來源:一是各級運維人員積累的經驗;二是知識管理員總結、導入的經驗。
知識審核:知識提交到知識庫后需知識管理員審查修正,才變?yōu)檎桨l(fā)布狀態(tài),以減少知識謬誤和差錯。
知識檢索:知識變?yōu)檎桨l(fā)布狀態(tài)后,可供各類用戶隨時檢索引用。知識記錄用戶閱讀次數(shù)和用戶引用解決問題次數(shù),次數(shù)越多該知識價值越大。
服務目錄和服務級別管理
1.服務目錄管理
定義和管理所提供的服務內容及服務目標,促使服務提供者和服務受益者之間建立一種長期穩(wěn)固的關系。
圖3 自主型社會化運維服務實例
2.服務級別管理
提供服務級別設計與管理功能,使能夠量化服務級別指標、構建合適的服務級別協(xié)議,服務級別引擎通過對量化指標進行監(jiān)控,保證服務級別協(xié)議履行,服務級別監(jiān)控統(tǒng)計功能反映服務級別協(xié)議當前以及歷史執(zhí)行情況。
3. IT運維服務流程設計
對運維服務管理的所有環(huán)節(jié)和內容按要求制定統(tǒng)一的運行維護工作流程,使業(yè)務活動在一個標準有序、可跟蹤、可控制的環(huán)境下進行,實現(xiàn)運維服務工作的標準化、規(guī)范化和自動化,最終提高服務對象的滿意度。
運維梯隊建設
1.梯隊組建
針對網(wǎng)絡與信息化應用系統(tǒng)資源現(xiàn)狀以及對技術支持的需求,組成多層次的運維服務的專家隊伍,面向不同層級的實際問題集中開展運維服務工作。
2. 梯隊管理
對各層級的運維服務人員,應制定一套切實可行的管理辦法,包括人員配置、職責劃分、技能培訓、工作流程等。通過科學管理,規(guī)范各層級隊伍的工作以及緊密的協(xié)同配合。
3.值班管理
梯隊實現(xiàn)統(tǒng)一的電子化值班管理,主要包括:周期性的參數(shù)化班次設定、非常規(guī)的可定制排班管理、異常交接班處理和記錄、全面記錄各班次值班過程中的運維服務事務,為績效管理提供考核數(shù)據(jù)。
4.績效管理
依據(jù)服務級別協(xié)議內容,將運維服務流程各環(huán)節(jié)的執(zhí)行過程進行分解,實現(xiàn)各層級運維服務人員工作量化統(tǒng)計,并對各層級運維服務人員進行考評。將運維服務的各KPI以圖形化格式展示,更客觀公正地評價各層級運維服務人員的綜合能力,達到激勵目的。
通過自主研發(fā)運維管理系統(tǒng),自主研發(fā)或采用開源的IT監(jiān)控系統(tǒng),自主構建具備呼叫中心功能的服務臺,可牢牢掌握運維服務自主性。
通過與社會化公司雙邊協(xié)商,設置靈活細致的運維服務考核辦法,可最大限度保障員工積極性、能動性并充分挖掘員工的潛力,有效較低公司管理成本,最終使用戶滿意度長期處于高位運行。經過多年實踐,總結浙江大學自主型社會化的網(wǎng)絡信息化運維服務模型如圖3所示。
(作者單位為浙江大學圖書與信息中心)