宋書文
處于科學(xué)和信息迅速發(fā)展的時代,數(shù)據(jù)中心是集信息之間的交換和統(tǒng)計分析、儲存?zhèn)浞轂橐惑w的中心,其為企業(yè)信息系統(tǒng)平臺中想要快速實現(xiàn)集中處理的關(guān)鍵所在,是信息發(fā)展建設(shè)不可缺少的一部分。隨著數(shù)據(jù)中心自動化目的提出,數(shù)據(jù)中心就需要加強管理,使得企業(yè)數(shù)據(jù)中心相關(guān)設(shè)備的應(yīng)用數(shù)量漸漸上升,從而實現(xiàn)數(shù)據(jù)中心自動化運維管理,來達到節(jié)省人力、節(jié)約成本的目的。本文首先介紹數(shù)據(jù)中心的基本概念和探討運維自動化管理的重點,從而提出自動化運維平臺的建設(shè)方法。
數(shù)據(jù)中心(Internet Data Center,簡稱IDC)是指一種擁有完善的設(shè)備(含有高速寬帶、強性能局域網(wǎng)、安全的機房環(huán)境等要素)、專業(yè)的管理、完善的服務(wù)平臺。以這些為前提,為客戶提供互聯(lián)網(wǎng)基礎(chǔ)平臺服務(wù)和其他各種增值服務(wù)。運維自動化是把傳統(tǒng)的計算機運維工作變成自動化,減少了人工成本,提高計算機運營和維護工作的生產(chǎn)率。以傳統(tǒng)的人工計算機操作體制,不能滿足目前的企業(yè)服務(wù)器及數(shù)據(jù)要求的各種事項,所以這就需要相關(guān)的工作人員加強對專業(yè)知識的學(xué)習(xí),從而在信息化技術(shù)飛速發(fā)展的時代立足。另外,企業(yè)的自動化運維管理系統(tǒng)采取自動化水平高、較強的綜合性、易擴張的原則,來實現(xiàn)實際業(yè)務(wù)執(zhí)行時的數(shù)據(jù)中心的自動化管理。
運維管理一般執(zhí)行政府、企業(yè)內(nèi)有關(guān)硬件設(shè)備、網(wǎng)絡(luò)軟件的復(fù)雜維護工作。大數(shù)據(jù)時代飛速發(fā)展的今天,企業(yè)的日常經(jīng)營發(fā)展中不可避免的會接觸到繁多的數(shù)據(jù)信息,如果像以往再使用手動運營的方式,不僅業(yè)務(wù)效率下降,還不利于提高企業(yè)業(yè)務(wù)質(zhì)量。因此,在這個階段,企業(yè)對運維工作自動化需求很大,現(xiàn)在計算機運營管理軟件的研究開發(fā)需要加強運營和維持管理工作的信息化,持續(xù)提高自動化水平。
(一)自動化的監(jiān)控
分析自動化的運維管理當前的應(yīng)用程序和以后該系統(tǒng)的持續(xù)發(fā)展方向,對運維人力的需求正在增加。一些運維人員由于人力不足,沒有辦法快速及時的發(fā)現(xiàn)問題并解決問題,結(jié)合情況需開發(fā)運維管理的自動監(jiān)控功能。有了自動監(jiān)控的話,就可以通過自動監(jiān)控來觀測運行情況,也能夠?qū)崟r的發(fā)現(xiàn)問題并能夠分析原因從而提出解決的方案。
(二)自動提示
運維管理工作有特定的復(fù)雜性和系統(tǒng)性,因此對運維工作人員有著為嚴格的要求。在特定的運維管理平臺工作中,首先要根據(jù)具體任務(wù)對各工作進行分類后,再根據(jù)具體進程執(zhí)行特定任務(wù)。在平臺的實際操作中經(jīng)常出現(xiàn)錯誤,如果具有自動提示功能,即時將錯誤信息傳輸給工作人員,讓工作人員能夠?qū)崟r準確的處理故障,從而提高工作效率。
(三)自動生成維護記錄
相關(guān)技術(shù)人員會對計算機操作系統(tǒng)和硬件設(shè)施定期檢查維護,并根據(jù)這些系統(tǒng)和硬件運行狀態(tài)實時的收集和分析并自動生成為工作日志。經(jīng)過長時間定期定時的收集分析和日志生成,對積累的數(shù)據(jù)加以總結(jié)和歸納,從而對計算機運維管理相關(guān)系統(tǒng)需要改進的地方有所了解,從而提高平臺的穩(wěn)定性和可靠性。
數(shù)據(jù)中心自動化運維管理建設(shè)過程之中,必須保證其建設(shè)初期是圍繞著實際業(yè)務(wù)工作需求開展的,要特別注重服務(wù)和安全兩個重要理念。把服務(wù)作為數(shù)據(jù)中心自動化運維管理建設(shè)的基礎(chǔ),把安全作為建設(shè)的第一指標,從而將現(xiàn)在使用的不合理的管理模式運用模塊化和分層次架構(gòu)相融合,制作出全新監(jiān)測軟件。
(一)保障自動化運維管理平臺質(zhì)量
自動化運維管理平臺具體建設(shè)策劃的過程:
要點就是抓住自身信息數(shù)據(jù)的特點,為建設(shè)自動化運維管理平臺打下堅實的基礎(chǔ)。
平臺建設(shè)之中,不能忽略互聯(lián)網(wǎng)技術(shù)的支持,對互聯(lián)網(wǎng)技術(shù)進行深入探討,將其巧妙地和數(shù)據(jù)庫技術(shù)融合,才能時刻監(jiān)控數(shù)據(jù)中心,才能及時發(fā)現(xiàn)一些潛在問題和風(fēng)險,提前做好警示。
要在相關(guān)規(guī)定下實施運維管理平臺的建設(shè)。操作運維自動化設(shè)計的管理范圍、種類很多,例如設(shè)備管理,軟件管理和操作維護管理等。應(yīng)明確工作內(nèi)容,并保障每個功能都符合預(yù)期標準。建立自動化的操作管理平臺構(gòu)架,以更好地設(shè)計平臺分層。在這個經(jīng)濟不斷向前邁進的社會中,建立數(shù)據(jù)中心還需在個性和靈活性這兩個方面下功夫。
(二)借鑒先進的監(jiān)控管理模式
在構(gòu)建數(shù)據(jù)中心時,可以學(xué)習(xí)先進運維管理系統(tǒng)監(jiān)控模式及技術(shù),從而促進自動化管理質(zhì)量和效率性大大提高。在這個時候,還要將信息系統(tǒng)和商務(wù)系統(tǒng)要密切融合。學(xué)習(xí)使用高級自動運營和維護監(jiān)控技術(shù),再結(jié)合科學(xué)管理模式及方法,讓數(shù)據(jù)中心的質(zhì)量和效率提升加快。并且通過數(shù)據(jù)取值的調(diào)控,觀察每一項指令,保障準確性,減少人工,也從根本上減少了事故發(fā)生率。要注意建立運維管理系統(tǒng)的構(gòu)建,時刻圍繞客戶服務(wù)和業(yè)務(wù)來進行,從而提高團隊合作能力,改善運維管理系統(tǒng),持續(xù)改善整體運營和維持管理質(zhì)量。
(三)設(shè)計規(guī)范的事件跟蹤流程
要構(gòu)建計算機操作的自動化管理,最重要的工作是建立流處理、事件處理和時間處理環(huán)節(jié),使用表單工具創(chuàng)建對日常工作中出現(xiàn)的異常工作情況和故障處理記錄出相關(guān)的運維日志,并且在一段特定的時間內(nèi)總結(jié)分析所有事故和故障信息。為了提高系統(tǒng)性能,將系統(tǒng)故障和問題的可能性降到最低。確保在事故發(fā)生之后及時處理,確保故障不會擴大化,從而有效加強了解決風(fēng)險的能力,降低了軟件故障率。但這些工作以人工完成的話,工作人員還要檢查目標端的信息數(shù)據(jù)處理情況,導(dǎo)致運維工作量的大量堆積,從而也降低了人工工作效率。這些工作需要由自動化運維技術(shù)來支撐,工作人員只需通過運營程序和計算機互聯(lián)網(wǎng)來保證數(shù)據(jù)的傳輸就可以構(gòu)建同步監(jiān)控功能,還能對故障提供預(yù)警。
(四)培養(yǎng)運維管理人員
目前來看,數(shù)據(jù)中心的運維管理工作有很大一部分需要管理人員來承擔(dān)的,現(xiàn)在發(fā)展的主要方向還是需要培養(yǎng)一批運維管理人員團隊,提高團隊的專業(yè)知識水平和各方面的綜合知識??梢詮囊韵聨讉€方面入手提供運維管理人員的水平:
定期提供運維管理人員的專業(yè)技術(shù)培訓(xùn)且將培訓(xùn)成績與個人業(yè)績掛鉤。還可定期對運維管理人員進行專業(yè)知識考核,考核所得的成績可做職位調(diào)動的參考依據(jù)。從而調(diào)動運維管理人員的積極性,增強個人對企業(yè)的認同感和責(zé)任心,在其日常工作系統(tǒng)監(jiān)督和研究中更有動力。
企業(yè)對各個運維管理人員專業(yè)技能進行評分、分析,采用技能劃分層次,多勞多得制度。確保所有運維管理人員都能發(fā)揮自己的專業(yè)水平,也設(shè)立相應(yīng)的獎勵制度,為能力強的員工提供了良好的晉升空間,并通過技能管理和職業(yè)規(guī)劃來培養(yǎng)經(jīng)理的積極性。此外,管理人員還要增加日常工作中的交流,吸收別人的經(jīng)驗教訓(xùn),積累自己的專業(yè)水平,有效減少人員流失帶來的影響。
隨著大數(shù)據(jù)時代步伐的邁進,數(shù)據(jù)得到良好的使用,也徹底改變了政府和企業(yè)各項工作的流程,給各界都創(chuàng)造了極大的便利,但是也給了數(shù)據(jù)中心和運維一個嶄新的挑戰(zhàn)。因為這個挑戰(zhàn),數(shù)據(jù)中心升級了運維技術(shù),在逐漸完成自動化運營管理建設(shè)過程中,也給相關(guān)運維管理工作人員不小的提升專業(yè)能力的空間,讓運維工作人員在日常工作中降低了失誤率,也降低了人力物力的消耗,實現(xiàn)真正意義上的自動化管理。從根本上完成企業(yè)財務(wù)成本控制,降低了企業(yè)運行風(fēng)險,鞏固了企業(yè)經(jīng)濟狀況。
作者單位:中國石油吐哈油田分公司信息技術(shù)公司