李旭軍
(安徽經(jīng)濟(jì)管理學(xué)院 計算機(jī)工程系,安徽 合肥 230051)
故障管理在維護(hù)計算機(jī)信息系統(tǒng)中的應(yīng)用*
李旭軍
(安徽經(jīng)濟(jì)管理學(xué)院 計算機(jī)工程系,安徽 合肥 230051)
維護(hù)計算機(jī)信息系統(tǒng)的目的是要保證信息系統(tǒng)可靠正常地運(yùn)行,并在系統(tǒng)不斷的提高與改善中,發(fā)揮充分的作用。故障管理即信息系統(tǒng)異常情況下的管理操作,通過動態(tài)地網(wǎng)絡(luò)維護(hù),來維持一定服務(wù)水利的正常運(yùn)轉(zhuǎn)。故障管理在維護(hù)計算機(jī)信息系統(tǒng)中的應(yīng)用是有組織、有計劃的一系列活動,從而保障計算機(jī)信息系統(tǒng)中各個要素始終處于正確的、最新的工作狀態(tài)。下面,本文就對故障管理在維護(hù)計算機(jī)信息系統(tǒng)中的應(yīng)用進(jìn)行分析,從而對故障管理效用加以明確。
故障管理;計算機(jī)信息系統(tǒng);維護(hù);應(yīng)用;分析
維護(hù)對于保障計算機(jī)信息系統(tǒng)連續(xù)平滑的運(yùn)行是十分重要的,維護(hù)的理由主要包括:管理者或風(fēng)險承擔(dān)者提出新的要求、軟件版本更新、錯誤或故障、性能要求提升、硬件或技術(shù)問題等等。計算機(jī)信息系統(tǒng)運(yùn)行中,故障因素十分普遍,是維護(hù)活動中重要的針對目標(biāo),在維護(hù)計算機(jī)信息系統(tǒng)的應(yīng)用中融入故障管理十分必要。
隨著計算機(jī)技術(shù)的不斷發(fā)展,因特網(wǎng)技術(shù)已得到了廣泛的應(yīng)用,計算機(jī)單純作為一臺文字處理機(jī)的時代已經(jīng)不復(fù)存在。現(xiàn)代的計算機(jī)同網(wǎng)絡(luò)密切相關(guān),已經(jīng)成為制造、收發(fā)、處理信息的信息處理機(jī)。當(dāng)前,政府機(jī)關(guān)和各企、事業(yè)單位均已淘汰了過去的單機(jī)時代,而是由服務(wù)器(WEB服務(wù)器、文件服務(wù)器、郵件服務(wù)器、打印服務(wù)器等)、個人計算機(jī)、局域網(wǎng)和外設(shè)(掃描儀、打印機(jī)、攝影機(jī)、數(shù)碼攝像機(jī)、數(shù)碼照相機(jī)等)及軟件(單機(jī)操作系統(tǒng)、網(wǎng)絡(luò)操作系統(tǒng)、各類應(yīng)用軟件)構(gòu)成一個辦公或工作系統(tǒng),由于這一系統(tǒng)主要通過計算機(jī)來完成對于信息的采集、共享、收發(fā)及處理的,故將其稱作計算機(jī)信息系統(tǒng)。
當(dāng)前,計算機(jī)信息系統(tǒng)在各企事業(yè)單位應(yīng)用廣泛,其主要功能應(yīng)用包括以下幾個方面:第一,信息共享功能。由于單獨(dú)的個人電腦,均是通過局域網(wǎng)的形式連接的,因而,使得計算機(jī)同計算機(jī)之間、服務(wù)器同計算機(jī)之間都可通過網(wǎng)絡(luò)的發(fā)送、傳遞和相互訪問,來實(shí)現(xiàn)信息資源的共享;第二,設(shè)備資源共享功能。計算機(jī)信息系統(tǒng)中,所有人員均可通過網(wǎng)絡(luò),來實(shí)現(xiàn)系統(tǒng)內(nèi)硬件資源和共享服務(wù)器中軟件資源的共享;第三,網(wǎng)上辦公功能。計算機(jī)信息系統(tǒng)是網(wǎng)絡(luò)互連的形式,只需要進(jìn)行網(wǎng)上辦公軟件的加裝,就可實(shí)現(xiàn)無紙化辦公、網(wǎng)上辦公,辦公效率提高的同時,辦公成本進(jìn)一步降低;第四,網(wǎng)格計算或集中計算功能。在將進(jìn)行對大量數(shù)據(jù)的處理時,如單個計算機(jī)運(yùn)算能力不足時,可通過網(wǎng)絡(luò)計算或集中計算軟件,將計算任務(wù)發(fā)送至空閑計算機(jī)上進(jìn)行計算,設(shè)備得到充分的利用,計算效率大大提升;第五,因特網(wǎng)共享功能。在互連局域網(wǎng)中,只要一臺計算機(jī)通過ADSL或MoDEM或AdsL同因特網(wǎng)相連,系統(tǒng)內(nèi)的所有計算機(jī)均可通過代理服務(wù)器(ProXv seⅣer)軟件來全部鏈接因特網(wǎng)。上網(wǎng)經(jīng)費(fèi)大大節(jié)約,上網(wǎng)規(guī)模進(jìn)一步擴(kuò)大。
對于計算機(jī)信息系統(tǒng)故障的孤立與分析是故障管理在維護(hù)應(yīng)用中的關(guān)鍵,其基本方法可歸納為:系統(tǒng)—設(shè)備—部件—器件—故障點(diǎn)的故障檢查范圍層層縮小的順序。針對于計算機(jī)信息系統(tǒng)的故障,首先應(yīng)明確是個性故障還是共性故障。個性故障只會發(fā)生在單一的設(shè)備上,而共性故障則會同時出現(xiàn)在幾臺相同設(shè)備或所有工作站上。如存在共性故障則說明在計算機(jī)信息系統(tǒng)公共部分如網(wǎng)絡(luò)、交換機(jī)、服務(wù)器等公共設(shè)備出現(xiàn)了故障,而對于個性掛賬,則只需要對故障設(shè)備作出懷疑即可。通過以上對于計算機(jī)信息系統(tǒng)的故障分析,我們可以作出一個計算機(jī)信息故障分析流程圖,以此流程作為故障排除的依據(jù),從而有的放矢、少走彎路,達(dá)到是事半功倍的效果。從表現(xiàn)形式上來看,計算機(jī)信息系統(tǒng)故障又可分為硬件故障和軟件故障,其中,軟件故障占據(jù)了信息故障率的80%以上,將軟件故障作為故障管理在維護(hù)計算機(jī)信息系統(tǒng)應(yīng)用的重點(diǎn)內(nèi)容,利于計算機(jī)信息系統(tǒng)維護(hù)效率的明顯提升。
故障管理對于計算機(jī)信息系統(tǒng)的維護(hù)是一個方法化、系統(tǒng)化的過程。一個良好的維護(hù)順序十分必要,維護(hù)順序即一項維護(hù)要求所引發(fā)的系列事件順序。如在系統(tǒng)維護(hù)中,軟件維護(hù)工作是重點(diǎn)內(nèi)容,其維護(hù)工作的開展應(yīng)首先通過維護(hù)申請單,來對維護(hù)請求進(jìn)行提出,再由專業(yè)維護(hù)隊或開發(fā)隊進(jìn)行認(rèn)可變更。維護(hù)申請單是一種規(guī)范化、且經(jīng)準(zhǔn)許程序修改的文檔,其對系統(tǒng)管理員工作軌跡加以記錄,便于責(zé)任的明確和對系統(tǒng)管理員做出業(yè)績評價。
故障管理在維護(hù)計算機(jī)信息系統(tǒng)的應(yīng)用中,面對著龐雜和多樣的設(shè)備,諸多用戶的要求紛至沓來,通常會使得維護(hù)管理者一腦漿糊、眼花繚亂。人們從實(shí)踐應(yīng)用中,總結(jié)出一些通用的原則:清晰、簡單、交流、自動、概要、由簡入繁。
對于系統(tǒng)內(nèi)程序的維護(hù)主要是通過改寫全部或部分程序來加以實(shí)現(xiàn)、以原程序?yàn)榛A(chǔ)來進(jìn)行修改的。對于原程序的修改應(yīng)注意以下兩個方面:第一,在程序首部序言進(jìn)行注釋語句的說明,對修改人員、日期加以指出;第二,注意對程序修改登記表的填寫,填寫的內(nèi)容應(yīng)包括:程序名、系統(tǒng)名、修改內(nèi)容、修改理由、修改日期、修改人和批準(zhǔn)人等。
對于數(shù)據(jù)的維護(hù)應(yīng)當(dāng)專人負(fù)責(zé),主要負(fù)責(zé)數(shù)據(jù)庫的完整性、安全性及其控制,對數(shù)據(jù)字典文件進(jìn)行定期的生成,并在數(shù)據(jù)庫工作恢復(fù)之后,能夠?qū)τ布收霞右耘懦Υa的維護(hù)則包括添加、刪除和新設(shè)計等內(nèi)容,當(dāng)代碼必須變更時,則應(yīng)由計算機(jī)相關(guān)人員和現(xiàn)場業(yè)務(wù)經(jīng)辦人組成專門討論小組,并組織相關(guān)使用者進(jìn)行學(xué)習(xí),采用書面的形式,將計算機(jī)代碼體系進(jìn)行輸入,其維護(hù)的關(guān)鍵在于對新代碼的貫徹實(shí)施。
在實(shí)施對于應(yīng)用程序、代碼、數(shù)據(jù)的維護(hù)之后,應(yīng)以維護(hù)變化為依據(jù),對相應(yīng)的文檔加以修改,并確保同系統(tǒng)的一致性。維護(hù)基礎(chǔ)打好之后,應(yīng)對維護(hù)的相關(guān)內(nèi)容進(jìn)行記載,主要包括:維護(hù)工作的執(zhí)行人員、時間、情況、內(nèi)容等。
對于硬件設(shè)備的維護(hù)應(yīng)包括對打印機(jī)、計算機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備的日常維護(hù)和管理。由專門人員進(jìn)行負(fù)責(zé)維護(hù)工作,對設(shè)備開展定期的檢查、殺毒和保養(yǎng)工作,同時還應(yīng)進(jìn)行設(shè)備檢修登記表和設(shè)備故障登記表的設(shè)立,從而便于設(shè)備維護(hù)工作的開展。此外,還應(yīng)通過定期檢查,來對潛在故障隱患進(jìn)行及時的解決,從而保障各設(shè)備穩(wěn)定性、安全性等都處在良好狀態(tài)。
(四)故障管理在維護(hù)計算機(jī)信息系統(tǒng)中的具體應(yīng)用
計算機(jī)信息系統(tǒng)的良好運(yùn)行是以恰當(dāng)?shù)挠曹浖脚_支持系統(tǒng)運(yùn)行為前提。日常的計算機(jī)信息系統(tǒng)運(yùn)行過程當(dāng)中,應(yīng)通過監(jiān)控來確保良好的系統(tǒng)運(yùn)作,經(jīng)迅速檢修來對故障源加以確定,及時進(jìn)行修復(fù),從而獲得信息系統(tǒng)性能相關(guān)的評估數(shù)據(jù),便于對日后故障的預(yù)測和應(yīng)對。
(1)歷史監(jiān)控
所謂歷史監(jiān)控,即指的是在預(yù)定時間間隔內(nèi)輪詢系統(tǒng)從系統(tǒng)各個組件的統(tǒng)計數(shù)據(jù)和使用視距加以收集,并對系統(tǒng)服務(wù)提供的工作情況進(jìn)行檢查。對于系統(tǒng)的使用情況和可用性進(jìn)行歷史監(jiān)控,對長時間的運(yùn)行統(tǒng)計數(shù)據(jù)進(jìn)行記錄,以做圖示分析之用。
(2)實(shí)時監(jiān)控
所謂實(shí)時監(jiān)控,即指的是輪詢整個系統(tǒng)狀態(tài)和監(jiān)視其他系統(tǒng)向監(jiān)控系統(tǒng)發(fā)送及時的故障提醒。通常情況下,實(shí)時監(jiān)控檢查服務(wù)是否響應(yīng)、計算機(jī)是否停機(jī)、網(wǎng)絡(luò)是否堵塞等。通過實(shí)時監(jiān)控可將發(fā)生故障及時地通知信息系統(tǒng)管理員。實(shí)時監(jiān)控包括兩個組件,即用來報告故障的報警組件和用來發(fā)現(xiàn)故障的監(jiān)控組件,監(jiān)控的目的在于使系統(tǒng)管理員能在用戶之前將故障發(fā)現(xiàn),將停機(jī)時間盡可能地縮短,并在用戶觀察之前將故障盡快地進(jìn)行修復(fù),從而促進(jìn)服務(wù)質(zhì)量的提升。實(shí)時監(jiān)控部不應(yīng)當(dāng)僅限于面向用戶的故障報告,而應(yīng)進(jìn)行精確故障信息的提供。
用戶支持的提供主要是對用戶請求的接受和處理,并做好故障問題的跟蹤。一般情況下,企業(yè)應(yīng)進(jìn)行幫助平臺的建立,這可以是虛擬的,也可以是現(xiàn)實(shí)的,用戶可在這里報告問題來請求新的服務(wù)。幫助平臺的界面應(yīng)該友好且有足夠人員的業(yè)務(wù)支持、有具體的職員步驟流程、有預(yù)定期的覆蓋范圍、有相應(yīng)的升級流程及跟蹤呼叫軟件。
合理調(diào)試是發(fā)現(xiàn)、解決系統(tǒng)故障的基礎(chǔ),亦是故障排除的主要手段。調(diào)試的前提是明確用戶的問題所在,找出故障的元兇并加以維修。表面或暫時的維修是不能從根源上來解決故障的,如果故障沒有從根本上解決,類似故障還會繼續(xù)發(fā)生,甚至進(jìn)一步嚴(yán)重。調(diào)試應(yīng)當(dāng)使用正確的工具,有物理設(shè)備,也軟件工具,可以下載,也可以自己制作。一般來講,常見的調(diào)試方法有兩種:逐次改進(jìn)法和排除法。逐次改進(jìn)法是增加系統(tǒng)的新組件,對每一步是否發(fā)生預(yù)期結(jié)果加以驗(yàn)證。排除法則是將系統(tǒng)中不同部分移走,直至問題消失。對于硬件故障的調(diào)試通常采用排除法,例如進(jìn)行內(nèi)存條的替換或?qū)蹇ò蔚糁敝料到y(tǒng)能夠啟動。在軟件的應(yīng)用程序上,排除法亦可采用,比如排除應(yīng)用程序或驅(qū)動程序的潛在沖突,直至故障得以消失。有些操作系統(tǒng)配備有自帶工具,可對可能故障進(jìn)行搜索或測試模式的提供,從而縮小故障調(diào)試范圍。
變更管理是對計算機(jī)信息系統(tǒng)的變更進(jìn)行分析、計劃,并保證其有效實(shí)現(xiàn)的過程。是滿足系統(tǒng)維護(hù)的核心內(nèi)容。通過此類機(jī)制,管理員在實(shí)現(xiàn)變更之前,應(yīng)對變更的不同方面進(jìn)行仔細(xì)的考慮,從而減少問題或故障的發(fā)生。變更管理同時也是一種通信工具,它能夠保障發(fā)生變更時,所有人都保持同一步調(diào)。這樣可以使變更發(fā)生時混亂減少,并作出盡快的處理。
維護(hù)窗口是維護(hù)信息系統(tǒng)應(yīng)用中的一部分,就同許多人每月或每月的定期掃除一樣,十分必要。應(yīng)將系統(tǒng)電源冷卻、關(guān)掉,放完電后再將其充滿。在服務(wù)器間對大量數(shù)據(jù)進(jìn)行移動,整理凌亂的電線,從而為優(yōu)化系統(tǒng)性能提供增長空間。主要網(wǎng)絡(luò)和系統(tǒng)的工作維護(hù)窗口應(yīng)進(jìn)行調(diào)度,根據(jù)企業(yè)大小,定期對窗口進(jìn)行維護(hù)。
故障管理在維護(hù)計算機(jī)信息系統(tǒng)中的應(yīng)用是一系列的過程,以故障維護(hù)為出發(fā)點(diǎn),積極地實(shí)施,從而使得計算機(jī)信息系統(tǒng)良好地運(yùn)行,應(yīng)有作用得以充分發(fā)揮。隨著計算機(jī)技術(shù)的不斷發(fā)展,故障管理在維護(hù)計算機(jī)信息系統(tǒng)的應(yīng)用中必將日益完善。
TP31
A
1006-5342(2011)10-0174-02
2011-08-30