周鳳凌
摘 要:伴隨著當(dāng)今時(shí)代信息技術(shù)地不斷發(fā)展,計(jì)算機(jī)服務(wù)器系統(tǒng)在我國得到了非常廣泛的應(yīng)用和普及。在中小企業(yè)和電力、國防、衛(wèi)生等一些重大的行業(yè)中也都離不開計(jì)算機(jī)服務(wù)器系統(tǒng)提供著不間斷的工作。所以,一旦計(jì)算機(jī)服務(wù)陷入崩潰或者是發(fā)生故障,那么就有可能帶來巨大的經(jīng)濟(jì)損失。、
關(guān)鍵詞:計(jì)算機(jī);服務(wù)器系統(tǒng);容錯(cuò)技術(shù)
由于我國當(dāng)前信息技術(shù)的飛速發(fā)展,各個(gè)行業(yè)中需要用到計(jì)算機(jī)系統(tǒng)的應(yīng)用越來越多。其中,計(jì)算機(jī)系統(tǒng)的發(fā)展也為各類業(yè)務(wù)提供了可靠及時(shí)的基礎(chǔ)支撐。然而,我們還應(yīng)該注意到計(jì)算機(jī)系統(tǒng)中的軟硬件都會產(chǎn)生一定的故障,對于這些故障的處理如果稍有不慎就有可能會對企事業(yè)單位,尤其是一些國防、衛(wèi)生以及電力等重點(diǎn)行業(yè)帶來一些較大的損失情況。但是伴隨著容錯(cuò)技術(shù)的引入,我們就能夠很好地解決這個(gè)問題,還能夠進(jìn)行正常、不間斷的工作。因此,本文就旨在對計(jì)算機(jī)服務(wù)器系統(tǒng)中的兩個(gè)主要容錯(cuò)技術(shù):軟件錯(cuò)誤容錯(cuò)技術(shù)和硬件錯(cuò)誤容錯(cuò)技術(shù)進(jìn)行一定的分析,能夠?yàn)橄嚓P(guān)的理論和實(shí)踐帶來一定的借鑒意義。
一、計(jì)算機(jī)服務(wù)器系統(tǒng)容錯(cuò)系統(tǒng)的概述
我們所說的計(jì)算機(jī)故障,指的是由于計(jì)算機(jī)不見的物理實(shí)現(xiàn)、操作錯(cuò)誤或者是設(shè)計(jì)錯(cuò)誤等原因引起的計(jì)算機(jī)系統(tǒng)硬件或者是軟件錯(cuò)誤的狀態(tài)。故障的診斷、檢測和恢復(fù)技術(shù)主要是作為計(jì)算機(jī)容錯(cuò)技術(shù)的重要組成部分,如果計(jì)算機(jī)系統(tǒng)要進(jìn)行故障恢復(fù)的操作,首先就要進(jìn)行檢測、診斷的技術(shù)來對故障所處的位置進(jìn)行定位。作為恢復(fù)的前提,我們還應(yīng)該在恢復(fù)技術(shù)的作用下使得計(jì)算機(jī)系統(tǒng)能夠恢復(fù)到無故障時(shí)候的狀態(tài)并且開始正常工作。當(dāng)前運(yùn)用的計(jì)算機(jī)容錯(cuò)技術(shù)最基本的方法是冗余技術(shù),而硬件冗余、軟件冗余、信息冗余以及時(shí)間冗余技術(shù)是作為冗余技術(shù)的四個(gè)主要組成部分。
二、計(jì)算機(jī)服務(wù)器系統(tǒng)容錯(cuò)技術(shù)分析
1.硬件錯(cuò)誤容錯(cuò)技術(shù)
(1)在硬件錯(cuò)誤容錯(cuò)的技術(shù)中,我們采用的硬件冗余技術(shù)也主要分為部分冗余和完全冗余這兩種主要方式。我們通過分析完全冗余的方式,可以發(fā)現(xiàn)工作方式的不同主要分為冷備、熱備、溫備和雙工等這四種方式。這四種方式的工作形式如下所述:
熱備工作方式:在該工作方式之下,我們對于兩個(gè)互為冗余的計(jì)算機(jī)服務(wù)器系統(tǒng)都處于加電工作的狀態(tài),但是由于熱備計(jì)算機(jī)系統(tǒng)并不能夠?qū)ο到y(tǒng)的處理結(jié)果進(jìn)行輸出以及計(jì)算。所以一旦主計(jì)算機(jī)系統(tǒng)在發(fā)生了故障的前提下,熱備計(jì)算機(jī)系統(tǒng)就會在繼續(xù)的工作中接手,直到系統(tǒng)故障修復(fù)完畢之后,熱備的機(jī)器就開始重新編程備機(jī)。
冷備工作方式:這一種方式跟熱備方式不同的是,冷備工作方式的備用指的是計(jì)算機(jī)系統(tǒng)是在處于不加電狀態(tài)下的工作。只要主機(jī)發(fā)生了故障,那么冷備機(jī)器就會接受繼續(xù)工作,故障解決之后就會重新變成備用機(jī)。
溫備工作方式:冗余的兩個(gè)系統(tǒng)都處于加電狀態(tài),一個(gè)在工作狀態(tài)的時(shí)候,另一個(gè)就開始處于等待狀態(tài)。如果工作的機(jī)器發(fā)生了故障,那么另一個(gè)就會開始接受繼續(xù)進(jìn)入工作狀態(tài)。等到故障恢復(fù)之后,就會變成備用等待的機(jī)器。
雙工工作方式:在該種工作方式下,兩個(gè)機(jī)器開始同時(shí)進(jìn)入工作,也開始同時(shí)進(jìn)入處理結(jié)果的輸出。在發(fā)生了故障之后,我們對兩個(gè)機(jī)器的結(jié)果進(jìn)行輸出的比較。
(2)所謂的信息冗余,指的就是在原始數(shù)據(jù)中附加若干位的冗余信息用來達(dá)到檢測故障或者是恢復(fù)故障等目標(biāo)的容錯(cuò)技術(shù),其中就包括了檢錯(cuò)編碼與糾錯(cuò)編碼這兩種。檢錯(cuò)編碼可以通過自動掃描來發(fā)現(xiàn)錯(cuò)誤,而對于糾錯(cuò)編碼具有自動發(fā)現(xiàn)錯(cuò)誤以及糾正錯(cuò)誤的能力等。我們在編碼技術(shù)常用到的是信息的傳輸和存儲以及處理過程中去。
(3)我們在時(shí)間冗余中,在一些非硬件冗余以及一些非強(qiáng)實(shí)時(shí)的系統(tǒng)中,可以利用使用時(shí)間冗余技術(shù)來達(dá)到容錯(cuò)的目的。時(shí)間冗余的工作方式主要就分為兩種,一種是RSHW,指的是在同一個(gè)硬件上對于同一數(shù)據(jù)在不同時(shí)間片中執(zhí)行同一指令集。第二種是使用數(shù)據(jù)延遲設(shè)備及表決電路結(jié)合,將一次次的數(shù)據(jù)處理的輸出結(jié)果通過設(shè)置不同的延遲大小而復(fù)制成多個(gè)版本并在表決器處進(jìn)行比較。
2.軟件錯(cuò)誤容錯(cuò)技術(shù)
在面對硬件系統(tǒng)故障研究的時(shí)候,軟件錯(cuò)誤就顯得比較困難了。由于當(dāng)前還沒有能夠形成一套成熟而又完整的方法來應(yīng)對軟件系統(tǒng)可靠性以及設(shè)計(jì)錯(cuò)誤等檢測結(jié)果?,F(xiàn)在應(yīng)用比較普遍的軟件故障恢復(fù)策略主要有兩種,一種是前向恢復(fù),另外一種是后向恢復(fù)。我們在面對前向恢復(fù)的時(shí)候,總是習(xí)慣將計(jì)算機(jī)當(dāng)前的計(jì)算狀態(tài)繼續(xù)進(jìn)行下午,從而將之后的狀態(tài)恢復(fù)到連貫的正確狀態(tài)。而對于后向恢復(fù)來說,字面理解上來說就是將計(jì)算機(jī)系統(tǒng)狀態(tài)恢復(fù)到前一個(gè)正確的狀態(tài)。
目前應(yīng)用的前向恢復(fù)狀態(tài)主要由N-version Programming的方法,該種方法的基本思路是通過不同的團(tuán)隊(duì)獨(dú)立設(shè)計(jì),以及使用不同的方法來對不同的設(shè)計(jì)語言和不同的開發(fā)環(huán)境以及工具來進(jìn)行完美的實(shí)現(xiàn)。主要目的就是為了減少各個(gè)版本軟件在表決點(diǎn)上出現(xiàn)的一些關(guān)于錯(cuò)誤的概率,其中相關(guān)的工作方式也是較容易實(shí)現(xiàn)的。而對于當(dāng)前應(yīng)用較普遍的后向恢復(fù)法來說,主要由恢復(fù)塊方法和防衛(wèi)式的程序設(shè)計(jì)方法。我們通過恢復(fù)塊方法來說,其中一個(gè)功能之下,存在有主塊和若干個(gè)后備塊的概念,一旦主塊開始投入運(yùn)行后就沒有通過驗(yàn)收的測試,也就可以指定第一個(gè)后備塊運(yùn)行,從而也就成為了主塊。在依次按順序開始耗盡所有后備塊的基礎(chǔ)上,設(shè)計(jì)的主塊和后備塊之間就盡量保證了相對的獨(dú)立性,不會因?yàn)橹鲏K出現(xiàn)了錯(cuò)誤而干擾到后備塊的運(yùn)行。
三、結(jié)語
綜上所述,我們對于計(jì)算機(jī)服務(wù)器系統(tǒng)的基礎(chǔ)支撐可以發(fā)現(xiàn),其中最主要的還是容錯(cuò)技術(shù)的保障,能夠?qū)ζ浞€(wěn)定而又不間斷的運(yùn)行提供了重要技術(shù)。每個(gè)企業(yè)都應(yīng)該對此引起足夠的重視,而本文通過對計(jì)算機(jī)服務(wù)器系統(tǒng)中的硬件容錯(cuò)技術(shù)和軟件容錯(cuò)技術(shù)進(jìn)行了仔細(xì)的分析,相信未來我國的計(jì)算機(jī)系統(tǒng)規(guī)模將會進(jìn)行進(jìn)一步地?cái)U(kuò)大。
參考文獻(xiàn):
[1] 吳玥. 淺析計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)[J]. 無線互聯(lián)科技. 2015(11) .
[2] 周榮. 容錯(cuò)技術(shù)研究[J]. 商情(教育經(jīng)濟(jì)研究). 2016(05) .