李興偉,白 博,周 軍
(西北工業(yè)大學(xué),精確制導(dǎo)與控制研究所,西安 710072)
多模冗余可重構(gòu)計(jì)算機(jī)可靠性研究
李興偉,白 博,周 軍
(西北工業(yè)大學(xué),精確制導(dǎo)與控制研究所,西安 710072)
為了以最小代價(jià)提高多??芍貥?gòu)計(jì)算機(jī)的可靠性,需要結(jié)合系統(tǒng)體積功耗等因素,對(duì)不同計(jì)算機(jī)體系結(jié)構(gòu)的可靠性進(jìn)行評(píng)估;首先,針對(duì)三模冗余、三熱一冷以及四模熱備這幾種不同冗余可重構(gòu)計(jì)算機(jī)體系結(jié)構(gòu),給出了他們的故障狀態(tài)轉(zhuǎn)移圖;其次,運(yùn)用馬爾可夫模型理論,對(duì)這些計(jì)算機(jī)結(jié)構(gòu)進(jìn)行可靠性建模;第三,根據(jù)上述3種系統(tǒng)的可靠性模型,在考慮失效率和維修率兩個(gè)參數(shù)對(duì)系統(tǒng)可靠性影響的情況下,對(duì)各結(jié)構(gòu)的可靠性指標(biāo)進(jìn)行了評(píng)價(jià);結(jié)果表明,三熱一冷的可靠性大于三模冗余,而小于四模熱備;但綜合考慮系統(tǒng)的可靠度、體積、功耗等因素后,在這幾種形式的表決系統(tǒng)中,三熱一冷是最優(yōu)的;同時(shí),設(shè)計(jì)完善的三模可重構(gòu)系統(tǒng)可靠度會(huì)比一個(gè)設(shè)計(jì)不合理的四??芍貥?gòu)系統(tǒng)要高。
多模冗余;馬爾可夫模型;可重構(gòu)計(jì)算機(jī)
近年來,隨著大容量可重構(gòu)FPGA的出現(xiàn),掃除了可重構(gòu)計(jì)算機(jī)技術(shù)在工程實(shí)現(xiàn)方面的障礙。與傳統(tǒng)的計(jì)算機(jī)相比,可重構(gòu)計(jì)算機(jī)在系統(tǒng)部分部件出現(xiàn)故障時(shí),能夠自主地改變自身的系統(tǒng)功能,使系統(tǒng)按原定性能指標(biāo)或比原性能指標(biāo)略有降低 (但可接受)的要求安全地完成任務(wù)。這樣就避免了固定硬件結(jié)構(gòu)的計(jì)算機(jī)一旦發(fā)生硬件損傷,將導(dǎo)致系統(tǒng)崩潰這一問題。
為了保證可重構(gòu)計(jì)算機(jī)的可靠性指標(biāo),除了選擇高質(zhì)量的元器件外,普遍的做法是采用余度技術(shù)來實(shí)現(xiàn)這一目標(biāo)[1]。常用的冗余結(jié)構(gòu)有雙機(jī)備份、二乘二取二、三模冗余、三熱一冷等結(jié)構(gòu)[2]。文獻(xiàn)[3]闡述了兩種不同工作策略的“二乘二取二”的可靠性與安全性,并與三模冗余系統(tǒng)進(jìn)行了比較。文獻(xiàn)[4]對(duì)雙模冗余系統(tǒng)與三模冗余系統(tǒng)各系統(tǒng)的工作狀態(tài)進(jìn)行了詳細(xì)分析,并利用馬爾可夫過程對(duì)不同維修率和故障檢測覆蓋率對(duì)系統(tǒng)可靠度和安全度的影響進(jìn)行了仿真計(jì)算。文獻(xiàn)[5]對(duì)軌道交通里的三模冗余系統(tǒng)的可靠性與安全性進(jìn)行了詳細(xì)分析,并給出了故障檢測率及維修率對(duì)三模冗余系統(tǒng)可靠性與安全性的影響。但以上文獻(xiàn)并未對(duì)具有更多冗余器件的可重構(gòu)系統(tǒng)的可靠性進(jìn)行討論。
本文針對(duì)由FPGA構(gòu)成的幾種比較典型的多模冗余可重構(gòu)系統(tǒng)結(jié)構(gòu),利用馬爾可夫過程對(duì)其進(jìn)行可靠性建模。同時(shí),在考慮系統(tǒng)失效率和維修率兩個(gè)參數(shù)對(duì)系統(tǒng)可靠性影響的情況下,對(duì)各系統(tǒng)的可靠性指標(biāo)進(jìn)行了評(píng)價(jià),分析了以最小代價(jià)提高多??芍貥?gòu)計(jì)算機(jī)可靠性的途徑。
由FPGA構(gòu)成的可重構(gòu)計(jì)算機(jī)系統(tǒng)的最大特點(diǎn)是可以通過重新配置,進(jìn)行系統(tǒng)的重構(gòu)。這樣當(dāng)系統(tǒng)出現(xiàn)故障后,系統(tǒng)通過可重構(gòu)機(jī)制使得系統(tǒng)得以修復(fù)。同時(shí),為了進(jìn)一步提高可重構(gòu)計(jì)算機(jī)的可靠性,采用多模結(jié)構(gòu)組成多模冗余可重構(gòu)計(jì)算機(jī)系統(tǒng)。本文主要針對(duì)比較常用的三模冗余、三熱一冷以及四模熱備這幾種冗余可重構(gòu)計(jì)算機(jī)的可靠性進(jìn)行分析。首先來看三模冗余系統(tǒng)。
1.1 三模冗余結(jié)構(gòu)
圖1所示為三模冗余系統(tǒng)結(jié)構(gòu)圖。
圖1 三模冗余表決系統(tǒng)結(jié)構(gòu)圖
其工作原理是3個(gè)模塊同時(shí)對(duì)輸入信號(hào)進(jìn)行運(yùn)算處理,處理完畢后,送給表決器,由表決器選擇輸出。當(dāng)3個(gè)模塊的輸出相同時(shí),隨機(jī)選擇一個(gè)輸出;當(dāng)有兩個(gè)模塊輸出相同而另一個(gè)模塊輸出不同時(shí),從相同的兩個(gè)模塊中選擇一個(gè)輸出;當(dāng)3個(gè)模塊輸出都不同時(shí),系統(tǒng)產(chǎn)生報(bào)警。因此三模冗余可以屏蔽一個(gè)錯(cuò)誤。
1.2 四模冗余結(jié)構(gòu)
將圖1所示的三模冗余表決系統(tǒng)再加上一模,這樣就組成了四模冗余表決系統(tǒng),如圖2所示。
圖2 四模冗余表決系統(tǒng)結(jié)構(gòu)圖
其工作原理是4個(gè)模塊同時(shí)對(duì)輸入信號(hào)進(jìn)行運(yùn)算處理,處理完畢后,送給表決器,由表決器選擇輸出。當(dāng)4個(gè)模塊的輸出相同時(shí),隨機(jī)選擇一個(gè)輸出;當(dāng)有兩個(gè)模塊輸出相同而另兩個(gè)模塊輸出不同時(shí),從相同的兩個(gè)模塊中選擇一個(gè)輸出;當(dāng)3個(gè)模塊輸出都不同時(shí),系統(tǒng)產(chǎn)生報(bào)警。因此四模冗余可以屏蔽兩個(gè)錯(cuò)誤。
1.3 三熱一冷冗余結(jié)構(gòu)
將圖1所示的三模冗余表決系統(tǒng)上再加一模冷備份,這樣就組成三熱一冷的冗余表決系統(tǒng),如圖3所示。
圖3 三熱一冷表決系統(tǒng)結(jié)構(gòu)圖
其工作原理如下,在正常情況下,由3個(gè)工作的模塊同時(shí)對(duì)輸入信號(hào)進(jìn)行運(yùn)算處理,冷備份模塊不工作,表決器僅對(duì)3個(gè)工作模塊的結(jié)果進(jìn)行處理。當(dāng)3個(gè)模塊的輸出相同時(shí),隨機(jī)選擇一個(gè)輸出;當(dāng)有兩個(gè)模塊輸出相同而另一個(gè)模塊輸出不同時(shí),從相同的兩個(gè)模塊中選擇一個(gè)輸出;當(dāng)有一個(gè)模塊無法修復(fù)時(shí),啟動(dòng)冷備份模塊,重新構(gòu)成三模冗余系統(tǒng);當(dāng)3個(gè)模塊輸出都不同時(shí),系統(tǒng)產(chǎn)生報(bào)警。因此三熱一冷冗余結(jié)構(gòu)同樣可以屏蔽兩個(gè)錯(cuò)誤,但其與四模冗余結(jié)構(gòu)在可靠性上會(huì)有區(qū)別。
在研究各系統(tǒng)的可靠性之前,首先對(duì)系統(tǒng)做如下假設(shè):
1)假設(shè)系統(tǒng)中除了幾個(gè)計(jì)算機(jī)模塊外,其他系統(tǒng)的可靠度均為1;
2)每個(gè)計(jì)算機(jī)模塊的失效率為λ,系統(tǒng)維修率為μ,同時(shí)假設(shè)維修時(shí)間分布為指數(shù)分布;
3)某一時(shí)刻只有一個(gè)模塊發(fā)生故障;
4)系統(tǒng)開始工作時(shí),系統(tǒng)處于完好狀態(tài)。
基于以上假設(shè),對(duì)各結(jié)構(gòu)的可靠性進(jìn)行研究。
2.1 三模表決系統(tǒng)
對(duì)于圖1所示的三模冗余表決系統(tǒng),定義每個(gè)模塊的維修率為常值μ,同時(shí)假設(shè)維修時(shí)間的分布為指數(shù)分布,則某一模塊在時(shí)刻t處于失效狀態(tài),而在時(shí)刻t+Δt處于正常工作狀態(tài)的概率為1-e-μΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-μΔt≈μΔt。
對(duì)于三模冗余表決系統(tǒng),當(dāng)且僅當(dāng)至少有2個(gè)計(jì)算機(jī)正常時(shí),系統(tǒng)才能工作。當(dāng)有2個(gè)計(jì)算機(jī)故障時(shí),系統(tǒng)故障,此時(shí)系統(tǒng)無法表決,系統(tǒng)停止輸出。因此其馬爾克夫狀態(tài)可描述為:
1)定義隨機(jī)變量X(t)=0,該狀態(tài)表示時(shí)刻t時(shí)有0個(gè)計(jì)算機(jī)故障,此狀態(tài)對(duì)應(yīng)系統(tǒng)正常工作。稱此狀態(tài)為狀態(tài)0。
2)定義隨機(jī)變量X(t)=1,該狀態(tài)表示時(shí)刻t時(shí)有1個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)仍能正常工作。稱此狀態(tài)為狀態(tài)1。
3)定義隨機(jī)變量X(t)=2,該狀態(tài)表示時(shí)刻t時(shí)有2個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)故障。稱此狀態(tài)為狀態(tài)2。
X(t)是一個(gè)齊次馬爾可夫鏈。模塊的失效率為常數(shù)λ,根據(jù)假設(shè)模塊壽命的分布為指數(shù)分布,則某模塊在時(shí)刻t處于正常狀態(tài),而在時(shí)刻t+Δt處于正常故障狀態(tài)的概率為1-e-λΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-λΔt≈λΔt。由于系統(tǒng)由3個(gè)模塊組成,因此系統(tǒng)從狀態(tài)0到狀態(tài)1的轉(zhuǎn)移概率用語言來描述,則為3個(gè)模塊中僅有1個(gè)模塊出現(xiàn)故障。這樣,由于有3個(gè)模塊,該轉(zhuǎn)移概率就為3λΔt。其它狀態(tài)轉(zhuǎn)移概率依此類推。系統(tǒng)的狀態(tài)轉(zhuǎn)移圖如圖4所示。
圖4 三模冗余表決系統(tǒng)狀態(tài)轉(zhuǎn)移圖
2.2 四模表決系統(tǒng)
如果將圖1所示的三模冗余表決系統(tǒng)上再加一模,這樣就組成四模冗余表決系統(tǒng)。同樣定義模塊的維修率為常值μ。根據(jù)假設(shè)維修時(shí)間的分布為指數(shù)分布,則某一模塊在時(shí)刻t處于失效狀態(tài),而在時(shí)刻t+Δt處于正常工作狀態(tài)的概率為1-e-μΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-μΔt≈μΔt。
對(duì)于四模冗余表決系統(tǒng),當(dāng)且僅當(dāng)至少有2個(gè)計(jì)算機(jī)正常時(shí),系統(tǒng)才能正常工作。當(dāng)有3個(gè)計(jì)算機(jī)故障時(shí),系統(tǒng)故障,此時(shí)系統(tǒng)無法表決,系統(tǒng)停止輸出。其馬爾克夫狀態(tài)可描述為:
1)定義隨機(jī)變量X(t)=0,該狀態(tài)表示時(shí)刻t時(shí)有0個(gè)計(jì)算機(jī)故障,此狀態(tài)對(duì)應(yīng)系統(tǒng)正常工作。稱此狀態(tài)為狀態(tài)0。
2)定義隨機(jī)變量X(t)=1,該狀態(tài)表示時(shí)刻t時(shí)有1個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)仍能正常工作。稱此狀態(tài)為狀態(tài)1。
3)定義隨機(jī)變量X(t)=2,該狀態(tài)表示時(shí)刻t時(shí)有2個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)仍能正常工作。稱此狀態(tài)為狀態(tài)2。
4)定義隨機(jī)變量X(t)=3,該狀態(tài)表示時(shí)刻t時(shí)有3個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)故障。稱此狀態(tài)為狀態(tài)3。
X(t)是一個(gè)齊次馬爾可夫鏈。模塊的失效率為常數(shù)λ,根據(jù)假設(shè)模塊壽命的分布為指數(shù)分布,則某模塊在時(shí)刻t處于正常狀態(tài),而在時(shí)刻t+Δt處于正常故障狀態(tài)的概率為1-e-λΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-λΔt≈λΔt。由于系統(tǒng)由4個(gè)模塊組成,因此系統(tǒng)從狀態(tài)0到狀態(tài)1的轉(zhuǎn)移概率用語言來描述,則為4個(gè)模塊中僅有1個(gè)模塊出現(xiàn)故障。這樣,由于有4個(gè)模塊,該轉(zhuǎn)移概率就為4λΔt。其它狀態(tài)轉(zhuǎn)移概率依此類推。系統(tǒng)的狀態(tài)轉(zhuǎn)移圖如圖5所示。
圖5 四模冗余表決系統(tǒng)狀態(tài)轉(zhuǎn)移圖
2.3 三熱一冷表決系統(tǒng)
將圖1所示的三模冗余表決系統(tǒng)上再加一模冷備份,這樣就組成三熱一冷的冗余表決系統(tǒng)。同樣定義模塊的維修率為常值μ。根據(jù)假設(shè)維修時(shí)間的分布為指數(shù)分布,則某一模塊在時(shí)刻t處于失效狀態(tài),而在時(shí)刻t+Δt處于正常工作狀態(tài)的概率為1-e-μΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-μΔt≈μΔt。
對(duì)于三熱一冷的表決系統(tǒng),仍然當(dāng)且僅當(dāng)至少有2個(gè)計(jì)算機(jī)正常時(shí),系統(tǒng)才能正常工作。當(dāng)有3個(gè)計(jì)算機(jī)故障時(shí),系統(tǒng)故障,此時(shí)系統(tǒng)無法表決,系統(tǒng)停止輸出。其馬爾克夫狀態(tài)可描述為:
1)定義隨機(jī)變量X(t)=0,該狀態(tài)表示時(shí)刻t時(shí)有0個(gè)計(jì)算機(jī)故障,此狀態(tài)對(duì)應(yīng)系統(tǒng)正常工作。稱此狀態(tài)為狀態(tài)0。
2)定義隨機(jī)變量X(t)=1,該狀態(tài)表示時(shí)刻t時(shí)有1個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)將冷備份模塊切換進(jìn)來,系統(tǒng)組成仍為三模冗余,仍能正常工作。稱此狀態(tài)為狀態(tài)1。
3)定義隨機(jī)變量X(t)=2,該狀態(tài)表示時(shí)刻t時(shí)有2個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)仍能正常工作。稱此狀態(tài)為狀態(tài)2。
4)定義隨機(jī)變量X(t)=3,該狀態(tài)表示時(shí)刻t時(shí)有3個(gè)計(jì)算機(jī)故障,在此狀態(tài)下,系統(tǒng)故障。稱此狀態(tài)為狀態(tài)3。
X(t)是一個(gè)齊次馬爾可夫鏈。模塊的失效率為常數(shù)λ,根據(jù)假設(shè)模塊壽命的分布為指數(shù)分布,則某模塊在時(shí)刻t處于正常狀態(tài),而在時(shí)刻t+Δt處于正常故障狀態(tài)的概率為1-e-λΔt,將其按級(jí)數(shù)展開,對(duì)于很小的Δt,可簡化為1-e-λΔt≈λΔt。由于系統(tǒng)為三熱一冷的形式,則在正常工作中,實(shí)際是三模系統(tǒng)在工作,因此系統(tǒng)從狀態(tài)0到狀態(tài)1的轉(zhuǎn)移概率用語言來描述,則為3個(gè)模塊中僅有1個(gè)模塊出現(xiàn)故障。這樣,由于僅計(jì)算3個(gè)模塊,該轉(zhuǎn)移概率就為3λΔt。而在狀態(tài)1時(shí),實(shí)際上系統(tǒng)仍為3模,因此狀態(tài)1向狀態(tài)2轉(zhuǎn)移的概率仍為3λΔt。其它狀態(tài)轉(zhuǎn)移概率依此類推。系統(tǒng)的狀態(tài)轉(zhuǎn)移圖如圖6所示。
圖6 三熱一冷表決系統(tǒng)狀態(tài)轉(zhuǎn)移圖
根據(jù)以上的可靠性模型進(jìn)行可靠性計(jì)算。
3.1 三模表決系統(tǒng)
根據(jù)圖4所示的狀態(tài)轉(zhuǎn)移圖,可得到如下轉(zhuǎn)移概率,即條件概率。
P00=P{X(t+Δt)=0|X(t)=0}=1-3λΔt
(1)
P10=P{X(t+Δt)=1|X(t)=0}=3λΔt
(2)
P20=P{X(t+Δt)=2|X(t)=0}=0
(3)
P01=P{X(t+Δt)=0|X(t)=1}=μΔt
(4)
P11=P{X(t+Δt)=1|X(t)=1}=1-2λΔt-μΔt
(5)
P21=P{X(t+Δt)=2|X(t)=1}=2λΔt
(6)
P02=P{X(t+Δt)=0|X(t)=2}=0
(7)
P12=P{X(t+Δt)=1|X(t)=2}=μΔt
(8)
P22=P{X(t+Δt)=2|X(t)=2}=1-μΔt
(9)
現(xiàn)欲求X(t)在不同狀態(tài)下的概率,P0(t)=P{X(t)=0},P1(t)=P{X(t)=1},P2(t)=P{X(t)=2}。根據(jù)全概率公式。
(10)
將式(1)~式(9)代入式(10)后,經(jīng)過整理并求Δt→0的極限,可將式(10)寫成微分方程組的形式。
(11)
考慮系統(tǒng)初始狀態(tài)為正常的初值情況,[P0(t)P1(t)P2(t)]’=[1 0 0]’。利用拉普拉斯變換將微分方程變換成線性方程組后,解得[P0(s)P1(s)P2(s)],再通過反拉式變換可解得時(shí)域解P0(t),P1(t),P2(t)。則據(jù)此可以算得三模表決系統(tǒng)的可靠度A3m(t),
A3m(t)=P0(t)+P1(t)
(12)
3.2 四模表決系統(tǒng)
根據(jù)圖5所示的狀態(tài)轉(zhuǎn)移圖,可得到如下轉(zhuǎn)移概率,即條件概率。
P00=P{X(t+Δt)=0|X(t)=0}=1-4λΔt
(13)
P10=P{X(t+Δt)=1|X(t)=0}=4λΔt
(14)
P20=P{X(t+Δt)=2|X(t)=0}=0
(15)
P30=P{X(t+Δt)=3|X(t)=0}=0
(16)
P01=P{X(t+Δt)=0|X(t)=1}=μΔt
(17)
P11=P{X(t+Δt)=1|X(t)=1}=1-(3λ+μ)Δt
(18)
P21=P{X(t+Δt)=2|X(t)=1}=3λΔt
(19)
P31=P{X(t+Δt)=3|X(t)=1}=0
(20)
P02=P{X(t+Δt)=0|X(t)=2}=0
(21)
P12=P{X(t+Δt)=1|X(t)=2}=μΔt
(22)
P22=P{X(t+Δt)=2|X(t)=2}=1-(2λ+μ)Δt
(23)
P32=P{X(t+Δt)=3|X(t)=2}=2λΔt
(24)
P03=P{X(t+Δt)=0|X(t)=3}=0
(25)
P13=P{X(t+Δt)=1|X(t)=3}=0
(26)
P23=P{X(t+Δt)=2|X(t)=3}=μΔt
(27)
P33=P{X(t+Δt)=3|X(t)=3}=1-μΔt
(28)
現(xiàn)欲求X(t)在不同狀態(tài)下的概率,P0(t)=P{X(t)=0},P1(t)=P{X(t)=1},P2(t)=P{X(t)=2},P3(t)=P{X(t)=3}。根據(jù)全概率公式。
(29)
將式(13)~式(28)代入式(29)后,經(jīng)過整理并求Δt→0的極限,可將式(29)寫成微分方程組的形式。
(30)
考慮系統(tǒng)初始狀態(tài)為正常的初值情況,[P0(t)P1(t)P2(t)P3(t)]’=[1 0 0 0]’。利用拉普拉斯變化將微分方程變換成線性方程組后,解得[P0(s)P1(s)P2(s)P3(s)],再通過反拉式變化可解得時(shí)域解P0(t),P1(t),P2(t),P3(t)。則據(jù)此可以算得四模表決系統(tǒng)的可靠度A4m(t),
A4m(t)=P0(t)+P1(t)+P2(t)
(31)
3.3 三熱一冷表決系統(tǒng)
根據(jù)圖3所示的狀態(tài)轉(zhuǎn)移圖,可得到如下轉(zhuǎn)移概率,即條件概率。
P00=P{X(t+Δt)=0|X(t)=0}=1-3λΔt
(32)
P10=P{X(t+Δt)=1|X(t)=0}=3λΔt
(33)
P20=P{X(t+Δt)=2|X(t)=0}=0
(34)
P30=P{X(t+Δt)=3|X(t)=0}=0
(35)
P01=P{X(t+Δt)=0|X(t)=1}=μΔt
(36)
P11=P{X(t+Δt)=1|X(t)=1}=1-(3λ+μ)Δt
(37)
P21=P{X(t+Δt)=2|X(t)=1}=3λΔt
(38)
P31=P{X(t+Δt)=3|X(t)=1}=0
(39)
P02=P{X(t+Δt)=0|X(t)=2}=0
(40)
P12=P{X(t+Δt)=1|X(t)=2}=μΔt
(41)
P22=P{X(t+Δt)=2|X(t)=2}=1-(2λ+μ)Δt
(42)
P32=P{X(t+Δt)=3|X(t)=2}=2λΔt
(43)
P03=P{X(t+Δt)=0|X(t)=3}=0
(44)
P13=P{X(t+Δt)=1|X(t)=3}=0
(45)
P23=P{X(t+Δt)=2|X(t)=3}=μΔt
(46)
P33=P{X(t+Δt)=3|X(t)=3}=1-μΔt
(47)
現(xiàn)在欲求X(t)在不同狀態(tài)下的概率,P0(t)=P{X(t)=0},P1(t)=P{X(t)=1},P2(t)=P{X(t)=2},P3(t)=P{X(t)=3}。根據(jù)全概率公式。
(48)
將式(32)~式(47)代入式(48)后,經(jīng)過整理并求Δt→0的極限,可將式(48)寫成微分方程組的形式。
(49)
考慮系統(tǒng)初始狀態(tài)為正常的初值情況,[P0(t)P1(t)P2(t)P3(t)]’=[1 0 0 0]’。利用拉普拉斯變化將微分方程變換成線性方程組后,解得[P0(s)P1(s)P2(s)P3(s)],再通過反拉式變化可解得時(shí)域解P0(t),P1(t),P2(t),P3(t)。則據(jù)此可以算得三熱一冷表決系統(tǒng)的可靠度A3h1c(t),
A3h1c(t)=P0(t)+P1(t)+P2(t)
(50)
根據(jù)式(12)、式(31)、式(50)可以分析與比較失效率和修復(fù)率對(duì)不同形式系統(tǒng)可靠性的影響。根據(jù)目前國內(nèi)器件的平均失效率分析,取單臺(tái)計(jì)算機(jī)的失效率λ=0.001/h。圖7顯示了失效率λ=0.001/h,模塊的維修率μ=0.1/h的情況下,不同系統(tǒng)形式的可靠度隨時(shí)間變化的曲線。
由圖中我們可以看出,3種形式的可靠度最后都趨向于常值,這是由于本文僅研究系統(tǒng)穩(wěn)定可靠期所致。實(shí)際上,隨著時(shí)間的推移,最終產(chǎn)品都會(huì)趨向于失效,這已超出本文所研究的范圍。由圖中可以看出,在相同失效率和修復(fù)率的情況下,三熱一冷的可靠度最高,約為99.99825%,四模熱備份的可靠度約為99.99770%,三模熱備份的可靠度最低,約為99.94178%。
雖然四模熱備的可靠度和三熱一冷的可靠度很相似,但在
圖7 不同形式表決系統(tǒng)的可靠度比較
實(shí)際使用過程中,三熱一冷的系統(tǒng)形式始終有一模處于冷的狀態(tài),這樣對(duì)于減小系統(tǒng)功耗是有利的。因此,在四模熱備、三熱一冷、三模熱備這幾種形式的表決系統(tǒng)中,三熱一冷是最優(yōu)的。
而對(duì)于可重構(gòu)系統(tǒng),其修復(fù)率不僅取決于硬件結(jié)構(gòu)的設(shè)計(jì),同時(shí)也取決于可重構(gòu)系統(tǒng)軟件的架構(gòu)。下表顯示了不同修復(fù)率情況下,不同系統(tǒng)形式的可靠度變化。
表1 修復(fù)率以及系統(tǒng)構(gòu)成對(duì)系統(tǒng)可靠度的影響
由該表可以看出,如果提升修復(fù)率后,各系統(tǒng)形式的可靠度均有上升。在高修復(fù)率的情況下,三模系統(tǒng)的可靠度能達(dá)到低修復(fù)率的四模系統(tǒng)。這一點(diǎn)說明,對(duì)于三模系統(tǒng),如果重構(gòu)系統(tǒng)設(shè)計(jì)完善,對(duì)不同故障都能夠修復(fù),那么該三模系統(tǒng)的可靠度會(huì)比一個(gè)設(shè)計(jì)不合理的四模系統(tǒng)要高。
通過以上分析可以得到如下兩點(diǎn)結(jié)論:
1)綜合考慮系統(tǒng)的可靠度、體積、功耗等因素后,在四模熱備、三熱一冷、三模熱備這幾種形式的表決系統(tǒng)中,三熱一冷是最優(yōu)的。
2)對(duì)于三模可重構(gòu)系統(tǒng),需要設(shè)計(jì)完善的重構(gòu)機(jī)制,盡量修復(fù)不同的故障模式,那么該三模系統(tǒng)的可靠度會(huì)比一個(gè)設(shè)計(jì)不合理的四??芍貥?gòu)系統(tǒng)要高。
本文針對(duì)比較常用的三模冗余、三熱一冷以及四模熱備這幾種冗余可重構(gòu)計(jì)算機(jī)的可靠性進(jìn)行分析。在一定的假設(shè)條件下,對(duì)比了這幾種體系結(jié)構(gòu)的可靠性。結(jié)果表明,在綜合考慮系統(tǒng)的可靠度、體積、功耗等因素后,在四模熱備、三熱一冷、三模熱備這幾種形式的表決系統(tǒng)中,三熱一冷是最優(yōu)的。同時(shí),如果三??芍貥?gòu)系統(tǒng)的重構(gòu)機(jī)制設(shè)計(jì)完善,修復(fù)率較高,那么該三模系統(tǒng)的可靠度會(huì)比一個(gè)設(shè)計(jì)不合理的四??芍貥?gòu)系統(tǒng)要高。因此在這幾種多模冗余可重構(gòu)計(jì)算機(jī)體系結(jié)構(gòu)中,可優(yōu)先考慮三模冗余結(jié)構(gòu)。如果對(duì)可靠性有進(jìn)一步的要求,可選擇三熱一冷的結(jié)構(gòu)形式。
[1] Majid Asadi,Ismihan Bayramoglu.The Mean Residual Life Function of a k-out-of-n Structure at the System Level [J].IEEE Transactions on Reliability,2006,55(2):314-317.
[2] 李榮強(qiáng),姜巍巍,曹德舜.基于典型冗余結(jié)構(gòu)的安全儀表系統(tǒng)可靠性對(duì)比分析 [J].安全技術(shù),2015,15(8):11-13.
[3] 張本宏,陸 陽,韓江洪,等.“二乘二取二”冗余系統(tǒng)的可靠性和安全性分析[J].系統(tǒng)仿真學(xué)報(bào),2009,21(1):256-261.
[4] 武曉春,高雪娟.雙模冗余-比較系統(tǒng)與三模冗余系統(tǒng)的性能比較[J].自動(dòng)化與儀器儀表,2012,164(6):169-171.
[5] 陳 州,倪 明.三模冗余系統(tǒng)的可靠性與安全性分析[J].計(jì)算機(jī)工程,2012,38(14):239-245.
Study on Reliability of Multiple Modular Redundant Reconfigurable Computer
Li Xingwei, Bai Bo, Zhou Jun
(Institute of Precision Guidance and Control, Northwestern Polytechnical University, Xi’an 710072, China)
In order to improve the reliability of multiple modular reconfigurable computers with minimum cost, the reliability of different computer architectures need to be evaluated with system power and volume consideration. First, considering the redundant reconfigurable computer architecture of triple modular redundancy (TMR), quadruple modular redundant (QMR)and triple modular with one cold backup, the fault state transition diagrams of these architectures are proposed. Second, the reliability models of these computer systems are built with Markov model. Third, considering the influences of reliability with failure rate and maintenance ratio, the reliability of different structure are evaluated based on the above three models. The comparison of three results indicates that, the reliability of triple modular with one cold is less than the reliability of QMR, while it is bigger than the reliability of TMR. But after considering the factors of reliability, system volume and power consumption, the triple modular with one cold is optimal. And the reliability of a perfectly designed TMR reconfigurable system will be higher than that of a bad designed QMR reconfigurable system.
multiple modular redundant; Markov model; reconfigurable computer
2016-12-27;
2017-02-06。
航天支撐技術(shù)基金(2015-HT-XGD);西北工業(yè)大學(xué)基礎(chǔ)研究基金(JC201205)。
李興偉(1974-),男,內(nèi)蒙古人,博士研究生,主要從事飛行器導(dǎo)航、制導(dǎo)與控制方面的研究。
1671-4598(2017)07-0309-04
10.16526/j.cnki.11-4762/tp.2017.07.077
TP302.8
A