胡慶新,陶桂東,顧愛華,夏文娟,張春陽
(合肥工業(yè)大學(xué) 計算機(jī)與信息學(xué)院,安徽 合肥230009)
我國是一個山洪災(zāi)害頻繁發(fā)生的國家,山洪發(fā)生大部分是以泥石流、山體滑坡的形式出現(xiàn),一旦發(fā)生就會帶來嚴(yán)重的影響。目前人工觀測的方式耗費大量的人力資源,且可靠性和實時性不高,所以需要建立高可靠性的山洪預(yù)警系統(tǒng)。而遠(yuǎn)程終端控制系統(tǒng)RTU(Remote Tenninal Unit)是其核心組成部分。RTU主要用于對信號、工業(yè)設(shè)備的監(jiān)測和控制[1],其可靠性是研究的要點。
對于山洪預(yù)警系統(tǒng),需要設(shè)計一個可以測量雨量和水位的RTU。由于山洪預(yù)警系統(tǒng)對RTU可靠性的要求較高,所以對RTU采用雙機(jī)系統(tǒng)結(jié)構(gòu)。建立Markov模型對單機(jī)系統(tǒng)和雙機(jī)熱備系統(tǒng)的可靠性和安全性進(jìn)行評估。
RTU的主要功能[2]是對現(xiàn)場進(jìn)行數(shù)據(jù)采集、處理和數(shù)據(jù)通信,并且RTU具有存儲、顯示、設(shè)置、報警的功能。本文設(shè)計的RTU主要具有檢測雨量和水庫水位的功能。具體功能如下:
(1)數(shù)據(jù)采集功能:主要負(fù)責(zé)采集由雨量傳感器和水位傳感器傳送來的模擬信號;
(2)數(shù)據(jù)處理功能:對采集到的模擬信號按照計算公式轉(zhuǎn)化為相應(yīng)的數(shù)字信號;
(3)數(shù)據(jù)存儲功能:RTU配備了大容量的存儲器以供存儲現(xiàn)場處理數(shù)據(jù);
(4)顯示功能:RTU可以顯示現(xiàn)場的水位、雨量以及終端的收發(fā)狀態(tài);
(5)設(shè)置功能:如對水位測量時,RTU可以設(shè)定周期(如1 h)采集傳感器數(shù)據(jù);
(6)報警功能:當(dāng)測量的水位和雨量超過設(shè)定值時,蜂鳴器產(chǎn)生報警信號;
(7)數(shù)據(jù)通信功能:提供若干種通信規(guī)約,支持無線通信的功能,例如將采集到的數(shù)據(jù)通過RS232串口傳送到GPRS模塊,再通過GPRS網(wǎng)絡(luò)發(fā)送到數(shù)據(jù)中心;
(8)診斷和恢復(fù)功能:本文設(shè)計的雙機(jī)系統(tǒng)的檢測包括自檢和它檢功能。
由于RTU工作的環(huán)境比較惡劣,現(xiàn)場的溫度和濕度都會有很大的變化,而且時常會發(fā)生雷擊,所以對RTU的設(shè)計需要達(dá)到一定的標(biāo)準(zhǔn)。RTU的溫度指標(biāo)應(yīng)該在-20℃~+70℃,濕度應(yīng)該為90%RH,平均無故障時間(MTBF)至少達(dá)到30 000 h,此外還應(yīng)具有抗雷擊、抗電磁干擾的能力。
系統(tǒng)模塊包括以下幾個部分[1,3]:
(1)主控制器模塊:通過兩片MC9S08QE64單片機(jī)構(gòu)成雙機(jī)熱備系統(tǒng),通過增加心跳總線和控制總線對兩個模塊進(jìn)行故障檢測和控制。
(2)電源模塊:通過2個繼電器,為外部設(shè)備提供 2路經(jīng)過DC/DC隔離的直流電,電流200 mA即可供電或斷電。將蓄電池的電壓由12 V變成5 V,給單片機(jī)供電。
(3)通信模塊:用一個串口提供2路RS232接口(1路接衛(wèi)星,1路接 GPRS,不隔離);用一個串口提供2個RS232接口和 1個RS485接口;1個SPI接口,供外部擴(kuò)展IO口用。
(4)輸入輸出模塊:包括數(shù)字量的輸入輸出模塊、模擬量的輸入模塊等。
(5)存儲模塊:1個4 MB大容量的存儲芯片MR25H40用來臨時存放采集到的各種數(shù)據(jù)。
由于RTU的工作環(huán)境比較惡劣,為滿足工業(yè)控制的指標(biāo)和需求,各模塊與單片機(jī)之間要加上隔離保護(hù)器件,如12 V變 5 V的非隔離DC/DC、防雷保護(hù)電路等。RTU的系統(tǒng)結(jié)構(gòu)框圖如圖1所示。
RTU工作現(xiàn)場的環(huán)境惡劣,這要求其具有很高的可靠性。由于單機(jī)系統(tǒng)[4]的容錯能力較差、可靠性不高,同時三模冗余系統(tǒng)[5]和雙模冗余-比較系統(tǒng)[6]的復(fù)雜度大、成本較高,所以經(jīng)過比較采用雙機(jī)熱備系統(tǒng)。如今國內(nèi)對系統(tǒng)可靠性的研究方法比較多,例如基于故障樹的分析方法、基于petri網(wǎng)的分析方法、故障模式及危害性分析、基于Markov模型的分析方法。由于雙機(jī)熱備的各個狀態(tài)轉(zhuǎn)換是一個隨機(jī)的動態(tài)過程,而Markov是研究狀態(tài)轉(zhuǎn)換的最佳方法,所以選用基于Markov模型的分析方法。最后對單機(jī)系統(tǒng)和雙機(jī)系統(tǒng)的可靠性和安全性進(jìn)行了比較。
在建立Markov模型之前,需要對可修復(fù)系統(tǒng)提出以下假設(shè):(1)系統(tǒng)的模塊和對應(yīng)的元器件完全相同,系統(tǒng)模塊切換完全可靠,維修時只有一組維修工;(2)元器件的失效率λ和維修率μ在狀態(tài)轉(zhuǎn)移過程中服從常指數(shù)分布,在極短的時間△t內(nèi)不會發(fā)生兩次及兩次以上的狀態(tài)轉(zhuǎn)移,模塊在 t時刻正常工作,則在 t~t+△t之間發(fā)生故障的概率為 P≈λ△t;(3)初始時刻各模塊都處于完好狀態(tài);(4)對于單機(jī)系統(tǒng)考慮故障檢測率,故障時不考慮維修;(5)各模塊故障檢測覆蓋率為c,即存在可測故障和不可測故障。
根據(jù)以上假設(shè),給出了單機(jī)系統(tǒng)和雙機(jī)熱備系統(tǒng)的狀態(tài)轉(zhuǎn)換圖,如圖2和圖3所示。
3.2.1 單機(jī)可測系統(tǒng)狀態(tài)分析
對于單機(jī)可測系統(tǒng)有以下3種狀態(tài):
狀態(tài)1:單機(jī)系統(tǒng)處于正常狀態(tài);
狀態(tài)2:單機(jī)系統(tǒng)出現(xiàn)可測故障,系統(tǒng)輸出故障安全狀態(tài),系統(tǒng)停機(jī)失效;
狀態(tài)3:單機(jī)系統(tǒng)處于不可測故障,系統(tǒng)處于危險狀態(tài)。
由以上可知只有狀態(tài)1是可靠狀態(tài),狀態(tài)1和狀態(tài)2是安全狀態(tài)。由圖2得到狀態(tài)轉(zhuǎn)移方程如下:
P1(t+△t)=(1-λ△t)P1(t)
P2(t+△t)=cλ△tP1(t)+P2(t)
P3(t+△t)=(1-c)λ△tP1(t)+P3(t)
由上式求出極短時間(△t→0)時的極限微分方程組并對其求解,帶入初始條件 P1(0)=1,P2(0)=0,P3(0)=0,得出單機(jī)系統(tǒng)的可靠度R(t)和安全度S(t)的表達(dá)式如下:
R(t)=P1(t),S(t)=R(t)+P2(t)
3.2.2 雙機(jī)熱備系統(tǒng)的狀態(tài)分析
雙機(jī)熱備系統(tǒng)有以下7種工作狀態(tài)[7]:
狀態(tài)1:主機(jī)、備機(jī)都處于正常狀態(tài);
狀態(tài)2:有一個系統(tǒng)發(fā)生可測故障,系統(tǒng)處于單機(jī)工作;
狀態(tài)3:主機(jī)、備機(jī)均出現(xiàn)可測故障,系統(tǒng)停機(jī);
狀態(tài)4:工作機(jī)出現(xiàn)不可測故障,備機(jī)正常,系統(tǒng)處于危險狀態(tài);
狀態(tài)5:主機(jī)正常,備機(jī)出現(xiàn)不可測故障,系統(tǒng)處于安全輸出狀態(tài);
狀態(tài)6:系統(tǒng)處于單機(jī)工作狀態(tài),并且工作機(jī)發(fā)生了不可測故障,系統(tǒng)處于危險狀態(tài);
狀態(tài)7:主機(jī)、備機(jī)都出現(xiàn)不可測故障,系統(tǒng)處于危險狀態(tài)。
根據(jù)圖3所示的狀態(tài)圖,可列出離散時間的馬爾可夫模型方程組:
P0(t+△t)=(1-2λ△t)P0(t)+μ△tP1(t)
P1(t+△t)=2cλ△tP0(t)+(1-μ△t-λ△t)P1(t)
P2(t+△t)=cλ△t P1(t)+P2(t)
P3(t+△t)=(1-c)λ△tP0(t)+(1-λ△t)P3(t)+μ△tP5(t)P4(t+△t)=(1-c)λ△tP0(t)+(1-λ△t)P4(t)
P5(t+△t)=(1-c)λ△tP1(t)+cλ△tP3(t)+cλ△tP4(t)+(1-μ△t)P5(t)
P6(t+△t)=(1-c)λ△tP3(t)+(1-c)λ△tP4(t)+P6(t)
對以上的微分方程組求解,并且?guī)氤跏紬l件P0(0)=1,P1(0)=P2(0)=P3(0)=P4(0)=P5(0)=P6(0)=0,得出雙機(jī)系統(tǒng)的R(t)和 S(t)的表達(dá)式如下:
R(t)=P0(t)+P1(t)+P4(t),S(t)=R(t)+P2(t)
3.2.3 仿真分析
由于求解微分方程比較困難,采用Matlab進(jìn)行仿真。根據(jù)實際情況對模型中的各個參數(shù)進(jìn)行假設(shè)。此時取λ=0.000 1 次/h,μ=0.1,c=0.9,時間取 0、1 000 h、3 000 h、5 000 h、8 000 h、10 000 h。 表 1和表 2給出了單機(jī)系統(tǒng)和雙機(jī)系統(tǒng)的可靠度和安全度數(shù)據(jù)。圖4對單機(jī)可測系統(tǒng)和雙機(jī)熱備系統(tǒng)的可靠度和安全度進(jìn)行了比較。
表1 單機(jī)可測系統(tǒng)的可靠度和安全度
表2 雙機(jī)可測系統(tǒng)的可靠度和安全度
由表1可以看出單機(jī)可測系統(tǒng)的可靠度和安全度隨著時間的增加而減小,且可靠度減小的幅度明顯比安全度要大。
由表2同樣也可以得出雙機(jī)熱備系統(tǒng)的可靠度和安全度會隨時間的增加而減小,但是下降幅度不明顯,且二者數(shù)值比較接近。
由圖4可以看出雙機(jī)熱備系統(tǒng)的可靠度明顯高于單機(jī)系統(tǒng)的可靠度,且單機(jī)系統(tǒng)在5 000 h時其可靠度躍為0.6,而雙機(jī)熱備系統(tǒng)的可靠度還高達(dá)0.94。雙機(jī)熱備系統(tǒng)的安全度和單機(jī)系統(tǒng)的安全度相差不大,都處于較高的水平。比較得出雙機(jī)熱備系統(tǒng)比單機(jī)系統(tǒng)好,更加適合設(shè)計高可靠的RTU。
通過對雙機(jī)熱備系統(tǒng)和單機(jī)系統(tǒng)的比較,得出雙機(jī)熱備技術(shù)既可以保持較高的安全度,同時也明顯提高了系統(tǒng)的可靠性,對于比較惡劣的環(huán)境采用雙機(jī)熱備技術(shù)提高RTU的可靠性是很好的選擇。
[1]陳梓馥,孫萬蓉,董明明,等.基于 ARM9的 RTU設(shè)計[J].物聯(lián)網(wǎng)技術(shù),2012,2(3):54-58.
[2]宋濤.水文自動測報系統(tǒng)RTU的設(shè)計[D].太原:太原理工大學(xué),2010.
[3]呂宗平.RTU在水電站計算機(jī)監(jiān)控中的應(yīng)用[D].武漢:華中科技大學(xué),2005.
[4]姜堅華.雙機(jī)熱備系統(tǒng)的技術(shù)研究和具體實現(xiàn)[J].微型電腦應(yīng)用,2004,20(3):7-8.
[5]王麗華,徐志根,王長林.可維修三模冗余結(jié)構(gòu)系統(tǒng)的可靠度與安全度分析[J].西南交通大學(xué)學(xué)報,2002,37(1):104-107.
[6]張本宏,陸陽,魏臻,等.雙模冗余一比較系統(tǒng)的可靠性和安全性分析[J].系統(tǒng)工程學(xué)報,2009,24(2):231-237.
[7]覃慶努,魏學(xué)業(yè),于蓉蓉,等.基于雙機(jī)聯(lián)合故障檢測的雙機(jī)熱備系統(tǒng)可靠性和安全性研究[J].系統(tǒng)工程與電子技術(shù),2011,33(12):210-215.