翁盛鑫,黃影
海軍總醫(yī)院 計(jì)算機(jī)管理中心,北京100037
HIS服務(wù)器系統(tǒng)的三種備份方案設(shè)計(jì)與比較
翁盛鑫,黃影
海軍總醫(yī)院 計(jì)算機(jī)管理中心,北京100037
本文分析了“軍字一號(hào)”HIS數(shù)據(jù)庫服務(wù)器系統(tǒng)的安全現(xiàn)狀和潛在的安全漏洞,針對(duì)其安全隱患,設(shè)計(jì)了“軍字一號(hào)”HIS系統(tǒng)存儲(chǔ)的雙機(jī)熱備等三種高可靠性備份改進(jìn)方案,并對(duì)三種備份方案的可靠性進(jìn)行了分析與比較。
“軍字一號(hào)”;HIS;服務(wù)器備份;雙機(jī)容錯(cuò)
隨著醫(yī)院HIS系統(tǒng)的深入應(yīng)用,醫(yī)院各個(gè)業(yè)務(wù)單位對(duì)計(jì)算機(jī)信息系統(tǒng)的依賴性越來越大,對(duì)其系統(tǒng)的可靠性要求也越來越高。數(shù)據(jù)庫作為信息系統(tǒng)的核心,擔(dān)當(dāng)著重要的角色。為保證醫(yī)院信息系統(tǒng)的正常運(yùn)行以及數(shù)據(jù)的安全,我們?cè)O(shè)計(jì)了一套詳細(xì)、完整和可靠的數(shù)據(jù)備份與恢復(fù)方案,并針對(duì)每種可能發(fā)生的情況進(jìn)行了模擬故障測(cè)試。目的是一旦發(fā)生計(jì)算機(jī)軟硬件故障,造成數(shù)據(jù)庫無法使用時(shí),能夠在盡可能短的時(shí)間內(nèi),最大限度地恢復(fù)系統(tǒng)的正常運(yùn)行,保證數(shù)據(jù)庫系統(tǒng)的高可用性。
1.1 方案一:基于共享存儲(chǔ)的雙機(jī)熱備設(shè)計(jì)
該系統(tǒng)方案采用兩臺(tái)服務(wù)器組成雙機(jī)熱備方式,其組成如圖1所示。
該方案的工作原理[2]是:兩臺(tái)服務(wù)器主機(jī)A和主機(jī)B均為系統(tǒng)提供支持,并通過同步控制點(diǎn)互相偵測(cè)對(duì)方運(yùn)行狀態(tài)。當(dāng)其中一臺(tái)主機(jī)因?yàn)槟撤N原因出現(xiàn)故障,如死機(jī)、主機(jī)斷電、病毒發(fā)作、硬盤損壞等,不能繼續(xù)提供服務(wù)時(shí),另一臺(tái)主機(jī)自動(dòng)接替故障主機(jī)管理磁盤陣列、網(wǎng)絡(luò)通訊、數(shù)據(jù)庫等,繼續(xù)支持信息系統(tǒng)的運(yùn)行,從而保證操作系統(tǒng)級(jí)和數(shù)據(jù)庫級(jí)的同步,保證信息系統(tǒng)的不間斷運(yùn)行(即保證任一服務(wù)器故障下的不間斷運(yùn)行)。
圖1 基于共享存儲(chǔ)的雙機(jī)熱備系統(tǒng)組成
該方案的設(shè)備和配置為:服務(wù)器兩臺(tái);磁盤陣列為5塊磁盤用RAID-5方式容錯(cuò);使用英文版WINDOWS Server 4.0 Enterprise Edition和雙機(jī)熱備容錯(cuò)專用軟件。采用這樣的雙機(jī)熱備工作模式,主要的優(yōu)點(diǎn)是能解決兩臺(tái)服務(wù)器硬件和系統(tǒng)軟件的故障問題。當(dāng)任一臺(tái)服務(wù)器故障后,都能實(shí)現(xiàn)自動(dòng)切換,保證系統(tǒng)的不間斷運(yùn)行。
同時(shí)也存在著一些不足:系統(tǒng)的復(fù)雜性增加了,實(shí)際上導(dǎo)致系統(tǒng)的可靠性下降。在本案例中有時(shí)兩臺(tái)主機(jī)同時(shí)死機(jī),不能實(shí)現(xiàn)自動(dòng)切換,不能解決數(shù)據(jù)和應(yīng)用方面的軟件錯(cuò)誤,其中一臺(tái)服務(wù)器處偵測(cè)狀態(tài),基本不能另作他用,造成資源浪費(fèi)。系統(tǒng)偶爾會(huì)出現(xiàn)A和B同時(shí)死機(jī)的現(xiàn)象,此種故障的處理時(shí)間一般較長(zhǎng),用戶難以容忍。雙機(jī)熱備方式中的備用服務(wù)器不能同時(shí)提供另外的數(shù)據(jù)庫服務(wù)功能,比如要進(jìn)行系統(tǒng)調(diào)試和數(shù)據(jù)修改等,只能再另外增配服務(wù)器,從而增大了額外的經(jīng)費(fèi)投入。雙機(jī)熱備方式只解決了服務(wù)器系統(tǒng)軟件和硬件的容錯(cuò)問題,但系統(tǒng)軟件和服務(wù)器硬件故障發(fā)生的概率很小,而對(duì)于絕大多數(shù)操作引起的應(yīng)用錯(cuò)誤問題,雙機(jī)熱備方式一點(diǎn)作用都沒有。
1.2 方案二:基于獨(dú)立存儲(chǔ)的雙機(jī)熱備系統(tǒng)設(shè)計(jì)
圖 2 基于獨(dú)立存儲(chǔ)的雙機(jī)熱備系統(tǒng)組成
為了彌補(bǔ)集中存儲(chǔ)方式的缺點(diǎn)與不足,采用純軟件的方式實(shí)現(xiàn)雙機(jī)容錯(cuò)可以進(jìn)一步提高數(shù)據(jù)的安全性[3]。如圖2所示,它將用戶數(shù)據(jù)存儲(chǔ)于各自服務(wù)器內(nèi)的鏡像盤上,通過鏡像引擎將數(shù)據(jù)進(jìn)行實(shí)時(shí)復(fù)制備份。鏡像盤可以是服務(wù)器本機(jī)上的硬盤,也可以是外部存儲(chǔ)設(shè)備。在主備機(jī)的工作模式下,當(dāng)主機(jī)發(fā)生故障時(shí)(包括各種軟硬件故障),備機(jī)通過心跳同步控制點(diǎn)偵測(cè)到主機(jī)的故障并自動(dòng)接管所有主機(jī)上的資源(如IP地址、數(shù)據(jù)庫服務(wù)或其他應(yīng)用程序、用戶數(shù)據(jù)、計(jì)算機(jī)名等等),在本機(jī)上將繼續(xù)讀取鏡像盤上的數(shù)據(jù)并繼續(xù)運(yùn)行數(shù)據(jù)庫服務(wù)或其他應(yīng)用程序。用戶感覺不到這種故障切換就可以繼續(xù)使用服務(wù)器提供的服務(wù)。待主機(jī)修復(fù)后,可選擇通過手工或自動(dòng)方式將所有已切換到備機(jī)的資源切換回到主機(jī),并且備機(jī)鏡像盤上的所有數(shù)據(jù)自動(dòng)恢復(fù)至主機(jī)的鏡像盤上,此時(shí)可結(jié)合使用快速差分備份軟件,只需要恢復(fù)最新的差分?jǐn)?shù)據(jù)即可,可大大加快這種數(shù)據(jù)恢復(fù)的過程,比普通的全盤復(fù)制方法在性能上有了明顯的提高。
另外,通過該鏡像復(fù)制備份的解決方案可以實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)熱備份,并且數(shù)據(jù)存儲(chǔ)于不同服務(wù)器內(nèi)的鏡像盤上也避免了單點(diǎn)崩潰的可能性,增加了數(shù)據(jù)的安全性及系統(tǒng)的可用性。而且,使用鏡像方式,兩臺(tái)服務(wù)器之間的距離不受外部存儲(chǔ)設(shè)備連接線的限制,可以將兩臺(tái)服務(wù)器放置在不同的位置以實(shí)現(xiàn)異地容災(zāi)功能。
1.3 方案三:基于獨(dú)立存儲(chǔ)的全冗余系統(tǒng)設(shè)計(jì)
從圖3中可以看出,HIS數(shù)據(jù)庫服務(wù)器和IBM存儲(chǔ)磁盤陣列可以通過網(wǎng)絡(luò)進(jìn)行全冗余工作,有效地避免了系統(tǒng)的單點(diǎn)故障,即:HIS服務(wù)器0故障時(shí),可以通過啟動(dòng)HIS服務(wù)器1接管EMC陣列0繼續(xù)工作,或者直接切換HIS服務(wù)器1和IBM磁盤陣列1接管整個(gè)系統(tǒng)。采用小型機(jī)替代PC SERVER,數(shù)據(jù)存儲(chǔ)轉(zhuǎn)向磁盤陣列的SAN存儲(chǔ)方式,并通過該鏡像復(fù)制備份的解決方案實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)熱備份,并且數(shù)據(jù)存儲(chǔ)于不同服務(wù)器內(nèi)的鏡像盤上也避免了單點(diǎn)崩潰的可能性,增加了數(shù)據(jù)的安全性及系統(tǒng)的可用性。而且,使用鏡像方式,兩臺(tái)服務(wù)器之間的距離不受外部存儲(chǔ)設(shè)備連接線的限制,可以將兩臺(tái)服務(wù)器放置在不同的位置以實(shí)現(xiàn)異地容災(zāi)功能。
圖 3 基于獨(dú)立存儲(chǔ)的全冗余系統(tǒng)組成
表 1 三種設(shè)計(jì)方案可靠度的比較
如表1所示,針對(duì)本文所提出的三種解決方案,進(jìn)行可靠性的分析與比較。經(jīng)過比較可以看出,基于SAN存儲(chǔ)架構(gòu)的第三種方案具有明顯的優(yōu)點(diǎn):故障恢復(fù)機(jī)制簡(jiǎn)單、時(shí)間較短、易于操作,并且回避了雙機(jī)備用系統(tǒng)中存在的單點(diǎn)故障瓶頸的問題。
隨著醫(yī)院醫(yī)療信息化進(jìn)程的逐步深入,可靠性在醫(yī)院信息化建設(shè)中的地位與日俱增。本文首先分析了針對(duì)目前醫(yī)院服務(wù)器系統(tǒng)的現(xiàn)狀和存在的安全漏洞,據(jù)此,提出了服務(wù)器系統(tǒng)備份可靠性改進(jìn)的設(shè)計(jì)方案,并進(jìn)行了分析和比較。通過實(shí)現(xiàn)此備份方案,必將大大提高數(shù)字化醫(yī)院的安全性、穩(wěn)定性和可靠性,對(duì)醫(yī)院信息化建設(shè)具有重大的意義。
[1] 羅晶,等.我院信息管理系統(tǒng)中的數(shù)據(jù)備份與恢復(fù)方案[J].海軍總醫(yī)院學(xué)報(bào),2003,16(6):108-110.
[2] 陳建成,等.構(gòu)建醫(yī)院完整的存儲(chǔ)體系架構(gòu)[J].醫(yī)學(xué)信息, 2006(8):1291-1293.
[3] 熊友生,等.服務(wù)器雙機(jī)熱備的問題與備份策略調(diào)整[J].醫(yī)療設(shè)備信息,2004(11):24-25.
[4] 張強(qiáng),等.醫(yī)院信息系統(tǒng)中數(shù)據(jù)備份工具的優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)[J].醫(yī)療設(shè)備信息,2007(5):19-20.
[5] 朱有存,等.基于RMAN的“軍衛(wèi)一號(hào)“數(shù)據(jù)庫備份恢復(fù)方法[J].醫(yī)療衛(wèi)生裝備,2007(1):50-51.
[6] 王維江.網(wǎng)絡(luò)應(yīng)用方案與實(shí)例精講[M].北京:人民郵電出版社,2003.
[7] 周兆確,等.存儲(chǔ)區(qū)域概念與應(yīng)用[M].北京:人民郵電出版社,2002.
[8] 金愛蘭.醫(yī)院信息系統(tǒng)數(shù)據(jù)備份與容災(zāi)策略[J].醫(yī)學(xué)信息, 2007(6):23-25.
Design and Comparison on 3 Backup Schemes for HIS Server System
WENG Sheng-xin, HUANG Ying
Computer Management Center ,Navy General Hospital, Beijing 100037, China
TP393.02
A
10.3969/j.issn.1674-1633.2010.06.015
1674-1633(2010)06-0047-02
2008-06-26
2010-04-01
作者郵箱:navy.hy@gmail.com
Abstract:Combining with practice of hospital informationization,this paper analyzes the security and potential loopholes of the database server system,and designs the improvement schemes of 3 kinds of high reliable backups for the hospital database server system. According to deal with the security hidden trouble, it also analyzes and compares the reliability of 3 kinds schemes.
Key words:No.1 military project; HIS; server backup;dual fault-tolerant