張 鶴,黎茂林,葛蘊翊,呂德奎
(中國電子科技集團公司第二十八研究所,江蘇 南京 210007)
基于SAN存儲的醫(yī)療衛(wèi)生數(shù)據(jù)中心異步數(shù)據(jù)災備設計
張 鶴,黎茂林,葛蘊翊,呂德奎
(中國電子科技集團公司第二十八研究所,江蘇 南京 210007)
隨著數(shù)據(jù)中心建設的興起,及其所承擔業(yè)務重要性的逐漸提升,災備中心越來越多地伴隨主數(shù)據(jù)中心共同建設。目前災備中心的建設思路多種多樣,從存儲網(wǎng)絡上可涵蓋DAS、NAS、SAN,從災備級別上可涵蓋數(shù)據(jù)級、應用級、業(yè)務級災備,從災備技術上可涵蓋冷備、暖備、熱備、雙活,從實現(xiàn)方式上可涵蓋異步、同步,從部署地點上可涵蓋同城、異地。詳細比較各類存儲網(wǎng)絡、災備級別、災備技術的特點,并以醫(yī)療衛(wèi)生災備數(shù)據(jù)中心為設計和建設出發(fā)點,介紹了以SAN為存儲網(wǎng)絡,建設遠程異步數(shù)據(jù)級災備中心的詳細思路與工作流程,可為中小型數(shù)據(jù)災備中心建設提供參考。
SAN;數(shù)據(jù)存儲;數(shù)據(jù)級災備;災備技術
隨著計算機技術與網(wǎng)絡通信技術的不斷進步,各級政府在進行日常工作時,越來越多地依賴于使用信息化手段進行數(shù)據(jù)處理,而數(shù)據(jù)處理的效率則依賴于數(shù)據(jù)中心的穩(wěn)定運行。由于數(shù)據(jù)中心本身固有的特性,它將用于承擔海量數(shù)量的存儲與處理,而隨著網(wǎng)絡的開放性逐漸加大,以及各類不可控災難的發(fā)生,數(shù)據(jù)中心出現(xiàn)數(shù)據(jù)丟失的可能性也與日俱增。如果不能夠對這些風險進行有效地控制與處理,一旦出現(xiàn)數(shù)據(jù)丟失,很有可能對各級政府的日常工作造成不可估量的損失。因此,如何確保數(shù)據(jù)中心的高可用性與高可靠性,是數(shù)據(jù)中心建設必須要考慮的問題。
鑒于上述問題,本文提出采用SAN存儲網(wǎng)絡進行數(shù)據(jù)存儲,并搭建醫(yī)療衛(wèi)生主數(shù)據(jù)中心與遠程異步數(shù)據(jù)災備中心,為中小型醫(yī)療衛(wèi)生數(shù)據(jù)中心進行災難備份提供應用參考。
災備,即災難備份,是指為了防止出現(xiàn)操作失誤或系統(tǒng)故障而導致的數(shù)據(jù)丟失,而將整個系統(tǒng)或部分數(shù)據(jù),從應用服務器主機的存儲介質復制到其它存儲介質的過程[1]。
1.1 災難備份級別
災難備份從保障的程度上一般分為3個級別:數(shù)據(jù)級、應用級和業(yè)務級。其中數(shù)據(jù)級災備用于保障數(shù)據(jù)不受到損壞、應用級災備用于確保災備中心應用能夠快速地接管主數(shù)據(jù)中心應用,業(yè)務級災備用于備份業(yè)務場景。
(1)數(shù)據(jù)級災備。數(shù)據(jù)級災備主要關注數(shù)據(jù),就是在災難發(fā)生之后,可以確保數(shù)據(jù)不受到損壞[2]。對于低級別數(shù)據(jù)級災備來說,只需要定期將備份的數(shù)據(jù)存儲設備從主數(shù)據(jù)中心轉運至異地保存即可。而對于高級別的數(shù)據(jù)級災備,則需要借助于數(shù)據(jù)復制工具來實現(xiàn)主備數(shù)據(jù)中心之間的數(shù)據(jù)傳輸。
(2)應用級災備。應用級災備關注于應用系統(tǒng),在異地災備中心再構建一套應用支撐系統(tǒng),支撐系統(tǒng)包括數(shù)據(jù)備份、備用數(shù)據(jù)處理、備用網(wǎng)絡等系統(tǒng)。應用級災備中心能夠在主數(shù)據(jù)中心發(fā)生故障后快速接管應用,從而盡量減少系統(tǒng)宕機時間,提高業(yè)務連續(xù)性。
(3)業(yè)務級災備。業(yè)務級災備是最高級別的災備系統(tǒng)。業(yè)務級災備不局限于業(yè)務數(shù)據(jù)、業(yè)務應用的備份,而是將備份的范疇拓展到了實際業(yè)務場景。當發(fā)生嚴重災難而導致用戶的業(yè)務場景出現(xiàn)損壞時,業(yè)務級災備為用戶提供了另外一套備份業(yè)務場景用于業(yè)務處理。當然,業(yè)務級災備的使用必須在數(shù)據(jù)級災備與應用級災備的基礎之上完成。
1.2 災難備份技術
隨著數(shù)據(jù)中心承載業(yè)務的重要性逐漸提高,只有引入切實有效的災備技術,才能夠真正意義上減輕數(shù)據(jù)中心發(fā)生故障后帶來的損失。數(shù)據(jù)中心災備技術主要分為4種:冷備、暖備、熱備和雙活。
(1)冷備。冷備技術是中小型數(shù)據(jù)中心或者承載業(yè)務不重要的站點經(jīng)常使用的災備技術。當數(shù)據(jù)中心出現(xiàn)故障時,數(shù)據(jù)中心管理人員借用其它的數(shù)據(jù)中心(例如其它企業(yè)數(shù)據(jù)中心或網(wǎng)絡公用云數(shù)據(jù)中心)臨時恢復數(shù)據(jù)中心的運轉,而當數(shù)據(jù)中心故障恢復后,再將業(yè)務切回本中心。這種災備方式的時間難以保證,有時臨時搭建的平臺也可能因為不穩(wěn)定而再次出現(xiàn)中斷。當然這種方式不必準備大量的空閑設備,維護成本可以忽略不計。冷備技術從啟用到真正可以開始工作需要較高的成本和時間,通常需要幾天甚至一周或者更長的時間。
(2)暖備。暖備技術是在主備數(shù)據(jù)中心的基礎上實現(xiàn)的。應用業(yè)務部署于主數(shù)據(jù)中心,備用數(shù)據(jù)中心則采用暖備部署方式。當主數(shù)據(jù)中心出現(xiàn)故障后,需要在規(guī)定的RTO之內,啟用備用數(shù)據(jù)中心,實現(xiàn)業(yè)務的整體切換。暖備中心平時處于休眠狀態(tài),只有當主數(shù)據(jù)中心出現(xiàn)故障時,才由數(shù)據(jù)中心管理人員手工啟用。
(3)熱備。熱備技術同樣在主備數(shù)據(jù)中心的基礎上完成。不同于暖備技術,熱備技術使用調度軟件感知主數(shù)據(jù)中心故障,一旦故障發(fā)生,立即切換災備數(shù)據(jù)中心業(yè)務應用軟件。熱備中心需要隨時保持待命狀態(tài),一旦主數(shù)據(jù)中心出現(xiàn)故障,能夠立刻被自動啟用。
(4)雙活。雙活技術一般應用于大型數(shù)據(jù)中心。使用雙活技術,主備數(shù)據(jù)中心均需要保持正常運轉,并通過負載均衡技術,將數(shù)據(jù)中心業(yè)務分攤至兩個數(shù)據(jù)中心當中。當其中一個數(shù)據(jù)中心出現(xiàn)故障時,另一數(shù)據(jù)中心將承擔所有業(yè)務。使用雙活技術不會造成數(shù)據(jù)中心資源的浪費,等同于主備數(shù)據(jù)中心都在為用戶提供服務。
1.3 災備選擇
災難備份的級別與技術需要根據(jù)數(shù)據(jù)中心的級別與承載數(shù)據(jù)的重要性確定[3],本文依托的應用背景為中小型醫(yī)療業(yè)務數(shù)據(jù)中心,因此選擇對主數(shù)據(jù)中心進行異地數(shù)據(jù)級災備,并使用熱備技術確保數(shù)據(jù)能夠快速地進行切換。
2.1 存儲網(wǎng)絡技術
網(wǎng)絡存儲技術是基于數(shù)據(jù)存儲的一種通用網(wǎng)絡術語。網(wǎng)絡存儲結構大致分為3種:直連式存儲(DAS)、網(wǎng)絡存儲設備(NAS)和存儲網(wǎng)絡(SAN)。
(1)DAS。DAS,即直連式存儲,是最為簡單,也最為常用的一種存儲網(wǎng)絡。它將外部存儲設備直連在服務器的內部總線上,使數(shù)據(jù)存儲設備成為整個服務器結構的一部分。DAS存儲方式主要適用于地理位置分散的網(wǎng)絡、小型網(wǎng)絡和特殊服務器上。
(2)NAS。NAS(網(wǎng)絡附加存儲)存儲方式全面改進了低效的DAS存儲方式。NAS獨立于服務器,單獨為網(wǎng)絡數(shù)據(jù)的存儲開發(fā)了一種文件服務器,用以連接存儲設備,并形成一個網(wǎng)絡[4]。這樣數(shù)據(jù)存儲就不再是服務器的附屬,而是作為獨立網(wǎng)絡節(jié)點存在于網(wǎng)絡之中,可由所有的網(wǎng)絡用戶共享。
(3)SAN。SAN存儲是基于光纖介質,最大傳輸速率達17MB/s的服務器訪問存儲器的一種連接方式,同時SAN也是最昂貴和最復雜的存儲選項,SAN存儲方式創(chuàng)造了存儲的網(wǎng)絡化,存儲網(wǎng)絡化順應了計算機服務器體系結構網(wǎng)絡化的趨勢,SAN的支撐技術是光纖通道技術,它是ANSI為網(wǎng)絡和通道I/O接口建立的一個標準集成,其最大特性是將網(wǎng)絡和設備的通信協(xié)議與傳輸物理介質隔離開,這樣多種協(xié)議可在同一個物理連接上同時傳送[5]。
2.2 存儲網(wǎng)絡選擇
從連接方式上對比,DAS將存儲設備直接與應用服務器進行相連,具備一定的靈活性;NAS通過網(wǎng)絡技術連接存儲設備和應用服務器,存儲設備位置靈活,隨著萬兆網(wǎng)的出現(xiàn),傳輸速率有了很大的提高;SAN則是通過光纖通道技術將存儲設備和應用服務器進行連接,具備極快的傳輸速率和極強的擴展性[6]。3種存儲方式各有優(yōu)勢,相互共存,被廣泛地應用于數(shù)據(jù)存儲應用中。
表 1中詳細描述了3類存儲網(wǎng)絡技術的區(qū)別,其中SAN包括ISCSI/IP SANS與光纖通道兩種類型。
表1 存儲網(wǎng)絡技術對比
存儲網(wǎng)絡的選擇取決于數(shù)據(jù)中心的預算、存儲數(shù)據(jù)的類型、災備等級要求等多種因素,本文描述的數(shù)據(jù)災備中心使用基于磁盤陣列的數(shù)據(jù)復制技術,在存儲網(wǎng)絡技術上,選擇SAN技術,并使用光纖通道連接磁盤陣列與服務器。
3.1 數(shù)據(jù)中心概述
本文依托的項目為區(qū)域醫(yī)療信息化項目,主數(shù)據(jù)中心部署于當?shù)卣l(wèi)生局數(shù)據(jù)機房當中,用于存儲當?shù)蒯t(yī)療衛(wèi)生機構和居民的醫(yī)療衛(wèi)生信息??紤]到主數(shù)據(jù)中心存儲的居民新農(nóng)合與醫(yī)保結算費用信息、居民健康檔案信息、居民健康卡維護信息等一旦丟失,將嚴重影響醫(yī)療衛(wèi)生體系的正常運轉,影響居民的日常就診行為,因此在進行數(shù)據(jù)中心設計時,要為主數(shù)據(jù)中心配備一個異地災備中心。
由于業(yè)務需要,異地災備中心部署于離主數(shù)據(jù)中心超過2 000km的軟件公司數(shù)據(jù)機房中??紤]到主備數(shù)據(jù)中心之間傳輸距離過長,在進行同步與異步的災備方式選擇時,決定使用異步的方式進行災備。同時,考慮到本次災備設計的出發(fā)點,是保證數(shù)據(jù)不丟失,并能夠在主數(shù)據(jù)中心恢復1小時之內完成主備切換,因此,在災備級別選擇時,系統(tǒng)選擇使用數(shù)據(jù)級災備的方式,并通過磁盤陣列自身盤陣的數(shù)據(jù)塊復制技術進行數(shù)據(jù)的遠程拷貝。
3.2 網(wǎng)絡設計
如圖 1所示,系統(tǒng)主數(shù)據(jù)中心網(wǎng)絡結構采用“雙活”策略,防火墻、核心交換機、匯聚交換機均使用雙機備份。其中,所有服務器通過兩臺雙活匯聚交換機接入到網(wǎng)絡中。同時,所有服務器與磁盤陣列之間使用存儲交換機進行連接,存儲交換機也使用雙機備份的策略,所有服務器通過光纖交換機與磁盤陣列共享存儲。
圖1 數(shù)據(jù)中心主備網(wǎng)絡
系統(tǒng)災備中心網(wǎng)絡結構則較為簡單,磁盤陣列直接掛載在核心交換機上,在進行災備同步時,主數(shù)據(jù)中心存儲直接通過核心交換機與災備中心存儲進行讀寫操作。
3.3 容災設計
由于異地容災主備中心之間的距離較遠(>200km),因此采用異步鏡像方式,并且會有少量的數(shù)據(jù)丟失。本系統(tǒng)采用基于存儲設備的數(shù)據(jù)復制技術,一旦主數(shù)據(jù)中心發(fā)生數(shù)據(jù)級故障,可以直接利用災備中心的數(shù)據(jù),為主數(shù)據(jù)中心的業(yè)務應用提供數(shù)據(jù)支撐。當主數(shù)據(jù)中心數(shù)據(jù)級故障解除后,也可利用災備中心的數(shù)據(jù)進行主數(shù)據(jù)中心業(yè)務數(shù)據(jù)的恢復,從而使主數(shù)據(jù)中心的業(yè)務快速回復到災難發(fā)生前的狀態(tài)。
基于存儲設備的數(shù)據(jù)復制技術如圖 2所示。
圖2 數(shù)據(jù)復制技術
如上圖所示,基于存儲設備的復制技術有多種方式,如“一對一”、“多對一”及“一對多”。其中“一對一”復制技術是將一個存儲的數(shù)據(jù)復制到另一個遠程存儲中;“多對一”復制技術是將多個存儲的數(shù)據(jù)復制到同一個遠程存儲中;“一對多”復制技術是將一個存儲的數(shù)據(jù)復制到多個遠程存儲中。
基于存儲設備的數(shù)據(jù)復制技術是當前選擇較多的容災技術平臺,這主要是由于基于存儲的復制技術方案有如下優(yōu)點:①基于存儲的數(shù)據(jù)復制技術利用存儲設備底層的技術機制,不需要消耗主機的處理資源;②基于存儲的數(shù)據(jù)復制技術應用于存儲設備底層,受應用、主機環(huán)境等因素的影響較小,非常適合于主機和業(yè)務系統(tǒng)繁多的環(huán)境;③采用異步方式?jīng)]有距離限制,可以實現(xiàn)距離超過200km的災難備份;④災備中心的數(shù)據(jù)可以得到一定程度的有效利用(用作測試或報表等)。
基于存儲的數(shù)據(jù)復制技術有兩種方式,即同步方式和異步方式。
(1)同步方式。使用同步復制方式,是將主數(shù)據(jù)中心與備份數(shù)據(jù)中心的數(shù)據(jù)進行同步更新,只有每一次I/O寫入操作在主數(shù)據(jù)中心及備份數(shù)據(jù)中心都完成之后,才能執(zhí)行下一條I/O寫入操作。
采用同步復制方式,使得備份數(shù)據(jù)中心磁盤陣列中的數(shù)據(jù)總是與主數(shù)據(jù)中心數(shù)據(jù)同步,因此當主數(shù)據(jù)中心發(fā)生災難事件時,不會造成數(shù)據(jù)丟失,可以實現(xiàn)RPO為零。為避免對生產(chǎn)系統(tǒng)性能的影響,同步方式通常在近距離范圍內(FC連接通常是200km范圍內,實際用戶部署多在35km之內)。
(2)異步方式。使用異步復制技術,每一條I/O寫入操作不光在主數(shù)據(jù)中心執(zhí)行,也在備份數(shù)據(jù)中心執(zhí)行,主數(shù)據(jù)中心不用等待備份數(shù)據(jù)中心完成I/O寫入操作,就可以執(zhí)行下一條數(shù)據(jù)更新。
采用異步復制方式對遠程備份存儲設備性能的影響較小,并且主數(shù)據(jù)中心與災備數(shù)據(jù)中心之間的距離理論上沒有限制(通?;贗P連接來實現(xiàn)數(shù)據(jù)的異步復制)。
由于本系統(tǒng)主備數(shù)據(jù)中心之間距離長達2 000km,同步方式會導致延遲太高而無法實現(xiàn),因此采用異步方式。
本文根據(jù)某區(qū)域衛(wèi)生信息化系統(tǒng)的實際情況,給出了基于SAN存儲網(wǎng)絡,建設醫(yī)療衛(wèi)生主數(shù)據(jù)中心的異步、數(shù)據(jù)級、熱備數(shù)據(jù)中心的詳細設計方法,并對災備設計過程中常見的問題進行了分析,能夠有效地指導中小型數(shù)據(jù)中心災備系統(tǒng)的設計與建設。
經(jīng)過在實際業(yè)務系統(tǒng)中為主數(shù)據(jù)中心搭建災備中心,并進行測試,災備中心基本能夠確保數(shù)據(jù)不丟失,并且數(shù)據(jù)恢復時間平均控制在15分鐘左右。
[1] 賈云潔,歐陽旦,王晉東,傅永剛.網(wǎng)絡信息系統(tǒng)遠程備份的設計與實現(xiàn)[J].信息工程大學學報,2006(1):67-70.
[2] 白勇.數(shù)據(jù)級災難備份技術的理論與實踐[J].金融科技時代,2012(11):82-83.
[3] 周兵.災備系統(tǒng)建設[J].中國科技縱橫,2014(19):213-214.
[4] 劉利.基于NAS和SAN技術的校園網(wǎng)數(shù)據(jù)存儲結構策略[J].阜陽師范學院學報:自然科學版,2011,28(2):64-67.
[5] 趙建翊.構建基于SAN存儲網(wǎng)絡架構的煙草企業(yè)數(shù)據(jù)中心[J].硅谷,2010(6):52,72.
[6] 吳洪橋.基于存儲的數(shù)據(jù)中心遠程災備技術方法探析[J].國土資源信息化,2012(4):81-84.
(責任編輯:孫 娟)
張鶴(1989-),男,江西豐城人,碩士,中國電子科技集團公司第二十八研究所工程師,研究方向為區(qū)域衛(wèi)生信息化系統(tǒng)集成技術;黎茂林(1979-),男,貴州都勻人,中國電子科技集團公司第二十八研究所高級工程師,研究方向為區(qū)域衛(wèi)生信息化系統(tǒng)集成技術;葛蘊翊(1980-),男,江蘇南京人,中國電子科技集團公司第二十八研究所工程師,研究方向為數(shù)據(jù)庫復制技術;呂德奎(1983-),男,山東菏澤人,碩士,中國電子科技集團公司第二十八研究所高級工程師,研究方向為復雜系統(tǒng)集成技術。
10.11907/rjdk.162542
TP392
A
1672-7800(2017)003-0146-03