摘 要:隨著近年來(lái)數(shù)據(jù)中心的建設(shè)和發(fā)展,越來(lái)越多的行業(yè)加強(qiáng)了對(duì)災(zāi)難備份技術(shù)的研究。本文針對(duì)銀行數(shù)據(jù)中心可能面臨的主要災(zāi)難情況,提出數(shù)據(jù)備份、恢復(fù)的方案,探討災(zāi)備的實(shí)現(xiàn)技術(shù),從而保障銀行業(yè)務(wù)正常、持續(xù)、安全地運(yùn)行。
關(guān)鍵詞:災(zāi)難備份;數(shù)據(jù)恢復(fù);數(shù)據(jù)中心
中圖分類號(hào):TP309
目前金融界、銀行業(yè)對(duì)云計(jì)算、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)這類信息技術(shù)應(yīng)用程度較高的行業(yè)在謀求信息系統(tǒng)發(fā)展以促進(jìn)業(yè)務(wù)拓展的同時(shí),越來(lái)越重視信息系統(tǒng)的業(yè)務(wù)持續(xù)性、可用性和安全性。數(shù)據(jù)集中的業(yè)務(wù)操作模式在大規(guī)模處理數(shù)據(jù)的同時(shí),還存在著無(wú)法預(yù)料的操作風(fēng)險(xiǎn)和災(zāi)難風(fēng)險(xiǎn)。只有建設(shè)完善的災(zāi)難備份系統(tǒng),采取積極的預(yù)防災(zāi)難措施,預(yù)先制定災(zāi)后的恢復(fù)計(jì)劃和方案,勤加實(shí)練,才能夠保證信息系統(tǒng)在遇到災(zāi)難時(shí),可以及時(shí)恢復(fù)正常運(yùn)轉(zhuǎn),最大程度地降低災(zāi)難造成的損失。銀行業(yè)的信息系統(tǒng)安全直接關(guān)系到國(guó)家社會(huì)經(jīng)濟(jì)的穩(wěn)定。而目前銀行業(yè)配套的應(yīng)急體系和災(zāi)備中心的建設(shè)還是比較滯后的,銀行數(shù)據(jù)中心應(yīng)加強(qiáng)對(duì)信息安全事件應(yīng)急處理能力、做好災(zāi)備工作,這已成為銀行業(yè)信息科技工作的重要任務(wù)之一。
1 災(zāi)備指標(biāo)與建設(shè)模式
1.1 災(zāi)備指標(biāo)
網(wǎng)絡(luò)恢復(fù)目標(biāo)、恢復(fù)點(diǎn)目標(biāo)和恢復(fù)時(shí)間目標(biāo)為容災(zāi)指標(biāo),容災(zāi)恢復(fù)的時(shí)間是指災(zāi)難發(fā)生導(dǎo)致業(yè)務(wù)中斷開(kāi)始,到能夠繼續(xù)運(yùn)行業(yè)務(wù)的時(shí)間,一般,IT層面的容災(zāi)能力用RTO指標(biāo)進(jìn)行評(píng)價(jià)。恢復(fù)點(diǎn)是指宕機(jī)后的業(yè)務(wù)數(shù)據(jù)恢復(fù)時(shí)間,在業(yè)務(wù)恢復(fù)后,業(yè)務(wù)狀態(tài)可以恢復(fù)到災(zāi)難發(fā)生前所進(jìn)行的相同工作。業(yè)務(wù)恢復(fù)之后,不需要進(jìn)行任何額外的處理,可以繼續(xù)災(zāi)難發(fā)生前的相同工作。RPO為災(zāi)難導(dǎo)致的數(shù)據(jù)丟失,RPO為0時(shí),說(shuō)明沒(méi)有丟失數(shù)據(jù)。現(xiàn)在的銀行業(yè)務(wù)越來(lái)越離不開(kāi)網(wǎng)絡(luò),如果網(wǎng)絡(luò)沒(méi)有恢復(fù)正常,即使恢復(fù)了數(shù)據(jù)和處理主機(jī)也不能對(duì)外提供服務(wù)。所以,NRO不能大于RTO,NRO是網(wǎng)絡(luò)恢復(fù)的時(shí)間。災(zāi)備中心的建設(shè)包括同城災(zāi)備中心、異地災(zāi)備中心和兩地三中心三種模式。數(shù)據(jù)中心災(zāi)備的模式以實(shí)現(xiàn)生產(chǎn)系統(tǒng)的安全運(yùn)營(yíng)和持續(xù)可用為目標(biāo),以業(yè)務(wù)連續(xù)性為重點(diǎn),將數(shù)據(jù)容災(zāi)作為核心內(nèi)容。
1.2 災(zāi)備模式
異地災(zāi)備中心一般在200公里以上,常在與生產(chǎn)中心處于不同地域的城市中建立。生產(chǎn)中心與異地災(zāi)備中心之間一般會(huì)進(jìn)行異步數(shù)據(jù)復(fù)制,因?yàn)?,兩個(gè)中心間的距離較遠(yuǎn),在進(jìn)行生產(chǎn)環(huán)境與異地災(zāi)備中心同步復(fù)制數(shù)據(jù)時(shí),很可能會(huì)給系統(tǒng)性能帶來(lái)嚴(yán)重的影響。對(duì)于異地災(zāi)備中心的區(qū)域性災(zāi)難,恢復(fù)業(yè)務(wù)的時(shí)間也較長(zhǎng),在進(jìn)行異地災(zāi)備中心的數(shù)據(jù)恢復(fù)時(shí),會(huì)有一定量的數(shù)據(jù)丟失。這種災(zāi)備中心模式實(shí)現(xiàn)了同城災(zāi)備中心數(shù)據(jù)的零丟失,它可以高效迅速地在同城災(zāi)備中心持續(xù)完成業(yè)務(wù),并且通過(guò)最近的同城災(zāi)備中心能夠抵御百分之八十的區(qū)域性災(zāi)難。要想實(shí)現(xiàn)數(shù)據(jù)零丟失,應(yīng)在同城災(zāi)備中心進(jìn)行同步數(shù)據(jù)復(fù)制。由于中心的工作方式為應(yīng)用集群,而同城災(zāi)備中心又采用活動(dòng)備援站點(diǎn)的方式進(jìn)行建設(shè),當(dāng)區(qū)域性災(zāi)難發(fā)生時(shí),切換至同城災(zāi)備中心不僅能實(shí)現(xiàn)應(yīng)用的無(wú)縫切換,還不會(huì)造成數(shù)據(jù)的丟失。如發(fā)生像地震這樣的大范圍自然災(zāi)害時(shí),生產(chǎn)中心與同城災(zāi)備中心都不能用,可通過(guò)切換到異地災(zāi)備中心來(lái)最大程度地減小損失,恢復(fù)生產(chǎn)系統(tǒng)運(yùn)行。雖然這樣的方式會(huì)丟失少量數(shù)據(jù),但是可以通過(guò)災(zāi)備技術(shù)來(lái)進(jìn)行計(jì)劃恢復(fù),恢復(fù)業(yè)務(wù)系統(tǒng)的工作可在異地災(zāi)備中心進(jìn)行。
同城災(zāi)備中心的兩個(gè)中心距離在二十公里以上,生產(chǎn)中心和災(zāi)備中心建立在同一城市。同城災(zāi)備中心與生產(chǎn)中心的距離越遠(yuǎn)抵御區(qū)域性災(zāi)難的效果就越好,但對(duì)災(zāi)難恢復(fù)目標(biāo)或生產(chǎn)系統(tǒng)的性能產(chǎn)生的影響也越大。它保留了生產(chǎn)環(huán)境的同步數(shù)據(jù)。同城災(zāi)備中心具備能夠抵御百分之八十的災(zāi)難事件的能力,它的特點(diǎn)是快速響應(yīng)、高等級(jí)、高效率重續(xù)運(yùn)行。對(duì)于三種模式而言,兩地三中心的災(zāi)備模式結(jié)合了異地災(zāi)備中心模式和同城災(zāi)備中心模式的優(yōu)點(diǎn),在遭遇較大范圍的自然災(zāi)害和區(qū)域性災(zāi)害時(shí),兩地三中心災(zāi)備模式能夠保證業(yè)務(wù)的連續(xù)性,提高數(shù)據(jù)的冗余。銀行數(shù)據(jù)中心系統(tǒng)災(zāi)備方案:通過(guò)時(shí)間的敏感性和對(duì)業(yè)務(wù)的影響力將災(zāi)難需求等級(jí)劃分為一到三個(gè)級(jí)別,以RTO和RPO體現(xiàn)出:災(zāi)難需求等級(jí)不同,最低恢復(fù)的要求也不同。災(zāi)難恢復(fù)需求等級(jí)越高,對(duì)RPO和RTO的要求也越高,體現(xiàn)了RTO、RPO與災(zāi)難恢復(fù)能力等級(jí)的關(guān)系。
2 災(zāi)備系統(tǒng)與銀行災(zāi)備方案
方案1以兩地三中心方案為基礎(chǔ),在生產(chǎn)中心安置兩臺(tái)存儲(chǔ)。一臺(tái)存儲(chǔ)為生產(chǎn)系統(tǒng)提供服務(wù),并以基于存儲(chǔ)的復(fù)制方式同步復(fù)制到另一臺(tái)存儲(chǔ)上。兩臺(tái)存儲(chǔ),分別放置在不同的生產(chǎn)機(jī)房,能降低單機(jī)房?jī)?nèi)偶發(fā)風(fēng)險(xiǎn),利用存儲(chǔ)復(fù)制技術(shù),將數(shù)據(jù)從生產(chǎn)中心異步復(fù)制到異地災(zāi)備中心。
方案2也是在兩地三中心方案的基礎(chǔ)上,在生產(chǎn)中心安置兩套存儲(chǔ),同時(shí),通過(guò)卷組鏡像訪問(wèn)存儲(chǔ),在同城災(zāi)備中心同步復(fù)制生產(chǎn)中心的數(shù)據(jù);通過(guò)異步復(fù)制技術(shù),在異地災(zāi)備中心異步增量復(fù)制生產(chǎn)中心的數(shù)據(jù)。異地災(zāi)備中心、同城災(zāi)備中心、生產(chǎn)中心以1:1:2的比例配置存儲(chǔ)設(shè)備。
銀行數(shù)據(jù)中心信息系統(tǒng)要全年不間斷地處理大量生產(chǎn)數(shù)據(jù)并保障業(yè)務(wù)連續(xù)性,這就需要加強(qiáng)系統(tǒng)抗沖擊和抗風(fēng)險(xiǎn)能力,這也考驗(yàn)了信息系統(tǒng)的連續(xù)性和穩(wěn)定性。為了提高系統(tǒng)數(shù)據(jù)庫(kù)和中間件的高可用性,特提出基于數(shù)據(jù)庫(kù)和中間件集群的災(zāi)備方案如圖1所示:
方案適合在集群?jiǎn)芜匧PAR宕機(jī),且共享磁盤整列可以正常運(yùn)行的情況下,數(shù)據(jù)庫(kù)與中間的LPAR獨(dú)立搭建,中間件和數(shù)據(jù)庫(kù)分別采用了集群的方式。2臺(tái)LPAR運(yùn)行時(shí),集群對(duì)系統(tǒng)服務(wù)起到負(fù)載平衡的作用,而集群中某一個(gè)LPAR宕機(jī)時(shí),另外一個(gè)LPAR也可獨(dú)立工作,此時(shí)對(duì)生產(chǎn)系統(tǒng)前端及應(yīng)用不會(huì)產(chǎn)生影響。而由于系統(tǒng)管理員的經(jīng)驗(yàn)缺乏或疏忽,可能造成數(shù)據(jù)庫(kù)、系統(tǒng)中間件或應(yīng)用程序的破壞,為避免發(fā)生這種情況,使系統(tǒng)在最短時(shí)間里恢復(fù)正常,一方面要備份中間件及應(yīng)用,另一方面要加強(qiáng)管理系統(tǒng)用戶權(quán)限。為提高操作系統(tǒng)的安全性和可靠性,系統(tǒng)的日常災(zāi)備和恢復(fù)方案尤為重要。當(dāng)系統(tǒng)無(wú)法正常啟動(dòng),操作系統(tǒng)數(shù)據(jù)受到破壞時(shí),要通過(guò)系統(tǒng)備份來(lái)恢復(fù)系統(tǒng)。而遭遇大災(zāi)難時(shí),就需要立即切換災(zāi)備系統(tǒng),災(zāi)備系統(tǒng)也可通過(guò)生產(chǎn)系統(tǒng)的系統(tǒng)備份數(shù)據(jù)來(lái)實(shí)現(xiàn)系統(tǒng)同步。應(yīng)定期對(duì)銀行數(shù)據(jù)中心操作系統(tǒng)進(jìn)行磁盤備份,因?yàn)椴僮飨到y(tǒng)關(guān)系到生產(chǎn)應(yīng)用系統(tǒng)業(yè)務(wù)操作能否正常運(yùn)行。例如在節(jié)假日前后,進(jìn)行操作系統(tǒng)和應(yīng)用系統(tǒng)的磁盤備份、維護(hù)生產(chǎn)數(shù)據(jù)是非常必要的。針對(duì)銀行數(shù)據(jù)中心極端情況下的自然災(zāi)難,提出數(shù)據(jù)備份恢復(fù)方案:系統(tǒng)的日常災(zāi)備與恢復(fù),當(dāng)發(fā)生大災(zāi)難時(shí),需要立即切換災(zāi)備系統(tǒng),以防止系統(tǒng)遭到毀滅性的破壞,通過(guò)生產(chǎn)系統(tǒng)的系統(tǒng)備份數(shù)據(jù),實(shí)現(xiàn)災(zāi)備系統(tǒng)同步,數(shù)據(jù)的同步也可通過(guò)同步或異步的方式來(lái)完成。切換系統(tǒng)步驟具體為:①將HDS遠(yuǎn)程拷貝斷開(kāi);②采用遠(yuǎn)程HMC登錄災(zāi)備系統(tǒng)環(huán)境;③在LparB上varyonvg;④啟動(dòng)HA,對(duì)concurrentvg_vg的狀態(tài)進(jìn)行檢查;⑤啟動(dòng)數(shù)據(jù)庫(kù),在兩節(jié)點(diǎn)執(zhí)行crsctl start crs;⑥對(duì)數(shù)據(jù)庫(kù)運(yùn)行狀態(tài)進(jìn)行檢查;⑦驗(yàn)證數(shù)據(jù)一致性;⑧切換網(wǎng)絡(luò),啟動(dòng)災(zāi)備環(huán)境接管原生產(chǎn)環(huán)境。
在信息化社會(huì)背景下,各金融企業(yè)越來(lái)越重視災(zāi)難備份技術(shù)及應(yīng)用。該如何建立基于日益業(yè)務(wù)增長(zhǎng)需求的容災(zāi)備份系統(tǒng)已成為必須要解決的問(wèn)題。本文提供的災(zāi)備方案針對(duì)單點(diǎn)故障和自然災(zāi)難情況下能夠?qū)崿F(xiàn)數(shù)據(jù)的實(shí)時(shí)備份和恢復(fù),有效保證銀行數(shù)據(jù)中心信息系統(tǒng)的安全穩(wěn)定運(yùn)行。
參考文獻(xiàn):
[1]宿培成.金融行業(yè)基于數(shù)據(jù)庫(kù)的災(zāi)備技術(shù)[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2010(9).
[2]高旭磊.技術(shù)創(chuàng)新——數(shù)據(jù)中心災(zāi)備策略[J].金融科技時(shí)代,2012(6).
[3]高曙東.銀行業(yè)災(zāi)備體系建設(shè)面臨的挑戰(zhàn)及對(duì)策——訪國(guó)家開(kāi)發(fā)銀行信息科技局局長(zhǎng)洪正華[J].中國(guó)金融電腦,2012(9).
[4]閆石,呂昱,牛夢(mèng)帆.基于HP主機(jī)平臺(tái)加EMC/EVA存儲(chǔ)的銀行業(yè)務(wù)系統(tǒng)災(zāi)備實(shí)現(xiàn)[J].中國(guó)金融電腦,2011(6).
作者簡(jiǎn)介:張殿奎,山東濟(jì)南人,計(jì)算機(jī)科學(xué)與技術(shù)專業(yè),主機(jī)系統(tǒng)管理方向,助理工程師。
作者單位:山東省農(nóng)村信用社聯(lián)合社,濟(jì)南 250001
計(jì)算機(jī)光盤軟件與應(yīng)用2013年12期