余詠
【摘 要】備份與容災(zāi)實(shí)際上是兩個(gè)概念,備份是為了應(yīng)對(duì)災(zāi)難來(lái)臨時(shí)造成的數(shù)據(jù)丟失問(wèn)題;容災(zāi)是為了在遭遇災(zāi)害時(shí)能保證信息系統(tǒng)能正常運(yùn)行,實(shí)現(xiàn)業(yè)務(wù)連續(xù)性的目標(biāo)。執(zhí)行備份與容災(zāi)的共同目的是應(yīng)對(duì)誤操作、軟件錯(cuò)誤、病毒入侵等“軟”性災(zāi)害以及硬件故障、自然災(zāi)害等“硬”性災(zāi)害。在本案中主要為四川電網(wǎng)構(gòu)建獨(dú)立的備份系統(tǒng),在有備份需求各個(gè)子系統(tǒng)中,部署備份管理軟件,實(shí)現(xiàn)數(shù)據(jù)及操作系統(tǒng)的在線、自動(dòng)化集中備份,保護(hù)生產(chǎn)數(shù)據(jù)、保護(hù)操作系統(tǒng)。在數(shù)據(jù)集中備份的基礎(chǔ)上,將重要的備份數(shù)據(jù)自動(dòng)復(fù)制到異地機(jī)房存儲(chǔ),當(dāng)本地機(jī)房發(fā)生災(zāi)難時(shí),重要數(shù)據(jù)及系統(tǒng)可以在異地恢復(fù)。實(shí)現(xiàn)了《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T20988-2007)中的第3級(jí)(電子傳輸和部分設(shè)備支持)容災(zāi)等級(jí)。
【關(guān)鍵詞】數(shù)據(jù)備份;磁盤備份;異地容災(zāi)
1 本地?cái)?shù)據(jù)備份
四川電網(wǎng)容災(zāi)備份系統(tǒng)的首要目標(biāo)是實(shí)現(xiàn)生產(chǎn)數(shù)據(jù)的本地集中備份,構(gòu)建一個(gè)全自動(dòng)的、集中式的備份系統(tǒng),覆蓋本地所有生產(chǎn)主機(jī)的保護(hù),將這些主機(jī)的操作系統(tǒng)、應(yīng)用程序及配置、文件系統(tǒng)以及數(shù)據(jù)庫(kù)進(jìn)行在線、統(tǒng)一備份到本地的集中備份存儲(chǔ)池。在大多數(shù)常見(jiàn)的災(zāi)難情形中,主機(jī)數(shù)據(jù)丟失或系統(tǒng)損毀時(shí),快速恢復(fù)生產(chǎn)主機(jī)的各種數(shù)據(jù),維持生產(chǎn)的持續(xù)性。
1.1 磁盤備份
在四川電網(wǎng)的容災(zāi)備份系統(tǒng)中,直接采用磁盤介質(zhì)作為備份的備份存儲(chǔ)池,與傳統(tǒng)的虛擬磁帶庫(kù)不同,不需要將磁盤空間虛擬化成為磁帶庫(kù)設(shè)備然后再給予主機(jī)識(shí)別。磁盤池的可用空間直接顯示,無(wú)需進(jìn)行虛擬磁帶庫(kù)層的轉(zhuǎn)化。該方式帶來(lái)了空間管理的極大簡(jiǎn)便性,可以一目了然地監(jiān)控其空間使用狀態(tài),及時(shí)對(duì)備份策略等進(jìn)行優(yōu)化管理。且避免了虛擬帶庫(kù)存在與物理磁帶庫(kù)一樣的磁帶過(guò)期問(wèn)題,即如果在一盒磁帶中有任意一份備份映像處于未過(guò)期狀態(tài),那么這一盒磁帶也不會(huì)過(guò)期并不會(huì)釋放該部份空間。
采用普通磁盤還能實(shí)現(xiàn)更高并發(fā)度的備份作業(yè)控制。對(duì)于傳統(tǒng)的物理磁帶庫(kù),其備份任務(wù)并發(fā)度取決于磁帶機(jī)的數(shù)量,而虛擬磁帶庫(kù)則取決于其虛擬磁帶機(jī)的數(shù)量,而基于普通磁盤的備份自身并無(wú)虛擬磁帶機(jī)的限制,可以提供更高并發(fā)多任務(wù)備份的能力,相較于虛擬磁帶庫(kù)更能發(fā)揮磁盤設(shè)備的特性和性能優(yōu)勢(shì)。
磁盤備份替代磁帶備份所帶來(lái)的存儲(chǔ)空間成本則被通過(guò)重復(fù)數(shù)據(jù)刪除技術(shù)來(lái)降低。重復(fù)數(shù)據(jù)刪除是指僅在存儲(chǔ)介質(zhì)上保留備份數(shù)據(jù)的一個(gè)唯一實(shí)例,而冗余數(shù)據(jù)則被替換為指向唯一數(shù)據(jù)副本的一個(gè)指針。重復(fù)數(shù)據(jù)刪除可在文件級(jí)別和文件段級(jí)別進(jìn)行;當(dāng)兩個(gè)或多個(gè)文件完全相同時(shí),重復(fù)數(shù)據(jù)刪除只會(huì)存儲(chǔ)文件的一個(gè)副本。當(dāng)兩個(gè)或多個(gè)文件具有相同的內(nèi)容時(shí),重復(fù)數(shù)據(jù)刪除會(huì)將文件分成多個(gè)段,僅存儲(chǔ)每個(gè)唯一文件段的一個(gè)副本。
1.2 備份加速器
在四川電網(wǎng)的各個(gè)系統(tǒng)中,由于業(yè)務(wù)應(yīng)用的特殊性,存在大量的小文件,在常規(guī)備份中需要耗費(fèi)大量時(shí)間掃描數(shù)以千萬(wàn)計(jì)的文件來(lái)確定哪些文件發(fā)生過(guò)更改,大大的影響了備份的速率并增加操作系統(tǒng)的負(fù)載。針對(duì)海量小文件的備份采用備份加速器模式,能夠?qū)鹘y(tǒng)完全備份速度加快到了增量備份的速度級(jí)。加速器大幅減少了傳統(tǒng)完全備份所需的資源量(客戶端I/O、時(shí)間、網(wǎng)絡(luò)和存儲(chǔ))。
備份加速器只識(shí)別和訪問(wèn)更改的數(shù)據(jù),減少遍歷大型文件系統(tǒng)招致的文件系統(tǒng)開(kāi)銷;在備份過(guò)程中對(duì)已減少的數(shù)據(jù)集進(jìn)行重復(fù)數(shù)據(jù)刪除,降低網(wǎng)絡(luò)和存儲(chǔ)資源需求;最后通過(guò)初次的全備份以及后續(xù)的更改數(shù)據(jù)備份創(chuàng)建優(yōu)化的合成完全備份,并內(nèi)嵌目錄,以提供全面的恢復(fù)功能,縮短RTO。
使用備份加速器備份包含數(shù)百萬(wàn)文件的大型文件系統(tǒng)完全備份所需的時(shí)間只是增量備份的時(shí)間。原來(lái)備份時(shí)間內(nèi)無(wú)法完成的系統(tǒng)備份,現(xiàn)在能夠以更快的速度進(jìn)行,從而使該備份能夠在指定的時(shí)間內(nèi)完成。
1.3 裸機(jī)備份與恢復(fù)
在本案的容災(zāi)備份系統(tǒng)中,使用的最主要的裸機(jī)還原功能,通過(guò)該功能,可以通過(guò)一個(gè)命令,系統(tǒng)就能在瞬間完成整個(gè)服務(wù)器恢復(fù)任務(wù),不需要執(zhí)行復(fù)雜的管理任務(wù)。利用這一個(gè)解決方案,能滿足大量平臺(tái)的需求,而且不需要為每臺(tái)服務(wù)器定制恢復(fù)程序。
在執(zhí)行每項(xiàng)預(yù)定備份任務(wù)之前,容災(zāi)備份系統(tǒng)將自動(dòng)執(zhí)行附加過(guò)程,即記錄服務(wù)器配置的當(dāng)前狀態(tài),其中包括磁盤配置和網(wǎng)絡(luò)配置。如果服務(wù)器配置被修改,系統(tǒng)在執(zhí)行備份時(shí),將自動(dòng)捕捉和記錄這些修改,不需要用戶進(jìn)行干預(yù)。
而在恢復(fù)時(shí),恢復(fù)過(guò)程已經(jīng)實(shí)現(xiàn)自動(dòng)化,只需要發(fā)出準(zhǔn)備恢復(fù)命令,系統(tǒng)就開(kāi)始執(zhí)行恢復(fù)。些時(shí),裸機(jī)恢復(fù)將立即檢索客戶機(jī)配置數(shù)據(jù),并使用該數(shù)據(jù)創(chuàng)建一個(gè)定制化的客戶恢復(fù)程序。然后,通過(guò)網(wǎng)絡(luò)為客戶機(jī)發(fā)送相應(yīng)的引導(dǎo)數(shù)據(jù)和文件系統(tǒng)。如果不需要改變服務(wù)器配置,除初始引導(dǎo)外,將不需要進(jìn)行人工干預(yù)(表1)。
由于服務(wù)器的持續(xù)運(yùn)行出現(xiàn)過(guò)多次的服務(wù)器系統(tǒng)磁盤故障及操作系統(tǒng)故障,得益于裸機(jī)備份恢復(fù)功能,自動(dòng)化的實(shí)現(xiàn)服務(wù)器恢復(fù)并簡(jiǎn)化恢復(fù)過(guò)程,避免了手動(dòng)重新安裝操作系統(tǒng)或配置硬件,加快服務(wù)器執(zhí)行恢復(fù)的速度,將使停機(jī)時(shí)間減少到最低限度。
2 異地?cái)?shù)據(jù)容災(zāi)
2.1 異地容災(zāi)必要性
遠(yuǎn)程數(shù)據(jù)備份保護(hù)不同于容災(zāi)中的數(shù)據(jù)復(fù)制,備份不是實(shí)時(shí)進(jìn)行數(shù)據(jù)復(fù)制,但是備份通常具有多份數(shù)據(jù)副本,其可恢復(fù)性和抗災(zāi)難性非常強(qiáng)。
舉例而言,當(dāng)年911事件,很多銀行生產(chǎn)中心遭遇到非可抗拒外力打擊,而容災(zāi)站點(diǎn)總是由于某些原因無(wú)法進(jìn)行切換,最終恢復(fù)都是通過(guò)遠(yuǎn)程的磁帶;其實(shí)每年中國(guó)移動(dòng)都進(jìn)行容災(zāi)切換演練,而幾乎很難一次性成功,據(jù)我看到的情況很多移動(dòng)需要數(shù)月準(zhǔn)備時(shí)間,3次以上的切換才有成功的可能性,這一切都?xì)w咎與業(yè)務(wù)的不斷發(fā)展與建設(shè),而容災(zāi)與生產(chǎn)完全一致的情況很難保證。
因此,我們可以得出結(jié)論,既然要考慮容災(zāi),那么數(shù)據(jù)遠(yuǎn)程備份保護(hù)一定是基礎(chǔ)中的基礎(chǔ),可以優(yōu)先納入考慮范疇。
在實(shí)現(xiàn)了生產(chǎn)數(shù)據(jù)的本地集中備份基礎(chǔ)上,在目前有限的遠(yuǎn)程數(shù)據(jù)鏈路帶寬的條件下,將重要的備份數(shù)據(jù)復(fù)制到異地機(jī)房的備份存儲(chǔ)設(shè)備。在極端的災(zāi)難情形中,當(dāng)生產(chǎn)中心機(jī)房的主機(jī)系統(tǒng)及集中備份存儲(chǔ)介質(zhì)全毀時(shí),通過(guò)異地機(jī)房的備份介質(zhì),恢復(fù)重要生產(chǎn)主機(jī)的各種數(shù)據(jù),維持生產(chǎn)的持續(xù)性。
2.2 自動(dòng)映像復(fù)制
如圖1所示,自動(dòng)映像復(fù)制的原理如下。
備份數(shù)據(jù)采用從源備份域傳輸?shù)侥繕?biāo)備份域(兩個(gè)獨(dú)立備份域)傳輸之前先進(jìn)行重復(fù)數(shù)據(jù)刪除,減少帶寬占用。傳輸?shù)侥繕?biāo)備份域的數(shù)據(jù)包含每筆作業(yè)的管理信息,管理信息自動(dòng)會(huì)被導(dǎo)入目標(biāo)備份域,目標(biāo)備份域不需要單獨(dú)恢復(fù)管理信息,已經(jīng)具備對(duì)每個(gè)備份映像的管理能力,隨時(shí)可以用于恢復(fù),并且數(shù)據(jù)可以根據(jù)生命周期策略在目標(biāo)備份域或者源備份域再次復(fù)制到磁帶庫(kù)。
在采用自動(dòng)映像復(fù)制之后,目標(biāo)備份域(容災(zāi)中心)是一個(gè)完全獨(dú)立的備份域,該域具有備份存儲(chǔ)資源,同時(shí)映像管理信息也處于就緒狀態(tài),可以隨時(shí)恢復(fù)任意的業(yè)務(wù)和數(shù)據(jù)。
2.3 自動(dòng)映像復(fù)制優(yōu)勢(shì)
在進(jìn)行異地復(fù)制過(guò)程中,源端不發(fā)送已經(jīng)存在于目標(biāo)重復(fù)數(shù)據(jù)刪除池中的數(shù)據(jù)段,因此可最大限度減少站點(diǎn)間的帶寬使用量,并在不增加成本的情況下將加密用于復(fù)制。
由于備份映像可用于從任何域或全球位置立即進(jìn)行恢復(fù),因此該功能支持快速、可伸縮的數(shù)據(jù)恢復(fù),并且存儲(chǔ)空間占用率和帶寬影響最低。在傳統(tǒng)的復(fù)制解決方案中,源端和目標(biāo)端使用遠(yuǎn)程鏡像保留保持一致,而自動(dòng)映像復(fù)制功能,可以在源端和目標(biāo)端獨(dú)立控制保留級(jí)別。
無(wú)論使用磁帶搬運(yùn)或者是基于虛擬帶庫(kù)的遠(yuǎn)程復(fù)制,在目標(biāo)站點(diǎn)的備份系統(tǒng)中需要使用數(shù)據(jù)信息前,均需要手工將磁帶的描述信息進(jìn)行手工的導(dǎo)入,導(dǎo)入工作完成后,才可以識(shí)別出搬運(yùn)到目標(biāo)站點(diǎn)的磁帶或者是其他復(fù)制的內(nèi)容。
在使用簡(jiǎn)便性和自動(dòng)化程度上,自動(dòng)映像復(fù)制所提供數(shù)據(jù)遠(yuǎn)程復(fù)制能力更加的完善,不僅僅只是將數(shù)據(jù)復(fù)制至遠(yuǎn)端目標(biāo)站點(diǎn),而是一套完整的自動(dòng)化方案,數(shù)據(jù)復(fù)制完成后即時(shí)成為可用狀態(tài),大大降低了操作的時(shí)間和難度。
3 結(jié)束語(yǔ)
容災(zāi)備份系統(tǒng)可以保障業(yè)務(wù)系統(tǒng)的持續(xù)運(yùn)行,確保在任何情況下的數(shù)據(jù)完整性和安全性。容災(zāi)備份系統(tǒng)采用直接磁盤備份避免了傳統(tǒng)磁帶及虛擬磁帶庫(kù)所存在的問(wèn)題,并通過(guò)重復(fù)數(shù)據(jù)刪除技術(shù)來(lái)降低存儲(chǔ)空間成本;備份加速器使得四川電網(wǎng)的海量小文件加速進(jìn)行備份,縮短備份時(shí)間,裸機(jī)恢復(fù)功能現(xiàn)實(shí)服務(wù)器的快速恢復(fù)減少業(yè)務(wù)因服務(wù)器損壞的停止時(shí)間;最終通過(guò)自動(dòng)映像復(fù)制實(shí)現(xiàn)備份映像自動(dòng)化的復(fù)制到異地進(jìn)行容災(zāi),確保了在極端情況下的數(shù)據(jù)完整安全。
[責(zé)任編輯:王楠]