信懷義++安衛(wèi)杰
摘要:隨著金融業(yè)數(shù)據(jù)大集中的推進,金融數(shù)據(jù)中心集中存放著海量的金融業(yè)務(wù)數(shù)據(jù)。為保障數(shù)據(jù)安全及滿足當(dāng)前業(yè)務(wù)連續(xù)性的要求,金融數(shù)據(jù)中心必須對其管理的數(shù)據(jù)進行全方位、多層次、高效率的數(shù)據(jù)備份。大數(shù)據(jù)時代到來,數(shù)據(jù)的價值得到充分體現(xiàn),數(shù)據(jù)也呈現(xiàn)爆發(fā)式增長,金融大數(shù)據(jù)備份也引起了眾多學(xué)者和業(yè)界人士的廣泛關(guān)注。但是當(dāng)前卻缺乏對金融數(shù)據(jù)備份理論方面的總結(jié)和歸納,為幫助系統(tǒng)運行維護人員及數(shù)據(jù)使用的相關(guān)人員對金融數(shù)據(jù)備份有個總攬性的認(rèn)識,本文從理論視角對數(shù)據(jù)備份的原理、用途、原則、策略、內(nèi)容等方面進行綜述性介紹,并針對當(dāng)前在數(shù)據(jù)備份方面所存在的問題提出了建設(shè)性的建議。
關(guān)鍵詞:數(shù)據(jù)備份;數(shù)據(jù)中心;備份策略
中圖分類號:TP399
文獻(xiàn)標(biāo)識碼:A
DOI:10.3969/j.issn.1003-6970.2015.12.017
本文著錄格式:信懷義,安衛(wèi)杰.金融數(shù)據(jù)中心數(shù)據(jù)備份必要性及其機制研究[J]軟件,201 5,36(12):72-75
0 引言
進入21世紀(jì)以來,隨著信息技術(shù)在金融業(yè)中廣泛應(yīng)用,金融機構(gòu)紛紛建立了自己的數(shù)據(jù)中心,實現(xiàn)了數(shù)據(jù)大集中。從過去主要由服務(wù)器、網(wǎng)絡(luò)設(shè)備、小容量存儲等設(shè)備組成的運算中心,到今天已經(jīng)成為超容量、高可用、多并發(fā)的智慧中心。金融數(shù)據(jù)中心存放并管理著企業(yè)核心的金融業(yè)務(wù)數(shù)據(jù),包括:系統(tǒng)業(yè)務(wù)數(shù)據(jù)、交易痕跡數(shù)據(jù)、客戶行為數(shù)據(jù)等等。這些數(shù)據(jù)涉及企業(yè)運營的方方面面,是企業(yè)的核心信息資產(chǎn)。為保障企業(yè)信息資產(chǎn)的安全,保障業(yè)務(wù)連續(xù)性,金融數(shù)據(jù)中心必須對其所管理的數(shù)據(jù)進行高安全、多層次、快效率的。
數(shù)據(jù)備份是周期性地將整個信息系統(tǒng)的數(shù)據(jù)、運行狀態(tài)以某種方式制作一個或多個拷貝,并將其存放在專門的設(shè)備上用以保留,以便在信息系統(tǒng)遭受破壞或數(shù)據(jù)丟失的情況下能夠進行快速的數(shù)據(jù)恢復(fù)。其作為現(xiàn)代容災(zāi)管理的基礎(chǔ),是保障數(shù)據(jù)完整性和一致性的最后一道防線。隨著大數(shù)據(jù)時代的到來,企業(yè)對數(shù)據(jù)的依賴性不斷加強,數(shù)據(jù)安全問題更加突出,數(shù)據(jù)備份將在大數(shù)據(jù)時代發(fā)揮出越來越重要的作用。
1 數(shù)據(jù)備份概述
數(shù)據(jù)備份是為了保證數(shù)據(jù)的一致性和完整性,通過保存正在使用的數(shù)據(jù),生成數(shù)據(jù)的副本,以備數(shù)據(jù)在遭到丟失或破壞時,能夠有效進行數(shù)據(jù)恢復(fù)。
1.1 數(shù)據(jù)備份的意義
在信息時代,數(shù)據(jù)作為企業(yè)的重要資產(chǎn),其價值和重要性不言而喻。而數(shù)據(jù)在傳輸、存儲、交換過程中面臨著遭受損壞或丟失的各種風(fēng)險,如自然災(zāi)害、信息攻擊、設(shè)備故障、誤操作等等能。如果缺少數(shù)據(jù)備份措施,數(shù)據(jù)的一致性和完整性就得不到保障,就可能導(dǎo)致數(shù)據(jù)丟失或損壞的情況出現(xiàn),對企業(yè)產(chǎn)生無法彌補的損失,甚至災(zāi)難性的后果.
1.2 數(shù)據(jù)備份的原則
為保障數(shù)據(jù)備份的安全性、可靠性、一致性,滿足進行快速數(shù)據(jù)恢復(fù)的要求,數(shù)據(jù)備份須滿足以下原則:
1.2.1 全面性原則。是指數(shù)據(jù)備份需要做到對備份內(nèi)容全面覆蓋,包括操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用程序、數(shù)據(jù)庫、業(yè)務(wù)數(shù)據(jù)、交易日志等,如果備份內(nèi)容不完備、不全面,就有可能導(dǎo)致在數(shù)據(jù)恢復(fù)時出現(xiàn)數(shù)據(jù)缺失,功虧一簣,無法達(dá)到完整恢復(fù)數(shù)據(jù)的效果。
1.2.2 容錯性原則。是指數(shù)據(jù)備份的內(nèi)容保存在不同介質(zhì)上,需要對備份介質(zhì)進行保護并具備一定容錯能力。如引入RIAD技術(shù)對磁帶進行鏡像,就能更好地保證數(shù)據(jù)安全可靠,相當(dāng)于對備份數(shù)據(jù)增加了一把保險鎖
1.2.3 高性能原則。由于業(yè)務(wù)的快速發(fā)展,備份數(shù)據(jù)的量越來越多,對于大型的系統(tǒng)每天備份的數(shù)據(jù)量都是TB級的。為減少數(shù)據(jù)備份對系統(tǒng)性能產(chǎn)生的影響,一般要求數(shù)據(jù)備份要在限定的時間窗口內(nèi)完成,這就要求數(shù)據(jù)備份具備高性能的處理能力。
1.2.4 自動化原則。根據(jù)系統(tǒng)業(yè)務(wù)特點及運維要求,不同系統(tǒng)的數(shù)據(jù)備份窗口各不相同,多數(shù)情況下數(shù)據(jù)備份會選擇在業(yè)務(wù)低峰時段進行,不能完全依靠人工操作。因此需要數(shù)據(jù)備份具備自動化的處理能力,能夠自動定時執(zhí)行,自動記錄執(zhí)行過程日志,并能在出現(xiàn)異常情況下自動報警。
1.3 數(shù)據(jù)備份的模式
數(shù)據(jù)備份對象及備份需求存在較大差異,針對不同的數(shù)據(jù)對象及備份需求可采用不同的數(shù)據(jù)備份模式,根據(jù)不同劃分原則,數(shù)據(jù)備份模式可分為以下幾大類。
1.3.1 按備份數(shù)據(jù)的完整性劃分,可將備份數(shù)據(jù)劃分為以下3類:
(l)全量備份。是指對應(yīng)用系統(tǒng)連續(xù)產(chǎn)生的在某時間點的橫截面的全量數(shù)據(jù)進行備份,不依賴于數(shù)據(jù)的歸檔屬性,也稱為完全備份。在備份在過程中,任何現(xiàn)有的標(biāo)記都被清除,每個數(shù)據(jù)快都被標(biāo)記為已備份,也就是說清除存檔屬性。該備份方式的優(yōu)點是恢復(fù)操作便捷、完整性強、可靠性高;其缺點是備份數(shù)據(jù)量大、備份時間長、備份期間數(shù)據(jù)容易變動、數(shù)據(jù)恢復(fù)時間長。
(2)增量備份。是指對應(yīng)用系統(tǒng)在上次備份之后所產(chǎn)生、更新的數(shù)據(jù)。在備份過程中,只備份有標(biāo)記的選中的數(shù)據(jù)塊,備份后標(biāo)記數(shù)據(jù)塊,也就是說清除存檔屬性。該備份方式的優(yōu)點是備份數(shù)據(jù)量少、占用空間少、單個備份或恢復(fù)時間短;其缺點是恢復(fù)操作復(fù)雜、數(shù)據(jù)完整性相對差,一旦發(fā)現(xiàn)單個增量備份不能正?;謴?fù),整個系統(tǒng)的備份將受到影響。
(3)差分備份。是指只備份在上一次完全備份后有變化的部分?jǐn)?shù)據(jù)。在備份過程中,只備份有標(biāo)記的選中的數(shù)據(jù)塊,備份后不標(biāo)記為已備份數(shù)據(jù)塊,也就是說不清除存檔屬性。該備份方式的優(yōu)點是備份數(shù)據(jù)量少、占用空間少、單個備份或恢復(fù)時間短;其缺點是恢復(fù)操作復(fù)雜、備份及恢復(fù)技術(shù)要求較高。
在實際應(yīng)用中,金融行業(yè)對數(shù)據(jù)完整性、時效性、安全性要求較高,一般在制定備份策略時會將3種方式的結(jié)合使用。例如每周一至周六進行一次增量備份或差分備份,每周日進行一次全量備份。
1.3.2 按備份數(shù)據(jù)的性質(zhì)劃分,可將備份數(shù)據(jù)劃分為以下2類:
(1)邏輯備份。是指對金融大數(shù)據(jù)(如用戶、數(shù)據(jù)表等)利用工具進行導(dǎo)出保存。該備份策略的優(yōu)點是能夠?qū)崿F(xiàn)對象級的數(shù)據(jù)備份,易實現(xiàn)跨平臺的數(shù)據(jù)遷移。其缺點是不能滿足介質(zhì)失效下的數(shù)據(jù)恢復(fù),僅能滿足邏輯故障下的數(shù)據(jù)恢復(fù)。
(2)物理備份。是指將物理文件進行轉(zhuǎn)儲保存,需要恢復(fù)時可以利用這些文件進行還原。該備份策略的優(yōu)點是備份和恢復(fù)迅速,容易達(dá)到低維護、高安全的效果。其缺點是單獨使用時只能提供到某一時點的恢復(fù),不能按具體數(shù)據(jù)對象進行恢復(fù)。
1.3.3 按備份時是否終止外服務(wù)劃分,可將備份數(shù)據(jù)劃分為以下2類:
(l)冷備份。又稱脫機完全備份,在關(guān)機(或停服務(wù))的狀態(tài)下進行對備份對象進行完成的截面數(shù)據(jù)備份。該備份策略的優(yōu)點是備份快速、安全且操作方法簡便。其缺點是在備份過程中必須處于脫機狀態(tài),對業(yè)務(wù)會造成一定的損失,而且只能進行物理備份,對存儲介質(zhì)造成空間浪費;恢復(fù)過程中只能進行完整數(shù)據(jù)恢復(fù),不能以小粒度進行恢復(fù)。
(2)熱備份。又稱在線備份,是在生產(chǎn)系統(tǒng)運行狀態(tài)下直接進行數(shù)據(jù)備份。該備份策略的優(yōu)點是能滿足業(yè)務(wù)連續(xù)運行要求。其缺點是熱備份會占用一定的系統(tǒng)資源,一般需要選擇業(yè)務(wù)低峰時段進行。
1.4 數(shù)據(jù)備份的策略
數(shù)據(jù)備份策略是指為滿足數(shù)據(jù)備份需求,制定的數(shù)據(jù)備份內(nèi)容、數(shù)據(jù)備份時間、數(shù)據(jù)備份時長、數(shù)據(jù)備份方式。備份策略的好壞直接影響備份系統(tǒng)的投資成本、備份時效、恢復(fù)效率、安全性等。完整的備份策略需要滿足以下基本要素:
1.4.1 備份對象。指進行數(shù)據(jù)備份的數(shù)據(jù)內(nèi)容,數(shù)據(jù)存放的物理位置,常見的數(shù)據(jù)備份對象有操作系統(tǒng)、數(shù)據(jù)庫實例、數(shù)據(jù)庫表、文件、磁盤等。
1.4.2 備份類型。指進行數(shù)據(jù)備份采用什么方式,如按備份數(shù)據(jù)的完整性分全量備份、增量備份、差分備份,按是否停機劃分冷備份、熱備份。
1.4.3 備份頻率。指為滿足備份需求執(zhí)行數(shù)據(jù)備份的間隔。如:每天、每周、每4小時等。
1.4.4 備份時間窗口。指執(zhí)行備份操作可執(zhí)行的時間范圍,規(guī)定了備份操作的最早開始時間、最遲結(jié)束時間。
1.4.5 備份保存時長。指為滿足業(yè)務(wù)需求對備份文件保存的時長,一般來說備份文件保存周期必須要大于備份執(zhí)行周期。
1.4.6 備份存放。指備份結(jié)果文件存放的位置(介質(zhì)),例如:光盤、磁帶、虛擬磁帶庫、數(shù)據(jù)庫、文件系統(tǒng)、文件服務(wù)器、異地存放、云存放等。
2 數(shù)據(jù)備份內(nèi)容
對于應(yīng)用系統(tǒng),一個完整、有效的數(shù)據(jù)備份涉及多個方面和多個層級備份內(nèi)容,包括操作系統(tǒng)、數(shù)據(jù)庫實例、物理磁盤(存儲)、應(yīng)用程序、數(shù)據(jù)庫表、交易日志、非結(jié)構(gòu)化數(shù)據(jù)文件等。操作系統(tǒng)備份、數(shù)據(jù)庫實例備份、物理磁盤(存儲)備份、應(yīng)用程序備份、數(shù)據(jù)庫表備份主要目標(biāo)是實現(xiàn)系統(tǒng)故障阪復(fù),保障系統(tǒng)的業(yè)務(wù)連續(xù)性,屬于技術(shù)性需求的數(shù)據(jù)備份。數(shù)據(jù)庫表備份、交易日志備份以及非結(jié)構(gòu)化數(shù)據(jù)備份更多的是為了滿足業(yè)務(wù)需求和監(jiān)管部門要求,屬于業(yè)務(wù)性需求的數(shù)據(jù)備份。
2.1 基礎(chǔ)軟件備份
基礎(chǔ)軟件備份是對整個操作系統(tǒng)、文件系統(tǒng)、設(shè)備驅(qū)動程序、常用工具軟件等進行備份,主要用于實現(xiàn)對整個基礎(chǔ)軟件環(huán)境進行故障恢復(fù),主要通過自身提供的備份命令(工具)將系統(tǒng)數(shù)據(jù)備份至磁帶、磁盤、光盤等外部介質(zhì)上。
由于基礎(chǔ)軟件相對較穩(wěn)定,備份頻率較低,一般每季度備份一次即可,另外在基礎(chǔ)軟件升級前后需要進行一次備份。
2.2 應(yīng)用程序備份
應(yīng)用程序備份是指對安裝的應(yīng)用程序、配置文件、用戶數(shù)據(jù)等進行備份,主要用于滿足應(yīng)用程序故障恢復(fù)、版本回退等運維需求。其實現(xiàn)機制主要是通過定時任務(wù)調(diào)用備份工具(或腳本),對涉及到的應(yīng)用程序、配置文件、用戶數(shù)據(jù)進行備份。
因為業(yè)務(wù)發(fā)展的需要,目前金融數(shù)據(jù)中心應(yīng)用程序(版本)變更相對比較頻繁,其備份頻率一般是每周一備,以及在每次版本升級前進行一次備份。
2.3 物理存儲備份
物理存儲備份是指通過磁盤鏡像、磁盤復(fù)制等方式實現(xiàn)對整個物理磁盤的數(shù)據(jù)備份,主要滿足磁盤級的數(shù)據(jù)保護和恢復(fù)。
磁盤鏡像是指將兩個磁盤接在同一個陣列卡上,用一個陣列卡來管理兩個磁盤的技術(shù)。當(dāng)用戶向服務(wù)器寫數(shù)據(jù)時,磁盤鏡像技術(shù)就同時將數(shù)據(jù)寫入兩個磁盤中,基本上滿足數(shù)據(jù)實時備份,一旦一個磁盤損壞,便可從另一個磁盤上獲得數(shù)據(jù),可維持系統(tǒng)的正常運行。
2.4 數(shù)據(jù)庫備份
數(shù)據(jù)庫備份是指對整個數(shù)據(jù)庫實例進行備份,用于保證整個數(shù)據(jù)庫實例的數(shù)據(jù)一致性、完整性,保障數(shù)據(jù)庫在出現(xiàn)物理故障或邏輯故障情況下能夠有效的進行恢復(fù)。
數(shù)據(jù)庫實例備份一般采取0級備份和邏輯日志備份相結(jié)合的備份策略,0級備份實現(xiàn)對整個數(shù)據(jù)庫的dbspace進行全備,可用于將數(shù)據(jù)庫完整地恢復(fù)到具體某個時間點所處的狀態(tài)。邏輯日志記錄了數(shù)據(jù)庫每一步的具體操作,基于前述的0級備份,再通過重做備份的邏輯日志的方式能夠?qū)?shù)據(jù)庫恢復(fù)到最近的一次操作所處的狀態(tài)。0級備份和邏輯日志備份的執(zhí)行頻率要視系統(tǒng)數(shù)據(jù)的重要性、數(shù)據(jù)庫的大小、可用備份時間窗口而定。
對于重要業(yè)務(wù)系統(tǒng),一般采用每日進行一次數(shù)據(jù)庫0級備份,每4小時進行一次歸檔邏輯日志備份。
2.5 交易日志備份
交易日志備份是指對應(yīng)用系統(tǒng)運行日志進行備份保存,主要用于滿足問題追蹤分析、業(yè)務(wù)需求及監(jiān)管審計要求等。應(yīng)用系統(tǒng)時刻會產(chǎn)生應(yīng)用日志以記錄交易處理詳細(xì)過程及重要的報錯信息,由于本地文件系統(tǒng)空間限制,可保留的日志量有限,因此對于某些重要的日志需要定期將其備份到外部介質(zhì)上進行保存。為方便對歷史日志查詢,一般是按日期每天進行一次備份。
2.6 業(yè)務(wù)數(shù)據(jù)備份
業(yè)務(wù)數(shù)據(jù)備份主要是針對應(yīng)用系統(tǒng)在業(yè)務(wù)處理時產(chǎn)生的數(shù)據(jù)文件,如:批量文件、文本文件、圖像、聲音、視頻等非結(jié)構(gòu)化數(shù)據(jù)文件進行備份。這些文件包含了重要的業(yè)務(wù)數(shù)據(jù),是保障業(yè)務(wù)連續(xù)性所需要的文件,為滿足業(yè)務(wù)需求及審計監(jiān)管要求,也需要定期對這些文件進行備份。其備份策略基本和交易日志備份相同。
3 數(shù)據(jù)備份不足
數(shù)據(jù)備份是日常系統(tǒng)運行維護工作中一項重要的基礎(chǔ)工作,目前在數(shù)據(jù)中心廣泛應(yīng)用,但在具體的執(zhí)行過程中還存在諸多問題和不足,需要我們予以關(guān)注。
3.1 缺乏對數(shù)據(jù)恢復(fù)驗證
數(shù)據(jù)恢復(fù)驗證是為了檢驗數(shù)據(jù)備份是否有效,及時發(fā)現(xiàn)在數(shù)據(jù)備份存中在的問題,并促使進一步優(yōu)化、完善數(shù)據(jù)備份策略。由于系統(tǒng)運維人員對數(shù)據(jù)恢復(fù)驗證重視不足及缺少相應(yīng)恢復(fù)驗證環(huán)境,目前普遍缺少數(shù)據(jù)恢復(fù)驗證工作,對于多數(shù)數(shù)據(jù)備份的有效性、一致性、全面性不得而知,這就埋藏巨大的風(fēng)險隱患。
對此,建議金融數(shù)據(jù)中心應(yīng)更加注重數(shù)據(jù)恢復(fù)驗證,通過制定相關(guān)的演練計劃,定期進行數(shù)據(jù)恢復(fù)驗證,測試備份介質(zhì)的可用性,備份數(shù)據(jù)的完整性及恢復(fù)所需的時間是否滿足要求。
3.2 等級劃分落實不夠
根據(jù)《信息安全技術(shù)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》規(guī)定,信息系統(tǒng)等級是其災(zāi)備建設(shè)的重要考慮因素,也就說明數(shù)據(jù)備份需要根據(jù)信息系統(tǒng)等級進行規(guī)劃?!兑?guī)范》將信息系統(tǒng)劃分為6級,不同的等級對數(shù)據(jù)備份系統(tǒng)要求各不相同,等級越高對于信息系統(tǒng)的保護效果越好,但同時成本也會急劇上升。在《規(guī)范》中也指出了,可以根據(jù)成本風(fēng)險平衡原則(即在災(zāi)難恢復(fù)資源的成本與風(fēng)險可能造成的損失之間取得平衡)來確定。應(yīng)建立重要數(shù)據(jù)的定期數(shù)據(jù)備份機制,至少每天進行一次完整的數(shù)據(jù)增量備份,并將備份介質(zhì)存放在安全區(qū)域內(nèi)。應(yīng)對關(guān)鍵數(shù)據(jù)進行同城和異地的實時備份,保證業(yè)務(wù)應(yīng)用能夠?qū)崿F(xiàn)實時切換。應(yīng)制定災(zāi)難恢復(fù)計劃并定期進行測試,確保各個恢復(fù)程序的正確性和計劃整體的有效性。
業(yè)務(wù)數(shù)據(jù)備份主要了滿足業(yè)務(wù)需要、監(jiān)管審計要求提出的,在制定數(shù)據(jù)備份策略過程中往往缺少相關(guān)業(yè)務(wù)部門參與,導(dǎo)致出現(xiàn)業(yè)務(wù)數(shù)據(jù)備份需求不明確,備份策略不完備,無法滿足業(yè)務(wù)需求的情況。
3.3 安全要求存在縫隙
數(shù)據(jù)備份所涉及的數(shù)據(jù)均屬于重要數(shù)據(jù),其中不乏涉及客戶資金賬號、個人身份信息等敏感數(shù)據(jù)。因此在制定數(shù)據(jù)備份策略時,不僅要注重數(shù)據(jù)備份的完整性、有效性,同時也應(yīng)注重數(shù)據(jù)的安全性,對于涉及敏感數(shù)據(jù)的備份應(yīng)當(dāng)采用必要的加密保護機制,對于所使用備份介質(zhì)也應(yīng)當(dāng)采取相應(yīng)的安全保護措施,防止信息泄露。
3.4 數(shù)據(jù)去重難于操作
數(shù)據(jù)去重是在數(shù)據(jù)備份前消除冗余數(shù)據(jù)以提高數(shù)據(jù)的存儲和/或傳輸效率,金融業(yè)務(wù)處理中重復(fù)數(shù)據(jù)難免,備份大量的重復(fù)數(shù)據(jù),會消耗一定的存儲和帶寬,導(dǎo)致資源浪費。隨著數(shù)據(jù)急劇膨脹,該問題日益突出。因此,在保證數(shù)據(jù)備份的完整性的同時應(yīng)當(dāng)盡量減少重復(fù)數(shù)據(jù)的產(chǎn)生,或者應(yīng)將重復(fù)數(shù)據(jù)刪除和數(shù)據(jù)壓縮技術(shù)納入整體的備份策略當(dāng)中。
4 結(jié)束語
數(shù)據(jù)備份是金融數(shù)據(jù)中心日常運行維護的基礎(chǔ)工作,是保障數(shù)據(jù)一致性、完整性的必要手段。當(dāng)前,數(shù)據(jù)備份在數(shù)據(jù)中心的運用已無處不在,各種數(shù)據(jù)備份技術(shù)成熟度趨于成熟,但由于缺少對各種備份方法理論方面的總結(jié)和介紹,致使系統(tǒng)運維人員在面對五花八門數(shù)據(jù)備份時困惑重重。隨著信息技術(shù)發(fā)展,企業(yè)對數(shù)據(jù)的依賴性不斷加強,數(shù)據(jù)安全問題更加突出,數(shù)據(jù)備份也將發(fā)揮出更大的作用。本文從理論角度出發(fā),對數(shù)據(jù)備份所涉及的基本內(nèi)容、基礎(chǔ)知識進行總結(jié),通過概述性的介紹幫助系統(tǒng)運維人員提高對數(shù)據(jù)備份的認(rèn)識,在日常工作中,有效的做好數(shù)據(jù)備份,提升信息系統(tǒng)運維能力,防范運行風(fēng)險。