內蒙古電力(集團)有限責任公司信息通信分公司 汪 嘯 李 晶 張 翼 張 瑜
關于企業(yè)數據保護方式的對比研究
內蒙古電力(集團)有限責任公司信息通信分公司 汪 嘯 李 晶 張 翼 張 瑜
數據安全是企業(yè)管理信息系統(tǒng)建設和運維工作的重中之重。隨著信息化工作的不斷深入,數據價值日顯重要,數據安全風險日益嚴重。依照數據安全保障規(guī)定,應同時規(guī)劃、同時設計、同時建設、同步維護的數據安全保障系統(tǒng),隨著企業(yè)信息化走向深入,數據安全風險還面臨著工作安全管理規(guī)定陳舊、保障能力不足、保障成本過高,保障效率低下等問題。為應對上述問題,本文在基于充分調查研究的基礎上,依據實際情況進行分析、研究、比較,通過對比研究各類型數據保障方案的優(yōu)勢與不足,針對可能產生的問題提出相應的應對思路,可提高數據安全保障的工作效率,降低綜合運行成本?;趯ζ髽I(yè)數據中心的實際情況,提出有針對性的意見,繼而對企業(yè)數據安全保障方式進行了較為深入的分析和探討。
企業(yè)數據安全數據中心;數據庫;數據一致性;數據摘要驗證技術
隨著企業(yè)信息化建設工作走向深入,企業(yè)信息系統(tǒng)數據的安全性逐漸受到管理人員和技術人員的重視。隨IT項目同步計劃、同步實施、同步運維的數據安全系統(tǒng)已經成為數據安全保障的支撐。
數據安全可分為數據可用性和數據保密性兩個方面。數據可用性在英文文獻中對應Data Safety,而數據保密性對應Data Security,在部分中文文獻中區(qū)分為“安全(SA)”和“安全(SE)”以指代上述名詞。在技術方面,存在著可用性和保密性互為支撐、發(fā)揮協(xié)同效應的現象。如在數據在線復制、離線備份中采用加密形式進行數據的傳輸和存儲,實現了多份數據的加密以滿足用戶特定需求。在密鑰制作、保存,數據加密、解密,數據脫敏、利用的過程中則需要借助數據復制、備份技術實現多副本利用。數據可用性依靠存儲設備進行數據在線冗余存儲或離線歸檔達到的能夠在設備災難來臨時進行恢復的能力,其主要指標為恢復時間目標(Recovery Time Objective,RTO)和恢復點目標(Recovery Point Objective,RPO)。數據保密性指數據在使用和保存的過程中能夠按照合法使用者的目的進行交互,不能夠被非授權者獲取、更改,任何獲取和修改數據的記錄必須完整可追溯。因篇幅所限,本論文著重討論數據可用性(即安全-SA)這一方面。
作為數據安全最后一道防線的數據保護系統(tǒng)在大數據時代顯得尤為重要。一個可靠的數據保護系統(tǒng)可以有效降低信息系統(tǒng)的安全風險,提高系統(tǒng)健壯性,實現信息系統(tǒng)高可用性。如何經濟高效地進行數據保護系統(tǒng)的建設已經成為亟待解決的重要問題。
目前,數據保護方式可根據保存形式分為數據鏡像、數據備份、數據容災、數據快照等多個方面。數據鏡像常見部署模式為使用兩臺配置相同的磁盤陣列存儲應用數據,并建立同等的連接關系,且兩臺磁盤陣列處于雙活或主備模式,可以在一臺設備出現故障的情況下實現業(yè)務的連續(xù)運行。數據備份常見部署模式為配置備份用磁帶庫和相關備份軟件與在運系統(tǒng)連接,實現數據的在線備份、離線保存。在發(fā)生數據丟失和損毀的情況下,可以通過載入離線備份數據進行恢復,良好的備份系統(tǒng)和備份策略可有效降低RTO和RPO指標。數據容災可依據數據中心的地理距離分為本地容災和異地容災,其技術架構為依托遠程高帶寬的IP網絡進行數據的異步更新。在實現目標方面,可分為應用級容災、數據級容災和離線容災。應用級容災又可分為主備數據中心模式和多活數據中心模式,其不同點在于業(yè)務數據的流向是集中于一個數據中心后進行變更分發(fā)還是分別流向多個數據中心后進行相互同步。數據快照是確定某個時間點的可用數據文件拷貝,此拷貝即為相對應數據在該時間點的完全映像。數據快照是其對應的數據的邏輯副本,也可以是其對應的數據的物理副本。在具體技術實現上,可設為基礎數據與指定時間點歸檔文件或數據塊的組合。對于回溯類型的快照,也可采用地址指針的存檔的辦法完成??煺盏臅r間區(qū)分顆粒度一般在分鐘級,相對于前者鏡像的時間區(qū)分顆粒度可達到秒級以下、而備份、數據容災的顆粒度在小時級以上。隨著技術的發(fā)展,將各種技術融合的方案也應運而生,即時間區(qū)分顆粒度向秒級以下發(fā)展,數據復制范圍則由文件向數據塊級別以下發(fā)展。
在數據鏡像、數據備份、數據容災、數據快照等數據保護方式的具體技術實現上,可依據技術手段、地理概念、行業(yè)標準、應用模式等方式進行區(qū)分。在技術手段區(qū)分方面,既可以通過基于存儲磁盤陣列、服務器等底層設備實現基礎架構層面、比特層級的物理實現,又可以通過操作系統(tǒng)、數據庫等系統(tǒng)軟件實現支撐架構層面、數據塊層級的邏輯實現。在地理概念區(qū)分方面,可分為近程災備和遠程災備。在行業(yè)標準方面,可分為災備、備份、鏡像等。災備可以在線或離線方式保存實時數據,主要以應對數據介質物理損壞。備份以在線或離線方式保存階段性歸檔數據數據,主要以應對數據的邏輯損壞,主要有病毒、誤操作、黑客因素等。在應用模式方面,既有完全基于存儲或備份技術的單一數據保護型產品,也有具有融合特點的產品。在項目實例中,既有本地鏡像、快照、多副本備份組成的多層數據恢復體系,也有遠端容災、遠端備份組成的多地址數據歸檔體系。既有基于數據庫技術的雙活數據中心模式,也有基于存儲或磁帶(物理或虛擬)的數據級災難恢復模式。
TRAP(timely recovery to any point-in-time)是結構化評估數據恢復能力的重要手段,可根據技術實現定義為1至4級。備份和快照技術在在線(on-line)模式下進行會占用系統(tǒng)I/O,耗費存儲資源并影響在運系統(tǒng)的生產業(yè)務。在數據恢復情況下,PRO和RTO相對較長,可評估為TRAP-1。具有版本控制(歸檔文件存取)功能的系統(tǒng)可隨時調閱或回退至指定時間點(指定版本),因其讀寫機制是基于文件系統(tǒng)層面實現的,性能較直接讀寫數據塊差,故定義為TRAP-2。常見的符合TRAP-2的技術為運行歸檔模式下的Oracle數據庫,其日志具有時間戳,可滿足相關要求,以邏輯方式實現的Oracle-Dataguard亦符合此要求。在TRAP-2級系統(tǒng)上實現數據塊讀取,可按時間(版本)進行追溯的系統(tǒng)被稱之為連續(xù)數據保護(continuous data protection,CDP)系統(tǒng),可定義為TRAP-3。實現ASM管理、在歸檔模式下運行的Oracle可滿足此要求,以物理方式實現的Oracle-Dataguard亦符合此要求。
TRAP-4是一種改進的CDP機制,其要求是基于初始數據去評估變量并進行壓縮,一般以比對初始數據和變更時間點數據的組成塊哈希值為手段,用指針代替恒定量,并追加保存變量實現備份數據的壓縮。近程鏡像、遠程復制卷等技術中的緩存部分是基于此原理進行開發(fā)和實現。由于比對工作需要高性能CPU、大容量內存的硬件平臺以及支持,一般常見于高端磁盤陣列和高端磁帶庫(物理/虛擬)或數據庫/備份一體化套件,也稱之為數據復制壓縮技術。
在理想狀態(tài)下,RPO與RTO均應無限趨近于零,極低RTO和RPO系統(tǒng)在運維階段也需要投入足夠多的資金、時間和人力成本,需要較多的資源,導致建設成本上升,這是需要企業(yè)管理層給予足夠的重視??紤]到公有云的快速發(fā)展,可以在滿足業(yè)務合規(guī)性的前提下將部分高價值、低敏感的數據或業(yè)務遷移至公有云。同時,以RTO、RPO級別選擇和考核云服務供應商。
[1]陳莉君.康華.賈威威.云存儲日志文件系統(tǒng)中快照的設計與實現[J].計算機應用與軟件,2013,7.
[2]趙建黨.銀行計算機網絡高可用模型研究[D].鄭州大學,2009.
[3]周煒.基于存儲虛擬化的快照與CDP設計[D].湖南大學,2011.
[4]蒲波.涉密局域網數據智能備份研究與實現[D].四川大學,2005.
[5]鄒強.高可用系統(tǒng)設計與實現[D].復旦大學,2012.
[6]海杰.設備層多版本快照的設計與實現[D].華中科技大學,2008.
汪嘯(1986—),碩士,工程師,研究方向為信息系統(tǒng)架構分析。