◆王曉翠
基于云原生重構(gòu)高校災備系統(tǒng)的探索與實踐
◆王曉翠
(北京第二外國語學院 北京 100024)
隨著信息安全問題的日益突出,高校信息中心面臨著各種威脅。建設(shè)一套完整的災備系統(tǒng)以保證系統(tǒng)的穩(wěn)定性、業(yè)務的連接性和數(shù)據(jù)可用性已成為高校信息化建設(shè)面臨的重要問題。但建設(shè)災備數(shù)據(jù)中心需要投入大量的資金和人力資源,目前多數(shù)高校不具備建設(shè)災備中心的條件。本文通過對幾種基于云的災備方式進行比較研究,發(fā)現(xiàn)云原生方案備份速度快,可靠性高,費用較低且對技術(shù)人員要求不高,可作為高校信息系統(tǒng)異地容災備份的一種新選擇。
容災備份;云災備;云原生
隨著信息化進程的推進,高校信息化建設(shè)的范圍越來越廣泛,涉及教學、科研、管理等多個方面,如學工系統(tǒng)、財務系統(tǒng)、選課系統(tǒng)、資產(chǎn)管理系統(tǒng)、圖書館自動化系統(tǒng)等。高度信息化為高校師生教、學、研、管等各方面帶來了便利,但信息化程度越高所產(chǎn)生的數(shù)據(jù)量也呈爆發(fā)式增長,高校所有業(yè)務的核心就是信息數(shù)據(jù),隨著信息安全問題的日益突出,學校的各類核心數(shù)據(jù)都受到各種威脅,自然災害、人為故障、系統(tǒng)自身缺陷、惡意竊取和攻擊,這些都在無時無刻影響著我們的數(shù)據(jù)安全[1]。但鑒于對災備系統(tǒng)的認識不足以及建設(shè)與管理成本的限制,高校對災備體系都沒有足夠的重視。等保2.0時代的到來對高校災備體系提出了新要求。《中華人民共和國網(wǎng)絡安全法》第二十一條、三十四條明確規(guī)定關(guān)鍵信息基礎(chǔ)設(shè)施的運營者應當履行對重要系統(tǒng)和數(shù)據(jù)庫進行容災備份的保護義務,并在其他條文中規(guī)定了相應的處罰細則。如何保證系統(tǒng)穩(wěn)定性、業(yè)務連續(xù)性和數(shù)據(jù)可用性已經(jīng)成為高校信息化建設(shè)必須考慮的重要問題。
傳統(tǒng)災備方案是由用戶自行購買存儲設(shè)備,在本地或異地建設(shè)災備中心,由組織內(nèi)部的技術(shù)人員進行維護。但往往企業(yè)自建的數(shù)據(jù)中心由于缺乏整體規(guī)劃、技術(shù)人員水平有限、沒有定制相應的恢復方案或不具備恢復演練的條件等原因沒有達到預期的效果。隨著云計算和大數(shù)據(jù)技術(shù)的發(fā)展,云平臺以其獨特的優(yōu)勢被越來越多的企業(yè)所接受和使用。云計算的使用,可以大幅度減少用戶的 IT 資源與人力成本的投入,同時獲得更加彈性和強大的計算能力,可快速便捷拓展業(yè)務[2]。由于云平臺的靈活性,災備也衍生了新的概念——云災備。本文將通過對當前常用云災備的幾種方案進行比較,探索利用云原生方案重構(gòu)高校信息中心災備機制。
云災備是指災備業(yè)務的云端實現(xiàn)形式,與傳統(tǒng)的組織在本地或異地災備模式不同,云災備是一種全新的災備服務模式,它將災備看作是一種服務,由客戶付費使用,由災備服務提供商提供產(chǎn)品的服務模式。采用這種模式,客戶可以利用服務提供商的優(yōu)勢技術(shù)資源、豐富的災備項目經(jīng)驗和成熟的運維管理流程,快速實現(xiàn)用戶的災備目標,降低客戶的運維成本和工作強度,同時也降低災備系統(tǒng)的總體擁有成本[2]。云災備主要包括傳統(tǒng)物理主機、虛擬機等 IT 系統(tǒng)往云端災備,以及云與云之間的災備等。云災備包括了傳統(tǒng)的數(shù)據(jù)存儲和定時復制,以及數(shù)據(jù)的實時傳輸、系統(tǒng)遷移、應用切換,保證災備端應急接管業(yè)務應用等范疇[2]。
云災備結(jié)合云平臺的計算、存儲和帶寬等諸多優(yōu)勢,相比本地災備具備了多方面的優(yōu)勢:
(1)減少基礎(chǔ)設(shè)施,降低IT成本
傳統(tǒng)災備系統(tǒng)需要用戶購買大量存儲設(shè)備,自建數(shù)據(jù)中心,通過RAID 方式來實現(xiàn)數(shù)據(jù)冗余和數(shù)據(jù)恢復。云存儲系統(tǒng)則主要采用大量廉價的普通主機,基于網(wǎng)絡利用分布式協(xié)同軟件,將數(shù)據(jù)分散存儲于若干通用存儲服務器上,并通過副本或編碼方法進行綜合管理,向用戶提供可靠的統(tǒng)一的邏輯存儲空間。利用云存儲系統(tǒng),用戶可直接借助云平臺供應商提供的計算和存儲平臺,或者直接采用云災備DRaaS(災難恢復即服務)應用服務,可以免去購置大量存儲設(shè)備自建數(shù)據(jù)中心所帶來的硬件購買及維護成本。采用更為經(jīng)濟、更具彈性的云存儲進行備份,實現(xiàn)了對資源的精細化管理,進而減少大部分的災備支出,同時也可以節(jié)省更多人力資源,企業(yè)可以將解放出來的備份維護人員投入到其他的更重要的工作中去。
(2)按需擴容、按使用付費
傳統(tǒng)的災備方案需要建立與生產(chǎn)中心架構(gòu)完全對應的災備中心,而云災備可以采用云基礎(chǔ)設(shè)施,或者災備即服務的模式,允許用戶自由選定重要的系統(tǒng)和數(shù)據(jù)。因為底層架構(gòu)被其他采用同樣云計算解決方案的公司所共有,共同分擔成本,所以用戶只需為實際所使用的資源付費,從而大大減少了資源的開支與浪費,并提升了效率[2]。
(3)高度靈活性
云災備具有高可用、高安全、易擴展、無限擴容等特點,使得業(yè)務需求更容易評估,用戶可以更準確預估哪個系統(tǒng)、甚至哪個子系統(tǒng)確實需要維護。也可以更細粒度地選擇關(guān)鍵的數(shù)據(jù)來優(yōu)化自身的備份計劃,而不是整個地完全備份,更精確地設(shè)置RPO,即能容忍的最大數(shù)據(jù)丟失量。云中建立的高可用、高容錯架構(gòu)可以提升恢復時間和恢復點目標,基于公有云平臺或者開源的私有云技術(shù)也可以簡便、快速、靈活地構(gòu)建災備節(jié)點并將數(shù)據(jù)遷移或者復制到云端,提升災難恢復的速度。
(4)快速迭代的復制與恢復技術(shù)
云災備使用戶可以預先準確估計恢復的時間,確保停機時間在一個可接受的合理范圍內(nèi),從而可以制定一個準確的、可交付的SLA 協(xié)議,并可以遠程使用云計算和云存儲資源[2]。
在具體的實際場景應用中,按照不同的對云的利用方式,云災備方案包括混合云方案、云托管及云原生方案。
本地部署方案是將災備方案中的服務器、災備軟件、備份存儲設(shè)備等部署在本地數(shù)據(jù)中心,災備系統(tǒng)全部由組織內(nèi)部技術(shù)人員維護的數(shù)據(jù)保護方案,在很多企業(yè)得到廣泛的應用。數(shù)據(jù)中心按兩地三中心定義可劃分為本地生產(chǎn)數(shù)據(jù)中心、同城雙活數(shù)據(jù)中心、異地數(shù)據(jù)中心??紤]到建設(shè)成本和管理成本,目前高校多使用本地生產(chǎn)數(shù)據(jù)中心和同城雙活數(shù)據(jù)中心兩種災備模式。多數(shù)不具備建立異地中心的條件。本地部署優(yōu)點是整個系統(tǒng)部署在組織內(nèi)部,可控性程度高;缺點是硬件軟件成本高、維護工作量大、上線時間長、擴展性差。
混合云方案與本地部署數(shù)據(jù)保護方案相比,服務器、災備軟件和備份存儲都相同,只是長期歸檔數(shù)據(jù)保存到云上。混合云方案用云端存儲替代了傳統(tǒng)的磁帶設(shè)備,相比傳統(tǒng)本地部署方案投入有所降低?;旌显品桨傅膬?yōu)點是相比本地部署,備份存儲介質(zhì)投入有所減少;缺點仍和本地部署方案相似,硬件軟件成本高、維護工作量大、上線時間長、擴展性差。
云托管是從云計算提供商處采購計算資源以托管數(shù)據(jù)、服務的解決方案,是一種基礎(chǔ)架構(gòu)即服務(IaaS)云交付模型,是按需提供并托管在云計算基礎(chǔ)設(shè)施之上。相對混合云,云上托管有更好的可靠性,但是云上托管方案并沒有針對云環(huán)境進行豐富的優(yōu)化,對云的經(jīng)濟性的價值利用有限,而且云上托管方案仍然需要IT團隊花費較多的精力進行維護。
CNCF(云原生計算基金會)對云原生這樣定義:云原生技術(shù)有利于各組織在公有云、私有云和混合云等新型動態(tài)環(huán)境中,構(gòu)建和運行可彈性擴展的應用[3]。確切的說云原生其實是一套指導進行軟件架構(gòu)設(shè)計的思想。云原生最大的價值是認為未來的軟件從誕生起就長在云上[4]。云原生方案是數(shù)據(jù)保護的SaaS服務。它充分利用了云的特性,在性能和可用性方面做了大量優(yōu)化。它提供了備份和恢復流程的集中管理,擴展性好。相比混合云和云上托管有更好的投入產(chǎn)出。云原生方案無需客戶部署任何軟硬件,30分鐘即可開始備份與恢復任務。
本文對四種災備方案從可靠性、可用性等九個方面進行比較,如表1所示。
表1 災備方案比較
云原生災備系統(tǒng)相比其他部署方案有以下優(yōu)勢:
(1)較低的資源成本。利用云原生災備方案,無須購買服務器、災備軟件、備份存儲等設(shè)備,而改為按備份使用量計費,降低了災備方案的投入成本。
(2)降低管理成本。傳統(tǒng)的本地部署方案中管理人員需要接受培訓、維護災備方案中的硬件、軟件,管理難度高,云原生方案只需管理人員設(shè)定備份計劃即可,方案維護有云災備服務商負責。
(3)異地分支機構(gòu)統(tǒng)一管理。對于異地數(shù)據(jù)保護及災難恢復的場景,一套方案、一個管理控制臺,一套全局視圖。
(4)減少企業(yè)業(yè)務中斷時間?;谠贫说膹椥?、資源編排服務等能力,可一鍵在云上自動化快速恢復企業(yè)業(yè)務,無須專業(yè)知識,無須干預。
無限擴展性。云端資源的無限擴展性,讓企業(yè)無須提前規(guī)劃購買多少資源,按需購買,隨買隨用。
利用云原生方案實施的災備服務項目,核心信息系統(tǒng)數(shù)據(jù)安全和業(yè)務連續(xù)性得到了全面提升,實現(xiàn)了重要業(yè)務系統(tǒng)等本地高效的數(shù)據(jù)及應用的容災容錯。經(jīng)測試,業(yè)務系統(tǒng)本地恢復RTO(恢復時間目標)<1 0分鐘,RPO(恢復點目標)≈0;云端恢復RTO<30分鐘,RPO<5分鐘。可以明顯看出云原生的優(yōu)勢,它具有高度可靠性和可用性,上線時間短,花費低且對帶寬要求不高。
云原生的優(yōu)點是災備費用低、性能好、無限擴展、管理簡單,但實際落地卻非常復雜,涉及許多新技術(shù),以及新的思維方式。目前的云原生應用并非完美無缺,很明顯的三個問題在于第一、云原生沒有統(tǒng)一標準可循,用戶需根據(jù)自己的實際需求,找到最適合自己的云原生解決方案[5];第二、云原生剛剛起步,缺少相關(guān)標準與支持;第三、云原生的核心是應用生來在就云上,要想云原生應用快速落地,就需要大量專業(yè)的人才,特別是既懂業(yè)務又懂技術(shù)的專業(yè)人才。
隨著信息化的不斷推進,高校各個業(yè)務對信息系統(tǒng)的依賴性不斷增強,信息系統(tǒng)的連續(xù)性和可靠性需求越發(fā)迫切。基于公有云的云災備模式將容災管理轉(zhuǎn)變?yōu)橐环N服務,用戶根據(jù)使用量按需付費,極大地節(jié)省了系統(tǒng)投資,降低了管理難度,同時便于業(yè)務的彈性擴展,是企業(yè)信息系統(tǒng)災備建設(shè)的可靠選擇。CNCF(云原生計算基金會)的調(diào)查數(shù)據(jù)顯示云原生技術(shù)有三大優(yōu)勢,即更快的部署、更高的可擴展性和更好的可移植性。CNCF 2018年報數(shù)據(jù)顯示,云原生技術(shù)在生產(chǎn)系統(tǒng)中的應用數(shù)量翻了一番,正評估和準備使用云原生技術(shù)的企業(yè)用戶數(shù)量增長了3倍以上[3]。云原生應用已是大勢所趨。盡管云原生還有很多技術(shù)需要專業(yè)人員進一步開拓,但無論如何,云原生時代已經(jīng)到來,不管你用或是不用,云原生就在那里,誰受益誰舉步維艱,一目了然;不管你現(xiàn)在用或是未來用,云原生在持續(xù)進化之中,只有適合自己的才是最好的[3]。
[1]孔琳俊. 高校信息化環(huán)境下災備體系建設(shè)的研究與應用[J]. 軟件,2013,34(3):94-97.
[2]英方研究院,災備技術(shù)國家工程實驗室,災備技術(shù)產(chǎn)業(yè)聯(lián)盟. 2019中國災備行業(yè)白皮書[R].上海:上海英方軟件股份有限公司,2019.
[3]人人都愛云原生[N].中國信息化周報,2019-07-15 (008).
[4]林琳. 為什么說2019年是云原生的關(guān)鍵節(jié)點[J]. 計算機與網(wǎng)絡,2019,45(19):38-40.
[5]蘇堅. 基于云原生計算的5G網(wǎng)絡演進策略[J]. 電信科學,2018,34(6):147-152.