吳虎 閆金霞
摘? 要:HANA系統(tǒng)是一種內(nèi)存數(shù)據(jù)庫(kù)系統(tǒng),承載著大數(shù)據(jù)運(yùn)算。因系統(tǒng)運(yùn)算速度快,吞吐量巨大,造成災(zāi)備數(shù)據(jù)實(shí)時(shí)同步困難。該文主要介紹了一種利用萬(wàn)兆城域網(wǎng)實(shí)現(xiàn)HANA系統(tǒng)同城災(zāi)備的方式。
關(guān)鍵詞:HANA? 大數(shù)據(jù)? 內(nèi)存數(shù)據(jù)庫(kù)? 災(zāi)備
中圖分類號(hào):TP309 ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2019)09(a)-0018-02
Abstract: HANA system is a in-memory database system, which carries large data operations. It is difficult to synchronize data in real time because of the fast operation speed and huge throughput of the system. In the paper, a method was introduced to realize disaster recovery of HANA system? in the same city by using 10Gb MAN.
Key Words: HANA; Large data; In-memory database; Disaster recovery
HANA系統(tǒng)災(zāi)備的實(shí)現(xiàn)可通過(guò)運(yùn)算節(jié)點(diǎn)之間數(shù)據(jù)同步或運(yùn)算節(jié)點(diǎn)存儲(chǔ)設(shè)備之間的數(shù)據(jù)同步實(shí)現(xiàn),二者有著不同的實(shí)現(xiàn)機(jī)制。前者通過(guò)10Gb萬(wàn)兆網(wǎng)連接兩個(gè)HANA集群節(jié)點(diǎn),雙活架構(gòu),一般同城實(shí)現(xiàn),稱之為系統(tǒng)復(fù)制。后者也通過(guò)10Gb萬(wàn)兆網(wǎng)鏈路連接兩側(cè)節(jié)點(diǎn)的存儲(chǔ)設(shè)備,實(shí)現(xiàn)數(shù)據(jù)庫(kù)全備份及日志存儲(chǔ)層同步。該文介紹的是后一種實(shí)現(xiàn)方式,即對(duì)大數(shù)據(jù)HANA系統(tǒng)的全備份和日志以存儲(chǔ)復(fù)制的方式進(jìn)行同城災(zāi)備建設(shè)。由于數(shù)據(jù)吞吐量大,對(duì)鏈路帶寬要求高,一般進(jìn)行同城容災(zāi)建設(shè)。
1? HANA概述
HANA內(nèi)存數(shù)據(jù)庫(kù)系統(tǒng)承載在大容量物理內(nèi)存上,因此運(yùn)算速度很快。但數(shù)據(jù)并不是只在內(nèi)存里,也會(huì)不停寫到硬盤里。HANA一方面通過(guò)高速數(shù)據(jù)總線,以一定時(shí)間間隔將數(shù)據(jù)和日志寫入高速硬盤上(持久層),另一方面,通過(guò)較低速數(shù)據(jù)總線將全庫(kù)備份以及增量日志離線備份到存儲(chǔ)設(shè)備上。
2? 災(zāi)備實(shí)現(xiàn)
HANA系統(tǒng)從內(nèi)存寫數(shù)據(jù)和日志到介質(zhì),可分為在線層和離線層。在在線層,多為HANA節(jié)點(diǎn)內(nèi)置高速硬盤,通過(guò)常規(guī)磁盤陣列進(jìn)行數(shù)據(jù)同步變得不太可能;在離線層,實(shí)時(shí)性要求低,并且數(shù)據(jù)庫(kù)全備份和日志增量備份到了外掛存儲(chǔ)設(shè)備上,則具備采用存儲(chǔ)層同步數(shù)據(jù)庫(kù)和日志備份的可能;在災(zāi)備側(cè),通過(guò)恢復(fù)全庫(kù)備份和應(yīng)用重做日志使系統(tǒng)得到恢復(fù);HANA節(jié)點(diǎn)數(shù)據(jù)總線速率很高,即使離線層存儲(chǔ)復(fù)制,也需要較大帶寬。在生產(chǎn)中心和災(zāi)備中心間采用萬(wàn)兆網(wǎng)連接,進(jìn)行同城災(zāi)備。
HANA備份時(shí),將備份每一個(gè)HANA服務(wù)的數(shù)據(jù)。如果HANA運(yùn)行在多個(gè)節(jié)點(diǎn)上,那么數(shù)據(jù)全備份會(huì)包含所有節(jié)點(diǎn)上的以服務(wù)為單位的備份。用戶可以在操作系統(tǒng)級(jí)別使用SAP HANA的命令行工具HDBSQL以及crontab讓數(shù)據(jù)庫(kù)在固定時(shí)間固定間隔進(jìn)行備份。在災(zāi)備中心,可利用HANA Studio進(jìn)行恢復(fù)。
某企業(yè)數(shù)據(jù)倉(cāng)庫(kù)HANA系統(tǒng)8個(gè)節(jié)點(diǎn),每節(jié)點(diǎn)內(nèi)存2TB。目前全庫(kù)備份大小為10T,6個(gè)小時(shí)備份完成,則會(huì)對(duì)存儲(chǔ)設(shè)備造成10×1024×1024/6×60×60≈485MB/S的吞吐量,同城萬(wàn)兆網(wǎng)吞吐量為:10000×0.9/8=1125MB/S(0.9為帶寬利用率)。因此,同城萬(wàn)兆網(wǎng)能夠滿足大數(shù)據(jù)全備份傳輸需求。當(dāng)生產(chǎn)端全備份完成的同時(shí),在同城災(zāi)備端也有了一份全備份。日志備份也存放在存儲(chǔ)設(shè)備中,持續(xù)產(chǎn)生,每5min或滿4G形成一個(gè)歸檔,隨備隨傳。
3? 結(jié)語(yǔ)
利用萬(wàn)兆城域網(wǎng)將大數(shù)據(jù)HANA系統(tǒng)的全備份和日志傳輸?shù)酵菫?zāi)備端來(lái)實(shí)現(xiàn)容災(zāi),技術(shù)上容易實(shí)現(xiàn)。相對(duì)于系統(tǒng)復(fù)制,該方式下存儲(chǔ)層復(fù)制系統(tǒng)和生產(chǎn)系統(tǒng)運(yùn)算節(jié)點(diǎn)完全解耦,對(duì)生產(chǎn)系統(tǒng)的性能和穩(wěn)定運(yùn)行均不產(chǎn)生影響。
參考文獻(xiàn)
[1] 高天.SAP HANA技術(shù)研究與應(yīng)用實(shí)施[J].信息系統(tǒng)工程,2016(8):117-118.
[2] 張巖松.HANA在某石油銷售決策支持系統(tǒng)的應(yīng)用[J].石油規(guī)劃設(shè)計(jì),2017,28(2):43-46.
[3] 周昕.BW遷移HANA平臺(tái)應(yīng)用技術(shù)探討[J].科技資訊,2017,15(18):26-27,30.
[4] 劉杰.數(shù)據(jù)復(fù)制技術(shù)在資產(chǎn)管理系統(tǒng)應(yīng)用級(jí)災(zāi)備中的應(yīng)用[J].電力信息與通信技術(shù),2017(7):36-40.
[5] 張鶴.基于SAN存儲(chǔ)的醫(yī)療衛(wèi)生數(shù)據(jù)中心異步數(shù)據(jù)災(zāi)備設(shè)計(jì)[J].軟件導(dǎo)刊,2017(3):146-149.
[6] 賈棟.企業(yè)級(jí)災(zāi)備中心的建設(shè)及技術(shù)選型[J].中國(guó)信息化,2018(6):64-65.