馮雷
【摘 要】本文先后闡述了系統(tǒng)的改進(jìn)方案;備份數(shù)據(jù)庫工作原理和系統(tǒng)特點(diǎn)與總結(jié)。
【關(guān) 鍵 詞】數(shù)據(jù)庫;雙機(jī)熱備份;系統(tǒng);解決方案
【中圖分類號(hào)】G250.74【文獻(xiàn)標(biāo)識(shí)碼】A【文章編號(hào)】1672-5158(2013)07-0213-02
引言:近年來,隨著經(jīng)濟(jì)改革的不斷深入,企業(yè)的各項(xiàng)業(yè)務(wù)也有了長足發(fā)展,計(jì)算機(jī)應(yīng)用水平得到迅速的提高。目前,開放平臺(tái)加客戶/服務(wù)器的雙機(jī)熱備份應(yīng)用模式已經(jīng)被我國中小型企業(yè)廣泛采用。
通常這種應(yīng)用模式是以兩臺(tái)小型機(jī)做互為備份的兩個(gè)節(jié)點(diǎn),同時(shí)聯(lián)到一個(gè)共享磁盤柜上,構(gòu)成一個(gè)Client/Server方式下的Server端服務(wù)器系統(tǒng)。這種服務(wù)器系統(tǒng)在考慮系統(tǒng)的高連續(xù)可用性時(shí),一般從主機(jī)、網(wǎng)絡(luò)到UPS電源都是一主一備,存放數(shù)據(jù)的磁盤選擇磁盤鏡像技術(shù)或選擇磁盤冗余陣列5技術(shù)(RAID5)。
從硬件角度看,這種配置已經(jīng)考慮了各組成部分的冗余,然而從應(yīng)用的角度來看,這樣的服務(wù)器系統(tǒng)還是有缺陷的。
對應(yīng)用系統(tǒng)而言,數(shù)據(jù)庫是非常重要的,而在這種服務(wù)器系統(tǒng)中數(shù)據(jù)庫只有一個(gè),一旦出現(xiàn)故障,不但整個(gè)系統(tǒng)會(huì)癱瘓,甚至還會(huì)給銀行帶來很大的經(jīng)濟(jì)損失。對于這個(gè)問題,雙機(jī)熱備份模式是無能為力的。在實(shí)際應(yīng)用系統(tǒng)的運(yùn)行過程中,由于參數(shù)設(shè)置不當(dāng)或數(shù)據(jù)庫本身存在的缺陷,使得數(shù)據(jù)庫出現(xiàn)的問題在故障率中所占比重還是比較大的,因而給應(yīng)用系統(tǒng)的可靠運(yùn)行帶來了較大的影響。本文針對這一問題,介紹我單位的一種解決方案。
一、系統(tǒng)的改進(jìn)方案
為了解決Oracle數(shù)據(jù)庫無備份的問題,必須另建一套服務(wù)器系統(tǒng)。然而對中小型企業(yè)來講,另外投資一套小型服務(wù)器系統(tǒng),經(jīng)濟(jì)上往往不允許??紤]到現(xiàn)在的PC服務(wù)器在性能上已經(jīng)足可以充當(dāng)企業(yè)級服務(wù)器,投資較小,所以我們選擇了用PC服務(wù)器備份的方案,如圖1所示:
根據(jù)對IBM System X服務(wù)器的壓力測試結(jié)果,我們認(rèn)為它具有處理日交易3萬筆的能力,符合我單位目前業(yè)務(wù)的情況,因此我們選用了IBM System X服務(wù)器做備份Oracle數(shù)據(jù)庫。
PC服務(wù)器硬件配置:
(1)CPU 4×Pentium Pro
(2)內(nèi)存 8G
(3)硬盤 320G
軟件環(huán)境:
(1)操作系統(tǒng) Windows server 2003
(2)數(shù)據(jù)庫 Oracle 10g
(3)應(yīng)用軟件 ERP軟件
二、 RAID系統(tǒng)
RAID (Redundant Array of Inexpensive Dins),廉價(jià)冗余磁盤陣列。RAID是一種使用磁盤驅(qū)動(dòng)器的方法,它將一組磁盤驅(qū)動(dòng)器用某種邏輯方式聯(lián)系起來,作為邏輯上的一個(gè)磁盤驅(qū)動(dòng)器來使用,使RAID一般是在SCSI磁盤驅(qū)動(dòng)路上實(shí)現(xiàn)的。它的優(yōu)點(diǎn)在于:
通過將多個(gè)物理磁盤編織(weaving)進(jìn)一個(gè)單獨(dú)的邏輯卷來使用,使RAID相對傳統(tǒng)的磁盤驅(qū)動(dòng)器,在同樣的容量下,價(jià)格要低許多。
通過將數(shù)據(jù)按條塊(blocks)寫入不同的磁盤來并行地讀寫幾個(gè)磁盤,進(jìn)而提升磁盤訪向速度。帶有多個(gè)磁盤控制器的RAID系統(tǒng),存取速度提高很快。
RAID的具體實(shí)現(xiàn)可以靠硬件也可以靠軟件,通過硬件實(shí)現(xiàn)RAID的產(chǎn)品有磁盤陣列柜,陣列柜中安裝有磁盤陣列控制卡,可以直接將柜中的硬盤配置成為邏輯盤陣。磁盤陣列柜通過SCSI電纜與服務(wù)器上普通SCSI卡相連,系統(tǒng)管理員需直接在磁盤柜上配置磁盤陣列。
磁盤陣列控制器一般都支持多種RAID級別、磁盤的熱插拔、在線平滑擴(kuò)容和雙冗余電源。
三、備份數(shù)據(jù)庫工作原理
由于PC服務(wù)器中的操作系統(tǒng)、數(shù)據(jù)庫與生產(chǎn)機(jī)中的版本不同,所以必須先將生產(chǎn)機(jī)中的數(shù)據(jù)庫數(shù)據(jù)卸出來,以文本文件的形式傳到PC服務(wù)器上,然后將此文本文件再裝入PC服務(wù)器的數(shù)據(jù)庫中,從而使兩個(gè)數(shù)據(jù)庫中的數(shù)據(jù)一致。慎重起見,還可以對重要表的有關(guān)字段進(jìn)行求和,并將兩個(gè)數(shù)據(jù)庫的求和結(jié)果進(jìn)行比較,若一致則可以放心,不一致則說明上述操作過程有問題,需要排除后重做。
1.日間備份
將每天晚上軋帳后的數(shù)據(jù)卸出并裝載到PC服務(wù)器上,使得生產(chǎn)機(jī)和PC服務(wù)器中的數(shù)據(jù)在每天業(yè)務(wù)開始前保持一致。正常開機(jī)后,當(dāng)生產(chǎn)機(jī)上的數(shù)據(jù)庫出現(xiàn)問題不能正常使用時(shí),可以通過修改PC服務(wù)器的網(wǎng)絡(luò)地址,使上傳的交易傳到PC服務(wù)器,從而實(shí)現(xiàn)數(shù)據(jù)庫的切換。
但應(yīng)注意,切換后的數(shù)據(jù)庫狀態(tài)是每天業(yè)務(wù)開始時(shí)的狀態(tài),所以還應(yīng)有一個(gè)追帳的過程,直到追帳完成,才算完成整個(gè)切換過程。這種切換所需的時(shí)間仍遠(yuǎn)遠(yuǎn)少于磁帶恢復(fù)后再追帳的時(shí)間。一般磁帶備份只做軋帳前的數(shù)據(jù)備份,這樣磁帶恢復(fù)后還要再做一個(gè)軋帳過程,才能恢復(fù)到開業(yè)時(shí)的數(shù)據(jù)庫狀態(tài)。
2.查找隔日數(shù)據(jù)
有時(shí)根據(jù)業(yè)務(wù)的需要,要求恢復(fù)前一天的有關(guān)數(shù)據(jù),由于白天業(yè)務(wù)運(yùn)轉(zhuǎn)不允許生產(chǎn)數(shù)據(jù)庫停下來恢復(fù)數(shù)據(jù),有了PC服務(wù)器,可以將一些數(shù)據(jù)表在軋帳前卸出來,傳到PC服務(wù)器上,需要時(shí)在PC服務(wù)器上恢復(fù)出來,進(jìn)行數(shù)據(jù)的查找。
3.磁帶備份的補(bǔ)充
服務(wù)器上的數(shù)據(jù)還起到異種介質(zhì)備份的作用,提高了備份數(shù)據(jù)的可靠性。PC服務(wù)器可放在辦公環(huán)境下使用,這樣可使服務(wù)器與生產(chǎn)機(jī)保持適當(dāng)?shù)木嚯x,一定程度上提高了整個(gè)系統(tǒng)的抗災(zāi)能力。
在雙機(jī)熱備份應(yīng)用模式下,采用PC服務(wù)器作數(shù)據(jù)庫的備份,提高了整個(gè)應(yīng)用系統(tǒng)的連續(xù)可用性和數(shù)據(jù)備份的可靠性,由于該方案投資省、易實(shí)施,對中小型企業(yè)有一定的借鑒價(jià)值。
四、系統(tǒng)特點(diǎn)與總結(jié)
雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)的特點(diǎn)是:
硬軟結(jié)合實(shí)現(xiàn)真正意義上的數(shù)據(jù)與系統(tǒng)分離。
對硬件配置要求不高,服務(wù)器可采用不同或相差較大的配置。
系統(tǒng)切換時(shí)間段,平均切換時(shí)間為60秒。
切換過程對應(yīng)用程序無影響,無需重新啟動(dòng)或登陸。
系統(tǒng)效率高。因?yàn)檎麄€(gè)系統(tǒng)中數(shù)據(jù)讀寫、管理及容錯(cuò)由磁盤陣列來完成。而系統(tǒng)服務(wù)器故障糾錯(cuò)處理由HA軟件來完成,而這兩個(gè)都是相對獨(dú)立的子系統(tǒng)。雙機(jī)容錯(cuò)監(jiān)控路徑為SCSI線路(80M/S)和RS232線路或10/ 100MB自適應(yīng)網(wǎng)卡線路,既不占用主機(jī)CPU資源,也不產(chǎn)用基礎(chǔ)網(wǎng)絡(luò)寬帶,因此系統(tǒng)效率高。
雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)不采用內(nèi)存鏡像技術(shù),因此需要有一定的切換時(shí)間(通常為60-180秒),它可以有效地避免由于應(yīng)用程序自身的缺陷導(dǎo)致系統(tǒng)全部宕機(jī),同時(shí)由于所有的數(shù)據(jù)全部存貯在中置的磁盤陣列柜中,當(dāng)工作機(jī)出現(xiàn)故障時(shí),備份機(jī)接替工作機(jī),從磁盤陣列中讀取數(shù)據(jù),所以不會(huì)產(chǎn)生數(shù)據(jù)不同步的問題,由于這種方案不需要網(wǎng)絡(luò)鏡像同步,因此這種集群方案服務(wù)器的性能要比鏡像服務(wù)器結(jié)構(gòu)高出很多。
雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)的缺點(diǎn)是在系統(tǒng)當(dāng)中存在單點(diǎn)錯(cuò)的缺陷,所謂單點(diǎn)錯(cuò)是指當(dāng)系統(tǒng)中某個(gè)部件或某個(gè)應(yīng)用程序出現(xiàn)故障時(shí),導(dǎo)致所有系統(tǒng)全部宕機(jī)。在這個(gè)系統(tǒng)中磁盤陣列柜會(huì)導(dǎo)致單點(diǎn)錯(cuò),當(dāng)磁盤陣列柜出現(xiàn)邏輯或物理故障時(shí),所有存貯的數(shù)據(jù)會(huì)全部丟失,因此在選配這種方案時(shí),需要選用一個(gè)品質(zhì)與售后服務(wù)較好的產(chǎn)品。
五、結(jié)束語
計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,使企業(yè)運(yùn)作效率大大提高。同時(shí)也使現(xiàn)代企業(yè)對計(jì)算機(jī)系統(tǒng)的依賴性進(jìn)一步增加。如何保證核心應(yīng)用永不停止,關(guān)鍵數(shù)據(jù)不會(huì)丟失?越來越多的企業(yè)采用雙機(jī)熱備份或多機(jī)集群技術(shù)來解決這一問題,其中雙機(jī)熱備份技術(shù)以其技術(shù)成熟,成本相對較低,獲得了廣泛的應(yīng)用。
典型的雙機(jī)熱備份系統(tǒng)通過在兩臺(tái)服務(wù)器上運(yùn)行雙機(jī)熱備份軟件和共用RAID磁盤陣列來實(shí)現(xiàn)。這種方案在電信,金觸、證券、政府等部門和行業(yè)的成功應(yīng)用,業(yè)己證明其可靠性和成熟性。
參考文獻(xiàn)
[1] 黃鎧,許志偉.可擴(kuò)展并行計(jì)算技術(shù)、結(jié)構(gòu)與編程[M].北京:機(jī)械工業(yè)出版社,2011
[2] 胡季敏,苗乃旺.使用動(dòng)態(tài)負(fù)載均衡技術(shù)的LINUX高性能集群服務(wù)器研究[J].徽型電腦應(yīng)用,2010,17(4)