張國生
摘 要:從服務(wù)器數(shù)據(jù)備份、恢復(fù)著手,詳細(xì)介紹了服務(wù)器RAID-1常見故障及相關(guān)處理方式。
關(guān)鍵詞:服務(wù)器;數(shù)據(jù)備份;數(shù)據(jù)恢復(fù);軟件故障
中圖分類號:TP309.3 文獻(xiàn)標(biāo)識碼:A DOI:10.15913/j.cnki.kjycx.2015.12.079
1 RAID基本知識介紹
1.1 概述
RAID(Redundant Array of Inexpensive Disks),直譯為“獨(dú)立冗余磁盤陣列”,也簡稱為“磁盤陣列”,通俗的說,RAID就是通過將多個磁盤按照一定的形式和方案組織起來,通過這樣的形式能夠獲取比單個硬盤更高的速度、更好的穩(wěn)定性、更大的存儲能力的存儲解決方案,用戶不必關(guān)心磁盤陣列究竟由多少塊硬盤組成,使用中,整個陣列就如同一塊硬盤一樣。
1.2 RAID技術(shù)的優(yōu)越性
1.2.1 提供更大的存儲空間
使用RAID技術(shù),就可以把多塊硬盤組成一個更大的存儲空間供用戶使用。比如,利用RAID-0技術(shù)把5塊2 TB的硬盤組織起來,能夠提供10 TB的存儲空間。
1.2.2 提供更快的傳輸速度
著名的摩爾定律告訴我們,CPU的處理速度以幾何數(shù)量級迅猛增長,CUP的性能每隔18個月就會提高1倍,可見其速度增長之快。然而,硬盤作為計(jì)算機(jī)中最重要的存儲設(shè)備,在容量飛速增長的同時,速度卻提高緩慢,已經(jīng)成為計(jì)算機(jī)速度發(fā)展的瓶頸。如果采用RAID技術(shù),可以讓很多硬盤同時傳輸數(shù)據(jù),而這些硬盤在邏輯上又表現(xiàn)為一塊硬盤,所以使用RAID可以達(dá)到單個硬盤幾倍,甚至幾十倍的速率。
1.2.3 提供更高的安全性
RAID可以通過數(shù)據(jù)校驗(yàn)提供容錯功能,在很多RAID模式中都有較為完備的冗余措施,甚至是直接相互的鏡像備份,從而大大提高了RAID系統(tǒng)的容錯性,讓系統(tǒng)的穩(wěn)定性更好、安全性更高。
1.3 如何實(shí)現(xiàn)RAID
一般有兩種方法可以實(shí)現(xiàn)RAID,一種是使用RAID控制器組建RAID,稱為硬RAID;另外一種是直接用程序創(chuàng)建RAID,稱為軟RAID。
2 RAID-1技術(shù)詳解
RAID-1又被稱為磁盤鏡像,需要兩個物理盤共同構(gòu)建。使用磁盤鏡像(Disk Mirroring)技術(shù),方法是在工作磁盤(Working Disk)之外再加一額外的備份磁盤(Backup Disk),兩個磁盤所儲存的數(shù)據(jù)完全一樣,數(shù)據(jù)寫入工作磁盤的同時也寫入備份磁盤,也就是將一塊物理盤的內(nèi)容完全復(fù)制到另一塊物理盤上,所以兩塊物理盤所構(gòu)成的RAID-1陣列,其容量僅等于一塊硬盤的容量。
RAID-1是磁盤陣列中單位成本最高的,但提供了很高的數(shù)據(jù)安全性和可用性。當(dāng)一個物理盤失效時,系統(tǒng)可以自動切換到鏡像磁盤上讀寫,而不需要重組失效的數(shù)據(jù)。
3 服務(wù)器故障處理
服務(wù)器在使用過程中,經(jīng)常會遇到一些與RAID相關(guān)的常見故障,這也使得RAID-1在給我們帶來高冗余的同時,帶來了很多難以估計(jì)的數(shù)據(jù)風(fēng)險。
3.1 常見RAID故障及可恢復(fù)性分析
3.1.1 軟件故障
軟件故障主要有:①突然斷電造成RAID磁盤陣列卡信息丟失數(shù)據(jù)的恢復(fù);②重新配置RAID陣列信息所導(dǎo)致的數(shù)據(jù)丟失恢復(fù);③如果磁盤順序出錯,將會導(dǎo)致系統(tǒng)不能識別數(shù)據(jù);④誤刪除、誤格式化、誤分區(qū)、誤克隆、文件解密、命毒損壞等數(shù)據(jù)恢復(fù)工作。
3.1.2 硬件損壞
硬件損壞情況主要有以下幾種:①RAID一般都會有幾塊硬盤,其中某一塊硬盤出現(xiàn)損壞,數(shù)據(jù)將無法讀??;②RAID出現(xiàn)壞道,導(dǎo)致數(shù)據(jù)丟失,這種恢復(fù)成功率比較大;③如果硬盤同時出現(xiàn)2塊以上的損壞,恢復(fù)工作非常復(fù)雜,成功率也比較低。
其中,RAID-1邏輯盤丟失或不可訪問,導(dǎo)致RAID-1故障的原因主要有以下幾種:①RAID控制器出現(xiàn)物理故障。RAID控制器如果出現(xiàn)物理故障,將不能被計(jì)算機(jī)識別,也就無法完成對RAID-1中各個物理成員盤的控制。在這種情況下,通過RAID控制器虛擬出來的邏輯盤自然就不存在了。②RAID信息出錯。RAID信息出錯就是指該RAID-1的配置信息出現(xiàn)錯誤,導(dǎo)致RAID程序不能正確地組織管理RAID-1中的成員盤,從而導(dǎo)致RAID-1邏輯盤丟失或不能訪問。③RAID-1成員盤出現(xiàn)物理故障。RAID-1可以允許其中一塊成員盤離線,如果RAID-1中的某一塊成員盤出現(xiàn)物理故障,比如電路損壞、磁頭損壞、固件損壞、出現(xiàn)壞扇區(qū)等,該成員盤就不能正常使用,但剩下的一塊成員盤中的數(shù)據(jù)完好無損,RAID-1還不會崩潰。④人為誤操作。如果誤將RAID-1中的兩塊成員盤都拔出,或不小心刪除了RAID-1的配置信息等,都會造成RAID-1崩潰。
3.2 RAID-1數(shù)據(jù)恢復(fù)思路
RAID-1是所有RAID中最簡單的一種,RAID-1中兩塊硬盤互為鏡像,所有數(shù)據(jù)都是完全一樣的,如果是RAID控制器故障或RAID信息出錯導(dǎo)致RAID-1的數(shù)據(jù)無法訪問,只要將兩塊物理盤中的一塊從服務(wù)器上拆下來,作為單獨(dú)的硬盤接在一臺計(jì)算機(jī)上,就很容易恢復(fù)數(shù)據(jù)。
如果RAID-1中一塊硬盤出現(xiàn)故障,則不會影響服務(wù)器的運(yùn)行,只要把故障硬盤更換為一塊好的硬盤就可以了。如果沒有及時更換,導(dǎo)致第二塊硬盤也出現(xiàn)故障,這時,RAID-1就會失效,因?yàn)橄瘸霈F(xiàn)故障的硬盤中的數(shù)據(jù)已經(jīng)不完整,所以不能以第一塊硬盤為基準(zhǔn)進(jìn)行數(shù)據(jù)恢復(fù),而應(yīng)該用后出現(xiàn)故障的硬盤進(jìn)行數(shù)據(jù)恢復(fù),一般情況下,都能夠完全恢復(fù)出所有的數(shù)據(jù)。
3.3 RAID故障注意事項(xiàng)
RAID故障注意事項(xiàng)主要有:①數(shù)據(jù)丟失后,用戶千萬不要對硬盤進(jìn)行任何操作,而要將硬盤按順序卸下來,用鏡像軟件將每塊硬盤做成鏡像文件,也可以交給專業(yè)數(shù)據(jù)恢復(fù)中心進(jìn)行;②不要對RAID卡進(jìn)行Rebuild操作,否則會加大恢復(fù)數(shù)據(jù)的難度;③標(biāo)記好硬盤在RAID卡上面的順序;④一旦出現(xiàn)問題,可以撥打?qū)I(yè)數(shù)據(jù)恢復(fù)中心的咨詢電話找專業(yè)工程師,切忌盲目修復(fù)。
4 結(jié)束語
服務(wù)器的運(yùn)行方式、狀態(tài)、故障類型對備份與恢復(fù)有著決定性的影響。數(shù)據(jù)備份是保障服務(wù)器數(shù)據(jù)安全運(yùn)行的最后一道屏障,也是最至關(guān)重要的。