范玉林
摘 要作為一種經(jīng)過多年時間檢驗的的磁盤系統(tǒng)數(shù)據(jù)保護(hù)技術(shù)標(biāo)準(zhǔn),RAID技術(shù)自出現(xiàn)以來一直作為存儲系統(tǒng)的基礎(chǔ)性技術(shù),近些年來,隨著整個社會信息化水平不斷發(fā)展,數(shù)據(jù)趨勢呈爆發(fā)式增長,數(shù)據(jù)已經(jīng)取代計算成為信息系統(tǒng)的中心。這促使人們對數(shù)據(jù)越來重視。隨著數(shù)據(jù)中心不斷追求海量容量、性能、安全、可用、擴(kuò)展、管理等等,傳統(tǒng)RAID逐漸暴露出越來越多的問題。
【關(guān)鍵詞】醫(yī)療行業(yè) 數(shù)據(jù)儲存 RAID技術(shù)
1 前言
根據(jù)近年來醫(yī)院存儲系統(tǒng)的硬件故障問題統(tǒng)計發(fā)現(xiàn),存儲陣列中90%的硬件故障是磁盤故障,只有12%是完物理故障?,F(xiàn)業(yè)界常用的RAID5組,在磁盤發(fā)生邏輯故障后,會立即將該磁盤踢出RAID組,雖然可以通過校驗來進(jìn)行數(shù)據(jù)恢復(fù),但是在RAID重建期間,控制器的數(shù)據(jù)的處理能力嚴(yán)重下降,而且醫(yī)院需要為100%的故障磁盤買單,還需要承擔(dān)RIAD重建時同一RAID組中其他磁盤邏輯故障所造成的數(shù)據(jù)丟失風(fēng)險。
2 CRAID技術(shù)的應(yīng)用
CRAID技術(shù)的出現(xiàn),基于Cell數(shù)據(jù)塊的管理模式,解決了這一困擾。
Cell,稱之為“細(xì)胞”,是指數(shù)據(jù)單元,是陣列資源管理的基本單位。引入Cell的基本單位后,在RAID具體的實現(xiàn)上,首先用磁盤創(chuàng)建RAID組,然后把RAID組的有效的可用空間根據(jù)指定大?。J(rèn)1GB,可以調(diào)節(jié))劃分為多個Cell,在創(chuàng)建LUN時,系統(tǒng)自動使用空閑Cell,破除了LUN到RAID,RAID到Disk之間的綁定關(guān)系,使RAID組的最小處理單元由原來的磁盤改變?yōu)楦屿`活的Cell,完全實現(xiàn)了的存儲的虛擬化架構(gòu)。按照Cell健康狀態(tài),突破了傳統(tǒng)RAID組容忍故障磁盤數(shù)目的限制。例如,傳統(tǒng)的RAID組允許1塊磁盤故障,第2塊磁盤故障時,RAID組失效,數(shù)據(jù)不能使用。在CRAID組中,只要磁盤邏輯故障的區(qū)域不在同一個Cell內(nèi),CRAID中的數(shù)據(jù)仍然可以實現(xiàn)訪問,即CRAID組內(nèi)可實現(xiàn)多個磁盤發(fā)生邏輯錯誤(非同一Cell中),大大提高了存儲陣列對磁盤的冗余性以及業(yè)務(wù)的連續(xù)性。
CRAID采用磁盤層管理和資源層管理,兩層虛擬化的模式管理,每塊磁盤空間被劃分成小的Cell管理,在這些Cell的基礎(chǔ)上來創(chuàng)建RAID組,使得數(shù)據(jù)平均分布到存儲陣列的每一塊磁盤上,同時,以為Cell單元來進(jìn)行管理,有效提升了管理的效率。
每個磁盤被切分成固定大小的數(shù)據(jù)塊(Chunk,也叫CK),每個Chunk為如:64MB等大小。存儲系統(tǒng)將不同磁盤的Chunk(CK)按照RAID算法組成Chunk Group(DCG),如圖1所示。
DCG被劃分為固定大小的存儲單元Cell,每個Cell的大小為如:1GB等,Cell是構(gòu)成LUN的基本單位。一個存儲池基于指定的一個磁盤域創(chuàng)建,可以從該磁盤域上動態(tài)的分配Chunk(CK)資源,并按照每個存儲層的“RAID策略”組成DCG向應(yīng)用提供具有RAID保護(hù)的存儲資源。CRAID 技術(shù)原理圖如圖2。
CRAID的實現(xiàn)框架如圖3所示。
同時,針對同一個Cell中多塊磁盤發(fā)生故障的情況,采用基于物理隔離的方式進(jìn)行處理,將磁盤錯誤隔離在當(dāng)前Cell,其他Cell繼續(xù)使用,最小限度的降低錯誤的影響范圍。
而且,基于Cell的管理模式,在后續(xù)重建數(shù)據(jù)時也能極大的提升重建的效率,區(qū)別于傳統(tǒng)RAID組,直接將磁盤踢出RAID組后進(jìn)行重建,CRAID的快速重建只需要重建錯誤磁盤上有錯誤的Cell數(shù)據(jù),沒有錯誤的Cell數(shù)據(jù)直接使用復(fù)制的方式將Cell數(shù)據(jù)復(fù)制到熱備盤,這種方式可以大大降低RAID組重建過程對RAID組計算性能的影響。
傳統(tǒng)RAID組重建時,大量的性能和時間消耗在調(diào)用所有磁盤進(jìn)行異或校驗??焖僦亟ㄖ恍鑼AID組全部磁盤校驗方式轉(zhuǎn)換成了按Cell校驗+磁盤復(fù)制的方式,其校驗量只有傳統(tǒng)RIAD組重建全盤重建校驗量的幾百分一或千分之一,校驗時間大大減少,而磁盤復(fù)制可以利用磁盤本身的讀寫速度。以1TB的SATA磁盤為例,在15塊盤的RAID組中,傳統(tǒng)的全盤重建大約需要30小時時間,而快速重建最快6小時就可以重建完成。
CRAID還支持局部重建模式,適用于磁盤完好,但發(fā)生過人為誤插拔。這種模式可恢復(fù)5分鐘內(nèi)磁盤被拔出過程中未寫入磁盤的數(shù)據(jù),提高了RAID組可靠性。
3 結(jié)語
基于CRAID技術(shù)創(chuàng)建的RAID組和傳統(tǒng)RAID組相比較,繼承了傳統(tǒng)RAID組的優(yōu)點,改良了傳統(tǒng)RAID組的不足,實現(xiàn)了磁盤資源的按需分配,極大的提供了磁盤利用率,性能的負(fù)載分?jǐn)?,提高了磁盤的使用壽命;在數(shù)據(jù)安全方面,基于Cell塊的管理模式,安全可靠,提高了RAID組的安全想和容錯率,在后續(xù)數(shù)據(jù)恢復(fù),數(shù)據(jù)重建等方面也優(yōu)于傳統(tǒng)RAID組,減少了運維人員的工作量,也為醫(yī)院數(shù)據(jù)中心建設(shè)添加了一層保障。
作者單位
浙江省人民醫(yī)院信息中心 浙江省杭州市 310000