國家新聞出版廣電總局五七三臺 馮 莉
在互聯(lián)網(wǎng)、多媒體等信息技術(shù)取得快速發(fā)展的同時,各行各業(yè)都將產(chǎn)生大量的數(shù)據(jù)信息。而在存儲系統(tǒng)建設(shè)方面,無論是新系統(tǒng)建設(shè)還是舊系統(tǒng)改造,都應(yīng)加強高可靠性技術(shù)的運用,從而解決數(shù)據(jù)安全存儲問題。因此,還要加強對存儲高可用性的技術(shù)標(biāo)準(zhǔn)與實現(xiàn)方法的分析,以便更好的完成系統(tǒng)建設(shè)。
伴隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)存儲安全問題引起了人們的普遍關(guān)注。對于企業(yè)來講,數(shù)據(jù)為重要的資源,能否保證數(shù)據(jù)得到安全、可靠的存儲,將對企業(yè)的發(fā)展產(chǎn)生直接影響。對存儲系統(tǒng)展開可用性分析,則能反映出數(shù)據(jù)存儲的安全性和可靠性,從而結(jié)合數(shù)據(jù)存儲存在的問題加強數(shù)據(jù)安全保護。目前,對存儲系統(tǒng)可用性能夠產(chǎn)生影響的因素主要有兩種,一種為故障率,另一種則為修復(fù)周期。數(shù)據(jù)存儲系統(tǒng)構(gòu)建需要采用存儲設(shè)備實現(xiàn),主要包含硬盤和存儲控制器,平均無故障時間能夠達到百萬小時以上,年故障率平均為0.88%。然而就實際情況來看,受機房溫濕度、灰塵、靜電等環(huán)境因素的影響,同時受自身固有特性引起的元器件損壞等問題的影響,硬盤會出現(xiàn)損壞、老化等問題。此外,軟件設(shè)置和病毒入侵等問題的存在,也將引起硬盤數(shù)據(jù)結(jié)構(gòu)混亂,繼而導(dǎo)致設(shè)備產(chǎn)生無法識別的故障。為解決這一問題,存儲行業(yè)大多采用熱插拔技術(shù),在硬盤發(fā)生故障時可直接進行備份硬盤的預(yù)置或更換新硬盤,促使存儲系統(tǒng)重新建立數(shù)據(jù),整個過程無數(shù)據(jù)丟失問題。但是采用該種技術(shù),需要較長的時間恢復(fù)數(shù)據(jù),同時也將造成系統(tǒng)存儲性能下降,難以滿足存儲的高可用性技術(shù)要求。采用存儲控制器,可以將多個磁盤驅(qū)動器組織在一起,提供高效數(shù)據(jù)讀寫、傳輸和存儲等服務(wù)。但是這類存儲設(shè)備存在控制器故障這一安全隱患,一旦故障發(fā)生盡管不會造成數(shù)據(jù)丟失,卻將導(dǎo)致系統(tǒng)服務(wù)器難以進行數(shù)據(jù)的正常讀寫,因此同樣難以滿足存儲系統(tǒng)的高可用性要求。
結(jié)合存儲可用性問題,還要利用高可用性技術(shù)構(gòu)建存儲系統(tǒng),并對系統(tǒng)展開高可用性評價,以便使系統(tǒng)在實踐應(yīng)用中可以發(fā)揮更好的功效。目前,針對存儲系統(tǒng)進行高可用性評價可以采用較多的技術(shù)標(biāo)準(zhǔn),但是結(jié)合實踐經(jīng)驗來看,主要可以采用故障恢復(fù)技術(shù)標(biāo)準(zhǔn)和技術(shù)的適用性標(biāo)準(zhǔn)展開評價,從而保證系統(tǒng)的應(yīng)用效果。
采用故障恢復(fù)技術(shù)標(biāo)準(zhǔn)展開評價,需要利用RPO和RTO兩個參數(shù)作為系統(tǒng)的故障恢復(fù)評價指標(biāo)。所謂的RPO,即為Recovery Point Objective的英文縮寫,為故障發(fā)生時系統(tǒng)可接受的最大容忍數(shù)據(jù)丟失量。該指標(biāo)將受到系統(tǒng)采用的數(shù)據(jù)復(fù)制技術(shù)的影響,如采用同步數(shù)據(jù)復(fù)制技術(shù)能夠使該指標(biāo)達到秒級。而RTO為Recovery Time Objective的英文縮寫,為系統(tǒng)發(fā)生故障后從業(yè)務(wù)停止到恢復(fù)需要的時間[1]。該項指標(biāo)將受到系統(tǒng)采用的系統(tǒng)切換技術(shù)的影響,采用系統(tǒng)自動恢復(fù)技術(shù)能夠達到秒級。對于具有高可用性的存儲系統(tǒng)來講,還要盡量降低設(shè)備故障率,即便發(fā)生故障系統(tǒng)在數(shù)據(jù)恢復(fù)期間數(shù)據(jù)丟失也應(yīng)當(dāng)趨近零,并且業(yè)務(wù)中斷時間同樣趨近于零。
針對存儲系統(tǒng)展開高可用性評價,還要采用技術(shù)的適用性標(biāo)準(zhǔn),對存儲設(shè)備的讀寫性能、兼容性能、實施性能和管理性能展開評價。分析設(shè)備讀寫性能,要求采用高可用性技術(shù)構(gòu)建的存儲系統(tǒng)能夠保持良好的數(shù)據(jù)讀寫性能,數(shù)據(jù)吞吐量和讀寫次數(shù)保持原有水平。其次,構(gòu)建的存儲系統(tǒng)需要對不同型號和品牌的存儲設(shè)備進行兼容,并對各種操作系統(tǒng)進行兼容[2]。再者,存儲系統(tǒng)無需實現(xiàn)結(jié)構(gòu)的大幅度改造,實施改造不會造成長時間業(yè)務(wù)中斷。最后,存儲系統(tǒng)在技術(shù)升級和運維管理方面較為容易,有助于加強系統(tǒng)管理。
伴隨著數(shù)據(jù)信息的海量增長,企業(yè)大多采用海量存儲系統(tǒng)架構(gòu)進行存儲系統(tǒng)建設(shè),利用集群滿足海量數(shù)據(jù)信息存儲需求,實現(xiàn)數(shù)據(jù)備份管理。系統(tǒng)由數(shù)據(jù)服務(wù)器群、前后端高性能網(wǎng)絡(luò)和應(yīng)用服務(wù)器集群構(gòu)成,利用應(yīng)用服務(wù)器集群可以從數(shù)據(jù)服務(wù)器進行數(shù)據(jù)的讀取或向服務(wù)器寫入數(shù)據(jù),提供數(shù)據(jù)存儲、查詢等服務(wù);利用數(shù)據(jù)服務(wù)器群可以采用管理節(jié)點服務(wù)器實現(xiàn)元數(shù)據(jù)保存,如對象地址、控制信息等,并采用數(shù)據(jù)節(jié)點服務(wù)器實現(xiàn)與后端網(wǎng)絡(luò)的數(shù)據(jù)協(xié)同;利用前端高性能網(wǎng)絡(luò),則能進行數(shù)據(jù)存儲請求的發(fā)送,利用后端網(wǎng)絡(luò)可以實現(xiàn)數(shù)據(jù)節(jié)點間的數(shù)據(jù)同步,完成數(shù)據(jù)的監(jiān)測和通信。目前,海量存儲系統(tǒng)采用的傳統(tǒng)高可用性技術(shù)方案包含主從方式、對稱方式和多機互備方式。采用主從方式,即利用主服務(wù)器進行服務(wù)的提供,利用備服務(wù)器進行主服務(wù)器的監(jiān)測,并在主服務(wù)器斷電、故障等情況下進行服務(wù)的接管。采用對稱方式,即實現(xiàn)服務(wù)器兩兩相互監(jiān)測,一旦一臺故障,另一臺會實現(xiàn)工作接管。采用多機互備方式,存儲系統(tǒng)各服務(wù)器都要進行多種服務(wù)的提供,同時進行相互監(jiān)測,隨時準(zhǔn)備進行其他服務(wù)器的替代。
針對海量存儲系統(tǒng),采用單一某種高可用性技術(shù)方案難以滿足服務(wù)器存儲數(shù)據(jù)的安全需求,但是設(shè)置過多備用設(shè)備也將導(dǎo)致系統(tǒng)成本過高。結(jié)合系統(tǒng)服務(wù)器特征,還要采用相適應(yīng)的高可用性技術(shù)方案。具體來講,就是分別采用不同技術(shù)進行管理服務(wù)器和數(shù)據(jù)節(jié)點服務(wù)器的管理。針對管理服務(wù)器,由于其需要完成元數(shù)據(jù)的存儲,并為應(yīng)用服務(wù)器提供數(shù)據(jù)查找路徑和實現(xiàn)數(shù)據(jù)節(jié)點管理,采用一臺服務(wù)器難以保證系統(tǒng)安全性和可用性,因此還要采用主從方式進行服務(wù)器配置。而在主從服務(wù)器之間,需要利用后端網(wǎng)絡(luò)確保數(shù)據(jù)協(xié)同,繼而使備用服務(wù)器能夠順利接管主機。針對數(shù)據(jù)節(jié)點服務(wù)器,通常利用不同數(shù)據(jù)節(jié)點服務(wù)器進行多個數(shù)據(jù)副本的存儲,因此還要采用多機互備的方式提高服務(wù)器群的數(shù)據(jù)存儲安全,利用后端網(wǎng)絡(luò)保證服務(wù)器間數(shù)據(jù)同步。
結(jié)合系統(tǒng)高可用性技術(shù)方案,在具體進行方案實現(xiàn)時,需要利用GFS文件系統(tǒng)進行海量存儲系統(tǒng)的構(gòu)建,并利用開源軟件Heartbeat實現(xiàn)服務(wù)器間的通信,采用Pacemaker對服務(wù)器集群進行管理。在實際進行系統(tǒng)構(gòu)建時,主備用管理服務(wù)器的CPU為Intel quad core 2.13GHz,采用的操作系統(tǒng)為Federo,網(wǎng)卡為千兆網(wǎng)卡,內(nèi)存為2GB 133MHz。采用的文件系統(tǒng)為KFS 0.5,采用的使GFS架構(gòu)。采用GFS,其實就是利用開源分布式文件系統(tǒng)提供數(shù)據(jù)存儲密集型服務(wù),具有較高的數(shù)據(jù)讀寫效率和較高的可靠性,能夠?qū)崿F(xiàn)數(shù)據(jù)陣列的共享[3]。在該種架構(gòu)下,可以利用Client端對Master服務(wù)器和Chunk服務(wù)器進行訪問。利用Master服務(wù)器,則能對系統(tǒng)元數(shù)據(jù)進行維護,加強數(shù)據(jù)地址信息、控制信息和命名空間等內(nèi)容的管理。采用Chunk服務(wù)器,能夠進行對象數(shù)據(jù)存儲管理,利用后端網(wǎng)絡(luò)實現(xiàn)服務(wù)器間數(shù)據(jù)同步。針對管理服務(wù)器和數(shù)據(jù)節(jié)點服務(wù)器,還要采用Heartbeat3.0.4 stable Pacemaker 1.1高可用軟件。采用Heartbeat,可以利用其發(fā)送的心跳信號對其他服務(wù)器狀態(tài)進行檢測,并利用軟件提供的多播、組播和單播等方式進行信息發(fā)送或接收,完成服務(wù)器狀態(tài)查詢[4]。該軟件內(nèi)部包含集群協(xié)同模塊,可以對各服務(wù)器間平等協(xié)調(diào)通信進行保證。采用該軟件,也能對系列進程間的通信函數(shù)進行定義,并對伙伴進程實現(xiàn)無障礙訪問,同時也可以進行系統(tǒng)日志的記錄。采用Pacemaker,可以與Heartbeat配合,促使打開服務(wù)停止。利用該軟件,能夠為集群管理軟件的拓展提供支持,并結(jié)合管理軟件提供的監(jiān)測節(jié)點狀態(tài)將服務(wù)適時打開或關(guān)閉,對服務(wù)在集群上的位置進行調(diào)整,增強集群的可用性。此外,系統(tǒng)的應(yīng)用服務(wù)器采用的CPU同樣為為Intel quad core 2.13GHz,操作系統(tǒng)為Federo,網(wǎng)卡為千兆網(wǎng)卡,內(nèi)存為2GB 133MHz。
采用高可用性技術(shù)方案完成海量存儲系統(tǒng)構(gòu)建后,還要對存儲系統(tǒng)展開高可用性評價,確定技術(shù)方案的實施效果。具體來講,就是要利用應(yīng)用服務(wù)器每隔50ms進行數(shù)據(jù)請求的發(fā)送,管理服務(wù)器則需要實現(xiàn)請求接收,并利用數(shù)據(jù)服務(wù)器返回5k數(shù)據(jù)包。在RTO測試的過程中,需要對主管理服務(wù)器網(wǎng)絡(luò)、數(shù)據(jù)節(jié)點網(wǎng)絡(luò)進行分別中斷,然后對中斷前后應(yīng)用服務(wù)器接收數(shù)據(jù)的時間間隔進行測量,得到服務(wù)器恢復(fù)時間。在RPO測試中,需要利用同步鏡像方式進行系統(tǒng)檢查,確定數(shù)據(jù)丟失情況。此外,需對系統(tǒng)讀寫性能、兼容性等性能進行綜合分析,確定系統(tǒng)構(gòu)建效果。
從測試結(jié)果來看,重復(fù)30次對管理節(jié)點服務(wù)器網(wǎng)絡(luò)進行中斷,得到的服務(wù)恢復(fù)時間在4.8-5.6s之間;重復(fù)30次對數(shù)據(jù)節(jié)點服務(wù)器網(wǎng)絡(luò)進行中斷,得到的服務(wù)恢復(fù)時間在5.3-6.2s之間。由此可見,采用該種存儲系統(tǒng),服務(wù)器中斷恢復(fù)時間將在5-6s之間,而系統(tǒng)設(shè)定的服務(wù)器請求為50ms,因此從RTO測試結(jié)果來看,服務(wù)器發(fā)生中斷后,備用服務(wù)器會在5-6s內(nèi)完成主機自動接管,整個過程不需要人工干預(yù),提供的服務(wù)也未發(fā)生中斷。從RPO測試結(jié)果來看,系統(tǒng)未發(fā)生數(shù)據(jù)丟失問題,存儲可用性得到了有效提高。此外,系統(tǒng)每秒讀寫次數(shù)、吞吐速率等指標(biāo)均無明顯下降,因此可以認(rèn)為方案能夠滿足數(shù)據(jù)服務(wù)的可用性要求。
通過研究可以發(fā)現(xiàn),伴隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)、多媒體、醫(yī)藥等行業(yè)都需要完成海量數(shù)據(jù)信息的存儲,對數(shù)據(jù)存儲提出了較高的安全性要求。而采用高可用性技術(shù)進行海量存儲系統(tǒng)的構(gòu)建,能夠按照相應(yīng)的技術(shù)標(biāo)準(zhǔn)進行系統(tǒng)建設(shè)與實現(xiàn),并對系統(tǒng)的高可用性展開評價,從而為數(shù)據(jù)信息存儲提供更多的安全保障。因此相信在企業(yè)存儲系統(tǒng)架構(gòu)設(shè)計方面,高可用性技術(shù)標(biāo)準(zhǔn)和實現(xiàn)方法能夠獲得較好的應(yīng)用前景。
[1]趙偉.基于vSphere平臺的iSCSI存儲網(wǎng)絡(luò)高可用性方案的研究與實現(xiàn)[J].電腦知識與技術(shù),2015,11(6):47-48+50.
[2]羅常.基于K-V模式的高可用性分布式存儲技術(shù)研究[J].機電工程技術(shù),2014,43(4):137-140.
[3]李東輝,沈麗菁,方方等.分布式云存儲高可用框架研究[J].計算機與數(shù)字工程,2014,42(1):76-80+144.
[4]朱俊潔,梁阿磊,馬汝輝.海量存儲系統(tǒng)高可用性研究[J].計算機應(yīng)用與軟件,2012,29(7):81-82+86.