李 靜 董 倩
〔摘 要〕本文對數(shù)字圖書館的現(xiàn)行存儲技術(shù)進(jìn)行了簡單介紹,分析NAS網(wǎng)絡(luò)架構(gòu)的特點(diǎn)與技術(shù)優(yōu)勢,探討為現(xiàn)代數(shù)字圖書館建設(shè)提出適宜的網(wǎng)絡(luò)存儲技術(shù)架構(gòu)。
〔關(guān)鍵詞〕網(wǎng)絡(luò)存儲;存儲區(qū)域網(wǎng)絡(luò);NSA;數(shù)字圖書館
〔中圖分類號〕G250.76 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)09-0101-03
Research of SAN and NAS Storage Technology in the Digital LibraryLi Jing Dong Qian
(Library,Hebei University of Economics and Business,Shijiazhuang 050061,China)
〔Abstract〕This article introduced the present network storage technology in digital library,analyzed the characteristics of SAN and NAS network architecture and technology,attempted to put forward suitable schemas for network storage technology storage.
〔Key words〕network storage;storage area networks;NSA;digital library
數(shù)字圖書館是當(dāng)今探索知識資源社會共享和增值利用的重要模式,通過數(shù)字圖書館,我們可以很快地得到相應(yīng)有效用的信息。近幾年來,隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展和數(shù)字圖書館的全面建設(shè),高校圖書館的數(shù)據(jù)存儲量急劇膨脹,數(shù)字化資源呈幾何級數(shù)增長,同時各種全文文獻(xiàn)和多媒體信息使讀者的訪問量激增,這對圖書館存儲系統(tǒng)I/O請求以及系統(tǒng)的安全性和穩(wěn)定性都提出了更高的要求,因此采用先進(jìn)的存儲技術(shù)架構(gòu)合理的數(shù)據(jù)存儲平臺,實(shí)現(xiàn)數(shù)據(jù)的集中存儲、分析和共享是數(shù)字圖書館面臨的首要問題。
1 數(shù)字圖書館主要的網(wǎng)絡(luò)存儲技術(shù)
數(shù)字圖書館中的數(shù)字化信息增長迅速,數(shù)字信息存儲的容量需求越來越大,對存儲技術(shù)要求越來越高。數(shù)字圖書館存儲技術(shù)的發(fā)展經(jīng)歷了硬盤存儲、磁帶庫、光盤塔存儲、光盤庫存儲、磁盤陣列等,這些存儲技術(shù)都很難滿足大容量存儲的需求。此時海量信息存儲技術(shù)應(yīng)運(yùn)而生,如在DAS基礎(chǔ)上發(fā)展起來的SAN存儲與NAS存儲都是較為先進(jìn)的數(shù)據(jù)存儲方式,是新型數(shù)據(jù)存儲模式中的兩個主要發(fā)展方向。
1.1 SAN(Storage Area Network,存儲區(qū)域網(wǎng)絡(luò))
SAN是獨(dú)立于服務(wù)器網(wǎng)絡(luò)之外的高速存儲專用網(wǎng),以數(shù)據(jù)存儲為中心,采用高速的光纖通道作為傳輸媒體,利用高性能的光纖通道Fiber Channel加載SCSI協(xié)議來達(dá)到可靠的塊級數(shù)據(jù)傳輸,實(shí)現(xiàn)了真正高速共享存儲的目標(biāo)。其優(yōu)點(diǎn)是:引入存儲網(wǎng)絡(luò)的理念,實(shí)現(xiàn)了數(shù)據(jù)存儲的集中化;通過專用網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)存儲與備份,不占用原有網(wǎng)絡(luò)帶寬,有效地改善了網(wǎng)絡(luò)的傳輸性能;允許多臺服務(wù)器使用由SAN連接的磁盤存儲設(shè)備組成的存儲池,具有幾乎無限的擴(kuò)展能力;能方便地實(shí)現(xiàn)高性能的服務(wù)器集群、負(fù)載均衡、雙機(jī)熱備、異地容災(zāi)等應(yīng)用,極大地提高系統(tǒng)的性能和可靠性;光纖接口使得服務(wù)器和存儲系統(tǒng)實(shí)現(xiàn)物理上分離,體現(xiàn)了部署的極大靈活性。SAN適用于存儲量大的工作環(huán)境,需要巨額的投資成本,它曾經(jīng)被看成數(shù)字圖書館存儲系統(tǒng)一種比較理想的選擇。
在實(shí)際應(yīng)用中,SAN也存在一些不足:設(shè)備互操作性較差;操作系統(tǒng)仍停留在服務(wù)器端,用戶不能直接訪問SAN,造成SAN在異構(gòu)環(huán)境下無法實(shí)現(xiàn)文件共享,只能獨(dú)享數(shù)據(jù)存儲池;由于其復(fù)雜結(jié)構(gòu)導(dǎo)致器材昂貴,安裝與維護(hù)成本巨大。所有這些均阻礙了SAN技術(shù)的普及應(yīng)用與推廣。
1.2 NAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲)
NAS是一種專業(yè)的網(wǎng)絡(luò)文件存儲及文件備份設(shè)備,或稱為網(wǎng)絡(luò)直聯(lián)存儲設(shè)備、網(wǎng)絡(luò)磁盤陣列。一個NAS里面包括核心處理器,文件服務(wù)管理工具,一個或者多個的硬盤驅(qū)動器用于數(shù)據(jù)的存儲,它將存儲設(shè)備通過TCP/IP協(xié)議連接到現(xiàn)有的網(wǎng)絡(luò)上,提供數(shù)據(jù)和文件服務(wù);轉(zhuǎn)變了“以服務(wù)器為中心”的存儲方案為“以數(shù)據(jù)為中心”的智能網(wǎng)絡(luò)服務(wù)器方案。NAS存儲系統(tǒng)具有即插即用的網(wǎng)絡(luò)集成,無需進(jìn)行較多的配置就能將NAS安裝到網(wǎng)絡(luò);具有獨(dú)立的優(yōu)化存儲操作系統(tǒng),不用應(yīng)用服務(wù)器干預(yù),就能在網(wǎng)絡(luò)上存取數(shù)據(jù),這樣就減少了CPU的開銷,提高了網(wǎng)絡(luò)的整體性能;管理簡單,基于Web的GUI管理界面使NAS設(shè)備的管理一目了然;可擴(kuò)展性和可訪問性好;能夠在異構(gòu)的操作系統(tǒng)用戶間實(shí)現(xiàn)文件級共享;能夠利用現(xiàn)有的以太網(wǎng)設(shè)備,降低資金投入,目前已有許多中小型圖書館在數(shù)據(jù)擴(kuò)容時采用了NAS存儲技術(shù)。
NAS也有不盡如人意的地方:NAS是文件級的存儲,采用NFS、CIFS等網(wǎng)絡(luò)文件協(xié)議,而不是塊協(xié)議或數(shù)據(jù)庫協(xié)議,因此不支持需大量依賴于數(shù)據(jù)庫處理結(jié)果的應(yīng)用;NAS解決了服務(wù)器I/O帶寬的問題,但是它的數(shù)據(jù)讀寫占用網(wǎng)絡(luò)的帶寬,特別是對大量數(shù)據(jù)進(jìn)行備份的時候,容易導(dǎo)致網(wǎng)絡(luò)的堵塞;NAS很難與現(xiàn)有備份系統(tǒng)集成,因此NAS的備份與恢復(fù)實(shí)現(xiàn)相當(dāng)困難。
2 數(shù)字圖書館存儲集成的優(yōu)勢
SAN技術(shù)和NAS技術(shù)都是信息整合的手段,二者各有特點(diǎn),適合不同的市場需求。數(shù)字圖書館數(shù)據(jù)多樣性的特點(diǎn),將SAN與NAS技術(shù)相融合的存儲系統(tǒng)無疑是一個適用良好的網(wǎng)絡(luò)存儲系統(tǒng)。
2.1 SAN與NAS存儲優(yōu)勢互補(bǔ)
數(shù)字圖書館的需求主要體現(xiàn)在數(shù)據(jù)庫服務(wù)與文件服務(wù)等方面,針對于數(shù)據(jù)庫服務(wù),分析其特點(diǎn)是I/O請求非常頻繁,對響應(yīng)要求高,要求系統(tǒng)的可靠性非常高;文件服務(wù)中,其特點(diǎn)是存儲文件較大,I/O請求次數(shù)相對較少,該類服務(wù)要求存儲系統(tǒng)容量大、速度快、性能高、擴(kuò)展性強(qiáng)等,同時還需要該系統(tǒng)具備集中管理、異構(gòu)資源整合和再利用的特性。不同的數(shù)據(jù)類型適用于不同的存儲模式,SAN與NAS各有其擅長應(yīng)用的地方,SAN是一個以數(shù)據(jù)塊(Block)為存儲單位的存儲技術(shù),而NAS則是一個以文件(File)為級別的存儲方式。可以采用SAN運(yùn)行關(guān)鍵應(yīng)用,例如數(shù)據(jù)庫、備份等,以進(jìn)行數(shù)據(jù)的集中存取與管理;而NAS則支持若干客戶端之間的文件共享,所以圖書館可以使用NAS作為日常辦公中需要經(jīng)常交換小文件的地方,例如存儲網(wǎng)頁、E-mail文件等,利用二者的混合模式是非常好的選擇。
2.2 存儲與服務(wù)器的分離更便于管理
目前圖書館一般擁有多臺服務(wù)器,由于所有的服務(wù)器采購時間較早,其存儲系統(tǒng)都是直連的模式,這種分散的存儲對其管理必須通過其主機(jī)系統(tǒng),而SAN存儲網(wǎng)絡(luò)提供一個存儲系統(tǒng)、備份設(shè)備和服務(wù)器相互連接的架構(gòu),它們之間的數(shù)據(jù)不再在以太網(wǎng)絡(luò)上流通,從而大大提高了以太網(wǎng)絡(luò)的性能。正由于存儲設(shè)備與服務(wù)器完全分離,用戶獲得一個與服務(wù)器分開的存儲管理理念。現(xiàn)在可以對圖書館的數(shù)據(jù)和存儲進(jìn)行特殊和專業(yè)的管理,不用再像以前那樣把數(shù)據(jù)管理與服務(wù)器管理混為一談。復(fù)制、備份、恢復(fù)數(shù)據(jù)和安全的管理可以以中央的控制和管理手段進(jìn)行。把不同的存儲池以網(wǎng)絡(luò)方式連接,用戶可以以任何他們需要的方式訪問他們的數(shù)據(jù),并獲得更高的數(shù)據(jù)完整性。
2.3 增加了存儲系統(tǒng)的可用性
SAN的高可用性基于它對災(zāi)難恢復(fù)、在線備份能力及對冗余存儲系統(tǒng)和數(shù)據(jù)的時效切換能力。NAS應(yīng)用成熟的網(wǎng)絡(luò)結(jié)構(gòu),提供快速的文件存取時間和高可用性,數(shù)據(jù)復(fù)制(在存儲系統(tǒng)層面)等功能可以保護(hù)和提供穩(wěn)固的文件級存儲。一個融合SAN和NAS技術(shù)的存儲解決方案可全面提供一套以塊和文件1/0為基礎(chǔ)的高效率平衡方案,從而全面增強(qiáng)數(shù)據(jù)的可用性。應(yīng)用光纖通道的SAN和NAS相融合能提供對主機(jī)的多層面的存儲連接,高性能、高可用和容易維護(hù)等優(yōu)點(diǎn)全由一個網(wǎng)絡(luò)架構(gòu)提供。
2.4 SAN與NAS混合模式存儲具有較強(qiáng)的擴(kuò)展能力
海量的電子圖書資源和多媒體資源是數(shù)字圖書館存儲的主要內(nèi)容。而這些數(shù)據(jù)每年都在增長,所以必須擁有一套或多套大容量的存儲系統(tǒng)來滿足海量存儲的要求。以光纖為接口的存儲網(wǎng)絡(luò)SAN能提供一個高擴(kuò)展性、高性能的網(wǎng)絡(luò)存儲機(jī)構(gòu)。光纖交換機(jī)和光纖存儲陣列同時提供高性能(20OMbps)和更大的服務(wù)器擴(kuò)展空間。這是以SCSI為基礎(chǔ)的系統(tǒng)所缺乏的。網(wǎng)絡(luò)存儲NAS可以是已經(jīng)配置好的、完整的并可追加至數(shù)個至數(shù)十個TB的網(wǎng)絡(luò)存儲設(shè)備。由于NAS設(shè)備是基于目前的TCP/IP網(wǎng)絡(luò),遠(yuǎn)距離存儲設(shè)備完全可以實(shí)現(xiàn)。一套融合SAN和NAS的解決方案全面獲得應(yīng)用光纖通道的能力,從而讓圖書館的存儲系統(tǒng)獲得更好的擴(kuò)展性。
3 數(shù)字圖書館網(wǎng)絡(luò)存儲集成方案
NAS和SAN的融合是存儲的需要,是存儲技術(shù)發(fā)展的必然結(jié)果。它們的融合有這樣幾種典型方案:
3.1 NAS與SAN簡單互聯(lián),分別提供不同的服務(wù)
其實(shí)嚴(yán)格來說這種方案還談不上“融合”,只是兩種存儲方式并行使用。這兩種存儲還是使用各自的響應(yīng)數(shù)據(jù)請求的方式和各自的網(wǎng)絡(luò),沒有對原來的存儲架構(gòu)進(jìn)行革命性的改變,也沒有消除信息的重復(fù)性和孤立性,不是一種徹底的全新的解決方案。這種融合方式的拓?fù)鋱D如圖1。
3.2 SAN作為NAS的一部分
也就是通常的NAS頭方案。這實(shí)際上是將NAS中瘦服務(wù)器與它的實(shí)際存儲單元進(jìn)行分離,將NAS服務(wù)器中的RAID卡去掉,增加一個光纖通道卡,使它們通過FC交換機(jī)或集線器連接起來。并與其他在這個光纖網(wǎng)絡(luò)中的服務(wù)器一樣共享和訪問存儲資源。集成后的網(wǎng)絡(luò)既可利用普通的NAS服務(wù)器直接連接到存儲子系統(tǒng)提供文件級的服務(wù)。也可利用NAS引擎連接到SAN上來。提供數(shù)據(jù)庫應(yīng)用和牽涉到大量數(shù)據(jù)塊I/O的操作服務(wù),可獲得較高的數(shù)據(jù)效率。對于終端用戶而言,整個過程是透明的。在這個過程中NAS的作用就像是一個網(wǎng)關(guān)一樣,負(fù)責(zé)文件和塊數(shù)據(jù)之間的轉(zhuǎn)換工作。所以NAS頭也叫NAS網(wǎng)關(guān),這種方法也是為不同系統(tǒng)提供共享SAN存儲資源的一個銳化方法。這種融合方式的拓?fù)鋱D如圖2。
NAS頭系統(tǒng)雖然在一定程度上解決了NAS與SAN系統(tǒng)的存儲設(shè)備級的共享問題,但在文件級的共享問題上卻與傳統(tǒng)的NAS系統(tǒng)遇到了同樣的可擴(kuò)展性問題。當(dāng)一個文件系統(tǒng)負(fù)載很大時,NAS頭很可能成為系統(tǒng)的瓶頸。
3.3 統(tǒng)一存儲系統(tǒng)
而“統(tǒng)一存儲系統(tǒng)”方式和在SAN前加NAS頭正好相反,不是SAN到NAS的支持,而是NAS到SAN的支持,即在原有的NAS基礎(chǔ)上,增加對FCP協(xié)議的支持。由于NAS具有自己的操作系統(tǒng)和文件系統(tǒng),因此增加的FCP和原有的NFS、CIFS、HTTP一樣,僅是一個協(xié)議的支持。NAS設(shè)備同時安裝兩個接口卡,在局域網(wǎng)端安裝網(wǎng)絡(luò)適配器(NIC卡)提供傳統(tǒng)的NAS訪問服務(wù),而同時又安裝HBA卡連接到光纖交換機(jī),將它的存儲資源融合到SAN存儲池中,向它提供訪問服務(wù)。這樣,一方面NAS服務(wù)器可以像SAN中普通工作站一樣獲得對SAN中存儲資源高效的塊級數(shù)據(jù)訪問,另一方面,SAN中的工作站也可通過SAN交換機(jī),利用NAS系統(tǒng)的文件緩存,獲取較高的性能和較快的數(shù)據(jù)響應(yīng)時間。這種融合方式的網(wǎng)絡(luò)拓?fù)鋱D如圖3。
4 結(jié) 語
數(shù)字圖書館的建設(shè)應(yīng)該從系統(tǒng)的可擴(kuò)展性、可管理性、可用性等考慮,確保系統(tǒng)運(yùn)行的高可靠性,可以預(yù)見,這些數(shù)據(jù)存儲技術(shù)將在數(shù)字圖書館建設(shè)中發(fā)揮越來越重要的作用,最終將成為面向不同應(yīng)用層面、分級的各種存儲技術(shù)的相互融合與統(tǒng)一。隨著千兆以太網(wǎng)技術(shù)的成熟以及萬兆以太網(wǎng)應(yīng)用的不斷普及,網(wǎng)絡(luò)存儲必然以其性價比、通用性、無地理限制等優(yōu)勢飛速發(fā)展,SAN與NAS融合將共同開創(chuàng)網(wǎng)絡(luò)存儲的新局面。將自身協(xié)議和特點(diǎn)完全不同的SAN與NAS技術(shù)加以融合便于實(shí)現(xiàn)數(shù)據(jù)集中管理、集中備份、數(shù)據(jù)保護(hù)、數(shù)據(jù)高速共享等。因此,應(yīng)該將SAN與NAS兩種系統(tǒng)積極地融合在數(shù)字圖書館網(wǎng)絡(luò)存儲結(jié)構(gòu)中,發(fā)揮各自的優(yōu)勢,取長補(bǔ)短,減少重復(fù)建設(shè)和浪費(fèi),從而構(gòu)建自己安全、快速、成本更低的數(shù)字資源存儲網(wǎng)絡(luò)。
參考文獻(xiàn)
[1]康春榮,蘇武榮.數(shù)據(jù)安全項(xiàng)目案例存儲與備份SAN與NAS容錯與容災(zāi)[M].北京:科學(xué)出版社,2004.
[2]徐文賢.基于SAN/NAS的圖書館數(shù)據(jù)存儲方案[J].圖書館,2005,(1):74-76.
[3]張繼征,楊波,陸體軍,等.NAS與SAN的融合[J].計(jì)算機(jī)應(yīng)用研究,2005,(8):190-192,240.
[4]教育行業(yè)存儲解決方案[EB].http:∥www.it.com.cn/f/solution/057/18/145355.htm,2008-06-17.
[5]董曉莉,張建剛.虛擬存儲技術(shù)在未來數(shù)字圖書館中的應(yīng)用[J].現(xiàn)代圖書情報技術(shù),2006,(8):18.
[6]中華服務(wù)器網(wǎng).存儲新概念[EB/OL].http:∥www.ccw.com.cn/server/wlcc/htm2006/20060529-188587.htm,2007-02-15.
[7]趙文輝,徐俊,周加林,等.網(wǎng)絡(luò)存儲技術(shù)[M].北京:清華大學(xué)出版社,2005.3:129-130.
[8]施威.網(wǎng)絡(luò)存儲技術(shù)再度進(jìn)化[EB/OL].http:∥media.ccidnet.com/art/2647/20061024/930547-1.html,2007-02-15.