肖詩伯, 郭秀英
(1. 川北醫(yī)學(xué)院 圖書館, 南充 637000; 2. 西南石油大學(xué) 經(jīng)濟(jì)管理學(xué)院, 成都 610500)
隨著高校圖書館數(shù)字資源的存儲(chǔ)海量化、數(shù)據(jù)類型非結(jié)構(gòu)化、讀者訪問持續(xù)性、高并發(fā)性以及云計(jì)算與云存儲(chǔ)、大數(shù)據(jù)等新技術(shù)在高校圖書館中逐步應(yīng)用。這對(duì)數(shù)據(jù)存儲(chǔ)介質(zhì)的容量、容錯(cuò)能力、響應(yīng)速度、可靠性、擴(kuò)展性、管理和運(yùn)維手段等提出了越來越高的要求。傳統(tǒng)旋轉(zhuǎn)磁盤因讀寫效率低、功耗高、空間需求大、故障隨機(jī)等缺點(diǎn),逐漸無法滿足新時(shí)期下圖書館高性能的數(shù)據(jù)存儲(chǔ)需求,進(jìn)而影響到讀者的資源獲取速度,館員對(duì)讀者主動(dòng)服務(wù),館內(nèi)核心數(shù)據(jù)的管理。隨著閃存技術(shù)的成熟,采用高性能閃存介質(zhì)來存儲(chǔ)數(shù)據(jù),可大大提高圖書館服務(wù)質(zhì)量和數(shù)據(jù)安全性。
當(dāng)前,高校圖書館的存儲(chǔ)系統(tǒng),從業(yè)務(wù)應(yīng)用方面看主要部署于:(1)圖書館傳統(tǒng)業(yè)務(wù)管理:如圖書、文獻(xiàn)、古籍、資料等傳統(tǒng)資源的購借存閱數(shù)據(jù)的存儲(chǔ)和資產(chǎn)管理。這些數(shù)據(jù)屬于圖書館核心數(shù)據(jù),對(duì)存儲(chǔ)系統(tǒng)的容錯(cuò)能力、擴(kuò)展性有著特殊要求。(2)數(shù)字資源存儲(chǔ)與服務(wù):如自建數(shù)據(jù)庫、外購數(shù)據(jù)庫、web資源、音視頻、電子圖書圖片、隨書光盤等數(shù)字資源的存儲(chǔ)管理。這些業(yè)務(wù)屬于圖書館數(shù)字化服務(wù)范疇。它對(duì)存儲(chǔ)系統(tǒng)的響應(yīng)速度、可持續(xù)性、并發(fā)性、存儲(chǔ)容量等有較高的要求[1]。(3)各類服務(wù)設(shè)施的數(shù)據(jù)存儲(chǔ):如電子閱覽室、視頻監(jiān)控、自助存包機(jī)、借還機(jī)等設(shè)備的數(shù)據(jù)存儲(chǔ)和管理。這些業(yè)務(wù)屬于圖書館增值服務(wù)范圍。上述系統(tǒng)對(duì)存儲(chǔ)系統(tǒng)有不同的需求。隨著圖書館大數(shù)據(jù)分析的來臨,存儲(chǔ)系統(tǒng)需要儲(chǔ)存海量非結(jié)構(gòu)化數(shù)據(jù);支撐分布式計(jì)算;承載機(jī)器學(xué)習(xí)等智能算法的高時(shí)間復(fù)雜度、空間復(fù)雜度的計(jì)算壓力[2]。這對(duì)存儲(chǔ)系統(tǒng)在響應(yīng)速度、容錯(cuò)能力、擴(kuò)展性和傳輸能力方面提出了更高的要求。而目前幾乎均用磁盤作為存儲(chǔ)介質(zhì),難以適應(yīng)要求。
傳統(tǒng)磁盤,主要為普通SATA磁盤和高性能SAS磁盤兩種。但磁盤有局限性:低性能、低擴(kuò)展性。普通SATA磁盤轉(zhuǎn)速為7500,IOPS(每秒讀寫操作次數(shù))最高為75至140;而高性能SAS磁盤轉(zhuǎn)速為15000,IOPS最高也僅為175至210。要提高IOPS,縮短尋道時(shí)間,只能不斷增加磁盤數(shù)量,將數(shù)據(jù)分散存放,利用多個(gè)磁頭同時(shí)讀寫數(shù)據(jù)以提高吞吐量。另外,磁盤只能部分填充,導(dǎo)致空間利用率低;同時(shí)磁盤故障是隨機(jī)的、不可預(yù)測(cè)的,只能用Raid架構(gòu)來重復(fù)備份數(shù)據(jù)以保證安全。面對(duì)圖書館不斷增長的數(shù)字資源存儲(chǔ)規(guī)模及高讀寫速率需求,簡(jiǎn)單增加磁盤數(shù)量的方式因低性能、高空間占用、高功耗、高冷卻成本和資金成本而逐漸變得不切實(shí)際,選擇新存儲(chǔ)介質(zhì)以滿足苛刻的海量數(shù)據(jù)讀寫需求成為唯一出路。
在數(shù)字資源應(yīng)用場(chǎng)景中:數(shù)字資源具有種類多、容量大、流量高等特點(diǎn)。在教學(xué)研等環(huán)境下,面對(duì)高校師生數(shù)以萬計(jì)的高并發(fā)、長持續(xù)、高流量訪問文獻(xiàn)、多媒體等服務(wù)器,磁盤存儲(chǔ)系統(tǒng)的低吞吐量將使讀者處于長等待狀態(tài)中,增加教學(xué)研時(shí)間成本,降低讀者體驗(yàn)。在圖書館關(guān)鍵系統(tǒng)存儲(chǔ)場(chǎng)景中,管理員對(duì)數(shù)據(jù)庫的增刪改檢及備份等操作也會(huì)因磁盤的低吞吐量增加等待時(shí)間、降低工作效率、影響工作質(zhì)量。
閃存又稱固態(tài)硬盤,不含有機(jī)械活動(dòng)部件,通過對(duì)其內(nèi)部的微小浮閘晶體管進(jìn)行充放電實(shí)現(xiàn)1bit的“0”和“1”數(shù)據(jù)存儲(chǔ),高級(jí)的晶體管單元可注入高低不同的電壓進(jìn)行區(qū)別以實(shí)現(xiàn)2至3bit的數(shù)據(jù)存儲(chǔ),其中浮閘(Floating Gate)是基于電氣絕緣層獨(dú)立的,能保證存儲(chǔ)的電子長年不會(huì)逸散。不過晶體管經(jīng)過大量充放電后,其物理特性會(huì)出現(xiàn)老化而無法存儲(chǔ)電子,但是導(dǎo)致老化失效的充放電次數(shù)是在生產(chǎn)晶體管時(shí)就能測(cè)試出的。因此,后期科學(xué)合理的安排各晶體管充放電,避免集中對(duì)某區(qū)域晶體管反復(fù)充放電,實(shí)現(xiàn)對(duì)晶體管的漸進(jìn)式消耗,實(shí)現(xiàn)壽命最大化并保護(hù)數(shù)據(jù)安全。相比基于物理位移的旋轉(zhuǎn)磁盤,閃存體積更小,容量從100G至TB級(jí)均有,單張企業(yè)級(jí)閃存盤IOPS達(dá)7萬以上,讀寫速度達(dá)500MB/S以上,功耗10瓦以下,能適應(yīng)高溫及劇烈震動(dòng)。隨著閃存芯片技術(shù)不斷創(chuàng)新,容量不斷增加,價(jià)格持續(xù)降低,閃存介質(zhì)逐步進(jìn)入到服務(wù)器端、大規(guī)模計(jì)算的存儲(chǔ)領(lǐng)域中。傳統(tǒng)磁盤與閃存盤性能參數(shù)對(duì)比,如表1所示。
表1 磁盤與閃存盤性能參數(shù)對(duì)比
閃存在服務(wù)器端存儲(chǔ)中相比傳統(tǒng)磁盤具有4大性能優(yōu)勢(shì):(1) 隨機(jī)讀方面:與內(nèi)存類似,都以芯片存儲(chǔ)數(shù)據(jù)。同時(shí)讀取多個(gè)數(shù)據(jù)的指令時(shí),無論數(shù)據(jù)在芯片中存放的物理位置有多遠(yuǎn),都能夠以相同的速度提供[3]。同時(shí),閃存是讀取指定數(shù)據(jù)所在整塊的內(nèi)容,當(dāng)?shù)诙巫x取數(shù)據(jù)的存放位置與第一次數(shù)據(jù)的存放位置都在同一個(gè)塊中時(shí),第二次可直接從緩存或內(nèi)存中使用數(shù)據(jù)。(2) 吞吐量方面:目前閃存系統(tǒng)IOPS高達(dá)數(shù)萬,比磁盤高兩個(gè)數(shù)量級(jí)以上。隨著閃存芯片密度增加,吞吐量還有很大增長空間。(3) 延時(shí)方面:閃存設(shè)備的讀取延時(shí)在50至100微秒之間,比磁盤快100倍。(4) 并行方面:閃存驅(qū)動(dòng)器可以提供多個(gè)控制器或者單個(gè)高性能控制器。能夠滿足采用多線程及內(nèi)核的數(shù)據(jù)庫方案[4]。
首先分析高校圖書館各類數(shù)字化服務(wù)對(duì)存儲(chǔ)設(shè)備的不同讀寫壓力。可用五年間每日隨機(jī)填充指標(biāo)(RFPD, Random Fill Per Day)來評(píng)價(jià)存儲(chǔ)需求,以選擇不同的閃存配置方案。在圖書館中的讀密集和讀寫混合的模式中,閃存能實(shí)現(xiàn)更快資源索引和傳遞,在訪問高并發(fā)中實(shí)現(xiàn)高速響應(yīng),解決讀者等待。在寫密集模式中,閃存的高IOPS可為核心業(yè)務(wù)數(shù)據(jù)庫提供高速修改、備份和災(zāi)難恢復(fù)速度。
對(duì)于閃存和服務(wù)器硬件的組合配置來看,主要有3種方案:一是將閃存安裝在服務(wù)器PCIe總線上[5];二是將閃存與磁盤組成混合存儲(chǔ)后連接服務(wù)器硬件;三是組建全閃存陣列連接服務(wù)器硬件。這3種方案各有特點(diǎn)、各有適合的圖書館應(yīng)用場(chǎng)景。
該方案是將帶有PCIe接口的閃存直接連接在服務(wù)器主板的PCIe槽上[6],單臺(tái)服務(wù)器可安裝1張或多張PCIe卡。這是離CPU和應(yīng)用程序最近的距離。在這個(gè)路徑中,沒有適配卡、網(wǎng)絡(luò)纜線、存儲(chǔ)控制器和交換機(jī)等。短距離可加速讀寫,減少延時(shí),擴(kuò)大訪問帶寬等所有I/O操作。該模式會(huì)消耗少量服務(wù)器硬件資源。
中小數(shù)據(jù)存儲(chǔ)對(duì)PCIe閃存的選擇:在圖書館數(shù)據(jù)庫應(yīng)用場(chǎng)景中,針對(duì)中小數(shù)據(jù)規(guī)模的事務(wù)處理單臺(tái)服務(wù)器,如圖書館核心業(yè)務(wù)服務(wù)器、中小型數(shù)據(jù)庫資源服務(wù)器,應(yīng)用PCIe閃存存儲(chǔ)數(shù)據(jù),其性能會(huì)明顯優(yōu)于連接DAS等方案[7]。因?yàn)椋阂环矫鍼CIe閃存省去了光纖通道,通過板卡內(nèi)置高效傳輸通道直接實(shí)現(xiàn)與CPU之間的高性能數(shù)據(jù)傳輸;另一方面,在執(zhí)行應(yīng)用負(fù)載并存儲(chǔ)數(shù)據(jù)業(yè)務(wù)上,PCIe閃存性能更高、延遲和協(xié)議成本更低。
大規(guī)模存儲(chǔ)對(duì)PCIe閃存的選擇:在圖書館存儲(chǔ)中心應(yīng)用場(chǎng)景中,雖然數(shù)據(jù)是通過陣列用SAN或NAS模式連接服務(wù)器,PCIe閃存無法提供海量存儲(chǔ)空間;但PCIe閃存在服務(wù)器端可作系統(tǒng)高速緩存??砂鸦赑CIe閃存的高速緩存看作內(nèi)存的延伸,縮短應(yīng)用到共享存儲(chǔ)的延時(shí),使數(shù)據(jù)傳輸與處理更加直接、高效。其性能可獲得幾倍提升,還能節(jié)省額外的光纖及以太網(wǎng)資源。若將目錄和熱文件“固定”到高速緩存,則可有效加速數(shù)據(jù)庫。
電子閱覽室存儲(chǔ)對(duì)PCIe閃存的選擇圖書館電子閱覽室虛擬桌面VDI應(yīng)用場(chǎng)景中,對(duì)于單臺(tái)服務(wù)器可用1或2張PCIe閃存作為服務(wù)器高速緩存,配合SSD閃存盤作硬盤,IOPS能達(dá)30萬以上,可大大提高吞吐量,更快的承載客戶端應(yīng)用。
PCIe閃存部署成本:目前PCIe閃存多采用MLC架構(gòu),單張卡的容量在400G至3.2T之間,成本約1至7美元/GB。
該方案是閃存+SATA磁盤的組合存儲(chǔ)模式,兩者通過閃存虛擬加速設(shè)備連接服務(wù)器及相互通信。在自動(dòng)層級(jí)技術(shù)下先由緩存或NAND分層軟件層處理讀寫請(qǐng)求,再分配到閃存或磁盤中作業(yè)。在這種方案中根據(jù)閃存與磁盤的不同特性進(jìn)行分工,閃存不單作為附加的存儲(chǔ)空間,而是I/O鏈路中高性能組成部分。
圖書館對(duì)混合存儲(chǔ)的選擇方案:圖書館各類中大型存儲(chǔ)場(chǎng)景均可部署混合存儲(chǔ)系統(tǒng)。關(guān)鍵是分析圖書館客觀條件、讀者訪問特性、數(shù)據(jù)讀寫頻率等特點(diǎn),分開存放相關(guān)數(shù)據(jù)到閃存或磁盤,應(yīng)用方案有:(1) 以高讀者訪問速度為側(cè)重的方案:可將閃存作為磁盤緩存,以補(bǔ)償磁盤緩慢的讀取速度。通過算法動(dòng)態(tài)分析和自動(dòng)處理[8-9],先將所有寫操作都寫進(jìn)磁盤中,再分析數(shù)據(jù)的讀取頻率,將磁盤中的熱門數(shù)據(jù)轉(zhuǎn)移到閃存上,并實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)熱度,及時(shí)置換閃存中熱度下降的數(shù)據(jù)。(2) 以硬盤壽命為側(cè)重的方案:可在閃存中存儲(chǔ)讀操作頻繁、寫操作少的數(shù)據(jù)[10]。在磁盤中存放寫操作頻繁、讀操作較少的數(shù)據(jù)。若存放文獻(xiàn)、多媒體等讀密集型數(shù)據(jù),在保證閃存壽命的同時(shí),也能提供高訪問速度。(3) 以低成本為側(cè)重的方案:可在閃存中存放小文件數(shù)據(jù),在磁盤中存放大文件數(shù)據(jù)。這種方案利用當(dāng)前單位GB下,磁盤價(jià)格相對(duì)低廉的特性,能最大降低存儲(chǔ)系統(tǒng)整體成本。不管采取哪種配置,對(duì)運(yùn)行在混合存儲(chǔ)系統(tǒng)上的操作系統(tǒng)和應(yīng)用程序,一定要考慮到傳統(tǒng)磁盤與閃存的性能差異:在存儲(chǔ)延遲過程中,在存儲(chǔ)設(shè)備、軟件、CPU之間達(dá)到整體一致性。
混合存儲(chǔ)部署成本:目前閃存和SAS磁盤價(jià)格較接近,SATA磁盤價(jià)格較低,采取混合存儲(chǔ)方案的成本僅會(huì)略高于磁盤陣列,而性能有幾倍的提升。以2016年第1、2季度的價(jià)格參考[11]:混合存儲(chǔ)前期成本在1.6至24美元/GB。運(yùn)用重復(fù)數(shù)據(jù)刪除和數(shù)據(jù)壓縮等技術(shù)優(yōu)化后,能降至0.6至8美元/GB。而傳統(tǒng)全磁盤陣列系統(tǒng),成本在0.5至15美元/GB。
全閃存陣列(AFA)是采用閃存介質(zhì)而無磁盤構(gòu)成的獨(dú)立存儲(chǔ)陣列,多個(gè)閃存盤通過控制器連接服務(wù)器。作為對(duì)磁盤陣列的替代,AFA同樣能運(yùn)行在DAS、NAS和SAN模式中。圖書館各類規(guī)模的數(shù)據(jù)存儲(chǔ)均可運(yùn)用全閃存陣列。
核心業(yè)務(wù)數(shù)據(jù)庫對(duì)全閃存陣列的選擇:在圖書館核心業(yè)務(wù)數(shù)據(jù)庫運(yùn)用場(chǎng)景中,AFA不僅能提供大容量存儲(chǔ)空間,又能提供高IOPS來滿足數(shù)據(jù)庫管理需求,如批量檢索、修改和維護(hù);還能對(duì)數(shù)據(jù)進(jìn)行卷管理、快照和復(fù)制等功能。在SAN下運(yùn)用全閃存陣列時(shí),可單獨(dú)將索引存儲(chǔ)在RAM中,數(shù)據(jù)存儲(chǔ)在閃存中[12]。先通過RAM快速查找索引,然后通過多個(gè)閃存盤并行檢索數(shù)據(jù);同時(shí)在RAM中更新索引[13],可減少對(duì)閃存擦寫次數(shù)。配置全閃存陣列的數(shù)據(jù)庫備份時(shí)間為磁盤陣列的1/6。讓圖書館工作人員更高效的完成核心數(shù)據(jù)的管理和運(yùn)維工作資源發(fā)布類數(shù)據(jù)庫對(duì)全閃存陣列的選擇:對(duì)圖書館資源發(fā)布類數(shù)據(jù)庫而言,面對(duì)師生高并發(fā)和持續(xù)訪問及后臺(tái)管理作業(yè),AFA的高IOPS能充分滿足服務(wù)器的I/O需求,以減少讀者的時(shí)間成本。非結(jié)構(gòu)化數(shù)據(jù)是資源發(fā)布類數(shù)據(jù)庫的特色,可用閃存控制器來處理,以取代傳統(tǒng)磁盤在數(shù)據(jù)庫引擎層面的工作,閃存控制器不僅效率更高,還減少了服務(wù)器硬件壓力。通過對(duì)各文件標(biāo)記、壓縮等處理后,再存入閃存盤,這樣不僅能節(jié)省空間容量,提高傳輸速度,還能降低閃存擦寫頻率。
電子閱覽室存儲(chǔ)對(duì)全閃存陣列的選擇:在圖書館電子閱覽室虛擬桌面VDI應(yīng)用場(chǎng)景中,因不需TB級(jí)的大容量存儲(chǔ),可運(yùn)用數(shù)個(gè)小容量閃存盤組建陣列,以高IOPS滿足客戶端需求?;谌W存陣列的服務(wù)器能輕松應(yīng)對(duì)數(shù)臺(tái)桌面同時(shí)創(chuàng)建時(shí)引起的“啟動(dòng)風(fēng)暴”,以高開機(jī)速度和運(yùn)行速度服務(wù)于讀者,而這對(duì)磁盤介質(zhì)來說很難實(shí)現(xiàn)。
全閃存陣列部署成本:從最近趨勢(shì)看,全閃存陣列前期成本在3至15美元/GB。運(yùn)用重復(fù)數(shù)據(jù)刪除、自動(dòng)精簡(jiǎn)配置、數(shù)據(jù)壓縮等已成熟的存儲(chǔ)效率相關(guān)技術(shù)壓縮優(yōu)化后,能降至1至8美元/GB。再結(jié)合單位美元/IOPS、單位GB/IOPS、功耗和制冷能耗綜合衡量成本。最終年均每GB平均成本將有很大性價(jià)比。
隨著大數(shù)據(jù)分析、云計(jì)算在高校圖書館逐步應(yīng)用,這些系統(tǒng)多采用Hadoop等分布式系統(tǒng),運(yùn)行在Linux上;數(shù)據(jù)庫多采用Hbas、Cassandra等。圖書館在構(gòu)建分布式集群時(shí),單機(jī)可將PCIe閃存與低頻CPU匹配。運(yùn)用軟件層面的閃存轉(zhuǎn)化層管理各PCIe閃存中的數(shù)據(jù),采用遠(yuǎn)程過程調(diào)用方式實(shí)現(xiàn)分布式數(shù)據(jù)通信。這取得均衡性能的同時(shí),有效降低整體系統(tǒng)能耗。在分布式系統(tǒng)硬件層和軟件層中設(shè)計(jì)并實(shí)施適合閃存讀寫調(diào)度、協(xié)議轉(zhuǎn)換等的處理模式(不同于現(xiàn)行廣泛使用的基于傳統(tǒng)磁盤模式的I/O等待式處理流),以降低訪問延遲,提高帶寬,滿足圖書館大規(guī)模數(shù)據(jù)分析。
根據(jù)圖書館數(shù)據(jù)存儲(chǔ)特色,為提高多個(gè)同時(shí)運(yùn)行的閃存盤整體壽命,可從以下兩方面設(shè)計(jì):
壽命方面:相比磁盤故障的隨機(jī)、無法預(yù)知性,閃存壽命是可監(jiān)控和干預(yù)的。閃存內(nèi)部由無數(shù)微小芯片單元(硅氧化物與浮置柵極)組成,對(duì)其充放電來實(shí)現(xiàn)數(shù)據(jù)寫入或擦除。多次充放電后,通過的電荷將致其氧化而使芯片單元失靈。目前1個(gè)芯片單元的擦寫壽命為1萬次(MLC方案)或10萬次(SLC方案)[14]。圖書館可兼用全局磨損均衡與反磨損均衡[15-16]兩種技術(shù)。在多個(gè)閃存盤同時(shí)運(yùn)行的前期運(yùn)用全局磨損均衡方案,使各閃存盤磨損進(jìn)度均衡。進(jìn)入中期后采用反磨損均衡方案,使各閃存盤出現(xiàn)漸進(jìn)式差異磨損,讓閃存在壽命后期有計(jì)劃的逐個(gè)磨損逐個(gè)更換,避免同時(shí)壞掉多個(gè)閃存盤而導(dǎo)致數(shù)據(jù)丟失,以保證閃存系統(tǒng)整體穩(wěn)定性、可靠性和數(shù)據(jù)的安全性。
備份方面:全閃存陣列無需采取Raid模式,而利用適合閃存高性能的專用數(shù)據(jù)保護(hù)算法,將存儲(chǔ)空間分為業(yè)務(wù)數(shù)據(jù)區(qū)和備份區(qū)。采用指紋、鏡像壓縮等手段快速壓縮業(yè)務(wù)數(shù)據(jù)來形成備份,其空間需求僅為業(yè)務(wù)數(shù)據(jù)的5%。這種備份方案一方面能最大增加閃存盤空間利用率;另一方面因其體積小可快速恢復(fù),能充分應(yīng)對(duì)意外閃存故障。
根據(jù)圖書館中小型單機(jī)數(shù)據(jù)庫業(yè)務(wù)場(chǎng)景,以圖書館關(guān)鍵業(yè)務(wù)服務(wù)器為例,設(shè)計(jì)一個(gè)數(shù)據(jù)處理模型:將1個(gè)70G的關(guān)系型數(shù)據(jù)庫連續(xù)16次復(fù)制、壓縮和刪除。采用單張PCIe閃存卡與單塊1.5K高性能SAS磁盤對(duì)比測(cè)試,測(cè)試中服務(wù)器硬件配置相同。通過CPU監(jiān)控軟件觀察作業(yè)效率,測(cè)試結(jié)果,如圖1所示。
圖1 基于閃存與磁盤的CPU作業(yè)效率對(duì)比圖
實(shí)驗(yàn)中基于磁盤的CPU其60%時(shí)間在等待讀寫,而基于閃存的CPU讀寫等待時(shí)間僅為15%。PCIe閃存的IOPS為20萬,數(shù)據(jù)庫復(fù)制時(shí)間從磁盤的10分鐘縮至2分鐘??梢娺\(yùn)用PCIe閃存能降低CPU等待時(shí)間,提高利用率,讓硬件承載更多的計(jì)算任務(wù),進(jìn)而減少服務(wù)器總體數(shù)量及購買軟件許可費(fèi)用。
根據(jù)圖書館大規(guī)模數(shù)據(jù)存儲(chǔ)場(chǎng)景,以圖書館多媒體資源數(shù)據(jù)庫為例,設(shè)計(jì)一個(gè)數(shù)據(jù)處理模型:空間需求30T、4萬IOPS的存儲(chǔ)負(fù)載。分別設(shè)計(jì)1套高性能SAS磁盤陣列和1套全閃存陣列(AFA)進(jìn)行對(duì)比測(cè)試,結(jié)果如表2所示。
可見:(1) 性能方面:全閃存陣列IOPS成倍增長,服務(wù)器具有更大的吞吐量,可大幅提高檢索下載、讀者瀏覽、多媒體和業(yè)務(wù)管理等各類數(shù)字服務(wù)的速度,提升讀者體驗(yàn)。(2) 運(yùn)維和管理方面:全閃存陣列機(jī)柜的空間占用僅6個(gè)U,相對(duì)磁盤陣列空間節(jié)省76%,大幅度降低了數(shù)據(jù)中心的空間需求,可節(jié)省不動(dòng)產(chǎn)成本。(3) 功耗方面:在滿負(fù)荷情況下全閃存陣列僅為220瓦,相比磁盤陣列可節(jié)省94.5%的電力供應(yīng),若在待機(jī)狀態(tài)下功耗更可降至20瓦內(nèi)。在此功耗下全閃存陣列整體的制冷電力需求也將大幅度降低,可減少長期運(yùn)行成本,在節(jié)能減排方面作出巨大貢獻(xiàn)。
表2 全閃存陣列與磁盤陣列配置對(duì)比數(shù)據(jù)
根據(jù)圖書館中等規(guī)模電子閱覽室VDI的應(yīng)用場(chǎng)景,設(shè)計(jì)同時(shí)啟動(dòng)100臺(tái)Win7桌面的承載模型。閃存陣列采用20張120GB固態(tài)硬盤,能提供60萬IOPS。通過VmwareView軟件評(píng)估:當(dāng)新創(chuàng)建1個(gè)Win7虛擬桌面時(shí)IOPS峰值為4K,通過桌面克隆100臺(tái)虛擬桌面全部啟動(dòng)時(shí)間為11分鐘,最快桌面啟動(dòng)時(shí)間可為5秒。
閃存存儲(chǔ)系統(tǒng)是近幾年新興的存儲(chǔ)模式,其成本和可靠性已獲得認(rèn)可。鑒于高校圖書館應(yīng)用閃存的案例很少,因此本文根據(jù)高校圖書館各類數(shù)字化服務(wù)和管理中對(duì)存儲(chǔ)設(shè)備的高并發(fā)、高持續(xù)需求。分析了主流閃存系統(tǒng)如何結(jié)合高校圖書館不同應(yīng)用需求來部署,以助圖書館在部署閃存系統(tǒng)時(shí)的選型。需要注意的是單一類型的閃存系統(tǒng)無法滿足所有需求場(chǎng)景,部署時(shí)要考慮存儲(chǔ)場(chǎng)景特點(diǎn)與閃存系統(tǒng)軟硬件的優(yōu)化,以及服務(wù)器層面的文件作業(yè)模式優(yōu)化,最終實(shí)現(xiàn)數(shù)據(jù)與CPU之間的高速交互,充分發(fā)揮閃存特性。閃存對(duì)已部署的傳統(tǒng)存儲(chǔ)系統(tǒng)并不具有破壞性,可采取切換或并行的運(yùn)行方式。高校圖書館通過部署閃存系統(tǒng)能大大提高服務(wù)敏捷性,減少讀者與管理人員的等待,提高教學(xué)研效率。隨著圖書館對(duì)存儲(chǔ)的性能需求不斷提高,閃存技術(shù)的不斷發(fā)展,閃存存儲(chǔ)系統(tǒng)定能為高校圖書館數(shù)字化建設(shè)擔(dān)負(fù)堅(jiān)強(qiáng)的支撐和切實(shí)的保障。