康建國(guó)
(江蘇省農(nóng)村信用社聯(lián)合社 江蘇 南京 210019)
存儲(chǔ)設(shè)備作為數(shù)據(jù)中心內(nèi)最關(guān)鍵的硬件資源,其重要性不言而喻。隨著數(shù)據(jù)中心發(fā)展規(guī)模的不斷壯大,存儲(chǔ)設(shè)備需要升級(jí)擴(kuò)容、更新?lián)Q代時(shí),我們?nèi)绾伍_(kāi)展存儲(chǔ)選型工作呢?
在開(kāi)展存儲(chǔ)選型工作之前,對(duì)自身存儲(chǔ)使用的需求進(jìn)行充分剖析,為接下來(lái)制定指標(biāo)體系做準(zhǔn)備。存儲(chǔ)采購(gòu)時(shí)需要考慮的需求基本上包含在以下各個(gè)方面。
對(duì)各行各業(yè)的數(shù)據(jù)中心而言,數(shù)據(jù)存儲(chǔ)動(dòng)一發(fā)而牽全身,存儲(chǔ)架構(gòu)的穩(wěn)定性和可靠性是數(shù)據(jù)中心存儲(chǔ)選型最基本也是最重要的需求。穩(wěn)定性和可靠性體現(xiàn)在幾個(gè)方面,一是存儲(chǔ)架構(gòu)冗余度高,各個(gè)部件均為冗余設(shè)計(jì)、支持熱插拔。二是存儲(chǔ)設(shè)備的可維護(hù)性高,各個(gè)部件的維修和更換均為在線(xiàn)操作,能在線(xiàn)升級(jí)微碼,輪流重啟時(shí)不影響到上層業(yè)務(wù)。
選擇集中式存儲(chǔ)還是分布式存儲(chǔ)是當(dāng)下做存儲(chǔ)選型時(shí)的一大熱門(mén)話(huà)題。集中式架構(gòu)的存儲(chǔ)采用的塊機(jī)制,以塊為單位實(shí)現(xiàn)數(shù)據(jù)的更新和鎖機(jī)制,其機(jī)制跟數(shù)據(jù)庫(kù)管理數(shù)據(jù)文件的方式可以說(shuō)是比較協(xié)同一致,性能及安全也就自然可以保障。分布式架構(gòu)現(xiàn)在常見(jiàn)的有兩種做法,一種是基于對(duì)象存儲(chǔ)機(jī)制實(shí)現(xiàn)的分布式架構(gòu),一種是基于分布式文件系統(tǒng)實(shí)現(xiàn)的分布式架構(gòu)。對(duì)于這兩種架構(gòu)的選擇,需要結(jié)合上層應(yīng)用配套考慮。
對(duì)于高IO同時(shí)對(duì)時(shí)延敏感的核心或者其他重要系統(tǒng),高吞吐低時(shí)延的集中式高端存儲(chǔ)更為合適,安全性和穩(wěn)定性也經(jīng)過(guò)多年磨練。
對(duì)數(shù)據(jù)中心而言,存儲(chǔ)建設(shè)事關(guān)重大,一旦建設(shè)完成,需要保證至少 5 年內(nèi)上層應(yīng)用不出現(xiàn)存儲(chǔ)層的性能瓶頸,隨著閃存技術(shù)的快速發(fā)展,目前全閃存存儲(chǔ)已經(jīng)成為各家主流存儲(chǔ)廠(chǎng)商的標(biāo)準(zhǔn)配置,同時(shí)結(jié)合控制器和硬盤(pán)框的NVMe技術(shù)應(yīng)用,IOPS已經(jīng)從傳統(tǒng)機(jī)械硬盤(pán)存儲(chǔ)的幾萬(wàn)十幾萬(wàn)上升到幾百萬(wàn)級(jí)別,性能得到極大提升,因此在如今年形勢(shì)之下全閃存儲(chǔ)已成為首選。
存儲(chǔ)設(shè)備必須具有靈活的體系架構(gòu),隨著容量需求的增加可以按需進(jìn)行在線(xiàn)擴(kuò)容,包括存儲(chǔ)柜內(nèi)的縱向擴(kuò)容和多柜的橫向擴(kuò)展,擴(kuò)展之后實(shí)現(xiàn)存儲(chǔ)資源的在線(xiàn)自動(dòng)平衡。
存儲(chǔ)架構(gòu)的容災(zāi)能力指的是本身高可用性之外對(duì)于各個(gè)災(zāi)備特性的支持,包括存儲(chǔ)層雙活以及兩地三中心架構(gòu)的支持度,雙活仲裁機(jī)制是否可以保證常見(jiàn)故障場(chǎng)景下業(yè)務(wù)的連續(xù)性和數(shù)據(jù)不丟失。
對(duì)于企業(yè)采購(gòu)來(lái)說(shuō),高端存儲(chǔ)選型一個(gè)重要的參考就是單位TB 可用容量下的成本,這就對(duì)存儲(chǔ)設(shè)備的架構(gòu)能力和存儲(chǔ)廠(chǎng)商的商業(yè)模式提出了一定的要求,最終的選擇需要根據(jù)客戶(hù)實(shí)際情況去做抉擇。
在對(duì)自身的需求進(jìn)行了充分分析之后,可以基于分析結(jié)果制定相應(yīng)的指標(biāo)體系。
①產(chǎn)品架構(gòu)選擇集中式還是分布式。如果上層應(yīng)用有特定的分布式文件存儲(chǔ)、對(duì)象存儲(chǔ)或者海量數(shù)據(jù)存儲(chǔ)需不斷擴(kuò)展的需求,同時(shí)對(duì)存儲(chǔ)穩(wěn)定性和時(shí)延要求不高的,可以選擇分布式存儲(chǔ)。對(duì)于大多數(shù)數(shù)據(jù)中心中掌握重要核心數(shù)據(jù)的應(yīng)用,具有高穩(wěn)定性、高吞吐量和低時(shí)延等特性的集中式存儲(chǔ)可能是更好的選擇。
②穩(wěn)定性方面,主要從兩個(gè)維度去考量。第一,整個(gè)存儲(chǔ)系統(tǒng)要具有全冗余與安全性設(shè)計(jì),沒(méi)有單點(diǎn)故障。包括控制器、緩存、硬盤(pán)、端口、電源、風(fēng)扇等部件均具有冗余,硬件維護(hù)對(duì)上層主機(jī)訪(fǎng)問(wèn)無(wú)感知。第二,各部件可以進(jìn)行微碼在線(xiàn)升級(jí),對(duì)主機(jī)訪(fǎng)問(wèn)無(wú)影響。
③性能方面,如今主流高端存儲(chǔ)的基本配置規(guī)格為四個(gè)控制器,CHACHE數(shù)TB甚至更高,主機(jī)接口模塊FC口速率達(dá)到32GB。同時(shí),閃存盤(pán)憑借著大容量、高IOPS、低耗時(shí)和低返廠(chǎng)率已成為主流配置。
④擴(kuò)展性包括縱向擴(kuò)展和橫向擴(kuò)展??v向擴(kuò)展指的是在單個(gè)柜子中增加硬盤(pán)框和前端接口卡,從而實(shí)現(xiàn)容量和主機(jī)接口數(shù)量的擴(kuò)容。隨著閃存盤(pán)的普及,單盤(pán)容量規(guī)格達(dá)到3.84T或者7.68T,因此單個(gè)硬盤(pán)框體積相對(duì)于上一代存儲(chǔ)大大縮小,存儲(chǔ)單柜可以擴(kuò)展的硬盤(pán)框數(shù)量也大大增加。橫向擴(kuò)展則是指通過(guò)橫向增加擴(kuò)展柜增加控制器、CACHE和硬盤(pán)框,實(shí)現(xiàn)容量和處理能力翻番增加。
⑤容災(zāi)能力。集中存儲(chǔ)的容災(zāi)特性主要體現(xiàn)在三個(gè)方面。第一,支持免網(wǎng)關(guān)雙活A(yù)-A架構(gòu)。第二是數(shù)據(jù)同步和異步復(fù)制功能,可以與雙活特性實(shí)現(xiàn)免網(wǎng)關(guān)的雙活+異地容災(zāi)的三副本數(shù)據(jù)容災(zāi)架構(gòu)。第三是快照功能。這三個(gè)方面的功能是當(dāng)前采購(gòu)高端存儲(chǔ)時(shí)盡量要求滿(mǎn)足的特性。
⑥成本主要包括硬件配置成本、軟件許可成本以及后期管理維護(hù)成本。
當(dāng)我們接到存儲(chǔ)選型任務(wù)時(shí)看似由于選擇太多無(wú)從下手,但是在運(yùn)用了上述方法論,經(jīng)過(guò)對(duì)存儲(chǔ)使用需求進(jìn)行充分分析和解剖、選型指標(biāo)體系建立和運(yùn)用之后,存儲(chǔ)選型思路豁然清晰,最后剩下的就是候選產(chǎn)品對(duì)比篩選和商務(wù)流程了。
希望本文所闡述的方法和思路可以給大家提供一定的參考,做好存儲(chǔ)采購(gòu)流程中選型工作,保障系統(tǒng)長(zhǎng)期健康平穩(wěn)運(yùn)行。