李 艷,呂 鵬,李 瓏(1.湖北省科學(xué)圖書(shū)館;2.中南民族大學(xué)圖書(shū)館;3.中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心)
?
高等院校高性能數(shù)據(jù)中心虛擬化系統(tǒng)的建設(shè)與研究——以中南民族大學(xué)及其圖書(shū)館為例
李艷1,3,呂鵬2△,李瓏1,3
(1.湖北省科學(xué)圖書(shū)館;2.中南民族大學(xué)圖書(shū)館;3.中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心)
摘要:從傳統(tǒng)數(shù)據(jù)中心的不足及未來(lái)高校建設(shè)及發(fā)展的需要出發(fā),分析了高性能數(shù)據(jù)中心虛擬化系統(tǒng)的特點(diǎn)及應(yīng)用場(chǎng)景,闡述了基于數(shù)據(jù)中心平臺(tái)、虛擬化系統(tǒng)管理平臺(tái)、業(yè)務(wù)系統(tǒng)平臺(tái)、供配電系統(tǒng)、集中式動(dòng)環(huán)監(jiān)控系統(tǒng)的高性能數(shù)據(jù)中心整體方案。同時(shí),以中南民族大學(xué)及其圖書(shū)館為例,介紹了基于其特點(diǎn)的數(shù)據(jù)中心虛擬化系統(tǒng)建設(shè)方案,通過(guò)圖書(shū)館多元化的各類應(yīng)用證明該架構(gòu)的高效性及可靠性。最后,提出了高性能數(shù)據(jù)中心對(duì)未來(lái)高校圖書(shū)館發(fā)展的若干思考。
關(guān)鍵詞:高性能數(shù)據(jù)中心虛擬化系統(tǒng);數(shù)據(jù)中心平臺(tái);虛擬化管理平臺(tái);高性能數(shù)據(jù)中心整體方案
當(dāng)前,傳統(tǒng)的數(shù)據(jù)中心已無(wú)法滿足高等院校(以下簡(jiǎn)稱“高?!保┒嗑W(wǎng)絡(luò)域的發(fā)展需要,及大數(shù)據(jù)交換平臺(tái)、高并發(fā)應(yīng)用支撐數(shù)據(jù)中心的發(fā)展要求。尤其在大數(shù)據(jù)時(shí)代,高校規(guī)模逐年擴(kuò)大、師生用戶逐年遞增,高校圖書(shū)館所承載的基礎(chǔ)網(wǎng)絡(luò)業(yè)務(wù)、數(shù)字化校園業(yè)務(wù)、移動(dòng)平臺(tái)應(yīng)用業(yè)務(wù)、新型應(yīng)用業(yè)務(wù)(企業(yè)微信平臺(tái)、MOOC網(wǎng)絡(luò)平臺(tái)、高清直錄播非線編平臺(tái))等傳統(tǒng)型數(shù)據(jù)中心正面臨著建設(shè)成本高、周期長(zhǎng)、能耗高、運(yùn)營(yíng)管理效率低、可擴(kuò)展性差等問(wèn)題,逐步制約著圖書(shū)館數(shù)據(jù)中心及業(yè)務(wù)平臺(tái)的發(fā)展。可見(jiàn),高校圖書(shū)館面對(duì)的正是核心業(yè)務(wù)大幅擴(kuò)張,信息系統(tǒng)數(shù)量與日倍增、維護(hù)成本逐年增長(zhǎng),安全隱患逐漸增加的局面。[1]傳統(tǒng)的數(shù)據(jù)中心方案使得高校圖書(shū)館數(shù)據(jù)中心逐漸面臨著資源大量重復(fù)建設(shè)浪費(fèi)、資源無(wú)法有效調(diào)度及回收、管理復(fù)雜度提升等問(wèn)題。隨著軟件定義網(wǎng)絡(luò)(Software Defined Network,SDN)技術(shù)的興起,軟件定義的數(shù)據(jù)中心(Software Defined Data Center,SDDC)技術(shù)也正在蓬勃發(fā)展。SDDC顛覆了傳統(tǒng)數(shù)據(jù)中心以“硬件”為主導(dǎo)的建設(shè)思想,使得高校圖書(shū)館新型數(shù)據(jù)中心的建設(shè)更側(cè)重于服務(wù)器集群虛擬化、存儲(chǔ)集群虛擬化、網(wǎng)絡(luò)虛擬化等資源的高度耦合及資源池的統(tǒng)一軟件化管理。本文以高性能數(shù)據(jù)中心虛擬化系統(tǒng)的特點(diǎn)和整體建設(shè)方案為切入點(diǎn),介紹了中南民族大學(xué)高性能數(shù)據(jù)中心的建設(shè)情況,探討了數(shù)據(jù)中心為高校圖書(shū)館未來(lái)建設(shè)和發(fā)展帶來(lái)的契機(jī)和優(yōu)勢(shì)。
1.1高性能數(shù)據(jù)中心虛擬化系統(tǒng)特點(diǎn)
SDDC能夠?qū)?shù)據(jù)中心物理、硬件資源進(jìn)行虛擬化、軟件化,并將其貫穿到數(shù)據(jù)中心的方方面面。SDDC通過(guò)在各種底層硬件架構(gòu)上加載一個(gè)虛擬的基礎(chǔ)設(shè)施層,提取所有硬件資源并將其匯集成資源池,以支持安全、高效、自動(dòng)地為各類應(yīng)用按需分配資源,將虛擬化技術(shù)的優(yōu)勢(shì)全面擴(kuò)展至包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)與安全以及可用性在內(nèi)的數(shù)據(jù)中心所有領(lǐng)域,從而實(shí)現(xiàn)支持靈活、彈性、高效和可靠IT服務(wù)的計(jì)算環(huán)境。所有資源的虛擬化,使得底層硬件的任何變化都與上層應(yīng)用無(wú)關(guān)。有了這個(gè)基礎(chǔ),可伸縮性、虛擬化性能問(wèn)題得到較大改善,各類資源的管理復(fù)雜度大幅降低,包含有大量遺留資產(chǎn)的數(shù)據(jù)中心。因此可以提高效率,降低成本,實(shí)現(xiàn)動(dòng)態(tài)化。[2]
當(dāng)前,高性能數(shù)據(jù)中心無(wú)疑是高校圖書(shū)館業(yè)務(wù)承載的主體。高校圖書(shū)館將面臨更龐大的數(shù)據(jù)交換壓力、更多樣的業(yè)務(wù)交互模式、更多層次的網(wǎng)絡(luò)域架構(gòu)、更高級(jí)別的網(wǎng)絡(luò)及數(shù)據(jù)安全保障、更復(fù)雜的系統(tǒng)運(yùn)行和數(shù)據(jù)管理環(huán)境。圖書(shū)館數(shù)據(jù)中心在承載大并發(fā)、多平臺(tái)的常規(guī)業(yè)務(wù)和用戶服務(wù)的同時(shí),還需要支撐起數(shù)字資源服務(wù)、查新服務(wù)、自助查詢打印服務(wù)、短信服務(wù)、語(yǔ)音服務(wù)、微平臺(tái)服務(wù)、移動(dòng)終端服務(wù)、虛擬云桌面服務(wù)及用戶互動(dòng)平臺(tái)等服務(wù)。[3]隨著技術(shù)的更新?lián)Q代,業(yè)務(wù)的翻新演化,構(gòu)建高可靠性圖書(shū)館的SDDC的核心就需實(shí)現(xiàn)所有資源的虛擬化、構(gòu)建統(tǒng)一的資源管理平臺(tái)。資源的整合與統(tǒng)一調(diào)度在解決新型圖書(shū)館發(fā)展中面臨的上述問(wèn)題、提升各類資源耦合度和資源利用率等方面意義非凡。
1.2典型應(yīng)用場(chǎng)景分析
高性能數(shù)據(jù)中心取代傳統(tǒng)的數(shù)據(jù)中心將是高校圖書(shū)館建設(shè)發(fā)展的必經(jīng)過(guò)程。高性能數(shù)據(jù)中心虛擬化系統(tǒng)將把高校圖書(shū)館的服務(wù)質(zhì)量和管理手段提升到一個(gè)新高度,為圖書(shū)館的發(fā)展提供更多契機(jī)。從高性能數(shù)據(jù)中心在高校圖書(shū)館的應(yīng)用分析看,主要包含以下典型的應(yīng)用場(chǎng)景。
場(chǎng)景一:高校圖書(shū)館承載的應(yīng)用種類較多,高峰時(shí)段的用戶數(shù)據(jù)請(qǐng)求和交互量大。單節(jié)點(diǎn)的應(yīng)用服務(wù)器已遠(yuǎn)遠(yuǎn)不能滿足當(dāng)前高校的業(yè)務(wù)需要。高性能數(shù)據(jù)中心需要保障的是服務(wù)的連續(xù)性和服務(wù)器、鏈路間的負(fù)載均衡。通過(guò)多節(jié)點(diǎn)(每個(gè)服務(wù)器一個(gè)IP)的同類業(yè)務(wù)服務(wù)器集群解析一個(gè)域名,配合負(fù)載均衡設(shè)備及虛擬交換機(jī)之間的鏈路聚合策略,實(shí)現(xiàn)業(yè)務(wù)訪問(wèn)的負(fù)載分擔(dān)和服務(wù)器資源的動(dòng)態(tài)回收及分配。當(dāng)單節(jié)點(diǎn)出現(xiàn)磁盤(pán)故障或服務(wù)崩潰等問(wèn)題時(shí),業(yè)務(wù)不會(huì)受到影響。
場(chǎng)景二:當(dāng)前,高校圖書(shū)館普遍存在“重應(yīng)用、輕管理,重建設(shè)、輕維護(hù)”的問(wèn)題。圖書(shū)館各類系統(tǒng)易出現(xiàn)磁盤(pán)寫(xiě)滿、應(yīng)用服務(wù)自動(dòng)停止、數(shù)據(jù)庫(kù)讀寫(xiě)異常、數(shù)據(jù)同步不一致、系統(tǒng)資源異常耗盡等諸多問(wèn)題。高性能數(shù)據(jù)中心部署多維網(wǎng)絡(luò)節(jié)點(diǎn)、業(yè)務(wù)服務(wù)及設(shè)備資源主動(dòng)監(jiān)測(cè)機(jī)制,能夠動(dòng)態(tài)監(jiān)測(cè)異常狀態(tài),保障業(yè)務(wù)系統(tǒng)可用性,實(shí)現(xiàn)差異化的QoS(Quality of Service,服務(wù)質(zhì)量)保證,提升安全策略配置調(diào)優(yōu)效率。對(duì)系統(tǒng)無(wú)法處理的異常通過(guò)調(diào)用短信網(wǎng)關(guān)和郵件告警的方式及時(shí)通知管理員處理。
場(chǎng)景三:高校圖書(shū)館的業(yè)務(wù)系統(tǒng)及各類服務(wù)器多存在腳本設(shè)計(jì)、服務(wù)安全等漏洞,易被局域網(wǎng)用戶和外部用戶攻擊、注入、篡改數(shù)據(jù)和劫持合法用戶提交表單數(shù)據(jù)。服務(wù)器自身存在較大安全隱患(如:SSL漏洞、Shell漏洞、SQL注入、DDoS攻擊等),且容易造成用戶私密信息泄露。高性能數(shù)據(jù)中心為高校圖書(shū)館的漏洞被攻擊、遠(yuǎn)程滲透方面提供服務(wù),包括:①網(wǎng)站全面信息搜集:開(kāi)啟端口集合、開(kāi)啟服務(wù)列表、同服務(wù)器其他網(wǎng)站列表搜集;②網(wǎng)站L4-7層漏洞發(fā)現(xiàn):主機(jī)安全漏洞、中間件的安全漏洞、網(wǎng)站代碼安全漏洞發(fā)現(xiàn)、業(yè)務(wù)邏輯漏洞發(fā)現(xiàn)、后臺(tái)口令破解、網(wǎng)站安全運(yùn)維管理漏洞;③旁站滲透監(jiān)控:利用旁站安全漏洞為跳板攻擊服務(wù)器實(shí)現(xiàn)網(wǎng)站入侵;④服務(wù)器滲透監(jiān)控:利用服務(wù)器漏洞為跳板入侵其他服務(wù)器,如:數(shù)據(jù)庫(kù)服務(wù)器、Web服務(wù)器等;⑤實(shí)現(xiàn)關(guān)鍵網(wǎng)站腳本的安全審計(jì)及漏洞修補(bǔ)。
場(chǎng)景四:虛擬云桌面技術(shù)、移動(dòng)應(yīng)用、海量數(shù)據(jù)分析等技術(shù)在高校圖書(shū)館的部署及應(yīng)用,將為節(jié)省圖書(shū)館硬件資源支出、服務(wù)終端高效管理、個(gè)性化的用戶服務(wù)體驗(yàn)提供保障。在高性能數(shù)據(jù)中心部署虛擬云桌面,能夠?yàn)閳D書(shū)館節(jié)省各類終端的大量投入,用戶只需通過(guò)客戶端就可以接入云桌面終端,通過(guò)認(rèn)證可以分享專屬于用戶自己的個(gè)性化桌面應(yīng)用和云盤(pán);部署移動(dòng)應(yīng)用為圖書(shū)館個(gè)性化的知識(shí)服務(wù)提供了保障。高校圖書(shū)館構(gòu)建的基于自身特色的“微信平臺(tái)”、“i民大(中南民族大學(xué)移動(dòng)App)平臺(tái)”、“學(xué)科服務(wù)移動(dòng)平臺(tái)”等都將為高校圖書(shū)館的嵌入式學(xué)科服務(wù),并建設(shè)媒體融合下的數(shù)字資源;vSphere5.5版本已經(jīng)集成了BDE模塊,能夠支持Hadoop環(huán)境中在vSphere上進(jìn)行海量數(shù)據(jù)的分析工作。在高性能數(shù)據(jù)中心,部署海量數(shù)據(jù)分析功能,為分析和挖掘圖書(shū)館用戶的個(gè)性化需求、知識(shí)服務(wù)和知識(shí)發(fā)現(xiàn)提供了支持。
2.1核心系統(tǒng)建設(shè)方案
高性能涵蓋的是不間斷的應(yīng)用服務(wù)能力,高效的數(shù)據(jù)交換、處理、備份與安全管理能力、故障動(dòng)態(tài)發(fā)現(xiàn)能力及其依賴的硬件、軟件、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)、安全防護(hù)等多項(xiàng)資源方面的高耦合目標(biāo)。應(yīng)用到高校圖書(shū)館數(shù)據(jù)中心的建設(shè)中,包含了虛擬化底層硬件平臺(tái)的構(gòu)建、虛擬化管理平臺(tái)的構(gòu)建及業(yè)務(wù)(或稱為“應(yīng)用”)平臺(tái)的構(gòu)建。高性能數(shù)據(jù)中心將以平臺(tái)建設(shè)代替?zhèn)鹘y(tǒng)的以系統(tǒng)為單位的垂直式建設(shè)模式,以資源合理分配及回收、應(yīng)用管理、控制與調(diào)度為核心手段,以快速提供非間斷、高質(zhì)量的服務(wù)為目標(biāo)。[4]
(1)數(shù)據(jù)中心平臺(tái)的建設(shè)。①軟件定義的虛擬化網(wǎng)絡(luò)平臺(tái)。軟件定義的網(wǎng)絡(luò)虛擬化VXLAN可以實(shí)現(xiàn)統(tǒng)一化網(wǎng)絡(luò)部署及管理,簡(jiǎn)化并自動(dòng)化網(wǎng)絡(luò)調(diào)配及部署、動(dòng)態(tài)配置網(wǎng)絡(luò)并減小VLAN開(kāi)銷。網(wǎng)絡(luò)虛擬化使得網(wǎng)絡(luò)連接與底層物理網(wǎng)絡(luò)硬件分離開(kāi),軟件定義的方式能夠利用軟件可視化創(chuàng)建網(wǎng)絡(luò)互連關(guān)系及接口模式和動(dòng)態(tài)下策略。基于分布式且可橫向擴(kuò)展(Scaleout)的方式構(gòu)建虛擬化網(wǎng)絡(luò)平臺(tái),大大簡(jiǎn)化了數(shù)據(jù)中心物理網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)了IP的快速轉(zhuǎn)發(fā)。
②虛擬化服務(wù)器集群平臺(tái)。數(shù)據(jù)中心內(nèi)部署高性能的刀片虛擬化服務(wù)器集群平臺(tái),能夠有效支撐高密度的應(yīng)用系統(tǒng),避免傳統(tǒng)服務(wù)器采購(gòu)和運(yùn)維管理模式的弊端。通過(guò)虛擬化軟件對(duì)服務(wù)器硬件資源進(jìn)行有效整合,以消除傳統(tǒng)的“一臺(tái)服務(wù)器、一個(gè)應(yīng)用”模式,通過(guò)統(tǒng)一的管理中心對(duì)服務(wù)器集群的所有虛擬機(jī)統(tǒng)一控制和管理,實(shí)現(xiàn)一臺(tái)物理機(jī)上運(yùn)行多個(gè)虛擬機(jī),服務(wù)器資源的靈活分配及調(diào)度,讓CPU、內(nèi)存、磁盤(pán)、I/O等硬件變成可以動(dòng)態(tài)管理的“資源池”,從而提高服務(wù)器硬件資源的利用率,簡(jiǎn)化系統(tǒng)管理,大大降低服務(wù)器設(shè)備的總投資成本及設(shè)備能耗開(kāi)銷。
③下一代虛擬化防火墻集群平臺(tái)。下一代虛擬化防火墻集群平臺(tái)除了實(shí)現(xiàn)第一代防火墻的基本功能外,還具備聯(lián)機(jī)配置,發(fā)揮網(wǎng)絡(luò)傳輸流檢查和網(wǎng)絡(luò)安全策略執(zhí)行平臺(tái)功能。集群更應(yīng)包含“雙機(jī)備份”、“鏈路備份”、“熱備份”、“多虛一”、“一虛多”等功能,實(shí)現(xiàn)業(yè)務(wù)的不間斷和連續(xù)防護(hù)功能?!半p機(jī)備份”多采用“1+1”的冷熱備份或雙熱互備模式,在設(shè)備發(fā)生故障時(shí)實(shí)現(xiàn)主動(dòng)切換和業(yè)務(wù)接替,保障業(yè)務(wù)連續(xù)性;“鏈路備份”能夠保障因物理鏈路故障或損壞導(dǎo)致服務(wù)終止,多鏈路在同時(shí)工作時(shí)能夠?qū)崿F(xiàn)數(shù)據(jù)轉(zhuǎn)發(fā)的負(fù)載分擔(dān),故障時(shí)實(shí)現(xiàn)業(yè)務(wù)鏈路的自動(dòng)切換,為用戶提供更可靠的服務(wù);“熱備份”保障了防火墻集群內(nèi)部分設(shè)備故障或鏈路切換時(shí),防火墻的配置信息、動(dòng)態(tài)業(yè)務(wù)流量(包括防火墻的過(guò)濾規(guī)則信息、連接信息、動(dòng)態(tài)路由信息、狀態(tài)監(jiān)測(cè)的應(yīng)用層協(xié)議的狀態(tài)機(jī)信息等)不受影響;“多虛一”是將多臺(tái)防火墻通過(guò)做聚合或VRRP,構(gòu)筑防火墻集群,實(shí)現(xiàn)物理上多臺(tái)邏輯上一臺(tái)的應(yīng)用效果;“一虛多”是將防火墻集群虛擬到多個(gè)業(yè)務(wù)或DMZ(demilitarized zone,隔離域)中,實(shí)現(xiàn)域的隔離保護(hù)與邏輯上的業(yè)務(wù)獨(dú)立,以保障各類業(yè)務(wù)的安全穩(wěn)定。
④軟件定義的虛擬化存儲(chǔ)集群平臺(tái)。軟件定義的存儲(chǔ)集群通過(guò)對(duì)存儲(chǔ)集群資源進(jìn)行抽象化處理來(lái)支持存儲(chǔ)資源的池化、復(fù)制和按需分發(fā),具備聚合、靈活、高效的線性擴(kuò)展能力,實(shí)現(xiàn)虛擬化平臺(tái)內(nèi)存儲(chǔ)與計(jì)算資源的共同管理,數(shù)據(jù)智能放置及策略的自動(dòng)存儲(chǔ)化。虛擬化存儲(chǔ)集群平臺(tái)應(yīng)具有縱向和橫向擴(kuò)展能力、高性能的高速數(shù)據(jù)緩存及分布式緩存功能,實(shí)現(xiàn)工作負(fù)載彈性、存儲(chǔ)域的自動(dòng)共享、平衡及故障切換及可預(yù)知服務(wù)級(jí)別的本地和遠(yuǎn)程數(shù)據(jù)訪問(wèn),保障異地存儲(chǔ)的數(shù)據(jù)同步和災(zāi)備。在單點(diǎn)存儲(chǔ)故障時(shí),其他存儲(chǔ)節(jié)點(diǎn)自動(dòng)接管業(yè)務(wù),實(shí)現(xiàn)數(shù)據(jù)讀寫(xiě)的無(wú)縫漫游切換。
⑤軟件定義的安全管理。軟件定義的安全管理是通過(guò)虛擬化安全管理軟件,管理支持虛擬化的防火墻和自適應(yīng)信任區(qū)域保護(hù)和隔離關(guān)鍵應(yīng)用,加強(qiáng)對(duì)內(nèi)部虛擬機(jī)通信的了解和控制,實(shí)現(xiàn)不相鄰的集群和單元資源利用率的優(yōu)化,識(shí)別并保護(hù)敏感的業(yè)務(wù)信息;基于虛擬化安全管理軟件構(gòu)建敏捷、可信賴的私有云基礎(chǔ)架,通過(guò)消除VLAN減少手動(dòng)網(wǎng)絡(luò)連接調(diào)配并簡(jiǎn)化部署,實(shí)現(xiàn)跨物理網(wǎng)絡(luò)邊界優(yōu)化計(jì)算資源的管理和使用;通過(guò)集成式防火墻和網(wǎng)關(guān)服務(wù)保護(hù)虛擬數(shù)據(jù)中心的邊緣安全,同時(shí)利用Web負(fù)載平衡功能跨虛擬機(jī)集群管理入站W(wǎng)eb保護(hù)業(yè)務(wù)系統(tǒng)、業(yè)務(wù)數(shù)據(jù)和虛擬桌面部署的安全,限制遠(yuǎn)程第三方用戶對(duì)授權(quán)應(yīng)用進(jìn)行網(wǎng)絡(luò)訪問(wèn),以簡(jiǎn)化安全管理流程并消除性能瓶頸。
(2)虛擬化管理平臺(tái)建設(shè)。高性能數(shù)據(jù)中心應(yīng)具備完整的虛擬化服務(wù)器管理、分布式存儲(chǔ)管理、數(shù)據(jù)庫(kù)及安全管理、虛擬云桌面管理等虛擬化管理平臺(tái)系統(tǒng),實(shí)現(xiàn)全融合的虛擬化、直觀的配置與管理及智能的資源配置優(yōu)化。虛擬化管理平臺(tái)融合基于計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)資源的綜合管理體系,形成彈性的數(shù)據(jù)中心資源池,實(shí)現(xiàn)資源的自動(dòng)化調(diào)度,更好地為上層應(yīng)用服務(wù)。虛擬化后虛擬機(jī)之間為完全隔離狀態(tài),具有獨(dú)立CPU、內(nèi)存、磁盤(pán)I/O、網(wǎng)絡(luò)I/O。當(dāng)任一虛擬機(jī)發(fā)生故障時(shí),同一物理機(jī)上的其他虛擬機(jī)不會(huì)受其影響,每個(gè)虛擬機(jī)具備獨(dú)立的用戶管理權(quán)限,可安裝獨(dú)立操作系統(tǒng),不同虛擬機(jī)間操作系統(tǒng)可以異構(gòu)。虛擬化管理平臺(tái)能對(duì)包括CPU、內(nèi)存、磁盤(pán)I/O、網(wǎng)絡(luò)I/O等重要資源在內(nèi)的關(guān)鍵元件進(jìn)行全面的性能監(jiān)測(cè),為配合系統(tǒng)和業(yè)務(wù)管理員實(shí)施合理的資源規(guī)劃提供詳盡的數(shù)據(jù)資料。
(3)業(yè)務(wù)/應(yīng)用系統(tǒng)平臺(tái)建設(shè)。業(yè)務(wù)是數(shù)據(jù)中心硬件和軟件平臺(tái)支撐的核心,是高性能數(shù)據(jù)中心的價(jià)值體現(xiàn)。業(yè)務(wù)平臺(tái)的構(gòu)建,將各類業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行整合,進(jìn)行歸類劃分。業(yè)務(wù)系統(tǒng)間應(yīng)實(shí)現(xiàn)數(shù)據(jù)的共享與同步推送,基于單點(diǎn)登錄(或統(tǒng)一身份認(rèn)證),跨多系統(tǒng)訪問(wèn)的功能。業(yè)務(wù)系統(tǒng)間通過(guò)輕量目錄訪問(wèn)協(xié)議(Lightweight Directory Access Protocol, LDAP)或ODI等方式,實(shí)現(xiàn)數(shù)據(jù)資源的最大化共享;通過(guò)webservice接口及視圖推送方式,完成數(shù)據(jù)動(dòng)態(tài)推送及調(diào)用,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)交互。業(yè)務(wù)系統(tǒng)是數(shù)據(jù)中心的上層建筑,基于虛擬化的業(yè)務(wù)平臺(tái)建設(shè)應(yīng)最大化、合理化動(dòng)態(tài)分配和調(diào)度系統(tǒng)資源,做好業(yè)務(wù)系統(tǒng)內(nèi)和業(yè)務(wù)系統(tǒng)間的安全防護(hù)(防火墻集群防護(hù)和服務(wù)器自身的iptables等防護(hù)),業(yè)務(wù)系統(tǒng)的數(shù)據(jù)備份、快照備份和鏡像備份,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)平臺(tái)整體的穩(wěn)定構(gòu)建。
2.2高性能數(shù)據(jù)中心輔助系統(tǒng)建設(shè)方案
(1)供配電系統(tǒng)。供配電是高性能數(shù)據(jù)中心安全穩(wěn)定運(yùn)行的基礎(chǔ)保障。供配電系統(tǒng)要求具有(市電、發(fā)電機(jī)、UPS)多級(jí)電力保障,具有“故障容錯(cuò)”和在線維修及擴(kuò)容能力,平面布局與線纜傳輸滿足安全防火要求,并兼顧防雷、防水、防潮、防爆、防盜、防蟲(chóng)鼠害等需求。
(2)集中式動(dòng)環(huán)監(jiān)控系統(tǒng)。為保證數(shù)據(jù)中心系統(tǒng)在一定的安全監(jiān)控范圍內(nèi),防范風(fēng)險(xiǎn)發(fā)生,將數(shù)據(jù)中心機(jī)房的門(mén)禁、視頻與環(huán)境設(shè)備集中統(tǒng)一監(jiān)控,對(duì)機(jī)房的動(dòng)力、環(huán)境、安全防護(hù)等三方面實(shí)現(xiàn)實(shí)時(shí)集中監(jiān)控、報(bào)警、聯(lián)動(dòng)。結(jié)合短信、郵件網(wǎng)關(guān)遠(yuǎn)程告警以及本地聲光、多媒體語(yǔ)音等告警,對(duì)數(shù)據(jù)綜合處理和數(shù)據(jù)分析等方面進(jìn)行科學(xué)管理,減少維護(hù)人員的工作量,有效降低機(jī)房運(yùn)行維護(hù)成本。
中南民族大學(xué)高性能數(shù)據(jù)中心是基于VCE(Virtual Computing Environment, VMware虛擬化服務(wù)器+ Cisco路由交換+ EMC存儲(chǔ))架構(gòu)構(gòu)建,實(shí)現(xiàn)了數(shù)據(jù)的集中化、信息共享化、內(nèi)容定制化、硬件集群化、文件電子化、流程規(guī)范化的建設(shè)目標(biāo)。建設(shè)的主要內(nèi)容包含了數(shù)據(jù)中心網(wǎng)絡(luò)及網(wǎng)絡(luò)安全、虛擬化計(jì)算資源池、核心應(yīng)用云計(jì)算平臺(tái)、共享數(shù)據(jù)庫(kù)平臺(tái)、數(shù)據(jù)存儲(chǔ)及災(zāi)備中心等。
中南民族大學(xué)數(shù)據(jù)中心服務(wù)器和Oracle數(shù)據(jù)庫(kù)均部署為VMware vSphere計(jì)算集群,所有核心業(yè)務(wù)均部署于虛擬機(jī)內(nèi),由VMware vCenter統(tǒng)管所有虛擬機(jī),實(shí)現(xiàn)了硬件信息的完全虛擬化。從主機(jī)的uuid,到網(wǎng)卡mac、網(wǎng)絡(luò)vlan,到hba卡的wwn號(hào)等所有硬件信息都寫(xiě)在配置文件上,實(shí)現(xiàn)了與物理刀片無(wú)關(guān)。采用santoot方式部署的Cisco UCS刀片服務(wù)器集群,能夠在任一刀片物理故障時(shí),在最短時(shí)間內(nèi)完成遷移和接管,接管刀片相當(dāng)于物理主機(jī)開(kāi)機(jī)時(shí)間,實(shí)現(xiàn)最短的RTO(Recovery Time Objective,數(shù)據(jù)恢復(fù)時(shí)間)。
VMware虛擬化環(huán)境以Cisco的Nexus7000路由交換集群作為配合,采用按DMZ域劃分虛擬硬件資源(virtual device contexts, VDC)的方式,使數(shù)據(jù)中心業(yè)務(wù)(作為一個(gè)獨(dú)立的VDC)、網(wǎng)絡(luò)中心業(yè)務(wù)(獨(dú)立的VDC)、一卡通中心業(yè)務(wù)(獨(dú)立的VDC)邏輯上相互隔離,通過(guò)下一代防火墻集群虛擬出多個(gè)虛擬墻作為每個(gè)DMZ域的安全保障。交換設(shè)施和下一代防火墻集群均采用了高性能的多電源、多風(fēng)扇設(shè)備,關(guān)鍵節(jié)點(diǎn)采用虛擬路由冗余協(xié)議(Virtual Router Redundancy Protocol, VRRP)實(shí)現(xiàn)設(shè)備的雙活互備;互聯(lián)鏈路間利用鏈路匯聚控制協(xié)議(Link Aggregation Control Protocol, LACP)實(shí)現(xiàn)鏈路間的動(dòng)態(tài)聚合及流量的負(fù)載分擔(dān)。存儲(chǔ)部分采用分布式存儲(chǔ)管理軟件VSAN集中管理行業(yè)標(biāo)準(zhǔn)x86服務(wù)器的內(nèi)部磁盤(pán)與閃存設(shè)備,實(shí)現(xiàn)靈活的虛擬機(jī)共享存儲(chǔ)。利用EMC的Avamar定時(shí)執(zhí)行關(guān)鍵數(shù)據(jù)的增量備份,實(shí)現(xiàn)全局備份重復(fù)數(shù)據(jù)消除。高性能數(shù)據(jù)中心的整體架構(gòu)為中南民族大學(xué)圖書(shū)館數(shù)據(jù)中心網(wǎng)絡(luò)及安全建設(shè)、應(yīng)用平臺(tái)及計(jì)算資源池建設(shè)、存儲(chǔ)資源池建設(shè)提供了技術(shù)支持及保障。
3.1圖書(shū)館數(shù)據(jù)中心網(wǎng)絡(luò)及安全建設(shè)
圖書(shū)館數(shù)據(jù)中心網(wǎng)絡(luò)及安全建設(shè)包含對(duì)數(shù)據(jù)中心交換設(shè)備、容災(zāi)中心交換設(shè)備、數(shù)據(jù)中心安全網(wǎng)關(guān)、Web防火墻、漏洞掃描、負(fù)載均衡和安全服務(wù)內(nèi)容的建設(shè)。
數(shù)據(jù)中心和容災(zāi)中心均采用高性能、低延時(shí)、高質(zhì)量的兩臺(tái)Cisco Nexus7000作為核心交換設(shè)備,設(shè)備之間采用心跳實(shí)現(xiàn)互熱、互備,兩臺(tái)物理設(shè)備通過(guò)VSS協(xié)議虛擬化為邏輯上的一臺(tái)設(shè)備,兩臺(tái)設(shè)備間采用BFD來(lái)進(jìn)行設(shè)備間互聯(lián)鏈路的檢測(cè),一旦一臺(tái)交換機(jī)出現(xiàn)故障,業(yè)務(wù)會(huì)自動(dòng)切換到另一臺(tái)交換機(jī),達(dá)到“1+1”熱備、無(wú)縫切換效果。其與上聯(lián)設(shè)備物理上各連一對(duì)光纖,采用鏈路聚合port-channel及等值策略路由的方式進(jìn)行部署,確保了數(shù)據(jù)中心網(wǎng)絡(luò)平臺(tái)可以充分滿足數(shù)據(jù)中心內(nèi)部應(yīng)用高性能數(shù)據(jù)交換、應(yīng)用系統(tǒng)高性能集群同步、虛擬化遷移高性能寬帶、內(nèi)外網(wǎng)用戶高速接入等需求,實(shí)現(xiàn)了數(shù)據(jù)中心內(nèi)部流量轉(zhuǎn)發(fā)的負(fù)載分擔(dān)。數(shù)據(jù)中心安全網(wǎng)關(guān)旁路部署于數(shù)據(jù)中心邊界,實(shí)現(xiàn)圖書(shū)館數(shù)據(jù)中心與外部之間的物理隔離,中心內(nèi)部應(yīng)用集群之間的邏輯隔離。該方式能夠及時(shí)識(shí)別攻擊程序或有害代碼及其克隆和變種,降低了圖書(shū)館內(nèi)數(shù)據(jù)中心的危害性。以Web防火墻(NSFocus NF)為數(shù)據(jù)中心的Web業(yè)務(wù)提供了防護(hù)保障,有效降低了圖書(shū)館Web服務(wù)器遭受諸如XSS跨站腳本攻擊、SQL注入攻擊、敏感詞注入、http協(xié)議請(qǐng)求檢查等惡意攻擊;漏洞掃描系統(tǒng)為圖書(shū)館數(shù)據(jù)中心提供漏洞掃描檢測(cè)和報(bào)告,以及時(shí)發(fā)現(xiàn)數(shù)據(jù)中心系統(tǒng)及其應(yīng)用的安全漏洞,做到防患于未然。Radware負(fù)載均衡集群的建設(shè),有效減輕了單節(jié)點(diǎn)虛擬機(jī)業(yè)務(wù)(并發(fā)連接大的服務(wù))的承載能力,為館內(nèi)分布式的多節(jié)點(diǎn)http/https或Web業(yè)務(wù)服務(wù)器部署及用戶Request請(qǐng)求及數(shù)據(jù)流量負(fù)載分擔(dān)提供了保障。
3.2圖書(shū)館應(yīng)用平臺(tái)及計(jì)算資源池建設(shè)
圖書(shū)館由于提供電子資源業(yè)務(wù)、文獻(xiàn)及學(xué)位數(shù)據(jù)庫(kù)業(yè)務(wù)、精品課程業(yè)務(wù)、微平臺(tái)業(yè)務(wù)、移動(dòng)應(yīng)用業(yè)務(wù)等多種形式的服務(wù),部署共享數(shù)據(jù)庫(kù)平臺(tái)、應(yīng)用云計(jì)算平臺(tái)、虛擬化刀片服務(wù)器集群資源池、容災(zāi)中心刀片服務(wù)器集群資源池、虛擬化容災(zāi)軟件與實(shí)施服務(wù)系統(tǒng)、數(shù)據(jù)庫(kù)容災(zāi)實(shí)施服務(wù)系統(tǒng)為圖書(shū)館業(yè)務(wù)支撐提供了基礎(chǔ)。
共享數(shù)據(jù)平臺(tái)用以支撐數(shù)字化校園各類業(yè)務(wù)的共享數(shù)據(jù)庫(kù);應(yīng)用云計(jì)算平臺(tái)用以支撐數(shù)字化校園的統(tǒng)一身份認(rèn)證、數(shù)據(jù)交換業(yè)務(wù),實(shí)現(xiàn)圖書(shū)館內(nèi)關(guān)鍵應(yīng)用系統(tǒng)與數(shù)據(jù)中心信息系統(tǒng)間的高效集成和統(tǒng)一管理;虛擬化、容災(zāi)中心刀片服務(wù)器集群資源池實(shí)現(xiàn)了服務(wù)器硬件資源的有效整合,以統(tǒng)一的管理中心對(duì)多臺(tái)服務(wù)器的所有虛擬機(jī)實(shí)現(xiàn)統(tǒng)一控制和管理,實(shí)現(xiàn)服務(wù)器資源的任意劃分和調(diào)配,提高服務(wù)器硬件資源的利用率,降低服務(wù)器設(shè)備的總投資成本和設(shè)備能耗;虛擬化容災(zāi)軟件與實(shí)施服務(wù)系統(tǒng)和數(shù)據(jù)庫(kù)容災(zāi)實(shí)施服務(wù)系統(tǒng)的部署,實(shí)現(xiàn)了數(shù)據(jù)中心虛擬化應(yīng)用和數(shù)據(jù)庫(kù)平臺(tái)的異地容災(zāi)備份及恢復(fù),做到直接從虛擬化管理控制中心創(chuàng)建災(zāi)備計(jì)劃并管理和監(jiān)控異地恢復(fù)計(jì)劃執(zhí)行,數(shù)據(jù)同步或異步的自動(dòng)轉(zhuǎn)換模式,完成基于IP網(wǎng)絡(luò)的日志復(fù)制等功能。
3.3圖書(shū)館存儲(chǔ)資源池建設(shè)
圖書(shū)館存儲(chǔ)資源池的部署包含F(xiàn)C SAN交換設(shè)備、結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)中心(雙活)、非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)中心、容災(zāi)中心存儲(chǔ)中心及數(shù)據(jù)連續(xù)保護(hù)系統(tǒng)的建設(shè)。高校圖書(shū)館的業(yè)務(wù)數(shù)據(jù)和數(shù)據(jù)交換容量很大,F(xiàn)C SAN交換設(shè)備、結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)中心(雙活)、非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)中心的部署,是圖書(shū)館業(yè)務(wù)的連續(xù)性和一致性的基礎(chǔ)。存儲(chǔ)資源池提供了分布式全冗余存儲(chǔ)系統(tǒng),并配備多個(gè)存儲(chǔ)節(jié)點(diǎn)?;诖鎯?chǔ)節(jié)點(diǎn)部署數(shù)據(jù)塊鏡像軟件,能夠可視化地實(shí)現(xiàn)本地和異地的數(shù)據(jù)同步、異步復(fù)制。利用分布式存儲(chǔ)管理軟件VSAN實(shí)現(xiàn)對(duì)存儲(chǔ)資源進(jìn)行合理的調(diào)配,實(shí)現(xiàn)虛擬機(jī)和存儲(chǔ)服務(wù)器在工作狀態(tài)下的熱升級(jí)和擴(kuò)容,完成以存儲(chǔ)執(zhí)行替代虛擬機(jī)執(zhí)行(例如:Block zeroing、Storage vMotion等)操作,從而降低虛擬機(jī)的資源消耗。[5]
當(dāng)前,中南民族大學(xué)圖書(shū)館承載了館內(nèi)基礎(chǔ)網(wǎng)絡(luò)業(yè)務(wù)、數(shù)字化校園一卡通館內(nèi)門(mén)禁、數(shù)據(jù)網(wǎng)上訂閱及流通借閱業(yè)務(wù)、各類電子資源校內(nèi)外訪問(wèn)業(yè)務(wù)、移動(dòng)平臺(tái)業(yè)務(wù)、新型應(yīng)用業(yè)務(wù)(微信平臺(tái)業(yè)務(wù)、MOOC網(wǎng)絡(luò)平臺(tái)業(yè)務(wù)、虛擬云桌面業(yè)務(wù))等多種服務(wù)。依托該校高性能數(shù)據(jù)中心的建設(shè),實(shí)現(xiàn)了各類數(shù)據(jù)、配置的安全管理和備份,并提高了虛擬化數(shù)據(jù)中心系統(tǒng)資源安全、可控、高效和靈活的配置與部署;實(shí)現(xiàn)了平臺(tái)運(yùn)行的高可靠和不間斷業(yè)務(wù)服務(wù);實(shí)現(xiàn)了IT設(shè)備與系統(tǒng)資源的動(dòng)態(tài)分配與彈性擴(kuò)展及回收,降低了圖書(shū)館建設(shè)的運(yùn)營(yíng)成本和整體能耗;實(shí)現(xiàn)了整體平臺(tái)支撐能力與管理能力的提升,并提高了數(shù)據(jù)中心運(yùn)維管理人員的建設(shè)、維護(hù)效率;新技術(shù)的更新、部署、調(diào)優(yōu)更有利于促進(jìn)圖書(shū)館技術(shù)隊(duì)伍的建設(shè)與發(fā)展。
事實(shí)證明,高性能數(shù)據(jù)中心有利于推動(dòng)高校圖書(shū)館業(yè)務(wù)的擴(kuò)充及發(fā)展,減少運(yùn)維人員的工作量和管理難度,提升虛擬化硬件資源的利用率、系統(tǒng)的可用性和資源調(diào)用的靈活性,保證信息系統(tǒng)的快速部署與容災(zāi)備份。未來(lái)高校圖書(shū)館的建設(shè),需要牢牢抓住技術(shù)革新和大數(shù)據(jù)資源,依賴新的虛擬化技術(shù)軟件管理底層硬件資源、業(yè)務(wù)服務(wù)、數(shù)據(jù)安全、服務(wù)安全、應(yīng)用安全等,利用諸如在EMC Isilon和VMware上搭建數(shù)據(jù)湖部署Hadoop模型、[6,7]在A-pache Ambari上搭建數(shù)據(jù)倉(cāng)庫(kù)部署Hadoop模型等方式分析大數(shù)據(jù),[8]以實(shí)現(xiàn)圖書(shū)館個(gè)性化知識(shí)服務(wù)、科學(xué)數(shù)據(jù)監(jiān)護(hù)(data curation)及相關(guān)服務(wù)、媒體融合下的數(shù)字資源建設(shè)與服務(wù)等。從數(shù)據(jù)池中進(jìn)行用戶數(shù)據(jù)智能挖掘,實(shí)現(xiàn)由資源發(fā)現(xiàn)到知識(shí)發(fā)現(xiàn),構(gòu)建用戶需求分析模型,為準(zhǔn)確把握時(shí)代用戶個(gè)性化需求提供基礎(chǔ)。同時(shí),高校圖書(shū)館數(shù)據(jù)中心的建設(shè)與優(yōu)化,更多的應(yīng)關(guān)注校際、城域、省域間的資源共享及信息交互,讓資源共享大平臺(tái)受惠于更多人。
[參考文獻(xiàn)]
[1]馬曉亭,陳臣.基于虛擬化技術(shù)的數(shù)字圖書(shū)館分布式云計(jì)算數(shù)據(jù)中心研究[J].情報(bào)科學(xué),2012,30(7):1025-1029.
[2]InfoWorld.What the software-defined data center really means[EB/OL].[2015-05-15].http://www.infoworld.com/article/2618097/data-center/what-the-software-defined-data-center-really-means.html.
[3]秦格輝.圖書(shū)館數(shù)據(jù)中心系統(tǒng)高可用性策略研究[J].圖書(shū)情報(bào)工作,2014,58(8):9,48-52.
[4]孟凡立,等.高校虛擬化數(shù)據(jù)中心建設(shè)探究[J].實(shí)驗(yàn)室研究與探索,2012,31(12):62-66,71.
[5]許卓斌,林俊偉.圖書(shū)館數(shù)據(jù)中心虛擬化網(wǎng)絡(luò)設(shè)計(jì)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2013(7/8): 137-142.
[6]Prnewswire.com.Isilon Announces Certification with VMware[EB/OL].[2015-05-29].http://www.prnewswire.com/ news-releases/ isilon-announces-certification-with-vmware-57352262.html.
[7]EMC正式推出Isilon NAS陣列支持文件存儲(chǔ)及Hadoop分析[EB/OL].[2015-05-29].http: //www.searchstorage.com.cn/showcontent_83502.htm.
[8]Wei-ChunChung,et al.CloudDOE:A User-Friendly Tool for Deploying Hadoop Clouds and Analyzing High-Throughput Sequencing Data with MapReduce [J].PLOSONE,2014,9(6):e98146.
Construction and Research on the Virtualization System of High Performance Data Center in Institutions of Higher Learning——Taking South Central University for Nationalities and Its library as Example
Li Yan,Lv Peng,Li Long
Abstract:Analyzing the weakness of traditionaldata center and the developmentdemands ofthe institutions of higher learning, the article describes the characteristics and different application scenarios of virtualization system of high performance data center .Meanwhile, the paper explains the overall solution to high performance data center which is basedon the platform of data center, the management platform of virtualization system, the platform of business system, the power supply and distribution system, the centralized ring monitoring system.Secondly, taking South Central University for Nationalities and its library as example, this article introduces the construction scheme of data center virtualization system based on its characteristics.The diversification of all kinds of applications show that the efficiency and reliability of above architecture in library of institutions of higher learning.Finally, the article puts forward some ideas ofthe high performance data center aboutthe development ofuniversity library inthe future.
Keywords:Virtualization System of High Performance Data Center; Platform of Data Center; Management Platform of Virtualization System;Overall Solutionto High Performance Data Center
[收稿日期]2015-06-11[責(zé)任編輯]菊秋芳
[作者簡(jiǎn)介]李艷(1982-),女,中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心館員,研究方向:大數(shù)據(jù)與圖情檢索;呂鵬(1979-),男,中南民族大學(xué)圖書(shū)館副館長(zhǎng),研究方向:計(jì)算機(jī)網(wǎng)絡(luò)與大數(shù)據(jù);李瓏(1965-),女,中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心副研究館員,研究方向:圖書(shū)情報(bào)檢索。
通訊作者:△呂鵬
[基金項(xiàng)目]本文系中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“云計(jì)算環(huán)境中數(shù)字化圖書(shū)館基于多維QoS屬性的虛擬化資源分配算法研究”(項(xiàng)目編號(hào):CZQ14023)資助成果。
中圖分類號(hào):G250.7
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1005-8214(2016)02-0074-06