●都平平,郭琪,蘇賀濤,李雨珂,鮑劼,鄧志文
(1.中國礦業(yè)大學(xué)a.圖書館;b.安全學(xué)院,江蘇徐州221116;2.格坦斯克大學(xué)商學(xué)院,Poland)
基于聯(lián)盟域特色資源數(shù)據(jù)庫的私有云設(shè)計(jì)
●都平平1a,郭琪1a,蘇賀濤1b,李雨珂2,鮑劼1a,鄧志文1a
(1.中國礦業(yè)大學(xué)a.圖書館;b.安全學(xué)院,江蘇徐州221116;2.格坦斯克大學(xué)商學(xué)院,Poland)
特色數(shù)據(jù)庫;私有云;數(shù)據(jù)聚合;聯(lián)盟域泛在服務(wù)
高校的特色資源數(shù)據(jù)庫是面向特定讀者的定向?qū)I(yè)化服務(wù)資源,為了保障數(shù)據(jù)存儲和服務(wù)中其數(shù)據(jù)的專有使用性、方便易用性、唯一整合性及安全可靠性,本文闡述了利用私有云對多個(gè)高校的同一學(xué)科聯(lián)盟特色資源數(shù)據(jù)庫的建設(shè)方法。以云計(jì)算技術(shù)為資源管理模式,并采用私有云的架構(gòu)布局特色資源數(shù)據(jù)結(jié)構(gòu),讓各類數(shù)據(jù)庫數(shù)據(jù)資源聚合在云端的存儲器中,各種資源可以借“云”統(tǒng)一結(jié)合起來,內(nèi)容化零為整集成融合為“域”,保障數(shù)據(jù)的安全性和服務(wù)的高質(zhì)量。
構(gòu)建域聯(lián)盟云服務(wù)共享系統(tǒng),即建設(shè)具有云計(jì)算技術(shù)的數(shù)字圖書館資源存儲服務(wù)系統(tǒng),受到圖書館界的廣泛關(guān)注,它解決了系統(tǒng)部署的重復(fù)性和單一服務(wù)器承載單一服務(wù)而造成設(shè)備和資源利用率低的問題。
私有云(Private Clouds)是為一個(gè)域或單個(gè)機(jī)構(gòu)單獨(dú)使用而構(gòu)建的。在建設(shè)科學(xué)資源共享域時(shí),為最有效控制數(shù)據(jù)的安全性和實(shí)現(xiàn)服務(wù)的高質(zhì)量,采用私有云的方式建設(shè)專題數(shù)據(jù)庫并在域中提供特定有效的專有服務(wù)。建立在私有云上的云計(jì)算服務(wù)主要是通過用戶自己的服務(wù)器來建立一套私有的云計(jì)算架構(gòu),為一定范圍內(nèi)的用戶提供數(shù)據(jù)使用、服務(wù)專指和安全性的高效保證。同時(shí),私有云可以部署在自有的數(shù)據(jù)防火墻之內(nèi)或者托管到安全服務(wù)中心,并在私有云服務(wù)上部署應(yīng)用程序?yàn)橛脩籼峁┓?wù)。我們所做的高校域聯(lián)盟的特色資源主要是在聯(lián)盟高校域的所屬基礎(chǔ)設(shè)施上部署私有云應(yīng)用程序,完成安全、專有、特定、有效的區(qū)域特定學(xué)科資源服務(wù)。[1]
1.1 現(xiàn)有問題及采用私有云的必要性
學(xué)科聯(lián)盟域一般包含相同學(xué)科的多個(gè)高校,學(xué)科資源分布在不同區(qū)域的不同高校的不同存儲設(shè)備上,具有分散性,存在以下問題:(1)多服務(wù)器管理復(fù)雜,由于高校區(qū)域不同,單獨(dú)承擔(dān)數(shù)據(jù)資源和服務(wù),服務(wù)器數(shù)量每年都在增大,數(shù)量越來越多,服務(wù)器的整合規(guī)劃管理面臨巨大挑戰(zhàn)。[2](2)數(shù)據(jù)建設(shè)缺乏標(biāo)準(zhǔn)化。單體建設(shè),很難采用統(tǒng)一建設(shè)標(biāo)準(zhǔn)和實(shí)施標(biāo)準(zhǔn)。(3)設(shè)備和資源利用率低。各服務(wù)器為運(yùn)行單個(gè)操作系統(tǒng)和單個(gè)應(yīng)用程序設(shè)計(jì),檢索資源要多次檢索,大部分資源無法統(tǒng)一檢索,服務(wù)器的CPU沒有被充分利用。(4)統(tǒng)一部署問題。各存儲配置不同,應(yīng)用系統(tǒng)之間缺乏共享機(jī)制和兼容性,致使每增加一個(gè)應(yīng)用就要求重新安裝系統(tǒng),進(jìn)行各種技術(shù)參數(shù)配置,不僅耗費(fèi)了大量人力,也增加了系統(tǒng)管理的復(fù)雜性。[3](5)數(shù)據(jù)長久保存機(jī)制和安全保障功能。高校圖書館用戶群體的專一性以及資源的特有性要求它相比其他數(shù)字資源應(yīng)具有更高的數(shù)據(jù)備份和安全保障功能,但不宜做到。
綜上所述,技術(shù)支撐下的高校域的統(tǒng)一資源布局勢在必行。
1.2 私有云支撐下的學(xué)科聯(lián)盟域特色資源庫建設(shè)思路
利用私有云技術(shù)搭建適合學(xué)科聯(lián)盟域的特色資源存儲和服務(wù)體系是特色庫建設(shè)的有效建設(shè)模式。把原有分散的建設(shè)改為集中建設(shè)模式,統(tǒng)一建設(shè)標(biāo)準(zhǔn),使其具有互操作性、學(xué)科特定性、體系完整性、媒體多樣性、平臺相互整合及統(tǒng)一檢索性。在私有云的環(huán)境下,規(guī)范的建設(shè)模式為不同機(jī)構(gòu)的相同學(xué)科資源提供了同一標(biāo)準(zhǔn)的整合建設(shè)服務(wù),云環(huán)境下聯(lián)盟域資源庫可以提高資源的組織能力和基于知識鏈共享使用效果,可以扶持學(xué)科、機(jī)構(gòu)的合作,特別有助于振興資源偏弱的機(jī)構(gòu),也是學(xué)科信息資源建設(shè)發(fā)展的趨勢。
2.1 私有云模式選擇和框架結(jié)構(gòu)布局
目前,國外比較流行的開源云計(jì)算平臺有Abi-Cloud、ⅠOgenMongo DB、Nimbus和Eucalyptus。其中,以提供開源私有云服務(wù)的平臺提供商開發(fā)的Eucalyptus從技術(shù)和應(yīng)用角度來看都是比較成功的私有云開源框架,能夠很好地提供目前圖書館應(yīng)用開發(fā)研究所需的硬件資源。[4,5]
特色資源庫學(xué)科域私有云平臺以Eucalyptus云計(jì)算軟件框架、中間件、Portlets技術(shù)為基礎(chǔ),通過虛擬機(jī)資源和操作系統(tǒng)模板等方式向不同用戶提供單位硬件資源和軟件資源服務(wù)。學(xué)科域數(shù)字資源的私有云平臺主要建設(shè)三部分構(gòu)架:基于GridSphere布局云計(jì)算域資源門戶系統(tǒng)、基于Euca2ools中間件系統(tǒng)、基于DLCloud(DigitalLibraryCloud)域資源云平臺。[6]見圖1、圖2。
圖1 學(xué)科域資源私有云平臺的架構(gòu)[7]
(1)GridSphere門戶作為訪問學(xué)科域特色數(shù)據(jù)資源庫私有云平臺的入口,即防火墻,是普通用戶訪問和使用私有云服務(wù)和管理員管理云資源的入口,提供了用戶登錄、注冊、驗(yàn)證等用戶管理功能。同時(shí),用戶使用各種終端(電腦、平板、手機(jī)等),利用瀏覽器訪問GridSphere門戶子系統(tǒng),通過管理和使用DLCloud云平臺提供的虛擬機(jī)上的域范圍的學(xué)科特色資源及特色資源所用的操作系統(tǒng)資源或平臺上閱讀、媒體播放工具等,可以實(shí)現(xiàn)虛擬機(jī)管理、模板管理、ⅠP控制管理、安全保障管理、存儲空間管理等主要功能。安裝了Euca2ools工具和訪問Eucalyptus平臺的相應(yīng)證書信息,其作為訪問私有云的中間件,用戶可以通過協(xié)議訪問DLCloud云平臺,并通過輸送相應(yīng)命令,對DLCloud云平臺進(jìn)行操作。DLCloud云基礎(chǔ)設(shè)施是整個(gè)架構(gòu)的核心模塊,為特色數(shù)據(jù)庫私有云平臺提供操作系統(tǒng)、虛擬機(jī)等資源,由Eucalyptus(Elastic Utility Computing Architecture for Linking Your Programs To Useful Systems)開源云平臺和硬件資源兩部分構(gòu)成。[7](2)FTP服務(wù)器:用于存儲上傳至私有云的鏡像文件和存儲圖書館各系統(tǒng)。(3)外部存儲:作為私有云的外部存儲,實(shí)現(xiàn)虛擬機(jī)的備份與快照,同時(shí)還存放了門戶系統(tǒng)所用到的Mysql數(shù)據(jù)庫。
私有云平臺考慮的一個(gè)出發(fā)點(diǎn)就是云端數(shù)據(jù)的安全性和單獨(dú)可用性,從這個(gè)角度出發(fā),云網(wǎng)絡(luò)環(huán)境的架構(gòu)采用三層網(wǎng)絡(luò)體系架構(gòu),形成三層防護(hù)屏蔽入侵者,即,(1)使用防火墻;(2)隔離帶通過主機(jī)在內(nèi)堡壘,外包過濾路由器構(gòu)成子網(wǎng)態(tài)勢;(3)應(yīng)用網(wǎng)關(guān)。
2.2 硬件平臺建設(shè)
DLCloud云基礎(chǔ)設(shè)施硬件環(huán)境,由三臺專用物理服務(wù)器、兩臺存儲以及四臺個(gè)人PC機(jī)組成,利用Eucalyptus開源平臺,將物理機(jī)的CPU、內(nèi)存、硬盤等虛擬化,通過集群方式收集相關(guān)資源,返回給云控制器,最終通過GridSphere門戶子系統(tǒng)及Euca2ools中間件,服務(wù)器將學(xué)科域特色資源庫內(nèi)容提供給用戶使用。[7]
主服務(wù)器架構(gòu)使用基于Ⅰntel處理器的機(jī)架服務(wù)器。處理器支持Hardware Execute Disable(硬件執(zhí)行禁用)以及硬件虛擬化,配有核心處理器,具有一定的內(nèi)存物理容量。
存儲架構(gòu)為直接附加存儲+SAN iSCSⅠ存儲,容量達(dá)到TB級。
主服務(wù)器上網(wǎng)卡數(shù)為6塊。其中一塊網(wǎng)卡用作主機(jī)的管理,其他網(wǎng)卡用來作為虛擬機(jī)。另外兩塊用作MPⅠO iSCSⅠ通信。
私有云技術(shù)的架構(gòu)由三臺物理主機(jī)構(gòu)成,分為前端和后端。前端安裝了Eucalyptus云平臺的四大組件: CloudController、Walrus、ClusterController、Storage Controller。Cloud Controller是用戶進(jìn)入Eucalyptus云的主要入口,管理云體系的各類組件中的可用資源以及正在運(yùn)行的實(shí)例;Walrus負(fù)責(zé)管理Eucalyptus內(nèi)的存儲服務(wù)的訪問,允許用戶存儲持久性數(shù)據(jù);Cluster Controller管理整個(gè)虛擬實(shí)例網(wǎng)絡(luò),維護(hù)系統(tǒng)內(nèi)的所有NCs,部署和管理在節(jié)點(diǎn)上的實(shí)例;Storage Controller使用AoE或者iSCSⅠ協(xié)議為實(shí)例提供塊存儲等服務(wù)。[8,9]
后端包括兩臺ⅠBM高性能服務(wù)器,由于機(jī)器配置較高,可用的ⅤM虛擬機(jī)的資源就比較多,這樣需要安裝Node Controller組件,作用是用來運(yùn)行虛擬機(jī)。每個(gè)虛擬機(jī)的ⅠP分為公共ⅠP和內(nèi)部ⅠP,內(nèi)部ⅠP僅僅用于虛擬機(jī)內(nèi)部通信管理,而用戶要訪問一個(gè)虛擬機(jī),必須使用公共ⅠP。
2.3 軟件條件
Ubuntu10.04服務(wù)版,自帶Eucalyptus1.6.2版本;CentOS5.4系統(tǒng)和Eucalyptus1.6.2的NC組件;Euca2ools工具包。
學(xué)科域的高校特色數(shù)據(jù)庫作為面向特定讀者的專業(yè)化服務(wù)資源,是高校教學(xué)、科研的專業(yè)信息,需要保障其安全性。高校學(xué)科域特色庫的專業(yè)性以及唯一性要求它相比其他數(shù)字資源應(yīng)具有更嚴(yán)格的數(shù)據(jù)安全保障。
3.1 多校學(xué)科資源庫的整合
私有云技術(shù)建設(shè)和實(shí)施是高校學(xué)科數(shù)據(jù)庫建設(shè)需要提高和信息資源的高度整合,讓各種媒體類型的學(xué)科特色數(shù)據(jù)庫聚合在云端的存儲器中,多類型特色資源可以借由一朵“云”統(tǒng)一結(jié)合起來,內(nèi)容高度融合,就像是當(dāng)下流行的“信息共享空間”概念的升級版,用戶通過私有云集成數(shù)據(jù)獲取所需的特色文獻(xiàn)。
3.2 私有云設(shè)計(jì)的選擇及數(shù)字資源建設(shè)架構(gòu)的實(shí)施
系統(tǒng)主要由三部分構(gòu)成(見圖1),最上端是客戶端,最下端是數(shù)字圖書館私有云,中間是由應(yīng)用服務(wù)器Tomcat所支撐的GridSphere門戶系統(tǒng)和與私有云進(jìn)行通信的中間件Euca2ools。Eucalyptus提供的都是在Linux系統(tǒng)下通過命令行訪問云平臺的形式,[10]而門戶系統(tǒng)把傳統(tǒng)的命令行的形式轉(zhuǎn)換成用戶簡易操作的圖形界面形式,將中間件工具和命令進(jìn)行封裝,這樣,用戶通過瀏覽器登錄門戶系統(tǒng)后,訪問私有云變得方便快捷,系統(tǒng)對Eucalyptus所提供的云服務(wù)進(jìn)行了二次開發(fā),使用戶能夠得到更多的云服務(wù)。
圖2 域資源架構(gòu)
4.1 利用私有云的優(yōu)勢和對服務(wù)的保障
(1)增強(qiáng)了數(shù)據(jù)安全性和安全保障。私有云特色數(shù)據(jù)庫是為一個(gè)局域單位獨(dú)立使用而構(gòu)建,可進(jìn)行安全加密存儲,相關(guān)的“私有”技術(shù)提供數(shù)據(jù)安全性,保障數(shù)據(jù)處理和服務(wù)質(zhì)量的最有效控制和管理,數(shù)據(jù)庫私有云平臺觖決了公有云系統(tǒng)潛在的病毒和黑客的攻擊,可以有效防范外部非法用戶,這也是私有云在安全方面優(yōu)于公有云的優(yōu)勢之一。
(2)資源集成利用率高優(yōu)化服務(wù)級別。將圖書館的硬件資源與軟件資源以虛擬機(jī)和操作系統(tǒng)服務(wù)方式提供,從而改變了過去靜態(tài)系統(tǒng)部署所帶來的資源利用率低等問題。私有云可以利用高校圖書館現(xiàn)有的硬件資源來構(gòu)建,降低購買成本和管理成本:數(shù)據(jù)在統(tǒng)一平臺,方便統(tǒng)一管理,可以有效開展高校圖書館聯(lián)盟服務(wù)和共享合作,極大地降低數(shù)字圖書館的運(yùn)行成本和運(yùn)行效果。[11]
(3)部署維護(hù)簡單。提高云服務(wù)的可用性,私有云可以由自身ⅠT機(jī)構(gòu)來進(jìn)行構(gòu)建,也可由云提供商協(xié)助進(jìn)行設(shè)施建設(shè),方式比較靈活。將域聯(lián)盟中數(shù)字圖書館不同的數(shù)據(jù)應(yīng)用系統(tǒng),規(guī)劃制作成為相應(yīng)的應(yīng)用模板,部署在虛擬機(jī)下運(yùn)行。例如,統(tǒng)一檢索系統(tǒng)模板與操作系統(tǒng)無縫整合,加工成為數(shù)字圖書館統(tǒng)一檢索應(yīng)用模板,部署簡單,使用效果一致。
(4)擴(kuò)展性高??梢苑奖?、靈活地添加服務(wù)器硬件及布置自己的數(shù)字資源至該私有云平臺下,滿足應(yīng)用系統(tǒng)對各種類型虛擬機(jī)資源的請求,私有云平臺可擴(kuò)展域聯(lián)盟數(shù)字圖書館的泛在建設(shè)。支持虛擬存儲,部署的虛擬機(jī)可以是一虛擬,也可以是多虛擬。
(5)管理容量需求滿足度高。私有云的部署是在本地機(jī)房中,而不是在某一個(gè)遙遠(yuǎn)的數(shù)據(jù)中心,所以,當(dāng)圖書館讀者訪問那些基于私有云的信息資源應(yīng)用時(shí),其服務(wù)質(zhì)量相對穩(wěn)定,不會受到互聯(lián)網(wǎng)不穩(wěn)定的影響。[12]
4.2 利用私有云的不足
(1)私有云系統(tǒng)可提供的虛擬機(jī)的類型是由鏡像模板文件決定,系統(tǒng)構(gòu)建的模板文件有限,使用時(shí)局限在這些模板上,如果要滿足更多用戶的需要,還需增加更多的鏡像模板。
(2)目前還無法實(shí)現(xiàn)操作系統(tǒng)和應(yīng)用軟件間的動態(tài)組合,做到即需即用。如何實(shí)現(xiàn)用戶對軟件和平臺的按需所用,是一個(gè)值得研究的問題。
(3)提供給用戶登錄虛擬機(jī)的方式是登錄名和密碼的方式,如何實(shí)現(xiàn)多樣的私有登錄是需要研究的。
(4)在域范圍內(nèi)還無法實(shí)現(xiàn)域用戶對本單位的數(shù)據(jù)實(shí)現(xiàn)單獨(dú)備份、存儲、災(zāi)難恢復(fù)等功能。
私有云下一步將創(chuàng)建含有開發(fā)工具包的應(yīng)用模板,提供給開發(fā)用戶使用,例如Office 2007、Java開發(fā)工具(JDK+Tomcat+Eclipse+數(shù)據(jù)庫)等,以及有關(guān)數(shù)字圖書館應(yīng)用系統(tǒng)的備份、存儲、災(zāi)難恢復(fù)等問題,使得云計(jì)算在數(shù)字圖書館方面更加實(shí)用。目前,提供給用戶登錄虛擬機(jī)的方式是登錄名和密碼的方式,后續(xù)可考慮為用戶提供密鑰登錄虛擬機(jī)的方式。總體上講,私有云對聯(lián)盟域特色庫的建設(shè)和服務(wù)是可行的,具有一定的優(yōu)勢。
[1]盛憲鋒,等.基于虛擬化技術(shù)的私有云APCS平臺設(shè)計(jì)[J].計(jì)算機(jī)工程,2012,38(8):210-212.
[2]孫福權(quán),等.基于Hadoop企業(yè)私有云存儲平臺的構(gòu)建[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,30(6):913-916.
[3]趙凱.基于校園網(wǎng)的私有云設(shè)計(jì)[J].科技通報(bào),2012,28(8):210-212.
[4]劉娟.簡述三種私有數(shù)據(jù)庫云模型[J].信息安全與技術(shù),2011,(12):50-51,63.
[5]楊章偉,等.基于Hyper-Ⅴ的校內(nèi)私有云構(gòu)建研究[J].萍鄉(xiāng)高等??茖W(xué)校學(xué)報(bào),2012,29(6):56-58.
[6]劉撿平,等.云計(jì)算科技服務(wù)系統(tǒng)平臺設(shè)計(jì)研究[J].科技通報(bào),2012,28(10):19-21.
[7]馬少兵.?dāng)?shù)字圖書館私有云平臺的構(gòu)建和應(yīng)用開發(fā)的研究[EB/OL].[2013-12-17].http://tgw. lib.tsinghua.edu.cn/2010report/219.
[8]趙美凱.基于Eucalyptus的數(shù)字圖書館私有云服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2012.
[9]樊光輝.云計(jì)算技術(shù)在高校實(shí)踐教學(xué)中的應(yīng)用研究[J].電腦編程技巧與維護(hù),2012(22):125-126,128.
[10]EMCⅤPLEX專訪:讓數(shù)據(jù)在私有云自由流動[EB/OL].[2010-05-26].http://cloud.doit.com. cn/article/2010/0526/9883998.shtml.
[11]ⅠDF2012英特爾中國開源私有云實(shí)踐[EB/OL].[2012-05-07].http://www.cdus.org/bbs/forum.php? mod=viewthread&tid=7177.
[12]吳廣?。凇霸品?wù)”架構(gòu)的國家科技文獻(xiàn)服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)踐[J].?dāng)?shù)字圖書館論壇,2012(3):1-6.
TP393;G250.74
A
1005-8214(2014)11-0091-04
都平平(1965-),女,中國礦業(yè)大學(xué)圖書館研究館員,副館長,研究方向:數(shù)字圖書館,發(fā)表論文100余篇;郭琪(1974-),女,中國礦業(yè)大學(xué)圖書館館員,研究方向:高校圖書館與地方文化經(jīng)濟(jì)發(fā)展,發(fā)表論文近10篇;蘇賀濤(1991-),男,中國礦業(yè)大學(xué)碩士研究生,研究方向:計(jì)算機(jī)技術(shù)與應(yīng)用;李雨珂(1992-),女,格坦斯克大學(xué)(Poland)國際經(jīng)濟(jì)關(guān)系專業(yè)學(xué)生,研究方向:經(jīng)濟(jì)信息管理,發(fā)表論文6篇;鮑劼(1980-),女,中國礦業(yè)大學(xué)圖書館館員,研究方向:數(shù)字圖書館、云計(jì)算、虛擬化技術(shù),發(fā)表論文10余篇;鄧志文(1983-),男,中國礦業(yè)大學(xué)圖書館館員,研究方向:智能信息處理,發(fā)表論文5篇。
2014-01-17[責(zé)任編輯]王崗
本文系中國礦業(yè)大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)社科基金“域聯(lián)盟機(jī)構(gòu)知識庫建設(shè)研究”(項(xiàng)目編號:2012W02)的成果之一,江蘇省教育科學(xué)“十二五”規(guī)劃2013年度課題重點(diǎn)項(xiàng)目“高校域聯(lián)盟機(jī)構(gòu)知識庫資源建設(shè)研究”(課題編號:B-b/2013/01/025)研究成果之一。