王喜平
云計算環(huán)境下數(shù)字圖書館信息服務(wù)平臺的研究
王喜平
隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的發(fā)展,針對數(shù)字圖書館信息資源的利用環(huán)境逐漸由物理空間向虛擬空間轉(zhuǎn)變,信息資源的存在方式也逐漸由模擬狀態(tài)向數(shù)字狀態(tài)轉(zhuǎn)變。通過將云計算中的虛擬化、分布式數(shù)據(jù)存儲、海量數(shù)據(jù)處理和云平臺等關(guān)鍵技術(shù)應(yīng)用于構(gòu)建數(shù)字圖書館信息服務(wù)云平臺,構(gòu)建了云環(huán)境下數(shù)字圖書館信息服務(wù)體系結(jié)構(gòu),并提出了云環(huán)境下數(shù)字圖書館個性化信息服務(wù)的框架模型。為高校圖書館在云計算環(huán)境下開展個性化知識服務(wù)提供了參考。
云計算;web服務(wù);數(shù)字圖書館;虛擬化;信息服務(wù)
在網(wǎng)絡(luò)環(huán)境下,如何實現(xiàn)圖書館之間,海量數(shù)據(jù)資源的無縫連接,實現(xiàn)資源共享和利用,為用戶提供個性化的服務(wù)。云計算是一種服務(wù)使用模式,是并行計算、分布式計算和網(wǎng)格計算的發(fā)展,是虛擬化、效用計算、基礎(chǔ)設(shè)施即服務(wù)、軟件即服務(wù)和平臺即服務(wù)等內(nèi)容與概念的綜合[1]。在該計算模式中,網(wǎng)絡(luò)、服務(wù)器、存儲設(shè)備、應(yīng)用軟件和各種服務(wù)組成資源池,這些資源通過網(wǎng)絡(luò)以服務(wù)的方式供用戶使用[2]。云計算模式下,任務(wù)處理過程分布在分布式計算機上,數(shù)據(jù)中心以互聯(lián)網(wǎng)提供服務(wù)的模式運行[3]。云計算通過把散落在不同設(shè)備或者介質(zhì)上的數(shù)字資源進行重新組合、協(xié)調(diào)、排序,為數(shù)字圖書館信息服務(wù)提供了一個集成的應(yīng)用平臺;該平臺可以加工、存儲數(shù)字信息資源,能夠不受時間、地點限制,可以隨時獲取信息資源。用戶所需的信息資源存儲在云服務(wù)平臺中,可以最大程度的滿足用戶對數(shù)字圖書館的信息需求。
數(shù)字圖書館是一個基于網(wǎng)絡(luò)環(huán)境的信息管理系統(tǒng),可發(fā)在任何時間、任何地點為用戶提供所需要的服務(wù)的操作系統(tǒng),數(shù)字圖書館信息管理系統(tǒng)在Web中的結(jié)點上運行。數(shù)字圖書館具有跨學(xué)科性、跨領(lǐng)域性以及研究角度的差異性等特點[4]。其主要功能:提供數(shù)字化資源服務(wù)技術(shù)、信息化資源的存儲、提供信息的檢索機制和檢索信息的發(fā)送。數(shù)字圖書館信息管理系統(tǒng)是一種分布式的信息系統(tǒng),擁有多種媒體內(nèi)容的資源,它以網(wǎng)絡(luò)方式把各種信息資源提供用戶、為用戶提供方便、快捷有效的信息存取服務(wù)。高效的利用其豐富的信息資源來滿足用戶需求。數(shù)字圖書館具有占用空間小且易保存、查閱檢索方便、獲取信息迅速和資源共享的優(yōu)點。數(shù)字圖書館作為信息資源數(shù)據(jù)中心,需要長期保存大量的數(shù)據(jù)信息資源以方便用戶使用。云服務(wù)平臺由用戶需求主導(dǎo),用戶通過互聯(lián)網(wǎng)進入云服務(wù)平臺,利用云服務(wù)平臺所提供的服務(wù),用戶可在任意時間、地點的訪問所需要的信息資源,同時平臺內(nèi)帶寬和計算資源可以被用戶共享。云計算環(huán)境下的數(shù)字圖書館改變了傳統(tǒng)的圖書館信息服務(wù)模式,使數(shù)字圖書館的功能和角色發(fā)生重大變革。
云計算是一種在分布式計算、網(wǎng)格計算、并行計算、效用計算等傳統(tǒng)計算技術(shù)的基礎(chǔ)上相互融合發(fā)展起來的信息資源提供方式,通過互聯(lián)網(wǎng)將動態(tài)、異構(gòu)的硬件資源、軟件資源、平臺管理資源等進行系統(tǒng)的優(yōu)化和有效整合,通過互聯(lián)網(wǎng)以按需付費的服務(wù)方式提供給用戶的新型信息服務(wù)方式[5]。云計算應(yīng)具有大規(guī)模、高可擴展性、按需服務(wù)、資源共享、虛擬化和成本低廉的特點[6]。云計算系統(tǒng)由用戶交互界面提供云計算服務(wù)交換的接口、用戶通過服務(wù)目錄可以查找所需、通過系統(tǒng)管理計算機資源、應(yīng)用提供工具為用戶提供需求服務(wù)、監(jiān)測跟蹤監(jiān)測云計算的使用,以保證資源可以合理有效的分配,服務(wù)器集群提供云計算服務(wù)所需的計算資源,由系統(tǒng)管理工具所控制。服務(wù)器集群服務(wù)器集群可以是物理的也可以是虛擬化的。如圖1所示:
圖1 云計算的系統(tǒng)架構(gòu)
數(shù)字圖書館提供信息服務(wù)需具備3個要素:信息資源、傳輸渠道以及用戶。信息資源是數(shù)字圖書館的基礎(chǔ),讀者是數(shù)字圖書館的服務(wù)對象,數(shù)字圖書館通過網(wǎng)絡(luò)把信息資源傳遞給讀者來形成訪問服務(wù)行為。數(shù)字圖書館能否提供個性化定制的信息服務(wù)是其吸引現(xiàn)有用戶、開發(fā)潛在用戶并留住用戶的關(guān)鍵所在。
數(shù)字圖書館云平臺的架構(gòu)采用跨平臺技術(shù),對異構(gòu)的圖書館數(shù)據(jù)庫資源進行元數(shù)據(jù)收割與管理整合到統(tǒng)一的云平臺上,為用戶提供個性化的信息服務(wù)。數(shù)字圖書館云平臺的構(gòu)建涉及三個方面:提供服務(wù)的底層物理設(shè)備和基礎(chǔ)設(shè)施,提供服務(wù)調(diào)度的管理平臺和數(shù)據(jù)資源,提供服務(wù)的應(yīng)用程序和服務(wù)接口等。云平臺的構(gòu)建有兩種方案:①自建私有云平臺;②付費使用Google App Engine和Microsoft Azure 云平臺。
(1)私有云平臺搭建
數(shù)字圖書館在提供個性化的信息服務(wù)時對用戶的個性化信息有很強的依賴性,即數(shù)字圖書館需要根據(jù)用戶的訪問行為來提供個性化的數(shù)據(jù),這其中涉及到用戶信息的安全性。數(shù)字圖書館向用戶提供信息服務(wù),除了依賴其付費購買的公共資源和網(wǎng)絡(luò)資源外,還有一部分其自建的信息資源。出于這兩個方面的考慮,我們可以針對這部分信息自建一個私有的云平臺。私有云建成之后,可以降低成本,使用起來也更加方便,需求也可以更好更快地得到響應(yīng)。數(shù)字圖書館內(nèi)部核心數(shù)據(jù)的傳輸可以通過內(nèi)部網(wǎng)絡(luò)在私有云上進行處理和存儲,這樣就解決了數(shù)據(jù)的安全問題。
搭建數(shù)字圖書館信息服務(wù)的私有云平臺,需應(yīng)用虛擬化技術(shù)來實現(xiàn)服務(wù)器資源的統(tǒng)一管理,具體可以采用微軟的Hyper-v或VMware的ESXh 的遷移技術(shù)來整合多臺服務(wù)器資源,這樣能夠降低服務(wù)器的成本以及提高服務(wù)器的利用效率。
(2)部署“公有云”平臺方案
云服務(wù)提供商通過互聯(lián)網(wǎng)可以同時向多個數(shù)字圖書館提供公有云服務(wù)。輕松地實現(xiàn)了圖書館之間的信息資源共享。利用公有云提供的服務(wù),既能操作便利又具有很強的安全保障。 數(shù)字圖書館在提供個性化信息服務(wù)時,可以將公共基礎(chǔ)資源、后臺數(shù)據(jù)以及 云門戶網(wǎng)站都部署在公有云上,這能有效的降低數(shù)字圖書館的信息服務(wù)成本和維護成本。鑒于目前云計算行業(yè)的現(xiàn)狀,用戶可以根據(jù)數(shù)字圖書館需要選擇購買使用亞馬遜的彈性計算公有云平臺。 本文結(jié)合數(shù)字圖書館服務(wù)使用和云計算的實現(xiàn)情況,搭建一個數(shù)字圖書館的混合云平臺,即針對數(shù)字圖書館自建的資源部署在私有云平臺上,將網(wǎng)絡(luò)資源和其他資源部署在公有云平臺上,具體部署方案如圖2所示:
圖2 基于云計算的數(shù)字圖書館信息服務(wù)網(wǎng)絡(luò)平臺
4.1 數(shù)字圖書館信息服務(wù)框架設(shè)計
根據(jù)云計算技術(shù)的特點以及數(shù)字圖書館采用個性化信息服務(wù)的現(xiàn)狀,把數(shù)字圖書館的基礎(chǔ)設(shè)施資源整合到統(tǒng)一的云服務(wù)平臺上,構(gòu)建數(shù)字圖書館信息服務(wù)云平臺,可以為用戶提供應(yīng)用服務(wù)程序和接口。利用集群技術(shù)、虛擬化技術(shù)、分布式技術(shù)來進行數(shù)據(jù)和資源的調(diào)度與分配構(gòu)建了一個 3層框架模型,該體系結(jié)構(gòu)自上而下劃分為應(yīng)用服務(wù)層、中間管理層和基礎(chǔ)設(shè)施層,這種部署提高了系統(tǒng)架構(gòu)的靈活性和可擴展性,如圖3所示:
圖3 云計算環(huán)境下數(shù)字圖書館個性化信息服務(wù)總體框架設(shè)計
(1)應(yīng)用服務(wù)層
該層通過將應(yīng)用程序或軟件進行封裝,最終以服務(wù)的方式提供給用戶訪問和使用。在模型中,應(yīng)用服務(wù)層為用戶提供了各種類型的可以直接訪問的服務(wù),如公共信息服務(wù)、檢索服務(wù)和個性化信息服務(wù)等;該層還提供了服務(wù)訪問接口,該接口特征明確、定位清晰,具有易用性和可移植性,用戶使用各種終端設(shè)備,如 PC、移動設(shè)備或者其他任何可以聯(lián)網(wǎng)的設(shè)備都可以快速的訪問和部署服務(wù)及資源,具有很強的用戶友好性。該層主要提供數(shù)字圖書館云服務(wù)平臺門戶網(wǎng)站,用戶通過登錄網(wǎng)站首頁接入云服務(wù)平臺就可獲得所需的服務(wù)。在其之上的電腦客戶端與移動客戶端是用戶與數(shù)字圖書館進行交互和通信的工具,是用戶使用云服務(wù)的平臺,可以不受時間地點設(shè)備的限制,訪問云服務(wù)網(wǎng)絡(luò)的所需資源,如PC機、瀏覽器和移動終端設(shè)備等。
(2)中間管理層
中間管理層具有承上啟下的作用,它為上層的應(yīng)用服務(wù)層提供支撐,又對底層的基礎(chǔ)設(shè)施層進行抽象封裝。本層是基于云計算的PaaS來實現(xiàn)和部署的,它為應(yīng)用程序提供了一個開源的環(huán)境,為高層服務(wù)提供了軟件環(huán)境、中間件及數(shù)據(jù)庫等的訪問接口,通過身份識別和認證為部署高層次的服務(wù)提供了一個統(tǒng)一的平臺和接口。
中間層是數(shù)字圖書館提供個性化信息的核心層,為應(yīng)用程序提供資源,并對資源進行合理的調(diào)度和優(yōu)化處理,最終提供給用戶使用。該層通過各種虛擬化技術(shù)對底層基礎(chǔ)設(shè)施進行虛擬化操作,同時實時采集用戶信息并及時更新。云平臺通過對各節(jié)點圖書館的數(shù)據(jù)快速訪問和部署來提高數(shù)字圖書館的運行效率和服務(wù)質(zhì)量。用戶向數(shù)字圖書館提出服務(wù)請求,數(shù)據(jù)處理模塊對用戶需求進行分析和細化,資源調(diào)度模塊根據(jù)細化后的需求動態(tài)的調(diào)度合適的資源給用戶。
(3)基礎(chǔ)設(shè)施服務(wù)層
基礎(chǔ)設(shè)施層是整個體系結(jié)構(gòu)的支撐,通過集群技術(shù)將各種物理設(shè)施設(shè)備和資源封裝起來形成服務(wù)資源池供上層調(diào)度和使用。該層主要實現(xiàn)虛擬化集群和數(shù)據(jù)存儲的功能。通過虛擬化技術(shù)將分布在不同節(jié)點的主機、服務(wù)器、存儲設(shè)備、網(wǎng)絡(luò)帶寬等物理設(shè)施集成形成一個整體,構(gòu)成整個云計算系統(tǒng)的基礎(chǔ)設(shè)施,擴展了物理設(shè)備的性能,優(yōu)化了對數(shù)字資源的訪問。用戶可以透明的對數(shù)字圖書館進行訪問,無需關(guān)注數(shù)字圖書館基礎(chǔ)設(shè)施內(nèi)部的部署方案和運行情況;分布式存儲數(shù)據(jù)資源,形成一個動態(tài)可擴展的存儲資源池,該資源池具有強大的計算能力和按需擴展能力,能夠滿足海量數(shù)據(jù)環(huán)境下大規(guī)模并發(fā)用戶的個性化信息請求。數(shù)字圖書館信息服務(wù)云平臺的每一層都可以利用相應(yīng)的云計算服務(wù)來構(gòu)建,并且實現(xiàn)數(shù)字圖書館云平臺功能的最大化?;A(chǔ)設(shè)施層可以利用基礎(chǔ)實施即服務(wù)(IaaS)來構(gòu)建計算機集群,形成強大的彈性計算能力,實現(xiàn)資源利用的最大化,為中間管理層提供物理和數(shù)據(jù)支持;中間管理層利用平臺即服務(wù)(PaaS)可以來構(gòu)建圖書館的系統(tǒng)平臺服務(wù)環(huán)境,應(yīng)用服務(wù)層利用云計算技術(shù)的軟件即服務(wù)(SaaS)可以來構(gòu)建云圖書館的數(shù)字化管理系統(tǒng)、信息檢索平臺以及其他應(yīng)用服務(wù)軟件,通過對云計算的應(yīng)用,最終形成基于云計算的數(shù)字圖書館信息服務(wù)云平臺。
4.2 數(shù)字圖書館個性化信息服務(wù)技術(shù)模型
數(shù)字圖書館個性化信息服務(wù)體系采用J2EE框架的體系結(jié)構(gòu)。如圖4所示:
圖4 數(shù)字圖書館個性化信息服務(wù)技術(shù)模型
需要跨平臺的互操作性和異構(gòu)數(shù)據(jù)的整合,因此數(shù)字圖書館的個性化信息服務(wù)技術(shù)模型設(shè)計分為:(1)客戶端層,此層主要為用戶提供功能一致的服務(wù)界面,是各種客戶端程序的開發(fā),提高了用戶的感知體驗,具有兼容性和可移植性;(2)應(yīng)用服務(wù)層,利用云計算提供的開源框架快速開發(fā)和部署數(shù)字圖書館個性化信息服務(wù),通過訪問低層提供的服務(wù)接口和各種基礎(chǔ)設(shè)施設(shè)備,實現(xiàn)客戶端與應(yīng)用程序的無縫集成,并最終封裝成服務(wù)提供給用戶使用;(3)管理平臺層,通過各種開源的云計算技術(shù),對底層設(shè)備管理和封裝,并通過統(tǒng)一的云資源管理平臺對資源進行調(diào)度和監(jiān)控;(4)基礎(chǔ)設(shè)施層,此層提供各種軟硬件資源的虛擬化處理和封裝,實現(xiàn)整個系統(tǒng)的透明使用和統(tǒng)一訪問。
將云計算應(yīng)用到數(shù)字圖書館領(lǐng)域,構(gòu)建一個成功的基于云計算的數(shù)字圖書館服務(wù)系統(tǒng)是一項長期而艱巨的任務(wù),不僅需要致力于數(shù)字圖書館的研究人員不斷地鉆研探索,而且需要努力適應(yīng)新的形勢對數(shù)字圖書館發(fā)展的需要。
4.3 個性化信息服務(wù)的實現(xiàn)
數(shù)字圖書館要在海量數(shù)據(jù)環(huán)境下實現(xiàn)個性化信息服務(wù),為用戶提供高質(zhì)量的信息內(nèi)容,其關(guān)鍵是精確匹配用戶的個性化需求。用戶個性化信息的獲取可以通過顯示獲取和隱式獲取,獲取的用戶個性化信息要注意弱化用戶真實信息的透露,通過數(shù)據(jù)挖掘和聯(lián)機分析處理,得到量化的用戶興趣信息并構(gòu)建用戶興趣模型。個性化的信息服務(wù)功能設(shè)計主要有個性化信息獲取模塊、個性化信息組織模塊、個性化信息服務(wù)提供模塊。如圖5所示:
圖5 個性化信息服務(wù)功能結(jié)構(gòu)圖
個性化信息獲取模塊主要通過用戶的注冊、檢索、瀏覽等獲取用戶興趣信息,個性化信息組織模塊通過對用戶行為的ap-Reduce 處理構(gòu)建用戶興趣特征庫、構(gòu)建用戶興趣模型,根據(jù)用戶興趣模型,對資源池的信息進行化簡和處理,得到用戶興趣信息的推薦列表;通過個性化信息服務(wù)提供模塊,為最終用戶和管理者提供個性化信息推送服務(wù)、參考咨詢服務(wù)、智能代理服務(wù)等多種不同的服務(wù)。云計算環(huán)境下的數(shù)字圖書館個性化信息服務(wù)平臺,為用戶接入方式實現(xiàn)個性化。通過網(wǎng)絡(luò),移動設(shè)備等訪問數(shù)字圖書館。實現(xiàn)個性化的信息提供與發(fā)布。滿足用戶對個性化知識交流和共享的需求。使得用戶可以享受一站式的個性化信息服務(wù)。
隨著云計算的出現(xiàn),利用虛擬化技術(shù)和云存儲相關(guān)技術(shù)解決目前數(shù)字圖書館信息服務(wù)的限制和瓶頸,給數(shù)字圖書館個性化信息服務(wù)帶來無限的應(yīng)用。本文重點研究了數(shù)字圖書館個性化信息服務(wù)的設(shè)計問題,構(gòu)建基于云計算的數(shù)字圖書館個性化信息服務(wù)平臺,改變了用戶與數(shù)字圖書館之間的主被動關(guān)系,實現(xiàn)讀者用戶可以根據(jù)自已需要構(gòu)建其相應(yīng)的私有云,拓展了數(shù)字圖書館個性化信息服務(wù),為用戶提供更加多樣化的個性化信息服務(wù),用戶可以根據(jù)自己的需要來定制服務(wù),提升了個性化信息服務(wù)的能力和質(zhì)量,服務(wù)平臺系統(tǒng)具有較強的可擴展性,為數(shù)字圖書館的未來發(fā)展提供了廣闊的空間。解決了數(shù)字圖書館個性化信息服務(wù)的設(shè)計問題,為下一步研究奠定基礎(chǔ)。
[1] 劉鵬.云計算[M].北京:電子工業(yè)出版社,2010:1-2.
[2] 周彤.欠發(fā)達地區(qū)農(nóng)村用戶個性化信息需求與服務(wù)[J].高校圖書館工作,2011,31(5):72-74.
[3] 陳雙慶,高志平.用戶個性化模式的信息搜索服務(wù)探索[J].農(nóng)業(yè)圖書情報學(xué)刊,2013,25(07):14-17
[4] 顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書館個性化服務(wù)的探討[J].圖書館雜志,2013(8):63-65.
[5] 王園.網(wǎng)絡(luò)環(huán)境下高校圖書館個性化信息服務(wù)研究[J].情報科學(xué),2011,29(8):1192-1196.
[6] Fox R.Library in the clouds[J].OCLC Systems&Services, 2009(3):156-161.
TN919 文獻標志碼:A
2015.06.02)
1007-757X(2015)08-0073-03
王喜平(1963-),女,駐馬店人,黃淮學(xué)院圖書館,館員,本科,研究方向:圖書信息資源管理,駐馬店,463000