文 / 徐延華
云計算作為一種基于互聯(lián)網(wǎng)的基礎(chǔ)服務(wù)共享架構(gòu)新方法,可以實現(xiàn)資源共享和海量存儲。近年來,這一技術(shù)在多個行業(yè)得到廣泛應(yīng)用。隨著人們對于數(shù)字信息資源需求的不斷增加,開展數(shù)字圖書館資源整合、滿足用戶的信息需求已經(jīng)成為數(shù)字圖書館發(fā)展的必然要求。因此,如何充分利用云計算在信息資源整合方面的優(yōu)勢進一步提升圖書館信息服務(wù)能力,是數(shù)字圖書館開展信息資源建設(shè)的關(guān)鍵。
隨著信息技術(shù)的快速發(fā)展,以傳統(tǒng)圖書和文獻資料為主要載體的圖書館信息資源已經(jīng)難以滿足用戶的個性化需求,數(shù)字化圖書館逐步成為信息時代文獻資源建設(shè)和服務(wù)的發(fā)展方向。但是數(shù)字資源體量大、種類多、內(nèi)容參差不齊,給用戶的檢索帶來了諸多不便。因此,從用戶需求出發(fā),以數(shù)字資源的集中管理、快捷檢索為目標,將分散、無序的信息資源整合起來,組建一個統(tǒng)一、有機的集成化系統(tǒng),實現(xiàn)不同資源之間的無縫鏈接和用戶的透明訪問,實現(xiàn)數(shù)字資源整合,是數(shù)字圖書館建設(shè)的關(guān)鍵。
但是隨著信息資源量劇增以及人們對于知識獲取需求的日益增加,數(shù)字圖書館面臨的海量信息資源整合的難題,已經(jīng)成為制約數(shù)字圖書館資源建設(shè)的瓶頸。云計算作為一種新的IT資源服務(wù)模式,可以將分布式計算、并行計算、互聯(lián)網(wǎng)技術(shù)有效地結(jié)合起來[1-2],通過網(wǎng)絡(luò)技術(shù)將成本較低的計算實體集成為具有強大計算功能的系統(tǒng),通過SaaS、PaaS、IaaS等模式對外提供服務(wù),為終端用戶減少處理負擔。與傳統(tǒng)計算相比,云計算將計算功能和存儲功能抽象化,以服務(wù)的形式分布到終端用戶中,可以便捷地實現(xiàn)用戶間的資源共享和計算效率的提升。
數(shù)字圖書館資源整合中應(yīng)用云計算技術(shù),可以大幅度提升檢索速度,滿足用戶的多元化、個性化檢索需求,實現(xiàn)數(shù)字資源一體化建設(shè)[3-4]。云計算環(huán)境下,各個數(shù)字圖書館借助網(wǎng)絡(luò)服務(wù)整合為分布式的網(wǎng)絡(luò)圖書館,通過動態(tài)適應(yīng)性的信息資源整合,為用戶提供優(yōu)質(zhì)的信息服務(wù),既可以在一定程度上消除信息孤島,促進信息資源共享,避免資源重復(fù)建設(shè),節(jié)約建設(shè)成本;又可以重構(gòu)信息資源體系,加強信息資源之間的內(nèi)在聯(lián)系,提高信息關(guān)聯(lián)度和完整性,實現(xiàn)不同資源之間的鏈接和溝通。云計算作為一種資源的有效匯聚和全新管理機制,有助于數(shù)字圖書館提升信息服務(wù)水平和能力[5-6]。在硬件設(shè)施方面,云服務(wù)的硬件服務(wù)體系可以為虛擬數(shù)據(jù)提供良好的硬件支撐,進而節(jié)約硬件設(shè)備和人力投入,方便數(shù)字圖書館日常管理;在軟件服務(wù)方面,云計算可以按需制定軟件服務(wù)行為,打破圖書館單一的集成管理系統(tǒng),幫助經(jīng)濟實力不強的中小圖書館實現(xiàn)信息化建設(shè);在存儲方面,云計算基于互聯(lián)網(wǎng)和集群應(yīng)用技術(shù),將數(shù)據(jù)存儲在服務(wù)提供商的服務(wù)器中,既能為用戶提供快捷的數(shù)據(jù)存儲支持,又能有效降低圖書館數(shù)據(jù)存儲、維護等成本投入。
信息資源整合的核心在于實現(xiàn)不用類型、不同格式信息資源之間的無縫連接和全面共享,形成跨平臺、跨數(shù)據(jù)庫、跨內(nèi)容的新型信息資源體系結(jié)構(gòu)。云環(huán)境下的信息資源整合涵蓋數(shù)據(jù)庫、系統(tǒng)、檢索方式、技術(shù)、協(xié)議標準等多方面內(nèi)容。其中數(shù)據(jù)庫的整合是對分散異構(gòu)數(shù)據(jù)進行無縫鏈接、整合分析,摒除多個數(shù)據(jù)庫中的重復(fù)信息,建立新的虛擬數(shù)字資源體系;系統(tǒng)整合是通過分解和重組等方式對應(yīng)用系統(tǒng)、數(shù)字資源進行整合,使其在組織結(jié)構(gòu)和表達方式等方面趨于共性并形成統(tǒng)一的管理平臺;檢索方式整合是以組合檢索等方式為用戶提供全方位的檢索服務(wù),方便用戶準確定位具體信息;技術(shù)整合是將多種資源整合技術(shù)合并以解決信息孤島難題;協(xié)議標準整合則是采用合適的技術(shù)手段,實現(xiàn)基于不同訪問協(xié)議和數(shù)據(jù)庫標準的數(shù)據(jù)庫在同一界面的統(tǒng)一檢索。
數(shù)字資源作為圖書館領(lǐng)域研究的熱點和難點,在整合機制的選擇上需要綜合考慮整合內(nèi)容和云計算的特征。目前數(shù)字資源整合的實現(xiàn)機制包括數(shù)據(jù)倉庫整合機制、中介器封裝器整合機制、代理整合機制等。其中數(shù)據(jù)倉庫整合機制是一種物理集成方式,可以滿足不同服務(wù)器之間資源一致性存儲的需求,為用戶提供復(fù)雜的信息檢索服務(wù),使信息資源的類型與范圍更加廣泛,數(shù)字圖書館可以在此基礎(chǔ)上整合多種資源,建立全方位的OPAC資源管理系統(tǒng);中介器封裝器整合機制作為一種虛擬的整合方式,應(yīng)用中介器解決用戶提問和檢索結(jié)果的整合,應(yīng)用封裝器解決信息源的連接和具體查詢,不需要在本地存儲大量的數(shù)字資源,能適應(yīng)云計算環(huán)境下信息資源數(shù)量多、更新快等特點,是目前數(shù)字資源整合的主流方式;代理整合機制作為近年來新興的一種整合機制,通過合理利用用戶Agent、資源Agent、代理方Agent來提高系統(tǒng)的整合效率,能夠主動適應(yīng)網(wǎng)絡(luò)環(huán)境的變化,增強了系統(tǒng)的靈活性。
1.云計算服務(wù)模式。根據(jù)服務(wù)類型,云計算可以為數(shù)字圖書館提供三種服務(wù)模式:SaaS(Software as a Service,軟件即服務(wù))、PaaS(Platform as a Service,平臺即服務(wù))、IaaS(Infrastructure as a Service,基礎(chǔ)設(shè)施即服務(wù))。
SaaS是21世紀發(fā)展起來的基于互聯(lián)網(wǎng)的軟件應(yīng)用模式,代表軟件科技發(fā)展的最新趨勢,是目前應(yīng)用最廣泛的一種云計算模式。在數(shù)字圖書館建設(shè)的過程中,提供商負責(zé)搭建基礎(chǔ)網(wǎng)絡(luò)設(shè)施和運作平臺,并負責(zé)系統(tǒng)的升級維護,數(shù)字圖書館只需購買相應(yīng)的軟件即可為用戶提供服務(wù)。以SaaS為基礎(chǔ)的資源整合是一站式的資源整合,云端資源基于SaaS技術(shù)可以將不同數(shù)字圖書館的異構(gòu)資源集成到統(tǒng)一的Web站點,并為用戶提供統(tǒng)一的檢索接口,能夠有效提高資源利用率和館間資源互補能力。其中比較有代表性的是谷歌公司在“云”概念的范疇下,將世界范圍內(nèi)的圖書館學(xué)術(shù)資源進行整合,推出了谷歌學(xué)術(shù)搜索(Google Scholar),具有便捷、全面、功能強大的特點,大大縮短了讀者檢索文獻的過程。
PaaS模式將服務(wù)器平臺作為一種可以提供的服務(wù)?;赑aaS的資源整合是通過構(gòu)建云服務(wù)平臺的方式,實現(xiàn)數(shù)字資源的最大集約化,進而最大程度地消除信息孤島。數(shù)字圖書館通過PaaS的中間平臺建立資源索引庫,對圖書館資源進行描述,將分散的數(shù)字圖書館館資源融合在一起,構(gòu)建一個統(tǒng)一可控的云資源整合中心。通過該平臺,云圖書管理員可以快速整合多個數(shù)字圖書館的資源,并及時向云端用戶提供相應(yīng)的檢索查詢服務(wù)。
IaaS模式下,用戶可以從完備的計算機基礎(chǔ)設(shè)施中獲取服務(wù),服務(wù)內(nèi)容包括處理、存儲、網(wǎng)絡(luò)等基本的計算資源以及操作系統(tǒng)、應(yīng)用程序等任意軟件的部署和運行。在服務(wù)運行的過程中,圖書館無需管理云計算基礎(chǔ)設(shè)施,但是可以控制相關(guān)程序的應(yīng)用。當前信息資源量激增,如何降低設(shè)備購置成本、提高資源保障水平,是數(shù)字圖書館亟待解決的問題。因此,數(shù)字圖書館基于IaaS的基礎(chǔ)設(shè)施共建共享模式構(gòu)建數(shù)字圖書館虛擬環(huán)境,可以實現(xiàn)基礎(chǔ)設(shè)施資源優(yōu)化整合并滿足用戶全方位的需求。
圖1 基于云計算的圖書館資源整合架構(gòu)
2.云計算服務(wù)架構(gòu)。在云計算服務(wù)模式的基礎(chǔ)上,構(gòu)建了如圖1所示的圖書館資源整合體系架構(gòu)。(1)SaaS讀者服務(wù)層主要為PC登錄、移動終端登錄等用戶登錄界面,用戶通過注冊賬號進入云桌面選擇所需要的服務(wù);(2)PaaS后臺管理層主要包括主服務(wù)控制機群和云監(jiān)控模塊等。主服務(wù)控制機群接收到用戶的信息請求后,通過對用戶身份進行合法性驗證和應(yīng)用請求類型的實時分析,動態(tài)分配合適的服務(wù)資源,在這個過程中,云監(jiān)控模塊對服務(wù)的執(zhí)行過程進行全程實時監(jiān)控,并對服務(wù)器進行管理操作;(3)IaaS基礎(chǔ)設(shè)施層中,存儲節(jié)點機群具有海量的存儲功能,可以滿足數(shù)字資源的存取需求。應(yīng)用節(jié)點機群是具有不同業(yè)務(wù)處理能力的應(yīng)用系統(tǒng),可以處理各種復(fù)雜的應(yīng)用請求。計算節(jié)點機群由多組云計算機群組成,可以滿足超大運算量的計算需求。云計算架構(gòu)的優(yōu)劣程度直接影響著數(shù)字圖書館信息資源服務(wù)的高效性和一致性,因此,以云計算圖書館架構(gòu)為基礎(chǔ),設(shè)計標準的管理流程,優(yōu)化管理模式,開展統(tǒng)一管理,可以最大化地提高資源利用效率。
云計算將眾多的計算機聯(lián)合起來,為圖書館提供強大的計算能力,可以完成單一計算機無法完成的計算任務(wù)。因此,云計算模式可以滿足用戶大規(guī)模同時在線檢索的服務(wù)需求,大幅提升圖書館的檢索效率。在本地云構(gòu)建的過程中,應(yīng)用數(shù)據(jù)庫技術(shù)、數(shù)據(jù)挖掘技術(shù),可以在實現(xiàn)資源整合的基礎(chǔ)上實現(xiàn)信息的智能化搜索,系統(tǒng)通過自動搜索并對搜索的信息進行權(quán)衡評價,幫助用戶獲取所需的信息。此外,用戶可以使用電腦、手機等設(shè)備的信息檢索平臺,通過統(tǒng)一的認證和檢索操作,隨時隨地獲取所需的信息資源,保證了用戶登錄檢索的便捷性,實現(xiàn)了用戶信息檢索服務(wù)的智能化、一體化。
基于大量系統(tǒng)連接而成的基礎(chǔ)設(shè)施,不同圖書館之間可以共享館際信息資源,而不必更新相關(guān)硬件設(shè)備,在降低投入、節(jié)約能耗、加快綠色數(shù)據(jù)計算的同時,大大提高了數(shù)字資源的利用率。因此,云計算的應(yīng)用會推動數(shù)字圖書館信息資源的整合共享,有利于促進圖書館之間的合作尤其是圖書館聯(lián)盟的構(gòu)建。
動態(tài)分配資源是云計算的重要特征之一。當出現(xiàn)大量用戶同時檢索、訪問量過大的情況時,云計算會采取“按需索取”的服務(wù)方式進行動態(tài)分配,保證數(shù)字圖書館獲取最優(yōu)的運算能力和服務(wù)器等設(shè)備的正常運轉(zhuǎn),最大化地滿足用戶需求;在計算需求較少時會歸還多余的運算能力,保證資源的優(yōu)化配置,減少資源的浪費。此外,傳統(tǒng)圖書館服務(wù)器常面臨黑客攻擊的風(fēng)險,數(shù)據(jù)容易被破壞,云計算憑借先進的技術(shù),可以提供安全可靠的數(shù)據(jù)存儲保障,為數(shù)字圖書館提供持續(xù)的安全服務(wù)。
數(shù)字圖書館只需要花費少量費用租用云服務(wù)商的相關(guān)服務(wù),就可以依托云計算供應(yīng)商的平臺、存儲和較強的計算能力來處理業(yè)務(wù),大大降低數(shù)字圖書館資源建設(shè)方面的投入成本,節(jié)約設(shè)備維護、管理等方面的開銷。在此基礎(chǔ)上,數(shù)字圖書館可以合理規(guī)劃開支,將有限的資金應(yīng)用于核心業(yè)務(wù)的發(fā)展中。
云計算的發(fā)展為數(shù)字圖書館資源整合帶來了新的機遇。云計算在服務(wù)模式、環(huán)境建設(shè)等方面的進步,有助于傳統(tǒng)圖書館突破信息傳遞、信息存儲等方面的限制,為用戶提供優(yōu)質(zhì)的信息資源服務(wù)。但是機遇與挑戰(zhàn)并存,云計算在數(shù)字圖書館資源整合方面也面臨著標準化、穩(wěn)定性、安全性、版權(quán)等方面的問題,需要云計算服務(wù)商與數(shù)字圖書館積極合作,采取相關(guān)措施,充分發(fā)揮云計算的最大功效,不斷提升數(shù)字圖書館的服務(wù)能力。