劉 芳,盧國強,王琳琳
(牡丹江醫(yī)學院,黑龍江 牡丹江 157011)
網格環(huán)境下數字圖書館異構資源整合分析
劉芳,盧國強,王琳琳
(牡丹江醫(yī)學院,黑龍江 牡丹江 157011)
文章主要對網絡環(huán)境下的數字圖書館異構資源的整合進行分析,介紹了網絡環(huán)境下數字圖書館的元數據、異構資源檢索類型、異構資源同構化的問題、數字圖書館建設的整體協調及未來發(fā)展趨勢問題。
數字圖書館;網絡環(huán)境;異構資源
網格是新世紀提出來的一種全新技術模式,這種模式出現的時間為21世紀初。網格背景將科研帶到了世界領域,全世界的人們實現了資源的共享,全世界進行學術交流與科研具備了可能性;網格帶來了全新的科研方法,新科研方法模式下出現了全新的科學交流方式;網絡環(huán)境的出現導致科研用戶的信息行為以及信息的需求都發(fā)生了深刻的變革,科研用戶的需求從原來的原始資源的需求轉變?yōu)橘Y源中知識的轉化,需求的類型也越來越多樣化,同時希望在享受資源的同時操作也能夠更加便捷。
隨著時代的發(fā)展,網格環(huán)境下的數字圖書館功能必將被進一步開拓和發(fā)展,本文主要以異構資源作為切入點,重點研究其元數據問題、資源整合問題以及異構資源同構化問題。
1.1元數據是組織網絡信息資源的有效工具
所謂的元數據,指的是數據之下的數據,也就是最原始的數據。無論是在任何一種環(huán)境下,元數據都是有效的信息資源組織工具,都是利用信息資源的關鍵部分。網格信息資源包括數據、元數據、指針3部分,指針是一種工具,用來表示數據;元數據是數據集,用來表示數據特征;數據是儲存在數字圖書館中的基本信息資源。在數字圖書館中,元數據十分重要,元數據主要描述的內容包括是什么、什么時候、在哪、為什么等。以DC的元數據為例,其主要組成部分為:作者、主題、標題。通過搜索,可以找到不同格式的元數據,由于元數據的格式較多,因此,為了提高搜索效率,在搜索引擎內設置了大量元數據模板,甚至可以搜索到格式不常見的元數據。除了上述分析之外,元數據還需要對數量、區(qū)域、距離等內容進行描述。數字圖書館因為其所提供者所處環(huán)境的不同,因此,在描述網絡信息資源時需要詳盡描述信息資源所處的位置。
1.2元數據在數字圖書館中的有效應用
(1)元數據的創(chuàng)建。在數據的搜索與創(chuàng)建階段,元數據等信息備被以HTML,SGML等形式放置到信息資源之中。在網格信息資源的整個生命周期之內,元數據的信息不是一成不變的,而是隨著信息資源的變化而變化的,并保證網絡系統能夠快速找到精準的信息。
(2)元數據的搜集。在發(fā)現網格數字圖書館信息資源的階段,搜集元數據可以迅速在信息龐大的資源中找到有效信息。元數據的格式有不同的類型,在專用的搜索引擎之內能夠找到不常用格式的元數據。
(3)元數據間的映射。MARC,TEL等格式的元數據能夠通過傳輸協議將他們的數據語句與元素等進行轉化,達到語義與結構相互兼容的目的。
(4)元數據與系統的建立。網格環(huán)境下元數據倉庫的技術基礎為因特網與網格技術。這種技術背景下建立的元數據倉庫不僅具有傳統圖書館的檢索系統,而且具有數字圖書館的信息資源檢索系統。網格技術能夠將所有的分布式數據館藏以及信息資源連接成一個虛擬源數據的館藏,通過數據館藏實現元數據的建立、映射以及檢索。用戶則可以通過網絡查詢網格中的信息資源,并通過對元數據信息的查詢,找到信息資源的實體。
1.3元數據在數字圖書館中的服務流程
為了實現異構資源的有機整合,就需要建立一個公用的數據庫信息中心,使用者能夠通過統一的網址進行透明的不同數據庫的訪問。在網格中,每一個數據庫都有指定的網格服務保證原數據的采集以及注冊,并通過網格服務以及監(jiān)測查詢作為中間層從而實現對元數據的管理以及查詢的功能??蛻舳擞卸喾N形式,可以是應用程序也可以是Web的瀏覽器,后臺的數據庫異構性被屏蔽,并由統一的服務接口進行訪問,用戶并不需要關心數據庫到底采用哪種類型以及何種訪問的方式。
如何實現網格環(huán)境下數字圖書館異構資源的有效整合,是網絡環(huán)境下數字圖書館信息資源管理重點需要解決的問題。網格環(huán)境下的數字圖書館包含著多種多樣的信息格式內容,信息具有分散性,并且是比較獨立松散的信息空間,每一信息空間都依照自己的方式進行元數據的集中,信息檢索模型的建立以及對計費方式的設定等都不相同,因此要實現跨庫檢索是一件很困難的事情,跨庫檢索要將這些獨立的元數據以及檢索方式等等集中到一塊,提高數據的檢索效率,簡單來說也就是將所有的數據庫系統進行集成,便于使用者進行檢索。
2.1 網格環(huán)境下的數字圖書館資源
將數字圖書館中大量的、分散的信息資源進行有效整合,集中到一塊是數字圖書館網格思考的問題。網格要實現資源的最大塊連通,連通的內容包括計算資源、存儲資源以及軟件資源等。
2.2構造異構資源統一檢索辦法
數字圖書館發(fā)展得越來越快,圖書館信息資源的不斷增多,然而因為各個數據庫都有自身的檢索界面、檢索方式,因此用戶在進入到不同的檢索庫中都需要進行身份驗證,頻繁的登入或登出。這種情況下即使經常使用圖書館資源的用戶也不免抱怨,在信息資源的海洋面前望而卻步。因此圖書館的大量資源并沒有被有效利用,如何讓用戶使用多個數據庫的集成資源跟檢索,保證圖書館的信息資源被最大程度上的使用成為關鍵。為了解決這個問題,各大圖書館都在開發(fā)Web的跨庫檢索系統。
2.2.1不同圖書館數據庫檢索界面類型
羅列型。這種檢索的界面是將所有的電子資源進行羅列,之后讓讀者自己去選擇一種資源進行注冊、登錄,隨后輸入檢索詞語進行檢索,之后換成另外一種檢索庫進行檢索,重新進行注冊登錄。如果電子資源的種類偏少的情況下,用戶還不覺得十分的繁瑣,但是如果需要大量的且在不同數據庫的電子資源,則很麻煩,造成很多用戶不愿意繼續(xù)使用電子圖書館進行資源的檢索。
導航型。導航型是對羅列型的發(fā)展,導航型的數據庫根據用戶的使用習慣以及需求類型等進行分類。分類方法主要包括以下幾種:字母順序類,主體范圍類,學科類型類,這幾種類別建立一個導航系統,之后用戶根據這幾種類別對應的電子資源進行內容檢索。導航型具有很強的學科性質,對電子資源的類別進行劃分,用戶根據不同的類別進行資源的查詢,并以此登錄到每個數據庫的網站,進行信息資源的查詢。這種分類的方法有很大局限性,對學科不了解的用戶來說用處不大。因此采用導航系統的都是有些對電子圖書館使用較多的重點高校,此種類型能夠有效節(jié)省用戶的檢索時間,實現一站式的檢索。
2.2.2網格環(huán)境下的異構跨庫檢索系統架構
電子圖書館是由一系列數字資源和應用系統構成的。在實際工作中可以將數字圖書館操作劃分為兩個方面:一是數字悺必須合理解決多個應用系統構成以及其與異構資源的集成;二是不同數字圖書館之間進行相互操作的關系。數字圖書館在網格環(huán)境下劃分為兩個主要構成部分:一是兩個或者兩個以上的圖書館與單個圖書館之間的交互操作交換。在互聯網環(huán)境中,數字圖書館的重點是對眾多用戶和諸多資源進行支持和服務。多個圖書館在網格環(huán)境下研究的主要內容集中在圖書館之間的相互操作、集成方式,甚至對分布式用戶訪問支持方式服務能力。
基于互聯網環(huán)境的數字圖書館建設應以OGSA規(guī)范為標準,在數字圖書館資源領域對網格計算資源管理能力予以適當地運用,同時保障組織模型的開放性、重用性與互操作性等特征。模型可以從3個層面進行子模塊的設置,分別為分布資源層、網格服務層與知識服務層。模型的最下層應將圖書館的分布式數字資源囊括在內,借助于網格服務層,可以對這些資源進行虛擬整合。
網絡服務層包括網絡基礎架構和統一資源空間兩大部分,網格基礎架構主要調度和整合信息資源及服務,自上而下包括信息服務層、數據服務層及計算服務層。信息服務層的主要作用是提供了統一的用戶服務接口,通過這個接口可以相互訪問不同的異構數據資源,在訪問過程中,元數據這一描述信息和異構信息整合的數據集顯得尤為重要。該層提供的服務根據系統需求會有有變化。數據服務層的主要服務內容是通過分布式信息資源集中計算與分析管理共享信息資源,其主要內容是管理數據存儲、元數據的管理及傳遞管理等。計算服務層主要提供的服務內容為資源發(fā)現以及分配和資源的監(jiān)控電能。統一資源空間主要包含統一的資源配置以及統一元數據描述,主要負責資源與服務之間的整合。知識服務層主要的作用是整合虛擬資源,資源整合之后通過知識服務層為用戶提供服務,不斷優(yōu)化統一資源存儲及檢所運行的模式。
關于網格環(huán)境下數字圖書館異構資源的整合,本文建立了一站式檢索的模型。一站式檢索用戶只需要在使用資源的時候輸入檢索詞,之后便能在多個電子資源中檢索到自己所需要的信息,不需要在多個數據庫中進行切換,反復的登錄或登出。通過簡單快捷的操作就能夠一步到位地檢索到需要的信息,是今后電子資源檢索的發(fā)展趨勢。
[1]畢強,沈涌.數字圖書館網格信息資源組織模式研究.[J].圖書情報工作,2007(8):10-14.
[2]李曉嫻,劉杰.上海研發(fā)公共服務平臺子系統間協同機制研究[J].科技政策與管理,2006(10):31-34.
[3]胡素青.大數據,向巔峰出發(fā)[J].金融科技時代,2012(9):20-23.
[4]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(4):120-122.
Integrated analysis of the digital library of heterogeneous resources in grid environment
Liu Fang, Lu Guoqiang, Wang Linlin
(Mudanjiang Medical University, Mudanjiang 157011, China)
This paper introduces the search type digital library grid environment heterogeneous resources, then focus on the analysis of the meta data and resource integration and grid environment heterogeneous resources digital library is omorphism problem and concluded under the overall coordination of grid environment background digital Library construction and the future of digital Library.
digital libraries; network environment; heterogeneous resources
2015年黑龍江省社科規(guī)劃項目;項目名稱:基于中蒙俄地域優(yōu)勢的區(qū)域館際互借系統建設研究;項目編號:15TQE02。2016年度黑龍江省藝術科學規(guī)劃項目;項目名稱:數字圖書館中異構資源共享平臺的研究;項目編號:2016C043。
劉芳(1983— ),女,黑龍江牡丹江,本科,講師;研究方向:數據庫,情報學。