胡翠紅
〔摘 要〕隨著數(shù)字圖書(shū)館建設(shè)的蓬勃發(fā)展,圖書(shū)館信息資源的種類和數(shù)量越來(lái)越多,如何將這些龐大的資訊量,以整合性、系統(tǒng)化的方式提供使用者檢索,也成為圖書(shū)館咨詢服務(wù)的重要課題。資源整合是數(shù)字圖書(shū)館建設(shè)中的基礎(chǔ)工程,論文在5S的基礎(chǔ)上,對(duì)數(shù)字圖書(shū)館的整合問(wèn)題進(jìn)行了研究。并在5S理論此基礎(chǔ)上進(jìn)一步提出整合工具:5Ssuite,5SSuite包括5Sgraph,5Sgen和SchemaMapper。
〔關(guān)鍵詞〕5S;5Ssuite;數(shù)字圖書(shū)館;資源整合
DOI:10.3969/j.issn.1008-0821.20.01.0
〔中圖分類號(hào)〕G252 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(20)01-0044-03
Integrating Digital Libraries Based on the 5S TheoryHu Cuihong
(Library,Southwest University of Science and Technology,Mianyang 621010,China)
〔Abstract〕With the rapid development of digital libraries(DL),there are more and more types and quantities of information resources.How to provide these massive amounts of information to users has become an important topic to library with an integrated and systematic way.Integration problem is the basis for construction of DL.This paper formalized the DL integration problem based on the 5S(Streams,Structures,Spaces,Scenarios,and Societies) theory,further put forward integration of tools:5Ssuite.The 5Ssuite consists of 5SGraph,5SGen,and SchemaMapper,which played an important role during integration.
〔Keywords〕5S;5Ssuite;digital library;integration
1 資源整合是數(shù)字圖書(shū)館建設(shè)中的基礎(chǔ)工程
隨著數(shù)字圖書(shū)館建設(shè)的發(fā)展,圖書(shū)館信息資源的種類和數(shù)量越來(lái)越多。然而,由于不同數(shù)據(jù)庫(kù)往往擁有不同的檢索界面和使用方式,用戶在進(jìn)入各個(gè)數(shù)據(jù)庫(kù)時(shí)需要進(jìn)行不同的身份認(rèn)證,頻繁的登錄和退出,使得即使是那些對(duì)于圖書(shū)館資源十分熟悉的用戶,在面對(duì)數(shù)字圖書(shū)館這個(gè)信息海洋時(shí)也望而卻步;而載體形式和利用手段均日趨多元化的文獻(xiàn)信息資源但在為用戶提供了便利的同時(shí)也逐漸暴露出諸多問(wèn)題,如分布式存在的資源之間互不關(guān)聯(lián)、內(nèi)容交叉,平臺(tái)各異、用法不一等。日益增多的各類商業(yè)資源平臺(tái)和數(shù)字資源更加劇了“信息孤島”現(xiàn)象,文獻(xiàn)信息資源在總體上呈現(xiàn)出越來(lái)越無(wú)序雜亂的狀態(tài)。因此,圖書(shū)館大量的信息資源并沒(méi)有像圖書(shū)館員所預(yù)想的那樣得到充分和有效的利用。如何將這些龐大的資訊量,以整合性、系統(tǒng)化的方式提供給用戶,整合現(xiàn)有文獻(xiàn)信息資源無(wú)疑是關(guān)鍵問(wèn)題。
所謂整合是指一個(gè)系統(tǒng)內(nèi)各要素的整體協(xié)調(diào)與相互滲透,使系統(tǒng)各要素發(fā)揮最大效益。從應(yīng)用需求角度數(shù)字圖書(shū)館資源整合的目標(biāo)分為3個(gè)層次:第1個(gè)層次是為了更好地揭示資源;第2個(gè)層次是為了實(shí)現(xiàn)各類資源內(nèi)容間的無(wú)縫關(guān)聯(lián)和透明訪問(wèn);第3個(gè)層次是將資源納入到統(tǒng)一的文獻(xiàn)信息服務(wù)體系中,做到資源與服務(wù)的無(wú)縫結(jié)合,為用戶提供高效率、個(gè)性化的優(yōu)質(zhì)服務(wù)。從實(shí)踐角度看,資源整合工作可以從兩個(gè)維度去考慮,即整合的廣度和深度。廣度是指整合的資源對(duì)象范圍;深度追求的是整合后所能達(dá)到的資源利用率。
2 圖書(shū)館數(shù)字資源整合的方法
2.1 基于OPAC系統(tǒng)的數(shù)字資源整合
OPAC(on line Public Access Catalogue)即聯(lián)機(jī)公共檢索目錄,是一種通過(guò)因特網(wǎng)對(duì)館藏資源進(jìn)行檢索的工具,是用戶利用圖書(shū)館的切入點(diǎn)。網(wǎng)絡(luò)環(huán)境下,用戶可以隨時(shí)隨地通過(guò)OPAC來(lái)檢索該館的文獻(xiàn)資源?;贠PAC資源系統(tǒng)的整合是圖書(shū)館數(shù)字資源最基本的整合方式,以O(shè)PAC系統(tǒng)為基礎(chǔ)平臺(tái),提供書(shū)目數(shù)據(jù)到鏈接全文實(shí)體館藏文獻(xiàn)與虛擬館藏文獻(xiàn)的有機(jī)結(jié)合,并利用各成員館的OPAC系統(tǒng),資源實(shí)現(xiàn)資源共享,以達(dá)到以書(shū)目為核心,向相關(guān)資源擴(kuò)展的功能。
2.2 基于導(dǎo)航系統(tǒng)的數(shù)字資源整合
基于導(dǎo)航系統(tǒng)的數(shù)字資源整合是指將數(shù)字資源的檢索入口整合在一起,建立數(shù)字資源導(dǎo)航庫(kù),提供按資源名、關(guān)鍵詞、資源標(biāo)識(shí)等獲取數(shù)字資源的途徑。目前我國(guó)絕大多數(shù)圖書(shū)館都已經(jīng)建立自己的數(shù)字資源導(dǎo)航系統(tǒng),如清華大學(xué)圖書(shū)館的“電子資源/數(shù)據(jù)庫(kù)導(dǎo)航系統(tǒng)”,中國(guó)國(guó)家圖書(shū)館的“數(shù)字資源欄目”,上海圖書(shū)館的“電子資源導(dǎo)航”等。上海圖書(shū)館的“電子資源導(dǎo)航”不僅按資源類型在導(dǎo)航系統(tǒng)主頁(yè)中設(shè)置了數(shù)據(jù)庫(kù)、電子期刊、虛擬電子資源等子系統(tǒng),而且每個(gè)子系統(tǒng)又根據(jù)本系統(tǒng)的特點(diǎn)設(shè)置了分類瀏覽功能和檢索功能。
2.3 基于鏈接系統(tǒng)的數(shù)字資源整合
基于鏈接系統(tǒng)的數(shù)字資源整合的原理即是:鏈接系統(tǒng)將圖書(shū)館數(shù)字資源鏈接在一起,形成一個(gè)具有內(nèi)在聯(lián)系的有機(jī)整體,以方便用戶使用。目前在圖書(shū)情報(bào)界和新聞出版界使用最多的是參考引文鏈接。
2.4 基于跨庫(kù)檢索系統(tǒng)的數(shù)字資源整合
基于跨庫(kù)的整合檢索系統(tǒng)就是在同一檢索平臺(tái)對(duì)多個(gè)數(shù)據(jù)庫(kù)同時(shí)進(jìn)行檢索。對(duì)異構(gòu)數(shù)據(jù)庫(kù)實(shí)現(xiàn)跨庫(kù)整合檢索,將更方便用戶,極大提高用戶對(duì)信息資源獲取的效率??鐜?kù)整合檢索可分兩個(gè)層次,即:檢索界面的整合和實(shí)現(xiàn)數(shù)字資源系統(tǒng)間的分布式異構(gòu)整合。
總之,數(shù)字圖書(shū)館的建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,資源整合是該工程的基礎(chǔ),也是數(shù)字圖書(shū)館發(fā)展必然趨勢(shì)。
5S理論的數(shù)字圖書(shū)館資源整合研究
數(shù)字圖書(shū)館所要面臨的整合檢索環(huán)境,已不再只是以MARC建檔的資料庫(kù)系統(tǒng),而是以各種不同的詮釋資料格式建檔的資料庫(kù)系統(tǒng),圖書(shū)館所建立的、或所購(gòu)買(mǎi)的資料庫(kù),往往多達(dá)數(shù)十種,而這些系統(tǒng)皆各有不同的資訊組織與檢索方式。因此如何達(dá)到:“整合散布且獨(dú)立運(yùn)作的資料庫(kù)系統(tǒng)與資源,讓使用者僅需透過(guò)系統(tǒng)或介面即可取得所需的資訊,以得到透通性的資訊服務(wù),使其資訊需求獲得滿足。”乃成為一個(gè)新的研究課題,而配合新數(shù)位環(huán)境所需的整合協(xié)訂也應(yīng)運(yùn)而生,如5S理論等等,都是為解決數(shù)位時(shí)代異質(zhì)資訊檢索與連結(jié)而被設(shè)計(jì)出來(lái)的理論。
本文重點(diǎn)探討5S理論以及5S模型,并以5S模型作為工具分析了數(shù)字圖書(shū)館的資源整合。
3.1 5S相關(guān)理論
數(shù)字圖書(shū)館是一種有組織的數(shù)字化信息物體的數(shù)據(jù)庫(kù),這些信息物體是用各種格式來(lái)維持的,以便向用戶群體提供不需要中介的便利的查找途徑。它具有以下5種特征,即:社會(huì)性要素Societies,情境性要素Scenarios,結(jié)構(gòu)性要素Structure,空間性要素Space和流體性要素Streams[1]。也即滿足用戶的信息需求,提供信息服務(wù),以有用的方式組織信息,提供管理信息的場(chǎng)地和以及與用戶及他們的代理人交流信息的功能。5S理論提供了一個(gè)正式的模型來(lái)描述數(shù)字圖書(shū)館的復(fù)雜性,5SL是對(duì)5S的模型XML實(shí)現(xiàn)(圖1)。圖 5S相關(guān)工具及在數(shù)字圖書(shū)館發(fā)展中的作用[2]
3.2 以5SL表達(dá)的數(shù)字圖書(shū)館的最小模型
5SL是一種基于XML的數(shù)字圖書(shū)館建模語(yǔ)言,作為特殊領(lǐng)域的建模語(yǔ)言提供一套符號(hào)系統(tǒng),表達(dá)該領(lǐng)域各類實(shí)體及其相互關(guān)系,以及對(duì)問(wèn)題進(jìn)行抽象表述。對(duì)于領(lǐng)域知識(shí)分析、表達(dá)、程序管理、可視化、測(cè)試、維護(hù)、建模、以及快速建立原型等都非常有用。以5SL表達(dá)的數(shù)字圖書(shū)館,見(jiàn)表1[2]:表1 以5SL表達(dá)的數(shù)字圖書(shū)館的最小模型
要素功能實(shí)例流體性要素?cái)?shù)字圖書(shū)館內(nèi)容屬性文本、視頻、音頻、圖…結(jié)構(gòu)性要素?cái)?shù)字圖書(shū)館內(nèi)容的組織特性資源集合、元數(shù)據(jù)架構(gòu)、采集…空間性要素?cái)?shù)字圖書(shū)館多個(gè)組件的邏輯和用戶視圖矢量、概率值…布爾數(shù)學(xué)體系情境性要素?cái)?shù)字圖書(shū)館服務(wù)的行為細(xì)節(jié)服務(wù)、事件、消息、條件、動(dòng)作、狀態(tài)…社會(huì)性要素各類角色分擔(dān)不同的職能管理員、用戶…
4 整合工具:5Ssuite
在網(wǎng)絡(luò)技術(shù)日益成熟的今天,模塊化系統(tǒng)開(kāi)發(fā)模式將形成數(shù)字圖書(shū)館的發(fā)展主流。5S模型在數(shù)字圖書(shū)館的發(fā)展過(guò)程中將起到積極的推動(dòng)作用。為了整合數(shù)字圖書(shū)館資源,我們發(fā)展5S理論并提出整合工具:5SSuite,以完成整合的進(jìn)程。5SSuite包括5SGraph、5SGen和SchemaMapper[2],這些在資源整合過(guò)程中起著重要作用。
4.1 5SGraph
5SGraph是數(shù)字圖書(shū)館建模工具,能夠幫助用戶利用5SL建立自己特殊的數(shù)字圖書(shū)館模型。5SGraph將元模型裝載于一個(gè)結(jié)構(gòu)化的工具箱中,其提供的結(jié)構(gòu)編輯器能夠提供自頂向下可視化數(shù)字圖書(shū)館設(shè)計(jì)環(huán)境,并根據(jù)可視化模型提供5SL文件的語(yǔ)法檢查等功能[3]。
5SGraph具有靈活的可擴(kuò)展結(jié)構(gòu)、模型的重用、裝載、存儲(chǔ)、修改子模型、視圖同步以及強(qiáng)化語(yǔ)義約束等初步功能。
4.2 5SGen
5SGen第一版應(yīng)用于MARIAN項(xiàng)目,支持基于語(yǔ)義網(wǎng)絡(luò)的知識(shí)表達(dá)和包含行為的節(jié)點(diǎn)(或鏈接)描述。
5SGen第二版將結(jié)構(gòu)性(或空間性)要素封裝于組件中,并更強(qiáng)調(diào)情景性(或社會(huì)性)要素的實(shí)現(xiàn),從而能夠支持組件化的ODL[3]。5SGen第二版已經(jīng)在CITIDEL、VIADUCT、NDLTD Union Catalog以及BDBComp等項(xiàng)目中建立原型,并在應(yīng)用過(guò)程中得到完善發(fā)展。
4.3 SchemaMapper
SchemaMapper映射模式包括:組裝SchemaMapper類框架和SchemaMapper生成Java類[4]。
4.3.1 組裝SchemaMapper類框架
SchemaMapper要做的第一件事就是為要生成的代碼設(shè)置一些基本存儲(chǔ)器。必須能夠從每個(gè)執(zhí)行映射的XML schema生成多個(gè)接口和實(shí)現(xiàn)。鍵是接口或?qū)崿F(xiàn)名稱以及映射表中的值,該值是將要輸出到新Java程序文件的實(shí)際代碼。
4.3.2 SchemaMapper生成Java類
XML文檔就可以解包成那些類其中一個(gè)的實(shí)例。即這個(gè)系統(tǒng)不僅需要XML文檔;文檔將變成其實(shí)例的Java類不僅必須已經(jīng)存在,而且它還必須在系統(tǒng)的類路徑中。
總而言之,5S理論是目前為數(shù)不多的對(duì)數(shù)字圖書(shū)館體系結(jié)構(gòu)和建設(shè)方法的系統(tǒng)、完整的認(rèn)識(shí),并不斷有實(shí)際的應(yīng)用對(duì)這套體系進(jìn)行發(fā)展完善。雖然目前還只有Virginia Tech等少數(shù)大學(xué)在繼續(xù)研發(fā)和使用,其方便性也不如FEDORA、DSPACE、Green Stone等開(kāi)源軟件,但在模型建設(shè)方面有它的特色,對(duì)于系統(tǒng)的可移植性、擴(kuò)展性和互操作性有著其它軟件不可比擬的優(yōu)越性。而且5S理論能統(tǒng)一對(duì)數(shù)字圖書(shū)館的認(rèn)識(shí),便于在全國(guó)乃至全球范圍內(nèi)進(jìn)行資源整合,從而實(shí)現(xiàn)模式兼容與資源共享,促進(jìn)數(shù)字圖書(shū)館事業(yè)的不斷發(fā)展。
5 結(jié)束語(yǔ)
資源整合是數(shù)字圖書(shū)館建設(shè)中的基礎(chǔ)工程,以5S為基礎(chǔ)探討數(shù)字圖書(shū)館的資源整合問(wèn)題,它不僅提供了一個(gè)系統(tǒng)化的整合方法,還有利于數(shù)字圖書(shū)館功能的探索和服務(wù)的實(shí)施。論文在5S的基礎(chǔ)上,對(duì)數(shù)字圖書(shū)館的整合問(wèn)題進(jìn)行了研究。
(1)提出數(shù)字圖書(shū)館資源整合問(wèn)題,介紹了基于OPAC系統(tǒng)的數(shù)字資源整合、基于導(dǎo)航系統(tǒng)的數(shù)字資源整合、基于跨庫(kù)檢索系統(tǒng)的數(shù)字資源整合和基于鏈接系統(tǒng)的數(shù)字資源整合基本方法,并進(jìn)一步提出基于5S理論的數(shù)字圖書(shū)館資源整合;
(2)介紹了以5SL表達(dá)的數(shù)字圖書(shū)館的最小模型,5SL是對(duì)5S的模型XML的實(shí)現(xiàn);
(3)進(jìn)一步提出整合工具:5Ssuite,5SSuite包括5Sgraph,5Sgen和SchemaMapper。
參考文獻(xiàn)
[1]Fox先生的數(shù)字圖書(shū)館5S模型[EB/OL].http:∥libseeker.bokee.com/2158616.html,2010-06-24/2010-06-26.
[2]Rao Shen,Naga Srinivas Vemuri,Weiguo Fan,Edward A.Fox.Integration of complex archeology digital libraries:An ETANA-DL experience[J].Information Systems,2008,33(7-8):699-723.
[3]劉煒.數(shù)字圖書(shū)館——在賽百基礎(chǔ)結(jié)構(gòu)中重新定位[EB/OL].http:∥www.libnet.sh.cn/sztsg/fulltext/reports/2…,2005-10-14/2009-02-05.
[4]Rao Shen,Applying the 5S Framework to Integrating Digital Libraries[D].Doctor of Philosophy,Virginia Polytechnic Institute and State University,2006-04-17.