• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于DC元數(shù)據(jù)的資源統(tǒng)一描述策略探討

      2020-06-11 00:36:29范小松
      關(guān)鍵詞:元數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)資源管理

      范小松

      摘要:不同類型信息資源、不同信息應(yīng)用行業(yè),有著眾多不同的元數(shù)據(jù)標(biāo)準(zhǔn)或應(yīng)用規(guī)范。尋求一種通用的、兼容多種類型信息資源和應(yīng)用需求的資源統(tǒng)一描述方案,既能降低資源描述與管理成本,又能消除跨系統(tǒng)、跨資源類型的數(shù)據(jù)交換與信息整合障礙。本文基于都柏林核心元數(shù)據(jù)(Dublin Core Metadata,DC元數(shù)據(jù))的理念,從元數(shù)據(jù)的編碼實(shí)現(xiàn)著手,探討了一種資源統(tǒng)一描述方案的設(shè)計(jì)策略,包括描述元素的核心化、可修飾或可限定策略,元數(shù)據(jù)結(jié)構(gòu)化與可伸縮化策略,資源描述對(duì)象單一化策略。

      關(guān)鍵詞:元數(shù)據(jù);統(tǒng)一描述;數(shù)據(jù)結(jié)構(gòu);資源管理

      中圖分類號(hào):G250.7 ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ?文章編號(hào):2095-5707(2020)03-0021-05

      Abstract: Different types of information resources and different information application industries have various metadata standards or application specifications. Seeking a resource uniform description strategy that is universal and compatible with multiple types of information resources and application requirements can not only reduce resource description and management costs, but also eliminate barriers to data exchange and information integration across systems and resources. Based on the concept of Dublin Core Metadata (DC Metadata), and starting with the implementation of metadata encoding, this article discussed a design strategy for a uniform resource description scheme, including core, modifiable or definable strategies for describing elements, metadata structure and scalability strategy, and resource description object simplification strategy.

      Key words: metadata; uniform description; data structure; resource management

      隨著科學(xué)技術(shù)的發(fā)展,圖書館館藏信息資源除了具備圖書、期刊,及非書、非刊等類型多樣性特征外,還具備紙質(zhì)、磁帶與數(shù)字化等載體多樣性特征。數(shù)量豐富、類型與載體格式不同的館藏資源,在滿足讀者信息需求的同時(shí),也給圖書館增加了信息資源的組織成本。

      元數(shù)據(jù)作為描述信息資源或數(shù)據(jù)本身特征和屬性的數(shù)據(jù),在信息資源的組織過(guò)程中發(fā)揮著重要作用。針對(duì)不同類型的信息資源,產(chǎn)生了大量的元數(shù)據(jù)體系,甚至同一資源類型因不同的應(yīng)用與管理需求,并存多種元數(shù)據(jù)體系。目前,信息資源描述中,有機(jī)讀目錄(Machine Readable Cataloging, MARC)、都柏林核心元數(shù)據(jù)(Dublin Core Metadata, DC元數(shù)據(jù))、編碼檔案著錄(Encoded Archival Description, EAD)、藝術(shù)作品描述目錄(Categories for the Description of Works of Art, CDWA)等多種元數(shù)據(jù)格式。元數(shù)據(jù)體系的多樣性和重疊現(xiàn)象不可避免地增加了資源描述成本,也影響了各種資源描述成果的共享和整合。

      應(yīng)當(dāng)采用一種大家共同遵守的元數(shù)據(jù)體系,對(duì)各類型信息資源進(jìn)行語(yǔ)義與格式統(tǒng)一的元數(shù)據(jù)描述。狹義的資源統(tǒng)一描述,指大家都采用同一種元數(shù)據(jù)體系,實(shí)現(xiàn)多種類型信息資源的描述。廣義的資源統(tǒng)一描述,是忽略前期采用的哪種元數(shù)據(jù)體系描述信息資源,只要求這些元數(shù)據(jù)在對(duì)外呈現(xiàn)或發(fā)布時(shí),轉(zhuǎn)換或二次加工為大家共同遵守的元數(shù)據(jù)體系。由于涉及既有元數(shù)據(jù)成果的繼承與轉(zhuǎn)換,及現(xiàn)有信息系統(tǒng)的改造,廣義上的資源統(tǒng)一描述更是業(yè)界當(dāng)前思考的重點(diǎn)。當(dāng)然,對(duì)于全新的信息系統(tǒng)與數(shù)據(jù)建設(shè)者來(lái)說(shuō),直接采用狹義的資源統(tǒng)一描述策略與體系,更能降低資源描述和轉(zhuǎn)換成本,輕易實(shí)現(xiàn)元數(shù)據(jù)的互操作性,促進(jìn)信息共享、交換及整合。

      1 ?傳統(tǒng)元數(shù)據(jù)資源描述概述

      1.1 ?傳統(tǒng)元數(shù)據(jù)資源描述的現(xiàn)狀

      圖書情報(bào)界主要從語(yǔ)義互操作、語(yǔ)法互操作、結(jié)構(gòu)互操作及應(yīng)用協(xié)議4個(gè)方面提出了元數(shù)據(jù)互操作的多個(gè)解決方案[1]。

      借助計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)行業(yè)國(guó)際標(biāo)準(zhǔn),在語(yǔ)法互操作層面,有采用文檔類型定義(Document Type Definition, DTD)或模式(Schema)約束的可擴(kuò)展標(biāo)記語(yǔ)言(Extensible Markup Language, XML)等解決方案;在結(jié)構(gòu)互操作層面,有資源描述框架(Resource Description Framework, RDF)等解決方案;在應(yīng)用協(xié)議層面,有Z39.50、開放檔案協(xié)議(Open Archives Initiative, OAI)等解決方案。這些成熟、并容易被計(jì)算機(jī)理解與實(shí)現(xiàn)的解決方案,完全可以滿足圖書情報(bào)界在資源統(tǒng)一描述和元數(shù)據(jù)互操作性上的需求。

      但是,在元數(shù)據(jù)的語(yǔ)義互操作層面,目前尚無(wú)一個(gè)廣泛認(rèn)可的、足以保障對(duì)各類型信息資源進(jìn)行語(yǔ)義與格式統(tǒng)一的元數(shù)據(jù)描述方案。目前采用元數(shù)據(jù)映射解決方案已成為一種共識(shí),即從語(yǔ)義和應(yīng)用功能角度,建立2種甚至多種元數(shù)據(jù)間的對(duì)照關(guān)系,從而實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換或映射檢索。目前已有大量的轉(zhuǎn)換程序,供若干流行元數(shù)據(jù)格式之間的轉(zhuǎn)化使用,例如DC元數(shù)據(jù)與美國(guó)機(jī)讀目錄(United States Machine Readable Cataloging, USMARC)、DC元數(shù)據(jù)與EAD等[2]。應(yīng)用層面,也有基于轉(zhuǎn)換后的DC元數(shù)據(jù)而提供服務(wù)的OAI項(xiàng)目。

      1.2 ?傳統(tǒng)元數(shù)據(jù)資源描述的不足

      傳統(tǒng)元數(shù)據(jù),比如MARC的元數(shù)據(jù)編碼體系結(jié)構(gòu)復(fù)雜、關(guān)系不明、標(biāo)記元素眾多,而新型元數(shù)據(jù),如都柏林核心元數(shù)據(jù)元素集(Dublin Core Metadata Element Set, DCMES)又過(guò)于原則化與抽象化,沒(méi)有也不會(huì)針對(duì)具體應(yīng)用推出更多的核心元素與限定修飾詞,更不會(huì)指定DCMES的編碼格式。所以,在映射轉(zhuǎn)換中,常常出現(xiàn)語(yǔ)義無(wú)法對(duì)應(yīng)或無(wú)法一一對(duì)應(yīng),導(dǎo)致信息丟失的現(xiàn)象。再加上元數(shù)據(jù)格式眾多,針對(duì)它們分別建立兩兩映射關(guān)系所需要的工作量和協(xié)調(diào)成本會(huì)急劇上升。針對(duì)這種多格式映射的難題,人們提出以一種元數(shù)據(jù)格式為中心,其他格式都向這一格式映射的星形映射方式改進(jìn)方案。目前公認(rèn)讓各方容易接受的中心元數(shù)據(jù)格式是DC元數(shù)據(jù),各元數(shù)據(jù)都統(tǒng)一轉(zhuǎn)換為DC元數(shù)據(jù)后實(shí)現(xiàn)匯總,比如OAI項(xiàng)目[1]。

      OAI首先是一種計(jì)算機(jī)協(xié)議,它約定了元數(shù)據(jù)的檢索與獲取的接口和調(diào)用方式,并非圖書情報(bào)界專有。OAI不關(guān)心數(shù)據(jù)提供者內(nèi)部元數(shù)據(jù)的格式,僅要求數(shù)據(jù)提供者能夠?qū)⒆约旱脑獢?shù)據(jù)以DC元數(shù)據(jù)15個(gè)核心元素的方式向外提供。OAI這類星形映射方案,且映射為DC元數(shù)據(jù)15個(gè)核心元素的映射方案,雖然降低了映射難度——將多格式映射等價(jià)為一組兩兩映射,將格式復(fù)雜且語(yǔ)義豐富的元數(shù)據(jù)映射成格式與語(yǔ)義都簡(jiǎn)單的元數(shù)據(jù),但也正是這種簡(jiǎn)單化,無(wú)法保障元數(shù)據(jù)的無(wú)損轉(zhuǎn)換,造成更多信息無(wú)法被共享與整合。

      2 ?關(guān)于DC元數(shù)據(jù)

      2.1 ?DC元數(shù)據(jù)帶來(lái)的困惑

      DC元數(shù)據(jù)是致力于規(guī)范網(wǎng)絡(luò)資源體系結(jié)構(gòu)的國(guó)際性元數(shù)據(jù)解決方案,它定義了一個(gè)所有網(wǎng)絡(luò)資源都應(yīng)遵循的、通用的核心標(biāo)準(zhǔn)。因?yàn)樗耐ㄓ眯浴⒑诵男?、可擴(kuò)展性的特征,得到了廣泛認(rèn)可,現(xiàn)已成為深具影響力的國(guó)際標(biāo)準(zhǔn)[3]。然而近年來(lái),圖書館界對(duì)DC元數(shù)據(jù)到底能做什么還是比較困惑。因?yàn)椤皠傂浴钡脑獢?shù)據(jù)方案(例如MARC),有著成熟的國(guó)際標(biāo)準(zhǔn)書目著錄(International Standard Bibliographic Description, ISBD)規(guī)范,需要描述資源的哪些內(nèi)容與形態(tài)特征、用哪些元素(字段或子字段)去描述皆有據(jù)可查、拿來(lái)即用,也有成熟的配套系統(tǒng)[3]。所以,面對(duì)只有原則、指導(dǎo)方針和框架的DC元數(shù)據(jù),無(wú)論是資源描述標(biāo)引工作人員,還是系統(tǒng)開發(fā)設(shè)計(jì)人員,都有無(wú)從下手的迷茫感。導(dǎo)致這個(gè)影響深遠(yuǎn)、多方認(rèn)可的元數(shù)據(jù)方案,卻在最注重信息資源描述的圖書館界無(wú)法推廣與普及。

      2.2 ?DC元數(shù)據(jù)的價(jià)值

      屈指可數(shù)的15個(gè)核心元素,及有限的語(yǔ)義限定和編碼限定詞,讓習(xí)慣于MARC成百上千字段與子字段的資源描述者找不到映射關(guān)系,多有“DC元數(shù)據(jù)只能簡(jiǎn)單編目”的錯(cuò)誤觀感與認(rèn)知。正是為了突破之前針對(duì)一種或有限幾種資源的元數(shù)據(jù)方案的局限性,欲使DC元數(shù)據(jù)更具通用性和適用性,使之承擔(dān)起跨類型與跨載體格式的信息資源統(tǒng)一描述功能的設(shè)計(jì)初衷和“野心”,才讓DC元數(shù)據(jù)體系更注重從語(yǔ)義層面、原則層面指導(dǎo)應(yīng)用,而非針對(duì)具體應(yīng)用具象化和形式化。

      所以,正確理解DC元數(shù)據(jù)的相關(guān)原則,才能在具體應(yīng)用中,遵循DC元數(shù)據(jù)原則并自行擴(kuò)展(也包括縮小)資源描述規(guī)范,采用合理的元數(shù)據(jù)結(jié)構(gòu)化組織方案(規(guī)范的數(shù)據(jù)格式),從而既滿足不同應(yīng)用中的資源描述需求,又保障各方元數(shù)據(jù)遵循同一個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范。

      3 ?基于DC元數(shù)據(jù)的資源統(tǒng)一描述策略

      由于DC元數(shù)據(jù)具有簡(jiǎn)單性、可擴(kuò)展性、可修改性和可選擇性原則,借助DC元數(shù)據(jù),圖書館可對(duì)館藏資源進(jìn)行統(tǒng)一描述,促進(jìn)館藏資源信息的共享與整合,更有效地解決在網(wǎng)絡(luò)中查找信息資源的問(wèn)題。在圖書的資源描述方面,可以使用基于XML的DC元數(shù)據(jù)組織技術(shù)。遵循DC元數(shù)據(jù)一一對(duì)應(yīng)原則,一個(gè)著錄對(duì)象著錄一個(gè)元數(shù)據(jù),提高著錄效率。同時(shí),通過(guò)不同元數(shù)據(jù)的關(guān)聯(lián)引用,形成諸如資源描述與檢索(Resource Description & Access, RDA)需要的信息關(guān)聯(lián)的標(biāo)引與整合效果。

      3.1 ?描述元素核心化策略

      DC元數(shù)據(jù)的簡(jiǎn)單性原則,要求定義一個(gè)能得到廣泛應(yīng)用、被全球所理解和接受的小元素集,并能作為特殊用戶詳細(xì)描述需求的一個(gè)核心集[3]。這個(gè)原則的核心價(jià)值在于,將資源描述對(duì)象分成各個(gè)語(yǔ)義互不重疊、互不交叉的描述層面或著錄項(xiàng),1個(gè)描述層面或著錄項(xiàng)采用1個(gè)標(biāo)記元素進(jìn)行標(biāo)記。

      雖然DC元數(shù)據(jù)只確定了15個(gè)涵蓋面最廣、能得以公認(rèn)的核心元素,但DC元數(shù)據(jù)的可擴(kuò)展原則指出,可以DC元數(shù)據(jù)核心元素集為基礎(chǔ),并為適應(yīng)各領(lǐng)域資源描述需要而擴(kuò)展或自定義別的元素。當(dāng)然,這些擴(kuò)展或自定義的元素也需要符合DC元數(shù)據(jù)的簡(jiǎn)單性原則,即語(yǔ)義要與DC元數(shù)據(jù)核心元素及其它擴(kuò)展或自定義元素相對(duì)獨(dú)立。

      與MARC對(duì)資源的同一描述層面(如各種題名信息)采用多個(gè)標(biāo)記字段或子字段進(jìn)行資源描述標(biāo)記的元數(shù)據(jù)體系相比,DC元數(shù)據(jù)的標(biāo)記元素確立原則顯然更具針對(duì)性與準(zhǔn)確性,也極大地降低了資源描述與理解的成本和難度。

      所以,在行業(yè)應(yīng)用中,針對(duì)特定資源進(jìn)行描述時(shí),首先應(yīng)該保證描述元素核心化的描述策略。例如,在書目元數(shù)據(jù)中,應(yīng)該將傳統(tǒng)的“正題名”“并列題名”“副題名”“叢書名”“書脊題名”等各種與題名信息相關(guān)的標(biāo)記元素,核心化或抽象化為1個(gè)“題名”元素。結(jié)合DC元數(shù)據(jù)的簡(jiǎn)單性原則和可選擇性原則,語(yǔ)義獨(dú)立的、有限的核心元素,就可以低成本實(shí)現(xiàn)資源的簡(jiǎn)單描述了。

      3.2 ?描述元素可修飾或可限定策略

      DC元數(shù)據(jù)的可修改性原則,是指在具體應(yīng)用中,可以對(duì)DC元數(shù)據(jù)元素集中的任何元素進(jìn)行進(jìn)一步修飾或限定,但不能擴(kuò)大或改變?cè)氐幕菊Z(yǔ)義[3]。即元素是某個(gè)信息面全部的語(yǔ)義集合標(biāo)記,其“修飾”或“限定”后的語(yǔ)義只是這個(gè)語(yǔ)義集合范疇中的子集,根據(jù)需要,可以從多個(gè)角度、多種粒度對(duì)元素所標(biāo)記的語(yǔ)義實(shí)現(xiàn)精致、細(xì)化或取值限定。所以,正確理解這個(gè)原則,可以消除DC元數(shù)據(jù)不能滿足圖書館復(fù)雜的書目描述需求的常見誤會(huì)。

      雖然前例中,將所有與題名信息相關(guān)的標(biāo)記元素核心化為1個(gè)“題名”元素后,肯定無(wú)法實(shí)現(xiàn)題名細(xì)節(jié)的描述與表達(dá)。但根據(jù)元素可修飾與可限定的統(tǒng)一描述策略,可以制定相應(yīng)的語(yǔ)義修飾或限定詞表,及決定采用哪些編碼取值體系并據(jù)此取值,從而實(shí)現(xiàn)“題名”這個(gè)核心元素的語(yǔ)義精致(細(xì)化)或編碼取值體系聲明。

      圖書館人熟知的“題名”著錄項(xiàng)中的“題名(正的)”“題名(另一著者的)”“題名(副的)”“題名(并列的)”“題名(分輯的)”等著錄細(xì)節(jié),括號(hào)中的詞匯就可視為“題名”元素的語(yǔ)義修飾或限定詞。而“題名(拼音形式)”,括號(hào)中的“拼音形式”,就可視為“題名”元素的編碼體系修飾或限定詞(即聲明采用漢語(yǔ)拼音這種規(guī)范體系或格式對(duì)資源“題名”信息進(jìn)行描述)??梢钥闯觯谛揎椈蛳薅ㄔ~的輔助下,基于DC元數(shù)據(jù)的新型元數(shù)據(jù),可以實(shí)現(xiàn)與MARC元數(shù)據(jù)的一一對(duì)應(yīng)與映射。

      根據(jù)需要,可以對(duì)元素不作修飾或限定,也可以只對(duì)元素作語(yǔ)義修飾或限定,或者只對(duì)元素作編碼體系修飾或限定,當(dāng)然也可以對(duì)元素同時(shí)采用語(yǔ)義和編碼體系的修飾或限定。根據(jù)描述元素可修飾與可限定策略,按需規(guī)劃并確定好元素的語(yǔ)義修飾或限定詞表、編碼體系修飾或限定詞表(體系名稱或標(biāo)識(shí)符,并據(jù)此規(guī)范取值),保證任何粒度的資源描述實(shí)現(xiàn)。

      3.3 ?元數(shù)據(jù)結(jié)構(gòu)化與可伸縮化策略

      盡管DC元數(shù)據(jù)體系理念非常先進(jìn),但沒(méi)有特定的元數(shù)據(jù)結(jié)構(gòu)化組織方案就不可能實(shí)用化,也無(wú)法體現(xiàn)出它的先進(jìn)性與獨(dú)特性。眾所周知,越結(jié)構(gòu)化的數(shù)據(jù),計(jì)算機(jī)越容易理解,信息間的關(guān)系越清晰、語(yǔ)義越明確。XML作為目前公認(rèn)最具結(jié)構(gòu)化的數(shù)據(jù)格式和互聯(lián)網(wǎng)標(biāo)準(zhǔn),包括DC元數(shù)據(jù)在內(nèi)的多種元數(shù)據(jù)標(biāo)準(zhǔn)也多采用XML作為其編碼方案。借助XML的元素、屬性概念與數(shù)據(jù)結(jié)構(gòu),很容易構(gòu)建出高度結(jié)構(gòu)化且語(yǔ)義表達(dá)彈性伸縮的資源統(tǒng)一描述策略[3]。例如:

      UKOLN

      UK Office for Library

      當(dāng)不清楚是否需要對(duì)“UK Office for Library”這個(gè)題名信息啟用語(yǔ)義限定或啟用什么語(yǔ)義限定詞時(shí),忽略這個(gè)數(shù)據(jù)結(jié)構(gòu)中的refinement屬性即可(這個(gè)refinement屬性名稱,與元數(shù)據(jù)無(wú)關(guān),僅從數(shù)據(jù)結(jié)構(gòu)層面體現(xiàn)出元數(shù)據(jù)的語(yǔ)義限定信息,所以,是否采用或更換這個(gè)屬性名稱,各應(yīng)用可視情況而定)。

      與采用XML元素屬性結(jié)構(gòu)來(lái)表達(dá)元數(shù)據(jù)元素的語(yǔ)義限定一樣,元數(shù)據(jù)元素的編碼限定也應(yīng)該采用XML元素屬性結(jié)構(gòu)實(shí)現(xiàn)表達(dá)。類似自定義的refinement屬性名,應(yīng)用中也可以自定義另1個(gè)屬性名,用其值來(lái)聲明具體的編碼限定體系(表達(dá)元素已被編碼限定)。推薦:作為XML的規(guī)范與模式約束,結(jié)合XML Schema這個(gè)標(biāo)準(zhǔn)中的數(shù)據(jù)類型派生(取值限定)表達(dá),直接在XML數(shù)據(jù)結(jié)構(gòu)中,采用業(yè)界熟知的xsi:type屬性名比自定義屬性名更容易讓人理解與接受。例如:

      騎士的故事

      qi shi de gu shi

      這樣的數(shù)據(jù)結(jié)構(gòu),可以清晰表明“qi shi de gu shi”這是題名的描述信息,是采用漢語(yǔ)拼音體系而非其它可能的語(yǔ)種、注音或字母體系,避免了可能有的歧義和沖突。

      甚至,結(jié)合XML標(biāo)準(zhǔn)中的xml:lang屬性、xml:id屬性,在有需要時(shí),就可以滿足添加或忽略描述語(yǔ)種、實(shí)現(xiàn)描述元素間的關(guān)聯(lián)表達(dá)(id引用或交叉引用)的需求。

      騎士的故事

      The Knights Tale

      qi shi de gu shi

      XML的元素、元素屬性,是獨(dú)立于元數(shù)據(jù)體系、屬于數(shù)據(jù)結(jié)構(gòu)化、屬于計(jì)算機(jī)技術(shù)層面的表達(dá)與實(shí)現(xiàn),不會(huì)對(duì)資源的元數(shù)據(jù)描述帶來(lái)干擾和增加成本。所以,選擇與設(shè)計(jì)一個(gè)清晰和無(wú)歧義、穩(wěn)定和可伸縮的元數(shù)據(jù)編碼結(jié)構(gòu)的資源統(tǒng)一描述策略,會(huì)輔助元數(shù)據(jù),實(shí)現(xiàn)資源的描述和信息揭示。

      3.4 ?資源描述對(duì)象單一化策略

      RDA是應(yīng)數(shù)字環(huán)境的發(fā)展而制定的最新國(guó)際編目規(guī)則,力求涵蓋當(dāng)前數(shù)字環(huán)境中所有內(nèi)容類型和媒介類型的資源,從一般到特殊,為不同類型的文獻(xiàn)資源提供著錄和檢索的統(tǒng)一方法。為了更深入、詳細(xì)、直白地揭示信息資源,RDA在對(duì)英美編目規(guī)則第二版(Anglo-American Cataloguing Rules, 2nd Edition, AACR2)做了相應(yīng)的調(diào)整與改進(jìn)的同時(shí),更是以書目記錄的功能需求(Functional Requirements for Bibliographic Records, FRBR)提出的實(shí)體-關(guān)系模型(Entity-Relationship model, E-R)概念模型為基礎(chǔ),通過(guò)“識(shí)別”和“關(guān)聯(lián)”,將館藏資源分成作品、內(nèi)容表達(dá)、載體表現(xiàn)和單件4個(gè)層次,分別記錄實(shí)體、屬性、實(shí)體間的關(guān)系[4]。

      強(qiáng)調(diào)資源描述對(duì)象間的關(guān)系,及資源描述對(duì)象與其屬性的關(guān)系,是RDA順應(yīng)資源統(tǒng)一描述與統(tǒng)一檢索需求的創(chuàng)新思路。然而,RDA只是一套編目規(guī)則,或者說(shuō)“內(nèi)容標(biāo)準(zhǔn)”,數(shù)據(jù)格式與元數(shù)據(jù)觀念不更新,再好的目標(biāo)也無(wú)法實(shí)現(xiàn)。事實(shí)上,在現(xiàn)有MARC元數(shù)據(jù)體系下,依靠擴(kuò)展或調(diào)整元數(shù)據(jù)的標(biāo)記字段或子字段,依靠規(guī)范描述細(xì)節(jié)要求,MARC元數(shù)據(jù)既有的局限仍會(huì)繼續(xù)影響資源描述的應(yīng)用。甚至,如果只理解RDA就只是增加了著錄項(xiàng)和著錄對(duì)象,這種同時(shí)面對(duì)多種資源對(duì)象的描述工作,必然增加RDA著錄理解成本和著錄難度。這也是采用RDA實(shí)現(xiàn)資源描述至今尚未普及的原因。

      在資源統(tǒng)一描述中,堅(jiān)持資源描述對(duì)象單一化的策略,可以很好地推動(dòng)RDA目標(biāo)的實(shí)現(xiàn)。DC元數(shù)據(jù)的一對(duì)一原則,即每個(gè)資源都應(yīng)該有一條單獨(dú)的(discrete)元數(shù)據(jù)描述,而每一條元數(shù)據(jù)描述所包含的元素必須與1個(gè)單獨(dú)的資源相關(guān)聯(lián)?;诖隧?xiàng)原則,目前通常認(rèn)為1條元數(shù)據(jù)描述應(yīng)該只描述1個(gè)資源對(duì)象(雖然1個(gè)資源對(duì)象不一定只有1條元數(shù)據(jù))。因?yàn)橛?條元數(shù)據(jù)同時(shí)描述其各種載體表現(xiàn),或?yàn)榱怂^的統(tǒng)一描述與檢索需要,在1條元數(shù)據(jù)中還涉及與當(dāng)前描述對(duì)象相關(guān)的其它資源對(duì)象的描述,會(huì)帶來(lái)資源描述成本的增加、數(shù)據(jù)冗余及管理和長(zhǎng)期保存上的嚴(yán)重問(wèn)題[3]。

      1條RDA目錄中可能涉及到內(nèi)容信息、紙質(zhì)館藏信息、數(shù)字化信息、責(zé)任者信息、它包括的部分對(duì)象信息、包含它的對(duì)象信息等。信息內(nèi)容豐富的同時(shí),也極大地增加了著錄難度與成本。其實(shí),更科學(xué)合理的資源描述理念與管理方式應(yīng)該是:對(duì)紙質(zhì)館藏對(duì)象進(jìn)行描述,對(duì)數(shù)字化對(duì)象進(jìn)行描述,對(duì)人物或機(jī)構(gòu)對(duì)象進(jìn)行描述,分別形成1條元數(shù)據(jù);對(duì)其它相關(guān)的對(duì)象,也同樣獨(dú)立地進(jìn)行描述,形成1條元數(shù)據(jù)。然后,通過(guò)計(jì)算機(jī)系統(tǒng)或著錄工具,實(shí)現(xiàn)這些不同元數(shù)據(jù)的參考引用,并綁定相關(guān)的引用標(biāo)識(shí)。

      每條元數(shù)據(jù),都可以根據(jù)需要靈活選擇不同的元數(shù)據(jù)標(biāo)識(shí)體系并據(jù)其取值,甚至可以同時(shí)采用多種標(biāo)識(shí)體系并據(jù)其取值。包括國(guó)際標(biāo)準(zhǔn)書號(hào)(International Standard Book Number, ISBN)、統(tǒng)一資源定位符(Uniform Resource Locator, URL)、數(shù)字對(duì)象標(biāo)識(shí)(Digital Object Identifier, DOI)及自定義的多種標(biāo)識(shí)體系。遵照前述,在資源唯一標(biāo)識(shí)元素dc:identifier中,采用這些具備唯一性特征的編碼體系,在實(shí)際應(yīng)用中計(jì)算機(jī)系統(tǒng)就能準(zhǔn)確尋找到對(duì)應(yīng)元數(shù)據(jù),例如,以下標(biāo)識(shí)符表達(dá)方式都是合理的:

      9788888888888

      http://example.com/search?GeoffreyChaucer

      10.3969/j.issn.7788-8877.2015.02.009

      7788xyz

      在針對(duì)《騎士的故事》這種圖書的元數(shù)據(jù)描述中,根據(jù)dc:contributor元素的語(yǔ)義限定詞,知道是“著者”的描述信息,根據(jù)“URL”這個(gè)編碼體系聲明,知道著者的描述信息可以通過(guò)URL方式對(duì)應(yīng)獲取,即可引導(dǎo)訪問(wèn)者查看人物或機(jī)構(gòu)規(guī)范庫(kù)中的著者描述元數(shù)據(jù),從而獲得著者的詳細(xì)信息。同理,通過(guò)查找ISBN號(hào)“9788888888888”,可以獲得包含當(dāng)前資源對(duì)象的另一個(gè)資源對(duì)象的詳細(xì)信息;通過(guò)URL標(biāo)識(shí)值,可以獲得另一個(gè)載體格式版本資源對(duì)象的詳細(xì)信息;通過(guò)DOI標(biāo)識(shí)值,可以獲得引用過(guò)當(dāng)前資源對(duì)象的另一個(gè)資源對(duì)象的信息;甚至根據(jù)應(yīng)用需要,可以實(shí)現(xiàn)多個(gè)資源間的各種特定關(guān)系的描述,并引導(dǎo)獲取相應(yīng)的資源描述信息:

      騎士的故事

      http://example.com/search?GeoffreyChaucer

      9788888888888

      http://example.com/search?KnightsTale

      10.3969/ j.issn.7788-8877.2015.02.009

      7788xyz

      從以上可以看出,在堅(jiān)持資源描述對(duì)象單一化的策略指導(dǎo)下,可以實(shí)現(xiàn)一個(gè)描述(元數(shù)據(jù)),多次、多方關(guān)聯(lián)和調(diào)用,極大地降低了數(shù)據(jù)冗余與資源描述成本。

      4 ?小結(jié)

      采用一種大家共同遵守的元數(shù)據(jù)體系,對(duì)各類型信息資源進(jìn)行語(yǔ)義與格式統(tǒng)一的元數(shù)據(jù)描述是完全可行的。在這種策略指導(dǎo)下,可以對(duì)OAI與RDA進(jìn)行低成本、高效率地改造,有助于其應(yīng)用與推廣,更有助于早日實(shí)現(xiàn)資源共享、信息整合的業(yè)界目標(biāo)。目前,DC元數(shù)據(jù)在數(shù)字圖書館建設(shè)中的應(yīng)用越來(lái)越多,中國(guó)國(guó)家圖書館以DC元數(shù)據(jù)制作了大量的數(shù)字化資源,上海圖書館與清華大學(xué)也參與了聯(lián)機(jī)計(jì)算機(jī)圖書館中心(Online Computer Library Center, OCLC)基于都柏林核心元數(shù)據(jù)元素集的合作聯(lián)機(jī)資源目錄(Co-operative Online Resource Catalog, CORC)計(jì)劃,另外還有清華大學(xué)建筑數(shù)字圖書館、北京大學(xué)圖書館古籍拓片數(shù)據(jù)庫(kù)等[5],相信DC元數(shù)據(jù)在圖書館的應(yīng)用前景一定會(huì)更廣闊。

      參考文獻(xiàn)

      [1] 朱超.關(guān)于元數(shù)據(jù)互操作的探討[J].情報(bào)理論與實(shí)踐,2005,28(6): 644-647,655.

      [2] DAY M. Mapping between metadata formats[EB/OL].[2019-12-04]. http://www.ukoln.ac.uk/metadata/interoperability/.

      [3] 劉煒,樓向英,趙亮.DC元數(shù)據(jù)的歷史、現(xiàn)狀及未來(lái)[EB/OL]. ?[2019-10-16].http://www.libnet.sh.cn/sztsg/fulltext/reports/ 2005/DC元數(shù)據(jù)_overview.pdf.

      [4] 葛紅梅,徐晶晶,董鵬.資源描述與檢索(RDA)書目數(shù)據(jù)在圖書館編目中的應(yīng)用[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2015,24(2):38-42.

      [5] 黃星亮.都柏林核心元數(shù)據(jù)及其在我國(guó)數(shù)字圖書館建設(shè)中的應(yīng)用[J].津圖學(xué)刊,2002(3):17-19,24.

      (收稿日期:2020-01-13)

      (修回日期:2020-03-16;編輯:魏民)

      猜你喜歡
      元數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)資源管理
      人事檔案管理在人力資源管理中的作用
      人力資源管理促進(jìn)企業(yè)績(jī)效提升
      企業(yè)人力資源管理
      GIS在森林資源管理中的應(yīng)用
      基于來(lái)源的組織機(jī)構(gòu)元數(shù)據(jù)構(gòu)建研究
      檔案管理(2017年1期)2017-01-17 19:09:04
      元數(shù)據(jù)與社會(huì)化標(biāo)簽在微視頻搜索中的應(yīng)用
      高等院校智慧校園建設(shè)規(guī)劃與實(shí)現(xiàn)
      “翻轉(zhuǎn)課堂”教學(xué)模式的探討——以《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)為例
      歸檔網(wǎng)絡(luò)信息價(jià)值判斷的元數(shù)據(jù)描述研究綜述
      高職高專數(shù)據(jù)結(jié)構(gòu)教學(xué)改革探討
      台山市| 定边县| 平安县| 峡江县| 罗源县| 突泉县| 即墨市| 富民县| 榕江县| 即墨市| 柯坪县| 磴口县| 河北区| 和田县| 巴塘县| 宝山区| 墨脱县| 务川| 舞阳县| 扬中市| 喜德县| 色达县| 乌兰浩特市| 肥东县| 鞍山市| 漳州市| 乐都县| 黑山县| 长海县| 建水县| 专栏| 咸阳市| 平原县| 巴楚县| 青田县| 牙克石市| 永济市| 延安市| 乌兰浩特市| 鄄城县| 宁波市|