李愛華
(河南廣播電視大學(xué),鄭州%450000)
元數(shù)據(jù)作為一種在計(jì)算機(jī)科學(xué)領(lǐng)域的專業(yè)術(shù)語(yǔ),已經(jīng)逐步地運(yùn)用在了地理、文藝、圖書情報(bào)等領(lǐng)域,而隨著電子文件的出現(xiàn)和電子檔案的管理以及數(shù)字檔案館的建立,從20世紀(jì)90年代起,檔案界的學(xué)者們也對(duì)檔案元數(shù)據(jù)問(wèn)題的研究高度重視,相關(guān)研究成果層出不窮,在此筆者僅對(duì)檔案學(xué)界的元數(shù)據(jù)研究做以下分析述評(píng)。
對(duì)檔案元數(shù)據(jù)定義的理解是檔案學(xué)界研究元數(shù)據(jù)之初就普遍研究的一個(gè)方向,作為一個(gè)由其他領(lǐng)域移植而來(lái)的名詞,檔案界起初并不能很好地理解它的含義。通常來(lái)講,元數(shù)據(jù)就是指關(guān)于數(shù)據(jù)的數(shù)據(jù)。這一定義比較抽象、泛指,在不同的領(lǐng)域還有其不同的內(nèi)涵和外延。
蘇州大學(xué)的譚琤培、章丹在其研究成果中就列舉了元數(shù)據(jù)在地理界、數(shù)據(jù)倉(cāng)庫(kù)等領(lǐng)域中的含義,同時(shí)還將國(guó)際圖書館協(xié)會(huì)聯(lián)盟(IFLA)、政府信息領(lǐng)域、英國(guó)公共檔案館(PRO)對(duì)元數(shù)據(jù)做出的定義進(jìn)行了列舉闡述,指出盡管在不同專業(yè)領(lǐng)域?qū)υ獢?shù)據(jù)的定義有諸多的不同,但其本質(zhì)是一樣的,即元數(shù)據(jù)是一種有效的信息資源組織和管理的工具,是一種編碼體系。它可以幫助人們檢索和確認(rèn)所需要的資源,可以對(duì)數(shù)據(jù)單元進(jìn)行詳細(xì)、全面的著錄描述,可以支持資源的存儲(chǔ)和使用管理,支持對(duì)資源進(jìn)行長(zhǎng)期保存[1]。段榮婷也指出元數(shù)據(jù)是描述一個(gè)資源特別是網(wǎng)絡(luò)資源對(duì)象的屬性或特征的數(shù)據(jù),它有助于資源的發(fā)現(xiàn)、定位、評(píng)估與選擇等。就功能而言,相當(dāng)于一個(gè)電子目錄。劉家真教授在對(duì)電子文件這一問(wèn)題研究時(shí)也涉及了對(duì)元數(shù)據(jù)問(wèn)題的探討,她指出元數(shù)據(jù)是“描述數(shù)據(jù)和數(shù)據(jù)系統(tǒng)的數(shù)據(jù)。在電子記錄中,它意味著數(shù)據(jù)必須與電子記錄一起獲取,使他們能夠被理解并支持它們的管理和利用”。而目前我國(guó)檔案界對(duì)電子文件中的元數(shù)據(jù)則定義為由電子文件系統(tǒng)自動(dòng)記錄的關(guān)于文件形成時(shí)間、地點(diǎn)、人員、活動(dòng)、文件系統(tǒng)、結(jié)構(gòu)及內(nèi)容等方面的具體數(shù)據(jù)。
除此之外,還有很多學(xué)者對(duì)元數(shù)據(jù)如何定義進(jìn)行了探討,結(jié)論也都大同小異,大家對(duì)于元數(shù)據(jù)的定義和理解已經(jīng)基本達(dá)成了一致,只是在表述上還沒有完全統(tǒng)一。其實(shí)正如蘇·麥克教授所說(shuō):“……元數(shù)據(jù)實(shí)際就是一個(gè)久已存在于我們周圍的一個(gè)簡(jiǎn)單的新詞……傳統(tǒng)的檢索工具、目錄卡片、案卷目錄、案卷封面、紙張文件的題名與腳注,所有這些都包括了元數(shù)據(jù)?!薄啊瓩n案工作者早已能獲取和利用元數(shù)據(jù)了。但是,他們以前并沒有聽說(shuō)過(guò)‘元數(shù)據(jù)’這個(gè)詞?!保?]因此,我們可以看出,在傳統(tǒng)的環(huán)境下,“元數(shù)據(jù)”已經(jīng)廣泛存在于檔案領(lǐng)域,而在如今的電子文件管理時(shí)代,它在檔案界的身份和作用被進(jìn)一步地明確和認(rèn)可。
綜上所述,檔案元數(shù)據(jù)具體來(lái)說(shuō)應(yīng)該是描述檔案及檔案業(yè)務(wù)的數(shù)據(jù)集合,主要包括基本元數(shù)據(jù)集、管理元數(shù)據(jù)集和業(yè)務(wù)處理元數(shù)據(jù)集三大部分。
(1)基本元數(shù)據(jù)是用以描述檔案內(nèi)容的基本屬性,主要包括文號(hào)、題名、時(shí)間、責(zé)任者、頁(yè)數(shù)、備注等。
(2)管理元數(shù)據(jù)是為了檔案管理、保存和提供利用需要而確定的元數(shù)據(jù)集。主要包括立檔單位、件號(hào)(順序號(hào))、檔號(hào)、全宗、類目、保管期限、保管級(jí)別、密級(jí)、存址(庫(kù)房位置、電子文件的URL)、載體、檢索/信息分類等。
(3)業(yè)務(wù)處理元數(shù)據(jù)是描述各檔案管理業(yè)務(wù)過(guò)程中產(chǎn)生的各種信息的元數(shù)據(jù)集。主要包括接口處理的責(zé)任鏈信息、工作過(guò)程產(chǎn)生的與檔案密切相關(guān)的過(guò)程信息。主要包括檔案的移交、接收、分類、排列、編號(hào)、組卷、編目、入庫(kù)、上架、庫(kù)房檔案狀態(tài)、保護(hù)處理、數(shù)字化處理、縮微處理、開放處理、利用信息、銷毀處理等工作的時(shí)間、責(zé)任者、處理相關(guān)信息等。這些元數(shù)據(jù)集記錄了檔案工作的全過(guò)程信息。
對(duì)檔案元數(shù)據(jù)的類型劃分的研究,也是眾說(shuō)紛紜。
吳淑娟提到,美國(guó)Getty(格蒂)信息研究所認(rèn)為可以將元數(shù)據(jù)劃分為管理型、描述型、保存型、技術(shù)型和使用型五種類型,并對(duì)其中的幾種常用類型進(jìn)行了深入研究,指出管理型元數(shù)據(jù)的實(shí)質(zhì)就是對(duì)信息系統(tǒng)管理機(jī)制的規(guī)范、開放描述,是用來(lái)描述管理政策與規(guī)則的;結(jié)構(gòu)型元數(shù)據(jù)也可以稱作是置標(biāo)語(yǔ)言,在發(fā)現(xiàn)通用置標(biāo)語(yǔ)言 (SGML)的復(fù)雜性以及超文本置標(biāo)語(yǔ)言(HTML)的不可擴(kuò)展性等非結(jié)構(gòu)性的缺陷后,繼而推出了適用性更強(qiáng)的可擴(kuò)展置標(biāo)語(yǔ)言;保存型元數(shù)據(jù)就是指支持?jǐn)?shù)字化資源長(zhǎng)期保存的數(shù)據(jù)。黃萃和葉曉林則對(duì)元數(shù)據(jù)從功能上劃分,提出了元數(shù)據(jù)的七種類型:確認(rèn)和檢索型、著錄描述型、信息資源的組織體系型、資源管理型、支持資源保護(hù)與長(zhǎng)期保存型支持信息資源管理系統(tǒng)功能的執(zhí)行型以及對(duì)信息資源管理系統(tǒng)進(jìn)行系統(tǒng)建模類元數(shù)據(jù)。
還有另一些學(xué)者持不同的看法。如吳品才根據(jù)元數(shù)據(jù)的內(nèi)容,將其劃分為兩種類型:結(jié)構(gòu)信息元數(shù)據(jù)和背景信息元數(shù)據(jù)。結(jié)構(gòu)信息元數(shù)據(jù)是指收到文件的結(jié)構(gòu)鏈,包括文件本身的內(nèi)部結(jié)構(gòu)和將數(shù)據(jù)加工成文件的軟件命令;背景信息元數(shù)據(jù)是指有關(guān)的業(yè)務(wù)活動(dòng)中文件來(lái)源和使用目的等方面的信息。劉必全對(duì)元數(shù)據(jù)類型的劃分則又從另一個(gè)角度出發(fā),將其劃分為:(1)檔案信息內(nèi)容元數(shù)據(jù)。這種元數(shù)據(jù)主要是將組成各類檔案的信息內(nèi)容及其結(jié)構(gòu)進(jìn)行標(biāo)記。(2)檔案作品與對(duì)象元數(shù)據(jù)。這種元數(shù)據(jù)是對(duì)各種載體形態(tài)下的檔案,甚至是物理對(duì)象的特征進(jìn)行描述。(3)檔案資源集合元數(shù)據(jù)。這種元數(shù)據(jù)是對(duì)檔案或組成檔案信息資源集合及其管理組織和知識(shí)組織體系進(jìn)行描述。(4)檔案管理與服務(wù)機(jī)制元數(shù)據(jù)。這種元數(shù)據(jù)是對(duì)檔案信息資源使用與管理中的資源評(píng)價(jià)、使用控制、權(quán)限管理、長(zhǎng)期存取等方面的政策和控制機(jī)制進(jìn)行描述。(5)檔案信息管理過(guò)程與系統(tǒng)元數(shù)據(jù)。這種元數(shù)據(jù)是對(duì)檔案信息服務(wù)過(guò)程和檔案信息系統(tǒng)的運(yùn)行模式、工作流程、模塊調(diào)用、系統(tǒng)控制等進(jìn)行描述。(6)檔案宏元數(shù)據(jù)。這種元數(shù)據(jù)是指對(duì)描述檔案元數(shù)據(jù)本身標(biāo)記語(yǔ)言、格式語(yǔ)言、套用、復(fù)用共享機(jī)制、轉(zhuǎn)換機(jī)制等進(jìn)行描述。
可以看出,關(guān)于檔案元數(shù)據(jù)的類型劃分問(wèn)題,目前檔案界是眾說(shuō)紛紜,各持己見,還沒有很好的定論,不同的研究角度有著不同的觀點(diǎn)。筆者認(rèn)為這樣的局面只是暫時(shí)性的,隨著檔案學(xué)者們對(duì)元數(shù)據(jù)的進(jìn)一步研究,一定會(huì)對(duì)元數(shù)據(jù)的類型做出完善的全面的總結(jié)。
分析了元數(shù)據(jù)的定義、內(nèi)涵及其類型,那么元數(shù)據(jù)到底是干什么用的呢?這就是元數(shù)據(jù)的的具體作用或者說(shuō)是它的功能,這一方面也是檔案學(xué)者研究的重點(diǎn)。
劉必全將元數(shù)據(jù)的作用歸納為這幾方面:(1)確認(rèn)和檢索,主要致力于如何幫助人們檢索和確認(rèn)所需要的資源,都柏林核心標(biāo)準(zhǔn)(Dublin%Core)是其典型代表。(2)著錄描述,用于對(duì)數(shù)據(jù)單元進(jìn)行詳細(xì)、全面的著錄描述,數(shù)據(jù)元素囊括內(nèi)容、載體、位置與獲取方式、制作與利用方法,甚至相關(guān)數(shù)據(jù)單元方面等,數(shù)據(jù)元素?cái)?shù)量往 往 較 多 ,MARC、GILS和 FGDC/CSDGM是 這 類Metadata的典型代表。(3)資源管理,支持資源的存儲(chǔ)和使用管理,數(shù)據(jù)元素除比較全面的著錄描述信息外,還往往包括權(quán)利管理、電子簽名、資源評(píng)鑒、使用管理等方面的信息。(4)資源保護(hù)與長(zhǎng)期保存,支持對(duì)資源進(jìn)行長(zhǎng)期保存,數(shù)據(jù)元素除對(duì)資源進(jìn)行描述和確認(rèn)外,往往包括詳細(xì)的格式信息、制作信息、保護(hù)條件、轉(zhuǎn)換方式、保存責(zé)任等內(nèi)容。
其他學(xué)者對(duì)檔案元數(shù)據(jù)的功能也有著各自不同的見解。劉越男在研究電子文件中的元數(shù)據(jù)時(shí)提到了元數(shù)據(jù)對(duì)電子文件的著錄功能,他指出電子文件的著錄不同于傳統(tǒng)的紙制文件的著錄,檔案元數(shù)據(jù)在著錄工作中不僅僅可以為編制檢索工具所用,還通過(guò)對(duì)文件內(nèi)容、結(jié)構(gòu)、背景的全面描述,幫助人們確認(rèn)電子文件的長(zhǎng)期真實(shí)性。張大偉也提出用于歸檔電子文件管理的元數(shù)據(jù)有兩個(gè)作用:一是描述功能,即選擇、記錄電子文件的內(nèi)容或形式特征屬性,以便于電子文件的檢索、選擇、定位和提供利用。二是是管理功能,即選擇、記錄電子文件從形成到銷毀的整個(gè)生命周期過(guò)程中的變化、使用和管理信息,以及對(duì)元數(shù)據(jù)本身的管理信息,如元數(shù)據(jù)的來(lái)源、與主文件的關(guān)聯(lián)信息等,以控制和證明電子文件的真實(shí)性、完整性、有效性。徐維也撰文強(qiáng)調(diào)了元數(shù)據(jù)在電子文件管理中的重要作用:元數(shù)據(jù)有效地加強(qiáng)了電子文件的憑證作用,元數(shù)據(jù)有力補(bǔ)充電子文件的著錄,元數(shù)據(jù)可以在一定程度上保證電子文件的長(zhǎng)期可讀性。
從以上的研究中可以看出,對(duì)于目前電子文件時(shí)代的檔案工作中,元數(shù)據(jù)有著重要的作用,雖然眾多學(xué)者對(duì)其功能作用研究的角度不同,表述各異,但可以看出大家都認(rèn)同元數(shù)據(jù)在維護(hù)電子文件真實(shí)性、有效性和完整性方面的功能,元數(shù)據(jù)已經(jīng)是電子文件管理時(shí)代的一項(xiàng)必不可少的技術(shù)基礎(chǔ)。
關(guān)于檔案元數(shù)據(jù)的標(biāo)準(zhǔn)化這一問(wèn)題,現(xiàn)在大多數(shù)學(xué)者都是在對(duì)國(guó)外的元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行分析研究的基礎(chǔ)上,對(duì)我國(guó)的檔案元數(shù)據(jù)標(biāo)準(zhǔn)制定找尋一定的啟示和借鑒。
談及相關(guān)檔案資源管理的元數(shù)據(jù)標(biāo)準(zhǔn),應(yīng)該要提及都柏林元數(shù)據(jù)標(biāo)準(zhǔn)(DC),它是由Dublin%Core%工作組制定的元數(shù)據(jù)國(guó)際標(biāo)準(zhǔn),現(xiàn)在廣泛地應(yīng)用于元數(shù)據(jù)的標(biāo)準(zhǔn)管理領(lǐng)域,成為各種資源元數(shù)據(jù)制定元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)。它包括十五個(gè)核心元素:題名(Title)、作者或創(chuàng)作者 (Author%or%Creator)、主題詞和關(guān)鍵詞(Sub ject%and%Keywords)、描述(Description)、出版者(Publish er)、其他參與者(Other%contributor)、時(shí)間(date)、類型(type)、格式(format)、資源標(biāo)識(shí)(resource%Identifies)、來(lái)源(source)、語(yǔ)言(language)、關(guān)聯(lián)(relation)、覆蓋范圍(coverage)、權(quán)限管理(rights)等,這些元素都是可選和重復(fù)使用的。[3]另外還有“檔案置標(biāo)著錄”(EAD)是標(biāo)準(zhǔn)置標(biāo)語(yǔ)言(SGML)的一個(gè)專用數(shù)據(jù)類型,是專門為解決檢索工具上網(wǎng)而制定的標(biāo)準(zhǔn),王小麗和王芳在《國(guó)內(nèi)外數(shù)字檔案館元數(shù)據(jù)標(biāo)準(zhǔn)體系比較研究》一文中對(duì)EAD進(jìn)行了詳細(xì)的介紹。
除了對(duì)國(guó)外一些標(biāo)準(zhǔn)的介紹,還有不少學(xué)者以比較的方式全面地分析各種標(biāo)準(zhǔn)的異同。郝晨輝、曹燕、李華鋒在研究這一問(wèn)題時(shí),就在闡述元數(shù)據(jù)的定義、作用以及元數(shù)據(jù)標(biāo)準(zhǔn)化的必要性的基礎(chǔ)上,比較了都柏林標(biāo)準(zhǔn)(DC)、澳大利亞電子政務(wù)元數(shù)據(jù)標(biāo)準(zhǔn)(AGLS)、新西蘭電子政務(wù)元數(shù)據(jù)標(biāo)準(zhǔn)(NZGLS),指出在電子文件管理中的元數(shù)據(jù)的標(biāo)準(zhǔn)化問(wèn)題已經(jīng)是電子時(shí)代檔案管理中的一個(gè)急需解決的問(wèn)題,我們可以在借鑒和吸收國(guó)外好經(jīng)驗(yàn)的基礎(chǔ)上,建立與我國(guó)具體情況相符合的電子文件元數(shù)據(jù)標(biāo)準(zhǔn)。而張正強(qiáng)則指出對(duì)電子文件元數(shù)據(jù)的標(biāo)準(zhǔn)化研究,明確元數(shù)據(jù)國(guó)際標(biāo)準(zhǔn)化的背景,然后從元數(shù)據(jù)的概念、需求、建立原則、體系框架的國(guó)際標(biāo)準(zhǔn)化分別論述。程妍妍對(duì)元數(shù)據(jù)的標(biāo)準(zhǔn)化問(wèn)題則從另一個(gè)角度探討,她認(rèn)為元數(shù)據(jù)在內(nèi)容和結(jié)構(gòu)上的有序應(yīng)該集中體現(xiàn)在電子文件管理元數(shù)據(jù)標(biāo)準(zhǔn)中,因而在制定元數(shù)據(jù)標(biāo)準(zhǔn)時(shí),要注意宏觀上的標(biāo)準(zhǔn)化,同時(shí)也要注意每一個(gè)電子文件管理元數(shù)據(jù)語(yǔ)義內(nèi)容和語(yǔ)法結(jié)構(gòu)的標(biāo)準(zhǔn)化,即微觀的標(biāo)準(zhǔn)化。宏觀標(biāo)準(zhǔn)化,應(yīng)當(dāng)保持三個(gè)一致:“與國(guó)際通用標(biāo)準(zhǔn)相一致”,“與現(xiàn)有國(guó)家標(biāo)準(zhǔn)相一致”和“與專業(yè)領(lǐng)域標(biāo)準(zhǔn)相一致”。從微觀來(lái)說(shuō),每一個(gè)電子文件管理元數(shù)據(jù)的語(yǔ)義結(jié)構(gòu)和語(yǔ)法結(jié)構(gòu)的描述要達(dá)到標(biāo)準(zhǔn)化,即電子文件管理元數(shù)據(jù)標(biāo)準(zhǔn)化、語(yǔ)義結(jié)構(gòu)標(biāo)準(zhǔn)化、語(yǔ)法結(jié)構(gòu)標(biāo)準(zhǔn)化。
與此同時(shí),還有學(xué)者從元數(shù)據(jù)內(nèi)容出發(fā),研究其標(biāo)準(zhǔn)的制定方向。章丹和譚琤培就認(rèn)為元數(shù)據(jù)包括著錄項(xiàng)目和著錄格式兩個(gè)方面,因此,元數(shù)據(jù)的標(biāo)準(zhǔn)化就要包括元數(shù)據(jù)著錄項(xiàng)目的標(biāo)準(zhǔn)與元數(shù)據(jù)著錄格式的標(biāo)準(zhǔn)。著錄項(xiàng)目的標(biāo)準(zhǔn)運(yùn)用是都柏林核心標(biāo)準(zhǔn),而著錄格式標(biāo)準(zhǔn)則有超文本置標(biāo)語(yǔ)言(HTML)和可擴(kuò)展置標(biāo)語(yǔ)言(XML)兩種,檔案界廣泛使用的還是XML。
顯而易見,檔案元數(shù)據(jù)的標(biāo)準(zhǔn)化工作在當(dāng)前的進(jìn)展只是局限在對(duì)國(guó)外標(biāo)準(zhǔn)理論的學(xué)習(xí)和探討過(guò)程中,學(xué)者們的研究角度大不相同,但大都是在分析和研究國(guó)外元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,對(duì)我國(guó)目前檔案元數(shù)據(jù)標(biāo)準(zhǔn)制定工作提出一定的建議和未來(lái)發(fā)展的方向。
[1] 譚琤培,章丹.%元數(shù)據(jù)的內(nèi)涵、特點(diǎn)及其他——元數(shù)據(jù)研究之一[J].%浙江檔案,2002,(02).
[2] 譚琤培,章丹.%檔案元數(shù)據(jù)在電子文件鑒定中的運(yùn)用——元數(shù)據(jù)研究之三[J].%浙江檔案,2002,(06).
[3] 郝晨輝,曹燕,李華峰.談電子文件元數(shù)據(jù)標(biāo)準(zhǔn)化[J].浙江檔案,2003,(12).
[4] 劉必全.數(shù)字檔案元數(shù)據(jù)研究[J].蘭臺(tái)世界,2007,(03).
[5] 徐維.元數(shù)據(jù):電子文件管理的關(guān)鍵所在[J].山西檔案,2000,(04).
[6] 譚琤培,章丹.%圖書館界元數(shù)據(jù)研究的現(xiàn)狀及對(duì)檔案界的啟示——元數(shù)據(jù)研究之二[J].浙江檔案,2002,(03).
[7] 徐維,胡吉兵,管志宇.元數(shù)據(jù)概念的產(chǎn)生、發(fā)展與成熟[J].中國(guó)檔案,2003,(08).
[8] 劉越男.對(duì)電子文件管理元數(shù)據(jù)的再認(rèn)識(shí)[J].檔案學(xué)通訊,2005,(02).
[9] 程妍妍.電子文件管理元數(shù)據(jù)標(biāo)準(zhǔn)化研究[J].中國(guó)檔案,2005,(12).
[10] 陳令.檔案元數(shù)據(jù)標(biāo)準(zhǔn)分析[J].湖北檔案,2008,(04).