楊文剛 崔杰 田偉
摘要:檔案元數(shù)據(jù)核心集是依據(jù)魂系歷史主義思想,從檔案歷史聯(lián)系的三個維度(來源、事由、時間)提出的,它既是對檔案元數(shù)據(jù)標(biāo)準(zhǔn)的一種精簡,又承載著記錄社會實踐活動的歷史使命。為了更好地記錄和管理檔案元數(shù)據(jù)核心集,構(gòu)建檔案元數(shù)據(jù)核心集系統(tǒng)勢在必行。本文以檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計要求為基礎(chǔ),提出系統(tǒng)的整體設(shè)計框架,依據(jù)檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計原則,歸納檔案元數(shù)據(jù)標(biāo)準(zhǔn),最后介紹元數(shù)據(jù)的著錄流程,并強調(diào)對著錄后元數(shù)據(jù)進(jìn)行動態(tài)維護(hù)的重要意義。
關(guān)鍵詞:檔案元數(shù)據(jù)核心集檔案資源整合檔案管理系統(tǒng)
Abstracts:Archive metadata core set is come from three dimensions of the archival historical rela? tion,which is based on the thought of historical spir? it, it is not only one compact form of archive meta? data standard, but also bearing the history mission of recording the social practice activity. In order to better record and manage the archive metadata core set , it is imperative for building the system of archive metadata core set. This article is based on the design requirement of archive metadata core set system, put forward the overall design of the system framework, according to design principle of archive metadata core set, summarized the archive metadata criterion, lastly explain the record work? flow of archive metadata, and emphasize the signif? icance that it is important to dynamically maintain the existing metadata.
Keywords: Archive metadata core set; Archive resource integration; Archive management system
在檔案管理中,元數(shù)據(jù)是描述檔案資源的內(nèi)容、結(jié)構(gòu)、背景環(huán)境及其管理過程的數(shù)據(jù)。它既是保障電子檔案原始性、真實性、完整性、一致性、關(guān)聯(lián)性、可讀性和長期保存性的基礎(chǔ),又是檔案資源整合和信息集成共享體系中必不可少的工具。[1]
目前,雖然許多元數(shù)據(jù)標(biāo)準(zhǔn)被廣泛應(yīng)用于圖書、情報、檔案等信息領(lǐng)域,但是相似的元數(shù)據(jù)標(biāo)準(zhǔn)被應(yīng)用到不同的文獻(xiàn)領(lǐng)域卻顯得較為泛化。從本質(zhì)上看,檔案與圖書、情報有所不同,它的研究對象、覆蓋范圍、管理方法以及服務(wù)模式與圖情管理存在較大差異,使得將已在圖情領(lǐng)域成功應(yīng)用的元數(shù)據(jù)標(biāo)準(zhǔn)直接移植到檔案管理中顯得不切實際。在這種情況下,檔案界亟需建立屬于本領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn),而這就需要結(jié)合歷史主義精神,[2]從檔案的本質(zhì)屬性中挖掘出檔案所特有的元數(shù)據(jù)標(biāo)準(zhǔn),即檔案元數(shù)據(jù)核心集。
在此基礎(chǔ)上,筆者提出檔案元數(shù)據(jù)核心集系統(tǒng)的概念,簡單來說,它是一種面向檔案元數(shù)據(jù)核心集管理的應(yīng)用系統(tǒng)。即通過構(gòu)建檔案元數(shù)據(jù)核心集系統(tǒng),賦予檔案元數(shù)據(jù)核心集以生命空間,發(fā)揮檔案元數(shù)據(jù)核心集的作用,客觀、真實、完整地記錄檔案歷史聯(lián)系,揭示檔案內(nèi)在的聯(lián)系,實現(xiàn)檔案記錄歷史的功能??梢哉f,建立檔案元數(shù)據(jù)核心集系統(tǒng),一方面,可以使用戶通過系統(tǒng)提供的人性化界面對元數(shù)據(jù)進(jìn)行操作,實現(xiàn)用戶與元數(shù)據(jù)的直線通話,降低元數(shù)據(jù)的操作門檻;另一方面,系統(tǒng)通過科學(xué)合理的設(shè)計,能夠最大限度地發(fā)揮檔案元數(shù)據(jù)核心集的記錄功能,承載檔案的歷史使命。它既是對檔案元數(shù)據(jù)核心集理論的一種應(yīng)用和實踐,又是對檔案元數(shù)據(jù)核心集理論的一種驗證。所以,設(shè)計并實施檔案元數(shù)據(jù)核心集管理系統(tǒng),不僅具有實踐的應(yīng)用意義,而且對檔案界元數(shù)據(jù)的理論研究具有促進(jìn)作用。
一、檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計要求
檔案元數(shù)據(jù)核心集系統(tǒng),是以對檔案元數(shù)據(jù)的捕獲和著錄為基礎(chǔ),以文件的整個生命周期為有效期,以信息挖掘與資源整合為技術(shù)手段,以輸出全面、準(zhǔn)確、關(guān)聯(lián)的檔案信息為目標(biāo),以紙質(zhì)檔案與電子檔案為管理對象而實施的全過程管理系統(tǒng)。
經(jīng)過深入分析,檔案元數(shù)據(jù)核心集系統(tǒng)需要滿足以下要求:一是系統(tǒng)需要針對不同類型的用戶設(shè)計不同的元數(shù)據(jù)項目,并在這些用戶完成各自元數(shù)據(jù)著錄之后,將所有的元數(shù)據(jù)組合起來,形成最終的檔案元數(shù)據(jù)核心集。因為檔案管理本身就是一項復(fù)雜的系統(tǒng)性工作,形成檔案的文書部門或檔案室是無法單獨完成檔案元數(shù)據(jù)的全部著錄任務(wù)的,這就要求文書部門、檔案室、檔案館協(xié)同合作來實現(xiàn)元數(shù)據(jù)的著錄。二是系統(tǒng)在元數(shù)據(jù)著錄方式中應(yīng)采用人工手動著錄和系統(tǒng)自動著錄相結(jié)合的方式,部分描述型檔案元數(shù)據(jù)可由人工進(jìn)行著錄,而部分管理型元數(shù)據(jù)(如文件的生成時間、歸檔時間、借閱情況等),可以由系統(tǒng)根據(jù)對檔案的跟蹤實現(xiàn)自動著錄。三是系統(tǒng)元數(shù)據(jù)應(yīng)具有較強的擴(kuò)展性,由于元數(shù)據(jù)標(biāo)準(zhǔn)不是一成不變的,這就需要系統(tǒng)動態(tài)地添加新的元數(shù)據(jù),并將新的元數(shù)據(jù)注冊到系統(tǒng)中,使系統(tǒng)在管理元數(shù)據(jù)方面更加靈活。四是系統(tǒng)需要為元數(shù)據(jù)提供存儲空間,來實現(xiàn)元數(shù)據(jù)的導(dǎo)入導(dǎo)出功能和電子檔案的封裝功能。這樣既可以實現(xiàn)對元數(shù)據(jù)及電子檔案的永久保存或異地備份,又可以為今后系統(tǒng)之間進(jìn)行數(shù)據(jù)交換或資源共享提供數(shù)據(jù)接口。五是系統(tǒng)需要設(shè)計一些管理型元數(shù)據(jù),用來監(jiān)控系統(tǒng)中電子檔案在其生命周期內(nèi)的所有動態(tài),從而保障電子檔案的真實性和完整性。例如可以利用電子檔案的操作記錄和數(shù)字簽名等管理型元數(shù)據(jù)來檢測電子檔案是否被惡意篡改。
二、檔案元數(shù)據(jù)核心集系統(tǒng)的總體設(shè)計框架
基于對檔案元數(shù)據(jù)核心集系統(tǒng)的需求導(dǎo)向,系統(tǒng)的總體框架(如圖1所示)可以分為數(shù)據(jù)層、用戶層、業(yè)務(wù)層、應(yīng)用層和存儲層。其中,數(shù)據(jù)層是整個系統(tǒng)的基礎(chǔ),并貫穿電子檔案管理的整個生命周期,原因在于用戶層、業(yè)務(wù)層、應(yīng)用層、存儲層各自的功能都是基于對元數(shù)據(jù)的獲取、解析和應(yīng)用來實現(xiàn)的。
(一)數(shù)據(jù)層
數(shù)據(jù)層主要用來建立檔案元數(shù)據(jù)的模型。所涉檔案元數(shù)據(jù)包括核心元數(shù)據(jù)和擴(kuò)展元數(shù)據(jù),核心元數(shù)據(jù)是系統(tǒng)中不可缺少的檔案元數(shù)據(jù),而擴(kuò)展元數(shù)據(jù)則是根據(jù)額外需求補充添加的元數(shù)據(jù)。在系統(tǒng)的具體設(shè)計中,必須對元數(shù)據(jù)進(jìn)行明確的分類和定義,包括元數(shù)據(jù)描述、元數(shù)據(jù)結(jié)構(gòu)、元數(shù)據(jù)功能和元數(shù)據(jù)關(guān)聯(lián)。
(二)用戶層
用戶層主要是指系統(tǒng)的使用者。它是檔案元數(shù)據(jù)著錄的主要參與者,也是該系統(tǒng)的服務(wù)對象,所以系統(tǒng)應(yīng)主要圍繞用戶層的需求對數(shù)據(jù)層、業(yè)務(wù)層、應(yīng)用層和存儲層進(jìn)行功能設(shè)計。在用戶層中,按照角色的不同,可以分為文書部門、檔案室、檔案館和檔案利用者。這些不同角色的用戶可以根據(jù)自身權(quán)限,通過業(yè)務(wù)層或應(yīng)用層來實現(xiàn)工作職責(zé),同時享有對檔案元數(shù)據(jù)的獲取和利用。
(三)業(yè)務(wù)層
業(yè)務(wù)層涵蓋了檔案管理的各項功能。從文件的創(chuàng)建開始,業(yè)務(wù)層就開始將檔案的元數(shù)據(jù)著錄到系統(tǒng)中,此后經(jīng)過對文件的修改、移交、接收、鑒定、歸檔等過程而形成了檔案,再由檔案管理部門對檔案進(jìn)行整理、保管、監(jiān)控、統(tǒng)計和開放利用,之后由檔案利用者對檔案進(jìn)行利用和反饋,最后由檔案管理部門對檔案進(jìn)行鑒定和銷毀。在這一完整的過程中,業(yè)務(wù)層始終需要動態(tài)地將元數(shù)據(jù)著錄到系統(tǒng)中。
(四)應(yīng)用層
應(yīng)用層側(cè)重對系統(tǒng)底層操作的實現(xiàn),它是業(yè)務(wù)層得以實現(xiàn)的一種功能封裝和技術(shù)支持,同時也是對業(yè)務(wù)層的一種功能擴(kuò)展。一般來說,它包括元數(shù)據(jù)的注冊、元數(shù)據(jù)的解析、元數(shù)據(jù)的封裝、數(shù)字簽名與簽名校驗的實現(xiàn)、文件關(guān)聯(lián)的建立方式、數(shù)據(jù)交換的應(yīng)用接口等。
(五)存儲層
存儲層是為元數(shù)據(jù)及電子文件的永久保存而設(shè)計的。它提供關(guān)系型數(shù)據(jù)庫、XML文件和封裝后的電子文件三種存儲方式。其中,關(guān)系型數(shù)據(jù)庫用于存儲系統(tǒng)中著錄的元數(shù)據(jù),在數(shù)據(jù)檢索時能夠體現(xiàn)較快的響應(yīng)速度。缺點是數(shù)據(jù)的存儲與讀取依賴數(shù)據(jù)庫平臺,脫離數(shù)據(jù)庫平臺后,數(shù)據(jù)將無法被識別。XML文件,用于存儲系統(tǒng)導(dǎo)出的元數(shù)據(jù),它屬于國際通用的標(biāo)準(zhǔn),具有較強的數(shù)據(jù)描述能力,同時不依賴任何平臺。缺點是檢索速度慢,只能存儲文字,不能存儲電子文件的附件,一般應(yīng)用于元數(shù)據(jù)信息交換的中間組件。封裝后的電子文件,將電子文件附件和元數(shù)據(jù)打包進(jìn)行存儲。優(yōu)點是將電子文件的全文和元數(shù)據(jù)完整地存儲下來,缺點是不易被其他系統(tǒng)識別。一般應(yīng)用于電子文件及元數(shù)據(jù)的永久保存和異地備份。
三、檔案元數(shù)據(jù)核心集系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)
(一)檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)設(shè)計原則
通過對檔案元數(shù)據(jù)核心集系統(tǒng)的整體分析,可以看到元數(shù)據(jù)模型的建立是系統(tǒng)正常運行的前提,而對元數(shù)據(jù)模型的描述和功能定位也直接牽動著檔案資源建設(shè)、檔案信息整合和檔案利用服務(wù)的命脈。因此在創(chuàng)建檔案元數(shù)據(jù)時,需要遵循以下原則:
1.尊重檔案的歷史原則。歷史原則是歷史主義精神[2]的一種表現(xiàn)形式,即尊重歷史、尊重客觀、尊重整體聯(lián)系或有機(jī)聯(lián)系。也就是說在元數(shù)據(jù)的設(shè)計中,既要客觀真實地記錄歷史事件,又要通過對元數(shù)據(jù)的設(shè)計來實現(xiàn)檔案文件內(nèi)部的關(guān)聯(lián),并將隱藏在文件內(nèi)部的聯(lián)系通過可視化的描述或可被理解的形式展現(xiàn)出來。
2.注重文件前端控制和全程管理的原則。元數(shù)據(jù)的著錄工作不是一蹴而就的,而是在文件生命周期內(nèi)的不同階段分步著錄的。注重文件的前端控制要求文件在產(chǎn)生時就開始對元數(shù)據(jù)進(jìn)行著錄,而不是當(dāng)文件歸檔后成為檔案時才對元數(shù)據(jù)進(jìn)行著錄。文件的全過程管理則要求檔案在未被鑒定銷毀之前,系統(tǒng)應(yīng)該一直利用元數(shù)據(jù)來監(jiān)控檔案文件的運行狀態(tài)。
3.堅持元數(shù)據(jù)標(biāo)準(zhǔn)化、擴(kuò)展性和互操作性。元數(shù)據(jù)標(biāo)準(zhǔn)化是指檔案元數(shù)據(jù)的建立并不是憑空而來的,而是建立在參考國內(nèi)外檔案元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上提出符合檔案元數(shù)據(jù)管理的標(biāo)準(zhǔn)。擴(kuò)展性則是指元數(shù)據(jù)的設(shè)計需要具有動態(tài)擴(kuò)展的功能?;ゲ僮餍允侵冈谠O(shè)計元數(shù)據(jù)時,要考慮到不同系統(tǒng)的數(shù)據(jù)交換問題,通過建立不同元數(shù)據(jù)的映射關(guān)系,來實現(xiàn)系統(tǒng)之間的數(shù)據(jù)交換和信息共享。[3]
(二)檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)標(biāo)準(zhǔn)
檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)包括核心元數(shù)據(jù)和擴(kuò)展元數(shù)據(jù),如圖2所示。其中,核心元數(shù)據(jù)應(yīng)遵循檔案的歷史原則,從檔案的本質(zhì)出發(fā),依據(jù)檔案歷史聯(lián)系的三個要素(來源、事由、年代),將核心元數(shù)據(jù)集通過三個維度(來源維度、事由維度、年代維度)展現(xiàn)出來??蓺w納為27項元數(shù)據(jù):來源標(biāo)識、來源名稱、來源類型、全宗號、全宗名稱、來源關(guān)聯(lián)標(biāo)識、來源關(guān)聯(lián)關(guān)系、來源關(guān)聯(lián)程度、事件標(biāo)識、事件參與者、事件動作、事件開始時間、事件結(jié)束時間、事件環(huán)境、事件起因、事件經(jīng)過、事件結(jié)果、事件關(guān)聯(lián)標(biāo)識、事件關(guān)聯(lián)關(guān)系、事件關(guān)聯(lián)程度、年代標(biāo)識、年代開始時間、年代結(jié)束時間、重要時間點、年代關(guān)聯(lián)標(biāo)識、年代關(guān)聯(lián)關(guān)系、年代關(guān)聯(lián)程度。另外,擴(kuò)展元數(shù)據(jù)則側(cè)重對電子檔案的管理功能進(jìn)行描述,分為描述型和管理型元數(shù)據(jù),應(yīng)遵循文件的全程管理與元數(shù)據(jù)的擴(kuò)展性等原則,便于系統(tǒng)實現(xiàn)對檔案的全程監(jiān)控及對元數(shù)據(jù)的互操作等功能。可歸納為12項元數(shù)據(jù):文件題名、保管期限、密級、檔號、關(guān)鍵詞、責(zé)任者、分類號、文件權(quán)限、存儲地址、電子文件、文件屬性、數(shù)字簽名。
四、檔案元數(shù)據(jù)核心集系統(tǒng)的著錄及維護(hù)
(一)檔案元數(shù)據(jù)核心集系統(tǒng)的著錄
元數(shù)據(jù)的著錄工作不能完全依靠檔案形成部門實施,依據(jù)文件運動周期理論,元數(shù)據(jù)的著錄應(yīng)是伴隨文件的生命周期呈現(xiàn)出一種實時的、動態(tài)的著錄過程,這就需要文書部門、檔案室、檔案館協(xié)同參與,并依據(jù)檔案的文件級、案卷級、全宗級、全宗群四個形態(tài)進(jìn)行分層級著錄。其著錄流程是:首先,由文書部門將各種事件、活動記錄下來形成文件,按照事由原則將屬于同一事件的文件組成案卷。同時完成事件相關(guān)元數(shù)據(jù)的著錄,并將案卷移交至檔案室。其次,檔案室根據(jù)來源原則,將不同立卷部門形成的案卷分別歸置到不同的全宗下,同時完成全宗相關(guān)的元數(shù)據(jù)著錄,并將不同全宗的檔案歸入檔案館。最后,由檔案館綜合參照事由原則、來源原則和年代原則,建立不同的事由全宗、來源全宗和年代全宗,最終形成全宗群。并通過對關(guān)聯(lián)元數(shù)據(jù)的定義和著錄,實現(xiàn)文件與文件、案卷與案卷、全宗與全宗之間的內(nèi)在關(guān)聯(lián),使檔案館資源成為一個內(nèi)在相互關(guān)聯(lián)的全宗群。如圖3所示。
(二)檔案元數(shù)據(jù)核心集系統(tǒng)的維護(hù)
檔案元數(shù)據(jù)著錄的最終目標(biāo)是通過元數(shù)據(jù)建立文件之間的內(nèi)部關(guān)聯(lián),使檔案資源得到有效整合,為檔案利用提供優(yōu)質(zhì)信息。利用元數(shù)據(jù)實現(xiàn)文件內(nèi)部關(guān)聯(lián)是通過檔案管理者對元數(shù)據(jù)著錄來實現(xiàn)的,其著錄項一般包括關(guān)聯(lián)文件的標(biāo)識、文件之間的關(guān)聯(lián)關(guān)系及關(guān)聯(lián)程度,這些元數(shù)據(jù)的著錄大多是檔案管理者根據(jù)自身工作經(jīng)驗判斷而生成的,具有一定的主觀性,在某種程度上影響了文件關(guān)聯(lián)的準(zhǔn)確性,所以文件之間的關(guān)聯(lián)性是否客觀真實還要放到檔案利用中去檢驗。檔案管理者應(yīng)該根據(jù)用戶對檔案利用的反饋信息,結(jié)合對文件本身的內(nèi)在關(guān)聯(lián)進(jìn)行綜合考慮,不斷調(diào)整或更新文件之間關(guān)聯(lián)的元數(shù)據(jù),客觀地揭示檔案文件內(nèi)部的關(guān)聯(lián)。
檔案資源整合與檔案利用是相互推動、相互促進(jìn)的,良好的資源整合可以為檔案利用提供優(yōu)質(zhì)的信息,而通過對檔案利用的準(zhǔn)確評價,又可以更好地揭示檔案文件內(nèi)部的關(guān)聯(lián)性,從而進(jìn)一步優(yōu)化檔案資源整合。所以我們在檔案管理中,除了要重視文件的前端控制以外,更要意識到檔案利用的信息跟蹤及后端反饋對檔案元數(shù)據(jù)揭示的重大意義。
*本文為2015年度教育部人文社會科學(xué)研究項目“‘魂系歷史主義的檔案元數(shù)據(jù)核心集的構(gòu)建研究”(項目編號:15YJC870007)的階段性研究成果之一。
注釋及參考文獻(xiàn):
[1]金更達(dá),何嘉蓀.檔案信息資源集成管理中的元數(shù)據(jù)問題及對策研究[J].中國圖書館學(xué)報,2006(4):56-59.
[2]黃霄羽.魂系歷史主義——西方檔案學(xué)支柱理論發(fā)展研究[J].檔案學(xué)通訊,2004(1):57-60.
[3]王健,姜偉,趙瑞紅.電子文件元數(shù)據(jù)自動采集的原則與實施路徑研究[J].北京檔案,2015(9):29-32.