□邵熠星
近年來(lái),地震災(zāi)害時(shí)有發(fā)生,給人們帶來(lái)了巨大的傷痛。從全球范圍看,近期已有超過(guò)10次6級(jí)以上強(qiáng)震,海地的7.3級(jí)、智利的8.8級(jí)等較大地震相繼發(fā)生。在我國(guó),2008年5月12日發(fā)生的汶川8級(jí)地震造成了慘重的人員傷亡與巨大的經(jīng)濟(jì)損失,社會(huì)影響強(qiáng)烈。地震發(fā)生后,黨中央、國(guó)務(wù)院舉全國(guó)之力,組織開(kāi)展了規(guī)??涨?、卓有成效的抗震救災(zāi)斗爭(zhēng),并取得了階段性勝利。在抗震救災(zāi)工作中,形成了大量文件材料,是黨和政府領(lǐng)導(dǎo)人民抗震救災(zāi)的真實(shí)記錄,是今后工作查考、歷史研究、經(jīng)驗(yàn)借鑒以及弘揚(yáng)中華民族偉大精神的珍貴載體。同時(shí),汶川地震是一種重要的地球動(dòng)力學(xué)災(zāi)變過(guò)程,它發(fā)生在我國(guó)城市化和現(xiàn)代化的特定階段,是我國(guó)地震災(zāi)害學(xué)、城市布局設(shè)計(jì)、防震社會(huì)工程等研究的不可多得的地震災(zāi)害破壞樣本。從檔案學(xué)的角度來(lái)看,汶川地震相關(guān)災(zāi)害記錄、抗震救災(zāi)資料和科學(xué)觀測(cè)數(shù)據(jù)等都具有不可或缺的檔案價(jià)值,應(yīng)當(dāng)?shù)玫酵咨频谋4婧凸芾?,充分發(fā)揮其在記錄歷史、借鑒經(jīng)驗(yàn)、促進(jìn)科研、謀求發(fā)展等方面的作用,為防震減災(zāi)事業(yè)發(fā)展和相關(guān)研究提供幫助。
國(guó)家對(duì)汶川地震資料歸檔工作十分重視。國(guó)務(wù)院頒布的《汶川地震災(zāi)后恢復(fù)重建條例》第二十三條明確規(guī)定:“地震部門(mén)、地震監(jiān)測(cè)臺(tái)網(wǎng)應(yīng)當(dāng)收集、保存地震前、地震中、地震后的所有資料和信息,并建立完整的檔案?!眹?guó)家檔案局也就汶川地震文件歸檔工作專(zhuān)門(mén)下發(fā)了《國(guó)家檔案局關(guān)于做好抗震救災(zāi)工作文件材料收集歸檔工作的通知》(檔函〔2008〕127號(hào)),用于指導(dǎo)汶川地震檔案建設(shè)工作。根據(jù)相關(guān)文件要求,中國(guó)地震局開(kāi)展了汶川地震信息資料庫(kù)的建設(shè),希望能夠?qū)︺氪ǖ卣鹫鹎?、震中、震后產(chǎn)生的文件、材料等及時(shí)進(jìn)行收集、整理和歸檔,保存真實(shí)可靠的汶川地震信息資料,建立實(shí)用、穩(wěn)定、先進(jìn)、高效的數(shù)據(jù)庫(kù),實(shí)現(xiàn)汶川地震信息資料管理的數(shù)字化、網(wǎng)絡(luò)化,滿足社會(huì)的利用需求。
在汶川地震信息資料庫(kù)的建設(shè)過(guò)程中,為了確保數(shù)據(jù)的真實(shí)性、完整性與長(zhǎng)期可讀性,制定了一整套元數(shù)據(jù)規(guī)范,以實(shí)現(xiàn)對(duì)數(shù)據(jù)的整個(gè)信息生命周期的有效管理。筆者有幸參與到該項(xiàng)工作之中,受益匪淺。
在汶川地震信息資料庫(kù)中,需要保存多種類(lèi)型的文件、資料,如圖像、音頻、視頻、報(bào)刊文章、圖件等等。于是,針對(duì)不同類(lèi)型文件的特征,相應(yīng)地編制了13個(gè)適用于不同類(lèi)型文件的元數(shù)據(jù)規(guī)范,具體包括:汶川地震文本文件元數(shù)據(jù)規(guī)范、汶川地震視頻文件元數(shù)據(jù)規(guī)范、汶川地震音頻文件元數(shù)據(jù)規(guī)范、汶川地震圖像文件元數(shù)據(jù)規(guī)范、汶川地震圖書(shū)元數(shù)據(jù)規(guī)范、汶川地震報(bào)刊文章元數(shù)據(jù)規(guī)范、汶川地震圖件元數(shù)據(jù)規(guī)范、汶川地震標(biāo)準(zhǔn)規(guī)范文件元數(shù)據(jù)規(guī)范、汶川地震觀測(cè)儀器文件元數(shù)據(jù)規(guī)范、汶川地震觀測(cè)數(shù)據(jù)文件元數(shù)據(jù)規(guī)范、汶川地震觀測(cè)臺(tái)站文件系列元數(shù)據(jù)規(guī)范、汶川地震會(huì)商元數(shù)據(jù)規(guī)范、汶川地震日志文件組合元數(shù)據(jù)規(guī)范。同時(shí),還配套制定了一個(gè)基于XML的電子文件封裝規(guī)范。
在整套元數(shù)據(jù)規(guī)范的編制過(guò)程當(dāng)中,設(shè)計(jì)思想主要源自ISO 23081-1信息與文獻(xiàn)-文件管理過(guò)程-文件元數(shù)據(jù)第1部分:原則(Information and documentation—Records managementprocesses—Metadata for records Part 1:Principles)與澳大利亞政府文件保管元數(shù)據(jù)標(biāo)準(zhǔn)2.0版本(Australian Government Recordkeeping Metadata Standard Version 2.0)。在 ISO 23081-1中指出,元數(shù)據(jù)可分為以下幾種類(lèi)型:關(guān)于文件自身的元數(shù)據(jù)、關(guān)于責(zé)任者的元數(shù)據(jù)、關(guān)于業(yè)務(wù)工作或過(guò)程的元數(shù)據(jù)、關(guān)于業(yè)務(wù)規(guī)章制度、政策以及法規(guī)的元數(shù)據(jù)、關(guān)于文件管理過(guò)程的元數(shù)據(jù)。在文件保管的過(guò)程中,必須具備以上所有類(lèi)型的元數(shù)據(jù),才能實(shí)現(xiàn)對(duì)電子文件的有效管理。圖1就展示了這幾種類(lèi)型元數(shù)據(jù)及其之間的相互關(guān)系。
澳大利亞政府文件保管元數(shù)據(jù)標(biāo)準(zhǔn)2.0版本于2008年7月頒布,替代了之前的《聯(lián)邦機(jī)關(guān)文件保管元數(shù)據(jù)標(biāo)準(zhǔn)1.0版本》,以適應(yīng)不斷變化的文件保管需求。該版本與1.0版本相比,最大的變化在于它在遵循ISO23081的基礎(chǔ)上,以多實(shí)體模型(multiple-entitymodel)為基礎(chǔ),能夠?qū)ξ鍌€(gè)單獨(dú)的實(shí)體進(jìn)行描述:文件(Record)、責(zé)任者(Agent)、業(yè)務(wù)(Business)、法規(guī)(Mandate)和關(guān)聯(lián)(Relationship),并且定義了一套26個(gè)基本的元數(shù)據(jù)元素(properties)和44個(gè)附加的限定元素(sub-properties)來(lái)描述這些實(shí)體。汶川地震信息資料庫(kù)元數(shù)據(jù)規(guī)范的核心編制思想正是借鑒了這一描述方法。
此外,為了保持規(guī)范的先進(jìn)性,在規(guī)范編制過(guò)程中還參考了南澳大利亞文件保管元數(shù)據(jù)標(biāo)準(zhǔn)3.0版、ISO15489-1:2001信息與文獻(xiàn)文件管理第1部分通用原則、ISO 23081-2:2007信息與文獻(xiàn)文件管理流程文件元數(shù)據(jù)第2部分概念與實(shí)施問(wèn)題、ISO11179信息技術(shù)—元數(shù)據(jù)元素的規(guī)范與標(biāo)準(zhǔn)化,以及國(guó)家檔案局發(fā)布的電子文件管理細(xì)則第一部分:文書(shū)電子文件元數(shù)據(jù)方案(征求意見(jiàn)稿)、電子文件管理細(xì)則第二部分:電子文件長(zhǎng)期保存格式需求(征求意見(jiàn)稿)、電子文件元數(shù)據(jù)標(biāo)準(zhǔn)(征求意見(jiàn)稿)等等。
同時(shí),在編制每一個(gè)具體的元數(shù)據(jù)規(guī)范的過(guò)程中,還參考了相關(guān)領(lǐng)域的一些標(biāo)準(zhǔn)規(guī)范。如在編制音頻文件元數(shù)據(jù)規(guī)范的過(guò)程中,就借鑒了我國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范建設(shè)項(xiàng)目成果之一的音頻資料描述元數(shù)據(jù)規(guī)范,以適應(yīng)不同類(lèi)型文件的獨(dú)特屬性。
為了確保一致性,每個(gè)規(guī)范的框架結(jié)構(gòu)基本相同,均包括范圍、編制目的、規(guī)范性引用文件、術(shù)語(yǔ)和定義、元數(shù)據(jù)元素框架、元數(shù)據(jù)元素描述方法、元數(shù)據(jù)元素的描述、附錄方案,以及附件元數(shù)據(jù)著錄規(guī)則。
其中,“范圍”主要是對(duì)每個(gè)元數(shù)據(jù)規(guī)范的適用范圍進(jìn)行規(guī)定,以使不同類(lèi)型的文件能夠根據(jù)其相應(yīng)的元數(shù)據(jù)規(guī)范進(jìn)行著錄;“編制目的”描述了通過(guò)規(guī)范的編制,預(yù)期達(dá)到的目標(biāo);“規(guī)范性引用文件”則列舉了引用的若干標(biāo)準(zhǔn)規(guī)范文件;“術(shù)語(yǔ)和定義”對(duì)提到的術(shù)語(yǔ)在本規(guī)范中的含義進(jìn)行了規(guī)定;第五部分“元數(shù)據(jù)元素框架”對(duì)規(guī)范中所包含的所有元數(shù)據(jù)元素及限定元素的組成情況進(jìn)行列表展示。每個(gè)規(guī)范的元數(shù)據(jù)元素框架都遵循多實(shí)體模型的核心思想,同時(shí)根據(jù)自身的特點(diǎn)進(jìn)行相應(yīng)的調(diào)整;第六部分“元數(shù)據(jù)元素描述方法”解釋了在對(duì)每個(gè)元素進(jìn)行描述時(shí),各項(xiàng)目的含義。參考GB/T18391,規(guī)范采用表1所示的方法對(duì)元數(shù)據(jù)元素進(jìn)行全面的描述。對(duì)每個(gè)元素進(jìn)行詳細(xì)描述時(shí),需要覆蓋表中所列的每個(gè)項(xiàng)目;第七部分“元數(shù)據(jù)元素的描述”則是對(duì)元數(shù)據(jù)元素框架表中所列的每個(gè)元素按照表1所示的項(xiàng)目依次進(jìn)行詳細(xì)的解釋?zhuān)坏诎瞬糠帧案戒浄桨浮笔菍?duì)規(guī)范中涉及的參考著錄方案進(jìn)行說(shuō)明。比如,在對(duì)“數(shù)據(jù)格式”元素進(jìn)行描述時(shí),“方案”一欄中填寫(xiě)的是“附錄2數(shù)據(jù)格式方案”,那么,在著錄時(shí),便需要按照附錄2的內(nèi)容來(lái)進(jìn)行描述。
此外,每個(gè)元數(shù)據(jù)規(guī)范都附有一個(gè)相應(yīng)的元數(shù)據(jù)著錄規(guī)則,里面對(duì)每個(gè)元素的著錄都進(jìn)行了細(xì)致的說(shuō)明和舉例,與規(guī)范配合使用,便于工作人員的操作。
表1 元數(shù)據(jù)元素描述方法表
為了便于理解,在此選用汶川地震音頻文件元數(shù)據(jù)規(guī)范為例,進(jìn)行較為詳細(xì)的說(shuō)明。汶川地震音頻文件元數(shù)據(jù)規(guī)范適用于汶川地震音頻文件的收集、歸檔、存儲(chǔ)、保管、利用等環(huán)節(jié),目的是對(duì)音頻文件進(jìn)行標(biāo)準(zhǔn)化描述,實(shí)現(xiàn)不同機(jī)構(gòu)、不同系統(tǒng)之間信息的互操作,確保汶川地震音頻文件的真實(shí)性、完整性、可用性,同時(shí)有利于說(shuō)明音頻文件與機(jī)構(gòu)、業(yè)務(wù)之間的關(guān)系,使得這些音頻文件更便于查找和檢索。整個(gè)汶川地震音頻文件元數(shù)據(jù)元素框架如表2所示。
隨后,在元數(shù)據(jù)元素的描述部分就對(duì)表2中所列的每個(gè)元素進(jìn)行了詳細(xì)的解釋?zhuān)砸纛l文件的“權(quán)限”元素為例,描述如下:由于“權(quán)限”元素是一個(gè)容器型元素,包含了“訪問(wèn)權(quán)限”、“安全等級(jí)”、“存取時(shí)間”這三個(gè)限定元素,因此,在對(duì)其描述時(shí),需要對(duì)這三個(gè)限定元素分別進(jìn)行描述,并且其編號(hào)是由這三個(gè)限定元素的編號(hào)所組成的。
以其中的“安全等級(jí)”為例描述如下:在對(duì)“安全等級(jí)”的描述中,方案一欄注明的是“安全等級(jí)方案”,則在附錄中我們就可找到下表,需要根據(jù)表中的內(nèi)容進(jìn)行著錄,不可隨意而定。
最后,還附有一個(gè)汶川地震音頻文件元數(shù)據(jù)著錄規(guī)則,對(duì)每個(gè)元素的著錄情況進(jìn)行細(xì)致的說(shuō)明和舉例。至此,一份完整的元數(shù)據(jù)規(guī)范編制完成。
以上所介紹的就是這次汶川地震信息資料庫(kù)元數(shù)據(jù)規(guī)范的編制情況。在這次規(guī)范編制的過(guò)程中,最為創(chuàng)新之處就是參考了國(guó)際和國(guó)內(nèi)先進(jìn)的標(biāo)準(zhǔn)規(guī)范,采用了多實(shí)體模型,對(duì)文件、責(zé)任者、業(yè)務(wù)、法規(guī)等方面的元數(shù)據(jù)進(jìn)行了全面而細(xì)致的規(guī)定。這一方法比以往的元數(shù)據(jù)描述方法更具靈活性和可擴(kuò)展性,能夠適應(yīng)新的信息時(shí)代的要求,保護(hù)數(shù)據(jù)的證據(jù)價(jià)值并確保其真實(shí)、完整和長(zhǎng)期可讀性。通過(guò)在文件與其背景信息之間進(jìn)行邏輯鏈接,并以一種結(jié)構(gòu)化的、可靠的和有效的方式維護(hù)這種鏈接,能夠?qū)崿F(xiàn)高效率的檢索,并且為實(shí)現(xiàn)文件在不同環(huán)境、計(jì)算機(jī)平臺(tái)或保管策略之間的有效遷移提供支持。目前,元數(shù)據(jù)規(guī)范仍在廣泛地征求各方意見(jiàn),并初步嘗試應(yīng)用于資料庫(kù)的建設(shè),相信在建設(shè)過(guò)程的推進(jìn)中,還將根據(jù)需要不斷地進(jìn)行修改,以適應(yīng)實(shí)踐的需求。
表2 元數(shù)據(jù)元素框架
表3 音頻文件元數(shù)據(jù)規(guī)范中對(duì)權(quán)限的描述
表4 安全等級(jí)的描述
表5 安全等級(jí)方案
*本文為國(guó)家自然科學(xué)基金項(xiàng)目“我國(guó)電子公文文檔一體化協(xié)同與管理策略研究”(項(xiàng)目編號(hào):70773088)系列論文之一。
注釋?zhuān)?/p>
①引自標(biāo)準(zhǔn)《信息與文獻(xiàn)-文件管理過(guò)程-文件元數(shù)據(jù)第1部分:原則》(征求意見(jiàn)稿),Information and documentation—Records managementprocesses—Metadata for records Part 1:Principles(ISO 23081-1:2006,IDT).
②由于篇幅有限,在此僅列舉了音頻資料元數(shù)據(jù)元素框架表的一部分,省略號(hào)表示還有若干元素及限定元素沒(méi)有展示。
①I(mǎi)SO15489-1:2001.Information and Documentation Documentation-Records Management.
②ISO23081 Information and documentation-Records management processes-Metadata for records.
③Australian Government Record keeping Metadata Standard Version2.0.
④South Australian Record keeping Metadata Standard Version3.