• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      國際文件/檔案著錄標(biāo)準(zhǔn)化前沿與趨勢(shì)展望

      2018-01-13 00:24:25段榮婷馬寅源李真
      檔案管理 2018年1期
      關(guān)鍵詞:標(biāo)準(zhǔn)化

      段榮婷+馬寅源+李真

      摘 要:文件/檔案著錄是對(duì)文件/檔案的一種智能化控制,其標(biāo)準(zhǔn)化對(duì)提供高效的知識(shí)檢索利用服務(wù),乃至智慧檔案館的構(gòu)建意義重大。論文基于國際檔案理事會(huì)最新標(biāo)準(zhǔn)《背景中的文件》的研究,對(duì)國際文件/檔案著錄標(biāo)準(zhǔn)化的前沿與趨勢(shì)進(jìn)行了展望,并對(duì)我國文件/檔案著錄標(biāo)準(zhǔn)化提出了建議。

      關(guān)鍵詞:文件著錄;檔案著錄;標(biāo)準(zhǔn)化;背景中的文件

      Abstract: Record/Archival description is intellectual control of records/archives. So its standardization is very meaningful to knowledge service, and even construction of smart archives. Based on the study on the ICAs newest RiC, this paper puts forward the frontier and tendency of the international record/archival description standardization, and several suggestions for Chinas record/archival description standardization.

      Keywords: record description; archival description; standardization; RiC

      在國際檔案界,早期著錄的概念通常用“檔案著錄(Archival Description)”這個(gè)術(shù)語。但隨著檔案信息化及其電子文件的飛速發(fā)展,前端控制、全程管理等理念進(jìn)一步深入檔案實(shí)踐。廣義的“文件(Records)”,包括了“檔案(Archives)”,相應(yīng)地,“文件著錄(Record Description)”也包括了“檔案著錄(Archival Description)”。應(yīng)該說,文件著錄更體現(xiàn)了對(duì)文件全生命周期的管理,因此國際檔案界開始更多地使用“文件著錄(Record Description)”這一提法,并且本質(zhì)依然是對(duì)文件的一種智能化控制,其重要作用,包括:(1)文件管理;(2)文件保存;(3)文件的可持續(xù)性利用與重用。也因此文件著錄標(biāo)準(zhǔn)化備受國際關(guān)注,其最新發(fā)展是國際檔案理事會(huì)(ICA)制定了《背景中的文件》(Records in Context,簡稱RiC)這一最新標(biāo)準(zhǔn),其亦應(yīng)引起我國檔案界的密切跟蹤與研究。

      1 國際檔案理事會(huì)(ICA)文件著錄系列標(biāo)準(zhǔn)《背景中的文件》(RiC)概述

      國際檔案理事會(huì)(ICA)文件著錄系列標(biāo)準(zhǔn)《背景中的文件》(RiC)是由ICA檔案著錄專家組(EGAD)基于文件著錄理論與實(shí)踐制定的,目前最新版為2016年的草稿版,計(jì)劃將于2017年定稿。該標(biāo)準(zhǔn)將成為文件著錄集成與共享的工具。

      此外,ICA至今已制定的檔案著錄標(biāo)準(zhǔn)還包括:《國際檔案著錄規(guī)則(總則)(ISAD(G))》(最新第2版,1999)、《國際檔案規(guī)范記錄(機(jī)構(gòu)團(tuán)體、個(gè)人與家族)著錄規(guī)則(ISAAR(CPF))》(最新第2版,2004)、《國際檔案職能著錄規(guī)則(ISDF)》(2007)及《國際檔案館藏機(jī)構(gòu)著錄規(guī)則(ISDIAH)》(2008),這些標(biāo)準(zhǔn)都已成為國際檔案著錄的最佳實(shí)踐,共同推進(jìn)了數(shù)字環(huán)境下檔案著錄信息的交換與共享。

      但是,在邁向知識(shí)社會(huì)、智能化時(shí)代的進(jìn)程中,信息技術(shù)加速發(fā)展,如在資源描述方面,以可擴(kuò)展置標(biāo)語言(XML)技術(shù)標(biāo)準(zhǔn)為基礎(chǔ),更具有語義表達(dá)性的資源描述框架(RDF)(圖(Graph)技術(shù))、語義網(wǎng)(關(guān)聯(lián)數(shù)據(jù))技術(shù)等也應(yīng)運(yùn)而生。在此背景下,檔案界如何能發(fā)揮更大的價(jià)值?這需要檔案界自身將其融入更廣的文化遺產(chǎn)領(lǐng)域,而檔案著錄也必須順應(yīng)文化遺產(chǎn)領(lǐng)域在資源描述/著錄方面的發(fā)展趨勢(shì),如,更高效地創(chuàng)建資源檢索工具、細(xì)分資源描述/著錄對(duì)象要素,同時(shí),再基于資源描述/著錄對(duì)象要素的整合,而開發(fā)與利用新工具、新方法路徑,等等。以上這些都成為ICA制定新標(biāo)準(zhǔn)《背景中的文件》(RiC)的動(dòng)因。

      在遵循檔案專業(yè)來源原則的前提下,順應(yīng)國際資源描述/著錄發(fā)展趨勢(shì),ICA RiC標(biāo)準(zhǔn)制定的技術(shù)路線主要包括概念模型的構(gòu)建及其本體化,據(jù)此該系列標(biāo)準(zhǔn)就由概念模型(RiC-CM)與本體(RiC-O)兩部分構(gòu)成。其中,概念模型(RiC-CM)部分,主要在綜合現(xiàn)有ISAD、ISAAR、ISDF、ISDIAH等標(biāo)準(zhǔn)的基礎(chǔ)上,提取文件著錄的共性實(shí)體對(duì)象,分析其特征屬性,及其相互關(guān)聯(lián),而建構(gòu)文件概念體系,增強(qiáng)其可理解性;本體(RiC-O)部分,則使RiC-CM形式化,即利用網(wǎng)絡(luò)本體語言(OWL)/RDF對(duì)文件實(shí)體及其關(guān)系進(jìn)行語義描述,使文件知識(shí)結(jié)構(gòu)化,從而更利于計(jì)算機(jī)可讀與處理,進(jìn)一步增強(qiáng)其可理解性與智能化利用,確保文件/檔案憑證與情報(bào)價(jià)值的發(fā)揮。

      2 標(biāo)準(zhǔn)RiC-CM內(nèi)容解析

      標(biāo)準(zhǔn)RiC-CM規(guī)定了文件著錄的概念模型。概念模型(conceptual model),亦稱概念數(shù)據(jù)模型(conceptual data model),是對(duì)真實(shí)世界的抽象表達(dá)(ISO/TS 23081-2:2007(E))。標(biāo)準(zhǔn)RiC-CM為文件著錄界定了關(guān)鍵的高層級(jí)概念:實(shí)體(Entities)、實(shí)體的屬性(Properties),及其相互關(guān)系(Relations),由此,標(biāo)準(zhǔn)RiC-CM所定義的文件著錄概念模型是一種實(shí)體-關(guān)系模型,也因此該標(biāo)準(zhǔn)的主體內(nèi)容就包括了實(shí)體、屬性及關(guān)系等幾大部分。endprint

      2.1標(biāo)準(zhǔn)RiC-CM文件著錄概念模型之宏觀多維特征分析。標(biāo)準(zhǔn)RiC-CM文件著錄概念模型從宏觀上來看,其最顯著的特征是多維性及其科學(xué)性。

      2.1.1多維來源的權(quán)威規(guī)范性。標(biāo)準(zhǔn)RiC-CM所架構(gòu)的文件著錄概念模型,既源于ISAD、ISAAR(CPF)、ISDF、ISDIAH等國際現(xiàn)行文件/檔案著錄標(biāo)準(zhǔn)所規(guī)定的最佳實(shí)踐,也源于融入更廣文化遺產(chǎn)領(lǐng)域,同圖書情報(bào)博物信息行業(yè)交流協(xié)作的緊迫需求。因此,RiC-CM概念模型建構(gòu)的標(biāo)準(zhǔn)基礎(chǔ)如圖1所示。

      2.1.2多維內(nèi)容的體系完備性。ICA檔案著錄專家組(EGAD)通過對(duì)如圖1所示的多維權(quán)威來源的標(biāo)準(zhǔn)模型進(jìn)行調(diào)研與比較,采用綜合分析歸納法,建構(gòu)了標(biāo)準(zhǔn)RiC-CM文件著錄實(shí)體-關(guān)系模型(概念模型),如圖2所示。

      該概念模型中所反映出的文件/檔案著錄最大的變化與特征,集中體現(xiàn)于著錄內(nèi)容的多維度化(包括多級(jí)著錄)。以往的多級(jí)著錄僅涉及了檔案這一單一實(shí)體的縱向等級(jí),而新的文件著錄則更是多維度化與更靈活的,即不僅包括了文件實(shí)體及其多級(jí)著錄,更包括了責(zé)任者、職能業(yè)務(wù)、時(shí)間、地點(diǎn)、概念/對(duì)象等諸多實(shí)體,及其屬性、關(guān)系等。

      2.1.3多維應(yīng)用的高效靈活性。標(biāo)準(zhǔn)RiC-CM文件著錄概念模型具有基于理論的最佳實(shí)踐指導(dǎo)性,可轉(zhuǎn)化為如后圖11與圖12所示的本體實(shí)例,且具有靈活實(shí)用性等優(yōu)點(diǎn),可以作為文件著錄元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)的概念模型,亦具有擴(kuò)展性,能夠囊括用戶貢獻(xiàn)的著錄等。

      2.2標(biāo)準(zhǔn)RiC-CM文件著錄概念模型之微觀-實(shí)體分析。在概念模型中,實(shí)體是指任何現(xiàn)在存在、過去存在或?qū)砜赡艽嬖诘木唧w或抽象的事物(例如:人、對(duì)象、事件、觀念或過程),及其關(guān)聯(lián)。

      標(biāo)準(zhǔn)RiC-CM文件著錄概念模型,最基礎(chǔ)的部分便是其實(shí)體(共14個(gè)),可大致地劃分為檔案專用關(guān)鍵實(shí)體與其他領(lǐng)域資源通用實(shí)體兩大類型(如圖3所示):

      ·檔案專用關(guān)鍵實(shí)體(key entities):文件(Record)、責(zé)任者(Agent)、職能(Function,或業(yè)務(wù))等;

      ·同其他行業(yè)共享共用的相關(guān)背景實(shí)體(contextual entities):概念(Concept,含主題)、地點(diǎn)(Place)等。

      圖3中,文件類實(shí)體最為關(guān)鍵,它們反映了文件著錄對(duì)象的來源主體,也是對(duì)多級(jí)著錄的繼承。文件類實(shí)體主要包括:文件(Record)、文件組件(Record Component),及文件集(Record Set),三者之間的邏輯關(guān)聯(lián),且文件集與文件之間邏輯關(guān)系的具體化,如圖4所示:

      圖4體現(xiàn)出著錄對(duì)象向文件與文件集轉(zhuǎn)變的特征。這里的文件集不僅對(duì)應(yīng)于多級(jí)著錄中的全宗、類別、案卷,且能夠囊括用戶館藏,更增強(qiáng)了靈活實(shí)用性。此外,文件類實(shí)體及其關(guān)系恰恰也體現(xiàn)出數(shù)字時(shí)代文件著錄知識(shí)智能控制(intellectual control)的新特征,即對(duì)應(yīng)于文件集(Record Set)的整體集合控制(aggregate control)同對(duì)應(yīng)于文件(Record)與文件組件(Record Component)的具體件級(jí)控制(item-level control)的有機(jī)結(jié)合。其中集合控制側(cè)重結(jié)構(gòu)與背景控制,件級(jí)控制則是具體的內(nèi)容控制(content control)。這樣進(jìn)行文件類實(shí)體設(shè)計(jì)利于滿足文件著錄的雙重需求,即通過側(cè)重結(jié)構(gòu)與背景信息描述的集合控制,確保文件/檔案的憑證價(jià)值,便于用戶實(shí)現(xiàn)全宗體系瀏覽檢索及其研究;而通過件級(jí)內(nèi)容控制,確保文件/檔案情報(bào)價(jià)值,便于用戶實(shí)現(xiàn)細(xì)粒度的發(fā)現(xiàn)與檢索。由此也從一個(gè)方面證明了RiC-CM概念模型的多維度化特征。

      2.3標(biāo)準(zhǔn)RiC-CM文件著錄概念模型之微觀-屬性分析。在概念模型中,實(shí)體的屬性(property)是指對(duì)象類(object class)所有成員共同的特性。

      標(biāo)準(zhǔn)RiC-CM文件著錄概念模型中實(shí)體的屬性(共67個(gè)),對(duì)應(yīng)于OWL中的數(shù)據(jù)屬性(owl:dataProperty),主要有兩大類(如圖5所示):所有實(shí)體的共用屬性與各實(shí)體的專用屬性。

      其中,所有實(shí)體的共用屬性包括標(biāo)識(shí)符、名稱、一般注解等4個(gè)屬性(RiC-P1~RiC-P4);而各實(shí)體的專用屬性則合計(jì)有63個(gè)(RiC-P5~RiC-P67),以責(zé)任者(Agent)實(shí)體為例,其屬性及其UML類圖如圖6所示:

      2.4標(biāo)準(zhǔn)RiC-CM文件著錄概念模型之微觀-關(guān)系分析。在概念模型中,關(guān)系(relation)是指概念(concepts)所可能通過構(gòu)成的角色而關(guān)聯(lián)的義項(xiàng)。

      標(biāo)準(zhǔn)RiC-CM的關(guān)系(Relations)有以下特點(diǎn):

      (1)以上所列14類實(shí)體的關(guān)系中,每一實(shí)體都同所有(含自身)實(shí)體互為關(guān)聯(lián),目前共有792種關(guān)系(含圖7及圖2與圖4等的示例),從而構(gòu)成了RiC-CM關(guān)系的豐富語義性,這將為文件著錄本體及其關(guān)聯(lián)數(shù)據(jù)化應(yīng)用奠定基礎(chǔ),確保文件著錄數(shù)據(jù)的高價(jià)值;

      (2)所有實(shí)體間均具有共性關(guān)系:“現(xiàn)在同……相關(guān)(is associated with)”與“過去同……相關(guān)(was associated with)”;

      (3)所有關(guān)系均具有共用屬性:日期(RiC-P68 Date)與地點(diǎn)(RiC-P69 Place),由此可以推斷出關(guān)系本身也是一種特殊的實(shí)體類,這同ISO/TS 23081-2:2007(E)《信息與文獻(xiàn)—文件管理過程—文件元數(shù)據(jù) 第2部分:概念與實(shí)現(xiàn)問題》中的實(shí)體模型是一致的。

      3 標(biāo)準(zhǔn)RiC-O內(nèi)容解析endprint

      3.1標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)意義。概念模型反映的是人對(duì)體系的理解(ISO/TS 23081-2:2007(E))。而本體(ontology)是指規(guī)定知識(shí)域中具體或抽象事物及其關(guān)系的規(guī)范。本體是共享概念模型的形式化與明確的規(guī)范。因此,為了使此概念模型(RiC-CM)所反映的文件著錄具有實(shí)踐可操作性,還需要將其轉(zhuǎn)化為計(jì)算機(jī)可讀取與處理的形式,也就是將此概念模型本體化。

      總的來說,RiC本體是其概念模型(RiC-CM)的機(jī)讀版,它是文件著錄更廣集成與共享的工具。為實(shí)現(xiàn)概念模型的機(jī)讀,RiC采用了國際萬維網(wǎng)聯(lián)盟(W3C)所制定的基于《資源描述框架(RDF)》的《網(wǎng)絡(luò)本體語言(OWL)》標(biāo)準(zhǔn),來定義RiC實(shí)體及其關(guān)系,從而能夠提供連接分散實(shí)體及其關(guān)系的語義框架,如RiC本體就可以將現(xiàn)行文件/檔案著錄實(shí)踐(EAD)納入一個(gè)更廣的概念框架中,這為EAD 3及其新版修訂都提供了新思路。此外,RiC本體還可通過對(duì)owl:sameAs等OWL/RDF原語的使用,建立RiC文件著錄本體同外部本體之間的映射關(guān)聯(lián)(如圖8所示),從而實(shí)現(xiàn)文件著錄數(shù)據(jù)的集成與共享,也就是說,通過RiC文件著錄本體同各外部本體之間的關(guān)聯(lián),實(shí)際上使文件著錄(本體實(shí)例)數(shù)據(jù)開放化,即一方面,外部數(shù)據(jù)集能夠發(fā)現(xiàn)文件著錄數(shù)據(jù)集,提高文件/檔案利用率;另一方面,文件著錄數(shù)據(jù)集自身能夠發(fā)現(xiàn)其他領(lǐng)域的相關(guān)數(shù)據(jù)集,從而進(jìn)一步豐富了語義關(guān)系,有助于加深數(shù)據(jù)的可理解性與可用性乃至可信性。由此,RiC-CM的本體化實(shí)際上能夠使文件著錄更適應(yīng)于語義網(wǎng)的發(fā)展趨勢(shì),構(gòu)建RDF檔案數(shù)據(jù)集,使文件及其著錄信息(元數(shù)據(jù))發(fā)布于語義網(wǎng),而成為關(guān)聯(lián)開放數(shù)據(jù),提升文件/檔案利用率及同其他文化遺產(chǎn)資源的交換共享,乃至對(duì)文化遺產(chǎn)的集成檢索利用。

      3.2標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)原則。標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)原則重點(diǎn)包括:

      (1)完整性(COMPLETE)

      領(lǐng)域本體應(yīng)涵蓋真實(shí)檔案世界的所有概念/實(shí)體,包括某些高層級(jí)的抽象概念,及職能需求等。

      (2)精準(zhǔn)性(CLARITY/ACCURACY)

      ·類及其屬性、屬性的域與值域的準(zhǔn)確定義;

      ·特別關(guān)注檔案概念與特征:定義職能與業(yè)務(wù)實(shí)體、文件集實(shí)體等,描述實(shí)體的歷史、來源(provenance),及某些管理事件等;

      ——多語種;

      ——實(shí)例(Examples)。

      (3)靈活性(FLEXIBILITY)

      ——允許使用本體的全部或部分;

      ——關(guān)系(relations)表達(dá)可簡可繁;

      ——可擴(kuò)展性(EXTENSIBILITY):動(dòng)態(tài)發(fā)展;

      ——開放性(OPENESS):提供同其他行業(yè)的關(guān)聯(lián)。

      (4)同其他本體的協(xié)同性(MAPPINGS)

      可通過本體映射(即不同本體中的概念(類或?qū)傩裕┢ヅ洌?,而?shí)現(xiàn)數(shù)據(jù)的集成。映射本體具體包括三大類(如圖8所示)。

      3.3標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)思路及方法與流程。基于以上標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)原則,該著錄本體構(gòu)建的實(shí)施,宏觀上決定于其總體思路(即方法論與路線圖);微觀上決定于其具體方法與流程。

      3.3.1標(biāo)準(zhǔn)RiC-O文件著錄本體宏觀建構(gòu)思路。標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)是個(gè)系統(tǒng)工程,因此必須遵循系統(tǒng)論的方法論,關(guān)注系統(tǒng)的輸入、輸出、控制及反饋等。

      ·就系統(tǒng)的輸入與輸出而言,標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)應(yīng)完整定義其形式化要素(詳見3.4本體構(gòu)建的實(shí)現(xiàn)部分):類(classes);對(duì)象屬性(object properties);數(shù)據(jù)屬性(data properties);某些類或某些屬性間的層級(jí)(hierarchy(ies));管控與使用類和屬性的規(guī)則(rules)。

      ·就系統(tǒng)的控制而言,標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)采用了模塊化的同步與迭代推進(jìn)的做法:

      ——調(diào)研技術(shù)標(biāo)準(zhǔn)規(guī)范、形式化本體的主要概念、本體構(gòu)建的工具與方法、設(shè)計(jì)模式、良好實(shí)踐等;

      ——析現(xiàn)存本體或模型;

      ——使用Protégé開源軟件及本地Git庫(GitHub中)迭代創(chuàng)建本體文檔及測試。

      ·就系統(tǒng)的反饋而言,一方面,標(biāo)準(zhǔn)RiC-O文件著錄本體的構(gòu)建與測試同其概念模型的構(gòu)建與優(yōu)化是個(gè)良性互動(dòng)的過程;另一方面,標(biāo)準(zhǔn)RiC-O文件著錄本體的建構(gòu)還應(yīng)建立討論與協(xié)作的反饋機(jī)制。

      據(jù)此,標(biāo)準(zhǔn)RiC-O文件著錄本體構(gòu)建的技術(shù)路線圖包括:

      ·首先,開發(fā)本體的核心部分(即主要實(shí)體與屬性)。

      ·其次,充實(shí)完善該本體:

      ——為準(zhǔn)確描述各實(shí)體,而添加更多的類與屬性及n元關(guān)系;

      ——同其他本體的類與屬性進(jìn)行映射;

      ——添加某些詞表(如某些特征的SKOS描述);

      ——準(zhǔn)備外用的說明文檔(documentation);

      ——持續(xù)檢查同RiC-CM的一致性。

      3.3.2標(biāo)準(zhǔn)RiC-O文件著錄本體微觀構(gòu)建方法與流程。目前,使用較多的領(lǐng)域本體構(gòu)建方法有TOVE法、Methontology法、骨架法、KACTUS工程法、SENSUS法、IDEF5法及七步法。

      在標(biāo)準(zhǔn)RiC-O文件著錄本體構(gòu)建宏觀思路的指引下,結(jié)合文件及其著錄領(lǐng)域特點(diǎn),以及以上七種領(lǐng)域本體構(gòu)建方法的綜合比較,標(biāo)準(zhǔn)RiC-O文件著錄本體采用七步法進(jìn)行構(gòu)建,具體步驟如圖9所示。

      其中,前3步側(cè)重概念建模,即在RiC-CM標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)一步優(yōu)化與完善;后4步則側(cè)重RiC-CM的形式化及其實(shí)例化。endprint

      3.4標(biāo)準(zhǔn)RiC-O文件著錄本體構(gòu)建的實(shí)現(xiàn)。如前所述,本體就是概念模型及其形式化,也即概念模型的OWL語義表達(dá)。據(jù)圖9可知,標(biāo)準(zhǔn)RiC-O文件著錄本體構(gòu)建實(shí)現(xiàn)的關(guān)鍵在于將概念模型(即RiC-CM)中定義的實(shí)體(Entities)、屬性(Properties)及關(guān)系(Relations)的形式化。而RiC-O文件著錄本體的形式化定義,需要結(jié)合OWL的描述結(jié)構(gòu)進(jìn)行(如圖10所示),具體包括以下要素:

      ——類(classes),同概念模型中的實(shí)體相一致,例如“人員(Person)”“文件(Record)”“文件集(RecordSet)”“活動(dòng)(Activity)”等;

      ——對(duì)象屬性(object properties),同概念模型的實(shí)體間的關(guān)系相一致,例如“曾創(chuàng)建(created)”“具有成員(hasMember)”“執(zhí)行(performs)”“曾導(dǎo)致(resultedIn)”等;

      ——數(shù)據(jù)屬性(data properties),類實(shí)例的特性取值用字符表達(dá)時(shí)使用,例如“具有本地標(biāo)識(shí)符(hasLocalIdentifier)”等;

      ——某些類或某些屬性間的層級(jí)(hierarchy(ies)),如上位類及其下位類、上位屬性及其下位屬性等;

      ——管控與使用類和屬性的規(guī)則(rules),如據(jù)概念模型定義屬性必備性和可重復(fù)性的狀態(tài)等。

      簡言之,RiC本體的定義既需要語義詞表(vocabulary,即概念模型),也需要形式化表達(dá)該詞表的語法(OWL),以使用該詞表,從而確保RiC-O構(gòu)建RDF檔案數(shù)據(jù)集任務(wù)的完成。

      綜上所述,經(jīng)歷了概念建模,及其形式化與實(shí)例化,同時(shí)基于Protégé,可將生成的RiC-O文件著錄本體可視化并用OWL或RDF語言進(jìn)行描述,如圖11與圖12所示。

      如圖11所示的RiC本體片段可視化實(shí)例,可以看出通過本體不僅可以構(gòu)建各實(shí)體類的等級(jí)體系,如“文件集(Record_Set)”類有子類“全宗(Fond)”“類別(Series)”“案卷(File)”;同時(shí)各實(shí)體類之間的關(guān)系除上所述的“有子類(has subclass)”外,還包括“創(chuàng)建(created)”“有成員(has_member)”等等,如“責(zé)任者(Agent)”類創(chuàng)建“文件(Record)”與“文件集(Record_Set)”類,“全宗”有成員“類別”或“案卷”,“類別”有成員“案卷”,“案卷”有成員“文件”等等。其中部分關(guān)系對(duì)應(yīng)的OWL語義描述(對(duì)象屬性聲明)如圖12所示。

      4 國際文件/檔案著錄標(biāo)準(zhǔn)化趨勢(shì)特點(diǎn)及其對(duì)我國的啟示

      如前所述,國際最新著錄標(biāo)準(zhǔn)ICA RiC的制定展現(xiàn)了國際文件/檔案著錄標(biāo)準(zhǔn)化的宏觀趨勢(shì)與微觀特點(diǎn),這些也將對(duì)我國文件/檔案著錄標(biāo)準(zhǔn)化的發(fā)展提供借鑒。

      4.1國際文件/檔案著錄標(biāo)準(zhǔn)的集成化與專門化辯證發(fā)展。國際最新著錄標(biāo)準(zhǔn)ICA RiC的制定是基于國際現(xiàn)有檔案著錄系列標(biāo)準(zhǔn),構(gòu)架了統(tǒng)一的概念模型,并將其本體化,但這并不意味著ICA RiC能夠取代其他著錄標(biāo)準(zhǔn),ICA RiC這一集成化標(biāo)準(zhǔn)與其他專門化標(biāo)準(zhǔn)辯證發(fā)展,共同構(gòu)成了國際文件/檔案著錄標(biāo)準(zhǔn)體系。事實(shí)上,ICA RiC可以看作是標(biāo)準(zhǔn)體系中最基礎(chǔ)的體系架構(gòu)性標(biāo)準(zhǔn),其功用主要側(cè)重于同文化遺產(chǎn)領(lǐng)域其他類型知識(shí)資源的交換與共享;而標(biāo)準(zhǔn)體系中的其他標(biāo)準(zhǔn),如側(cè)重描述檔案資源的ISAD(G)及其《檔案編碼著錄(EAD)》、側(cè)重描述檔案責(zé)任者的ISAAR(CPF)及其《團(tuán)體、個(gè)人與家族檔案背景編碼(EAC-CPF)》、側(cè)重描述檔案職能的ISDF及其編碼標(biāo)準(zhǔn)EAC-F,及側(cè)重描述檔案館藏機(jī)構(gòu)的ISDIAH及其編碼標(biāo)準(zhǔn)EAG仍在不斷地制修訂與優(yōu)化中。

      國際文件/檔案著錄標(biāo)準(zhǔn)的集成化與專門化辯證發(fā)展的趨勢(shì)與特點(diǎn)對(duì)我國的啟示則在于:我國應(yīng)積極推進(jìn)國際文件/檔案著錄標(biāo)準(zhǔn)體系的本土化,加緊我國文件/檔案著錄標(biāo)準(zhǔn)體系構(gòu)建,一方面據(jù)我國著錄實(shí)踐進(jìn)一步優(yōu)化ICA RiC的制定,另一方面也應(yīng)對(duì)應(yīng)地做好專門化標(biāo)準(zhǔn)的制修訂工作,如:修訂《檔案著錄規(guī)則》(DA/T18-1999)、制定《電子文件著錄規(guī)則》《檔案責(zé)任者著錄規(guī)則》《檔案職能著錄規(guī)則》《檔案館藏機(jī)構(gòu)著錄規(guī)則》并實(shí)現(xiàn)其標(biāo)準(zhǔn)化計(jì)算機(jī)編碼等。

      4.2 國際文件/檔案著錄向語義知識(shí)組織標(biāo)準(zhǔn)化發(fā)展。較以往的國際文件/檔案著錄標(biāo)準(zhǔn)而言,ICA RiC的最大變化在于它構(gòu)架了文件/檔案著錄的統(tǒng)一概念模型,并將其形式化,即最終構(gòu)建了文件/檔案著錄領(lǐng)域本體。此外,還出現(xiàn)了檔案關(guān)聯(lián)數(shù)據(jù)EAC-CPF著錄本體,等等。而本體是語義知識(shí)組織的核心,因?yàn)橐环矫?,本體是語義網(wǎng)(關(guān)聯(lián)數(shù)據(jù))高層級(jí)的技術(shù)構(gòu)成要素,文件/檔案著錄本體成為文件/檔案關(guān)聯(lián)開放數(shù)據(jù)化的基礎(chǔ),這更能滿足大數(shù)據(jù)時(shí)代數(shù)字化、網(wǎng)絡(luò)化環(huán)境下知識(shí)粒度化挖掘與利用的需求;而另一方面,本體又是一種結(jié)構(gòu)化與語義性都最強(qiáng)的知識(shí)組織系統(tǒng),本體能夠?qū)崿F(xiàn)智能推理,加強(qiáng)對(duì)文件/檔案著錄的智能化控制,進(jìn)而更好地實(shí)現(xiàn)面向用戶需求的高效的知識(shí)服務(wù),及智慧檔案館的構(gòu)建。

      國際文件/檔案著錄語義知識(shí)組織標(biāo)準(zhǔn)化趨勢(shì)與特點(diǎn)對(duì)我國的啟示則在于:我國應(yīng)加緊將語義網(wǎng)技術(shù)集成融入文件/檔案著錄標(biāo)準(zhǔn),實(shí)現(xiàn)文件/檔案著錄的關(guān)聯(lián)數(shù)據(jù)化,并進(jìn)而推動(dòng)我國文化遺產(chǎn)整體的語義知識(shí)組織的標(biāo)準(zhǔn)化。

      4.3國際文件/檔案著錄標(biāo)準(zhǔn)化需要科學(xué)的建模需求與建模原則。

      4.3.1標(biāo)準(zhǔn)化的建模需要面向領(lǐng)域的功能需求分析。通過調(diào)研分析比較可得知:同一領(lǐng)域的建模及其本體化,可以有不同的視角,這均源于建模背景的不同,即從不同的需求出發(fā),建模的結(jié)果及其本體將不同,也就是說“領(lǐng)域本體”中的“領(lǐng)域”既是一個(gè)體系性概念,又是一個(gè)相對(duì)性概念,這就要求建模前首先要進(jìn)行功能需求分析,從而能夠明晰所需要建構(gòu)本體的“領(lǐng)域”范疇。因此檔案領(lǐng)域本體體系,從最高層級(jí)的面向整個(gè)檔案學(xué)科知識(shí)概念共享的檔案學(xué)知識(shí)領(lǐng)域本體可具體依次細(xì)分為面向檔案檢索利用的檔案著錄(子)領(lǐng)域本體、面向檔案資源組織的檔案資源(子)領(lǐng)域本體等等,針對(duì)每一“領(lǐng)域”的建模需求分析,都應(yīng)依據(jù)相應(yīng)范疇的權(quán)威法規(guī)標(biāo)準(zhǔn)等。例如,對(duì)于檔案學(xué)知識(shí)領(lǐng)域本體,應(yīng)遵循綜合性檔案法規(guī)標(biāo)準(zhǔn)(如ISO 30300系列、ISO 16175等);對(duì)于檔案著錄(子)領(lǐng)域本體,則應(yīng)遵循檔案著錄的相關(guān)法規(guī)標(biāo)準(zhǔn)(如ISAD(G)、ISAAR(CPF)、ISDF、ISDIAH、ISO 23081、METS等);而對(duì)于檔案資源(子)領(lǐng)域本體,則應(yīng)遵循檔案資源組織的相關(guān)法規(guī)標(biāo)準(zhǔn)(如ISAD(G)等),據(jù)此對(duì)檔案資源實(shí)體及其屬性(內(nèi)容與形式特征)進(jìn)行語義描述(如圖13所示)。endprint

      4.3.2標(biāo)準(zhǔn)化的建模需要確保智能化控制得以實(shí)現(xiàn)的體系性原則。在具體建模過程中,應(yīng)遵循科學(xué)的原則,對(duì)于檔案行業(yè)而言,建議還應(yīng)采用最新國際標(biāo)準(zhǔn)《信息與文獻(xiàn)—文化遺產(chǎn)信息交換參考本體》(ISO 21127:2014(E))中所規(guī)定的系列建模原則:

      (1)單調(diào)(推理)性(Monotonicity);

      (2)(本體)最小化(Minimality);

      (3)(屬性)簡便性(Shortcuts);

      (4)(類)不相交性(Disjointness);

      (5)類型關(guān)聯(lián)化(Types);

      (6)動(dòng)態(tài)擴(kuò)展性(Extensibility);

      (7)內(nèi)容范圍的完整性(Coverage of intended scope)。

      唯有遵循了以上國際標(biāo)準(zhǔn)化的建模原則體系,才能確保對(duì)文件/檔案著錄實(shí)體的語義描述,從而實(shí)現(xiàn)文件/檔案信息的智能化控制推理及檢索利用。

      國際文件/檔案著錄概念模型構(gòu)建的標(biāo)準(zhǔn)化需要科學(xué)的建模需求與建模原則,這對(duì)我國的啟示則在于:我國在架構(gòu)文件/檔案著錄概念模型過程中應(yīng)科學(xué)分析我國文件/檔案著錄領(lǐng)域功能需求,并遵循國際標(biāo)準(zhǔn)化的建模原則體系。

      4.4國際文件/檔案著錄本體建構(gòu)的標(biāo)準(zhǔn)化需要完備的結(jié)構(gòu)與精準(zhǔn)的語義描述。根據(jù)最新國際標(biāo)準(zhǔn)《信息與文獻(xiàn)—文化遺產(chǎn)信息交換參考本體》(ISO 21127:2014(E)),本體的結(jié)構(gòu)要素主要包括實(shí)體類與屬性,因此本體構(gòu)建的主要內(nèi)容包括實(shí)體類聲明(Class declarations)與屬性聲明(Property declarations)及其結(jié)構(gòu)化語義定義,如圖14所示。

      img src="http://img1.qikan.com.cn/qkimages/dagl/dagl201801/dagl20180109-8-l.jpg" alt="" />

      基于以上實(shí)體類語義定義模型與實(shí)體屬性語義定義模型的本體,其結(jié)構(gòu)完整包含了本體形式化定義的所有要素(如圖10所示),并且還依據(jù)一定的命名規(guī)則(Naming conventions),另具有屬性數(shù)量詞(Property qualifiers),等等,這些均有利于本體構(gòu)建的具體實(shí)現(xiàn)。

      國際文件/檔案著錄本體建構(gòu)的標(biāo)準(zhǔn)化,需要完備的結(jié)構(gòu)與精準(zhǔn)的語義描述,這對(duì)我國的啟示則在于:我國在構(gòu)建文件/檔案著錄本體過程中應(yīng)致力于增強(qiáng)本體最佳實(shí)踐應(yīng)用的可操作性,制定實(shí)體類與屬性的命名規(guī)則,結(jié)構(gòu)化地定義本體的語義要素,形成本體的語義詞典,從而增強(qiáng)本體的語義精準(zhǔn)性。

      *本文為國家社科基金重大項(xiàng)目“云計(jì)算環(huán)境下電子文件管理元數(shù)據(jù)智能化研究”(項(xiàng)目號(hào):13ATQ008)的研究成果之一。

      參考文獻(xiàn):

      [1] ICA. RECORDS IN CONTEXTS: A CONCEPTUAL MODEL FOR ARCHIVAL DESCRIPTION [S]. Consultation Draft v0.1, September 2016.

      [2] ICA EGAD. Records in Contexts (RiC): An Archival Description Draft Standard, 2016.

      [3] ISO. Information and documentation – Records management processes – Metadata for records – Part 2: Conceptual and implementation issues: ISO/TS 23081-2:2007(E) [S].

      [4] ISO. Information technology -- Metadata registries (MDR) -- Part 1: Framework: ISO 11179-1:2015 [S].endprint

      猜你喜歡
      標(biāo)準(zhǔn)化
      標(biāo)準(zhǔn)化綜合
      標(biāo)準(zhǔn)化綜合
      標(biāo)準(zhǔn)化簡述
      企業(yè)標(biāo)準(zhǔn)化管理信息系統(tǒng)
      標(biāo)準(zhǔn)化是綜合交通運(yùn)輸?shù)谋U稀庾x《交通運(yùn)輸標(biāo)準(zhǔn)化體系》
      中國公路(2017年9期)2017-07-25 13:26:38
      對(duì)標(biāo)準(zhǔn)化管理工作的幾點(diǎn)思考
      解讀:國家標(biāo)準(zhǔn)委副主任談標(biāo)準(zhǔn)化法
      福建輕紡(2017年12期)2017-04-10 12:56:27
      如何創(chuàng)建標(biāo)準(zhǔn)化團(tuán)隊(duì)?
      以標(biāo)準(zhǔn)化引領(lǐng)科技創(chuàng)新
      論汽車維修診斷標(biāo)準(zhǔn)化(上)
      滁州市| 金湖县| 门头沟区| 黎城县| 怀集县| 贺州市| 宜兴市| 惠东县| 许昌县| 巴南区| 若尔盖县| 白沙| 高要市| 宝山区| 临泉县| 朝阳区| 饶河县| 绥棱县| 都昌县| 顺昌县| 连江县| 凤阳县| 新疆| 翁源县| 丰顺县| 云浮市| 怀集县| 西青区| 华池县| 江口县| 永康市| 广灵县| 阿克苏市| 汉源县| 东海县| 大同县| 沅江市| 伊金霍洛旗| 吴忠市| 蚌埠市| 勐海县|