段榮婷
(南京政治學院上海校區(qū)信息管理系,上海,200433)
近日,中共中央辦公廳、國務院辦公廳印發(fā)了《關于加強和改進新形勢下檔案工作的意見》,強調(diào)指出了要建立健全覆蓋人民群眾的檔案資源體系,建立健全方便人民群眾的檔案利用體系[1]。而檔案規(guī)范控制是檔案知識管理的重要內(nèi)容,關系到檔案資源體系與檔案利用體系等的建設。
對檔案規(guī)范控制的研究可分別從檔案專業(yè)視角與概念邏輯視角進行。
從檔案專業(yè)視角對檔案規(guī)范控制的實質(zhì)進行分析,可以得出:
*檔案規(guī)范控制是一種情報控制,能夠確保檔案情報價值的實現(xiàn)。檔案規(guī)范控制是廣義檔案著錄的重要組成部分(如下圖1所示),它通過創(chuàng)建者著錄,實現(xiàn)對實體(機構團體、個人或家族)名稱檢索點的控制。
*檔案規(guī)范控制(主要是實體名稱)是一種背景控制(如下圖2[2]所示),能夠確保檔案憑證價值的實現(xiàn)。檔案規(guī)范控制通過創(chuàng)建者來源背景的著錄,實現(xiàn)對檔案的前端乃至全程控制。檔案規(guī)范控制的背景控制屬性是檔案規(guī)范控制區(qū)別于圖書規(guī)范控制的核心,也代表著檔案規(guī)范控制的發(fā)展方向。
從概念邏輯視角對檔案規(guī)范控制的實質(zhì)進行分析,可以得出:檔案規(guī)范控制是對實體(機構團體、個人或家族)概念的控制[3],這也包括兩個層面:
*概念的語義控制:檔案規(guī)范控制通過對檔案機構團體、個人或家族實體概念本身內(nèi)涵的描述,及對檔案實體之間、檔案實體同信息資源之間外部關系的描述,來明確檔案實體概念的語義。
*概念的語詞控制:檔案規(guī)范控制通過對檔案機構團體、個人或家族實體概念名稱的規(guī)范化形式的確定,來確保概念語詞標識的唯一性,使標識與概念盡可能一一對應,從而達到控制檢索點、提高檢索效率的目的。
檔案規(guī)范控制研究的檔案專業(yè)與概念邏輯這兩個視角均為檔案工作者明確了實施檔案規(guī)范控制的需求,即應側(cè)重背景控制,為檔案可信網(wǎng)的構建奠定基礎;同時在情報控制方面,應側(cè)重明確檔案機構團體、個人或家族實體的概念體系,并將其形式化,即構建檔案規(guī)范記錄本體,為檔案知識組織系統(tǒng)、語義網(wǎng)的構建奠定基礎,為檔案關聯(lián)數(shù)據(jù)的利用奠定基礎。
在檔案規(guī)范控制理論的指導下,國際檔案規(guī)范控制的實踐應用也取得了較快進展。
國際檔案規(guī)范控制應用主要體現(xiàn)于檔案規(guī)范記錄檢索系統(tǒng)的構建,其總體上可分為兩大類,即:檔案規(guī)范記錄嵌入集成式檢索系統(tǒng)與檔案規(guī)范記錄專門獨立式檢索系統(tǒng)。
圖1 檔案規(guī)范記錄與檔案著錄的邏輯關系示意
圖2 檔案規(guī)范控制與背景控制關系示意
檔案規(guī)范記錄嵌入集成式檢索系統(tǒng)的典型代表是國際檔案理事會的記憶存?。↖nternational Council on Archives“Access to Memory”,簡稱ICAAtoM)[4],及美國國家檔案館(NARA)最新的“在線公共存取”(Online Public Access,簡稱OPA)。此處以國際檔案理事會的記憶存取(ICAAtoM)檔案規(guī)范記錄應用研究為典型案例。
國際檔案理事會的記憶存?。↖CAAtoM)檔案著錄開源軟件是檔案界目前唯一的國際性項目。ICAAtoM作為生成與發(fā)布規(guī)范記錄工具的原因在于:
-該軟件運行于網(wǎng)絡環(huán)境;
-該工具使用簡便,易于操作;
-規(guī)范記錄的生成與其網(wǎng)上出版幾乎是同步的;
-輸入的數(shù)據(jù)既可被用戶輸出至 XML/EAC-CPF[5],亦可被重新輸入至其它信息系統(tǒng)。
正是基于如下圖3所示的數(shù)據(jù)模型,ICAAtoM能夠提供規(guī)范記錄(authority records)的添加(著錄)、檢索瀏覽等功能。
ICAAtoM的瀏覽頁面,創(chuàng)建者的名稱與其它執(zhí)行者實體能夠通過事件實體(同時還記錄了同事件相關的日期與其它信息)由檔案著錄鏈向規(guī)范記錄,提供名稱(names)的檢索入口項,檢索結果以EAC格式輸出,即支持規(guī)范記錄輸入與輸出的EAC XML模板,提供與相關實體的關聯(lián)鏈接。同時在ICA-AtoM中,創(chuàng)建者信息,如行政管理歷史與存在日期等均保存于獨立的規(guī)范記錄中,并通過向現(xiàn)存或新建ISAAR(CPF)[6]規(guī)范記錄鏈接而添加至檔案著錄。
圖3 ICAAtoM的數(shù)據(jù)模型
檔案規(guī)范記錄專門獨立式檢索系統(tǒng)的典型代表則是美國等的社會網(wǎng)絡與檔案背景(Social Networks and Archival Context,簡稱SNAC)計劃的成果。
2.2.1 SNAC規(guī)范記錄原型檢索系統(tǒng)的結構功能
(1)SNAC原型系統(tǒng)的基本檢索結構與功能
SNAC原型系統(tǒng)提供了機構團體(Corporate)、個人(Personal),及家族(Family)檔案規(guī)范記錄(檔案背景記錄)的檢索與瀏覽。
SNAC原型系統(tǒng)所提供的規(guī)范記錄的基本檢索途徑包括以下:
①統(tǒng)一檢索(search)框,可輸入機構團體、個人或家族的名稱或關鍵詞(目前已有128,787個名稱,所有名稱以字順索引排列);
② 名 稱 索 引(A ll Names→Alphabetical Index),所有個人、機構團體和家族的名稱均以字母排序;
③ 特 色 記 錄 (Featured Records)列表,可通過個人、機構團體和家族名稱的特色記錄列表直接從中選擇鏈接,從而實現(xiàn)快速瀏覽與檢索;
④ 高 頻 職 業(yè) (Top Occupations)列表;
⑤ 高頻主題(Top Subjects)列表。
其中②、④和⑤都隨著機構團體、個人或家族具體選項卡的專指選擇,而相應有所不同。
(2)SNAC原型系統(tǒng)的高級檢索結構與功能
SNAC原型系統(tǒng)所提供的規(guī)范記錄的高級檢索功能包括以下:
①可通過限定匹配EAC-CPF的某著錄項而精煉檢索結果,如可僅檢索
②通過職業(yè)(Occupation)或主題(Subject)縮檢。
③通過關聯(lián)款目(Related Entries)及其鏈接,提供檔案檢索與圖情等資源檢索兩種科研功能。
2.2.2 SNAC規(guī)范記錄原型檢索系統(tǒng)的優(yōu)點小結
SNAC的發(fā)展趨向是國家檔案規(guī)范合作計劃(National Archival Authorities Cooperative, 簡 稱NAAC),并成為國家檔案規(guī)范基本 設 施 (National Archival Authorities Infrastructure)的有機組成部分。在檔案規(guī)范控制及其合作發(fā)展方面,其具體優(yōu)點可概括總結如下:
對于檔案工作者而言,成功維護共享規(guī)范記錄:
*能夠最終實現(xiàn)檔案規(guī)范控制。
*能夠確保在著錄中對同一實體名稱使用的一致性。
*檔案規(guī)范控制合作著錄具有經(jīng)濟效益:
*共享的國家規(guī)范記錄將是一個充實的歷史資源庫。
因此,對于檔案利用者而言,檔案規(guī)范記錄是其工具書:
*能夠統(tǒng)一集成檢索存取利用分散的檔案資源;
*能夠獲取檔案文件及其它一切文化遺產(chǎn)資源的背景信息;
*能夠獲知實體(如人物)所生存與工作的社會-職業(yè)-情報網(wǎng)絡;
*能夠獲取歷史沿革或生平資源;
*不僅服務于學者,還滿足于終生學習者對歷史軼事、家譜等的好奇心。
從以上分析可知,檔案檢索系統(tǒng)建立規(guī)范記錄是科學有效地開發(fā)檔案信息資源的關鍵性措施。無論是檔案規(guī)范記錄嵌入集成式檢索系統(tǒng),還是檔案規(guī)范記錄專門獨立式檢索系統(tǒng),它們都以特有的結構使其具有很好的檢索功能,極大地優(yōu)化了檔案檢索系統(tǒng)的檢索效率。總體的,從其構建的共性中我們都可以得到有益的借鑒。
檔案規(guī)范控制的國際實踐證明,建立檔案規(guī)范記錄檢索系統(tǒng)必須要標準先行,這也是檔案規(guī)范控制應用頂層設計的重要需求。
國際檔案規(guī)范記錄標準化取得了快速發(fā)展,如美國檔案就制定了符合國際標準《國際標準—團體、個人和家族檔案規(guī)范記錄(簡稱 ISAAR(CPF))》(第二版)[7]的《檔案著錄內(nèi)容標準》(Describing Archives:a Content Standard(Second Edition)(DACS))(2013年最新的第2版),尤其是其將檔案規(guī)范記錄(Archival Authority Records)獨立作為標準的第Ⅱ部分[8],加拿大也制定了《檔案著錄規(guī) 則 》(Rules for Archival Description)(2008年7月修訂版),對人物、機關團體的標目及參照等進行了規(guī)范[9],再如歐洲檔案門戶網(wǎng)站則應用了符合國際標準ISAAR(CPF)的《團體、個人與家族檔案背景編碼》(Encoded Archival Context for Corporate Bodies,Persons,and Fam ilies,簡稱 EAC-CPF)[10],并將其最佳實踐本地化為 apeEAC-CPF[11]。
目前,國內(nèi)檔案界也開始重視檔案規(guī)范控制及檔案規(guī)范記錄標準化的理論研究[12],但在應用研究方面卻仍有所欠缺。國內(nèi)除香港、臺灣(例如,明清檔案人名權威系統(tǒng)[13]等)外,大陸地區(qū)僅有的檔案著錄參考依據(jù)——《DA/T 18-1999檔案著錄規(guī)則》,僅僅對著錄進行規(guī)范,而沒有相應的具體規(guī)范控制。這恐怕也就是我國目前檔案計算機檢索系統(tǒng)中缺乏規(guī)范記錄檢索途徑的重要原因。
因此,根據(jù)國際檔案規(guī)范記錄應用及其標準化研究結論,建議必須遵循國際標準,為我國檔案規(guī)范記錄構建標準體系。
圖4 三個世界視角下的檔案規(guī)范記錄著錄概念模型的地位,檔案規(guī)范記錄著錄的基本數(shù)據(jù)需求,及檔案規(guī)范記錄著錄標準的邏輯關系示意
圖5 檔案規(guī)范記錄概念模型
圖6 檔案規(guī)范記錄數(shù)據(jù)模型實例化構建
實踐證明,檔案規(guī)范記錄著錄標準的制定,必須首先構建檔案規(guī)范記錄概念模型。從檔案著錄的三個世界視角來看,檔案規(guī)范記錄概念模型的邏輯作用如下圖4[14]所示,即建立概念模型能夠通過明確實體及其關系而明確檔案規(guī)范記錄著錄的基本數(shù)據(jù)需求及最佳實踐需求,并進而據(jù)此制定檔案規(guī)范記錄著錄標準。
具體做法可以目前國際最權威的《規(guī)范數(shù)據(jù)功能需求(Functional Requirements for Authority Data,簡稱 FRAD):概念模型》(2013年修訂)為依據(jù),構建檔案規(guī)范記錄概念模型(如下圖 5[15]所示)。
如上圖所示的檔案規(guī)范記錄概念模型,實質(zhì)是一種實體-關系方法,體現(xiàn)了著錄實體同名稱/標識符,及受控檢索點之間的關聯(lián)。如從檔案文件背景及其憑證價值的角度可細化建立以下關系類型的概念模型:文件與機構團體、個人或家族實體的關系;機構團體、個人或家族實體與業(yè)務的關系,及機構團體、個人或家族實體之間的關系,等等。僅以人名規(guī)范記錄文檔與機構團體規(guī)范記錄文檔之關聯(lián)為例,可具體構建檔案規(guī)范記錄數(shù)據(jù)模型如下圖 6[16]所示:
如上所述,通過檔案規(guī)范記錄概念模型的構建,可以更清晰地分析出檔案規(guī)范記錄著錄所涉及實體及其屬性之間的關系。這為確定檔案規(guī)范記錄數(shù)據(jù)層面的功能需求奠定了基礎。而檔案規(guī)范記錄系統(tǒng)的整體構建與實現(xiàn)不僅包括數(shù)據(jù)層面的功能需求,還包括系統(tǒng)層面的功能需求。綜合檔案規(guī)范控制的國際應用案例,檔案規(guī)范記錄需求規(guī)范的完整的內(nèi)容要素如表1所示:
檔案規(guī)范記錄著錄標準不僅需以實體著錄的基本數(shù)據(jù)需求為基礎,還需以國際標準ISAAR(CPF)為基礎,即我國也有必要據(jù)此而制定出本土化的相關標準。我國檔案規(guī)范記錄格式標準不僅需要與本國的《DA/T 18-1999檔案著錄規(guī)則》相協(xié)調(diào),更需同《國際標準——檔案著錄規(guī)則(總則)》(ISAD(G))等相對應。
我國檔案規(guī)范記錄需與相關的檔案元數(shù)據(jù)(Metadata)格式相對應,應以國際標準ISAAR(CPF)(語義標準)結合EAC-CPF(語法標準)為基礎,制定我國檔案規(guī)范記錄編碼標準,并與EAD標準、“規(guī)范記錄的功能需求與編號(FRANAR)”[17]等兼容與一致,并加強檔案與圖書、博物館規(guī)范控制的互通[18]。
此外,目前國際上已有檔案規(guī)范記錄EAC-CPF本體應用的實踐案例,如意大利檔案界就通過檔案規(guī)范記錄EAC-CPF本體編碼及外部RDF詞表引用,實現(xiàn)了關聯(lián)檔案數(shù)據(jù)的檢索利用。檔案規(guī)范記錄EAC-CPF本體應用代表著國際檔案規(guī)范控制的最新發(fā)展趨勢,即知識組織、語義網(wǎng),這也應是我國檔案規(guī)范記錄及其標準化的重點發(fā)展方向。
廣義地,檔案規(guī)范記錄是個體系,其標準化具有不斷細化的特征,如國際檔案規(guī)范記錄標準,除ISAAR(CPF)外,還逐漸分化出《國際標準——檔案職能著錄規(guī)則》(ISDF)[19]和《國際標準——檔案保管機構團體著錄規(guī)則》(ISDIAH)[20]等,這就要求體系配套,也符合檔案規(guī)范控制向背景控制發(fā)展的趨勢。
一般而言,國際檔案規(guī)范記錄標準(如 ISAAR(CPF)、ISDIAH等)屬于數(shù)據(jù)結構標準,國家檔案著錄規(guī)則(如《DA/T 18-1999檔案著錄規(guī)則》)屬于數(shù)據(jù)內(nèi)容標準,而具體的名稱規(guī)范檔(如《美國國會圖書館名稱規(guī)范檔》(LCNAF))、敘詞表,及ISDF等則屬于數(shù)據(jù)值標準。在我國規(guī)范記錄標準制定與應用過程中,應在檔案著錄標準體系內(nèi)做到數(shù)據(jù)結構標準、數(shù)據(jù)內(nèi)容標準及數(shù)據(jù)值標準的配套[21],這也符合檔案著錄標準開發(fā)模型[22]。
*本文系2010年國家社科基金青年項目“網(wǎng)絡環(huán)境下的檔案規(guī)范記錄系統(tǒng)研究”(批準號:10CTQ020)的研究成果之一。
表1 檔案規(guī)范記錄需求內(nèi)容要素
[1]中共中央辦公廳.國務院辦公廳印發(fā)《關于加強和改進新形勢下檔案工作的意見》[EB/OL].[2012-07-19].http://www.saac.gov.cn/zt/2014- 05/04/content_44880.htm。
[2]Jean Dryden,F(xiàn)rom Authority Control to Context Control.Respect for Authority:Authority Control, Context Control,and Archival Description.Journal of Archival Organization,Volume 5,Numbers1/2 2007:5.
[3]注:從概念邏輯的視角分析,機構團體、個人或家族的具體實體均可被看作是個別概念.
[4]ICAAtoM:open source archival description software [EB/OL].[2012-10-16]。 http://ica-atom.org/.
[5]注:EAC-CPF是國際標準《團體、個人與家族檔案背景編碼》(Encoded Archival Context for Corporate Bodies,Persons,and Families)的簡稱.
[6]注:ISAAR(CPF)是國際檔案理事會2004年修訂的《國際標準—團體、個人和家族檔案規(guī)范記錄(International Standard Archival Authority Record for Corporate Bodies,Persons and Families)》(第二版)的簡稱.
[7]ICA.ISAAR(CPF)International Standard Archival Authority Record for Corporate Bodies,Persons and Families(Second Edition)[S].2004:1-70.
[8] SAA.Describing Archives:a Content Standard(DACS)(Second Edition)[S].2013.
[9]Canadian Comm ittee on Archival Description.Rules for Archival Description (RAD) (Revised version)[S].2008.7.
[10] Encoded Archival Context Working Group of the Society of American Archivists and the Staatsbibliothek zu Berlin.Encoded Archival Context—Corporate Bodies,Persons,and Fam ilies(EAC-CPF)Tag Library(Version 2010(initial release))[S/OL].[2012-10-15].http://www3.iath.virginia.edu/eac/cpf/tagLibrary/cpfTagLibrary.ht -m l#d1e8025.
[11]APEx project-Standards[EB/OL].[2013-07-01].http://www.apexproject.eu/index.php/outcomes/standards.
[12]注:國內(nèi)已發(fā)表了相關學術論文:張文友,徐維?!秶H標準——團體、個人和家族檔案規(guī)范記錄著錄規(guī)則》的制定及其結構特點[J].檔案與建設,2001(2):55-56;李超,常曉茹.檔案檢索系統(tǒng)中的規(guī)范記錄研究[J].檔案時空,2009(2):16-18;馮留燕.圖書與檔案的規(guī)范控制工作研究[J].云南檔案,2011,(4):56-58.等等.
[13]洪一梅,王蕉.中國人名權威控制之建置與應用:以明清檔案人名權威系統(tǒng)為例:174-186.
[14] 注 :據(jù) Abelardo Santamaría.Report on the work of CNEDA(2007-2012):toward a conceptualmodel for archival description in Spain[R].(July 11,2012):8.修改.
[15]注:據(jù) IFLA Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional Requirements for Authority Data: A Conceptual Model [R].2008.12:7.修改.
[16]注:該圖反映了個人同機構團體之間的成員關系,二者之間是通過個人實體的“經(jīng)歷”屬性與機構團體的“機構團體首長”屬性進行關聯(lián)的.
[17]IFLA UBCIM Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional requirements for authority records:a conceptualmodel,draft 2005-06-15.[2013-02-12].http://www.ifla.org/VIId40FRANAR2Conceptu -al2M 2Draft2e.pdf.
[18]馮留燕.圖書與檔案的規(guī)范控制工作研究[J].云南檔案,2011(4):56.
[19]ICA.ISDF International Standard for Describing Functions(First edition),2007.5
[20] ICA.ISDIAH International Standard for Describing Institutions w ith ArchivalHoldings,2008.3
[21]段榮婷.國際檔案規(guī)范記錄標準化研究[J].檔案學研究,2013(5):70-71.
[22]段榮婷.論國際檔案信息標準化現(xiàn)狀、發(fā)展趨勢及我國的對策[J].檔案學研究,2008(1):45.