(中國科學技術信息研究所)
我國電子出版物呈繳標準體系構建研究
劉春燕(中國科學技術信息研究所)
當前我國電子出版物呈繳標準還只是針對具體數(shù)字對象,分階段制定相關的具體技術標準,各個標準之間缺乏體系化考慮和戰(zhàn)略化決策。為確保我國電子出版物呈繳系統(tǒng)的高效性、長期性、共享性和互操作性,本文在考慮電子出版物整個生命周期的基礎上,深入分析國內外電子出版物呈繳應用技術環(huán)境、關鍵技術標準和業(yè)務活動實踐等因素,構建了我國電子出版物呈繳標準體系框架。我國電子出版物呈繳標準需要形成以保存為基礎,以內容編碼、元數(shù)據及元數(shù)據互操作、統(tǒng)計與績效管理為核心的技術標準體系,而且,最佳實踐研究是我國電子出版物呈繳標準體系構建應用效果的重要保證。
電子出版物;呈繳;標準體系;構建
20世紀80年代后,信息化使單一傳統(tǒng)出版物向數(shù)字化文本、圖像、音視頻和其他機讀格式的“電子出版物”分化,紙質出版物呈繳運行框架已不適于以電子格式生產、發(fā)布、存儲和使用的電子出版物,標準和技術規(guī)范成為電子出版物呈繳制度實施以及管理的技術支撐。
電子出版物呈繳全生命周期的標準化需求是完善電子出版物呈繳標準體系的基礎和關鍵因素,歐盟數(shù)字復本的國家戰(zhàn)略由國家記憶機構或公共機構在政府直接領導下制定,國家戰(zhàn)略框架包括法定呈繳及公共文件、出版領域等(特別是原生數(shù)字資源)。ISO/TC46在其2010年商業(yè)計劃[1]中,對其所歸口的圖書館、檔案館、出版商、博物館等文獻信息領域標準化的市場環(huán)境和相關利益方進行了描述,指出文獻信息領域既包括盈利機構(如商業(yè)組織、系統(tǒng)商和出版商等),也包括非盈利機構(如圖書館、文獻中心、檔案館等)。信息與文獻業(yè)務活動中的相關利益方涉及信息創(chuàng)建者、信息發(fā)布或提供者、信息管理者、信息保存者、信息系統(tǒng)或服務提供者及用戶等。
隨著信息與文獻領域的技術發(fā)展、環(huán)境變化和市場需求,及參考信息與文獻領域標準化需求,我國電子出版物呈繳全生命周期的標準化需求特點主要包括:①從紙本呈繳出版物或離線呈繳出版物標準化對象向非受控的電子化和網絡化信息創(chuàng)建、分發(fā)和保存標準化對象轉換;②多種媒體類型的資源對象融合,使電子出版物呈繳在創(chuàng)建、生產、組織和保存信息變得日益復雜;③遠程學習和機器學習環(huán)境下需要考慮增加電子出版物呈繳標準信息發(fā)布的新機制;④對網絡標準的依賴和融合使電子出版物呈繳標準在借鑒國際標準化組織標準外,還要考慮相關的網絡事實型標準;⑤在新媒體標準和音頻標準未成為國際標準和國家標準的形式前,電子出版物呈繳相關標準化最佳實踐指南將與紙質國際標準一起,成為電子出版物呈繳標準領域的新需求。
當前,我國電子出版物呈繳范圍主要為實體電子出版物,2008年發(fā)布的《電子出版物出版管理規(guī)定》,[2]規(guī)定電子出版物包括只讀光盤、一次寫入光盤、可擦寫光盤、軟磁盤、硬磁盤、集成電路卡等,以及新聞出版署認定的其他媒體形態(tài)。其中,連續(xù)型出版物指有固定名稱,用卷、期、冊或者年、月順序編號,按照一定周期出版的電子出版物。近年來,隨著國內外連續(xù)出版物(如純網絡期刊)出版形態(tài)的發(fā)展,我國新聞出版廣電總局也開始試行對網絡版連續(xù)出版物頒發(fā)國內統(tǒng)一連續(xù)出版物號(CN號)。如,2015年8月13日國家新聞出版廣電總局文關于同意出版《知識管理論壇(網絡版)》網絡連續(xù)型出版物的批復(新廣出審[2015]885號)中指出:根據《出版管理條例》《互聯(lián)網出版管理暫行規(guī)定》相關規(guī)定和總局開展網絡連續(xù)型出版物規(guī)范管理試點的有關精神,同意互聯(lián)網出版單位《圖書情報工作》雜志社出版《知識管理論壇(網絡版)》網絡連續(xù)型出版物,新編國內統(tǒng)一連續(xù)出版物號CN11-6036/C,中文,雙月刊,公開發(fā)行。而在呈繳方面,由于網絡出版物呈繳在我國沒有明確規(guī)定,網絡出版物的呈繳目前“只有少數(shù)幾家出版機構自發(fā)提交在線數(shù)字出版物目錄及鏈接地址,做存檔處理?!保?]因此,為了確保網絡出版物呈繳的可利用性和長期保存性,附有元數(shù)據的標準化呈繳平臺是必備條件和必然趨勢。
1.2 出版物呈繳接收機構對統(tǒng)一的、全流程的電子出版物呈繳技術標準體系的需求
目前,網絡電子出版物呈繳在我國還處于探索階段,沒有成熟的業(yè)務流程和實際成果,也沒有用于數(shù)字出版物呈繳的統(tǒng)一平臺。盡管如此,我國出版物呈繳接收機構對網絡電子出版物呈繳在制度、技術等方面都給予了極大的關注。國家圖書館早在2003年就啟動了網絡信息資源采集與保存WICP試驗項目和網絡數(shù)據庫導航ODBN項目。[4]WICP對100家政府網站、100家電子期刊網站、100家大學網站、100家企業(yè)網站、100家其他網站(門戶網站,媒體網站——報紙、電臺、電視臺網站等)通過網絡機器人進行收集,并對收集數(shù)據進行了MARC編目和DC編目。國家圖書館出版物繳送國外相關進展主要介紹了英、法等國網絡電子出版物的動態(tài)。[5]我國另一個法定呈繳機構——中國版本圖書館2012年征繳離線數(shù)字出版物與出版量趨于一致,基本達到有效征繳目標。但在線數(shù)字出版呈繳受困于制度、呈繳范圍、信息化支撐環(huán)境、后期數(shù)字資源長期保存等因素,目前只有幾家出版機構自發(fā)提交的在線數(shù)字出版物目標及鏈接地址。[6]鑒于網絡電子出版物呈繳的數(shù)字資源特征和多方協(xié)作的復雜業(yè)務流程,統(tǒng)一的、全流程的電子出版物呈繳技術標準體系可對該項業(yè)務工作的可操作性、可持續(xù)性和質量控制目標等加以保證。
1.3 電子出版物呈繳標準體系的選擇和制定順應當前電子出版物呈繳和服務的新環(huán)境
網絡電子出版物作為一種數(shù)字資源,其呈繳和服務方式受數(shù)字資源保存和服務發(fā)展的影響。當前我國數(shù)字資源保存正在倡議“國家保存”模式,2009年國家科學圖書館與施普林格簽訂了數(shù)字資源長期保存協(xié)議,對我國信息文獻機構從國外引進資源的長期保存模式具有開創(chuàng)性意義。2015年9月,在國家科技圖書文獻中心NSTL的倡議下,國家圖書館、中科院文獻情報中心、北京大學圖書館等60個文獻信息機構集體簽署了《數(shù)字文獻資源長期保存共同聲明》,[7]宣布圖書館支持國家建立數(shù)字文獻資源長期保存系統(tǒng),將委托其長期保存自己所采購的數(shù)字文獻資源。同時,希望國家將數(shù)字文獻資源長期保存系統(tǒng)作為重要的國家公共基礎設施,予以長期穩(wěn)定的支持和規(guī)范可靠的管理。順應這一發(fā)展,我國網絡電子出版物呈繳也即將面臨相應的技術標準選擇和體系規(guī)劃。
隨著技術和業(yè)務的發(fā)展,近年來電子出版物呈繳的關注重心已從電子出版物收集獲取向電子出版物長期保存轉變,而廣泛使用國際的、開放的標準是促進互操作和長期保存的先決條件。20年前,數(shù)字保存研究集中于圖書館和檔案領域,主要研究定義、基本模型和概念等,數(shù)字化對象主要為政府文件。近年來,相關研究已從單個文獻的保存和數(shù)據結構轉向復雜資源,如關聯(lián)對象、元數(shù)據和短期數(shù)據等轉變,集中于支持數(shù)字保存的技術框架和工具的研究。
“保存(Preservation)”這個概念在數(shù)字資源領域有兩個含義,一個是數(shù)字化保存,還有一個是保存的數(shù)字化,對電子出版物呈繳活動來說,保存是指數(shù)字化保存,即“以長期獲取為目的的數(shù)字對象的保藏和維護”。Adrienne Muir[8]認為,法定呈繳的目的是確保國家智力和文化遺產的保存和獲取,數(shù)字出版物呈繳是全球趨勢,印本環(huán)境下的出版、出版商、出版地和版次等在數(shù)字出版物呈繳環(huán)境下有新的含義,有些可能并不適用。在數(shù)字環(huán)境下,具有呈繳功能的圖書館與外界通過元數(shù)據、定義和標準等進行業(yè)務交互,法定呈繳每個業(yè)務過程都涉及法律、經濟、技術和組織管理問題,網絡技術的優(yōu)勢使得圖書館在獲得一份數(shù)字呈繳出版物后能夠廣泛復制,從而與出版商產生經濟利益之爭。數(shù)字出版物呈繳的業(yè)務過程包括識別(Identification)、選擇(Selection)、獲?。–apture/Deliver)、處理或編目或保存(Processing or Cataloguing or Storing)、獲取(Access)五個過程,而保存(Preservation)貫穿于這五個過程中。在業(yè)務流程梳理方面,英國數(shù)字保存中心在其數(shù)字保存生命周期模型中定義了數(shù)字保存的邏輯/迭代順序:概念化、創(chuàng)建、獲取和使用、評價和選擇、處理、攝取、保存活動、存儲、獲取和再利用、轉換,這些業(yè)務模塊分別涉及相應的具體技術標準。
國內外電子出版物呈繳應用較多的保存標準框架是OAIS(開放檔案信息系統(tǒng)),該標準是由空間數(shù)據系統(tǒng)在1999年制定的國際標準ISO 14721,OAIS定義了數(shù)字資源長期保存和獲取的功能,包括獲得和處理、檔案化保存、獲取、數(shù)據管理和檔案管理等。
近年來,數(shù)字資源長期保存成為我國圖書館界的研究和實踐熱點。王樂春等[9]指出,超大規(guī)模、多數(shù)據類型的數(shù)字資源長期保存和有效讀取是國際圖書館界的熱點問題,而數(shù)據組織標準的研究制定更是長期保存必須優(yōu)先研究的問題。他們認為,目前真正面向長期保存工作的國際標準只有OAIS。我國國家圖書館數(shù)字資源長期保存的核心標準體系框架包括:指導長期保存體系整體建設的相關標準;數(shù)字資源信息打包和編碼相關標準;數(shù)字資源內容和格式相關標準,包括元數(shù)據格式、對象數(shù)據格式;存檔系統(tǒng)數(shù)字資源標識相關標準;存檔系統(tǒng)數(shù)字資源信息,包括提交和發(fā)布方法相關標準;不同單位的存檔系統(tǒng)間互操作接口標準;用于存儲的物理媒介相關標準;數(shù)據在介質和格式遷移方面的相關標準;存檔系統(tǒng)質量評估相關標準等(見下圖)。
電子出版物長期保存在電子出版物呈繳系統(tǒng)中具有重要的地位。李英等[10]認為,電子出版物呈繳制度運行機制是電子出版物制度良好運行的重要保障,其基本框架包括法律機制、組織管理機制、經濟補償機制和長期保存機制。另外,長期保存本身就是一個復雜系統(tǒng),劉春燕等[11]認為,電子出版物呈繳系統(tǒng)信息資源長期保存所涉及的問題本身就是一個既包括了宏觀管理(規(guī)劃涉及、需求分析、建設設施和符合性評估等),又包含有具體技術操作層面(元數(shù)據、數(shù)據格式、編目、標記、結構、壓縮、加密等)的系統(tǒng)性問題,其長期保存系統(tǒng)應重點考慮元數(shù)據支持整個管理流程并記錄各實體之間的關系,以及與相關業(yè)務進行關聯(lián)。電子出版物呈繳系統(tǒng)信息資源長期保存系統(tǒng)需求應在滿足通用系統(tǒng)需求基礎上,考慮元數(shù)據需求、功能需求、選擇性需求和非功能性需求。
圖電子出版物呈繳標準體系框架
當前國內外電子出版物呈繳積極采用相關國際標準和國外先進標準。如我國國家圖書館WICP項目采用了ISO 28500 WARC文件格式標準;加拿大圖書和檔案館在對法定呈繳電子出版物的識別、獲取、管理、分發(fā)等業(yè)務處理過程中,采用了ISO 14721 OAIS標準、元數(shù)據收割標準METS和保存元數(shù)據標準PREMIS等通用型國際和區(qū)域標準。Greg Bak[12]指出,加拿大圖書和檔案館被法律賦予數(shù)字保存的職責,包括要求法定電子出版物呈繳。其數(shù)字對象除了文獻類型的數(shù)字對象外,還包括數(shù)字照片和藝術、數(shù)字多媒體和音像制品、地理信息、數(shù)字技術和建筑繪畫、廣播數(shù)字內容。這些數(shù)字資產包括各個領域,通過各自的元數(shù)據和保存標準,在各自的保存環(huán)境,通過不同的渠道去獲取,這直接導致相關費用的高居不下和用戶獲取的不便。為此,LAC通過多年的研究項目,在OAIS基礎上建立了數(shù)字倉庫服務。加拿大數(shù)字文獻遺產“書目、檔案和文章”能被識別、獲取、管理、分發(fā)。書目和檔案描述元數(shù)據通過MODS的XML基礎的元數(shù)據標準來實現(xiàn)。GOOGLE也采用Fedsearch系統(tǒng)中的MODES標識GOOGLE SCHOLAR中的元數(shù)據。這些全球通用標準的應用確保了其電子出版物呈繳資源的穩(wěn)定性、開放性和互操作性。
根據國內外電子出版物呈繳的研究和實踐,電子出版物呈繳涉及的相關關鍵技術標準主要涉及元數(shù)據、數(shù)字保存、統(tǒng)計與績效管理等方面。
(1)電子出版物呈繳相關內容標識標準研究。為了獲取資源,必須對呈繳的電子出版物進行標識。Webb[13]曾建議法定呈繳條文中要求所有出版商標識他們呈繳的所有出版物,由于網絡“出版”的巨量而不具有可操作性。在印本環(huán)境下,國際標準化組織ISO/TC46制定了國際標準書號ISBN、國際標準連續(xù)出版物號ISSN、國際標準錄音號ISRC、國際標準視頻號ISAN、數(shù)字對象唯一標識符DOI等標識圖書、連續(xù)出版物、音頻資源、視頻資源、數(shù)字資源等描述對象的國際標準。另外,互聯(lián)網URL是當前事實型的資源標識符標準,加拿大LAC在電子出版物呈繳中采用的Archival Resource Key(ARK)永久性標識符就是一種能描述任何類型信息對象的多功能標識符。由于同一資源對象可能有幾個不同粒度的標識號,或有的資源粒度應當有標識符而沒有(如科學數(shù)據),電子出版物呈繳內容標識更關鍵的是選擇合適的標識符標準,以便實現(xiàn)不同資源標識符之間的互操作和共享。
(2)電子出版物呈繳相關元數(shù)據標準研究。元數(shù)據是關于數(shù)據的數(shù)據,是描述對象數(shù)據的數(shù)據。根據其功能不同,元數(shù)據分為描述型元數(shù)據、結構型元數(shù)據、管理型元數(shù)據、保存型元數(shù)據等。當前描述型元數(shù)據相關國際標準主要有ISO 15836都柏林核心元數(shù)據、ISO 19115地理信息元數(shù)據等。目前電子出版物呈繳相關描述型元數(shù)據、結構型元數(shù)據、管理型元數(shù)據已有比較成熟的研究和實踐成果。保存型元數(shù)據作為電子出版物呈繳的重要元數(shù)據類型也取得了很大進展,2004年Gavin[14]通過文獻調研得出當前有來自出版領域的保存元數(shù)據和來自圖書館領域的保存元數(shù)據方案,他認為,為了對呈繳電子資源進行保存,描述內容、來源、技術環(huán)境和保存操作等類型的元數(shù)據應系統(tǒng)收集和管理,用于圖書商業(yè)交換的ONIX具有改造后滿足電子出版物呈繳元數(shù)據框架的功能。
在實踐上,為解決數(shù)字資源長期保存元數(shù)據的可實施性,OCLC與RLG組建了PREMIS工作組,計劃在OCLC/RLG基礎上開發(fā)元數(shù)據核心元數(shù)據,為保存系統(tǒng)元數(shù)據的利用提供指導,并于2005年發(fā)布了PREMIS數(shù)據字典,其數(shù)據元包括核心元素、語義單元名稱、定義、應用對象層次、包含原理、示例、創(chuàng)建和應用說明、使用說明、是否可重復、必要性及可選性等。2015年6月,PREMIS保存元數(shù)據字典3.0[15]發(fā)布,對對象(Object)、事件(Event)、代理(Agent)、權限(Right)等實體的屬性及語義關系進行描述。由于其對象的明確性和可操作性,在元數(shù)據互操作標準和協(xié)議方面,METS和PREMIS等全球通用協(xié)議已在中國、英國、加拿大、澳大利亞等國家得到廣泛應用。我國國家圖書館數(shù)字資源長期保存標準原則上確定為遵循OAIS框架標準,借鑒PREMIS+METS方案,兼容PREMIS數(shù)據詞典提供的核心保存元數(shù)據集,兼容METS給出的基于XML的通用數(shù)據對象的封裝和交換框架。[9]
(3)電子出版物呈繳相關統(tǒng)計與績效標準研究。R Williamson[16]對電子出版物的附加價值進行了分析,提出了一致性(如標識符等與內容的一致性)、完整性(如包含電子出版物的修訂版和修改版)和及時性(如定期更新和維護)三個增值指標。國際標準化組織ISO/TC46/SC8在制定ISO 2789《國際圖書館統(tǒng)計》、ISO 11620《圖書館績效指標》、ISO/TR 28118《國家圖書館績效指標》、ISO 16439《圖書館影響力評價的方法和程序》等圖書館業(yè)務管理國際標準的基礎上,針對近年來圖書館法定呈繳業(yè)務向網絡資源延伸的新形式,于2013年發(fā)布了ISO/TR 14873《網絡保存的統(tǒng)計和質量評估》國際標準。[17]Clement[18]認為,音視頻等離線電子出版物呈繳可通過類型和容量來進行統(tǒng)計和評價,而網絡保存統(tǒng)計與質量評價主要有兩個難點,一是缺乏成熟的概念,如對網絡保存新工具和新過程的概念統(tǒng)一,由網絡爬蟲開展的網頁復制版是稱網頁“抓取(Capture)”、網頁“版本(Version)”,還是網頁“存檔(Archive)”;二是網上文獻的復雜粒度的統(tǒng)一,如網站可以作為一個呈繳文獻單元,但有時機構只選取網頁部分內容或單獨網頁作為呈繳內容。下表是根據ISO/TR 14873的技術內容,歸納出的網絡出版物呈繳相關統(tǒng)計及質量評估指標。
開展電子出版物呈繳標準體系最佳實踐研究的首要原因是技術標準不能脫離相關的業(yè)務環(huán)境。早在1986年,英國國家圖書館與商業(yè)和工業(yè)部資助的知識倉庫項目[18]就開始鼓勵英國呈繳電子出版物通過郵件方式提交給知識倉庫項目,知識倉庫對技術質量、一致性和整體性提出相應的標準,呈繳者和知識倉庫通過法律合同確定關于呈繳出版物提交的相關事項,主要對相關方(出版物呈繳方和知識倉庫)、呈繳出版物、呈繳權利義務(知識倉庫必須保存和以電子形式出版提交的知識產品,確保保存數(shù)據的一致性和安全性,沒有相關授權不能發(fā)布任何存儲產品的拷貝件,建立索引等)等相關條款進行規(guī)定。英國同時從技術角度對用戶獲取資源情況進行監(jiān)控,如,英國2013年出版物呈繳規(guī)定要求“法定呈繳圖書館必須確保只有一個計算機終端能被讀者獲取相關的呈繳資源”,這是為了在同一時間保證在一個法定呈繳圖書館只有一個用戶在呈繳系統(tǒng)平臺上。而用戶不能對電子呈繳出版物進行拷貝,只能打印恰當比例的呈繳作品,用于非盈利性研究或其他規(guī)定目的。這些電子出版物呈繳的標準化環(huán)境,將影響著通用關鍵技術標準具體條款的修改,同時催生一些具體的業(yè)務標準。
表網絡出版物呈繳相關統(tǒng)計和質量評價指標
加強電子出版物呈繳標準體系最佳實踐方式是通過業(yè)務場景來選擇、驗證、優(yōu)化和合理使用相關的技術標準。當前我國已為開展電子出版物呈繳相關標準的最佳實踐打下了很好的基礎。姚曉霞等[19]認為,國家圖書館、國家科學圖書館和國家科技文獻中心等已在數(shù)字資源長期保存系統(tǒng)的可信賴工作流程、政策與機制、法律與權益管理、數(shù)字知識倉儲建設、網絡信息資源的采集與保存等方面進行了比較系統(tǒng)的研究和實踐,對全國數(shù)字資源保存活動具有積極的示范作用。在具體操作層面,王樂春等[9]認為,數(shù)字資源長期保存封裝規(guī)范在遵循與METS綱要的兼容大方向下,必須以國圖自身的應用場景為基礎。其中,對于SIP封裝規(guī)范要適應國圖多種途徑獲得數(shù)字資源的格式需求,AIP信息封裝包的封裝規(guī)范可基于METS,確定國圖AIP包結構的限定和擴展,對于DIP信息包應統(tǒng)籌考慮國圖服務對象特定需求和館際交流的需要來確定封裝規(guī)范。
在國際電子出版物呈繳標準最佳實踐研究方面,Antonella Fersa等[20]指出,歐盟不同國家,不同行業(yè)和機構在數(shù)字內容管理和保存等方面存在不同的政策和指南,這直接導致了數(shù)字保存費用居高不下,歐洲博物館、檔案館和圖書館在未來十年里數(shù)字化費用預計約1億歐元,平均每年約1000萬歐元。為此,2014年歐盟開展了文化信息/電子檔案保存格式PREFORMA計劃,致力于采用高質量的文件格式標準實現(xiàn)長期保存數(shù)字內容需求。PREFORMA項目基于當前“長期保存標準模型OAIS通過包含數(shù)據和元數(shù)據的信息包進行傳輸和保存業(yè)務,數(shù)據具有文檔、圖像、音頻、視頻等文件格式,這些格式來自于不同供應商的軟件,其應用效果依賴于不同軟件而不受信息生產者和信息保存者的控制”的實際,研究保存過程中的標準應用質量關鍵因素,力圖建立一個包含各類實踐工具,各利益相關方的長期可持續(xù)性生態(tài)系統(tǒng)。PREFORMA項目認為,作為概念模型,OAIS標準不提供具體的實施方法和特定設計,需要標準使用者在分析業(yè)務過程后提出自己的實施方案來滿足OAIS功能,在實施過程中由于缺乏數(shù)字化保存(遷移、仿真)的獨立功能模塊,保存功能只能與其他幾個功能交叉。為此,PREFORMA希望能在OAIS的接收(Ingest)功能中,反映數(shù)字保存的第一步。在接收(Ingest)準備階段,可考慮信息產生者和存儲者的標準化交流、支持生成和傳輸元數(shù)據的工具、用于自動或半自動評估數(shù)據工具的三個不同標準化任務。在數(shù)字對象接收(Ingest)階段,由于需要將數(shù)字對象傳輸?shù)酱鎯熘校瑒t涉及文件格式和元數(shù)據完整性等相關標準化任務。而對于文件格式來說,PDF/A作為ISO國際標準受多個計算機軟件(OpenOffice.org,Microsoft Word 2007)支持,但受“嵌入PDF文件的語義信息有時只能被特定用戶讀取,一些字體不能使用需要特定允許條件等”因素影響,PDF/A文檔存儲在實踐中還依賴于軟件和供應商。圖像格式TIFF標準在實際使用中則缺乏管理元數(shù)據和技術元數(shù)據,視頻格式當前越來越多存儲機構采用MXF格式。PREFORMA計劃開發(fā)開源工具,對需要長期保存的數(shù)字文件進行一致性測試,測試內容包括:①檢查文檔是否由標準化文件格式生成;②檢測文檔是否符合長期保存要求;③自動對偏差元數(shù)據進行修正,同時確保數(shù)據對象不受影響。
[1]ISO/TC46,ISO/TC 46 Business Plan 2010[EB/OL].[2015-10-10].http://isotc.iso.org/livelink/livelink/.
[2]百度百科.電子出版物出版管理規(guī)定[EB/OL].[2015-11-20].http://baike.baidu.com/link?url=eq.
[3]尚瑩瑩,鄧千紅.數(shù)字出版物呈繳現(xiàn)狀及對策[J].出版參考,2013(11):23-24.
[4]陳力,等.網絡信息資源的采集與保存——國家圖書館的WICP和ODBN項目介紹[J].國家圖書館學刊,2014(1):2-6.
[5]中國國家圖書館.出版物繳送[EB/OL].[2015-10-10].http://www.nlc.gov.cn/dsb_footer/dsb_zcwm/.
[6]尚瑩瑩,鄧千紅.數(shù)字出版物呈繳現(xiàn)狀及對策——以中國版本圖書館為例[J].國家圖書館學刊,2004(1):2-6.
[7]中華人民共和國科學技術部.數(shù)字文獻資源長期保存共同聲明發(fā)布[EB/OL].[2015-10-08].http: //www.1633.com/news/html/201510/news_18183410_1.
[8]AdrienneMuir.Legal deposit and preservationof digital publications:a review of research and development activity[J].Journal of Documentation,2001,57(5): 652-682.
[9]王樂春,等.超大型數(shù)據資源長期保存系統(tǒng)數(shù)據組織標準研究[J].標準科學,2012(8):12-15.
[10]李英,等.電子出版物呈繳制度運行機制研究[J].圖書館工作與研究,2011(10):67-69.
[11]劉春燕,等.電子出版物呈繳系統(tǒng)信息資源長期保存標準化框架研究[J].情報雜志,2011,30(9):164-168.
[12]Greg Bak,Pam Armstrong.Points of convergence: Seamless long-term access to digital publicaions and archival records at libaray and archives Canada[J]. ArcSci,2008(8):279-293.
[13]Webb,C.Long-term management and preservation of publications on CD-ROMs and floppy disks:technical issure[EB/OL].[2015-09-24].http: //www.nla.gov.au/niac/meetings/tech.html.
[14]Gavin Brindley Adrienne Muir Steve Probets.Provision of digital preservation metadata:A role for ONIX?[J].Program,2004,38(4):240-250.
[15]Preservation metadata maintenance activity.PREMIS DataDictionaryforPreservationMetadata,Version3.0[EB/OL].[2015-09-29].http://www.loc.gov/standards/premis/v3/.
[16]Williamson R.The Knowledge Warehouse:Legal and commercial issues[J].The Electronic Library,1998, 6(1):10-16.
[17]ISO/TC46/SC8.Information and documentation Statisticsandqualityissuesforwebarchiving[S].
[18]Clement Oury Roswitha Poll.Counting the uncountable:Statistics for web archives[J].Performance Measurement and Metrics,2013,14(2):132-141.
[19]姚曉霞,陳凌.CALIS數(shù)字資源保存的現(xiàn)狀和發(fā)展策略[J].圖書情報工作,2010,54(7):68-71.
[20]Antonella Fresa,et al.Digital curation and quality standards for memeory institutions:PREFORMA research project[J].Arch Sci,2015(15):191-216.
Research on the Construct of Standard System for Electronic Publication Deposit in China
Liu Chun-yan
At present,the national e-pub deposit standards are object-specific,stage-specific and lack of systematic and strategic design.In order to ensure the high efficiency,longevity,sharing and interoperability of national e-pub deposit system,this article makes an in-depth analysis on the technology environment,key technologies and real practices of worldwide e-pub deposit,and constructs a standard system for domestic e-pub deposit.It suggests the system shall be based on long-term preservation with the interoperability between content code and metadata,statistics and performance management as the core of technical standard system.The best practice research is an important guarantee for the construction of the standard system of e-pub in China.
Electronic Publication(E-pub);Deposit;Standard System;Construct
G253.1
:A
:1005-8214(2016)12-0001-06
版日益增多使我國
物呈繳呈現(xiàn)必然趨勢,出版機構需要標準化的呈繳平臺
劉春燕(1974-),女,博士,中國科學技術信息研究所副研究館員,研究方向:信息資源管理、信息與文獻標準化。
2016-05-27[責任編輯]菊秋芳
本文系2010年社科基金項目“建立健全中國電子出版物呈繳制度研究”(項目編號:10BTQ013)研究成果之一。