董一鳳
(哈爾濱體育學(xué)院圖書館 黑龍江 哈爾濱 150008)
數(shù)字資源長(zhǎng)期保存的目的就是確保數(shù)字比特流能長(zhǎng)期得到運(yùn)行與其內(nèi)容得到長(zhǎng)久獲取的信息管理活動(dòng),早在20世紀(jì)90年代一些發(fā)達(dá)國家就著手研究數(shù)字資源存取保護(hù)問題。例如,北歐五國包括(瑞士、挪威、丹麥、芬蘭和冰島)在1991年就頒布國家檔案館了《電子文件的存取與保護(hù)》;在這之后其他歐洲各國相繼成立了由大學(xué)、圖書館、檔案館及出版界的著名學(xué)者、專家組成的保護(hù)與存取歐洲委員會(huì),英文簡(jiǎn)稱為ECPA;1993年12月澳大利亞也成立了澳大利亞數(shù)字信息調(diào)研組,簡(jiǎn)稱為TF2001PADI;美國于1994年12月成立了保護(hù)與存取委員會(huì),他們對(duì)數(shù)字信息的長(zhǎng)期保存問題進(jìn)行了調(diào)研并且對(duì)其保護(hù)措施提出了建設(shè)性意見,并制定了數(shù)字信息的管理指南和規(guī)范及數(shù)字信息的長(zhǎng)期存取與保護(hù)等。
在數(shù)字資源管理與保護(hù)方面也取得了長(zhǎng)足的進(jìn)展。以美國為例,美國斯坦福大學(xué)的LOCKSS項(xiàng)目意為通過建立各個(gè)副本保證數(shù)據(jù)的安全,即通過建立出版商與圖書館之間的協(xié)作關(guān)系,允許圖書館在本地收藏、管理電子期刊,并提供用戶服務(wù)的信息系統(tǒng)[2]。美國國家航空局和宇航局的空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)所推出的關(guān)于數(shù)字信息長(zhǎng)期保存和利用的基本框架體系——開放檔案信息系統(tǒng)參照模型簡(jiǎn)稱OAIS,目前,該機(jī)構(gòu)的數(shù)字信息長(zhǎng)期保存體系已成為國際標(biāo)準(zhǔn),為其他國家所公認(rèn)。
可見,國外發(fā)達(dá)國家的數(shù)字資源無論在資源整合與保存,還是在合作上都取得了積極的進(jìn)展。歸納起來主要體現(xiàn)在:
第一,政府的高度重視,并制定數(shù)字資源長(zhǎng)期保存的標(biāo)準(zhǔn)規(guī)范,以此建立不同層次的合作機(jī)制與制定合理的保護(hù)策略。在信息化社會(huì)越發(fā)普及的當(dāng)今,無論從政府組織,還是跨國集團(tuán)或高校圖書館與出版機(jī)構(gòu)都成為數(shù)字保存運(yùn)作的主要實(shí)施者。
第二,政府在數(shù)字信息長(zhǎng)久保存上,實(shí)現(xiàn)永久性的電子文件檔案館,通過網(wǎng)絡(luò)合作實(shí)現(xiàn)數(shù)據(jù)與信息的共享與利用,實(shí)現(xiàn)資源的動(dòng)態(tài)更新、損壞修復(fù)、丟失補(bǔ)遺等功能,從而確保了數(shù)字資源的完整性。
第三,建立出版商與圖書館、圖書館與圖書館之間的協(xié)作平臺(tái),提出了從電子資源出版、發(fā)布到永久性保存與利用等一整套解決方案,例如,美國最新報(bào)告表明,每年世界上生產(chǎn)的信息量在千兆兆位以上,即世界上每人平均大約250MB,這些巨量的信息中有90%以上是數(shù)字資源,[3]這些數(shù)字信息的長(zhǎng)期保存需要一整套完善措施的支持。
以上不難看出,發(fā)達(dá)國家政府適應(yīng)信息化社會(huì)的發(fā)展要求,越來越對(duì)數(shù)字資源的長(zhǎng)期保存、利用更加重視。
目前,在對(duì)數(shù)字資源長(zhǎng)期保存上還沒有一個(gè)公認(rèn)的模式,但有幾種具有代表性的研究模式主要體現(xiàn)在:
第一,(英文簡(jiǎn)稱為OAIS模型)這一觀點(diǎn)認(rèn)為,數(shù)字保存系統(tǒng)的目標(biāo)是要確保被保存的信息對(duì)于目標(biāo)團(tuán)體而言是獨(dú)立可理解的,也就是說,在沒有專家的幫助下,目標(biāo)團(tuán)體仍能夠獨(dú)立地理解被保存的信息,為了達(dá)到這一要求,在保存過程中,既要保存存檔對(duì)象,也要保存針對(duì)對(duì)象的描述和說明信息[4]。
第二,還有(簡(jiǎn)稱PREMIS)該模式認(rèn)為,數(shù)字保存的目標(biāo)是維持?jǐn)?shù)字資源的長(zhǎng)期可生存能力,也就是要求被保存的數(shù)字對(duì)象的比特流完整無缺,并且能夠從它所存儲(chǔ)的載體上讀出。數(shù)字保存目標(biāo)要求數(shù)字資源的可呈現(xiàn)能力,也就是能夠?qū)⒈忍亓鬓D(zhuǎn)變?yōu)橐环N可以被人看被計(jì)算機(jī)處理的能力。
第三種模式(英文簡(jiǎn)稱Priscilla Caplan),這一研究認(rèn)為,從下到上,從低到高的要求數(shù)字信息保存的目標(biāo)分別為:可獲得性,即選擇獲得技術(shù);可識(shí)別性,即描述;可理解性,即文檔記錄;完整性,即安全存儲(chǔ);持久生存能力,即媒體管理;可呈現(xiàn)能力,即格式技術(shù)策略;被保存對(duì)象的真實(shí)性,即真實(shí)還原技術(shù)[4]。
雖然發(fā)達(dá)國家在數(shù)字資源長(zhǎng)期保存技術(shù)開發(fā)方面取得較大的成績(jī),但還存在較突出的問題,有學(xué)者研究認(rèn)為,目前尚未有國家建立統(tǒng)一的國家體系進(jìn)行數(shù)字資源的典藏與保存,對(duì)數(shù)字資源及非印本資源的呈繳也缺乏相應(yīng)政策和法律支持,這些為數(shù)字資源長(zhǎng)期保存造成不利影響[6]。在2008年數(shù)字資源長(zhǎng)期保存國際會(huì)議(Ipres2008)參加會(huì)議的專家一致認(rèn)為,技術(shù)不是數(shù)字保存的關(guān)鍵問題,而政策、法律、跨界合作等的不足才是制約數(shù)字保存的瓶頸。可見,從技術(shù)上升到法律、法規(guī)是確保數(shù)字資源長(zhǎng)期保存、利用的新課題,有待于進(jìn)行探討。
我國的數(shù)字資源長(zhǎng)期保存與歐洲國家相比,無論是系統(tǒng)目標(biāo)確定,還是具體技術(shù)環(huán)節(jié)或細(xì)節(jié)等方面仍然存在這一定的差距,但也取得了一些成果,例如,我國目前主要的軟件開發(fā)系統(tǒng)有:中國科學(xué)院國家科學(xué)圖書館的NSTLH NSL聯(lián)合資助的對(duì)電子出版物構(gòu)建長(zhǎng)期保存系統(tǒng);國家圖書館“網(wǎng)絡(luò)信息資源保存試驗(yàn)項(xiàng)目”簡(jiǎn)稱WICP,目前建立有2110中報(bào)紙、1800個(gè)報(bào)紙網(wǎng)站以及80個(gè)網(wǎng)站的PDF文件的數(shù)據(jù)庫;中國Web信息博物館,目前已經(jīng)有30億以中文為主的網(wǎng)頁,并已月均45000完網(wǎng)頁的速度在增長(zhǎng)。此外,還有清華大學(xué)圖書館開發(fā)出來的元數(shù)據(jù)框架、標(biāo)引機(jī)制和元數(shù)據(jù)編碼的系統(tǒng)軟件等。
與國外數(shù)字資源長(zhǎng)期保存相比,還存在一些問題與不足,主要體現(xiàn)在以下幾個(gè)方面。有學(xué)者研究認(rèn)為,數(shù)字資源長(zhǎng)期保存所涉及經(jīng)濟(jì)投入,例如巨大投資、可持續(xù)投資以及投資額不明確;知識(shí)產(chǎn)權(quán)問題,例如永久使用權(quán)、保存權(quán)與國家尚未制定責(zé)任體系的相應(yīng)政策與有關(guān)技術(shù)開發(fā)中的選擇什么技術(shù)策略與方法[7]。
由于互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)數(shù)字資源越來越豐富,人們也更注重從網(wǎng)上獲取數(shù)字資源,但怎樣收集與保存也成為突出的問題。有學(xué)者指出,我國互聯(lián)網(wǎng)信息采集系統(tǒng)采集信息的準(zhǔn)確性和效率較低,對(duì)動(dòng)態(tài)網(wǎng)頁和數(shù)據(jù)庫中的深層網(wǎng)頁采集質(zhì)量不高[8]。
我國還缺乏合作性質(zhì)的保存網(wǎng)絡(luò)組織機(jī)構(gòu),雖然有學(xué)者在研究協(xié)作保存網(wǎng)絡(luò)的數(shù)字資源問題,但仍然體現(xiàn)出不同程度的分散性,不僅不利于數(shù)字資源的整合,還會(huì)導(dǎo)致重要資源內(nèi)容遺漏、利用率低下以及人力物力等浪費(fèi)現(xiàn)象。
數(shù)字資源長(zhǎng)期保存的主體,政府部門、數(shù)字信息創(chuàng)造者、出版商、數(shù)字信息保存機(jī)構(gòu)、軟硬件的開發(fā)者與非營利組織在軟件開發(fā)的責(zé)任、作用與表現(xiàn),從相關(guān)的研究中,雖有學(xué)者對(duì)之在模式上進(jìn)行探討[9],但在法律、政策上還缺乏必要的保障與對(duì)相應(yīng)責(zé)任的追究等。
還有學(xué)者以數(shù)字圖書館信息資源保存為依托,提出對(duì)信息進(jìn)行必要的壓縮、鑒定與選擇、選擇適當(dāng)?shù)膬?chǔ)存媒體以及采用新技術(shù)(仿真、更新與遷移)[10]。
標(biāo)準(zhǔn)是數(shù)字資源長(zhǎng)期保存建設(shè)過程中不可忽視的重要問題之一,是保證數(shù)字資源長(zhǎng)期保存各環(huán)節(jié)互相操作的基礎(chǔ),貫穿于數(shù)字資源生命周期的全過程[11]。標(biāo)準(zhǔn)也是緩解技術(shù)更新與數(shù)字信息讀出矛盾的一劑良方。
我國目前這項(xiàng)技術(shù)還處在實(shí)驗(yàn)階段,還沒有形成被廣泛認(rèn)可的統(tǒng)一標(biāo)準(zhǔn)。有學(xué)者研究認(rèn)為,管理是國家從整體上對(duì)數(shù)字資源的長(zhǎng)期保存進(jìn)行宏觀規(guī)劃、組織和控制,是數(shù)字資源長(zhǎng)期保存的基礎(chǔ)與保障。它的內(nèi)容有:保存政策、責(zé)任體系及合作機(jī)制、知識(shí)產(chǎn)權(quán)等。保存政策是有效實(shí)施數(shù)字資源長(zhǎng)期保存的管理上的保證,涉及技術(shù)、組織、法律及權(quán)益等管理,包括確定長(zhǎng)期保存目標(biāo),完善管理機(jī)構(gòu),制定長(zhǎng)期保存的規(guī)范流程,明確有關(guān)人員或組織職責(zé),確定技術(shù)標(biāo)準(zhǔn)和最佳實(shí)踐,制定長(zhǎng)期保存的延續(xù)性計(jì)劃,建立對(duì)實(shí)施效果的評(píng)價(jià)機(jī)制,完善保存政策的反饋系統(tǒng)等[12]。
(1)由政府牽頭,加大對(duì)我國數(shù)字資源的調(diào)查、歸類與整合,并依托網(wǎng)絡(luò)組織以及高校與企事業(yè)單位等組織,進(jìn)行結(jié)構(gòu)調(diào)整,建立數(shù)字資源長(zhǎng)期保存的不同層次的系統(tǒng),同時(shí)要配合制定相應(yīng)法律、法規(guī),使之規(guī)范化、制度化。從發(fā)達(dá)國家對(duì)數(shù)字資源長(zhǎng)期保存的實(shí)踐上看,他們對(duì)數(shù)字資源的整合、開發(fā)與使用都具有較強(qiáng)的體系性、嚴(yán)謹(jǐn)性與安全性,貫穿控?cái)z整個(gè)信息社會(huì)的內(nèi)部要素,對(duì)他們的技術(shù)方法與手段進(jìn)行更多的借鑒,在國家相關(guān)政策的指導(dǎo)下構(gòu)建有中國特色的數(shù)字資源長(zhǎng)期保存體系。
(2)在對(duì)我國數(shù)字資源長(zhǎng)期保存基礎(chǔ)構(gòu)建中,注重我國數(shù)字長(zhǎng)期保存經(jīng)驗(yàn)的繼承,通過與發(fā)達(dá)國家的比較,對(duì)我國數(shù)字資源的分布進(jìn)行宏觀比較,對(duì)政府、企事業(yè)單位等數(shù)字保存進(jìn)行資源整合,避免資源“割據(jù)”現(xiàn)象,對(duì)此在所用經(jīng)費(fèi)的來源、使用以及系統(tǒng)模型的開發(fā)等方面要形成清晰權(quán)利責(zé)任體系。
(3)國家要對(duì)數(shù)字資源保存系統(tǒng)進(jìn)行統(tǒng)一規(guī)劃,在對(duì)資源的合作保存、選擇性保存以及最大減小保存前的顧慮,明確不同數(shù)字資源保存組織之間的關(guān)聯(lián),在實(shí)踐中發(fā)揮其功效。
數(shù)字資源是信息社會(huì)中主要載體,對(duì)其長(zhǎng)期保存不僅是技術(shù)層面上的問題,也是社會(huì)(法律、道德等)層面上的問題,隨著信息社會(huì)的不斷發(fā)展,數(shù)字資源的長(zhǎng)期保存也來越來越多受到注目。通過對(duì)國外數(shù)字資源長(zhǎng)期保存現(xiàn)狀的分析,我們看到作為信息社會(huì)載體的數(shù)字資源保存的理論探討與實(shí)際應(yīng)用非常龐雜,同時(shí)它選擇什么技術(shù),還取決于待保護(hù)的數(shù)據(jù)類型,格式,內(nèi)容結(jié)構(gòu)和關(guān)系復(fù)雜性及原始軟硬件平臺(tái)。因此,我們?cè)诹私鈬H上大量有價(jià)值的信息及技術(shù)動(dòng)態(tài)的同時(shí),對(duì)我國數(shù)字資源長(zhǎng)期保存基礎(chǔ)構(gòu)建進(jìn)行初步探討,目的在于促進(jìn)我國相關(guān)領(lǐng)域?qū)?shù)字資源長(zhǎng)期保存工作的重視和發(fā)展。
[1]俞敏,編譯.韓國國家圖書館的網(wǎng)頁存檔系統(tǒng)[J].AwebArchiving System of the National Libraryofkorea:OASIS.http://www.ndigo,Jp/en/publication/cdnlao/058/583.htwl[2007-4-7].
[2]吳振新,等.LOCKSSS數(shù)字資源長(zhǎng)期保存策略[J].現(xiàn)代圖書館技術(shù),2006(2):35-37.
[3]圣才學(xué)習(xí)網(wǎng).數(shù)字圖書館理論基[EB//OL].(2006.10)[2010-10-19].http//www.100xuexi.
[4]張智雄.如何長(zhǎng)期保存數(shù)字資源2006年教育行業(yè)信息存儲(chǔ)大會(huì)上的講話.[EB//OL].(2006.4)[2006-6-12].http//www.cnki.net.China.AcademicJournalElectronic Publishing House.AIIrights reserued.
[5]李丹等.協(xié)作與實(shí)踐:數(shù)字資源長(zhǎng)期保存工具及方法[J].圖書館理論與實(shí)踐,2009(11)70-72.
[6]苑玲.國外數(shù)字資源長(zhǎng)期保存的最新發(fā)展及對(duì)我國的啟示[J].中國圖書館學(xué)報(bào),2004(2)24-25.
[7]蘇雪梅.網(wǎng)絡(luò)數(shù)字信息采集與保存的探討[J].預(yù)防醫(yī)學(xué)報(bào),2004(6):647.
[8]謝永憲.數(shù)字長(zhǎng)期保存的相關(guān)主體及合作模式研究[J].圖書館學(xué)研究,2009(3):42.
[9]石得萬.數(shù)字圖書館信息資源保存面臨的挑戰(zhàn)與對(duì)策[J].圖書館論壇,2002(8)47-48.
[10]徐恩元,李瀾楠.市場(chǎng)經(jīng)濟(jì)條件下信息資源有效配置問題初探[J].情報(bào)雜志,2005(11).
[11]王芳.陽光下的政府:政府信息行為的路徑與激勵(lì)[M].南開大學(xué)出版社,2006:65.