金俊蘭
(湖北師范大學,湖北 黃石 435002)
數(shù)字檔案館建設(shè)思考
金俊蘭
(湖北師范大學,湖北 黃石 435002)
在國家信息基礎(chǔ)建設(shè)中,穩(wěn)步推進數(shù)字檔案館建設(shè)是當前形勢下多數(shù)國家的重要任務(wù),我國亦不例外。數(shù)字檔案館雖然在我國已經(jīng)有了十余年的發(fā)展,但目前仍處于初級階段,我國仍然需要不斷探索與思考,促進數(shù)字檔案館建設(shè)的進一步發(fā)展。本文主要從數(shù)字檔案館概念及相關(guān)研究入手,立足數(shù)字檔案館在新技術(shù)、新理念中的新發(fā)展,對數(shù)字檔案館建設(shè)進行思考。
數(shù)字檔案館;現(xiàn)狀;新發(fā)展;建設(shè)
隨著網(wǎng)絡(luò)信息時代的到來,數(shù)字檔案室成為衡量檔案室信息建設(shè)水平高低的標志。尤其最近幾年,信息方面新技術(shù)、新理念的發(fā)展使數(shù)字檔案室建設(shè)成為廣大學者研究的重要課題,隨之加強的還有各國對數(shù)字檔案室建設(shè)的投資力度,推進了數(shù)字檔案室的進一步發(fā)展。在這種熱潮中,如何促進我國數(shù)字檔案室的理性建設(shè)和可持續(xù)發(fā)展,是我國數(shù)字檔案室建設(shè)當前面臨的焦點問題。而在探討數(shù)字檔案室在新技術(shù)、新理念中的新發(fā)展及對數(shù)字檔案室建設(shè)進行思考前,我們首先應(yīng)對數(shù)字檔案室及其相關(guān)研究有一定了解。
(一)數(shù)字檔案室概念、特點、優(yōu)勢
關(guān)于數(shù)字檔案室概念的定義,目前尚不統(tǒng)一。概括來說,數(shù)字檔案室即指依托數(shù)字化形式而運行的信息文獻檔案室,通過數(shù)字技術(shù)對信息文獻進行收集、整理、保存和發(fā)布。利用數(shù)字技術(shù),數(shù)字化檔案室可將各種不同載體的信息資源存貯于檔案室內(nèi),讀者只需要通過網(wǎng)絡(luò)即可對所需的信息進行查詢和傳播[1]。數(shù)字檔案室在形式上不僅可以以具體的社會機構(gòu)或組織存在,同時還可以以虛擬的網(wǎng)站等數(shù)字信息集合的形式而存在。
數(shù)字檔案室的基礎(chǔ)為數(shù)字化信息資源,數(shù)字資源是指通過通信技術(shù)及多媒體技術(shù)等而獲取的信息資源總和,正是在這些數(shù)字化資源的支撐下,數(shù)字檔案室才沒有淪為空中樓閣。數(shù)字檔案室的傳遞手段為網(wǎng)絡(luò)化,在這種網(wǎng)絡(luò)化的傳遞中促使用戶對檔案室數(shù)字資源的共享得以實現(xiàn)。數(shù)字檔案室除了注重對網(wǎng)絡(luò)手段的利用外,還對多種信息技術(shù)加以應(yīng)用,在多種信息技術(shù)的支撐下,為用戶提供了一個傳統(tǒng)檔案室中不可能提供的多庫連接的信息存取服務(wù)。此外,數(shù)字檔案室具有資源共享的特點,讀者對數(shù)字檔案室資源的訪問不用經(jīng)過室員的中介作用同樣可以進行,很多人可同時對數(shù)據(jù)資源加以利用,在信息資源的獲取上既方便又快捷。
相對傳統(tǒng)檔案室以紙質(zhì)文獻為主的室藏載體來說,數(shù)字檔案室的室藏中同時可以存在多樣的儲存介質(zhì),如磁盤、光盤、磁帶等,使讀者獲得更豐富是閱讀感受。數(shù)字檔案室在資源的儲存上對溫度濕度、亮度等儲存條件相對傳統(tǒng)檔案室來說較低,且可復(fù)制和備份,能夠促進檔案室文獻安全性有了大幅度提升[2]。與傳統(tǒng)檔案室相比,數(shù)字檔案室的存儲在紙質(zhì)文獻的保存方面占用房屋的空間較少,且數(shù)字化形式儲存可節(jié)省很多人力。在信息資料的借閱與訪問上,數(shù)字檔案室可通過互聯(lián)網(wǎng)實時傳遞,比傳統(tǒng)檔案室要靈活很多,大大提高了檔案室信息使用效率。
(二)數(shù)字檔案室相關(guān)研究
數(shù)字檔案室當前的研究很多,但追溯到最初的研究時,最先正式將這一研究概念提出的是美國國家研究創(chuàng)新組織。在報告中,他們計劃對一種稱為數(shù)字檔案室系統(tǒng)的開放架構(gòu)加以建立,通過該系統(tǒng)使檔案室可以實現(xiàn)為不同地區(qū)用戶提供服務(wù),使用戶能夠以機讀形式存在的大量分布式信息資源方便地訪問。之后的將近30年里,雖然數(shù)字檔案室的研究越來越多,但其概念定義仍然沒有統(tǒng)一下來,不過在信息資源和服務(wù)上卻已經(jīng)達成了兩點共識。即在信息資源上,數(shù)字檔案室的資源屬于集合資源,且內(nèi)容海量呈分布式;而在服務(wù)上,數(shù)字檔案室具有傳統(tǒng)檔案室所無法完成的跨地域服務(wù),對網(wǎng)絡(luò)訪問給予支持是其一大特點之一[3]。
數(shù)字檔案室研究當前已經(jīng)具有相當大的規(guī)模,并成為檔案室研究中的重要組成部分。研究顯示,大量的數(shù)字檔案室系統(tǒng)已經(jīng)開始投入使用,但在實際應(yīng)用中,用戶面對眾多的獲取信息途徑反而開始出現(xiàn)選擇迷茫。對資源的查詢往往穿梭于多個系統(tǒng)之間,導(dǎo)致很多時間與精力的浪費。在當前的數(shù)字檔案室建設(shè)中,突出的需求即為資源的整合、集成和共享。在計算機和網(wǎng)絡(luò)不斷發(fā)展的過程中,數(shù)字檔案室技術(shù)也隨之經(jīng)歷了不同的階段。數(shù)字檔案室系統(tǒng)最初為以書目為中心的檔案室自動化系統(tǒng),之后演變?yōu)槿馁Y源服務(wù)系統(tǒng),再之后向多媒體數(shù)字檔案室轉(zhuǎn)變,發(fā)展到現(xiàn)在已經(jīng)轉(zhuǎn)變?yōu)樘峁┙y(tǒng)一界面使用平臺給分散的資源與服務(wù)等[4]。不過,當前數(shù)字檔案室的服務(wù)仍然無法完全滿足實際的需求,還需要繼續(xù)研究建設(shè)。
(一)網(wǎng)格技術(shù)在數(shù)字檔案室中的應(yīng)用形成了新型共享模式
網(wǎng)格出現(xiàn)在人們的視野之中,是以一種繼萬維網(wǎng)之后新型網(wǎng)絡(luò)平臺的姿態(tài)出現(xiàn)的。通過網(wǎng)格中間件,網(wǎng)絡(luò)可以被虛擬為巨大虛擬計算機,該計算機中包含各節(jié)點資源總合,網(wǎng)格應(yīng)用層在使用接口上可由其提供透明和一致的使用接口,這種方式促使網(wǎng)格范圍內(nèi)存儲資源、信息資源等高效、全面共享的實現(xiàn)。在網(wǎng)絡(luò)基礎(chǔ)上,用戶可對需要的資源加以使用且不需要對資源的具體位置和細節(jié)進行了解[5]。
網(wǎng)格技術(shù)在數(shù)字檔案室中的應(yīng)用,從網(wǎng)絡(luò)基礎(chǔ)架構(gòu)上為其提供了共享多種資源的途徑且是在不同系統(tǒng)之間的共享途徑。網(wǎng)絡(luò)技術(shù)可使孤立的系統(tǒng)有所轉(zhuǎn)變,在趨向網(wǎng)格節(jié)點的過程中不再孤立存在,促進數(shù)字檔案室資源實現(xiàn)普遍性共享,同時有利于推進數(shù)字檔案室實現(xiàn)服務(wù)復(fù)用目的。對數(shù)字檔案室中網(wǎng)絡(luò)技術(shù)的應(yīng)用,國內(nèi)外都有較多研究,DILIGEN T數(shù)字檔案室基本架構(gòu)是其中比較有代表性的項目,該項目使網(wǎng)絡(luò)技術(shù)得以有機融入到數(shù)字檔案室技術(shù)中。
(二)數(shù)字檔案室集中模式的瓶頸被P2P技術(shù)解決
P2P是一種對等網(wǎng)絡(luò),在該種互聯(lián)網(wǎng)模式下每個節(jié)點的地位在網(wǎng)絡(luò)中都是對等的,每個結(jié)點既充當服務(wù)器,為其他結(jié)點提供服務(wù),同時也可反過來享用其他節(jié)點所提供的服務(wù)(見圖1)。在各個網(wǎng)絡(luò)節(jié)點中,P2P網(wǎng)絡(luò)中的資源和服務(wù)是以分散的形式存在的。在這種非中心化的模式下,信息的傳輸與服務(wù)的完成可以擺脫中間環(huán)節(jié)與服務(wù)器,而在節(jié)點之間就可以直接完成,這一特點對集中式服務(wù)器處理能力具有相當大的改善,彌補了其處理較為有限的缺點[6]。除了這點優(yōu)勢之外,P2P的優(yōu)勢還體現(xiàn)在分布式搜索的實現(xiàn)方面。在P2P技術(shù)環(huán)境下,可以直接而又實時地完成對等點之間的搜索,避免了傳統(tǒng)技術(shù)中數(shù)據(jù)產(chǎn)生實時性不高等缺點,在這一過程中還可以使集中式搜索中覆蓋廣度與深度不夠等突出問題得到解決。在當前的很多領(lǐng)域中,P2P已經(jīng)開始廣泛地與網(wǎng)絡(luò)技術(shù)進行結(jié)合。對數(shù)字檔案室來說,P2P的應(yīng)用能夠提供良好的支持給其分布式管理特性,在一定程度上實現(xiàn)分布式系統(tǒng)間的直接互操作,促進數(shù)字檔案室中文件內(nèi)容、存儲容量等多種直接共享的實現(xiàn)。P2P數(shù)字檔案室,是用java實現(xiàn)的,其中的節(jié)點可以由每一個參與者所代表,可集中對高度分布的信息資源進行搜索,大大改進搜索效果。
圖1:P2P網(wǎng)絡(luò)模式
(三)SOA與Web服務(wù)支持為數(shù)字化檔案室提供了動態(tài)配置機制
SOA作為一種軟件設(shè)計方法,其在模式上主要是一種面向讀物的c/s模式,在其作用下一系列的功能單元被分解出來,這些單元組成了軟件系統(tǒng)需要實現(xiàn)的業(yè)務(wù)功能,其服務(wù)的實現(xiàn)主要依賴這些軟件組件的封裝作用。在松散耦合的關(guān)系中,SOA應(yīng)用系統(tǒng)便在此前提下由許多“服務(wù)”和“服務(wù)消費者”組構(gòu)形成,基于這一特點SOA不僅更加靈活,且伸縮性較強,而且在服務(wù)復(fù)用的功能中,應(yīng)用系統(tǒng)能夠在不斷變化的用戶需求中實現(xiàn)快速迎合[7]。Web服務(wù)這種軟件系統(tǒng)是在一定的環(huán)境中形成的,具有互操作性,它的格式描述接口在處理上可以用機器進行,對基于XML的SOAP消息傳輸Web是給予支持的。在服務(wù)的理念上,Web與SOA的吻合性很高,且使基于HTTP的SOA應(yīng)用系統(tǒng)能夠?qū)崿F(xiàn)首次的動態(tài)構(gòu)成。
在數(shù)字檔案室中,SOA與Web服務(wù)的應(yīng)用從軟件架構(gòu)上提供了一種“可動態(tài)配置”機制(見圖2)給數(shù)字檔案室,不僅使異構(gòu)系統(tǒng)間互操作得以實現(xiàn),而且促進了數(shù)字檔案室在客觀需求變化的適應(yīng)上敏捷性大大增加。
SOA在數(shù)字檔案室中的應(yīng)用,不斷增多是從2005年后開始,其中歐盟資助的DELOS為最具代表性項目。在公共領(lǐng)域?qū)ο乱淮鷶?shù)字檔案室體系進行研究與開發(fā),是DELOS的主要宗旨。DELOS的兩大貢獻在于對第一個完整、規(guī)范的數(shù)字檔案室參考模型進行了頒布,同時對數(shù)字檔案室管理系統(tǒng)原型進行了建立。SOA與Web服務(wù)在數(shù)字檔案室中的應(yīng)用,預(yù)示著數(shù)字檔案室動態(tài)配置大規(guī)模實現(xiàn)的開始。
圖2:SOA與Web3.0下的數(shù)字檔案室平臺
(四)云計算與云存儲在數(shù)字化檔案室中逐步應(yīng)用
云計算的產(chǎn)生并非憑空而來,而是基于分布式處理、并行處理等這些技術(shù)基礎(chǔ)而產(chǎn)生的。云計算能夠催生虛擬超級計算中心,在這一過程中促使超級計算機的功能在更低的成本下實現(xiàn)。云存儲這一概念的出現(xiàn),是基于云計算概念的延伸與發(fā)展,云存儲可以通過應(yīng)用軟件實現(xiàn)集合并使各種不同類型的存儲設(shè)備協(xié)同工作[8]。數(shù)據(jù)存儲和管理,在云計算系統(tǒng)中為核心存在,當對其進行大量的云存儲設(shè)備配置時就會促使其向一個云存儲系統(tǒng)轉(zhuǎn)變?!霸啤钡母拍?,在Yahoo、Amazon等互聯(lián)網(wǎng)服務(wù)提供者的推動下得到了很大發(fā)展。這些互聯(lián)網(wǎng)服務(wù)者還對云服務(wù)的提供加以嘗試,對用戶通過Web方式對“云”中資源的使用持允許態(tài)度,在這種推動下計算機計算、存儲能力可轉(zhuǎn)變?yōu)楣觅Y源。我國云存儲市場規(guī)模,近年來也一直不斷上漲(見圖3),并逐漸應(yīng)用于數(shù)字檔案室中。對數(shù)字檔案室的發(fā)展來說,云計算和云存儲使其擴充擁有了更多余地。在數(shù)據(jù)的處理、搜索和挖掘上,常用的SAN架構(gòu)和標準的關(guān)系數(shù)據(jù)庫當前是存在一定瓶頸的,而當數(shù)據(jù)量達到PB級時這些瓶頸即可得到突破。在數(shù)字檔案室的建設(shè)中,云計算與云存儲當前的應(yīng)用正在逐步進行,從數(shù)字化檔案室的發(fā)展形勢來看,在“云”上或遷至“云”上將會成為更多數(shù)字檔案室的建設(shè)趨勢。
圖3:我國2009—2014年云存儲市場規(guī)模狀況
(一)立足資源這一根本來對數(shù)字化檔案室進行建設(shè)
從數(shù)字檔案室的特點可知,信息資源為其建設(shè)基礎(chǔ),數(shù)字化檔案室在建設(shè)過程中必須以資源為本。自建資源與購買資源是信息資源中的兩大組成部分,其中包括合建資源動態(tài)資源、專題信息庫等都屬于自建資源。對于尚未達到實用階段的自建資源,必須對其加強建設(shè)。動態(tài)資源通常產(chǎn)生于教學、科研活動中,是一種非正式的信息資源,但這類資源具有特殊的價值,所以在數(shù)字化檔案室建設(shè)中其組織、管理和發(fā)布都需要專業(yè)人員來進行。在資源的使用價值上,其主要的決定因素為資源的特色和質(zhì)量,則兩大因素同時對數(shù)字檔案室的存在價值具有決定作用[9]。數(shù)字檔案室的資源建設(shè),要對質(zhì)量控制加以強調(diào),根據(jù)既定標準揭示和利用資源,降低元數(shù)據(jù)二次加工的隱患。
(二)數(shù)字化檔案室建設(shè)要開放體系
在數(shù)字檔案室建設(shè)中,開放可謂其靈魂。作為一個虛擬的概念,數(shù)字檔案室對分布式管理系統(tǒng)的資源共享和服務(wù)雙重強調(diào),這一強調(diào)對數(shù)字檔案室系統(tǒng)的開放性便有了較多要求。在對數(shù)字檔案室進行整體規(guī)劃和系統(tǒng)設(shè)計過程中,必須著重考慮開放性這一重要指標。在用戶界面的友好、功能齊全等方面,很多已經(jīng)建成的數(shù)字檔案室系統(tǒng)均會考慮很多,但對其他系統(tǒng)如何實現(xiàn)對本系統(tǒng)功能和數(shù)據(jù)的共性卻很少考慮,這種“重內(nèi)輕外”在數(shù)字化檔案室建設(shè)中是尤其要不得的,容易使其成為信息孤島[10]。面對未來,數(shù)字化檔案室建設(shè)必須立足大環(huán)境,通過合理地封裝與開放對世界數(shù)字檔案室建設(shè)經(jīng)驗積極吸收,引導(dǎo)數(shù)字檔案室建設(shè)能夠與時俱進,始終走在大環(huán)境的前沿。
(三)數(shù)字化檔案室建設(shè)要重視集成工作
集成在數(shù)字檔案室建設(shè)中屬于主題式的存在,這里的集成主要指通過對可用資源與服務(wù)的充分利用,對數(shù)字檔案室進行開拓性地組合創(chuàng)新,構(gòu)建特定的數(shù)字檔案室。在數(shù)字檔案室開發(fā)中,集成用于最終階段,通過集成將功能連貫的應(yīng)用系統(tǒng)提供給用戶,在這一過程中數(shù)字數(shù)字檔案室的建設(shè)成果可以被更加直觀地呈現(xiàn)出來。在數(shù)字檔案室的集成工作中,開放信息源的多少具有重要影響,掌握足夠多的開放信息源是其建設(shè)必須,也是數(shù)字化檔案室建設(shè)集成的基礎(chǔ)[11]。數(shù)字化檔案室在建設(shè)的過程中,應(yīng)立足現(xiàn)實中的已有條件正確選擇資源集成途徑,通過合作等方式將分散的資源和服務(wù)進行有機集成,通過資源的開放來實現(xiàn)彼此雙贏,形成整體化效應(yīng)。
(四)數(shù)字化檔案室要做好安全保障工作
數(shù)字化檔案室建設(shè)還必須注意安全問題,基于計算機技術(shù)的數(shù)字檔案室在建設(shè)中會面臨著互聯(lián)網(wǎng)本身所具有的較多的安全隱患,尤其伴隨著數(shù)字檔案室系統(tǒng)的開放的不斷提高,其安全問題也隨之凸顯。數(shù)字檔案室的安全除了包括安全運行外,還包括安全使用。前者要求數(shù)字檔案室在建設(shè)中必須做好防止非法入侵及病毒破壞等工作,后者要求數(shù)字檔案室必須對資源的合法使用給予安全保障,其中后者是當前數(shù)字化檔案室建設(shè)中熱點和難點[12]。數(shù)字檔案室建設(shè)在對綜合的安全策略進行制定時,必須要考慮要用戶的方便性,同時還需要考慮不增加過多的額外流量。
在當前的社會發(fā)展中,數(shù)字檔案室相對傳統(tǒng)檔案室具有突出的優(yōu)勢,與數(shù)字檔案室有關(guān)的研究成果也很多,數(shù)字檔案室建設(shè)是檔案室發(fā)展的必然趨勢。新技術(shù)在數(shù)字檔案室中的應(yīng)用,進一步推動了數(shù)字檔案室的建設(shè),不過在建設(shè)過程中數(shù)字化檔案室必須從自身現(xiàn)狀出發(fā),立足資源建設(shè)根本,做到開放體系、廣泛集成,同時要好安全保障工作。
[1] 張紅亮.數(shù)字檔案室建設(shè)芻議[J].科學中國人,2015,(9):55-56.
[2]張金雁.數(shù)字檔案室建設(shè)與發(fā)展淺析[J].科技致富向?qū)В?015,(6):128-130.
[3]朱長宏.淺談數(shù)字檔案室建設(shè)與發(fā)展趨勢[J].中文信息,2015,(6):89-91.
[4]夏立新,胡守敏,劉楓.我國數(shù)字檔案室研究十年:基于科研項目分析,2010,(5):40-42.
[5]李偉.萬丈高樓平地起——淺談網(wǎng)格計算基礎(chǔ).http://www.iipl.fudan.edu.cn/research/gc.html,2009-12-08.
[6]趙捧未,郭利偉.基于Super-P2P的個人數(shù)字檔案室虛擬社區(qū)知識組織模型構(gòu)建研究[J].情報理論與實踐,2010,33(6):77-79.
[7]孟優(yōu)優(yōu).論檔案室數(shù)據(jù)共享與交換平臺的可行性--鑒于SOA的研究[J].數(shù)字化用戶,2014,(12):91-92.
[8]馬曉亭.云計算環(huán)境下數(shù)字檔案室數(shù)據(jù)安全存儲架構(gòu)與策略研究[J].高校檔案室工作,2012,32(4):33-34.
[9] 李躍輝.淺析如何建設(shè)數(shù)字化檔案室[J].現(xiàn)代閱讀,2012,(2):88-90.
[10]周義剛.高校數(shù)字檔案室建設(shè)思考——以湖北大學檔案室為例[J].情報探索,2009,(5):104-106.
[11]裴亞欣.淺析如何做好數(shù)字檔案室管理工作[J].今日財富(金融發(fā)展與監(jiān)管),2012,(5):62-63.
[12]劉洪,周明君,劉暉.對我國數(shù)字檔案室建設(shè)的三點思考[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014,(3):230-232.
金俊蘭(1967-),女,副研究館員,主要從事檔案信息化、檔案信息開發(fā)與利用等研究。