摘 要:本文從數(shù)字檔案館建設(shè)必要性出發(fā),分析福建院數(shù)字檔案館基本要求,具備特點,詳細介紹了數(shù)字檔案館功能及技術(shù)架構(gòu),提出數(shù)字檔案館后續(xù)館藏充實豐富工作方向。
關(guān)鍵詞:數(shù)字檔案;檔案數(shù)字化;電子檔案;數(shù)字檔案館
1 前言
進入21世紀(jì)后,隨著信息技術(shù)的發(fā)展和設(shè)計手段的提高,檔案資料的載體逐漸數(shù)字化、信息化,這些檔案資料是設(shè)計企業(yè)的寶貴財富,一旦流失將給企業(yè)造成巨大的損失,更為重要的是,一些資料甚至屬于孤本,具有重要的保存價值和使用價值。傳統(tǒng)的檔案管理方式已不能適應(yīng)計算機網(wǎng)絡(luò)信息化的發(fā)展,企業(yè)對電子文件歸檔存儲、傳統(tǒng)載體檔案數(shù)字化、信息化和電子檔案安全、使用和管理提出新的要求,亟需解決檔案的數(shù)據(jù)建立和數(shù)據(jù)歸宿、信息資源的開發(fā)和利用等問題。
為適應(yīng)這一些變化,滿足數(shù)字檔案資源的有效管理和在線利用的需求,數(shù)字檔案館建設(shè)在各級檔案部門蓬勃發(fā)展,數(shù)字檔案館建設(shè)已成為全國檔案信息化建設(shè)的重點。各檔案部門在機讀目錄數(shù)據(jù)庫建設(shè)、館藏檔案數(shù)字化、檔案網(wǎng)站建設(shè)、數(shù)字檔案館建設(shè)方面均取得了長足進展,檔案信息化建設(shè)全面、有序、系統(tǒng)發(fā)展。
福建省電力勘測設(shè)計院(以下簡稱福建院)信息化建設(shè)起步較早,已建立了設(shè)計項目全過程管理系統(tǒng)《設(shè)計院管理信息系統(tǒng)平臺》、《OA辦公系統(tǒng)》、《檔案管理系統(tǒng)》等,隨著業(yè)務(wù)的擴展和信息化的發(fā)展,福建院對檔案資源收集和管理提出了更高的要求,希望利用更先進的信息化手段,并按照電力設(shè)計行業(yè)數(shù)字檔案館建設(shè)指導(dǎo)意見的架構(gòu)要求,構(gòu)建一套數(shù)字檔案館系統(tǒng),實現(xiàn)圖檔資源的流程化、網(wǎng)絡(luò)化、自動化、智能化、規(guī)范化管理,實現(xiàn)檔案資源的互相利用,互聯(lián)互通,重點解決數(shù)字檔案和傳統(tǒng)檔案等的歸檔和管理利用問題,實現(xiàn)檔案資源的“可收、可存、可管、可用”,提高企業(yè)的生產(chǎn)和管理效率,保護企業(yè)的知識財產(chǎn)。
2 福建院數(shù)字檔案館建設(shè)基本要求和技術(shù)特點
2.1、整體規(guī)劃檔案的資源建設(shè),考慮各類檔案資源的入口,為電子檔案的輸入提供標(biāo)準(zhǔn)、通用的歸檔接口。
2.2、實現(xiàn)與《設(shè)計院管理信息系統(tǒng)平臺》集成,實現(xiàn)圖紙和文本報告的電子文件在線收集,確保歸檔電子文件的及時性、完整性、真實性。
2.3、實現(xiàn)與《設(shè)計院管理信息系統(tǒng)平臺》集成,實現(xiàn)生成過程記錄表單及附件(包括校審單、設(shè)計變更通知單、互提資料單等過程性文件)的在線歸檔,逐步實現(xiàn)工程原始文件的電子歸檔。
2.4、實現(xiàn)與《設(shè)計院管理信息系統(tǒng)平臺》集成,實現(xiàn)合同、招投標(biāo)文件、科標(biāo)業(yè)檔案資料的在線歸檔。
2.5、通過網(wǎng)上歸檔和批量導(dǎo)入實現(xiàn)非在線文件的收集歸檔。
2.6、實現(xiàn)工程設(shè)計檔案、文書檔案、聲像檔案、實物檔案、總承包項目檔案、合同檔案、招投標(biāo)檔案、科標(biāo)業(yè)檔案、會計檔案、儀器設(shè)備檔案、軟件檔案、地形圖、圖書、規(guī)程規(guī)范、資料、標(biāo)準(zhǔn)圖集等外購資源及其網(wǎng)費管理及訂購管理共16個分類的檔案資源的收集、整理、保管、檢索、利用等功能。
2.7、實現(xiàn)電子檔案與紙質(zhì)文件的集成管理;實現(xiàn)各類紙質(zhì)檔案及電子文件的借閱查詢、借閱審批、借閱辦理、電子文件瀏覽、下載審核、歸還、催還提醒等業(yè)務(wù)管理。
2.8、利用信息化手段,基于電子地圖數(shù)據(jù)及地形圖圖號規(guī)則,將設(shè)計人員從傳統(tǒng)的紙質(zhì)索引目錄查找方式中解脫出來,實現(xiàn)索引目錄的可視化檢索。
2.9、實現(xiàn)并內(nèi)嵌功能強大的安全瀏覽器,能對矢量格式、光柵格式、文檔格式和其它格式文件僅能在線瀏覽,無法下載、復(fù)制、打印電子文件,保護知識產(chǎn)權(quán)。
2.10、采用具有索引引擎,查詢引擎,文本分析引擎的全文檢索技術(shù),實現(xiàn)電子文件內(nèi)容級的檢索,滿足利用者對資源快速、準(zhǔn)確、全面的利用要求。
2.11、實現(xiàn)現(xiàn)有應(yīng)用系統(tǒng)的數(shù)據(jù)遷移,以及歷史收集的電子文件的批量入庫,以便進行統(tǒng)一、有序管理。
3 整體功能架構(gòu)
以電力設(shè)計行業(yè)數(shù)字檔案館建設(shè)意見為指導(dǎo),結(jié)合當(dāng)前信息技術(shù)發(fā)展現(xiàn)狀和趨勢,采用如圖1所示的總體框架,來滿足福建院現(xiàn)在和未來的管理和發(fā)展需要。
圖1:數(shù)字檔案館總體架構(gòu)圖
數(shù)字檔案館平臺架構(gòu)包括數(shù)字檔案資源收集、數(shù)字檔案資源管理、數(shù)字檔案資源保存、數(shù)字檔案資源利用四部分主要功能。數(shù)字檔案資源建設(shè)是數(shù)字檔案館建設(shè)的核心內(nèi)容。
3.1 數(shù)字檔案資源收集
數(shù)字檔案館設(shè)計開發(fā)通用的歸檔接口,與產(chǎn)生文件的《設(shè)計院管理信息系統(tǒng)平臺》、《OA系統(tǒng)》及其他MIS系統(tǒng)集成,在產(chǎn)生文件的前端自動采集,自動將文件轉(zhuǎn)為檔案,實現(xiàn)檔案資源網(wǎng)絡(luò)化、流程化、自動化、智能化管理。
3.1.1、工程成品檔案收集,主要包括圖紙、文本報告等,主要有AutoCAD、Microsoft Word/Excel軟件形成的電子文件,以及數(shù)字化掃描件。通過格式轉(zhuǎn)換技術(shù),DWG文件在《設(shè)計院管理信息系統(tǒng)平臺》經(jīng)電子簽名后,將DWG圖紙轉(zhuǎn)換成不可編輯的TIFF或PDF格式,省去了煩瑣的人工數(shù)字化掃描工作,大大提高工作效率,節(jié)省了成本。
3.1.2、工程原始檔案收集,包括計劃、合同(委托、協(xié)議)、互提資料、客戶資料和驗證、卷冊任務(wù)及策劃、卷冊校審單、設(shè)計聯(lián)系單、設(shè)計更改通知單、設(shè)計計算書等,以及數(shù)字化掃描件。在《設(shè)計院管理信息系統(tǒng)平臺》中,內(nèi)部的原始檔案資料均是經(jīng)過系統(tǒng)流轉(zhuǎn)后自動生成,外部資料經(jīng)掃描后上傳至平臺中。原始檔案資源流轉(zhuǎn)結(jié)束后通過歸檔接口歸檔,保證了原始檔案資料的準(zhǔn)確性、完整性。
3.1.3、文書檔案收集:福建院的《OA辦公系統(tǒng)》是中電建統(tǒng)一的管理平臺,目前要實現(xiàn)歸檔接口存在一定的困難,因此考慮通過中間文件Excel的方式實現(xiàn)數(shù)據(jù)轉(zhuǎn)換至《數(shù)字檔案館》。
3.1.4、總承包項目檔案收集:項目總包過程中即投標(biāo)、招標(biāo)、勘察、設(shè)計、施工、調(diào)試、設(shè)備采購、監(jiān)理及竣工驗收等過程中形成的文字材料、圖紙、圖表、計算、聲像等以及其他形式載體的文件材料,通過與《總承包項目管理系統(tǒng)》的歸檔接口,實現(xiàn)總承包項目的項目文檔在線歸檔。endprint
3.1.5、合同、招投標(biāo)檔案、科標(biāo)業(yè)檔案等。在《設(shè)計院管理信息系統(tǒng)平臺》中實現(xiàn)了合同管理、招投標(biāo)、科標(biāo)業(yè)的過程管理,通過歸檔接口,實現(xiàn)合同、招投標(biāo)文件、科標(biāo)業(yè)檔案的自動收集,從文件生成、辦理到檔案歸檔管理的全過程管理。
3.1.6、檔案資源其他收集情況
對于不能在線方式收集的電子文件,由管理人員批量上傳歸檔,作為自動收集的補充手段,提供單個文件導(dǎo)入、多個文件導(dǎo)入、文件夾導(dǎo)入功能。
對于無前端控制系統(tǒng)的檔案收集,通過Web頁面,為各職能部門提供統(tǒng)一的歸檔途徑,各職能部門在Web頁面中進行文件的信息錄入、電子文件上傳、打印移交清單等。檔案人員通過相應(yīng)的歸檔模塊進行歸檔簽入確認(rèn),并利用移交的數(shù)據(jù)完成相應(yīng)檔案整編工作。目前需通過Web頁面網(wǎng)上歸檔的檔案門類有:文書檔案、部分合同檔案、聲像檔案、實物檔案、會計檔案、儀器設(shè)備檔案、軟件檔案等。
3.2 數(shù)字檔案資源管理
數(shù)字檔案資源管理包括企業(yè)內(nèi)各類檔案紙介質(zhì)和電子文件的錄入、整理、分類、組卷、著錄、移交、檔案銷毀、檔案編研、光盤刻錄、借閱管理等工作。
檔案資源管理既兼顧現(xiàn)狀,提供傳統(tǒng)紙質(zhì)檔案的管理,又著眼于未來,緊跟檔案數(shù)字化的時代趨勢,加強數(shù)字資源建設(shè),實現(xiàn)傳統(tǒng)紙質(zhì)檔案和電子文件的統(tǒng)一管理。
根據(jù)福建院現(xiàn)有檔案業(yè)務(wù)需求,分別建立檔案庫,實現(xiàn)線上線下業(yè)務(wù)完全接軌、同步運轉(zhuǎn)。
通過開發(fā)條形碼管理模塊,將所有正式提交出版的圖紙、報告等電子文件,全部添加條形碼,并確保唯一。這樣能保證圖紙從入口到出口都能隨時管控,提高了歸檔數(shù)據(jù)的準(zhǔn)確性,完整性。另外簡化電子檔案歸檔入庫操作,只需掃一下條形碼,核對相關(guān)卷冊信息內(nèi)容即可。
3.3 數(shù)字檔案資源保存
3.3.1、建立目錄數(shù)據(jù)庫、元數(shù)據(jù)庫、內(nèi)容數(shù)據(jù)庫
檔案資源條目信息通過數(shù)據(jù)庫技術(shù)保存,包括檔案資源的目錄數(shù)據(jù)庫、內(nèi)容數(shù)據(jù)庫和元數(shù)據(jù)庫。目錄數(shù)據(jù)庫主要保存檔案實體的屬性信息,比如工程編號、工程名稱、圖號、圖名等信息。內(nèi)容數(shù)據(jù)庫保存提取得到的電子文件的文本內(nèi)容,實現(xiàn)更為精準(zhǔn)、豐富的查詢。數(shù)字檔案館在收集電子文件的同時,會提取相關(guān)元數(shù)據(jù),比如DWG文件的AutoCAD版本、字體、引用文件及日期、時間等信息保存在元數(shù)據(jù)庫,確保電子文件的完整性。
3.3.2、建立電子文件資源庫
數(shù)字檔案館的電子文件按照檔案門類不同存儲在文件服務(wù)器不同文件夾上, 通過文件存儲服務(wù)來實現(xiàn)電子文件的寫入和讀取。
3.4 數(shù)字檔案資源利用
3.4.1、數(shù)字檔案館網(wǎng)站
開發(fā)數(shù)字檔案館網(wǎng)站,為用戶提供一個統(tǒng)一數(shù)字檔案館入口界面,用戶通過IE瀏覽器訪問數(shù)字檔案館網(wǎng)站,無論身在何處,都可以方便的實現(xiàn)檔案目錄、檔案數(shù)據(jù)、檔案全文的查詢、在線瀏覽和下載。
3.4.2、查詢檢索
提供簡單查詢和組合查詢方式,實現(xiàn)在最短的時間內(nèi),對所有數(shù)據(jù)進行檢索查詢,查詢項可由用戶自定義,對查詢結(jié)果提供關(guān)鍵項的全庫排序功能,其他非關(guān)鍵項的當(dāng)前頁排序功能,將查詢結(jié)果導(dǎo)出到Excel。
3.4.3、全文檢索
全文檢索技術(shù)是一種全新的檢索手段,通過全文檢索技術(shù),能實現(xiàn)電子文件內(nèi)容級的檢索,它提供更為豐富的檢索手段。對于收集到的電子文件,系統(tǒng)直接讀取DWG、DOC、XLS、PPT等文件格式中的文本信息,用戶輸入關(guān)鍵詞信息,系統(tǒng)根據(jù)關(guān)鍵詞信息進行全文檢索,將包含該信息的文件摘要以條目的形式呈現(xiàn)給用戶,效果類似于百度。
3.4.4、縮略圖
圖片格式的文件在web端以省略圖的形式顯示,以提高瀏覽的速度,點擊可查看原始照片。
3.4.5、在線瀏覽
為了給設(shè)計人員提供方便,支持在線瀏覽功能,但是不能下載、拷貝、打印等。有效防止檔案信息的流失,保護福建院知識產(chǎn)權(quán)。在線瀏覽支持常見格式文件:DWG、DWF、DOC、XLS、PPT、PDF、TIF、JPG等。
3.4.6、傳統(tǒng)載體檔案借閱
可以通過系統(tǒng)提供的檢索功能檢索到所有的檔案、圖書、資料等不同類型的傳統(tǒng)載體檔案信息,并可以了解庫存和借閱情況,實現(xiàn)網(wǎng)上借閱申請,網(wǎng)上流程審批功能。
3.4.7、電子文件下載
可以在系統(tǒng)中檢索已歸檔的電子版檔案資料,并在允許權(quán)限內(nèi)下載所需檔案資料。
3.4.8、地形圖可視化檢索
地形圖可視化檢索利用WebGIS技術(shù),實現(xiàn)電子地圖的在線瀏覽定位,可快速查詢和匹配相應(yīng)的紙質(zhì)地形圖,實現(xiàn)地形圖的檢索和借閱。
4 技術(shù)架構(gòu)
4.1 技術(shù)路線
軟件平臺采用微軟的.NET企業(yè)級架構(gòu)的解決方案,數(shù)據(jù)庫使用SQLServer,系統(tǒng)采用面向服務(wù)的體系結(jié)構(gòu)(SOA)。采用C/S和B/S結(jié)合,檔案整編管理端基于C/S結(jié)構(gòu),用戶端使用基于B/S結(jié)構(gòu),設(shè)計人員通過IE瀏覽器即可實現(xiàn)各門類檔案的查詢、在線瀏覽、借閱申請等。
4.2 技術(shù)架構(gòu)圖
5 結(jié)語
在數(shù)字檔案館建設(shè)過程中,隨著對檔案工作的理解不斷深入,對數(shù)字檔案館的認(rèn)識不斷深化,采取數(shù)據(jù)提取、文件共享、流程改進等先進技術(shù)和手段,使福建院數(shù)字檔案館建設(shè)平穩(wěn)搭建,功能完備,為系統(tǒng)順利上線奠定堅實基礎(chǔ)。未來,為充實豐富數(shù)字檔案館館藏,進一步進行館藏歷史檔案數(shù)字化加工和外部資源補充,以后通過與“中國知網(wǎng)”、“標(biāo)準(zhǔn)信息系統(tǒng)”、“國標(biāo)電子書庫”等網(wǎng)站的鏈接,可以減少或不購買規(guī)程規(guī)范、圖書、期刊等紙質(zhì)版,不但知識的傳速度增快,滿足生產(chǎn)的需要,有效地提高生產(chǎn)效率,而且還大大的地減少檔案庫房和檔案裝具,從而降低保管成本。
作者簡歷
陳世雄,福建省電力勘測設(shè)計院檔案中心職工,高級工程師,曾在信息中心供職多年,熟悉信息化工作,并在新崗位上接受檔案管理知識培訓(xùn),是本單位數(shù)字檔案館建設(shè)的項目負責(zé)人員之一。endprint