文/正元地理信息有限責任公司山東分公司 劉文照
大數(shù)據(jù)時代檔案管理模式的轉(zhuǎn)換與創(chuàng)新
文/正元地理信息有限責任公司山東分公司 劉文照
本文論述了檔案管理大數(shù)據(jù)特征;大數(shù)據(jù)時代檔案管理面臨的挑戰(zhàn);大數(shù)據(jù)時代檔案管理變革策略分析。
大數(shù)據(jù)時代;檔案管理模式;轉(zhuǎn)換;創(chuàng)新
(一)大數(shù)據(jù)帶來的挑戰(zhàn)。2012年以來,“大數(shù)據(jù)”一詞越來越多地被提及,人們通常用它來命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新,并定義和描述信息爆炸時代產(chǎn)生的海量數(shù)據(jù)。檔案本身是一種具有原始性物證的載體,更是一種特殊的信息資源,在大數(shù)據(jù)時代被賦予了新的內(nèi)涵,是大數(shù)據(jù)極為重要的組成部分。如何抓住大數(shù)據(jù)初現(xiàn)的歷史機遇,實現(xiàn)檔案管理方法、理念及模式的轉(zhuǎn)換與創(chuàng)新,以適應新時代信息收集、傳播、利用的新趨勢是檔案部門面臨的一項新課題。與此同時,傳統(tǒng)檔案管理利用模式也受到大數(shù)據(jù)高度關(guān)注可用性特點的挑戰(zhàn)。
(二)大數(shù)據(jù)的基本特征。一般認為,大數(shù)據(jù)(big data,mega data),或稱巨量信息、巨量資料,是收集和分析大量信息的能力,目的在于從復雜的數(shù)據(jù)里找到過去不容易昭示的規(guī)律。通常認為,大數(shù)據(jù)具有4個“V”字開頭的特征,即體量大、多樣性、價值密度低、速度快。相比 “數(shù)據(jù)”而言,“大數(shù)據(jù)”的顯著特征是:第一,數(shù)據(jù)的屬性是包括結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。第二,數(shù)據(jù)之間頻繁產(chǎn)生交互,大規(guī)模進行數(shù)據(jù)分析,并實時與業(yè)務(wù)結(jié)合進行數(shù)據(jù)挖掘。
大數(shù)據(jù)是繼云計算、云存儲、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等新技術(shù)新應用之后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革。它影響著科技、商業(yè)、企業(yè)、政府和個人等各個領(lǐng)域,整個世界步入了大數(shù)據(jù)時代。檔案界也不例外,滾滾來襲的大數(shù)據(jù)浪潮也必將使傳統(tǒng)的檔案工作發(fā)生變革。檔案管理的思維,檔案資源的組織、收集、存儲、利用方式都在發(fā)生新的改變,呈現(xiàn)新的特點。
(一)檔案數(shù)據(jù)資源種類繁多。目前,檔案數(shù)據(jù)主要來源于兩個方面:1.各業(yè)務(wù)部門通過業(yè)務(wù)系統(tǒng)產(chǎn)生的業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)為檔案數(shù)據(jù)。2.檔案部門通過人工填寫、錄入、搜集歸類后轉(zhuǎn)為檔案數(shù)據(jù)。前者具有及時、廣泛、數(shù)據(jù)量大、內(nèi)容繁雜的特點;后者最常見的是將館藏的實體檔案通過數(shù)字化技術(shù)轉(zhuǎn)為檔案數(shù)據(jù),如掃描、拍照等。可見,隨著全面開展按照“存量數(shù)字化”和“增量電子化”要求,檔案數(shù)據(jù)資源的數(shù)量必將呈幾何級增長,形成真正意義上的檔案大數(shù)據(jù)。檔案管理的信息資源呈現(xiàn)多元化:有檔案內(nèi)容、檔案管理、檔案實體、檔案應用和檔案館樓宇管理信息資源。這些資源中存在著大量的結(jié)構(gòu)和非結(jié)構(gòu)化的種類繁多的數(shù)據(jù),既可以讓用戶滿足利用需求獲取檔案內(nèi)容信息;也可以讓管理者獲取檔案管理知識,協(xié)同處理檔案業(yè)務(wù)工作。
(二)檔案數(shù)據(jù)資源價值密度低。在傳統(tǒng)檔案管理工作中,一直存在“重藏輕用、重資源輕管理”的現(xiàn)象,人們既要盡力避免檔案實體漲庫,避免檔案信息存儲空間限制,又要防止有效檔案資源被淹沒海量檔案中間降低利用價值;而在利用環(huán)節(jié),人們追求檔案如何在需要時應有盡有,同時要能被快速、準確地檢索出來。因此,從這個意義上來說,檔案價值的實現(xiàn)更多地體現(xiàn)在“用”上,而檔案的“用”要做到全智能服務(wù)。應用大數(shù)據(jù)技術(shù),可以通過主動調(diào)查業(yè)務(wù)部門的需求,建立各種數(shù)據(jù)模型,對海量數(shù)據(jù)進行聚類、分類、數(shù)據(jù)挖掘與分析,實現(xiàn)有針對性、個體化的服務(wù),將數(shù)據(jù)進行系統(tǒng)地收集、分析、發(fā)現(xiàn)和預測,從而建立起更切合用戶需求的檔案信息服務(wù)模式。
(一)技術(shù)瓶頸有待解決。在實際檔案管理工作中,大數(shù)據(jù)技術(shù)的應用將面臨新的挑戰(zhàn)。譬如:庫房資源成為檔案管理存儲的瓶頸;如何將大數(shù)據(jù)解決方案與傳統(tǒng)的檔案信息資源、數(shù)據(jù)存儲和應用技術(shù)進行融合銜接?可見,設(shè)計最合理的分層、分級存儲架構(gòu)已成為數(shù)據(jù)管理及服務(wù)的關(guān)鍵技術(shù),當然還要有穩(wěn)定的信息整合、遷移和歸檔技術(shù)。
(二)檔案部門的職能義務(wù)。如今的檔案部門不但要承擔收集和保存好檔案資料的社會責任,還要承擔檔案信息資源有效利用和產(chǎn)出良好社會效益的重任。結(jié)合大數(shù)據(jù)帶來的挑戰(zhàn)和機遇,檔案部門已經(jīng)開始朝著知識管理、信息服務(wù)的方向發(fā)展,運用大數(shù)據(jù)理念,在保障國家安全、商業(yè)秘密、知識產(chǎn)權(quán)、個人隱私的前提下,全面整合開放并管理公共數(shù)據(jù)信息資源,以滿足全社會對信息資源的利用需求,發(fā)揮檔案部門的數(shù)據(jù)主體地位和職能作用,是值得深入思考的問題。
(三)法律規(guī)范需完備。在新形勢下,各個加入大數(shù)據(jù)應用的檔案館可以通過有關(guān)的協(xié)議共享彼此的信息資源,這樣數(shù)據(jù)的處理和傳輸將會在一個虛擬的空間內(nèi)進行。同時也會帶來訪問和隱私的安全性、穩(wěn)定性和可靠性等一系列問題。從目前國內(nèi)大數(shù)據(jù)的產(chǎn)生和應用來看,立法工作明顯滯后,不但在數(shù)據(jù)保護方面缺乏相應的法律規(guī)范,在信息安全度方面也缺乏有效的監(jiān)管機制和準入制度。
大數(shù)據(jù)給檔案管理思維帶來了沖擊,要求我們要用發(fā)展的眼光認識、尋求檔案管理理念和檔案工作的整個流程的突破和創(chuàng)新,要從館藏內(nèi)容的構(gòu)成、資源開放體系構(gòu)建、開放平臺和應用技術(shù)的運用與檔案服務(wù)方式的改進等多方面著手,構(gòu)建一個親近、便捷、有魅力的開放型檔案館。充分利用大數(shù)據(jù)挖掘、分析技術(shù),實現(xiàn)信息資源整合,做到緊密銜接、全程動態(tài)管理和安全可靠。制定大數(shù)據(jù)時代檔案管理的規(guī)章制度,明確目的和標準,做到檔案管理規(guī)范化。