廖毅飛
【摘要】大數(shù)據(jù)時(shí)代的到來沖擊著整個(gè)世界,變革著人們的生活、工作和思維方式。大數(shù)據(jù)時(shí)代的到來對檔案管理工作也產(chǎn)生了很大的沖擊和影響,是對檔案部門的檔案管理能力和水平的全新考驗(yàn)。大數(shù)據(jù)時(shí)代下檔案管理模式變化的研究,有利于保護(hù)各類檔案文化資源,優(yōu)化檔案業(yè)務(wù)流程,挖掘檔案增值信息,加強(qiáng)檔案管理機(jī)構(gòu)的職能建設(shè),達(dá)到促進(jìn)檔案事業(yè)發(fā)展的目的。在理清大數(shù)據(jù)相關(guān)概念的基礎(chǔ)上,本文對國內(nèi)外相關(guān)研究文獻(xiàn)進(jìn)行歸納和總結(jié),了解和分析目前學(xué)術(shù)界對大數(shù)據(jù)時(shí)代下檔案管理研究的重點(diǎn)內(nèi)容,提出本文研究的主要內(nèi)容。
【關(guān)鍵詞】大數(shù)據(jù)時(shí)代;檔案管理模式;轉(zhuǎn)換;創(chuàng)新
一、大數(shù)據(jù)的興起
1.大數(shù)據(jù)帶來的挑戰(zhàn)。2012年以來,“大數(shù)據(jù)”一詞越來越多地被提及,人們通常用它來命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新,并定義和描述信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù)。檔案本
身是一種具有原始性物證的載體,更是一種特殊的信息資源,在大數(shù)據(jù)時(shí)代被賦予了新的內(nèi)涵,是大數(shù)據(jù)極為重要的組成部分。如何抓住大數(shù)據(jù)初現(xiàn)的歷史機(jī)遇,實(shí)現(xiàn)檔案管理方法、理念及模式的轉(zhuǎn)換與創(chuàng)新,以適應(yīng)新時(shí)代信息收集、傳播、利用的新趨勢是檔案部門面臨的一項(xiàng)新課題。與此同時(shí),傳統(tǒng)檔案管理利用模式也受到大數(shù)據(jù)高度關(guān)注可用性特點(diǎn)的挑戰(zhàn)。
2.大數(shù)據(jù)的基本特征。一般認(rèn)為,大數(shù)據(jù)(bigdata,mega data),或稱巨量信息、巨量資料,是收集和分析大量信息的能力,目的在于從復(fù)雜的數(shù)據(jù)里找到過去不容易昭示的規(guī)律。通常認(rèn)為,大數(shù)據(jù)具有4個(gè)“V”字開頭的特征,即體量大、多樣性、價(jià)值密度低、速度快。相比“數(shù)據(jù)”而言,“大數(shù)據(jù)”的顯著特征是:第一,數(shù)據(jù)的屬性是包括結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。第二,數(shù)據(jù)之間頻繁產(chǎn)生交互,大規(guī)模進(jìn)行數(shù)據(jù)分析,并實(shí)時(shí)與業(yè)務(wù)結(jié)合進(jìn)行數(shù)據(jù)挖掘。
二、檔案管理工作大數(shù)據(jù)特征
大數(shù)據(jù)是繼云計(jì)算、云存儲(chǔ)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等新技術(shù)新應(yīng)用之后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革。它影響著科技、商業(yè)、企業(yè)、政府和個(gè)人等各個(gè)領(lǐng)域,整個(gè)世界步入了大數(shù)據(jù)時(shí)代。檔案界也不例外,滾滾來襲的大數(shù)據(jù)浪潮也必將使傳統(tǒng)的檔案工作發(fā)生變革。檔案管理的思維,檔案資源的組織、收集、存儲(chǔ)、利用方式都在發(fā)生新的改變,呈現(xiàn)新的特點(diǎn)。
1.檔案數(shù)據(jù)資源種類繁多。目前,檔案數(shù)據(jù)主要來源于兩個(gè)方面:1.各業(yè)務(wù)部門通過業(yè)務(wù)系統(tǒng)產(chǎn)生的業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)為檔案數(shù)據(jù)。2.檔案部門通過人工填寫、錄入、搜集歸類后轉(zhuǎn)為檔案數(shù)據(jù)。前者具有及時(shí)、廣泛、數(shù)據(jù)量大、內(nèi)容繁雜的特點(diǎn);后者最常見的是將館藏的實(shí)體檔案通過數(shù)字化技術(shù)轉(zhuǎn)為檔案數(shù)據(jù),如掃描、拍照等??梢姡S著全面開展按照“存量數(shù)字化”和“增量電子化”要求,檔案數(shù)據(jù)資源的數(shù)量必將呈幾何級增長,形成真正意義上的檔案大數(shù)據(jù)。檔案管理的信息資源呈現(xiàn)多元化:有檔案內(nèi)容、檔案管理、檔案實(shí)體、檔案應(yīng)用和檔案館樓宇管理信息資源。
2.檔案數(shù)據(jù)資源價(jià)值密度低。在傳統(tǒng)檔案管理工作中,一直存在“重藏輕用、重資源輕管理”的現(xiàn)象,人們既要盡力避免檔案實(shí)體漲庫,避免檔案信息存儲(chǔ)空間限制,又要防止有效檔案資源被淹沒海量檔案中間降低利用價(jià)值;而在利用環(huán)節(jié),人們追求檔案如何在需要時(shí)應(yīng)有盡有,同時(shí)要能被快速、準(zhǔn)確地檢索出來。因此,從這個(gè)意義上來說,檔案價(jià)值的實(shí)現(xiàn)更多地體現(xiàn)在“用”上,而檔案的“用”要做到全智能服務(wù)。應(yīng)用大數(shù)據(jù)技術(shù),可以通過主動(dòng)調(diào)查業(yè)務(wù)部門的需求,建立各種數(shù)據(jù)模型,對海量數(shù)據(jù)進(jìn)行聚類、分類、數(shù)據(jù)挖掘與分析,實(shí)現(xiàn)有針對性、個(gè)體化的服務(wù),將數(shù)據(jù)進(jìn)行系統(tǒng)地收集、分析、發(fā)現(xiàn)和預(yù)測,從而建立起更切合用戶需求的檔案信息服務(wù)模式。
三、大數(shù)據(jù)時(shí)代下檔案管理面臨的挑戰(zhàn)
1.技術(shù)瓶頸有待解決。在實(shí)際檔案管理工作中,大數(shù)據(jù)技術(shù)的應(yīng)用將面臨新的挑戰(zhàn)。譬如:庫房資源成為檔案管理存儲(chǔ)的瓶頸;如何將大數(shù)據(jù)解決方案與傳統(tǒng)的檔案信息資源、數(shù)據(jù)存儲(chǔ)和應(yīng)用技術(shù)進(jìn)行融合銜接?可見,設(shè)計(jì)最合理的分層、分級存儲(chǔ)架構(gòu)已成為數(shù)據(jù)管理及服務(wù)的關(guān)鍵技術(shù),當(dāng)然還要有穩(wěn)定的信息整合、遷移和歸檔技術(shù)。
2.檔案部門的職能義務(wù)。如今的檔案部門不但要承擔(dān)。收集和保存好檔案資料的社會(huì)責(zé)任,還要承擔(dān)檔案信息資源有效利用和產(chǎn)出良好社會(huì)效益的重任。結(jié)合大數(shù)據(jù)帶來的挑戰(zhàn)和機(jī)遇,檔案部門已經(jīng)開始朝著知識(shí)管理、信息服務(wù)的方向發(fā)展,運(yùn)用大數(shù)據(jù)理念,在保障國家安全、商業(yè)秘密、知識(shí)產(chǎn)權(quán)、個(gè)人隱私的前提下,全面整合開放并管理公共數(shù)據(jù)信息資源,以滿足全社會(huì)對信息資源的利用需求,發(fā)揮檔案部門的數(shù)據(jù)主體地位和職能作用,是值得深入思考的問題。
3.法律規(guī)范需完備。在新形勢下,各個(gè)加入大數(shù)據(jù)應(yīng)用的檔案館可以通過有關(guān)的協(xié)議共享彼此的信息資源,這樣數(shù)據(jù)的處理和傳輸將會(huì)在一個(gè)虛擬的空間內(nèi)進(jìn)行。同時(shí)也會(huì)帶來訪問和隱私的安全性、穩(wěn)定性和可靠性等一系列問題。
四、大數(shù)據(jù)時(shí)代檔案管理變革策略分析
大數(shù)據(jù)給檔案管理思維帶來了沖擊,要求我們要用發(fā)展的眼光認(rèn)識(shí)、尋求檔案管理理念和檔案工作的整個(gè)流程的突破和創(chuàng)新,要從館藏內(nèi)容的構(gòu)成、資源開放體系構(gòu)建、開放平臺(tái)和應(yīng)用技術(shù)的運(yùn)用與檔案服務(wù)方式的改進(jìn)等多方面著手,構(gòu)建一個(gè)親近、便捷、有魅力的開放型檔案館。充分利用大數(shù)據(jù)挖掘、分析技術(shù),實(shí)現(xiàn)信息資源整合,做到緊密銜接、全程動(dòng)態(tài)管理和安全可靠。制定大數(shù)據(jù)時(shí)代檔案管理的規(guī)章制度,明確目的和標(biāo)準(zhǔn),做到檔案管理規(guī)范化。