周玉敏
近年來,隨著科學(xué)技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)和信息技術(shù)迅速滲透到各行各業(yè),并成為改變?nèi)藗児ぷ鞣绞?、思維方式的重要手段。在新的工作和生活方式的改變進(jìn)程中,產(chǎn)生了大量的行為痕跡,這些痕跡以數(shù)據(jù)的方式存放于服務(wù)器中。這就是人們常說的“大數(shù)據(jù)”。國家檔案局局長李明華2017年12月27日在北京召開的全國檔案局長館長會議上表示,我國檔案工作要應(yīng)勢而動、乘勢而為,加快轉(zhuǎn)型升級,逐步實現(xiàn)以信息化為核心的檔案管理現(xiàn)代化。
1 大數(shù)據(jù)為檔案工作帶來新的挑戰(zhàn)
1.1 檔案數(shù)量呈爆發(fā)式增長。隨著無紙化辦公的發(fā)展,一些地區(qū)和部門實行雙套制歸檔,檔案不僅以紙質(zhì)形式存儲,更以電子文件的形式運轉(zhuǎn)和留存。各級檔案館接收進(jìn)館的檔案亦增幅可觀。據(jù)統(tǒng)計,2008年,全國各級國家綜合檔案館館藏1.93億卷,較上年增加1769萬卷,增幅達(dá)10%;2011年,各級國家檔案館館藏已達(dá)3.3億卷;據(jù)預(yù)測,到2020年,各級國家檔案館館藏將達(dá)到6億多卷。而我國檔案數(shù)據(jù)不僅局限于檔案館館藏,還廣泛存在于政府、企業(yè)、金融、教育等各行業(yè)的檔案室中??梢灶A(yù)見,檔案數(shù)量將呈爆發(fā)式增長。
1.2 檔案種類紛繁多樣。由于檔案廣泛存在于各行各業(yè)中,政府機(jī)關(guān)、金融、通信、建筑、教育、法院等行業(yè)產(chǎn)生的檔案種類各不相同,如文檔、圖紙、照片、音頻、視頻、GIS信息、水文氣象信息等。檔案種類從以文書檔案為主向表格、網(wǎng)頁、音視頻、圖像等類型的數(shù)據(jù)傾斜。如何收集、管理、保存這些種類的檔案,是我們急需解決的問題。
1.3 檔案利用需求多元化。為群眾提供利用服務(wù)是檔案館的一項日常工作,也是檔案為各項事業(yè)服務(wù)和百姓服務(wù)的直接手段。隨著檔案資源的不斷豐富,檔案利用的主體已由各級行政機(jī)關(guān)擴(kuò)展到全社會,并且社會普通民眾的利用比率逐年上升。普通民眾利用的檔案內(nèi)容呈現(xiàn)出多元化的特點,涉及房產(chǎn)、婚姻、兵役、招工等各種民生檔案和專業(yè)檔案。如何更好地提供利用服務(wù)是我們面對的問題。
2 大數(shù)據(jù)為檔案工作帶來新的機(jī)遇
2.1 大數(shù)據(jù)為檔案數(shù)據(jù)挖掘帶來新的機(jī)遇。數(shù)據(jù)挖掘又稱為資料探勘、數(shù)據(jù)采礦,它是數(shù)據(jù)庫知識發(fā)現(xiàn)中的一個步驟,一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。這些數(shù)據(jù)可以是結(jié)構(gòu)化的,也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。通過數(shù)據(jù)挖掘,可以做出預(yù)測性的、基于知識的決策。檔案館以及各行業(yè)的檔案室擁有大量的數(shù)據(jù)資源,在大數(shù)據(jù)時代,這些數(shù)據(jù)資源可以從孤立的信息變?yōu)榫哂邢嚓P(guān)性的網(wǎng)狀數(shù)據(jù)關(guān)系,在醫(yī)療衛(wèi)生、社會事件、政府決策等方面做出預(yù)測和參考,從而發(fā)揮檔案服務(wù)中心工作的作用。
2.2 大數(shù)據(jù)為檔案利用服務(wù)帶來新的機(jī)遇。傳統(tǒng)的利用服務(wù)是群眾到檔案館或其他檔案保存機(jī)構(gòu)現(xiàn)場查閱檔案,既費時費力又難以達(dá)到滿意的效果。而大數(shù)據(jù)時代的到來,利用互聯(lián)網(wǎng)和信息技術(shù),群眾可以在線查閱電子檔案,既省時省力,又減少了對檔案的損害。同時,可以對檔案查閱信息進(jìn)行二次數(shù)據(jù)挖掘,對利用檔案的種類、人群分布、查閱時段等進(jìn)行分析,有針對性地開展檔案鑒定、開放和編研工作,以擴(kuò)大檔案在社會上的影響。
3 大數(shù)據(jù)促進(jìn)檔案行業(yè)加快轉(zhuǎn)型升級
3.1 大數(shù)據(jù)促進(jìn)檔案工作模式改進(jìn)。傳統(tǒng)的檔案工作模式由收集、管理、利用三個主要環(huán)節(jié)構(gòu)成。其中,收集由各檔案產(chǎn)生部門分別收集,整理后移交至檔案保管部門;管理以人工手動管理為主,建立紙質(zhì)的管理流程;利用是以人工手動查詢檔案實體的被動利用方式為主。而在大數(shù)據(jù)時代,檔案的收集是自動形式的實時收集過程,其目標(biāo)數(shù)據(jù)不僅是結(jié)果,而是檔案產(chǎn)生的整個過程;檔案管理是智能化的機(jī)器管理過程,管理對象不僅是檔案實體或電子文件,也包括對檔案進(jìn)行諸多操作的痕跡管理;檔案利用則是依靠數(shù)據(jù)挖掘、云計算等信息技術(shù)對數(shù)據(jù)的分析和預(yù)測。
3.2 大數(shù)據(jù)促進(jìn)各類型檔案管理標(biāo)準(zhǔn)規(guī)范。由于大數(shù)據(jù)時代的到來,檔案產(chǎn)生來源更為廣泛,各種類型的檔案如何管理迫在眉睫。尤其是利用率較高的民生檔案和專門檔案,由于劃分細(xì)致,各具特色,急需更具操作性的檔案管理標(biāo)準(zhǔn)來規(guī)范管理。
3.3 大數(shù)據(jù)促進(jìn)檔案法規(guī)逐步健全。由于檔案具有保密性和安全性的屬性,在利用過程中要注重安全性問題。特別是以互聯(lián)網(wǎng)為運作環(huán)境的大數(shù)據(jù)時代,網(wǎng)絡(luò)環(huán)境的開放性對檔案的安全保密會形成一定的沖擊。如何在安全的前提下,保存檔案資源的真實可靠性是必須解決的問題。因此,要提高安全防范意識,建立健全和不斷完善相關(guān)檔案法規(guī)。比如在安全管理制度、配備安全管理設(shè)備、系統(tǒng)的安全防護(hù)和保密管理條件等方面做出具體規(guī)定,查處違法行為。
(作者單位:新密市尖山風(fēng)景區(qū)管理委員會 來稿日期:2018-01-26)