馮華
摘要:利用大數(shù)據(jù),對海量檔案進(jìn)行科學(xué)歸集和利用,是當(dāng)前檔案管理工作的重中之重。
關(guān)鍵詞:大數(shù)據(jù) 檔案管理 信息化
伴隨著我國信息化進(jìn)程的快速發(fā)展,大數(shù)據(jù)已無聲無息地潛入到各行各業(yè),網(wǎng)絡(luò)化、平臺化的新型企業(yè)組織模式正在極大挖掘管理的智慧和潛能。如何搶占管理制高點,利用大數(shù)據(jù),對海量檔案進(jìn)行科學(xué)歸集和利用,是當(dāng)前檔案管理工作的重中之重。
一、正確認(rèn)識大數(shù)據(jù)
1.大數(shù)據(jù)是社會發(fā)展高科技的產(chǎn)物。現(xiàn)在的社會是一個高速發(fā)展的社會,科技發(fā)達(dá),信息流通,人們之間的交流越來越密切,生活也越來越方便,大數(shù)據(jù)就是這個高科技時代的產(chǎn)物。牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所舍恩伯格教授認(rèn)為,大數(shù)據(jù)是人們獲得新的知識、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構(gòu)和關(guān)系結(jié)構(gòu)的工具。我們也可以將它定義為記錄人類社會活動的、具有規(guī)模效應(yīng)的數(shù)據(jù)集合。
2.大數(shù)據(jù)的特性和原理。大數(shù)據(jù)有數(shù)據(jù)量巨大,數(shù)據(jù)種類繁多,價值密度相對低,處理速度特別快的特點,也具有規(guī)模性、多樣性以及高速性的特性;大數(shù)據(jù)的原理是運用云計算處理和其數(shù)據(jù)庫、云存儲、虛擬化的主要技術(shù)手段,對海量數(shù)據(jù)開展數(shù)據(jù)挖掘,從而快速獲得有價值的信息。其核心價值在于對海量數(shù)據(jù)進(jìn)行存儲和分析。
3.大數(shù)據(jù)已融入社會發(fā)展各個領(lǐng)域。隨著互聯(lián)網(wǎng)信息化技術(shù)時代廣泛應(yīng)用,大數(shù)據(jù)也吸引了越來越多的關(guān)注。大數(shù)據(jù)因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百甚至數(shù)千的電腦分配工作。在現(xiàn)今的社會,大數(shù)據(jù)的應(yīng)用越來越彰顯它的優(yōu)勢,它占領(lǐng)的領(lǐng)域也越來越大,電子商務(wù)、O2O、物流配送等,各種利用大數(shù)據(jù)進(jìn)行發(fā)展的領(lǐng)域正在協(xié)助企業(yè)不斷地發(fā)展新業(yè)務(wù)、創(chuàng)新運營模式。大數(shù)據(jù)技術(shù)能夠通過海量、動態(tài)數(shù)據(jù)的有效集成,推動社會治理的精細(xì)化和科學(xué)化進(jìn)程,并有效節(jié)約社會治理的成本。
二、大數(shù)據(jù)與檔案
1.從檔案概念看大數(shù)據(jù)。《檔案法》規(guī)定:檔案是指過去和現(xiàn)在的國家機構(gòu)、社會組織以及個人從事政治、軍事、經(jīng)濟、科學(xué)、技術(shù)、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。單從檔案的定義來看,除電子檔案外,其他載體形式的檔案與大數(shù)據(jù)沒有任何關(guān)系,只有檔案記錄的信息可以稱之為數(shù)據(jù)。
2.從檔案特性看大數(shù)據(jù)。從檔案的特征來分析,檔案具有社會性、歷史性、確定性及原始記錄性。而大數(shù)據(jù)也具有類似的特征,大數(shù)據(jù)也是人類社會活動的原始記錄,其內(nèi)容也具有確定性,且其記錄的內(nèi)容只反映事物已經(jīng)完成的狀態(tài),同樣具有原始記錄性。因此,檔案與大數(shù)據(jù)的關(guān)系僅是具有相似的特征,大數(shù)據(jù)是具有鮮明檔案特性的數(shù)據(jù)集合。
3.從檔案價值看大數(shù)據(jù)。從數(shù)據(jù)的保存價值來講,有些數(shù)據(jù)集合對國家和社會沒有永久的保存價值,不需要永久保存。而檔案本身的價值在于歷史性和記錄性,如何借助信息化手段,將有形的檔案轉(zhuǎn)換為數(shù)據(jù),將電子檔案歸集利用好大數(shù)據(jù),使檔案的保存價值得以放大,這是檔案今后發(fā)展與大數(shù)據(jù)的真正關(guān)系所在。
三、大數(shù)據(jù)給檔案管理帶來的機遇
1.實現(xiàn)挖掘檔案的價值的最大化。隨著當(dāng)前檔案數(shù)字化進(jìn)程的推進(jìn),檔案信息數(shù)量越來越龐大,面對海量的檔案信息,利用大數(shù)據(jù)技術(shù)可以快速地篩選出有價值的檔案信息,不僅實現(xiàn)了人力、物力和財務(wù)的節(jié)約,而且為檔案信息的開發(fā)利用提供了全新的思路。同時還能夠利用大數(shù)據(jù)技術(shù)對檔案信息進(jìn)行深度挖掘,更好地發(fā)揮出檔案信息的重要價值。
2.實現(xiàn)共享檔案信息資源的最大化?;诖髷?shù)據(jù)技術(shù)支撐下可以有效地促進(jìn)檔案信息資源的利用和共享,在實際工作中,通過利用云存儲技術(shù)將有用的檔案信息在云平臺上進(jìn)行存儲,構(gòu)建云檔案系統(tǒng),可以為檔案利用者提供更為便捷的檔案信息服務(wù)。云存儲不僅能夠為檔案信息資源共享提供更多的便利,而且還能夠有效地節(jié)約檔案信息開發(fā)利用的時間和存儲成本。通過將檔案信息錄入到數(shù)據(jù)庫中,用戶在查詢檔案信息時只需要輸入關(guān)鍵詞即可獲取到自己需要的檔案信息,不受時間和空間的限制。
3.實現(xiàn)檔案管理變革的最大化。在當(dāng)前大數(shù)據(jù)時代,傳統(tǒng)的檔案管理方式越來越無法滿足電子檔案發(fā)展的需求。特別是大數(shù)據(jù)特有的碎片化、及時性和非結(jié)構(gòu)化的特點,這也迫切要求檔案工作要加快自身的變革,摒棄落后的管理模式,加快推進(jìn)檔案工作的升級,特別是要重視檔案信息挖掘技術(shù)和檢索技術(shù)的應(yīng)用,提高檔案管理的智能化水平,放大檔案的價值。
四、大數(shù)據(jù)給檔案管理帶來的挑戰(zhàn)
1.大數(shù)據(jù)時代,從事檔案管理工作的人員管理的理念相對落后,大多數(shù)人員還存在著“重管理、輕利用”的理念,嚴(yán)重缺乏先進(jìn)的工作思路和專業(yè)的知識體系,對掌握現(xiàn)代化信息手段和大數(shù)據(jù)應(yīng)用技術(shù)不積極、不主動,部分檔案系統(tǒng)員工老齡化現(xiàn)象嚴(yán)重,不能適應(yīng)全新的檔案管理模式,不能適應(yīng)信息化技術(shù)帶來的挑戰(zhàn)。
2.對檔案資源管理的挑戰(zhàn)。隨著大數(shù)據(jù)時代來臨,傳統(tǒng)檔案管理工作已無法適應(yīng)原始數(shù)據(jù)處理,檔案存儲能力和檢索能力受到嚴(yán)峻挑戰(zhàn)。尤其是從實體檔案到檔案數(shù)字化、數(shù)據(jù)化,檔案信息資源呈指數(shù)型增長,管理手段和工具已難以滿足大數(shù)據(jù)時代檔案信息資源管理的需求。目前歸檔內(nèi)容龐大、檔案信息泛濫,這種環(huán)境下實現(xiàn)檔案數(shù)據(jù)的真實性、完整性、可用性和安全性,并在海量數(shù)據(jù)中實現(xiàn)對檔案信息的挖掘分析,從而提供有價值的信息,是檔案管理面臨的新挑戰(zhàn)。
3.數(shù)據(jù)資源安全性是檔案管理工作當(dāng)中的一項重要內(nèi)容,檔案涉及大量的黨和國家秘密、企業(yè)商業(yè)秘密和個人隱私。隨著檔案信息化程度的越來越高,現(xiàn)代技術(shù)應(yīng)用的同時,致使檔案更容易受到網(wǎng)絡(luò)病毒、黑客的攻擊,造成信息丟失、泄漏或者篡改的后果,很難保證檔案的保密性。在檔案的提取利用中,容易被非法盜取、復(fù)制、修改或者偽造等,影響檔案的真實性、合法性。
4.大數(shù)據(jù)時代,檔案管理對信息技術(shù)的應(yīng)用已是現(xiàn)實,現(xiàn)代化檔案管理人離不開掌握先進(jìn)的信息化技術(shù),需要既懂信息化技術(shù)又懂檔案管理專業(yè)的人才進(jìn)行實際操作。但當(dāng)前我國檔案管理數(shù)據(jù)分析類人才相對較少,制約了檔案管理工作發(fā)展。根據(jù)現(xiàn)有人員隊伍現(xiàn)狀,相應(yīng)的人員素質(zhì)急需提升檔案數(shù)據(jù)分析、操作和應(yīng)用的能力,來適應(yīng)檔案管理信息化的應(yīng)用。