文/黑龍江省水利水電勘測(cè)設(shè)計(jì)研究院 陳婷婷
大數(shù)據(jù)時(shí)代背景下檔案管理探討
文/黑龍江省水利水電勘測(cè)設(shè)計(jì)研究院 陳婷婷
大數(shù)據(jù)這一革命性技術(shù)給現(xiàn)代社會(huì)的各個(gè)行業(yè)帶來了超過預(yù)期的沖擊和改變,新技術(shù)和新應(yīng)用地陸續(xù)躋身人類生產(chǎn)和生活的各個(gè)舞臺(tái),檔案管理也不可避免地面臨著諸多的調(diào)整和機(jī)遇,如何準(zhǔn)確地把握時(shí)代脈搏,有針對(duì)性地采取措施促進(jìn)檔案管理實(shí)現(xiàn)創(chuàng)新發(fā)展,更好地發(fā)揮服務(wù)功能,檔案管理人員必須高度重視和深入思考。
大數(shù)據(jù);檔案管理;信息技術(shù)
信息技術(shù)讓檔案管理實(shí)現(xiàn)了電子化和數(shù)據(jù)化,近年來隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,社會(huì)組織衍生了海量的數(shù)據(jù),加上信息儲(chǔ)存和處理技術(shù)的升級(jí),使得對(duì)海量數(shù)據(jù)的收集、挖掘、儲(chǔ)存、應(yīng)用成為可能,檔案管理進(jìn)入大數(shù)據(jù)階段。大數(shù)據(jù)時(shí)代背景下的檔案管理對(duì)于用戶的檢索、查閱和電子檔案的數(shù)據(jù)處理能力要求更高,深入分析大數(shù)據(jù)時(shí)代背景下檔案管理所面臨的挑戰(zhàn)和機(jī)遇,有針對(duì)性地采取優(yōu)化措施,對(duì)提高檔案管理的服務(wù)水平具有重要的現(xiàn)實(shí)意義。
(一)檔案信息的儲(chǔ)存和獲取。大數(shù)據(jù)時(shí)代背景下,一方面是檔案數(shù)據(jù)呈指數(shù)增長,現(xiàn)有的儲(chǔ)存設(shè)備和技術(shù)難以完整的儲(chǔ)存全部信息,另一方面則是海量的數(shù)據(jù)意味著信息的上傳需要更多的時(shí)間,很難實(shí)現(xiàn)信息上傳的即時(shí)性。因此,大數(shù)據(jù)時(shí)代背景下檔案管理面臨的首要挑戰(zhàn)就是如何在保證檔案信息完整性的前提下,對(duì)數(shù)據(jù)進(jìn)行有效儲(chǔ)存,當(dāng)前比較常見的是在儲(chǔ)存點(diǎn)進(jìn)行處理后僅傳輸處理結(jié)果,但這樣無法準(zhǔn)確判斷信息的有效性,這對(duì)于檔案管理是一個(gè)極大的挑戰(zhàn)。
(二)有效的數(shù)據(jù)管理。數(shù)據(jù)從產(chǎn)生、傳播、儲(chǔ)存、保護(hù)、歸檔到安全維護(hù),都有發(fā)生錯(cuò)誤的可能性,在傳統(tǒng)檔案管理和信息化檔案管理都是采用構(gòu)建容錯(cuò)算法模型的方式來降低檔案管理各個(gè)環(huán)節(jié)錯(cuò)誤發(fā)生的頻率。但是大數(shù)據(jù)時(shí)代背景下的檔案管理無法設(shè)計(jì)零誤差的容錯(cuò)設(shè)備或者軟件,雖然理論上來說容錯(cuò)率只需要保持在一個(gè)“可接受”狀態(tài)即可,但是隨著容錯(cuò)率的降低成本,錯(cuò)誤產(chǎn)生的概率將會(huì)大幅度提高,對(duì)檔案管理的創(chuàng)新發(fā)展造成了極大阻礙。
(三)人才挑戰(zhàn)。大數(shù)據(jù)時(shí)代對(duì)檔案人員的能力和素質(zhì)要求也出現(xiàn)了很大的變化,傳統(tǒng)的檔案人員只需要掌握一定的紙質(zhì)檔案管理技術(shù)即可,信息化時(shí)代下檔案管理人員需要掌握一定的計(jì)算機(jī)技術(shù)如辦公軟件等,而大數(shù)據(jù)時(shí)代背景下的檔案人員不僅需要掌握相應(yīng)的檔案管理技術(shù),更需要深入學(xué)習(xí)數(shù)據(jù)挖掘、數(shù)據(jù)分析技術(shù)。因此,在工作實(shí)踐中,檔案管理急需大數(shù)據(jù)處理所要求的軟硬件工程師、數(shù)據(jù)庫工程師等專業(yè)人才。
(一)大數(shù)據(jù)理念給海量檔案信息資源管理帶來了機(jī)遇。紙質(zhì)檔案資源信息管理往往以卷、件、份為單位,信息時(shí)代的檔案資源信息管理更多的是直接將檔案信息儲(chǔ)存在電腦中,大數(shù)據(jù)時(shí)代的檔案信息管理則是以字段、數(shù)據(jù)庫的方式來對(duì)檔案資源信息進(jìn)行管理,面對(duì)海量數(shù)據(jù)所帶來的巨大壓力,檔案人員的工作目標(biāo)將不再是檔案的收、管、用上,而是電子檔案的生成、可讀性、安全性,同時(shí)借助云計(jì)算技術(shù)實(shí)現(xiàn)計(jì)算資源和儲(chǔ)存資源的動(dòng)態(tài)擴(kuò)展。
(二)大數(shù)據(jù)理念給數(shù)據(jù)利用帶來了新的機(jī)遇。進(jìn)入檔案管理進(jìn)行信息化時(shí)代后檔案利用效率較以前有了一定的提升,而數(shù)據(jù)挖掘技術(shù)作為大數(shù)據(jù)時(shí)代的代表性技術(shù),對(duì)于利用率的提升作用不言而喻,通過數(shù)據(jù)挖掘和數(shù)據(jù)模型,對(duì)相關(guān)的數(shù)據(jù)進(jìn)行聚類、分類、相關(guān)性分析,將原本的“死檔案”轉(zhuǎn)變?yōu)椤盎钚畔ⅰ?,?shí)現(xiàn)了檔案信息資源的即時(shí)使用。
(一)積極利用先進(jìn)技術(shù)。大數(shù)據(jù)概念和海量數(shù)據(jù)兩者的最大區(qū)別在于是否擁有先進(jìn)的數(shù)據(jù)挖掘技術(shù)和相應(yīng)的數(shù)據(jù)處理模型,在檔案管理工作中,我們要積極主動(dòng)的采用各種先進(jìn)信息技術(shù)和儲(chǔ)存系統(tǒng)來提高檔案管理科學(xué)化水平。例如采用內(nèi)存計(jì)算技術(shù)來實(shí)現(xiàn)檔案資源的自動(dòng)化管理和配置,降低大數(shù)據(jù)時(shí)代背景下檔案管理的復(fù)雜性,提高利用效率,采用云計(jì)算技術(shù)來實(shí)現(xiàn)檔案信息資源共享,構(gòu)建檔案服務(wù)大數(shù)據(jù)。
(二)提升檔案管理部門的協(xié)同工作能力。不同區(qū)域、不同等級(jí)的檔案部門經(jīng)常是各自為戰(zhàn),檔案信息資源的共享和利用幾乎不存在,管理者的思想認(rèn)識(shí)不足是不容忽視的一個(gè)重要原因。面對(duì)大數(shù)據(jù)時(shí)代所帶來的壓力,各級(jí)檔案部門必須不斷優(yōu)化管理手段,消除信息壁壘,建設(shè)“大檔案”,實(shí)現(xiàn)“大服務(wù)”。例如以數(shù)字檔案館建設(shè)為載體構(gòu)建檔案大數(shù)據(jù),實(shí)現(xiàn)檔案信息資源的統(tǒng)一利用,大幅提高檔案信息資源的利用效率。
(三)重視數(shù)據(jù)技術(shù)在檔案智能檢索中的應(yīng)用。大數(shù)據(jù)時(shí)代到來,如何在海量的檔案數(shù)據(jù)中篩選出有效信息成為亟待解決的問題,數(shù)據(jù)技術(shù)為實(shí)現(xiàn)檔案智能檢索提供了可能。例如可視化分析、預(yù)測(cè)性分析、數(shù)據(jù)挖掘算法、語義引擎、多字段過濾、智能篩選等技術(shù)都能夠保證檔案檢索的真實(shí)性和有效性,優(yōu)化檔案利用服務(wù)流程,提升檔案管理人員公共服務(wù)能力。
大數(shù)據(jù)時(shí)代的我們處于由各種數(shù)據(jù)包圍的環(huán)境中,對(duì)數(shù)據(jù)的利用水平?jīng)Q定了未來的發(fā)展高度。因此,檔案管理在面對(duì)大數(shù)據(jù)時(shí)代所帶來的諸多挑戰(zhàn)時(shí)要勇于創(chuàng)新,積極地采取措施提高數(shù)據(jù)挖掘、整理、歸納能力,更好地服務(wù)社會(huì),實(shí)現(xiàn)檔案管理工作和社會(huì)經(jīng)濟(jì)的共同發(fā)展。
[1]于曉萍.大數(shù)據(jù)時(shí)代下檔案管理的應(yīng)對(duì)策略研究[J].蘭臺(tái)世界,2015(02).
[2]石冬梅.大數(shù)據(jù)時(shí)代檔案管理工作的挑戰(zhàn)與機(jī)遇[J].現(xiàn)代商業(yè),2014(09).
[3]尹寶君.大數(shù)據(jù)時(shí)代檔案管理中新媒體與傳統(tǒng)紙媒的融合研究[J].蘭臺(tái)世界,2015(08).
[4]邢蕾蕾.大數(shù)據(jù)時(shí)代下檔案管理發(fā)展的有效途徑[J].科技展望,2014(11).