常林 王峰
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,逐漸發(fā)展成為了信息時代,信息處理方式也發(fā)生了變化,種類越來越多,隨著人們生活水平的不斷提高,人們對于信息的處理技術(shù)要求越來越多,傳統(tǒng)的檔案管理已經(jīng)逐漸無法達到人們生活,因此,人們開始探索新的檔案處理方式,逐漸向著大數(shù)據(jù)領(lǐng)域方面發(fā)展,該項技術(shù)的使用大大提升了人們的工作效率,由于大數(shù)據(jù)帶來的便利,帶動了人們向著大數(shù)據(jù)更深的領(lǐng)域進行挖掘。本文簡單介紹了大數(shù)據(jù)技術(shù)并分析了檔案數(shù)據(jù)挖掘技術(shù)以及大數(shù)據(jù)下的檔案數(shù)據(jù)挖掘,希望能夠為相關(guān)領(lǐng)域做出一定的貢獻,也期望能夠為相關(guān)的研究人員提供一定啟發(fā)。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);檔案數(shù)據(jù);數(shù)據(jù)挖掘
前言
目前,隨著世界經(jīng)濟向一體化趨勢發(fā)展,帶動了我國經(jīng)濟的迅猛發(fā)展,各方面數(shù)據(jù)信息量逐漸增多,百姓在辦事時,經(jīng)常會浪費很多的時間,于是人們對于很多政府部門的辦事效率提出了新的要求,應(yīng)人們的生活需求,大數(shù)據(jù)技術(shù)開始得以運營而生,該項技術(shù)的使用大大提升了人們的工作效率,由于大數(shù)據(jù)帶來的便利,帶動了人們向著大數(shù)據(jù)更深的領(lǐng)域進行挖掘。本文簡單介紹了大數(shù)據(jù)技術(shù)并分析了檔案數(shù)據(jù)挖掘技術(shù)以及大數(shù)據(jù)下的檔案數(shù)據(jù)挖掘,希望能夠為相關(guān)領(lǐng)域做出一定的貢獻。
一、“大數(shù)據(jù)技術(shù)”的簡單介紹
大數(shù)據(jù),是最近新興一門技術(shù),各方面還不健全,當(dāng)然有自身的特點。主要包括以下幾個方面:(1)大數(shù)據(jù)顧名思義就是以數(shù)據(jù)量大而著稱,因此,信息量大就是其中一個特征,在整個數(shù)據(jù)庫中,信息技術(shù)員通過對大量數(shù)據(jù)進行搜集,并進行合理的整理,當(dāng)使用時能夠迅速搜集到。(2)大數(shù)據(jù)所儲存的信息各種各樣的,包括領(lǐng)域很多,如交通信息、電力信息以及人們的日常生活檔案信息等等,都會根據(jù)應(yīng)用的領(lǐng)域進行保存。(3)大數(shù)據(jù)具備很高的應(yīng)用價值。目前,各行各業(yè)的數(shù)據(jù)信息越來越多,利用傳統(tǒng)信息管理方式需要浪費大量的人力物力和財力,而且浪費時間,通過大數(shù)據(jù),能夠有效的解決信息量巨大的問題。(4)使用大數(shù)據(jù),提高了辦事員的工作效率。當(dāng)確定所需要的信息,只要在數(shù)據(jù)庫中進行檢索,就會快速獲取所需要的信息。
二、檔案數(shù)據(jù)挖掘技術(shù)
1.檔案數(shù)據(jù)挖掘技術(shù)基本概念。
在日常的信息檢索和整合處理的時候,管理檔案的技術(shù)工作人員會采用一些較為特殊的技術(shù)手段進行處理,這種特殊的數(shù)據(jù)處理方式就是我們所說的檔案數(shù)據(jù)挖掘技術(shù)。在傳統(tǒng)的信息檢索處理中,檔案管理工作人員往往需要花費很多的時間和精力才能在眾多的數(shù)據(jù)庫當(dāng)中挑選出合適的數(shù)據(jù)信息。數(shù)據(jù)時代的到來給人們的生活帶來了無限的便利條件,當(dāng)前,檔案管理技術(shù)工人可以利用數(shù)據(jù)挖掘技術(shù)處理日常的工作,大大提高了工作效率,拓寬了檔案數(shù)據(jù)挖掘技術(shù)的應(yīng)用空間。
2.檔案數(shù)據(jù)挖掘技術(shù)的特點。
一般來說,在大數(shù)據(jù)時代下的檔案數(shù)據(jù)挖掘技術(shù)相對十分復(fù)雜,它雖然在一定程度上改善了傳統(tǒng)檔案數(shù)據(jù)檢索中常常遇到的問題和困難,但還需要建立合適的數(shù)學(xué)模型。沒有合適的數(shù)據(jù)數(shù)學(xué)模型,檔案技術(shù)人員很難進行下一步的工作,也就無法對數(shù)據(jù)進行相應(yīng)的處理。另外,對于檔案數(shù)據(jù)挖掘技術(shù)來說,它所使用的數(shù)據(jù)庫十分龐大,這在無形中增加了出現(xiàn)微小錯誤的可能性,這種錯誤雖然不影響最終的處理結(jié)果,但還是不能保證十全十美。最后,相比于原有的檔案數(shù)據(jù)處理技術(shù),檔案數(shù)據(jù)挖掘技術(shù)更加人性化,它可以從用戶的角度出發(fā),最大限度地滿足用戶的根本需求。
三、大型數(shù)據(jù)庫的檔案數(shù)據(jù)挖掘
1.關(guān)聯(lián)規(guī)則挖掘。
通過使用關(guān)聯(lián)規(guī)則挖掘,可以將同一用戶的不同領(lǐng)域的信息進行關(guān)聯(lián)整合,并通過整合后的信息對該用戶的需求進行預(yù)測。具有十分重要的意義。對能夠有效的幫助工作人員管理檔案。此外,對于企業(yè)而言,能夠率先了解客戶的需求,負責(zé)檔案管理的員工就可以提前準備,解決客戶時間,提供更好地服務(wù)。
2.實現(xiàn)了檔案數(shù)據(jù)采集層的優(yōu)化管理。
在檔案管理方面應(yīng)用大數(shù)據(jù)技術(shù),可以大大提高工作效率。在進行檔案管理時,首先要搜集信息資料。只有通過大數(shù)據(jù)技術(shù),才可能確保所收集的資料的齊全,減少在后期處理中出現(xiàn)問題。此外,在對檔案數(shù)據(jù)進行收集整理時,能夠根據(jù)具體的情況篩選檔案材料,通過這種方式,可以留存原有的數(shù)據(jù),如果在后期管理過程中發(fā)生錯誤,可以進行查找。
四、結(jié)束語
隨著科學(xué)技術(shù)的不斷發(fā)展,逐漸發(fā)展成為了信息時代,傳統(tǒng)數(shù)據(jù)處理方式已經(jīng)漸漸不能滿足人們的生活需求,大數(shù)據(jù)技術(shù)得以運應(yīng)而生,大數(shù)據(jù)的發(fā)展為人們的生活帶來了很多便利,為檔案的管理工作帶來了很多優(yōu)勢,節(jié)省了大量的時間。但是,從另一角度說,大數(shù)據(jù)由于是新開發(fā)的技術(shù),在各方面還存在很多的缺陷和不足,還需要人們?nèi)ネ诰蚝吞剿?,只有不斷的完善,才能夠更好地為百姓服?wù),才能更有助于我國經(jīng)濟的發(fā)展。
參考文獻
[1]于英香,周明浩,李子奇.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015,12(02):4-8.
[2]王雅潔,楊冰,羅艷,等.大數(shù)據(jù)挖掘在食品安全風(fēng)險預(yù)警領(lǐng)域的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2015,09(08):332-334.
[3]周楓,郝志廣,張明宇.資源技術(shù)思維——大數(shù)據(jù)時代檔案館的三維詮釋[J].檔案學(xué)研究,2013,12(06):61-64.