何晶
中圖分類號:D641 文獻(xiàn)標(biāo)識:A 文章編號:1674-1145(2018)8-235-01
摘要 隨著科技時代的進(jìn)步,數(shù)據(jù)種類不斷增加,原始的檔案查找和檢索方式的繁雜給人們帶來了很大的不便。為了解決這一現(xiàn)狀,大數(shù)據(jù)的檔案數(shù)據(jù)挖掘使出現(xiàn)在了人們的視野當(dāng)中,大數(shù)據(jù)的檔案數(shù)據(jù)挖掘的應(yīng)用為其提供了便利的技術(shù)手段,提高了工作人員對信息處理的速度和精確度。本文探討分析了大數(shù)據(jù)技術(shù)和檔案數(shù)據(jù)挖掘技術(shù),簡單介紹了其應(yīng)用現(xiàn)狀和前景。
關(guān)鍵詞 大數(shù)據(jù)技術(shù) 檔案數(shù)據(jù) 數(shù)據(jù)挖掘
一、大數(shù)據(jù)技術(shù)
(一)大數(shù)據(jù)的簡介
隨著信息時代的到來,互聯(lián)網(wǎng)的迅速發(fā)展,各種網(wǎng)絡(luò)信息充斥在我們的生活中,大數(shù)據(jù)技術(shù)漸漸的出現(xiàn)在人們的字典當(dāng)中,為大量數(shù)據(jù)的收集和處理等提供了很大的便利性。大數(shù)據(jù)對于世界中外的學(xué)者都沒有一個準(zhǔn)確的定義,它應(yīng)用于多種方面,不同的專家和學(xué)者對其分析的角度不同,得到的結(jié)論也不相同[1]。作為一種新興的技術(shù),大數(shù)據(jù)在數(shù)據(jù)的整合、數(shù)學(xué)模型的構(gòu)建以及接收和處理相關(guān)信息和數(shù)據(jù)方面有著得天獨厚的優(yōu)勢,極大的方便了人們對于信息和數(shù)據(jù)的處理,提高了工作效率。
(二)大數(shù)據(jù)的特點
大數(shù)據(jù)技術(shù)作為一種新興技術(shù),特點十分鮮明。大數(shù)據(jù)中數(shù)據(jù)的信息量是十分龐大的,技術(shù)人員要將接收到的大量數(shù)據(jù)進(jìn)行分類歸納到相應(yīng)的數(shù)據(jù)庫中,包括商業(yè)信息,國防信息,互聯(lián)網(wǎng)信息,日常生活信息等等。這決定了大數(shù)據(jù)能夠很好的進(jìn)行相關(guān)信息的查詢,方便了人們對數(shù)據(jù)的使用和處理,具有很大的價值。除此之外,工作人員想要獲取些有用信息的時候,可以在數(shù)據(jù)庫系統(tǒng)中分類查找,便捷的找到所需信息和相關(guān)數(shù)據(jù),極大的提高了工作效率。
二、檔案數(shù)據(jù)挖掘技術(shù)
(一)檔案數(shù)據(jù)挖掘技術(shù)的介紹
在傳統(tǒng)的模式當(dāng)中,工作人員想要對檔案進(jìn)行管理需要投人大量的時間和精力從數(shù)據(jù)庫中獲取合適有用的信息。信息時代的到來,檔案數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為其提供了很大的便利,在對相關(guān)數(shù)據(jù)查找和分類的過程中,相關(guān)的技術(shù)人員通過這種技術(shù)能夠高效的進(jìn)行信息工作的檢索和處理。
(二)檔案數(shù)據(jù)挖掘技術(shù)的特征
檔案數(shù)據(jù)挖掘技術(shù)雖然能夠改變傳統(tǒng)模式下繁雜的信息檢索和分類處理等工作,但是它的使用比較復(fù)雜,必須進(jìn)行更大的改進(jìn)才能夠更好的滿足人們對信息處理高效性的要求。數(shù)據(jù)模型能夠很大程度上改善這種技術(shù)的復(fù)雜性,方便工作人員更好的進(jìn)行信息數(shù)據(jù)的處理工作。除此之外,由于檔案數(shù)據(jù)挖掘技術(shù)所用的數(shù)據(jù)庫十分龐大,增大了出現(xiàn)錯誤的概率,有些較小的錯誤雖然不會對最后的信息處理結(jié)果產(chǎn)生影響,但是也產(chǎn)生了不小的瑕疵,還需要刊其進(jìn)行相應(yīng)的改進(jìn)。值得.提的是,檔案數(shù)據(jù)挖掘技術(shù)是從客戶的角度出發(fā),能夠最大程度的滿足客戶的需要,十分的人性化。
(三)檔案數(shù)據(jù)挖掘技術(shù)的使用
人們的生活與大數(shù)據(jù)息息相關(guān),檔案數(shù)據(jù)挖掘技術(shù)應(yīng)用也越來越廣泛。首先,針對不同用戶的不同需要,可以在檔案數(shù)據(jù)庫中對所需信息進(jìn)行查找和采集,使檔案數(shù)據(jù)處理更加個性化。其次,通過將不同用戶之間的信息相互關(guān)聯(lián),能夠通過所有用戶的查找情況進(jìn)來推斷出他們之間的有關(guān)聯(lián)系和工作等。比較重要的一點是檔案系統(tǒng)能夠自行將相似度較高的信息進(jìn)行歸納,然后存放在同一個檔案數(shù)據(jù)庫中,便于對信息的檢索和處理,極大的減少了檔案管理人員的工作量,減輕了工作人員的負(fù)擔(dān),提高了效率。
三、大數(shù)據(jù)技術(shù)和檔案數(shù)據(jù)深度挖掘結(jié)合下的影響
大數(shù)據(jù)技術(shù)能夠?qū)n案數(shù)據(jù)的采集層、整理層、分析層和展示層進(jìn)行有效管理,提高了對數(shù)據(jù)的各種處理效率。檔案管理需要對大量的數(shù)據(jù)進(jìn)行收集和處理,通過使用大數(shù)據(jù)技術(shù)能夠更高效的對檔案中的信息進(jìn)行處理,深度優(yōu)化了對檔案數(shù)據(jù)的采集管理,更加精確的完成所需數(shù)據(jù)的篩選;檔案進(jìn)行采集之后的整理過程也是十分復(fù)雜的,采用大數(shù)據(jù)技術(shù)能夠充分提高檔案數(shù)據(jù)的有效存儲的效率,并且可以防止整理時候出現(xiàn)的誤差導(dǎo)致丟失數(shù)據(jù),將困難繁雜的工作變得非常簡單容易操作,減少了工作人員的負(fù)擔(dān);檔案數(shù)據(jù)之間存在著種種聯(lián)系,并不是單獨存在的,工作人員需要對檔案數(shù)據(jù)逐一分析和管理,很難及時了解到他們之間的聯(lián)系,利用大數(shù)據(jù)技術(shù)可以通過挖掘數(shù)據(jù)隱藏的信息進(jìn)行分析和歸類,方便了工作人員的工作,為信息資源的共享提供了極大的便利性;工作人員利用大數(shù)據(jù)技術(shù)可以實現(xiàn)對數(shù)據(jù)的可視化處理,對檔案數(shù)據(jù)管理系統(tǒng)更好的改進(jìn)和補充。這樣也可以更加方便用戶對檔案數(shù)據(jù)的查詢,節(jié)省寶貴的時間,
四、結(jié)語
綜上所述,大數(shù)據(jù)時代為人們提供了更多的便利性,檔案數(shù)據(jù)挖掘技術(shù)在檔案管理中起到了重要的作用。檔案數(shù)據(jù)挖掘技術(shù)的應(yīng)用方便了數(shù)據(jù)的采集和處理。大型數(shù)據(jù)庫的檔案數(shù)據(jù)挖掘技術(shù)在實際應(yīng)用中也存在著一些問題,還需要不斷進(jìn)行改善和創(chuàng)新,更好的發(fā)揮作用。
參考文獻(xiàn):
[1]于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015(2):4-8.
[2]周楓.資源技術(shù)思維——大數(shù)據(jù)時代檔案館的三維診釋[J].檔案學(xué)研究,2013(6):61-64.
[3]張芳霖,唐霜.大姿側(cè)澹影響下檔案學(xué)發(fā)展趨勢的思考[J].北京檔案,2014(9):9-13.