黃順杰 海南熱帶海洋學(xué)院
計算機挖掘技術(shù)能夠通過統(tǒng)計、分析和檢索,對信息數(shù)據(jù)進(jìn)行科學(xué)管理,利用了統(tǒng)計學(xué)的抽樣法和計算機的人工智能技術(shù),可以對數(shù)據(jù)信息進(jìn)行整理、分析和歸納。能夠在人們需要信息時,為人們提供技術(shù)依據(jù),幫助人們在龐大的數(shù)據(jù)信息庫中,尋找到準(zhǔn)確、有效的信息。
計算機數(shù)據(jù)挖掘技術(shù)擁有兩種形式,一種形式是描述型,通過對數(shù)據(jù)信息所擁有的共性規(guī)律進(jìn)行描述,找出數(shù)據(jù)信息中具有標(biāo)志性和普標(biāo)性的信息,并對其進(jìn)行描述,從而提供這一類型的數(shù)據(jù)信息特征和規(guī)律。另一種是預(yù)測性,通過對已知數(shù)據(jù)信息的分析,推測另一類數(shù)據(jù)信息特征和規(guī)律。
計算機數(shù)據(jù)挖掘技術(shù)的工作方法有三種,一種是分類法,這是計算機數(shù)據(jù)挖掘技術(shù)最常見的形式。通過對數(shù)據(jù)信息進(jìn)行分析,將其進(jìn)行歸類,并根據(jù)分類決定數(shù)據(jù)的等級,對部分?jǐn)?shù)據(jù)進(jìn)行處理和分析,將剩下的數(shù)據(jù)進(jìn)行測試和檢驗,達(dá)標(biāo)后再進(jìn)行歸類。第二種是關(guān)聯(lián)法,它是計算機數(shù)據(jù)挖掘技術(shù)中,最簡便和使用的方法。對數(shù)據(jù)信息進(jìn)行分析,并將其準(zhǔn)確的描述。第三種是粗糙集,粗糙集能夠應(yīng)對不具有穩(wěn)定性的數(shù)據(jù)信息內(nèi)容,能夠在沒有提供多余信息的情況下,進(jìn)行簡潔的算法。
運用計算機數(shù)據(jù)挖掘技術(shù),對檔案信息進(jìn)行收集和整理,利用技術(shù)構(gòu)建完整的數(shù)據(jù)信息庫,將檔案數(shù)據(jù)信息錄入到計算機數(shù)據(jù)庫中,并對數(shù)據(jù)信息進(jìn)行有效的分析和整理,提取信息的主要特征和規(guī)律。通過計算機數(shù)據(jù)信息庫的建立,能夠在檔案信息管理的整理環(huán)節(jié),起到重要的簡化作用,只需要利用計算機數(shù)據(jù)挖掘技術(shù),對信息進(jìn)行準(zhǔn)確的錄入,就可以實現(xiàn)檔案信息的管理,無需大量的耗費人工和時間,充分的提高了檔案信息的整理時間和準(zhǔn)確度。
檔案信息價值鑒定管理,是信息整理環(huán)節(jié)中的一項內(nèi)容,需要對檔案信息進(jìn)行有效的分析,將檔案信息的價值進(jìn)行分級,利用檔案信息的級別,可以將信息按照價值、重要程度以及詳細(xì)程度進(jìn)行分類、分級。提高檔案信息的質(zhì)量,優(yōu)化檔案信息管理,并能通過價值鑒定,對檔案信息進(jìn)行科學(xué)、合理的分配。
檔案信息管理的歸類環(huán)節(jié),在檔案信息管理中有著重要的地位和作用。在信息價值鑒定環(huán)節(jié)的基礎(chǔ)上,為檔案信息進(jìn)行更加細(xì)致的歸類。利用計算機數(shù)據(jù)挖掘技術(shù),可以快速、準(zhǔn)確的對信息進(jìn)行分析和劃分,對信息的主要特征和規(guī)律進(jìn)行提取,能夠根據(jù)實際進(jìn)行多種類別的劃分,比如就可以根據(jù)信息價值、信息涉及方面、信息時間等特征和規(guī)律進(jìn)行劃分。運用計算機數(shù)據(jù)挖掘技術(shù),能夠?qū)n案信息管理的正確性和穩(wěn)定性進(jìn)行提高,改變了人工檔案信息歸類,耗費時間并且準(zhǔn)確度不高的情況,通過對歸類環(huán)節(jié)的科學(xué)、嚴(yán)謹(jǐn)管理,能夠為接下來的檔案管理工作帶來幫助,并打下良好的基礎(chǔ)。
在通過計算機數(shù)據(jù)挖掘技術(shù),對檔案信息管理的整理和歸類后,為了方便查找和檢索檔案信息,要將檔案信息進(jìn)行編目,也就是給檔案信息編制目錄和標(biāo)引。
利用計算機數(shù)據(jù)挖掘技術(shù)所做出來的數(shù)據(jù)平臺,對所有的檔案信息進(jìn)行分類過后,將信息的特征和規(guī)律進(jìn)行總結(jié)和分析,將每個檔案信息的分類,做好主題標(biāo)引,比如想要查找園林設(shè)計方面的信息,就可以在數(shù)據(jù)庫中輸入園林設(shè)計。并按照人名、主題、分類等方式進(jìn)行編排,形成各種類型的全面目錄。
檔案信息具有著分散、量大、煩雜、固本等多種情況,在傳統(tǒng)的檔案信息管理中,大多是紙質(zhì)檔案信息,后來才出現(xiàn)了電子檔案信息。計算機數(shù)據(jù)挖掘技術(shù),將檔案信息的管理進(jìn)行了細(xì)化,并且強化了管理,無論是紙質(zhì)還是電子,都能夠通過技術(shù)進(jìn)行有效的保存。對于紙質(zhì)檔案,可以進(jìn)行數(shù)據(jù)庫的歸檔、分類,運用原有的紙質(zhì)檔案保存方法,進(jìn)行保存,在通過數(shù)據(jù)信息庫,對檔案信息進(jìn)行保護(hù)和標(biāo)注。也可以將具有一定價值或者孤本的紙質(zhì)檔案信息進(jìn)行電子影印,將其上傳到云端或數(shù)據(jù)庫中,避免丟失和損壞。而電子檔案信息的保存,相對就簡單很多,通過上傳數(shù)據(jù)庫,可以復(fù)制和有效的保存信息,使信息能夠完整和準(zhǔn)確。計算機數(shù)據(jù)挖掘技術(shù)的出現(xiàn),極大的改變了原有的檔案信息結(jié)構(gòu)和內(nèi)容,提高了管理、查閱檔案信息的效率。
現(xiàn)代化信息技術(shù)的出現(xiàn),改變了人們的生活和工作方式與內(nèi)容,方便了人們的生活和工作,為檔案信息的現(xiàn)代化技術(shù)管理帶來了幫助,不僅提高了信息管理的效率與質(zhì)量,還能通過計算機挖掘技術(shù)將檔案信息進(jìn)行整理和分析,為檔案信息管提供技術(shù)支持。
[1]韓樹河.計算機數(shù)據(jù)挖掘技術(shù)及其在檔案信息管理系統(tǒng)中的應(yīng)用探討[J].電子科學(xué)技術(shù),2016,03(06):774-777.
[2]曾雪峰.計算機數(shù)據(jù)挖掘技術(shù)開發(fā)及其在檔案信息管理中的運用研究[J].科技創(chuàng)新與應(yīng)用,2016(09):285.