吳秀霞
摘 要:隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,檔案管理模式也發(fā)生了很大變化,傳統(tǒng)的檔案管理已經(jīng)不能滿足日益增長(zhǎng)的信息需求,需要采用新型的檔案管理方法。數(shù)據(jù)挖掘技術(shù)是一種能夠在繁雜的信息中快速提取出有用信息的技術(shù),將這種技術(shù)運(yùn)用到檔案管理中具有重要的意義。本文主要分析了數(shù)據(jù)挖掘技術(shù),分析了它在檔案管理中的應(yīng)用等,希望能為檔案管理的發(fā)展提供一定幫助。
關(guān)鍵詞:檔案管理 數(shù)據(jù)挖掘技術(shù) 分析應(yīng)用
隨著社會(huì)的發(fā)展,計(jì)算機(jī)技術(shù)有了很大提升,它在各個(gè)行業(yè)的應(yīng)用非常廣泛,數(shù)據(jù)庫(kù)作為辦公的一項(xiàng)重要工具,能給人們的工作帶來(lái)巨大幫助,但是由于人們知識(shí)的貧乏,可能會(huì)給人們的生活帶來(lái)一定的困擾,大量的數(shù)據(jù)使人們不能有效地提取中有用的信息。檔案信息是一項(xiàng)巨大的數(shù)據(jù)庫(kù),傳統(tǒng)的檔案管理模式不能處理大量的數(shù)據(jù)信息,不能滿足當(dāng)前檔案信息的時(shí)效性和系統(tǒng)性要求,因此很有必要對(duì)傳統(tǒng)的管理模式進(jìn)行改進(jìn),以更好的處理檔案信息。數(shù)據(jù)挖掘技術(shù)能夠很好解決這個(gè)問(wèn)題,將這項(xiàng)技術(shù)運(yùn)用到檔案管理中,能大大提高檔案管理的效率,推動(dòng)著社會(huì)的快速發(fā)展。
一、數(shù)據(jù)挖掘分析
1.數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘就是挖掘有價(jià)值信息的一種方法。它是在大量、模糊、有噪聲、隨機(jī)的應(yīng)用數(shù)據(jù)中挖掘出人們感興趣的數(shù)據(jù)信息,通常這些數(shù)據(jù)都是隱諱的、未知的。數(shù)據(jù)挖掘技術(shù)是在計(jì)算機(jī)技術(shù)的快速發(fā)展條件下發(fā)展的,它主要利用統(tǒng)計(jì)學(xué)、人工智能、自動(dòng)化等技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析,做出合理的歸納總結(jié),得到人們需要數(shù)據(jù)信息,幫助人們解決問(wèn)題。數(shù)據(jù)挖掘是在數(shù)據(jù)集中提取出新穎的、潛在的、有用的、易被人們理解的數(shù)據(jù)管理模式,將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理中,能夠充分發(fā)揮它的作用,達(dá)到良好的檔案管理效果。
2.數(shù)據(jù)挖掘的分析。在使用數(shù)據(jù)挖掘技術(shù)分析時(shí),數(shù)據(jù)挖掘的方法是不相同的,常用的數(shù)據(jù)挖掘方法有以下幾種。第一,分類分析。根據(jù)數(shù)據(jù)集合的特征,分析相關(guān)程序的數(shù)據(jù)庫(kù),找出所需要的模型,以幫助識(shí)別未知的數(shù)據(jù)。第二,關(guān)聯(lián)分析。在已知的數(shù)據(jù)集合中找出頻繁出現(xiàn)的數(shù)據(jù)集,根據(jù)事物的描寫特點(diǎn),從中得出一類相同屬性事物的特征。第三,序列分析。這種分析方法是通過(guò)分析數(shù)據(jù)的前因后果判斷數(shù)據(jù)間的聯(lián)系。第四,聚類分析。在給定的數(shù)據(jù)中找尋數(shù)據(jù)對(duì)象的價(jià)值聯(lián)系,從而制定相應(yīng)的管理方案。第五,粗糙集分析。它主要針對(duì)不確定、不精確的數(shù)據(jù),這種分析方法不需要知道相應(yīng)的信息,并且算法比較簡(jiǎn)單。它能夠在一系列的數(shù)據(jù)中快速找到他們之間的關(guān)系,并經(jīng)過(guò)歸納總結(jié),得到相應(yīng)的決策表,以便于用戶使用。
二、檔案管理方面的數(shù)據(jù)挖掘的重要性
數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)處理方面有著非常明顯的優(yōu)勢(shì),傳統(tǒng)的檔案管理已經(jīng)不能滿足與日俱增的檔案信息量的發(fā)展,需要開(kāi)發(fā)新的檔案管理方法,保證檔案管理能順利進(jìn)行。首先,將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理中,能大大提高檔案內(nèi)容的安全和保存質(zhì)量。檔案信息是一個(gè)人的隱私和過(guò)去,保證檔案的安全,才能有效保護(hù)相關(guān)人員的隱私。并且還能促進(jìn)檔案的保存質(zhì)量。運(yùn)用數(shù)據(jù)挖掘技術(shù)能對(duì)檔案信息進(jìn)行實(shí)施分析統(tǒng)計(jì),及時(shí)防范不良行為,有效保護(hù)檔案信息的安全。其次,數(shù)據(jù)挖掘技術(shù)能及時(shí)將檔案信息進(jìn)行收集和編碼,發(fā)現(xiàn)數(shù)據(jù)中潛在的信息,提高檔案利用的服務(wù)水平,增強(qiáng)檔案的保密性。第三,數(shù)據(jù)挖掘技術(shù)能降低檔案的保管成本,加強(qiáng)檔案的鑒定水平,增強(qiáng)檔案的真實(shí)度,根據(jù)檔案的特點(diǎn)和規(guī)律,抓住檔案管理的重點(diǎn),實(shí)現(xiàn)檔案的整體管理。
三、檔案管理方面的數(shù)據(jù)挖掘應(yīng)用
1.檔案信息的收集。在檔案管理時(shí),第一步就是進(jìn)行檔案信息的收集和分析,對(duì)收集到的數(shù)據(jù)信息合理描述,建立數(shù)據(jù)集有關(guān)的模型或者數(shù)據(jù)類型,將這個(gè)模型或者數(shù)據(jù)類型同樣本進(jìn)行對(duì)比,如果準(zhǔn)確性比較高,則可以將其作位相應(yīng)的標(biāo)準(zhǔn)來(lái)對(duì)數(shù)據(jù)進(jìn)行分類,因此檔案信息的收集是最基礎(chǔ)的階段。將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案信息的收集中,能夠快速建立模型,為檔案信息的分類和整合奠定一定的基礎(chǔ)。當(dāng)在檔案館的網(wǎng)頁(yè)上發(fā)布調(diào)查問(wèn)卷時(shí),將調(diào)查問(wèn)卷得到的相應(yīng)數(shù)據(jù)同數(shù)據(jù)庫(kù)聯(lián)系起來(lái),這樣數(shù)據(jù)庫(kù)中就會(huì)存在使用者的姓名、性別、學(xué)歷、職業(yè)等個(gè)人信息,并對(duì)使用者的信息進(jìn)行描述,決定使用者的類型和需要提供的相應(yīng)服務(wù),為使用者檔案的建立、預(yù)測(cè)和分類提供個(gè)性化服務(wù)奠定基礎(chǔ)。
2.檔案信息的分類。數(shù)據(jù)挖掘技術(shù)能迅速將數(shù)據(jù)庫(kù)的信息根據(jù)不同的屬性特點(diǎn)進(jìn)行分類,將數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理中,能迅速尋找出所需要的檔案信息。數(shù)據(jù)挖掘技術(shù)在進(jìn)行檔案信息分類時(shí),根據(jù)數(shù)據(jù)訓(xùn)練集,建立數(shù)據(jù)的分類模型,進(jìn)而對(duì)數(shù)據(jù)進(jìn)行分類。在檔案管理時(shí),能根據(jù)用戶的相關(guān)信息,查找出用戶的原始信息,然后通過(guò)歸納總結(jié)得出使用者的特征。如在使用者訪問(wèn)檔案館的網(wǎng)頁(yè)時(shí),數(shù)據(jù)挖掘技術(shù)能根據(jù)使用者的搜尋信息,自動(dòng)保存使用的身份信息和搜索信息,如使用者的姓名、性別、年齡、興趣愛(ài)好等,進(jìn)而對(duì)訪問(wèn)者進(jìn)行信息分類,根據(jù)搜索的內(nèi)容、時(shí)間、下載次數(shù)等得出使用者的偏好??偟膩?lái)說(shuō),能通過(guò)使用者訪問(wèn)檔案館的網(wǎng)頁(yè)信息,對(duì)使用者的偏好和特征進(jìn)行分類,對(duì)使用者的需求進(jìn)行預(yù)測(cè),進(jìn)而能更加準(zhǔn)確快速的為使用者提供個(gè)性化的服務(wù),還能顯著提升檔案管理的效率。
3.檔案信息的整合。為了能使檔案充分發(fā)揮其作用,需要對(duì)檔案信息進(jìn)行整合。在檔案信息整合時(shí)要充分利用信息化技術(shù),將“死檔案”開(kāi)發(fā)成為“活檔案”,發(fā)揮檔案管理人員的參與和效益意識(shí),提供良好的檔案信息。如在對(duì)高效的教學(xué)質(zhì)量進(jìn)行評(píng)估時(shí),高校的檔案部門應(yīng)該將相關(guān)的檔案資源進(jìn)行提前收集,并進(jìn)行展覽,展示學(xué)校的教學(xué)水平和科研成果,使檔案資源充分發(fā)揮作用。這就需要對(duì)檔案信息進(jìn)行整合,將檔案數(shù)據(jù)進(jìn)行總結(jié)和規(guī)劃,根據(jù)數(shù)據(jù)之間的聯(lián)系確定相互之間的關(guān)聯(lián),然后建立統(tǒng)一的信息平臺(tái),將這些信息進(jìn)行整合,這樣能大大提高檔案管理的效率。如可以將教師的獎(jiǎng)項(xiàng)和職稱關(guān)聯(lián),將今年和去年的獎(jiǎng)項(xiàng)關(guān)聯(lián),這樣通過(guò)檢索關(guān)鍵詞就能迅速查找出相應(yīng)的信息,發(fā)揮檔案的作用。因此數(shù)據(jù)挖掘技術(shù)能使將檔案信息進(jìn)行全面、完整、統(tǒng)一的整合,為使用者提供最有價(jià)值的檔案信息。
四、結(jié)語(yǔ)
綜上所述,隨著信息化技術(shù)的快速發(fā)展,將計(jì)算機(jī)技術(shù)運(yùn)用到檔案管理中具有非常重要的意義,可以提高檔案信息的需求量和實(shí)效性。數(shù)據(jù)挖掘技術(shù)運(yùn)用到檔案管理中,能對(duì)檔案信息進(jìn)行收集、分類和整合,大大提高檔案信息的搜索速度,迅速找到使用者搜索的檔案信息重點(diǎn),挖掘檔案管理人員和檔案實(shí)體、檔案內(nèi)容之間的聯(lián)系,進(jìn)而根據(jù)使用者對(duì)檔案信息的需求,快速尋找到他們最需要的檔案信息,為他們提供實(shí)時(shí)的、迅速的個(gè)性化服務(wù)。
參考文獻(xiàn):
[1]黃華. 數(shù)據(jù)挖掘分析在檔案管理方面的應(yīng)用[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2009,04:81-82+76.
[2]魏俊強(qiáng). 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用[A]. 《建筑科技與管理》組委會(huì).2015年8月建筑科技與管理學(xué)術(shù)交流會(huì)論文集[C].《建筑科技與管理》組委會(huì):,2015:2.
[3]張清盛,仉琦. 讓案卷檔案管理走進(jìn)大數(shù)據(jù)時(shí)代[A]. .中國(guó)煙草學(xué)會(huì)2015年度優(yōu)秀論文匯編[C].:,2015:8.
[4]王曉燕. 數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用[J]. 蘭臺(tái)世界,2012,23:25-26.
[5]杜星. 檔案信息管理和服務(wù)中的數(shù)據(jù)挖掘技術(shù)及應(yīng)用分析[J]. 蘭臺(tái)內(nèi)外,2012,04:32.