楊鴻華
摘要:檔案管理工作在信息技術(shù)的推動(dòng)下獲得了快速發(fā)展,將數(shù)據(jù)挖掘技術(shù)引入到檔案管理系統(tǒng)中是實(shí)現(xiàn)檔案管理目標(biāo)和提升檔案管理價(jià)值的必然要求,本文在介紹了數(shù)據(jù)挖掘技術(shù)及其與檔案管理工作關(guān)系的基礎(chǔ)上,重點(diǎn)從檔案分類、檔案收集、檔案保管三個(gè)方面研究了數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用。
關(guān)鍵詞:檔案管理系統(tǒng);數(shù)據(jù)挖掘技術(shù);應(yīng)用
1引言
信息時(shí)代背景下的檔案管理模式不斷受到網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)信息技術(shù)發(fā)展的沖擊和挑戰(zhàn),人們對信息需求具有多維性和及時(shí)性的特征,因此信息時(shí)代背景下的檔案管理模式和檔案管理系統(tǒng)必須滿足人們不斷增長的海量信息需求以及最大程度上縮短信息獲取的等待時(shí)間,實(shí)踐表明將數(shù)據(jù)挖掘技術(shù)引入到檔案管理系統(tǒng)中具有非常重要的作用和價(jià)值。
2數(shù)據(jù)挖掘技術(shù)及其應(yīng)用概述
數(shù)據(jù)挖掘技術(shù)是伴隨著信息技術(shù)的革新和人工智能的發(fā)展而得到廣泛應(yīng)用和不斷發(fā)展的一項(xiàng)技術(shù),目前其已經(jīng)在包括檔案管理系統(tǒng)在內(nèi)的廣大領(lǐng)域中得到了廣泛而深入的應(yīng)用,伴隨著數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用,相關(guān)的檔案信息收集、數(shù)據(jù)處理、數(shù)據(jù)利用的速度和質(zhì)量都得到了大幅度提高,大大地推動(dòng)了檔案管理事業(yè)的發(fā)展。
數(shù)據(jù)挖掘技術(shù)通常使用分類法、關(guān)聯(lián)法、粗糙集法等對采集的數(shù)據(jù)進(jìn)行多維度分析整合,從而得到隱藏其中的知識(shí)、規(guī)律和模式,決策者基于數(shù)據(jù)挖掘的結(jié)果進(jìn)行決策可以顯著提高決策的科學(xué)性、準(zhǔn)確性和針對性,提高對未來行為和事情的預(yù)見性。
在使用數(shù)據(jù)挖掘技術(shù)之前,必須有可供挖掘的大量數(shù)據(jù)存在,只有滿足這個(gè)前提才能使用相關(guān)的方法對數(shù)據(jù)進(jìn)行分析、整理從而得到相應(yīng)的結(jié)果,數(shù)據(jù)挖掘后得到的結(jié)果可以在過程控制、信息管理、數(shù)據(jù)維護(hù)、查詢優(yōu)化、決策分析等方面得到廣泛的應(yīng)用。數(shù)據(jù)挖掘技術(shù)及其應(yīng)用同時(shí)又是一個(gè)跨學(xué)科的技術(shù),其與人工智能技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)據(jù)倉庫技術(shù)和統(tǒng)計(jì)學(xué)方法理論等緊密相連,同時(shí)數(shù)據(jù)挖掘技術(shù)中還會(huì)大量應(yīng)用到遺傳算法、神經(jīng)網(wǎng)絡(luò)等技術(shù)。
3檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用不僅是信息時(shí)代背景下檔案管理工作的客觀要求,同時(shí)也是新時(shí)代背景下實(shí)現(xiàn)檔案管理價(jià)值的重要方法和途徑。歸納綜合起來檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用主要體現(xiàn)在以下幾個(gè)方面:
3.1檔案分類中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
檔案分類是檔案管理的基礎(chǔ)工作,數(shù)據(jù)挖掘技術(shù)的決策樹算法可以依據(jù)一定的規(guī)則將不同種類不同屬性的檔案快速區(qū)分開來,對符合一定規(guī)則和屬性的檔案進(jìn)行歸整,大大提高檔案管理員的歸類速度,提高檔案檢索速度和效率。檔案分類中數(shù)據(jù)挖掘技術(shù)的具體工作流程為:在眾多具有不同特征的數(shù)據(jù)集中挑選出訓(xùn)練集,訓(xùn)練集是指已經(jīng)完成分類工作的數(shù)據(jù)集,基于此訓(xùn)練集構(gòu)建符合既定規(guī)則的分類模型,然后將該分類模型應(yīng)用到?jīng)]有完成分類工作的訓(xùn)練集,這種檔案分類可以幫助檔案管理者對信息用戶的特點(diǎn)和行為進(jìn)行分類總結(jié),并可以根據(jù)其個(gè)人愛好定制和推薦用戶感興趣的信息,諸如基于用戶的職業(yè)、性別、學(xué)歷、愛好以及瀏覽習(xí)慣等信息分析和推斷出用戶的偏好,這種基于數(shù)據(jù)挖掘的差異化和個(gè)性化分析可以幫助用戶提高獲取有效信息的速度,從而提高檔案管理的有效性和價(jià)值水平。值得注意的是要在檔案分類中正確使用決策樹算法要處理好分裂屬性的選擇和訓(xùn)練數(shù)據(jù)分類的有效性。
3.2檔案收集中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
檔案收集中數(shù)據(jù)挖掘技術(shù)的應(yīng)用主要是基于數(shù)據(jù)庫內(nèi)的數(shù)據(jù)描述來構(gòu)建數(shù)據(jù)模型,將數(shù)據(jù)樣本與數(shù)據(jù)模型進(jìn)行對比并找出差異,如果發(fā)現(xiàn)測試樣本模型與構(gòu)建的數(shù)據(jù)模型相吻合,那么就按照測試樣本模型的分類方法對事務(wù)進(jìn)行分類。檔案收集中數(shù)據(jù)挖掘技術(shù)的應(yīng)用要求對檔案信息庫進(jìn)行全面分析和綜合測度以得到科學(xué)的描述方案,并對已知概念模型和相關(guān)數(shù)據(jù)集進(jìn)行科學(xué)描述,然后將模型與測試樣本進(jìn)行比較來檢查模型的準(zhǔn)確程度,如果反復(fù)測試后模型表現(xiàn)出較高的準(zhǔn)確性,那么就將該模型作為標(biāo)準(zhǔn)模型,這是檔案管理個(gè)性化功能實(shí)現(xiàn)的基礎(chǔ)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到檔案收集中可以提高檔案收集工作的有效性,從而為后續(xù)的檔案分類和檔案信息預(yù)測工作創(chuàng)造良好的前提條件,這也是檔案管理個(gè)性化和功能定制化得以實(shí)現(xiàn)的重要保障。
3.3檔案保管中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
檔案保管的目的是保留用戶的檔案信息防止檔案流失。對于企業(yè)來說留住老員工的成本遠(yuǎn)遠(yuǎn)要比重新聘用新員工的成本要低,研究和保管老員工的檔案信息是留住老員工手段的重要方法之一,通過對老員工檔案流失記錄的分析、挖掘和整合,從中可以發(fā)現(xiàn)導(dǎo)致員工流失的原因并及時(shí)地采取補(bǔ)救措施,這在現(xiàn)代企業(yè)人力資源檔案管理中具有十分重要的地位,國內(nèi)外許多大公司已經(jīng)率先應(yīng)用并取得了一定的成績。檔案管理活動(dòng)的目標(biāo)是為了滿足管理者對于檔案信息的需求,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到檔案日常保管管理中可以提高檔案工作的效率和效能,同時(shí)也可以將檔案管理工作與人力資源管理工作緊密結(jié)合起來。
4 結(jié)論
數(shù)據(jù)挖掘技術(shù)是現(xiàn)代信息化技術(shù)的重要領(lǐng)域,也是人工智能(AI)和商務(wù)智能(BI)領(lǐng)域的重要支撐技術(shù),具有重要的實(shí)際應(yīng)用價(jià)值和發(fā)展前景。檔案管理系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,大幅度地提升了檔案管理工作的效率和檔案信息查詢檢索的速度,隨著檔案管理現(xiàn)代化的不斷推薦、新的需求不斷提出以及計(jì)算機(jī)技術(shù)的發(fā)展,因此有必要進(jìn)一步加強(qiáng)檔案管理工作中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,從而有效快捷地實(shí)現(xiàn)檔案管理的現(xiàn)代化。
參考文獻(xiàn):
[1]於立勇.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用在檔案信息管理系統(tǒng)中的探討[J].電腦知識(shí)與技術(shù),2012(02).
[2]黃華.數(shù)據(jù)挖掘分析在檔案管理方面的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2009(04).
[3]周碧珍.淺析計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案信息管理系統(tǒng)中的應(yīng)用[J].黑龍江科技信息,2009(01).
[4]彭皖民.基于用戶檔案管理的數(shù)據(jù)挖掘分析[J].河南科技, 2008(04).endprint