邱大偉
社會(huì)的日益發(fā)展,促使各行業(yè)的管理工作趨于智能化,而大數(shù)據(jù)挖掘技術(shù)作為智能化管理的代表,將其應(yīng)用于經(jīng)濟(jì)檔案管理當(dāng)中,是極具可行性的。該技術(shù)的應(yīng)用,可促使檔案信息管理水平得到有效提升,檔案的管理效率也可大大提高。本文通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的介紹,并對(duì)其在經(jīng)濟(jì)檔案管理中的應(yīng)用意義進(jìn)行闡述,繼而提出具體的應(yīng)用策略,以期可為該技術(shù)在經(jīng)濟(jì)檔案管理中實(shí)現(xiàn)更好的應(yīng)用,起到一定的參考作用。
經(jīng)濟(jì)的快速發(fā)展,信息技術(shù)的日益提升,使得檔案管理模式受到巨大沖擊,若是經(jīng)濟(jì)檔案管理繼續(xù)延續(xù)以往的模式,必然會(huì)導(dǎo)致管理需求無(wú)法得到滿足,和時(shí)代發(fā)展的步伐也不相符合。
一、數(shù)據(jù)挖掘技術(shù)
科技發(fā)展愈發(fā)迅速,若要跟上新時(shí)代的發(fā)展需求,就不可繼續(xù)沿用傳統(tǒng)的數(shù)據(jù)收集模式。且出現(xiàn)數(shù)據(jù)挖掘技術(shù)之后,數(shù)據(jù)可實(shí)現(xiàn)快速收集,而精確度更高,這對(duì)于社會(huì)發(fā)展實(shí)則也可起到一定作用。
(一)數(shù)據(jù)挖掘技術(shù)的概念
數(shù)據(jù)挖掘技術(shù)實(shí)際上是從較為模糊的、眾多的、不完整的數(shù)據(jù)當(dāng)中,尋找出以往不了解、潛在的、但又具有效用的信息的過(guò)程。數(shù)據(jù)挖掘獲得的信息主要包含三個(gè)特征,分別是未知、實(shí)用、有效。決策者通過(guò)分析挖掘的信息,可提取出這些信息之間的潛在關(guān)系,進(jìn)而預(yù)測(cè)未來(lái)的行為。
(二)數(shù)據(jù)挖掘技術(shù)的運(yùn)用
數(shù)據(jù)挖掘技術(shù)應(yīng)用時(shí),時(shí)常都會(huì)應(yīng)用數(shù)學(xué)方法,但由于存在特殊狀況,所以也有一些方法為非數(shù)學(xué)的。同時(shí),在應(yīng)用時(shí)不單有上述這些方法,還有歸納法、演繹法等方法,這些也是極佳的數(shù)據(jù)收集法。數(shù)據(jù)挖掘技術(shù)可通過(guò)挖掘、收集與分析相關(guān)數(shù)據(jù),并得出所需的結(jié)果,且在某些情況之下,得出的結(jié)果恰巧可用于信息管理、數(shù)據(jù)維護(hù)、決策支持等方面。但因?yàn)槠浯嬖谝欢ǖ奶匦裕沟迷诰唧w使用時(shí)涉及的內(nèi)容非常廣泛,涉及了多個(gè)學(xué)科,也和數(shù)據(jù)庫(kù)、人工智能等領(lǐng)域相關(guān),常用的有可視化、遺傳算法、決策樹(shù)等技術(shù)。
二、數(shù)據(jù)挖掘技術(shù)的形式
數(shù)據(jù)挖掘主要有兩種形式。其中一種為描述型,主要是描述數(shù)據(jù)的規(guī)則,且結(jié)合數(shù)據(jù)的微觀性尋找有較高層次、表征的、較為宏觀的知識(shí),并通過(guò)總結(jié)數(shù)據(jù)的概念,對(duì)同類事物的屬性相似特征進(jìn)行描述。另一種為預(yù)測(cè)型,其是對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行分析與處理,進(jìn)而獲得某些屬性的具體內(nèi)容,或者對(duì)某些事物潛在的規(guī)律進(jìn)行預(yù)測(cè)等。在這兩種技術(shù)使用過(guò)程中,分類法、粗糙集法、相關(guān)規(guī)則法是相對(duì)應(yīng)用廣泛的方法,這些方法的介紹如下:
(一)分類
在數(shù)據(jù)挖掘技術(shù)應(yīng)用過(guò)程中,分類是其中非常關(guān)鍵的一部分。所收集的數(shù)據(jù)質(zhì)量高低,數(shù)據(jù)的屬性,都是取決于分類的。所以,在挖掘技術(shù)應(yīng)用時(shí)分類的作用是無(wú)法替代的,分類是分析數(shù)據(jù)庫(kù)的屬性,進(jìn)而進(jìn)行種類劃分的過(guò)程,對(duì)某些數(shù)據(jù)進(jìn)行集中處理與劃分,再測(cè)試剩下的那些數(shù)據(jù),在滿足測(cè)試要求之后,基于相關(guān)規(guī)則之上進(jìn)行分類。具體分類時(shí),較為典型的分類過(guò)程包含確定分類范圍、尋找目標(biāo)屬性、分類計(jì)算、驗(yàn)證分類規(guī)則等。
(二)相關(guān)規(guī)則
在數(shù)據(jù)挖掘技術(shù)當(dāng)中,相關(guān)規(guī)則是較為簡(jiǎn)單的關(guān)聯(lián)分析規(guī)則,其實(shí)用性也非常強(qiáng),能夠精準(zhǔn)描述相關(guān)數(shù)據(jù),且可以嚴(yán)格分析數(shù)據(jù)。使用相關(guān)規(guī)則時(shí),主要是在描述具體的事物,結(jié)合各事物的相關(guān)屬性,進(jìn)而進(jìn)行總結(jié),尋找共同屬性。正常情況下,會(huì)在數(shù)據(jù)庫(kù)當(dāng)中直接應(yīng)用關(guān)聯(lián)規(guī)則,將各事物獲得的數(shù)據(jù)全數(shù)記錄下來(lái)。其不僅可精準(zhǔn)記下數(shù)據(jù),且數(shù)據(jù)搜索的范圍也能夠消減,運(yùn)行系統(tǒng)也由此實(shí)現(xiàn)較好的改善,效率大幅提升。
(三)粗糙集
粗糙集為一種數(shù)學(xué)工具,主要是用于研究不確定的知識(shí)與不夠精準(zhǔn)的數(shù)據(jù),在系統(tǒng)使用過(guò)程中有著非常顯著的優(yōu)勢(shì)。首先,在粗糙集方法使用的過(guò)程中,無(wú)需了解相關(guān)信息,且運(yùn)算時(shí)較為容易控制,算法相對(duì)簡(jiǎn)單,因而大部分用戶對(duì)該方法都非常青睞。其次,在粗糙集運(yùn)行時(shí),可發(fā)現(xiàn)數(shù)據(jù)存在的異常之處,消除發(fā)現(xiàn)可用知識(shí)時(shí)存在的干擾因素,且可短時(shí)間快速尋找數(shù)據(jù)規(guī)律,并借助表格來(lái)整合歸納數(shù)據(jù),使其成為決策表,使用者在具體查詢時(shí)更為便捷高效。最后,客觀世界中某些規(guī)則的應(yīng)用,也極易有不確定性存在。數(shù)據(jù)庫(kù)的應(yīng)用會(huì)形成很多信息是難以確定的,這些信息要有效處理必須要通過(guò)粗糙集,如此才可大大提升數(shù)據(jù)挖掘的效率。
三、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)檔案管理中應(yīng)用的意義
檔案是極佳的歷史資料記錄手段,檔案管理者的工作成效可直接通過(guò)檔案來(lái)判定。計(jì)算機(jī)發(fā)展愈發(fā)迅速,給經(jīng)濟(jì)檔案管理帶來(lái)了巨大的機(jī)遇,經(jīng)濟(jì)檔案本就有著龐大的數(shù)據(jù)信息,管理難度相當(dāng)大,因而要提升管理水平,就必須充分利用挖掘技術(shù),對(duì)現(xiàn)有的管理模式進(jìn)行改革。所以,經(jīng)濟(jì)檔案管理過(guò)程中,數(shù)據(jù)挖掘技術(shù)是極具意義的應(yīng)用手段,具體的應(yīng)用意義主要從下述幾方面體現(xiàn)出來(lái):
(一)和智慧城市發(fā)展需求相符合
智慧城市的建設(shè),是社會(huì)面臨的極為關(guān)鍵的問(wèn)題,要順利建成,不單單應(yīng)加大科技研究力度,且應(yīng)結(jié)合不同地區(qū)的特征構(gòu)建與之相符合的智慧城市。智慧城市旨在對(duì)各行業(yè)的海量數(shù)據(jù)信息進(jìn)行整合與分析,結(jié)合處理的結(jié)果對(duì)城市今后的發(fā)展方向進(jìn)行預(yù)測(cè)。且通過(guò)了解某些領(lǐng)域的數(shù)據(jù),可使得我們對(duì)經(jīng)濟(jì)發(fā)展中出現(xiàn)的問(wèn)題有更為深入的了解,由此提前做好應(yīng)對(duì)措施。經(jīng)濟(jì)檔案管理工作和該理念恰巧極為契合,結(jié)合大數(shù)據(jù)挖掘技術(shù)的經(jīng)濟(jì)檔案管理工作,在某種程度上可助力智慧城市的建設(shè),通過(guò)大數(shù)據(jù)技術(shù)來(lái)整合與分類相關(guān)數(shù)據(jù)信息,可使得各領(lǐng)域的工作者快速尋找到自己所需的信息,如此對(duì)于檔案管理水平的提升非常有利,也更能體現(xiàn)出大數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)。
(二)和經(jīng)濟(jì)檔案管理信息化需求相符合
我國(guó)以往在進(jìn)行經(jīng)濟(jì)檔案管理時(shí),一般的數(shù)據(jù)儲(chǔ)存手段都是紙質(zhì)檔案。盡管對(duì)我國(guó)檔案管理工作來(lái)說(shuō),此方式確實(shí)有巨大貢獻(xiàn),但在新時(shí)代下若是一直繼續(xù)沿用此方式,而不做出相應(yīng)的改變,必然會(huì)引發(fā)諸多問(wèn)題,例如信息數(shù)據(jù)不斷增加,會(huì)導(dǎo)致工作人員查詢信息時(shí)較為困難,所需的信息查詢消耗的人力與物力都相當(dāng)大,這和檔案管理部門成立的初衷是相違背的。我們之所以應(yīng)進(jìn)行檔案管理,主要原因是能夠快速便捷地查詢信息,但紙質(zhì)檔案存儲(chǔ)時(shí)間并不長(zhǎng),人們的查詢需求難以得到滿足,且紙質(zhì)檔案極易丟失,這些都與檔案管理在新時(shí)代下的要求相悖。所以,經(jīng)濟(jì)檔案管理應(yīng)積極引入數(shù)據(jù)挖掘技術(shù),并高度重視該技術(shù)的應(yīng)用,如此來(lái)可構(gòu)建信息化管理系統(tǒng),為用戶們提供個(gè)性化的服務(wù),使其需求都可最大限度得到滿足。
(三)有利于經(jīng)濟(jì)檔案管理安全性的提升
經(jīng)濟(jì)檔案信息都是非常寶貴的,這些數(shù)據(jù)內(nèi)容可發(fā)揮的作用是無(wú)可厚非的。對(duì)于有歷史價(jià)值的檔案,能夠保存時(shí)間越長(zhǎng)自然是越好的,檔案價(jià)值才能夠更好地體現(xiàn)出來(lái),檔案管理者對(duì)此方面應(yīng)有正確認(rèn)知。只要提升使用價(jià)值后,檔案的使用頻率也會(huì)提升,進(jìn)而加大了保管難度,檔案信息也會(huì)因?yàn)槭褂么螖?shù)的增加而縮短壽命。與此同時(shí),在檔案信息管理中,保密性也是尤為重要的工作,若是信息被外泄,不僅隱私會(huì)被泄露,也極易給相關(guān)人員今后生活產(chǎn)生消極影響,導(dǎo)致檔案的保管和使用形成矛盾。在檔案管理當(dāng)中引入數(shù)據(jù)挖掘技術(shù),可使得該問(wèn)題得到較好的規(guī)避,為檔案信息提供更大的安全保障。
(四)有利于檔案管理效率的提升,縮減管理成本
將數(shù)據(jù)挖掘技術(shù)引入到經(jīng)濟(jì)檔案管理中,可使得傳統(tǒng)模式的不足得以有效彌補(bǔ),檔案管理人員也可在一定程度提升工作效率,管理水平也能夠得到提高。技術(shù)引入之后,工作人員可大大縮減管理時(shí)間,也能夠提升檔案處理速度,且有利于檔案鑒定。檔案鑒定是經(jīng)濟(jì)檔案管理尤為關(guān)鍵的環(huán)節(jié)之一,以往的鑒定工作都是管理人員憑著個(gè)人經(jīng)驗(yàn)進(jìn)行鑒定,得出的結(jié)果較為主觀。應(yīng)用挖掘技術(shù)之后,可規(guī)避檔案人員過(guò)于主觀而丟失了一些有價(jià)值的檔案的現(xiàn)象,提供了更具有效性的管理方法,檔案鑒定也可有相關(guān)依據(jù),進(jìn)而得出的鑒定結(jié)果也更為科學(xué)。
(五)有利于檔案信息使用效率的提升
檔案的價(jià)值要發(fā)揮,除了實(shí)現(xiàn)更高程度的共享,也應(yīng)規(guī)避一些機(jī)密性檔案的泄露,需要設(shè)置好權(quán)限,某些檔案只能部分人可以查閱。因?yàn)槟承┙栝喺邿o(wú)法將自身的需求清晰表達(dá)出來(lái),管理者也難以提供其真正所需的檔案信息,這種情況也會(huì)影響到檔案信息資源的利用。數(shù)據(jù)挖掘技術(shù)的應(yīng)用,可使得這些問(wèn)題得到有效解決,借閱者可自行檢索檔案信息,尋找到自身具體所需的信息,而管理者需要注意的是,應(yīng)對(duì)信息的搜索權(quán)限進(jìn)行設(shè)置,不能將全部信息都公開(kāi)借閱,避免機(jī)密檔案泄露。這種情況下,使用者的需求能夠得到更好滿足,檔案信息也可大幅提升使用效率。
四、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)檔案信息管理系統(tǒng)中的運(yùn)用
在信息技術(shù)快速發(fā)展的過(guò)程中,也應(yīng)提升經(jīng)濟(jì)檔案管理的效率。傳統(tǒng)的檔案管理方式盡管在從前可起到一定的效用,但在新時(shí)代下,此模式暴露出了很多問(wèn)題,導(dǎo)致諸多數(shù)據(jù)信息難以實(shí)現(xiàn)高效應(yīng)用。若要使得經(jīng)濟(jì)檔案數(shù)據(jù)能夠得到高效應(yīng)用,價(jià)值最大限度體現(xiàn)出來(lái),就應(yīng)通過(guò)數(shù)據(jù)挖掘技術(shù)來(lái)挖掘潛在的信息,并進(jìn)行總結(jié)與使用。數(shù)據(jù)挖掘技術(shù)引入到經(jīng)濟(jì)檔案信息管理中,可使得挖掘的信息能夠得到更好的應(yīng)用,目前該技術(shù)的應(yīng)用方法主要包含下述幾種:
(一)檔案分類法
檔案分類法是依據(jù)檔案的種類對(duì)其進(jìn)行科學(xué)分類的一種方法,主要是將檔案中具有相似屬性的信息劃分成同個(gè)類別,將不同屬性的檔案歸于不同的種類。對(duì)檔案分類時(shí),數(shù)據(jù)挖掘及時(shí)可將檔案種類進(jìn)行細(xì)分,促使管理者更好地對(duì)檔案進(jìn)行分類,進(jìn)而提升檔案的檢索速率。數(shù)據(jù)挖掘技術(shù)的應(yīng)用,通常是借助系統(tǒng)數(shù)據(jù)庫(kù)的功能,對(duì)全部對(duì)象進(jìn)行種類劃分的過(guò)程,而分類法的應(yīng)用可實(shí)現(xiàn)用戶短時(shí)間內(nèi)在海量信息中尋找到所需的數(shù)據(jù)內(nèi)容。而分類也可根據(jù)使用者特性進(jìn)行,例如在借助網(wǎng)絡(luò)進(jìn)行檔案系統(tǒng)訪問(wèn)時(shí),數(shù)據(jù)挖掘技術(shù)就會(huì)將使用者的訪問(wèn)詳情自動(dòng)記錄下來(lái),并根據(jù)其的個(gè)人情況來(lái)進(jìn)行分類。因使用者的喜好都有著一定差異,所以技術(shù)的應(yīng)用可更為精準(zhǔn)的挖掘用戶信息,為其推薦感興趣的內(nèi)容,進(jìn)而使得服務(wù)質(zhì)量得到有效提升。
(二)檔案收集法
檔案收集法是對(duì)數(shù)據(jù)庫(kù)現(xiàn)有數(shù)據(jù)進(jìn)行分析,接著再細(xì)致地描述這些數(shù)據(jù),基于此構(gòu)建相應(yīng)的模型,接著用建好的模型與測(cè)試樣本一一對(duì)比,若測(cè)試結(jié)果得出有模型與樣本符合,就可參考模型來(lái)進(jìn)行分類。檔案收集過(guò)程中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用,實(shí)則就是科學(xué)分析數(shù)據(jù)庫(kù)現(xiàn)有數(shù)據(jù),并構(gòu)建相應(yīng)的數(shù)據(jù)模型,繼而對(duì)比模型和測(cè)試樣本的差異性,若是測(cè)試過(guò)程中,發(fā)現(xiàn)兩者有相似的地方,就可依據(jù)模型分類來(lái)對(duì)管理對(duì)象進(jìn)行分類。數(shù)據(jù)挖掘技術(shù)應(yīng)對(duì)數(shù)據(jù)庫(kù)信息進(jìn)行科學(xué)分析,確保方案是切實(shí)合理的,進(jìn)而對(duì)數(shù)據(jù)模型進(jìn)行有效的描述,并實(shí)施對(duì)比測(cè)試,若是模型在經(jīng)過(guò)多次測(cè)試之后有較高的精準(zhǔn)度,就能夠依據(jù)該模式來(lái)科學(xué)分類各相關(guān)對(duì)象。信息收集是檔案管理工作當(dāng)中非?;A(chǔ)的工作,要實(shí)現(xiàn)檔案的個(gè)性化管理,就應(yīng)先做好收集工作,這是不可缺少的基礎(chǔ)。例如,檔案管理者將問(wèn)卷發(fā)布于網(wǎng)絡(luò)中,并將問(wèn)卷填寫的狀況記錄到數(shù)據(jù)庫(kù),通過(guò)填寫內(nèi)容對(duì)用戶進(jìn)行自行分類,明晰用戶的種類與實(shí)際需求,提升服務(wù)的針對(duì)性,使其達(dá)到更高的效率。
(三)檔案保留法
借助數(shù)據(jù)挖掘技術(shù)來(lái)詳細(xì)分析人員檔案流失的情況,進(jìn)而有針對(duì)性地采取方式,規(guī)避出現(xiàn)檔案流失的情況。不同的人員,對(duì)檔案也有著不同的使用需求,為確保各類人員需求都可以滿足,就應(yīng)進(jìn)行檔案分類。通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,經(jīng)濟(jì)檔案能夠進(jìn)行更為科學(xué)的分類,檢索的效率也可大幅提升,而通過(guò)挖掘檔案數(shù)據(jù),可對(duì)檔案使用者與管理者的關(guān)系進(jìn)行明晰,結(jié)合各人員的具體狀況為其提供所需的服務(wù),提升服務(wù)的針對(duì)性,使得人員獲得個(gè)性化服務(wù)之后,能夠快速查詢實(shí)際想要的經(jīng)濟(jì)檔案信息,也可能使得經(jīng)濟(jì)檔案的管理達(dá)到更高效率,相關(guān)管理者的工作壓力也能夠得到減輕。
結(jié) 語(yǔ)
經(jīng)濟(jì)檔案管理是尤為重要的工作,但以往的做法已不適合新時(shí)代,必須要對(duì)管理工作進(jìn)行創(chuàng)新,在創(chuàng)新過(guò)程中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用勢(shì)在必行。引入該技術(shù)之后,檔案管理模式能夠突破傳統(tǒng)的局限性,且為未來(lái)的檔案信息管理提供了良好的平臺(tái)和技術(shù)支持,是開(kāi)發(fā)信息化檔案管理系統(tǒng)必不可少的技術(shù)。