• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘

      2018-03-09 00:22:45李元鋒
      卷宗 2017年36期
      關(guān)鍵詞:大數(shù)據(jù)技術(shù)數(shù)據(jù)挖掘檔案管理

      李元鋒

      摘要:在大數(shù)據(jù)技術(shù)運(yùn)用在檔案管理的過程中,產(chǎn)生的最為顯著的特點(diǎn)是檔案數(shù)據(jù)的深度挖掘,這個顯著特點(diǎn)可以顯著的幫助檔案管理發(fā)生以下幾方面的改變:首先,檔案管理的流程更加精細(xì)化;其次,細(xì)致化的檔案資源和用戶的需求之間的雙向控制關(guān)系更進(jìn)一步。

      關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)挖掘;檔案管理

      1前言

      當(dāng)前的時代是一個信息化的時代,也是一個數(shù)據(jù)化的時代,數(shù)據(jù)挖掘技術(shù)在檔案管理過程中的運(yùn)用得到進(jìn)一步的加深。知識管理和知識的挖掘在很早之前就已經(jīng)在檔案界提出了,但是對知識挖掘的提出尚停留在概念的提出及初步理論的提出。已經(jīng)有大量的數(shù)據(jù)證明,從大數(shù)據(jù)中進(jìn)行知識的挖掘可以更加高效地解決數(shù)據(jù)與知識之間的鴻溝,這是許多檔案管理者認(rèn)為檔案館的傳統(tǒng)業(yè)務(wù)將發(fā)生向數(shù)據(jù)分析和數(shù)據(jù)挖掘方面的轉(zhuǎn)移,傳統(tǒng)的檔案信息服務(wù)底層將不再是進(jìn)行知識的簡單檢索,而是進(jìn)行智能化的深度數(shù)據(jù)挖掘。大數(shù)據(jù)時代的到來,給數(shù)據(jù)挖掘技術(shù)帶來的改變最為顯著的是為數(shù)據(jù)的深度挖掘提供了可能。對數(shù)據(jù)的深度挖掘過程中,不僅要注重?cái)?shù)據(jù)挖掘的深度和廣度,還要注重?cái)?shù)據(jù)的全面性、可靠性和價值等。

      2數(shù)據(jù)深度挖掘是大數(shù)據(jù)技術(shù)在檔案管理中的主要特點(diǎn)

      數(shù)據(jù)挖掘首先是對海量的數(shù)據(jù)進(jìn)行建模,然后通過建好的模型對企業(yè)的大量數(shù)據(jù)進(jìn)行整理和分析,從而幫助企業(yè)進(jìn)行數(shù)據(jù)進(jìn)行劃分,包括客戶的年齡段分析、市場分析、產(chǎn)品特征分析及技術(shù)手段分析等。對數(shù)據(jù)進(jìn)行深度挖掘,不僅是數(shù)據(jù)建立模型的過程,也是探索數(shù)據(jù)中規(guī)律的過程。比如,檔案管理人員在進(jìn)行檔案的編研選題過程中,不僅要深入調(diào)查用戶使用檔案數(shù)據(jù)過程中,使用的檔案調(diào)卷數(shù)量、檔案利用的次數(shù)、檔案的復(fù)制次數(shù)、檔案的制備數(shù)量等。此外,還要進(jìn)行用戶訪問記錄的深度挖掘,包括用戶檢索的關(guān)鍵詞、下載的記錄、用戶運(yùn)用網(wǎng)絡(luò)的時間和頻度等。通過這些數(shù)據(jù)建立用戶模型,一方面可以根據(jù)不同的類型進(jìn)行編研選題,另一方面可以通過用戶需求分析來預(yù)測未來的發(fā)展趨向,總結(jié)出社會熱點(diǎn),總結(jié)出讓檔案編研部滿意的編研成果。在進(jìn)行檔案的利用過程中,我們可以選取不同的方向進(jìn)行建模,得出不同的檔案利用形式的變化趨勢,一些變化高的檔案進(jìn)行全文數(shù)字化,使之得到高效的利用,進(jìn)而有效的保護(hù)檔案的原件。從以上分析,我們不難看出,對檔案的數(shù)據(jù)進(jìn)行深度的挖掘是大數(shù)據(jù)時代的一大特點(diǎn)。檔案管理進(jìn)程中的每一次重大變革都對檔案學(xué)的發(fā)展產(chǎn)生了重大的影響。比如在這個過程中引入的計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù),讓檔案管理理念發(fā)生了重大的改變,讓文件和檔案的處理流程也發(fā)生了重大的轉(zhuǎn)變。

      3大數(shù)據(jù)技術(shù)有助于檔案管理模式走向精細(xì)化

      在傳統(tǒng)的數(shù)據(jù)挖掘基礎(chǔ)上進(jìn)行大數(shù)據(jù)的挖掘,這個過程中使用的是數(shù)據(jù)倉庫形式,進(jìn)行了“泛關(guān)系”的分類模型的構(gòu)造,在這個過程中采取了海量數(shù)據(jù)分析方法,進(jìn)行的是傳統(tǒng)數(shù)據(jù)挖掘方式的深化改革?,F(xiàn)已有相關(guān)分析認(rèn)為,大數(shù)據(jù)技術(shù)對數(shù)據(jù)的挖掘主要包括了一下幾個過程:數(shù)據(jù)來源、數(shù)據(jù)的抽取和收集、數(shù)據(jù)的分析、數(shù)據(jù)的解釋。

      3.1檔案數(shù)據(jù)質(zhì)量更高

      在數(shù)據(jù)收集過程中,是大數(shù)據(jù)技術(shù)處理的基礎(chǔ)步驟,數(shù)據(jù)的質(zhì)量直接影響大數(shù)據(jù)技術(shù)的效能,只有在高質(zhì)量的數(shù)據(jù)前提下,大數(shù)據(jù)技術(shù)菜能發(fā)揮出它的作用。大數(shù)據(jù)具有實(shí)時l生和動態(tài)性,為了得到兼具兩種特性的數(shù)據(jù),進(jìn)行數(shù)據(jù)采集的手段十分重要。數(shù)據(jù)采集過程中還要重視數(shù)據(jù)的來源,數(shù)據(jù)來源不同使得數(shù)據(jù)更具有現(xiàn)實(shí)意義。

      3.2處理方式得到改進(jìn)

      現(xiàn)有的數(shù)據(jù)來源十分復(fù)雜,數(shù)據(jù)形式多樣化,為使數(shù)據(jù)統(tǒng)計(jì)便于進(jìn)行,我們有必要進(jìn)行相應(yīng)的數(shù)據(jù)處理。首先,將結(jié)構(gòu)較為復(fù)雜的數(shù)據(jù)進(jìn)行單一化轉(zhuǎn)變,在互聯(lián)網(wǎng)時代,數(shù)據(jù)呈現(xiàn)了半結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的增長,這些都是一些館藏?cái)?shù)據(jù)的重要來源。其次,還要對收集的數(shù)據(jù)進(jìn)行篩選,保證數(shù)據(jù)的質(zhì)量和可靠性。原始數(shù)據(jù)中可能摻雜著一些無效或多余的數(shù)據(jù),因此,我們有必要進(jìn)行數(shù)據(jù)的深處理。

      3.3數(shù)據(jù)分析精細(xì)化

      數(shù)據(jù)分析是大數(shù)據(jù)處理過程中的核心步驟,相關(guān)性分析是大數(shù)據(jù)處理過程中的一個重要思維模式,通過這種分析可以讓我們更好的發(fā)現(xiàn)數(shù)據(jù)之間的密切聯(lián)系。進(jìn)行相關(guān)性分析的精細(xì)化,可以讓數(shù)學(xué)檔案資源得以活化,進(jìn)行數(shù)據(jù)倉庫價值的深入挖掘。進(jìn)一步展現(xiàn)數(shù)據(jù)分析的價值,進(jìn)行新知識的創(chuàng)造。

      3.4服務(wù)更加精準(zhǔn),突出以人為本

      對廣大的檔案用戶而言,最重要的不是數(shù)據(jù)分析的過程而是結(jié)果以及相關(guān)的結(jié)石。檔案用戶需要的是明確精準(zhǔn)的結(jié)果,否則,他們心中有疑惑,就容易產(chǎn)生困擾,甚至被誤導(dǎo)。在檔案管理信息系統(tǒng)中,進(jìn)行相關(guān)數(shù)據(jù)的深化分析,讓用戶對未來的發(fā)展把握更深,更明確,從而做出更加準(zhǔn)確有效的決策,這也是判斷數(shù)據(jù)挖掘是否有價值的重要衡量標(biāo)準(zhǔn)。

      4大數(shù)據(jù)技術(shù)對檔案數(shù)據(jù)深度挖掘,讓檔案管理更加精細(xì)化

      4.1檔案資源挖掘

      在檔案管理中存在普遍的現(xiàn)象是對檔案的管理比較重視,檔案的運(yùn)用較少,這就導(dǎo)致檔案的價值沒有得到發(fā)揮。為此,我們需要深度挖掘檔案中的數(shù)據(jù),讓其中包含的數(shù)據(jù)價值得到發(fā)揮,產(chǎn)生新的價值。在進(jìn)行數(shù)據(jù)挖掘過程中,我們首先要樹立一個大檔案的工作思路。要重視數(shù)據(jù)的整體性和完整性,將之完善成一個具體的體系;其次,我們要建立數(shù)據(jù)共享的資源庫,可以以地級關(guān)系為依托,進(jìn)行數(shù)據(jù)庫的設(shè)立,是數(shù)據(jù)庫之間的聯(lián)系更加緊密;最后,利用當(dāng)前的計(jì)算機(jī)技術(shù)和云服務(wù),進(jìn)行數(shù)據(jù)資源網(wǎng)的構(gòu)建,為檔案用戶提供更好的服務(wù)平臺。

      4.2用戶數(shù)據(jù)挖掘

      對用戶的數(shù)據(jù)進(jìn)行深入挖掘可以幫助用戶提升認(rèn)同感,提高檔案服務(wù)工作的價值。進(jìn)行用戶數(shù)據(jù)的深度挖掘主要包括以下幾個方面:進(jìn)行用戶數(shù)據(jù)的深度挖掘,從用戶留下的檢索信息中提取他們的具體需求,推測他們的興趣,進(jìn)行統(tǒng)計(jì),為用戶提供人性化的服務(wù)。其次,對用戶的點(diǎn)擊率進(jìn)行統(tǒng)計(jì),將點(diǎn)擊量高的檔案進(jìn)行數(shù)據(jù)化;進(jìn)行檢索詞和關(guān)鍵詞的細(xì)化和擴(kuò)充,提高檢索的效率,提升用戶的滿意度。

      5實(shí)現(xiàn)數(shù)據(jù)深度挖掘的策略

      5.1建立數(shù)據(jù)資源體系以及用戶關(guān)系管理

      建立一個完善的數(shù)字資源庫,要求我們從以下幾個方面做起:首先進(jìn)行數(shù)據(jù)的擴(kuò)容,進(jìn)而構(gòu)建完備的資源數(shù)據(jù)庫,其次,加強(qiáng)數(shù)據(jù)化的資源建設(shè),最后數(shù)據(jù)開放,有效提升數(shù)據(jù)的價值。

      5.2保護(hù)客戶隱私,完善大數(shù)據(jù)技術(shù)

      大數(shù)據(jù)分析過程中,我們經(jīng)常面臨的問題主要包括技術(shù)層面的問題和人力層面的問題。在進(jìn)行數(shù)據(jù)挖掘的過程中勢必會牽涉到一些用戶的因素問題,那么如何避免這些問題呢?首先健全法律保護(hù),健全信息安全管理?xiàng)l例,還要使用可以保護(hù)用戶隱私的數(shù)據(jù)挖掘方法,進(jìn)行數(shù)據(jù)的合理挖掘。

      6結(jié)語

      綜上所述,在大數(shù)據(jù)時代,我們不斷的進(jìn)行檔案管理的創(chuàng)新。將大數(shù)據(jù)技術(shù)運(yùn)用在檔案管理的各個環(huán)節(jié),使得在檔案管理中大數(shù)據(jù)技術(shù)得到合理的運(yùn)用,有效的推動了檔案數(shù)據(jù)價值的發(fā)揮。endprint

      猜你喜歡
      大數(shù)據(jù)技術(shù)數(shù)據(jù)挖掘檔案管理
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      檔案管理中的電子檔案管理
      檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      論大數(shù)據(jù)技術(shù)在智能電網(wǎng)中的應(yīng)用
      高校檔案管理信息服務(wù)中大數(shù)據(jù)技術(shù)的應(yīng)用
      大數(shù)據(jù)技術(shù)在電氣工程中的應(yīng)用探討
      大數(shù)據(jù)技術(shù)在商業(yè)銀行中的應(yīng)用分析
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      健康檔案管理的“云”前景
      新乡市| 张北县| 曲阜市| 福清市| 阆中市| 社会| 墨玉县| 潍坊市| 陈巴尔虎旗| 焦作市| 桃园市| 隆回县| 淮滨县| 岱山县| 建始县| 日照市| 山东省| 三明市| 文山县| 资兴市| 东台市| 鲁山县| 丰都县| 临海市| 淮南市| 河间市| 长白| 淄博市| 金华市| 黄浦区| 恩平市| 内黄县| 周至县| 海门市| 东源县| 河池市| 温泉县| SHOW| 乐山市| 玉屏| 烟台市|