• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘?qū)Σ哐芯?/h1>
      2022-01-01 23:56:22
      企業(yè)改革與管理 2021年9期
      關(guān)鍵詞:數(shù)據(jù)挖掘檔案管理數(shù)據(jù)庫

      賴 倩

      (山東省青島第二中學(xué)分校,山東 青島 266071)

      進(jìn)入新時期以來,行業(yè)內(nèi)的競爭加劇,為實(shí)現(xiàn)自身競爭力的提升,很多企業(yè)開始探索以大數(shù)據(jù)技術(shù)為基礎(chǔ)的檔案數(shù)據(jù)挖掘在檔案管理中的應(yīng)用,目的是解決現(xiàn)存的檔案數(shù)據(jù)挖掘問題,進(jìn)一步提升企業(yè)的信息處理效率,實(shí)現(xiàn)企業(yè)競爭力的提升。在企業(yè)檔案管理信息化發(fā)展的同時,為保障檔案數(shù)據(jù)挖掘技術(shù)在企業(yè)檔案管理中的可持續(xù)發(fā)展,需以數(shù)據(jù)挖掘?yàn)楹诵臉?gòu)造企業(yè)管理系統(tǒng),采取以人為本的管理模式,為數(shù)據(jù)挖掘的安全長遠(yuǎn)發(fā)展提供全面的保障。

      一、大數(shù)據(jù)技術(shù)概述

      大數(shù)據(jù)技術(shù)特征可從以下四個方面進(jìn)行簡要概述:

      1.信息龐大

      信息龐大是大數(shù)據(jù)技術(shù)的主要特征,相關(guān)技術(shù)人員將龐大的數(shù)據(jù)信息進(jìn)行搜集與整理,并統(tǒng)一地存放于數(shù)據(jù)系統(tǒng)中。

      2.信息多樣化

      數(shù)據(jù)庫中存放著各種類型的信息,例如,生態(tài)系統(tǒng)信息、國防安全信息與日常生活信息等,都會按照其具體類型進(jìn)行保存。

      3.高附加價值

      各行各業(yè)中人們的生活信息與工作信息都會保存在數(shù)據(jù)庫中,這為相關(guān)有需要的人員進(jìn)行數(shù)據(jù)處理與數(shù)據(jù)采集提供了較大便利。

      4.高效性

      相關(guān)人員在數(shù)據(jù)庫中就相關(guān)信息進(jìn)行檢索時能夠快速地獲取所需信息,這能在一定程度上有效地提升相關(guān)人員的工作效率。

      二、檔案數(shù)據(jù)挖掘技術(shù)

      大數(shù)據(jù)背景下,檔案數(shù)據(jù)挖掘需要相關(guān)工作人員在檔案管理過程中進(jìn)行不斷探索?,F(xiàn)階段的數(shù)據(jù)挖掘技術(shù)可從以下三個方面進(jìn)行簡要論述:

      1.分類技術(shù)

      分類技術(shù)是數(shù)據(jù)挖掘中常用的技術(shù)手段,通過決策樹技術(shù),定義數(shù)據(jù)庫中所有記錄的輸出屬性與輸入屬性,選取數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練,從而找出數(shù)據(jù)屬性之間的規(guī)則,通過規(guī)則實(shí)現(xiàn)新的數(shù)據(jù),并可記錄預(yù)測。企業(yè)在對供應(yīng)商管理以及銀行客戶管理中應(yīng)用決策樹技術(shù)較多,主要用來預(yù)測客戶行為,且準(zhǔn)確性很高。在檔案管理中應(yīng)用分類技術(shù)可結(jié)合客戶資料與檔案信息的每年詳細(xì)數(shù)據(jù)進(jìn)行相關(guān)信息的及時修正[1]。

      2.聚類技術(shù)

      聚類技術(shù)對檔案數(shù)據(jù)庫中的所有數(shù)據(jù)進(jìn)行相似性分析,從而將屬性較為相似的數(shù)據(jù)歸為一類實(shí)現(xiàn)分類化與集中化管理。聚類技術(shù)對數(shù)據(jù)沒有特別高的要求,因此,應(yīng)用較為廣泛。在檔案管理中應(yīng)用聚類技術(shù)可實(shí)現(xiàn)不同渠道與不同部門之間數(shù)據(jù)的有效關(guān)聯(lián),實(shí)現(xiàn)數(shù)據(jù)間的深層次聯(lián)系,有效提升數(shù)據(jù)管理效率。

      3.關(guān)聯(lián)技術(shù)

      關(guān)聯(lián)技術(shù)主要用于描述數(shù)據(jù)項間的關(guān)系規(guī)則,通過一件事物中的事項導(dǎo)出其他事項的出現(xiàn),以此來挖掘數(shù)據(jù)之間隱藏的關(guān)聯(lián)性。檔案數(shù)據(jù)之間一般會存在方方面面的聯(lián)系,這些聯(lián)系體現(xiàn)事物之間的某些規(guī)律,通過對這部分?jǐn)?shù)據(jù)的挖掘,能夠促進(jìn)決策與預(yù)測的科學(xué)合理化發(fā)展,但是,這種技術(shù)的實(shí)現(xiàn)通常需要較為豐富的數(shù)據(jù)庫。

      三、檔案數(shù)據(jù)挖掘現(xiàn)狀

      檔案數(shù)據(jù)挖掘現(xiàn)狀可從以下兩個方面進(jìn)行簡單論述:

      1.檔案數(shù)據(jù)管理方式落后

      當(dāng)前許多研究機(jī)構(gòu)、企業(yè)以及國家相關(guān)部門仍采用較為落后的檔案管理方式,不同部門之間獨(dú)立管理,不同類型檔案文件缺乏關(guān)聯(lián),這使得在檔案管理中浪費(fèi)了大量的人力物力資源。隨著信息技術(shù)的快速發(fā)展,檔案管理開始積極吸取各種先進(jìn)的管理經(jīng)驗(yàn),呈現(xiàn)多元化發(fā)展態(tài)勢,這也從側(cè)面反映出檔案數(shù)據(jù)挖掘技術(shù)的重要性[2]。

      2.檔案管理從業(yè)者管理意識陳舊

      大數(shù)據(jù)背景下,信息技術(shù)在各行各業(yè)實(shí)現(xiàn)了快速發(fā)展,其檔案信息量不斷攀升,然而部門檔案管理工作人員缺乏足夠的先進(jìn)意識,依然忙于各種數(shù)據(jù)儲存,不能實(shí)現(xiàn)數(shù)據(jù)之間的有效關(guān)聯(lián),從而無法發(fā)揮數(shù)據(jù)的最大功效,同時也不利于企業(yè)的快速發(fā)展。

      四、大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘

      大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘可從多方面進(jìn)行論述,在此不能完全涵蓋,僅從以下幾個方面進(jìn)行簡單論述。通過大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù);通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)挖掘的精細(xì)化發(fā)展;綜合性對策實(shí)現(xiàn)檔案數(shù)據(jù)的深度挖掘。

      1.通過大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù)

      (1)數(shù)據(jù)采集層管理

      數(shù)據(jù)采集是大數(shù)據(jù)技術(shù)中的基礎(chǔ)環(huán)節(jié),其質(zhì)量高低直接關(guān)系大數(shù)據(jù)技術(shù)的功效大小。只有完備化、高質(zhì)量的數(shù)據(jù)信息才能協(xié)助大數(shù)據(jù)技術(shù)提取出有用的隱含信息。由于大數(shù)據(jù)的動態(tài)性與實(shí)時性特征,離線、近線、在線等數(shù)字資源皆在采集范圍之內(nèi)。為突出采集數(shù)據(jù)的有效性與代表性,應(yīng)選擇合理的數(shù)據(jù)信息采集方式,收集所需的數(shù)據(jù),為檔案數(shù)據(jù)挖掘打好基礎(chǔ)。

      (2)數(shù)據(jù)管理層管理

      各種方式與渠道挖掘的數(shù)據(jù)結(jié)構(gòu)多樣、種類繁多,通過數(shù)據(jù)管理層的處理、集成與存儲,可實(shí)現(xiàn)以下功能:

      其一,將結(jié)構(gòu)復(fù)雜、難于管理的數(shù)據(jù)轉(zhuǎn)化為便于處理、結(jié)構(gòu)單一的數(shù)據(jù)?,F(xiàn)代互聯(lián)網(wǎng)環(huán)境下,非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用幅度不斷增長,這些資源數(shù)據(jù)逐漸成為館藏重要來源;其二,對挖掘數(shù)據(jù)采取“清洗”與“去噪”處理,以此保障數(shù)據(jù)的可靠性與高質(zhì)量。由于剛采集數(shù)據(jù)有冗余數(shù)據(jù)以及噪聲數(shù)據(jù),對數(shù)據(jù)進(jìn)行解析、清洗以及重構(gòu),能夠有效地提升挖掘數(shù)據(jù)質(zhì)量;其三,儲存數(shù)據(jù)。為不同的數(shù)據(jù)建立獨(dú)立的數(shù)據(jù)庫并進(jìn)行存放,縮短訪問與查詢時間,提升數(shù)據(jù)獲取效率[3]。

      (3)分析層管理

      數(shù)據(jù)分析是大數(shù)據(jù)技術(shù)的核心部分,通過對檔案數(shù)據(jù)關(guān)聯(lián)性的分析,挖掘數(shù)據(jù)之間的密切聯(lián)系,提升數(shù)據(jù)挖掘的深度與廣度。相關(guān)性分析能夠?qū)崿F(xiàn)檔案資源功效的最大化,大數(shù)據(jù)技術(shù)的關(guān)鍵性作用即是發(fā)掘出檔案數(shù)據(jù)獨(dú)有的價值,不管是儲存的“冷數(shù)據(jù)”,還是基于網(wǎng)絡(luò)實(shí)時在線的“熱數(shù)據(jù)”,通過大數(shù)據(jù)技術(shù)對檔案數(shù)據(jù)的挖掘、整合、分析,激活檔案數(shù)據(jù)中潛在的資源,實(shí)現(xiàn)數(shù)據(jù)功效的同時,創(chuàng)造出新價值與新知識,有效破除信息孤島壁壘效應(yīng),實(shí)現(xiàn)孤立而互不聯(lián)通檔案數(shù)據(jù)庫間的信息共享。

      2.通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)挖掘的精細(xì)化

      (1)檔案資源挖掘

      其一,通過大數(shù)據(jù)技術(shù)明確“大檔案”思路,在日常的數(shù)據(jù)挖掘中重視數(shù)據(jù)積累,不但需要完善檔案資源管理體系,還應(yīng)確立數(shù)據(jù)資源體系觀;其二,建立檔案數(shù)據(jù)資源共享庫。以省級為基本建設(shè)單位,建立共享的、規(guī)范的、集中的檔案數(shù)據(jù)庫,實(shí)現(xiàn)各個檔案館藏的關(guān)聯(lián),形成資源豐富依托于網(wǎng)絡(luò)空間的檔案數(shù)據(jù)庫;利用處理技術(shù)與云計算平臺構(gòu)建檔案數(shù)據(jù)網(wǎng),用于實(shí)時接收最新檔案數(shù)據(jù),并分類處理非實(shí)時性數(shù)據(jù),為檔案用戶提供更加優(yōu)質(zhì)的服務(wù)平臺。

      (2)數(shù)據(jù)挖掘

      其一,用戶信息挖掘。挖掘用戶的需求,查看其訪問服務(wù)器留下的日志,實(shí)現(xiàn)對用戶的在線跟蹤,根據(jù)用戶需求進(jìn)行個性化服務(wù);其二,發(fā)掘用戶瀏覽記錄與檢索記錄。通過統(tǒng)計分析,選取點(diǎn)擊率較高的檔案數(shù)據(jù)進(jìn)行數(shù)字化處理;歸納整理用戶常用搜索詞來充實(shí)檔案數(shù)據(jù)庫中的關(guān)鍵詞,降低搜索時間,提升查準(zhǔn)率[4]。

      (3)關(guān)系洞察、趨勢分析

      不論是用戶數(shù)據(jù)還是檔案資源,通過挖掘只能獲取單方面數(shù)據(jù),無法將獨(dú)立的數(shù)據(jù)匯集成完整的網(wǎng)絡(luò)。因此要實(shí)現(xiàn)數(shù)據(jù)的集中化管理,將其集成為完整的管理網(wǎng)絡(luò),需要對其進(jìn)行全面深入的分析。通過整合孤立數(shù)據(jù)點(diǎn),形成完整的檔案網(wǎng)絡(luò),有效促進(jìn)檔案的可持續(xù)發(fā)展。

      3.綜合性對策實(shí)現(xiàn)檔案數(shù)據(jù)的深度挖掘

      (1)實(shí)現(xiàn)“以人為本”的用戶關(guān)系管理

      通過大數(shù)據(jù)技術(shù)可以實(shí)時掌握用戶此前行為與當(dāng)下行為,并預(yù)測分析用戶未來行為,深入挖掘檔案數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),促進(jìn)資源的集成化與創(chuàng)新化;利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對用戶儲存行為、利用興趣、使用習(xí)慣、行為軌跡、搜索方式的分析,發(fā)掘用戶的隱性訴求。根據(jù)不同的用戶建立個性化數(shù)據(jù)庫,并在其中放入數(shù)據(jù)挖掘結(jié)果以及用戶所需。

      (2)合理應(yīng)用“智慧因子”

      智慧城市在提出以后,其概念已經(jīng)輻射到各個領(lǐng)域,其中也包括智慧檔案館,將智慧因子植入大數(shù)據(jù)技術(shù),利用物聯(lián)網(wǎng)技術(shù)將用戶、數(shù)據(jù)、網(wǎng)絡(luò)、檔案、館舍統(tǒng)一在智能網(wǎng)絡(luò)中,達(dá)到深度挖掘與有效整合的目的。大數(shù)據(jù)技術(shù)不但能實(shí)現(xiàn)關(guān)系洞察、用戶數(shù)據(jù)、檔案資源、趨勢分析數(shù)據(jù)的融合,還能通過智慧服務(wù)理念實(shí)現(xiàn)個性化服務(wù),推動檔案數(shù)據(jù)信息的知識空間構(gòu)建。

      五、結(jié)語

      綜上所述,現(xiàn)階段的檔案數(shù)據(jù)挖掘還存在著一些問題亟待解決,這對于檔案管理工作的可持續(xù)發(fā)展有著一定的阻礙作用?;谶@種狀況,很多企業(yè)相關(guān)從業(yè)者開始探索基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘,目的是進(jìn)一步提升檔案管理信息化進(jìn)程,解決現(xiàn)有的檔案數(shù)據(jù)挖掘問題,實(shí)現(xiàn)企業(yè)檔案管理的長遠(yuǎn)發(fā)展。

      猜你喜歡
      數(shù)據(jù)挖掘檔案管理數(shù)據(jù)庫
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      檔案管理中的電子檔案管理
      檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      數(shù)據(jù)庫
      財經(jīng)(2016年3期)2016-03-07 07:44:46
      數(shù)據(jù)庫
      財經(jīng)(2016年6期)2016-02-24 07:41:51
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      健康檔案管理的“云”前景

      双流县| 绥芬河市| 绥德县| 峨眉山市| 武平县| 四会市| 长兴县| 海盐县| 彰化市| 晴隆县| 唐河县| 三原县| 长子县| 浏阳市| 蓝山县| 安化县| 商都县| 安陆市| 壶关县| 衡南县| 增城市| 乌拉特中旗| 基隆市| 靖远县| 同德县| 汕头市| 淳化县| 常州市| 资中县| 吐鲁番市| 丹寨县| 新绛县| 常山县| 南昌市| 长沙县| 明溪县| 罗江县| 辛集市| 龙海市| 泰和县| 黔江区|