• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)時代檔案信息資源共享平臺數(shù)據(jù)挖掘模型的研究與實現(xiàn)

      2020-07-23 07:08:30卞咸杰
      檔案管理 2020年4期
      關(guān)鍵詞:檔案信息資源共享平臺模型構(gòu)建

      卞咸杰

      摘? 要:隨著大數(shù)據(jù)時代技術(shù)的不斷發(fā)展以及檔案信息資源數(shù)據(jù)不斷積累,如何利用檔案信息資源大數(shù)據(jù)進一步提升檔案服務(wù)能力,促進檔案智能化管理能力提升,已經(jīng)成為檔案部門的當(dāng)務(wù)之急。在描述數(shù)據(jù)挖掘相關(guān)概念的基礎(chǔ)上,通過對數(shù)據(jù)挖掘技術(shù)在檔案信息資源共享平臺中應(yīng)用的研究,從數(shù)據(jù)挖掘模型的確立、檔案信息資源數(shù)據(jù)選擇和檔案信息資源數(shù)據(jù)源創(chuàng)建等方面,論述平臺數(shù)據(jù)挖掘模型的建立,并在數(shù)據(jù)挖掘模型功能模塊、數(shù)據(jù)挖掘模型處理流程、數(shù)據(jù)挖掘模型樣本準(zhǔn)備、預(yù)測模型創(chuàng)建和剖析模型集創(chuàng)建等方面進行實踐,驗證該模型的可行性,為實現(xiàn)檔案信息數(shù)字化全面發(fā)展的目標(biāo)提供了更為有效的科學(xué)方案。

      關(guān)鍵詞:大數(shù)據(jù);檔案信息資源;共享平臺;數(shù)據(jù)挖掘;模型構(gòu)建

      Abstract:With the continuous development of technology in the era of big data and the continuous accumulation of archive information resource data, how to use archive information resource big data to further enhance archive service capabilities and promote the intelligent management of archives has become a top priority for archives departments. On the basis of describing the relevant concepts of data mining, through the research on the application of data mining technology in the archive information resource sharing platform, from the establishment of the data mining model, the selection of archive information resource data and the creation of archive information resource data sources, etc. The establishment of the data mining model, and practice in the data mining model function module, data mining model processing flow, data mining model sample preparation, prediction model creation and profiling model set creation, etc., to verify the feasibility of the model, in order to achieve archive information. The goal of comprehensive digital development provides a more effective scientific solution.

      Keywords:Big data; Archive information resources; Sharing platform; Data mining; Model building

      隨著數(shù)據(jù)技術(shù)的進步,數(shù)據(jù)價值在互聯(lián)網(wǎng)時代吸引了越來越多的關(guān)注。行業(yè)大數(shù)據(jù)的研究應(yīng)運而生,過去不同部門掌握的傳統(tǒng)數(shù)據(jù)往往呈現(xiàn)出煙囪式孤島效應(yīng),相互之間有著巨大的關(guān)聯(lián)價值卻不能得到充分利用[1],檔案信息資源方面尤為明顯,檔案行業(yè)的信息化建設(shè)快速發(fā)展,數(shù)字檔案資源極大豐富,檔案數(shù)據(jù)挖掘成為了學(xué)界和業(yè)界研究的新方向[2]。信息技術(shù)的發(fā)展與進步,對檔案信息、數(shù)據(jù)進行深度的挖掘,使得檔案信息管理的各個要素形成內(nèi)在聯(lián)系,充分實現(xiàn)檔案信息資源的共享[3],用戶對檔案服務(wù)要求的不斷提升,相關(guān)高層級的共享平臺建設(shè)也逐漸完善,平臺投入應(yīng)用之后,檔案信息資源數(shù)據(jù)也急劇增加。目前對檔案信息資源數(shù)據(jù)的應(yīng)用主要集中在現(xiàn)有數(shù)據(jù)的維護與檢索方面,數(shù)據(jù)挖掘的過程不僅僅是表層對數(shù)據(jù)的數(shù)值分析,更是基于內(nèi)容的深層語義知識發(fā)現(xiàn)[4]。如何將現(xiàn)有的檔案信息數(shù)據(jù)利用效率最大化,數(shù)據(jù)挖掘的作用會顯現(xiàn)出來,從數(shù)據(jù)流挖掘的角度來看,大數(shù)據(jù)檔案信息資源數(shù)據(jù)挖掘處理是一個巨大的挑戰(zhàn)[5],通過檔案信息數(shù)據(jù)研究,并找出有價值的信息成為大數(shù)據(jù)平臺建成后需要重點關(guān)注的方向。通過檔案信息資源數(shù)據(jù)挖掘模型建立與實現(xiàn),可以給檔案信息資源共享平臺提供數(shù)據(jù)挖掘方案作參考。

      1 數(shù)據(jù)挖掘相關(guān)的概念

      檔案信息資源共享平臺中的數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)中的非結(jié)構(gòu)化數(shù)據(jù)[6]。數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、潛在有用的信息和知識的過程[7]。數(shù)據(jù)挖掘技術(shù)包括統(tǒng)計分析、序列模式發(fā)現(xiàn)、數(shù)據(jù)挖掘等[8],對于檔案信息資源共享平臺數(shù)據(jù)挖掘,包含預(yù)測任務(wù)和描述任務(wù)兩大類任務(wù)[9]。首先需要根據(jù)現(xiàn)有的檔案信息資源數(shù)據(jù)特點,建立數(shù)據(jù)分類,該分類作為預(yù)測目標(biāo)數(shù)據(jù)的參考,分類任務(wù)完成后,需要通過回歸方式,來預(yù)測連續(xù)的目標(biāo)參考數(shù)據(jù);其次需要將檔案信息數(shù)據(jù)中聯(lián)系的方式進行標(biāo)準(zhǔn)化描述,如趨勢、軌跡等,數(shù)據(jù)挖掘任務(wù)的細化通常是探查性的工作,一般需要經(jīng)過后繼數(shù)據(jù)處理來驗證和解釋前期數(shù)據(jù)挖掘的結(jié)果。

      1.1 數(shù)據(jù)分析

      隨著信息技術(shù)的發(fā)展,數(shù)學(xué)與計算機科學(xué)相結(jié)合產(chǎn)生了數(shù)據(jù)分析分支。對于檔案信息資源數(shù)據(jù)分析是采用合適的統(tǒng)計分析方法對收集來的檔案信息資源數(shù)據(jù)進行自動化分析,將采集到的數(shù)據(jù)加以匯總并得出統(tǒng)計報告信息,以求最大化地利用現(xiàn)有的檔案信息大數(shù)據(jù),發(fā)揮共享平臺大數(shù)據(jù)的作用。檔案信息資源數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細研究和概括總結(jié)的過程。傳統(tǒng)的Excel自帶的數(shù)據(jù)分析功能基本可以滿足數(shù)據(jù)統(tǒng)計與數(shù)據(jù)分析的要求,該工具最終可以產(chǎn)生直方圖、相關(guān)系數(shù)、協(xié)方差、各種概率分布、抽樣與動態(tài)模擬、總體均值判斷等內(nèi)容?,F(xiàn)代的數(shù)據(jù)分析一般借用數(shù)據(jù)庫強大的數(shù)據(jù)分析功能,Microsoft SQL Server、Oracle等中大型數(shù)據(jù)庫自帶的數(shù)據(jù)分析工具,同時還可以根據(jù)需要配置數(shù)據(jù)報告。

      1.2 數(shù)據(jù)挖掘

      隨著大數(shù)據(jù)技術(shù)及人工智能技術(shù)的成熟,對數(shù)據(jù)的利用需求日益增長,數(shù)據(jù)挖掘研究在此背景下成為熱門的方向。從大量數(shù)據(jù)中挖掘出有用的信息,大數(shù)據(jù)的出現(xiàn)對傳統(tǒng)的簡單的數(shù)據(jù)挖掘算法提出挑戰(zhàn)[10],檔案信息資源的數(shù)據(jù)挖掘成為了當(dāng)下熱門的話題,所謂檔案信息資源數(shù)據(jù)挖掘是指從檔案信息共享平臺大數(shù)據(jù)中發(fā)掘未知且不確定的并有潛在價值的信息的創(chuàng)造性決策支持過程,該過程依賴于數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、模式識別、可視化技術(shù)等相關(guān)現(xiàn)代化科技[11]。在數(shù)據(jù)挖掘的過程中將由傳統(tǒng)的半自動化向高度全自動化地分析檔案信息資源數(shù)據(jù),通過設(shè)定的策略進行推理,從中挖掘出潛在的有價值數(shù)據(jù),幫助檔案服務(wù)部門做出前瞻性決策。數(shù)據(jù)挖掘的對象不限源頭數(shù)據(jù)類型,這對于多媒體化的檔案信息資源特別有利,傳統(tǒng)的檔案信息資源一般采用結(jié)構(gòu)化存儲方式,因為其存在形式主要為文本格式。隨著硬件設(shè)備配置的提升以及現(xiàn)代互聯(lián)網(wǎng)技術(shù)的發(fā)展,檔案信息資源的存在形式是多種形態(tài)并存,它可以是文本,圖像、視頻或結(jié)構(gòu)化記錄[12],如列表和表格,此類數(shù)據(jù)中也可以包含非結(jié)構(gòu)化數(shù)據(jù)。

      1.3 數(shù)據(jù)挖掘中常見的分析方法

      決策樹分析法。在檔案信息資源數(shù)據(jù)歸類與預(yù)測上有著極強的能力,該方法是以一連串的問題表示出來,經(jīng)由不斷詢問問題,在該過程中不斷優(yōu)化流程,最終能引導(dǎo)出預(yù)定的數(shù)據(jù)信息。

      神經(jīng)網(wǎng)絡(luò)分析法。該方法將一串待學(xué)習(xí)的檔案信息資源數(shù)據(jù)提交給神經(jīng)網(wǎng)絡(luò),使其歸納出有一定區(qū)分度的格式。若得到的是新的檔案信息資源數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)即可以利用過去學(xué)習(xí)的成果并進行智能歸納后,推導(dǎo)出有價值的數(shù)據(jù)參考,自動學(xué)習(xí)推理的技能屬于人工智能領(lǐng)域的一個分支,通過不斷的數(shù)據(jù)學(xué)習(xí),未來可以根據(jù)新提交的檔案信息資源數(shù)據(jù)自動給出預(yù)測結(jié)果。

      連接分析法。該方法是以數(shù)學(xué)領(lǐng)域中的圖形理論為基礎(chǔ),由不同數(shù)據(jù)的關(guān)系發(fā)展出一個模式。該方法的核心是數(shù)據(jù)關(guān)系,由人與人、物與物或是人與物的關(guān)系可以發(fā)展出相當(dāng)多的智能化應(yīng)用,未來可以做出對檔案服務(wù)能力提升更多的挖掘研究。

      2 檔案信息資源共享平臺數(shù)據(jù)挖掘模型的建立

      2.1 數(shù)據(jù)挖掘模型的確立

      為了充分發(fā)揮檔案信息資源共享平臺的優(yōu)勢,要結(jié)合用戶的實際需求建立完整的處理框架體系[13]。在實際做數(shù)據(jù)挖掘之前,首先需要確認數(shù)據(jù)挖掘模型建立的目標(biāo),在共享平臺數(shù)據(jù)挖掘模型建立之前,將檔案服務(wù)中涉及到檔案信息資源數(shù)據(jù)的業(yè)務(wù)問題定義完善,然后根據(jù)問題來確定如何解決問題,將廣泛的問題目標(biāo)具體化與細化。在檔案信息資源數(shù)據(jù)挖掘模型建立過程中,可以按照確定目標(biāo)平臺用戶、為目標(biāo)用戶設(shè)定可行的行為模式、確定常用的用戶操作習(xí)慣、列出數(shù)據(jù)利用過程中的高頻利用信息、分析高頻數(shù)據(jù)訪問特點、為特定檔案信息資源數(shù)據(jù)建立特殊訪問通道,加強數(shù)據(jù)利用效率。具體確立流程如圖1所示:

      在此過程中通過中間模型來翻譯輸入數(shù)據(jù)變量與目標(biāo)變量的關(guān)系,這一步非常重要,對數(shù)據(jù)挖掘?qū)ο蠛腿蝿?wù)的理解程度需要正確且深入。如果這個問題沒有被準(zhǔn)確理解就無法把檔案信息資源數(shù)據(jù)轉(zhuǎn)化為挖掘任務(wù)。在實施數(shù)據(jù)挖掘任務(wù)之前,還需要明確如何使用檔案信息資源數(shù)據(jù)挖掘結(jié)果以及確定交付結(jié)果的方式。

      2.2 檔案信息資源數(shù)據(jù)選擇

      檔案信息資源數(shù)據(jù)存儲點首先在共享平臺所關(guān)聯(lián)的大數(shù)據(jù)平臺上,平臺數(shù)據(jù)的大幅增加對平臺自身來說是一項具有挑戰(zhàn)性的任務(wù)[14],存儲在倉庫中的檔案信息資源大數(shù)據(jù)在進入系統(tǒng)之前已經(jīng)被清洗和核實過,共享平臺會通過數(shù)據(jù)整合技術(shù)將不同的數(shù)據(jù)資源進行整合。數(shù)據(jù)在實際的整合過程中,會遇到相同的信息點名稱但是表示不同的含義,這中間有一個數(shù)據(jù)遷移的過程,通過建立數(shù)據(jù)交互接口表,數(shù)據(jù)之間的信息互通將通過接口表信息完成信息翻譯。數(shù)據(jù)選擇與整理流程如圖2所示:

      在建模構(gòu)建期間,需要準(zhǔn)備足夠的檔案信息資源數(shù)據(jù)并注意數(shù)據(jù)庫之間的平衡,這樣對于數(shù)據(jù)研究更加便捷。特定數(shù)據(jù)在數(shù)據(jù)集合中的存在會產(chǎn)生更大的價值。數(shù)據(jù)挖掘的本質(zhì)是使用過去的數(shù)據(jù)預(yù)測未來的趨勢,針對檔案信息資源的數(shù)據(jù)挖掘,歷史上較新的信息對數(shù)據(jù)挖掘更加有價值,歷史太過靠前的數(shù)據(jù),由于其信息本身的附加屬性信息較少,需要對這部分數(shù)據(jù)進行深加工,這樣才能發(fā)揮更久歷史的檔案信息資源數(shù)據(jù)的價值。

      2.3 檔案信息資源數(shù)據(jù)源創(chuàng)建

      在數(shù)據(jù)用于構(gòu)建模型之前,數(shù)據(jù)探索方面需要得到足夠的重視,不能等后繼使用時才發(fā)現(xiàn)檔案信息資源的數(shù)據(jù)質(zhì)量問題,在具體的數(shù)據(jù)源創(chuàng)建過重中,可以遵循以下步驟執(zhí)行:

      檢查檔案信息資源數(shù)據(jù)分布情況,在數(shù)據(jù)庫的初步探索階段,可以借助可視化工具?,F(xiàn)存的可視化工具如Excel對待挖掘的檔案信息數(shù)據(jù)提供了強大的匯總分析支持。取得檔案信息資源數(shù)據(jù)源中的數(shù)據(jù)文件后,需要對其中的內(nèi)容進行剖析,剖析的過程中可能會產(chǎn)生不一致問題或定義問題的警告,需要對問題數(shù)據(jù)進行分析并解決警告,這樣可以避免后繼分析產(chǎn)生不必要的麻煩。

      經(jīng)過檔案信息資源數(shù)據(jù)存儲的值與描述進行比較與二次確認,并對檔案信息資源大數(shù)據(jù)進行觀察,將它們與現(xiàn)有文件中的變量描述進行比較,可以發(fā)現(xiàn)有問題的數(shù)據(jù)描述。確定檔案信息資源存儲的數(shù)據(jù)與所要描述的數(shù)據(jù)一致性是非常重要的,每條記錄的字段定義信息要明確,這樣才不會導(dǎo)致后繼數(shù)據(jù)挖掘過程中的數(shù)據(jù)源頭不一致錯誤。對存在問題的檔案信息資源數(shù)據(jù)進行討論研究,檔案信息資源數(shù)據(jù)不同于普通業(yè)務(wù)系統(tǒng)的數(shù)據(jù),其真實性與準(zhǔn)確性要求非常高,如果存儲系統(tǒng)中的數(shù)據(jù)看上去有存疑,需要記錄下來。待問題數(shù)據(jù)積累到一定數(shù)量后進行溝通討論,研究出問題源頭,在今后的數(shù)據(jù)創(chuàng)建過程中避免問題的產(chǎn)生,這項工作需要耐心和細心,對檔案信息數(shù)據(jù)挖掘的成果尤為重要[15]。

      3 檔案信息資源共享平臺數(shù)據(jù)挖掘模型的實現(xiàn)

      3.1 數(shù)據(jù)挖掘模型功能模塊

      檔案信息資源數(shù)據(jù)挖掘模型功能模塊主要由檔案信息資源數(shù)據(jù)采集模塊、存儲模塊、數(shù)據(jù)分類模塊、數(shù)據(jù)分析模塊等組成。數(shù)據(jù)采集模塊包含后臺管理數(shù)據(jù)采集與用戶行為數(shù)據(jù)采集,數(shù)據(jù)共享后會定期從公共接口進行數(shù)據(jù)交互,新產(chǎn)生的數(shù)據(jù)會收集到檔案信息資源共享平臺中。存儲模塊會定期將存儲到平臺的檔案信息資源數(shù)據(jù)進行備份,并自動處理歷史數(shù)據(jù)與當(dāng)前操作數(shù)據(jù)分離,以提升數(shù)據(jù)挖掘模塊的數(shù)據(jù)操作性能。數(shù)據(jù)分類模塊通過利用檔案信息資源共享平臺獲取的原始數(shù)據(jù),采用智能策略對檔案信息資源數(shù)據(jù)進行歸納與分離,該模塊是待挖掘源頭數(shù)據(jù)的最終達到預(yù)定目標(biāo)的關(guān)鍵,良好的分類可以更好地發(fā)現(xiàn)有價值的結(jié)果。數(shù)據(jù)分析模塊是對分好類的數(shù)據(jù)進行智能化提取價值關(guān)鍵詞,該模塊是檔案信息資源數(shù)據(jù)挖掘的價值所在,該模塊通過減少對非關(guān)鍵數(shù)據(jù)的分析來提升數(shù)據(jù)挖掘效率。具體的功能模塊如圖3所示:

      3.2 數(shù)據(jù)挖掘模型處理流程

      檔案信息資源數(shù)據(jù)挖掘模型處理流程包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、評價等幾個過程[16],數(shù)據(jù)準(zhǔn)備階段是按用戶需求從檔案信息資源共享平臺上獲取基礎(chǔ)信息。數(shù)據(jù)預(yù)處理階段是將第一階段收集的大量不完善、模糊和冗余的數(shù)據(jù)進行預(yù)處理并轉(zhuǎn)換成準(zhǔn)確有效的數(shù)據(jù),在此流程中與數(shù)據(jù)挖掘相關(guān)的數(shù)據(jù)和屬性才可以被使用,該流程中使用了數(shù)據(jù)挖掘算法,為數(shù)據(jù)挖掘奠定了基礎(chǔ)。數(shù)據(jù)挖掘階段可分為三個部分,即確定挖掘及其知識類型、確定算法,根據(jù)算法進行數(shù)據(jù)的實際挖掘。評價階段主要時間預(yù)測結(jié)果驗證,不合格結(jié)果可按以上三步重新挖掘,直到預(yù)測結(jié)果符合要求,同時應(yīng)刪除挖掘結(jié)果中的多余知識。檔案信息資源共享平臺數(shù)據(jù)挖掘模型的詳細處理流程如圖4所示:

      3.3 數(shù)據(jù)挖掘模型樣本準(zhǔn)備

      不同于以往的標(biāo)準(zhǔn)統(tǒng)計分析,需要將超出正常范圍的數(shù)據(jù)舍棄以便于數(shù)據(jù)統(tǒng)計,在檔案信息數(shù)據(jù)挖掘的過程中,以往的非正常范圍數(shù)據(jù)可能正是數(shù)據(jù)挖掘的關(guān)鍵,在數(shù)據(jù)挖掘的樣本準(zhǔn)備過程中,需要重視這部分數(shù)據(jù)并對其進行研究。知識發(fā)現(xiàn)算法需通過檔案信息資源原始數(shù)據(jù)來進行學(xué)習(xí),如果沒有足夠數(shù)量的檔案信息資源大數(shù)據(jù)模型的例子,數(shù)據(jù)挖掘模型是無法得出期望的預(yù)測模型。在這種情況下,利用邊緣樣本來豐富樣本模型集,提高特定預(yù)測結(jié)果的成功率。檔案信息資源數(shù)據(jù)挖掘模型的建立需要一個較長的時序,基于較短時間建立的模型存在風(fēng)險,最終得到的數(shù)據(jù)學(xué)習(xí)知識不能真實反映數(shù)據(jù)趨勢信息。在實際的時序應(yīng)用中需要結(jié)合模型集中的多個時序信息以消除因時間推進帶來的趨勢分析影響。

      3.4 預(yù)測模型創(chuàng)建

      檔案信息資源數(shù)據(jù)挖掘模型用來預(yù)測時,需要明確模型集所占用的時間長度,同時需要將具體的時間段明確下來,預(yù)測模型就是要利用過去設(shè)定的模型,用來解釋最近的輸出。預(yù)測模型部署到正式環(huán)境后,能夠通過自我學(xué)習(xí),運用不斷更新的數(shù)據(jù)預(yù)測未來。數(shù)據(jù)預(yù)測模型創(chuàng)建是動態(tài)的,通過模型預(yù)測的短期信息是不能作為未來預(yù)測模型的基礎(chǔ)數(shù)據(jù)輸入,如果在遠期數(shù)據(jù)預(yù)測中需要用到近期的預(yù)測信息,可行的方案是在模型集合中跳過近期預(yù)測數(shù)據(jù)輸入。

      3.5 剖析模型集創(chuàng)建

      檔案信息資源數(shù)據(jù)模型集與預(yù)測模型較為相似,不同點在于剖析模型集目標(biāo)的時間幀與輸入的時間幀是重疊的。該差別對建模工作有非常大的影響,因為輸入可能使目標(biāo)模式出現(xiàn)偏差,嚴格選擇剖析模型的輸入才能避免該問題的產(chǎn)生。當(dāng)目標(biāo)變量的時間幀與輸入變量的時間幀一致時,該模型即是一個剖析模型。剖析模型輸入變量可能會引入無固定的挖掘模式,而這些模式可能會混淆數(shù)據(jù)挖掘技術(shù)。

      *2017年國家社科基金年度項目《大數(shù)據(jù)時代智慧檔案信息服務(wù)平臺構(gòu)建與創(chuàng)新研究》(項目批準(zhǔn)號:17BTQ074)階段性成果之一。

      參考文獻:

      [1]羅俊,于水,楊維,孔華鋒.實時大數(shù)據(jù)挖掘系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機應(yīng)用與軟件,2020(3):57-60+122.

      [2]譚美琴,鄭川.檔案數(shù)據(jù)挖掘文獻統(tǒng)計分析[J].資源信息與工程,2019(4):166-168.

      [3]倪一君.大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘分析[J].辦公室業(yè)務(wù),2019(5):21+24.

      [4]王萍,牟冬梅,石琳琚,沅紅.領(lǐng)域知識融合驅(qū)動下的數(shù)據(jù)挖掘模型構(gòu)建與優(yōu)化[J].情報理論與實踐,2018(9):114-117+153.

      [5]Sonia Jaramillo Valbuena,Sergio Augusto Cardona,Alejandro Fernández.Minería de datos sobre streams de redes sociales,una herramienta al servicio de la Bibliotecología[J].Información,cultura y Sociedad,2015,33:63-74.

      [6]楊尊琦.大數(shù)據(jù)導(dǎo)論[M].北京:機械工業(yè)出版社,2018.

      [7]王競秋.數(shù)字·數(shù)據(jù)·知識:檔案資源開發(fā)利用形式的拓展與整合[D].南昌:南昌大學(xué),2019.

      [8]Rehab Duwairi,Ammari Hadeel.An enhanced CBAR algorithm for improving recommendation systems accuracy[J].Simulation Modelling Practice and Theory,2016,60:54-68.

      [9]欒立娟,盧健,劉佳.數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用[J].計算機光盤軟件與應(yīng)用,2015(1):35-36.

      [10]謝光.基于Map Reduce 的云數(shù)據(jù)挖掘模型的設(shè)計與實現(xiàn)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(6):62-63+71.

      [11]鄭斐,郭彥宏,郝俊勤,劉娜.數(shù)據(jù)挖掘技術(shù)如何在圖書館建設(shè)中體現(xiàn)價值[J].圖書情報工作,2013(S13):263-264+212.

      [12]Hanane Ezzikouri,Mohamed Fakir,Cherki Daoui,Mohamed Erritali.Extracting knowledge from web data[J].Journal of Information Technology Research,2014,7(4):27-41.

      [13]劉斌.檔案信息管理系統(tǒng)中的計算機數(shù)據(jù)挖掘技術(shù)探討[J].信息與電腦(理論版) ,2018(3):138-139+142.

      [14]Hemant Kumar Singh,Brijendra Singh.A classification algorithm to improve the design of websites[J].Journal of Software Engineering and Applications,2012,5:492-499.

      [15]王萍,牟冬梅,石琳,琚沅紅.領(lǐng)域知識融合驅(qū)動下的數(shù)據(jù)挖掘模型構(gòu)建與優(yōu)化[J].情報理論與實踐,2018(9):114-117+153.

      [16]Cuiyuan Yu,Jie Shan.The application of web data mining technology in e-commerce[J].Advanced Materials Research.2014,1044:1503-1506.

      (作者單位:鹽城師范學(xué)院? 來稿日期:2020-04-20)

      猜你喜歡
      檔案信息資源共享平臺模型構(gòu)建
      檔案信息服務(wù)創(chuàng)新的內(nèi)驅(qū)力研究
      檔案管理(2017年2期)2017-02-25 15:00:10
      檔案信息資源開發(fā)主體多元化理論探析
      檔案管理(2017年1期)2017-01-17 19:04:09
      中企搭乘“共享平臺”好出海
      科學(xué)數(shù)據(jù)共享平臺的建設(shè)與服務(wù)探討
      模型構(gòu)建在高中生物教學(xué)中的應(yīng)用
      “微平臺”在包裝設(shè)計課程資源共享教學(xué)中的應(yīng)用研究
      基于云計算的大學(xué)生移動學(xué)習(xí)模型構(gòu)建
      亞太教育(2016年31期)2016-12-12 21:20:54
      試論檔案信息資源的開發(fā)利用
      中文信息(2016年10期)2016-12-12 09:59:42
      高中物理解題的模型構(gòu)建
      考試周刊(2016年89期)2016-12-01 13:31:12
      高校大型儀器設(shè)備共享平臺構(gòu)建與運行管理探討
      靖西县| 永州市| 霍城县| 罗江县| 祥云县| 布尔津县| 旌德县| 福安市| 亚东县| 阿克苏市| 庐江县| 高安市| 灌南县| 雷山县| 化州市| 瓮安县| 丰宁| 丰顺县| 冕宁县| 望奎县| 深州市| 扶沟县| 遂平县| 桓仁| 翼城县| 五常市| 密云县| 汾西县| 海原县| 鄂托克旗| 巍山| 朝阳区| 新巴尔虎右旗| 吉安市| 正安县| 宁阳县| 原阳县| 霍州市| 房产| 普定县| 中山市|