• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文獻(xiàn)挖掘的圖書館智慧化平臺建設(shè)研究

      2022-08-24 09:47:58河南中醫(yī)藥大學(xué)圖書館雷天鋒
      辦公室業(yè)務(wù) 2022年15期
      關(guān)鍵詞:文獻(xiàn)資料數(shù)據(jù)挖掘精準(zhǔn)

      文/河南中醫(yī)藥大學(xué)圖書館 雷天鋒

      文獻(xiàn)挖掘是借助數(shù)據(jù)挖掘技術(shù),從圖書館海量的文獻(xiàn)數(shù)據(jù)庫中挖掘和整合有用的文獻(xiàn)資料的技術(shù)方法和行為過程。在教學(xué)、科研行動中,文獻(xiàn)挖掘是精準(zhǔn)獲取文獻(xiàn)資料信息的關(guān)鍵路徑,也是高校在文獻(xiàn)資料整合利用方面面臨的“瓶頸”。在傳統(tǒng)以紙質(zhì)文獻(xiàn)資料為主的圖書館運(yùn)營管理模式中,讀者對文獻(xiàn)資料的挖掘更多依靠人工搜集,不僅效率低,最終獲得的文獻(xiàn)資料的可利用性也欠佳。隨著智慧化圖書館平臺的開發(fā),借助數(shù)據(jù)挖掘技術(shù),進(jìn)行精準(zhǔn)的文獻(xiàn)挖掘已然成為一種高效的行為。近年來,已有高校圖書館開始將開發(fā)具有文獻(xiàn)挖掘功能的圖書館智慧化平臺作為重要關(guān)注點。

      一、數(shù)據(jù)挖掘技術(shù)概述

      數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)技術(shù)在智慧化圖書館平臺建設(shè)中深度應(yīng)用的產(chǎn)物,其特點在于數(shù)據(jù)的精準(zhǔn)檢索和高效利用。雖然大數(shù)據(jù)技術(shù)的應(yīng)用使得圖書館在文獻(xiàn)資料獲取、存儲、分析、挖掘和可視化呈現(xiàn)等方面有了明顯改善,但是,技術(shù)作用下產(chǎn)生的海量數(shù)據(jù)并不都是讀者真正需要的數(shù)據(jù),其中不乏一些干擾性的信息。在精準(zhǔn)獲取文獻(xiàn)資料需求日益明顯的情況下,有必要通過技術(shù)手段為讀者提供短時間內(nèi)獲取準(zhǔn)確文獻(xiàn)資料信息的方法,而這就使得數(shù)據(jù)挖掘技術(shù)有了應(yīng)用的需求。

      (一)數(shù)據(jù)挖掘技術(shù)的概念。數(shù)據(jù)挖掘技術(shù),是在專家系統(tǒng)、計算機(jī)信息處理技術(shù)等方法的支持下,從大量無規(guī)則的數(shù)據(jù)中提取出符合特定條件的,具有潛在指導(dǎo)性作用的數(shù)據(jù)信息的技術(shù)。數(shù)據(jù)挖掘技術(shù)的應(yīng)用包括五個階段:第一階段為數(shù)據(jù)準(zhǔn)備階段,主要內(nèi)容為確定數(shù)據(jù)挖掘的目標(biāo),并從數(shù)據(jù)庫中采集大量原始數(shù)據(jù);第二階段為數(shù)據(jù)預(yù)處理階段,主要內(nèi)容是對采集到的原始數(shù)據(jù)進(jìn)行科學(xué)選擇和合成處理;第三階段為數(shù)據(jù)變換階段,主要是通過聚集、降維等方式將合成的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換,使數(shù)據(jù)在格式上呈現(xiàn)出統(tǒng)一性、規(guī)則性;第四階段為數(shù)據(jù)處理階段,主要是選擇合適的模型和算法對數(shù)據(jù)進(jìn)行分析處理,使數(shù)據(jù)以正確的方式表達(dá)出來;第五階段為結(jié)果呈現(xiàn)階段,主要是根據(jù)讀者在視覺方面的個性化要求,對數(shù)據(jù)進(jìn)行可視化的圖表或者模型處理,使數(shù)據(jù)本身具有的規(guī)則能夠更直觀地顯現(xiàn)出來。

      (二)數(shù)據(jù)挖掘技術(shù)的特點。數(shù)據(jù)挖掘技術(shù)具有三方面的特點。第一,集成性。數(shù)據(jù)挖掘技術(shù)是在對海量數(shù)據(jù)進(jìn)行挖掘、集成基礎(chǔ)上的進(jìn)一步應(yīng)用,是從海量數(shù)據(jù)中挖掘和提取出符合特定規(guī)律的內(nèi)容;第二,隱含性。數(shù)據(jù)挖掘技術(shù)的功能在于發(fā)現(xiàn)海量數(shù)據(jù)中隱藏的深層次信息和規(guī)律,而不是直接從數(shù)據(jù)的表征中提取相關(guān)規(guī)律;第三,規(guī)則性。數(shù)據(jù)挖掘技術(shù)是按照特定的規(guī)則或者算法對數(shù)據(jù)庫中海量的數(shù)據(jù)進(jìn)行檢索、整合和處理的技術(shù),其輸出的結(jié)果具有明顯的規(guī)律性。

      二、基于文獻(xiàn)挖掘的圖書館智慧化平臺概述

      圖書館智慧化平臺,是以為用戶提供泛在智慧服務(wù)為主的平臺,是繼數(shù)字圖書館、復(fù)合圖書館后,圖書館發(fā)展的一個更高級形態(tài)。圖書館智慧化平臺主要依托傳感器技術(shù)、云計算技術(shù)、大數(shù)據(jù)技術(shù)等要素,旨在實現(xiàn)圖書流、人員流、物流、信息流的充分流動和融合,最終充分滿足用戶尤其是讀者在智慧化方面的服務(wù)需求。基于文獻(xiàn)挖掘的圖書館智慧化平臺是其中的一項重要功能。在數(shù)據(jù)挖掘技術(shù)的支持下,高校圖書館可以為讀者提供精準(zhǔn)的文獻(xiàn)資料信息檢索服務(wù)。以下著重對該類平臺的架構(gòu)以及應(yīng)用方向進(jìn)行分析。

      (一)基于文獻(xiàn)挖掘的圖書館智慧化平臺的架構(gòu)。在原有的數(shù)字化圖書館系統(tǒng)和平臺的基礎(chǔ)上,加入數(shù)據(jù)挖掘技術(shù)內(nèi)容,使原本以文獻(xiàn)資料數(shù)據(jù)信息管理為主的平臺轉(zhuǎn)變?yōu)橐晕墨I(xiàn)資料數(shù)據(jù)信息精準(zhǔn)檢索和推送為主的平臺。圖1展示了基于文獻(xiàn)挖掘的圖書館智慧化平臺的架構(gòu)??梢钥闯觯跀?shù)據(jù)挖掘技術(shù)開發(fā)的智慧化平臺是通過該平臺中的數(shù)據(jù)理解、分析和應(yīng)用,來構(gòu)建相應(yīng)的文獻(xiàn)數(shù)據(jù)模型,以模型為載體,借助精準(zhǔn)、高效的數(shù)據(jù)挖掘技術(shù),為讀者提供更為精準(zhǔn)、可靠的文獻(xiàn)資料數(shù)據(jù)檢索服務(wù)。在整個智慧化平臺中,數(shù)據(jù)的理解和模型的構(gòu)建是關(guān)鍵,其中,數(shù)據(jù)理解是模型構(gòu)建的前提,模型構(gòu)建是數(shù)據(jù)應(yīng)用的結(jié)果。

      圖1 基于文獻(xiàn)挖掘的圖書館智慧化平臺架構(gòu)

      (二)基于文獻(xiàn)挖掘的圖書館智慧化平臺應(yīng)用方向。目前文獻(xiàn)挖掘的圖書館智慧化平臺的應(yīng)用主要體現(xiàn)在讀者借閱行為模式分析、讀者個性化文獻(xiàn)資料服務(wù)和圖書館文獻(xiàn)排架分析三方面。其中,讀者借閱行為模式分析是平臺借助數(shù)據(jù)挖掘技術(shù),對讀者在檢索過程中留下的各種記錄進(jìn)行集中性的分析處理,從中獲得關(guān)于讀者對文獻(xiàn)資料閱讀習(xí)慣的數(shù)據(jù)信息,或者某一文獻(xiàn)資料在讀者群體中的受歡迎程度信息,然而根據(jù)這些數(shù)據(jù)構(gòu)建相應(yīng)的模型,作為精準(zhǔn)化文獻(xiàn)資料檢索或者書籍資料推送的依據(jù)。讀者個性化文獻(xiàn)資料服務(wù)是通過對讀者的身份信息與讀者的文獻(xiàn)檢索、借閱信息進(jìn)行關(guān)聯(lián)性分析,并建立相應(yīng)的模型,呈現(xiàn)讀者在不同文獻(xiàn)資料閱讀方面的需求,便于圖書館或者智慧化平臺為讀者提供個性化的文獻(xiàn)資料閱讀服務(wù)。圖書館文獻(xiàn)排架分析是通過對讀者群體文獻(xiàn)資料借閱行為模式和個性化服務(wù)內(nèi)容進(jìn)行分析,掌握不同類型圖書在讀者群體中的受歡迎程度和被借閱的記錄情況,為圖書館進(jìn)行文獻(xiàn)資料的合理排架和陳設(shè)提供相應(yīng)的數(shù)據(jù)支持。

      三、基于文獻(xiàn)挖掘的圖書館智慧化平臺建設(shè)策略

      從功能上看,基于文獻(xiàn)挖掘的圖書館智慧化平臺是在原有的智慧化平臺中增加數(shù)據(jù)挖掘技術(shù)要素,實現(xiàn)文獻(xiàn)挖掘的精準(zhǔn)化和高效化。但真正的文獻(xiàn)挖掘功能實現(xiàn)卻需要有成熟、安全的技術(shù)作為支撐。基于上文提出的平臺架構(gòu),相關(guān)主體要在現(xiàn)有技術(shù)框架內(nèi),結(jié)合數(shù)據(jù)挖掘技術(shù)的特點,科學(xué)推進(jìn)智慧化平臺文獻(xiàn)挖掘功能的開發(fā)與應(yīng)用。具體來說,在平臺建設(shè)實踐中,需要重點采取以下幾方面的策略:

      (一)做好數(shù)據(jù)挖掘引擎的開發(fā)。通過圖2可以看出,基于文獻(xiàn)挖掘的圖書館智慧化平臺建設(shè)的關(guān)鍵在于第二層次,即數(shù)據(jù)挖掘引擎的開發(fā)。一方面,數(shù)據(jù)挖掘引擎是將當(dāng)前已經(jīng)形成的圖書館數(shù)據(jù)庫中的文獻(xiàn)數(shù)據(jù)進(jìn)行集中性的管理和挖掘的重要抓手,只有具備在海量數(shù)據(jù)信息中進(jìn)行文獻(xiàn)資料數(shù)據(jù)關(guān)聯(lián)性分析的引擎功能,才能夠為讀者提供簡潔、快速的文獻(xiàn)挖掘功能支持;另一方面,前期的智慧化平臺建設(shè)實際上已經(jīng)為基于文獻(xiàn)挖掘的圖書館智慧化平臺建設(shè)提供了相應(yīng)的數(shù)據(jù)庫支持,目前需要做的就是結(jié)合相關(guān)文獻(xiàn)資料服務(wù)需求,開發(fā)具體的算法,賦予智慧化平臺更強(qiáng)大的數(shù)據(jù)整合、挖掘和分析處理能力,進(jìn)而實現(xiàn)更精準(zhǔn)的數(shù)據(jù)挖掘功能。因此,在當(dāng)前的智慧化圖書館平臺建設(shè)中,相關(guān)工作的開展應(yīng)當(dāng)重點放在數(shù)據(jù)挖掘引擎的開發(fā)與應(yīng)用上。

      圖2 基于文獻(xiàn)挖掘的圖書館智慧化平臺的技術(shù)層次結(jié)構(gòu)

      (二)注重用戶行為數(shù)據(jù)的清洗?;谖墨I(xiàn)挖掘的圖書館智慧化平臺的用戶包括管理者和讀者兩類,不同用戶在平臺上的操作行為存在個性化的差異。在平臺運(yùn)行過程中,雖然用戶的行為都會產(chǎn)生相應(yīng)的記錄,并被存儲到圖書管理數(shù)據(jù)庫中,但這些信息中不乏一些格式不規(guī)范、內(nèi)容不完整的數(shù)據(jù)信息,對文獻(xiàn)挖掘會產(chǎn)生一定的干擾性影響,需要重點剔除和清洗。因此,在平臺建設(shè)中,技術(shù)人員要注意對用戶行為數(shù)據(jù)進(jìn)行有效清洗,將采集到的用戶行為數(shù)據(jù)進(jìn)行規(guī)范性處理,并在核實數(shù)據(jù)完備性的基礎(chǔ)上,過濾垃圾數(shù)據(jù)或者冗余數(shù)據(jù),提高文獻(xiàn)挖掘的精準(zhǔn)性。在大數(shù)據(jù)清洗過程中,技術(shù)人員可以使用技術(shù)手段與人工操作相結(jié)合的方式,以確保清洗行為的規(guī)范性和科學(xué)性。

      (三)增強(qiáng)平臺數(shù)據(jù)轉(zhuǎn)換集成能力?;谖墨I(xiàn)挖掘的圖書館智慧化平臺的運(yùn)行是基于海量用戶尤其是讀者數(shù)據(jù)的基礎(chǔ)上實現(xiàn)的。如果無法保證平臺擁有足夠的數(shù)據(jù)資源,則很難實現(xiàn)深度的文獻(xiàn)挖掘目的。但是,在實際的平臺運(yùn)行中,由于用戶使用終端設(shè)備的多樣性,以及用戶行為數(shù)據(jù)類型的差異,使得最終錄入到數(shù)據(jù)庫中的數(shù)據(jù)的結(jié)構(gòu)和類型存在明顯的差異,難以完全匹配數(shù)據(jù)挖掘技術(shù)應(yīng)用的要求。因此,在平臺數(shù)據(jù)庫的運(yùn)維中,技術(shù)人員要注意對平臺的數(shù)據(jù)轉(zhuǎn)換集成能力進(jìn)行優(yōu)化和提升,形成統(tǒng)一的、標(biāo)準(zhǔn)的數(shù)據(jù),供智慧化平臺文獻(xiàn)挖掘時使用。

      四、結(jié)語

      隨著圖書館服務(wù)的智慧化發(fā)展,開發(fā)基于文獻(xiàn)挖掘的圖書館智慧化平臺,逐漸成為高校圖書館發(fā)展中重點落實的任務(wù)。在數(shù)據(jù)挖掘技術(shù)的支持下,圖書館智慧化平臺可以圍繞讀者借閱行為模式分析、讀者個性化文獻(xiàn)資料服務(wù)和圖書館文獻(xiàn)排架等進(jìn)行高效的文獻(xiàn)資料信息挖掘與利用,進(jìn)而提高圖書館文獻(xiàn)資料使用的效率和效果。當(dāng)前,智慧化平臺建設(shè)尚處于探索和深化階段,需要在做好數(shù)據(jù)挖掘引擎開發(fā)的同時,注重用戶行為數(shù)據(jù)的清洗和平臺數(shù)據(jù)轉(zhuǎn)換集成能力的增強(qiáng),以保證基于文獻(xiàn)挖掘的圖書館智慧化平臺建設(shè)工作能夠有序推進(jìn),發(fā)揮實效。

      猜你喜歡
      文獻(xiàn)資料數(shù)據(jù)挖掘精準(zhǔn)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      精準(zhǔn)防返貧,才能穩(wěn)脫貧
      精準(zhǔn)的打鐵
      NBA特刊(2018年11期)2018-08-13 09:29:22
      用信息技術(shù)搜集文獻(xiàn)
      用信息技術(shù)搜集文獻(xiàn)
      精準(zhǔn)扶貧 齊奔小康
      民生周刊(2017年19期)2017-10-25 16:48:02
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      精準(zhǔn)扶貧二首
      岷峨詩稿(2017年4期)2017-04-20 06:26:26
      淺談文獻(xiàn)資料的特點和作用
      長江叢刊(2016年29期)2016-11-26 00:40:13
      淺談在初中語文教學(xué)中如何調(diào)動學(xué)生的學(xué)習(xí)積極性
      浮梁县| 秦安县| 独山县| 昔阳县| 定兴县| 射阳县| 彭阳县| 辽宁省| 凌源市| 九龙城区| 遵义县| 临汾市| 文登市| 百色市| 甘泉县| 酒泉市| 洛阳市| 密山市| 无锡市| 桐梓县| 讷河市| 张家口市| 都江堰市| 永仁县| 芮城县| 高尔夫| 延寿县| 南岸区| 定陶县| 胶州市| 通河县| 长宁区| 葵青区| 婺源县| 北流市| 抚顺县| 柯坪县| 大同县| 娱乐| 手游| 台州市|