• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)挖掘下的高校圖書館信息資源管理研究

      2021-04-14 21:57:40趙玉蓮
      卷宗 2021年2期
      關(guān)鍵詞:信息資源管理數(shù)據(jù)挖掘檢索

      趙玉蓮

      (山東師范大學(xué)圖書館,山東 濟(jì)南 250339)

      高校作為我國培養(yǎng)高素質(zhì)人才的重要陣地,高校圖書館需為學(xué)校師生提供科研、教學(xué)所需信息資料,具有十分重要的作用,能夠結(jié)合其他學(xué)科力量,構(gòu)成學(xué)科交叉優(yōu)勢,以提升信息資源在管理、組織、拓展服務(wù)及服務(wù)質(zhì)量等方面的提升。而在信息化時(shí)代下,產(chǎn)生信息渠道越來越多,個(gè)人利用信息要求不再滿足于獲取原件與檢索文件,還要求深入分析信息內(nèi)容,尋找數(shù)據(jù)隱藏價(jià)值。因此,應(yīng)當(dāng)采取數(shù)據(jù)挖掘技術(shù),以提高圖書館信息管理水平與效率,滿足高校師生科研及教學(xué)需求。

      1 數(shù)據(jù)挖掘技術(shù)概述

      數(shù)據(jù)挖掘技術(shù)是從眾多不完整、隨機(jī)模糊、有噪聲的數(shù)據(jù)中提取潛在有意義的知識(shí)與信息的過程,數(shù)據(jù)挖掘可采取數(shù)學(xué)方法或非數(shù)學(xué)方法,可以使歸納總結(jié)法,也可以是逐步演技發(fā),挖掘數(shù)據(jù)結(jié)構(gòu)有利于優(yōu)化數(shù)據(jù)庫、信息管理、過程控制及信息決策,維護(hù)數(shù)據(jù)[1]。數(shù)據(jù)挖掘涉及學(xué)科較為廣泛,包含人工智能、數(shù)據(jù)庫、數(shù)學(xué)統(tǒng)計(jì)、并行計(jì)算等,應(yīng)用范圍也隨理論發(fā)展逐漸延拓,在信息資源管理中實(shí)現(xiàn)廣泛應(yīng)用。

      高校圖書館在逐步推廣個(gè)性化服務(wù)理念下,對(duì)于信息資源分類已經(jīng)成為工作重點(diǎn),利用數(shù)據(jù)挖掘技術(shù)對(duì)讀者進(jìn)行歸納總結(jié),尋找讀者特征信息以實(shí)現(xiàn)對(duì)應(yīng)分類,即可分析學(xué)生學(xué)歷、年齡與專業(yè),掌握用戶特點(diǎn),提供針對(duì)性信息資源服務(wù),還能借此分配購置文獻(xiàn)費(fèi)用與存儲(chǔ)空間。

      2 高校圖書館信息資源管理中數(shù)據(jù)挖掘流程

      1)確定挖掘目標(biāo)。在數(shù)據(jù)挖掘前應(yīng)當(dāng)明確數(shù)據(jù)挖掘目標(biāo),如,圖書館向了解全校師生對(duì)于文獻(xiàn)類型需求,則應(yīng)當(dāng)將圖書館文獻(xiàn)分為多個(gè)類型,以此在大數(shù)據(jù)中挖掘所需信息,使得數(shù)據(jù)挖掘具有針對(duì)性,更好地為圖書館信息管理提供服務(wù)。

      2)用戶信息準(zhǔn)備??衫脠D書館系統(tǒng)確認(rèn)師生基本信息。在師生應(yīng)用圖書館中,利用RFID技術(shù)在系統(tǒng)內(nèi)部反映出個(gè)人信息,一方面在參閱文獻(xiàn)及圖書中,獲取師生詳細(xì)記錄,包含證件號(hào)、專業(yè)、借閱登記、院系、性別、年齡、類型等。另一方面則為讀者借閱歷史記錄,此為圖書信息資源管理的重要數(shù)據(jù)信息,以此為統(tǒng)計(jì)數(shù)據(jù)對(duì)象,可整合圖書條碼號(hào)、索書號(hào)、讀者編號(hào)、借閱時(shí)間、書名、歸還時(shí)間等信息[2]。對(duì)上述信息進(jìn)行詳細(xì)分類統(tǒng)計(jì)、整理分析,便于圖書館預(yù)測和分析文獻(xiàn)利用率,且借閱歷史信息還包含文獻(xiàn)書目記錄與流通日志,同樣為數(shù)據(jù)挖掘目標(biāo)。

      3)數(shù)據(jù)挖掘關(guān)鍵技術(shù)。(1)數(shù)據(jù)清理。該環(huán)節(jié)是指剔除數(shù)據(jù)中的異常數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果準(zhǔn)確性。處理圖書數(shù)據(jù)與讀者數(shù)據(jù)中,存在有噪聲、不一致、不完整數(shù)據(jù),需要對(duì)數(shù)據(jù)加以清理,其包含使用數(shù)據(jù)光滑技術(shù)及缺失值處理,對(duì)于“續(xù)借”“性別”等缺失值替換unknown,“年齡”缺失值替換ageave;記錄中字段為空則使用手工編寫SQL腳本少出,部分圖書分類號(hào)為中文字符,在挖掘程序中應(yīng)當(dāng)做好處理工作,此類壞數(shù)據(jù)需及時(shí)丟棄。(2)數(shù)據(jù)整合。當(dāng)獲取完整信息后,即可利用大數(shù)據(jù)挖掘技術(shù)深入挖掘數(shù)據(jù),此過程中需使用面向?qū)傩詺w納算法分類數(shù)據(jù),獲得數(shù)據(jù)屬性集合[3]。如,在高校圖書館信息資源管理中,產(chǎn)生數(shù)據(jù)可分為文獻(xiàn)圖書數(shù)據(jù)集合、記錄數(shù)據(jù)集合、用戶數(shù)據(jù)集合、借閱檢索圖書集合等,以此減少數(shù)據(jù)維度即挖掘難度。此過程中,在數(shù)據(jù)庫中導(dǎo)入分散數(shù)據(jù),以此構(gòu)建讀者借閱記錄。(3)數(shù)據(jù)歸約算法。在運(yùn)行數(shù)據(jù)倉庫一段時(shí)間后,其中數(shù)據(jù)量迅速增加,不采取歸約算法直接挖掘,則會(huì)初夏以下問題,一是表的每個(gè)字段均占據(jù)較大空間,提高了內(nèi)存占用率,延長了內(nèi)存導(dǎo)入時(shí)間;二是大部分單項(xiàng)為漢字字符串,候選序列生產(chǎn)時(shí)間與空間開銷均會(huì)增加,為節(jié)省空間與實(shí)踐效率,需壓縮每個(gè)事務(wù)記錄為6個(gè)字符串,且每個(gè)字符均為單個(gè)小寫字符,當(dāng)系統(tǒng)讀取屬性配置后,按照順序賦予屬性值唯一字母。如程序讀到“本科”,則會(huì)將“a”賦值本科,讀到“研究生”,則將“b”賦值“研究生”,通過以此類推的方式,讀取所有屬性值,即可構(gòu)建字母字符到屬性值的映射表,壓縮讀者數(shù)據(jù)庫為文件,將預(yù)處理文件減少,提高效率[4]。如,未壓縮數(shù)據(jù)庫前127M,數(shù)據(jù)壓縮后大小11.6M,有效節(jié)省內(nèi)存資源。

      3 高校圖書館信息資源管理中數(shù)據(jù)挖掘技術(shù)應(yīng)用

      1)優(yōu)化資源建設(shè)。高校圖書館每年購置文獻(xiàn)費(fèi)用有限,需結(jié)合高校科研、教學(xué)等情況分配各學(xué)科的文獻(xiàn)購置費(fèi)用,以此實(shí)現(xiàn)費(fèi)用均衡支出,將購置文獻(xiàn)效益充分發(fā)揮出來。原本圖書館在采集信息中通常是由少數(shù)專家與采訪人員商議決定,不可避免存在信息不全面情況,造成信息資源缺失及經(jīng)費(fèi)浪費(fèi),存儲(chǔ)文獻(xiàn)空間也有限。并且,館藏分布,包含多媒體文獻(xiàn)與傳統(tǒng)文獻(xiàn)擺放、服務(wù)器上文獻(xiàn)索引組織等,以此提高資源利用效率。

      通過挖掘圖書館圖書流通、借閱、檢索請求等數(shù)據(jù),根據(jù)類別統(tǒng)計(jì)文獻(xiàn)頻繁借閱集與拒借集,可為信息資源補(bǔ)充與豐富決策提供支持,借此分析文獻(xiàn)利用率,將過時(shí)文獻(xiàn)剔除,或是減少收集與采訪部分文獻(xiàn)。分析用戶借閱文獻(xiàn)關(guān)聯(lián),以發(fā)現(xiàn)文獻(xiàn)比例關(guān)系及關(guān)聯(lián)規(guī)則,對(duì)圖書館館藏布局及信息建設(shè)進(jìn)行優(yōu)化。

      2)拓展智能信息服務(wù)。為確保用戶短時(shí)間即可獲取信息,需收集用戶專題瀏覽集合,對(duì)每位用戶瀏覽記錄構(gòu)建事務(wù)庫,再進(jìn)行事務(wù)庫操作,具體如下:一是通過關(guān)聯(lián)規(guī)則尋找訪問頻率高于閾值項(xiàng)目及,利用分類算法將頻繁項(xiàng)目及與用戶瀏覽模式實(shí)現(xiàn)相似匹配,組織瀏覽模式相似用戶到同一服務(wù)器,減少服務(wù)器頁面?zhèn)鬏敂?shù)量及服務(wù)器緩存。二是對(duì)于事務(wù)庫內(nèi)訪問頻率超過閾值的專題及,通過關(guān)聯(lián)分析獲得專題關(guān)聯(lián)規(guī)則,將其存儲(chǔ)至服務(wù)器知識(shí)庫,用戶進(jìn)行網(wǎng)頁瀏覽,即可根據(jù)規(guī)則對(duì)關(guān)聯(lián)頁預(yù)先連接,提高響應(yīng)速度。

      智能信息檢索支持聯(lián)想檢索、模糊檢索、概念檢索及多語言檢索,還能借助聚類算法聚類分析查詢結(jié)果,保證呈現(xiàn)內(nèi)容條理化,便于用戶篩選。

      3)實(shí)現(xiàn)自動(dòng)化信息處理。圖書館信息資源管理中,文本數(shù)據(jù)較多,可通過文本挖掘技術(shù)自動(dòng)摘要分類文本數(shù)據(jù)文檔。其中,文本自動(dòng)摘要應(yīng)用統(tǒng)計(jì)算法,挑出與主題聯(lián)系密切的原文語句,自動(dòng)生成文本摘要,該數(shù)據(jù)挖掘?qū)τ陔娮悠诳㈦娮訄D書等文獻(xiàn)信息應(yīng)用價(jià)值較高。而文檔自動(dòng)分類則是結(jié)合文檔文本數(shù)據(jù)特征挖掘文檔類別,歸入恰當(dāng)主題范圍供人查詢。文本挖掘技術(shù)在海量數(shù)據(jù)信息下彌補(bǔ)了時(shí)間有限、人力不足的問題,為高校圖書館信息資源服務(wù)提供了保障。

      4 總結(jié)

      綜上所述,在高校圖書館信息資源管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠優(yōu)化和豐富信息資源,提高信息服務(wù)質(zhì)量,拓展信息服務(wù)范圍,進(jìn)而為高??蒲屑敖虒W(xué)提供范圍廣、質(zhì)量高的信息服務(wù)。因此,高校圖書館應(yīng)當(dāng)在此過程中,通過數(shù)據(jù)清理、數(shù)據(jù)整合及數(shù)據(jù)歸約算法的方式,優(yōu)化圖書館信息資源建設(shè),拓展智能信息服務(wù),實(shí)現(xiàn)自動(dòng)化信息處理。

      猜你喜歡
      信息資源管理數(shù)據(jù)挖掘檢索
      美軍信息資源管理戰(zhàn)略概況研究與啟示
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      2019年第4-6期便捷檢索目錄
      大數(shù)據(jù)在部隊(duì)信息資源管理中的運(yùn)用
      電子測試(2018年4期)2018-05-09 07:28:33
      淺談西藏農(nóng)牧業(yè)信息資源管理
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      《信息資源管理學(xué)報(bào)》2016年總目錄
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      东兰县| 柯坪县| 眉山市| 上虞市| 石渠县| 方城县| 淳安县| 叶城县| 商洛市| 杭锦后旗| 山东省| 根河市| 宜宾县| 广河县| 赣州市| 雷波县| 阳曲县| 思茅市| 盐城市| 花垣县| 明光市| 海丰县| 文昌市| 曲阜市| 齐齐哈尔市| 肥西县| 桃园县| 本溪市| 张家港市| 新干县| 沂水县| 岳阳市| 西乌珠穆沁旗| 吴忠市| 翁牛特旗| 贵阳市| 上林县| 西平县| 鸡西市| 孟村| 乐昌市|