• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘在國內(nèi)圖書館應(yīng)用領(lǐng)域研究綜述

      2015-11-14 11:40:32俞錦梅
      圖書與情報(bào) 2015年2期
      關(guān)鍵詞:數(shù)據(jù)挖掘個(gè)性化圖書館

      俞錦梅

      (廣東中山市中等專業(yè)學(xué)校圖書館 廣東中山 528458)

      隨著數(shù)據(jù)庫技術(shù)應(yīng)用的快速普及,圖書館信息的種類和形式越來越豐富,需要存儲(chǔ)和傳播的信息資源數(shù)量日益龐大,數(shù)據(jù)量呈現(xiàn)“爆發(fā)式”增長(zhǎng)的趨勢(shì)。然而,面對(duì)海量數(shù)據(jù)的處理,圖書館傳統(tǒng)的信息化管理模式和手段卻顯得無能為力,有些圖書館不由自主地陷入了“數(shù)據(jù)豐富,知識(shí)貧乏”的局面。在這種情況下,如果將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館服務(wù)之中,就可從大量圖書館數(shù)據(jù)中篩選出隱藏的、有用的數(shù)據(jù),發(fā)掘表面上復(fù)雜無序信息的內(nèi)在聯(lián)系,找出有價(jià)值的信息知識(shí),實(shí)現(xiàn)“數(shù)據(jù)→信息→知識(shí)→價(jià)值”的轉(zhuǎn)變。

      目前,作為數(shù)據(jù)庫研究、應(yīng)用與開發(fā)最活躍的分支之一,數(shù)據(jù)挖掘技術(shù)正在帶動(dòng)學(xué)術(shù)研究進(jìn)步,并推動(dòng)產(chǎn)業(yè)界的不斷發(fā)展,數(shù)據(jù)挖掘也成為圖書館應(yīng)用研究的一項(xiàng)重要課題,不斷地吸引著國內(nèi)外圖書館界的專家學(xué)者們的極大關(guān)注。筆者嘗試對(duì)檢索文獻(xiàn)進(jìn)行整理歸納,綜述數(shù)據(jù)挖掘在國內(nèi)圖書館領(lǐng)域應(yīng)用研究的現(xiàn)狀及熱點(diǎn),分析當(dāng)前研究存在的不足,以為進(jìn)一步的研究應(yīng)用指引方向。

      1 國外數(shù)據(jù)挖掘在圖書館應(yīng)用的研究現(xiàn)狀

      國外最早以數(shù)據(jù)挖掘在圖書館中的應(yīng)用為主題的論文出現(xiàn)在1997年,自此之后,國外許多專家學(xué)者開始關(guān)注數(shù)據(jù)挖掘在圖書館領(lǐng)域的應(yīng)用。圍繞面向圖書館的數(shù)據(jù)挖掘技術(shù),不少學(xué)者還提出了應(yīng)用理論及實(shí)現(xiàn)方法。從發(fā)文量來看,據(jù)統(tǒng)計(jì),SCI收錄數(shù)據(jù)挖掘技術(shù)方面的文章呈現(xiàn)出逐年遞增的趨勢(shì),其目前收錄的圖書館領(lǐng)域有關(guān)數(shù)據(jù)挖掘技術(shù)應(yīng)用的文獻(xiàn)將近30篇。尤其是近幾年來,歐洲和北美地區(qū)對(duì)數(shù)據(jù)挖掘技術(shù)在圖書館的理論與應(yīng)用方面取得豐碩的成果。例如,美國加州大學(xué)Michael cooper教授利用數(shù)據(jù)挖掘?qū)又荽髮W(xué)數(shù)字圖書館使用記錄進(jìn)行分析,得出了不同類型用戶的逗留時(shí)間規(guī)律,他還構(gòu)建了數(shù)學(xué)模型,應(yīng)用時(shí)間序列以及聚類等分析方法研究圖書館用戶的行為規(guī)律,并對(duì)未來的趨向進(jìn)行了科學(xué)預(yù)測(cè)。芝加哥大學(xué)圖書館的Swansan開發(fā)了Arrowsmith軟件系統(tǒng)。該系統(tǒng)可以對(duì)數(shù)據(jù)庫文獻(xiàn)信息進(jìn)行深度挖掘,探索文獻(xiàn)中信息之間的內(nèi)在聯(lián)系,挖掘有價(jià)值的信息知識(shí),這一成果吸引了該領(lǐng)域?qū)<覍W(xué)者的廣泛關(guān)注。Papatheodorou等人提出數(shù)據(jù)挖掘技術(shù)可用于圖書館數(shù)字化數(shù)據(jù)分析,其結(jié)果可成為圖書館管理者制定科學(xué)館藏和管理策略的重要依據(jù)。

      2 數(shù)據(jù)挖掘在圖書館應(yīng)用的研究熱點(diǎn)

      2.1 數(shù)據(jù)挖掘在數(shù)字圖書館的應(yīng)用

      目前,數(shù)據(jù)挖掘技術(shù)主要應(yīng)用于數(shù)字圖書館讀者分析研究、資源建設(shè)優(yōu)化,以及多媒體數(shù)字資源挖掘等幾個(gè)方面。關(guān)于讀者分析研究,大部分專家學(xué)者采用聚類分析方法對(duì)讀者類別進(jìn)行劃分,而后再進(jìn)一步進(jìn)行關(guān)聯(lián)規(guī)則分析,以對(duì)每一類讀者的借閱特征進(jìn)行深入挖掘,精確地掌握讀者信息,更好地實(shí)現(xiàn)為讀者提供服務(wù);也有學(xué)者引入“讀者信息域的概念”,運(yùn)用數(shù)據(jù)倉庫技術(shù),對(duì)讀者信息進(jìn)行全面挖掘,確保能對(duì)讀者特征進(jìn)行準(zhǔn)確的分析。還有學(xué)者將數(shù)據(jù)挖掘應(yīng)用到讀者主觀感受的研究之中,例如,徐原青在數(shù)字圖書館總體規(guī)劃的早期就引入了數(shù)據(jù)挖掘技術(shù),通過構(gòu)建數(shù)據(jù)倉庫,利用Analysis Services 2000數(shù)據(jù)處理機(jī)制,對(duì)基于讀者滿意度的數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用進(jìn)行了研究。在圖書館資源建設(shè)優(yōu)化方面,潘小楓從數(shù)據(jù)應(yīng)用數(shù)字圖書館管理系統(tǒng)建設(shè)、館藏的深層次加工,以及網(wǎng)絡(luò)信息資源挖掘等方面提出了推進(jìn)數(shù)字圖書館發(fā)展策略;有的學(xué)者提出了應(yīng)用基于數(shù)據(jù)挖掘的數(shù)字圖書館館藏建設(shè)評(píng)價(jià)方法,通過評(píng)價(jià)為優(yōu)化館藏策略提供參考;還有學(xué)者立足于對(duì)數(shù)字圖書館借閱數(shù)據(jù)進(jìn)行挖掘分析,對(duì)圖書館信息資源的利用情況進(jìn)行評(píng)價(jià)等角度開展研究。對(duì)于多媒體數(shù)字資源挖掘研究,李默提出使用Web挖掘等技術(shù)構(gòu)建多媒體資源用戶行為分析的原型系統(tǒng),采用頻繁模式樹算法對(duì)用戶信息進(jìn)行分析的方法。

      2.2 數(shù)據(jù)挖掘在高校圖書館的應(yīng)用

      國內(nèi)圖書情報(bào)學(xué)的專家學(xué)者圍繞數(shù)據(jù)挖掘在高校圖書館的應(yīng)用開展研究。比如,趙衛(wèi)軍就數(shù)據(jù)挖掘在高校圖書館資源優(yōu)化、智能化服務(wù)、信息自動(dòng)化處理等方面的應(yīng)用展開了討論;王慧敏等利用SPSS和MATLAB軟件作為數(shù)據(jù)挖掘工具,以西安工程大學(xué)圖書館自動(dòng)化管理系統(tǒng)的館藏?cái)?shù)據(jù)作為基本數(shù)據(jù)源,對(duì)西安工程大學(xué)圖書館的入庫比例以及各學(xué)院借閱量排名進(jìn)行對(duì)比細(xì)分,探討數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用;孫健波在碩士論文中,利用k-means算法實(shí)現(xiàn)了對(duì)讀者和圖書的聚類分析,根據(jù)聚類結(jié)果指導(dǎo)圖書館管理和對(duì)讀者個(gè)性化服務(wù);同時(shí),他還對(duì)Apriori算法進(jìn)行了改進(jìn),采用關(guān)聯(lián)規(guī)則挖掘?qū)ψx者數(shù)據(jù)和圖書數(shù)據(jù)進(jìn)行挖掘,探索那些隱藏在數(shù)據(jù)中的潛在規(guī)律。金瑤對(duì)數(shù)據(jù)挖掘在高校圖書館的資源管理、信息服務(wù),以及圖書館工作管理進(jìn)行了探討;楊光和張學(xué)潮提出了利用數(shù)據(jù)挖掘技術(shù),對(duì)圖書館信息系統(tǒng)中隱藏的用戶相關(guān)的知識(shí)進(jìn)行發(fā)掘,并以山西大學(xué)為例,對(duì)圖書館用戶行為進(jìn)行了分析。此外,有的學(xué)者提出了基于數(shù)據(jù)挖掘的高校圖書館圖書采購計(jì)劃輔助決策方法;有的學(xué)者提出利用數(shù)據(jù)挖掘構(gòu)建web學(xué)科導(dǎo)航系統(tǒng),對(duì)圖書館信息資源系統(tǒng)進(jìn)行豐富;還有學(xué)者提出了基于數(shù)據(jù)挖掘技術(shù)的圖書館信息系統(tǒng)建設(shè)策略。

      2.3 數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)中的應(yīng)用

      除了將數(shù)據(jù)挖掘用于高校圖書館之外,不少專家針對(duì)數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)方面進(jìn)行了積極的探索。國內(nèi)對(duì)數(shù)據(jù)挖掘在圖書館個(gè)性化服務(wù)的應(yīng)用研究包括以下幾個(gè)方面:個(gè)性化服務(wù)模型構(gòu)建,個(gè)性化服務(wù)軟件開發(fā)。吳一平提出了基于智能聚合技術(shù)的圖書館個(gè)性化信息服務(wù)方法;史艷梅通過對(duì)CMPS系統(tǒng)模型的設(shè)計(jì),實(shí)現(xiàn)對(duì)用戶興趣的獲?。涣榈忍接懥舜植诩湍:垲愃惴☉?yīng)用到圖書館個(gè)性化服務(wù)中的方法;張英等提出了適合圖書館多媒體數(shù)據(jù)挖掘的系統(tǒng)框架,并且給出了對(duì)音頻、圖像以及視頻等多媒體進(jìn)行挖掘的方法;在個(gè)性參考咨詢研究方面,楊亞華提出了把知識(shí)管理、知識(shí)挖掘和參考咨詢服務(wù)有機(jī)結(jié)合的參考咨詢服務(wù)結(jié)構(gòu);關(guān)于圖書館個(gè)性化服務(wù)軟件開發(fā),中國人民大學(xué)等高等學(xué)府率先開發(fā)了KBDL個(gè)性化服務(wù)系統(tǒng),沈陽東軟軟件股份有限公司推出的東軟Internet/Intranet應(yīng)用構(gòu)架平臺(tái)(Neusoft Web)等軟件系統(tǒng),為圖書館個(gè)性化服務(wù)提供了豐富的特色應(yīng)用。

      2.4 數(shù)據(jù)挖掘的主要方法及軟件

      綜合數(shù)據(jù)挖掘在圖書館應(yīng)用領(lǐng)域文獻(xiàn),可以把圖書館數(shù)據(jù)挖掘方法歸納為概念描述、分類和預(yù)測(cè)、聚類分析、關(guān)聯(lián)規(guī)則和偏差檢測(cè)。從現(xiàn)有文獻(xiàn)進(jìn)行分析,用于圖書館數(shù)據(jù)挖掘的技術(shù)主要包括人工神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)分析、模糊數(shù)學(xué)、歸納學(xué)習(xí)、仿生學(xué)、公式法、可視化手段等。而在圖書館應(yīng)用軟件方面,數(shù)據(jù)挖掘包括通用型工具、綜合數(shù)據(jù)挖掘工具,以及面向特定應(yīng)用工具。

      2.4.1 通用型工具

      通用型工具目前應(yīng)用最為廣泛,其所占市場(chǎng)也最大,技術(shù)手段最成熟。通用的數(shù)據(jù)挖掘工具不區(qū)分具體數(shù)據(jù)的含義,所以一般采用通用的挖掘算法,處理常見的數(shù)據(jù)類型,其中包括的主要工具有IBM公司Almaden研究中心開發(fā)的QUEST系統(tǒng),SGI公司開發(fā)的MineSet系統(tǒng),加拿大Simon Fraser大學(xué)開發(fā)的DBMiner系統(tǒng)、SAS Enterprise Miner、IBM Intelligent Miner、Oracle Darwin、SPSS Clementine、Unica PRW等軟件。

      2.4.2 綜合數(shù)據(jù)挖掘工具

      綜合數(shù)據(jù)挖掘工具反映了商業(yè)對(duì)具有多功能的決策支持工具的真實(shí)和迫切的需求。商業(yè)要求該工具能提供管理報(bào)告、在線分析處理和普通結(jié)構(gòu)中的數(shù)據(jù)挖掘能力。這些綜合工具包括Cognos Scenario和Business Objects等。

      2.4.3 面向特定應(yīng)用工具

      這一部分工具正在快速發(fā)展,在這一領(lǐng)域的廠商設(shè)法通過提供商業(yè)方案而不是尋求方案的一種技術(shù)來區(qū)分自己和別的領(lǐng)域的廠商。這些工具是縱向的、貫穿這一領(lǐng)域的方方面面,其常用工具有重點(diǎn)應(yīng)用在零售業(yè)的KD1、主要應(yīng)用在保險(xiǎn)業(yè)的Option&Choices和針對(duì)欺詐行為探查開發(fā)的HNC軟件。

      3 存在的問題

      3.1 理論研究不深入

      自20世紀(jì)90年代后期以來,國外圖書情報(bào)學(xué)的專家學(xué)者們就開始致力于圖書館數(shù)據(jù)挖掘相關(guān)理論研究,就圖書館的數(shù)據(jù)挖掘技術(shù)、應(yīng)用理論及方法而言,不少學(xué)者具有自己獨(dú)到的見解。較為典型的有:Nicholson提出了書目挖掘(Biblio mining)的概念;May Chau構(gòu)建了圖書館數(shù)據(jù)挖掘理論模型,并研發(fā)了圖書館網(wǎng)上信息數(shù)據(jù)挖掘系統(tǒng);Kyle Baner-jee對(duì)數(shù)據(jù)挖掘技術(shù)應(yīng)于圖書館的各種方式進(jìn)行了理論探討??梢哉f,關(guān)于數(shù)據(jù)挖掘理論與算法研究,國外圖書館領(lǐng)域已形成較為成熟的理論體系。相比之下,國內(nèi)圖書館界對(duì)于數(shù)據(jù)挖掘的理論研究起步較晚,從現(xiàn)有的研究文獻(xiàn)來看,大約76%的文獻(xiàn)只是介紹數(shù)據(jù)挖掘的方法,以及該方法在圖書館實(shí)踐的應(yīng)用,有的作者甚至只對(duì)其它學(xué)科文獻(xiàn)的理論研究成果進(jìn)行簡(jiǎn)單的移植,對(duì)數(shù)據(jù)挖掘在圖書館領(lǐng)域的理論基礎(chǔ)及運(yùn)用實(shí)踐缺乏個(gè)人分析研究??傮w來看,這些文章偏重于對(duì)數(shù)據(jù)挖掘技術(shù)在圖書館領(lǐng)域應(yīng)用的定性分析,對(duì)于數(shù)據(jù)挖掘在圖書館方面的應(yīng)用缺乏必要的理論研究,文章作者也并未應(yīng)用計(jì)算機(jī)仿真等定量研究手段對(duì)方法使用的可行性進(jìn)行分析,并且,國內(nèi)圖書館界目前還沒有提出具有影響力的數(shù)據(jù)挖掘模型。中國知網(wǎng)中僅一篇《數(shù)字圖書館數(shù)據(jù)挖掘的基礎(chǔ)研究》對(duì)數(shù)據(jù)挖掘技術(shù)在圖書館應(yīng)用的理論基礎(chǔ)進(jìn)行了簡(jiǎn)要的分析??傊?,數(shù)據(jù)挖掘技術(shù)在圖書館的應(yīng)用尚屬于起步階段,迄今為止,還沒有形成較為系統(tǒng)、成熟的理論體系,國內(nèi)尚未正式出版一本有關(guān)圖書館數(shù)據(jù)挖掘方面的專著,因而,對(duì)數(shù)據(jù)挖掘理論在圖書館應(yīng)用方面的探討將是長(zhǎng)期而艱巨的任務(wù)。

      3.2 應(yīng)用研究不全面

      數(shù)據(jù)挖掘是計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、可視化、人工智能和機(jī)器學(xué)習(xí)等多學(xué)科相結(jié)合的產(chǎn)物,并已成功應(yīng)用于金融、醫(yī)療、互聯(lián)網(wǎng)、學(xué)校教育和遙感等領(lǐng)域。對(duì)圖書館而言,數(shù)據(jù)挖掘主要應(yīng)用于圖書館個(gè)性服務(wù)、圖書館知識(shí)發(fā)現(xiàn)、圖書館文獻(xiàn)資源建設(shè)、數(shù)字圖書館建設(shè)、圖書館內(nèi)部工作流程優(yōu)化、圖書館用戶挖掘、圖書館用戶行為分析等方方面面。

      縱觀國內(nèi)數(shù)據(jù)挖掘在圖書館領(lǐng)域的應(yīng)用研究,從發(fā)文量上看,盡管在2007年之后,國內(nèi)相關(guān)文獻(xiàn)的總量達(dá)到一個(gè)高潮,然而,發(fā)表在圖書情報(bào)學(xué)中文核心期刊的比例不高,質(zhì)量較高的論文并不多見;從發(fā)文作者的分布來看,論文研究作者大都來自高校圖書館系統(tǒng),來自公共圖書館和高職院校圖書館的作者為數(shù)不多;從作者發(fā)文數(shù)量來看,發(fā)表論文數(shù)量3篇以上的作者只有6人,發(fā)表論文數(shù)量2篇的作者33人,由此可見,高產(chǎn)作者數(shù)量不多;從論文主題進(jìn)行分析,關(guān)于數(shù)據(jù)挖掘在高職院校圖書館應(yīng)用的文獻(xiàn)不到10篇,大約有98%的研究文獻(xiàn)是以大學(xué)圖書館為背景,很難看到有科學(xué)圖書館和公共圖書館的作者的研究成果。所有這些現(xiàn)象都說明國內(nèi)目前對(duì)公共圖書館和高職院校圖書館的數(shù)據(jù)挖掘研究并未引起足夠廣泛的重視。從方法應(yīng)用來看,現(xiàn)有文獻(xiàn)在方法應(yīng)用研究方面缺乏針對(duì)性,研究者們通常局限于將常用的貝葉斯分析、聚類分析和關(guān)聯(lián)分析應(yīng)用到圖書館借閱、采訪等業(yè)務(wù)之中,而沒有著眼于圖書館的實(shí)際業(yè)務(wù)進(jìn)行針對(duì)性的分析,有的放矢,目前尚未發(fā)現(xiàn)粗糙集與關(guān)聯(lián)規(guī)則聯(lián)合數(shù)據(jù)挖掘、時(shí)空數(shù)據(jù)挖掘,以及粗糙集理論和神經(jīng)網(wǎng)絡(luò)結(jié)合的數(shù)據(jù)挖掘等方法應(yīng)用于圖書館領(lǐng)域的研究,現(xiàn)有的方法在原理上缺乏創(chuàng)新性;另一方面,隨著“云計(jì)算”和移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展成熟,人類迎來了大數(shù)據(jù)時(shí)代,然而,從研究選題情況進(jìn)行分析,雖然在2011年就有專家學(xué)者提出了數(shù)據(jù)挖掘技術(shù)在移動(dòng)圖書館和云圖書館中應(yīng)用是未來的發(fā)展趨勢(shì),但當(dāng)前只有周艷在《現(xiàn)代情報(bào)》發(fā)表的《基于云平臺(tái)的圖書館數(shù)據(jù)挖掘技術(shù)研究》一文對(duì)數(shù)據(jù)挖掘技術(shù)在“云圖書館”的應(yīng)用進(jìn)行了探討;針對(duì)手機(jī)讀者的需求,重慶大學(xué)圖書館與國家圖書館等率先推出手機(jī)圖書館WAP網(wǎng)站,滿足移動(dòng)用戶需要,但是,從中國知網(wǎng)現(xiàn)有的數(shù)據(jù)來看,只有聶飛霞在《基于數(shù)據(jù)挖掘的移動(dòng)圖書館個(gè)性化圖書推薦服務(wù)》一文中提出了應(yīng)用數(shù)據(jù)挖掘技術(shù)的移動(dòng)圖書館個(gè)性化圖書推薦服務(wù)模式。關(guān)于大數(shù)據(jù)和云計(jì)算相結(jié)合的數(shù)據(jù)挖掘在圖書館領(lǐng)域的應(yīng)用研究,目前國內(nèi)尚未見到相關(guān)的文獻(xiàn)報(bào)道。

      3.3 研究項(xiàng)目和經(jīng)費(fèi)支持少

      在所有檢索的文獻(xiàn)中,明確標(biāo)注有支持項(xiàng)目和支持經(jīng)費(fèi)的只有14篇。其中,國家863計(jì)劃資助項(xiàng)目資助的只有一篇,國家自然科學(xué)基金和國家社會(huì)科學(xué)基金資助的論文6篇,總體來看,論文基金資助率僅為3.47%,明顯低于其它領(lǐng)域的資助水平。相對(duì)其它研究領(lǐng)域,此類項(xiàng)目支持經(jīng)費(fèi)不高。而科學(xué)研究與推進(jìn)需要經(jīng)費(fèi)的支持,尤其是數(shù)據(jù)挖掘技術(shù)門檻較高,既需要具有人工智能數(shù)理統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、數(shù)據(jù)庫等專業(yè)知識(shí)和技能,同時(shí)也需要更多的經(jīng)費(fèi)支持,為它進(jìn)一步的研究創(chuàng)造條件。

      3.4 研究成果與圖書館管理信息系統(tǒng)開發(fā)聯(lián)系不緊密

      圖外圖書館將數(shù)據(jù)挖掘的研究結(jié)合到圖書館信息系統(tǒng)建設(shè)之中,目前已開發(fā)出具有數(shù)據(jù)挖掘功能的圖書館管理信息系統(tǒng),如新西蘭克萊斯特徹奇教育學(xué)院圖書館的MyLibrary-Christ church College of Education,華盛頓大學(xué)圖書館的My Gateway-University of Washington Libraries,以及康奈爾大學(xué)的圖書館My Library Cornell University Library等等,這些系統(tǒng)的構(gòu)建都是基于數(shù)據(jù)挖掘的思想,并且在實(shí)踐中發(fā)揮了巨大的作用。相比而言,由國內(nèi)圖書館開發(fā)的真正可操作性強(qiáng)、易于實(shí)現(xiàn)、能夠指導(dǎo)實(shí)際業(yè)務(wù)的成熟產(chǎn)品卻為數(shù)不多,僅有包括中國人民大學(xué)在內(nèi)的少數(shù)幾所大學(xué)圖書館自行研發(fā)了圖書館個(gè)性化服務(wù)系統(tǒng)——KBDL系統(tǒng)?,F(xiàn)有的文獻(xiàn)中,大多偏重于數(shù)據(jù)挖掘理論的研究,對(duì)數(shù)據(jù)挖掘應(yīng)用于圖書館信息系統(tǒng)及算法測(cè)試的研究較少,大部分的研究?jī)H是局限于聚類分析、關(guān)聯(lián)規(guī)則等方法,對(duì)圖書館采訪數(shù)據(jù)進(jìn)行相應(yīng)的研究,極個(gè)別的研究者將研究的成果應(yīng)用于該館實(shí)際運(yùn)作管理。從圖書館數(shù)據(jù)挖掘軟件開發(fā)來看,大部分圖書館還 是 通 過 使 用 Intelligent Miner、SPSS Clementine、SAS Enterprise Miner、Orange、KNIME、Weka 等數(shù)據(jù)挖掘軟件對(duì)圖書館的數(shù)據(jù)進(jìn)行分析、處理和挖掘,很少用于圖書館領(lǐng)域的專用的數(shù)據(jù)挖掘軟件,現(xiàn)有的成果并不能有效地指導(dǎo)圖書館信息系統(tǒng)開發(fā)建設(shè)的實(shí)踐,圖書館復(fù)雜數(shù)據(jù)類型挖掘(Web,Text,音頻、圖形圖像、視頻等)軟件的研究在國內(nèi)尚屬空白。

      4 結(jié)語

      圖書館數(shù)據(jù)挖掘綜合了可視化技術(shù)、智能圖書館系統(tǒng)和數(shù)據(jù)挖掘等方面的知識(shí)和技術(shù),它是一個(gè)新興的研究領(lǐng)域。本文通過對(duì)數(shù)據(jù)挖掘在圖書館中應(yīng)用研究的回顧,從高校圖書館、數(shù)字圖書館、圖書館個(gè)性化服務(wù),及數(shù)字挖掘的主要方法及軟件研究等多個(gè)方面歸納總結(jié)了國內(nèi)數(shù)據(jù)挖掘在圖書館領(lǐng)域應(yīng)用的研究現(xiàn)狀??梢钥闯觯瑖鴥?nèi)圖書情報(bào)學(xué)的專家學(xué)者為數(shù)據(jù)挖掘在圖書館領(lǐng)域的應(yīng)用做了大量的研究工作,取得了豐碩的成果。但同時(shí)也應(yīng)看到:目前在該領(lǐng)域的研究,仍存在理論研究不夠深入、應(yīng)用研究不全面、研究成果與圖書館管理信息系統(tǒng)開發(fā)聯(lián)系不緊密等問題。因此,為了能使數(shù)據(jù)挖掘更好地應(yīng)用到圖書館和各項(xiàng)實(shí)踐,將來應(yīng)在理論研究上下功夫,在實(shí)踐研究上求突破,同時(shí),還要加速“一專多能”的人才培養(yǎng),加大科研經(jīng)費(fèi)的投入力度,進(jìn)一步推動(dòng)研究成果向?qū)嵺`應(yīng)用的轉(zhuǎn)化。

      [1] 奉國和,奉永桃.近十年國內(nèi)圖書館數(shù)據(jù)挖掘研究文獻(xiàn)計(jì)量分析[J].圖書館論壇,2011(1):46-49.

      [2] 唐吉深.圖書館數(shù)據(jù)挖掘技術(shù)研究現(xiàn)狀述評(píng)[J].圖書館界,2011(l):42-64.

      [3] Michael C.Patterns of a web based library catalog[J].Journal of the American Society for Information Science&Technology,2001,52(2):137-148.

      [4] R.Cooley.Web Usage Mining:Discovery and Application of Interesting Patterns from the Web Data[M].phD thesis.Dept of Computer Science.University of Minnesota.2000.

      [5] Fu Kai-Yan,LiuYan,Zhang Qin,etc.Data mining services in the university library in the application [J],Medical Information.2011,24(1):262-264.

      [6] UTHURUSAMY R.From Data Mining to Knowledge Discovery:Current Challenges and Future Directions[C].FAYGAD U.Advances in Knowledge Discovery and Data Mining.The MIT Press,1996:561-569.

      [7] HANJ,KAMBER M,TUNGAK H.SpatialClustering Methods in Data Mining[J].A Survey Geographie Data Mining and Knowledge Diseovery,2008,8(10).

      [8] 習(xí)慧丹.數(shù)據(jù)挖掘研究綜述[J].電腦與信息技術(shù),2012(2):43-45.

      [9] Nicholson S.Bibliomining for automated collection development in a digital library setting:Using data mining to discover Web-based scholarly research works [J].Journal of the American Society for Information Science and Technology,2003,54(12):1081-1090.

      [10] 高巨山.數(shù)字圖書館構(gòu)建中的數(shù)據(jù)挖掘應(yīng)用研究[J].圖書館工作與研究,2009,158(4):20-21.

      [11] 潘慶超.網(wǎng)格數(shù)據(jù)挖掘在信息服務(wù)質(zhì)量評(píng)價(jià)中的應(yīng)用[J].現(xiàn)代情報(bào),2009(7):141-143.

      [12] 徐原青.基于讀者滿意度的數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用[J].圖書館學(xué)刊,2009(7):107-109.

      [13] 潘小楓.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館建設(shè)中的運(yùn)用[J].圖書館理論與實(shí)踐,2006(4):105-106.

      [14] 李默.基于web數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館建設(shè)中的應(yīng)用[J].大學(xué)圖書情報(bào)學(xué)刊,2007(4):105-106.

      [15] 田瑞雪.國內(nèi)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究述評(píng)[J].科技信息,2014,(1):167-232.

      [16] 趙衛(wèi)軍.數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用[J].圖書館論壇,2007(4):126-128.

      [17] 王慧敏,賀興時(shí),牛四強(qiáng).數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用[J].西安工程大學(xué)學(xué)報(bào),2014(2):241-245.

      [18] 唐杰,梅俏竹數(shù)據(jù)發(fā)掘?qū)W科發(fā)展報(bào)告[EB/OL].[2013-10-17].http://www.pinggu.org/jingji/987.html.

      [19] 金瑤.數(shù)據(jù)挖掘技術(shù)在高校圖書館管理系統(tǒng)中的應(yīng)用[D].上海:華東師范大學(xué)信息學(xué)院,2010.

      [20] 楊光,張學(xué)潮.數(shù)據(jù)挖掘在高校圖書館用戶行為分析中的應(yīng)用——以山西大學(xué)圖書館為例[J].晉圖學(xué)刊,2011(2):19-27.

      [21] 吳一平.智能聚合技術(shù)在圖書館個(gè)性化信息服務(wù)中的應(yīng)用[J].圖書館工作與研究,2008(11):58-61.

      [22] 楊傳明.基于移動(dòng)代理的數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用研究[J].情報(bào)理論與實(shí)踐,2008(3):436-439.

      [23] 周艷,李萍,吳雷.基于云平臺(tái)的圖書館數(shù)據(jù)挖掘技術(shù)研究[J].現(xiàn)代情報(bào),2012(7):46-49.

      [24] 聶飛霞.基于數(shù)據(jù)挖掘的移動(dòng)圖書館個(gè)性化推薦服務(wù)[J].圖書館學(xué)刊,2014(5):46-49.

      [25] 韓麗.Agent技術(shù)在數(shù)字圖書館個(gè)性化信息服務(wù)中的應(yīng)用[J].現(xiàn)代情報(bào),2008(4):104-105.

      猜你喜歡
      數(shù)據(jù)挖掘個(gè)性化圖書館
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      堅(jiān)持個(gè)性化的寫作
      文苑(2020年4期)2020-05-30 12:35:12
      新聞的個(gè)性化寫作
      新聞傳播(2018年12期)2018-09-19 06:27:10
      圖書館
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      上汽大通:C2B個(gè)性化定制未來
      飛躍圖書館
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      滿足群眾的個(gè)性化需求
      去圖書館
      惠东县| 天柱县| 平泉县| 四平市| 遂川县| 霍山县| 依兰县| 三亚市| 洮南市| 鹤壁市| 清徐县| 织金县| 盐山县| 沙田区| 施秉县| 德保县| 台中市| 翁牛特旗| 华蓥市| 平武县| 六枝特区| 温州市| 微山县| 米易县| 双桥区| 仁怀市| 琼结县| 田阳县| 朔州市| 东至县| 灵宝市| 大渡口区| 临邑县| 商城县| 镇坪县| 华容县| 会同县| 邵阳县| 祁阳县| 贞丰县| 舟曲县|