張冬
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館數(shù)據(jù)庫,挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類號: TP393. 41 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書館數(shù)據(jù)庫中數(shù)據(jù)量的增加,圖書館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書館數(shù)據(jù)庫,利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。本研究過程包括:數(shù)據(jù)倉庫建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶提供挖掘的知識。
2 建立數(shù)據(jù)倉庫
參考文獻(xiàn):
[1] 鮑靜,范生萬.基于數(shù)據(jù)挖掘的圖書數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書情報(bào)學(xué)刊,2008(2).
[2] 陸覺民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶的數(shù)字圖書館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書館讀者行為分析[J]. 現(xiàn)代圖書情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書情報(bào)技術(shù),2005(10).endprint
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館數(shù)據(jù)庫,挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類號: TP393. 41 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書館數(shù)據(jù)庫中數(shù)據(jù)量的增加,圖書館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書館數(shù)據(jù)庫,利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。本研究過程包括:數(shù)據(jù)倉庫建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶提供挖掘的知識。
2 建立數(shù)據(jù)倉庫
參考文獻(xiàn):
[1] 鮑靜,范生萬.基于數(shù)據(jù)挖掘的圖書數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書情報(bào)學(xué)刊,2008(2).
[2] 陸覺民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶的數(shù)字圖書館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書館讀者行為分析[J]. 現(xiàn)代圖書情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書情報(bào)技術(shù),2005(10).endprint
摘要:該文將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館數(shù)據(jù)庫,挖掘主題確定后,依次進(jìn)行了數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理、數(shù)據(jù)再豐富、編程工作、數(shù)據(jù)挖掘。利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。其中數(shù)據(jù)挖掘是使用Clementine12完成。
關(guān)鍵詞:數(shù)據(jù)挖掘;圖書館;關(guān)聯(lián)規(guī)則;SqlServer;Clementine
中圖分類號: TP393. 41 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)31-7260-03
Abstract: In this paper ,Data Mining Techniques is used on the library database. After determined areas of focus on the mining, the stages of the knowledge discovery processes are done,they are Data selection, Cleaning, Enrichment, Coding, Data mining, Reporting. By Analyzing Association Mining of the study,readers other borrowing behaviors is recovered when borrowing one type of books. The mining-results can help optimize the layout of library and provide technical and decision support for the librarys managers . Clementine12 is used for Data Mining.
Key words: data mining; library; asocciation rules; SqlServer; Clementine
1 概述
我所在圖書館文獻(xiàn)管理系統(tǒng)已經(jīng)建成和使用多年,隨著圖書館數(shù)據(jù)庫中數(shù)據(jù)量的增加,圖書館的流通管理數(shù)據(jù)正在快速上漲。但海量、分散的流通數(shù)據(jù),往往很難直接發(fā)現(xiàn)其中相互間的聯(lián)系和規(guī)律。本研究將數(shù)據(jù)挖掘技術(shù)應(yīng)用于我院的圖書館數(shù)據(jù)庫,利用關(guān)聯(lián)挖掘?qū)D書館的流通管理數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)讀者借閱一類圖書時(shí)的其他借閱行為,便于為讀者推薦相關(guān)文獻(xiàn),也可以優(yōu)化館藏布局,并為圖書館管理人員提供技術(shù)和決策支持。本研究過程包括:數(shù)據(jù)倉庫建立,根據(jù)挖掘主題進(jìn)行數(shù)據(jù)集成和選擇;數(shù)據(jù)變換,數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式;數(shù)據(jù)清理,除噪聲和刪除不一致數(shù)據(jù);數(shù)據(jù)挖掘,使用Clementine12,選擇特定的算法實(shí)施數(shù)據(jù)挖掘;知識表示,分析和研究數(shù)據(jù)挖掘結(jié)果,向用戶提供挖掘的知識。
2 建立數(shù)據(jù)倉庫
參考文獻(xiàn):
[1] 鮑靜,范生萬.基于數(shù)據(jù)挖掘的圖書數(shù)據(jù)預(yù)處理[J]. 大學(xué)圖書情報(bào)學(xué)刊,2008(2).
[2] 陸覺民,鄭宇.基于矩陣的數(shù)據(jù)挖掘技術(shù)在數(shù)字化圖書館中的應(yīng)用[J]. 現(xiàn)代情報(bào),2007(12) .
[3] 李虹.面向用戶的數(shù)字圖書館信息服務(wù)模式研究[J]. 情報(bào)雜志,2007(08) .
[4] 王偉,張征芳,王海明.基于數(shù)據(jù)挖掘的圖書館讀者行為分析[J]. 現(xiàn)代圖書情報(bào)技術(shù),2006(11) .
[5] 魏育輝,潘潔.圖書流通數(shù)據(jù)的關(guān)聯(lián)挖掘量化分析方法[J]. 現(xiàn)代情報(bào),2005(11) .
[6] 王燕,溫有奎.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在數(shù)字圖書館中的應(yīng)用[J]. 情報(bào)科學(xué),2007(6) .
[7] 張永梅,韓焱,薛海麗.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化,2005(10) .
[8] 司徒浩臻.數(shù)據(jù)挖掘技術(shù)在圖書館信息服務(wù)中的應(yīng)用[J]. 現(xiàn)代圖書情報(bào)技術(shù),2005(10).endprint