高躍峰
摘要:隨著我國教育事業(yè)的逐漸完善,圖書館作為人們獲取知識的一個重要途徑受到了各界人士的高度關注?;诖?,本文主要針對數據挖掘技術在圖書館管理信息系統(tǒng)中的應用流程、關聯(lián)規(guī)則挖掘、讀者服務和應用效果進行分析,進一步明確數據挖掘技術的主要功能,更好地發(fā)揮出科學技術在教育事業(yè)中的應用效果,希望為我國圖書館管理信息系統(tǒng)的完善提供參考依據。
關鍵詞:數據挖掘技術;圖書館;讀者服務
前言:
近幾年來,我國正逐漸走向信息化的道路,數據挖掘技術作為一項專業(yè)化的信息處理技術備受關注。眾所周知,我國圖書館藏書量較大,并且每一天都隨著世界的變化而在不斷更新,需要處理的信息量也持續(xù)攀升。基于此,在圖書館管理信息系統(tǒng)中充分利用數據挖掘技術是非常必要的,進一步改變傳統(tǒng)的手工加工管理時代,從而提高圖書館信息管理的整體水平。
一、數據挖掘技術的功能
數據挖據技術是一種新型的信息化處理技術,其主要原理是對工作中產生的大量數據資料進行分析,并且在分析的過程中發(fā)現(xiàn)隱藏在數據中知識和規(guī)律,最大限度的發(fā)揮出數據的重要作用,為相關人員在工作的過程中節(jié)省大量的時間和精力,便于他們更加直接的獲取到自己想要的信息[1]。目前,科學家將數據挖掘技術按照其功能劃分為兩個方面。一方面進行預測性數據分析,在資料初步分析信息結論的基礎上,對其進行未來預測,主要包括分類型數據預測和統(tǒng)計回歸型預測兩個部分。另一方面進行描述性數據分析,主要是指對已經收集到的資料信息進行系統(tǒng)化的描述,在與預測性數據分析相結合的基礎上,更好的進行海量數據的分類。
二、數據挖掘技術在圖書館管理信息系統(tǒng)中的應用
(一)應用流程
在實際的圖書館管理信息系統(tǒng)運行過程中,數據挖掘技術主要是通過“選擇挖掘工具—收集處理數據—數據庫挖掘—數據分析總結”這一流程步驟實現(xiàn)應用的。具體來講:
在進行“選擇挖掘工具”的流程環(huán)節(jié)時,人們通常選擇“SQLServer2005”所謂數據挖掘的軟件工具。與傳統(tǒng)的數據挖掘工具相比,“SQLServer2005”整合了“T-SQL”事務處理模塊、“CLR”通用語言模塊、數據加密模塊、“SMTP”郵件模塊、“HTTP”終端模塊等多個功能模塊,具有極強的優(yōu)勢特點和應用價值;其后,便可通過操作“SQLServer2005”軟件工具,實現(xiàn)基本數據的采集和處理。在這一過程當中,相關人員首先要從軟件服務其中找到相應的信息表格,并對表格中存在的不對稱、不完善問題進行優(yōu)化補充。在達成表格信息的完善之后,便可啟動“SQLServer2005”工具,對表格做出進一步的技術處理,使表格信息更加便于分析和管理;再后,便可進行“數據庫挖掘”環(huán)節(jié)的相應操作。對于這一環(huán)節(jié),相關人員一定要提起足夠的重視,嚴格按照軟件工具的技術步驟實施挖掘,以此保證數據挖掘的準確、高效[2];最后,即需要對挖掘出的信息進行分析處理。
(二)圖書關聯(lián)規(guī)則挖掘方面
1.數據準備及處理
圖書關聯(lián)規(guī)則挖掘前,應做好數據準備,并對數據進行預處理。數據準備過程需要的數據,包括書籍名稱、借閱次數等內容。數據預處理方法,包括空值處理、噪聲處理、數據集成三種方法。以噪聲處理為例,影響數據挖掘結果的數據,既“噪聲”。如未給予處理,隨借閱次數的增加,重復統(tǒng)計的現(xiàn)象較容易發(fā)生。為避免上述問題,應根據讀者條碼的不同,完成預處理工作。
2.挖掘過程及結果
圖書關聯(lián)規(guī)則的挖掘過程如下:(1)生成事務集:圖書借閱過程中,借閱者的支持度,是決定挖掘效果的主要因素。為提高挖掘效率,應首先將支持度低的紀錄刪除。選擇支持度較高的事務,將其作為樣本,挖掘關聯(lián)規(guī)則。(2)最小支持度:最小支持度是決定挖掘效率的主要因素,因此,為提高數據處理效率,確定最小支持度指標是關鍵。(3)挖掘算法:可將Apriori算法,應用到關聯(lián)規(guī)則的挖掘中,用以獲取關聯(lián)結果。當挖掘結果為10—20時,表明圖書較為活躍。當挖掘結果處于10以下時,則表明圖書活躍度較差。根據上述關聯(lián)結果的數據,有關人員既能夠得到最終的圖書關聯(lián)規(guī)則挖掘結論。
(三)讀者服務方面
數據挖掘技術可以提升圖書館管理的水平,在信息系統(tǒng)中應用數據挖掘技術一個顯著的優(yōu)勢是提升了對讀者的服務效果。一般來說,現(xiàn)代圖書館的藏書規(guī)模往往在10萬甚至百萬冊以上,如此規(guī)模的圖書,依靠紙質信息進行記錄和管理勢必存在困難,當讀者進入圖書館查找圖書時,也存在困擾。應用數據挖掘技術,可以將所有圖書進行編號,以不同內容為標準進行分類,在大類別下設置小類別,直到所有書籍實現(xiàn)編號的精細化。
(四)應用效果
為了檢驗數據挖掘技術在圖書館管理信息系統(tǒng)中的應用效果,可采用如下方法對系統(tǒng)進行檢驗:表單檢測:表單內容是管理員、讀者使用圖書館管理信息系統(tǒng)的媒介,其測試內容包含標題欄功能測試、TAB鍵測試系統(tǒng)是否需要設置ESC(全屏退出)、標題輸入功能以及列表間距是否合理等。系統(tǒng)鏈接測試則需要評估導航條、靜態(tài)信息鏈接的準確性、系統(tǒng)各頁面鏈接的準確性以及圖書鏈接的準確性等。數據庫測試需通過對單元、系統(tǒng)及集成狀況的測試,評估圖書館管理信息系統(tǒng)運行過程中是否會出現(xiàn)錯誤輸出或一致性錯誤。
經過上述測試項目的多次重復測試后,基于數據挖掘技術的圖書館管理信息系統(tǒng)測試結果表明:該系統(tǒng)的功能均可正常運行,系統(tǒng)各頁面鏈接正常,系統(tǒng)登錄反應、鏈接顯示反應速度較快;讀者可通過對圖書館管理信息系統(tǒng)的便捷操作,掌握圖書館的圖書上架信息,而系統(tǒng)則可根據讀者的檢索記錄、借閱記錄自動為其推薦相應類型圖書;管理員可利用該系統(tǒng)獲取讀者的閱讀需求,并制定適宜的圖書館資源管理方案。
結論:
綜上所述,與其他技術相比,數據挖掘技術的描述性數據分析功能、預測性數據分析功能為其在圖書館管理信息系統(tǒng)中的應用奠定了良好的基礎。在圖書館管理信息系統(tǒng)中引入數據挖掘技術,可有效促進圖書館管理信息系統(tǒng)功能的強化,使其為圖書館管理工作帶來更多的便捷。而從讀者層面來講,該技術的引入可以提高讀者的滿意度,間接促進圖書資源價值的發(fā)揮。
參考文獻:
[1]張昕.數據挖掘技術在圖書館管理信息系統(tǒng)中的應用[J].湖南城市學院學報(自然科學版),2016,25(05):63-64.
[2]徐德俊.數據挖掘技術在圖書館管理信息系統(tǒng)中的應用[J].黑龍江史志,2015(05):266-268.