陳海軍
(鹽城市圖書館,江蘇 鹽城 224000)
?
數(shù)據(jù)挖掘在公共圖書館管理工作中的應用
陳海軍
(鹽城市圖書館,江蘇 鹽城 224000)
[摘 要]大數(shù)據(jù)時代的到來,加速了圖書館的數(shù)字化進程,使得海量的數(shù)據(jù)信息得到完好的保存。數(shù)據(jù)挖掘技術是一種結合多門學術領域技術開發(fā)而成的新型技術,在現(xiàn)代圖書館的數(shù)字化建設過程中具有重要作用。本文探究了數(shù)據(jù)挖掘在公共圖書館管理工作中的應用。
[關鍵詞]數(shù)據(jù)挖掘;公共圖書館;管理;應用
數(shù)據(jù)挖掘技術(KDD),又叫做知識發(fā)現(xiàn)技術,是利用數(shù)據(jù)庫技術、人工智能技術、數(shù)據(jù)統(tǒng)籌等多個領域的實用技術,對信息存儲倉庫中的有用數(shù)據(jù)信息進行挖掘的一種新型技術。在金融分析、醫(yī)學數(shù)據(jù)分析和銷售產(chǎn)業(yè)管理等社會生產(chǎn)生活的各個方面,數(shù)據(jù)挖掘技術都有大量應用。在公共圖書館管理工作中,數(shù)據(jù)挖掘技術的應用,為館存信息的管理帶來了很大便利。
數(shù)據(jù)挖掘技術包括兩個基本過程:數(shù)據(jù)準備、信息挖掘。
1.1數(shù)據(jù)準備
在公共圖書館管理工作中,數(shù)據(jù)挖掘的應用首先要對四個數(shù)據(jù)集進行分析概括,洞悉書籍使用情況。第一,獲取用戶的基本信息。在信息化的圖書館中,用戶的基本信息主要分為用戶身份信息和借閱行為信息兩個部分,包括用戶姓名、年齡、性別、年齡、職業(yè)、證件號碼、聯(lián)系方式、借閱等級。第二,獲取借閱歷史信息。這一類數(shù)據(jù)信息在圖書館的日常管理工作中十分重要,主要包括用戶編號、書籍信息、借閱時間、歸還時間等。通過對這類信息的分析處理,能把圖書的實時使用狀態(tài)清晰地表達出來,并能依此進行較為準確的預測。第三,獲取圖書檢索記錄。在現(xiàn)代信息化的圖書館中,大多具有一定的圖書檢索功能,用戶在進行借閱操作前大多需要通過圖書檢索系統(tǒng)尋找圖書,這就會為圖書館管理員提供大量的用戶需求信息。對于圖書檢索信息的處理,需要獲取用戶編號信息、檢索內(nèi)容、檢索時間,其中對檢索內(nèi)容的處理,要根據(jù)檢索方式、檢索關鍵詞、檢索符合等進行分類整理。同時,圖書檢索系統(tǒng)往往具有相當大的使用量,所以關于檢索記錄的數(shù)據(jù)存儲,需要技術水平達到一定高度的硬件設施支持。第四,獲取書籍信息。書籍信息的數(shù)據(jù)集是圖書館信息系統(tǒng)建立的基礎,包括書籍名稱、書籍編號、位置編號、作者、出版社信息、學科分類、館藏日期等,對這部分信息,需要從其特征屬性進行概化處理。
1.2信息挖掘
信息挖掘階段包括以下四個環(huán)節(jié):確定挖掘目標、選擇挖掘工具、建立挖掘模型實施搜索以及結果分析。第一,確定挖掘目標。首先將數(shù)據(jù)挖掘的目標確定,一種是數(shù)據(jù)挖掘系統(tǒng)自動幫助用戶做出假設,即發(fā)現(xiàn)驅動,另一種是驗證驅動,即用戶對圖書館數(shù)據(jù)庫中的有用知識進行合理假設。第二,選擇挖掘工具,即選擇合適的軟件進行挖掘操作。第三,建立挖掘模型實施搜索,通過挖掘工具在數(shù)據(jù)庫中建立模型,進行查找,這一過程既能讓系統(tǒng)全程自行操作,也能讓用戶進行一定的主動操作。第四,結果分析。數(shù)據(jù)的挖掘需要進行數(shù)次操作,通過對結果的分析,使數(shù)據(jù)挖掘的精度達到要求范圍內(nèi)。
分類規(guī)則挖掘分類就是根據(jù)數(shù)據(jù)庫中各個數(shù)據(jù)單元的共同特征進行分類規(guī)劃。聚類規(guī)則挖掘是一種以數(shù)據(jù)單元的特點為基礎,根據(jù)其特性差異大小進行分類,即,首先分析數(shù)據(jù)進行劃分歸類、然后再確定每一部分屬于的類。預測分析是通過挖掘數(shù)據(jù),分析相應對象在一定時間的發(fā)展規(guī)律,對未來一段時間的發(fā)展進行預測。關聯(lián)規(guī)則挖掘,在圖書館數(shù)據(jù)庫中,大多數(shù)數(shù)據(jù)單元之間都會存在一定的具備相應規(guī)律的關聯(lián)性,在數(shù)據(jù)挖掘的應用中,可通過數(shù)據(jù)的關聯(lián)規(guī)則,進行數(shù)據(jù)的查詢及處理。
3.1分析用戶需求
對于用戶需求的分析,為了得到更加真實、準確的結果,相關人員需要對量足夠巨大的數(shù)據(jù)信息進行處理。比如圖書的借閱次數(shù)比例可在一定程度上反映讀者的需求,這種數(shù)據(jù)信息的挖掘來源于大量的數(shù)據(jù)挖掘,圖書館管理人員可通過數(shù)據(jù)挖掘對用戶需求進行分析,由此得出最受讀者歡迎的藏書模式,并進行相應的合理圖書管理規(guī)劃和系統(tǒng)優(yōu)化。
3.2優(yōu)化信息架構
由于公共圖書館的文獻采購費用是有一定規(guī)劃的。如何有效利用這些有限經(jīng)費,是一個很重要的問題。而數(shù)據(jù)挖掘技術的應用,能很好地優(yōu)化信息架構,解決這一難題。首先,可對公共圖書館的檢索系統(tǒng)、借閱記錄、館藏文獻記錄等數(shù)據(jù)進行分析挖掘,對于讀者需求大的文獻進行合理的補充,有效調(diào)整各類文獻的購入比例。其次,應用數(shù)據(jù)挖掘技術可從因特網(wǎng)上進行文檔的搜集和整理,從中篩選出有用的內(nèi)容,納入圖書館的信息資源,在不花費、少花費經(jīng)費的情況下最大程度地補充圖書館的電子信息資源。最后,應用數(shù)據(jù)挖掘技術,可對圖書館電子文獻進行高效有序的管理,例如,對于文本數(shù)據(jù),可引入文本發(fā)掘技術,進行資源查找、分類整理,能在減少人工操作成本的同時,完成工作量巨大的電子文獻整理工作。
圖書館的存在是記載人類文明所不可缺少的。隨著網(wǎng)絡時代的降臨,圖書館的建設發(fā)生了相應變化,信息化圖書館的建設,有效增大了圖書館的館藏容量,節(jié)約了圖書館的建設成本。數(shù)據(jù)挖掘這一新興技術的廣泛應用,大大簡化了公共圖書館復雜繁重的管理工作,為信息化圖書館的推廣建設提供了有效支持。同時,科技的不斷進步,也為數(shù)據(jù)挖掘技術在公共圖書館管理工作中的深化應用提供技術支持和硬件保障。數(shù)據(jù)挖掘技術的應用,具有廣闊前景。
主要參考文獻
[1]宋麗軍.數(shù)據(jù)挖掘在圖書館管理上的應用[J].科技創(chuàng)新與應用,2014(5).
[2]馮毅.數(shù)據(jù)挖掘技術在高校圖書館管理中的應用研究[J].中國電子商務,2013(12).
[3]黃蘭,孫林山,羅日輝.數(shù)據(jù)挖掘及其在圖書館管理中的應用[J].華南熱帶農(nóng)業(yè)大學學報,2015(2).
[收稿日期]2015-11-10
[中圖分類號]G250.7;G258.2
[文獻標識碼]A
[文章編號]1673-0194(2016)02-0169-01
doi:10.3969/j.issn.1673 - 0194.2016.02.130