李小璽 李學
摘? ?要:順應時代的發(fā)展,遵循高校改革方案,促進高職院校圖書館的發(fā)展建設工作迫在眉睫。通過對數據的收集、整理和分析發(fā)現,圖書使用率低、圖書資源浪費是高職院校普遍存在的問題。將數據挖掘技術和圖書館管理有效結合,從數據收集、整理、分析、處理、挖掘、實施等方面來解決這一難題。
關鍵詞:高職院校;圖書館;數據挖掘
相比于高等院校的智慧圖書館、移動圖書館,高職院校圖書館的發(fā)展受到較大阻力。辦學性質在某種程度上制約了圖書館的發(fā)展,在資金、設備、技術等方面尤為明顯。本次研究,無論設備支持還是技術支持幾乎都是零成本?;旧辖鉀Q了圖書使用率低、圖書資源嚴重浪費的問題,使得圖書館這一典型的服務性場所能為廣大師生提供更優(yōu)質的服務。
1? ? 高職院校圖書館現狀分析
通過對同類院校的走訪和調查以及網上開展的問卷結果的分析,發(fā)現高職院校圖書館中普遍存在如下問題:(1)圖書使用率低,圖書資源嚴重浪費。一些冷門圖書甚至無人借閱。(2)圖書館藏書目標不明確,經常出現購置新書無人借閱的情況。缺少對讀者的借閱需求分析,從而造成資金浪費。(3)館藏分布不合理。很難找到甚至找不到讀者需要的圖書,導致地理分布邊緣化的圖書長期無人借閱。(4)圖書管理人員的工作模式欠佳,嚴重影響工作效率。
2? ? 數據挖掘技術簡介
數據挖掘,一般是指從大量的數據中自動搜索隱藏于其中的、有特殊關系的信息的過程。數據挖掘技術幫助人們從數據的海洋中提煉出有價值的知識和規(guī)則,以從不同的角度、方面、側重點去研究和分析,使數據得到更為充分的利用。數據挖掘技術改變了原有的信息管理模式,不再局限于信息的采集、整理、存儲等工作,轉而升級為更高層次和更加復雜的信息整合、數據處理、知識提取等工作。
3? ? 數據挖掘在高職院校圖書館中的應用
3.1? 研究設計
通過對數據挖掘技術的研究和使用,找到其在圖書館中的主要應用方向。(1)數據分析:對讀者的借閱歷史記錄進行分析與研究,挑選出數據挖掘工作所必要的數據,進行數據加工和處理,使之成為能夠進行數據挖掘的數據源。(2)數據挖掘:選擇聚類算法中的K-MEANS算法對讀者進行數據分析。將讀者細化分為多個相似的讀者群。在群內運用關聯(lián)規(guī)則算法中的APRIORI算法對數據進行數據挖掘。然后分析結果,為向讀者推薦圖書做好準備。(3)功能實現:利用ASP,Java,SQL等技術,在原有圖書管理系統(tǒng)中加入圖書薦購功能模塊,方便收集用戶推薦書目。利用網頁的發(fā)布功能,將數據挖掘的結果(熱門圖書排行榜、關聯(lián)圖書一覽表、專家推薦功能書目單)公布在學校圖書館的網站上,方便廣大師生查閱圖書資料。(4)圖書分類:根據中圖法圖書分類,對圖書大類進行關聯(lián)分析。對于讀者借閱的書目,根據中圖法分類提取大類的索書號,然后通過關聯(lián)分析,找到隱藏在大類之間的關聯(lián)關系,根據關系來調整圖書的上架、排架、下架和采購工作。
3.2? 過程實施
挖掘工具:數據挖掘屬于典型的面向數據的分析與管理技術,能夠為決策提供必要的數據支持。本次研究采用SPSS MODELER數據挖掘工具完成應用開發(fā),其算法比較先進,具有過程直觀、功能強大的優(yōu)勢,能夠充分滿足系統(tǒng)開發(fā)過程中用戶的個性化需求,并能夠顯著提升系統(tǒng)開發(fā)的效率并縮短開發(fā)周期。
數據選?。罕敬窝芯繉⒈拘D書管理系統(tǒng)中的讀者借閱記錄信息作為數據源進行數據挖掘,具體數據為2018年1月—2018年12月的讀者借還書記錄。進入圖書管理系統(tǒng)后,選擇相應的時間段進行查詢,結果顯示近一年的讀者借閱記錄,通過系統(tǒng)自帶的導出功能將原始數據導出為Excel表格,方便后續(xù)使用。
數據預處理:空白數據會對數據挖掘結果的準確性產生較大的影響,需要查找圖書數據庫將必要信息補全,或者通過將無法填充的數據刪除等方式來保證分析的準確性。一天內多次借還相同書目則會產生重復數據,對挖掘結果造成不利影響。因此,在挖掘前要識別并刪除冗余、重復的數據,減小數據規(guī)模,提高數據的清晰度。
挖掘分析:本次研究預計采用聚類分析和關聯(lián)規(guī)則分析進行數據挖掘。通過聚類分析將讀者分成幾個群,同一群中讀者有相似的愛好。通過觀察相同讀者群內讀者的節(jié)約行為,準確了解讀者的閱讀喜好,從而有針對性地開展個性化服務。使用關聯(lián)規(guī)則挖掘的目的是分析用戶之間圖書借閱的內在關聯(lián)關系,主要采用索書號和分類號開展研究工作。
4? ? 研究價值
(1)提供有效教育的功能。圖書館是學生獲取知識的最佳場所,可以運用數據挖掘技術智能推薦讀者所需書籍。相比于以前讀者自己檢索或管理人員人工推薦的方法,更加準確和高效。(2)優(yōu)化館藏建設的功能。通過關聯(lián)數據分析,發(fā)現圖書之間的潛在聯(lián)系,對圖書的排架、整理、上架等工作提出科學的指導意見。(3)推薦圖書購置的功能??梢圆捎脭祿诰蚣夹g中的遺傳算法,利用種群進化來主動尋優(yōu),根據不同領域熱度給出不同的權重,為采購方案的制定給出科學的指導意見,有效利用購書經費。(4)新啟動的功能。推薦系統(tǒng)的核心問題在于新用戶啟動和新書啟動。解決新用戶啟動的問題:讀者登錄后,系統(tǒng)根據讀者的個人信息(系部、專業(yè)),顯示當前圖書使用率排行榜,同時讀者可以查看一定時期內的熱門圖書排行榜,有助于學生選擇圖書。解決新書啟動的問題:利用讀者的圖書薦購信息對新書進行關聯(lián)挖掘,找到新到圖書與讀者之間的關聯(lián)規(guī)則,然后向讀者進行推薦。
5? ? 結語
圖書館作為我國的傳統(tǒng)服務行業(yè),不僅肩負著為廣大讀者提供信息資源的重要使命,還肩負著保護人類文化遺產的重要責任。高職院校圖書館要想更好地為廣大師生提供服務,必須利用現代化的信息技術,對服務管理工作進行創(chuàng)新,加快圖書館資源的數字化建設。
[參考文獻]
[1]嚴春來.大數據環(huán)境下數據挖掘在高校圖書館中的應用研究[J].網絡安全技術與應用,2017(3):113.