張雷蕾
摘要:隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,高校圖書館傳統(tǒng)管理模式和系統(tǒng)受到了巨大的沖擊,現(xiàn)階段,結(jié)合大數(shù)據(jù)和云計算等技術(shù),提高圖書館系統(tǒng)管理功能顯得尤為重要。目前,讀者對于圖書館要求不僅僅限于傳統(tǒng)借還服務(wù)方式上,還包括網(wǎng)絡(luò)檢索、快速查閱、個性化服務(wù)等多方面。圖書館系統(tǒng)建設(shè)中要充分利用現(xiàn)代網(wǎng)絡(luò)及信息技術(shù),促進(jìn)推薦系統(tǒng)的逐步完善,加強信息審核,結(jié)合讀者需求定期推薦,進(jìn)而提高圖書服務(wù)水平。本文首先對數(shù)據(jù)挖掘的概念進(jìn)行了分析,指出了圖書館系統(tǒng)應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,對具體算法、數(shù)據(jù)處理和關(guān)鍵技術(shù)改進(jìn)提出了有效的建議和對策。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);圖書館;推薦系統(tǒng)
中圖分類號:TP311 ? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)13-0001-02
現(xiàn)代網(wǎng)絡(luò)技術(shù)的發(fā)展,使圖書館發(fā)生了翻天覆地的變革,最初的紙質(zhì)圖書館到目前的自動化、智能化圖書館,網(wǎng)絡(luò)虛擬技術(shù)在圖書館系統(tǒng)中的應(yīng)用較為普遍。目前,圖書館系統(tǒng)中服務(wù)項目逐漸增加,讀者圖書服務(wù)水平逐漸提高,但是針對性的個性化的服務(wù)項目還有待挖掘和完善。我國高校建設(shè)也十分重視圖書館的建設(shè)和發(fā)展,推進(jìn)數(shù)字化校園建設(shè)。數(shù)據(jù)挖掘技術(shù)作為信息技術(shù)中的重要組成部分,在圖書館推薦系統(tǒng)中應(yīng)用該類技術(shù),可以實現(xiàn)為讀者提供個性化服務(wù),創(chuàng)新管理形式,促進(jìn)系統(tǒng)功能優(yōu)化,進(jìn)而促進(jìn)圖書館建設(shè)的日趨完善。
1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘概念最早是在加拿大被提出,1995年加拿大蒙特利爾第一屆知識發(fā)現(xiàn)和數(shù)據(jù)挖掘國際會議上國外學(xué)者Usaama提出,后期在美國底特律舉行的學(xué)術(shù)會議上,對人工智能進(jìn)行了系統(tǒng)的分析。從20世紀(jì)依賴,數(shù)據(jù)技術(shù)逐步萬漢,數(shù)據(jù)庫系統(tǒng)建設(shè)逐步更新,數(shù)據(jù)信息整合和挖掘的水平顯著提高,很多有價值的信息被快速提取出來。由于海量信息處理的難度加大,數(shù)據(jù)挖掘和篩選技術(shù)應(yīng)運而生,數(shù)據(jù)挖掘技術(shù)逐漸被人們關(guān)注和認(rèn)可。數(shù)據(jù)挖掘技術(shù)的發(fā)展是與計算機(jī)技術(shù)革新、數(shù)據(jù)庫建設(shè)發(fā)展和網(wǎng)絡(luò)信息技術(shù)發(fā)展息息相關(guān)的。知識發(fā)現(xiàn)也是一個重要的相關(guān)概念,是指在海量信息中辨別出有價值的知識,這是對數(shù)據(jù)和信息的高級處理過程。數(shù)據(jù)挖掘技術(shù)是知識發(fā)現(xiàn)的核心技術(shù),是從數(shù)據(jù)庫中提取特定規(guī)律的數(shù)據(jù)和信息,作為參考,進(jìn)而提煉出用戶所需的最終信息和資源。
2 圖書館服務(wù)系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢
數(shù)據(jù)挖掘技術(shù)對于人類生活和工作的影響是十分突出的,這是一種高效便捷的數(shù)據(jù)整合和篩選技術(shù),集成了多個領(lǐng)域的知識系統(tǒng),目前正逐步走向成熟,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校圖書館智能體系中,十分必要。
2.1 數(shù)據(jù)挖掘技術(shù)的優(yōu)勢
2.1.1 信息需求的促進(jìn)
隨著網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,人們對于信息的需求量逐漸增加,使用層次加深,在眾多海量信息和數(shù)據(jù)中,如何將復(fù)雜的數(shù)據(jù)轉(zhuǎn)換成有價值的資源和信息是十分必要的。在圖書館系統(tǒng)中龐大的數(shù)據(jù)和信息資源難以計算和篩選,必須采用一種先進(jìn)的技術(shù),實現(xiàn)數(shù)據(jù)的整合和處理,進(jìn)而篩選出有價值的資源,為讀者提供針對性的圖書服務(wù)。
2.1.2 爭取潛在讀者的需求
圖書館管理系統(tǒng)中,很多讀者的訪問數(shù)據(jù)都存在這里,如何將這些數(shù)據(jù)和信息進(jìn)行整合至關(guān)重要,數(shù)據(jù)挖掘技術(shù)就是這樣一種技術(shù),可以對數(shù)據(jù)進(jìn)行分類處理,從而確定圖書館中那類書籍借閱量較大,讀者感興趣的書籍都是哪些類別。數(shù)據(jù)挖掘技術(shù)可以將一些隱藏的信息挖掘出來,將智能整合后的資源和信息推送給讀者,進(jìn)而更好地為讀者服務(wù)。
2.1.3 提高獲取信息和數(shù)據(jù)的速度
圖書館系統(tǒng)要定期更新,在傳統(tǒng)系統(tǒng)使用中,對于數(shù)據(jù)和信息的處理和計算速度較慢,數(shù)據(jù)挖掘技術(shù)可以有效地避免這些弊端,計算速度極快,信息篩選能力強,使用這類技術(shù)可以顯著提高圖書館系統(tǒng)的各項功能。數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以提高圖書館獲取資源的速率,提升讀者應(yīng)用體驗,提高系統(tǒng)反應(yīng)能力。
2.2 數(shù)據(jù)挖掘技術(shù)的可行性分析
我國高校圖書館積累了很多的經(jīng)驗,數(shù)據(jù)挖掘技術(shù)在實際應(yīng)用中是具有可行性的。首先,我國高校現(xiàn)代化建設(shè)水平逐步提高,為了發(fā)揮圖書館的價值,要充分利用信息資源,挖掘數(shù)據(jù)和信息中有價值的資源,提高數(shù)據(jù)的利用率,從而提高圖書館服務(wù)質(zhì)量。圖書館喲滿足讀者的需求,要提供個性化、針對性的服務(wù),這也是圖書推薦系統(tǒng)的主要功能,這就需要對現(xiàn)有數(shù)據(jù)和信息進(jìn)行挖掘和處理,對數(shù)據(jù)進(jìn)行分析,加強信息管理,組織各類數(shù)據(jù),為圖書館的知識管理提供依據(jù)。其次,數(shù)據(jù)挖掘技術(shù)逐漸成熟也為圖書館推薦系統(tǒng)的逐步完善提供了可能。數(shù)據(jù)挖掘技術(shù)目前應(yīng)用多種領(lǐng)域,包括工業(yè)生產(chǎn)、醫(yī)療機(jī)構(gòu)、圖書管理系統(tǒng)等等,數(shù)據(jù)挖掘技術(shù)逐步的發(fā)展和完善,運作方式方法日趨成熟,管理方便,技術(shù)逐步革新,圖書館推薦系統(tǒng)應(yīng)用數(shù)據(jù)挖掘技術(shù)十分可行。另外,圖書館信息化建設(shè)水平逐漸提高,數(shù)據(jù)庫建設(shè)較為完善,數(shù)據(jù)庫系統(tǒng)分析能力不斷增強,圖像數(shù)據(jù)庫、對象數(shù)據(jù)庫、智能數(shù)據(jù)庫逐步建設(shè),這也為數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了平臺。
3 數(shù)據(jù)挖掘算法
3.1 分類分析
對于數(shù)據(jù)分類的分析是比較基礎(chǔ)的,要對數(shù)據(jù)集進(jìn)行訓(xùn)練,要采取科學(xué)的算法進(jìn)行計算,數(shù)據(jù)庫確定后要進(jìn)行初步分析,做好數(shù)據(jù)類別的基本分類,要做好類別描述,要根據(jù)數(shù)據(jù)性質(zhì)進(jìn)行建立模型,之后要利用原有信息和數(shù)據(jù)進(jìn)行研究,加強信息和數(shù)據(jù)預(yù)測。
3.2 聚類分析
聚類分析是指將數(shù)據(jù)和信息分為若干類別,主要根據(jù)分析對象的特征找出一定的規(guī)律,進(jìn)而對同一類型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分布模式較為特殊,對數(shù)據(jù)之間的關(guān)系進(jìn)行分析。
3.3 關(guān)聯(lián)分析
數(shù)據(jù)挖掘技術(shù)中的算法還有關(guān)聯(lián)分析,這也是基礎(chǔ)算法之一,主要是針對不同的數(shù)據(jù)建立一種聯(lián)系,可以是因果聯(lián)系、時序聯(lián)系或簡單聯(lián)系等等,進(jìn)而實現(xiàn)各類數(shù)據(jù)的瞬間提取和篩選。