王莉
摘 要:在數(shù)字圖書(shū)館的不斷發(fā)展過(guò)程中,傳統(tǒng)模式之下的紙質(zhì)資源逐漸遞減,但是在現(xiàn)階段的圖書(shū)館管理工作開(kāi)展過(guò)程中,紙質(zhì)圖書(shū)仍然有著較為重要的價(jià)值與作用,面對(duì)這種日益增長(zhǎng)的圖書(shū)館館藏,對(duì)此在實(shí)踐中如果把相關(guān)業(yè)務(wù)管理與數(shù)據(jù)挖掘技術(shù)進(jìn)行充分的融合,是現(xiàn)階段值得探究分析的問(wèn)題。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);圖書(shū)館;管理應(yīng)用
在現(xiàn)代圖書(shū)館管理中逐漸應(yīng)用了各種信息系統(tǒng),這種背景也就直接的導(dǎo)致了管理的數(shù)據(jù)的增長(zhǎng),傳統(tǒng)模式的圖書(shū)管理在開(kāi)展數(shù)據(jù)管理過(guò)程中經(jīng)常集中在一些信息的備份以及查詢(xún)之中,無(wú)法有效的對(duì)這些信息信息系統(tǒng)的應(yīng)用。
一、數(shù)據(jù)挖掘技術(shù)
1.數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘在實(shí)踐中又可以稱(chēng)之為數(shù)據(jù)采掘以及數(shù)據(jù)開(kāi)展,就是一種通過(guò)一定的技術(shù)以及算法開(kāi)展工作,在實(shí)際中其具有一定的隨機(jī)性,可以對(duì)于一些具有模糊性以及不完整的信息數(shù)據(jù)進(jìn)行系統(tǒng)的處理,進(jìn)而提升對(duì)人們各種知識(shí)的篩選,獲得較為各種有用的知識(shí)。
2.數(shù)據(jù)挖掘體系結(jié)構(gòu)以及過(guò)程
(1)數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理主要就是通過(guò)數(shù)據(jù)的清理以及數(shù)據(jù)的集成兩個(gè)方面構(gòu)成,其中數(shù)據(jù)的清理在實(shí)踐中主要就是對(duì)于數(shù)據(jù)中存在的不一致性以及噪音進(jìn)行系統(tǒng)的消除,而數(shù)據(jù)的集成在實(shí)踐中主要就是對(duì)于不同數(shù)據(jù)來(lái)源的數(shù)據(jù)進(jìn)行集成。
(2)數(shù)據(jù)變換以及選擇。①數(shù)據(jù)變換,預(yù)處理之后的數(shù)據(jù)在實(shí)踐中不適合數(shù)據(jù)的挖掘以及應(yīng)用,對(duì)此在實(shí)踐中要對(duì)數(shù)據(jù)進(jìn)行系統(tǒng)的轉(zhuǎn)換,讓其可以在數(shù)據(jù)挖掘中直接應(yīng)用。在實(shí)踐中應(yīng)用的數(shù)據(jù)變換的主要技術(shù)以及手段就是屬性構(gòu)造、規(guī)范化、數(shù)據(jù)概化以及平滑等技術(shù)手段。②數(shù)據(jù)選擇就是在實(shí)踐中對(duì)于一些通過(guò)變換的數(shù)據(jù)進(jìn)行系統(tǒng)的分析以及檢索。
(3)數(shù)據(jù)挖掘。就是對(duì)算法庫(kù)中的相關(guān)挖掘算法處理選擇應(yīng)用的相關(guān)數(shù)據(jù),最終生產(chǎn)的一種具體的模式與手段。
(4)模式評(píng)估以及表示.①模式評(píng)估,就是在通過(guò)一些具體的數(shù)據(jù)挖掘之后,綜合實(shí)際的業(yè)務(wù)需求等相關(guān)內(nèi)容,對(duì)于一些與既定條件相吻合的模式進(jìn)行系統(tǒng)的識(shí)別。②表示,就是通過(guò)知識(shí)表示技術(shù)以及可視化技術(shù)對(duì)于契機(jī)的挖掘結(jié)果進(jìn)行系統(tǒng)的展示。
3.數(shù)據(jù)挖掘方法
(1)聚類(lèi)分析,就是對(duì)于一些現(xiàn)有的數(shù)據(jù)通過(guò)群組類(lèi)模式的分類(lèi)的方式進(jìn)行分析,在操作中是無(wú)法預(yù)先了解既定的分組規(guī)則的,群組主要就是基于其自身的特征對(duì)其進(jìn)行劃分的。
(2)序列分析,在實(shí)踐中就是基于時(shí)間序列的方式對(duì)于模式進(jìn)行提取,其提取的主要依據(jù)就是重復(fù)產(chǎn)生的相關(guān)概率。
(3)關(guān)聯(lián)分析,就是在數(shù)據(jù)分析過(guò)程中通過(guò)依據(jù)其內(nèi)在的關(guān)聯(lián)規(guī)則對(duì)其進(jìn)行分析,而相關(guān)關(guān)聯(lián)規(guī)則的篩選在實(shí)踐中則是利用閾值設(shè)定的方式開(kāi)展。
(4)統(tǒng)計(jì)回歸分析,在實(shí)踐中借助一些現(xiàn)有的數(shù)據(jù)數(shù)值開(kāi)展未知變量的預(yù)測(cè)。在常規(guī)狀況之下,通過(guò)標(biāo)準(zhǔn)統(tǒng)計(jì)的可以利用線性回歸的方式開(kāi)展。
(5)分類(lèi)預(yù)測(cè)分析,分類(lèi)預(yù)測(cè)分析在實(shí)踐中主要就是利用分類(lèi)函數(shù)的方式開(kāi)展,在實(shí)踐中其可以對(duì)于具體的數(shù)據(jù)項(xiàng)目以及數(shù)據(jù)集進(jìn)行映射,實(shí)際的樹(shù)形結(jié)構(gòu)是應(yīng)用相對(duì)較多的分類(lèi)模式的有效表現(xiàn),其想相關(guān)數(shù)值的搜索,都是基于數(shù)的根部開(kāi)始,在實(shí)踐中綜合數(shù)字的節(jié)點(diǎn)以及分支相關(guān)內(nèi)容,進(jìn)而獲得最終的預(yù)測(cè)結(jié)果。
二、數(shù)據(jù)挖掘技術(shù)在圖書(shū)管理中的有效應(yīng)用
1.圖書(shū)管理中數(shù)據(jù)的特征
(1)信息的隱晦性特征,也可以稱(chēng)之為潛在性,主要就是指一些圖書(shū)館管理工作開(kāi)展過(guò)程中產(chǎn)生的數(shù)據(jù),這些信息中蘊(yùn)含了大量的數(shù)據(jù)信息,只有通過(guò)特定的方式手段對(duì)其進(jìn)行深入的挖掘以及分析才可以有效的發(fā)掘其實(shí)際的價(jià)值與內(nèi)涵。
(2)關(guān)聯(lián)性特征,在現(xiàn)代圖書(shū)館管理工作的開(kāi)展工程中涵蓋了一些借閱記錄以及記錄信息查詢(xún),這些數(shù)據(jù)在不斷的累積中存在著一定的關(guān)聯(lián)性特征。
2.圖書(shū)管理中數(shù)據(jù)挖掘的實(shí)際需求
院校圖書(shū)管理業(yè)務(wù)相對(duì)較為成熟,但是其大多數(shù)的服務(wù)主要就是體現(xiàn)在為讀者提供一些圖書(shū)咨詢(xún)、圖書(shū)借閱以及歸還等相關(guān)內(nèi)容,其缺乏個(gè)性化的服務(wù),對(duì)此要想真正的提升圖書(shū)館的智能化發(fā)展,就要轉(zhuǎn)變傳統(tǒng)的圖書(shū)服務(wù)理念,加強(qiáng)對(duì)讀者實(shí)際需求的重視,綜合數(shù)據(jù)挖掘技術(shù),通過(guò)深層次的數(shù)據(jù)分析了解讀者的實(shí)際檢索習(xí)慣以及各種需求,進(jìn)而為其提供一些個(gè)性化的服務(wù),滿(mǎn)足讀者的實(shí)際需求。
(1)借閱行為模式以及讀者群的分析。①孤立點(diǎn)分析,主要就是基于讀者群對(duì)其進(jìn)行分析,在實(shí)踐中此種分析的主要依據(jù)就是讀者的實(shí)際借閱習(xí)慣以及其特殊性需求,在實(shí)踐中通過(guò)對(duì)于借閱歷史的相關(guān)信息的有效分析,通過(guò)對(duì)圖書(shū)的借閱次數(shù)等相關(guān)信息進(jìn)行分析;②聚類(lèi)統(tǒng)計(jì),在實(shí)踐中綜合讀者的相關(guān)資料信息以及借閱記錄等相關(guān)內(nèi)容對(duì)于讀者的借閱行為以及群體的特殊性進(jìn)行系統(tǒng)的分析,通過(guò)聚類(lèi)分析對(duì)于讀者的相關(guān)行為規(guī)則以及模式進(jìn)行深入的挖掘。
(2)個(gè)性化服務(wù)工作。①關(guān)聯(lián)規(guī)則分析,就是在實(shí)踐中對(duì)于讀者的實(shí)際借記錄內(nèi)在的關(guān)聯(lián)性進(jìn)行系統(tǒng)的分析,進(jìn)而明確讀者的實(shí)際需求,在實(shí)踐中在為不同的種類(lèi)的讀者提供各種具有針對(duì)性的信息服務(wù)推薦。②時(shí)間序列分析,就是在實(shí)踐中通過(guò)對(duì)于讀者的不同種類(lèi)圖書(shū)的實(shí)際借閱時(shí)間以及順序進(jìn)行分析,進(jìn)而對(duì)于讀者的實(shí)際借閱習(xí)慣進(jìn)行了解,在合適的時(shí)間為讀者提供優(yōu)質(zhì)的服務(wù);同時(shí)通過(guò)時(shí)間序列的分析在實(shí)踐中可以有利于圖書(shū)館對(duì)于圖書(shū)進(jìn)行合理的安排。
3.圖書(shū)管理中數(shù)據(jù)挖掘的相關(guān)層次結(jié)構(gòu)。
通過(guò)圖書(shū)管理中數(shù)據(jù)的挖掘分析可以了解,圖書(shū)管的挖掘主要就是對(duì)于借閱行為方式進(jìn)行分析、個(gè)性化服務(wù)進(jìn)行等相關(guān)內(nèi)容進(jìn)行分析,在實(shí)踐中圖書(shū)管理中數(shù)據(jù)挖掘的主要層次結(jié)構(gòu)具體如下:
(1)就是數(shù)據(jù)預(yù)處理模塊層次,在實(shí)踐中主要就是基于院校圖書(shū)館管理數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)對(duì)于數(shù)據(jù)進(jìn)行轉(zhuǎn)換以及相關(guān)數(shù)據(jù)的有效集成,在實(shí)際的處理之中,可以將數(shù)據(jù)保存到圖書(shū)館的相關(guān)數(shù)據(jù)挖掘庫(kù)之中;
(2)就是管理規(guī)則挖掘算法模塊層,在實(shí)踐中主要就是對(duì)于各種數(shù)據(jù)進(jìn)行系統(tǒng)的選擇與處理,通過(guò)調(diào)用與實(shí)際需求相吻合的挖掘算法對(duì)于圖書(shū)館的相關(guān)數(shù)據(jù)進(jìn)行深入的挖掘處理;
(3)就是模刑可視分析模塊層,在實(shí)踐中主要就是圖書(shū)館管理的可視化操作界面,其主要涵蓋了圖書(shū)館的借閱行為有效分析,圖書(shū)館的個(gè)性化服務(wù)分析等相關(guān)內(nèi)容中的挖掘信息,在實(shí)踐中必須要通過(guò)此層對(duì)圖書(shū)館進(jìn)行系統(tǒng)的挖掘任務(wù)參數(shù)的有效設(shè)定,在完成相關(guān)數(shù)據(jù)信息之后,就可以通過(guò)可視模式規(guī)則的方式對(duì)其進(jìn)行輸出操作。
三、結(jié)語(yǔ)
在圖書(shū)館規(guī)模的不斷擴(kuò)大過(guò)程中,圖書(shū)管理工作在實(shí)踐中的應(yīng)用信息越來(lái)越多,這樣海量的數(shù)據(jù)必須要通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)其進(jìn)行處理,在實(shí)踐中利用圖書(shū)管理數(shù)據(jù)中的系統(tǒng)分析以及相關(guān)行為模式的方式對(duì)其進(jìn)行輸出管理,進(jìn)而為院校圖書(shū)館提供更加智能化以及個(gè)性化的服務(wù),在根本上提升現(xiàn)代圖書(shū)管理的整體服務(wù)質(zhì)量以及水平。
參考文獻(xiàn):
[1]李會(huì)艷. 數(shù)據(jù)挖掘技術(shù)在院校圖書(shū)管理中的應(yīng)用[J]. 農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2015,(03):65-68.
[2]楊帆. 基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2014:5-12.