喬瑋
摘要:受信息技術(shù)影響,現(xiàn)代圖書館為了展現(xiàn)自身價(jià)值都積極引入了相關(guān)信息技術(shù),使得圖書館朝信息化方向發(fā)展,這時(shí)信息技術(shù)就涉及圖書館的管理系統(tǒng)中,能夠幫助管理員做好管理工作,有利于圖書館運(yùn)維。數(shù)據(jù)挖掘技術(shù)就是圖書館管理信息系統(tǒng)中的常用技術(shù),與信息系統(tǒng)作用及管理工作質(zhì)量有密切關(guān)系,因此如何正確應(yīng)用該項(xiàng)技術(shù)是現(xiàn)代圖書館需要思考的問(wèn)題,本文也將展開(kāi)研究,重點(diǎn)論述數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中的運(yùn)用方法。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);圖書館;管理信息系統(tǒng)
目前,國(guó)內(nèi)圖書館基本都構(gòu)建了管理信息系統(tǒng),但這些系統(tǒng)的功能性普遍比較淺薄,一般只能用于信息儲(chǔ)存、信息查找、信息展示等工作環(huán)節(jié),由此系統(tǒng)雖然有利于圖書館管理工作,實(shí)際效用水平卻相對(duì)薄弱。而針對(duì)這一現(xiàn)象,數(shù)據(jù)挖掘技術(shù)能夠彌補(bǔ)當(dāng)前圖書館管理信息系統(tǒng)的短板,進(jìn)一步簡(jiǎn)化圖書館管理工作,還能對(duì)工作質(zhì)量做出更有力的保障,因此有必要對(duì)圖書館管理信息系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用進(jìn)行研究,此舉具有一定現(xiàn)實(shí)意義。
1 數(shù)據(jù)挖掘技術(shù)概念與管理作用
1.1技術(shù)概念
顧名思義,數(shù)據(jù)挖掘技術(shù)就是一種能夠不斷深入的挖掘大量數(shù)據(jù)的技術(shù)工具,該項(xiàng)技術(shù)在不斷發(fā)展中已經(jīng)趨向成熟,具有數(shù)據(jù)處理能力強(qiáng)、挖掘深度優(yōu)秀、性能全面等特點(diǎn),因此可以投入實(shí)際應(yīng)用。在基本作用上,該項(xiàng)技術(shù)面對(duì)種類繁多,且量級(jí)龐大的數(shù)據(jù),能夠在短時(shí)間內(nèi)提取所有數(shù)據(jù)的關(guān)鍵特征信息,這樣技術(shù)系統(tǒng)能對(duì)所有數(shù)據(jù)進(jìn)行定義,隨后將任意數(shù)據(jù)進(jìn)行組合,可得數(shù)據(jù)之間的關(guān)系,根據(jù)關(guān)系能對(duì)數(shù)據(jù)代表事項(xiàng)的發(fā)展趨勢(shì)進(jìn)行判斷,而數(shù)據(jù)之間的關(guān)系是十分復(fù)雜的,屬于隱含信息,單純從數(shù)據(jù)表面上是無(wú)法看出的,這就是數(shù)據(jù)挖掘技術(shù)的挖掘作用體現(xiàn)。此外,人工自然也具備一定的數(shù)據(jù)挖掘能力,可以對(duì)數(shù)據(jù)關(guān)系進(jìn)行分析,但人工必然存在能力上的限制,實(shí)際分析中如果數(shù)據(jù)量太大,首先無(wú)法保障分析效率,其次很有可能出現(xiàn)分析不全面、不準(zhǔn)確等不良現(xiàn)象,因此有必要用數(shù)據(jù)挖掘技術(shù)來(lái)代替人工完成大量數(shù)據(jù)分析工作。
1.2管理作用
在圖書館管理工作基礎(chǔ)上,根據(jù)該項(xiàng)工作的當(dāng)前要求,圖書館管理員除了要維系圖書館秩序以外,還要對(duì)圖書館用戶的各種需求來(lái)進(jìn)行分析,而該項(xiàng)工作就比較困難,因?yàn)閳D書館用戶的需求是不斷產(chǎn)生的,且種類繁多,還隨時(shí)會(huì)發(fā)生變化,同時(shí)很多用戶自己都不知道自己有什么需求,也不會(huì)主動(dòng)向圖書館管理員提出,所以依靠管理員進(jìn)行人工管理,只能做到維系圖書館秩序,難以分析用戶需求,這影響了現(xiàn)代圖書館的服務(wù)水平。但在數(shù)據(jù)挖掘技術(shù)上,首先該項(xiàng)技術(shù)會(huì)不斷搜集用戶在圖書館中的行為,并將這些行為以數(shù)據(jù)形式儲(chǔ)存,其次將對(duì)這些行為進(jìn)行分析,通過(guò)分析可以從用戶綜合行為中得到用戶可能存在的需求,這樣就能提出準(zhǔn)確的服務(wù)方向,有利于圖書館服務(wù)水平,另外技術(shù)的介入能在短時(shí)間內(nèi)完成工作,可以應(yīng)對(duì)不斷產(chǎn)生、隨時(shí)變化的數(shù)據(jù),可見(jiàn)數(shù)據(jù)挖掘技術(shù)具有良好的管理作用,應(yīng)用價(jià)值很高,值得推廣。
2 圖書館管理信息系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用方法
圖書館管理信息系統(tǒng)是數(shù)據(jù)挖掘技術(shù)的運(yùn)用基礎(chǔ),但如何將該項(xiàng)技術(shù)融入系統(tǒng)中,并充分發(fā)揮技術(shù)作用就是一大難題,要解決難題就必須采用正確運(yùn)用方法。為此,下文將提出技術(shù)在系統(tǒng)中的運(yùn)用方法,以供參考。
2.1基本思路
數(shù)據(jù)挖掘技術(shù)在圖書館管理信息系統(tǒng)中運(yùn)用的基本思路必須貼合管理需求,即現(xiàn)代圖書館管理工作希望了解用戶閱讀需求、購(gòu)書需求、閱讀興趣、閱讀習(xí)慣等,以便于圖書館經(jīng)營(yíng)與服務(wù)。因此技術(shù)運(yùn)用方法必須滿足這些需求,做到這一點(diǎn)就說(shuō)明技術(shù)運(yùn)用方法有效。本文技術(shù)運(yùn)用思路中技術(shù)運(yùn)用方法大體可分為四個(gè)步驟,分別為挖掘工具選擇、數(shù)據(jù)采集與處理、數(shù)據(jù)挖掘、數(shù)據(jù)挖掘成果總結(jié)。
2.2運(yùn)用方法
根據(jù)基本思路中技術(shù)運(yùn)用方法的四個(gè)步驟,下文將展開(kāi)相關(guān)分析。
(1)挖掘工具選擇
在數(shù)據(jù)挖掘技術(shù)的發(fā)展中出現(xiàn)了很多中挖掘工具,其中部分工具的性能、適用條件比較狹窄,不符合現(xiàn)代圖書館管理信息系統(tǒng)需求,因此必須慎重選擇數(shù)據(jù)挖掘工具,這樣才能對(duì)技術(shù)運(yùn)用效果做出保障。根據(jù)普遍數(shù)據(jù)挖掘工具的優(yōu)劣、特點(diǎn),本文主要選擇了SQL數(shù)據(jù)庫(kù)(SQL Server 2005)作為數(shù)據(jù)挖掘工具,該數(shù)據(jù)庫(kù)包含了大量數(shù)據(jù)挖掘方法,且相較于其他類似數(shù)據(jù)挖掘工具,SQL數(shù)據(jù)庫(kù)的優(yōu)勢(shì)非常明顯,具備獨(dú)特的數(shù)據(jù)處理方式,在運(yùn)作中可以先保存海量數(shù)據(jù),同時(shí)提出關(guān)鍵詞來(lái)識(shí)別數(shù)據(jù),最后依靠挖掘邏輯來(lái)進(jìn)行數(shù)據(jù)分析,這樣就能得到數(shù)據(jù)深層信息。可見(jiàn)SQL數(shù)據(jù)挖掘工具的應(yīng)用不但簡(jiǎn)便,還行之有效,建議在圖書館管理信息系統(tǒng)中推廣。
(2)數(shù)據(jù)采集與處理
SQL作為數(shù)據(jù)挖掘工具不可能憑空運(yùn)作,因此必須在運(yùn)作前需要進(jìn)行數(shù)據(jù)采集與處理。具體方法可分為兩個(gè)步驟:①進(jìn)入SQL服務(wù)器找到代表數(shù)據(jù)采集邏輯的表格,該表格在初始化階段包含的信息非常少,不滿足圖書館數(shù)據(jù)采集需求,因此必須進(jìn)行完善,這里需要根據(jù)用戶閱讀需求、購(gòu)書需求、閱讀興趣、閱讀習(xí)慣等相關(guān)數(shù)據(jù)特征來(lái)進(jìn)行處理,由此得到完善的數(shù)據(jù)采集邏輯;②啟動(dòng)SQL Server Management Shad io,這樣能根據(jù)系統(tǒng)提出對(duì)數(shù)據(jù)采集邏輯表格進(jìn)行進(jìn)一步處理,使表格更貼合管理工作流程。經(jīng)過(guò)以上兩個(gè)步驟,就可以通過(guò)圖書館管理信息系統(tǒng)來(lái)進(jìn)行數(shù)據(jù)采集,采集所得數(shù)據(jù)會(huì)被全部導(dǎo)入SQL的數(shù)據(jù)儲(chǔ)存空間中接受挖掘分析。
(3)數(shù)據(jù)挖掘
要保障SQL能準(zhǔn)確挖掘出管理員想要的信息,在挖掘之前應(yīng)當(dāng)先設(shè)定好挖掘邏輯。以用戶閱讀需求為例,管理員應(yīng)當(dāng)先在SQL內(nèi)設(shè)定數(shù)據(jù)分類項(xiàng),即用戶閱讀需求為分類項(xiàng)總目,其下要根據(jù)用戶閱讀需求的特征進(jìn)行細(xì)化分類,類如用戶翻閱記錄、用戶閱讀時(shí)長(zhǎng)、用戶上次閱讀位置記錄等,這樣SQL就會(huì)根據(jù)分類項(xiàng)來(lái)進(jìn)行數(shù)據(jù)挖掘,獲取相關(guān)信息后進(jìn)行分析,這一步驟可以通過(guò)人工來(lái)完成,但如果條件允許,則建議引入智能邏輯來(lái)進(jìn)行分析。此外,無(wú)論是人工分析還是技術(shù)分析,分析的基本流程是相同的,即根據(jù)相關(guān)分類項(xiàng)總目下細(xì)化分類的數(shù)據(jù)表現(xiàn),推測(cè)用戶當(dāng)前可能存在什么需求,如在用于閱讀需求分類項(xiàng)總目下,通過(guò)用戶翻閱記錄可知用戶可能對(duì)哪些類型的圖書有興趣,這樣就可以向用戶推送相關(guān)類型的圖書,或者根據(jù)用戶閱讀時(shí)長(zhǎng),可知用戶最感興趣的是哪些類型的圖書,可集中推送。