韓雷
(伊寧市圖書館,新疆 伊犁 839300)
當(dāng)今圖書館的數(shù)字化、信息化、自動化是伴隨著信息通信技術(shù)和計算機網(wǎng)絡(luò)的高速發(fā)展。除為讀者提供豐富的知識庫外,圖書館還需要在浩如煙海的多種信息載體中,有選擇地向讀者提供科學(xué)的參考咨詢服務(wù),在資源建設(shè)方面實施數(shù)據(jù)化的信息管理。面對數(shù)據(jù)豐富而信息匱乏的嚴(yán)峻困境,如何從海量的數(shù)據(jù)信息中挖掘適用于管理者決策的知識至關(guān)重要,數(shù)據(jù)挖掘技術(shù)將為圖書館的資源管理、組織和拓展服務(wù)范圍、提高服務(wù)質(zhì)量提供科學(xué)合理的技術(shù)支持。
運用數(shù)據(jù)挖掘技術(shù)對用戶檢索和借閱的館藏文獻進行分析,可以為管理采訪計劃提供有效的決策,通過對客觀真實的數(shù)據(jù)進行分析,進而預(yù)測社會市場需求和未來采訪趨勢。運用數(shù)據(jù)挖掘技術(shù),對文獻的需求狀況進行探討,最終結(jié)合傳統(tǒng)的管理方法,在減少借閱率低的情況下,對陳舊的圖書資源進行清理,科學(xué)地提高館藏的利用率,合理地指導(dǎo)圖書采訪任務(wù),盡量減少因主觀因素造成的偏差問題,優(yōu)化紙質(zhì)圖書資源的結(jié)構(gòu)。許多圖書館專業(yè)人員以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),對個性化服務(wù)課題進行了深入探索,主要體現(xiàn)在個性化服務(wù)模型和軟件的構(gòu)建上。智能化集成技術(shù)能為圖書館提供個性化服務(wù),方便地獲取讀者用戶的愛好和興趣方向;結(jié)合知識管理、個性化參考咨詢服務(wù)和數(shù)據(jù)挖掘,形成一個全新的個性化參考服務(wù)咨詢模型。此外,在數(shù)字圖書館的應(yīng)用方面,數(shù)據(jù)挖掘技術(shù)能促進數(shù)字資源統(tǒng)一管理的規(guī)范化,推動信息服務(wù)水平的提高,使圖書館數(shù)據(jù)管理系統(tǒng)分工明確,實現(xiàn)數(shù)字資源的集中處理。它可以優(yōu)化數(shù)字資源的館藏結(jié)構(gòu),實現(xiàn)期刊館藏的合理布局,利用數(shù)據(jù)挖掘工具的分析和統(tǒng)計功能,使分散的數(shù)字資源得到大量實用的信息。利用該技術(shù),還可以在電子數(shù)據(jù)庫和多媒體資源中挖掘出較為精確的數(shù)字資源使用情況,使用戶在獲取數(shù)字資源時能夠產(chǎn)生大量的交互信息,對信息檢索技術(shù)的應(yīng)用有著特殊的意義。
圖書館管理工作非常復(fù)雜,涉及多方面的信息,面對的是社會各界讀者。所以圖書館的管理工作主要是在圖書館藏書與讀者之間進行。圖書管理包括圖書管理、用戶信息管理和圖書流通信息管理等內(nèi)容。藏書信息管理主要是指圖書館借閱圖書及注銷、退書的相關(guān)信息。用戶信息管理是指圖書館添加、刪除、查詢、更改用戶信息,用戶信息包括用戶的個人信息、查詢信息、借閱信息等。圖書流通信息管理是圖書館的主要工作,主要是圖書的借出、歸還、補償?shù)裙芾砉ぷ?,還包括讀者登記管理、流通查詢等工作。這一信息管理模式存在很多問題?,F(xiàn)有的信息管理模式都是死板的劃分,不能流暢高效地獲取和共享信息,很難完成信息服務(wù)建設(shè)。目前圖書館MIS 還缺乏對信息自動化的處理能力,目前的系統(tǒng)大多依靠人工操作,龐大的數(shù)據(jù)信息很難進行有效的整理和操作,缺乏自動化的處理手段,使得獲取的信息失去應(yīng)有的實時效果。此外,在信息管理系統(tǒng)中還缺乏決策能力,現(xiàn)有的數(shù)據(jù)信息無法進行有效的信息分析和規(guī)劃未來發(fā)展,不能準(zhǔn)確判斷信息,影響未來的發(fā)展規(guī)劃。
圖書館數(shù)字館藏資源不僅包含館藏信息,還包含著館藏資源與眾多館藏相關(guān)的在線資源,這些資源分布非常廣泛,內(nèi)容豐富,給圖書館的信息存儲和分析工作帶來不便和困擾。面臨著巨大而繁復(fù)的數(shù)據(jù)信息量,圖書館必須對其存儲方式進行更新,對數(shù)據(jù)信息進行分類處理,在較高層次上統(tǒng)一描述,保證數(shù)據(jù)信息的完整性和一致性,符合信息資源管理的標(biāo)準(zhǔn),以滿足信息服務(wù)的要求。數(shù)據(jù)挖掘技術(shù)是一種以信息處理為主的技術(shù),它具有完善的聚類功能,可以將具有相似特征的數(shù)據(jù)信息歸類為同一類,在圖書館進行數(shù)據(jù)收集整理時,如果要提高數(shù)據(jù)的有效性,應(yīng)合理地利用數(shù)據(jù)挖掘技術(shù)。
收集文獻是圖書館信息資源保障必不可少的一環(huán)。大多數(shù)傳統(tǒng)信息采購都是通過書店、出版社或期刊社的新書目錄渠道,由專業(yè)的館長或館員來決定,也可以由一小部分專家來決定。這兩種方式不能避免有強烈的主觀性和個人偏好,但每年圖書館的文獻購置經(jīng)費都十分有限,如何利用有限的購買費用,合理地收集多個學(xué)科的專業(yè)數(shù)據(jù)信息,最大程度地發(fā)揮采集經(jīng)費的效益。利用數(shù)據(jù)挖掘技術(shù),通過對圖書館的借閱流通記錄和檢索請求分析,將頻繁借閱集與文獻柜閱集進行分類統(tǒng)計,實現(xiàn)信息采集的目的,補充和完善信息資源。它通過對海量信息資源進行智能服務(wù)的表現(xiàn),為圖書館的讀者服務(wù)工作提供不可替代的技術(shù)支持,為文獻資源建設(shè)提供可靠的決策依據(jù)。
圖書咨詢服務(wù)工作從館員和讀者實際咨詢發(fā)展到數(shù)字化網(wǎng)絡(luò)虛擬咨詢模式。借助于網(wǎng)絡(luò),讀者不僅可以從專家或咨詢管理人員那里獲取信息,而且可以進入知識資源庫享受自助式服務(wù)。構(gòu)建知識資源庫需要運用數(shù)據(jù)挖掘技術(shù)對歷史數(shù)據(jù)進行分析,探索隱藏在其中的信息規(guī)律,創(chuàng)造出符合用戶需求的深層信息產(chǎn)品。另外,根據(jù)讀者的歷史閱覽和咨詢信息,推斷其研究興趣的方向,運用數(shù)據(jù)挖掘技術(shù)為每位讀者提供多種咨詢服務(wù)。也能方便咨詢管理人員從大量的信息中為讀者提煉答案,使主動咨詢成為信息服務(wù)的主流途徑。利用數(shù)學(xué)分析法記錄讀者的借閱歷史,從中獲得不同讀者的閱讀傾向,挖掘圖書館每一類書中潛在的讀者信息,然后根據(jù)自己的興趣愛好和主要研究領(lǐng)域和方向,逐步把它發(fā)展成為一個特定的、穩(wěn)定的讀者群。
數(shù)據(jù)挖掘技術(shù)是有效的科學(xué)決策工具,可為圖書館管理決策提供合理、可靠的依據(jù)。綜上所述,在數(shù)據(jù)挖掘的基礎(chǔ)流程中,可見其以數(shù)據(jù)存儲技術(shù)為基本依托,實現(xiàn)更充足的信息集中。因為數(shù)據(jù)倉庫能把數(shù)字圖書館的所有信息進行匯總,并進行統(tǒng)一處理和加工整理,從而形成信息決策一體化,全面地分析和比較集成信息,從而不僅彌補了信息的缺陷和漏洞,而且可以明顯提高信息決策的可靠性和可行性。為此,將信息挖掘技術(shù)應(yīng)用于圖書館管理,可以最大限度地提供決策支持。通過數(shù)據(jù)存儲和挖掘技術(shù)建立圖書情報機構(gòu),能夠形成強大的信息資源優(yōu)勢,并具有較強的信息分析、濃縮和轉(zhuǎn)化功能,為信息服務(wù)決策提供支持。
圖書館能運用數(shù)據(jù)挖掘技術(shù),自動處理數(shù)字化信息,實現(xiàn)特定場景下數(shù)據(jù)和信息的自動分類檢索。自動文摘是根據(jù)文本分類識別信息的一種方法,并將其分為若干種類型的主題;自動文摘使摘要信息以文本的形式呈現(xiàn),其基本原理是依靠應(yīng)用統(tǒng)計方法。怎樣合理、科學(xué)地利用圖書館期刊購置費來分配各學(xué)科期刊的數(shù)量,平衡不同文獻的種類和載體的采購,從而使經(jīng)費得到充分、有效的使用,是需要慎重考慮的問題。通過數(shù)據(jù)挖掘技術(shù)收集網(wǎng)絡(luò)上大量的非結(jié)構(gòu)化、雜亂的非結(jié)構(gòu)化數(shù)據(jù),并對其進行詳細的分類,能夠有效地實現(xiàn)期刊的豐富和多樣化。此外,為了提高期刊的流通量,合理滿足讀者和用戶的需要,運用數(shù)據(jù)挖掘技術(shù)分析讀者的借閱和流量狀況,可以優(yōu)化期刊館藏結(jié)構(gòu)。
運用數(shù)據(jù)挖掘技術(shù),全面了解用戶的使用需求,根據(jù)實際情況制定出科學(xué)、規(guī)范的數(shù)據(jù)監(jiān)護流程和制度,以保證數(shù)據(jù)監(jiān)護工作的可持續(xù)發(fā)展。進行數(shù)據(jù)處理時,要對數(shù)據(jù)的價值進行審核,檢查數(shù)據(jù)的正確性和完整性,以保證最后輸入的信息的有效性。系統(tǒng)數(shù)據(jù)存儲與備份機制的優(yōu)化,保證系統(tǒng)的兼容性。同時,圖書館也可以整合不同領(lǐng)域的專家,建立不同學(xué)科的數(shù)據(jù)標(biāo)準(zhǔn),為數(shù)據(jù)共享奠定堅實的基礎(chǔ)。并可加大經(jīng)費投入,針對收集到的資料資料,分析讀者的閱讀需求,根據(jù)所得結(jié)論加強圖書館建設(shè),為用戶提供更好的閱讀環(huán)境。
在資源數(shù)字化方面的工作是圖書館必須予以重視的一個方面。推進圖書館數(shù)據(jù)庫建設(shè),進行高效管理,能更好地滿足時代對圖書館的發(fā)展要求。圖書資料庫主要有數(shù)字化圖書、數(shù)字化期刊和數(shù)字化專業(yè)文獻。目前,這種數(shù)字化數(shù)據(jù)庫所包含的信息資源是傳統(tǒng)圖書館無法比擬的。通過對信息資源的數(shù)字化處理,并將其存入專門的服務(wù)器中,用戶可以通過網(wǎng)絡(luò)實現(xiàn)對此類信息資源的在線瀏覽。圖書資料庫建立的資料庫應(yīng)當(dāng)便于使用。為使用戶能夠更快速、準(zhǔn)確地搜索到所需的信息,圖書館可以與供貨商合作,一起對數(shù)據(jù)庫進行改進,以獲得更加理想的檢索方式。與此同時數(shù)據(jù)庫也具有記錄功能,可以記錄用戶的搜索習(xí)慣和搜索內(nèi)容,方便用戶的使用。
結(jié)束語:在信息化時代,數(shù)字圖書館是實現(xiàn)圖書信息共享和傳播的重要途徑和途徑,為大眾的信息需求構(gòu)建了信息高度整合的有利場所,在信息保存、發(fā)布、傳遞、應(yīng)用等功能上積累了豐富的數(shù)據(jù)資源,滿足了各類信息需求。在圖書館信息處理自動化任務(wù)中,數(shù)據(jù)挖掘技術(shù)占據(jù)著重要地位。伴隨著科學(xué)技術(shù)的日益成熟,鑒于數(shù)據(jù)挖掘技術(shù)的強大功能,圖書館必將展現(xiàn)出更長遠的發(fā)展?jié)摿?。我們相信,通過數(shù)據(jù)挖掘技術(shù),能夠使圖書館信息服務(wù)的能力和效率實現(xiàn)跨越式的飛躍,進一步滿足社會大眾對信息服務(wù)多樣化的需求。