文/遼寧財貿學院 孫冰洋
大數(shù)據(jù)的發(fā)展對人們的閱讀方式產(chǎn)生了較大的影響,傳統(tǒng)的紙質書籍閱讀逐漸轉變?yōu)榧堎|書籍閱讀與電子書閱讀并重的閱讀模式。圖書館需要認識到人們閱讀方式的轉變,對傳統(tǒng)業(yè)務和服務進行創(chuàng)新,使其符合大數(shù)據(jù)時代讀者的閱讀需求,保障圖書館功能和作用的充分發(fā)揮。
大數(shù)據(jù)技術的發(fā)展營造了泛在知識環(huán)境,人們能夠通過互聯(lián)網(wǎng)進行數(shù)據(jù)信息的傳播,傳統(tǒng)紙質書籍閱讀方式逐漸被取代;再加上商業(yè)搜索引擎的推廣,對圖書館的OPAC服務造成不利影響。由此可以看出,大數(shù)據(jù)的發(fā)展對圖書館的業(yè)務應用與服務創(chuàng)新提供了更高的要求。雖然大數(shù)據(jù)對圖書館的生存發(fā)展帶來了挑戰(zhàn),也為圖書館提供了發(fā)展機遇,圖書館管理人員需要充分利用大數(shù)據(jù)技術的各項功能,對圖書館業(yè)務開展和提供讀者服務過程中產(chǎn)生的數(shù)據(jù)信息進行采集與整合分析,明確圖書館發(fā)展中的薄弱環(huán)節(jié),為圖書館業(yè)務的完善和服務水平的提升提供參考資料。
(一)大數(shù)據(jù)驅動平臺的構建。在應用大數(shù)據(jù)技術進行圖書館業(yè)務應用與服務創(chuàng)新時,圖書館首先要做好大數(shù)據(jù)驅動平臺的構建,整合圖書館的相關大數(shù)據(jù),為大數(shù)據(jù)挖掘和應用提供支持。一般來說,大數(shù)據(jù)驅動平臺主要包括大數(shù)據(jù)采集、大數(shù)據(jù)建模及大數(shù)據(jù)分析三個維度。在大數(shù)據(jù)采集方面,主要通過圖書館流通日志、OPAC日志、系統(tǒng)層面或者圖書館網(wǎng)絡底層進行用戶訪問數(shù)據(jù)的采集,包括用戶信息行為數(shù)據(jù)和用戶訪問行為數(shù)據(jù)兩類大數(shù)據(jù),為后續(xù)大數(shù)據(jù)建模與分析提供數(shù)據(jù)支持;在大數(shù)據(jù)建模方面,技術人員可以通過多事務隊列解析原始HTML數(shù)據(jù)的方式,對大數(shù)據(jù)進行初步處理,并將初步處理的數(shù)據(jù)存儲于目標數(shù)據(jù)表,完成數(shù)據(jù)建模,并將其存儲于用戶數(shù)據(jù)庫;在大數(shù)據(jù)分析方面,技術人員通過大數(shù)據(jù)挖掘技術整合有價值的用戶數(shù)據(jù),對其進行深入統(tǒng)計分析,為大數(shù)據(jù)業(yè)務應用及服務創(chuàng)新提供參考。需要注意的是,在圖書館網(wǎng)絡與應用系統(tǒng)中,圖書館工作人員的管理權限有所差異。針對具有管理權限的數(shù)據(jù),技術人員可以通過管理程序代理的方式,實現(xiàn)進程級別數(shù)據(jù)的管理;針對沒有管理權限的數(shù)據(jù),技術人員可以通過模擬訪問進行應用系統(tǒng)運行數(shù)據(jù)的獲取,并分析系統(tǒng)服務狀態(tài)是否有效。在獲取圖書館網(wǎng)絡與應用系統(tǒng)的相關數(shù)據(jù)后,技術人員可以通過隱馬爾可夫模型明確數(shù)據(jù)中的異常數(shù)據(jù)信息,實現(xiàn)圖書館網(wǎng)絡與應用系統(tǒng)的有效監(jiān)控,在圖書館網(wǎng)絡系統(tǒng)的CPU使用率或者內存使用率等數(shù)據(jù)信息出現(xiàn)異常時,及時發(fā)現(xiàn)與報警,保障圖書館網(wǎng)絡系統(tǒng)的穩(wěn)定運行。
(二)基于業(yè)務應用的平臺功能創(chuàng)新。在圖書館業(yè)務管理與應用中,圖書館管理人員可以通過大數(shù)據(jù)技術進行決策支持系統(tǒng)和統(tǒng)一統(tǒng)計分析系統(tǒng)的開發(fā),實現(xiàn)圖書館業(yè)務應用的創(chuàng)新。在不同子系統(tǒng)中,大數(shù)據(jù)技術的應用方法和實現(xiàn)功能有所差異。
1.決策支持系統(tǒng)。在圖書館業(yè)務應用創(chuàng)新中,圖書館管理人員可以通過大數(shù)據(jù)技術的引進,對圖書館業(yè)務系統(tǒng)的大數(shù)據(jù)進行整合分析,結合大數(shù)據(jù)挖掘內容,為圖書館業(yè)務決策提供參考資料。技術人員需要構建大數(shù)據(jù)平臺,對圖書館現(xiàn)有館藏數(shù)據(jù)、OPAC檢索日志數(shù)據(jù)以及流通數(shù)據(jù)等數(shù)據(jù)信息進行整合,通過數(shù)據(jù)的深入挖掘,為業(yè)務應用創(chuàng)新提供幫助。在館藏數(shù)據(jù)挖掘方面,技術人員可以通過大數(shù)據(jù)技術進行圖書館藏相關數(shù)據(jù)的分析,對不同學科大類和二級學科的圖書數(shù)量及占比進行分析,并通過餅形圖、柱狀圖和表格等方式,對圖書館館藏數(shù)據(jù)進行挖掘。在此基礎上,大數(shù)據(jù)平臺可以根據(jù)圖書的年份、分館、學科和語種等因素實現(xiàn)圖書館館藏的整合分析,圖書館管理人員能夠以此明確館藏的薄弱環(huán)節(jié),有針對性地進行圖書資源的引進,豐富圖書館館藏,有助于圖書館業(yè)務的完善。在OPAC檢索日志數(shù)據(jù)挖掘方面,大數(shù)據(jù)技術可以保障日志數(shù)據(jù)挖掘的有效性,明確讀者資源利用和圖書館館藏資源間的匹配度,該內容與圖書館業(yè)務水平聯(lián)系密切。大數(shù)據(jù)平臺需要具備結構查詢及關鍵字頻次查詢功能,使圖書館人員明確檢索效率高,但是檢索結果為0的內容,該內容為圖書館館藏的空白區(qū)域,需要管理人員進行補充。由此可以看出,OPAC檢索日志數(shù)據(jù)的挖掘,能夠為圖書館業(yè)務開展提供指導。在流通數(shù)據(jù)挖掘方面,圖書館可以通過大數(shù)據(jù)平臺對讀者的借閱數(shù)據(jù)信息、預約信息數(shù)據(jù)進行挖掘。通過學科、出版社等參數(shù)分析讀者借閱狀況;通過年月、分館和院系等參數(shù)分析讀者續(xù)借狀況及讀者預約狀況;通過學科、借閱日期和入庫時間等參數(shù)分析零借閱狀況分析。基于上述大數(shù)據(jù)挖掘結果,圖書館管理人員可以明確圖書館館藏的使用狀況,為圖書館業(yè)務的改進提供參考。
2.統(tǒng)一統(tǒng)計分析系統(tǒng)。在圖書館資源統(tǒng)計分析方面存在數(shù)據(jù)異構和應用異構問題,對圖書館數(shù)據(jù)信息的保護產(chǎn)生影響。在此基礎上,技術人員可以通過大數(shù)據(jù)平臺構建統(tǒng)一統(tǒng)計分析系統(tǒng),開展有效資源管理及使用統(tǒng)計分析工作,明確圖書館資源的應用狀況,為圖書館業(yè)務應用管理提供幫助。在圖書館資源管理方面,大數(shù)據(jù)平臺的應用可以實現(xiàn)圖書館資源的有效劃分,將其劃分為平臺、網(wǎng)站、數(shù)據(jù)庫以及電子期刊等內容,并通過學科種類進行數(shù)據(jù)庫和電子期刊的進一步細化,實現(xiàn)資源管理工作的精細化。具體而言,大數(shù)據(jù)平臺可以將資源管理工作細化為電子期刊管理、學科分類管理以及讀者分組管理等內容,實現(xiàn)圖書館業(yè)務管理的有效開展。在圖書館使用統(tǒng)計分析工作中,大數(shù)據(jù)平臺主要對讀者使用與資源使用兩個維度進行分析。在讀者使用統(tǒng)計分析方法中,大數(shù)據(jù)平臺通過讀者相關大數(shù)據(jù)的整合與分析,明確讀者使用行為、讀者訪問文獻以及讀者分組管理等內容,并對讀者分組下的讀者使用資源、行為統(tǒng)計和應用數(shù)據(jù)庫統(tǒng)計等數(shù)據(jù)進行整合分析,明確圖書館讀者的閱讀需求,為圖書館服務的創(chuàng)新提供參考;在資源使用統(tǒng)計分析方法中,大數(shù)據(jù)平臺通過圖書館資源應用狀況,明確數(shù)據(jù)庫、電子期刊的使用狀況,并根據(jù)相關使用數(shù)據(jù)構建報表,為圖書館業(yè)務完善提供參考。
(三)基于圖書館服務的平臺功能創(chuàng)新。在圖書館服務創(chuàng)新方面,大數(shù)據(jù)的驅動主要是通過讀者大數(shù)據(jù)的挖掘,為其提供個性化圖書館服務。具體而言,圖書館在獲取讀者網(wǎng)絡底層數(shù)據(jù)信息的同時,利用大數(shù)據(jù)挖掘技術對大數(shù)據(jù)中的檢索、瀏覽、下載等相關日志數(shù)據(jù)進行整合分析,以此歸納讀者在圖書資源檢索、瀏覽和下載方面的特征,結合其時間維度,分析某一時期讀者較為關注的學科,并通過關聯(lián)分析方法、社會網(wǎng)絡分析方法與聚類分析方法,預測學科熱點及關聯(lián)交叉學科,事先做好圖書資源整合,在其他讀者檢索或者瀏覽時,為其推薦相關圖書資源,有助于圖書館服務水平的提升。以高校圖書館為例,高校圖書館需要充分發(fā)揮自身的學科情報服務作用,定期采集各個學科師生在某個時間段的中國期刊網(wǎng)檢索、瀏覽及下載日志數(shù)據(jù),并通過關聯(lián)分析法,明確學科熱點和關聯(lián)交叉學科。比如,某高校圖書館管理人員指導圖書館館員應用情報分析專業(yè)知識,通過大數(shù)據(jù)挖掘技術及高校圖書館的文獻信息資源優(yōu)勢,編制了多份學科分析報告,指出圖書館在學科情報服務方面的不足,對圖書館業(yè)務創(chuàng)新提供指導。
綜上所述,大數(shù)據(jù)對圖書館發(fā)展提出了較大的挑戰(zhàn),也為圖書館提供了發(fā)展機遇。通過本文的分析可知,圖書館管理人員需要構建完善的大數(shù)據(jù)驅動平臺,基于該平臺進行業(yè)務應用及服務創(chuàng)新,提升圖書館的業(yè)務水平,為讀者提供信息化與個性化的圖書館服務,提升圖書館的市場競爭力,促進其健康發(fā)展。