馮穎
摘 要:文章闡述了大數(shù)據(jù)給圖書館信息服務(wù)帶來的轉(zhuǎn)變,提出了大數(shù)據(jù)圖書館服務(wù)的發(fā)展方向,分析了基于大數(shù)據(jù)的圖書館信息服務(wù)模式和資源流程,并研究了大數(shù)據(jù)模式下的圖書館信息模式與個(gè)性化服務(wù)方式。
關(guān)鍵詞:大數(shù)據(jù);主動(dòng)服務(wù);信息可視化;智能用戶分析
中圖分類號(hào):G250 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-1588(2017)02-0093-03
近年來,隨著移動(dòng)信息技術(shù)、大數(shù)據(jù)技術(shù)、數(shù)據(jù)處理技術(shù)的發(fā)展,圖書館的信息模式也在不斷地革新和優(yōu)化。在圖書館信息服務(wù)中,各類跨行業(yè)、定制化、個(gè)性化的業(yè)務(wù)需求不斷增多,對(duì)圖書信息數(shù)據(jù)的抽取、挖掘和分析成為推動(dòng)圖書館信息服務(wù)水平提升的關(guān)鍵。大數(shù)據(jù)技術(shù)的發(fā)展為圖書館信息模式的創(chuàng)新提供了良好契機(jī),構(gòu)建基于大數(shù)據(jù)的圖書館“數(shù)據(jù)—信息—知識(shí)—智慧”信息服務(wù)模式,能更好地推動(dòng)圖書信息數(shù)據(jù)轉(zhuǎn)化為潛在知識(shí)服務(wù),進(jìn)而創(chuàng)新信息服務(wù)模式,提升數(shù)字化、智能化、個(gè)性化服務(wù)水平。
1 大數(shù)據(jù)帶動(dòng)圖書館信息模式的轉(zhuǎn)變
根據(jù)維基百科的定義,大數(shù)據(jù)是一種數(shù)據(jù)集,能夠通過常用的軟件工具來獲取、存儲(chǔ)和管理,具有種類多、流量大、體量大、價(jià)值高的特點(diǎn)。此外,大數(shù)據(jù)的處理時(shí)間超過常規(guī)數(shù)據(jù)處理的可容忍時(shí)間,不僅數(shù)據(jù)量巨大,而且增長(zhǎng)迅速。大數(shù)據(jù)是一種寶貴的信息資產(chǎn),數(shù)據(jù)中蘊(yùn)藏著豐富的信息內(nèi)容,圖書館用戶在圖書信息網(wǎng)站、購物平臺(tái)、社交網(wǎng)絡(luò)等信息平臺(tái),都會(huì)產(chǎn)生并留下大量的數(shù)據(jù),這類大數(shù)據(jù)信息包含圖片、聲音、視頻等多媒體信息,最終形成海量的圖書館用戶大數(shù)據(jù)。大數(shù)據(jù)對(duì)圖書館信息模式的轉(zhuǎn)變有巨大的推動(dòng)作用,具體如下。
1.1 從被動(dòng)服務(wù)向主動(dòng)服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書館服務(wù)以被動(dòng)服務(wù)為主,管理員對(duì)圖書資源進(jìn)行信息加工,經(jīng)過信息資源的采集、存儲(chǔ)、集成、分享,形成信息產(chǎn)品推送給用戶。這個(gè)信息流是以管理員為中心的單向流動(dòng)的過程,用戶處于一種被動(dòng)接受的狀態(tài),很難將自身需求傳遞回圖書館[1]。
大數(shù)據(jù)的出現(xiàn)有助于圖書館向主動(dòng)式服務(wù)轉(zhuǎn)變,建立以用戶需求為中心的信息服務(wù)模式,為用戶提供個(gè)性化信息服務(wù)。如:圖書館根據(jù)對(duì)用戶評(píng)論、滿意度反饋調(diào)查等大數(shù)據(jù)的分析結(jié)果,提取出用戶的實(shí)際需求、閱讀習(xí)慣、閱讀頻次,并將之反饋給管理員,再由管理員進(jìn)行信息資源的采集、存儲(chǔ)、集成和分享,形成符合用戶個(gè)性化需求的信息產(chǎn)品。
1.2 從內(nèi)向型服務(wù)向外向型服務(wù)轉(zhuǎn)變
傳統(tǒng)的圖書館服務(wù)屬于內(nèi)向型服務(wù),服務(wù)載體以紙質(zhì)書籍、報(bào)刊、檔案為主,知識(shí)傳播途徑較為單一。移動(dòng)信息時(shí)代,圖書館的服務(wù)載體日益多元化,通過智能手機(jī)、電腦、電視等都可以進(jìn)行圖書信息傳播,信息資源獲取途徑也不斷拓展,打破了傳統(tǒng)圖書服務(wù)模式的時(shí)空限制。
大數(shù)據(jù)模式下,圖書館信息途徑更加外向,信息受眾也更加寬泛,目前包括首都圖書館、廣州圖書館、上海圖書館等在內(nèi)的圖書館都允許社會(huì)人員入館,開放式的大數(shù)據(jù)圖書館成為發(fā)展趨勢(shì),傳統(tǒng)“讀萬卷書、行萬里路”的信息獲取方式已經(jīng)過時(shí),“秀才不出門,便知天下事”的大數(shù)據(jù)閱讀已成為現(xiàn)實(shí)。
2 基于大數(shù)據(jù)的圖書館信息服務(wù)模式研究
大數(shù)據(jù)是數(shù)字世界的智慧基因,來自圖書館用戶的使用數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)和社會(huì)網(wǎng)絡(luò)數(shù)據(jù)都能夠匯聚為大數(shù)據(jù),圖書館自身即可被視為一個(gè)大的數(shù)據(jù)集,不同地區(qū)的圖書館可以聯(lián)合構(gòu)建大數(shù)據(jù)圖書館,不同地區(qū)的圖書館數(shù)據(jù)之間存在數(shù)據(jù)交換和資源共享。圖書館通過對(duì)大數(shù)據(jù)的整合與分析,洞悉用戶的真實(shí)需求。圖1為圖書館大數(shù)據(jù)應(yīng)用的支撐技術(shù)與實(shí)現(xiàn)方法。
圖1顯示,圖書館大數(shù)據(jù)應(yīng)用主要基于分布式數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)分析挖掘、圖計(jì)算技術(shù)、可視化技術(shù)等,對(duì)各類源數(shù)據(jù)進(jìn)行收集、整合、存儲(chǔ)和處理、分析,最終轉(zhuǎn)換為個(gè)性化服務(wù)。圖書館大數(shù)據(jù)結(jié)構(gòu)復(fù)雜、種類眾多、容量巨大,對(duì)數(shù)據(jù)的處理過程是信息工作人員對(duì)信息的再次加工與分析的過程。
國(guó)外對(duì)移動(dòng)圖書館和大數(shù)據(jù)應(yīng)用的研究起步較早,由此衍生出的個(gè)性化服務(wù)也較多。目前,美國(guó)高校可以提供基于Windows Phone、Kindle、Blackberry等多個(gè)系統(tǒng)的圖書數(shù)據(jù)服務(wù),很多高校都實(shí)現(xiàn)了數(shù)字圖書館服務(wù)。如:耶魯大學(xué)所有紙質(zhì)圖書均印有二維碼,用戶可以通過掃碼直接鏈接圖書資源,還可以通過大數(shù)據(jù)收集提供多媒體資源的移動(dòng)信息檢索;斯坦福大學(xué)圖書館用戶可以通過智能手機(jī)終端獲取各類移動(dòng)信息,包括視頻、音頻、樂譜等。
在國(guó)內(nèi),清華大學(xué)、中國(guó)人民大學(xué)等高校的圖書館,以及國(guó)家圖書館、首都圖書館等技術(shù)先進(jìn)的圖書館也在大數(shù)據(jù)應(yīng)用方面展開了一系列探索,國(guó)內(nèi)很多圖書館已經(jīng)基本實(shí)現(xiàn)館藏?cái)?shù)字化,并借助大數(shù)據(jù)提供了一系列特色服務(wù)[2]。如:國(guó)家圖書館的“掌上國(guó)圖”、杭州數(shù)字圖書館的“文瀾在線”等。大數(shù)據(jù)信息模式通過數(shù)據(jù)挖掘和分析最終得出用戶行為分析結(jié)果,從而為圖書館個(gè)性化服務(wù)提供支撐。
如圖2所示,圖書館大數(shù)據(jù)的信息架構(gòu)可以分為四層,分別為大數(shù)據(jù)的采集、存儲(chǔ)、處理和應(yīng)用。其中,圖書館大數(shù)據(jù)主要采集來自國(guó)內(nèi)外數(shù)據(jù)庫的論文、著作以及社交網(wǎng)絡(luò)數(shù)據(jù)等,包括文字、圖片、影像、視頻等多種表現(xiàn)形式。圖書館數(shù)據(jù)浩如煙海,要想從數(shù)據(jù)中成功提取所需要的信息,需要借助Hadoop技術(shù)、Map Reduce技術(shù)、SQL(Structured Query Language,結(jié)構(gòu)化查詢語言)技術(shù)等,將大數(shù)據(jù)存儲(chǔ)到云服務(wù)器,通過云計(jì)算技術(shù)對(duì)大量的圖書文件系統(tǒng)和元數(shù)據(jù)庫進(jìn)行整合,實(shí)現(xiàn)多渠道、多類型、大異構(gòu)的信息存儲(chǔ)服務(wù)[3]。
3 基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)研究
基于大數(shù)據(jù)的圖書館個(gè)性化服務(wù)能夠幫助用戶融入其中,構(gòu)建充分適用于互聯(lián)網(wǎng)、移動(dòng)終端、智能手機(jī)、本地用戶等多種接入方式的大數(shù)據(jù)知識(shí)共享平臺(tái)。大數(shù)據(jù)技術(shù)強(qiáng)大的數(shù)據(jù)處理和分析能力,不僅能夠幫助用戶克服時(shí)空局限,與信息管理員進(jìn)行實(shí)時(shí)反饋與交流,還能夠幫助用戶借助大數(shù)據(jù)個(gè)性化服務(wù)方式,通過新媒體傳播、互動(dòng)百科、學(xué)術(shù)論壇等方式來發(fā)布信息,實(shí)現(xiàn)圖書信息的閉環(huán)傳遞和反饋。
3.1 信息可視化服務(wù)
移動(dòng)信息時(shí)代圖書信息資源日益多樣化,用戶對(duì)信息提供方式的要求日益提升,希望能夠?qū)崿F(xiàn)反饋信息可視化。大數(shù)據(jù)信息量大、價(jià)值密度低、數(shù)據(jù)層次多,因此通過大數(shù)據(jù)挖掘提取出有用信息,并以可視化形式呈現(xiàn),能夠大大提高圖書館用戶對(duì)圖書信息檢索的評(píng)價(jià)。常見的圖書可視化技術(shù)包括標(biāo)簽云、歷史流、空間信息技術(shù)等,通過大數(shù)據(jù)的可視化輸出,能夠提高用戶的查準(zhǔn)率。
清華大學(xué)圖書館將圖書館服務(wù)嵌入搜索引擎中,將購買的66,000多種電子期刊資源與Google Scholar等平臺(tái)進(jìn)行關(guān)聯(lián),并嵌入大數(shù)據(jù)的圖書可視化技術(shù),將電子館藏大數(shù)據(jù)信息整合為XML文件并存儲(chǔ)在特定服務(wù)器,從而使Google Scholar等平臺(tái)能夠定期抓取。當(dāng)用戶在相關(guān)搜索引擎進(jìn)行搜索時(shí),可以根據(jù)用戶的檢索自動(dòng)連接到清華大學(xué)的館藏資源,并能夠可視化呈現(xiàn),用戶通過標(biāo)識(shí)性的文字就能夠獲取閱讀權(quán)限,從而極大地提升了資源的查準(zhǔn)率和資源共享率[4]。
3.2 個(gè)性化圖書信息服務(wù)
要做好圖書館信息服務(wù),應(yīng)該充分利用大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),并與云計(jì)算技術(shù)、無線通信技術(shù)、傳感和網(wǎng)絡(luò)技術(shù)相結(jié)合,實(shí)現(xiàn)圖書館數(shù)據(jù)從基礎(chǔ)設(shè)施架構(gòu)到用戶服務(wù)模式的變革,進(jìn)而幫助用戶克服閱讀時(shí)間、地點(diǎn)、內(nèi)容、終端類型等條件的限制,結(jié)合移動(dòng)圖書館、手機(jī)圖書館、云計(jì)算圖書館、泛在圖書館等新的服務(wù)形式,真正實(shí)現(xiàn)以用戶需求為中心的信息模式與個(gè)性化服務(wù)。
如表1所示,以國(guó)家圖書館的“掌上國(guó)圖”和杭州數(shù)字圖書館的“文瀾在線”為代表,國(guó)內(nèi)一些技術(shù)先進(jìn)的圖書館已經(jīng)逐步對(duì)館藏進(jìn)行數(shù)字化,并基于大數(shù)據(jù)技術(shù)對(duì)數(shù)字資源進(jìn)行分析、存儲(chǔ)和整合,提供參考咨詢、圖書館微博、讀者薦購等服務(wù)。圖書館將海量的無序數(shù)據(jù)進(jìn)行整合,通過開放鏈接和數(shù)據(jù)混搭的方式對(duì)其進(jìn)行推送,對(duì)于來自互聯(lián)網(wǎng)、移動(dòng)終端、本地等不同路徑的圖書館用戶,圖書館能夠基于大數(shù)據(jù)提供的海量資源,提供具備個(gè)性化參考咨詢的一站式檢索服務(wù)。在個(gè)性化知識(shí)發(fā)布方面,圖書館能夠通過學(xué)術(shù)博客、圖書館網(wǎng)站等來發(fā)布圖書信息;在個(gè)性化知識(shí)交流方面,讀者既能夠在知網(wǎng)空間發(fā)表心得,也能夠通過互動(dòng)百科、學(xué)術(shù)論壇等方式參與知識(shí)交流。此外,互聯(lián)網(wǎng)用戶還能夠借助泛在網(wǎng)絡(luò)和虛擬社區(qū)來參與圖書信息交流,大數(shù)據(jù)的可視化技術(shù)也極大地提升了圖書館個(gè)性化服務(wù)的效率。
3.3 用戶智能化分析服務(wù)
數(shù)據(jù)挖掘即從大數(shù)據(jù)中提取出各類有價(jià)值信息,并將之應(yīng)用于對(duì)圖書信息用戶閱讀習(xí)慣、信息行為、信息軌跡的分析上,同時(shí)借助這些分析來預(yù)測(cè)用戶需求,從而提供智能化推送服務(wù)[5]。此外,圖書館還能夠借助智能化分析服務(wù),對(duì)現(xiàn)有資源進(jìn)行綜合分析,預(yù)測(cè)未來有可能存在的系統(tǒng)故障、用戶需求響應(yīng)障礙、信息安全等方面的問題。
圖3是大數(shù)據(jù)圖書館讀者閱讀行為分析判定流程圖。如圖3所示,大數(shù)據(jù)圖書館會(huì)全面而規(guī)范地搜集用戶行為數(shù)據(jù),基于大量的存儲(chǔ)數(shù)據(jù)對(duì)用戶行為事件進(jìn)行初步過濾,通過科學(xué)分類、智能分析、人工匹配等環(huán)節(jié),結(jié)合信息管理人員的經(jīng)驗(yàn),經(jīng)過價(jià)值過濾和人工篩選后得出用戶行為定義,從而進(jìn)行用戶行為判定,完成價(jià)值過濾和信息篩選過程。與此同時(shí),圖書館還采集用戶行為事件并將之存入大數(shù)據(jù)庫,將用戶行為分析的結(jié)果與數(shù)據(jù)庫對(duì)比,進(jìn)行用戶行為匹配,最終得出用戶的閱讀行為和興趣點(diǎn),并據(jù)此進(jìn)行個(gè)性化推送服務(wù)。
清華大學(xué)圖書館在新浪微博注冊(cè)了名為“清華樂推”的微博,并使用了大數(shù)據(jù)的用戶智能分析技術(shù),通過對(duì)清華大學(xué)官方微博上的讀者咨詢、建議、投訴和表揚(yáng)等方面數(shù)據(jù)的分析,篩選出重要的價(jià)值信息[6],并依據(jù)這些信息來提供相應(yīng)的定制服務(wù)、培訓(xùn)信息、圖書推送信息等。
4 結(jié)語
大數(shù)據(jù)是移動(dòng)信息時(shí)代用戶閱讀需求快速變化的產(chǎn)物,也是信息技術(shù)發(fā)展的必然趨勢(shì),大數(shù)據(jù)在圖書館的應(yīng)用有利于打破傳統(tǒng)圖書館在時(shí)間和地點(diǎn)方面的限制。大數(shù)據(jù)已經(jīng)成為保障圖書館信息系統(tǒng)和服務(wù)能力的重要因素,現(xiàn)代圖書館應(yīng)該充分利用大數(shù)據(jù)資源,準(zhǔn)確識(shí)別圖書館用戶的服務(wù)需求、閱讀行為、個(gè)性化特征,創(chuàng)新信息模式與個(gè)性化服務(wù)方法,不斷改善用戶的閱讀體驗(yàn),改善用戶關(guān)系,從而實(shí)現(xiàn)精準(zhǔn)化、個(gè)性化、智能化的圖書信息服務(wù)。
參考文獻(xiàn):
[1]胡越.圖書館服務(wù)的學(xué)科化與個(gè)性化[M].北京:首都師范大學(xué)出版社,2008:21.
[2]周虹,張蓓,竇天芳,等.清華大學(xué)圖書館OPAC書封服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2008(8):84-87.
[3]施慧娟.可視化數(shù)據(jù)挖掘技術(shù)的研究與實(shí)現(xiàn)[D].上海:華東師范大學(xué)信息學(xué)院,2010.
[4]劉淑玲.網(wǎng)絡(luò)環(huán)境下高校圖書館的知識(shí)管理與知識(shí)服務(wù)[J].情報(bào)科學(xué),2010(4):523-526.
[5]韓晶星.面向知識(shí)社區(qū)的數(shù)字參考咨詢服務(wù)平臺(tái)構(gòu)建[J].情報(bào)雜志,2010(2):123-126.
[6]李靖.圖書館自助式服務(wù)的現(xiàn)狀與未來[J].上海高校圖書情報(bào)工作研究,2011(2): 6-8.
(編校:周雪芹)