何聰
摘 要:近年來,國內外的圖書館都在轉變觀念,重視圖書館中各類數(shù)據(jù)的收集、存儲和管理,在用戶數(shù)據(jù)管理軟件開發(fā)、用戶利用文獻資源的數(shù)據(jù)分析與共享、文獻資源選擇的用戶主導決策等方面進行了有益的嘗試。本文分析了大數(shù)據(jù)時代下圖書館文獻資源的構成體系,并討論了再造文獻資源建設模式及其方法,提出了相應的措施。
關鍵詞:大數(shù)據(jù)技術;圖書館大數(shù)據(jù);文獻資源建設;圖書館變革;模式創(chuàng)新
1 圖書館大數(shù)據(jù)的構成體系
隨著互聯(lián)網的發(fā)展,網絡化傳播、數(shù)字化出版、移動化閱讀成為人們的首選,尤其是隨著社會化媒體的發(fā)展,博客、微博、微信、朋友圈的發(fā)展,作者、讀者的身份逐漸模糊,個人既是信息內容的消費者,同時又是內容的生產者和傳播者。海量用戶參與到數(shù)字信息生產、傳播、出版的各個環(huán)節(jié),形成了大量的出版、傳播、閱讀與使用數(shù)據(jù)。從數(shù)據(jù)生成角度,可以分為專家生成的專業(yè)數(shù)據(jù)、用戶生成內容和信息設備采集生成內容。
依據(jù)用戶生產、傳播、瀏覽、閱讀、收藏、購買、利用等數(shù)據(jù)進行存儲、管理和分析,建立讀者數(shù)據(jù)庫,管理讀者信息并分析其關注的問題,發(fā)現(xiàn)其興趣、愛好、閱讀和購買習慣,可為圖書館進行有針對性、即時性的購買提供精準化的推薦或推送信息,提高圖書館經費的使用效率和效果,改進圖書館資源購買的方式,提高資源規(guī)劃的科學性和預見性。
在大數(shù)據(jù)環(huán)境下,圖書館必須開展全方位、全過程、跨部門、跨機構、多途徑地采集、存儲、加工和整合用戶在本圖書館網絡系統(tǒng)、其他網絡環(huán)境、社交網絡、移動閱讀、監(jiān)控設備和傳感器等信息來源的數(shù)據(jù),圖書館必須開展與出版商、數(shù)據(jù)庫供應商和信息資源平臺之間的數(shù)據(jù)共享與合作,才能全面、準確地掌握讀者的閱讀行為、閱讀興趣與閱讀需求、閱讀需求以及閱讀方式變化趨勢等數(shù)據(jù)資產,為改進圖書館管理與服務效率,變革文獻資源評價、選擇的標準與方法,提高文獻資源建設的科學性、預見性、系統(tǒng)性等工作提供決策支持。
2 大數(shù)據(jù)有助于再造文獻資源建設模式
2.1 大數(shù)據(jù)為資源采購提供決策支持
頻繁變化的應用背后,不變的是永恒的數(shù)據(jù)。大數(shù)據(jù)的研究機構Gartner認為:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。圖書館大數(shù)據(jù)的來源也呈多樣性的特征,它包括圖書館業(yè)務數(shù)據(jù)、文獻數(shù)據(jù)和用戶數(shù)據(jù)3種基本類型。用戶使用數(shù)據(jù)是指用戶在使用圖書館信息資源或信息設施的過程中可以被計算機所記錄的用戶信息行為數(shù)據(jù),既包括網絡環(huán)境中的信息行為數(shù)據(jù),也包括物理空間中的信息行為數(shù)據(jù)。
圖書館系統(tǒng)通過大數(shù)據(jù)技術的運用,掌握讀者使用資源的交互數(shù)據(jù),如圖書瀏覽、數(shù)據(jù)庫訪問、檢索、下載記錄、評論、推薦等信息,可以更加有效地評估讀者對各種資源的使用情況,尤其是通過挖掘用戶檢索日志,對那些被多次檢索而圖書館又缺藏的資源的購買和補充提供非常有力的依據(jù),能夠更全面、更精準、更及時地掌握單個圖書館或者某個系統(tǒng)、某個地域全部圖書館的用戶對信息資源獲取與利用的情況,為圖書館文獻資源的采訪決策、優(yōu)化配置和數(shù)據(jù)庫的刪選調整提供科學的依據(jù),也為圖書館再造文獻采訪模式提供有力的保障。
2.2 大數(shù)據(jù)推動“讀者決策采購”模式的發(fā)展
近年來,國內外各類圖書館普遍面臨文獻采購經費投入減少的問題,無論是外文紙本期刊還是外文數(shù)據(jù)庫的購買都出現(xiàn)不同程度的下降,這對捆綁銷售、集團購買和整庫或全庫購買等方式都會帶來不利影響。由于經費困難等因素,國外有部分圖書館已經停止以大宗交易(bigdeal)(整庫購買、捆綁銷售)方式購買期刊資源,代之以按篇付費(pay-per-view,PPV)等模式。按篇付費方式訂購期刊論文,或按需購買單本電子圖書和按需出版等方式的興起,實際上是讀者決策采購(patrondrivenacquisition,PDA)在圖書館資源訂購中的體現(xiàn)。
2.3 大數(shù)據(jù)創(chuàng)新圖書館資源的動態(tài)管理機制
文獻資源的有效組織和科學管理是圖書館文獻資源建設的重要組成部分。有些圖書館往往重視資源的購買而忽視資源的有效組織和整合。互聯(lián)網時代的知識生產呈冪級數(shù)增長,知識體系的更新更加頻繁,人們在圖書館檢索中不只需要獲取某一知識點,更需要獲得知識體系。知識體系的動態(tài)構建和檢索結果的有效呈現(xiàn)需要大數(shù)據(jù)的數(shù)據(jù)處理技術給予支撐。谷歌知識圖譜、搜狗知立方、百度知識圖譜等搜索引擎的推出,為用戶的搜索關鍵詞返回多種媒體形式、多種知識點組成的知識關聯(lián)結果,這大大擴展了用戶搜索的知識體系,值得圖書館界學習和借鑒。
3 創(chuàng)新圖書館文獻資源建設的措施
3.1 樹立大數(shù)據(jù)思維
維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中討論了關于大數(shù)據(jù)的3個思維變化:1)不是隨機樣本,而是全數(shù)據(jù);2)不是精準性的,而是具有混雜性,尤其是大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法有效;3)不是因果關系,而是相關關系。就圖書館而言,大數(shù)據(jù)思維是一種重視用戶數(shù)據(jù),重視用戶使用行為,平等對待用戶需求的理念,按照用戶的需求抉擇圖書館資源建設和服務的理念。同時,要求圖書館重視對圖書館和科研機構等相關數(shù)據(jù)的存儲、管理、分析和利用,徹底改變過去在圖書館管理、資源建設和服務工作中憑表面印象就決定的思維方式和決策方法。
3.2 培養(yǎng)大數(shù)據(jù)館員
大數(shù)據(jù)將重建圖書館的知識管理體系。面對大量異質、異構的數(shù)據(jù),圖書館需要解決大數(shù)據(jù)的可表示性、可處理性、可融合性及可靠性等關鍵問題。這就需要一批掌握大數(shù)據(jù)分析工具來對數(shù)據(jù)進行有效挖掘、分析預測的數(shù)據(jù)館員,需要一批從關注資源技術、圖書館技術轉變?yōu)殛P注知識技術和用戶技術,從提供勞動力密集服務轉變?yōu)樘峁┓椒?、工具與計算密集型服務的分析師,通過數(shù)據(jù)挖掘軟件和Citespace、LiterMiner等可視化工具來繪制科學知識圖譜,了解和預測科學發(fā)展前沿和動態(tài),提供有針對性的、個性化的推送服務。
3.3 充分利用現(xiàn)有大數(shù)據(jù)工具,精準推送文獻
Altmetrics是一種基于社會網絡的學術影響力評價方法,該方法利用Altmetrics工具收割文獻管理系統(tǒng)和社交網絡中涉及某一研究成果的相關信息,通過對這些信息進行計算達到評價該學術成果影響力的目的,目前網絡上已有多種此類工具,如Altmetric.com、ImpactStory、PlumAnalytics等。另一方面,OA資源作為館藏資源的重要組成部分,越來越受到人們重視,但是圖書館在收集OA資源時往往缺乏參考工具,Altmetrics在一定程度上為我們提供了依據(jù)。南昌大學圖書館利用Altmetric.com通過MEDLINE主題詞、匹配PUBMED提問等條件進行設置,每季度向醫(yī)學院相關課題組提供學科影響力排在前10名的論文,大受歡迎。
4 結語
總之,大數(shù)據(jù)技術正在對圖書館的資源評價、選擇、組織和服務等工作產生越來越大的影響,圖書館應當科學有效地采集、存取、管理數(shù)據(jù),并通過分析,提煉出有價值的信息,支持管理層作出及時有效的決策。需要指出的是,我們對大數(shù)據(jù)不能迷信,大數(shù)據(jù)不是萬能的,它也存在自身局限性。我們必須從本單位的實際情況出發(fā),循序漸進,量力而行,切忌好大喜功。
參考文獻
[1]孫坦.開放信息環(huán)境:學術圖書館信息資源建設的重新定義[J].中國圖書館學報,2013(3):9-17.
[2]張計龍.大數(shù)據(jù)驅動圖書館業(yè)務應用與服務創(chuàng)新[J].上海高校圖書情報工作研究,2013(3):1-6.
[3]陳超.圖書館如何迎接大數(shù)據(jù)時代?[J].圖書館雜志,2014,33(1):4-7.
[4]烏恩.智慧圖書館及其服務模式的構建[J].情報資料工作,2012(5):102-104.
[5]葉蘭.研究數(shù)據(jù)管理能力成熟度模型評析[J].圖書情報知識,2015(2):115-123.