楊方銘,章 華
(淮安信息職業(yè)技術學院圖書館,江蘇 淮安 223003)
大數(shù)據(jù)環(huán)境下圖書館服務變革探討*
楊方銘,章華
(淮安信息職業(yè)技術學院圖書館,江蘇淮安223003)
論述大數(shù)據(jù)的特征,闡述大數(shù)據(jù)對圖書館服務、館藏的影響和作用,提出需要在分析和挖掘圖書館相關大數(shù)據(jù)的基礎上創(chuàng)新圖書館服務,圖書館應朝著一體化的個性化服務、面向創(chuàng)新的知識服務和智慧化服務的方向發(fā)展。
大數(shù)據(jù);圖書館服務;數(shù)據(jù)挖掘;數(shù)據(jù)分析
從字面上看,大數(shù)據(jù)是一個表示龐大規(guī)模數(shù)據(jù)的抽象概念。如果僅在數(shù)量上,大數(shù)據(jù)和以前的“海量數(shù)據(jù)”“超大規(guī)模數(shù)據(jù)”等概念之間并無太大區(qū)別。目前,關于大數(shù)據(jù),學界尚未形成統(tǒng)一的定義,但是存在一些共識,大數(shù)據(jù)是一個用來描述海量的結構化、半結構化和非結構化數(shù)據(jù)的動態(tài)概念,這些數(shù)據(jù)的容量非常巨大以至于很難用傳統(tǒng)的數(shù)據(jù)庫和軟件技術進行存儲、管理和處理。其中,數(shù)據(jù)量并不是必須達到TB級或PB級才算是大數(shù)據(jù),它的數(shù)量是隨著技術的進步而改變,過去或目前的大數(shù)據(jù),在未來可能不再是大數(shù)據(jù)。它的理念是通過包括互聯(lián)網(wǎng)在內的多種渠道收集研究對象的多維度數(shù)據(jù),再對海量數(shù)據(jù)進行關聯(lián)分析和數(shù)據(jù)挖掘,發(fā)現(xiàn)被研究對象的潛在行為模式或規(guī)律[1]。
圖書館大數(shù)據(jù)環(huán)境具有 “4V+1C”特征:(1)Variety。數(shù)據(jù)種類多,包括結構、半結構和非結構等數(shù)據(jù)類型,具有較強的異構性。(2)Volume。圖書館利用監(jiān)控、服務終端采集讀者行為數(shù)據(jù)和系統(tǒng)運營數(shù)據(jù),使其圖書館數(shù)據(jù)日益龐大。(3)Velocity。圖書館采集到的大部分數(shù)據(jù)均為用戶行為和應用服務等方面的數(shù)據(jù),它的分析處理時效性很強。(4)Vitality。圖書館依據(jù)用戶需求和服務實際情況對大數(shù)據(jù)進行處理和分析,其需要很強的時間和空間適用性。(5)Complexity。圖書館需要采用高效算法對異構數(shù)據(jù)進行處理分析,其難度很大[2]。
2.1館藏收集范圍擴大與知識挖掘
隨著移動服務的普及和社交媒體的流行,圖書館收藏的數(shù)據(jù)源開始擴展到視頻、音頻、數(shù)據(jù)流等非結構化數(shù)據(jù)。針對如此復雜的數(shù)據(jù),圖書館需要利用大數(shù)據(jù)技術和理念處理好以下幾個問題:(1)大數(shù)據(jù)的收集。圖書館需要收集的大數(shù)據(jù)主要包含自身網(wǎng)絡應用子系統(tǒng)產生的數(shù)據(jù)和外部Internet產生的數(shù)據(jù),收集范圍是圖書館需要采集有價值的數(shù)據(jù)與可以采集到數(shù)據(jù)的相互交融的數(shù)據(jù)。(2)大數(shù)據(jù)由大變小,即如何處理和清洗大數(shù)據(jù)。圖書館要想利用大數(shù)據(jù),就必須掌握大數(shù)據(jù)處理流程和方法,對大數(shù)據(jù)進行抽樣、篩選、壓縮、索引、提取元數(shù)據(jù)等操作,把海量數(shù)據(jù)變小。然后,采用主題分析,核心概念提取,選用上位詞、普選利用下位詞、縮小數(shù)據(jù)范圍等方法對大數(shù)據(jù)進行分析和挖掘。(3)怎么對大數(shù)據(jù)進行價值提煉。隨著圖書館越來越重視個性化服務,圖書館系統(tǒng)與網(wǎng)絡日志、監(jiān)控與服務視頻、音頻、圖片、網(wǎng)絡行為及增值服務等非結構化數(shù)據(jù)量將超結構化數(shù)據(jù)量。因此,圖書館需要對非結構化數(shù)據(jù)進行結構化解讀和梳理,利用群體智慧提煉和發(fā)酵數(shù)據(jù)的價值。
2.2以用戶為中心的服務創(chuàng)新
在大數(shù)據(jù)環(huán)境下,圖書館館藏數(shù)量的激增、非機構數(shù)據(jù)占主體、數(shù)據(jù)種類繁多等特征,使圖書館不能再利用傳統(tǒng)的信息搜集、組織、分析、傳遞與提供利用的服務模式以滿足用戶的信息需求,而是要在搜集、組織、分析、挖掘數(shù)據(jù)的基礎上,提煉知識,關注知識服務的全過程,利用數(shù)據(jù)了解服務中發(fā)生了什么,分析和預測科研創(chuàng)新合作過程中、解決用戶問題過程中發(fā)生了什么,以便在關注用戶的結構化信息需求時,創(chuàng)新服務模式,通過對非結構化、半結構化、結構化數(shù)據(jù)的分析來滿足用戶急劇擴張的知識需求。
其具體措施是:(1)加強用戶研究與交換數(shù)據(jù)的利用,對用戶數(shù)據(jù)進行深度分析并建立用戶模型,開展精準服務、知識關聯(lián)服務,提供預測性信息服務產品;(2)將現(xiàn)有成熟的信息采集工作模式與先進的數(shù)學模型結合,實現(xiàn)工作效率的提升;(3)關注和融入社交網(wǎng)站,擴大圖書館的受眾面,實時了解讀者的需求,提升圖書館在讀者個人文化生活中的作用和影響[3];(4)圍繞用戶的問題、科研創(chuàng)新提供服務。
3.1圖書館服務走近用戶
大數(shù)據(jù)對圖書館工作的沖擊及其理念對圖書館服務的影響,迫使圖書館不能只重視館藏數(shù)字化及其數(shù)據(jù)存儲量,而是要強化圖書館對大數(shù)據(jù)的分析和挖掘的能力。讓館藏建設走向知識組織,把無序的網(wǎng)絡空間變成有序的數(shù)字知識服務系統(tǒng),保證用戶高效、系統(tǒng)、可靠地獲取所需要的信息[4]。圖書館還要加強隨時隨地為用戶提供服務的能力,滿足他們對知識服務的需求,為用戶科學創(chuàng)造提供必需的情報服務,讓用戶在科研過程中體驗到圖書館細致入微的科研服務,真正體現(xiàn)以用戶為主的服務思想。在服務方式上,圖書館要改變過去只注重吸引大量用戶到圖書館而不注重服務效果的服務方式,切實做到把圖書館服務延伸到用戶的第一線,用大數(shù)據(jù)理念預測用戶需求,提供精確服務,真正讓圖書館服務走近用戶。
3.2一體化的個性化服務體系
隨著大數(shù)據(jù)技術與理念應用到各行各業(yè),圖書館也要轉變信息資源建設觀念與信息服務理念,改變信息資源的選擇、組織與存儲方式,從海量數(shù)據(jù)中窺探用戶行為,并與已有業(yè)務流程、服務模式融合,創(chuàng)造新的方法讓圖書館服務更具價值。圖書館長期為用戶提供信息服務,積累了大量用戶資料,在此基礎再研究用戶的網(wǎng)絡行為、學習行為、個人背景等數(shù)據(jù)資料,利用Hadoop、NoSQL等大數(shù)據(jù)處理技術,挖掘用戶的知識背景、興趣、學習風格、情感、社會關系等信息,利用語義網(wǎng)、信息檢索、個性化推薦等技術,與用戶行為模式相似的其他用戶歷史數(shù)據(jù)進行對照,并深層次分析、組織數(shù)字資源,讓圖書館系統(tǒng)能夠針對用戶的搜索信息行為,提供個性化語義搜索服務;針對用戶的瀏覽行為,提供個性化語義導航服務;針對用戶的提問行為,提供個性化的問答服務;針對用戶的自主學習行為,提供個性化定制服務;針對用戶需求,進行語義分析、語義擴展等步驟來明確用戶真實意圖,根據(jù)用戶本體,利用個性化推薦引擎為用戶推薦符合需求的知識內容。這樣,最終建立以數(shù)據(jù)為中心,以用戶、服務、信息、技術和應用為一體化的個性化服務體系。
3.3面向創(chuàng)新的知識服務
在大數(shù)據(jù)環(huán)境下,圖書館的服務策略建立在對大規(guī)模復雜數(shù)據(jù)搜集、組織、整理、分析和挖掘的基礎之上,因而圖書館服務項目更具有針對性和操作性[5]。圖書館經(jīng)過對海量數(shù)據(jù)的統(tǒng)計性搜索、比較、聚類、分類等分析歸納,能夠完成數(shù)據(jù)價值的挖掘和讀者需求的預測,再利用大數(shù)據(jù)技術對多個信息平臺的數(shù)據(jù)進行過濾整合,實現(xiàn)依據(jù)讀者需求的變化而提供差別化的知識服務,滿足用戶智慧集群和群體創(chuàng)造的需要,滿足多用戶合作學習、合作科研、多元知識交互分析、利用與交流的需要,進而把知識服務嵌入到用戶學習、科技創(chuàng)新的過程中,形成面向用戶科研創(chuàng)新的知識服務模式。
其模式以解決用戶問題為核心,深入解決問題的各個環(huán)節(jié),擁有解決問題的探索、構建和測試等服務機制。此服務建立用戶數(shù)據(jù)庫,跟蹤和整理大量文獻(館內外信息資源),對比、篩選與組織相關內容,鑒別、分析可能的結構和趨勢來構建宏知識,利用大數(shù)據(jù)技術進一步挖掘知識結構中的沖突、變異和可能性,分析知識內容的發(fā)展趨勢與路徑,支持對科技創(chuàng)新、未來演變方向與可能性的挖掘與預警,從而開拓和激發(fā)創(chuàng)新思路與路徑。通過對多樣化數(shù)據(jù)和信息的關聯(lián)與分析,來支持具體領域的具體問題及其解決方法的分析,再根據(jù)需求的動態(tài)變化不斷調適,與用戶共同探索問題的解決方案[6]。
3.4智慧化服務
大數(shù)據(jù)是數(shù)據(jù)世界的智慧基因,分析和應用大數(shù)據(jù)是獲得智慧的關鍵[7]。傳統(tǒng)分析數(shù)據(jù)基本上都是抽取樣本,事先確定收集什么樣的數(shù)據(jù),然后尋找“已知的未知(Known unknows)”,也就是證實某一結論正確。而大數(shù)據(jù)分析則是以全部數(shù)據(jù)為對象,發(fā)現(xiàn)未知的未知,也就是找到一些未曾想到的結果。大數(shù)據(jù)這種發(fā)現(xiàn)未知的未知功能為實現(xiàn)圖書館服務智慧化開辟了途徑。利用大數(shù)據(jù)技術能夠了解用戶信息行為、意愿、信息需求、知識應用能力及服務需求等,還能夠預測用戶科研創(chuàng)新將要發(fā)生什么,從而提供智慧服務。
3.5數(shù)據(jù)分析與數(shù)據(jù)挖掘是圖書館提供服務的基礎
在大數(shù)據(jù)時代,大數(shù)據(jù)資源已成為關系圖書館服務質量和館藏資源結構科學性的關鍵因素。人們將拋棄隨機采樣的調查方式,轉向分析大量數(shù)據(jù);人們不再瘋狂追求分析數(shù)據(jù)的精確度,轉向注重對事物發(fā)展趨勢的預測;人們不再重視事情的前因后果,轉向關注挖掘事物之間的關聯(lián)性。因此,圖書館數(shù)據(jù)資源的質量、管理和分析,將成為圖書館服務質量提升的基礎,成為準確分析用戶需求、制定科學的管理與服務策略、服務質量提升的關鍵。
圖書館通過對互聯(lián)網(wǎng)上的知識點 (詞匯或專有名詞)進行搜索,并對知識點進行關聯(lián)、描述,建立知識點的知識數(shù)據(jù)庫,再利用一定算法、鏈接技術和匹配技術,能夠實現(xiàn)基于知識的知識推送服務,即網(wǎng)絡在線閱讀中提供動態(tài)的專有名詞解釋或提示服務;通過分析圖書館與用戶之間、不同服務數(shù)據(jù)之間、用戶與服務數(shù)據(jù)之間的關系數(shù)據(jù),能預測用戶需求,提供針對性服務和個性化定制服務,還能合理調配館員,充分調動他們的工作積極性;通過對用戶借閱信息、下載使用數(shù)字資源行為、瀏覽網(wǎng)站行為、檢索信息行為等記錄信息進行分析,并與用戶行為模式相似的其他用戶歷史數(shù)據(jù)進行對照,能提供基于用戶隱性知識的推送服務;通過對圖書借閱率、流通量、訪問數(shù)字資源類型及時間、學習行為、利用資源模式等記錄進行分析,能針對性地采購用戶需要的信息資源;通過對讀者閱讀習慣、學習方式、獲取資源方式等數(shù)據(jù)進行分析,能科學合理地完善圖書館工作流程與服務模式。因此,大數(shù)據(jù)時代,圖書館需要對用戶數(shù)據(jù)進行分析、處理和預測,以便提供更好的服務。
在大數(shù)據(jù)時代,圖書館要真正將服務嵌入用戶的學習、科研、教學、科技創(chuàng)新、管理決策等活動過程中,提供以知識、信息、智力、工具的應用為特征的知識服務,則需要搜集、分析、挖掘各種類型、各種結構的數(shù)據(jù)資源和用戶的行為數(shù)據(jù)資源。只有這樣,圖書館的服務范圍和領域才會得到更大的擴展和延伸,并且數(shù)據(jù)分析服務、數(shù)據(jù)挖掘服務會成為圖書館服務體系創(chuàng)新的制高點[8]。
[1]李善青,趙輝,宋立榮.基于大數(shù)據(jù)挖掘的科技項目查重模型研究[J].圖書館論壇,2014(2):78-83.
[2]陳臣.大數(shù)據(jù)時代一種基于用戶行為分析的圖書館個性化智慧服務模式[J].圖書館理論與實踐,2015(2):96-99.
[3]吳敏慧.大數(shù)據(jù)與圖書館信息服務新構想[J].圖書館理論與實踐,2015(2):14-16.
[4]馮國權.互聯(lián)網(wǎng)思維下圖書館服務變革[J].圖書情報工作, 2015(2):25-30.
[5]楊海燕.大數(shù)據(jù)時代的圖書館服務淺析[J].圖書與情報, 2012(4):120-122.
[6]張曉林.研究圖書館2020:嵌入式協(xié)作化知識實驗室?[J].中國圖書館學報,2012(1):11-20.
[7]韓煒.大數(shù)據(jù)時代公共圖書館消除數(shù)據(jù)不平等的路徑選擇[J].圖書館論壇,2014(3):14-21.
[8]程蓮娟.美國推進大數(shù)據(jù)的應用實踐及其有益借鑒[J].情報資料工作,2013(5):110-112.
(編發(fā):章忠平)
A Study of the Reform of Library Service Based on Big Data
YANG Fang-ming,ZHANG Hua
(Library of Huai’an College of Information Technology,Huai’an 223003,China)
This paper discusses the characteristic of big data,elaborates the influence and function of big data on library services and collections,points out innovations of library service which is based on the analysis and mining of big data related to the library.The integration of personalized service,the innovation of knowledge service and the intelligent service are the direction of library development.
big data;library service;data mining;data analysis
G250.73
G250.73
A
2095-5197(2016)01-0048-03
* 本文系2014 年中國職業(yè)技術教育學會科研規(guī)劃項目:“高職院?;訉W習平臺的構建與實踐研究”(編號:201410Y02)的研究成果之一。
楊方銘(1981-),男,館員,碩士,研究方向:信息服務與信息咨詢;章華(1963-),女,館員,大專,研究方向:圖書館服務。
2015-11-10