摘 要:本文對大數(shù)據(jù)時代高校圖書館的用戶行為進(jìn)行分析,并對圖書館資源建設(shè)的優(yōu)化進(jìn)行了初步的探索。
關(guān)鍵詞:大數(shù)據(jù)時代;用戶行為分析;資源建設(shè)優(yōu)化
1 大數(shù)據(jù)時代的特征及處理分析方法
大數(shù)據(jù)(Big Date)又稱為巨量資料,指需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。“大數(shù)據(jù)”概念最早由維克托·邁爾·金恩伯格和肯尼斯·庫克耶在編寫《大數(shù)據(jù)時代》中提出,指不用隨機(jī)分析法(抽樣調(diào)查)的捷徑,而是采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)有5V特點(diǎn),即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實(shí)性)。大數(shù)據(jù)技術(shù)就是基于分析處理(移動)互聯(lián)網(wǎng)、信息領(lǐng)域日常運(yùn)作中累積下來的海量數(shù)字信息資料,來發(fā)現(xiàn)和形成新的服務(wù)形式的技術(shù)。
大數(shù)據(jù)所處理的數(shù)據(jù)不僅僅是規(guī)模大,而且處理的數(shù)據(jù)不止是關(guān)系型數(shù)據(jù)。大數(shù)據(jù)處理的數(shù)據(jù)往往是半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。大數(shù)據(jù)所需處理的信息是非常廣泛的,包括個人大數(shù)據(jù)(個人使用SNS網(wǎng)站或軟件產(chǎn)生的信息等)、科學(xué)大數(shù)據(jù)(科研數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)、研究報(bào)告等)、業(yè)務(wù)流程大數(shù)據(jù)(各個機(jī)構(gòu)在正常運(yùn)作中業(yè)務(wù)流程產(chǎn)生的數(shù)據(jù))、企業(yè)大數(shù)據(jù)(企業(yè)文化、人員組成、財(cái)務(wù)狀況等)和社會大數(shù)據(jù)(社會宏觀環(huán)境的數(shù)據(jù))等內(nèi)容。除此之外,最重要的是對大數(shù)據(jù)進(jìn)行分析處理,只有通過分析才能獲取很多智能的,深入的,有價值的信息。那么越來越多的應(yīng)用涉及到大數(shù)據(jù),而這些大數(shù)據(jù)的屬性,包括數(shù)量,速度,多樣性等等都是呈現(xiàn)了大數(shù)據(jù)不斷增長的復(fù)雜性,所以大數(shù)據(jù)的分析方法在大數(shù)據(jù)領(lǐng)域就顯得尤為重要。大數(shù)據(jù)分析處理的方法有:
采集:是指利用多個數(shù)據(jù)庫來接收發(fā)自客戶端(Web、App或者傳感器形式等)的數(shù)據(jù),并且用戶可以通過這些數(shù)據(jù)庫來進(jìn)行簡單的查詢和處理工作。
導(dǎo)入/預(yù)處理:雖然采集端本身會有很多數(shù)據(jù)庫,但是如果要對這些海量數(shù)據(jù)進(jìn)行有效的分析,還是應(yīng)該將這些來自前端的數(shù)據(jù)導(dǎo)入到一個集中的大型分布式數(shù)據(jù)庫,或者分布式存儲集群,并且可以在導(dǎo)入基礎(chǔ)上做一些簡單的清洗和預(yù)處理工作。
統(tǒng)計(jì)/分析:主要利用分布式數(shù)據(jù)庫,或者分布式計(jì)算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總等,以滿足大多數(shù)常見的分析需求。
挖掘:與前面統(tǒng)計(jì)和分析過程不同的是,數(shù)據(jù)挖掘一般沒有什么預(yù)先設(shè)定好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計(jì)算,從而起到預(yù)測(Predict)的效果,從而實(shí)現(xiàn)一些高級別數(shù)據(jù)分析的需求。
大數(shù)據(jù)時代,“各類型數(shù)據(jù)急劇增長,正朝著海量數(shù)據(jù)方向發(fā)展,高校圖書館面臨著數(shù)字資源長期保存、資源整合、信息安全以及服務(wù)創(chuàng)新等多方面的挑戰(zhàn)。隨著讀者服務(wù)擴(kuò)展至計(jì)算機(jī)、數(shù)字電視、手機(jī)、手持閱讀器、平板電腦、電子觸摸屏等多種服務(wù)終端,服務(wù)量的不斷增加,各業(yè)務(wù)系統(tǒng)每天都會產(chǎn)生大量的日志數(shù)據(jù),其中包含了大量的用戶行為信息,進(jìn)行數(shù)字資源整合必須結(jié)合大數(shù)據(jù)特點(diǎn)和資源現(xiàn)狀,以用戶需求為導(dǎo)向,博采眾長,突出特色,分階段、有計(jì)劃的實(shí)施。圖書館工作要順應(yīng)大數(shù)據(jù)時代的發(fā)展,努力創(chuàng)新信息服務(wù)模式,開放網(wǎng)絡(luò)服務(wù),不僅要關(guān)注師生的需求信息,并準(zhǔn)確及時地提供相應(yīng)的服務(wù),還要分析挖掘相關(guān)的大數(shù)據(jù),找出他們的潛在需求信息,進(jìn)行個性化信息服務(wù)。大數(shù)據(jù)時代下的高校圖書館工作應(yīng)在對傳統(tǒng)紙質(zhì)文獻(xiàn)的搜集、整理與利用的基礎(chǔ)上,加強(qiáng)與開發(fā)大數(shù)據(jù)技術(shù)在圖書館工作中的應(yīng)用,整合各種電子資源、文獻(xiàn)數(shù)據(jù)庫等館藏資源,跟蹤并記錄用戶的基本信息與信息行為,挖掘數(shù)據(jù)的應(yīng)用價值,為高校師生提供高質(zhì)量的信息服務(wù)??傊咝D書館要抓住歷史機(jī)遇,根據(jù)大數(shù)據(jù)的特點(diǎn),充分運(yùn)用大數(shù)據(jù)處理手段和技術(shù),改變與提升高校圖書館的網(wǎng)絡(luò)服務(wù)模式,以人為本,優(yōu)化資源建設(shè),切實(shí)提高信息服務(wù)質(zhì)量,為高校的事業(yè)發(fā)展作出應(yīng)有的貢獻(xiàn)。
2 大數(shù)據(jù)環(huán)境下高校圖書館用戶需求的新特點(diǎn)
一般而言,大數(shù)據(jù)自身的特點(diǎn)及其作用構(gòu)成了大數(shù)據(jù)環(huán)境,而圖書館用戶則會面臨著受到大數(shù)據(jù)環(huán)境對文獻(xiàn)資源獲取的影響,圖書館的資源組織與用戶服務(wù)需要必然要考慮大數(shù)據(jù)環(huán)境下對用戶行為的作用影響,以適應(yīng)用戶新的需求。
1.全民社交性
大數(shù)據(jù)時代是一個知識共享、智慧共享、服務(wù)共享的時代,微博、微信、QQ等社交平臺初步構(gòu)成了全民社交圈,每時每刻產(chǎn)生大量的數(shù)據(jù)信息。為順應(yīng)這一發(fā)展趨勢,高校圖書館借助這一平臺,開展社交服務(wù),將師生的討論、需求、閱讀興趣導(dǎo)向與館藏資源相結(jié)合,并在網(wǎng)絡(luò)環(huán)境中進(jìn)行創(chuàng)新服務(wù),時時互動,以符合全時段服務(wù)的時代特征要求。
2.信息獲取方式的多樣化
大數(shù)據(jù)時代下信息資源的獲取更加快捷與多樣化,傳統(tǒng)的閱讀方式發(fā)生了翻天覆地的變化,讀者可以借助計(jì)算機(jī)設(shè)備與現(xiàn)代化通信設(shè)備輕而易舉地獲取信息資源,對海量數(shù)據(jù)進(jìn)行搜索,獲取有用的數(shù)據(jù)信息。新媒體下的數(shù)字化服務(wù),帶來了閱讀的便捷與信息獲得的高效。
3.信息服務(wù)的交互性
大數(shù)據(jù)時代下,師生能夠隨時隨地的獲得所需的館藏信息,而圖書館服務(wù)系統(tǒng)則可以通過用戶的注冊、用戶的閱讀行為、用戶的學(xué)術(shù)研究方向等來獲取用戶的個性化信息。那么,雙方的交互使得師生可以根據(jù)自己的學(xué)習(xí)習(xí)慣、科研要求定制特色資源信息服務(wù),而圖書館則可借助現(xiàn)代技術(shù)為師生用戶量身打造個性化服務(wù),主動推送準(zhǔn)確、及時的文獻(xiàn)信息。
3 圖書館資源建設(shè)優(yōu)化
1、轉(zhuǎn)變管理思維
隨著數(shù)字圖書館發(fā)展進(jìn)程的快速推進(jìn),高校圖書館資源建設(shè)已經(jīng)經(jīng)歷了由量變到質(zhì)變的發(fā)展轉(zhuǎn)型階段,目前國內(nèi)各高校圖書館的數(shù)字資源業(yè)務(wù)數(shù)據(jù)急劇增加,并已經(jīng)超越了紙質(zhì)業(yè)務(wù)數(shù)據(jù)。數(shù)字資源在建設(shè)、傳播、存取利用方面,具有傳統(tǒng)文獻(xiàn)無法比擬的優(yōu)勢,已成為圖書館資源建設(shè)的核心內(nèi)容。因此,高校圖書館應(yīng)該著眼于數(shù)字資源的多樣化建設(shè),除數(shù)據(jù)庫、電子圖書、電子期刊、電子學(xué)位論文等傳統(tǒng)形式外,還需要多加關(guān)注電子音樂、電子教參、數(shù)字圖片、電子藝術(shù)品等數(shù)字資源的建設(shè)。此外,智能終端等的采購應(yīng)用也是實(shí)現(xiàn)數(shù)字資源多樣化建設(shè)的體現(xiàn),它們基于網(wǎng)絡(luò)、流量、人機(jī)互動的信息傳播方式,讓閱讀行為更加多元,信息渠道更加豐富。endprint
大數(shù)據(jù)環(huán)境下,讀者習(xí)慣通過網(wǎng)絡(luò)獲取信息,希望更為方便地享受服務(wù)。所以在大數(shù)據(jù)環(huán)境下,高校圖書館需應(yīng)更為關(guān)注讀者的個性化需求,而不應(yīng)是圖書館的館藏資源等著讀者來使用。圖書館應(yīng)實(shí)時動態(tài)地關(guān)注讀者的需求,積極主動地解決讀者潛在需求??傮w而言,大數(shù)據(jù)環(huán)境下的圖書館管理思維應(yīng)向敏銳抓取讀者的潛在閱讀需求并去滿足它的方向轉(zhuǎn)變。
2、適度調(diào)整各種資源的比重
一般圖書館的館藏資源包括印刷型文獻(xiàn)(以紙張為載體,如紙質(zhì)書本)、縮微型文獻(xiàn)(以感光材料為載體,如縮微膠片)、聲像型文獻(xiàn)(以磁性材料為載體,如唱片)、計(jì)算機(jī)閱讀型文獻(xiàn)(電子期刊、電子圖書等)和網(wǎng)絡(luò)型文獻(xiàn)(以聯(lián)機(jī)方式為讀者服務(wù))f=1。國內(nèi)圖書館,特別是中小型圖書館往往注重印刷型文獻(xiàn)的館藏,而其他類型文獻(xiàn)的館藏很少。在大數(shù)據(jù)環(huán)境下,圖書館要轉(zhuǎn)變這種資源建設(shè)思維,要更為重視電子資源建設(shè)。隨著紙質(zhì)圖書價格的上漲,從經(jīng)濟(jì)角度考慮圖書館也應(yīng)調(diào)整資源建設(shè)策略。所以高校圖書館應(yīng)重視電子資源的建設(shè),但電子資源采購經(jīng)費(fèi)比例則根據(jù)自身的實(shí)際情況講行把握。
3、注重非結(jié)構(gòu)化數(shù)據(jù)的建設(shè)
現(xiàn)在中國圖書館提供的是基于結(jié)構(gòu)化數(shù)據(jù)的服務(wù),而半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的增長速度遠(yuǎn)遠(yuǎn)大于結(jié)構(gòu)化數(shù)據(jù)。據(jù)統(tǒng)計(jì),2012年非結(jié)構(gòu)化數(shù)據(jù)占有比例在互聯(lián)網(wǎng)達(dá)到7%,同時結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的年增長率分別為32%和63%。這意味著互聯(lián)網(wǎng)世界里非結(jié)構(gòu)化數(shù)據(jù)的比例將不斷增大。在圖書館領(lǐng)域,每年結(jié)構(gòu)化數(shù)據(jù)的增長是較為有限的,而與讀者有關(guān)的非結(jié)構(gòu)化數(shù)據(jù)卻每天都在快速增長。所以高校圖書館應(yīng)優(yōu)化非結(jié)構(gòu)化數(shù)據(jù)的收集與服務(wù)。高校圖書館應(yīng)采用大數(shù)據(jù)技術(shù),動態(tài)分析通過微信、微博、社交網(wǎng)絡(luò)等產(chǎn)生的與圖書館相關(guān)的讀者需求。這些需求是實(shí)時動態(tài)的,從而為讀者提供匹配的讀者需求。大數(shù)據(jù)環(huán)境下讀者閱讀特征是“3I" ;“交互式營銷(Interac-tivemarketing) " ,“即刻化傳播(Immediatelypropaga-tion } "與“買借同一性(Identicborrowandbuy ) "。所以大數(shù)據(jù)環(huán)境下的圖書館的資源建設(shè)過程中應(yīng)注意與讀者的交互性和即刻性。
4、數(shù)據(jù)資源治理的轉(zhuǎn)型
高校圖書館的多樣化數(shù)字資源建設(shè),帶來了海量的信息數(shù)據(jù),各館普遍存在著重獲取輕管理、重?cái)?shù)量輕質(zhì)量、重使用輕安全的現(xiàn)象,因此高校圖書館界應(yīng)樹立數(shù)據(jù)治理的理念,對數(shù)字資源的數(shù)據(jù)進(jìn)行合理的分析、優(yōu)化、重新整合,確保在使用過程信息數(shù)據(jù)的高質(zhì)量性、安全性和可靠性。需要不斷擴(kuò)大存儲容量,服務(wù)器采用新存儲技術(shù)和能力更強(qiáng)的大數(shù)據(jù)技術(shù),轉(zhuǎn)向非結(jié)構(gòu)化的存儲架構(gòu),構(gòu)建存儲系統(tǒng),在軟件、硬件上實(shí)現(xiàn)數(shù)據(jù)的系統(tǒng)化、信息化、標(biāo)準(zhǔn)化建設(shè)。以滿足對海量數(shù)據(jù)的分析處理、挖掘等運(yùn)轉(zhuǎn)的要求,最大程度上實(shí)現(xiàn)信息資源的應(yīng)有價值。
5、信息資源共享的轉(zhuǎn)型
在大數(shù)據(jù)的環(huán)境下,高校圖書館對數(shù)字資源的建設(shè)絕對不能只依靠自己的力量,要結(jié)合自身用戶需求以及自身學(xué)科優(yōu)勢進(jìn)行建設(shè),并積極開展區(qū)域性的合作,實(shí)現(xiàn)館藏資源的共建共享,密切跟蹤開放獲取資源,聯(lián)合數(shù)據(jù)商研發(fā)可靠高效的信息資源存儲挖掘分析系統(tǒng),來向讀者提供更經(jīng)濟(jì)、更高效、更全面的館藏信息資源。
大數(shù)據(jù)環(huán)境下,面對信息“快速、簡單、準(zhǔn)確”的要求,高校圖書館要全面提升服務(wù)能力。高校圖書館未來需加大資源的揭示力度,提供一站式服務(wù),通過異構(gòu)數(shù)字資源的融合、聚類和重組使資源從數(shù)據(jù)層的揭示與展現(xiàn)轉(zhuǎn)向信息層、知識層的深度服務(wù);利用時間軸、地域軸等知識圖譜可視化展示方式將資源呈現(xiàn)給用戶;依托融合的物聯(lián)網(wǎng)、移動通信網(wǎng)以及互聯(lián)網(wǎng)絡(luò)進(jìn)行傳播,最終實(shí)現(xiàn)為用戶提供電視、電腦、手機(jī)等多種終端的接收;加強(qiáng)用戶數(shù)據(jù)分析,實(shí)現(xiàn)個性服務(wù);促進(jìn)業(yè)界合作建設(shè),實(shí)現(xiàn)共知共享。
參考文獻(xiàn)
[1]王詠梅.基于高校用戶網(wǎng)絡(luò)信息行為的高校圖書館信息資源建設(shè)[J].圖書館研究,2014(3)
[2]何建新.大數(shù)據(jù)時代高校圖書館的數(shù)字資源共享策略探討[J]現(xiàn)代情報(bào),2014,34(9)
[3]熊健敏.大數(shù)據(jù)時代高校圖書館資源創(chuàng)新服務(wù)研究[J].浙江高校圖書情報(bào)工作,2014,(4)
[4]宋佳.大數(shù)據(jù)環(huán)境下圖書館資源建設(shè)與服務(wù)研究[J]圖書館學(xué)刊,2017,(5)
[5]史少凡等.基于大數(shù)據(jù)技術(shù)的高校數(shù)字圖書館資源建設(shè)研究[J].出版廣角,2016,(4)
作者簡介
梁逶,本科,副研究館員,貴州職業(yè)技術(shù)學(xué)院圖書館。endprint