張強(qiáng)
摘 ? 要:當(dāng)今是數(shù)據(jù)信息量爆發(fā)的時(shí)代,高校圖書(shū)館數(shù)字資源建設(shè)迅猛發(fā)展,數(shù)據(jù)信息龐大,種類(lèi)繁多,在大數(shù)據(jù)技術(shù)的應(yīng)用和推廣下使得對(duì)圖書(shū)館數(shù)字資源如何建設(shè),如何對(duì)數(shù)據(jù)進(jìn)行合理梳理、分析與優(yōu)化等系列問(wèn)題正面臨著巨大的影響與挑戰(zhàn),本文利用大數(shù)據(jù)分析來(lái)發(fā)現(xiàn)圖書(shū)館運(yùn)作及提供服務(wù)過(guò)程中存在的問(wèn)題,從而為用戶(hù)提供精準(zhǔn)的、個(gè)性化的服務(wù)。
關(guān)鍵詞:圖書(shū)館數(shù)字資源 ?大數(shù)據(jù) ?數(shù)據(jù)分析
中圖分類(lèi)號(hào):G25 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2020)02(c)-0239-02
Abstract: Nowadaysis the era of data information explosion, the digital resources construction ofuniversity library develops rapidly, the data information is huge, the variety is various. With the application and promotion of big data technology, aseries of problems such as how to construct the digital resources of the library and how to sort, analyze and optimize the data reasonably are facing enormous influence and challenge. This paper uses big data analysis to find out the problems existing in the process of library operation and service provision, so as to provide users with accurate and personalized services.
Key Words: Library digital resources; Big data; Data analysis
隨著數(shù)字圖書(shū)館發(fā)展進(jìn)程的快速推進(jìn),目前圖書(shū)館都加大了對(duì)數(shù)字資源業(yè)務(wù)的投入比例,使其數(shù)據(jù)量急劇增加,并已經(jīng)超越了傳統(tǒng)紙介質(zhì)圖書(shū)數(shù)據(jù)量。數(shù)字資源在資源建設(shè)、傳播、存取利用等方面,相對(duì)于傳統(tǒng)文獻(xiàn)具有較大優(yōu)勢(shì),已成為圖書(shū)館資源建設(shè)過(guò)程中不可或缺的重要部分。大數(shù)據(jù)環(huán)境下,圖書(shū)館的傳統(tǒng)服務(wù)形式逐步向數(shù)據(jù)分析、數(shù)據(jù)挖掘方向延伸,對(duì)大規(guī)模數(shù)據(jù)的處理和分析將成為圖書(shū)館的主要服務(wù)內(nèi)容。
1 ?圖書(shū)館數(shù)字資源建設(shè)的主要途徑
數(shù)字資源的使用打破了傳統(tǒng)文獻(xiàn)在時(shí)間、空間上的限制,只要保障網(wǎng)絡(luò)暢通,全體師生就可以全天候使用學(xué)院館建數(shù)字資源,因此獲得廣大讀者的普遍認(rèn)可。高校圖書(shū)館數(shù)字資源采用多樣化建設(shè),主要來(lái)源于兩個(gè)方面:(1)商業(yè)化數(shù)字資源,圖書(shū)館結(jié)合本校教學(xué)和科研方面的需求,選擇性購(gòu)置的學(xué)術(shù)價(jià)值較高的國(guó)內(nèi)外電子文獻(xiàn)數(shù)據(jù)庫(kù),以及大量電子出版物包括文字、音頻、視頻、圖片等多媒體資源。(2)自建數(shù)字資源數(shù)據(jù)庫(kù)。主要包括書(shū)目數(shù)據(jù)庫(kù)、學(xué)位論文數(shù)據(jù)庫(kù)以及符合自身特點(diǎn)的收藏性、地域性特色數(shù)據(jù)庫(kù)等。這些豐富的資源建設(shè),讓讀者閱讀行為更加多元,信息渠道更加豐富。
2 ?圖書(shū)館建設(shè)數(shù)字資源數(shù)據(jù)分析的現(xiàn)實(shí)需求
圖書(shū)館的建設(shè)與發(fā)展經(jīng)常處于資源采購(gòu)經(jīng)費(fèi)的有限和用戶(hù)需求不斷增大之間的矛盾中。數(shù)字資源的高投入是否提高了圖書(shū)館服務(wù)效能,數(shù)字資源建設(shè)的初衷與目的性能否得到充分體現(xiàn), 自建的數(shù)字資源能否充分體現(xiàn)了學(xué)科建設(shè)的特色,這些都需要利用大數(shù)據(jù)建模與數(shù)據(jù)發(fā)掘分析,其作用如下。
2.1 呈現(xiàn)決策依據(jù),引導(dǎo)數(shù)字資源建設(shè)
在大數(shù)據(jù)的時(shí)代,圖書(shū)館面對(duì)種類(lèi)多樣的數(shù)字資源,采購(gòu)資金的限制不可能購(gòu)置全部相關(guān)資源,因此要慎重進(jìn)行篩選。某種數(shù)字資源是采購(gòu)還是自建,其利用率如何,能否滿(mǎn)足讀者的需求,通過(guò)對(duì)數(shù)字資源的學(xué)科情況、核心期刊的收錄情況的調(diào)查等確定該資源是否具有權(quán)威性。數(shù)據(jù)分析的結(jié)果能為圖書(shū)館在制定采購(gòu)計(jì)劃與發(fā)展規(guī)劃時(shí),提供了可靠的科學(xué)依據(jù)。
2.2 分析出用戶(hù)的實(shí)際訴求,推進(jìn)數(shù)字資源的館藏建設(shè)
通過(guò)對(duì)數(shù)字資源建設(shè)的數(shù)據(jù)分析,可以準(zhǔn)確的反映出用戶(hù)對(duì)數(shù)字資源類(lèi)型和學(xué)科等方面的需求,圖書(shū)館可以據(jù)此調(diào)整數(shù)字資源的學(xué)科分布,調(diào)整全文數(shù)據(jù)庫(kù)、文摘性數(shù)據(jù)庫(kù)、電子圖書(shū)和電子期刊的購(gòu)置比例,優(yōu)化數(shù)字資源的結(jié)構(gòu),更大程度的滿(mǎn)足用戶(hù)的不同需求。
2.3 改進(jìn)讀者服務(wù)工作,提升圖書(shū)館的服務(wù)質(zhì)量
數(shù)字資源建設(shè)數(shù)據(jù)分析的另一方面在于考量讀者服務(wù)工作的效能與效果,評(píng)估的主要目的也是為了不斷提升服務(wù)水平,使數(shù)字資源的價(jià)值在服務(wù)中得到體現(xiàn),受到讀者的認(rèn)同。
3 ?圖書(shū)館數(shù)字資源數(shù)據(jù)分析的技術(shù)實(shí)現(xiàn)
在對(duì)數(shù)據(jù)分析過(guò)程中我們需要從不同的層面與角度對(duì)大量用戶(hù)數(shù)據(jù)進(jìn)行檢索、分析與處理,對(duì)數(shù)據(jù)進(jìn)行不同層次維度的建模,導(dǎo)致數(shù)據(jù)量猛增,同時(shí)也需要大量的數(shù)據(jù)運(yùn)算工作。云計(jì)算技術(shù)技術(shù)的應(yīng)用解決了大數(shù)據(jù)存儲(chǔ)和運(yùn)行的最大問(wèn)題,數(shù)據(jù)中心采用分布式的云計(jì)算服務(wù)方式,配置數(shù)臺(tái)高性能的服務(wù)器,便于數(shù)據(jù)挖掘和數(shù)據(jù)模型的建立及修改,大大提高數(shù)據(jù)分析效率。
該平臺(tái)主要由數(shù)據(jù)中心虛擬化平臺(tái)、圖書(shū)館數(shù)據(jù)來(lái)源、大數(shù)據(jù)處理與分析平臺(tái)、大數(shù)據(jù)決策應(yīng)用層四個(gè)部分組成。虛擬化平臺(tái)為圖書(shū)館提供高效的數(shù)據(jù)中心IT基礎(chǔ)設(shè)施服務(wù),主要由虛擬計(jì)算、虛擬存儲(chǔ)、虛擬網(wǎng)絡(luò)通信、虛擬網(wǎng)絡(luò)安全防護(hù)四部分組成。通過(guò)上層的虛擬化資源管理與調(diào)度模塊,可根據(jù)圖書(shū)館大數(shù)據(jù)計(jì)算量、存儲(chǔ)量、數(shù)據(jù)傳輸?shù)陌踩枨?,?duì)下層虛擬化系統(tǒng)計(jì)算資源進(jìn)行科學(xué)分配和調(diào)度管理,降低大數(shù)據(jù)挖掘與分析的負(fù)荷,確保虛擬化基礎(chǔ)設(shè)施運(yùn)行安全、高效、平穩(wěn)和性能動(dòng)態(tài)可優(yōu)化。大數(shù)據(jù)處理與分析平臺(tái)首先對(duì)原始大數(shù)據(jù)進(jìn)行過(guò)濾、整合和價(jià)值提取等操作,加強(qiáng)大數(shù)據(jù)的價(jià)值密集度和數(shù)據(jù)的有效和可用性。然后數(shù)據(jù)處理分析層可通過(guò)對(duì)下層傳輸?shù)臄?shù)據(jù)進(jìn)行數(shù)據(jù)倉(cāng)儲(chǔ)、深度挖掘、充分分析,并從中發(fā)現(xiàn)讀者對(duì)知識(shí)的實(shí)現(xiàn)需求、讀者閱讀行為跟蹤、資源分類(lèi)與讀者間關(guān)系的精確發(fā)現(xiàn)。決策應(yīng)用層是數(shù)據(jù)分析平臺(tái)的最高層,可對(duì)讀者實(shí)際需求、讀者今后閱讀模式發(fā)展趨勢(shì)進(jìn)行智慧分析和預(yù)測(cè),完成圖書(shū)館發(fā)展規(guī)劃、圖書(shū)館可視化數(shù)據(jù)服務(wù),以及其他與讀者服務(wù)相關(guān)的大數(shù)據(jù)決策,為圖書(shū)館可持續(xù)發(fā)展提供可靠的大數(shù)據(jù)決策支持。
4 ?圖書(shū)館數(shù)字資源數(shù)據(jù)分析決策
通過(guò)大數(shù)據(jù)技術(shù),分析讀者入館數(shù)據(jù)、借閱數(shù)據(jù),電子資源利用及查詢(xún)數(shù)據(jù)、檢索歷史等讀者信息行為數(shù)據(jù),從海量復(fù)雜而又無(wú)序的數(shù)據(jù)中分析出讀者的閱讀興趣與關(guān)注點(diǎn),發(fā)現(xiàn)被傳統(tǒng)服務(wù)所忽視的讀者潛在需求,在適當(dāng)?shù)臅r(shí)間通過(guò)多種恰當(dāng)?shù)耐緩骄珳?zhǔn)地向讀者推送個(gè)性化信息,以滿(mǎn)足不同讀者的個(gè)性化需求,進(jìn)而引起讀者的關(guān)注。根據(jù)數(shù)據(jù)分析、優(yōu)化后的結(jié)果,針對(duì)數(shù)字資源建設(shè)過(guò)程中的問(wèn)題,提出提高數(shù)字資源建設(shè)成效的對(duì)策。
5 ?結(jié)語(yǔ)
圖書(shū)館的建設(shè)與發(fā)展不僅僅局限于館藏書(shū)目與信息資源的建設(shè)規(guī)模,還應(yīng)覆蓋對(duì)大數(shù)據(jù)信息的挖掘、處理和分析。在大數(shù)據(jù)快速發(fā)展的今天,利用大數(shù)據(jù)理論和技術(shù)對(duì)圖書(shū)館資源庫(kù)的建設(shè)進(jìn)行擴(kuò)展,不僅可以幫助圖書(shū)館建設(shè)更為多元化的資源體系,還可以為讀者提供更為符合其需求的個(gè)性化服務(wù)。
參考文獻(xiàn)
[1] 包冬梅,范穎捷,李鳴.高校圖書(shū)館數(shù)據(jù)治理及其框架[J].圖書(shū)情報(bào)工作,2015(9):134-141.
[2] 陳臣.基于大數(shù)據(jù)的圖書(shū)館個(gè)性化服務(wù)用戶(hù)行為分析研究[J].圖書(shū)館工作與研究,2015,1(2):28-31.
[3] 何勝,馮新翎,武群輝,等.基于用戶(hù)行為建模和大數(shù)據(jù)挖掘的圖書(shū)館個(gè)性化服務(wù)研究[J].圖書(shū)情報(bào)工作,2017(1):40-46.
[4] 秦帥.基于大數(shù)據(jù)的圖書(shū)館個(gè)性化智慧服務(wù)體系構(gòu)建探討[J].佳木斯職業(yè)學(xué)院學(xué)報(bào),2017(6):472.
[5] 徐瀟潔,邵波.基于數(shù)據(jù)驅(qū)動(dòng)的智慧圖書(shū)館服務(wù)框架研究 [J].圖書(shū)館學(xué)研究,2018(22):37-43.
[6] 杜亮,劉濤.智慧圖書(shū)館系統(tǒng)架構(gòu)設(shè)計(jì)與應(yīng)用系統(tǒng)建設(shè)研究[J].蘭臺(tái)世界,2018(11):136-139.