葉 函 章 迪 劉思詩(shī) 周 盼
?
大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用分析
葉 函 章 迪 劉思詩(shī) 周 盼
武漢東湖學(xué)院,湖北 武漢 430000
近年來,隨著信息技術(shù)的不斷發(fā)展,圖書館的數(shù)據(jù)信息管理面臨著越來越多的挑戰(zhàn)。從現(xiàn)狀來看,大數(shù)據(jù)問題日益成為制約圖書館進(jìn)一步發(fā)揮其功能的重要問題。基于此,對(duì)大數(shù)據(jù)給圖書館帶來的挑戰(zhàn)進(jìn)行了分析,并對(duì)大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用進(jìn)行了探討。
大數(shù)據(jù);生態(tài)系統(tǒng);圖書館
隨著大數(shù)據(jù)在全球知識(shí)服務(wù)體系中的作用越來越凸顯,大數(shù)據(jù)問題成為人類社會(huì)經(jīng)濟(jì)發(fā)展的瓶頸。要進(jìn)一步推動(dòng)人類社會(huì)經(jīng)濟(jì)的發(fā)展,就需要推動(dòng)大數(shù)據(jù)的發(fā)展,解決大數(shù)據(jù)問題。在圖書館發(fā)揮其知識(shí)服務(wù)職能的過程中,隨著圖書館數(shù)字化進(jìn)程的加快,大數(shù)據(jù)問題給圖書館帶來的壓力越來越大。面對(duì)大數(shù)據(jù)問題,圖書館需要建立大數(shù)據(jù)生態(tài)系統(tǒng),借助大數(shù)據(jù)生態(tài)系統(tǒng),實(shí)現(xiàn)對(duì)大數(shù)據(jù)的有效管理,以此促進(jìn)圖書館職能的進(jìn)一步發(fā)揮。
1.1 數(shù)據(jù)量的增多給圖書館現(xiàn)有的計(jì)算能力帶來挑戰(zhàn)
隨著圖書館數(shù)據(jù)量的不斷增長(zhǎng),數(shù)據(jù)類型的不斷增多,對(duì)圖書館現(xiàn)有的技術(shù)能力、儲(chǔ)存能力帶來了挑戰(zhàn)。首先,在圖書館的儲(chǔ)存能力方面,圖書館的儲(chǔ)存設(shè)備總量是固定的,并且圖書館儲(chǔ)存設(shè)備以及儲(chǔ)存容量的增加速度,遠(yuǎn)落后于數(shù)據(jù)量的增加速度,這就會(huì)使得圖書館陷入儲(chǔ)存問題的困境。隨著數(shù)據(jù)儲(chǔ)存復(fù)雜度的不斷增加以及數(shù)據(jù)類型的不斷增加,現(xiàn)有計(jì)算機(jī)的計(jì)算能力越來越無(wú)法滿足如此多與復(fù)雜的數(shù)據(jù)計(jì)算需求。其次,隨著物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等網(wǎng)絡(luò)信息交流的便捷程度不斷增加,圖書館的數(shù)據(jù)交換、讀取變得越來越頻繁,而數(shù)據(jù)的交換需要占用圖書館一定的儲(chǔ)存空間,并且大量的數(shù)據(jù)交換還需要有強(qiáng)大的計(jì)算能力作為支撐,這進(jìn)一步提高了對(duì)圖書館計(jì)算能力的要求[1]。此外,隨著數(shù)據(jù)量的不斷提升,數(shù)據(jù)的可信度越來越難以判別,這就對(duì)圖書館的數(shù)據(jù)分析技術(shù)以及數(shù)據(jù)檢索技術(shù)提出了更高的要求。并且,隨著高校圖書館職工作用的弱化,圖書館對(duì)計(jì)算機(jī)系統(tǒng)的依賴程度進(jìn)一步加深,這使得圖書館計(jì)算能力面臨的壓力越來越大。
1.2 給圖書館基礎(chǔ)設(shè)施帶來挑戰(zhàn)
數(shù)據(jù)量的飛速增長(zhǎng),給圖書館的基礎(chǔ)設(shè)施帶來巨大的挑戰(zhàn)。在許多圖書館基礎(chǔ)設(shè)施的建設(shè)中,對(duì)軟硬件資源的建設(shè)從高端服務(wù)設(shè)施轉(zhuǎn)向了集群化服務(wù),并且隨著數(shù)據(jù)儲(chǔ)存結(jié)構(gòu)的轉(zhuǎn)變,要求圖書館的硬件儲(chǔ)存設(shè)備以及軟件系統(tǒng)也需要有相應(yīng)的轉(zhuǎn)變,這就給圖書館現(xiàn)有的硬件儲(chǔ)存設(shè)備與軟件系統(tǒng)帶來較大的壓力。圖書館需要根據(jù)實(shí)際的數(shù)據(jù)儲(chǔ)存需要,建設(shè)網(wǎng)絡(luò)基礎(chǔ)設(shè)施與數(shù)據(jù)儲(chǔ)存設(shè)施,通過分布式基礎(chǔ)設(shè)施的建設(shè),建立更加高效與靈活的組網(wǎng)方式與信息儲(chǔ)存方式。大數(shù)據(jù)問題給圖書館帶來的挑戰(zhàn)還包括人員方面的挑戰(zhàn),大數(shù)據(jù)引起的數(shù)據(jù)儲(chǔ)存方式的變革,以及數(shù)據(jù)處理系統(tǒng)上的變革,要求圖書館管理員具備信息系統(tǒng)以及數(shù)據(jù)管理方面的專業(yè)知識(shí),并且還要求圖書管理員具有更廣的知識(shí)面,以及更高的專業(yè)技能水平[2]。
2.1 大數(shù)據(jù)生態(tài)系統(tǒng)的應(yīng)用特點(diǎn)
圖書館的大數(shù)據(jù)生態(tài)系統(tǒng)具有高度的靈活性與可拓展性,可以儲(chǔ)存、讀取PB級(jí)的數(shù)據(jù),可以更快速地進(jìn)行數(shù)據(jù)的儲(chǔ)存與讀取。在大數(shù)據(jù)生態(tài)系統(tǒng)中,采用的是云計(jì)算技術(shù),可以快速地將大數(shù)據(jù)轉(zhuǎn)換為單一的數(shù)據(jù),并將這一術(shù)數(shù)據(jù)作為大數(shù)據(jù)生態(tài)系統(tǒng)檢索的節(jié)點(diǎn),同時(shí)依據(jù)這一數(shù)據(jù)節(jié)點(diǎn),可以進(jìn)行數(shù)據(jù)的檢索與分析。利用大數(shù)據(jù)生態(tài)系統(tǒng),可以解決傳統(tǒng)系統(tǒng)無(wú)法處理結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的問題,實(shí)現(xiàn)圖書館儲(chǔ)存結(jié)構(gòu)的轉(zhuǎn)變以及讀取方式的轉(zhuǎn)變,從而增加圖書館數(shù)據(jù)儲(chǔ)存類型以及處理類型,拓展圖書館的數(shù)據(jù)處理與數(shù)據(jù)服務(wù)能力[3]。應(yīng)用在圖書館中的大數(shù)據(jù)生態(tài)系統(tǒng),使得結(jié)構(gòu)數(shù)據(jù)與非結(jié)構(gòu)數(shù)據(jù)相結(jié)合,實(shí)現(xiàn)了新舊系統(tǒng)以及新舊數(shù)據(jù)的兼容,實(shí)現(xiàn)了結(jié)構(gòu)數(shù)據(jù)向非結(jié)構(gòu)數(shù)據(jù)的轉(zhuǎn)變。并且,大數(shù)據(jù)生態(tài)系統(tǒng)借助云計(jì)算,可以實(shí)現(xiàn)可視化數(shù)據(jù)查詢。在數(shù)據(jù)查詢中,不需要使用到本地終端,節(jié)省了圖書館的數(shù)據(jù)儲(chǔ)存空間。
2.2 大數(shù)據(jù)生態(tài)系統(tǒng)軟硬件結(jié)合的解決方案
2.2.1獲取階段
在圖書館應(yīng)用的大數(shù)據(jù)生態(tài)系統(tǒng)中,實(shí)現(xiàn)了圖書館軟硬件資源的結(jié)合,使得圖書館資源得到了更加高效的利用。在大數(shù)據(jù)生態(tài)系統(tǒng)獲取數(shù)據(jù)的階段,當(dāng)前常用的數(shù)據(jù)檢索方法為:從信息資源角度獲取數(shù)據(jù)。這一數(shù)據(jù)檢索方式與當(dāng)前大數(shù)據(jù)的檢索情況不符,在大數(shù)據(jù)生態(tài)系統(tǒng)中,是以用戶的需求進(jìn)行數(shù)據(jù)獲取操作,在數(shù)據(jù)獲取中,利用云計(jì)算進(jìn)行數(shù)據(jù)的檢索以及構(gòu)建操作[4]。大數(shù)據(jù)生態(tài)系統(tǒng)可以判斷用戶的數(shù)據(jù)需求,根據(jù)用戶的數(shù)據(jù)需求,自動(dòng)對(duì)數(shù)據(jù)進(jìn)行檢索。同時(shí),在用戶檢索的過程中,大數(shù)據(jù)生態(tài)系統(tǒng)會(huì)自動(dòng)記錄用戶的信息獲取途徑以及用戶的信息獲取偏好,同時(shí)自助式的展開數(shù)據(jù)的收集以及顯示操作,在數(shù)據(jù)獲取中,也會(huì)考慮到結(jié)構(gòu)數(shù)據(jù)與非結(jié)構(gòu)數(shù)據(jù)的檢索,并計(jì)算用戶獲取數(shù)據(jù)突發(fā)性與易變性的可能。
2.2.2儲(chǔ)存與組織階段
大數(shù)據(jù)生態(tài)系統(tǒng)采用了低成本集群儲(chǔ)存方式,儲(chǔ)存性能高,讀取速度快,并且可拓展,成本低,實(shí)現(xiàn)了關(guān)系型數(shù)據(jù)庫(kù)與云儲(chǔ)存方式的有機(jī)結(jié)合。在大數(shù)據(jù)生態(tài)系統(tǒng)采用的是MapReduce并行計(jì)算模型,實(shí)現(xiàn)對(duì)了非結(jié)構(gòu)新數(shù)據(jù)的處理,其最早適用于網(wǎng)絡(luò)數(shù)據(jù)處理。但是在大數(shù)據(jù)的處理過程中,MapReduce并行計(jì)算模型不需要對(duì)數(shù)據(jù)進(jìn)行抓取處理,在數(shù)據(jù)處理過程中,對(duì)非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行移動(dòng)計(jì)算。大數(shù)據(jù)生態(tài)系統(tǒng)借助強(qiáng)大的數(shù)據(jù)處理能力,實(shí)現(xiàn)數(shù)據(jù)的橫向處理,數(shù)據(jù)處理效率相比于豎向處理有了極大的提高。
隨著大數(shù)據(jù)時(shí)代的到來,圖書館現(xiàn)有軟硬件設(shè)施面臨著巨大的壓力,數(shù)據(jù)量的增多也給圖書館現(xiàn)有的計(jì)算能力帶來挑戰(zhàn)。而通過大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用,可以在很大程度上提升圖書館的數(shù)據(jù)服務(wù)效率,并且對(duì)傳統(tǒng)的知識(shí)服務(wù)模式也是一種創(chuàng)新。信息技術(shù)帶給我們的機(jī)會(huì)是轉(zhuǎn)瞬即逝的,我們需要站在更高的高度上,進(jìn)行大數(shù)據(jù)系統(tǒng)的研發(fā),從而推動(dòng)人類社會(huì)經(jīng)濟(jì)的發(fā)展。
[1]劉健,張海濤,張連峰.圖書館知識(shí)生態(tài)系統(tǒng)的虛擬化封裝模型構(gòu)建及技術(shù)方法研究[J].情報(bào)科學(xué),2015(2):121-125.
[2]劉小鋒.大數(shù)據(jù)環(huán)境下圖書館跨邊界知識(shí)自組織促進(jìn)知識(shí)轉(zhuǎn)移方法[J].圖書館學(xué)研究,2014(13):45-52.
[3]李艷,呂鵬,李瓏.基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個(gè)性化服務(wù)研究[J/OL].圖書情報(bào)知識(shí),2016(2):60-68.
[4]鐘靜.讀者購(gòu)借在館藏建設(shè)中的策略探討與制定——以“重慶圖書館大數(shù)據(jù)分析試驗(yàn)系統(tǒng)”子項(xiàng)目為例[J/OL].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2016(8):18-21.
Big data analysis of application of ecological system in the
Library
College of Wuhan East Lake,Hubei Wuhan 430000
In recent years,with the continuous development of information technology,the library data information management is facing more and more challenges.From the point of view of the current situation, the problem of big data has become an important problem that restricts the further development of the library.This paper will analyze the challenges brought by the big data to the library,and discuss the application of the big data ecosystem in the library.
big data;ecosystem;library
G250.7
A
1009-6434(2017)01-0107-02