摘 要:現(xiàn)下圖書館表現(xiàn)出大數(shù)據(jù)的特性。大數(shù)據(jù)于圖書管相關(guān)服務(wù)方面發(fā)揮著協(xié)助功能,但同時也暴露出一定的不足。圖書館需要聚焦知識服務(wù)的發(fā)展形勢,通過全新技術(shù)的應(yīng)用完成大數(shù)據(jù)解讀,避免以往知識服務(wù)的不足,相對可觀地獲得深層次的大數(shù)據(jù)內(nèi)容,使得圖書館服務(wù)實現(xiàn)進一步開拓。
關(guān)鍵詞:大數(shù)據(jù);圖書館;知識服務(wù)
1 引言
最近幾年由于互聯(lián)網(wǎng)蓬勃成長而出現(xiàn)了各式的數(shù)據(jù)形態(tài),既存在以往類型的結(jié)構(gòu)化數(shù)據(jù),還包括眾多半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。種種跡象顯示出了大數(shù)據(jù)的來臨,其代表的是海量數(shù)據(jù)涌入人們的生活,而從內(nèi)容方面來看更是異常豐富,屬于海量數(shù)據(jù)的拓展。處于這一背景之下,圖書館資源表現(xiàn)出了大數(shù)據(jù)的特性,基于數(shù)據(jù)的相關(guān)知識服務(wù)既獲得了機會,同時也迎來了挑戰(zhàn)。圖書館需要盡可能明確大數(shù)據(jù)的長處以及特征,解讀目前知識服務(wù)暴露出的問題,研究制定全新的服務(wù)措施,幫助讀者獲得更貼合需求的服務(wù)。
2 大數(shù)據(jù)為圖書館知識服務(wù)再拓展提供可能
知識服務(wù)的概念為:依照用戶的要求,有目的的由多類或是顯性或是隱含的資源內(nèi)獲取整合知識,同時基于此處理用戶提出的深層次問題的整個環(huán)節(jié)。 [1] 根據(jù)統(tǒng)計學(xué)來看,追求精準(zhǔn)的成果就要獲取更多的數(shù)據(jù),利用優(yōu)化運算的方式可以探索到全新的內(nèi)容。圖書館經(jīng)過多年的沉積,現(xiàn)已展示出大數(shù)據(jù)特征。大數(shù)據(jù)讓圖書館涉及內(nèi)容更加多彩,同時在運算方面速度更快,而投入量相對降低,這些均導(dǎo)致數(shù)據(jù)量的大幅增加。
除此以外,大數(shù)據(jù)使得數(shù)據(jù)的處理相對合理精準(zhǔn)。移動服務(wù)大面積推廣使得圖書館數(shù)據(jù)豐富,特別是非結(jié)構(gòu)化數(shù)據(jù)。盡管伴隨數(shù)據(jù)呈現(xiàn)出愈加復(fù)雜的勢頭,但是涉及數(shù)據(jù)類別的豐富,數(shù)據(jù)處理成果的交叉驗證隨之提升,因此有助于數(shù)據(jù)處理合理程度以及精準(zhǔn)水平的提升。[2]
3 大數(shù)據(jù)時代圖書館知識服務(wù)面臨的挑戰(zhàn)
3.1 數(shù)據(jù)平臺與安全技術(shù)
圖書館大多涉及的是關(guān)系數(shù)據(jù)庫平臺,而在常用的RDBMS之中,由新技術(shù)拓展的非結(jié)構(gòu)化數(shù)據(jù)處于弱勢地位,倘若繼續(xù)使用RDBMS的手法控制非結(jié)構(gòu)化數(shù)據(jù),將導(dǎo)致存儲模塊的流失,過量的數(shù)據(jù)內(nèi)容匯聚于同一數(shù)據(jù)庫同樣使得數(shù)據(jù)庫讀寫不順暢?,F(xiàn)下大部分圖書館為追求便利的數(shù)據(jù)儲存,因而使用了集中存儲的手段,這將便于圖書館方面明確每一塊工作的落實狀況,還有讀者使用服務(wù)項目的效果。然而由安全方面入手,此類手法暴露出不足之處。目前圖書館數(shù)據(jù)與個體的隱私以及知識產(chǎn)權(quán)息息相關(guān),同時集中存儲時常發(fā)生系統(tǒng)漏洞或者不安全因素的產(chǎn)生。同時,大數(shù)據(jù)涉及到的非關(guān)系數(shù)據(jù)的提升表現(xiàn)出非線性特點,但是現(xiàn)下圖書館采取的措施大多面向的是線性擴增的數(shù)據(jù)。
3.2 分析引擎與知識發(fā)現(xiàn)
大數(shù)據(jù)分析對實時性提出了嚴(yán)苛的態(tài)度,讀者使用的順暢程度會作用于圖書館服務(wù)的水平,而圖書館以往數(shù)據(jù)分析水平不足。伴隨圖書館網(wǎng)絡(luò)系統(tǒng)的大規(guī)模推廣以及和讀者越來越多的互動,動態(tài)交互數(shù)據(jù)激增。由于同時登錄的讀者數(shù)目增加讓數(shù)據(jù)倉庫處理狀況不良,改善服務(wù)器緩存效果同樣無法有效地舒緩此方面壓力。圖書館各代知識服務(wù)在更新?lián)Q代之后均將造成知識庫數(shù)據(jù)源涉及單位的擴增,使得其結(jié)構(gòu)愈加復(fù)雜。所以以往的查詢功能朝著多表查詢以及數(shù)據(jù)處理結(jié)合的方面過渡,進而數(shù)據(jù)結(jié)構(gòu)于橫向伸縮特性方面達到需要。而現(xiàn)下的圖書館信息服務(wù)網(wǎng)絡(luò)不具備這一效果。
4 大數(shù)據(jù)時代圖書館知識服務(wù)解決方案
4.1 大數(shù)據(jù)物理存儲平臺
它屬于圖書館大數(shù)據(jù)知識服務(wù)構(gòu)造的前提,依照不同的要求解讀數(shù)據(jù)儲存措施還有劃分?jǐn)?shù)據(jù)節(jié)點。由于圖書館涉及的數(shù)據(jù)量以及類別范圍的廣闊使得不能通過一致的標(biāo)準(zhǔn)來實現(xiàn)物理存儲。除去增量方面投入非關(guān)系構(gòu)造HDFS以外,其他部分繼續(xù)保持以往關(guān)系型構(gòu)造,這屬于一類相對優(yōu)越的手段。關(guān)系型架構(gòu)通過以往的服務(wù)器還有磁盤陣列模式組建而成,再利用RAID加以數(shù)據(jù)重建,把數(shù)據(jù)各自存儲于磁盤陣列內(nèi)部,同時通過SAN協(xié)議實現(xiàn)計算機以及存儲裝備二者的信息交互。此類手法已經(jīng)充當(dāng)圖書館以往信息服務(wù)手法實施已久,表現(xiàn)出相對優(yōu)秀的穩(wěn)定程度自己安全水平。非關(guān)系型架構(gòu)HDFS對照RAID表現(xiàn)出一些差距,其屬于一類分布型文件系統(tǒng),它的中心環(huán)節(jié)NaneNode 用于控制文件系統(tǒng)涉及的元數(shù)據(jù),以及控制不同數(shù)據(jù)節(jié)點DataNode ,每一DataNode就屬于一個 機架,不同的DataNode利用交換機加以連通,NameNode把數(shù)據(jù)文件劃分放入許多不同的DataNode內(nèi), 同時于用戶涉及此方面時把DataNode下的信息匯合在一起呈遞于用戶。HDFS通過TCP/IP協(xié)議實現(xiàn)具體的連通,此類構(gòu)造手段能夠可觀地通過集群的效果實現(xiàn)便捷的存儲以及迅速的計算,可以面向超大數(shù)據(jù)集加以科學(xué)、可行的分布型處理。
4.2 大數(shù)據(jù)采集平臺
采集平臺依照圖書館使用人員反饋的需要,明確涉及的大數(shù)據(jù)源構(gòu)造同時進行探究,遵循數(shù)據(jù)挑取的規(guī)則,通過專門的語言由數(shù)據(jù)庫內(nèi)獲得目標(biāo)數(shù)據(jù),同時面向搜集的數(shù)據(jù)加以深入的處理,最終把獲得的數(shù)據(jù)實現(xiàn)轉(zhuǎn)換,依照讀者提出的條件進行相關(guān)搜索以顯現(xiàn)相關(guān)數(shù)據(jù)。
4.3 大數(shù)據(jù)組織平臺
大數(shù)據(jù)組織平臺囊括了關(guān)系型數(shù)據(jù)庫以及非關(guān)系型數(shù)據(jù)庫二者。RDBMS具有保障數(shù)據(jù)穩(wěn)定、投入量有限的特點,而且其應(yīng)用的比重相對較高。另一方面,當(dāng)處于非結(jié)構(gòu)化類型時,NOSQL數(shù)據(jù)庫表現(xiàn)出絕佳的存儲以及管理能力。由于刨除了關(guān)系型數(shù)據(jù)庫涉及的關(guān)系性,因此這類數(shù)據(jù)庫構(gòu)造便捷,能夠任意時間設(shè)置數(shù)據(jù)結(jié)構(gòu)。
5 結(jié)語
由于信息技術(shù)于全球范圍沒推廣,多種數(shù)據(jù)形態(tài)如同雨后春筍一般涌現(xiàn)出來。圖書館作為知識以及信息的保存以及傳輸?shù)臋C構(gòu),處于這一時代背景之下,同樣顯示出了大數(shù)據(jù)的跡象。大數(shù)據(jù)時代的來臨推動了圖書館持續(xù)地實現(xiàn)自我發(fā)展,但同時也帶來了相應(yīng)的問題。以往的圖書館服務(wù)手段無法與日益增長的讀者需求相對等,本文由此切入,解讀了將大數(shù)據(jù)投入于圖書館服務(wù)的可行性還有問題,并由此著手構(gòu)筑相應(yīng)平臺,為圖書館的持續(xù)進步做好鋪墊。
參考文獻
[1]肖強,朱慶華.Hadoop環(huán)境下的分布式協(xié)同過濾算法設(shè)計與實現(xiàn)[J]現(xiàn)代圖書情報技術(shù),2013(1):83-89.
[2]李廣建,楊林.大數(shù)據(jù)視角下情報研究與情報研究技術(shù)[J].圖書與情報,2012(6):42-44.
作者簡介
張俠(1969-),女,河南南陽人,研究生,館員,陜西省延安市委黨校圖書館,研究方向:圖書管理。endprint