• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)處理在圖書館信息化管理中的應(yīng)用

      2016-03-12 22:15:32遼寧對外經(jīng)貿(mào)學(xué)院劉奉駁
      電子世界 2016年22期
      關(guān)鍵詞:結(jié)構(gòu)化書籍圖書

      遼寧對外經(jīng)貿(mào)學(xué)院 劉奉駁

      大數(shù)據(jù)處理在圖書館信息化管理中的應(yīng)用

      遼寧對外經(jīng)貿(mào)學(xué)院 劉奉駁

      人們現(xiàn)在越來越依賴網(wǎng)絡(luò),而大數(shù)據(jù)在近幾年已經(jīng)成為大多數(shù)人研究與分析的對象,其中大數(shù)據(jù)的應(yīng)用也深深的影響著圖書館的管理,大數(shù)據(jù)技術(shù)的發(fā)展改變了圖書館的管理的方式,加快了信息化管理的進程。大數(shù)據(jù)技術(shù)對于含有意義的數(shù)據(jù)進行專業(yè)化處理,加強了對圖書館的管理,為讀者提供更方便的服務(wù)。本文介紹了大數(shù)據(jù)處理為圖書館管理帶來的影響以及如何推進圖書館的信息化進程,改變了傳統(tǒng)圖書館的管理方式,為其提供了新的平臺。

      大數(shù)據(jù);圖書館;應(yīng)用

      1.大數(shù)據(jù)與圖書館

      1.1大數(shù)據(jù)的概念

      大數(shù)據(jù),又稱巨量資料,指的是所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征[1]。

      1.2圖書館所具備的大數(shù)據(jù)特征

      (1)大容量

      圖書館作為存儲圖書的場所,其中存在大量的文獻圖書信息,音頻視頻資源,電子刊物等,而這之中不光有各種書籍的資源,還包括多媒體資源,并且每年圖書館都需要更新數(shù)據(jù)庫,以及新增各種書籍和購買最新的音頻視頻資源。還有讀者通過圖書館借閱書籍的信息,網(wǎng)上的交流,這些所產(chǎn)生的這些數(shù)據(jù),而且圖書館的數(shù)據(jù)量每天都在快速的增長。在公元前3世紀,希臘時代最著名的圖書館亞歷山大圖書館用盡全力獲得了大部分的書籍資料,可以說希臘搜集的資料囊括了世界上絕大部分的書籍。但是當(dāng)大數(shù)據(jù)時代的到來,每個人都可以通過各種渠道獲取到許多的數(shù)據(jù)資源,而這些相當(dāng)于當(dāng)時希臘圖書館中書籍資料的320倍。因此如果再用傳統(tǒng)的圖書館管理方式那是不行的,所以這都是圖書館需要大數(shù)據(jù)的大容量特點的理由。

      (2)多樣性

      在大數(shù)據(jù)時代,數(shù)據(jù)格式變得越來越多樣,涵蓋了文本、音頻、圖片、視頻、模擬信號等不同的類型;數(shù)據(jù)來源也越來越多樣,不僅產(chǎn)生于組織內(nèi)部運作的各個環(huán)節(jié),也來自于組織外部。圖書館中的數(shù)據(jù)不光有圖書信息這樣的結(jié)構(gòu)化數(shù)據(jù),還有很多來自網(wǎng)上微博、社交網(wǎng)站等產(chǎn)生的非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。圖書館的數(shù)據(jù)恰恰是驗證了大數(shù)據(jù)在圖書館的應(yīng)用中多樣性的特點。

      (3)快速度

      時間就是金錢。而我們最多的就是時間,而最需要的也是時間,越快的讀取數(shù)據(jù),那么在競爭時就會更有機會。讀者對圖書館中圖書的更新越來越看重,而這就要求圖書館能夠快速的將最新的圖書信息更新到圖書館中,并在網(wǎng)上的借閱系統(tǒng)中將信息顯示出來,可以使讀者在圖書館借閱時盡快的找到自己想要的書籍,滿足讀者的需求。對于圖書館大量的數(shù)據(jù)變化,它需要以最快的速度改變信息,因此處理信息的速度尤為重要。

      (4)價值密度低

      追求高數(shù)據(jù)質(zhì)量是一項重要的大數(shù)據(jù)要求和挑戰(zhàn),即使最優(yōu)秀的數(shù)據(jù)清理方法也無法消除某些數(shù)據(jù)固有的不可預(yù)測性,例如在圖書館中監(jiān)控資源分析過程中,可能只有十幾秒甚至幾秒有用,因此必須用大數(shù)據(jù)來處理。

      2.大數(shù)據(jù)處理對圖書館的影響

      隨著信息化的發(fā)展,傳統(tǒng)圖書館的缺點已經(jīng)越來越明顯了,它已經(jīng)不能滿足讀者的需求,大數(shù)據(jù)時代帶來的價值也深深的影響著圖書館的管理。圖書館的宗旨就是為讀者提供優(yōu)秀的書籍以及更全面的服務(wù),也是圖書館的價值體現(xiàn)。在大數(shù)據(jù)時代,圖書館通過大數(shù)據(jù)的管理方式,用先進的技術(shù)條件,進行數(shù)據(jù)挖掘和分析,使圖書館更快速的更新最新的書籍,為讀者提供更便捷的服務(wù),加強圖書館的管理。

      2.1大數(shù)據(jù)為圖書館帶來的機遇

      大數(shù)據(jù)為圖書館帶來的機遇:一是為圖書館創(chuàng)建新型知識服務(wù)引擎,它更便捷的為讀者服務(wù),使讀者更快速的搜索到自己想要的書籍以及更重資料,節(jié)省了讀者的時間;二是通過大數(shù)據(jù)建立的圖書館管理系統(tǒng),可以節(jié)省更多的人力物力,并且可以減少發(fā)生失誤的概率,為讀者提供更方便的學(xué)習(xí)方式。三是為圖書館提供更精準的分析能力,減少可能發(fā)生的資源故障,更好的管理圖書館。四是為圖書館帶來更完整的數(shù)據(jù)收集能力,增強圖書館的數(shù)據(jù)量,為讀者提供更多的資源。

      2.2大數(shù)據(jù)為圖書館帶來的挑戰(zhàn)

      在大數(shù)據(jù)的發(fā)展過程中一直存在的問題就是隱私問題,微軟張亞勤說:“大數(shù)據(jù)安全和隱私問題永遠無法解決”[2]。對大數(shù)據(jù)存儲、挖掘、 分析也是大勢所趨,也不能因為懼怕隱私問題就停滯不前。在信息化的時代,圖書館需要為不同的讀者提供不同的服務(wù),而這勢必會侵犯到讀者的隱私問題,就目前來說還沒有太好的解決辦法,主要是樹立圖書館員的道德風(fēng)尚,使其更加重視讀者的隱私問題?,F(xiàn)在由于大數(shù)據(jù)的快速發(fā)展,國家已經(jīng)制定了相關(guān)的法律來保護隱私問題。

      圖書館需要存儲大量的數(shù)據(jù),因此這就對數(shù)據(jù)的存儲有了更高的要求。隨著數(shù)據(jù)量的巨大增長和數(shù)據(jù)來源的多樣化,傳統(tǒng)的數(shù)據(jù)存儲結(jié)構(gòu)已經(jīng)不能滿足圖書館的需求,可以考慮最大程度利用存儲系統(tǒng),進行存儲虛擬化、分層存儲、堆棧管理等[3]。

      3.圖書館大數(shù)據(jù)處理方案

      3.1大數(shù)據(jù)采集

      圖書館大數(shù)據(jù)采集是對圖書館中相關(guān)的數(shù)據(jù)庫、自動化系統(tǒng)和外聯(lián)網(wǎng)數(shù)據(jù)進行采集,與傳統(tǒng)數(shù)據(jù)采集相比它是對全部類型的資源的采集,能夠更多的增加數(shù)據(jù)庫中的數(shù)據(jù)量,滿足大部分讀者的需求。大數(shù)據(jù)采集沒有統(tǒng)一的要求,不管是結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)或是非結(jié)構(gòu)化數(shù)據(jù);也不管是采集正確的數(shù)據(jù),還是不正確的數(shù)據(jù);總之是不管什么樣的數(shù)據(jù),只要是數(shù)據(jù)統(tǒng)統(tǒng)都要,越多越好。因此圖書館的大數(shù)據(jù)采集可以用通用分布式大數(shù)據(jù)工具。系統(tǒng)日志采集可以應(yīng)用大數(shù)據(jù)工具如Cloudera的Flume、Hadoop的Chukwa、Facebook的Scribe等,這些工具采用分布式架構(gòu),可以滿足大量的系統(tǒng)日志的采集和上傳;外聯(lián)網(wǎng)絡(luò)數(shù)據(jù)可以通過網(wǎng)絡(luò)爬蟲或網(wǎng)站API等從網(wǎng)站上獲取來進行采集,它不僅僅支持音頻視頻,還支持圖片等數(shù)據(jù)[4]。

      3.2大數(shù)據(jù)存儲與組織

      現(xiàn)如今大數(shù)據(jù)發(fā)展越來越迅速,而傳統(tǒng)的數(shù)據(jù)倉庫其本身存在的缺點已經(jīng)不能滿足圖書館的要求,但是數(shù)據(jù)倉庫也存在可擴展性、容錯性、低成本等優(yōu)點。所以說要像圖書館更好的發(fā)展,可以將數(shù)據(jù)倉庫和大數(shù)據(jù)結(jié)合起來,創(chuàng)造一個混合的存儲平臺。

      現(xiàn)如今使用最多的大數(shù)據(jù)處理平臺架構(gòu)是Hadoop,所以圖書館可以采用傳統(tǒng)數(shù)據(jù)倉庫(DW)和 Hadoop大數(shù)據(jù)處理平臺的混合架構(gòu),用來保存圖書館中大量的資源,對于不同的要求來選擇不同的存儲方式。圖書館對傳統(tǒng)海量結(jié)構(gòu)化業(yè)務(wù)數(shù)據(jù)可以采用現(xiàn)有數(shù)據(jù)倉庫進行存儲;對于海量半結(jié)構(gòu)化服務(wù)日志數(shù)據(jù)可以采用NoSQL數(shù)據(jù)庫(NoSQL為典型的半結(jié)構(gòu)化數(shù)據(jù)存儲數(shù)據(jù)庫),對于海量原生非結(jié)構(gòu)化數(shù)據(jù)可以將其提取元數(shù)據(jù)存儲于數(shù)據(jù)倉庫,數(shù)據(jù)資源對象存儲于Hadoop平臺的HDFS分布式文件系統(tǒng)中。這種存儲方式符合大數(shù)據(jù)基本存儲架構(gòu),同時它對于圖書館的硬件設(shè)施有很高的要求。

      4.大數(shù)據(jù)在圖書館中的實踐

      4.1圖書館的空間優(yōu)化

      例如學(xué)校圖書館的門禁系統(tǒng),通過門禁系統(tǒng)圖書館可以統(tǒng)計進館人數(shù)、讀者身份等等。再對這些信息進行整體的劃分與推算,這樣就能更好的區(qū)分圖書館在何時人比較少,在何時是高峰期。載人比較少的時候減少一些工作人員,節(jié)省更多的財力物力;在高峰期的時候,提前做好準備,可以更好的調(diào)節(jié)工作人員,整理圖書,做到更好的服務(wù)。還可以將門禁系統(tǒng)加入到其他系統(tǒng)中,形成更加智能化的系統(tǒng),例如清華大學(xué)圖書館的RFID智能系統(tǒng),通過該系統(tǒng)進行的座位預(yù)約,就是先在線預(yù)約,之后通過圖書館中的終端機刷卡確定身份后入座,利用這個系統(tǒng)我們還可以確認讀者是否在閉館前是否還在圖書館中[5]。

      還有就是圖書館的監(jiān)控系統(tǒng),通過監(jiān)控設(shè)備來確定圖書館中各個位置的使用率,以及在何時開放哪個地區(qū)等;利用設(shè)備監(jiān)控整個圖書館的溫度與濕度,防止圖書的損壞和讀者的舒適度。

      4.2圖書館的閱讀推廣

      圖書館通過對網(wǎng)絡(luò)中得到的數(shù)據(jù)以及電子文獻數(shù)據(jù)和搜索數(shù)據(jù)、借閱數(shù)據(jù)等進行推理分析,通過大數(shù)據(jù)得到的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進行篩選、分類,進一步的了解最近一段時間比較火熱的,話題最多的圖書,根據(jù)大部分讀者的喜好選擇文學(xué)作品來進行閱讀推廣。另外現(xiàn)在讀者都持有手機,我們可以對讀者的身份信息進行同意的管理,在通過第三方平臺例如微信、qq、郵箱、微博等進行圖書的推廣,為讀者提供更加便捷的服務(wù),讓讀者不用到圖書館也能了解最新的圖書資訊,甚至可以通過手機、電腦等終端進行下載或者在線閱讀。

      4.3大數(shù)據(jù)在圖書館人力資源的應(yīng)用

      人力資源的核心是人力資源管理。圖書館在大數(shù)據(jù)時代背景下,要想得到更好的發(fā)展,那么必須有大量的相關(guān)人才,而怎么樣培養(yǎng)出相關(guān)的人才就是我們需要仔細的研究和探討的了?,F(xiàn)如今圖書館的大部分的工作人員的工作素養(yǎng)、服務(wù)水平、對圖書館知識的掌握等方面都還差的很遠,需要很大的提高。我們可以利用圖書館中保存的大數(shù)據(jù)來進行查找,分析有用的書籍和文獻,通過其中得到的信息在根據(jù)圖書館自身的需求來進行尋找,培養(yǎng)圖書館需要的人才。大數(shù)據(jù)作為前沿技術(shù)具有很高的難度,現(xiàn)如今它得到了廣泛的應(yīng)用,為了跟上時代的步伐,圖書館必須與時俱進,充分利用大數(shù)據(jù),為圖書館的管理等方面帶來巨大改變。如果想要在圖書館中擔(dān)任大數(shù)據(jù)的分析的工作,那么必須有相對應(yīng)得技術(shù)基礎(chǔ)的人才可以,但是這方面的人才又相對來說比較缺乏,因此對于圖書館來說培養(yǎng)大數(shù)據(jù)的人才那么就事關(guān)重要了,而這也是圖書館的一大挑戰(zhàn)。

      5.結(jié)語

      大數(shù)據(jù)正在快速發(fā)展階段,圖書館作為社會中公共信息服務(wù)體系的一部分,其讀者的基礎(chǔ)以及各類書籍資源將會越來越多,而這也就要求圖書館需要更新的技術(shù)支持。圖書館對大數(shù)據(jù)的應(yīng)用,推動了圖書館信息化的進程,改變了傳統(tǒng)圖書館的缺點,為圖書館開拓了新的平臺,充分的發(fā)揮大數(shù)據(jù)的特點,更好的提高圖書館的服務(wù)質(zhì)量,改善圖書館的閱讀環(huán)境,提升讀者的閱讀體驗,方便讀者,也使大數(shù)據(jù)在圖書館中得到更好的價值。

      [1]The Age of Big Data[EB/OL].[2014-10-16].http:///www,nytimes. com/2012/02/12/Sunday review/big datas impact in the world,Html?pagewanter=all

      [2]涂蘭敬.專家觀點:“大數(shù)據(jù)”與“海量數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37-38.

      [3]張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2012(6):15-21.

      [4]張毅,趙雅潔.論大數(shù)據(jù)在圖書館管理與服務(wù)中的應(yīng)用[J].圖書館工作與研究,2015(9):4-8.

      [5]甘琳.RFID技術(shù)在圖書館的創(chuàng)新應(yīng)用[J].圖書館論壇,2007,27(3): 8-11.

      猜你喜歡
      結(jié)構(gòu)化書籍圖書
      魯迅與“書籍代購”
      促進知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
      圖書推薦
      南風(fēng)(2020年22期)2020-09-15 07:47:08
      結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
      計算機教育(2020年5期)2020-07-24 08:53:00
      歡迎來到圖書借閱角
      AOS在書籍編寫的應(yīng)用
      書籍
      班里有個圖書角
      書籍是如何改變我們的
      基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
      計算機工程(2015年8期)2015-07-03 12:20:35
      高密市| 津市市| 绿春县| 本溪市| 醴陵市| 潜山县| 永州市| 南陵县| 黄山市| 沧源| 澄江县| 贺州市| 奈曼旗| 买车| 苍溪县| 历史| 运城市| 永定县| 丰顺县| 东至县| 奉节县| 墨竹工卡县| 咸丰县| 顺义区| 孟州市| 中山市| 松江区| 滨州市| 定安县| 长寿区| 萍乡市| 澄江县| 徐闻县| 黄骅市| 宾川县| 武城县| 灵武市| 济源市| 崇州市| 淳安县| 同德县|