荀麗芳
摘要:大數(shù)據(jù)時(shí)代的來(lái)臨,使“數(shù)據(jù)”成為各行各業(yè)都要考慮的不可或缺的一種生產(chǎn)要素。作為圖書(shū)館行業(yè),雖然“數(shù)字圖書(shū)館”仍是一個(gè)較新的概念,但就其發(fā)展趨勢(shì)而言,在大數(shù)據(jù)時(shí)代的背景下,“數(shù)據(jù)”更應(yīng)該是數(shù)字圖書(shū)館建設(shè)的重心。在大數(shù)據(jù)時(shí)代到來(lái)之際,對(duì)大數(shù)據(jù)、大數(shù)據(jù)思維的了解有助于數(shù)字圖書(shū)館在建設(shè)過(guò)程中的數(shù)據(jù)挖掘、數(shù)據(jù)處理及數(shù)據(jù)服務(wù)上形成符合時(shí)代需求的產(chǎn)品及模式。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)思維;數(shù)字圖書(shū)館;數(shù)據(jù)圖書(shū)館
中圖分類號(hào):G250.76文獻(xiàn)標(biāo)志碼:A文章編號(hào):10017836(2017)04015403
近年來(lái),隨著計(jì)算機(jī)技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,商業(yè)與互聯(lián)網(wǎng)的結(jié)合越發(fā)緊密,“大數(shù)據(jù)”也通過(guò)這種全新的商業(yè)模式走入人們的視野。“大數(shù)據(jù)”是指在信息時(shí)代通過(guò)網(wǎng)絡(luò)等工具收集匯聚的海量的數(shù)據(jù),同時(shí)也被指為是對(duì)這些數(shù)據(jù)進(jìn)行挖掘、分析的各類技術(shù)的發(fā)展與創(chuàng)新。其實(shí),大數(shù)據(jù)在很早之前就被運(yùn)用在多種學(xué)科之中。最早提出“大數(shù)據(jù)”時(shí)代的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”[1]由于互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展,大數(shù)據(jù)的理念與實(shí)踐從商業(yè)領(lǐng)域迅速擴(kuò)展到社會(huì)信息服務(wù)的各個(gè)領(lǐng)域,圖書(shū)館作為社會(huì)重要的公共文化服務(wù)機(jī)構(gòu),也開(kāi)始積極致力于大數(shù)據(jù)理念與技術(shù)的引進(jìn)與應(yīng)用。
1大數(shù)據(jù)、大數(shù)據(jù)思維與大數(shù)據(jù)技術(shù)
1.1大數(shù)據(jù)
雖然“大數(shù)據(jù)”成為了近年的熱詞,也有越來(lái)越多的人開(kāi)始了大數(shù)據(jù)的研究,但目前“大數(shù)據(jù)”仍沒(méi)有統(tǒng)一的定義。那么究竟什么是大數(shù)據(jù)?筆者認(rèn)為,大數(shù)據(jù)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。再簡(jiǎn)單的概括一下,可以說(shuō)“大數(shù)據(jù)”就是一個(gè)數(shù)據(jù)集合。一般認(rèn)為,當(dāng)數(shù)據(jù)集合的存儲(chǔ)量達(dá)到PB①或者EB級(jí)時(shí),這個(gè)數(shù)據(jù)集合就可以稱為是大數(shù)據(jù)或海量數(shù)據(jù)。
1.2大數(shù)據(jù)思維
提到大數(shù)據(jù)與大數(shù)據(jù)思維,就不得不提及經(jīng)典的“尿布與啤酒”的大數(shù)據(jù)案例。在美國(guó)的沃爾瑪超市里,你會(huì)發(fā)現(xiàn)尿布與啤酒這兩種風(fēng)馬牛不相及的貨品竟然是被陳列在一起的,而這種陳列方式大大地促進(jìn)了二者的銷量。原來(lái),在美國(guó),年輕的媽媽一般都會(huì)要求孩子的爸爸去為孩子購(gòu)買(mǎi)尿布,要知道,美國(guó)的年輕男士是非常鐘愛(ài)于啤酒的。所以這些孩子的爸爸們往往則會(huì)在購(gòu)置尿布的時(shí)順便購(gòu)買(mǎi)啤酒。這一規(guī)律就是由沃爾瑪?shù)臄?shù)據(jù)專家在雜亂無(wú)章的銷售數(shù)據(jù)中挖掘出來(lái)的。而這種數(shù)據(jù)中有利的、規(guī)律性的信息的挖掘過(guò)程其實(shí)就是大數(shù)據(jù)思維的一種體現(xiàn)。
由此可見(jiàn),大數(shù)據(jù)思維就是大數(shù)據(jù)技術(shù)的哲學(xué)基礎(chǔ)或內(nèi)在邏輯。掌握大數(shù)據(jù)思維就能掌握大數(shù)據(jù)中各類別數(shù)據(jù)的關(guān)聯(lián)關(guān)系,進(jìn)而通過(guò)各種關(guān)聯(lián)關(guān)系獲得有利的潛在信息。大數(shù)據(jù)思維具有以下特征:
(1)規(guī)律性。大數(shù)據(jù)中任何相關(guān)聯(lián)的數(shù)據(jù)之間都有其內(nèi)在的聯(lián)系,這一聯(lián)系是各個(gè)數(shù)據(jù)存在的基礎(chǔ),同時(shí)也是大數(shù)據(jù)內(nèi)部運(yùn)行演變的規(guī)律。如“尿布與啤酒”,就是在海量的數(shù)據(jù)中尋找到“尿布”與“啤酒”的關(guān)聯(lián)關(guān)系后,在通過(guò)這種潛在關(guān)系促進(jìn)二者的銷量。
(2)無(wú)偏性。不難看出大數(shù)據(jù)思維的基礎(chǔ)是統(tǒng)計(jì)學(xué)思維,但其有別于統(tǒng)計(jì)學(xué)思維的地方就是無(wú)偏性。大數(shù)據(jù)最突出的特點(diǎn)是數(shù)據(jù)的龐大,在龐大的數(shù)據(jù)中獲取有效信息進(jìn)行分析研究的結(jié)果,往往能體現(xiàn)各種不同數(shù)據(jù)的之間的聯(lián)系與變化規(guī)律,由此得到的結(jié)果,往往是海量元數(shù)據(jù)的共性,所以這種結(jié)果一般更加科學(xué),更加符合實(shí)際。而統(tǒng)計(jì)學(xué)常采取的抽樣形式,相比較大數(shù)據(jù)而言,“以偏概全”的概率更高。
(3)準(zhǔn)確性。大數(shù)據(jù)思維的準(zhǔn)確性不僅僅體現(xiàn)在其無(wú)偏性上,而且體現(xiàn)在其“求解”的過(guò)程中。一般的數(shù)據(jù)分析是在數(shù)據(jù)所直接表達(dá)的信息上發(fā)現(xiàn)問(wèn)題,可以說(shuō)是“提問(wèn)”的過(guò)程。而大數(shù)據(jù)由于其數(shù)據(jù)過(guò)于龐大,往往使用大數(shù)據(jù)的前提是已知某一問(wèn)題,再就這一問(wèn)在海量的大數(shù)據(jù)中尋找共性及解決方案,是一種“求解”的過(guò)程。
1.3大數(shù)據(jù)技術(shù)
如同大數(shù)據(jù)一樣,目前大數(shù)據(jù)技術(shù)也同樣沒(méi)有明確的定義,筆者認(rèn)為,大數(shù)據(jù)技術(shù)是指通過(guò)大數(shù)據(jù)思維在大數(shù)據(jù)中提取有效的數(shù)據(jù)關(guān)系的技術(shù)手段,它應(yīng)該是統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)等多學(xué)科技術(shù)的融合。結(jié)合以上學(xué)科特點(diǎn),大數(shù)據(jù)技術(shù)往往被應(yīng)用于概率統(tǒng)計(jì)、趨勢(shì)預(yù)測(cè)、客戶分析等方面,由于學(xué)科的結(jié)合,大數(shù)據(jù)應(yīng)用在情報(bào)分析方面都有著非常出色的表現(xiàn)[2]。
1.4大數(shù)據(jù)與數(shù)字圖書(shū)館
(1)數(shù)字圖書(shū)館。在理解大數(shù)據(jù)與數(shù)字圖書(shū)館的關(guān)系前,我們首先了解下什么是數(shù)字圖書(shū)館。數(shù)字圖書(shū)館是相對(duì)于實(shí)體圖書(shū)館而言的,一般情況下,數(shù)字圖書(shū)館是基于實(shí)體圖書(shū)館建構(gòu)的一種虛擬圖書(shū)館。數(shù)字圖書(shū)館是隨著信息時(shí)代的發(fā)展而來(lái)的,屬于隨著信息時(shí)代的到來(lái)而到來(lái)的產(chǎn)物。數(shù)字圖書(shū)館是一種能夠?yàn)橛脩籼峁┓奖?、快捷、高水平的信息化服?wù)機(jī)制的擁有多種媒體內(nèi)容的數(shù)字化信息資源,它既是一種科學(xué)技術(shù),又是一項(xiàng)社會(huì)事業(yè)。進(jìn)一步從概念上對(duì)信息圖書(shū)館進(jìn)行具體化理解數(shù)字圖書(shū)館的工作的話,主要有以下兩種:一是將傳統(tǒng)紙質(zhì)圖書(shū)數(shù)字化,即將傳統(tǒng)的紙質(zhì)圖書(shū)轉(zhuǎn)化為電子版的數(shù)字圖書(shū);一是對(duì)數(shù)字圖書(shū)的管理,這就涵蓋對(duì)數(shù)字圖書(shū)的存儲(chǔ)、交換與流通使用。
(2)大數(shù)據(jù)與數(shù)字圖書(shū)館。就數(shù)字圖書(shū)館領(lǐng)域討論大數(shù)據(jù),就不得不討論圖書(shū)館中是否存在大數(shù)據(jù)。如果有,其大數(shù)據(jù)的一面又體現(xiàn)在哪里?在已有的大數(shù)據(jù)與數(shù)字圖書(shū)館的研究中,普遍認(rèn)為圖書(shū)館自建或外購(gòu)的數(shù)字資源即數(shù)據(jù)、信息和知識(shí)就是圖書(shū)館的大數(shù)據(jù)。這些數(shù)據(jù)已經(jīng)達(dá)到了PB級(jí)別,符合大數(shù)據(jù)存儲(chǔ)量上的要求。但也有反對(duì)者認(rèn)為,這些數(shù)據(jù)、信息與知識(shí)在大數(shù)據(jù)被調(diào)用分析前即已存在,且一般有著詳細(xì)的歸類,無(wú)須進(jìn)一步提取與分析,不能成為大數(shù)據(jù)。反對(duì)者認(rèn)為圖書(shū)館的機(jī)器可讀目錄數(shù)據(jù)、讀者的借閱記錄、用戶信息行為數(shù)據(jù)才是圖書(shū)館的大數(shù)據(jù),雖然這些數(shù)據(jù)達(dá)不到大數(shù)據(jù)要求的存儲(chǔ)量(PB級(jí)以上),但是這些數(shù)據(jù)的存在與應(yīng)用是符合大數(shù)據(jù)思維的,即我們可以通過(guò)大數(shù)據(jù)技術(shù)手段去探尋隱藏在圖書(shū)館的海量數(shù)據(jù)中各類數(shù)據(jù)之間規(guī)律性的關(guān)聯(lián)關(guān)系。筆者認(rèn)為,就大數(shù)據(jù)現(xiàn)有的概念而言,以上兩種觀點(diǎn)都不可完全稱作是圖書(shū)館的大數(shù)據(jù),但如果將兩者結(jié)合,則完全滿足大數(shù)據(jù)的定義要求,且兩種數(shù)據(jù)之間并不沖突。以上兩種類型數(shù)據(jù)之間既有既定的,也有可變性的,但兩者之前其實(shí)是存在聯(lián)系的,這種聯(lián)系的探求就符合大數(shù)據(jù)思維模式,數(shù)字圖書(shū)館的建設(shè)就可以根據(jù)以上數(shù)據(jù)進(jìn)行挖掘與探究。而兩者數(shù)據(jù)存儲(chǔ)量之和也滿足大數(shù)據(jù)對(duì)存儲(chǔ)量上的PB級(jí)以上的定義。
2大數(shù)據(jù)時(shí)代數(shù)字圖書(shū)館的挑戰(zhàn)與危機(jī)
2.1數(shù)字圖書(shū)館的外部競(jìng)爭(zhēng)危機(jī)
現(xiàn)實(shí)生活中,學(xué)術(shù)資源上的大數(shù)據(jù)應(yīng)用已很常見(jiàn)。如中國(guó)知網(wǎng)(CNKI)、萬(wàn)方數(shù)據(jù)知識(shí)平臺(tái)、百度學(xué)術(shù)等學(xué)術(shù)資源建設(shè)商都已存在大數(shù)據(jù)應(yīng)用。據(jù)測(cè)算,目前僅百度擁有的信息總量就超過(guò)1000PB,相當(dāng)于國(guó)家圖書(shū)館藏書(shū)數(shù)字化后數(shù)據(jù)量的5萬(wàn)倍,每天增加的數(shù)據(jù)量 10TB,相當(dāng)于半個(gè)國(guó)家圖書(shū)館的藏書(shū)數(shù)字化后的數(shù)據(jù)量[3]。由此可見(jiàn),在學(xué)術(shù)、教育、文化資源上的網(wǎng)絡(luò)資源建設(shè)發(fā)展十分迅速,這些網(wǎng)絡(luò)資源建設(shè)商已經(jīng)在資源的規(guī)模與資源的種類兩個(gè)方面,遠(yuǎn)遠(yuǎn)地超過(guò)了傳統(tǒng)的數(shù)字圖書(shū)館。再者,一份關(guān)于大學(xué)生對(duì)高校圖書(shū)館使用情況的調(diào)研報(bào)告顯示,72%的學(xué)生通過(guò)網(wǎng)絡(luò)獲得信息,而通過(guò)圖書(shū)館獲得信息的學(xué)生只占18%[4]。另一項(xiàng)調(diào)查也顯示,大學(xué)生訪問(wèn)圖書(shū)館網(wǎng)站(數(shù)字圖書(shū)館)的只占28%,遠(yuǎn)低于使用搜索引擎的使用比例,甚至有25.3%的大學(xué)生表示從沒(méi)有去訪問(wèn)過(guò)圖書(shū)館網(wǎng)站(數(shù)字圖書(shū)館)[5]。傳統(tǒng)的數(shù)字圖書(shū)館已經(jīng)成為了大數(shù)據(jù)時(shí)代背景下信息獲取的最后途經(jīng)。
2.2數(shù)字圖書(shū)館的內(nèi)部建設(shè)困境
(1)信息時(shí)代遺留問(wèn)題亟待解決。由于時(shí)代的差異,傳統(tǒng)數(shù)字圖書(shū)館在建設(shè)時(shí)難免受技術(shù)所限。同時(shí),由于資金不足、標(biāo)準(zhǔn)不統(tǒng)一等許多原因,導(dǎo)致數(shù)字圖書(shū)館長(zhǎng)期存在著諸如接口不統(tǒng)一、資源元數(shù)據(jù)描述不夠、檢索能力不足、文獻(xiàn)數(shù)據(jù)相互關(guān)聯(lián)性較差、互操作程度較低、資源發(fā)現(xiàn)和擴(kuò)展能力低下等問(wèn)題。這些問(wèn)題從根本上阻斷了各圖書(shū)館內(nèi)以及圖書(shū)館之間信息的共享,也使得文獻(xiàn)檢索不便、不全。
(2)大數(shù)據(jù)時(shí)代帶來(lái)新的數(shù)字圖書(shū)館建設(shè)挑戰(zhàn)。其一,大數(shù)據(jù)技術(shù)應(yīng)用為數(shù)字圖書(shū)館傳統(tǒng)技術(shù)應(yīng)用帶來(lái)挑戰(zhàn)。我們知道,目前數(shù)字圖書(shū)館在信息檢索互操作方面很難將復(fù)雜數(shù)據(jù)環(huán)境(多源數(shù)據(jù)、多類型數(shù)據(jù))下的數(shù)據(jù)價(jià)值發(fā)現(xiàn)與圖書(shū)館知識(shí)服務(wù)結(jié)合起來(lái)。這是因?yàn)閭鹘y(tǒng)的數(shù)字圖書(shū)館的檢索方式主要有基于圖書(shū)館自動(dòng)化系統(tǒng)的元數(shù)據(jù)互操作(如聯(lián)合目錄+OpenURL)和基于二代圖書(shū)館系統(tǒng)的基于系統(tǒng)的互操作(如MetaSearch+OpenURL)兩種,這兩種檢索互操作方式的結(jié)合應(yīng)用,也只能是有效地解決信息描述與檢索能力不足的問(wèn)題,而上文提到的問(wèn)題是根本無(wú)法解決的。這一問(wèn)題卻完全可以通過(guò)大數(shù)據(jù)思維進(jìn)行剖析與處理。其二,大數(shù)據(jù)思維為數(shù)字圖書(shū)館的用戶維護(hù)帶來(lái)了挑戰(zhàn)。如上文所述,大數(shù)據(jù)的出現(xiàn)形成了有別于傳統(tǒng)思維的大數(shù)據(jù)思維。這種在海量數(shù)據(jù)中尋找相互關(guān)系的思維逐步地使人拋棄傳統(tǒng)的、易錯(cuò)的思維模式與實(shí)驗(yàn)方式,是一種“通過(guò)信息找人”的思維方式。傳統(tǒng)的數(shù)字圖書(shū)館在其各項(xiàng)數(shù)據(jù)間都無(wú)法形成有效聯(lián)系的情況下,想“通過(guò)信息找人”,即在數(shù)據(jù)中進(jìn)行概率預(yù)測(cè),為信息找用戶的服務(wù)就很難達(dá)到。
對(duì)此,在大數(shù)據(jù)的背景下,傳統(tǒng)的數(shù)字圖書(shū)館界就應(yīng)當(dāng)重視來(lái)自其自身內(nèi)外的威脅,但有時(shí)威脅可能也是一種啟示,更是一種機(jī)遇。
3大數(shù)據(jù)時(shí)代背景下數(shù)字圖書(shū)館建設(shè)研究
3.1數(shù)據(jù)圖書(shū)館是數(shù)字圖書(shū)館的發(fā)展方向
數(shù)據(jù)圖書(shū)館即在數(shù)字圖書(shū)館的基礎(chǔ)上,綜合以上數(shù)字圖書(shū)館存在問(wèn)題,以數(shù)據(jù)為核心,圍繞數(shù)據(jù)及數(shù)據(jù)業(yè)務(wù)來(lái)重構(gòu)或重組數(shù)字圖書(shū)館的建設(shè)、運(yùn)營(yíng)與服務(wù)。圍繞數(shù)據(jù)及數(shù)據(jù)業(yè)務(wù)就是指數(shù)字圖書(shū)館的建設(shè)、運(yùn)營(yíng)與服務(wù)均已數(shù)據(jù)為核心,對(duì)數(shù)據(jù)進(jìn)行采集、保存、挖掘、分析以及處理與應(yīng)用,進(jìn)而形成數(shù)據(jù)出版、數(shù)據(jù)增值與數(shù)據(jù)服務(wù)。
數(shù)據(jù)圖書(shū)館的架構(gòu)主要為三個(gè)部分。首先是負(fù)責(zé)數(shù)據(jù)采集與保存的大數(shù)據(jù)層。這一層級(jí)主要由文獻(xiàn)數(shù)據(jù)(期刊、論文、雜志等)、用戶數(shù)據(jù)(個(gè)人數(shù)據(jù)、閱讀習(xí)慣、生活信息等)及其他數(shù)據(jù)(政府信息、科技環(huán)境等)構(gòu)成。其次是負(fù)責(zé)數(shù)據(jù)分析及處理的數(shù)據(jù)計(jì)算層。顧名思義,該層級(jí)的主要任務(wù)就是提取、處理、分析大數(shù)據(jù)層存儲(chǔ)的所有數(shù)據(jù)。最后層級(jí)即用戶服務(wù)層,該層級(jí)為用戶提供基礎(chǔ)數(shù)據(jù)服務(wù),同事兼收用戶直接反饋或間接反饋的各類信息。通過(guò)用戶服務(wù)層的功能即可看出,三個(gè)層級(jí)之間是相互聯(lián)系的,各自的信息既是為自己服務(wù),也是為其他層級(jí)服務(wù)的。
3.2數(shù)字圖書(shū)館的建設(shè)研究
在理清未來(lái)大數(shù)據(jù)背景下數(shù)字圖書(shū)館向數(shù)據(jù)圖書(shū)館的發(fā)展方向后,如何建設(shè)未來(lái)數(shù)字圖書(shū)館是數(shù)字圖書(shū)館建設(shè)的主要問(wèn)題。筆者通過(guò)國(guó)內(nèi)外各相關(guān)文獻(xiàn)總結(jié)出以下未來(lái)大數(shù)據(jù)數(shù)字圖書(shū)館建設(shè)過(guò)程中存在的問(wèn)題及解決方法。
(1)跳出傳統(tǒng)圖書(shū)館的思維框架,創(chuàng)建大數(shù)據(jù)思維的數(shù)據(jù)圖書(shū)館。行動(dòng)上想有所轉(zhuǎn)變,首先應(yīng)該在思想上有所轉(zhuǎn)變。其實(shí),大數(shù)據(jù)時(shí)代最重要的并不是大數(shù)據(jù)本身,因?yàn)殡s亂無(wú)章的數(shù)據(jù)并沒(méi)有任何價(jià)值。大數(shù)據(jù)時(shí)代最重要的應(yīng)該是大數(shù)據(jù)思維。傳統(tǒng)的數(shù)字圖書(shū)館實(shí)質(zhì)上在其思維框架上并沒(méi)有脫離原有的實(shí)體圖書(shū)館的思維模式,其設(shè)計(jì)與建設(shè)只是將從前到圖書(shū)館內(nèi)查找圖書(shū)的方式轉(zhuǎn)變?yōu)橥ㄟ^(guò)網(wǎng)絡(luò)查找,被查找的書(shū)目由紙質(zhì)版變?yōu)殡娮訒?shū)。而大數(shù)據(jù)時(shí)代就是要打破傳統(tǒng)的數(shù)字圖書(shū)館的這種被動(dòng)提供資源的形式,而是根據(jù)海量數(shù)據(jù)的有效提取、處理及分析轉(zhuǎn)變?yōu)橹鲃?dòng)地運(yùn)行模式。當(dāng)然,大數(shù)據(jù)思維在數(shù)字圖書(shū)館的建設(shè)上并不僅僅局限于此,更多的數(shù)字圖書(shū)館的工作(如出版等)都可以用大數(shù)據(jù)思維進(jìn)行思考,并進(jìn)行改善。
(2)提供專業(yè)有效的大數(shù)據(jù)技術(shù)支持。大數(shù)據(jù)背景下的數(shù)字圖書(shū)館建設(shè)是絕對(duì)離不開(kāi)專業(yè)的、有效的大數(shù)據(jù)技術(shù)支持的。離開(kāi)了大數(shù)據(jù)技術(shù)的支持,大數(shù)據(jù)思維將永遠(yuǎn)停留在“想”的階段,只有在大數(shù)據(jù)的技術(shù)支持下行之有效的運(yùn)行才會(huì)實(shí)現(xiàn)大數(shù)據(jù)背景下數(shù)字圖書(shū)館的真正轉(zhuǎn)型,實(shí)現(xiàn)大數(shù)據(jù)背景下數(shù)字圖書(shū)館建設(shè)的“想與做”的結(jié)合。一般而言,計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)專業(yè)的人員是大數(shù)據(jù)技術(shù)人員的首選,結(jié)合上文,無(wú)論是大數(shù)據(jù)的收集與存儲(chǔ)、處理與分析都離不開(kāi)以上兩種學(xué)科的支持。
(3)提升數(shù)字圖書(shū)館工作人員個(gè)人素質(zhì)。這里提升的素質(zhì)主要是指加強(qiáng)圖書(shū)館工作人員的大數(shù)據(jù)思維培養(yǎng)。無(wú)論多么便利的工具,只有在正確的使用下,才能充分發(fā)揮其效能。相對(duì)于大數(shù)據(jù)而言,人的因素才是主動(dòng)因素。這里我們不要求普通的圖書(shū)館工作人員要向計(jì)算機(jī)科學(xué)與統(tǒng)計(jì)學(xué)等專業(yè)人員一樣在大數(shù)據(jù)的應(yīng)用中創(chuàng)造技術(shù),但我們需要這些工作人員能夠掌握大數(shù)據(jù)思維,且能夠熟練運(yùn)用數(shù)字圖書(shū)館中各種數(shù)據(jù)的分析工具與軟件,能夠充分掌握?qǐng)D書(shū)館中各種數(shù)據(jù)資源,這才是未來(lái)數(shù)字圖書(shū)館在大數(shù)據(jù)背景下發(fā)展為數(shù)據(jù)圖書(shū)館的有力保障。
注釋:
①計(jì)算機(jī)信息技術(shù)用于計(jì)量存儲(chǔ)容量和傳輸容量的一種計(jì)量單位(Byte),其換算公式為:1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB,1GB=1024MB,1MB=1024KB,1KB=1024Byte。
參考文獻(xiàn):
[1]大數(shù)據(jù)[EB/OL].百度百科.
[2]譚影虹.從數(shù)字圖書(shū)館到數(shù)據(jù)圖書(shū)館——大數(shù)據(jù)時(shí)代的圖書(shū)館服務(wù)范式轉(zhuǎn)變[J].圖書(shū)與情報(bào),2016(3).
[3]盤(pán)點(diǎn)中國(guó)2013行業(yè)數(shù)據(jù)量[EB/0L].百度文庫(kù).
[4]張穎.大學(xué)生圖書(shū)館使用情況調(diào)查與研究——以A校為例[J].青年文學(xué)家,2014(6):182.
[5]關(guān)于圖書(shū)館利用狀況的調(diào)查報(bào)告[EB/OL].百度文庫(kù).
[6]和婷.大數(shù)據(jù)思維對(duì)圖書(shū)館信息服務(wù)工作的啟示[J].圖書(shū)館建設(shè),2014(1).
[7]朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書(shū)館的挑戰(zhàn)及其應(yīng)對(duì)策略[J].現(xiàn)代情報(bào),2013,33(5).
[8]蘇新寧.大數(shù)據(jù)時(shí)代數(shù)字圖書(shū)館面臨的機(jī)遇和挑戰(zhàn)[J].探索交流,220.
[9]陳傳夫,錢(qián)鷗,代鈺珠.大數(shù)據(jù)時(shí)代的數(shù)字圖書(shū)館建設(shè)研究[J].圖書(shū)情報(bào)工作,2014,58(4).
[10]Tony H.,Stewart T.,Kristin T. Thefourth paradigm: Dataintensivescientific discover[M].Washington: MicrosoftResearch, 2009.
Abstract:The arrival of big data era makes the “data” become an indispensible production factor which all walks of life have to consider. In the library industry, though the “digital library” is still a new concept, considering its developing trend, the “data” should be the key to the construction of the digital library in the big data era. With the era of big data coming, the understanding of big data and big data thinking is conducive to the creation of the product and mode which meet the needs of the times in terms of data exploration, data processing and data service in the construction process of digital library.
Key words:big data; big data thinking; digital library; data library
(責(zé)任編輯:陳樹(shù))
黑龍江教育學(xué)院學(xué)報(bào)2017年4期