劉曉英 文庭孝
(1.中南大學(xué)圖書館醫(yī)學(xué)分館 湖南長(zhǎng)沙 410013;2.中南大學(xué)醫(yī)藥信息系 湖南長(zhǎng)沙 410013)
“大數(shù)據(jù)”(Big Data)是繼“云計(jì)算”之后IT行業(yè)最熱的詞匯。美國(guó)麥肯錫咨詢公司最早提出“大數(shù)據(jù)”的概念,在IT行業(yè)和商業(yè)領(lǐng)域掀起了大數(shù)據(jù)狂潮。[1]2012年2月,奧巴馬政府宣布推出“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,并于3月29日在美國(guó)白宮網(wǎng)站發(fā)布《大數(shù)據(jù)研究和發(fā)展倡議》,在政府管理和社會(huì)應(yīng)用領(lǐng)域掀起了大數(shù)據(jù)巨浪。[2-5]正如Steve Lohr在給美國(guó)紐約時(shí)報(bào)撰寫的《大數(shù)據(jù)時(shí)代(The Age of Big Data)》[6]一文中宣布的那樣:大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨!
大數(shù)據(jù)的核心是數(shù)據(jù)集成和數(shù)據(jù)管理,在“大數(shù)據(jù)”時(shí)代,數(shù)據(jù)即資源、數(shù)據(jù)即財(cái)富、數(shù)據(jù)即資產(chǎn)已并非虛言,數(shù)據(jù)、信息已經(jīng)成為組織重要的資產(chǎn)。如何充分利用歷史的和每天產(chǎn)生的海量數(shù)據(jù)、信息,如何處理和存儲(chǔ)這些寶貴的資源,如何從海量數(shù)據(jù)中提取有價(jià)值的信息,如何將數(shù)據(jù)、信息轉(zhuǎn)化為有用的知識(shí)和規(guī)則,對(duì)于組織的生存與發(fā)展至關(guān)重要,對(duì)于提升組織的核心能力和競(jìng)爭(zhēng)優(yōu)勢(shì)至關(guān)重要。而要從大數(shù)據(jù)和海量數(shù)據(jù)中提取有價(jià)值的信息,并加以利用,就必須實(shí)行數(shù)據(jù)開放、信息公開,將分散分布、零碎存在的數(shù)據(jù)和信息融合成完整的“大數(shù)據(jù)”。
隨著互聯(lián)網(wǎng)的高速發(fā)展,信息呈爆炸式增長(zhǎng),需用“大數(shù)據(jù)或者海量數(shù)據(jù)”來(lái)描述現(xiàn)有信息和數(shù)據(jù)量。Gartner(高德納)公司研究認(rèn)為,新產(chǎn)生的數(shù)據(jù)量每年以至少50%的速度遞增,使得每年新增的數(shù)據(jù)量不到兩年就翻一番。Cisco(思科)公司在一份報(bào)告中推測(cè)2015年僅移動(dòng)數(shù)據(jù)量將會(huì)突破每月6EB,等于60億GB。而IDC最新的數(shù)據(jù)預(yù)計(jì),到2020年,世界上的數(shù)據(jù)存儲(chǔ)總量將達(dá)到35ZB,等于35萬(wàn)億GB。[7]
“大數(shù)據(jù)”是一場(chǎng)數(shù)據(jù)革命,也是一場(chǎng)思維變革,已經(jīng)在政府管理、商業(yè)經(jīng)營(yíng)、醫(yī)療衛(wèi)生、交通運(yùn)輸?shù)阮I(lǐng)域得到廣泛應(yīng)用,它將對(duì)我們的工作、生活和思維產(chǎn)生巨大的影響,“大數(shù)據(jù)”正在改變政府、商業(yè)以及我們的生活方式。
1.1.1 從實(shí)踐進(jìn)展來(lái)看。大數(shù)據(jù)最早源于IT領(lǐng)域的數(shù)據(jù)存儲(chǔ)和處理,如云計(jì)算和云平臺(tái)、數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)等。繼而用于商業(yè)領(lǐng)域數(shù)據(jù)關(guān)聯(lián)、產(chǎn)品關(guān)聯(lián)和用戶行為等分析,如零售巨人沃爾瑪從數(shù)據(jù)中發(fā)現(xiàn)啤酒與尿布、蛋撻與颶風(fēng)用品的神奇關(guān)聯(lián);谷歌的信息關(guān)聯(lián)搜索和數(shù)據(jù)圖書館;亞馬遜的圖書關(guān)聯(lián)推薦;IBM開發(fā)出基于大數(shù)據(jù)的汽車預(yù)測(cè)模型;蘋果從“潛在”數(shù)據(jù)中挖掘信息價(jià)值;銀行、電信和保險(xiǎn)業(yè)通過(guò)用戶信息和交易記錄分析來(lái)提高利潤(rùn)、降低風(fēng)險(xiǎn)等等。之后受到政府管理、醫(yī)療衛(wèi)生、交通管理、科學(xué)研究等領(lǐng)域的重視,如美國(guó)政府面對(duì)大數(shù)據(jù)挑戰(zhàn)提出的“數(shù)據(jù)開放”政策和“數(shù)據(jù)民主”政府;醫(yī)療衛(wèi)生領(lǐng)域通過(guò)大數(shù)據(jù)進(jìn)行流感預(yù)測(cè)、疾病診斷、手術(shù)成功率預(yù)測(cè)、用藥效果監(jiān)測(cè)以及健康信息共享;交通領(lǐng)域基于GPS大數(shù)據(jù)的路面生命周期預(yù)測(cè)、交通線路選擇和交通事故處理;科學(xué)研究領(lǐng)域利用大數(shù)據(jù)進(jìn)行知識(shí)發(fā)現(xiàn)和尋找前沿領(lǐng)域[8-10]等等?;诖髷?shù)據(jù)的關(guān)聯(lián)分析、數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)在實(shí)踐中顯示出巨大的價(jià)值和作用。
1.1.2 從研究領(lǐng)域來(lái)看。國(guó)外大數(shù)據(jù)研究主要集中在IT領(lǐng)域、商業(yè)領(lǐng)域、公共領(lǐng)域和科研領(lǐng)域等,正在向各行各業(yè)和各學(xué)科領(lǐng)域拓展。IT領(lǐng)域主要從技術(shù)、算法、模型和實(shí)現(xiàn)等角度研究大數(shù)據(jù),其中有關(guān)云計(jì)算、數(shù)據(jù)處理、數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)等的研究最引人注目。2011年,IBM指出了“大數(shù)據(jù)”的四大特征,即“4V”特征(Volume,大量化;Variety,多樣化;Velocity,快速化;Value,價(jià)值)。Gartner公司在其2012年的研究報(bào)告中指出,大數(shù)據(jù)挖掘?qū)⑹俏磥?lái)10年內(nèi)IT領(lǐng)域最重要的技術(shù)之一。[11]商業(yè)領(lǐng)域的研究主要通過(guò)數(shù)據(jù)關(guān)聯(lián)分析來(lái)發(fā)現(xiàn)信息的價(jià)值。英國(guó)著名學(xué)者維克托·邁爾-舍恩伯格與肯尼斯·庫(kù)克耶最早對(duì)大數(shù)據(jù)進(jìn)行系統(tǒng)研究,并于2013年1月出版了《大數(shù)據(jù)時(shí)代》一書,系統(tǒng)總結(jié)了大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用,指出了大數(shù)據(jù)引發(fā)的思維變革和商業(yè)變革。[12]公共管理領(lǐng)域的研究主要是通過(guò)數(shù)據(jù)挖掘和數(shù)據(jù)關(guān)聯(lián)分析來(lái)提升公共服務(wù)質(zhì)量和加強(qiáng)社會(huì)管理能力。旅美學(xué)者涂子沛出版了《大數(shù)據(jù)》一書,從技術(shù)、政治、商業(yè)三個(gè)角度描述了大數(shù)據(jù)在美國(guó)政府管理應(yīng)用中的經(jīng)驗(yàn)和實(shí)踐,反映了美國(guó)政府的數(shù)據(jù)開放創(chuàng)新過(guò)程。[13]歐洲新聞學(xué)中心(European Journalism Centre)和開放知識(shí)基金會(huì)(Open Knowledge Foundation)于2012年共同開發(fā)了一本《數(shù)據(jù)新聞學(xué)手冊(cè)》,旨在推動(dòng)全球數(shù)據(jù)新聞學(xué)的研究和發(fā)展。2012年,陶氏基金會(huì)和奈特基金會(huì)宣布提供20億美元用于資助哥倫比亞大學(xué)新聞學(xué)院的數(shù)據(jù)新聞學(xué)研究。2011年,麥肯錫公司在其全球研究報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》中詳細(xì)介紹了醫(yī)療健康領(lǐng)域中信息化和大數(shù)據(jù)應(yīng)用的發(fā)展趨勢(shì)。公共健康領(lǐng)域的研究者越來(lái)越多地采用地理信息系統(tǒng)(GIS)來(lái)分析人們所處的環(huán)境及其影響。國(guó)外目前主要從技術(shù)和應(yīng)用角度研究大數(shù)據(jù),理論研究、系統(tǒng)研究和綜合研究不多。
1.1.3 從數(shù)字資源融合研究現(xiàn)狀來(lái)看。最早是集成,而后是整合,繼而是融合?;跀?shù)字資源整合、集成和共享的數(shù)字資源融合的相關(guān)研究已經(jīng)十分豐富和成熟,如數(shù)字資源集成,以數(shù)字圖書館、跨庫(kù)檢索系統(tǒng)、數(shù)據(jù)庫(kù)集成系統(tǒng)、搜索引擎等為代表;數(shù)字資源整合、共享與服務(wù),以文獻(xiàn)資源保障體系、圖書館聯(lián)盟、數(shù)字資源共享等為代表。[14-15]無(wú)論是數(shù)字資源集成,還是數(shù)字資源整合、共享,目前都沒(méi)有有效地解決數(shù)據(jù)資源的分散分布、重復(fù)建設(shè)、利益沖突及低效利用等問(wèn)題,數(shù)據(jù)開放、信息公開、資源融合、無(wú)縫聯(lián)結(jié)是未來(lái)發(fā)展的必然趨勢(shì),數(shù)字資源有效利用才是目的。為解決這些問(wèn)題,第十五屆國(guó)際信息融合會(huì)議將于2013年12月在奧地利維也納舉行?!按髷?shù)據(jù)”開啟了數(shù)字資源融合的新方向。
我國(guó)從2011年開始引入“大數(shù)據(jù)”,很快成為繼“云計(jì)算”之后的另一個(gè)關(guān)注熱點(diǎn)。我國(guó)的大數(shù)據(jù)研究以翻譯和介紹國(guó)外研究成果為主,處于研究的初級(jí)階段,并且常常和云計(jì)算研究結(jié)合在一起。翻譯的著作以《大數(shù)據(jù)時(shí)代》(維克托·邁爾-舍恩伯格和肯尼斯·庫(kù)克耶,2013)、《駕馭大數(shù)據(jù)》(弗蘭克斯,2013)和《大數(shù)據(jù)》(涂子沛,2012)等為代表,在國(guó)內(nèi)影響較大。隨后,國(guó)內(nèi)也相繼出版了一些關(guān)于大數(shù)據(jù)研究的著作,如《大數(shù)據(jù)》(郭曉科,2013)、《大數(shù)據(jù)挖掘》(譚磊,2013)、《大數(shù)據(jù)的力量》(郭昕、孟曄,2013)、《大數(shù)據(jù)戰(zhàn)略·技術(shù)·實(shí)踐》(周寶曜、劉偉、范承工,2013)、《大數(shù)據(jù)時(shí)代的歷史機(jī)遇:產(chǎn)業(yè)變革與數(shù)據(jù)科學(xué)》(趙國(guó)棟等,2013)等,這些著作主要是從技術(shù)和應(yīng)用角度對(duì)“大數(shù)據(jù)”進(jìn)行了系統(tǒng)介紹。相關(guān)研究論文主要從大數(shù)據(jù)的意義、作用、影響、技術(shù)、應(yīng)用等方面進(jìn)行介紹,真正意義上的學(xué)術(shù)研究和應(yīng)用研究很少。
有關(guān)數(shù)字資源融合的研究也主要體現(xiàn)在數(shù)據(jù)融合及信息資源整合、集成和共享與服務(wù)等方面。我國(guó)數(shù)據(jù)資源融合與服務(wù)始于20世紀(jì)末,相關(guān)研究論文逐年增長(zhǎng)。信息融合與服務(wù)研究興于2000年左右,相關(guān)研究論文勻速增長(zhǎng),而信息資源融合并未引起關(guān)注。信息集成與服務(wù)研究始于2000年左右,2005年后逐漸冷卻。信息共享、信息資源共享與服務(wù)研究興起稍晚于信息集成與服務(wù),迅速成為研究熱點(diǎn),2010年之后關(guān)注開始下降。信息整合、信息資源整合與服務(wù)研究也同時(shí)興起。從整體來(lái)看,目前國(guó)內(nèi)將“大數(shù)據(jù)”與“數(shù)據(jù)和信息資源融合、整合、集成、共享與服務(wù)”兩者結(jié)合起來(lái)的研究還極少,研究者們幾乎沒(méi)有將融合與整合、集成、共享明確區(qū)分,而是混合使用。
數(shù)字資源融合是指從時(shí)間上融合過(guò)去、現(xiàn)在及未來(lái)數(shù)據(jù)資源,從空間上融合不同區(qū)域和不同行業(yè)領(lǐng)域數(shù)據(jù)資源,將信息和數(shù)據(jù)資源組成一個(gè)完整的有機(jī)整體進(jìn)行開發(fā)利用,獲得更多更大的價(jià)值。數(shù)字資源融合是數(shù)字資源的全面開放、無(wú)縫聯(lián)結(jié)、高度集成、即時(shí)共享,跨越時(shí)空和主體界線,將數(shù)據(jù)資源組合成一個(gè)有機(jī)整體。
在大數(shù)據(jù)時(shí)代,分散分布與零碎存在的數(shù)據(jù)和小數(shù)據(jù)意義不大,而“大數(shù)據(jù)”才有價(jià)值。封閉的“數(shù)據(jù)孤島”、“信息孤島”難以發(fā)揮作用,數(shù)據(jù)開放、數(shù)據(jù)集成、數(shù)據(jù)共享、數(shù)據(jù)融合是大趨勢(shì)。在大數(shù)據(jù)時(shí)代,只有“活”的數(shù)字資源才是資產(chǎn),圖書館等信息機(jī)構(gòu)要么主動(dòng)融合數(shù)字資源并組織開發(fā)利用大數(shù)據(jù)的價(jià)值,要么被融合,沒(méi)有其他選擇。
從大數(shù)據(jù)的基本要求來(lái)看,目前圖書館等信息機(jī)構(gòu)的數(shù)字資源融合迫切需要研究和解決的問(wèn)題如下:(1)大數(shù)據(jù)時(shí)代圖書館等信息機(jī)構(gòu)所擁有的數(shù)字資源及其特征。重點(diǎn)需要確定圖書館等信息機(jī)構(gòu)有哪些“大數(shù)據(jù)”,這些大數(shù)據(jù)有何特征,如用戶大數(shù)據(jù)、館藏資源大數(shù)據(jù)等[16]。(2)大數(shù)據(jù)時(shí)代圖書館等信息機(jī)構(gòu)的數(shù)字資源服務(wù)。如何通過(guò)數(shù)字資源融合形成大數(shù)據(jù)來(lái)開發(fā)利用數(shù)字資源,并提供服務(wù),是大數(shù)據(jù)時(shí)代數(shù)字資源融合研究的目的。(3)大數(shù)據(jù)時(shí)代圖書館等信息機(jī)構(gòu)的數(shù)字資源融合及服務(wù)模式。大數(shù)據(jù)背景下圖書館等信息機(jī)構(gòu)的數(shù)字資源融合及服務(wù)模式可分為三個(gè)層次,即數(shù)據(jù)融合模式或資源融合模式、平臺(tái)融合模式、服務(wù)融合模式,以及基于大數(shù)據(jù)和云計(jì)算的數(shù)字資源融合與服務(wù)模式,這些模式如何運(yùn)作還需要進(jìn)一步研究。(4)大數(shù)據(jù)時(shí)代圖書館等信息機(jī)構(gòu)的數(shù)字資源融合及服務(wù)平臺(tái)構(gòu)建。需要以數(shù)字資源融合與服務(wù)模式為基礎(chǔ)構(gòu)建模型和平臺(tái),設(shè)計(jì)平臺(tái)實(shí)現(xiàn)方案,為數(shù)字資源融合與服務(wù)在信息機(jī)構(gòu)的實(shí)現(xiàn)提供指導(dǎo)。國(guó)外圖書館、檔案館、博物館的數(shù)字資源整合實(shí)踐與研究為我們提供了經(jīng)驗(yàn)和依據(jù)[17]。(5)大數(shù)據(jù)時(shí)代圖書館等信息機(jī)構(gòu)數(shù)字資源融合及服務(wù)對(duì)策。需要解決大數(shù)據(jù)背景下實(shí)現(xiàn)數(shù)字資源融合可持續(xù)發(fā)展的資源保障、制度保障、組織保障和運(yùn)行機(jī)制等。
根據(jù)全球大數(shù)據(jù)實(shí)踐的基本現(xiàn)狀來(lái)看,大數(shù)據(jù)管理需要解決三個(gè)核心問(wèn)題,即大數(shù)據(jù)采集與處理(數(shù)據(jù)問(wèn)題)、大數(shù)據(jù)基礎(chǔ)設(shè)施(技術(shù)問(wèn)題)、大數(shù)據(jù)分析與應(yīng)用(利用問(wèn)題),[18]因此數(shù)字資源融合實(shí)現(xiàn)的基本模式可以分為三個(gè)層次,即數(shù)據(jù)融合層、平臺(tái)融合層和服務(wù)融合層。如圖1所示。
圖1 大數(shù)據(jù)環(huán)境下數(shù)字資源融合的基本模式
數(shù)據(jù)融合層需要通過(guò)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)解決異質(zhì)異構(gòu)異地?cái)?shù)據(jù)的開放存取問(wèn)題。數(shù)據(jù)開放和數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)資源融合的基礎(chǔ)和關(guān)鍵,公共管理部門和企事業(yè)單位是數(shù)據(jù)的最大擁有者,如何平衡數(shù)據(jù)資源的利益相關(guān)者,開放數(shù)字資源形成大數(shù)據(jù),并解決大數(shù)據(jù)利用帶來(lái)的價(jià)值分配問(wèn)題,需要法律、政策和制度依據(jù)。數(shù)據(jù)融合的最終實(shí)現(xiàn)還需要構(gòu)建一個(gè)多中心多層級(jí)的中央數(shù)據(jù)平臺(tái),分別存放各個(gè)數(shù)據(jù)主體和各行業(yè)領(lǐng)域的數(shù)據(jù)。
基礎(chǔ)設(shè)施是大數(shù)據(jù)管理和數(shù)字資源融合的平臺(tái)和技術(shù)基礎(chǔ),大數(shù)據(jù)的利用和數(shù)字資源融合的實(shí)現(xiàn)歸根到底還是一個(gè)信息技術(shù)問(wèn)題。數(shù)字資源融合平臺(tái)需要解決數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)集成、數(shù)據(jù)共享、數(shù)據(jù)傳輸、數(shù)據(jù)安全、數(shù)據(jù)利用等實(shí)現(xiàn)的相關(guān)標(biāo)準(zhǔn)和技術(shù)手段。如何將最新的網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、云計(jì)算技術(shù)、數(shù)據(jù)挖掘技術(shù)、知識(shí)發(fā)現(xiàn)技術(shù)等用于數(shù)字資源平臺(tái)構(gòu)建是實(shí)現(xiàn)數(shù)字資源融合的核心。
大數(shù)據(jù)和數(shù)字資源的開發(fā)利用,為管理和決策提供一站式綜合服務(wù)是數(shù)字資源融合的根本目的。以數(shù)據(jù)資源為基礎(chǔ),以基礎(chǔ)設(shè)施為平臺(tái),可以進(jìn)行數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)、關(guān)聯(lián)分析等,為用戶提供數(shù)據(jù)定制服務(wù)、個(gè)性化數(shù)據(jù)服務(wù)等,完成數(shù)字資源融合的最終目標(biāo)。
在大數(shù)據(jù)和云計(jì)算背景下,研究信息機(jī)構(gòu)的數(shù)字資源融合及服務(wù)問(wèn)題突破了傳統(tǒng)信息資源整合、集成與共享等研究局限與缺陷,是重要的突破和創(chuàng)新,需要理論依據(jù)、實(shí)踐證明和價(jià)值現(xiàn)實(shí)。首先需要從理論上尋找大數(shù)據(jù)背景下數(shù)據(jù)開放、信息公開、資源融合、無(wú)縫聯(lián)結(jié)等的科學(xué)依據(jù),并有效地解決傳統(tǒng)環(huán)境下存在的數(shù)據(jù)資源和信息資源分散分布、重復(fù)建設(shè)、利益沖突及低效利用等問(wèn)題。其次需要從實(shí)踐上探索大數(shù)據(jù)時(shí)代信息機(jī)構(gòu)數(shù)字資源融合與服務(wù)的框架和模式,并構(gòu)建相應(yīng)的資源融合平臺(tái)框架模型,為信息機(jī)構(gòu)的數(shù)字資源開發(fā)利用與服務(wù)提供新思路,證明其實(shí)踐中實(shí)現(xiàn)和實(shí)施的可能性和可行性。最后需要通過(guò)理論、實(shí)踐和應(yīng)用研究為信息機(jī)構(gòu)在大數(shù)據(jù)背景下實(shí)現(xiàn)數(shù)字資源融合與服務(wù)提供指導(dǎo),同時(shí)研究其可持續(xù)發(fā)展的資源保障、制度保障、組織保障和運(yùn)行機(jī)制,發(fā)揮信息機(jī)構(gòu)的優(yōu)勢(shì)和特色,提升信息機(jī)構(gòu)在大數(shù)據(jù)時(shí)代的社會(huì)地位和影響,尋求其現(xiàn)實(shí)作用和價(jià)值實(shí)現(xiàn)。
大數(shù)據(jù)背景下的數(shù)字資源融合實(shí)現(xiàn)面臨著諸多問(wèn)題,包括:
4.2.1 觀念問(wèn)題。數(shù)字資源融合涉及的觀念問(wèn)題包括數(shù)字資源保護(hù)問(wèn)題和數(shù)字資源利用問(wèn)題等。一方面,數(shù)據(jù)即資產(chǎn)、核心數(shù)據(jù)資源即核心競(jìng)爭(zhēng)優(yōu)勢(shì)已成為共識(shí);另一方面,數(shù)據(jù)閑置即浪費(fèi)、分散與零碎數(shù)據(jù)和小數(shù)據(jù)無(wú)意義、“大數(shù)據(jù)”才有價(jià)值、數(shù)據(jù)開放是大趨勢(shì)已深入人心。如何解決數(shù)據(jù)資源保護(hù)和利用的平衡點(diǎn)和有效邊界是數(shù)字資源融合需要突破的觀念問(wèn)題。
4.2.2 技術(shù)問(wèn)題。數(shù)字資源融合涉及的技術(shù)問(wèn)題主要包括數(shù)據(jù)存儲(chǔ)容量問(wèn)題、數(shù)據(jù)標(biāo)準(zhǔn)問(wèn)題、數(shù)據(jù)安全問(wèn)題、數(shù)據(jù)保存問(wèn)題等。數(shù)據(jù)存儲(chǔ)容量問(wèn)題是指大數(shù)據(jù)中的“大容量”通??蛇_(dá)到PB級(jí)的數(shù)據(jù)規(guī)模,海量數(shù)據(jù)存儲(chǔ)系統(tǒng)一定要有相應(yīng)等級(jí)的擴(kuò)展能力;數(shù)據(jù)標(biāo)準(zhǔn)問(wèn)題是指異質(zhì)異構(gòu)異地?cái)?shù)字資源的兼容與共享;數(shù)據(jù)安全問(wèn)題是指某些特殊行業(yè)的數(shù)據(jù)資源應(yīng)用技術(shù)設(shè)備等都有特殊的安全要求,比如金融數(shù)據(jù)、醫(yī)療信息以及政府情報(bào)等都有自己的安全標(biāo)準(zhǔn)和保密性需求;數(shù)據(jù)保存問(wèn)題是指數(shù)字資源保存和積累的時(shí)間要求與量的要求,不同類型的數(shù)字資源保存期限要求不同,不同領(lǐng)域的大數(shù)據(jù)分析需要積累量的要求不同等等。
4.2.3 經(jīng)濟(jì)問(wèn)題。大數(shù)據(jù)管理和數(shù)字資源融合的經(jīng)濟(jì)問(wèn)題包括成本控制問(wèn)題、成本分?jǐn)倖?wèn)題、利益分配問(wèn)題等。成本控制問(wèn)題不僅涉及數(shù)據(jù)采集、處理、存儲(chǔ)和利用等,還涉及人力、設(shè)備和利用效率;成本分?jǐn)倖?wèn)題涉及數(shù)字資源融合實(shí)現(xiàn)過(guò)程中各方參與主體的投入問(wèn)題,包括數(shù)據(jù)、人、財(cái)、設(shè)備等的投入成本;利益分配問(wèn)題指數(shù)字資源融合帶來(lái)的收益分配問(wèn)題。
4.2.4 法律問(wèn)題。數(shù)字資源融合的實(shí)現(xiàn)還需要從、法律層面解決出現(xiàn)的各種問(wèn)題,包括參與各方的權(quán)利和義務(wù)、數(shù)字資源的版權(quán)保護(hù)、數(shù)字資源安全、數(shù)據(jù)和平臺(tái)管理、成本分?jǐn)偤屠嫫胶獾取?/p>
(來(lái)稿時(shí)間:2014年6月)
1.陸靜.我國(guó)圖書館界大數(shù)據(jù)研究評(píng)述與展望.圖書館雜志,2014(1):20-25
2.Executive Office of the President. Big Data Across the Federal Government.[2014-04-20].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sheet_final.pdf
3.Executive Office of the President. Obama Administration Unveils “Big Data” Initiative: Announces$200 Milion in New R&D Investments.[2014-04-20].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release_final_2.pdf
4.Steve Lohr. The Age of Big Data.[2014-04-20].http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-inthe-world.html
6,8.郭曉科.大數(shù)據(jù).北京:清華大學(xué)出版社,2013
5,7,10,11.譚磊.大數(shù)據(jù)挖掘.北京:電子工業(yè)出版社,2013
9,12.(英)維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代.盛楊燕,周濤,譯.杭州:浙江人民出版社,2013
13.涂子沛.大數(shù)據(jù).桂林:廣西師范大學(xué)出版社,2012
14.肖希明,唐義.國(guó)外數(shù)字資源整合在多領(lǐng)域的研究進(jìn)展.中國(guó)圖書館學(xué)報(bào),2013(1):1-11
15.程煥文.信息資源共享.北京:高等教育出版社,2004
16.陳超.圖書館如何迎接大數(shù)據(jù)時(shí)代?.圖書館雜志,2014(1):4-7
17.肖希明,鄭燃.國(guó)外圖書館、檔案館、博物館數(shù)字資源整合研究進(jìn)展.中國(guó)圖書館學(xué)報(bào),2012(5):26-39
18.周寶曜,劉偉,范承工.大數(shù)據(jù)戰(zhàn)略·技術(shù)·實(shí)踐.北京:電子工業(yè)出版社,2013