黃鑫 鄧仲華
摘 要:隨著大數(shù)據(jù)時代的來臨,海量科學(xué)數(shù)據(jù)的爆發(fā)使得圖書館科學(xué)數(shù)據(jù)服務(wù)面臨諸多挑戰(zhàn),而“互聯(lián)網(wǎng)+”的提出為圖書館科學(xué)數(shù)據(jù)服務(wù)的發(fā)展提供了思路。在“互聯(lián)網(wǎng)+”視角下,科學(xué)數(shù)據(jù)開發(fā)服務(wù)、科學(xué)數(shù)據(jù)語義檢索服務(wù)、科學(xué)數(shù)據(jù)存儲服務(wù)、科學(xué)數(shù)據(jù)分析服務(wù)、科學(xué)數(shù)據(jù)參考咨詢服務(wù)、科學(xué)數(shù)據(jù)開放存取平臺服務(wù)以及個性化科學(xué)數(shù)據(jù)服務(wù)將成為圖書館科學(xué)數(shù)據(jù)服務(wù)的發(fā)展趨勢。在開展這些數(shù)據(jù)服務(wù)時,需注意個人隱私保障和數(shù)據(jù)安全、數(shù)據(jù)版權(quán)問題。
關(guān)鍵詞:互聯(lián)網(wǎng)+ ;科學(xué)數(shù)據(jù);圖書館;數(shù)據(jù)服務(wù);數(shù)據(jù)密集型科研環(huán)境
中圖分類號: G252 文獻(xiàn)標(biāo)識碼: A DOI:10.11968/tsyqb.1003-6938.2016075
Research on Library Scientific Data Service under the Perspective of “Internet+”
Abstract With the approaching of the big data era, the outbreak of massive scientific data makes library scientific data service faces many challenges, but “Internet+” provides a guideline for the development of library science data service. The features of“Internet+”and library integration are analyzed at first, then the status of library science data services development is summarized, and finally these features are used to research into the library science data service under the perspective of“Internet+”. The new directions of the library science data service under the perspective of "Internet+" are proposed and some issues are emphasized which need to be solved.
Key words Internet+; scientific data; library; data service; data-intensive research environment
科學(xué)研究正在向數(shù)據(jù)密集型科研轉(zhuǎn)變,科學(xué)數(shù)據(jù)在科學(xué)研究中的地位與日俱增。圖書館作為傳統(tǒng)文獻(xiàn)信息的聚集中心和服務(wù)機構(gòu),提出了科學(xué)數(shù)據(jù)服務(wù)的概念,即圖書館提供給研究者的科學(xué)數(shù)據(jù)相關(guān)服務(wù)?,F(xiàn)有的圖書館科學(xué)數(shù)據(jù)服務(wù)在數(shù)據(jù)資源、硬件基礎(chǔ)設(shè)施、數(shù)據(jù)互操作性、數(shù)據(jù)長期保存、服務(wù)受眾和服務(wù)協(xié)同性等方面存在很多難題?!盎ヂ?lián)網(wǎng)+”是李克強總理多次強調(diào),由國務(wù)院認(rèn)定的國家發(fā)展新戰(zhàn)略,其核心理念是跨界融合,萬物相連?!盎ヂ?lián)網(wǎng)+”的提出給圖書館科學(xué)數(shù)據(jù)服務(wù)所面臨的難題提供了新的解決思路,對圖書館科學(xué)數(shù)據(jù)服務(wù)發(fā)展具有重要意義,本文將從“互聯(lián)網(wǎng)+”與圖書館的融合特征入手,探討“互聯(lián)網(wǎng)+”視角下的圖書館科學(xué)數(shù)據(jù)服務(wù)新發(fā)展。
1 “互聯(lián)網(wǎng)+”與圖書館
2015年7月,李克強總理簽批國務(wù)院第40號文件《關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》,由此正式掀起我國各界“互聯(lián)網(wǎng)+”的熱潮[1]?!盎ヂ?lián)網(wǎng)+”的“+”不是行業(yè)間簡單的疊加,而是互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)的深度融合。在公共服務(wù)體系中,互聯(lián)網(wǎng)可以對公共服務(wù)資源進行優(yōu)化和集成,提高公共服務(wù)資源利用率,提升服務(wù)過程的互動性?!盎ヂ?lián)網(wǎng)+”與公共服務(wù)業(yè)的深度融合將引領(lǐng)公共服務(wù)模式創(chuàng)新,形成網(wǎng)絡(luò)經(jīng)濟與實體經(jīng)濟協(xié)同互動的發(fā)展新格局。圖書館“互聯(lián)網(wǎng)+”即是傳統(tǒng)圖書館與互聯(lián)網(wǎng)的深度融合,互聯(lián)網(wǎng)的平等、開放、高效、互動、去中心的特點將對圖書館的資源融合、結(jié)構(gòu)變革、服務(wù)創(chuàng)新具有重要的引導(dǎo)作用,圖書館應(yīng)該積極引入“互聯(lián)網(wǎng)+”的理念,才能適應(yīng)網(wǎng)絡(luò)和信息化時代數(shù)據(jù)的爆發(fā),滿足各類用戶不斷發(fā)展的新需求。“互聯(lián)網(wǎng)+”的跨界連接與融合理念對圖書館發(fā)展的推動作用主要體現(xiàn)在三個方面:(1)資源的融合。傳統(tǒng)的圖書館資源以自身館藏資源為主,以合作共享資源為輔,“互聯(lián)網(wǎng)+”環(huán)境下的圖書館可以實現(xiàn)資源的深度融合和跨界聯(lián)合,深度融合是指圖書館依托互聯(lián)網(wǎng)將館藏的跨學(xué)科、跨領(lǐng)域數(shù)據(jù)和信息資源進行有效集成,進一步方便用戶檢索獲取,跨界聯(lián)合是指圖書館與商業(yè)、政府、公益、醫(yī)療等機構(gòu)的跨界聯(lián)合,以政策和協(xié)議為基礎(chǔ),通過數(shù)據(jù)庫的連接來共享數(shù)據(jù)和信息;(2)組織融合。傳統(tǒng)環(huán)境下的圖書館各機構(gòu)之間大多各司其職,聯(lián)系不夠緊密,而圖書館“互聯(lián)網(wǎng)+”將促進圖書館內(nèi)部各機構(gòu)之間的深層融合連接,館長辦公室、采編、技術(shù)、出版、服務(wù)等機構(gòu)之間以互聯(lián)網(wǎng)為基礎(chǔ)的技術(shù)融合和組織融合在提高館員工作效率、提升服務(wù)質(zhì)量等方面具有重要意義;(3)服務(wù)融合。圖書館“互聯(lián)網(wǎng)+”促進圖書館各類服務(wù)的融合,如文獻(xiàn)檢索服務(wù)和數(shù)據(jù)檢索服務(wù)的融合,圖書館以互聯(lián)網(wǎng)為基礎(chǔ),使用元數(shù)據(jù)制定、統(tǒng)一標(biāo)識符等技術(shù)將館藏文獻(xiàn)和數(shù)據(jù)進行語義集成,用戶在獲取文獻(xiàn)的同時也可以獲取相關(guān)的科學(xué)數(shù)據(jù),服務(wù)融合對提升服務(wù)質(zhì)量、提升用戶體驗等方面具有重要作用。
2 圖書館科學(xué)數(shù)據(jù)服務(wù)的發(fā)展困境
數(shù)據(jù)是科研活動的基礎(chǔ)產(chǎn)出,是科學(xué)出版的重要內(nèi)容,也是科學(xué)研究活動的基本信息資源,類型上包括數(shù)值、事實和文字型數(shù)據(jù)[2]??茖W(xué)數(shù)據(jù)服務(wù)是以科學(xué)數(shù)據(jù)為基礎(chǔ)的服務(wù)方式,類型上包括科學(xué)數(shù)據(jù)開發(fā)服務(wù)、科學(xué)數(shù)據(jù)檢索服務(wù)、科學(xué)數(shù)據(jù)參考咨詢服務(wù)、科學(xué)數(shù)據(jù)計算服務(wù)以及科學(xué)數(shù)據(jù)存儲服務(wù)等??茖W(xué)數(shù)據(jù)服務(wù)的內(nèi)容是向用戶提供所需科學(xué)數(shù)據(jù),目的是協(xié)助用戶開展科學(xué)研究,提高科學(xué)數(shù)據(jù)的利用率??茖W(xué)數(shù)據(jù)服務(wù)是一種跨界服務(wù)、動態(tài)服務(wù)、嵌入服務(wù),既能滿足用戶需求,也符合圖書館等圖書情報機構(gòu)自身發(fā)展的需要,是圖書館一項重要的新興服務(wù)。但是,隨著大數(shù)據(jù)時代的來臨,在數(shù)據(jù)密集型科研范式所帶來的海量科學(xué)數(shù)據(jù)的沖擊下,圖書館科學(xué)數(shù)據(jù)服務(wù)面臨著困境:(1)數(shù)據(jù)資源匱乏。在圖書館館藏資源中,文獻(xiàn)資源仍然占主導(dǎo)地位,數(shù)據(jù)資源的缺乏有很多原因,一是圖書館傳統(tǒng)信息中心的地位被削弱,科研機構(gòu)逐漸建立自己的數(shù)據(jù)倉儲,不再以圖書館作為數(shù)據(jù)存儲中心[3];二是科研人員上傳意愿不足,數(shù)據(jù)是科研人員和科研機構(gòu)的重要戰(zhàn)略資源,具有高價值,數(shù)據(jù)上傳后的安全問題、版權(quán)問題都是阻礙科研人員上傳科學(xué)數(shù)據(jù)的重要因素[4];(2)缺乏硬件基礎(chǔ)設(shè)施。在大數(shù)據(jù)時代,科學(xué)數(shù)據(jù)正在呈現(xiàn)爆發(fā)式增長,原始科學(xué)數(shù)據(jù)集的采集、傳輸、計算和存儲需要強大的計算中心、高通量網(wǎng)絡(luò)傳輸設(shè)備、大型云存儲中心的支持[5]。圖書館作為科研服務(wù)機構(gòu),理應(yīng)向科研團隊提供科學(xué)大數(shù)據(jù)集的計算和存儲服務(wù),但無論是建設(shè)大型計算中心、云存儲中心還是高通量網(wǎng)絡(luò)傳輸設(shè)施都需要大量資金的支持,這無疑是圖書館數(shù)據(jù)服務(wù)所面臨的困境[7];(3)數(shù)據(jù)長期保存面臨挑戰(zhàn)[8-10]。科學(xué)數(shù)據(jù)的長期保存對于科學(xué)數(shù)據(jù)的復(fù)用、深度挖掘以實現(xiàn)科研創(chuàng)新具有重要意義?,F(xiàn)在,科學(xué)大數(shù)據(jù)呈指數(shù)型增長,大量半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲給圖書館帶來了挑戰(zhàn),數(shù)據(jù)的長期保存難題主要包括兩個方面:一是數(shù)據(jù)篩選難題,并不是所有的科學(xué)數(shù)據(jù)都值得長期保存,如何依托強大的硬件設(shè)施和合理的軟件工具對科學(xué)數(shù)據(jù)進行有效篩選,是圖書館亟待解決的問題;二是數(shù)據(jù)組織難題,多學(xué)科跨領(lǐng)域數(shù)據(jù)繁雜,圖書館缺乏領(lǐng)域?qū)<襾碛行Ч芾砗徒M織科學(xué)數(shù)據(jù);(4)數(shù)據(jù)互操作性不足[11]?,F(xiàn)有的圖書館科學(xué)數(shù)據(jù)缺乏互操作性,一是因為數(shù)據(jù)間的關(guān)聯(lián)不足,現(xiàn)有圖書館的科學(xué)數(shù)據(jù)集大多獨立存儲,數(shù)據(jù)與數(shù)據(jù)之間、數(shù)據(jù)與文獻(xiàn)之間缺乏語義關(guān)聯(lián)。數(shù)據(jù)互操作性的缺失會影響用戶體驗,用戶在訪問某一科學(xué)數(shù)據(jù)集的同時難以依據(jù)語義關(guān)系轉(zhuǎn)向另一相關(guān)數(shù)據(jù)集,同時也不利于圖書館數(shù)據(jù)資源整合,阻礙圖書館的數(shù)據(jù)服務(wù)發(fā)展;二是由于缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)間的格式不統(tǒng)一會阻礙科研進程,不同的數(shù)據(jù)分析軟件對輸入數(shù)據(jù)的格式有著不同的要求,當(dāng)科學(xué)數(shù)據(jù)的格式不能作為數(shù)據(jù)分析軟件的輸入格式,科研工作流的效率就會減緩;三是互操作協(xié)議問題,跨機構(gòu)的科學(xué)數(shù)據(jù)互操作需要合理的協(xié)議來保障,制定數(shù)據(jù)互操作協(xié)議有利于保護數(shù)據(jù)安全和維護各方權(quán)益,對促進跨機構(gòu)科學(xué)數(shù)據(jù)交流良性發(fā)展起重要作用;(5)服務(wù)對象具有局限性[12]?,F(xiàn)有的圖書館科學(xué)數(shù)據(jù)服務(wù)主要對象是科研工作者,服務(wù)目的是支持科研創(chuàng)新。但隨著移動互聯(lián)網(wǎng)的發(fā)展,開放存取理念的普及,高校圖書館的服務(wù)對象不應(yīng)局限于科研工作者,而應(yīng)同時向普通民眾開放,如將科學(xué)數(shù)據(jù)可視化之后向兒童展示以促進科學(xué)啟蒙教育,這在提升科學(xué)數(shù)據(jù)價值,加深科學(xué)研究項目的意義,發(fā)展惠民服務(wù)等方面具有重要意義;(6)服務(wù)缺乏協(xié)作性[13]?,F(xiàn)有的圖書館科學(xué)數(shù)據(jù)服務(wù)缺乏協(xié)作性,多為獨自向用戶提供服務(wù)。如果用戶提出的服務(wù)需求不能被滿足,圖書館大多會轉(zhuǎn)向拒絕服務(wù)而非尋求機構(gòu)協(xié)作來滿足用戶需求。隨著數(shù)據(jù)密集型科研范式的到來,科學(xué)數(shù)據(jù)量的不斷增長,圖書館無法獨自擁有所有的科學(xué)數(shù)據(jù)資源,在數(shù)據(jù)資源、硬件資源、平臺技術(shù)方面轉(zhuǎn)向機構(gòu)協(xié)作是必然的發(fā)展趨勢,如圖書館與圖書館之間的協(xié)作、圖書館與科研機構(gòu)的協(xié)作、圖書館與商業(yè)機構(gòu)的協(xié)作、圖書館與政府機構(gòu)的協(xié)作等。
3 “互聯(lián)網(wǎng)+”視角下的圖書館科學(xué)數(shù)據(jù)服務(wù)
本文將在“互聯(lián)網(wǎng)+”的視角下針對現(xiàn)有科學(xué)數(shù)據(jù)服務(wù)發(fā)展困境探討圖書館科學(xué)數(shù)據(jù)服務(wù)的發(fā)展趨勢,包括基于數(shù)據(jù)資源融合的科學(xué)數(shù)據(jù)開發(fā)服務(wù)、引入數(shù)據(jù)關(guān)聯(lián)技術(shù)的科學(xué)數(shù)據(jù)語義檢索服務(wù)、基于機構(gòu)合作的分布式科學(xué)數(shù)據(jù)存儲服務(wù)、依靠基礎(chǔ)設(shè)施融合的科學(xué)數(shù)據(jù)分析服務(wù)、面向科研創(chuàng)新的科學(xué)數(shù)據(jù)參考咨詢服務(wù)、科學(xué)數(shù)據(jù)開放存取平臺服務(wù)以及基于情景感知與融合的個性化科學(xué)數(shù)據(jù)服務(wù)(見圖1)。
3.1 基于數(shù)據(jù)資源融合的科學(xué)數(shù)據(jù)開發(fā)服務(wù)
科學(xué)數(shù)據(jù)資源的融合對于改善圖書館科學(xué)數(shù)據(jù)資源匱乏的難題具有重要意義。圖書館科學(xué)數(shù)據(jù)開發(fā)服務(wù)是指圖書館對其自身擁有的科學(xué)數(shù)據(jù)和其他合作科研機構(gòu)的科學(xué)數(shù)據(jù)進行統(tǒng)一收集和整理,通過構(gòu)建科學(xué)數(shù)據(jù)共享平臺向用戶提供服務(wù)的過程[14]。如密歇根大學(xué)[15]、加州大學(xué)伯克利分校[16]、麻省理工學(xué)院[17]等國外高校圖書館對學(xué)校內(nèi)各科研機構(gòu)的社會科學(xué)數(shù)據(jù)進行收集和整理后通過服務(wù)平臺統(tǒng)一提供給用戶,科學(xué)數(shù)據(jù)開發(fā)服務(wù)在提高科學(xué)數(shù)據(jù)利用率,方便科研數(shù)據(jù)獲取,提升科研效率方面具有重要意義?,F(xiàn)在,隨著嵌入式服務(wù)和學(xué)科化服務(wù)的發(fā)展,大數(shù)據(jù)時代所帶來的海量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)給圖書館科學(xué)數(shù)據(jù)開發(fā)帶來了巨大的挑戰(zhàn),如何對海量科學(xué)數(shù)據(jù)進行有效的組織是圖書館面臨的難題。不同于傳統(tǒng)圖書館科學(xué)數(shù)據(jù)開發(fā)服務(wù)對各學(xué)科、領(lǐng)域和行業(yè)科學(xué)數(shù)據(jù)資源的簡單疊加,“互聯(lián)網(wǎng)+”要求圖書館對跨學(xué)科、跨領(lǐng)域的科學(xué)數(shù)據(jù)進行更深更廣的有機融合,包括兩個方面:一是技術(shù)融合,以網(wǎng)絡(luò)硬件和軟件為基礎(chǔ),通過元數(shù)據(jù)制定等技術(shù)對不同學(xué)科間、領(lǐng)域間的科學(xué)數(shù)據(jù)進行語義關(guān)聯(lián),更深層次的對科學(xué)數(shù)據(jù)資源進行開發(fā);二是組織融合,通過與科研機構(gòu)、政府機構(gòu)、公益機構(gòu)等組織跨界合作,共享數(shù)據(jù),來實現(xiàn)更廣程度上的科學(xué)數(shù)據(jù)資源開發(fā)。
3.2 引入數(shù)據(jù)關(guān)聯(lián)技術(shù)的科學(xué)數(shù)據(jù)語義檢索服務(wù)
數(shù)據(jù)關(guān)聯(lián)技術(shù)可以有效增強數(shù)據(jù)互操作性?,F(xiàn)在,隨著數(shù)據(jù)在科研活動中的地位和重要性與日俱增,科學(xué)數(shù)據(jù)檢索服務(wù)也逐漸成為圖書館服務(wù)的重要項目,是科研人員獲取所需科學(xué)數(shù)據(jù)的重要渠道,而基于語義的科學(xué)數(shù)據(jù)檢索是發(fā)展趨勢。如大英圖書館使用RDF格式編輯館藏目錄的xml文件,并對外界開放[18];歐洲國家圖書館的European資源門戶通過關(guān)聯(lián)數(shù)據(jù)試點的形式對文本、圖像、視頻和音頻進行關(guān)聯(lián)并向用戶提供開放檢索服務(wù)[19]。另外,德國歐洲分子生物學(xué)實驗室開發(fā)了科學(xué)術(shù)語全自動化標(biāo)注Reflect[20]瀏覽器插件,可以對學(xué)術(shù)文獻(xiàn)中的基因、分子、蛋白質(zhì)等術(shù)語進行語義標(biāo)注,并外鏈至相關(guān)的基因、分子和蛋白質(zhì)數(shù)據(jù)庫。然而,國內(nèi)圖書館在科學(xué)數(shù)據(jù)檢索服務(wù)方面仍然存在一些難題:一是科學(xué)數(shù)據(jù)資源有限,圖書館可供檢索的數(shù)據(jù)資源以自身館藏為主,缺乏與其他科研機構(gòu)的連接;二是檢索技術(shù)有限,可供檢索的科學(xué)數(shù)據(jù)往往是獨立的,缺乏數(shù)據(jù)集之間、數(shù)據(jù)庫之間的映射和連接。“互聯(lián)網(wǎng)+”的理念提供了有效的解決方案,在科學(xué)數(shù)據(jù)檢索資源方面,圖書館與其他科研機構(gòu)、政府機構(gòu)、商業(yè)機構(gòu)、公益機構(gòu)等的跨界合作可以使圖書館脫離依靠自身館藏數(shù)據(jù)提供檢索的局面,在檢索技術(shù)方面,元數(shù)據(jù)描述、數(shù)字對象唯一標(biāo)識符等數(shù)據(jù)關(guān)聯(lián)技術(shù)可以實現(xiàn)科學(xué)數(shù)據(jù)與數(shù)據(jù)、數(shù)據(jù)與文獻(xiàn)之間的連接,圖書館使用SPARQL語言可以實現(xiàn)跨領(lǐng)域間的科學(xué)數(shù)據(jù)語義檢索,URI標(biāo)識的唯一性也可辨識不同領(lǐng)域的同一事物。
3.3 基于機構(gòu)合作的分布式科學(xué)數(shù)據(jù)存儲服務(wù)
基于機構(gòu)合作的分布式科學(xué)數(shù)據(jù)存儲服務(wù)為現(xiàn)有圖書館所面臨的缺乏硬件基礎(chǔ)設(shè)施、數(shù)據(jù)長期保存等難題提供了解決方案。傳統(tǒng)意義上的圖書館科學(xué)數(shù)據(jù)存儲服務(wù)即是建立科學(xué)數(shù)據(jù)倉儲,為科研用戶提供科學(xué)數(shù)據(jù)保存服務(wù)??茖W(xué)數(shù)據(jù)存儲服務(wù)可以實現(xiàn)科學(xué)數(shù)據(jù)的共享和復(fù)用,對于科學(xué)發(fā)現(xiàn)和創(chuàng)新具有重要意義,也是國內(nèi)外各圖書館的重要服務(wù)內(nèi)容。如普渡大學(xué)圖書館則是使用科學(xué)數(shù)據(jù)管理服務(wù)平臺對各領(lǐng)域的科學(xué)數(shù)據(jù)進行統(tǒng)一收集和保存[21];康奈爾大學(xué)圖書館與華盛頓大學(xué)合作建立了Datastar[22]數(shù)據(jù)存儲庫,科研用戶可以選擇上傳自己的科研數(shù)據(jù),該庫試圖收集、分析和比較科研用戶的數(shù)據(jù)偏好,致力于建設(shè)一個基于語義技術(shù)的開放共享數(shù)據(jù)平臺。在傳統(tǒng)互聯(lián)網(wǎng)環(huán)境下,圖書館科學(xué)數(shù)據(jù)存儲以館內(nèi)自建數(shù)據(jù)庫和院系共建數(shù)據(jù)庫為主,主要服務(wù)對象是校內(nèi)科研人員。但隨著數(shù)據(jù)密集型科學(xué)研究范式的興起,海量原始科學(xué)數(shù)據(jù)的爆發(fā)式增長給圖書館帶來了巨大的數(shù)據(jù)存儲壓力,圖書館無法獨自應(yīng)對昂貴的硬件設(shè)備,數(shù)據(jù)的組織、維護、安全等難題?!盎ヂ?lián)網(wǎng)+”視角下的圖書館科學(xué)數(shù)據(jù)存儲形式將是以機構(gòu)合作為基礎(chǔ)的分布式存儲。首先,以機構(gòu)合作為基礎(chǔ)的分布式存儲可以分擔(dān)數(shù)據(jù)存儲硬件設(shè)備的開銷,也可減輕數(shù)據(jù)組織、維護的壓力;其次,基于機構(gòu)合作的分布式科學(xué)數(shù)據(jù)存儲方案可以深化圖書館與其他科研機構(gòu)、政府等機構(gòu)、公益機構(gòu)和商業(yè)機構(gòu)等的合作關(guān)系,將科學(xué)數(shù)據(jù)服務(wù)對象擴大至更多非科研用戶,增加服務(wù)受眾,擴大服務(wù)范圍,進一步實現(xiàn)“互聯(lián)網(wǎng)+”普惠服務(wù);最后,各類跨界機構(gòu)所擁有的領(lǐng)域?qū)<铱梢詫Ω髯灶I(lǐng)域內(nèi)科學(xué)數(shù)據(jù)集進行高效地組織和監(jiān)護,有利于多領(lǐng)域科學(xué)數(shù)據(jù)的長期保存。
3.4 依靠基礎(chǔ)設(shè)施融合的科學(xué)數(shù)據(jù)分析服務(wù)
基礎(chǔ)設(shè)施融合可以解決現(xiàn)有圖書館科學(xué)數(shù)據(jù)服務(wù)缺乏硬件基礎(chǔ)設(shè)施的難題。幾乎所有的科學(xué)研究實驗室都需要通過分析處理數(shù)據(jù)來得到科研成果??茖W(xué)數(shù)據(jù)的分析服務(wù)是科研工作者的重要需求之一。圖書館科學(xué)數(shù)據(jù)的分析服務(wù)是指圖書館向科研用戶提供科學(xué)數(shù)據(jù)的計算、統(tǒng)計等服務(wù),需要一定的軟件工具和硬件設(shè)施為基礎(chǔ)。服務(wù)內(nèi)容包括數(shù)據(jù)抽取、關(guān)聯(lián)分析、聚類分析、可視化分析、統(tǒng)計分析等[23]。如哈佛大學(xué)和麻省理工學(xué)院建立了聯(lián)合數(shù)據(jù)中心Harvard-MIT Data Center,向校內(nèi)科研工作者提供數(shù)據(jù)計算和分析服務(wù),包括硬件基礎(chǔ)設(shè)施服務(wù)和軟件服務(wù)等[24]。隨著科學(xué)研究進入數(shù)據(jù)密集型時代,多個領(lǐng)域的科學(xué)正在從衛(wèi)星、電話、高通設(shè)備、傳感器等數(shù)據(jù)采集設(shè)施獲取海量科學(xué)數(shù)據(jù),這些原始科學(xué)數(shù)據(jù)必須通過計算和分析來實現(xiàn)其價值,科研工作者需要可支持大型數(shù)據(jù)集分析的高性能計算中心來計算和處理科學(xué)數(shù)據(jù)?,F(xiàn)有互聯(lián)網(wǎng)環(huán)境下的圖書館無力獨自建設(shè)高性能計算中心來支持海量科學(xué)數(shù)據(jù)的分析服務(wù),而“互聯(lián)網(wǎng)+”視角下的圖書館科學(xué)數(shù)據(jù)分析服務(wù)可以通過基礎(chǔ)設(shè)施融合來解決這個難題,一方面,圖書館通過與其他科研、商業(yè)、政府等機構(gòu)的合作,簽訂硬件設(shè)備共享協(xié)議來建立更為強大的計算中心,為科研活動帶來足夠的計算能力;另一方面,圖書館可根據(jù)科研用戶的需求收集、購買、自主開發(fā)科學(xué)數(shù)據(jù)分析軟件,然后將學(xué)科內(nèi)、跨學(xué)科的數(shù)據(jù)分析軟件關(guān)聯(lián)起來,實現(xiàn)科研軟件的融合,按照科研活動的生命周期推薦給科研用戶。
3.4 面向科研創(chuàng)新的嵌入式科學(xué)數(shù)據(jù)管理咨詢服務(wù)
“互聯(lián)網(wǎng)+”的跨界融合理念可以增強圖書館科學(xué)數(shù)據(jù)咨詢服務(wù)的協(xié)同性。圖書館科學(xué)數(shù)據(jù)參考咨詢服務(wù)即是圖書館組建科學(xué)數(shù)據(jù)參考咨詢團隊通過非正式科學(xué)交流方式嵌入到科研項目數(shù)據(jù)的規(guī)劃、采集、計算、存檔、發(fā)布和長期保存一系列流程中,幫助用戶解決各種科學(xué)數(shù)據(jù)相關(guān)的問題,以支持科研創(chuàng)新。服務(wù)內(nèi)容主要包括制定數(shù)據(jù)管理規(guī)劃、數(shù)據(jù)發(fā)現(xiàn)與檢索咨詢、數(shù)據(jù)安全及版權(quán)咨詢、數(shù)據(jù)分析軟件開發(fā)、數(shù)據(jù)出版、數(shù)據(jù)政策咨詢等。圖書館科學(xué)數(shù)據(jù)參考咨詢服務(wù)是推動科研創(chuàng)新的重要服務(wù)內(nèi)容,國外開設(shè)科學(xué)數(shù)據(jù)參考咨詢服務(wù)的高校圖書館較為先進,并已建立專門的服務(wù)網(wǎng)頁,有步驟有計劃地引導(dǎo)科研人員在科研活動中進行科學(xué)數(shù)據(jù)管理,麻省理工學(xué)院圖書館社會科學(xué)數(shù)據(jù)中心[17]在網(wǎng)站首頁右側(cè)列出了數(shù)據(jù)管理服務(wù)專家的姓名、肖像照、聯(lián)系方式,用戶可直接點擊“How can I help you”來獲取咨詢服務(wù);耶魯大學(xué)[25]、澳大利亞昆士蘭大學(xué)[26]使用Lib Guides系統(tǒng)來引導(dǎo)用戶制定數(shù)據(jù)管理計劃、數(shù)據(jù)需求和共享等數(shù)據(jù)管理問題。國內(nèi)圖書館在此項服務(wù)上并不完善,多數(shù)圖書館僅在網(wǎng)站上公布了館員的電子郵件或其他聯(lián)系方式,需要用戶主動聯(lián)系咨詢,在與用戶交互方面存在不足?!秶鴦?wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》中指出:互聯(lián)網(wǎng)應(yīng)與公共服務(wù)領(lǐng)域深入融合和創(chuàng)新發(fā)展,創(chuàng)新網(wǎng)絡(luò)化公共服務(wù)模式,大幅提升公共服務(wù)能力[1]。國內(nèi)圖書館的科學(xué)數(shù)據(jù)參考咨詢服務(wù)應(yīng)重視“互聯(lián)網(wǎng)+”指導(dǎo)思想,大力發(fā)展參考咨詢服務(wù)創(chuàng)新,實現(xiàn)服務(wù)思想創(chuàng)新、服務(wù)體系創(chuàng)新和服務(wù)內(nèi)容創(chuàng)新:(1)在服務(wù)思想創(chuàng)新方面,圖書館應(yīng)將傳統(tǒng)被動服務(wù)思想積極轉(zhuǎn)換為主動服務(wù)思想,將傳統(tǒng)獨立服務(wù)思想轉(zhuǎn)換為協(xié)作服務(wù)思想;(2)在服務(wù)體系創(chuàng)新方面,圖書館應(yīng)以互聯(lián)網(wǎng)為基礎(chǔ),一方面,通過開發(fā)科學(xué)交流軟件、建立服務(wù)社區(qū)等方式加深圖書館館員、領(lǐng)域?qū)<?、?shù)據(jù)專家等與科研用戶的融合連接,全面了解科研用戶在科研活動各個階段的不同數(shù)據(jù)需求,并針對性的提供數(shù)據(jù)服務(wù);另一方面,圖書館應(yīng)重視機構(gòu)間協(xié)作服務(wù),積極發(fā)展與其他圖書館、科研、政府和商業(yè)機構(gòu)的深度合作,為科研用戶提供更全面的服務(wù)資源;(3)在服務(wù)內(nèi)容創(chuàng)新方面,增加數(shù)據(jù)引用服務(wù)、數(shù)據(jù)關(guān)聯(lián)服務(wù)等創(chuàng)新服務(wù)內(nèi)容。
3.5 科學(xué)數(shù)據(jù)開放存取平臺服務(wù)
開放存取OA是一種學(xué)術(shù)信息免費共享的理念與出版機制,是指允許用戶不受經(jīng)濟、法律和技術(shù)的限制免費獲取公共網(wǎng)絡(luò)上的論文以進行閱讀、下載、復(fù)制、打印和搜索等[27]?!栋亓中浴分赋鲩_放存取的內(nèi)容不僅包括原始的科學(xué)研究成果,也包括原始的科學(xué)數(shù)據(jù)。科學(xué)數(shù)據(jù)的開放存取在加速科研進程、擴大科學(xué)數(shù)據(jù)影響、提高科研效率、縮短科研數(shù)據(jù)出版時間、提高數(shù)據(jù)引用速度和引用率、提高科學(xué)交流效率等方面具有重要意義。國內(nèi)科學(xué)數(shù)據(jù)開放平臺如中國地質(zhì)科學(xué)院數(shù)據(jù)網(wǎng)[28],集成了中國地質(zhì)科學(xué)院50年來積累的地質(zhì)科學(xué)數(shù)據(jù)資源,向外界提供基礎(chǔ)地質(zhì)科學(xué)數(shù)據(jù)的開放獲取服務(wù)。國外開放科學(xué)數(shù)據(jù)共享平臺如PubMed Central[29]、美國國家醫(yī)學(xué)圖書館平臺NLM[30]提供生命科學(xué)和醫(yī)學(xué)科學(xué)文獻(xiàn)和科學(xué)數(shù)據(jù)的開放獲取。科學(xué)數(shù)據(jù)的開放存取依托平臺而實現(xiàn),作為多學(xué)科科研信息資源的集中地,在“互聯(lián)網(wǎng)+”的視角下,圖書館建設(shè)科學(xué)數(shù)據(jù)開放共享平臺具有必要性:一是加強跨界融合,與政府、企業(yè)、科研機構(gòu)等深度合作,以實現(xiàn)更多科學(xué)數(shù)據(jù)資源的開放;二是提供科學(xué)數(shù)據(jù)的提交、審核、專家評議、出版、發(fā)布和交流等服務(wù),以滿足科研用戶對科學(xué)數(shù)據(jù)的各種需求;三是關(guān)系結(jié)構(gòu)重組,實現(xiàn)服務(wù)創(chuàng)新,在科學(xué)數(shù)據(jù)開放存取平臺上,每位科研用戶不僅是服務(wù)獲得者,也同時是服務(wù)提供者,關(guān)系結(jié)構(gòu)的重組有利于科學(xué)數(shù)據(jù)交流生態(tài)環(huán)境的良性發(fā)展。
3.6 基于情景感知與融合的個性化科學(xué)數(shù)據(jù)服務(wù)
情景感知融合技術(shù)和個性化服務(wù)理念在實現(xiàn)圖書館民主化數(shù)據(jù)訪問,增加科學(xué)數(shù)據(jù)服務(wù)受眾方面具有重要作用。在“互聯(lián)網(wǎng)+”環(huán)境下,個人是連接融合的最小細(xì)胞,萬物互聯(lián)和信息爆炸不會把個人淹沒,反而會帶來個人的凸顯,每個人的個性將更容易識別,移動設(shè)備如智能手機、平板電腦的普及使得個人的地理位置、情景需求、行為趨向等數(shù)據(jù)更容易被采集和感知。圖書館應(yīng)以互聯(lián)網(wǎng)為基礎(chǔ),采集和融合每個用戶各類情景數(shù)據(jù),快速理解和相應(yīng)用戶需求,實現(xiàn)人與人、人與物、人與服務(wù)、人與場景的連接,構(gòu)建基于情景感知與融合的個性化科學(xué)數(shù)據(jù)服務(wù)?!盎ヂ?lián)網(wǎng)+”視角下的圖書館服務(wù)是以人為本的普惠服務(wù),圖書館科學(xué)數(shù)據(jù)服務(wù)的對象不僅僅是科研工作者,還包括普通民眾,民主化的數(shù)據(jù)訪問是“互聯(lián)網(wǎng)+”圖書館科學(xué)數(shù)據(jù)服務(wù)的特征,體現(xiàn)了“互聯(lián)網(wǎng)+”人人受益的思想。如微軟全球望遠(yuǎn)鏡WWT,任何人都可以通過轉(zhuǎn)動鏡頭和縮放來觀察浩瀚的宇宙,開始自己的太空旅行,還可以在感興趣的位置獲取相關(guān)論文[31]。
4 需要注意的兩個問題
4.1 個人隱私保障和數(shù)據(jù)安全問題
“互聯(lián)網(wǎng)+”與圖書館的融合為現(xiàn)有圖書館科學(xué)數(shù)據(jù)服務(wù)所面臨的數(shù)據(jù)資源匱乏、數(shù)據(jù)服務(wù)缺乏協(xié)調(diào)性、服務(wù)受眾局限性等諸多難題提供了解決思路,但個人隱私和數(shù)據(jù)安全問題在“互聯(lián)網(wǎng)+”的影響下被進一步放大,密切的跨界連接、數(shù)據(jù)開放共享會導(dǎo)致個人隱私缺乏保護,數(shù)據(jù)安全問題日益加劇。要在“互聯(lián)網(wǎng)+”環(huán)境下保障個人隱私和數(shù)據(jù)安全,一是要依靠國家政策法規(guī),政府發(fā)布的政策和國家法規(guī)是保障“互聯(lián)網(wǎng)+”環(huán)境下個人隱私和數(shù)據(jù)安全的重要手段,《國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》是政府首次發(fā)布“互聯(lián)網(wǎng)+”相關(guān)文件,其中列出了“互聯(lián)網(wǎng)+”的總體思路、發(fā)展目標(biāo)和重點行動,顯示出政府將“互聯(lián)網(wǎng)+”列入國家戰(zhàn)略的決心,圖書館應(yīng)結(jié)合自身需求,積極推動相關(guān)國家政策的發(fā)布和法律法規(guī)的形成;二是要完善數(shù)據(jù)互操作協(xié)議,圖書館以互聯(lián)網(wǎng)為基礎(chǔ),與科研機構(gòu)、政府機構(gòu)和公益機構(gòu)建立更多連接,實現(xiàn)數(shù)據(jù)共享的同時,應(yīng)積極開發(fā)與機構(gòu)間的數(shù)據(jù)互操作協(xié)議,完善的數(shù)據(jù)互操作協(xié)議可以統(tǒng)一數(shù)據(jù)操作標(biāo)準(zhǔn),防止誤操作或惡意操作造成用戶隱私泄露,威脅數(shù)據(jù)安全。
4.2 數(shù)據(jù)版權(quán)問題
科學(xué)數(shù)據(jù)的采集、管理、計算、存儲和發(fā)布過程都需要大量資金的支持,其本身具有價值。在當(dāng)今社會,知識產(chǎn)權(quán)受到特別重視,數(shù)據(jù)版權(quán)發(fā)展雖處于初級階段,但其重要性是不言而喻的。數(shù)據(jù)版權(quán)涉及數(shù)據(jù)資源歸屬、增值、引用等問題?!盎ヂ?lián)網(wǎng)+”以跨界融合、萬物互聯(lián)為根本,機構(gòu)之間的密切交流合作所帶來的數(shù)據(jù)版權(quán)問題愈發(fā)嚴(yán)峻。如何有效應(yīng)對“互聯(lián)網(wǎng)+”時代數(shù)據(jù)版權(quán)問題,健全相關(guān)法律法規(guī)是關(guān)鍵,圖書館應(yīng)積極推動數(shù)據(jù)相關(guān)法律法規(guī)的制定,嚴(yán)格區(qū)分?jǐn)?shù)據(jù)版權(quán)歸屬、規(guī)范數(shù)據(jù)引用,權(quán)衡各方利益,避免機構(gòu)間糾紛對“互聯(lián)網(wǎng)+”數(shù)據(jù)服務(wù)生態(tài)環(huán)境發(fā)展產(chǎn)生不利影響。
5 結(jié)語
“互聯(lián)網(wǎng)+”理念的提出為社會經(jīng)濟、文化和服務(wù)的創(chuàng)新發(fā)展提供了理論基礎(chǔ),融合連接、創(chuàng)新驅(qū)動、結(jié)構(gòu)重組、開放共享和以人為本五個特征對于圖書館科學(xué)數(shù)據(jù)的發(fā)展有重要引導(dǎo)作用?!盎ヂ?lián)網(wǎng)+”在解決現(xiàn)有圖書館數(shù)據(jù)服務(wù)難題的同時也帶來了諸多挑戰(zhàn),如個人隱私、數(shù)據(jù)安全和數(shù)據(jù)版權(quán)等問題,如何應(yīng)對新的挑戰(zhàn)是圖書館科學(xué)數(shù)據(jù)服務(wù)接下來需要考慮的問題。
參考文獻(xiàn):
[1] 中國政府網(wǎng).關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見[EB/OL].[2016-05-16].http://www.gov.cn/zhengce/content/2015-07/04/content_10002.htm.
[2] 張曉林.顛覆數(shù)字圖書館的大趨勢[J].中國圖書館學(xué)報,2011(9):4-12.
[3] 肖瀟,呂俊生.E-science環(huán)境下國外圖書館科學(xué)數(shù)據(jù)服務(wù)研究進展[J].圖書情報工作,2012,56(17):53-58.
[4] Borgman,Christine L.The Conundrum of Sharing Research Data[J].Journal of the American Society for Information Science and Technology,2012,63(6):1059-1078.
[5] Vivien Marx.The big challenges of big data[J].Nature,2013(498):255-259.
[6] 肖瀟,呂俊生.圖書館嵌入式學(xué)科化科學(xué)數(shù)據(jù)服務(wù)研究[J].圖書館學(xué)研究,2012,56(21):85-89.
[7] Luce R.The role of academic research libraries in the digital data universe[EB/OL].[2016-05-20].https://www-s.cic.net/programs/centerforlibraryinitiatives/Archive/ConferencePresentation/Conference2008/e-ScienceSpeakerPresentations/RickLucePPTpres13May08.pdf.
[8] 余文婷,吳丹.基于數(shù)據(jù)關(guān)聯(lián)的開放科學(xué)數(shù)據(jù)長期保存利用研究[J].信息資源管理學(xué)報,2014(2):87-92.
[9] Pinfield S,Cox A M,Smith J.Research Data Management and Libraries:Relationships,Activities,Drivers and Influences[J].PLOS ONE,2014(12):1-28.
[10] 徐坤,曹錦丹.高校圖書館參與科學(xué)數(shù)據(jù)管理研究[J].圖書館論壇,2014(5):92-98.
[11] Shotton D,Portwin K,Klyne G,et al.Adventures in Semantic Publishing:Exemplar Semantic Enhancements of a Research Article[J].PLOS Comput Biol,2009,5(4):1-17.
[12] 朱彩萍.高校圖書館提供科學(xué)數(shù)據(jù)服務(wù)的途徑與內(nèi)容[J].圖書與情報,2014(3):97-99.
[13] Cox A M, Pinfield S. Research data management and libraries: Current activities and future priorities[J].Journal of Librarianship and Information Science,2014,46(4):299-316.
[14] 陳建新.科學(xué)數(shù)據(jù)服務(wù):圖書館服務(wù)的新領(lǐng)域[J].圖書與情報,2013(4):93-95.
[15] NADAC[EB/OL].[2016-05-20].http://www.icpsr.umich.edu/icpsrweb/NADAC/.
[16] UC DATA[EB/OL].[2016-05-20].http://ucdata.berkeley.edu/.
[17] Social Science Data Services[EB/OL].[2016-05-20].http://libguides.mit.edu/ssds.
[18] Collection metadata service in THE BRITISH LIBRARY [EB/OL].[2016-05-20].http://www.bl.uk/bibliographic/download.html#basicbnb.
[19] Linked Open Data Pilot[EB/OL].[2016-05-20].http://www.europeana.eu/.
[20] Reflect[EB/OL].[2016-05-21].http://reflect.ws.
[21] D2C2[EB/OL].[2016-05-26].https://www.lib.purdue.edu/researchdata/.
[22] Datastar[EB/OL].[2016-05-26].http://datastar.mannlib.cornell.edu/.
[23] 洪程.國外科學(xué)數(shù)據(jù)服務(wù)現(xiàn)狀研究[J].圖書館雜志,2012(10):31-33.
[24] Harvard-MIT Data Center[EB/OL].[2016-05-20].http://projects.iq.harvard.edu/user-services.
[25] Yale University Library[EB/OL].[2016-05-20].http://guides.library.yale.edu/.
[26] UQ Library Guides[EB/OL].[2016-05-20].http://guides.library.uq.edu.au/.
[27] Budapest Open Access Initiative[EB/OL].[2016-05-06].http://www.budapestopenaccessinitiative.org/read.
[28] 中國地質(zhì)科學(xué)院數(shù)據(jù)網(wǎng)[EB/OL].[2016-05-22].http://www.geoscience.cn/.
[29] PMC[EB/OL].[2016-05-22].http://www.ncbi.nlm.nih.gov/pmc/.
[30] National Library of Medicine[EB/OL].[2016-05-20].https://www.nlm.nih.gov/.
[31] Tony Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm: Data-Intensive Scientific Discovery[M].Microsoft research,redmond,Washington,2009:1-13.
作者簡介:黃鑫(1990-),男,武漢大學(xué)信息管理學(xué)院博士研究生,研究方向:數(shù)據(jù)密集型科研范式、科學(xué)數(shù)據(jù)管理、科學(xué)交流;鄧仲華(1957-),男,武漢大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師,研究方向:知識組織與信息系統(tǒng)。