陶 蕊,葉繼元
進(jìn)入數(shù)字時(shí)代,數(shù)據(jù)成為關(guān)鍵的生產(chǎn)要素、戰(zhàn)略資源,政府?dāng)?shù)據(jù)、公共數(shù)據(jù)、企業(yè)數(shù)據(jù)、科學(xué)數(shù)據(jù)等各領(lǐng)域的數(shù)據(jù)資源建設(shè)受到廣泛關(guān)注??茖W(xué)研究領(lǐng)域內(nèi),隨著數(shù)據(jù)密集型科學(xué)的快速發(fā)展,科研人員對(duì)可發(fā)現(xiàn)、可訪問(wèn)、可互操作、可重用的數(shù)據(jù)需求越來(lái)越強(qiáng)。以開(kāi)放性、共享性、社會(huì)化、可重復(fù)為主要特征的開(kāi)放科學(xué)隨之興起,強(qiáng)調(diào)通過(guò)數(shù)字化工具和網(wǎng)絡(luò)實(shí)施、傳播并轉(zhuǎn)變科學(xué)研究的方式,提供無(wú)限制、無(wú)障礙、開(kāi)放獲取的研究成果,推動(dòng)科學(xué)研究的高效和透明[1]。開(kāi)放科學(xué)運(yùn)動(dòng)使得科研環(huán)境發(fā)生巨大變化,科學(xué)數(shù)據(jù)開(kāi)放需求不斷提高,科學(xué)數(shù)據(jù)的管理與服務(wù)任務(wù)加重,數(shù)據(jù)資源的建設(shè)面臨著新要求。目前我國(guó)數(shù)據(jù)資源建設(shè)仍處于起步階段,存在資源建設(shè)不平衡不充分問(wèn)題,不同主體、不同領(lǐng)域、不同地區(qū)的建設(shè)情況參差不齊,尚未形成良好的數(shù)據(jù)資源保障系統(tǒng)。因此,加快數(shù)據(jù)資源的建設(shè)步伐已成為圖書(shū)館等信息服務(wù)部門(mén)的重點(diǎn)任務(wù)。高校圖書(shū)館(以下簡(jiǎn)稱“高校館”)作為數(shù)據(jù)資源的收藏方、主要供需方和開(kāi)放科學(xué)的重要參與者,加強(qiáng)數(shù)據(jù)資源建設(shè)將成為開(kāi)放科學(xué)運(yùn)動(dòng)和文獻(xiàn)信息資源保障體系的關(guān)鍵一環(huán)。
數(shù)據(jù)一詞有廣泛的內(nèi)涵和外延,其含義可概括為數(shù)字、字母與符號(hào)的集合,系客觀事物與主觀思維的具體表達(dá),現(xiàn)常用來(lái)指可以由計(jì)算機(jī)處理的信息單元[2]2,此為廣義數(shù)據(jù)。從外延看,數(shù)據(jù)包括數(shù)值、字母、圖表、圖像等多種形式;從類型看,有科學(xué)數(shù)據(jù)、政府?dāng)?shù)據(jù)、空間數(shù)據(jù)等豐富內(nèi)容。而具體到與開(kāi)放科學(xué)運(yùn)動(dòng)和高校館建設(shè)密切相關(guān)的數(shù)據(jù),則專指狹義的數(shù)據(jù),即與知識(shí)生產(chǎn)相關(guān)的數(shù)據(jù),主要是科學(xué)數(shù)據(jù)以及部分應(yīng)用于科學(xué)研究和教學(xué)工作的公共數(shù)據(jù)、政府?dāng)?shù)據(jù)等。本文的研究對(duì)象主要是狹義上的數(shù)據(jù)。
中外學(xué)者已開(kāi)展相關(guān)研究,內(nèi)容主要為高校館在開(kāi)放科學(xué)環(huán)境下的科學(xué)數(shù)據(jù)管理與服務(wù)以及開(kāi)放數(shù)據(jù)的建設(shè)。Tzanova指出,高校館提供的信息服務(wù)與高校的教育和科研需求密切相關(guān);開(kāi)放科學(xué)環(huán)境下,高校館應(yīng)積極了解開(kāi)放科學(xué)內(nèi)容,掌握新的研究和教育需求,通過(guò)開(kāi)發(fā)科學(xué)數(shù)據(jù)管理模型、制定數(shù)據(jù)管理計(jì)劃、提高館員的數(shù)據(jù)素養(yǎng)等方式應(yīng)對(duì)挑戰(zhàn)[3]。張俊等指出,開(kāi)放科學(xué)環(huán)境下,科學(xué)數(shù)據(jù)管理是高校館實(shí)現(xiàn)自身價(jià)值的重要途徑,高校館需從科學(xué)數(shù)據(jù)管理過(guò)程、共享政策、共享途徑、管理規(guī)范等方面加強(qiáng)建設(shè)[4]。部分學(xué)者則結(jié)合具體實(shí)踐開(kāi)展論述:周力虹等調(diào)查我國(guó)高校館的科學(xué)數(shù)據(jù)管理服務(wù)現(xiàn)狀,發(fā)現(xiàn)科學(xué)數(shù)據(jù)管理存在計(jì)劃服務(wù)缺乏、服務(wù)方式單一以及館員提供的幫助有限等問(wèn)題,建議關(guān)注用戶需求特點(diǎn),針對(duì)性地開(kāi)展科學(xué)數(shù)據(jù)管理與服務(wù)[5];Agnieszka 等調(diào)查波蘭醫(yī)學(xué)類高校研究人員對(duì)科學(xué)數(shù)據(jù)的需求和態(tài)度,發(fā)現(xiàn)多數(shù)人員對(duì)科學(xué)數(shù)據(jù)的需求較大,但缺乏科學(xué)數(shù)據(jù)的管理、開(kāi)放數(shù)據(jù)等知識(shí)[6];Ahmed等指出,馬來(lái)西亞高校館在開(kāi)放科學(xué)的推進(jìn)和開(kāi)放科學(xué)數(shù)據(jù)的建設(shè)中存在思想意識(shí)不足、專門(mén)機(jī)構(gòu)和人員缺乏以及政策不完備等問(wèn)題[7]。此外,數(shù)據(jù)平臺(tái)的開(kāi)發(fā)作為科學(xué)數(shù)據(jù)管理服務(wù)的重要組成部分,也成為學(xué)者們的討論對(duì)象。李洋等調(diào)查我國(guó)代表性高校館的科學(xué)數(shù)據(jù)平臺(tái)建設(shè)現(xiàn)狀,提出高校館在科學(xué)數(shù)據(jù)的開(kāi)發(fā)過(guò)程中應(yīng)加強(qiáng)政策規(guī)劃,充分收集本校的科學(xué)數(shù)據(jù),開(kāi)展合作建設(shè)等方法策略[8]??傮w看,已有成果集中在高校館的科學(xué)數(shù)據(jù)管理與服務(wù)這一環(huán)節(jié),研究范圍比較固定且局限,對(duì)數(shù)據(jù)資源前期建設(shè)這一基礎(chǔ)性環(huán)節(jié)關(guān)注較少,對(duì)各種類型的數(shù)據(jù)資源建設(shè)情況研究不足。研究基礎(chǔ)性的數(shù)據(jù)資源建設(shè),有利于后期數(shù)據(jù)管理、服務(wù)與利用等環(huán)節(jié)的順利開(kāi)展;而對(duì)數(shù)據(jù)資源建設(shè)的探討,也有助于完善整個(gè)高校館文獻(xiàn)信息資源建設(shè)與保障體系。基于此,本文在新的開(kāi)放科學(xué)環(huán)境下,重點(diǎn)研究高校館這一信息機(jī)構(gòu)的數(shù)據(jù)資源建設(shè)情況:調(diào)查中外部分高校館數(shù)據(jù)資源建設(shè)現(xiàn)狀,總結(jié)經(jīng)驗(yàn)與不足;分析開(kāi)放科學(xué)環(huán)境下高校館開(kāi)展數(shù)據(jù)資源建設(shè)面臨的新形勢(shì);探討開(kāi)放科學(xué)環(huán)境下我國(guó)高校館開(kāi)展數(shù)據(jù)資源建設(shè)的策略。
國(guó)內(nèi)的調(diào)查初步選取42所“雙一流”高校的圖書(shū)館。樣本的選取主要考慮兩方面因素,一是“雙一流”高校的教學(xué)科研發(fā)展對(duì)數(shù)據(jù)資源的需求較高,同時(shí),“雙一流”高校館的人力物力對(duì)于數(shù)據(jù)資源建設(shè)的支持更強(qiáng),數(shù)據(jù)資源建設(shè)的環(huán)境更好;二是通過(guò)前期的文獻(xiàn)和網(wǎng)站調(diào)研發(fā)現(xiàn),國(guó)內(nèi)高校館開(kāi)展數(shù)據(jù)資源建設(shè)的總體水平不高,但“雙一流”高校的圖書(shū)館資源建設(shè)相對(duì)較好。由于北京航空航天大學(xué)圖書(shū)館、電子科技大學(xué)圖書(shū)館等5所高校館的網(wǎng)站無(wú)法打開(kāi),為此本文最終以其余37所圖書(shū)館作為調(diào)查對(duì)象,調(diào)研時(shí)間為2022年3月10-30日。通過(guò)網(wǎng)站調(diào)查并輔以文獻(xiàn)調(diào)研,了解其數(shù)據(jù)資源建設(shè)的總體情況,并從資源的范圍、類型、內(nèi)容等方面做具體分析。
總體上,37所國(guó)內(nèi)高校館的數(shù)據(jù)資源建設(shè)普遍存在資源覆蓋范圍小、數(shù)量少、類型單一、內(nèi)容不豐富、開(kāi)放程度低等問(wèn)題。如表1所示,在資源類型方面,依據(jù)資源來(lái)源渠道,已建設(shè)的數(shù)據(jù)資源主要有3種類型:購(gòu)買(mǎi)的數(shù)據(jù)型數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)資源和自建數(shù)據(jù)資源。其中,購(gòu)買(mǎi)的數(shù)據(jù)型數(shù)據(jù)庫(kù)是大多數(shù)高校館的主體資源,但這類數(shù)據(jù)庫(kù)并非只提供科學(xué)數(shù)據(jù)、公共數(shù)據(jù)等,還包含了研究報(bào)告、政策法規(guī)、案例等資源,其實(shí)質(zhì)是以數(shù)據(jù)為主,涵蓋多種資源的全文數(shù)據(jù)庫(kù),如中經(jīng)網(wǎng)、國(guó)研網(wǎng)等。網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)資源占比較小,主要是政府和部分公共機(jī)構(gòu)、研究機(jī)構(gòu)提供的開(kāi)放數(shù)據(jù),多以數(shù)據(jù)庫(kù)或數(shù)據(jù)平臺(tái)的形式呈現(xiàn),如國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)、聯(lián)合國(guó)統(tǒng)計(jì)數(shù)據(jù)、國(guó)家科技圖書(shū)文獻(xiàn)中心(NSTL)的開(kāi)放科學(xué)數(shù)據(jù)等。自建的數(shù)據(jù)資源則聚焦于科學(xué)數(shù)據(jù),僅有少數(shù)高校館開(kāi)展建設(shè),如北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)、復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)平臺(tái)等;部分高校的院系也自建了數(shù)據(jù)平臺(tái),通過(guò)圖書(shū)館的資源列表提供獲取服務(wù),如湖南大學(xué)的校經(jīng)濟(jì)數(shù)據(jù)研究中心數(shù)據(jù)庫(kù)。在語(yǔ)種方面,大多數(shù)高校館的數(shù)據(jù)資源以中文為主,外文主要為英文。在學(xué)科方面,社會(huì)科學(xué)數(shù)據(jù)是大部分高校館的主體資源,其中,金融、財(cái)經(jīng)類的數(shù)據(jù)又占多數(shù)。自然科學(xué)和綜合學(xué)科的數(shù)據(jù)資源較少,僅有北京大學(xué)圖書(shū)館、上海交通大學(xué)圖書(shū)館、華中科技大學(xué)圖書(shū)館、西北農(nóng)林科技大學(xué)圖書(shū)館4所高校館的自然科學(xué)數(shù)據(jù)數(shù)量高于社會(huì)科學(xué)。
表1 國(guó)內(nèi)部分高校館數(shù)據(jù)資源建設(shè)統(tǒng)計(jì)(單位:種)
近年“開(kāi)放”和“數(shù)據(jù)”已成為科學(xué)發(fā)展的兩大方向,數(shù)據(jù)的開(kāi)放有利于加強(qiáng)學(xué)術(shù)交流,提高科學(xué)生產(chǎn)力,這一發(fā)展趨勢(shì)進(jìn)一步刺激了數(shù)據(jù)資源的開(kāi)放需求。具體來(lái)說(shuō),調(diào)研中的高校館建設(shè)開(kāi)放共享數(shù)據(jù)資源主要有兩種方式,一是提供網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)的獲取途徑,二是自建開(kāi)放科學(xué)數(shù)據(jù)平臺(tái)。其中,網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)在各高校館之間的建設(shè)程度不一。統(tǒng)計(jì)網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)占各圖書(shū)館全部數(shù)據(jù)資源的比重(見(jiàn)圖1)可知,網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)并非多數(shù)高校館的主體資源。網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)占比小于10%的高校館有17 家,11%~30%的有14家;而高于30%的只有6家,如中國(guó)農(nóng)業(yè)大學(xué)圖書(shū)館、四川大學(xué)圖書(shū)館等,當(dāng)中北京大學(xué)圖書(shū)館提供的網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)最為豐富,占比大于90%。同時(shí),多數(shù)高校館提供的網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)以公共數(shù)據(jù)、政府?dāng)?shù)據(jù)為主,如國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù),對(duì)研究機(jī)構(gòu)、數(shù)據(jù)中心開(kāi)放的科學(xué)數(shù)據(jù)建設(shè)力度偏小。在自建開(kāi)放科學(xué)數(shù)據(jù)平臺(tái)方面,37所高校館中僅有北京大學(xué)圖書(shū)館、復(fù)旦大學(xué)圖書(shū)館、武漢大學(xué)圖書(shū)館搭建了開(kāi)放科學(xué)數(shù)據(jù)平臺(tái),而武漢大學(xué)的科研數(shù)據(jù)管理平臺(tái)因管理運(yùn)行原因暫無(wú)法使用。北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)和復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)平臺(tái)的基本情況如表2 所示。通過(guò)調(diào)查可知,經(jīng)過(guò)幾年的建設(shè),北京大學(xué)和復(fù)旦大學(xué)在自建開(kāi)放科學(xué)數(shù)據(jù)平臺(tái)的實(shí)踐上已取得一定的成效。具體來(lái)說(shuō),一是數(shù)據(jù)內(nèi)容類型豐富,兩平臺(tái)均定位于科學(xué)數(shù)據(jù),數(shù)據(jù)量達(dá)到一定規(guī)模,保存管理多個(gè)學(xué)科的資源內(nèi)容,數(shù)據(jù)類型涵蓋了文檔、數(shù)據(jù)文件、問(wèn)卷、圖片、軟件或代碼等多種形式;二是資源組織有序,平臺(tái)的資源按照“數(shù)據(jù)空間-數(shù)據(jù)集-文件”三級(jí)結(jié)構(gòu)組織,通過(guò)豐富的元數(shù)據(jù)進(jìn)行資源描述,同時(shí)按照學(xué)科、機(jī)構(gòu)、關(guān)鍵詞等進(jìn)行分類;三是數(shù)據(jù)開(kāi)放初具成效,兩平臺(tái)都鼓勵(lì)數(shù)據(jù)提交者共享數(shù)據(jù),同時(shí)北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)還向中外學(xué)者或研究單位征集數(shù)據(jù),整理加工后開(kāi)放共享。但兩平臺(tái)的建設(shè)也存在一些不足,一是技術(shù)自主性較低,均在國(guó)外平臺(tái)的框架基礎(chǔ)上二次開(kāi)發(fā)完成,基礎(chǔ)設(shè)施和核心技術(shù)受制于人;二是數(shù)據(jù)更新不及時(shí),以復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)平臺(tái)為例,其數(shù)據(jù)發(fā)布時(shí)間集中在2020年及以前,近兩年新上傳的數(shù)據(jù)量很少。
圖1 國(guó)內(nèi)部分高校館網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)建設(shè)統(tǒng)計(jì)
表2 北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)和復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)平臺(tái)資源建設(shè)情況
(1)數(shù)據(jù)資源建設(shè)方向不明晰。高校館的數(shù)據(jù)資源建設(shè)應(yīng)有明確的方向,以本校的教學(xué)科研需求為中心,同時(shí)考慮國(guó)家的重大科技戰(zhàn)略、創(chuàng)新發(fā)展等實(shí)際需要。而本調(diào)研中,大多數(shù)高校館的數(shù)據(jù)資源建設(shè)以社會(huì)科學(xué)為主,其中又以財(cái)經(jīng)、金融類居多,自然科學(xué)數(shù)據(jù)少。這一建設(shè)現(xiàn)狀與部分高校的優(yōu)勢(shì)學(xué)科發(fā)展不完全匹配,同時(shí)也不能很好地滿足科技創(chuàng)新的需求。
(2)資源類型單一、內(nèi)容不豐富。國(guó)內(nèi)高校館的數(shù)據(jù)資源以購(gòu)買(mǎi)的數(shù)據(jù)型數(shù)據(jù)庫(kù)為主,網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)的建設(shè)程度參差不齊,自建數(shù)據(jù)資源發(fā)展不足。此外,資源內(nèi)容單薄,已建設(shè)的資源多為統(tǒng)計(jì)數(shù)據(jù),對(duì)于其他類型的數(shù)據(jù),尤其是科學(xué)數(shù)據(jù)建設(shè)不足,對(duì)基礎(chǔ)學(xué)科、新興戰(zhàn)略等領(lǐng)域的數(shù)據(jù)資源保障不夠。
(3)開(kāi)放數(shù)據(jù)的建設(shè)力度不大。首先,37所高校館在整合其他機(jī)構(gòu)的開(kāi)放數(shù)據(jù)方面程度不一。例如,北京大學(xué)圖書(shū)館提供了300余種網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)的獲取途徑,但有10家圖書(shū)館卻未將網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)納入資源列表中。這一建設(shè)現(xiàn)狀與網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)的發(fā)展實(shí)情有較大差距。部分政府部門(mén)、研究機(jī)構(gòu)、數(shù)據(jù)中心等已不同程度地推進(jìn)開(kāi)放數(shù)據(jù)項(xiàng)目,高校館作為中介性的信息機(jī)構(gòu),應(yīng)當(dāng)在高質(zhì)量網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)的擴(kuò)散、傳播中發(fā)揮中介作用,在用戶和數(shù)據(jù)資源之間搭建橋梁,通過(guò)提供滿足本校教學(xué)科研需求的網(wǎng)絡(luò)開(kāi)放數(shù)據(jù)來(lái)擴(kuò)展圖書(shū)館的數(shù)據(jù)資源。其次,在自建開(kāi)放科學(xué)數(shù)據(jù)方面,北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)和復(fù)旦大學(xué)社會(huì)科學(xué)數(shù)據(jù)平臺(tái)均取得較好的成效,但在數(shù)據(jù)開(kāi)放的全周期性上仍有不足,其他圖書(shū)館在自建開(kāi)放科學(xué)數(shù)據(jù)方面則鮮有可供利用的成果。
本文重點(diǎn)選取斯坦福大學(xué)、芝加哥大學(xué)、牛津大學(xué)等7所國(guó)外高校館開(kāi)展調(diào)研,樣本主要通過(guò)初期的文獻(xiàn)和網(wǎng)絡(luò)調(diào)研來(lái)獲取,調(diào)研時(shí)間為2022年3月20日-4月15日。這些國(guó)外高校館的數(shù)據(jù)資源建設(shè)情況良好且各有特色,有一定的借鑒意義。梳理調(diào)查內(nèi)容可知,各館數(shù)據(jù)資源數(shù)量眾多,內(nèi)容形式多樣,組織管理有序,開(kāi)放保護(hù)并行。
(1)數(shù)據(jù)資源的內(nèi)容形式多樣。7所國(guó)外高校館的數(shù)據(jù)資源均已形成較大規(guī)模,數(shù)據(jù)資源有3種主要類型。一是數(shù)據(jù)型數(shù)據(jù)庫(kù)。此類資源多列舉在數(shù)據(jù)庫(kù)資源這一門(mén)類下,通過(guò)數(shù)據(jù)庫(kù)資源的分類以方便獲取。例如,斯坦福大學(xué)圖書(shū)館將數(shù)據(jù)資源分為統(tǒng)計(jì)數(shù)據(jù)(Statistics)、數(shù)據(jù)集(Data sets)、人口普查數(shù)據(jù)(Census data)等,在這些門(mén)類下又包含了各種內(nèi)容的數(shù)據(jù)庫(kù),如商業(yè)數(shù)據(jù)庫(kù)、公共數(shù)據(jù)平臺(tái)等[9]。二是機(jī)構(gòu)知識(shí)庫(kù)。機(jī)構(gòu)知識(shí)庫(kù)是一個(gè)以本機(jī)構(gòu)成員在工作過(guò)程中創(chuàng)建的各種數(shù)字化產(chǎn)品為內(nèi)容的數(shù)據(jù)庫(kù)和服務(wù)系統(tǒng)[2]94,機(jī)構(gòu)成員所生產(chǎn)的科學(xué)數(shù)據(jù)也是其重要的資源。國(guó)外部分高校館通過(guò)加強(qiáng)機(jī)構(gòu)數(shù)據(jù)庫(kù)的資源建設(shè)來(lái)保存、利用本校的科學(xué)數(shù)據(jù)。例如,芝加哥大學(xué)圖書(shū)館的機(jī)構(gòu)知識(shí)庫(kù)(Knowledge@UChicago)支持本校成員上傳數(shù)字格式、完整、可使用的數(shù)據(jù)集,數(shù)據(jù)內(nèi)容可以是學(xué)術(shù)性的、創(chuàng)新性的和教學(xué)科研相關(guān)的等等,并且允許在尊重版權(quán)和數(shù)據(jù)安全的前提下開(kāi)放共享[10]。三是數(shù)據(jù)存儲(chǔ)庫(kù)。部分圖書(shū)館搭建專門(mén)的數(shù)據(jù)存儲(chǔ)庫(kù)來(lái)保存數(shù)據(jù)資源。例如,芝加哥大學(xué)圖書(shū)館為查找和共享數(shù)據(jù)而建立了專門(mén)的學(xué)科數(shù)據(jù)存儲(chǔ)庫(kù)(Data Repositories),對(duì)多渠道多學(xué)科的數(shù)據(jù)資源分類匯總,既有國(guó)際組織的開(kāi)放數(shù)據(jù)和調(diào)查報(bào)告,也有所在國(guó)家、州的人口普查、選舉、財(cái)政、刑事司法、環(huán)境、交通等政府?dāng)?shù)據(jù)和公共數(shù)據(jù),學(xué)科多樣、知識(shí)面廣,很好地?cái)U(kuò)展了該校的數(shù)據(jù)資源[11]。哈佛大學(xué)的數(shù)據(jù)存儲(chǔ)庫(kù)(Harvard Dataverse)則不局限于收藏本機(jī)構(gòu)的科學(xué)數(shù)據(jù),校內(nèi)外的研究人員、期刊、機(jī)構(gòu)都可以在此平臺(tái)上保存、管理、分享科學(xué)數(shù)據(jù),不僅便利了其他人員、機(jī)構(gòu)的數(shù)據(jù)管理,也極大豐富了其數(shù)據(jù)資源[12]。國(guó)外高校館的數(shù)據(jù)資源內(nèi)容豐富,既有諸如實(shí)驗(yàn)數(shù)據(jù)、觀測(cè)記錄等科學(xué)數(shù)據(jù),也有地方司法、財(cái)政、人口等政府?dāng)?shù)據(jù)、公共數(shù)據(jù),部分圖書(shū)館還提供空間數(shù)據(jù)(Spatial Data),覆蓋從地球空間數(shù)據(jù)到圖書(shū)館空間數(shù)據(jù)等資源;學(xué)科全面,既有社會(huì)科學(xué)、人文學(xué)科類數(shù)據(jù),又有大量的自然科學(xué)數(shù)據(jù);空間范圍廣,既有本校擁有的科學(xué)數(shù)據(jù),又囊括所在州、國(guó)家以及全球的可獲取數(shù)據(jù);資源語(yǔ)種以英語(yǔ)為主,同時(shí)兼有中文、德文、法文等其他語(yǔ)種數(shù)據(jù)。
(2)數(shù)據(jù)資源組織管理有序。數(shù)據(jù)資源的長(zhǎng)期保存和有效利用,離不開(kāi)有序的組織管理。元數(shù)據(jù)建設(shè)、數(shù)據(jù)分類、數(shù)據(jù)備份、文件格式控制等內(nèi)容,是國(guó)外高校館數(shù)據(jù)組織與管理的重點(diǎn)。在元數(shù)據(jù)方面,國(guó)外高校館通過(guò)制定相應(yīng)的元數(shù)據(jù)方案來(lái)描述及組織數(shù)據(jù)資源。例如,哈佛大學(xué)圖書(shū)館采用PREMIS保存元數(shù)據(jù),并結(jié)合元數(shù)據(jù)封裝標(biāo)準(zhǔn)METS,制定元數(shù)據(jù)實(shí)施方案,同時(shí)在PREMIS實(shí)體類型的基礎(chǔ)上開(kāi)發(fā)自有數(shù)據(jù)模型,作為整個(gè)服務(wù)技術(shù)體系的運(yùn)行基礎(chǔ)[13]。麻省理工學(xué)院的科學(xué)數(shù)據(jù)管理平臺(tái)也從描述元數(shù)據(jù)、管理元數(shù)據(jù)和結(jié)構(gòu)元數(shù)據(jù)三方面設(shè)計(jì)元數(shù)據(jù)方案[14]。另外,部分高校的機(jī)構(gòu)知識(shí)庫(kù)或數(shù)據(jù)存儲(chǔ)庫(kù)支持用戶自行上傳數(shù)據(jù),與此相適應(yīng),圖書(shū)館也為用戶創(chuàng)建與管理元數(shù)據(jù)提供指導(dǎo)。康奈爾大學(xué)圖書(shū)館提出,當(dāng)既有的元數(shù)據(jù)標(biāo)準(zhǔn)不能很好地描述數(shù)據(jù)時(shí),用戶可以根據(jù)相關(guān)指南,編寫(xiě)符合要求的“自述”型元數(shù)據(jù)文檔[15]。在數(shù)據(jù)分類方面,國(guó)外高校館主要有形式分類和內(nèi)容分類兩種方式。對(duì)于形式分類,多數(shù)圖書(shū)館按字順排列數(shù)據(jù)資源,而國(guó)別地區(qū)分類也是常用的方式,部分機(jī)構(gòu)知識(shí)庫(kù)還按本校的學(xué)院部門(mén)分類數(shù)據(jù)。內(nèi)容分類上,學(xué)科、主題分類是國(guó)外圖書(shū)館常用的分類方法。芝加哥大學(xué)圖書(shū)館針對(duì)政府?dāng)?shù)據(jù)還按行政部門(mén)類別進(jìn)行劃分[10],牛津大學(xué)博德利圖書(shū)館將全部數(shù)據(jù)劃分為定量數(shù)據(jù)(Quantitative data)、定性數(shù)據(jù)(Qualitative data)、 地理空間數(shù)據(jù)(Geospatial data)和元數(shù)據(jù)(Metadata)4 種類型[16],普渡大學(xué)的機(jī)構(gòu)知識(shí)庫(kù)則允許用戶通過(guò)添加標(biāo)簽來(lái)自行分類數(shù)據(jù)??傊?,多數(shù)圖書(shū)館并非采用單一分類法,而是將多種分類方式結(jié)合使用。在數(shù)據(jù)備份方面,為保證數(shù)據(jù)的完整度和安全性,康奈爾大學(xué)圖書(shū)館提出了數(shù)據(jù)備份的“三原則”,即建議至少保留3份數(shù)據(jù)副本:保存在數(shù)據(jù)創(chuàng)建本地的原始副本,保存在不同載體介質(zhì)上的其他副本,以及保存在不同地理位置的遠(yuǎn)程副本??紤]到數(shù)據(jù)備份的成本問(wèn)題,康奈爾大學(xué)圖書(shū)館允許備份部分?jǐn)?shù)據(jù),如備份全部數(shù)據(jù)中最有價(jià)值的、易受安全威脅的部分,或者只備份更新的數(shù)據(jù)內(nèi)容[15]。此外,為更好地保存和利用數(shù)據(jù),部分圖書(shū)館提供文件格式的選擇建議。例如,斯坦福大學(xué)圖書(shū)館提出,在選擇存檔的文件格式時(shí),理想的格式應(yīng)該是非專有的、非加密的、非壓縮的、研究人員普遍使用的、可兼容和互操作的,等等[9]。
(3)數(shù)據(jù)資源的開(kāi)放與保護(hù)并行。近年來(lái),歐美發(fā)達(dá)國(guó)家大力推進(jìn)開(kāi)放科學(xué),高校館在開(kāi)放數(shù)據(jù)的建設(shè)上重點(diǎn)發(fā)力,并將開(kāi)放數(shù)據(jù)作為館藏?cái)?shù)據(jù)資源的重要組成部分。國(guó)外高校館建設(shè)的開(kāi)放數(shù)據(jù)主要由兩部分組成,一是其他單位的開(kāi)放數(shù)據(jù),如政府開(kāi)放數(shù)據(jù)、研究機(jī)構(gòu)的開(kāi)放數(shù)據(jù)等;二是自建的開(kāi)放數(shù)據(jù),主要以機(jī)構(gòu)知識(shí)庫(kù)或數(shù)據(jù)存儲(chǔ)庫(kù)的形式建設(shè),內(nèi)容是本校本機(jī)構(gòu)的科學(xué)數(shù)據(jù)。各高校館針對(duì)自有科學(xué)數(shù)據(jù)的開(kāi)放范圍、開(kāi)放程度做了不同的規(guī)定。芝加哥大學(xué)圖書(shū)館的機(jī)構(gòu)知識(shí)庫(kù)定位為開(kāi)放的知識(shí)庫(kù),建議知識(shí)庫(kù)中的數(shù)據(jù)盡可能開(kāi)放,但允許設(shè)置訪問(wèn)權(quán)限,如僅在校內(nèi)公開(kāi);同時(shí),芝加哥大學(xué)圖書(shū)館還鼓勵(lì)研究人員通過(guò)多種途徑共享數(shù)據(jù),如發(fā)布在數(shù)據(jù)期刊、研究網(wǎng)站、博客等其他渠道上[10]。斯坦福大學(xué)的機(jī)構(gòu)知識(shí)庫(kù)支持全球開(kāi)放(World-access)和校內(nèi)開(kāi)放(Stanford-only),并針對(duì)不同的開(kāi)放情況,提供了不同層次的協(xié)議來(lái)規(guī)范開(kāi)放數(shù)據(jù)建設(shè)[9]。由于數(shù)據(jù)資源自身的特殊性以及數(shù)據(jù)開(kāi)放的風(fēng)險(xiǎn)性,數(shù)據(jù)安全問(wèn)題更加突出,國(guó)外高校館通過(guò)多種途徑來(lái)維護(hù)數(shù)據(jù)安全。例如,斯坦福大學(xué)圖書(shū)館通過(guò)數(shù)據(jù)分級(jí)政策來(lái)劃分開(kāi)放和保護(hù)的界限,將所有數(shù)據(jù)劃分為3 類風(fēng)險(xiǎn)級(jí)別:低風(fēng)險(xiǎn)、中風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)。低風(fēng)險(xiǎn)級(jí)別是指數(shù)據(jù)的損壞不會(huì)對(duì)機(jī)構(gòu)的安全、聲譽(yù)、財(cái)務(wù)等產(chǎn)生不利影響,這一級(jí)別的數(shù)據(jù)可用于開(kāi)放獲??;而中高風(fēng)險(xiǎn)級(jí)別的數(shù)據(jù)則出于法律規(guī)定、安全保護(hù)等原因不對(duì)公眾開(kāi)放[9]。此外,部分圖書(shū)館還通過(guò)制定數(shù)據(jù)安全政策、版權(quán)規(guī)定,提供數(shù)據(jù)安全存儲(chǔ)設(shè)施,加強(qiáng)數(shù)據(jù)使用許可等方式保障數(shù)據(jù)安全。
綜上可知,國(guó)外部分高校館的數(shù)據(jù)資源建設(shè)情況良好。調(diào)研中的圖書(shū)館依據(jù)科學(xué)發(fā)展方向和本校學(xué)科建設(shè)等目標(biāo),系統(tǒng)制定數(shù)據(jù)資源建設(shè)規(guī)劃,針對(duì)性地布局?jǐn)?shù)據(jù)資源,初步形成了類型多樣、內(nèi)容豐富、覆蓋廣泛的數(shù)據(jù)資源保障體系。在提高資源數(shù)量的同時(shí),注重?cái)?shù)據(jù)質(zhì)量的提升,從數(shù)據(jù)的采集、組織管理、檢索利用到更新維護(hù),實(shí)行全流程的質(zhì)量監(jiān)管。發(fā)展水平較高的圖書(shū)館還重點(diǎn)推進(jìn)科學(xué)數(shù)據(jù)的管理與服務(wù),鼓勵(lì)科學(xué)數(shù)據(jù)開(kāi)放,積極融入開(kāi)放科學(xué)的建設(shè)。
開(kāi)放科學(xué)環(huán)境下,數(shù)據(jù)資源的內(nèi)容與形式、供給與需求、管理與服務(wù)等都發(fā)生了深刻變化。高校館的數(shù)據(jù)資源建設(shè)面臨著新形勢(shì),機(jī)遇與挑戰(zhàn)并存。
(1)數(shù)據(jù)質(zhì)量的高要求。在數(shù)據(jù)建設(shè)過(guò)程中,數(shù)據(jù)質(zhì)量是影響建設(shè)效果的關(guān)鍵因素。良好的數(shù)據(jù)質(zhì)量可以提升數(shù)據(jù)價(jià)值,有助于整個(gè)數(shù)據(jù)資源系統(tǒng)長(zhǎng)期安全地運(yùn)行,質(zhì)量差的數(shù)據(jù)則有可能讓整個(gè)系統(tǒng)面臨風(fēng)險(xiǎn)。數(shù)據(jù)質(zhì)量是指數(shù)據(jù)的正確性、適時(shí)性、精確性、完備性、相關(guān)性及可訪問(wèn)性,用以評(píng)估數(shù)據(jù)的適用性[17]。數(shù)據(jù)質(zhì)量屬性眾多,不同領(lǐng)域的數(shù)據(jù)屬性也有所差別。高校館的數(shù)據(jù)資源以科學(xué)數(shù)據(jù)為主,高校的科學(xué)數(shù)據(jù)具有多元性、跨部門(mén)性、價(jià)值密度低的特點(diǎn),存在數(shù)據(jù)冗余、不完整、不準(zhǔn)確、不一致等質(zhì)量問(wèn)題[18],而開(kāi)放科學(xué)的發(fā)展對(duì)數(shù)據(jù)資源的兼容性、互操作性等提出更多更高的要求。當(dāng)前,國(guó)內(nèi)高校館已建的數(shù)據(jù)資源和開(kāi)放科學(xué)數(shù)據(jù)管理平臺(tái)在數(shù)據(jù)完整性、可用性、開(kāi)放性、及時(shí)性以及平臺(tái)功能等方面都有待提高,而高質(zhì)量的數(shù)據(jù)建設(shè)也需要大量的人力、物力支持。因此,高校館的數(shù)據(jù)資源質(zhì)量建設(shè)面臨多方面的挑戰(zhàn),應(yīng)選擇合適的質(zhì)量維度,采用多種方法提高數(shù)據(jù)質(zhì)量。
(2)競(jìng)爭(zhēng)對(duì)手對(duì)數(shù)據(jù)資源建設(shè)陣地的沖擊。當(dāng)前,數(shù)據(jù)的獲取渠道日益多元化,出現(xiàn)了一些新興的數(shù)據(jù)提供者。諸如阿里、騰訊、百度等互聯(lián)網(wǎng)企業(yè)依托自身渠道積累了大量數(shù)據(jù)資源;第三方數(shù)據(jù)服務(wù)機(jī)構(gòu)也提供大量行業(yè)、市場(chǎng)或綜合性的數(shù)據(jù);傳統(tǒng)的數(shù)據(jù)擁有者,如政府、公共服務(wù)機(jī)構(gòu)、研究中心、數(shù)據(jù)庫(kù)商等近年來(lái)也逐漸在數(shù)據(jù)資源建設(shè)與服務(wù)方面持續(xù)發(fā)力。部分領(lǐng)域的數(shù)據(jù)商業(yè)化、集中化趨勢(shì)日漸明顯。在此環(huán)境下,圖書(shū)館作為傳統(tǒng)的信息提供者,在數(shù)據(jù)資源供給與服務(wù)方面受到了競(jìng)爭(zhēng)對(duì)手的強(qiáng)烈沖擊。圖書(shū)館自身數(shù)據(jù)資源建設(shè)不足,數(shù)據(jù)服務(wù)匱乏,不能很好地滿足用戶的數(shù)據(jù)需求,在數(shù)據(jù)服務(wù)領(lǐng)域中面臨邊緣化的風(fēng)險(xiǎn)。高校內(nèi)各部門(mén)為科學(xué)數(shù)據(jù)的生產(chǎn)大戶,高校館卻未能充分利用其資源優(yōu)勢(shì)、有效地提供科學(xué)數(shù)據(jù)服務(wù),造成科學(xué)數(shù)據(jù)資源的浪費(fèi)。由此,如何在科學(xué)數(shù)據(jù)的建設(shè)方面確立自己的獨(dú)特優(yōu)勢(shì)、提升競(jìng)爭(zhēng)力,維護(hù)其信息中心的地位是高校館面臨的重要問(wèn)題。
(3)缺乏友好的科學(xué)數(shù)據(jù)開(kāi)放氛圍。開(kāi)放科學(xué)環(huán)境下,高校館的數(shù)據(jù)資源建設(shè)重點(diǎn)之一就是開(kāi)放科學(xué)數(shù)據(jù),而高校館在開(kāi)放科學(xué)數(shù)據(jù)的建設(shè)過(guò)程中面臨諸多障礙,其中一個(gè)主要障礙就是開(kāi)放科學(xué)數(shù)據(jù)建設(shè)的氛圍不夠友好。總體上,國(guó)內(nèi)雖已有部分學(xué)者和機(jī)構(gòu)開(kāi)始研究并建設(shè)開(kāi)放科學(xué)數(shù)據(jù),但并未形成完整的研究體系與實(shí)踐系統(tǒng),缺乏對(duì)開(kāi)放科學(xué)數(shù)據(jù)的系統(tǒng)性頂層規(guī)劃,全社會(huì)未能有效聯(lián)動(dòng),開(kāi)放的理念并未貫穿資源建設(shè)的全周期,開(kāi)放科學(xué)數(shù)據(jù)的建設(shè)仍處于起步階段。具體到高校館的開(kāi)放科學(xué)數(shù)據(jù)建設(shè),高校的科研人員作為科學(xué)數(shù)據(jù)的主要供給者和需求者,處在高漲的數(shù)據(jù)需求和保守的數(shù)據(jù)開(kāi)放這一矛盾態(tài)度之中,即一方面對(duì)其他主體提供的科學(xué)數(shù)據(jù)有著強(qiáng)烈的需求,另一方面對(duì)開(kāi)放共享自己擁有的科學(xué)數(shù)據(jù)有所顧慮。其不愿開(kāi)放自有數(shù)據(jù)的原因,主要有以下幾點(diǎn):出于保護(hù)隱私、保護(hù)未完成的研究?jī)?nèi)容、避免搶先發(fā)表等目的,不愿主動(dòng)開(kāi)放科學(xué)數(shù)據(jù);對(duì)已上傳和開(kāi)放的科學(xué)數(shù)據(jù)的知識(shí)產(chǎn)權(quán)保護(hù)不完備,科學(xué)數(shù)據(jù)的知識(shí)產(chǎn)權(quán)易受侵犯;學(xué)術(shù)評(píng)價(jià)制度不太認(rèn)同科學(xué)數(shù)據(jù)的貢獻(xiàn),當(dāng)前圖書(shū)、期刊論文、專利、研究報(bào)告等科研產(chǎn)出的價(jià)值均已被社會(huì)所公認(rèn),但對(duì)研究過(guò)程中產(chǎn)出的科學(xué)數(shù)據(jù)的貢獻(xiàn)作用并沒(méi)有明確,阻礙了研究人員開(kāi)放其科學(xué)數(shù)據(jù)。此外,高校館在建設(shè)開(kāi)放科學(xué)數(shù)據(jù)時(shí),也面臨著數(shù)據(jù)開(kāi)放與安全的問(wèn)題,這些都影響了科學(xué)數(shù)據(jù)的開(kāi)放環(huán)境。
當(dāng)前,我國(guó)正處于創(chuàng)新驅(qū)動(dòng)發(fā)展、建設(shè)科技強(qiáng)國(guó)的關(guān)鍵時(shí)期,數(shù)據(jù)資源的建設(shè)水平與服務(wù)能力對(duì)于我國(guó)科技高質(zhì)量發(fā)展、提高國(guó)際競(jìng)爭(zhēng)力至關(guān)重要。高校館在科學(xué)數(shù)據(jù)方面擁有得天獨(dú)厚的優(yōu)勢(shì),在數(shù)據(jù)建設(shè)過(guò)程中,要面向國(guó)家戰(zhàn)略需求,找準(zhǔn)自身定位,積極融入國(guó)家數(shù)據(jù)資源保障體系中,在科學(xué)數(shù)據(jù)的建設(shè)與保障中發(fā)揮作用?!笆奈濉币?guī)劃強(qiáng)調(diào),要“發(fā)展壯大戰(zhàn)略性新興產(chǎn)業(yè)”,“加強(qiáng)信息科學(xué)與生命科學(xué)、材料等基礎(chǔ)學(xué)科的交叉創(chuàng)新”[19]等。為此,高校館的科學(xué)數(shù)據(jù)建設(shè)既要保障新興領(lǐng)域、跨學(xué)科領(lǐng)域、基礎(chǔ)學(xué)科領(lǐng)域的數(shù)據(jù)供應(yīng),參與重點(diǎn)科研領(lǐng)域數(shù)據(jù)資源管理與服務(wù)平臺(tái)的建設(shè),又要注重科學(xué)研究、實(shí)踐應(yīng)用和經(jīng)濟(jì)發(fā)展需求的有機(jī)融合,向企業(yè)開(kāi)放科學(xué)數(shù)據(jù),提高數(shù)據(jù)資源在產(chǎn)學(xué)研結(jié)合中的支撐作用。同時(shí),應(yīng)增強(qiáng)人文學(xué)科、社會(huì)科學(xué)領(lǐng)域的科學(xué)數(shù)據(jù)建設(shè)力度,為數(shù)字人文的開(kāi)展、哲學(xué)社會(huì)科學(xué)領(lǐng)域的研究創(chuàng)新提供豐富的數(shù)據(jù)內(nèi)容與充足的數(shù)據(jù)工具,以數(shù)據(jù)資源的高效建設(shè)推動(dòng)中國(guó)特色哲學(xué)社會(huì)科學(xué)學(xué)科體系的構(gòu)建。
高校館數(shù)據(jù)資源的建設(shè)還應(yīng)著眼于學(xué)校自身的需求,有的放矢地布局?jǐn)?shù)據(jù)資源。首先,把握學(xué)校的學(xué)科建設(shè)與發(fā)展目標(biāo),有重點(diǎn)地規(guī)劃數(shù)據(jù)資源的建設(shè)內(nèi)容,形成具有本館特色的數(shù)據(jù)資源。其次,充分了解用戶的需求和資源利用方式,提供能滿足用戶教學(xué)科研需求、使用便利的數(shù)據(jù),避免盲目增加資源數(shù)量導(dǎo)致資源利用率低等問(wèn)題。再次,高校館在館藏資源建設(shè)中面臨著經(jīng)費(fèi)、人才、資源結(jié)構(gòu)等各方面的壓力,對(duì)數(shù)據(jù)資源的建設(shè)提出了挑戰(zhàn)。在開(kāi)放科學(xué)環(huán)境下,高校館可以通過(guò)資源的共建共享、整合推送其他主體建設(shè)的開(kāi)放數(shù)據(jù)等方式來(lái)補(bǔ)充自己的數(shù)據(jù)資源,提高數(shù)據(jù)資源的保障能力。
構(gòu)建多元融合、組織有序、安全開(kāi)放的數(shù)據(jù)資源保障體系,是開(kāi)放科學(xué)環(huán)境下高校館數(shù)據(jù)資源建設(shè)的必然要求。高校館要充分發(fā)揮中介性的基礎(chǔ)作用,融合各方數(shù)據(jù)資源,如整合中外研究機(jī)構(gòu)的科學(xué)數(shù)據(jù)、收藏與教學(xué)科研任務(wù)相關(guān)的政府?dāng)?shù)據(jù)和公共數(shù)據(jù)、篩選數(shù)據(jù)庫(kù)商和第三方數(shù)據(jù)平臺(tái)的數(shù)據(jù),充實(shí)本館的數(shù)據(jù)資源館藏,節(jié)約用戶的數(shù)據(jù)獲取成本。在已建成的數(shù)據(jù)資源的基礎(chǔ)上,重點(diǎn)開(kāi)發(fā)本校擁有的科學(xué)數(shù)據(jù),打造本館特色化的科學(xué)數(shù)據(jù)館藏。
對(duì)數(shù)據(jù)進(jìn)行有效的組織與管理,這是高質(zhì)量數(shù)據(jù)與數(shù)據(jù)資源保障體系建設(shè)的基礎(chǔ)。高校館要重點(diǎn)建設(shè)數(shù)據(jù)資源的元數(shù)據(jù),在吸收?qǐng)D書(shū)館已有元數(shù)據(jù)的基礎(chǔ)上,借鑒社會(huì)中的元數(shù)據(jù)應(yīng)用,分析數(shù)據(jù)的保存管理環(huán)境、資源特性等,有針對(duì)性地構(gòu)建適合高校館數(shù)據(jù)資源的元數(shù)據(jù)體系。面對(duì)數(shù)據(jù)動(dòng)態(tài)變化、格式多樣等帶來(lái)的數(shù)據(jù)管理和利用的不便,高校館應(yīng)采取必要的控制手段。例如,明確數(shù)據(jù)保存所允許的文件格式,為圖表、數(shù)據(jù)集、統(tǒng)計(jì)報(bào)告等不同的數(shù)據(jù)類型分配不同的文件格式,但不論何種格式都應(yīng)符合普遍性、規(guī)范性、兼容性、互操作性等要求。對(duì)上傳的數(shù)據(jù)進(jìn)行版本控制,明確已上傳的數(shù)據(jù)版本在內(nèi)容、格式等方面的完整性,同時(shí)允許數(shù)據(jù)的動(dòng)態(tài)更新,并通過(guò)編寫(xiě)元數(shù)據(jù)等方法進(jìn)行版本更新說(shuō)明。此外,還應(yīng)積極建立數(shù)據(jù)的長(zhǎng)期保存機(jī)制、數(shù)據(jù)管理與利用的反饋機(jī)制等,以提高資源建設(shè)的有效性。
努力建造既開(kāi)放又安全的數(shù)據(jù)資源保障體系。開(kāi)放數(shù)據(jù)的建設(shè),一方面要廣泛集合各方開(kāi)放數(shù)據(jù),完善資源結(jié)構(gòu);另一方面應(yīng)有序開(kāi)放自有的科學(xué)數(shù)據(jù),如向企業(yè)開(kāi)放科學(xué)數(shù)據(jù),助推企業(yè)提高生產(chǎn)力與創(chuàng)新發(fā)展,或向其他高校、科研機(jī)構(gòu)開(kāi)放科學(xué)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)資源的開(kāi)放共享,推動(dòng)科技創(chuàng)新。在開(kāi)放的同時(shí),高校館還需實(shí)施安全保護(hù)措施,保障數(shù)據(jù)安全,提高數(shù)據(jù)資源系統(tǒng)抵御風(fēng)險(xiǎn)的能力。例如,加強(qiáng)圖書(shū)館館員和用戶的數(shù)據(jù)安全教育,提高管理人員和用戶的數(shù)據(jù)安全意識(shí);建立數(shù)據(jù)分類分級(jí)制度,依據(jù)風(fēng)險(xiǎn)類別對(duì)數(shù)據(jù)進(jìn)行等級(jí)劃分,并對(duì)不同風(fēng)險(xiǎn)等級(jí)的數(shù)據(jù)實(shí)行不同的開(kāi)放策略,借此實(shí)現(xiàn)數(shù)據(jù)安全的分級(jí)管理;加強(qiáng)數(shù)據(jù)安全相關(guān)的技術(shù)開(kāi)發(fā)和基礎(chǔ)設(shè)施建設(shè),為數(shù)據(jù)的采集、組織管理、存儲(chǔ)與傳播利用提供安全的工作流程和工具等。
高校館的數(shù)據(jù)資源建設(shè)是一個(gè)基礎(chǔ)性、持續(xù)性的過(guò)程,是推動(dòng)科技進(jìn)步的重要環(huán)節(jié)。因此,需要營(yíng)造良好的環(huán)境來(lái)推動(dòng)高校館數(shù)據(jù)資源的建設(shè)與發(fā)展。具體可以從以下幾方面展開(kāi)。一是構(gòu)建全方位的數(shù)據(jù)發(fā)展規(guī)劃。數(shù)據(jù)資源的建設(shè)離不開(kāi)政策規(guī)劃的指導(dǎo),良好的政策環(huán)境可以促進(jìn)數(shù)據(jù)資源的發(fā)展。為此,應(yīng)積極搭建橫向上覆蓋各領(lǐng)域、各環(huán)節(jié),縱向上貫通各層級(jí)、各主體的數(shù)據(jù)發(fā)展戰(zhàn)略。高校館也需制定符合自身特點(diǎn)的數(shù)據(jù)資源發(fā)展策略,并針對(duì)重要的環(huán)節(jié)制定更為具體的行動(dòng)指南,如數(shù)據(jù)安全保護(hù)指南、元數(shù)據(jù)使用指南等,指導(dǎo)具體工作的開(kāi)展。二是保護(hù)數(shù)據(jù)的知識(shí)產(chǎn)權(quán)。高校館在建設(shè)數(shù)據(jù)資源的過(guò)程中,要遵守知識(shí)產(chǎn)權(quán)相關(guān)的法律法規(guī),不僅要尊重其他主體建設(shè)的數(shù)據(jù)的知識(shí)產(chǎn)權(quán),也要合理界定并保護(hù)本機(jī)構(gòu)成員生產(chǎn)的數(shù)據(jù)資源的知識(shí)產(chǎn)權(quán),明確相關(guān)主體的權(quán)限范圍,加強(qiáng)對(duì)開(kāi)放數(shù)據(jù)知識(shí)產(chǎn)權(quán)的保護(hù)力度,創(chuàng)建安全有序的數(shù)據(jù)環(huán)境。三是制定標(biāo)準(zhǔn)規(guī)范。目前我國(guó)在數(shù)據(jù)方面的標(biāo)準(zhǔn)規(guī)范尚未形成完整統(tǒng)一的體系,數(shù)據(jù)建設(shè)在一定程度上混亂無(wú)序。高校館作為數(shù)據(jù)資源的建設(shè)者,應(yīng)積極推動(dòng)并參與相關(guān)標(biāo)準(zhǔn)規(guī)范的制定,在標(biāo)準(zhǔn)規(guī)范的推行中貢獻(xiàn)圖書(shū)館的力量,推動(dòng)規(guī)范化的數(shù)據(jù)資源建設(shè)。四是認(rèn)可科學(xué)數(shù)據(jù)的價(jià)值,建立開(kāi)放科學(xué)數(shù)據(jù)制度。高校館在科學(xué)數(shù)據(jù),尤其是開(kāi)放科學(xué)數(shù)據(jù)的建設(shè)中,要努力推動(dòng)學(xué)術(shù)評(píng)價(jià)制度對(duì)科學(xué)數(shù)據(jù)地位的認(rèn)可;同時(shí),考慮將科學(xué)數(shù)據(jù)的開(kāi)放以制度的形式固定下來(lái),通過(guò)制度要求來(lái)提高數(shù)據(jù)開(kāi)放的執(zhí)行力。例如,高校的科學(xué)數(shù)據(jù)管理平臺(tái)或機(jī)構(gòu)知識(shí)庫(kù)可以要求研究人員在項(xiàng)目結(jié)項(xiàng)后,上傳相關(guān)的科學(xué)數(shù)據(jù)并酌情開(kāi)放,以此來(lái)加快開(kāi)放科學(xué)數(shù)據(jù)的建設(shè)。
總的來(lái)說(shuō),加強(qiáng)數(shù)據(jù)資源建設(shè)是開(kāi)放科學(xué)及社會(huì)發(fā)展的一大趨勢(shì),高校館應(yīng)認(rèn)識(shí)到數(shù)據(jù),尤其是科學(xué)數(shù)據(jù),在科學(xué)生產(chǎn)和社會(huì)發(fā)展中的作用,加快推進(jìn)數(shù)據(jù)資源的建設(shè)。同時(shí),也應(yīng)時(shí)刻保持清醒頭腦,理清各類文獻(xiàn)信息資源的地位與關(guān)系,不能一味盲目地追求數(shù)據(jù)資源而忽視了原有的資源,要結(jié)合自身的實(shí)際需求,構(gòu)建結(jié)構(gòu)合理的文獻(xiàn)信息資源保障體系。