摘? ?要:當(dāng)前,業(yè)界對科學(xué)數(shù)據(jù)出版及其質(zhì)量控制的研究漸趨豐富,但對諸如數(shù)據(jù)出版的模式與形態(tài)、質(zhì)量控制的內(nèi)容與方法等具體問題的討論稍顯分散,不利于研究者和實(shí)踐者形成全局的視野、進(jìn)行整體的把握。文章首先梳理了三種數(shù)據(jù)出版模式的出版流程、協(xié)同環(huán)節(jié)及質(zhì)量可控環(huán)節(jié),構(gòu)建了融合三種出版模式的數(shù)據(jù)出版生態(tài)系統(tǒng);然后將數(shù)據(jù)質(zhì)量控制的內(nèi)容與方法歸納為數(shù)據(jù)標(biāo)準(zhǔn)/規(guī)范、工具/平臺(tái)、內(nèi)容/形式三個(gè)維度;確定了數(shù)據(jù)質(zhì)量控制要素,據(jù)此構(gòu)建了面向流程的數(shù)據(jù)出版質(zhì)量控制體系。
關(guān)鍵詞:科學(xué)數(shù)據(jù);數(shù)據(jù)出版;質(zhì)量控制;生態(tài)系統(tǒng)
中圖分類號(hào):G237? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2019017
Abstract Researches on scientific data publishing and data quality control are becoming more and more abundant, but the discussion on specific issues such as data publishing models, contents and methods of data quality control are slightly dispersed, which are not conducive to form overviews for researchers and practitioners. The paper firstly figured three models of data publishing and their processes, identified their collaborative issues and quality controllable units, and then built the data publishing ecosystem that integrated three models. Moreover, the paper summarized data quality control into three dimensions: data standards and specifications, data tools and systems, and data contents and forms. Accordingly, determining data quality control elements, and then a process-oriented data publishing quality control system is constructed.
Key words scientific data; data publishing; quality control; ecosystem
1? ?引言
科學(xué)數(shù)據(jù)是重要的學(xué)術(shù)資源,數(shù)據(jù)開放共享已成為科技界、出版界、圖書館界的普遍共識(shí)和行動(dòng),而數(shù)據(jù)出版是規(guī)范數(shù)據(jù)開放共享、協(xié)調(diào)數(shù)據(jù)知識(shí)產(chǎn)權(quán)、提高數(shù)據(jù)質(zhì)量的重要途徑。國內(nèi)外學(xué)者對科學(xué)數(shù)據(jù)政策、數(shù)據(jù)管理與共享、數(shù)據(jù)出版模式、數(shù)據(jù)出版實(shí)踐、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)影響力等的相關(guān)問題已經(jīng)進(jìn)行了較多研究。
關(guān)于數(shù)據(jù)出版模式,不少學(xué)者都進(jìn)行了歸納總結(jié)和比較研究。從數(shù)據(jù)出版客體切入的研究,如黃國彬等[1]歸納的兩種、孔麗華[2]總結(jié)的三種、張靜蓓和任樹懷[3]劃分的四種、Lawrence等[4]提出的五種;從數(shù)據(jù)出版主體出發(fā)的研究,如張麗麗和黎建輝[5]以數(shù)據(jù)管理與出版動(dòng)力為視角總結(jié)數(shù)據(jù)出版的三種模式;張小強(qiáng)和李欣[6]以數(shù)據(jù)管理與存儲(chǔ)主體為視角總結(jié)數(shù)據(jù)出版的四種模式。雖然研究的角度不同,但兩者之間可以相互映射;即便表述存在差異,但事實(shí)上仍達(dá)成了相對共識(shí),即數(shù)據(jù)出版/發(fā)表的“三種模式”: 作為論文附件的數(shù)據(jù)出版、獨(dú)立的數(shù)據(jù)出版、數(shù)據(jù)論文出版。
關(guān)于數(shù)據(jù)出版質(zhì)量控制,包括理論層面的思考探索和實(shí)踐層面的分析研究。理論研究涉及數(shù)據(jù)質(zhì)量控制的環(huán)節(jié)、內(nèi)容/對象、層次維度及控制方法等,如Pampel等[7]從數(shù)據(jù)出版流程角度認(rèn)為可從數(shù)據(jù)創(chuàng)建、數(shù)據(jù)管理及其計(jì)劃、數(shù)據(jù)質(zhì)量評估三個(gè)環(huán)節(jié)進(jìn)行數(shù)據(jù)質(zhì)量控制;Austin等[8]以質(zhì)量對象和質(zhì)量維度為視角認(rèn)為數(shù)據(jù)質(zhì)量控制包括對數(shù)據(jù)計(jì)劃、元數(shù)據(jù)、數(shù)據(jù)及其他數(shù)據(jù)相關(guān)文檔的質(zhì)量控制,也可從技術(shù)質(zhì)量、科學(xué)質(zhì)量以及管理質(zhì)量等維度進(jìn)行控制;王丹丹[9]分別研究了三種數(shù)據(jù)出版模式下的質(zhì)量控制方式并進(jìn)行比較;屈寶強(qiáng)和王凱[10]著重研究了數(shù)據(jù)出版中的數(shù)據(jù)同行評議。實(shí)踐研究主要表現(xiàn)為從實(shí)踐調(diào)研中總結(jié)、提煉出的質(zhì)量控制內(nèi)容、方法及問題等,如張靜蓓和任樹懷[11]選取Dryad、Dataverse、figshare、ICPSR、SSDA、ISPS Data Archive等常用的數(shù)據(jù)知識(shí)庫進(jìn)行分析,總結(jié)數(shù)據(jù)出版質(zhì)量控制四個(gè)方面的內(nèi)容,即文件整體質(zhì)量控制、文檔說明質(zhì)量控制、科學(xué)數(shù)據(jù)本身質(zhì)量控制、源代碼質(zhì)量控制;涂志芳和劉茲恒[12]從內(nèi)容接收標(biāo)準(zhǔn)與用戶服務(wù)原則、技術(shù)與科學(xué)層面、管理與傳播層面研究數(shù)據(jù)知識(shí)庫模式的數(shù)據(jù)出版質(zhì)量控制實(shí)踐;Gordon[13]對知識(shí)庫Dryad的創(chuàng)建者、日期、類型等元數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)存在同一創(chuàng)建者姓名表述不統(tǒng)一、日期表達(dá)方式不統(tǒng)一、資源類型與事實(shí)不相符等問題,并建議加強(qiáng)元數(shù)據(jù)質(zhì)量控制。
以上理論和實(shí)踐研究,對數(shù)據(jù)出版質(zhì)量控制具有現(xiàn)實(shí)的指導(dǎo)作用。然而,人們在進(jìn)行實(shí)際的數(shù)據(jù)出版過程中,并不一定首先自我定位為數(shù)據(jù)出版模式的某一種或幾種再從事數(shù)據(jù)出版活動(dòng),也并不刻意區(qū)分不同的數(shù)據(jù)出版模式再尋求對應(yīng)的質(zhì)量控制辦法。因此美中不足的是,尚缺乏一個(gè)融合全部三種模式的數(shù)據(jù)出版生態(tài)系統(tǒng)以及基于該系統(tǒng)的數(shù)據(jù)質(zhì)量控制體系。
本文分別梳理三種數(shù)據(jù)出版模式的出版過程,關(guān)聯(lián)數(shù)據(jù)出版的協(xié)同環(huán)節(jié),識(shí)別數(shù)據(jù)出版的質(zhì)量可控環(huán)節(jié),據(jù)此構(gòu)建融合三種數(shù)據(jù)出版模式的數(shù)據(jù)出版生態(tài)系統(tǒng);同時(shí)將數(shù)據(jù)質(zhì)量控制歸納為數(shù)據(jù)標(biāo)準(zhǔn)/規(guī)范、數(shù)據(jù)工具/平臺(tái)、數(shù)據(jù)內(nèi)容/形式三個(gè)維度,明確質(zhì)量控制體系的框架要素。在此基礎(chǔ)上,構(gòu)建面向流程的數(shù)據(jù)出版質(zhì)量控制體系,以期為數(shù)據(jù)出版活動(dòng)提供更為全面的視角和現(xiàn)實(shí)的參考。
2? ?數(shù)據(jù)出版流程與生態(tài)系統(tǒng)
2.1? ? 三種數(shù)據(jù)出版模式及其出版流程
2.1.1? 作為論文附件的數(shù)據(jù)出版
涂志芳[14]通過研究發(fā)現(xiàn),期刊通過制定或執(zhí)行相關(guān)數(shù)據(jù)政策對數(shù)據(jù)出版活動(dòng)進(jìn)行指導(dǎo),其中一方面是要求將數(shù)據(jù)作為論文的附件而提交并發(fā)布/出版,作者一般須在論文中說明數(shù)據(jù)可用性及獲取方式,并在論文的在線版本中提供下載/跳轉(zhuǎn)鏈接(附件存儲(chǔ)在期刊網(wǎng)站和/或數(shù)據(jù)知識(shí)庫);另一方面是將數(shù)據(jù)提交、存儲(chǔ)在指定或推薦的數(shù)據(jù)知識(shí)庫(即“獨(dú)立的數(shù)據(jù)出版”),并試圖通過標(biāo)簽、訪問控制號(hào)、數(shù)據(jù)描述符、DOI、鏈接等方式揭示數(shù)據(jù)與論文的關(guān)聯(lián)與鏈接,數(shù)據(jù)與論文保持同步出版。
作為論文附件的數(shù)據(jù)出版是由數(shù)據(jù)作者、數(shù)據(jù)知識(shí)庫管理人員、評審專家等角色共同完成的過程(出版各環(huán)節(jié)及人員角色流程見圖1)。其中,“數(shù)據(jù)可用性聲明”是在論文中聲明數(shù)據(jù)公開可用,并提供存儲(chǔ)位置以便查找和獲取;“分配標(biāo)識(shí)符”是指數(shù)據(jù)附件的標(biāo)識(shí)符取決于源論文的標(biāo)識(shí)符,便于論文及數(shù)據(jù)的管理和關(guān)聯(lián);“數(shù)據(jù)評審”是指數(shù)據(jù)作為文章內(nèi)容的一部分接受與論文同樣的科學(xué)評審,數(shù)據(jù)同時(shí)作為論文附件理論上只需接受技術(shù)性審查(實(shí)際操作過程中也可能并不執(zhí)行)。
2.1.2? 獨(dú)立的數(shù)據(jù)出版
獨(dú)立的數(shù)據(jù)出版即基于(廣義的)數(shù)據(jù)知識(shí)庫(包括數(shù)據(jù)倉儲(chǔ)數(shù)據(jù)中心、數(shù)據(jù)平臺(tái)等)的數(shù)據(jù)出版,數(shù)據(jù)可與研究性論文、報(bào)告等出版物關(guān)聯(lián),但具有相對獨(dú)立的地位和利用價(jià)值(流程見圖2)。
其中,“數(shù)據(jù)接收”是指數(shù)據(jù)知識(shí)庫作為第三方機(jī)構(gòu)接收來自作者、團(tuán)體、機(jī)構(gòu)等提交的數(shù)據(jù)或從其他存儲(chǔ)網(wǎng)絡(luò)遷移的數(shù)據(jù),這也是數(shù)據(jù)知識(shí)庫獲得數(shù)據(jù)最主要的途徑;“數(shù)據(jù)大處理”是指數(shù)據(jù)知識(shí)庫的管理人員對接收的數(shù)據(jù)進(jìn)行處理,包括可能需要進(jìn)行的數(shù)據(jù)選擇和數(shù)據(jù)清洗,過濾沒有任何價(jià)值的、亂碼等情況的無效數(shù)據(jù),對數(shù)據(jù)存在的較為明顯的問題進(jìn)行清洗從而將其轉(zhuǎn)化為可利用的數(shù)據(jù);“數(shù)據(jù)審查”是由數(shù)據(jù)知識(shí)庫的專業(yè)/專門數(shù)據(jù)管理人員對數(shù)據(jù)的技術(shù)性問題進(jìn)行審查,包括數(shù)據(jù)格式的兼容性、數(shù)據(jù)描述的完整性、元數(shù)據(jù)與數(shù)據(jù)本身的匹配性等,以及由學(xué)科領(lǐng)域內(nèi)的專家學(xué)者對數(shù)據(jù)進(jìn)行科學(xué)性評議,包括數(shù)據(jù)邏輯的流暢與正確、數(shù)據(jù)內(nèi)容的完整度、數(shù)據(jù)的科學(xué)價(jià)值等。
2.1.3? 數(shù)據(jù)論文出版
數(shù)據(jù)論文形式的數(shù)據(jù)出版包括兩方面的內(nèi)容:一是對數(shù)據(jù)的方法、內(nèi)容、價(jià)值等進(jìn)行描述的數(shù)據(jù)論文;二是數(shù)據(jù)(集)本身的存儲(chǔ)與公開發(fā)布及其與數(shù)據(jù)論文的關(guān)聯(lián),因此數(shù)據(jù)論文往往與數(shù)據(jù)存儲(chǔ)結(jié)合才能稱為完整意義上的數(shù)據(jù)出版(流程見圖3)。
2.2? ? 數(shù)據(jù)出版生態(tài)系統(tǒng)
2.2.1? 數(shù)據(jù)出版協(xié)同環(huán)節(jié)及質(zhì)量可控環(huán)節(jié)
除數(shù)據(jù)出版的主要環(huán)節(jié)外,數(shù)據(jù)政策與標(biāo)準(zhǔn),數(shù)據(jù)備份、轉(zhuǎn)換、處置、遷移等也是與數(shù)據(jù)出版相關(guān)的協(xié)同環(huán)節(jié)?!皵?shù)據(jù)政策”主要指研究資助機(jī)構(gòu)及研究機(jī)構(gòu)本身制定的數(shù)據(jù)開放、數(shù)據(jù)共享、數(shù)據(jù)開放存取政策,受資助的機(jī)構(gòu)、團(tuán)體、個(gè)人等遵照執(zhí)行;“數(shù)據(jù)標(biāo)準(zhǔn)”是指相關(guān)主體執(zhí)行數(shù)據(jù)出版相關(guān)標(biāo)準(zhǔn)與規(guī)范,如數(shù)據(jù)格式規(guī)范、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)知識(shí)庫系統(tǒng)標(biāo)準(zhǔn)等;“數(shù)據(jù)備份”是對數(shù)據(jù)進(jìn)行備份以便應(yīng)對數(shù)據(jù)丟失、數(shù)據(jù)損壞、數(shù)據(jù)操作失誤后需要復(fù)原但無法復(fù)原等意外情況;“數(shù)據(jù)轉(zhuǎn)換”是根據(jù)需求對數(shù)據(jù)類型、數(shù)據(jù)格式等進(jìn)行轉(zhuǎn)換;“數(shù)據(jù)處置”是對非永久保存的數(shù)據(jù)進(jìn)行處置,如對喪失價(jià)值的數(shù)據(jù)進(jìn)行清除;“數(shù)據(jù)遷移”是將數(shù)據(jù)從一個(gè)存儲(chǔ)位置遷移到另一個(gè)存儲(chǔ)位置。
此外,數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)政策、數(shù)據(jù)計(jì)劃、數(shù)據(jù)創(chuàng)建、數(shù)據(jù)描述、數(shù)據(jù)審查、科學(xué)評議、分配永久標(biāo)識(shí)符、數(shù)據(jù)知識(shí)庫管理等均是能夠進(jìn)行質(zhì)量控制的環(huán)節(jié),這些環(huán)節(jié)涉及數(shù)據(jù)的標(biāo)準(zhǔn)/規(guī)范、工具/平臺(tái)、內(nèi)容/形式等層次和維度,數(shù)據(jù)出版需從其中的多個(gè)維度進(jìn)行全面的質(zhì)量控制。
2.2.2? 數(shù)據(jù)出版生態(tài)系統(tǒng)
數(shù)據(jù)出版的整個(gè)流程以“數(shù)據(jù)計(jì)劃”為起點(diǎn),以數(shù)據(jù)利用及其評價(jià)為終結(jié)。將三種模式的數(shù)據(jù)出版整合到同一出版體系中(生態(tài)系統(tǒng)見圖4),出版流程包含“數(shù)據(jù)計(jì)劃”“數(shù)據(jù)創(chuàng)建”“數(shù)據(jù)描述”“數(shù)據(jù)提交”“數(shù)據(jù)評審”“分配永久標(biāo)識(shí)符”“數(shù)據(jù)(永久)保存”“數(shù)據(jù)利用”“數(shù)據(jù)利用評價(jià)”等基礎(chǔ)和共同環(huán)節(jié);從“數(shù)據(jù)(永久)保存”環(huán)節(jié)后,開始分流為三種出版模式,并且數(shù)據(jù)發(fā)布或出版之后的“數(shù)據(jù)知識(shí)庫管理”“數(shù)據(jù)利用”“數(shù)據(jù)利用評價(jià)”又成為共同環(huán)節(jié),各環(huán)節(jié)及其執(zhí)行人員共同構(gòu)成科學(xué)數(shù)據(jù)開放出版生態(tài)系統(tǒng)。
3? ?數(shù)據(jù)質(zhì)量控制的三個(gè)層次和維度
3.1? ? 相關(guān)標(biāo)準(zhǔn)、規(guī)范與數(shù)據(jù)質(zhì)量控制
科學(xué)數(shù)據(jù)相關(guān)的標(biāo)準(zhǔn)、原則、規(guī)范等“規(guī)矩”是能夠?qū)?shù)據(jù)出版質(zhì)量控制產(chǎn)生重要作用的外在因素。
3.1.1? 科學(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)
通常認(rèn)為,元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,國際標(biāo)準(zhǔn)化組織(ISO)將元數(shù)據(jù)定義為關(guān)于數(shù)據(jù)內(nèi)容、質(zhì)量、條件狀態(tài)及其它特征的描述;那么,科學(xué)數(shù)據(jù)元數(shù)據(jù)則是“描述科學(xué)數(shù)據(jù)的數(shù)據(jù)”,是關(guān)于科學(xué)數(shù)據(jù)內(nèi)容、質(zhì)量、條件狀態(tài)及其他特征的描述。元數(shù)據(jù)直接影響數(shù)據(jù)的傳播、共享和重用,蔡迎春[15]認(rèn)為數(shù)據(jù)服務(wù)質(zhì)量取決于數(shù)據(jù)資源的元數(shù)據(jù)質(zhì)量,元數(shù)據(jù)質(zhì)量本身成為了數(shù)據(jù)質(zhì)量的重要組成部分。科學(xué)數(shù)據(jù)元數(shù)據(jù)作為描述數(shù)據(jù)資源特征和屬性的結(jié)構(gòu)化數(shù)據(jù)[16],具有數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)利用等功能特點(diǎn)[17]。
元數(shù)據(jù)標(biāo)準(zhǔn)包括通用元數(shù)據(jù)標(biāo)準(zhǔn)和特定學(xué)科領(lǐng)域或行業(yè)的元數(shù)據(jù)標(biāo)準(zhǔn)。都柏林核心元數(shù)據(jù)(DC元數(shù)據(jù))是國際上廣泛應(yīng)用的通用元數(shù)據(jù)標(biāo)準(zhǔn)(ISO 15836)[18],具有很強(qiáng)的擴(kuò)展性和移植性,現(xiàn)有各類元數(shù)據(jù)方案大多參考DC元數(shù)據(jù)而設(shè)計(jì)。國內(nèi)外特定學(xué)科領(lǐng)域或行業(yè)的元數(shù)據(jù)標(biāo)準(zhǔn)也較為豐富,包括國際標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn),如美國聯(lián)邦地理數(shù)據(jù)委員會(huì)(Federal Geographic Data Committee)制定的“地球空間數(shù)據(jù)資產(chǎn)元數(shù)據(jù)標(biāo)準(zhǔn)”(National Geospatial Data Assets Metadata)[19];描述地理信息和服務(wù)相關(guān)的標(biāo)識(shí)、范圍、質(zhì)量、空間、時(shí)間、內(nèi)容、空間參照系、描繪、分布等屬性的“地理信息元數(shù)據(jù)”標(biāo)準(zhǔn)(ISO 19115)[20]等。
3.1.2? 數(shù)字對象唯一標(biāo)識(shí)符及其標(biāo)準(zhǔn)
數(shù)字對象唯一標(biāo)識(shí)符(Digital Object Identifier,DOI)[21]是“用于識(shí)別數(shù)字環(huán)境下對象的知識(shí)產(chǎn)權(quán)的字符串”[22],是指“一個(gè)對象的數(shù)字標(biāo)識(shí)符”(digital identifier of an object)而不是“一個(gè)數(shù)字化對象的標(biāo)識(shí)符”(identifier of a digital object)[23],主要用于對對象的數(shù)字化內(nèi)容進(jìn)行原文獲取、引文鏈接、數(shù)字版權(quán)管理及永久標(biāo)識(shí)等,已經(jīng)在國際國內(nèi)出版領(lǐng)域得到了廣泛的應(yīng)用。DOI由國際DOI基金會(huì)于1998年發(fā)起,已于2012年成為ISO“信息與文獻(xiàn)”領(lǐng)域的一項(xiàng)國際標(biāo)準(zhǔn)(標(biāo)準(zhǔn)號(hào)ISO 26324:2012),并沿用至今。
科學(xué)數(shù)據(jù)作為一類重要的數(shù)字資源,其管理機(jī)構(gòu)也同樣應(yīng)用DOI來對數(shù)據(jù)資源進(jìn)行管理以促進(jìn)科學(xué)數(shù)據(jù)的出版和傳播,如世界數(shù)據(jù)中心(WDC)、國際科技數(shù)據(jù)委員會(huì)(CODATA)德國委員會(huì)等。DOI因其能夠?qū)?shù)據(jù)資源進(jìn)行持久唯一標(biāo)識(shí)、動(dòng)態(tài)更新、與物理地址變動(dòng)無關(guān)、能跟蹤版本更新信息、引用方便等特征[24],滿足了目前科學(xué)數(shù)據(jù)管理的主要需求(DOI特征與數(shù)據(jù)管理與出版需求對應(yīng)情況見表1)。
3.1.3? 數(shù)字記錄與保存系統(tǒng)的可信賴性標(biāo)準(zhǔn)
“可信賴”成為衡量數(shù)字記錄與保存系統(tǒng)質(zhì)量的重要標(biāo)準(zhǔn),包括成為可信賴的數(shù)據(jù)知識(shí)庫的標(biāo)準(zhǔn)要求和對數(shù)據(jù)知識(shí)庫進(jìn)行審計(jì)與認(rèn)證的標(biāo)準(zhǔn)。如2012年,ISO針對數(shù)字記錄的存儲(chǔ)與管理問題制定“數(shù)字記錄可信第三方庫”(trusted third party repository for digital records)[25]標(biāo)準(zhǔn)(標(biāo)準(zhǔn)號(hào)ISO 17068),該標(biāo)準(zhǔn)主要包括可信第三方庫(TTPR)服務(wù)、TTPR系統(tǒng)要求、管理要求等三方面內(nèi)容。其中,第三方庫的“可信”特征便是指TTPR的質(zhì)量可信,而認(rèn)證服務(wù)和認(rèn)證系統(tǒng)、驗(yàn)證系統(tǒng)及審計(jì)管理也都是數(shù)據(jù)質(zhì)量控制的有效方式。同年,空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)(CCSDS)[26]、研究圖書館工作組(RLG)等制定的數(shù)字存儲(chǔ)庫審計(jì)與認(rèn)證規(guī)范在較為廣泛的實(shí)踐和較好的實(shí)施效果的基礎(chǔ)上,成為“空間數(shù)據(jù)和信息傳輸系統(tǒng)”領(lǐng)域的一項(xiàng)國際標(biāo)準(zhǔn)“可信賴數(shù)字存儲(chǔ)庫審計(jì)與認(rèn)證”(標(biāo)準(zhǔn)號(hào)ISO 16363)[27]。該標(biāo)準(zhǔn)定義了評估數(shù)字存儲(chǔ)庫的可靠做法,數(shù)字存儲(chǔ)庫的審計(jì)與認(rèn)證主要包括組織基礎(chǔ)設(shè)施、數(shù)字對象管理、基礎(chǔ)設(shè)施與安全風(fēng)險(xiǎn)管理等三方面的內(nèi)容。
3.2? ? 相關(guān)工具、平臺(tái)與數(shù)據(jù)質(zhì)量控制
3.2.1? 數(shù)據(jù)管理計(jì)劃及其工具
數(shù)據(jù)管理計(jì)劃(Data Management Plan,DMP)是描述研究過程中和研究完成后如何處理數(shù)據(jù)的正式文件[28],是研究者遵從相關(guān)數(shù)據(jù)政策要求而制定的關(guān)于如何有效管理和共享自己的科學(xué)數(shù)據(jù)的簡要計(jì)劃與行動(dòng)方案,通常涵蓋了部分或全部的數(shù)據(jù)生命周期。
DMP作為資助機(jī)構(gòu)或研究機(jī)構(gòu)的一項(xiàng)要求,是在數(shù)據(jù)創(chuàng)建之前對未來可預(yù)期的數(shù)據(jù)管理與共享進(jìn)行規(guī)范化指導(dǎo)的有效工具,對數(shù)據(jù)管理與出版的意義體現(xiàn)在兩方面:一是基礎(chǔ)性,無論從數(shù)據(jù)管理生命周期還是數(shù)據(jù)出版流程看,數(shù)據(jù)計(jì)劃都是最基礎(chǔ)的第一步,正所謂“良好的開端是成功的一半”。若數(shù)據(jù)管理計(jì)劃的質(zhì)量和計(jì)劃執(zhí)行的質(zhì)量都能得到保證,那么數(shù)據(jù)出版的質(zhì)量便能在很大程度上得到保證;二是統(tǒng)籌性與規(guī)范化,數(shù)據(jù)管理計(jì)劃驅(qū)動(dòng)了數(shù)據(jù)管理與出版的生命周期,數(shù)據(jù)管理計(jì)劃作為綱領(lǐng)性文件統(tǒng)籌著數(shù)據(jù)管理的每一個(gè)環(huán)節(jié)并奠定規(guī)范化基調(diào),如沈彤等[29]認(rèn)為數(shù)據(jù)管理計(jì)劃是最重要的數(shù)據(jù)管理文件之一,是保證數(shù)據(jù)質(zhì)量的根本文件。
常用的數(shù)據(jù)管理計(jì)劃工具包括英國數(shù)字監(jiān)護(hù)中心(DCC)開發(fā)的DMPonline、美國加利福尼亞數(shù)字圖書館和DataONE聯(lián)合開發(fā)的DMPTool以及加拿大研究圖書館協(xié)會(huì)開發(fā)的英法雙語工具DMP Assistant,三者在美國、加拿大、英國及其它歐洲國家中得到廣泛應(yīng)用。
3.2.2? 數(shù)據(jù)管理與出版開源系統(tǒng)
根據(jù)圖書館出版聯(lián)盟(Library Publishing Coalition,LPC)發(fā)布的2014-2018年度《圖書館出版名錄》[30]可知,圖書館及出版行業(yè)常用的在線出版平臺(tái)和基礎(chǔ)設(shè)施包括Open Journal Systems(OJS)、DSpace、bepress、WordPress、CONTENTdm、Dataverse、Fedora等,而研究數(shù)據(jù)管理領(lǐng)域的主流平臺(tái)所使用的開源軟件產(chǎn)品包括Dataverse、Data conservancy、CKAN和DSpace等[31]。其中,哈佛大學(xué)定量社會(huì)科學(xué)研究所(IQSS)與哈佛大學(xué)圖書館、哈佛大學(xué)信息技術(shù)組織聯(lián)合開發(fā)的Dataverse[32],麻省理工學(xué)院圖書館和惠普公司實(shí)驗(yàn)室聯(lián)合開發(fā)的DSpace[33]是國內(nèi)外應(yīng)用最為廣泛的數(shù)據(jù)管理與出版開源系統(tǒng)。
DSpace和Dataverse作為數(shù)字化資源管理的開源軟件有很多優(yōu)點(diǎn),如元數(shù)據(jù)標(biāo)準(zhǔn)及方案、數(shù)據(jù)引用標(biāo)準(zhǔn)、系統(tǒng)本地化或個(gè)性化、數(shù)字保存等。以DSpace和Dataverse等開源軟件為基礎(chǔ)的知識(shí)庫系統(tǒng)整合了元數(shù)據(jù)、DOI的全部元素,也集元數(shù)據(jù)、DOI的全部功能于一身;是將數(shù)據(jù)管理計(jì)劃付諸實(shí)踐必需的載體平臺(tái),也是目前為止進(jìn)行數(shù)據(jù)管理與出版可選的理想工具。
3.2.3? 數(shù)據(jù)知識(shí)庫的管理運(yùn)行及質(zhì)量控制
數(shù)據(jù)知識(shí)庫是數(shù)據(jù)作者、研究資助機(jī)構(gòu)及用戶管理和利用數(shù)據(jù)的操作平臺(tái),數(shù)據(jù)知識(shí)庫本身的管理、運(yùn)行、維護(hù)、評價(jià)也是整個(gè)數(shù)據(jù)管理與出版生態(tài)系統(tǒng)中的重要環(huán)節(jié),而數(shù)據(jù)庫注冊、審計(jì)和認(rèn)證是其中現(xiàn)行且有效的質(zhì)量控制辦法。
根據(jù)相關(guān)研究[14,34]可知,常見數(shù)據(jù)知識(shí)庫注冊系統(tǒng)有re3data.org、FAIRsharing、ROAR和OpenDOAR等;常見的數(shù)據(jù)知識(shí)庫審計(jì)、認(rèn)證與評估工具包括DRAMBORA方法、數(shù)據(jù)認(rèn)可印章(Data Seal of Approval,DSA)、“可信賴知識(shí)庫審計(jì)與認(rèn)證(TRAC)”、“可信任數(shù)據(jù)知識(shí)庫標(biāo)準(zhǔn)nestor目錄”、“CCSDS推薦/DIN 31644標(biāo)準(zhǔn)/ISO 16363標(biāo)準(zhǔn)”以及歐盟可信賴數(shù)字倉儲(chǔ)審計(jì)與認(rèn)證框架[35]等。
數(shù)據(jù)知識(shí)庫注冊、審計(jì)、認(rèn)證的作用體現(xiàn)在:首先,利用數(shù)據(jù)知識(shí)庫目錄系統(tǒng)對其注冊與發(fā)展情況進(jìn)行統(tǒng)計(jì)分析,過濾掉因質(zhì)量問題而不能進(jìn)行注冊的知識(shí)庫;其次,從基礎(chǔ)設(shè)施建設(shè)與審計(jì)、數(shù)字對象管理、安全風(fēng)險(xiǎn)管理的維度對數(shù)據(jù)知識(shí)庫進(jìn)行有效的審計(jì)與評估,有利于及時(shí)監(jiān)測、報(bào)告數(shù)據(jù)知識(shí)庫的風(fēng)險(xiǎn)并提供有效的解決辦法;最后,對達(dá)到審計(jì)與評估標(biāo)準(zhǔn)的數(shù)據(jù)知識(shí)庫進(jìn)行認(rèn)證并授予認(rèn)證標(biāo)識(shí)。因此,注冊、審計(jì)、評估與認(rèn)證是提升數(shù)據(jù)知識(shí)庫可信賴性,進(jìn)而提升數(shù)據(jù)質(zhì)量的有效方法。
3.3? ? 數(shù)據(jù)內(nèi)容、形式評審與數(shù)據(jù)質(zhì)量控制
數(shù)據(jù)評審是同行評審的新發(fā)展,Peer和Green[36]將數(shù)據(jù)評審定義為“采取必要措施對數(shù)據(jù)及相關(guān)文件進(jìn)行評估,確保文件可被獨(dú)立地理解以便重用的有效過程”,該過程涉及對文件、文檔、數(shù)據(jù)及代碼等的評審。
3.3.1? 數(shù)據(jù)評審的三個(gè)考察維度
相關(guān)研究[8,37]表明,數(shù)據(jù)評審可分為科學(xué)性評審(scientific review)、技術(shù)性評審(technical review)和監(jiān)護(hù)性評審(curatorial review)三個(gè)維度,評審對象分別為數(shù)據(jù)內(nèi)容、數(shù)據(jù)形式與元數(shù)據(jù)、語境信息和/或其他相關(guān)文檔,主要評審主體分別為同行專家/編輯、學(xué)科領(lǐng)域內(nèi)數(shù)據(jù)專家和/或數(shù)據(jù)管理人員、數(shù)據(jù)管理人員,但在數(shù)據(jù)出版實(shí)踐中數(shù)據(jù)評審?fù)ǔH诤先齻€(gè)維度的內(nèi)容與方法,對數(shù)據(jù)進(jìn)行綜合的評審和全面的質(zhì)量控制。
科學(xué)性評審則是對數(shù)據(jù)內(nèi)容的各類科學(xué)性特征進(jìn)行評審,以保障數(shù)據(jù)的科學(xué)性質(zhì)量,數(shù)據(jù)的科學(xué)性質(zhì)量包括但不限于數(shù)據(jù)源的完整性、真實(shí)性、準(zhǔn)確性、可靠性;數(shù)據(jù)渠道的可訪問性、可獲得性、訪問安全;數(shù)據(jù)利用的可理解性、有用性、增值性等。
技術(shù)性評審主要包括對數(shù)據(jù)格式和元數(shù)據(jù)的評審,數(shù)據(jù)格式評審包括:①格式標(biāo)準(zhǔn)化,方便使用及格式轉(zhuǎn)換;②格式標(biāo)準(zhǔn)開源化,最大程度上實(shí)現(xiàn)格式標(biāo)準(zhǔn)的實(shí)施范圍與程度;③格式兼容性最大化;④格式獨(dú)立,對軟件及平臺(tái)的依賴性最小化;⑤格式處理成本最低化。元數(shù)據(jù)評審包括:①元數(shù)據(jù)完整性;②元數(shù)據(jù)準(zhǔn)確性;③元數(shù)據(jù)描述的真實(shí)性;④元數(shù)據(jù)的增強(qiáng)功能。
監(jiān)護(hù)性評審是對數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式、元數(shù)據(jù)以外的上下文/語境信息、數(shù)據(jù)相關(guān)文檔、編碼、源代碼等進(jìn)行監(jiān)護(hù)性的檢查和審核,其監(jiān)護(hù)性評審可能包括的質(zhì)量因素有:①文檔的相關(guān)性;②文檔的充分性,如數(shù)據(jù)來源、數(shù)據(jù)環(huán)境、數(shù)據(jù)收集/處理/分析方法等文檔是否齊全;③文檔版本控制及相關(guān)文檔信息更迭的及時(shí)性;④數(shù)據(jù)與其他文檔關(guān)系的協(xié)調(diào)性(如數(shù)據(jù)對政策、標(biāo)準(zhǔn)等的遵循)。
3.3.2? 數(shù)據(jù)評審的兩個(gè)操作層面
在目前的數(shù)據(jù)出版實(shí)踐活動(dòng)中,數(shù)據(jù)質(zhì)量控制主要集中在技術(shù)性審查,對數(shù)據(jù)本身的科學(xué)性評審開展得相對較少且以基礎(chǔ)的科學(xué)評審為主;此外,數(shù)據(jù)出版實(shí)踐活動(dòng)通常融合不同的內(nèi)容與方法[8]、協(xié)同不同審查主體的角色[38],對數(shù)據(jù)進(jìn)行綜合的審查和全面的質(zhì)量控制,科學(xué)性審查與技術(shù)性審查并不總是分開進(jìn)行。因此,將數(shù)據(jù)質(zhì)量控制劃分為技術(shù)與科學(xué)層面、管理與傳播層面的質(zhì)量控制更貼合實(shí)際,前者包括元數(shù)據(jù)標(biāo)準(zhǔn)方案選擇與應(yīng)用、元數(shù)據(jù)檢查與驗(yàn)證、數(shù)據(jù)格式推薦與轉(zhuǎn)換、數(shù)字標(biāo)識(shí)符應(yīng)用、數(shù)據(jù)檢驗(yàn)、數(shù)據(jù)同行評審等;后者包括數(shù)據(jù)知識(shí)庫注冊、審計(jì)與認(rèn)證,數(shù)據(jù)引用原則制定與格式推薦等[12]。
4? ?數(shù)據(jù)出版質(zhì)量控制體系構(gòu)建
4.1? ? 數(shù)據(jù)出版質(zhì)量控制體系框架要素
以數(shù)據(jù)出版流程及其協(xié)同環(huán)節(jié)為基礎(chǔ),本文制定了科學(xué)數(shù)據(jù)開放出版質(zhì)量控制體系的框架要素(見表2)。
4.2? ? 面向流程的數(shù)據(jù)出版質(zhì)量控制體系構(gòu)建
在本文所呈現(xiàn)的“科學(xué)數(shù)據(jù)開放出版生態(tài)系統(tǒng)”的基礎(chǔ)上,結(jié)合數(shù)據(jù)質(zhì)量控制的三個(gè)維度和兩個(gè)操作層面所涉及的數(shù)據(jù)質(zhì)量控制辦法,本研究初步構(gòu)建面向出版流程的“科學(xué)數(shù)據(jù)開放出版質(zhì)量控制體系”(見圖5),以期較為全面地呈現(xiàn)數(shù)據(jù)出版的全局內(nèi)容,為數(shù)據(jù)出版質(zhì)量控制的路徑選擇提供參考。
該體系以“科學(xué)數(shù)據(jù)開放出版生態(tài)系統(tǒng)”為主體,以數(shù)據(jù)出版流程為主軸,針對數(shù)據(jù)出版各環(huán)節(jié)及其協(xié)同環(huán)節(jié)提供可能的質(zhì)量控制辦法:(1)數(shù)據(jù)政策:國家政府機(jī)構(gòu)、研究資助機(jī)構(gòu)、教育科研機(jī)構(gòu)等制定的數(shù)據(jù)政策是數(shù)據(jù)出版應(yīng)該遵循的一種規(guī)范,對數(shù)據(jù)出版具有指導(dǎo)性或約束性作用,而數(shù)據(jù)政策也能夠在數(shù)據(jù)管理與數(shù)據(jù)出版的實(shí)踐中不斷完善,從而更具適用性;(2)數(shù)據(jù)標(biāo)準(zhǔn):國際組織、政府、學(xué)科、行業(yè)等制定的數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)出版應(yīng)該符合的一種規(guī)范,對數(shù)據(jù)出版具有指導(dǎo)性,依照標(biāo)準(zhǔn)出版的數(shù)據(jù)往往具有更高的規(guī)范性、兼容性、可靠性,也因此更可能具有較高的數(shù)據(jù)質(zhì)量和利用價(jià)值;(3)數(shù)據(jù)計(jì)劃:首先可利用數(shù)據(jù)管理計(jì)劃的向?qū)絼?chuàng)建工具(提問式引導(dǎo)或高質(zhì)量模板)進(jìn)行數(shù)據(jù)管理計(jì)劃的創(chuàng)建,另外還可對數(shù)據(jù)管理計(jì)劃內(nèi)容框架的覆蓋范圍、質(zhì)量等進(jìn)行評審;(4)數(shù)據(jù)描述:最重要的是利用標(biāo)準(zhǔn)化、規(guī)范化的術(shù)語對數(shù)據(jù)進(jìn)行描述,使用合適的元數(shù)據(jù)標(biāo)準(zhǔn)方案;(5)數(shù)據(jù)提交:數(shù)據(jù)知識(shí)庫最好采用性能較好的數(shù)據(jù)管理與出版系統(tǒng),以便數(shù)據(jù)提交及發(fā)布等過程的自動(dòng)化、規(guī)范化;(6)分配(永久)標(biāo)識(shí)符:DOI已成為國內(nèi)外較為廣泛應(yīng)用的數(shù)字對象標(biāo)識(shí)符,DOI具有唯一且永久標(biāo)識(shí)、首發(fā)確認(rèn)、版權(quán)保護(hù)等作用,數(shù)據(jù)出版可以完全實(shí)現(xiàn)DOI標(biāo)識(shí);(7)數(shù)據(jù)知識(shí)庫注冊、審計(jì)與認(rèn)證:數(shù)據(jù)知識(shí)庫管理者應(yīng)主動(dòng)進(jìn)行數(shù)據(jù)知識(shí)庫的注冊,而期刊出版商、數(shù)據(jù)作者往往傾向于優(yōu)先選擇已注冊的數(shù)據(jù)知識(shí)庫以確保其信譽(yù),數(shù)據(jù)知識(shí)庫可以積極主動(dòng)地接受審計(jì)和認(rèn)證并獲取相關(guān)標(biāo)識(shí),提升公共誠信的可見度;(8)數(shù)據(jù)附件、數(shù)據(jù)論文、數(shù)據(jù)知識(shí)庫同行評審:對數(shù)據(jù)附件、數(shù)據(jù)論文和數(shù)據(jù)知識(shí)庫的內(nèi)容與形式進(jìn)行評審,確保其質(zhì)量;(9)推薦數(shù)據(jù)引用格式:由于數(shù)據(jù)引用標(biāo)準(zhǔn)遠(yuǎn)不如文獻(xiàn)著錄標(biāo)準(zhǔn)那般豐富和完善,因此擬定要素齊全的數(shù)據(jù)引用格式加以推薦有利于數(shù)據(jù)重用;(10)質(zhì)量控制標(biāo)識(shí):為采取數(shù)據(jù)出版質(zhì)量控制手段并取得一定成效的數(shù)據(jù)知識(shí)庫授予“質(zhì)量控制標(biāo)識(shí)”,為用戶判別其質(zhì)量和信譽(yù)提供參考。
5? ?結(jié)語
數(shù)據(jù)出版是數(shù)據(jù)開放共享的有效途徑,質(zhì)量控制是提升和保障數(shù)據(jù)價(jià)值的重要手段。數(shù)據(jù)出版內(nèi)容、方法、工具呈現(xiàn)多元性,數(shù)據(jù)出版活動(dòng)具有復(fù)雜性,數(shù)據(jù)出版有多種模式,對應(yīng)不同的質(zhì)量控制方法,一定程度上使得把握數(shù)據(jù)出版及其質(zhì)量控制的全貌變得困難。因此,文章梳理不同數(shù)據(jù)出版模式的流程特點(diǎn)及其角色主體,協(xié)同數(shù)據(jù)管理與出版的關(guān)聯(lián)環(huán)節(jié),以此為基礎(chǔ)構(gòu)建融合多種數(shù)據(jù)出版模式的數(shù)據(jù)出版生態(tài)系統(tǒng);將數(shù)據(jù)出版質(zhì)量可控環(huán)節(jié)劃分為三個(gè)維度,分別是起間接質(zhì)量控制作用的標(biāo)準(zhǔn)、規(guī)范和起直接作用的工具、平臺(tái),以及針對數(shù)據(jù)本身的內(nèi)容與形式評審;在出版生態(tài)系統(tǒng)和質(zhì)量控制內(nèi)容與方法的基礎(chǔ)上,確定質(zhì)量控制體系的要素,構(gòu)建數(shù)據(jù)出版質(zhì)量控制體系,為綜合的、復(fù)雜的數(shù)據(jù)出版及其質(zhì)量控制活動(dòng)提供全局視角和完整參考。
參考文獻(xiàn):
[1]? 黃國彬,王舒,屈亞杰.科學(xué)數(shù)據(jù)出版模式比較研究[J].大學(xué)圖書館學(xué)報(bào),2018,36(1):34-40,33.
[2]? 孔麗華.科學(xué)數(shù)據(jù)質(zhì)量同行評議現(xiàn)狀[R/OL].[2017-01-09].http://ir.las.ac.cn/handle/12502/7968.
[3]? 張靜蓓,任樹懷.科研數(shù)據(jù)出版模式、流程及引用策略研究[J].圖書情報(bào)工作,2015,59(9):21-27.
[4]? Lawrence B,Jones C,Matthews B,et al.Citation and Peer Review of Data:Moving Towards Formal Data Publication[J].International Journal of Digital Curation,2011,6(2):4-37.
[5]? 張麗麗,黎建輝.科研數(shù)據(jù)的開放:進(jìn)展、模式與新探索[J].大數(shù)據(jù),2016(6):25-33.
[6]? 張小強(qiáng),李欣.數(shù)據(jù)出版理論與實(shí)踐關(guān)鍵問題[J].中國科技期刊研究,2015(8):813-821.
[7]? Pampel H,Pfeiffenberger H,Schfer A,et al. Report on Peer Review of Research Data in Scholarly Communication[R/OL].[2017-10-05].https://www.researchgate.net/publication/224922538_Report_on_Peer_Review_of_Research_Data_in_Scholarly_Communication.
[8]? Austin C C,Bloom T,Dallmeier-Tiessen S,et al. Key components of data publishing:using current best practices to develop a reference model for data publishing[J].International Journal on Digital Libraries,2016:1-16.
[9]? 王丹丹.科學(xué)數(shù)據(jù)出版過程中的數(shù)據(jù)質(zhì)量控制[J].圖書情報(bào)工作,2015,59(23):124-129.
[10]? 屈寶強(qiáng),王凱.數(shù)據(jù)出版視角下的科學(xué)數(shù)據(jù)同行評議[J].圖書館雜志,2017,36(10):71-77.
[11]? 張靜蓓,任樹懷.國外科研數(shù)據(jù)知識(shí)庫數(shù)據(jù)質(zhì)量控制研究[J].圖書館雜志,2016,35(11):38-44.
[12]? 涂志芳,劉茲恒.國外數(shù)據(jù)知識(shí)庫模式的數(shù)據(jù)出版質(zhì)量控制實(shí)踐研究[J].圖書館建設(shè),2018(3):5-13.
[13]? Gordon K. Principles of Data Management[EB/OL].[2018-11-15].http://bcs.org/upload/pdf/data-management-chapter1.pdf.
[14]? 涂志芳.科學(xué)數(shù)據(jù)開放出版質(zhì)量控制研究[D].北京:北京大學(xué),2017.
[15]? 蔡迎春.分布式機(jī)構(gòu)庫的質(zhì)量控制[J].圖書情報(bào)工作,2008,52(7):44-47.
[16]? 趙華,王健.科學(xué)數(shù)據(jù)元數(shù)據(jù)功能與內(nèi)容分析[J].科技管理研究,2015(17):232-235.
[17]? Qin J,Ball A,Greenberg J.Functional and architectural requirements for metadata:supporting discovery and management of scientific data[C].Twelfth International Conference on Dublin Core and Metadata Applications.Malaysia:University of Bath,2012:62-71.
[18]? ISO 15836:2009.Information and documentation—The Dublin Core metadata element set[EB/OL].[2017-04-09].https://www.iso.org/standard/52142.html.
[19]? Federal Geographic Data Committee.National Geospatial Data Assets (NGDA) Metadata Guidelines[EB/OL].[2017-02-08].https://cms.geoplatform.gov/sites/default/files/document_library/NGDA_Metadata_Guidelines.pdf.
[20]? ISO 19115-1:2014.Geographic information—Metadata[EB/OL].[2017-04-09].https://www.iso.org/standard/53798.html.
[21]? DOI.The DOI system[EB/OL].[2017-02-07].http://www.doi.org/.
[22]? Chandrakar R.Digital object identifier system:an overview[J].The Electronic Library,2006,24(4):445-452.
[23]? ISO 26324:2012.Information and documentation-Digital object identifier system[EB/OL].[2017-02-10].https://www.iso.org/standard/43506.html.
[24]? 涂勇,彭潔.數(shù)字對象唯一標(biāo)識(shí)在中國科學(xué)數(shù)據(jù)領(lǐng)域中的應(yīng)用研究[J].數(shù)字圖書館論壇,2013(8):31-36.
[25]? ISO/TR 17068:2012.Information and documentation—Trusted third party repository for digital records[EB/OL].[2017-02-06].https://www.iso.org/obp/ui/#iso:std:iso:tr:17068:ed-1:v1:en.
[26]? CCSDS[EB/OL].[2017-02-25].https://public.ccsds.org/default.aspx.
[27]? ISO 16363:2012 Space data and information transfer systems—Audit and certification of trustworthy digital repositories[EB/OL].[2017-02-06].https://www.iso.org/standard/56510.html.
[28]? Data Management General Guidance[EB/OL].[2017-02-12].https://dmptool.org/dm_guidance.
[29]? 沈彤,徐列東,付海軍,等.數(shù)據(jù)管理計(jì)劃的結(jié)構(gòu)與內(nèi)容[J].藥學(xué)學(xué)報(bào),2015(11):1388-1392.
[30]? Library Publishing Coalition.Library Publishing Directory 2014-2018[EB/OL].[2018-11-21].https://librarypublishing.org/resources/.
[31]? 朱玲,聶華,崔海媛,等.北京大學(xué)開放研究數(shù)據(jù)平臺(tái)建設(shè):探索與實(shí)踐[J].圖書情報(bào)工作,2016(4):44-51.
[32]? Dataverse.Best practices[EB/OL].[2017-02-18].http://dataverse.org/best-practices/data-management.
[33]? DSpace[EB/OL].[2017-02-14].http://www.dspace.org/.
[34]? 吳振新.數(shù)字資源長期保存可信賴認(rèn)證研究發(fā)展綜述[J].中國圖書館學(xué)報(bào),2015,41(3):114-126.
[35]? Buddenbohm S,Cretin N,Dijk E,et al.State of the art report on open access publishing of research data in the humanities[R/OL].[2017-01-09].https://halshs.archives-ouvertes.fr/halshs-01357208/document.
[36]? Peer L,Green A.Research Data Review is Gaining Ground[EB/OL].[2017-04-12].http://isps.yale.edu/news/blog/2015/03/research-data-review-is-gaining-ground.
[37]? Callaghan S,Donegan S,Pepler S,et al.Making Data a First Class Scientific Output:Data Citation and Publication by NERC's Environmental Data Centres[J].International Journal of Digital Curation,2012,7(1):107-113.
[38]? Economic and Social Research Council.Transparency of the peer review process[EB/OL].[2017-04-14].http://www.esrc.ac.uk/funding/guidance-for-peer-reviewers/transparency-of-the-peer-review-process/.
作者簡介:涂志芳(1993-),女,中國科學(xué)院文獻(xiàn)情報(bào)中心助理館員,研究方向:信息資源建設(shè)。