張瀟月 顧立平 胡良霖
(1.北京大學(xué)信息管理系 北京 100871;2.中國科學(xué)院大學(xué)經(jīng)濟與管理學(xué)院圖書情報與檔案管理系北京 100049;3.中國科學(xué)院文獻(xiàn)情報中心 北京 100190;4.中國科學(xué)院計算機網(wǎng)絡(luò)信息中心北京 100190;5.國家基礎(chǔ)學(xué)科公共科研數(shù)據(jù)中心 北京 100190)
數(shù)據(jù)重用困難使開放科研數(shù)據(jù)運動難以繼續(xù)得到資助機構(gòu)、科研機構(gòu)及科研人員的長期支持。歐盟開放科學(xué)監(jiān)測平臺[1]研究表明,荷蘭開放科學(xué)實踐中的一項阻礙即如何使數(shù)據(jù)以最合適的方式(被)重用[2]。這說明數(shù)據(jù)重用已經(jīng)成為開放科研數(shù)據(jù)可持續(xù)發(fā)展過程中不可忽視的問題。該問題將對開放科研數(shù)據(jù)的資金管理、科研管理和實踐發(fā)展過程產(chǎn)生一系列影響。目前開放科研數(shù)據(jù)所取得的進展,既使資助機構(gòu)難以在公眾面前展示所資助的科研成果,又存在科研數(shù)據(jù)可重復(fù)程度有待提升的問題[3],科研人員缺乏從中受益的直觀感受。同時,在推動開放科研數(shù)據(jù)重用的過程中,數(shù)據(jù)中心和圖書館對數(shù)據(jù)資產(chǎn)的權(quán)益管理存在眾多模糊地帶,阻礙其深入開展新型數(shù)據(jù)服務(wù)。
基礎(chǔ)設(shè)施環(huán)境為科研數(shù)據(jù)的存儲和開放提供基本條件,也通過對科研數(shù)據(jù)的質(zhì)量控制,為開放科研數(shù)據(jù)的重用活動提供支持。眾學(xué)者以數(shù)據(jù)知識庫和學(xué)術(shù)期刊(刊載論文或數(shù)據(jù)論文的期刊)作為重要觀測點,從可發(fā)現(xiàn)性、科研數(shù)據(jù)質(zhì)量、易用性等角度為科研人員開展科研數(shù)據(jù)重用活動創(chuàng)造條件。例如研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,RDA)的報告認(rèn)為數(shù)據(jù)重用的關(guān)鍵在于基礎(chǔ)設(shè)施的可獲取性;該報告同時指出開發(fā)基礎(chǔ)設(shè)施應(yīng)基于科研人員的實際工作,(為達(dá)該目標(biāo))應(yīng)首先建立一個包括通用組成部分(components)的數(shù)據(jù)出版參考模型。在此基礎(chǔ)上,研究者從知識基礎(chǔ)設(shè)施的角度著重論述數(shù)據(jù)質(zhì)量保證與控制、數(shù)據(jù)出版環(huán)節(jié)[4]。這說明數(shù)據(jù)出版的基礎(chǔ)設(shè)施環(huán)境,可通過質(zhì)量控制與長期持續(xù)運營,影響科研人員的數(shù)據(jù)重用行為。又如Pasquetto等人發(fā)現(xiàn),數(shù)據(jù)質(zhì)量是在多種數(shù)據(jù)重用活動中需考慮的內(nèi)容,并指出在元數(shù)據(jù)、本體和其他文檔充足的情況下,同領(lǐng)域的學(xué)者能通過文檔、文獻(xiàn)等方式獲得充足信息,評估重用數(shù)據(jù)的質(zhì)量和價值,以理解他人的數(shù)據(jù)[5]。這說明,完善背景信息能夠為重用者判斷數(shù)據(jù)質(zhì)量提供更多參考。再如由OpenAIRE、CERN等機構(gòu)共同資助的Zenodo數(shù)據(jù)知識庫,為科研人員科研數(shù)據(jù)與軟件的共享、監(jiān)管與出版提供服務(wù),支持多種類型研究成果的注冊,并與Datacite和學(xué)術(shù)聚合器(the scholarly aggregators)間交換引用信息[6],以確保數(shù)據(jù)重用計量的準(zhǔn)確程度。該數(shù)據(jù)知識庫還按照具體的研究領(lǐng)域,建立了眾多科研社群,截至2020年9月24日,Zenodo共有17 138個社群[7],內(nèi)容涵蓋公共健康、生態(tài)學(xué)、天文學(xué)、物理學(xué)、藝術(shù)學(xué)、語言學(xué)、新能源等諸多領(lǐng)域。這說明,科研數(shù)據(jù)知識庫不僅能滿足科研人員在科研數(shù)據(jù)保存、共享與出版方面對基礎(chǔ)設(shè)施的需求,而且也能夠利用其自身活躍且規(guī)模較為龐大的科研社群,進一步促進學(xué)術(shù)交流與發(fā)展。
國內(nèi)研究首先通過探索國外起步較早且發(fā)展較成熟的科研數(shù)據(jù)知識庫,關(guān)注實現(xiàn)數(shù)據(jù)重用的功能與流程。如劉峰等人指出對數(shù)據(jù)知識庫的研究應(yīng)積極適應(yīng)開放存儲、集成發(fā)現(xiàn)、互操作、開放利用等目標(biāo),并從技術(shù)層面提出包括數(shù)據(jù)集描述與引用、數(shù)據(jù)格式和元數(shù)據(jù)互操作、數(shù)據(jù)權(quán)益保護和利用許可機制等在內(nèi)的若干實施建議[8]。曾麗瑩和劉茲恒分析re3data.org列表內(nèi)國內(nèi)外高校科研數(shù)據(jù)知識庫的特點,從建立完整的數(shù)據(jù)政策、完善元數(shù)據(jù)管理、建立數(shù)據(jù)處理和加工規(guī)范等方面,為我國高??蒲袛?shù)據(jù)知識庫的科研數(shù)據(jù)管理與共享提供建議[9]。這說明國內(nèi)學(xué)者們已關(guān)注到包括科研數(shù)據(jù)知識庫在內(nèi)的基礎(chǔ)設(shè)施環(huán)境對科研數(shù)據(jù)活動的促進作用,并立足基礎(chǔ)設(shè)施的功能提出服務(wù)發(fā)展要點。
政策環(huán)境是激勵與保障科研數(shù)據(jù)重用的重要措施,國外學(xué)者從科研人員權(quán)益保護和利益相關(guān)方權(quán)益協(xié)調(diào)方面,為科研數(shù)據(jù)重用行為提供良好的發(fā)展支持。如數(shù)據(jù)期刊Scientific Data將數(shù)據(jù)重用作為其建立的6大原則之一,即標(biāo)準(zhǔn)化和詳細(xì)的描述使研究數(shù)據(jù)更易于查找和重用;并認(rèn)為它體現(xiàn)于數(shù)據(jù)描述符的充分程度、與數(shù)據(jù)實體的關(guān)聯(lián)程度以及對利益相關(guān)方政策的滿足程度[10]。在行為規(guī)范方面,有學(xué)者從倫理角度探索科研數(shù)據(jù)重用行為中涉及的深層權(quán)益問題。如Darch和Knox基于倫理視角(ethical perspectives)闡述實現(xiàn)數(shù)據(jù)(軟件)共享和重用的方法,即識別與解決利益相關(guān)方倫理視角的差異,培養(yǎng)科研人員在數(shù)據(jù)、軟件管理與共享中的倫理方法;并認(rèn)為在設(shè)計與實施時,既需滿足現(xiàn)有數(shù)據(jù)與軟件共享的倫理視角,又需建設(shè)培育更好的倫理實踐政策與基礎(chǔ)設(shè)施(環(huán)境)[11]。這說明在尊重科研人員現(xiàn)有實踐的前提下,科研人員和其他利益相關(guān)方通過政策環(huán)境與基礎(chǔ)設(shè)施支持等方面的服務(wù),可形成較好的倫理氛圍,促進科研數(shù)據(jù)重用活動規(guī)范開展。又如英國生物技術(shù)與生物科學(xué)研究理事會(BBSRC)在數(shù)據(jù)共享政策中規(guī)定,二次使用數(shù)據(jù)時,使用者應(yīng)披露第三方資源或數(shù)據(jù)庫中共享數(shù)據(jù)的來源;對原始生產(chǎn)者共享的數(shù)據(jù),應(yīng)視利用與合作程度判斷是否成為合著者或承認(rèn)其貢獻(xiàn)[12]。這說明,通過政策方式識別數(shù)據(jù)重用過程中潛在的問題,能夠增強科研人員在實踐過程中尊重數(shù)據(jù)原始生產(chǎn)者權(quán)益的意識,促進其規(guī)范開展數(shù)據(jù)重用活動。
國內(nèi)學(xué)者從利益相關(guān)方角度,探討科研數(shù)據(jù)重用過程中的權(quán)益保護機制。首先從權(quán)益主體、權(quán)益內(nèi)容與權(quán)益流轉(zhuǎn)等方面,分析數(shù)據(jù)重用過程中各利益相關(guān)方需關(guān)注的權(quán)益問題。如張閃閃等通過提煉政策要素,深入分析科研數(shù)據(jù)內(nèi)容重用過程中的利益相關(guān)者、涉及的權(quán)利、權(quán)利的使用、權(quán)利轉(zhuǎn)移與授權(quán)許可等內(nèi)容[13];王德莊等人梳理數(shù)據(jù)生命周期各環(huán)節(jié)中利益相關(guān)方的數(shù)據(jù)重用訴求,從開放科研數(shù)據(jù)政策與個人數(shù)據(jù)保護政策協(xié)同角度進行剖析[14]。其次,眾學(xué)者從各關(guān)鍵利益相關(guān)方著手,具體分析權(quán)益保護的內(nèi)容,研究主體主要集中于具備科研數(shù)據(jù)管理業(yè)務(wù)的機構(gòu),如圖書館、數(shù)據(jù)中心、出版機構(gòu)等。例如劉晶晶等梳理通用型數(shù)據(jù)知識庫、提交者和使用者的權(quán)益管理規(guī)范,從圖書館權(quán)益管理服務(wù)方面提出建議[15];楊云秀等調(diào)研英國10所高校數(shù)據(jù)政策中科學(xué)數(shù)據(jù)傳播規(guī)范部分對數(shù)據(jù)重用行為的諸多規(guī)定[16];孔麗華等梳理總結(jié)三種主要的數(shù)據(jù)出版方式涉及的政策要素,并針對出版過程中涉及的權(quán)益管理問題提出建議[17]。
圖書館、數(shù)據(jù)中心、數(shù)據(jù)知識庫、出版商等科研支撐輔助機構(gòu)在開放科研數(shù)據(jù)領(lǐng)域起步較早,并已開始從科研人員角度關(guān)注數(shù)據(jù)發(fā)現(xiàn)、質(zhì)量控制、影響力評價與計量等環(huán)節(jié),以促進數(shù)據(jù)重用。例如re3data.org為眾多開放科研數(shù)據(jù)知識庫或大型數(shù)據(jù)集提供相應(yīng)注冊機制,支持直接檢索,或按照研究領(lǐng)域、數(shù)據(jù)資源類型、國別檢索[18],幫助科研人員按照多樣的研究需求進行數(shù)據(jù)發(fā)現(xiàn)。加拿大國家統(tǒng)計局(Statistics Canada)提供可作為工具箱使用的開放數(shù)據(jù)與數(shù)據(jù)重用資源[19],歐盟委員會提供數(shù)據(jù)質(zhì)量評估手冊[20]。Piwowar等人分析GEO和ArrayExpress注冊登記號的數(shù)據(jù)引用情況,以計量科研數(shù)據(jù)重用的效果和影響力[21]。又如RDA下屬的學(xué)術(shù)鏈接交換(Scholarly Link Exchange , Scholix)工作組,結(jié)合數(shù)據(jù)出版商、數(shù)據(jù)知識庫與機構(gòu)知識庫中的數(shù)據(jù)引用與使用信息,探索了數(shù)據(jù)級別計量的新型測量指標(biāo)[22]。上述科研數(shù)據(jù)服務(wù)從眾多環(huán)節(jié)推動與保障科研人員開展科研數(shù)據(jù)重用活動。
國內(nèi)著重從科研數(shù)據(jù)資源組織服務(wù)、數(shù)據(jù)出版流程設(shè)計出發(fā),為科研數(shù)據(jù)重用提供數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)質(zhì)量控制方面的保障。在數(shù)據(jù)資源組織服務(wù)方面,歐陽劍等從滿足圖書館科研用戶再利用需求和發(fā)展數(shù)據(jù)服務(wù)角度,探索人文學(xué)科領(lǐng)域數(shù)據(jù)的組織與重構(gòu),認(rèn)為應(yīng)以數(shù)據(jù)化、數(shù)據(jù)融合、數(shù)據(jù)關(guān)聯(lián)與發(fā)布的方式進行[23];在數(shù)據(jù)出版的質(zhì)量控制方面,吳立宗等討論了具體數(shù)據(jù)出版流程、涉及主體及其協(xié)作方式,倡議建立我國的科學(xué)數(shù)據(jù)出版體系[24]。涂志芳整合梳理數(shù)據(jù)出版的組成要素,認(rèn)為它們構(gòu)成了數(shù)據(jù)出版生態(tài)系統(tǒng),在此基礎(chǔ)上,提出對科研數(shù)據(jù)質(zhì)量控制體系的構(gòu)建思路[25]。屈寶強等人認(rèn)為開放共享視角下,數(shù)據(jù)出版的發(fā)展應(yīng)適應(yīng)標(biāo)準(zhǔn)化引用、唯一化識別和便捷化利用的需求[26]。該研究進一步證實了科研用戶在數(shù)據(jù)出版環(huán)節(jié)對質(zhì)量控制的需求。同時,我國國家標(biāo)準(zhǔn)《科研數(shù)據(jù)引用 (GB/T 35294-2017)》[27]、《數(shù)據(jù)溯源描述模型(GBT 34945)》[28]已于 2018年正式實施,為數(shù)據(jù)重用行為提供了較為規(guī)范的實踐指導(dǎo)。
國外研究人員已完成從僅關(guān)注科研數(shù)據(jù)重用行為的外部特征(數(shù)據(jù)引用)到研究科研用戶主觀因素的初步過渡。隨著實踐的發(fā)展與推進,學(xué)者認(rèn)識到科研人員自身的態(tài)度、意圖和感知在科研數(shù)據(jù)重用實踐中發(fā)揮著重要作用,并通過多種實證研究手段,探究數(shù)據(jù)重用行為的影響因素。眾多行為學(xué)領(lǐng)域的理論與實證研究表明,人們對某一事件的態(tài)度、意圖等主觀因素影響其行為,相關(guān)理論包括理性行為理論(TRA)、計劃行為理論(TPB)、技術(shù)接受和使用統(tǒng)一理論(UTAUT)等。在科研數(shù)據(jù)重用行為影響因素研究中,這些主觀因素也得到了證實[29-30]。如Curty和Qin基于UTAUT理論,編碼對13位社會科學(xué)家的訪談內(nèi)容,構(gòu)建了數(shù)據(jù)重用意圖和行為的影響因素模型,認(rèn)為感知有用性、感知風(fēng)險、感知努力程度、社會影響、促進條件等因素會影響重用意圖,進而影響科研人員的重用行為[31]。這說明科研人員自身的意圖和其對重用活動的感知對其數(shù)據(jù)重用行為具有較大影響。Yoon等人通過使用計劃行為理論(TPB)和技術(shù)接受模型(TAM)的綜合模型,發(fā)現(xiàn)科研人員對數(shù)據(jù)重用的態(tài)度、主觀規(guī)范和感知努力程度顯著影響其數(shù)據(jù)重用意圖[29]。這說明態(tài)度同樣是科研數(shù)據(jù)重用行為(意圖)重要的影響因素。
科研數(shù)據(jù)重用行為影響因素存在學(xué)科差異。英國數(shù)字監(jiān)管中心(DCC)在對諸多學(xué)科領(lǐng)域的研究人員開展數(shù)據(jù)共享和重用態(tài)度的調(diào)查時發(fā)現(xiàn),學(xué)科間的差異體現(xiàn)在技術(shù)和行為水平方面[32]。有學(xué)者指出應(yīng)注意產(chǎn)生大數(shù)據(jù)和長尾數(shù)據(jù)的學(xué)科在數(shù)據(jù)重用條件、成本與數(shù)據(jù)重用行為方面的異同[11]。因此,本文進一步梳理具體學(xué)科中科研人員數(shù)據(jù)重用行為的主觀影響因素,見表1。
表1 國外研究中態(tài)度、意圖等主觀因素對數(shù)據(jù)重用行為的影響
由表1可知,科研人員的科研數(shù)據(jù)重用行為與具體學(xué)科領(lǐng)域中數(shù)據(jù)重用需求的產(chǎn)生背景、科研人員對數(shù)據(jù)開放共享與重用的認(rèn)可和參與程度、數(shù)據(jù)基礎(chǔ)設(shè)施發(fā)展的成熟程度、數(shù)據(jù)出版流程的完善程度等內(nèi)容相關(guān),這些態(tài)度與感知方面的影響因素,呈現(xiàn)出學(xué)科間的差異。
國內(nèi)學(xué)者目前多從科研數(shù)據(jù)引用角度分析科研數(shù)據(jù)重用行為的目的、方式。彭潔等人較早關(guān)注數(shù)據(jù)引用行為在提高科研資源利用率、促進科研發(fā)現(xiàn)過程中的作用[39]。而后,我國學(xué)者對數(shù)據(jù)引用行為的研究逐步擴展。張英杰等人在2012年從提交、描述、動機、功能等方面對我國科研人員科學(xué)數(shù)據(jù)引用行為開展調(diào)查[40]。由于數(shù)據(jù)出版在生物學(xué)、地球科學(xué)等領(lǐng)域的發(fā)展,有學(xué)者進一步從數(shù)據(jù)期刊的引用角度,分析數(shù)據(jù)期刊層面的重用行為[41]。此后,相關(guān)學(xué)者從引用規(guī)范程度[42]、科學(xué)計量與影響力評價[43-44]等角度探究數(shù)據(jù)引用行為,以期促進數(shù)據(jù)重用行為的規(guī)范發(fā)展。
我國學(xué)者已開始關(guān)注從科研用戶視角識別分析科研數(shù)據(jù)重用行為的影響因素。研究主要集中在全學(xué)科領(lǐng)域或較大的學(xué)科門類下[45],并未專門針對具體學(xué)科領(lǐng)域中的科研人員開展實證調(diào)查。如李佳潞對我國高校和科研院所中自然科學(xué)和社會科學(xué)領(lǐng)域的研究人員開展數(shù)據(jù)重用行為問卷調(diào)查,發(fā)現(xiàn)科研人員的重用意愿、數(shù)據(jù)素養(yǎng)和科研環(huán)境的開放程度,對數(shù)據(jù)重用行為具有直接影響[46]。這表明,我國學(xué)者目前已意識到開放數(shù)據(jù)運動對科研人員數(shù)據(jù)重用行為的影響。文靜等面向南京市眾高校的學(xué)生和科研人員開展實證研究,發(fā)現(xiàn)以往重用經(jīng)歷的滿意度對繼續(xù)重用的意愿具有重要影響[47]。該研究雖未在背景部分強調(diào)開放科研數(shù)據(jù)的環(huán)境,但在數(shù)據(jù)來源這一潛變量的具體測量項中涉及數(shù)據(jù)來源平臺的開放程度與獲取途徑,這也從側(cè)面反映了研究者對開放科研數(shù)據(jù)環(huán)境下科研人員數(shù)據(jù)重用行為的關(guān)注。隨著我國科研數(shù)據(jù)開放共享實踐條件的逐步成熟,探究不同學(xué)科背景下科研數(shù)據(jù)重用行為影響因素并提出相應(yīng)促進方案,具有現(xiàn)實意義。
相關(guān)學(xué)者對數(shù)據(jù)重用活動內(nèi)涵認(rèn)識的不斷深入,為開放科研數(shù)據(jù)運動實踐的推進提供了新的著力點與發(fā)展方向。根據(jù)定義側(cè)重點的不同,我們可將科研數(shù)據(jù)重用的定義分為4類:①“意圖”派:注重從詞語含義方面界定,突出原始目的以外的使用意圖;②“情境”派:著重列舉數(shù)據(jù)重用的具體情境;③“內(nèi)容”派:對所重用數(shù)據(jù)的具體表現(xiàn)形式與呈現(xiàn)要求進行闡述,著重說明重用數(shù)據(jù)后形成的新的科研產(chǎn)出;④“流程”派:注重將數(shù)據(jù)開放共享與重用視為完整流程,強調(diào)數(shù)據(jù)重用過程須可追溯。
由表2可知,對科研數(shù)據(jù)重用概念的界定,首先來源于具體實踐中的需要(不同的使用意圖),側(cè)重從詞語本身的含義方面說明(意圖派)。而后,具體學(xué)科領(lǐng)域中的學(xué)者通過特定應(yīng)用情境,總結(jié)典型的數(shù)據(jù)重用現(xiàn)象,從成果形式(內(nèi)容派)、應(yīng)用情境(情境派)方面細(xì)分。同時,隨著數(shù)據(jù)重用實踐的發(fā)展,學(xué)者需通過明確的流程使科研數(shù)據(jù)可追溯、可測量(流程派)。因而,信息管理領(lǐng)域的研究人員從該角度進一步定義了數(shù)據(jù)重用。
該發(fā)展歷程對開放科研數(shù)據(jù)實踐的啟示為:利益相關(guān)方除需關(guān)注開放科研數(shù)據(jù)在初期的可獲取、可使用條件,以及后來的數(shù)據(jù)集成、生產(chǎn)衍生數(shù)據(jù)的服務(wù)事項外,也應(yīng)在知識產(chǎn)權(quán)層面上平衡數(shù)據(jù)生產(chǎn)者與使用者的權(quán)益(因為使用范圍更廣,形式多樣,涉及主體更多,亦涉及對新型科研成果的評價等相關(guān)問題)。因此,開放科研數(shù)據(jù)實踐后期的發(fā)展,更應(yīng)注重探討并構(gòu)建較為明晰的權(quán)責(zé)關(guān)系環(huán)境,保障數(shù)據(jù)生產(chǎn)者與使用者的合法權(quán)益。
科研人員在開放科研數(shù)據(jù)運動中起關(guān)鍵作用,他們既是科研數(shù)據(jù)的生產(chǎn)者又是使用者,既是實現(xiàn)者又是受益者。開放科研數(shù)據(jù)環(huán)境下圍繞科研人員數(shù)據(jù)重用主題的研究,主要經(jīng)歷以下5個階段。
第一階段:學(xué)科領(lǐng)域中數(shù)據(jù)開放共享與重用需求的產(chǎn)生,推動科研數(shù)據(jù)重用相關(guān)政策的出臺。該過程始于20世紀(jì)90年代后期,并在2010年后出現(xiàn)眾多研究成果。例如在大量基因組圖譜定位與測序數(shù)據(jù)生成后,學(xué)界對縮短科研數(shù)據(jù)從生成到發(fā)布時間的需求愈發(fā)強烈[58],1996年的百慕大原則(Bermuda principle)回應(yīng)了該訴求。該原則推行的重要目的之一即促進研究工作[59],意含數(shù)據(jù)重用。這說明在某些學(xué)科領(lǐng)域中,科研人員的數(shù)據(jù)重用需求推動著政策的制定;同時也說明相關(guān)政策因能滿足科研人員的需求而得到較廣泛的認(rèn)可。2017年的一項研究發(fā)現(xiàn),開放數(shù)據(jù)運動促使2002—2016年間二次分析定性數(shù)據(jù)的方法在英國快速發(fā)展,并使之成為當(dāng)前的一種主流研究方法。數(shù)據(jù)重用活動為學(xué)習(xí)過去的研究項目提供材料,以(幫助)獲得方法論和實質(zhì)的見解[60]。英國數(shù)據(jù)服務(wù)組織(UK Data Service)也為重用定性數(shù)據(jù)提供指導(dǎo)方案[61]。
第二階段:數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)持續(xù)推進,從數(shù)據(jù)監(jiān)管(data curation)與長期保存角度促進開放科研數(shù)據(jù)的重用。例如世界數(shù)據(jù)系統(tǒng)(World Data System, WDS)在其愿景和使命中提及“協(xié)調(diào)和支持可信賴的數(shù)據(jù)服務(wù),以提供、使用和保存可信賴的數(shù)據(jù)集”[62]。這說明,數(shù)據(jù)基礎(chǔ)設(shè)施方會根據(jù)科研用戶獲取和使用數(shù)據(jù)的需求優(yōu)化其支持服務(wù)。相關(guān)學(xué)者已注意到數(shù)據(jù)知識庫在數(shù)據(jù)長期保存與重用方面的作用,開始注重評估其實際應(yīng)用效果。LIBER在《知識庫及其數(shù)據(jù)的公平性》(FAIRness of Repositories & Their Data)報告中,面向數(shù)據(jù)知識庫管理人員、圖書館員和技術(shù)人員,調(diào)查數(shù)據(jù)安全、監(jiān)管與質(zhì)量、(開放)數(shù)據(jù)FAIR原則所涉及的具體內(nèi)容,以了解其應(yīng)用FAIR原則的最佳實踐和理解誤區(qū)[63]。數(shù)據(jù)知識庫作為開放科研數(shù)據(jù)的典型基礎(chǔ)設(shè)施,能夠從質(zhì)量、安全等層面為科研數(shù)據(jù)重用奠定基礎(chǔ)。
第三階段:從數(shù)據(jù)引用方面著手,科研數(shù)據(jù)重用流程得以完善。海量科研數(shù)據(jù)的產(chǎn)生,可能造成大量數(shù)據(jù)與其所得科學(xué)結(jié)論分離[64]的困境。因此,科研人員重用現(xiàn)有數(shù)據(jù)時,需通過新的方式對數(shù)據(jù)原始來源進行標(biāo)識與關(guān)聯(lián),由此產(chǎn)生了數(shù)據(jù)引用與數(shù)據(jù)溯源的相關(guān)議題。2014年FORCE11發(fā)布《數(shù)據(jù)引用原則聯(lián)合聲明》(Joint Declaration of Data Citation Principles),鼓勵和推動數(shù)據(jù)成為合理、可引用的研究成果,對引用學(xué)術(shù)文獻(xiàn)、其他數(shù)據(jù)集或任何其他研究項目中的數(shù)據(jù)提供了一組指導(dǎo)原則[65]。進一步而言,若希望現(xiàn)有數(shù)據(jù)集可以被使用、再闡述或再加工成為新的數(shù)據(jù),那么數(shù)據(jù)來源(data provenance)(包括數(shù)據(jù)起源、保管過程與所有權(quán))是非常重要的[66]。這引發(fā)了相關(guān)學(xué)者對數(shù)據(jù)溯源問題的進一步關(guān)注。另有學(xué)者從數(shù)據(jù)引用視角關(guān)注科研數(shù)據(jù)重用行為。如Park等人的研究表明,生物醫(yī)藥領(lǐng)域非正式數(shù)據(jù)引用行為較為普遍的原因在于,缺乏對數(shù)據(jù)共享者與重用者的回報系統(tǒng)[67]。我國學(xué)者通過分析國外數(shù)據(jù)引用政策、研究國內(nèi)數(shù)據(jù)引用行為,認(rèn)為可從提升作者的數(shù)據(jù)引用意識、創(chuàng)建科學(xué)數(shù)據(jù)引用文化方面著手[68]促進數(shù)據(jù)引用行為規(guī)范程度的提升。
第四階段:科研數(shù)據(jù)重用過程中存在的法規(guī)和道德層面議題(如數(shù)據(jù)挖掘行為規(guī)范、數(shù)據(jù)權(quán)益管理服務(wù))得到更多關(guān)注。Duke等人提出面向數(shù)據(jù)重用構(gòu)建一套倫理框架,以解決數(shù)據(jù)引用和共同作者的問題,促進科學(xué)界對話[69]。相關(guān)學(xué)者針對數(shù)據(jù)與軟件在科研社群內(nèi)的共享進行具體分析。Darch等人從個體的道德感、倫理規(guī)則、倫理原則和倫理理論視角,闡述了數(shù)據(jù)和軟件共享在重用時所需關(guān)注的內(nèi)容[11]。我國學(xué)者也對其中涉及的法規(guī)議題進行了梳理總結(jié)。如顧立平指出,數(shù)據(jù)重用治理的目標(biāo)之一是釋出之前數(shù)據(jù)集必須經(jīng)過國家安全、個體隱私、數(shù)據(jù)安全和商業(yè)利益的成本與風(fēng)險檢查[70]。
第五階段:以數(shù)據(jù)重用目的為導(dǎo)向的科研數(shù)據(jù)社群逐漸形成與發(fā)展,科研人員的核心作用及其科研數(shù)據(jù)重用行為成為重要研究主題。Fecher等人通過分析梳理數(shù)據(jù)共享領(lǐng)域的論文發(fā)現(xiàn),研究社群是影響科研數(shù)據(jù)共享的重要因素,并進一步影響二次使用數(shù)據(jù)的用戶(secondary data users)[71]。Cooper等的研究則進一步表明,成功的數(shù)據(jù)共享發(fā)生在數(shù)據(jù)社群(data community)內(nèi)。該社群是由研究人員組成的流動的非正式網(wǎng)絡(luò),他們共享和使用特定(主題)類型的數(shù)據(jù),例如晶體結(jié)構(gòu)數(shù)據(jù)、DNA序列和自然災(zāi)害相關(guān)的測量數(shù)據(jù)[72]??蒲腥藛T作為科研社群中最為活躍的主體之一,其數(shù)據(jù)重用行為的影響因素逐漸受到學(xué)者們的關(guān)注。
通過梳理以上發(fā)展脈絡(luò)可以發(fā)現(xiàn),開放科研數(shù)據(jù)在發(fā)展初期需要基礎(chǔ)設(shè)施,否則科研數(shù)據(jù)無法得到有效存儲和傳播。因為存在種種數(shù)據(jù)權(quán)益的利益相關(guān)者,需要政策甚至法律法規(guī)來界定權(quán)責(zé)機制。數(shù)據(jù)重用實踐中,科研人員是推動開放科研數(shù)據(jù)的戰(zhàn)略核心。如果“回歸本質(zhì)”思考,那么開放科研數(shù)據(jù)是互聯(lián)網(wǎng)時代實現(xiàn)科研社群持續(xù)發(fā)展的必要措施,發(fā)展推動的核心是人,最終將促進科研社群的發(fā)展和壯大。
由上述科研數(shù)據(jù)重用研究發(fā)展歷程可知,與重用相關(guān)的科研數(shù)據(jù)管理活動涉及眾多主體及各類運行條件。這些主體依賴環(huán)境條件(諸如基礎(chǔ)設(shè)施環(huán)境、權(quán)益保護政策)以保證科研數(shù)據(jù)重用行為的順利開展。在該環(huán)境下,眾主體間以數(shù)據(jù)流轉(zhuǎn)為主要物質(zhì)交換特征,進而保證科研人員科研數(shù)據(jù)重用活動的開展。這恰與英國生態(tài)學(xué)家Tansley提出的生態(tài)系統(tǒng)概念較為契合——特定區(qū)域的內(nèi)生成分和外生成分通過物質(zhì)循環(huán)和能量流動相互作用、相互依存而形成的生態(tài)學(xué)功能單位,被稱為生態(tài)系統(tǒng)[73]。我國學(xué)者尚玉昌認(rèn)為生態(tài)系統(tǒng)需具備兩種基本特征:①具有生物和非生物成分;②二者可通過聯(lián)系達(dá)成一定的穩(wěn)定性[74]??蒲袛?shù)據(jù)重用實踐過程具備生態(tài)系統(tǒng)的基本特征,故本文進一步將科研人員科研數(shù)據(jù)重用活動視為生態(tài)系統(tǒng),通過該視角明確其內(nèi)部各組成部分間的發(fā)展過程與運行機制。
科研數(shù)據(jù)重用行為源于學(xué)術(shù)社群內(nèi)部科研人員或科研團隊的研究需求(主體分散交流階段),通過一定機制逐漸規(guī)模化后,首先形成某一特定研究主題下的數(shù)據(jù)社群(數(shù)據(jù)社群識別階段);后續(xù)相關(guān)支持資源的投入,使得該社群通過科研人員的參與形成正反饋;隨著基礎(chǔ)設(shè)施的完善,數(shù)據(jù)社群和利益相關(guān)方隊伍不斷發(fā)展壯大,形成科研數(shù)據(jù)重用生態(tài)系統(tǒng)(科研數(shù)據(jù)重用生態(tài)系統(tǒng)發(fā)展初期)。具體發(fā)展過程見圖1。
科研社群在此過程中發(fā)揮重要作用。由于當(dāng)前研究中呈現(xiàn)的交叉學(xué)科趨勢,在科研數(shù)據(jù)共享與重用領(lǐng)域,科研人員更傾向于從數(shù)據(jù)自身所反映的研究內(nèi)容(主題)出發(fā),進行開放共享和重用。相較按學(xué)科劃分學(xué)術(shù)社群,數(shù)據(jù)社群能更好地反映數(shù)據(jù)驅(qū)動科研發(fā)展范式下的實踐活動[72]。Leonelli等人認(rèn)為,從分散的研究項目向社群轉(zhuǎn)化的過程中,需要一定的條件集合(repertoires),這些獨特的元素組合,能夠促進研究人員合作[75]。而這些條件集合,正是不斷完善的基礎(chǔ)設(shè)施、利益相關(guān)方的支持服務(wù)以及參與數(shù)據(jù)重用的文化氛圍等內(nèi)容。
數(shù)據(jù)社群形成后,眾多研究人員間的交流進一步增強,相應(yīng)地,產(chǎn)出規(guī)模會逐步擴大,促進外部資源的進一步投入。數(shù)據(jù)社群中的科研人員,除開放自身科研數(shù)據(jù)外,也能夠從科研數(shù)據(jù)生態(tài)系統(tǒng)中獲得已有的開放數(shù)據(jù)集作為滿足研究需求的數(shù)據(jù)來源,由此形成科研數(shù)據(jù)開放共享與數(shù)據(jù)重用間循環(huán)促進的發(fā)展?fàn)顟B(tài)(科研數(shù)據(jù)重用生態(tài)系統(tǒng)穩(wěn)定運行期)。參考相關(guān)研究[76-77],筆者認(rèn)為科研人員科研數(shù)據(jù)重用生態(tài)系統(tǒng)的特征有:①以數(shù)據(jù)交流(開放共享、重用)活動為紐帶,擁有科研數(shù)據(jù)資源的輸入和輸出;②擁有相互依賴的實踐環(huán)節(jié)、交流網(wǎng)絡(luò)、基礎(chǔ)設(shè)施與政策環(huán)境支持;③數(shù)據(jù)重用與數(shù)據(jù)開放共享間呈相互促進的狀態(tài),數(shù)據(jù)重用的正反饋推動數(shù)據(jù)開放共享的良性發(fā)展。
促進科研數(shù)據(jù)社群的形成與發(fā)展成為數(shù)據(jù)重用生態(tài)系統(tǒng)的重要內(nèi)容。有學(xué)者認(rèn)為,未來應(yīng)關(guān)注圍繞開放科研數(shù)據(jù)所形成的社群及其用戶的潛在需求,并建議可通過促進社群規(guī)則的形成、鼓勵協(xié)作、采納專門數(shù)據(jù)監(jiān)管活動的方式,更好地聚合數(shù)據(jù)社群參與者[78]。由此可見,通過數(shù)據(jù)社群在數(shù)據(jù)重用活動中建立社群文化,能夠促進科研人員聚合、認(rèn)可并持續(xù)參與開放科研數(shù)據(jù)實踐。
數(shù)據(jù)社群在促進數(shù)據(jù)重用生態(tài)系統(tǒng)文化形成過程中的具體表現(xiàn)為:逐步形成符合研究需求的數(shù)據(jù)重用流程與促進政策,培養(yǎng)科研人員在數(shù)據(jù)重用過程中良好的研究習(xí)慣,使開放科研數(shù)據(jù)政策理念能更好地落實。對科研人員研究習(xí)慣的培養(yǎng),可考慮重點關(guān)注與其自身權(quán)益直接相關(guān)的環(huán)節(jié),諸如數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)生產(chǎn)與出版環(huán)節(jié)。具體包括:通過科研人員多樣化的數(shù)據(jù)發(fā)現(xiàn)需求,合理收集與組織數(shù)據(jù)出版過程中的元數(shù)據(jù);通過科研人員在數(shù)據(jù)生產(chǎn)過程中的習(xí)慣優(yōu)化數(shù)據(jù)引用活動等。
聯(lián)合國第一屆開放科學(xué)大會成果文件指出,圖書館是開放科學(xué)過程中(所需)信息或數(shù)據(jù)的天然中介方與監(jiān)管者,在開放科學(xué)運動中發(fā)揮著重要作用[79]。作為利益相關(guān)方重要成員的圖書館,可充分發(fā)揮與用戶互動的優(yōu)勢,促使科研人員對數(shù)據(jù)重用生態(tài)系統(tǒng)形成積極的態(tài)度與感知,以進一步促進數(shù)據(jù)社群的形成。嵌入式服務(wù)已幫助學(xué)術(shù)圖書館和科研用戶形成良好的互動基礎(chǔ),圖書館的科學(xué)數(shù)據(jù)管理服務(wù)貫穿整個科研數(shù)據(jù)生命周期??蒲袛?shù)據(jù)重用生態(tài)系統(tǒng)的形成,離不開科研人員對該理念的認(rèn)可與參與。因此,相關(guān)的服務(wù)可首先關(guān)注科研數(shù)據(jù)生產(chǎn)環(huán)節(jié)的數(shù)據(jù)質(zhì)量控制,讓開放共享的科研數(shù)據(jù)為數(shù)據(jù)重用奠定良好的內(nèi)容基礎(chǔ),而后關(guān)注重用者在數(shù)據(jù)發(fā)現(xiàn)方面的多樣化需求;其次,在開放科研數(shù)據(jù)流轉(zhuǎn)過程中,關(guān)注利益相關(guān)方之間的聯(lián)絡(luò)與協(xié)調(diào),以保障科研人員積極且規(guī)范地開展科研數(shù)據(jù)重用活動,促進形成科研數(shù)據(jù)重用文化氛圍;最終,需要重視科研數(shù)據(jù)重用對開放科研數(shù)據(jù)的反饋機制,從科研評價與激勵措施方面促進科研人員感知科研數(shù)據(jù)重用活動在科研創(chuàng)新與自身發(fā)展中的積極作用。
基于此,圖書館未來的提升策略在于優(yōu)化數(shù)據(jù)質(zhì)量控制、開放資源建設(shè)與服務(wù)、聯(lián)絡(luò)協(xié)調(diào)、科研評價與激勵措施等方面的服務(wù)。具體策略有:①數(shù)據(jù)質(zhì)量控制。首先,在數(shù)據(jù)素養(yǎng)教育過程中,可從數(shù)據(jù)重用生態(tài)系統(tǒng)角度向科研人員介紹數(shù)據(jù)重用的完整流程,有利于其在具體工作環(huán)節(jié)中有意識地實踐這些內(nèi)容。其次,與所在機構(gòu)的教學(xué)部門合作(如適用),在具體的學(xué)科領(lǐng)域課程中開展數(shù)據(jù)重用主題的學(xué)習(xí)任務(wù),有助于實踐相關(guān)質(zhì)量控制標(biāo)準(zhǔn)。②開放資源建設(shè)與服務(wù)推廣,可主動宣傳告知本館開放資源建設(shè)導(dǎo)航或目錄,促進科研人員掌握與拓展數(shù)據(jù)發(fā)現(xiàn)渠道(作為重用數(shù)據(jù)的來源)。③圖書館也可通過與一線科研人員的聯(lián)系,收集其使用館內(nèi)資源和數(shù)據(jù)基礎(chǔ)設(shè)施的建議與后續(xù)需求。此外,圖書館可通過與專業(yè)學(xué)/協(xié)會合作,推動具體學(xué)科領(lǐng)域數(shù)據(jù)重用進程。如通過舉辦專題研討會、在大型會議中設(shè)置數(shù)據(jù)重用主題征文、舉辦開放數(shù)據(jù)大賽等方式,擴展數(shù)據(jù)重用理念在學(xué)科領(lǐng)域中的傳播,吸納學(xué)/協(xié)會的終端用戶重用開放科研數(shù)據(jù)資源。④推動數(shù)據(jù)作為新型科研成果形式在學(xué)術(shù)評價與影響力評估中的作用,對優(yōu)秀的數(shù)據(jù)重用案例給予相應(yīng)獎勵,激發(fā)科研人員參與科研數(shù)據(jù)重用過程的熱情。
(來稿時間:2020年12月)