司 莉,辛娟娟
科學數據(或研究數據)是指在科技活動中(實驗、觀測、探測、調查等)通過其他方式獲取的反映客觀世界的本質、特征、變化規(guī)律等的原始基本數據以及根據不同科技活動需要,進行系統(tǒng)加工整理的各類數據集[1]。隨著e-science、開放存取運動的迅速發(fā)展,人們對科學數據價值的認識不斷深入,科學數據管理與共享越來越受到關注和重視,國際組織及各國科研資助機構、大學科研院所、政府部門紛紛出臺了相關科學數據的聲明、指南以及政策法規(guī)。國際組織發(fā)布的指南及各國政府頒布的法律法規(guī)從宏觀上保障了科學數據的管理和共享,科研資助機構頒布的政策及原則對科學數據的管理和共享進行了細化,大學科學數據政策在微觀上規(guī)定了數據管理的具體操作及實施方案。英美兩國高等院??蒲袡C構制定了較為完善的科學數據政策,本文旨在對英、美兩國高等院校頒布的科學數據政策進行調查并比較分析,揭示兩國大學科學數據政策的特點與差異,從而為國內高??茖W數據政策的制定提供借鑒。
筆者通過網站調研及閱讀國外調查報告,從英國和美國分別選擇10所高校的科學數據政策作為研究樣本。英國數據保存中心(Digital Curation Centre,DCC)在官方網站“Resource”欄目的“policy and legal”列舉18所大學的科學數據政策[2],其中12所大學在《泰晤士報高等教育》公布的“2013年世界大學排名”內[3],選取排名前10的大學頒布的數據政策作為研究對象。Stan Ahalt等在對美國UNC(University of North Carolina at Chapel Hill)大學科學數據管理的研究報告中列舉12所美國大學頒布的科學數據政策[4]。通過訪問大學網站,收集到10所大學科學數據政策的有效連接,最終確定英美各10所大學的科學數據政策的樣本。在基于政策內容分析的基礎上,對英美大學的科學數據政策進行剖析。DCC2009年發(fā)布科研資助機構的數據管理政策報告,列舉10項科學數據政策內容[5]。Dietrich等對美國科研資助機構數據政策調查中涉及4類政策元素(一般政策元素、數據標準元素、數據訪問和保存元素、數據發(fā)表元素)[6]??紤]到大學科學數據政策與科研資助機構科學數據政策的差別,對調查元素進行增刪,最終將其包含的內容劃分為4大類,包括一般政策、數據標準、數據共享與保存、數據安全與所有權,每一大類下細分了共13項元素。
筆者通過對英美20所大學頒布的政策名稱進行分析(見表1),發(fā)現(xiàn)英美兩國大學數據政策存在明顯的差異,英國科學數據政策名稱中含有“數據管理”的為100%,美國科學數據政策名稱中含有“數據保存”的占70%;從政策名稱中可以看出英國頒布的政策偏向數據管理,而美國頒布的政策偏向數據保存。
表1 英美高??茖W數據管理與共享政策一覽表
筆者按照科學數據管理與共享的4大類13個子類的分類標準對英美大學制定的科學數據管理與共享政策進行內容分析,結果見表2。
表2 英美高??茖W數據管理與共享政策主要內容
從表2中可看出,總體上,英美大學科學數據政策覆蓋比例較高的集中在數據范圍、數據訪問、數據保存、數據共享及數據所有權,其覆蓋率分別為65%(英4所,美9所)、80%(英6所,美10所)、100%(英10所,美10所)、65%(英8所,美5所)、75%(英6所,美9所);且英美大學政策關注熱點有所差異,英國大學科學數據政策元素中覆蓋率較高的還有數據管理計劃和數據管理指導與服務,均達到了90%;而美國大學科學數據政策未涉及數據管理指導與服務,數據管理計劃僅10%。美國大學科學數據政策的關注熱點還有數據轉讓(50%)和數據審查(60%),英國大學科學數據政策中未涉及數據轉讓,數據審查僅10%。僅有個別大學的科學數據政策涉及資金支持、元數據標準等元素。
(1)數據管理計劃。10所大學科學數據政策涉及該內容,其中英國9所,美國1所。利茲大學和埃克塞特大學要求研究者創(chuàng)建全面的數據管理計劃,包括數據采集、管理、保存、共享等[7-8]。牛津大學要求數據管理計劃應包括數據開發(fā)、收集、儲存、使用等,若為合作研究項目,則需將合作項目協(xié)議及責任說明納入數據管理計劃中[9]。其余僅要求制定數據管理計劃,并未規(guī)定具體內容,愛丁堡大學和埃塞克斯大學要求首席研究員(Principal Investigators PIs)創(chuàng)建數據管理計劃,并讓項目成員了解和遵守該計劃[10-11]。
(2)資金支持。20所大學中僅2所大學的政策涉及該項內容,其中英國謝菲爾德大學規(guī)定研究者應盡可能從項目資助者那爭取管理研究數據所需要的成本[12]。新罕布什爾州大學設有專門的大學管理基金,對研究者開展的研究項目或研究活動,以工資、津貼和外部贊助的形式給以資金支持,但沒有明確提出科學數據管理的費用問題[13]。
(3)數據范圍。13所大學對科學數據的范圍進行了說明。謝菲爾德大學認為研究數據應包括觀測數據、實驗數據及分析得出的數據。新罕布什爾州大學將原始數據、匯編數據和分析數據列為研究數據。約翰霍普金斯大學認為以物理形式記錄的信息也應包含在研究數據中,包括生物標本、環(huán)境樣品和設備等[14]。部分大學的界定較為籠統(tǒng),將學校教職人員及學生的科研活動或其他資助項目產生的數據列為研究數據的范圍,其中埃塞克斯大學僅承認博士和博士后研究所產生的數據。
(4)數據管理指導與服務。英國有9所大學的科學數據政策中都明確指出會為科研人員提供數據管理的相關指導和培訓。其中牛津大學規(guī)定數據管理指導與服務的具體內容包括:①若研究項目引進新的研究人員,科研管理機構應對其提供培訓;②數據管理的指導和建議,包括數據管理計劃制定、成本核算、創(chuàng)建描述性元數據、知識產權管理以及信息獲取的要求;③數據管理的其他基礎設施和服務。美國僅1所大學涉及此項內容,且未作詳細說明。
有7所大學的科學數據政策提到數據管理的標準問題,但未作詳細的說明。利茲大學要求科研人員在數據的生命周期中,按照資助者提出的數據標準進行管理。僅英國3所大學提到數據保存中的元數據問題,但同樣未作詳細說明。
⑴數據訪問。數據訪問是大學數據政策的一個重要內容,16所大學都對數據訪問進行了說明,認為大學和項目人員有權對數據進行訪問或復制,但須有合理的理由和時間限制。新罕布什爾州大學規(guī)定了訪問數據的群體有:①項目科研人員,項目所有成員都有權合理的訪問和使用數據;②當出現(xiàn)專利糾紛、涉嫌數據濫用、經濟利益沖突時,相關管理機構有權訪問相關數據。約翰霍普金斯大學規(guī)定首席研究員有權訪問項目所產生的所有數據,而其他教師、員工、學生或項目有關人員可訪問由他們所創(chuàng)建的那部分數據,大學出于技術轉讓等原因也有權訪問數據。
(2)數據保存。數據的保存是數據管理的重要內容,20所大學的數據政策都對數據保存進行了說明,主要是涉及數據保存的地點和期限。大部分大學數據政策規(guī)定研究數據將被當作一種資產儲存在國家、國際或網絡存儲庫中,或大學機構庫中。對于數據保存期限,各大學的規(guī)定也不盡相同,牛津大學、東卡羅萊納大學[15]、羅切斯特大學[16]、斯坦福大學[17]、新罕布什爾州大學及凱斯西儲大學[18]規(guī)定在數據發(fā)表之后,數據保存的最短期限是3年。杜克大學[19]、弗吉尼亞聯(lián)邦大學[20]規(guī)定數據保存的最低年限為5年;另外如果項目中有學生或實習生參加,數據必須保留至少等到學生拿到學位。而英國大學的科學數據政策保存時間都較長,華威大學[21]、南安普頓大學[22]及倫敦大學瑪麗女王學院[23]都規(guī)定科學數據的保存時間為10年。
(3)數據轉讓。美國5所大學對數據轉讓作了明確說明,如弗吉尼亞聯(lián)邦大學規(guī)定科研人員離開大學時應簽署一份數據保存協(xié)議,多數情況下,數據可以被轉移,但專利數據,或其他大學科研人員參與的研究數據及被校外資助條款做特別要求的數據,應當保存在原任職學校。東卡羅萊納大學數據政策支持大學專利或受聯(lián)邦資助產生的原始數據和記錄都應保留在大學,并規(guī)定了以下3種數據轉移的情況:①允許科研人員將研究數據轉移到新的機構,但其須接受聯(lián)邦機構賦予的數據保存責任;②研究人員若得到授權,就能將自己創(chuàng)造的原始數據轉移到新的機構;③若原始數據和記錄保存在特定的機構,則大學可保留數據副本。斯坦福大學規(guī)定科研人員離職時可轉移數據副本但原始數據須由首席研究員保存,若首席研究員離開本單位,數據的所有權將被轉移至新的項目負責人。肯塔基大學規(guī)定,原始數據的轉讓必須符合資助者制定的合同及協(xié)議,并且學校管理委員會有權反對首席研究員轉移原始數據[24]。
(4)數據審查。大部分高校都強調數據審查的重要性,如東卡羅萊納大學認為準確的數據記錄是一個可信的科學研究的前提,教師、員工和學生是一個利益共同體,有義務確保研究數據和記錄的可靠性,在適當情況下可供學者和其他人進行審查,同時也要保護數據的知識產權。弗吉尼亞聯(lián)邦大學規(guī)定受科研資助機構資助的數據需接受科研資助機構的審查。
(5)數據共享。13大學的科學數據政策中都提到數據共享和合作的重要性,但沒有規(guī)定數據共享的具體細則,如數據共享的方式、原則等。埃塞克斯大學強調重復使用或發(fā)布數據的權利不應過多的授予商業(yè)出版商或代理商。匹茲堡大學規(guī)定,受聯(lián)邦資助產生的研究數據和記錄等,應該被共享,同時也提到大學數據共享應遵循科研資助機構的數據共享政策[25]。
只有少數幾所大學科學數據政策對數據安全有所規(guī)定,且內容較為籠統(tǒng)。幾乎全部大學都在數據政策中提到了科學數據所有權,如謝菲爾德大學認為研究項目所產生的科學數據是學校的財產;斯坦福大學規(guī)定除受科研資助機構自主的科研項目的數據,在斯坦福大學主持下的研究,所產生的數據和記錄都屬于斯坦福大學;愛丁堡大學、杜克大學等都認為大學擁有科學數據的所有權。
從以上內容分析來看,英美大學科學數據的主要關注熱點集中在數據訪問、數據保存、數據共享及數據所有權這幾項內容上。不同的是,英國大學科學數據政策更重視數據管理計劃和數據管理的指導與服務,許多大學要求科研人員使用DDC研發(fā)的DMP Online對數據進行管理,2011年3月,DDC提供的數據管理計劃(此處提及的是數據管理計劃,只是數據管理與共享政策中的某一項元素,筆者旨在用這個例子說明英國科學數據管理與共享政策中對數據管理計劃的要求更為詳細和具體)列舉了數據管理與共享計劃中應包含的八大核心內容:(1)項目介紹與背景;(2)數據類型、格式、標準與數據采集方法;(3)數據使用道德和知識產權;(4)數據檢索、共享與重用;(5)短期保存與數據管理;(6)數據長期保存;(7)資金與人力支持;(8)監(jiān)督與評估[26]。美國大學制訂的數據政策的重點放在數據訪問、保存和所有權上,雖然數據共享理念已引起各高校的重視,但某些大學依然將重點放在數據知識產權的保護上,較多地規(guī)定了數據使用的法律問題,對數據訪問也設置了訪問權限;也有一些大學意識到大學數據管理政策應適應科研資助機構如美國國家科學基金會(National Science Foundation,NSF)和美國國立衛(wèi)生研究院(National Institutes of Health,NIH)等的要求。
英美大學數據政策還存在一些問題。首先,各大學數據政策內容的完備程度不夠平衡,還需在實踐中不斷修改和完善;其次,對遵守和實施這些政策,缺乏更詳細的指導和規(guī)定,例如許多大學政策提到“合理的使用數據”,但并未對“合理使用”進行界定,雖然各大學數據政策都強調數據共享的重要性,但并沒有說明數據該如何共享,哪些數據可以共享等問題。筆者認為,英美大學數據政策存在的問題的原因有以下幾點:首先,科學數據共享過程中包含眾多的利益相關者,利益相關者之間的利益關系難以達到平衡,大學等科研機構,一方面認識到數據共享的重要性,另一方面需保護科研人員的利益及數據的知識產權,因此,對數據的共享持“模棱兩可”的態(tài)度;其次,國際上還未形成和制定一個良好的科學數據開放利用機制,缺乏適用于科學數據的開放許可協(xié)議,數據共享的實踐還需更為具體的行動??傮w來說,英美兩國大學科學數據政策實踐遠早于我國,同時還在不斷的修改和發(fā)展以適應不斷變化的科學研究環(huán)境和方式。目前我國尚未制定關于科學數據管理與共享的法律法規(guī),國內大學科研機構可以借鑒英美各大學已取得的成果,同時避免已顯現(xiàn)的問題,從而推動我國大學科學數據管理與共享政策的制定和發(fā)布,為科學研究提供有力的數據保障?,F(xiàn)階段,國內大學的科學數據管理還存在不規(guī)范之處,科學數據的管理是數據共享的前提和基礎。筆者認為,首先,大學科研管理部門應重視并規(guī)范科學研究活動中的數據管理,要求科研人員承擔數據創(chuàng)建和管理的責任,并為科研人員提供數據管理的資金支持,制定相關數據管理與共享政策;其次,科研人員應提高數據管理與共享的意識,設置科研項目的首席信息員,借鑒國外大學研發(fā)的數據管理工具,制定數據管理的詳細計劃,負責數據的創(chuàng)建、管理和維護。
[1] 司莉,邢文明. 國外科學數據管理與共享政策調查及對我國的啟示[J]. 情報資料工作,2013 (1):61-66.
[2] UK Institutional data policies[EB/OL].[2013-08-26].http://www.dcc.ac.uk/resources/policy-and-legal/institutionaldata-policies/uk-institutional-data-policies.
[3] The World University Rankings [EB/OL]. [2013-08-26]. http://www.timeshighereducation.co.uk/worlduniversityrankings/2012-13/world-ranking.
[4] Stan Ahalt, Michael Barker, Tom Carsey, et al.Research Data Stewardship at UNC [EB/OL]. [2103-08-26]. http://www.docin.com/p-719958163.html.
[5] Jones S.A Report on the Range of Policies Required for and Related to Digital Curation [EB/OL]. [2013-08-10]. http://www.dcc.ac.uk/sites/default/files/documents/reports/DDC_Curation_Policies_Report.pdf.
[6] Dietrich D,Adamus T,Miner A,et al . Demystifying the data management requirements of research fouders[EB/OL].[2013-08-09]. http://dcc.ac.uk/resources/policy-and-legal/overview-foudersdatapolicies.
[7] Research Data Management Policy [EB/OL]. [2013-08-25]. http://library.leeds.ac.uk/info/422/policies/189/university_of_leeds_research_data_management_policy/1.
[8] Open Access Research and Research Data Management Policy[EB/OL].[2013-08-26]. https://ore.exeter.ac.uk/repository/handle/10036/4280.
[9] Policy on the Management of Research Data and Records [EB/OL]. [2013-08-26]. http: //www.admin. oxac . uk/media/global/wwwadminoxacuk/localsites/researchdatamanagement/documents/Policy_on_the_Management_of_Research_Data_and_Records.pdf.
[10] Research Data Management Policy [EB/OL]. [2013-08-26]. http://www.ed.ac.uk/schools-departments/information-services/about/policies-and-regulations/research-data-policy.
[11] Research Data Management Policy [EB/OL]. [2013-08-27]. http://www.essex.ac.uk/reo/research_community/research_governance/research_data/RDM_Policy_April2012.pdf.
[12] Research Data Management Policy [EB/OL]. [2013-08-27]. http://www.shef.ac.uk/ris/other/gov-ethics/grippolicy/practices/all/rdmpolicy.
[13] Ownership and Management of Research Data [EB/OL].[2013-08-27]. http://www.usnh.edu/olpm/UNH/VIII.Res/C.htm.
[14] POLICY ON ACCESS AND RETENTION OF RESEARCH DATA AND MATERIALS [EB/OL].[2013-08-27]. http://jhuresearch.jhu.edu/Data_Management_Policy.pdf.
[15] Policy on the Custody,Retention,Transfer and Access to Research Data and Records [EB/OL]. [2013-08-27]. http://www.ecu.edu/fsonline/customcf/facultymanual/part7/77.htm.
[16] Access to and Retention of Research Data [EB/OL].[2013-08-27]. http://www.rochester.edu/ORPA/policies/retent.pdf.
[17] Access to and Retention of Research Data [EB/OL].[2013-08-28]. http://doresearch.stanford.edu/policies/research-policy-handbook2-10.html.
[18] POLICY ON CUSTODY OF RESEARCH DATA[EB/OL].[2013-08-28]. https://research.case.edu/files/University_Policy_On_Custody_Of_Research_Data.pdf.
[19] POLICIES RELATED TO RESEARCH [EB/OL].[2013-08-28]. http://provost.duke.edu/pdfs/fhb/FHB_App_P.pdf.
[20] Research Data Ownership, Retention, and Access[EB/OL].[2013-08-28]. http://www.research.vcu.edu/p_and_g/pdf/FNL% 20Data% 20Ownership,%20Retention,%20Access%20%20BOV%205-09.pdf.
[21] Research Data Management Policy [EB/OL]. [2013-08-29]. http://www2.warwick.ac.uk/services/rss/researchgovernance_ethics/research_code_of_practice/datacollection_retention/reseatch_data_mgt_policy.
[22] Research Data Management Policy [EB/OL]. [2013-08-28]. http: //www.calendar.soton.ac.uk/sectionIV/research-data-management.html.
[23] Policy on Research Data Management [ EB/OL ] .[2013-08-29]. http://www.kcl.ac.uk/college/policyzone/index.php?id=499.
[24] Data Retention & Ownership Policy [EB/OL]. [2013-08-29]. http://www.rgs.uky.edu/ori/data.htm.
[25] Guidelines on research data management [ EB/OL ] .[2013-08-28]. http://www.provost.pitt.edu/documents/RDM_Guidelines.pdf.
[26] DDC. Checklist for a data management plan[EB/OL].[2013-07-30]. http: //www.dcc.ac.uk/sites/default/files/documents/data-forum/documents/docs/DDC_Checklist_DMP_v3.pdf.