王璞(上海海事大學(xué)圖書館 上?!?01306)
·數(shù)據(jù)管理與服務(wù)·
英美兩國制定數(shù)據(jù)管理計劃的政策、內(nèi)容與工具
王璞
(上海海事大學(xué)圖書館上海201306)
摘要:
隨著人們對研究數(shù)據(jù)的共享與長期保存重要性認識的不斷提高,制定數(shù)據(jù)管理計劃 (data management plan,DMP)已經(jīng)逐漸成為科研過程中不可或缺的重要組成部分,以為后續(xù)數(shù)據(jù)管理工作提供明確規(guī)范和指導(dǎo)。文章簡要回顧了英美兩國主要基金管理機構(gòu)對DMP內(nèi)容的政策性要求;以英國數(shù)字監(jiān)護中心(DCC)和美國政治與社會研究校際聯(lián)盟(ICPSR)的DMP內(nèi)容框架為主要依據(jù),對DMP的核心內(nèi)容進行探討;介紹了兩種主要的DMP在線撰寫工具DMPonline和DMPTool;最后為圖書館圍繞DMP開展研究數(shù)據(jù)管理服務(wù)提出了建議。關(guān)鍵詞:
數(shù)據(jù)管理計劃;研究數(shù)據(jù)管理;數(shù)據(jù)監(jiān)護;DMPonline;DMPTool自2001年的“布達佩斯開放存取計劃”以來,科研成果的開放存取運動發(fā)展勢頭迅猛。OECD(經(jīng)濟合作與發(fā)展組織)先后在2004年、2006年發(fā)布了《開放存取公共資助研究數(shù)據(jù)的宣言》和《開放存取公共資助研究數(shù)據(jù)的原則和指南》。這兩份文件進一步促使通過公共資金資助的科研產(chǎn)生的研究數(shù)據(jù)公開獲取以及研究數(shù)據(jù)管理事業(yè)的快速發(fā)展。
在當前E-Science科研環(huán)境下,科研越來越趨向于基于大規(guī)模的數(shù)據(jù)驅(qū)動,數(shù)字化的研究數(shù)據(jù)已經(jīng)成為科研的基礎(chǔ)信息設(shè)施,并成為證實或駁斥學(xué)術(shù)成果的最有力的客觀證據(jù)??茖W(xué)研究數(shù)據(jù)的長期保存與共享具有重大的科學(xué)價值、經(jīng)濟價值和社會價值,已經(jīng)成為當前科技創(chuàng)新能力的重要基礎(chǔ)?;鸾M織和研究機構(gòu)普遍意識到,要充分發(fā)揮研究成果的價值和知識潛力,只有通過廣泛傳播和開放存取,并促進新型研究范式的產(chǎn)生。
隨著數(shù)據(jù)密集型科研的發(fā)展,研究數(shù)據(jù)的創(chuàng)建、獲取、處理分析、重用以及長期保存對科學(xué)研究具有越來越重要的意義,良好的研究數(shù)據(jù)管理能確保數(shù)據(jù)有效的共享、驗證和重用,提高科學(xué)研究的有效產(chǎn)出。隨著人們對研究數(shù)據(jù)的共享與長期保存重要性認識的不斷提高,制定研究數(shù)據(jù)管理計劃已經(jīng)逐漸成為科研過程不可或缺的重要組成部分。
數(shù)據(jù)管理計劃(data management plan,DMP)是一份正式文檔,概括描述了研究者在科研過程中以及結(jié)束后對整個研究數(shù)據(jù)生命周期的管理過程。DMP對研究數(shù)據(jù)的產(chǎn)生、管理到長期保存都進行清晰的描述,包括:數(shù)據(jù)概況、數(shù)據(jù)組織、元數(shù)據(jù)方案、數(shù)據(jù)保存、數(shù)據(jù)使用以及倫理與法律相關(guān)事項等說明。
DMP是一份各參與方認可、可執(zhí)行、集中概括了所有數(shù)據(jù)管理活動有關(guān)事項的文檔,提高了數(shù)據(jù)管理的透明度。項目負責人(principal investigator,PI)在基金申請前期對數(shù)據(jù)管理的工作任務(wù)和各方職責進行確定,以確保數(shù)據(jù)管理的參與人員能依據(jù)DMP進行有效的溝通和合作,保證整個管理團隊遵循統(tǒng)一的數(shù)據(jù)管理流程和規(guī)范,促進工作的一致性、規(guī)范化和高效率。
DMP的制定確保了研究數(shù)據(jù)的長期保存和共享,從以下幾個方面促進了科研的進步與發(fā)展:①具有數(shù)據(jù)引證和以數(shù)據(jù)分析為基礎(chǔ)的研究成果有更強的可信度和影響力;②為研究成果提供以數(shù)據(jù)為基礎(chǔ)的證明;③符合基金管理機構(gòu)的數(shù)據(jù)管理政策,包括版權(quán)遵守和道德準則的規(guī)范約束;④確保研究數(shù)據(jù)的長期保存和重復(fù)利用;⑤便于數(shù)據(jù)的共享,推動跨學(xué)科研究和基于已有數(shù)據(jù)的創(chuàng)新性研究。
英國研究理事會(Research Councils UK,RCUK)作為英國9家主要基金管理機構(gòu)的戰(zhàn)略合作伙伴,所制定的數(shù)據(jù)管理政策共同原則,為各個基金會的數(shù)據(jù)政策制定提供了總體框架。RCUK的數(shù)據(jù)管理共同原則要求在充分尊重數(shù)據(jù)創(chuàng)建者知識產(chǎn)權(quán)和智力勞動的前提下,從制度上保證研究數(shù)據(jù)的合理合法開放存取和長期保存利用,以提高公共研究基金的使用效益。
2005年以來,英國主要的基金會都已經(jīng)發(fā)布了主張數(shù)據(jù)管理與共享的數(shù)據(jù)政策。Sarah Jones在2009年的報告詳細解讀了英國各基金會對于出版物和研究數(shù)據(jù)的政策規(guī)定和技術(shù)支持等方面的情況。英國數(shù)字監(jiān)護中心(Digital Curation Centre,DCC)以網(wǎng)頁的形式將該報告的主要成果進行展示,并依據(jù)數(shù)據(jù)政策變化隨時更新。從DCC收集的信息來看,英國的主要基金會都已經(jīng)要求基金申請附帶提交DMP。Sarah Jones在2012年對各基金會的DMP要求內(nèi)容進行了最新匯總和簡要概括?;饡驞MP對研究數(shù)據(jù)的收集、產(chǎn)生、管理、分享和保存進行概括說明。DMP用來證明研究者對數(shù)據(jù)整個生命周期的管理能力,從而滿足資助者的數(shù)據(jù)政策。楊淑娟與陳家翠對英國的基金會數(shù)據(jù)政策和DMP要求進行了總體概括和詳細說明。
自2011年1月開始,美國國家自然科學(xué)基金委員會(National Science Foundation,NSF)要求基金申請書必須附帶DMP,以說明將怎樣遵循NSF研究成果傳播和共享方針。主要包括研究過程將產(chǎn)生的資源和數(shù)據(jù)類型、所采用的數(shù)據(jù)格式和內(nèi)容標準、獲取和共享方針(即隱私政策、保密性、安全性、知識產(chǎn)權(quán)及其他權(quán)限要求的相關(guān)規(guī)定)、衍生產(chǎn)品的重用和再傳播政策和規(guī)定、研究數(shù)據(jù)和成果存檔及長期保存計劃等內(nèi)容。2013年初,奧巴馬政府的科技政策辦公室要求聯(lián)邦政府資助的基金管理機構(gòu),必須制定研究數(shù)據(jù)的管理政策,以確保數(shù)據(jù)的長期保存與利用。此后,美國的國立衛(wèi)生研究院、疾控與預(yù)防中心、能源部、國防部、農(nóng)業(yè)部和太空總署等主要科研資助機構(gòu)都在項目申請指南中明確規(guī)定基金申請者必須提交DMP。加州大學(xué)數(shù)據(jù)監(jiān)護中心(University of California Curation Center,UC3)的DMPTool網(wǎng)站上收集了美國主要基金會的DMP內(nèi)容要求的模板文檔,以供基金申請人參考。
綜合英國各基金會的要求和實踐經(jīng)驗,英國數(shù)字監(jiān)護中心DCC從2009年開始發(fā)布DMP的內(nèi)容建議清單,目前公布的是2013年的第四版,列舉了DMP應(yīng)包含的8部分主要內(nèi)容。美國政治與社會研究校際聯(lián)盟(ICPSR)作為全球規(guī)模最大的社會科學(xué)研究聯(lián)盟機構(gòu),比較了包括NSF、ANU、DCC和MIT等幾個重要研究機構(gòu)的DMP建議內(nèi)容,提出了撰寫DMP的內(nèi)容框架及包含的核心元素,具有很高的參考價值。基于以上兩個重要的DMP內(nèi)容框架,本章對部分核心內(nèi)容進行說明和分析。
3.1數(shù)據(jù)類型與格式
DMP需要對數(shù)據(jù)進行總體描述,包括預(yù)計產(chǎn)生的內(nèi)容、數(shù)量、類型等,以便評審人了解數(shù)據(jù)的基本特征并評估可能發(fā)生的信息暴露風險。DMP應(yīng)該簡要描述采集數(shù)據(jù)的標準、方法和格式。數(shù)據(jù)類型一般包括文本、圖像、音視頻等通用的文件類型或特定學(xué)科的專用數(shù)據(jù)類型。從利于數(shù)據(jù)長期保存的角度要求:①使用非專利的、開放性的標準格式,以利于在不同的平臺和應(yīng)用程序間進行互操作;②使用非加密的、未壓縮的文件格式;③使用符合特定學(xué)科領(lǐng)域標準的數(shù)據(jù)格式,便于學(xué)術(shù)交流。DMP還應(yīng)該陳述與研究課題相關(guān)的現(xiàn)有公開數(shù)據(jù)集的調(diào)查概況,不能滿足研究需求的原因,以及新舊數(shù)據(jù)集之間的差異及可能的關(guān)聯(lián)。
3.2元數(shù)據(jù)與文檔記錄
元數(shù)據(jù)被稱為“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是用于數(shù)據(jù)重復(fù)利用和分析的重要通訊形式,所以元數(shù)據(jù)必須完整、準確,提供足夠的必要信息。元數(shù)據(jù)包括描述性元數(shù)據(jù)、結(jié)構(gòu)性元數(shù)據(jù)、技術(shù)性元數(shù)據(jù)等類型,既有人工記錄的元數(shù)據(jù),也有機器自動生成的元數(shù)據(jù)。元數(shù)據(jù)的標準選用和方案制定非常關(guān)鍵,直接決定了研究數(shù)據(jù)的可利用程度,并幫助用戶了解數(shù)據(jù)的產(chǎn)生以及收集過程。為幫助研究者選擇元數(shù)據(jù)標準,DCC收集了包括生物學(xué)、地球科學(xué)、物理、社科與人文以及通用型的元數(shù)據(jù)標準、擴展標準、用例和軟件工具。Jenn Riley將105種常用的元數(shù)據(jù)標準,從資源類型、應(yīng)用領(lǐng)域、功能和用途四個維度,以可視化彩圖的形式進行重要性評估,幫助研究人員進行元數(shù)據(jù)標準的選擇和比較。
文檔記錄(Documentation)是數(shù)據(jù)管理中一項重要的輔助工作,對數(shù)據(jù)進行清晰、詳細的描述以及注釋,其目的是使數(shù)據(jù)易于使用和分享,可以被其他用戶理解和解釋。文檔記錄的內(nèi)容一般包括:數(shù)據(jù)報告、用戶指南、實驗室手冊、操作流程等相關(guān)文檔;還有數(shù)據(jù)集結(jié)構(gòu)的文件說明、數(shù)據(jù)收集的軟件工具、方法與過程記錄等。高效率管理數(shù)據(jù),需要對數(shù)據(jù)文件進行科學(xué)的組織,主要包括:文件結(jié)構(gòu)的規(guī)劃、文件命名規(guī)則制定以及版本控制。Katherine分析了文件組織的層級結(jié)構(gòu)方法和標簽式方法的利與弊,建議可取長補短,采用混合式的組織方法,制定文件命名系統(tǒng),并提出文件命名的最佳實踐經(jīng)驗和規(guī)范并給出了具體操作實例。
3.3短期的數(shù)據(jù)存儲與安全
依據(jù)前期確定的數(shù)據(jù)管理生命周期各階段負責人及職責內(nèi)容,利用Wiki等協(xié)同工作軟件與版本控制系統(tǒng),控制數(shù)據(jù)質(zhì)量并協(xié)調(diào)、同步工作流程及進度,實施可靠的數(shù)據(jù)管理。研究過程中產(chǎn)生的臨時數(shù)據(jù),一般存放在本地的存儲器,根據(jù)數(shù)據(jù)規(guī)模和存儲要求的不同,可存放在個人PC、實驗室服務(wù)器、圖書館或者IT部門建立的存儲服務(wù)系統(tǒng)等不同地點。
數(shù)字化數(shù)據(jù)有丟失和損壞的風險,DMP應(yīng)詳細說明數(shù)據(jù)備份和恢復(fù)方案。數(shù)據(jù)備份策略包括:內(nèi)容選擇、介質(zhì)、地點、方法、頻率、備份保存的時長以及對備份數(shù)據(jù)的正確性驗證等。應(yīng)該至少在3個不同的地理位置進行數(shù)據(jù)備份,主備份通常駐留在工作PC;第二份拷貝應(yīng)該在外接的移動硬盤或者家用計算機上;第三份備份可選擇本地的數(shù)據(jù)存儲系統(tǒng)或者在線的云存儲系統(tǒng)。DMP還應(yīng)該介紹數(shù)據(jù)的保護措施,包括密碼機制、防病毒軟件和防火墻設(shè)施、用戶使用權(quán)限設(shè)置等。數(shù)據(jù)安全還包括對敏感性數(shù)據(jù)的安全存儲方法、加密傳輸與使用,加密和解密軟件的使用等。
3.4數(shù)據(jù)長期保存
有研究表明,通過倉儲系統(tǒng)分享數(shù)據(jù)比通過期刊等方式明顯具有傳播的廣泛性,研究數(shù)據(jù)的分享能夠顯著提升科研成果的影響力并促進科技創(chuàng)新。研究數(shù)據(jù)的長期保存與共享是DMP中的關(guān)鍵性內(nèi)容,基金申請人應(yīng)對此作出明確和具有說服力的證據(jù)來表明,研究結(jié)果數(shù)據(jù)是可長期存取及利用的。因此,選擇何種數(shù)據(jù)長期保存的基礎(chǔ)設(shè)施,應(yīng)提出令人信服的觀點和事實。是選擇安全性更高的本地數(shù)據(jù)倉儲系統(tǒng)還是選擇開放性更強的第三方學(xué)科數(shù)據(jù)倉儲?像ICPSR這種在社會科學(xué)領(lǐng)域具有高知名度和超大規(guī)模用戶的數(shù)據(jù)倉儲系統(tǒng),不僅能夠顯著增加數(shù)據(jù)集的顯示度,而且在數(shù)據(jù)的規(guī)范程度和安全性上都有可靠的保障。目前全球最有影響力的兩個研究數(shù)據(jù)倉儲目錄及檢索系統(tǒng) Databib和re3data.org宣布將在2015年完成合并。這兩個規(guī)模最大的索引系統(tǒng)收集了囊括各個學(xué)科的1000余個數(shù)據(jù)倉儲系統(tǒng),為研究者快速發(fā)現(xiàn)、存取和利用數(shù)據(jù)集提供了重要的參考功能。
3.5倫理道德和版權(quán)事項
出于學(xué)術(shù)成果保護或者商業(yè)利益考慮,研究數(shù)據(jù)可能不會在項目完成后就立即公開。基金會通常要求在DMP中承諾盡快公開數(shù)據(jù)或者出版數(shù)據(jù)文檔的時間表。DMP必須對數(shù)據(jù)封閉期和限制使用規(guī)則進行充分的說明。在數(shù)據(jù)利用的倫理方面,所有涉及到人的數(shù)據(jù)或資料研究都需要遵守道德規(guī)范和權(quán)益的保護。為保護調(diào)查對象的隱私,應(yīng)該將原始數(shù)據(jù)進行匿名化處理并簽署關(guān)于數(shù)據(jù)使用與共享的“知情同意協(xié)議(informed consent)”。UKDS(UK Data Service)在數(shù)據(jù)匿名化的操作指南里對身份保密、定量數(shù)據(jù)、定性數(shù)據(jù)、地理信息、聲像文件處理給出了非常實用的建議。
在撰寫DMP的初期,就應(yīng)該對數(shù)據(jù)的所有權(quán)進行明確的定義和區(qū)分,避免后續(xù)使用過程中可能產(chǎn)生的糾紛。通常由數(shù)據(jù)生產(chǎn)者、項目負責人PI以及研究人員所屬機構(gòu)共同享有數(shù)據(jù)的版權(quán)和知識產(chǎn)權(quán)。在數(shù)據(jù)長期保存階段,PI可授權(quán)倉儲系統(tǒng)享有數(shù)據(jù)存儲、轉(zhuǎn)換和傳播的權(quán)利。研究過程中如果使用第三方數(shù)據(jù)或者利用專利設(shè)備產(chǎn)生的數(shù)據(jù),需要遵守相關(guān)的數(shù)據(jù)保存和分享權(quán)利的限制性規(guī)則,并進行簡要說明。
3.6數(shù)據(jù)管理成本規(guī)劃
為了幫助研究人員更好地規(guī)劃與測算數(shù)據(jù)管理成本,UKDS制定了數(shù)據(jù)管理活動成本核算的內(nèi)容清單。這個清單的部分內(nèi)容可包含在DMP中,幫助DMP制定者更好的填寫“成本(Costs)”部分的內(nèi)容。這個清單按照研究數(shù)據(jù)管理的生命周期,詳細的羅列了各個管理步驟可能發(fā)生的成本,包括人員與技能準備、時間消耗、軟件工具、硬件基礎(chǔ)設(shè)施、儀器設(shè)備、專業(yè)知識需求、支持與培訓(xùn)以及可能需要產(chǎn)生的外包服務(wù)(例如數(shù)據(jù)的存儲與備份、格式化處理等)等費用。
英國的DMPonline和美國的DMPTool是當前主要的在線生成DMP的工具,用戶范圍很廣,具有典型的代表意義,因此通過介紹這兩種工具,可以了解DMP撰寫工具的發(fā)展狀況。
4.1DMPonline
英國數(shù)字監(jiān)護中心DCC與基金會及高校合作,2010年初推出了在線DMP創(chuàng)建工具——DMPonline。DMPonline內(nèi)置了英國基金會和部分大學(xué)的DMP內(nèi)容需求模版文檔,用戶可按照其提供的模版及流程在線創(chuàng)建、編輯、分享、輸出或者刪除DMP文檔。DMPonline在每個填寫流程都提供了詳細的指導(dǎo)信息及鏈接,幫助用戶填寫和完善內(nèi)容。用戶可以利用DMPonline的分享功能,授權(quán)其他用戶查閱和編輯DMP文檔,并將最后完成的內(nèi)容以PDF、DOCX、XML、CSV等格式輸出。
Martin Donnelly等人介紹了DMPonline的起因及早期發(fā)展的情況。2009年,DCC的Jones通過研究英國各基金會的數(shù)據(jù)政策發(fā)現(xiàn),項目申請書必須附帶DMP已經(jīng)成為普遍要求。DMPonline項目組以DCC的數(shù)據(jù)監(jiān)護生命周期模型為框架,在分析和綜合了多個基金會的DMP內(nèi)容要求之后,形成了撰寫DMP內(nèi)容的建議清單。從長期發(fā)展的角度考慮,DMPonline的開發(fā)完全使用開源軟件,包括開發(fā)語言Ruby on Rails、Apache Web server、MySQL數(shù)據(jù)庫軟件和Ubuntu操作系統(tǒng)。
項目組在2012年秋季,以愛丁堡大學(xué)的用戶為研究對象,采用軟件使用分析、調(diào)查與意見反饋、焦點小組討論、用戶訪談、啟發(fā)式評估等方法,對軟件進行評估和可用性測試。軟件的可用性測試重點評估從3.0版本升級到4.0(beta)版本以后所帶來的積極變化和影響??捎眯詼y試證明,在重新修訂了DMPonline的數(shù)據(jù)模型、改進了填寫流程和重新設(shè)計了用戶界面之后,4.0版本相比前一版本,具有明顯的改進效果。DCC從一開始就認識到開放性和用戶群體支持的重要性,將軟件源代碼放在GitHub上,鼓勵更多人下載和進行功能開發(fā)。DCC期望未來DMPonline能夠增加更多的社交元素,并通過開放接口與更多的研究信息管理系統(tǒng)集成。
4.2DMPTool
2011年年初,受英國DMPonline的啟發(fā),由美國加州大學(xué)數(shù)據(jù)監(jiān)護中心(UC3)牽頭,聯(lián)合8家著名的科研機構(gòu)(其中也包括DCC)作為發(fā)起人,共同開發(fā)了DMP在線撰寫工具DMPTool。自2011年10月發(fā)布第一版以來,DMPTool獲得了科研機構(gòu)和圖情領(lǐng)域的廣泛關(guān)注,并贏得了2011年的美國國會圖書館十佳“數(shù)字保存進步獎”。截止2014年12月,超過800家機構(gòu)的9000余名用戶使用了DMPTool。
在斯隆基金會的支持下,2014年發(fā)布的DMPTool第二版采用開源軟件框架,依靠用戶社區(qū)支持,并以充分滿足研究者、圖書館、基金會和院校等各方面的利益為宗旨。通過新設(shè)計的管理界面,學(xué)院能夠提供個性化的幫助信息、資源,以及針對特定學(xué)科的DMP模版文檔。DMPTool創(chuàng)建了一個協(xié)同式的工作環(huán)境,允許多人對同一份DMP進行編輯、討論和定稿。用戶可以將完成的DMP分享給其他人進行評閱,聽取專家或者數(shù)據(jù)館員的意見,以完善DMP的內(nèi)容。
DMPTool的主要目標包括:促進數(shù)據(jù)管理、分享與長期保存的基礎(chǔ)設(shè)施的建設(shè),讓更多的高校開始利用DMPTool;努力培育并繁榮DMPTool用戶及開發(fā)者社區(qū),保持DMPTool項目的透明度并促進社區(qū)的參與度;加強與各方機構(gòu)的合作,進一步增加DMP模版文檔并整合各級服務(wù)資源;盡可能提供數(shù)據(jù)全生命周期的管理服務(wù)。
4.3DMP撰寫工具的未來發(fā)展
對于這兩種當前最主要的DMP在線撰寫工具,國內(nèi)外都有研究者進行介紹,并從不同角度進行對比、討論。王凱等人對DMPonline和DMPTool進行了介紹,并從開發(fā)路線、服務(wù)方式和需求建議來源等方面進行了對比分析。Andrew與Martin從使用案例、組織架構(gòu)、文化特征、發(fā)展進程等方面對DMPonline和 DMPTool進行了分析和比較。DMPonline作為一項國家層面的服務(wù),主要由DCC和愛丁堡大學(xué)運營管理,服務(wù)于英國整個高等教育事業(yè)。DMPTool項目更開放,積極的歡迎各類型研究機構(gòu)參與到項目建設(shè),并以充分滿足各基金會的DMP內(nèi)容要求為首要考慮事項。
兩個項目的管理者都認識到未來的發(fā)展要注重可持續(xù)發(fā)展的模式,尋求更多的合作伙伴,努力繁榮用戶與開發(fā)者社區(qū),開發(fā)新的功能,更開放的系統(tǒng)接口。盡管兩個工具的發(fā)展路徑有所差異,但共同目標和愿景都是發(fā)展成為一個集成式 (integrative)的DMP撰寫工具,通過保持與基金管理機構(gòu)和政策制定者的聯(lián)系和溝通,促進數(shù)據(jù)管理的最佳實踐,持續(xù)培養(yǎng)數(shù)據(jù)分享的文化并整合各學(xué)科、各類型基金會、各層次高校及科研機構(gòu)的資源,乃至發(fā)展成為國際型的數(shù)據(jù)管理工具。
通過介紹制定DMP的內(nèi)容與工具,一方面可加深國內(nèi)科研活動中各相關(guān)方對DMP的理解,對我國研究數(shù)據(jù)長期保存與共享的發(fā)展產(chǎn)生積極影響;另一方面可為促進國內(nèi)高校圖書館研究并開展數(shù)據(jù)管理服務(wù)提供借鑒。
5.1DMP是一份動態(tài)的指導(dǎo)性文檔
一份完善的DMP既充分滿足資金資助機構(gòu)要求,同時兼具合理性和可執(zhí)行性。DMP應(yīng)簡潔明了但內(nèi)容完整,能完全證明基金申請人充分理解該領(lǐng)域數(shù)據(jù)的研究現(xiàn)狀。DMP中應(yīng)該明確指定數(shù)據(jù)管理流程不同階段的負責人和職責內(nèi)容。隨著項目研究的深入,DMP的內(nèi)容是可以被修訂的,以符合數(shù)據(jù)管理與分享的實際需求,但總體上應(yīng)保持原先的框架和內(nèi)容。在數(shù)據(jù)長期保存與分享等關(guān)鍵問題上,需要兌現(xiàn)原先的承諾。
5.2圖書館主動提供撰寫DMP的咨詢服務(wù)
為了制定可執(zhí)行的DMP,研究者對研究過程中所涉及到的數(shù)據(jù)環(huán)境總體上有比較清晰的認識,其中包括專門的學(xué)科知識、技術(shù)現(xiàn)狀、領(lǐng)域軟件應(yīng)用以及獲取和分析數(shù)據(jù)的方法等。但佐治亞理工大學(xué)的一項研究表明,盡管研究人員對數(shù)據(jù)管理表現(xiàn)出了濃厚的興趣,但仍有接近一半(47%)的人沒有為數(shù)據(jù)管理制定計劃,因為他們?nèi)狈ψ銐虻南嚓P(guān)知識和必要的指導(dǎo)。圖書館長期以來擔負著學(xué)術(shù)資源管理與服務(wù)的重任,面對數(shù)據(jù)資源管理這個新生事物,有著天然的技術(shù)優(yōu)勢和舍我其誰的使命感。因此,圖書館應(yīng)該發(fā)揮傳統(tǒng)的學(xué)科優(yōu)勢,迅速掌握數(shù)據(jù)管理相關(guān)技能,主動提供撰寫DMP的咨詢服務(wù),幫助科研人員了解制定DMP的重要性與促進科研發(fā)展的必要性。
5.3以DMP為突破口,逐步推出多種數(shù)據(jù)服務(wù)
在英美等發(fā)達國家,近幾年來已經(jīng)有不少高水平大學(xué)圖書館提供研究數(shù)據(jù)管理服務(wù),高校的IT部門也建立了數(shù)據(jù)倉儲系統(tǒng)并提供相應(yīng)的支持工作。目前已經(jīng)開展的數(shù)據(jù)管理服務(wù)類型主要包括:DMP撰寫的咨詢與指導(dǎo)、數(shù)據(jù)素養(yǎng)的技能培訓(xùn)、研究數(shù)據(jù)搜索與獲取、元數(shù)據(jù)咨詢與數(shù)據(jù)處理、數(shù)據(jù)存儲服務(wù)等。休斯頓大學(xué)的一份調(diào)查發(fā)現(xiàn):幫助研究人員撰寫DMP、申請基金項目以及研究數(shù)據(jù)的搜索與獲取是研究者最需要的數(shù)據(jù)服務(wù)類型。國內(nèi)高校圖書館應(yīng)從培養(yǎng)科研人員的數(shù)據(jù)素養(yǎng)為出發(fā)點,以DMP為突破口,提供研究數(shù)據(jù)管理的咨詢服務(wù)與技能培訓(xùn)。在完善DMP服務(wù)的基礎(chǔ)上,逐步推出其他數(shù)據(jù)管理服務(wù)。從已有經(jīng)驗來看,研究數(shù)據(jù)管理服務(wù)應(yīng)在學(xué)校高層領(lǐng)導(dǎo)的統(tǒng)一協(xié)調(diào)下,由圖書館牽頭,聯(lián)合學(xué)院、實驗室、科研部門以及IT服務(wù)部門,共同推進實施才能取得良好效果。
參考文獻:
[1]WikiPedia.Data Management Plan[EB/OL].[2014-09-08].http://en.wikipedia.org/wiki/Data_management_plan.
[2]Robert E.Kennedy Library.Data Management[EB/OL].[2014-09-08].http://libguides.calpoly.edu/datamanagement.
[3]Research Councils UK.RCUK Common Principles on Data Policy[EB/OL].[2014-09-10].http://www.rcuk.ac.uk/research/ datapolicy.
[4]JonesS.A report on the range of policies required for and related to digital curation[EB/OL].[2014-09-10].http://www.dc c.ac.uk/sites/default/files/documents/reports/DCC_Curation_Policies_Report.pdf.
[5]DCC.Overview of funders'data policies[EB/OL].[2014-09-12].http://www.dcc.ac.uk/resources/policy-and-legal/overviewfunders-data-policies.
[6]DCC.Funders'data plan requirements[EB/OL].[2014-09-12].http://www.dcc.ac.uk/resources/data-management-plans/fun ders-requirements.
[7]Jones S.Summary of UK research funders’expectations for the content of data management and sharing plans[EB/OL]. [2014-09-15].http://www.dcc.ac.uk/webfm_send/945.
[8]楊淑娟,陳家翠.研究成果傳播與共享——英美國家基金項目數(shù)據(jù)管理計劃概述[J].情報雜志,2012(12):176-179.
[9]The National Science Foundation.Dissemination and Sharing of Research Results[EB/OL].[2014-09-16].http://www.nsf. gov/bfa/dias/policy/dmp.jsp.
[10]Office of Science and Technology Policy.Expanding Public Access to the Results of Federally Funded Research[EB/OL]. [2014-09-16].http://www.whitehouse.gov/blog/2013/02/22/expanding-public-access-results-federally-funded-research.
[11]The University of Minnesota Library.Funding Agency Gudielines[EB/OL].[2014-09-20].https://www.lib.umn.edu/datamanagement/funding.
[12]DMPTool.DMP Requirements[EB/OL].[2014-09-21].https://dmptool.org/guidance.
[13]DCC.Checklist for a Data Management Plan[EB/OL].[2014-09-22].http://www.dcc.ac.uk/sites/default/files/documents/resource/DMP/DMP_Checklist_2013.pdf.
[14] ICPSR.Usage of Elements Across a Sample of Organizations[EB/OL].[2014-09-25].http://www.icpsr.umich.edu/icpsrweb/ content/datamanagement/dmp/table.html.
[15]ICPSR.Framework for Creating a Data Management Plan[EB/OL].[2014-09-25].http://www.icpsr.umich.edu/icpsrweb/con tent/datamanagement/dmp/framework.html.
[16]Brown A.Selecting File Formats for Long-Term Preservation[EB/OL].[2014-10-08].http://www.nationalarchives.gov.uk/ documents/selecting-file-formats.pdf.
[17]UK Data Archive.File Formats Table[EB/OL].[2014-10-08].http://www.data-archive.ac.uk/create-manage/format/formats -table.
[18]DCC.Disciplinary Metadata[EB/OL].[2014-10-10].http://www.dcc.ac.uk/resources/metadata-standards.
[19]Riley J.Seeing Standards:A Visualization of the Metadata Universe[EB/OL].[2014-10-11].http://www.dlib.indiana.edu/~jenlrile/metadatamap.
[20]Kozlowski W.Guidelines for writing”readme”style metadata[EB/OL].[2014-10-12].http://data.research.cornell.edu/site s/default/files/SciMD_ReadMe_Guidelines_v4_1_0.pdf.
[21]UK Data Service.Documenting and contextualising your data[EB/OL].[2014-10-13].http://ukdataservice.ac.uk/media/44 0277/documentingdata.pdf.
[22]McNeill K,Bailey H.Research Data Management:File Organization[EB/OL].[2014-10-13].http://libraries.mit.edu/datamanagement/files/2014/05/file-organization-july2014.pdf.
[23]UK Data Service.Storing and securing your data[EB/OL].[2014-10-15].http://ukdataservice.ac.uk/media/440284/storing data.pdf.
[24]PientaM,AlterC,LyleA.The Enduring Value of Social Science Research The use and Reuse of Primary Research Data [EB/OL].[2014-10-16].http://deepblue.lib.umich.edu/handle/2027.42/78307.
[25]re3data.org.DataCite,re3data.org,and Databib Announce Collaboration[EB/OL].[2014-10-17].http://www.re3data.org/20 14/03/datacite-re3data-org-databib-collaboration.
[26]UK Data Service.Informed consent[EB/OL].[2014-10-18].http://ukdataservice.ac.uk/media/440280/ethicallegal_informedconsent.pdf.
[27]UK Data Service.Anonymisation and access regulation[EB/OL].[2014-10-19].http://ukdataservice.ac.uk/media/440279/et hicallegal_anonymisation.pdf.
[28] UK Data Service.Data management costing tool and checklist[EB/OL].[2014-10-20].http://www.data-archive.ac.uk/media/247429/costingtool.pdf.
[29]DCC.DMPonline[EB/OL].[2014-10-22].http://dmponline.dcc.ac.uk.
[30]DonnellyM,JonesS,John W.DMP Online:The Digital Curation Centre’s Web-based Tool for Creating,Maintaining and Exporting Data Management Plans[J].The International Journal of Digital Curation,2010,5(1):187-193.
[31]GetlerM,SisuD,JonesS,et al.DMPonline Version 4.0:User-Led Innovation[J].International Journal of Digital Curation,2014,9(1):193-219.
[32]University of California Curation Center.DMPTool[EB/OL].[2014-11-02].https://dmptool.org.
[33]LeFurgy B.Top 10 digital preservation developments of 2011[EB/OL].[2014-11-03].http://blogs.loc.gov/digitalpreservation/2012/01/top-10-digital-preservation-developments-of-2011.
[34]StrasserC,AbramsS,CruseP.DMPTool2:Expanding Functionality for Better DataManagement Planning[J].International Journal of Digital Curation,2014,9(1):324-330.
[35]王凱,彭潔,屈寶強.國外數(shù)據(jù)管理計劃服務(wù)工具的對比研究[J].情報雜志,2014(12):203-206,169.
[36]Sallans A,DonnellyM.DMP Online and DMPTool:Different Strategies Towards aShared Goal[J].The International Journal of Digital Curation,2012,7(2):123-129.
[37]ParhamS,BodnarJ,F(xiàn)uchsS.Supporting Tomorrow’s Research:Assessing Faculty Data Curation Needs at Georgia Tech [J].College&Research Libraries News,2012,73(1):10-13.
[38]Akers G,Sferdean F,Nicholls H,et al.Building Support for Research Data Management:Biographies of Eight Research Universities[J].International Journal of Digital Curation,2014,9(2):171-191.
[39]邢文明,吳方枝,司莉.高校圖書館開展科研數(shù)據(jù)管理與共享服務(wù)調(diào)查分析[J].圖書館論壇,2013(11):19-25,61.
[40]Peters C,Dryden A.Assessing the Academic Library’s Role in Campus-Wide Research Data Management:A First Step at the University of Houston[J].Science&Technology Libraries,2011,30(4):387-403.
中圖分類號:
G203文獻標識碼:
ADOI:
10.11968/tsygb.1003-6938.2015070作者簡介:
王璞(1977-),男,上海海事大學(xué)圖書館館員。收稿日期:
2015-03-25;責任編輯:魏志鵬Promoting Long-term Preservation and Sharing of Research Data:Policies、Contents and Tools
Abstract
There is a growing awareness among researchers of the importance of research data sharing and long-term preservation.Data management plan(DMP)has been playing a vital role in data-driven research progress.DMP provide specific and comprehensive guidance for research data management practice.This paper provides a brief review of research fund policies and requirements for DMP in the US and UK.Based on the frame work for creating DMP by DCC and ICPSR,this paper provides a comparative discussion of the main contents in DMP.DMPonline and DMPTool are two primary web-based tools to help researchers creating,maintaining and exporting DMP.Finally,the author puts forward some recommendations on how libraries involved in data management planning and promoting the practice of data management,sharing and preservation.Key words
data management plan;research data management;data curation;DMPonline;DMPTool