• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      德國FAKIN小型科研機構(gòu)的科研數(shù)據(jù)管理方案

      2020-09-03 12:34:54雷,楊
      圖書館論壇 2020年9期
      關(guān)鍵詞:數(shù)據(jù)管理方案模型

      周 雷,楊 萍

      隨著科學研究第四范式的到來,科研數(shù)據(jù)已成為推動科技發(fā)展、社會進步的重要戰(zhàn)略資源,這使得如何管理科研數(shù)據(jù)逐漸成為學術(shù)界的重要命題。近年已經(jīng)產(chǎn)生大量研究成果:從應用場景看,主要為高校等大型科研機構(gòu);從操作視角看,主要以圖書館的科研數(shù)據(jù)管理服務為主;而面向中小型科研機構(gòu)和以科研人員為視角的科研數(shù)據(jù)管理工作研究較少。德國FAKIN 小型科研機構(gòu)科研數(shù)據(jù)管理方案(以下簡稱“FAKIN方案”)來自德國教研部(BMBF)最新科研數(shù)據(jù)管理項目16FDM007[1],以中小型機構(gòu)科研人員日常數(shù)據(jù)管理為基礎(chǔ),將日常管理所用到的科研數(shù)據(jù)整理、元數(shù)據(jù)使用、數(shù)據(jù)清理、數(shù)據(jù)出版分享等具體方法集為一體,具有較強的實踐性和應用性。本文以該項目成果為研究對象,旨在為機構(gòu)科研數(shù)據(jù)管理服務提供參考。

      1 文獻綜述

      目前科研數(shù)據(jù)管理研究很多,主要分為3個方向。(1)以數(shù)據(jù)為主體視角的數(shù)據(jù)生命周期模型研究。數(shù)據(jù)生命周期模型是規(guī)劃監(jiān)護活動并抽象描述數(shù)據(jù)監(jiān)護活動各個階段的概念框架[2],如美國地質(zhì)勘探局科研數(shù)據(jù)生命周期模型、英國牛津大學科研數(shù)據(jù)生命周期模型、數(shù)字監(jiān)管中心監(jiān)管生命周期模型[3]。各模型雖然在具體結(jié)構(gòu)和細節(jié)上有所區(qū)別,但階段劃分較為類似,從機構(gòu)應用角度也基本以這些成熟模型為基礎(chǔ)[4]。(2)以圖書館為主體視角的科研數(shù)據(jù)管理服務研究。其中,以機構(gòu)政策、數(shù)據(jù)權(quán)益為代表的科研數(shù)據(jù)管理理論機制研究、以調(diào)查比較為主的科研數(shù)據(jù)管理服務實踐研究和以平臺建設(shè)為主體的科研數(shù)據(jù)管理服務應用技術(shù)研究,是目前研究的重點。(3)以專業(yè)學科領(lǐng)域為主體視角的科研數(shù)據(jù)管理研究,主要以學科基礎(chǔ)科研數(shù)據(jù)建設(shè)為主,如學科元數(shù)據(jù)標準[5]、基礎(chǔ)數(shù)據(jù)建設(shè)規(guī)范[6]、學科科研數(shù)據(jù)匯交方案[7]。從科研數(shù)據(jù)管理具體工作來看,科研數(shù)據(jù)管理是一項沿數(shù)據(jù)生命周期并且在周期上每個結(jié)點都有具體工作流程、數(shù)據(jù)能反復溯源的一系列操作,具體包括數(shù)據(jù)采集、清洗、元數(shù)據(jù)使用、數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)出版和引用等。但從以往研究看,科研數(shù)據(jù)管理往往側(cè)重于圖書館等機構(gòu)運營策略及服務的構(gòu)建以及專業(yè)元數(shù)據(jù)標準的建立,而對于整體科研數(shù)據(jù)管理的具體工作方案卻較為欠缺。

      2 FAKIN方案的制定背景及原則

      2.1 制定背景

      德國最早的科研數(shù)據(jù)政策一般認為是德國研究聯(lián)合會(DFG)1998年出臺的《確保良好科學實踐的建議》,科研數(shù)據(jù)管理最初目的是保證科學研究的嚴謹和規(guī)范[8]。隨著科技發(fā)展和信息時代到來,在開放科學推進下,科研數(shù)據(jù)有了更多用途。2010年德國科學組織聯(lián)盟(ADW)通過《科研數(shù)據(jù)處理原則》,明確科研數(shù)據(jù)不僅是良好科學實踐的保障,更對未來科學研究具有較高價值[9]。此后,眾多科研數(shù)據(jù)基礎(chǔ)應用項目陸續(xù)展開。2014年底,德國高校校長聯(lián)席會議(HRK)明確大學需要對科研數(shù)據(jù)進行管理[10],科研數(shù)據(jù)開始向機構(gòu)層面實施推進。FAKIN科研數(shù)據(jù)管理方案也來自同期項目成果之一,制定的目的在于,科研數(shù)據(jù)管理不僅是一些大型科研機構(gòu)、基礎(chǔ)研究所必須,也是一些規(guī)模較小科研機構(gòu)提升工作連貫性、加強科研質(zhì)量的要求。這些科研機構(gòu)的研究往往更加具體、集中,更容易進行數(shù)據(jù)匯交和關(guān)聯(lián),更容易體現(xiàn)科研數(shù)據(jù)管理對于數(shù)據(jù)價值的提升。

      2.2 制定原則

      FAKIN項目由柏林水技術(shù)中心有限公司(KWB)執(zhí)行,始于2017年,歷時2年。制定原則為:從機構(gòu)性質(zhì)角度看,小型科研機構(gòu)是該項目的主要服務對象。這些機構(gòu)通常沒有獨立的IT部門,一般也缺少專門致力于數(shù)據(jù)管理或相關(guān)領(lǐng)域的員工,數(shù)據(jù)處理一般根據(jù)個人技能進行。從內(nèi)容角度看,F(xiàn)AKIN方案是基于項目最佳實踐經(jīng)驗的總結(jié),說明項目成果對不同機構(gòu)具備可復制性。因為有益的實踐可以在將來的項目中使用,甚至可以作為整個研究機構(gòu)的標準,也符合當前科研數(shù)據(jù)管理自下而上制定的規(guī)律特征。從制定機構(gòu)屬性看,KWB 是非營利性的水技術(shù)研究中心,2018年有員工35人,承包合同32項,總額860萬歐元,其中近40%來自德國各部委和歐盟基金項目,科研論文產(chǎn)出17篇[11],可見該機構(gòu)具備小型科研機構(gòu)的特點,主業(yè)以公共科研項目為主,實踐經(jīng)驗具有普適性。

      3 FAKIN方案主要內(nèi)容及其結(jié)構(gòu)功能特點

      3.1 主要內(nèi)容

      FAKIN方案分為6個部分:文件夾結(jié)構(gòu)、文件和文件夾命名規(guī)范、版本控制、元數(shù)據(jù)、數(shù)據(jù)處理和數(shù)據(jù)出版與分享。每部分又針對具體細節(jié)再細分[12]。從總體數(shù)據(jù)結(jié)構(gòu)看,F(xiàn)AKIN方案將數(shù)據(jù)分為3 部分:原始數(shù)據(jù)、過程數(shù)據(jù)和結(jié)果數(shù)據(jù),符合一般科研項目流程。從涵蓋內(nèi)容看,F(xiàn)AKIN方案較細致和具體,如在文件命名、常用詞典、元數(shù)據(jù)使用等方面都有較為詳細的規(guī)范,易于操作,見表1。

      表1 德國FAKIN方案主要內(nèi)容

      3.2 結(jié)構(gòu)功能

      科研數(shù)據(jù)管理方案的內(nèi)容應該服務于方案的功能定位。首先,科研數(shù)據(jù)管理方案是科研數(shù)據(jù)管理具體工作/操作的集合,所以科研數(shù)據(jù)管理方案首先應具備全面性;其次,科研數(shù)據(jù)管理的目的是,以數(shù)據(jù)管理的形式,發(fā)現(xiàn)和利用數(shù)據(jù),達到數(shù)據(jù)服務的增值、數(shù)據(jù)價值的升值,所以科研數(shù)據(jù)管理方案也應具備可溯源性和質(zhì)量控制特性。

      (1)全周期覆蓋。科研數(shù)據(jù)管理方案應滿足科研數(shù)據(jù)管理整個周期的工作。本文使用Wissik等提出的科研數(shù)據(jù)工作流程模型[13](以下簡稱“工作流程模型”)作為分析框架進行研究。該框架源自奧地利科研和經(jīng)濟部(BMWFW)資助的“go!digital”項目,工作流程模型認為科研數(shù)據(jù)管理主要包括5 個部分,即數(shù)據(jù)預處理、數(shù)據(jù)處理、存儲、出版和復用,如圖1上半部分所示。該流程在開始階段增加兩個場景即新項目和遺留數(shù)據(jù)(項目結(jié)束后的數(shù)據(jù),原有設(shè)計不足可能會導致這些數(shù)據(jù)丟失或無法再利用)。在FAKIN 方案中,“版本控制”為遺留數(shù)據(jù)的“免疫”提供了具體方法,“元數(shù)據(jù)”中“目的”和“一般信息”則為原始數(shù)據(jù)提供數(shù)據(jù)源、類型等靜態(tài)信息,以及允許何種操作、如何處理等動態(tài)信息,保證遺留數(shù)據(jù)在未來加工的可能性;而對于“新項目”場景——數(shù)據(jù)管理計劃,“元數(shù)據(jù)”中的“目的”“一般信息”,以及“存儲位置”“存儲格式”部分基本可以涵蓋數(shù)據(jù)管理計劃所涉及的相關(guān)信息,如項目數(shù)據(jù)如何管理、描述、分析和存儲等。此后,“預處理”階段還包括數(shù)據(jù)的獲取、建模、轉(zhuǎn)換、數(shù)字化等科研數(shù)據(jù)基本操作過程。對于這些操作過程,“文件夾結(jié)構(gòu)”和“文件和文件夾命名規(guī)范”給出了科研數(shù)據(jù)結(jié)構(gòu)層次和命名規(guī)則,而“數(shù)據(jù)處理”明確了數(shù)據(jù)轉(zhuǎn)換和數(shù)字化的具體辦法,“數(shù)據(jù)出版和分享”中的“文件格式”則明確了數(shù)字化文件格式。工作流程的下一階段是數(shù)據(jù)處理,包括數(shù)據(jù)分析、可視化等。其中,數(shù)據(jù)的分析、可視化,推薦使用OpenRefine,并給出了數(shù)據(jù)清洗的示例代碼,同時也推薦了其它選擇如Data Munging等。工作流程的后續(xù)步驟包括數(shù)據(jù)的存儲、出版和復用。這些部分具有較強的關(guān)聯(lián)性,而“數(shù)據(jù)出版和分享”中的“知識庫”也提供了“標識符”“許可”等一體化服務。整個流程如圖1所示。綜上可以看出,F(xiàn)AKIN方案涵蓋科研數(shù)據(jù)管理工作流程的主要內(nèi)容,具有高度一致性。

      圖1 FAKIN方案與科研數(shù)據(jù)管理工作流程的映射關(guān)系

      (2)便于溯源[14]。溯源過程的通用表達模型起源于國際溯源和標注組織(IPAW)的OPM 模型,之后W3C(萬維網(wǎng)聯(lián)盟)針對OPM 的不當之處進行修改,開發(fā)PORV-DM模型,通過3個基本類以及7 種類間關(guān)系較好地描述了數(shù)據(jù)的流轉(zhuǎn)過程,但模型過于復雜。陳希等在其基礎(chǔ)上創(chuàng)建ProVOC模型[15],該模型較為輕量化,可以按照應用進行擴展。本研究使用該模型對FAKIN方案的溯源性進行分析。ProVOC模型有3個類:執(zhí)行實體、活動和數(shù)據(jù)?!皥?zhí)行實體”又分為“人類執(zhí)行實體”“非人類執(zhí)行實體”;“活動”是由執(zhí)行實體發(fā)起或受執(zhí)行實體控制、影響的一個或一系列動作;“數(shù)據(jù)”包括參數(shù)和數(shù)據(jù)集,其中“參數(shù)”一般指時間、空間和條件,“數(shù)據(jù)集”指按特定應用領(lǐng)域進一步分解出的若干子類(特定數(shù)據(jù)集)。FAKIN方案具備ProVOC中相應的構(gòu)件元素,其中“人類執(zhí)行實體”為處理人,“非人類執(zhí)行實體”為數(shù)據(jù)來源,“活動”則為數(shù)據(jù)處理過程?!盎顒印钡奶幚硐拗茷椤翱刂?影響”因素,“參數(shù)”為數(shù)據(jù)的產(chǎn)生時間、地點等,“特定數(shù)據(jù)集”為方案中不同項目、不同階段中各子數(shù)據(jù)集。模型的交互關(guān)系共有8種,如“處理人”在“時間”/“地點”對“數(shù)據(jù)集”進行了“活動”,而對于FAKIN方案中的元素,也可以表達出該關(guān)系:“處理人”對于“數(shù)據(jù)”在“受控條件”和“參數(shù)”下進行了“活動”。

      (3)多維度質(zhì)量控制。數(shù)據(jù)質(zhì)量被公認為是一個多維概念[16],以往研究主要涉及數(shù)據(jù)的準確性、連續(xù)性、完整性、可靠性等。張靜蓓等[17]發(fā)現(xiàn)數(shù)據(jù)質(zhì)量控制主要涉及4個方面的內(nèi)容:文件整體質(zhì)量、文檔說明質(zhì)量、科研數(shù)據(jù)本身質(zhì)量以及源代碼質(zhì)量;屈文建等[18]利用krantz 理論,構(gòu)建出一套科研數(shù)據(jù)質(zhì)量控制標準,并從準確性、完整性、一致性等給出了具體指標。二者雖然在構(gòu)建的出發(fā)點上有所區(qū)別,前者主要從數(shù)據(jù)的組成,后者從數(shù)據(jù)的特性進行構(gòu)建,但按照各自給出的具體指標,二者又較為類似。本研究將其歸并為科研數(shù)據(jù)構(gòu)成(整體—文檔—數(shù)據(jù)—代碼)—特性(準確性—完整性—一致性)指標,如表2 所示。具體來看,文件整體和說明文檔主要通過“文件和文件夾命名規(guī)范”“版本控制”來保證拼寫、符號等基礎(chǔ)元素的準確性、一致性;通過“元數(shù)據(jù)”中的“一般信息”來保證數(shù)據(jù)處理過程、方法的完整性、準確性;科研數(shù)據(jù)及其附屬代碼的質(zhì)量控制,主要通過開源的處理軟件進行保證,由于其開源特性,處理結(jié)果的偏差和代碼本身的問題都可以通過大量反復使用而不斷更正優(yōu)化。

      3.3 主要特點

      在方案結(jié)構(gòu)方面,F(xiàn)AKIN方案使用IPO模型(輸入—處理過程—輸出)制定文件夾結(jié)構(gòu)策略。首先,IPO模型是IBM公司最早提出并用于描述過程的工具,其應用核心是描述數(shù)據(jù)處理的工作流程,與科研數(shù)據(jù)的收集—處理—輸出流程類似,可以防止文件被意外覆蓋,特別是在數(shù)據(jù)自動處理中最大程度地降低原始數(shù)據(jù)被刪除的風險;其次,IPO過程可以分為多個子過程,向下分解、向上聚集方便,有利于保持文件和文件夾的清晰組織,避免深層文件夾結(jié)構(gòu)的混亂。

      表2 FAKIN方案質(zhì)量控制特性

      在軟件工具方面,F(xiàn)AKIN方案使用大量開源軟件和開放科學資源,如Figshare、Pangea。在數(shù)據(jù)處理過程中,所利用的程序軟件,如R語言、OpenRefine、Github 都為開放、開源,既有利于數(shù)據(jù)的共享和再利用,又符合成果針對小型科研機構(gòu)在設(shè)計中充分利用現(xiàn)有網(wǎng)絡(luò)資源的特點。同時,工具的開源特性不僅減少軟硬件投入,也便于不同類型科研人員、不同規(guī)??蒲袡C構(gòu)參與科研數(shù)據(jù)管理。

      在應用操作方面,F(xiàn)AKIN方案為科研數(shù)據(jù)管理提供了現(xiàn)成的數(shù)據(jù)處理工具包,提高數(shù)據(jù)處理的便捷性。數(shù)據(jù)的收集整理是科研數(shù)據(jù)管理中最為耗時的部分,Borgman 發(fā)現(xiàn)數(shù)據(jù)收集處理中的工作量是數(shù)據(jù)共享的重要影響因素之一[19]。FAKIN方案提供基于R語言環(huán)境的數(shù)據(jù)收集工具包,普遍兼容常規(guī)數(shù)據(jù)采集器,同時,對于不同應用場景又可以實現(xiàn)二次開發(fā),提升了收集處理數(shù)據(jù)的效率。

      3.4 應用案例

      FAKIN 方案的設(shè)計經(jīng)驗源自項目的最佳實踐,KWB在開發(fā)過程中已經(jīng)通過機構(gòu)中試工廠的科研項目反復優(yōu)化。在公共科研項目領(lǐng)域,F(xiàn)AKIN 方案也有了成熟的應用。例如,KWB 執(zhí)行的 Flusshygiene 項目[20]和 AquaNES 項目[21]分屬德國聯(lián)邦教研部“可持續(xù)發(fā)展研究框架計劃”和歐盟“地平線2020”,是全聯(lián)邦或歐盟成員國共同參與的重大科研計劃項目,對科研數(shù)據(jù)管理有嚴格規(guī)定。特別是AquaNES 項目涉及實驗、文獻等不同類型數(shù)據(jù),而實驗數(shù)據(jù)平行采集于4個實驗工廠,具有采集頻率和數(shù)據(jù)量不等(在50萬~1,000萬條/月)、采集裝置和應用系統(tǒng)也不同的特點。在該項目中,除按照FAKIN方案進行一般性數(shù)據(jù)管理外,由于IPO模型的建立原則是處理過程,實驗室數(shù)據(jù)一般來自數(shù)據(jù)記錄儀,與其他數(shù)據(jù)具有不同的處理方法,所以依照IPO模式在相應的raw data和process目錄中也分別構(gòu)建相應子文件夾,并利用方案數(shù)據(jù)收集工具同時采集4處工廠的數(shù)據(jù),效果良好。而對于科研過程中數(shù)據(jù)文件普遍過大的問題,如在利用監(jiān)測數(shù)據(jù)進行廢水處理裝置生命周期評估[22]分析過程中,單個文件數(shù)據(jù)條目往往超過100萬,使用FAKIN方案中數(shù)據(jù)處理工作包也可較為輕松地進行拆分整合。這種利用IPO 模型的文件結(jié)構(gòu)簡單有效,而工具包既具備較好的兼容性、二次開發(fā)特性,又能充分考慮實際應用的需要。從以上實際案例看,F(xiàn)AKIN方案主要應用于小型機構(gòu),其項目較為獨立,領(lǐng)域也偏向工程技術(shù),基本屬于“監(jiān)測數(shù)據(jù)+處理計算”的模式,具有數(shù)據(jù)來源類型相對單一,格式和結(jié)構(gòu)也相對規(guī)整的特點。所以,隨著不同類型數(shù)據(jù)來源增多或是大型異構(gòu)數(shù)據(jù)集出現(xiàn)帶來的命名沖突、結(jié)構(gòu)沖突問題,可能還需要相對完善的命名規(guī)制和人工介入。

      4 啟示

      縱觀我國科研數(shù)據(jù)管理研究,主要從服務的范疇和任務(如內(nèi)容、參與者)、治理(如機構(gòu)科研數(shù)據(jù)政策)、執(zhí)行(圖書館在科研數(shù)據(jù)管理服務中的作用)和實踐(科研數(shù)據(jù)管理服務平臺建設(shè))等方面開展,并取得了大量研究成果,但具體方案卻鮮有研究。所以,以科研工作者視角開發(fā)基于良好實踐的德國FAKIN方案,不僅對我國圖書館/信息機構(gòu)開展相關(guān)服務,而且對相關(guān)機構(gòu)制定數(shù)據(jù)管理方案、保障科研質(zhì)量都具有重要參考價值。

      4.1 加強科研數(shù)據(jù)管理方案的制定

      關(guān)于科研數(shù)據(jù)管理的文獻眾多,科研數(shù)據(jù)管理在設(shè)施建設(shè)、服務流程、服務項目上已經(jīng)有了較為清晰的全景圖。從調(diào)查結(jié)果看,科研數(shù)據(jù)管理的大部分基礎(chǔ)設(shè)施已經(jīng)可以滿足項目及政策的基本要求,如何應用、實施路徑已經(jīng)成為科研數(shù)據(jù)管理研究的重點。而科研數(shù)據(jù)管理方案既是科研人員進行數(shù)據(jù)管理的具體工具,貫穿于整個數(shù)據(jù)生命周期,又是科研質(zhì)量的保障和數(shù)據(jù)資源價值的前提。所以,圖書館和信息服務機構(gòu)科研數(shù)據(jù)管理方案的建設(shè)與制定,既是服務的基礎(chǔ),又是提升服務質(zhì)量的有力工具。目前,數(shù)據(jù)管理計劃是科研數(shù)據(jù)管理服務的第一步。由于科研數(shù)據(jù)管理的后續(xù)步驟都包含在數(shù)據(jù)管理計劃之中,因此良好的數(shù)據(jù)管理計劃是增強數(shù)據(jù)質(zhì)量、提升數(shù)據(jù)共享的基礎(chǔ)保障,也是后續(xù)數(shù)據(jù)存儲、組織等工作的落腳點和指南[23]?,F(xiàn)階段,作為參與數(shù)據(jù)管理的重要工具,幾乎所有開展科研數(shù)據(jù)管理服務的圖書館都提供數(shù)據(jù)管理計劃服務[24]。所以,參考數(shù)據(jù)管理計劃進行科研數(shù)據(jù)管理方案的制定,既可以提升服務質(zhì)量,又可以加深參與程度。

      4.2 科研數(shù)據(jù)管理方案應注重全面性和可操作性

      科研數(shù)據(jù)管理是貫穿整個數(shù)據(jù)生命周期的活動,作為活動指導的方案又需要在反復使用中不斷優(yōu)化,因此全面性和可操作性是科研數(shù)據(jù)管理方案的基礎(chǔ)??蒲袛?shù)據(jù)管理的全面性包括流程和內(nèi)容的完整。流程的完整要求方案涵蓋整個科研過程,內(nèi)容的完整則要求方案針對過程中所有可能涉及的問題。而可操作性則是要求在全面性的基礎(chǔ)上,方案所給出的方式方法能被執(zhí)行。FAKIN方案中,其設(shè)計來自科研流程,天然滿足了完整的科研數(shù)據(jù)管理工作流程;而從內(nèi)容看,以DCC主題模板為例[25],方案涵蓋除由于其自身定位而較少涉及的政策和預算外的數(shù)據(jù)格式、數(shù)據(jù)收集、元數(shù)據(jù)、知識庫、道德隱私、知識產(chǎn)權(quán)、存儲安全等所有主題領(lǐng)域,給出的相關(guān)方法又詳細具體。而在質(zhì)量控制和溯源性等方面,則通過相對簡單的結(jié)構(gòu)方式來實現(xiàn),易于操作實施。

      4.3 科研數(shù)據(jù)管理方案應注重便捷性

      簡便易行是科研人員使用科研數(shù)據(jù)管理方案的必要條件,也是提升科研數(shù)據(jù)共享程度的基礎(chǔ)。在科研數(shù)據(jù)管理中,文件命名的一致性、描述性質(zhì)量以及文件夾目錄結(jié)構(gòu)清晰程度,是避免造成文件丟失、混亂以及提升可溯源性的關(guān)鍵;而數(shù)據(jù)收集和清洗既是科研過程中最為較耗時費力的步驟,又由于存在數(shù)據(jù)格式轉(zhuǎn)換或是消除錯誤項、重復項等容易導致操作失誤的階段,也是阻礙數(shù)據(jù)分享的制約因素之一。所以,方案的制定還應著力體現(xiàn)在其便捷性上。在FAKIN方案采納IPO模型,文件夾管理結(jié)構(gòu)清晰,且從命名規(guī)范、元數(shù)據(jù)、源代碼等方面考慮了數(shù)據(jù)的質(zhì)量控制,可以有效避免產(chǎn)生無意義信息、錯誤描述、歧義性描述、版本混亂等常見錯誤[18]。而數(shù)據(jù)處理工具包又能在數(shù)據(jù)收集、整合階段,較好地接收采集不同數(shù)據(jù)源的數(shù)據(jù)。在清洗階段,既有常用軟件的推薦和示例,又有自開發(fā)的擴展工具。這樣,一方面降低科研人員數(shù)據(jù)處理的工作量,另一方面提高科研數(shù)據(jù)服務人員的工作效率,從而成為方案推廣和普及的另一推手。

      4.4 科研數(shù)據(jù)管理方案的制定與實施應具普遍性

      隨著開放科學的到來,機構(gòu)數(shù)據(jù)知識庫等IT基礎(chǔ)設(shè)施建設(shè)成為必須的保障平臺,在re3data.org 注冊的機構(gòu)數(shù)據(jù)知識庫就有 2,542 個[26]。同時,機構(gòu)數(shù)據(jù)知識庫的存儲服務能力、IT支撐能力已經(jīng)成為機構(gòu)科研數(shù)據(jù)管理服務評價的重要指標[27]。但從FAKIN 方案看,其立足項目組成員,利用公共資源,同樣也可以建立機構(gòu)內(nèi)部、部門內(nèi)部的科研數(shù)據(jù)管理規(guī)范。據(jù)德國同期項目調(diào)研[28],將近一半科研項目的數(shù)據(jù)量本身就在10G以內(nèi),特別是在社科領(lǐng)域,1G數(shù)據(jù)量內(nèi)的項目約占30%,數(shù)據(jù)量規(guī)模自主可控。所以,對不同規(guī)模、不同類型的科研機構(gòu),都應建立符合自身硬件條件和學科特點的科研數(shù)據(jù)管理方案,提高科研質(zhì)量,增強科研的可重復性。

      猜你喜歡
      數(shù)據(jù)管理方案模型
      一半模型
      企業(yè)級BOM數(shù)據(jù)管理概要
      爛臉了急救方案
      好日子(2022年3期)2022-06-01 06:22:30
      定制化汽車制造的數(shù)據(jù)管理分析
      海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
      重要模型『一線三等角』
      CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
      重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
      定邊:一份群眾滿意的“脫貧答卷” 一種提供借鑒的“扶貧方案”
      陜西畫報(2018年6期)2018-02-25 01:37:20
      3D打印中的模型分割與打包
      安岳县| 策勒县| 炎陵县| 万全县| 民权县| 绥化市| 阳山县| 沙湾县| 和龙市| 襄樊市| 瓮安县| 大同市| 道孚县| 鄂温| 白沙| 花莲市| 红桥区| 平遥县| 襄汾县| 滁州市| 铜梁县| 琼海市| 桂平市| 宁明县| 绿春县| 墨竹工卡县| 松桃| 修文县| 临湘市| 荣成市| 邳州市| 东城区| 兴仁县| 宁阳县| 永胜县| 鹤壁市| 锡林浩特市| 鸡泽县| 盐亭县| 望奎县| 精河县|