• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      ICPSR科學數(shù)據(jù)中心的建設經(jīng)驗與啟示

      2017-12-13 06:32:27王明明王卷樂高孟緒韓雪華王玉潔
      中國科技資源導刊 2017年6期
      關(guān)鍵詞:數(shù)據(jù)管理數(shù)據(jù)中心科學

      王明明 王卷樂,6 趙 強 高孟緒 李 舸 韓雪華,5 王玉潔

      (1. 中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2. 山東理工大學建筑工程學院,山東淄博 255049;3. 中國礦業(yè)大學(北京)地球科學與測繪工程學院,北京 100083;4. 國家科技基礎條件平臺中心,北京 100862;5. 中國科學院大學,北京 100049;6. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,江蘇南京 210023)

      ICPSR科學數(shù)據(jù)中心的建設經(jīng)驗與啟示

      王明明1,2王卷樂1,6趙 強3高孟緒4李 舸1,2韓雪華1,5王玉潔1,2

      (1. 中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2. 山東理工大學建筑工程學院,山東淄博 255049;3. 中國礦業(yè)大學(北京)地球科學與測繪工程學院,北京 100083;4. 國家科技基礎條件平臺中心,北京 100862;5. 中國科學院大學,北京 100049;6. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,江蘇南京 210023)

      科學數(shù)據(jù)中心是科學數(shù)據(jù)管理的重要載體之一。在當前大數(shù)據(jù)和數(shù)據(jù)驅(qū)動科學研究范式的信息化時代,我國在科學數(shù)據(jù)中心建設上發(fā)展迅速但缺乏經(jīng)驗,迫切需要了解和借鑒發(fā)達國家的科學數(shù)據(jù)中心建設方面的先進理念和做法,促進我國的科學數(shù)據(jù)管理。從網(wǎng)絡調(diào)研、文獻跟蹤、實地訪談等方法,對在人文社會科學領域科學數(shù)據(jù)中心建設方面極具代表性的美國密西根大學的大學間政治社會研究聯(lián)盟開展調(diào)研,從組織機制、政策標準、數(shù)據(jù)獲取、數(shù)據(jù)歸檔、數(shù)據(jù)認證、數(shù)據(jù)引用和數(shù)據(jù)服務等方面對其進行了詳細闡述并總結(jié)其建設經(jīng)驗。進一步結(jié)合我國科學數(shù)據(jù)中心數(shù)據(jù)管理現(xiàn)狀,給出我國數(shù)據(jù)中心發(fā)展的啟示,預期為我國學科領域的科學數(shù)據(jù)中心建設、數(shù)據(jù)管理和國際化發(fā)展等方面提供參考和借鑒。

      科學數(shù)據(jù)管理;科學數(shù)據(jù)中心;國際經(jīng)驗;發(fā)展啟示

      科學數(shù)據(jù)(或研究數(shù)據(jù))是指在科技活動(實驗、觀測、探測、調(diào)查等)或通過其他方式所獲取的反映客觀世界的本質(zhì)、特征、變化規(guī)律等的原始基本數(shù)據(jù),以及根據(jù)不同科技活動需要進行系統(tǒng)加工整理的各類數(shù)據(jù)集[1]。隨著大數(shù)據(jù)時代的到來,海量科學數(shù)據(jù)不斷產(chǎn)生,科學數(shù)據(jù)已成為國家的戰(zhàn)略資源,以及整個科研活動的基石和保障??茖W數(shù)據(jù)中心是科學數(shù)據(jù)管理的重要載體之一,其建設方式有自上而下的國家數(shù)據(jù)中心模式和自下而上的學科領域科學數(shù)據(jù)中心模式等不同方式。在當前大數(shù)據(jù)和數(shù)據(jù)驅(qū)動科學研究范式的信息化時代,我國在科學數(shù)據(jù)中心建設上發(fā)展迅速但缺乏經(jīng)驗,迫切需要了解和借鑒發(fā)達國家的科學數(shù)據(jù)中心建設方面的先進理念和做法并獲得啟示,促進我國科學數(shù)據(jù)管理。

      美國是世界上科學數(shù)據(jù)擁有量最多的國家[2]。美國已經(jīng)將科學數(shù)據(jù)的持續(xù)積累和開放利用能力提高到了國家科技戰(zhàn)略的高度進行部署,并投入了大量的人力、物力和財力。通過多年持續(xù)發(fā)展,形成了一系列上至國家級下至各行業(yè)部門的科學數(shù)據(jù)中心,并在科研過程中發(fā)揮了重要作用。本文選擇美國在人文社會科學領域科學數(shù)據(jù)中心建設方面極具有代表性的大學間政治社會研究聯(lián)盟(簡稱“ICPSR”)作為研究對象,分析其數(shù)據(jù)中心建設及數(shù)據(jù)管理的經(jīng)驗,為我國科學數(shù)據(jù)中心的建設提供借鑒。

      1 管理機構(gòu)與資金來源

      ICPSR是一個建立于1962年的聯(lián)盟機構(gòu),隸屬于美國密歇根大學的社會研究所,是全球數(shù)據(jù)管理組織DSA、DDI和WDS的成員。目前,ICPSR在社會科學和行為科學領域存儲有超過25萬份數(shù)據(jù)存檔文件,6.6萬多個科學數(shù)據(jù)集,涉及教育、老齡化、刑事司法、物質(zhì)濫用、恐怖主義等40余個領域。ICPSR的組織架構(gòu)如圖1所示。

      ICPSR作為數(shù)字檔案館建立在密歇根大學社會研究院(ISR),通過協(xié)議備忘錄(MOA)與ISR達成運作關(guān)系[3],密歇根大學、ISR和ICPSR三者相互協(xié)作,共同完成ICPSR的任務和目標。(1)財政關(guān)系:密歇根大學校務委員通過ISR擔任ICPSR的財務代理人,ICPSR采取的所有財務和行政行動均受密歇根大學政策和程序的約束。(2)ISR的職責:ISR向ICPSR提供空間、服務和資源,并為ICPSR提供行政和財務監(jiān)督。(3)ICPSR員工任命:執(zhí)行董事由理事會選定,經(jīng)ISR主任任命為密歇根大學員工。ICPSR普通員工的雇傭由執(zhí)行董事決定,但要經(jīng)過ISR和密歇根大學人事管理人員的審查和批準程序。(4)ICPSR員工權(quán)利:執(zhí)行董事和ICPSR管理人員有權(quán)代表ISR和理事會開展工作,但要受到ISR和密歇根大學正常規(guī)定的約束,并要符合ICPSR的章程。

      圖1 ICPSR組織架構(gòu)

      ICPSR在管理上采取理事會制度和會員制。(1)理事會成員:理事會由會員機構(gòu)選舉的12名成員組成,每兩年選舉6名新成員,任期4年。(2)理事會職責:理事會是ICPSR會員機構(gòu)和管理部門的執(zhí)行委員會,被授權(quán)代表ICPSR行事,不僅參與組織目標的確定以及制定實現(xiàn)這些目標的政策和程序,而且審查工作人員代表ICPSR采取的活動。(3)會議制度:在通常情況下,理事會每年舉行3次工作會議,但還會因為一些特殊目的舉行特別會議、閉門會議和執(zhí)行會議等。

      ICPSR是高校主導建設的聯(lián)盟機構(gòu)組織,目前擁有遍布全球的大約760所會員機構(gòu),具有非常豐富的會員管理經(jīng)驗。(1)明確會員入會標準:具有明確教育使命的非營利研究組織可經(jīng)理事會批準成為ICPSR成員。(2)會員分類管理:ICPSR根據(jù)普遍接受的學術(shù)機構(gòu)分類系統(tǒng)(如傳統(tǒng)的卡內(nèi)基高校分類法)將美國本土教育機構(gòu)分為6個會員等級,美國以外的非營利、政府和學術(shù)機構(gòu)以及商業(yè)用戶等準會員或訂閱用戶將根據(jù)規(guī)模大小和數(shù)據(jù)資源的使用情況被分為4個級別,根據(jù)此分類,制定不同機構(gòu)的年度會費標準。(3)官方代表(Of fi cial Representatives,OR):OR由會員機構(gòu)指定,作為ICPSR和會員機構(gòu)之間的聯(lián)絡人,代表會員參加官方代表會議。(4)明確權(quán)利和義務:ICPSR工作人員將努力為每位會員提供公平的服務,但會員要遵守使用數(shù)據(jù)資源的相關(guān)規(guī)定。

      根據(jù)ICPSR“章程”規(guī)定[4],ICPSR的主要資金來源為會員年費,以支撐主要的財務活動和服務項目。在理事會的指導和支持下,ICPSR還會尋求除會員費之外的資金,如:訂閱費用和與私人出版商合作的費用。此外,ICPSR也申請相關(guān)基金項目[5],如:“新型宏觀經(jīng)濟數(shù)據(jù)建設的計算方法”項目得到密歇根大學數(shù)據(jù)科學研究所、密歇根大學社會研究所、密歇根經(jīng)濟教學與研究研究所等機構(gòu)的贊助,“科研人員訪問受限數(shù)據(jù)的憑證”項目得到Alfred P. Sloan基金會的贊助,等。

      2 政策支持與遵循的國際標準

      科學數(shù)據(jù)管理的政策支持包括宏觀和微觀兩個層面[10]。宏觀科學數(shù)據(jù)管理政策指導構(gòu)建科學數(shù)據(jù)管理總體框架,如美國重視科學數(shù)據(jù)的積累和重用,在法律和政策等層面提出科學數(shù)據(jù)管理的原則。微觀科學數(shù)據(jù)管理政策主要體現(xiàn)在各個數(shù)據(jù)中心制定的數(shù)據(jù)管理政策中。ICPSR為其社會科學數(shù)據(jù)管理制定了ICPSR數(shù)字保存政策框架、訪問政策框架、ICPSR保藏發(fā)展政策、再分配政策、ICPSR會員資助數(shù)據(jù)共享政策、可訪問性政策、隱私政策、角色與職責政策和ICPSR出售或交換數(shù)據(jù)政策等多個數(shù)據(jù)管理政策,旨在確保其科學數(shù)據(jù)管理工作的合法性、高效性和原則性。

      在數(shù)據(jù)中心建設上,ICPSR遵循以下國際標準。(1)開放檔案信息系統(tǒng)(OAIS):是由美國航空航天局(NASA)咨詢委員會為空間系統(tǒng)定制的標準,2003年作為ISO標準頒發(fā),目前在世界范圍內(nèi)得到廣泛應用。該標準旨在為基于長期保存目的的信息系統(tǒng)建立一個參考模型和基本概念框架,以維護信息系統(tǒng)中數(shù)字信息的長期保存和可存取性。ICPSR跟蹤響應OAIS相關(guān)舉措,包括數(shù)字檔案館認證、永久標識符、元數(shù)據(jù)保存和制作人存檔接口等,并根據(jù)OAIS參考模型制定了符合自己的數(shù)據(jù)管理流程。(2)數(shù)據(jù)文檔計劃(DDI):DDI標準是一項促進描述統(tǒng)計和社會科學數(shù)據(jù)的國際標準,描述了通過調(diào)查和其他觀察方法在社會、行為、經(jīng)濟和健康科學領域中產(chǎn)生的數(shù)據(jù)產(chǎn)品,在整個科學數(shù)據(jù)生命周期對研究數(shù)據(jù)進行記錄和管理。作為DDI團體中極具影響力的成員,ICPSR嚴格執(zhí)行DDI數(shù)據(jù)標準和DDI元數(shù)據(jù)標準。DDI標準的執(zhí)行,有助于增強人、軟件系統(tǒng)和計算機網(wǎng)絡對數(shù)據(jù)的理解、解釋和使用[11]。(3)數(shù)字對象標識符(Digital Object Identi fi er,DOI):DOI是用于唯一標識對象的永久性標識符或句柄的ISO標準。ICPSR為每一項研究分配DOI,同時鼓勵此項標準應用于期刊論文以及其他論文。DOI標準的使用,不僅方便了數(shù)據(jù)使用者,而且有助于數(shù)據(jù)產(chǎn)生者展示其工作的價值和科學影響力。(4)網(wǎng)頁標準:ICPSR網(wǎng)頁符合美國聯(lián)邦政府采用的“第508節(jié)標準”,以及“網(wǎng)頁內(nèi)容可訪問性指南(WCAG)2.0”(AA級)?!暗?08節(jié)標準”是根據(jù)康復法案第508節(jié)頒布的,適用于聯(lián)邦采購的電子和信息技術(shù),包括計算機硬件、軟件、網(wǎng)站、電話系統(tǒng)和復印機[12]。網(wǎng)頁內(nèi)容可訪問性指南(WCAG)2.0包含了使Web內(nèi)容更容易訪問的各種建議,遵循這些標準有助于增強網(wǎng)頁的易讀性[13]。

      3 數(shù)據(jù)處理流程

      ICPSR根據(jù)開放檔案信息系統(tǒng)(OAIS)參考模型制定了符合自己的數(shù)據(jù)處理流程。具體數(shù)據(jù)處理流程如圖2所示。

      3.1 數(shù)據(jù)獲取

      (1)數(shù)據(jù)源:一是ICPSR定位于收集社會科學、行為科學和健康科學等共包含27個學科的數(shù)據(jù),不收集非社會或非行為研究、具有數(shù)據(jù)成本和限制訪問權(quán)限的數(shù)據(jù)。二是規(guī)范數(shù)據(jù)獲取機制,不僅依靠數(shù)據(jù)歸檔人主動存儲數(shù)據(jù),而且依靠工作人員主動搜索數(shù)據(jù)。三是一個數(shù)據(jù)資源包括數(shù)據(jù)文件、文檔文件和描述性文件,三者缺一不可。四是規(guī)范數(shù)據(jù)格式,有利于數(shù)據(jù)用戶的使用,如國會圖書館推薦的格式規(guī)范。五是數(shù)據(jù)要符合公認的隱私和保密標準。

      圖2 數(shù)據(jù)處理流程圖[14]

      (2)獲取優(yōu)先級:在使用以上標準識別數(shù)據(jù)集后,ICPSR工作人員通過評估數(shù)據(jù)的可用性,安全、隱私和保密事項,版權(quán)及法律問題,數(shù)據(jù)質(zhì)量,數(shù)據(jù)格式和財務因素等確定數(shù)據(jù)集所獲取的優(yōu)先等級。優(yōu)先等級較高的數(shù)據(jù)集被立即存儲,優(yōu)先等級較低的數(shù)據(jù)集則被進一步考慮收益和成本,并在短期內(nèi)判斷是否存儲此數(shù)據(jù)集。

      (3)數(shù)據(jù)獲?。荷鐣茖W檔案館和其他學科的存儲庫不同于一般獲取靜態(tài)內(nèi)容的數(shù)據(jù)庫(如圖書館),其數(shù)據(jù)獲取過程涉及很多方面。ICPSR的數(shù)據(jù)獲取包括接收數(shù)據(jù)、數(shù)據(jù)優(yōu)化處理、審查保密和隱私性、編輯元數(shù)據(jù)文檔等內(nèi)容。在接收數(shù)據(jù)階段:所有數(shù)據(jù)都要通過電子存檔表存入數(shù)據(jù)庫,并被賦予唯一的存檔ID,物理材料通過可移動介質(zhì)(CD-ROM或DVD)傳輸。最終數(shù)據(jù)存檔者簽署存檔協(xié)議,同時ICPSR向存檔者遞送收據(jù),以確保數(shù)據(jù)傳輸?shù)陌踩院秃戏ㄐ浴?/p>

      3.2 數(shù)據(jù)歸檔

      ICPSR建立了一個巨大的數(shù)據(jù)倉庫,用來支撐社會和行為科學的研究和知識資源積累。針對社會科學領域研究過程中所創(chuàng)建數(shù)據(jù)的保存、復用等問題和需求,ICPSR制定了“數(shù)據(jù)保藏發(fā)展政策”[6],明確闡述了匯集數(shù)據(jù)的類型、制定了相應的評估標準[7]、確定了數(shù)據(jù)集的優(yōu)先級等。只有符合ICPSR興趣特征的數(shù)據(jù)才能被賦予較高優(yōu)先等級,并優(yōu)先存儲,反之則被賦予較低優(yōu)先等級,并推遲存儲或不存儲。為了形成長期數(shù)據(jù)來源,ICPSR在長期實踐中積累經(jīng)驗,總結(jié)了數(shù)據(jù)的主要來源[8],同時也規(guī)范化了數(shù)據(jù)集收集機制。

      ICPSR數(shù)據(jù)中心建設注重數(shù)據(jù)歸檔管理,主要包括以下流程。(1)科學數(shù)據(jù)準備:ICPSR提倡早在數(shù)據(jù)產(chǎn)出之初就計劃數(shù)據(jù)歸檔和共享等事宜,以最大限度地發(fā)揮數(shù)據(jù)的作用,并確保數(shù)據(jù)的長期可用性。根據(jù)雅克布和漢弗萊的說法,“數(shù)據(jù)歸檔是一個過程,應該開始于成立項目之初,并且納入到整個項目生命周期中,隨時產(chǎn)生并存儲數(shù)據(jù)產(chǎn)品,生成和保存準確的元數(shù)據(jù),以確保研究數(shù)據(jù)的可靠性”,“數(shù)據(jù)歸檔應作為科研活動的一部分”。(2)科學數(shù)據(jù)獲?。涸诳茖W數(shù)據(jù)獲取階段,嚴格執(zhí)行接收數(shù)據(jù)、數(shù)據(jù)優(yōu)化處理、審查保密和隱私性、編輯元數(shù)據(jù)文檔等相關(guān)規(guī)定,確??茖W數(shù)據(jù)歸檔的質(zhì)量。(3)科學數(shù)據(jù)存儲:ICPSR將所有數(shù)據(jù)按會員數(shù)據(jù)集、代理數(shù)據(jù)集、openICPSR數(shù)據(jù)集和DataLumos數(shù)據(jù)集進行分類分級存儲管理。為保證科學數(shù)據(jù)的安全,ICPSR將所有數(shù)據(jù)文件共存儲有6個副本,并且對異地備份數(shù)據(jù)進行加密處理。另外,ICPSR引入了云計算技術(shù),在2009年第一次用亞馬遜的云服務支撐整個網(wǎng)絡傳輸系統(tǒng)。

      3.3 數(shù)據(jù)認證

      評估認證對科學數(shù)據(jù)中心獲取各利益相關(guān)者的信賴具有重要意義。近年來,ICPSR在數(shù)據(jù)認證方面做了很多努力,先后通過了可信賴倉庫的審計和認證(TRAC)、數(shù)據(jù)認可印章(DSA)和DRAMBORA等數(shù)據(jù)中心認證體系。其目的就是確保數(shù)據(jù)存儲過程清晰透明且符合實踐要求,并確保數(shù)字資產(chǎn)得到應有的保護。事實證明,評估認證能提升科學數(shù)據(jù)中心的可信賴度,確保數(shù)據(jù)的長期可獲得性,增加科學數(shù)據(jù)中心工作流程的透明度,而科學數(shù)據(jù)中心本身也能依照行業(yè)標準評估改進工作流程和步驟[15]。

      3.4 數(shù)據(jù)引用規(guī)范

      ICPSR一直與Data-PASS合作,推動數(shù)據(jù)引用標準的發(fā)展。每一條數(shù)據(jù)引用必須包含能唯一識別數(shù)據(jù)集的基本元素:標題、作者、日期、版本、永久標識符(數(shù)字對象標識符DOI、統(tǒng)一資源名稱URN或句柄系統(tǒng)),如國家健康與營養(yǎng)調(diào)查(NHANES)項目數(shù)據(jù)的引用格式為:“United States Department of Health and Human Services.Centers for Disease Control and Prevention. National Center for Health Statistics. National Health and Nutrition Examination Survey (NHANES), 2005-2006. ICPSR25504-v5. Ann Arbor, MI: Interuniversity Consortium for Political and Social Research [distributor], 2012-02-22. https://doi.org/10.3886/ICPSR25504.v5”[16]。ICPSR對 每 條數(shù)據(jù)的引用情況進行跟蹤統(tǒng)計,并在網(wǎng)上展示這些數(shù)據(jù)共享后的引用情況[17]。恰當?shù)臄?shù)據(jù)引用能夠促進科學的發(fā)展,無論是數(shù)據(jù)生產(chǎn)者、作者還是雜志編輯者,都應遵守數(shù)據(jù)引用標準,共同營造一個良好的數(shù)據(jù)引用文化氛圍。

      4 數(shù)據(jù)服務

      ICPSR數(shù)據(jù)用戶不再局限于會員,數(shù)據(jù)訪問者的身份更加多樣,主要包括:研究者、政策制定者、從業(yè)者、教師、學生、贊助商和基金會等。為此,ICPSR對其數(shù)據(jù)資源分級共享,包括完全公開和限制使用等級別,同時專門制定有明確而透明的訪問政策框架,以支撐其數(shù)據(jù)訪問和共享活動[9]。

      ICPSR為其數(shù)據(jù)用戶提供了“一站式”數(shù)據(jù)服務系統(tǒng)。(1)可搜索數(shù)據(jù)庫:ICPSR為數(shù)據(jù)用戶提供了科研項目、變量和引文3個可搜索數(shù)據(jù)庫,此搜索引擎包含所有的數(shù)據(jù)文檔,既支持多關(guān)鍵字搜索也支持精確搜索。(2)在線分析工具:為了方便數(shù)據(jù)用戶,ICPSR利用由加州大學伯努利分校計算機輔助調(diào)查方法項目開發(fā)的調(diào)查文檔與分析(SDA)軟件,提供在線分析數(shù)據(jù)服務,用戶無需下載全部數(shù)據(jù),就可對數(shù)據(jù)進行評估分析。(3)數(shù)據(jù)利用報告:ICPSR向數(shù)據(jù)存儲者提供有關(guān)其數(shù)據(jù)集的使用報告,報告顯示數(shù)據(jù)被查看和下載的次數(shù),以及數(shù)據(jù)使用者的學術(shù)身份和機構(gòu)信息。此報告幫助數(shù)據(jù)存儲者了解其數(shù)據(jù)的社會影響力。(4)暑期培訓:自1963年以來,ICPSR一直提供關(guān)于社會研究定量方法的暑期培訓課程,作為其數(shù)據(jù)服務的補充。每年有來自全世界350多所學院、大學和組織的30種不同學科的學員參加暑期培訓課程。(5)教育資源:ICPSR為本科教師和學生特別創(chuàng)建了一些數(shù)據(jù)資源,這些資源可以作為家庭作業(yè)的基礎、課堂或?qū)W習的練習、講座內(nèi)容和其他相關(guān)的教育資源。(6)數(shù)據(jù)處理工具:ICPSR為數(shù)據(jù)用戶提供豐富多樣的數(shù)據(jù)處理工具,如表1所示。

      5 幾點啟示

      我國于1988年加入世界數(shù)據(jù)中心(WDC,世界數(shù)據(jù)系統(tǒng)WDS的前身),并于當年成立了9個學科中心[18],2002年啟動的國家科學數(shù)據(jù)共享工程和2004年啟動的國家科技基礎條件平臺建設專項相繼推動了一批國家科學數(shù)據(jù)中心的建設與發(fā)展。除了這些自頂而下的科學數(shù)據(jù)中心建設,國內(nèi)許多高校、科研機構(gòu)也建立有學科領域的數(shù)據(jù)中心?,F(xiàn)針對國內(nèi)科學數(shù)據(jù)中心的缺點和不足,結(jié)合ICPSR的管理和服務經(jīng)驗,提出以下幾點啟示。

      表1 數(shù)據(jù)處理工具

      (1)學科領域的公共存儲是科學數(shù)據(jù)管理的重要載體

      ICPSR是典型的社會科學領域公共存儲庫,接納本學科領域的各類科學數(shù)據(jù)集和科技資源。作為公共存儲,要強調(diào)其學科性、開放性和服務性。首先,學科性是其立足之本,需要不斷明確其在本學科領域的引領性,提升其在學科領域的影響力,讓更多本學科領域的研究人員愿意把科學數(shù)據(jù)資源存儲在這一存儲庫內(nèi)。開放性是公共存儲庫的基本特征,ICPSR沒有行政或者資金約束機構(gòu)的限制,具有在社會科學領域數(shù)據(jù)交換和共享的充分自由度,ICPSR的數(shù)據(jù)資源能夠在全球任何地域訪問。服務性是一個公共存儲庫得以長期立足和不斷擴大國際影響力的根本,ICPSR通過科學數(shù)據(jù)標識、科學數(shù)據(jù)引用統(tǒng)計、科學數(shù)據(jù)管理和備份等服務舉措,首先滿足數(shù)據(jù)資源存儲方的基本訴求,進而為科學數(shù)據(jù)提供專門的質(zhì)量控制、維護和開發(fā)團隊,來確保數(shù)據(jù)能夠充分服務于用戶。此外,ICPSR通過若干數(shù)據(jù)周、夏令營、培訓班和在線Webinar講座等形式傳播其科學數(shù)據(jù)管理的做法和成效。這些均是我國科學數(shù)據(jù)管理中所缺少的。

      (2)科學數(shù)據(jù)管理的生命周期完整、管理過程分工清晰

      ICPSR在科學數(shù)據(jù)管理中具有清晰而完整的數(shù)據(jù)生命周期。首先是科研人員將本人的科學數(shù)據(jù)成果提交或匯交到ICPSR。美國國家科學基金會(National Science Foundation,NSF)要求所有的科學研究項目結(jié)題前需要將科學數(shù)據(jù)共享和開放到科學界,許多社會科學領域的科學家首先選擇ICPSR作為數(shù)據(jù)匯交的平臺。首先,匯交后的數(shù)據(jù)經(jīng)科研人員進行質(zhì)量審核,以確認該數(shù)據(jù)能否進入存儲庫中;然后,對質(zhì)量合格的科學數(shù)據(jù)進行分類、編碼和編制元數(shù)據(jù)信息;最后,將數(shù)據(jù)存入數(shù)據(jù)存儲庫,并使其能夠被檢索、瀏覽和在分類分級共享政策控制下被開放獲取,且收集各界用戶對科學數(shù)據(jù)使用情況進行評估的意見,反饋到數(shù)據(jù)管理部門。ICPSR這一數(shù)據(jù)管理過程涉及多個部門,各部門管理分工明確、流程銜接有序,不僅能夠保證科學數(shù)據(jù)管理的質(zhì)量而且提高了科學數(shù)據(jù)管理效率,而且有利于在各個階段進行數(shù)據(jù)質(zhì)量的溯源。

      (3)完備的科學數(shù)據(jù)管理政策和標準化體系是數(shù)據(jù)中心建設的重要基礎

      ICPSR在科學數(shù)據(jù)管理方面有一系列的數(shù)據(jù)管理政策,諸如大學間政治社會研究聯(lián)盟訪問政策框架、保藏發(fā)展政策、會員資助數(shù)據(jù)共享政策、數(shù)字保存政策框架等。在標準技術(shù)上,ICPSR采用國際標準化組織推薦的OAIS建立數(shù)據(jù)管理的標準化框架,采用國際DDI標準構(gòu)建元數(shù)據(jù)技術(shù)規(guī)范。在其元數(shù)據(jù)描述要求中,規(guī)定所有數(shù)據(jù)必須遵從ICPSR的元數(shù)據(jù)內(nèi)容要求,包括使用可擴展標記語言(XML)對文檔和數(shù)據(jù)進行結(jié)構(gòu)化處理,元數(shù)據(jù)中要包含參研人員、資金來源、項目描述等主要元素。ICPSR同樣規(guī)定了數(shù)據(jù)的引用格式。其標準化的引用格式包括標題、作者、數(shù)據(jù)、版本和永久標識符等內(nèi)容。這些都是其科學數(shù)據(jù)可以長期保存、利用和增值的重要基礎。

      (4)科學數(shù)據(jù)安全管理制度完善、物理設施齊備,重視數(shù)據(jù)中心認證

      ICPSR重視科學數(shù)據(jù)的安全管理,具有6個數(shù)據(jù)存儲備份,并且依托于亞馬遜的云平臺建立云備份。ICPSR對于重要的、具有權(quán)限控制的科學數(shù)據(jù)采取物理存儲隔離,只有具有相關(guān)權(quán)限的人員才能通過門禁系統(tǒng)進入這個區(qū)域。對于用戶訪問的網(wǎng)絡安全,ICPSR提供有VPN機制對特定用戶提供局域網(wǎng)的數(shù)據(jù)服務。鑒于數(shù)據(jù)安全問題,ICPSR未在國外進行備份。ICPSR重視數(shù)據(jù)中心認證,于2011年通過荷二Data Seal of Approval的數(shù)據(jù)中心認證。ICPSR數(shù)據(jù)中心各項軟、硬環(huán)境完善,是ICSU-WDS的國際數(shù)據(jù)中心之一,并通過ICSU-WDS的數(shù)據(jù)認證和評估。

      (5)科學數(shù)據(jù)管理的反哺和回報機制完善

      ICPSR利用信息技術(shù)對科學數(shù)據(jù)管理和開放服務的效益進行量化和追蹤,協(xié)調(diào)解決數(shù)據(jù)提供者、管理者、使用者之間的利益關(guān)注點,使得科學數(shù)據(jù)管理成效能夠開放透明地反哺和回報各利益相關(guān)方。例如,發(fā)布帶有標識符的科學數(shù)據(jù),提供科學數(shù)據(jù)使用的引用統(tǒng)計等。ICPSR當前引用率較高的數(shù)據(jù)其引用次數(shù)高達850余次。這個數(shù)據(jù)引用追蹤機制是對科學數(shù)據(jù)資源擁有者和提交者的極大回報,在客觀上也促進了優(yōu)質(zhì)科學數(shù)據(jù)資源的社會推廣和科學界評價。

      [1]司莉,莊曉喆,王思敏,等.2005年以來國外科學數(shù)據(jù)管理與共享研究進展與啟示[J].國家圖書館學刊,2013,22(3):40-49.

      [2]劉闖.美國國有科學數(shù)據(jù)共享管理機制及對我國的啟示[J].中國基礎科學,2003(1):29-31.

      [3]Memorandum of Agreement[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/about/governance/moa.html.

      [4]Constitution[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/about/governance/constitution.html.

      [5]Data Stewardship and Social Science Research Projects[EB/OL].[2017-05-14]. http://www.icpsr.umich. edu/icpsrweb/content/about/research-projects.html.

      [6]ICPSR Collection Development Policy[EB/OL].[2017-05-14]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/policies/colldev.html.

      [7]Details on Appraisal Critera[EB/OL].[2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/details.html.

      [8]Data Sources[EB/OL]. [2017-05-14].http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/sources.html.

      [9]ICPSR Access Policy Framework[EB/OL].[2017-05-14]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/preservation/policies/access-policyframework.html.

      [10]孟祥保,錢鵬.高校社會科學數(shù)據(jù)管理的國際經(jīng)驗及其借鑒:以UKDA和ICPSR為例[J].情報資料工作,2013,34(2):77-80.

      [11]Data Documentation Initiative (DDI)[EB/OL].[2017-05-02].http://www.ddialliance.org/.

      [12]About the Section 508 Standards[EB/OL].[2017-05-02]. https://www.access-board.gov/guidelines-andstandards/communications-and-it/about-the-section-508-standards.

      [13]Web Content Accessibility Guidelines (WCAG) 2.0 [EB/OL]. [2017-05-02]. https://www.w3.org/TR/WCAG20/.

      [14]OAIS-Based Processes[EB/OL].[2017-05-21]. http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/lifecycle/oais.html.

      [15]VARDUGAN M, LYLE J. The inter-university consortium for political and social research and the data seal of approval: accreditation experiences, challenges, and opportunities[J].Data Science Journal,2014(13):83-87.

      [16]National Health and Nutrition Examination Survey(NHANES), 2005-2006 (ICPSR 25504)[EB/OL].[2017-05-25].http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/25504#cite.

      [17]Utilization for National Health and Nutrition Examination Survey (NHANES), 2005-2006[EB/OL]. [2017-05-25].http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/25504/utilization.

      [18]王卷樂,孫九林.世界數(shù)據(jù)中心(WDC)回顧、變革與展望[J].地球科學進展,2009,24(6):612-620.

      Experiences and Enlightenment of ICPSR Scientific Data Center Development

      WANG Mingming1,2, WANG Juanle1,6, ZHAO Qiang3, GAO Mengxu4, LI Ge1,2, HAN Xuehua1,5, WANG Yujie1,2
      (1. Laboratory of Resources and Environment Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101; 2. School of Civil and Architectural Engineering, Shandong University of Technology, Zibo Shandong 255049; 3. College of Geoscience and Engineering, China University of Mining & Technology (Beijing), Beijing 100083; 4. National Science and Technology Infrastructure Center, Beijing 100862; 5. University of Chinese Academy of Sciences, Beijing 100049; 6. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023)

      Scientific data center is one of the important carriers of scientific data management and its construction methods include state data center model by top-down and disciplines distribution science data center model by bottom-up. In the information age of big data and data-driven scientific research paradigm,china develops rapidly but lacks experience in the construction of scientific data center, therefore In order to promote the management of scientific data in China, it is urgent to understand and draw lessons from the advanced concepts and practices of scientific data center construction in developed countries. The University of Michigan’s Inter-university Consortium for Political and Social Research (ICPSR) has conducted long-term social survey data accumulation, with years of Social Science Variables Database. It is highly representative of the construction of scientific data centers in the field of humanities and social sciences. In this paper, the ICPSR is elaborated and summarized from the aspects of organization and mechanism, policy and standard,data acquisition, data archiving, data authentication, data referencing and data services, through network research, document tracking and field interview. Combining with the status of data management of domestic scientific data center, the paper presents some suggestions for the development of Chinese scientific data center, and is expected to provide reference for scientific data center construction, data management and international development in various disciplinary fields.

      scientific data management, scientific data center, international experience, development enlightenment

      TP391.7

      A

      10.3772/j.issn.1674-1544.2017.06.015

      王明明(1993—),男,山東理工大學碩士研究生,研究方向:地理信息系統(tǒng)與科學數(shù)據(jù)管理;王卷樂(1976—),男,博士,中國科學院地理科學與資源研究所研究員,地球數(shù)據(jù)科學與共享研究室副主任,博士生導師,研究方向:科學數(shù)據(jù)共享、地理信息系統(tǒng)與遙感應用(通訊作者);趙強(1992—),男,中國礦業(yè)大學(北京)碩士研究生,研究方向:3S集成與工程應用;高孟緒(1982—),男,國家科技基礎條件平臺中心副研究員,博士,研究方向:科技資源管理與共享;李舸(1993—),男,山東理工大學碩士研究生,研究方向:地理信息系統(tǒng)與科學數(shù)據(jù)管理;韓雪華(1992—),女,中國科學院大學碩士研究生,研究方向:數(shù)據(jù)共享與知識發(fā)現(xiàn);王玉潔(1992—),女,山東理工大學碩士研究生,研究方向:地理信息共享。

      基金項目:國家科技基礎條件平臺專項課題“科學數(shù)據(jù)管理與開放共享的模式與方法研究”(2015DDJ1ZZ11);國家科技基礎條件平臺專項課題“科學數(shù)據(jù)匯聚的模式與方法研究”(2017DDJ12215);中國科學院學部咨詢評議項目“前沿與交叉學科科研信息化發(fā)展戰(zhàn)略研究”(O7M74940F4)。

      2017年5月30日。

      猜你喜歡
      數(shù)據(jù)管理數(shù)據(jù)中心科學
      酒泉云計算大數(shù)據(jù)中心
      企業(yè)級BOM數(shù)據(jù)管理概要
      定制化汽車制造的數(shù)據(jù)管理分析
      海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
      CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
      科學大爆炸
      民航綠色云數(shù)據(jù)中心PUE控制
      電子測試(2018年11期)2018-06-26 05:56:24
      科學
      基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應用
      科學拔牙
      龙陵县| 乌鲁木齐县| 伽师县| 玛多县| 昂仁县| 钟山县| 民县| SHOW| 日照市| 陈巴尔虎旗| 福海县| 咸丰县| 巴彦淖尔市| 江源县| 玉溪市| 黄山市| 浦县| 长阳| 龙海市| 库尔勒市| 三明市| 延安市| 牡丹江市| 中江县| 台东县| 肥东县| 华容县| 鲁山县| 简阳市| 宁蒗| 太原市| 金坛市| 宜黄县| 邵阳市| 阿拉善右旗| 怀集县| 江川县| 闻喜县| 临汾市| 甘孜| 晋宁县|