• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)字對象唯一標(biāo)識在中國科學(xué)數(shù)據(jù)領(lǐng)域中的應(yīng)用研究*

      2013-09-29 01:59:08涂勇彭潔中國科學(xué)技術(shù)信息研究所北京100038
      數(shù)字圖書館論壇 2013年8期
      關(guān)鍵詞:標(biāo)識符數(shù)據(jù)中心科學(xué)

      □ 涂勇 彭潔 / 中國科學(xué)技術(shù)信息研究所 北京 100038

      數(shù)字對象唯一標(biāo)識在中國科學(xué)數(shù)據(jù)領(lǐng)域中的應(yīng)用研究*

      □ 涂勇 彭潔 / 中國科學(xué)技術(shù)信息研究所 北京 100038

      文章在分析比較國外科學(xué)數(shù)據(jù)唯一標(biāo)識符研究現(xiàn)狀的基礎(chǔ)上,結(jié)合已開展的DOI注冊工作,對中文科學(xué)數(shù)據(jù)DOI的應(yīng)用現(xiàn)狀和服務(wù)成效進(jìn)行了概述,對科學(xué)數(shù)據(jù)唯一標(biāo)識符應(yīng)用的可行性進(jìn)行了分析,并對中文科學(xué)數(shù)據(jù)DOI管理策略以及注冊推廣中存在的突出問題進(jìn)行了分析,將為今后的科學(xué)數(shù)據(jù)DOI注冊工作提供參考。

      數(shù)字對象唯一標(biāo)識,科學(xué)數(shù)據(jù),數(shù)據(jù)共享

      科學(xué)數(shù)據(jù)總量的迅猛增加使得對科學(xué)數(shù)據(jù)資源的定位難度加大。傳統(tǒng)的科學(xué)數(shù)據(jù)資源(保密數(shù)據(jù)除外)依靠URL對資源進(jìn)行定位,但URL指向數(shù)字對象的物理位置而不是數(shù)字對象本身的性質(zhì),決定了其無法對數(shù)字對象進(jìn)行長期、穩(wěn)定的定位。1998年由美國出版協(xié)會(AAP)創(chuàng)立非贏利組織IDF,IDF在CNRI(美國國家研究推進(jìn)機(jī)構(gòu))配合下制定了數(shù)字對象唯一標(biāo)識(DOI)標(biāo)準(zhǔn)和相應(yīng)的解析系統(tǒng)(Handle System),建立了由IDF、注冊代理機(jī)構(gòu)(RA)、發(fā)布代理機(jī)構(gòu)(PA)組成的DOI應(yīng)用體系,其目的是建立互聯(lián)網(wǎng)環(huán)境下數(shù)字對象標(biāo)識和知識產(chǎn)權(quán)管理和保護(hù)的解決方案。本文將對數(shù)字對象唯一標(biāo)識技術(shù)(DOI)在中國科學(xué)數(shù)據(jù)領(lǐng)域中的應(yīng)用現(xiàn)狀與成效、存在的問題進(jìn)行梳理,希望能對今后的科學(xué)數(shù)據(jù)DOI注冊和服務(wù)工作有借鑒作用。

      1 科學(xué)數(shù)據(jù)唯一標(biāo)識的發(fā)展現(xiàn)狀

      1.1 國外科學(xué)數(shù)據(jù)唯一標(biāo)識的應(yīng)用現(xiàn)狀

      在國外,數(shù)字對象唯一標(biāo)識符系統(tǒng)(DOIs)在原文獲取、引文鏈接與數(shù)字版權(quán)管理中已有廣泛的應(yīng)用[1]??茖W(xué)數(shù)據(jù)作為一種科技資源,也存在類似的應(yīng)用,國外相關(guān)機(jī)構(gòu)已經(jīng)開展了DOI在科學(xué)數(shù)據(jù)上的應(yīng)用,并取得了一定的成效。

      德國國家科學(xué)技術(shù)圖書館(TIB)是世界上首個將DOI應(yīng)用在科學(xué)數(shù)據(jù)領(lǐng)域的專業(yè)機(jī)構(gòu)。德國科學(xué)基金會在2003年至2005年間資助德國CODATA啟動了科學(xué)數(shù)據(jù)出版和引用的項(xiàng)目,在該項(xiàng)目中使用DOI來標(biāo)識科學(xué)數(shù)據(jù)資源。這些數(shù)據(jù)源存儲在世界數(shù)據(jù)中心(WDC)在德國的科研機(jī)構(gòu)[2]。2005年它正式成為科學(xué)數(shù)據(jù)的DOI注冊中心(RA for scientificdataset),2009年10月由TIB牽頭聯(lián)合世界上多家科技信息機(jī)構(gòu)建立的DataCite非盈利組織,其RA的資格也轉(zhuǎn)移到該組織,旨在建立跨數(shù)據(jù)中心的數(shù)據(jù)集成系統(tǒng),方便研究者發(fā)現(xiàn)和獲取數(shù)據(jù),推動數(shù)據(jù)的引用。截至2013年初,已經(jīng)有13個國家21個單位和組織加入了DataCite系統(tǒng),截止到2013年4月,該組織的DOI注冊量已經(jīng)達(dá)到1400萬個[3]。注冊的數(shù)據(jù)類型主要包括數(shù)據(jù)集、科學(xué)電影剪輯、醫(yī)學(xué)案例、技術(shù)報(bào)告和學(xué)習(xí)對象等,未來科學(xué)內(nèi)容(scientific content)將是TIB的主要工作,它的注冊對象包括各種不同的內(nèi)容類型,如晶體結(jié)構(gòu)、地球模型和3D模型等[4]。

      由于各國的發(fā)展環(huán)境、政策以及數(shù)據(jù)共享意識存在差別,其他國家在科學(xué)數(shù)據(jù)領(lǐng)域的DOI應(yīng)用工作還只是起步階段。除了DataCite在國際上對科學(xué)數(shù)據(jù)進(jìn)行注冊外,韓國科學(xué)技術(shù)情報(bào)研究所(KISTI)是DataCite的聯(lián)系會員(affiliated member),將通過DataCite來注冊本國的科學(xué)數(shù)據(jù)資源;日本科技振興機(jī)構(gòu)(JST)在成為全球第12個注冊代理機(jī)構(gòu)后,將在材料科學(xué)數(shù)據(jù)領(lǐng)域開展科學(xué)數(shù)據(jù)DOI的注冊工作。

      1.2 中文科學(xué)數(shù)據(jù)DOI應(yīng)用現(xiàn)狀概述

      在中文科學(xué)數(shù)據(jù)DOI相關(guān)的理論研究方面,自2001年起,中國科學(xué)院文獻(xiàn)情報(bào)中心、國家圖書館等機(jī)構(gòu)開始關(guān)注和研究DOI在中文信息資源方面的應(yīng)用,并承擔(dān)了科技部“數(shù)字對象唯一標(biāo)識”課題研究,為中文DOI的推廣和應(yīng)用奠定了基礎(chǔ)[5]。目前中文科學(xué)數(shù)據(jù)DOI的應(yīng)用仍處在探索階段,除了DOI本身的唯一標(biāo)識的特性外,國內(nèi)相關(guān)學(xué)者對DOI的價(jià)值尤其是在異質(zhì)科技資源的鏈接和數(shù)據(jù)引用方面進(jìn)行了初步的探討。賀德方等探討了DOI在異質(zhì)科技資源的相互引用和鏈接上的應(yīng)用[6],吳立宗等總結(jié)了DOI在數(shù)據(jù)共享中的跟蹤價(jià)值、引用價(jià)值、集成價(jià)值、關(guān)聯(lián)價(jià)值,以及在科學(xué)數(shù)據(jù)出版中的應(yīng)用[7]。彭潔等對基于DOI的科技文獻(xiàn)與科學(xué)數(shù)據(jù)的融合以及科學(xué)數(shù)據(jù)引用進(jìn)行了初步的探討[8,9],王衛(wèi)華等針對科學(xué)數(shù)據(jù)庫的數(shù)據(jù)資源建立了科學(xué)數(shù)據(jù)引用規(guī)范[10],張英杰等對科研人員引用科學(xué)數(shù)據(jù)進(jìn)行了調(diào)查,指出科研人員針對科學(xué)數(shù)據(jù)引用依然存在著認(rèn)識不充分、引用行為不規(guī)范等諸多問題[11]。

      在中文科學(xué)數(shù)據(jù)DOI應(yīng)用服務(wù)方面,2007年3月,中國科學(xué)技術(shù)信息研究所聯(lián)合北京萬方數(shù)據(jù)股份有限公司成為中國大陸地區(qū)DOI的注冊代理機(jī)構(gòu),開始提供中文DOI注冊服務(wù),并結(jié)合科技部精品期刊項(xiàng)目開展了中文DOI的推廣,科學(xué)數(shù)據(jù)是當(dāng)初確定的兩個重點(diǎn)推廣領(lǐng)域之一。2011年底,國際DOI 基金會(IDF)正式授權(quán)中信所為DOI注冊機(jī)構(gòu)(RA),同時中信所授權(quán)北京萬方數(shù)據(jù)股份有限公司為用戶提供DOI的注冊及相關(guān)服務(wù),目前已經(jīng)注冊了15000條科學(xué)數(shù)據(jù)DOI,實(shí)現(xiàn)唯一標(biāo)識的注冊、解析和查詢服務(wù),并對傳統(tǒng)科學(xué)數(shù)據(jù)中心、自然科技資源相關(guān)機(jī)構(gòu)、科學(xué)數(shù)據(jù)相關(guān)的商業(yè)公司進(jìn)行了調(diào)研,開展了初步的合作。

      2 科學(xué)數(shù)據(jù)唯一標(biāo)識在科學(xué)數(shù)據(jù)中心應(yīng)用的可行性分析

      科學(xué)數(shù)據(jù)資源是科學(xué)研究基礎(chǔ)的信息資源之一,很多科學(xué)數(shù)據(jù)資源已經(jīng)通過Internet對外提供數(shù)據(jù)服務(wù)。但在數(shù)據(jù)服務(wù)過程中,經(jīng)常出現(xiàn)由于資源被移動而發(fā)生鏈接錯誤、在資源復(fù)制過程中發(fā)生版權(quán)遺失、由于版本更新使資源鏈接失效或無法對數(shù)據(jù)引用進(jìn)行有效標(biāo)識等一系列問題。因而急需一種能對數(shù)據(jù)資源進(jìn)行持久唯一標(biāo)識的、動態(tài)更新的、與物理地址變動無關(guān)的、能跟蹤版本更新信息的、引用方便的數(shù)字對象唯一標(biāo)識系統(tǒng)。

      唯一標(biāo)識符系統(tǒng)的目的在于分配永久的、可互用的、優(yōu)化組合的、可解析的標(biāo)識符,用于公共訪問及組織間的協(xié)同工作,唯一標(biāo)識符系統(tǒng)在實(shí)現(xiàn)不同應(yīng)用系統(tǒng)的互操作和集成、保護(hù)互聯(lián)網(wǎng)上的知識產(chǎn)權(quán)等方面發(fā)揮著越來越重要的作用。

      對于數(shù)據(jù)中心來說,唯一標(biāo)識符系統(tǒng)主要意味著接受一個“前綴”,這個前綴是不同科學(xué)數(shù)據(jù)出版機(jī)構(gòu)共享元數(shù)據(jù)和應(yīng)用互操作的基礎(chǔ)。唯一標(biāo)識符可以更好地實(shí)現(xiàn)科學(xué)數(shù)據(jù)資源的集成處理和發(fā)布,便于進(jìn)行科學(xué)數(shù)據(jù)的管理和應(yīng)用,可以用同一種標(biāo)識機(jī)制來管理科技資源,促進(jìn)科學(xué)數(shù)據(jù)與科技文獻(xiàn)的融合。在一些數(shù)據(jù)中心,各種來源的數(shù)據(jù)往往采用各自不同的標(biāo)識機(jī)制,各種數(shù)據(jù)在內(nèi)容特別是標(biāo)識格式上的差異,以及同一內(nèi)容科學(xué)數(shù)據(jù)不同數(shù)據(jù)機(jī)構(gòu)保存的重復(fù),客觀上需要科學(xué)數(shù)據(jù)中心建立集成發(fā)布的界面和本地化控制的機(jī)制(如利用開放鏈接的機(jī)制),另外國外一些數(shù)據(jù)資源(TIB所收錄的WDCC的數(shù)據(jù)資源)已經(jīng)采用DOI的方式對科學(xué)數(shù)據(jù)進(jìn)行標(biāo)識,也要求我們用類似的機(jī)制進(jìn)行管理。

      唯一標(biāo)識符大大簡化了最終用戶的操作,通過唯一標(biāo)識符,用戶可以準(zhǔn)確定位到對應(yīng)的數(shù)字對象,避免了因?qū)ο蟮奈恢米兏⑿薷亩鴮?dǎo)致的鏈接錯誤。唯一標(biāo)識解析系統(tǒng)不僅只針對一個軟件技術(shù)平臺,更重要的是在國內(nèi)建立一整套數(shù)字資源唯一標(biāo)識符的解析管理機(jī)制,具體來說包括技術(shù)平臺的維護(hù)和擴(kuò)展、唯一標(biāo)識符前綴的申請和分配、唯一標(biāo)識符如何同數(shù)據(jù)庫提供商的現(xiàn)有產(chǎn)品相結(jié)合等內(nèi)容。

      正是由于DOI的某些特性,能夠滿足科學(xué)數(shù)據(jù)管理的需求,如表1所示[11]。

      3 中文科學(xué)數(shù)據(jù)DOI應(yīng)用的成效概述

      自2007年中信所成為DOI注冊機(jī)構(gòu)后,項(xiàng)目組對國內(nèi)大型科學(xué)數(shù)據(jù)中心,包括氣象、國土、地震數(shù)據(jù)中心、WDS中國節(jié)點(diǎn)等國內(nèi)有影響力的數(shù)據(jù)中心,以及目前運(yùn)行比較好的地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)、中國科學(xué)院網(wǎng)絡(luò)中心的科學(xué)數(shù)據(jù)庫進(jìn)行了深入走訪和調(diào)查。調(diào)研的結(jié)果發(fā)現(xiàn),本次調(diào)研的范圍基本上涵蓋了國內(nèi)主要的科學(xué)數(shù)據(jù)機(jī)構(gòu),大部分機(jī)構(gòu)都意識到注冊DOI工作的重要性,但對于DOI的安全性和收費(fèi)問題仍然存在疑問,同時由于前期各數(shù)據(jù)中心缺乏項(xiàng)目支持(2008-2012年),積極性并不是很高,只有少數(shù)機(jī)構(gòu)自發(fā)地開展工作,但隨著試點(diǎn)工作的持續(xù)進(jìn)行,DOI對數(shù)據(jù)中心的價(jià)值日益顯現(xiàn)。2012年開始,科技部對認(rèn)定的23個平臺進(jìn)行持續(xù)經(jīng)費(fèi)支持,一部分科學(xué)數(shù)據(jù)中心將DOI工作列入新一年的數(shù)據(jù)中心工作計(jì)劃,DOI的注冊和服務(wù)工作將會得到一個實(shí)質(zhì)性的推動。

      表1 DOI特性與科學(xué)數(shù)據(jù)需求對照表

      2008年中信所與中國科學(xué)院寒旱所西部數(shù)據(jù)中心(現(xiàn)改名寒旱區(qū)數(shù)據(jù)中心)開展了科學(xué)數(shù)據(jù)唯一標(biāo)識注冊與引用的試點(diǎn)工作,目前已經(jīng)注冊DOI 233條,雙方共同制定了科學(xué)數(shù)據(jù)引用格式,開展了合作研究和共同申報(bào)項(xiàng)目,組織了多次研討會。此外,隨著討論的深入,西部數(shù)據(jù)中心已經(jīng)將DOI及其增值應(yīng)用的思路融入到其業(yè)務(wù)流程中,創(chuàng)新地提出了科學(xué)數(shù)據(jù)共享的新思路,包括基于DOI的科學(xué)數(shù)據(jù)引用與出版、科學(xué)數(shù)據(jù)評審確??茖W(xué)數(shù)據(jù)質(zhì)量,以及尊重科學(xué)數(shù)據(jù)知識產(chǎn)權(quán)創(chuàng)新服務(wù)模式方面都取得了新的進(jìn)展,逐步將科學(xué)數(shù)據(jù)資源盤活,也走出了一條數(shù)據(jù)中心可持續(xù)發(fā)展的思路,成為目前國內(nèi)研究人員獲取數(shù)據(jù)的重要渠道,其數(shù)據(jù)服務(wù)的成效也得到了業(yè)界的認(rèn)可,這充分說明在引入DOI后將極大促進(jìn)科學(xué)數(shù)據(jù)中心資源的管理和共享。該試點(diǎn)工作非常成功,在其影響下北京師范大學(xué)全球變化研究院、中國極地研究中心、地球科學(xué)數(shù)據(jù)共享網(wǎng)都表現(xiàn)出很大的積極性,已經(jīng)簽署了科學(xué)數(shù)據(jù)唯一標(biāo)識服務(wù)協(xié)議,并已經(jīng)注冊了少量數(shù)據(jù),并表示在今后的項(xiàng)目和平臺過程中將DOI作為科學(xué)數(shù)據(jù)管理的基本要素進(jìn)行考慮。

      2010年與北京師范大學(xué)全球變化研究院在項(xiàng)目數(shù)據(jù)DOI注冊上開展了實(shí)驗(yàn),已經(jīng)注冊了5條項(xiàng)目中產(chǎn)生的數(shù)據(jù)集,該機(jī)構(gòu)為項(xiàng)目數(shù)據(jù)注冊DOI一方面是由于項(xiàng)目結(jié)題需要,另一方面也是為了對這些項(xiàng)目執(zhí)行過程中產(chǎn)生的數(shù)據(jù)進(jìn)行唯一性、權(quán)威性認(rèn)證,該工作得到了評委專家的認(rèn)可,并可以在今后項(xiàng)目數(shù)據(jù)管理中進(jìn)行推廣應(yīng)用。

      在實(shí)物資源數(shù)據(jù)方面,項(xiàng)目啟動之初,項(xiàng)目組對國家自然科技資源e平臺,實(shí)驗(yàn)細(xì)胞平臺、中國農(nóng)業(yè)科學(xué)院土肥所、中科院植物所、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所進(jìn)行了深入調(diào)查,對實(shí)物資源的唯一標(biāo)識注冊進(jìn)行了探討,并對e平臺中一萬余條植物、微生物、實(shí)驗(yàn)細(xì)胞資源數(shù)據(jù)進(jìn)行了注冊。

      對商業(yè)公司運(yùn)營的科學(xué)數(shù)據(jù)平臺方面,選擇計(jì)算機(jī)領(lǐng)域的數(shù)據(jù)堂公司、實(shí)驗(yàn)方法領(lǐng)域的庫巴扎公司以及萬方醫(yī)學(xué)網(wǎng)平臺開展了調(diào)研活動,其公益性運(yùn)行的數(shù)據(jù)中僅有少部分有注冊的需求,而且DOI給該公司帶來的商業(yè)價(jià)值并不明顯,該層面的合作還需要進(jìn)行深入探討和挖掘。目前已經(jīng)與庫巴扎公司開展了實(shí)驗(yàn)方法方面的合作,確定了DOI注冊的范圍,簽訂了科學(xué)數(shù)據(jù)唯一標(biāo)識服務(wù)合同,探討了科學(xué)數(shù)據(jù)出版的一種模式,即在紙質(zhì)出版物上對實(shí)驗(yàn)方法進(jìn)行DOI標(biāo)注。

      4 中文科學(xué)數(shù)據(jù)DOI管理策略

      6年來,項(xiàng)目組對中文DOI管理中的核心問題進(jìn)行了研究和分析,逐步對DOI注冊的對象、地址管理策略、DOI元數(shù)據(jù)和注冊流程進(jìn)行了梳理,在實(shí)際的管理過程中得到了應(yīng)用。

      4.1 科學(xué)數(shù)據(jù)DOI注冊的對象

      IDF對于DOI可注冊的內(nèi)容沒有嚴(yán)格的限制,只要是數(shù)字物體都可以分配DOI,甚至對實(shí)物也可以賦予DOI號。DOI源頭注冊的功能,一方面是對源頭資源知識產(chǎn)權(quán)的一種保護(hù),另一方面也是保證DOI號唯一性,無論該數(shù)據(jù)匯交到哪個地方,DOI號依然保持不變。對于科學(xué)數(shù)據(jù)來說,科學(xué)數(shù)據(jù)注冊的粒度根據(jù)用戶的需要來制定,本文認(rèn)為其注冊的對象主要分為兩個層次:

      數(shù)據(jù)集合(data collection):一個或者多個數(shù)據(jù)集的集合,按照某種應(yīng)用目的組織起來的數(shù)據(jù)集合稱為數(shù)據(jù)產(chǎn)品。

      數(shù)據(jù)集(dataset):按照一定序列組織的數(shù)據(jù)單元,由一條或者多條數(shù)據(jù)記錄組成。

      數(shù)據(jù)記錄(data record):數(shù)據(jù)組織的最小單位。

      從數(shù)據(jù)引用的角度上講,粒度太粗或者太細(xì)都不符合數(shù)據(jù)引用的需求,定位到數(shù)據(jù)集將能最大限度地揭示數(shù)據(jù)的特征,因此在數(shù)據(jù)注冊的時候盡量選擇數(shù)據(jù)集進(jìn)行注冊,從而能夠更好地揭示數(shù)據(jù)的本質(zhì),有利于進(jìn)行科研成果的檢驗(yàn)和審核。

      科學(xué)數(shù)據(jù)DOI注冊對象的要求主要包括:

      (1)數(shù)據(jù)具有穩(wěn)定性:所注冊的數(shù)據(jù)對象一旦注冊就固定下來,不能隨意改動,數(shù)據(jù)的穩(wěn)定性還能保證該數(shù)據(jù)能夠持續(xù)永久地被訪問到。

      (2)數(shù)據(jù)產(chǎn)權(quán)清晰,非涉密:目前國內(nèi)的科學(xué)數(shù)據(jù)大多數(shù)存在知識產(chǎn)權(quán)的問題,部分?jǐn)?shù)據(jù)由于涉及國際機(jī)密,這些數(shù)據(jù)很難進(jìn)行獲取,因此在注冊時應(yīng)優(yōu)先考慮產(chǎn)權(quán)清晰、非涉密的科學(xué)數(shù)據(jù)資源。

      (3)開放獲?。╫pen access):這是由DOI的特性所決定的,其號碼背后的鏈接地址決定了該資源能夠進(jìn)行開放獲取。

      (4)可被引用(citable):引用是DOI的擴(kuò)展價(jià)值,數(shù)據(jù)能夠被引用也從另一方面說明了數(shù)據(jù)的價(jià)值,并能對數(shù)據(jù)的使用情況進(jìn)行追蹤。

      (5)適合出版(fit for publication):與文獻(xiàn)的出版類似,數(shù)據(jù)注冊DOI號以后,該號碼將伴隨數(shù)據(jù)的整個出版過程。

      DOI由前綴和后綴組成,并且有鏈接地址與DOI號進(jìn)行綁定,其管理原則主要包括:

      前綴由IDF統(tǒng)一組織編碼,對于持續(xù)穩(wěn)定注冊的機(jī)構(gòu)建議注冊新的前綴,由數(shù)據(jù)中心提出申請,注冊機(jī)構(gòu)收到申請后提交到IDF,由IDF隨機(jī)生成一個唯一標(biāo)識該數(shù)據(jù)中心的前綴碼,以后該中心注冊的數(shù)據(jù)必須附加該前綴碼。對于注冊量比較小或者臨時注冊的情況建議使用公共前綴。

      而后綴是由注冊機(jī)構(gòu)根據(jù)自身的需求,在保證號碼唯一性的前提下自行定義的,中文DOI管理中心會出建議標(biāo)準(zhǔn),且后綴的每個字段都必須是有意義的字符串,可選的注冊信息主要包括項(xiàng)目信息、數(shù)據(jù)類別碼、流水碼等,將協(xié)助數(shù)據(jù)中心來制定后綴的編碼規(guī)則。

      鏈接地址:從實(shí)際運(yùn)行的情況來看,該鏈接地址指向的是數(shù)據(jù)的元數(shù)據(jù)地址,數(shù)據(jù)地址將在元數(shù)據(jù)中進(jìn)行體現(xiàn)。該地址必須是正式域名,且指向的是描述該數(shù)據(jù)的詳細(xì)頁面,如果有多個地址,一種方法是挑選最穩(wěn)定的一個地址進(jìn)行注冊,同時也可以使用DOI注冊的多向解析功能,注冊多個地址,但由于該項(xiàng)功能的商業(yè)模式并不成熟,在初期應(yīng)用的時候不建議使用。當(dāng)鏈接地址發(fā)生變更時,由數(shù)據(jù)機(jī)構(gòu)及時更新并通知數(shù)據(jù)注冊中心,同時中文DOI中心將定期對鏈接地址進(jìn)行查詢,如果鏈接地址失效應(yīng)及時通知數(shù)據(jù)機(jī)構(gòu)并協(xié)商解決。

      4.3 DOI元數(shù)據(jù)管理策略

      在DOI的元數(shù)據(jù)模型方面,IDF在DOI手冊(DOI handbook)中提出了基于INDECS框架構(gòu)建DOI元數(shù)據(jù)模型,并規(guī)定了其中的核心元數(shù)據(jù)項(xiàng),根據(jù)該標(biāo)準(zhǔn)TIB(DataCite)也制定了核心元數(shù)據(jù)標(biāo)準(zhǔn)(TIB metadata Kernel),中文科學(xué)數(shù)據(jù)DOI依據(jù)TIB的標(biāo)準(zhǔn),構(gòu)建了中文科學(xué)數(shù)據(jù)DOI元數(shù)據(jù)標(biāo)準(zhǔn)STD-DOI metadata V1.0。但是在實(shí)際執(zhí)行的過程中,結(jié)果并不理想,由于技術(shù)和學(xué)科背景的差異,不同數(shù)據(jù)中心采用的元數(shù)據(jù)標(biāo)準(zhǔn)存在一定的差異,并不能全部按照該標(biāo)準(zhǔn)上傳元數(shù)據(jù),條件較好的數(shù)據(jù)中心能按照要求準(zhǔn)備元數(shù)據(jù),并能夠注冊英文元數(shù)據(jù),能夠在國際上進(jìn)行查詢。但是大部分的數(shù)據(jù)中心并不具備這樣的條件和水平。因此,更多的數(shù)據(jù)中心希望用一種更加簡單的元數(shù)據(jù),同時以更加靈活的方式(批量注冊、在線實(shí)時注冊)進(jìn)行元數(shù)據(jù)的上載工作。為了能夠兼容不同數(shù)據(jù)中心的元數(shù)據(jù)差異,中文DOI中心將采用一種簡單的元數(shù)據(jù)標(biāo)準(zhǔn)實(shí)現(xiàn)DOI標(biāo)識數(shù)字資源的描述和管理。主要的字段包括數(shù)據(jù)作者、數(shù)據(jù)標(biāo)題、數(shù)據(jù)關(guān)鍵詞、數(shù)據(jù)DOI號和鏈接地址,開發(fā)自動注冊接口實(shí)現(xiàn)在線注冊,同時能夠兼容V1.0的標(biāo)準(zhǔn),在條件成熟時,能夠補(bǔ)充相關(guān)的元數(shù)據(jù)信息,來實(shí)現(xiàn)與國外資源的互聯(lián)。

      注冊機(jī)構(gòu)收錄數(shù)據(jù)元數(shù)據(jù)的目的在于便于進(jìn)行DOI號的查重,但更重要的是基于元數(shù)據(jù)開發(fā)DOI的增值利用,便于用戶能夠查詢到該數(shù)據(jù)的部分信息,同時能更加方便地使用DOI服務(wù)。目前IDF對于元數(shù)據(jù)的增值應(yīng)用并沒有統(tǒng)一的標(biāo)準(zhǔn),各家RA機(jī)構(gòu)各自開發(fā)基于元數(shù)據(jù)的增值應(yīng)用,如CrossRef出于商業(yè)利益,開發(fā)了一系列基于元數(shù)據(jù)的增值應(yīng)用。元數(shù)據(jù)信息一般保留在注冊代理機(jī)構(gòu)本地的數(shù)據(jù)庫,元數(shù)據(jù)也不會在國際范圍內(nèi)公開,因此數(shù)據(jù)中心根本不用擔(dān)心注冊提交元數(shù)據(jù)泄密的問題。注冊代理機(jī)構(gòu)之間的元數(shù)據(jù)一般也不共享,如果的確需要共享,機(jī)構(gòu)間必須簽署元數(shù)據(jù)交換協(xié)議。

      在科學(xué)數(shù)據(jù)DOI注冊的元數(shù)據(jù)的使用方面,根據(jù)我們與數(shù)據(jù)中心簽訂的科學(xué)數(shù)據(jù)唯一標(biāo)識合同,數(shù)據(jù)機(jī)構(gòu)賦予注冊機(jī)構(gòu)永久的權(quán)利去免費(fèi)使用和分發(fā)元數(shù)據(jù),注冊中心不能隨意更改元數(shù)據(jù)的內(nèi)容,除非是有技術(shù)要求的需要,更深層次的修改必須通過協(xié)議解決。

      4.4 中文科學(xué)數(shù)據(jù)DOI注冊流程

      科學(xué)數(shù)據(jù)DOI標(biāo)識需要遵循IDF以及中文DOI制定的DOI注冊、申請等相關(guān)機(jī)制和政策。中文科學(xué)數(shù)據(jù)DOI注冊的具體實(shí)施過程是:

      (1)申請。簽訂科學(xué)數(shù)據(jù)唯一標(biāo)識服務(wù)協(xié)議。

      (2)注冊唯一標(biāo)識符,按照指定的科學(xué)數(shù)據(jù)DOI標(biāo)識規(guī)范,對適合進(jìn)行標(biāo)識的數(shù)據(jù)對象賦予唯一標(biāo)識符。

      (3)元數(shù)據(jù)??茖W(xué)數(shù)據(jù)DOI元數(shù)據(jù)按照IDF制定的schema準(zhǔn)備XML批處理文件,并向中文DOI注冊科學(xué)數(shù)據(jù)每一個數(shù)據(jù)集的元數(shù)據(jù)信息。

      (4)查詢與解析。由科學(xué)數(shù)據(jù)唯一標(biāo)識服務(wù)系統(tǒng)提供科學(xué)數(shù)據(jù)的查詢、解析服務(wù)。

      5 科學(xué)數(shù)據(jù)唯一標(biāo)識注冊推廣中的難點(diǎn)分析

      通過對6年科學(xué)數(shù)據(jù)唯一標(biāo)識注冊工作的總結(jié),總體來看,科學(xué)數(shù)據(jù)唯一標(biāo)識工作推進(jìn)較慢,注冊量較小,應(yīng)用面較窄。科學(xué)數(shù)據(jù)唯一標(biāo)識注冊工作與文獻(xiàn)唯一標(biāo)識注冊工作有很明顯的區(qū)別,存在一些問題,原因一方面由于人手不夠,集中在比較熟悉的領(lǐng)域,但更多還是從科學(xué)數(shù)據(jù)自身以及管理過程中存在的問題決定的:

      (1)科學(xué)數(shù)據(jù)缺乏一個穩(wěn)定的載體,是DOI注冊的障礙之一

      國外的文獻(xiàn)基本上被主要的文獻(xiàn)出版商進(jìn)行控制,國內(nèi)雖然都是小的編輯部,但也存在像同方、萬方、維普這樣的數(shù)據(jù)出版商對數(shù)字資源進(jìn)行整合、集成和應(yīng)用。與文獻(xiàn)不同,科學(xué)數(shù)據(jù)缺乏一個穩(wěn)定的載體(沒有紙質(zhì)的載體),以及專業(yè)的數(shù)據(jù)出版機(jī)構(gòu),目前大部分科學(xué)數(shù)據(jù)生產(chǎn)機(jī)構(gòu)(共享平臺)都是通過項(xiàng)目的形式進(jìn)行維持的,有的平臺由于缺乏經(jīng)費(fèi),其內(nèi)容不再更新,或者網(wǎng)站根本就關(guān)掉或者停止訪問,客觀上造成比較難于有一個持續(xù)、穩(wěn)定的科學(xué)數(shù)據(jù)獲取渠道,對于科學(xué)數(shù)據(jù)DOI注冊是一個最大的障礙。

      (2)科學(xué)數(shù)據(jù)自身的特點(diǎn)導(dǎo)致注冊難于推進(jìn)

      跟文獻(xiàn)不同,科學(xué)數(shù)據(jù)體量大,學(xué)科領(lǐng)域眾多,數(shù)據(jù)來源多樣化(網(wǎng)上搜集的、匯交的),缺乏知識產(chǎn)權(quán)保護(hù),部分?jǐn)?shù)據(jù)有涉密的要求。數(shù)據(jù)粒度難以把握。因此,注冊的時候需要對數(shù)據(jù)資源進(jìn)行篩選,挑選粒度合適、產(chǎn)權(quán)清晰、數(shù)據(jù)質(zhì)量較好的科學(xué)數(shù)據(jù)注冊DOI。

      (3)科學(xué)數(shù)據(jù)管理過程中的特點(diǎn)導(dǎo)致DOI注冊工作難于推進(jìn)

      數(shù)據(jù)生產(chǎn)的時間不固定,通常要根據(jù)項(xiàng)目或者實(shí)驗(yàn)的時間數(shù)據(jù)的內(nèi)容不固定,數(shù)據(jù)的內(nèi)容由于項(xiàng)目結(jié)題或者管理的需要經(jīng)常被重新組合、修改、更新,同時還有數(shù)據(jù)鏈接不穩(wěn)定、地址經(jīng)常發(fā)生變更、數(shù)據(jù)描述不規(guī)范等問題,需要數(shù)據(jù)中心在技術(shù)、人員、機(jī)制等方面進(jìn)行改善,來保證DOI標(biāo)識鏈接的穩(wěn)定性和有效性。

      (4)擔(dān)心元數(shù)據(jù)被匯交到國外,降低競爭力

      數(shù)據(jù)中心擔(dān)心注冊時所用的元數(shù)據(jù)被匯交到國外,降低競爭力,這是目前DOI注冊的最大障礙。在注冊初期,項(xiàng)目組借鑒了TIB(DataCite)的元數(shù)據(jù)標(biāo)準(zhǔn),一部分遵循了IDF的INDECS標(biāo)準(zhǔn),但是也有一部分是為了開展增值服務(wù)的,同時為了與國際上的目錄信息進(jìn)行交換和集成,但大部分元數(shù)據(jù)信息無法收錄,而且實(shí)際上中文科學(xué)數(shù)據(jù)中心的國際化程度較低,僅有極少數(shù)中心實(shí)現(xiàn)了中英文雙語的元數(shù)據(jù)描述,是在執(zhí)行的過程中數(shù)據(jù)中心傾向于使用最簡單的元數(shù)據(jù)進(jìn)行注冊。同時IDF不存儲具體的DOI號、具體數(shù)據(jù)地址信息及元數(shù)據(jù),只存儲號段對應(yīng)的RA地址,在某家RA注冊的DOI號不管從哪個入口查詢,最終都會由IDF引導(dǎo)到具體的RA來查詢并返回信息。DOI的元數(shù)據(jù)由注冊機(jī)構(gòu)與注冊用戶協(xié)商解決,原則上匯交核心字段,元數(shù)據(jù)的基本功能是DOI號碼的查重,不對外直接暴露,如果基于此開發(fā)增值應(yīng)用,可簽訂具體的協(xié)議約定元數(shù)據(jù)的使用及公開條款。

      (5)DOI收費(fèi)的問題也曾經(jīng)是導(dǎo)致注冊工作很難推進(jìn)的因素

      中文DOI制定了詳細(xì)的收費(fèi)標(biāo)準(zhǔn),包括會員費(fèi)和注冊費(fèi),一年大約是1000元左右,包含500條DOI的注冊,單條DOI注冊的成本僅為國外CrossRef注冊費(fèi)用的1/7~1/6。但在推廣初期,我們免費(fèi)注冊了200多條DOI信息,但隨著工作的開展,以及DOI維護(hù)成本的提高,需要由數(shù)據(jù)中心來支付相關(guān)的費(fèi)用。在推廣初期,數(shù)據(jù)中心未獲得平臺項(xiàng)目支持,最擔(dān)心的就是一旦注冊量太大,注冊費(fèi)用比較高的問題,但實(shí)際上發(fā)現(xiàn)除了個別平臺潛在注冊量較大外,大部分中心的注冊量都在1000以下,并且現(xiàn)在部分?jǐn)?shù)據(jù)中心從2012年開始也已經(jīng)得到了較穩(wěn)定的經(jīng)費(fèi)支撐,DOI費(fèi)用僅僅占很小的部分,因此可以通過項(xiàng)目經(jīng)費(fèi)的方式來支付該費(fèi)用,如果注冊量比較大,可以通過協(xié)商的方式來共同制定合理的收費(fèi)政策,保證DOI在經(jīng)費(fèi)允許的情況下發(fā)揮最大的作用。

      6 結(jié)語

      確定唯一標(biāo)識和建立鏈接解析是建立知識鏈接體系的基礎(chǔ),通過DOI與其他標(biāo)準(zhǔn)和技術(shù)的集成應(yīng)用,可以實(shí)現(xiàn)知識鏈接從封閉系統(tǒng)向開放系統(tǒng)的轉(zhuǎn)移,并使鏈接的資源不斷多樣化,從期刊發(fā)展到圖書、學(xué)位、電子本,甚至科學(xué)數(shù)據(jù)[13],在科學(xué)數(shù)據(jù)領(lǐng)域中引入DOI,也將構(gòu)建完整的學(xué)術(shù)出版產(chǎn)業(yè)鏈[14]。DOI除了其本身的注冊、解析、查詢基本服務(wù)之外,將有利于解決科學(xué)數(shù)據(jù)引用、出版和知識產(chǎn)權(quán)等問題,為科學(xué)數(shù)據(jù)中心的建設(shè)提供新的思路,來促進(jìn)科學(xué)數(shù)據(jù)共享。

      [1] 任瑞娟,劉麗斌,濮德敏,等.中文DOI路在何方:從參考文獻(xiàn)著錄與DOI的關(guān)系探討中文數(shù)字對象唯一標(biāo)識符的發(fā)展方向[J].中國圖書館學(xué)報(bào),2010(2):115-121.

      [2] KLUMP J. Data Publication in the Open Access Initiative [J]. Data Science Journal, 2006, 5(15): 79.

      [3] DataCite Statistics service [EB/OL]. [2013-05-20]. http://stats.datacite.org.

      [4] BRASE J.德國國家科技圖書館科學(xué)內(nèi)容DOI注冊中心研究進(jìn)展[J].中國科技資源導(dǎo)刊,2008,40(1):37-39.

      [5] 王燕,毛軍.我國數(shù)字資源唯一標(biāo)識符應(yīng)用模式與管理機(jī)制[J].現(xiàn)代圖書情報(bào)技術(shù),2005(2):10-14.

      [6] 賀德方,張旭.服務(wù)于科技信息資源共享的數(shù)字對象唯一標(biāo)識應(yīng)用研究[J].現(xiàn)代圖書情報(bào)技術(shù),2007(8):26-29.

      [7] 吳立宗,涂勇,等.淺談科學(xué)數(shù)據(jù)出版中的數(shù)字對象唯一標(biāo)識符[J].中國科技資源導(dǎo)刊,2010,42(5):22-29.

      [8] 涂勇,彭潔.基于DOI技術(shù)的科學(xué)數(shù)據(jù)與科技文獻(xiàn)融合的研究[J].數(shù)字圖書館論壇,2007(10):29-31.

      [9] 彭潔,涂勇.科學(xué)數(shù)據(jù)引用的探討[J].數(shù)字圖書館論壇,2008(10):14-18.

      [10] 王衛(wèi)華,胡良霖,沈志宏.科學(xué)數(shù)據(jù)引用規(guī)范的研制[J].中國科技資源導(dǎo)刊,2013(1):36-40.

      [11] 張英杰,彭潔,張新民,等.科研人員引用科學(xué)數(shù)據(jù)的問卷調(diào)查[J].中國科技資源導(dǎo)刊,2013(1):41-46.

      [12] 郭曉峰,涂勇,蔡京生.DOI在內(nèi)容產(chǎn)業(yè)的應(yīng)用[J].傳媒,2012(12):72-74.

      [13] 賀德方.知識鏈接發(fā)展的歷史、未來和行動[J].現(xiàn)代圖書情報(bào)技術(shù),2005(3):11-15.

      [14] 張旭.DOI在學(xué)術(shù)出版產(chǎn)業(yè)鏈中的應(yīng)用研究[J].數(shù)字圖書館論壇,2007(10):5-9.

      Research on the Application of Digital Object Identifier in China's Scientific Data

      Tu Yong, Peng Jie / Institute of Scientific and Technical Information of China, Beijing, 100038

      Based on the comparative study of foreign Status quo of the unique identifier in scientific data, combined with the DOI registration work, the status and effectiveness of DOI application in China's scientific data were outlined, and the feasibility of DOI application in scientific data were analyzed, finally the problems of DOI management for China's scientific data and registration and promotion service were analyzed as the reference for future DOI registration service for scientific data.

      t: Digital Object Identifier(DOI), Scientific data, Data sharing

      2013-06-07)

      10.3772/j.issn.1673—2286.2013.08.006

      *本文為中央級公益性科研院所基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(編號:XK2012-4)成果之一。

      4.2

      與鏈接地址管理策略

      涂勇(1981- ),男,湖北鄂州人,博士,中國科學(xué)技術(shù)信息研究所助理研究員,研究方向:科技資源管理、科學(xué)數(shù)據(jù)共享、數(shù)字對象唯一標(biāo)識等。E-mail: tuyong@istic.ac.cn

      猜你喜歡
      標(biāo)識符數(shù)據(jù)中心科學(xué)
      淺析5G V2X 通信應(yīng)用現(xiàn)狀及其側(cè)鏈路標(biāo)識符更新技術(shù)
      酒泉云計(jì)算大數(shù)據(jù)中心
      基于底層虛擬機(jī)的標(biāo)識符混淆方法
      基于區(qū)塊鏈的持久標(biāo)識符系統(tǒng)①
      科學(xué)大爆炸
      民航綠色云數(shù)據(jù)中心PUE控制
      電子測試(2018年11期)2018-06-26 05:56:24
      數(shù)字美術(shù)館“數(shù)字對象唯一標(biāo)識符系統(tǒng)”建設(shè)需求淺議
      科學(xué)
      基于云計(jì)算的交通運(yùn)輸數(shù)據(jù)中心實(shí)現(xiàn)與應(yīng)用
      科學(xué)拔牙
      深泽县| 涡阳县| 工布江达县| 合江县| 吉安县| 洱源县| 尤溪县| 拉孜县| 枣强县| 赣州市| 德庆县| 土默特左旗| 成武县| 平果县| 邵东县| 扶沟县| 高唐县| 含山县| 山东省| 富宁县| 定边县| 玛多县| 霍邱县| 咸阳市| 顺昌县| 铁岭县| 云林县| 双流县| 灌阳县| 土默特左旗| 剑河县| 罗平县| 从江县| 临沂市| 乌苏市| 婺源县| 托里县| 巴彦县| 雷山县| 乐都县| 高安市|