• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      影響科學數(shù)據(jù)引用的外部因素分析*

      2017-04-12 11:18:41黃國彬劉馨然姜穎
      數(shù)字圖書館論壇 2017年6期
      關鍵詞:數(shù)據(jù)中心科學

      黃國彬,劉馨然,姜穎

      (1.北京師范大學政府管理學院,北京 100875;2.對外經(jīng)濟貿(mào)易大學圖書館,北京 100029)

      影響科學數(shù)據(jù)引用的外部因素分析*

      黃國彬1,劉馨然1,姜穎2

      (1.北京師范大學政府管理學院,北京 100875;2.對外經(jīng)濟貿(mào)易大學圖書館,北京 100029)

      為引導科學合理地引用科學數(shù)據(jù),提高科學數(shù)據(jù)的質量和權威程度,有必要關注影響科學數(shù)據(jù)引用的關鍵因素。本文采用文獻調研法和網(wǎng)站調研法,站在科學數(shù)據(jù)引用者的立場,結合國內外已有研究和實踐經(jīng)驗,梳理科學數(shù)據(jù)引用的主要外部影響因素,包括科學數(shù)據(jù)引用規(guī)范與格式、科學數(shù)據(jù)權利保護與引用許可、科學數(shù)據(jù)發(fā)布平臺與管理軟件,并指出對這三方面的有效處理和應對是科學數(shù)據(jù)引用者規(guī)范其引用行為的主要考慮點。

      科學數(shù)據(jù)引用;影響因素;引用規(guī)范;引用許可

      科學數(shù)據(jù)是科技活動中產(chǎn)生的基本數(shù)據(jù),包括觀測數(shù)據(jù)、考查數(shù)據(jù)、實驗數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等[1]??茖W數(shù)據(jù)引用指科研工作者引用科學數(shù)據(jù)作為論文觀點的支撐數(shù)據(jù),并以參考文獻、腳注或文中注等方式,對其所引用數(shù)據(jù)提供數(shù)據(jù)參考的做法[2]。對科學數(shù)據(jù)進行引用能有效促進科學數(shù)據(jù)傳播,也可以在后期更好地對科學數(shù)據(jù)進行評價和計量。在20世紀80年代已有學者指出,其科研過程產(chǎn)生的數(shù)據(jù)文件應該被引用,從而確定特定數(shù)據(jù)文件的可用性[3-4]。隨著科研模式逐漸趨向于數(shù)據(jù)密集型,在進行科學研究時對數(shù)據(jù)集進行使用并加以標引變得更加重要[5]??茖W數(shù)據(jù)引用的影響因素指由于科學數(shù)據(jù)創(chuàng)建者或擁有者對科學數(shù)據(jù)的擁有方式、共享與被利用要求,以及科學數(shù)據(jù)自身的領域、類型、保密性、著錄要求等對科學數(shù)據(jù)引用者的引用動機、目的、規(guī)模、條件、方式與成本等產(chǎn)生作用的各種情形。為引導科學合理的科學數(shù)據(jù)引用,提高科學數(shù)據(jù)的引用質量和權威程度,有必要關注科學數(shù)據(jù)引用的關鍵影響因素。本文結合國內外已有研究和實踐經(jīng)驗,站在科學數(shù)據(jù)引用者的立場,梳理科學數(shù)據(jù)引用的主要外部影響因素,以期為促進科學數(shù)據(jù)引用的發(fā)展提供借鑒和幫助。

      1 國內外研究綜述

      目前,國內外對于科學數(shù)據(jù)引用影響的研究不多,基本上是從科學數(shù)據(jù)引用的發(fā)展現(xiàn)狀與影響因素兩方面進行調研。(1)科學數(shù)據(jù)引用的發(fā)展現(xiàn)狀。屈寶強等通過調研,總結了目前科學數(shù)據(jù)引用在學科、引用位置、引用行為、引用格式和引用工具利用等方面的現(xiàn)狀,并且分析了基于引用的數(shù)據(jù)發(fā)現(xiàn)和評價研究狀況[1],為今后科學數(shù)據(jù)利用中的權益分配、數(shù)據(jù)引用標準研制、數(shù)據(jù)引用實現(xiàn)方式、數(shù)據(jù)計量等方面的深入研究提供建議。張靜蓓等從數(shù)據(jù)引用關鍵問題、數(shù)據(jù)引用規(guī)范、文獻管理工具及數(shù)據(jù)引用利益相關者四個方面對國外數(shù)據(jù)引用研究現(xiàn)狀進行梳理與總結,其中數(shù)據(jù)引用關鍵問題包括數(shù)據(jù)共享與引用意識、引用對象的唯一標識符等問題,文中指出引用意識與數(shù)據(jù)引用規(guī)范是推動科學數(shù)據(jù)引用發(fā)展的關鍵[6]。王丹丹從如何引用、引用什么以及何時引用三個角度出發(fā),探討科學數(shù)據(jù)引用的關鍵點和難點,并討論了元數(shù)據(jù)、數(shù)據(jù)版本、數(shù)據(jù)粒度和文獻管理工具等問題,對研究者、出版商、數(shù)據(jù)中心和圖書館提出數(shù)據(jù)引用規(guī)范要求[7]。(2)科技文獻引用影響因素的探討。鞠秀芳等討論了影響科技文獻引用的因素,發(fā)現(xiàn)期刊的引用行為具有一定的復雜性,其過程受引用動機、引用習慣、期刊編輯等內在動機和外在因素的影響[8]。馬智峰從引用者動機、文獻引用力度、信息檢索工具的利用、信息資源的發(fā)現(xiàn)與獲取、文獻時效性、期刊編輯與管理等角度分析科技文獻標引的影響因素,發(fā)現(xiàn)文獻標引規(guī)范、信息檢索渠道的拓寬等可正確指導文獻標引工作[9],提高科研水平和科技論文質量。

      國外對科學數(shù)據(jù)引用的研究主要集中在三個方面。(1)數(shù)據(jù)引用現(xiàn)狀。Piwowar等發(fā)現(xiàn)在同類數(shù)據(jù)集文獻中,開放數(shù)據(jù)集的被引率高于非開放數(shù)據(jù)集,并且在公開數(shù)據(jù)源后,數(shù)據(jù)重用的強度也在穩(wěn)步上升[10]。(2)基于數(shù)據(jù)引文索引(Data Citation Index,DCI)分析數(shù)據(jù)引用實踐現(xiàn)狀。Cho通過DCI分析數(shù)據(jù)引用現(xiàn)狀,發(fā)現(xiàn)遺傳學和生物技術學是產(chǎn)生科學數(shù)據(jù)最多的學科領域,而經(jīng)濟學和社會學的科學數(shù)據(jù)被引頻次較高(如人口數(shù)據(jù)和就業(yè)數(shù)據(jù));通過數(shù)據(jù)分析發(fā)現(xiàn)UK Data Archive和ICPSR為被引頻次最高的兩個數(shù)據(jù)庫;并指出科學數(shù)據(jù)不僅可以提高研究過程的效率和透明度,還可以通過數(shù)據(jù)整合和重新詮釋創(chuàng)造新的科學數(shù)據(jù)[11]。(3)數(shù)據(jù)引用標準與數(shù)據(jù)引用最佳實踐。Hapgood等提出氣象數(shù)據(jù)難以與現(xiàn)代引用標準相結合,并鼓勵領域專家在數(shù)據(jù)政策與現(xiàn)實需求間尋找平衡點[12]。

      目前,國內外對科學數(shù)據(jù)引用的研究多集中在科學數(shù)據(jù)引用的實踐與發(fā)展現(xiàn)狀上,對科學數(shù)據(jù)影響因素的研究較少,而科學數(shù)據(jù)引用的影響因素決定科學數(shù)據(jù)的引用者是否可以引用、出于何種目的引用、以什么方式引用、引用時的著錄方式等。因此,本文從科學數(shù)據(jù)引用者角度,指出影響科學數(shù)據(jù)引用的因素包括內因和外因,而二者的區(qū)分是以影響引用者引用行為的主觀和客觀條件來劃分的。其中,主觀條件包括引用者的引用動機、引用態(tài)度等,本文將其歸為影響引用者引用行為的內部因素;而影響引用者引用行為的客觀因素則包括所引用科學數(shù)據(jù)的可獲得性、科學數(shù)據(jù)所涉及的領域、科學數(shù)據(jù)的類型、科學數(shù)據(jù)的引用格式、科學數(shù)據(jù)的引用版本等,將其歸為影響引用者引用行為的外部因素。現(xiàn)有研究較多探究科學數(shù)據(jù)引用規(guī)范、粒度、版本、唯一標識符及文獻管理工具等的內容構成和實踐發(fā)展現(xiàn)狀,較少闡述其對科學數(shù)據(jù)引用的影響。本文在已有研究基礎上,還將從科學數(shù)據(jù)引用政策、協(xié)議、版權、檢索與發(fā)布平臺等角度探討影響科學數(shù)據(jù)引用的外部因素;同時,在相關研究及科學數(shù)據(jù)引用實踐經(jīng)驗的基礎上,考慮資料的可獲得性,將影響科學數(shù)據(jù)引用的外部因素歸納為科學數(shù)據(jù)引用規(guī)范與格式、科學數(shù)據(jù)權利保護與引用許可、科學數(shù)據(jù)發(fā)布平臺與管理軟件三方面,并對這三方面內容進行深入剖析,以期為研究者進一步思考和探討提供參考。

      2 科學數(shù)據(jù)引用規(guī)范與格式

      科學數(shù)據(jù)引用規(guī)范與格式是對科學數(shù)據(jù)的規(guī)范性、完整性、可追蹤性、可重復驗證的限定。對科學數(shù)據(jù)引用者來說,能否遵循引用規(guī)范和規(guī)定的引用格式,與其引用的科學數(shù)據(jù)可信度具有直接關系。同時,若科學數(shù)據(jù)引用者擬引用的科學數(shù)據(jù)存在引用版本、引用粒度、唯一標識符、元數(shù)據(jù)等著錄內容不完整等現(xiàn)象,則會降低其引用質量和權威程度。

      2.1 科學數(shù)據(jù)引用規(guī)范

      2.1.1 科學數(shù)據(jù)引用規(guī)模

      科學數(shù)據(jù)引用規(guī)模指引用數(shù)據(jù)的類型、界限與數(shù)據(jù)量。Hayes等將科學數(shù)據(jù)引用對象分為數(shù)據(jù)庫、數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品和數(shù)據(jù)記錄[13]。數(shù)據(jù)引用最常見的內容為數(shù)據(jù)集,一個數(shù)據(jù)集下通常會包含若干子集。目前,國際組織、學術出版社、數(shù)據(jù)中心等仍沒有給出數(shù)據(jù)集的統(tǒng)一定義,因此會對科學數(shù)據(jù)引用產(chǎn)生影響。首先,引用者在對數(shù)據(jù)進行引用時通常存在模棱兩可的現(xiàn)象,而引用本身也是一個比較模糊的過程[13];其次,數(shù)據(jù)集通常是動態(tài)的,數(shù)字對象唯一標識符并不能解決此類問題[14],這些不確定性在一定程度上影響科學數(shù)據(jù)的引用;再次,數(shù)據(jù)產(chǎn)權問題,數(shù)據(jù)集通常是多方合作產(chǎn)物,同一個數(shù)據(jù)集有多個作者,對這種數(shù)據(jù)的引用很容易造成知識產(chǎn)權糾紛,阻礙科學數(shù)據(jù)引用實踐的發(fā)展;最后,在科學數(shù)據(jù)引用過程中應避免個人特征的出現(xiàn),因此應注意對于敏感數(shù)據(jù)的引用。由此可見,明確界定科學數(shù)據(jù)引用界限能夠避免由于界限不清晰而帶來的產(chǎn)權不清等問題,能夠讓引用者更方便、合理地對科學數(shù)據(jù)進行引用。

      2.1.2 科學數(shù)據(jù)提交與引用規(guī)定

      科學數(shù)據(jù)提交與引用規(guī)定指數(shù)據(jù)中心對數(shù)據(jù)創(chuàng)建者提交數(shù)據(jù)和數(shù)據(jù)引用者使用科學數(shù)據(jù)而制定的規(guī)則。數(shù)據(jù)中心作為科學數(shù)據(jù)的存儲及發(fā)布機構,承擔數(shù)據(jù)監(jiān)護的重要責任[15]。規(guī)范數(shù)據(jù)提交流程及數(shù)據(jù)內容,能夠保證數(shù)據(jù)中心的數(shù)據(jù)質量,為數(shù)據(jù)引用奠定基礎。Dryad明確表示其接收的數(shù)據(jù)集語言應為英文,提交形式多樣,但數(shù)據(jù)大小不能超過20GB;此外,Dryad接收的數(shù)據(jù)大多經(jīng)過同行評議,對于部分非同行評議但來源可靠的數(shù)據(jù),也會考慮接收(如學位論文、專著等)[16]。

      科學數(shù)據(jù)的引用可以使科學數(shù)據(jù)更容易被發(fā)現(xiàn)與重用,追蹤數(shù)據(jù)來源并驗證研究過程,目前許多數(shù)據(jù)中心都有數(shù)據(jù)引用規(guī)定,要求研究人員在使用數(shù)據(jù)時進行恰當引用。ICPSR(Inter-university Consortium for Political and Social Research)[17]和羅普中心公眾輿論研究[18]提供了科學數(shù)據(jù)集引用指南,并給出具體引用案例。也有一些機構沒有給出具體引用規(guī)范,僅要求對科學數(shù)據(jù)的引用進行說明,如美國國家海洋和大氣管理局的國家數(shù)據(jù)中心僅請求在文本中得到承認或致謝;美國地質調查中心要求數(shù)字地圖必須正式引用,而表格數(shù)據(jù)只需在致謝中說明即可[1]。由于不同數(shù)據(jù)中心對科學數(shù)據(jù)引用的要求不一致,因此產(chǎn)生多種科學數(shù)據(jù)引用格式,不利于引用的規(guī)范化。大量科學數(shù)據(jù)引用規(guī)范會影響研究者的使用,各數(shù)據(jù)中心應加強聯(lián)系,研制統(tǒng)一的數(shù)據(jù)引用規(guī)范,降低引用難度,以推動科學數(shù)據(jù)引用實踐的發(fā)展。

      2.2 科學數(shù)據(jù)引用格式

      引用格式指在引用科學數(shù)據(jù)時需使用的具體規(guī)格樣式,如要求數(shù)據(jù)使用者通過致謝、腳注等形式提供科學數(shù)據(jù)來源信息。引用格式以引用規(guī)范為參照,而引用規(guī)范則以引用格式作為具體體現(xiàn)。本文對引用格式的討論包括元數(shù)據(jù)與唯一標識符、數(shù)據(jù)版本和粒度以及與科學文獻相關聯(lián)。

      2.2.1 元數(shù)據(jù)與唯一標識符

      元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),是科學數(shù)據(jù)引用的關鍵內容。目前,DataCite、OECD(Organization for Economic Cooperation and Development)等已出臺一些面向科學數(shù)據(jù)元數(shù)據(jù)的方案,但并沒有形成統(tǒng)一的科學數(shù)據(jù)引用標準。張靜蓓等探討目前致力于科學數(shù)據(jù)引用的國際組織所要求的核心元數(shù)據(jù)集構成(其中包括Author/Creator,Publication date,Title,Publisher/Archive,URL,Persistent Identifier等),數(shù)據(jù)中心或其他機構可根據(jù)數(shù)據(jù)特點選擇元數(shù)據(jù)項進行描述[15]。許多學科都有元數(shù)據(jù)標準,但對元數(shù)據(jù)標準的遵循還需各利益相關主體的支持與協(xié)作,只有科學數(shù)據(jù)創(chuàng)建者、科學數(shù)據(jù)管理機構及行業(yè)組織、科學數(shù)據(jù)引用者對元數(shù)據(jù)標準達成一致,才能最大限度地促進數(shù)據(jù)的引用和再使用。在此過程中,出版商的作用明顯,《科學》和《自然》對基因數(shù)據(jù)引用采取的強制性政策是很好的例證[7]。元數(shù)據(jù)標準的制定應該在通用性與專用性間尋找平衡,既不能過少以致數(shù)據(jù)描述不完整難以被準確識別,也不能過多導致冗余。

      唯一標識符指唯一標識數(shù)據(jù)集的名稱或字符串,其獨立于數(shù)據(jù)并永久標識數(shù)據(jù)[19]?!稊?shù)據(jù)引用共同原則》提出數(shù)據(jù)要擁有唯一標識性,數(shù)據(jù)引用應該擁有一種機器可識別的、全球唯一的、能夠被廣泛使用的可持續(xù)方法[20]。使用唯一標識符能精確定位數(shù)據(jù)集,減少研究者工作量。Honor等指出數(shù)據(jù)共享和重用雖被廣泛認可,但缺乏被廣泛接受的數(shù)據(jù)引用標準,難于追蹤科學數(shù)據(jù)使用情況并衡量其影響[21]。針對唯一標識符的分配問題,仍有許多爭議,這需要標識符注冊機構、數(shù)據(jù)中心、出版社等多方主體共同協(xié)商解決。唯一標識符能精確識別數(shù)據(jù)使用者所引用的數(shù)據(jù)集,保護數(shù)據(jù)創(chuàng)建者的著作權,并且對科學數(shù)據(jù)引用的規(guī)范性、完整性、可追蹤性、可重復驗證性具有重要意義。

      2.2.2 數(shù)據(jù)版本和粒度

      數(shù)據(jù)版本指由于數(shù)據(jù)變動使數(shù)據(jù)集表現(xiàn)出不同狀態(tài),如隨著時間的推移數(shù)據(jù)量不斷增加,或應用新的研究方法產(chǎn)生新數(shù)據(jù)等。在數(shù)據(jù)版本不斷變化的情況下,如何保證數(shù)據(jù)的可驗證性成為影響科學數(shù)據(jù)引用的關鍵。數(shù)據(jù)中心對動態(tài)數(shù)據(jù)集的維護也是影響科學數(shù)據(jù)引用的一個難題。如Argo Project[22],用3 000多個設備探測海水溫度和鹽度,每年產(chǎn)生10萬條數(shù)據(jù),該數(shù)據(jù)規(guī)模需要相當大存儲量的數(shù)據(jù)中心才能承擔。王丹丹總結了目前引用大規(guī)模動態(tài)數(shù)據(jù)集的兩種方法,一是完整的數(shù)據(jù)集分配標識符,這種情況下的數(shù)據(jù)集只有一個最終版,存在數(shù)據(jù)收集期間不能被引用的問題;二是制定基礎版,對新增數(shù)據(jù)進行補充,針對這種情況,國家冰雪數(shù)據(jù)中心建議由研究者決定基礎數(shù)據(jù)版本,英國國家資料庫則對定義新版本的情況進行說明[7]。而OECD則制定動態(tài)數(shù)據(jù)集元數(shù)據(jù)來解決動態(tài)數(shù)據(jù)集的維護問題,其元數(shù)據(jù)項包含數(shù)據(jù)集更新時間、數(shù)據(jù)集常規(guī)更新頻率等[19]。就引用數(shù)據(jù)而言,需要研究者和數(shù)據(jù)中心協(xié)商制定數(shù)據(jù)版本和引用不同版本數(shù)據(jù)的規(guī)范和方法[7]??茖W數(shù)據(jù)的及時更新,能夠提高引用質量與權威程度,但由此帶來的引用版本信息的揭示同樣需要引起重視。

      數(shù)據(jù)粒度指數(shù)據(jù)引用的層次[7]。一個數(shù)據(jù)集往往可劃分為多個子集,而一個數(shù)據(jù)集可能又是另一個大數(shù)據(jù)集的子集,數(shù)據(jù)間的層次關系較多變與復雜,這種特性也讓引用者對數(shù)據(jù)引用產(chǎn)生困擾。由于不同學科引用粒度存在差異,因此數(shù)據(jù)中心需明確適合其數(shù)據(jù)的最佳引用單元。如在生物學科中,共有15個數(shù)據(jù)聚合器,卻有11種不同的引用格式,這會使研究者感到困惑[23]。為解決數(shù)據(jù)引用的粒度問題,需要科學數(shù)據(jù)引用規(guī)則或政策的制定者給出合理、明確的標準規(guī)范,來幫助數(shù)據(jù)引用者更好地引用數(shù)據(jù),同時也需要數(shù)據(jù)引用管理工具協(xié)助生成對各層次數(shù)據(jù)的引用。如PANGAEA針對不同層次數(shù)據(jù)引用設計相應的引用格式;DCC認為數(shù)據(jù)粒度應滿足研究者需求,可在文章引用數(shù)據(jù)處提供所引數(shù)據(jù)集細節(jié);GBIF希望找到一種既滿足版本問題又滿足粒度問題的解決方案,并強化工具的整合,以支持復雜數(shù)據(jù)的引用。

      數(shù)據(jù)的版本與粒度反映數(shù)據(jù)更新、修訂及引用層次問題,在引用時通過對版本信息、引用粒度的注明,方便為審稿人和使用者(包括科技文獻讀者、對同一科學數(shù)據(jù)進行引用的其他學者)提供比較完整的科學數(shù)據(jù)信息,保證科學數(shù)據(jù)引用的規(guī)范性、完整性、可追蹤性及可重復驗證性。

      2.2.3 與科學文獻相關聯(lián)

      將科學數(shù)據(jù)與科學文獻相關聯(lián),可以使讀者了解數(shù)據(jù)的使用情況,為科學研究進展提供借鑒;同時,也可以為數(shù)據(jù)發(fā)布平臺設計更好的服務模式提供基礎。根據(jù)歐盟PARSE.Insight研究顯示,超過84%的科學家認為將科學數(shù)據(jù)與文獻進行關聯(lián)是有用的[1]。目前已有部分科學數(shù)據(jù)與科學文獻實現(xiàn)關聯(lián),如通過PubMed檢索號實現(xiàn)GenBank到PubMed的鏈接,以保證在GenBank中使用檢索基因序列能夠查找到相關文獻[24]。通過數(shù)據(jù)與文獻的雙向鏈接,讀者在閱讀文獻時,既可以訪問原始數(shù)據(jù)甚至重復其研究過程,也能從數(shù)據(jù)出發(fā)找到與其相關的所有文獻,由此提高科研效率。

      3 科學數(shù)據(jù)權利保護與引用許可

      科學數(shù)據(jù)權利保護與引用許可能夠明確數(shù)據(jù)創(chuàng)建者,如果數(shù)據(jù)創(chuàng)建者或擁有者聲明他人不可以擅自利用其科學數(shù)據(jù),那么科學數(shù)據(jù)使用者進行引用時就需要經(jīng)過創(chuàng)建者的允許。本文對科學數(shù)據(jù)權利保護與引用許可的討論包括科學數(shù)據(jù)創(chuàng)建者的態(tài)度與立場、科學數(shù)據(jù)版權保護的法律、科學數(shù)據(jù)的引用政策以及科學數(shù)據(jù)的引用協(xié)議。

      3.1 科學數(shù)據(jù)創(chuàng)建者的態(tài)度與立場

      科學數(shù)據(jù)創(chuàng)建者的態(tài)度與立場指創(chuàng)建者是否同意他人使用其數(shù)據(jù)并對其進行引用。數(shù)據(jù)創(chuàng)建者在科研活動中收集或創(chuàng)造科學數(shù)據(jù),對其進行描述、組織,并上傳至數(shù)據(jù)中心,使其得到傳播與重用??茖W數(shù)據(jù)的產(chǎn)生需要耗費創(chuàng)建者大量的時間與精力,因此需要制定一定的科學數(shù)據(jù)獎勵機制,使數(shù)據(jù)創(chuàng)建者的工作得到認可,以此鼓勵創(chuàng)建者分享數(shù)據(jù)。張靜蓓等總結出影響科學數(shù)據(jù)共享的制度因素(數(shù)據(jù)引用政策與規(guī)范等)、技術因素(統(tǒng)一的元數(shù)據(jù)標準、合適的數(shù)據(jù)庫等)和個人因素(個人預期利益及共享可能帶來的風險等)[25]??蒲泄ぷ髡邔茖W數(shù)據(jù)的共享是科學數(shù)據(jù)引用及重用的前提??茖W數(shù)據(jù)創(chuàng)建者對數(shù)據(jù)共享的態(tài)度在很大程度上決定科學數(shù)據(jù)引用的進程和發(fā)展。Candela等指出,在學術交流過程中,科研人員應減少科學數(shù)據(jù)的交流阻礙,支持其流動和發(fā)展[26]。也有學者對科研人員共享科學數(shù)據(jù)的態(tài)度進行調研,結果顯示科研人員對數(shù)據(jù)共享持積極態(tài)度[27]??茖W數(shù)據(jù)創(chuàng)建者對科學數(shù)據(jù)引用的許可是科學數(shù)據(jù)引用實踐的基石,對推動科學數(shù)據(jù)引用實踐發(fā)展有重要作用。

      3.2 科學數(shù)據(jù)版權保護的法律

      科學數(shù)據(jù)版權指數(shù)據(jù)的權利歸屬,而科學數(shù)據(jù)版權保護的法律則將科學數(shù)據(jù)的版權屬性納入法律保護范圍。目前,從國內外發(fā)展實踐來看,科學數(shù)據(jù)的保護需要相應的法律法規(guī)作支撐;從世界各國現(xiàn)行的立法實踐來看,科學數(shù)據(jù)并不是各國現(xiàn)行版權法律所完全認可的保護標的物。一方面,科學數(shù)據(jù)的創(chuàng)建凝聚著創(chuàng)建者的智慧,及設備、資金方面的大量投入;另一方面,從版權立法的初衷來看,平衡版權作品創(chuàng)建者和版權作品使用者的利益關系,需要給予科學數(shù)據(jù)創(chuàng)建者必要的、在限定時間內的、適當形式的專有權,并加以排他性的保護。這種保護是對其創(chuàng)建科學數(shù)據(jù)所投入的財力與智力成本的必要彌補。而從科學數(shù)據(jù)的廣泛傳播和最大利用效益來看,科學數(shù)據(jù)一旦創(chuàng)建,需要被更多的科學數(shù)據(jù)使用者知曉、檢索和再利用,以促進人類科學數(shù)據(jù)研究的進步。目前,雖然國內外高度重視科學數(shù)據(jù)的再利用,但在現(xiàn)有各國版權法律未能給創(chuàng)建者提供足夠保護前提下,借助科學數(shù)據(jù)創(chuàng)建者對科學數(shù)據(jù)利用與共享的立場與態(tài)度,以及由此體現(xiàn)的數(shù)據(jù)共享協(xié)議的細化要求,可以在保護科學數(shù)據(jù)創(chuàng)建者合法權益的同時,促進科學數(shù)據(jù)的引用。因此,科學數(shù)據(jù)引用者在進行科學數(shù)據(jù)引用時,需充分尊重科學數(shù)據(jù)創(chuàng)建者或擁有者的權益訴求,參照現(xiàn)行版權法律規(guī)定,避免侵權行為的發(fā)生。若科學數(shù)據(jù)創(chuàng)建者或擁有者被禁止對科學數(shù)據(jù)在某種情形或某種規(guī)模、內容上的使用,則科學數(shù)據(jù)施引者應放棄其使用意圖。

      3.3 科學數(shù)據(jù)的引用政策

      科學數(shù)據(jù)的引用政策指致力于科學數(shù)據(jù)管理的組織/機構對科學數(shù)據(jù)引用制定的原則和要求??茖W數(shù)據(jù)引用的用途、再共享等方面的自由與方便程度,與科學數(shù)據(jù)的權利保護與引用許可密切相關。由于科學數(shù)據(jù)引用具有一定的政策約束,因此科學數(shù)據(jù)使用者對數(shù)據(jù)進行引用時必須遵循政策規(guī)定。目前,許多致力于科學數(shù)據(jù)引用的相關組織/機構(如DataCite[28]、DCC[29]、ANDS[30]、ESIP[31]、CODATA[32]和RDA[33])都發(fā)布了科學數(shù)據(jù)引用政策,有助于對科學數(shù)據(jù)引用行為進行約束和規(guī)范,形成良好的科學數(shù)據(jù)引用氛圍。與此同時,科學數(shù)據(jù)引用也需要建立一定的獎勵機制,對數(shù)據(jù)創(chuàng)建者給予獎勵可以激勵科學數(shù)據(jù)的共享,對科學數(shù)據(jù)引用者的獎勵(如優(yōu)先發(fā)表)也可以激勵其收集或創(chuàng)造更多的數(shù)據(jù)。王丹丹認為理想的數(shù)據(jù)引用應與傳統(tǒng)文獻引用方式一樣,在參考文獻部分對數(shù)據(jù)進行引用標注,并將引用排名納入科研評價體系[7]。張靜蓓等針對科學數(shù)據(jù)缺乏共享意識和引用意識的問題,提出應完善學術報償體系,將數(shù)據(jù)引用納入科研評價體系[6]。權威機構通過科學數(shù)據(jù)引用政策對科學數(shù)據(jù)引用行為進行引導與約束,形成良好的科學數(shù)據(jù)引用氛圍,能夠促進科學數(shù)據(jù)引用實踐的進一步發(fā)展。

      3.4 科學數(shù)據(jù)的引用協(xié)議

      科學數(shù)據(jù)引用協(xié)議是能夠將科學數(shù)據(jù)創(chuàng)建者與科學數(shù)據(jù)使用者對科學數(shù)據(jù)引用的權利和義務達成一致意見的一種約定。由于現(xiàn)有版權法等相關法律法規(guī)及引用、共享政策不能完全保護科學數(shù)據(jù)創(chuàng)建者的權利。因此,科學數(shù)據(jù)共享中心按照數(shù)據(jù)類型特點制定了相應的數(shù)據(jù)許可使用協(xié)議或創(chuàng)作共享協(xié)議,以約定使用者承認并尊重創(chuàng)建者的權利。數(shù)據(jù)許可協(xié)議提供雙方共同認可的約定,保證科學數(shù)據(jù)引用雙方的基本利益。在科學數(shù)據(jù)引用協(xié)議中,大部分協(xié)議明確提出數(shù)據(jù)引用的要求,并且提出要遵循特定數(shù)據(jù)引用格式規(guī)范。例如,UK Data Service的數(shù)據(jù)許可使用協(xié)議包含科學數(shù)據(jù)的引用格式、使用申請機制、使用和用途規(guī)定及特殊協(xié)議保護措施等內容[34]。協(xié)議要求數(shù)據(jù)使用者在引用數(shù)據(jù)時對數(shù)據(jù)進行規(guī)范性標識,并將數(shù)據(jù)按照創(chuàng)建者意愿分為“open data”“safeguarded data”“controlled data”。其中,“open data”沒有使用限制,“safeguarded data”與“controlled data”都有單獨的許可使用條款,對數(shù)據(jù)的用途進行了規(guī)定;“safeguarded data”只能用于科研目的,“controlled data”需要引用者提交使用申請,待數(shù)據(jù)創(chuàng)建者審核通過并將其加入特定用戶組后,才可獲得使用。在許可協(xié)議條件下,科學數(shù)據(jù)的引用者需尊重數(shù)據(jù)創(chuàng)建者的權利,嚴格按照協(xié)議內容對數(shù)據(jù)進行使用;此外,引用協(xié)議對衍生數(shù)據(jù)也有控制權。衍生數(shù)據(jù)是在原有數(shù)據(jù)基礎上進行補充、加工等行為后產(chǎn)生的數(shù)據(jù),因此科學數(shù)據(jù)引用者使用衍生數(shù)據(jù)時也需遵循相關的引用協(xié)議。

      4 科學數(shù)據(jù)發(fā)布平臺與管理軟件

      本文對科學數(shù)據(jù)發(fā)布平臺與管理軟件的討論包括科學數(shù)據(jù)檢索與發(fā)布平臺、科學數(shù)據(jù)管理軟件與發(fā)現(xiàn)工具。

      4.1 科學數(shù)據(jù)檢索與發(fā)布平臺

      科學數(shù)據(jù)檢索與發(fā)布平臺是能夠對科學數(shù)據(jù)進行存儲、描述、檢索、獲取、共享的數(shù)據(jù)庫??茖W數(shù)據(jù)的引用需要由科學數(shù)據(jù)的發(fā)布平臺作為科學數(shù)據(jù)創(chuàng)建者與數(shù)據(jù)引用者的溝通橋梁,科學數(shù)據(jù)引用者通過發(fā)布平臺可以集中、方便地檢索,發(fā)現(xiàn)并下載所需引用的科學數(shù)據(jù)。從國內外發(fā)展情況來看,科學數(shù)據(jù)的發(fā)布平臺主要有單一科學數(shù)據(jù)發(fā)布平臺和科技文獻與科學數(shù)據(jù)的混合發(fā)布平臺。

      單一科學數(shù)據(jù)發(fā)布平臺包括國家數(shù)據(jù)中心和機構數(shù)據(jù)庫。國家數(shù)據(jù)中心,如國家地球科學數(shù)據(jù)中心、環(huán)境信息數(shù)據(jù)中心、國家冰雪數(shù)據(jù)中心等;機構數(shù)據(jù)庫,如羅普中心公眾輿論研究、哈佛大學Harvard Dataverse等??萍嘉墨I與科學數(shù)據(jù)混合發(fā)布平臺,如Dryad、ICPSR、Figshare和GenBank等。

      4.2 科學數(shù)據(jù)管理軟件與發(fā)現(xiàn)工具

      科學數(shù)據(jù)引用軟件可以使數(shù)據(jù)使用者更方便地生成引用規(guī)范,科學數(shù)據(jù)發(fā)現(xiàn)工具可以使數(shù)據(jù)使用者更容易發(fā)現(xiàn)與檢索所需數(shù)據(jù)集。

      Kotarski等對常用文獻管理軟件進行調研,指出在18種常用文獻管理軟件中,只有3種軟件(EndNote、Papers和Sente)具備科學數(shù)據(jù)引用管理功能,分別通過“數(shù)據(jù)庫”“表格”和“數(shù)據(jù)文件”選等選項進行引用管理;其余15種軟件中,有5種(Bibus、Bookends、JabRef、Reference Manager和Scholar’s Aid)允許用戶自定義引用類型,如“數(shù)據(jù)集”選項,但并沒有專門針對科學數(shù)據(jù)引用的元數(shù)據(jù);另外10種軟件(Biblioscape、Citavi、Docear、Mendeley、Pybiographer、Qiqqa、Refbase、Ref Works、Wiz Folio和Zotero)則根本沒有涉及科學數(shù)據(jù)選項[35]。目前,常用的文獻管理軟件缺乏對數(shù)據(jù)引用的支持,對科學數(shù)據(jù)等非文本資源類型引用的關注度還不夠。隨著參考文獻管理工具的廣泛應用,確??茖W數(shù)據(jù)的引用管理作為其功能之一將有助于使用者更規(guī)范、便捷地引用數(shù)據(jù)。

      湯森路透于2012年推出DCI[36],對推進科學數(shù)據(jù)引用標準統(tǒng)一和增強數(shù)據(jù)價值有重要意義。DCI的數(shù)據(jù)來源于數(shù)據(jù)庫,它為數(shù)據(jù)集建立索引,使其能夠與文獻相鏈接。Robinson-garcía等對DCI數(shù)據(jù)引用記錄進行分析,發(fā)現(xiàn)雖然科學和工程領域的科技數(shù)據(jù)集引用最多,但在社會科學和藝術與人文研究中,科學數(shù)據(jù)的作用更大;同時,有88.1%的數(shù)據(jù)沒有得到引用[37]。通過對科學數(shù)據(jù)發(fā)現(xiàn)工具的研究,能夠促進全球科學數(shù)據(jù)的發(fā)現(xiàn)與引用,尋找科學數(shù)據(jù)引用規(guī)律,使其更好地為科學研究服務。

      5 結語

      隨著科學技術的發(fā)展以及科學數(shù)據(jù)在科研活動中的廣泛使用,對科學數(shù)據(jù)引用行為的研究越來越迫切。科學數(shù)據(jù)引用不僅體現(xiàn)對科學數(shù)據(jù)創(chuàng)建者基本權利的尊重,也為科學數(shù)據(jù)共享提供依據(jù)與保障。為提高科學數(shù)據(jù)引用質量與權威程度,本文基于已有研究與實踐經(jīng)驗,梳理出影響科學數(shù)據(jù)引用的外部因素主要包括科學數(shù)據(jù)引用規(guī)范與格式、科學數(shù)據(jù)權利保護與引用許可、科學數(shù)據(jù)發(fā)布平臺與管理軟件,以期為科學數(shù)據(jù)引用研究的發(fā)展提供借鑒。

      [1]屈寶強,王凱.科學數(shù)據(jù)引用現(xiàn)狀和研究進展[J].情報理論與實踐,2016(5):134-138,114.

      [2]WU Z X.Data citation resources[EB/OL].[2017-03-31].http://www.ands.org.au/cite-data/resources.html#What_is_Data_Citaiton.

      [3]DODD S A.Bibliographic references for numeric social science data files:suggestedguidelines[J].Journal of the Association for Information Science and Technology,1979,30(2):77-82.

      [4]WHITE H D.Citation analysis of data fi les use[J].Library Trends,1982,30(3):885-888.

      [5]BALL A, DUKE M.Data citation and linking[EB/OL].(2012-06-21)[2017-03-21].http://www.dcc.ac.uk/resources/briefing-papers/introduction-curation/data-citation-and-linking.

      [6]張靜蓓,呂俊生,田野.國外科學數(shù)據(jù)引用研究進展[J].圖書情報工作,2014(8):91-95,138.

      [7]王丹丹.科學數(shù)據(jù)規(guī)范引用關鍵問題探析[J].圖書情報工作,2015(8):42-47,53.

      [8]鞠秀芳,鄭彥寧,潘云濤.期刊引用操縱行為研究綜述[J].西南民族大學學報(人文社會科學版),2013(4):224-228.

      [9]馬智峰.參考文獻的引用及影響引用的因素分析[J].編輯學報,2009(1):23-25.

      [10]PIWOWAR H A,VISION T J.Data reuse and the open data citation advantage[J].Peerj,2013,1(3):e175.

      [11]CHO J.Study about research data citation based on DCI(Data Citation Index)[J].Journal of the Korean Library and Information Science Society,2016,50(1):189-207.

      [12]HAPGOOD M,KNIPP D.Data citation and availability:striking a balance between the-ideal and the practical[J].Space Weather-the International Journal of Research & Applications,2016,14(11):919-920.

      [13]HAYES P J,HALPIN H,SHETH A.In defense of ambiguity[J].International Journal on Semantic Web & Information Systems,2008,4(4):1-18.

      [14]DUERR R E,DOWNS R R,TILMES C,et al. On the utility of identification schemes for digital earth science data:an assessment and recommendations[J]. Earth Science Informatics,2011,4(3):139.

      [15]張靜蓓,田野,呂俊生.科學數(shù)據(jù)引用規(guī)范研究進展[J].圖書與情報,2014(5):100-104.

      [16]DRYAD.What kinds of data does Dryad accept?[EB/OL].[2017-03-31].http://datadryad.org/pages/faq#depositing-acceptable-data.

      [17]ICPSR.Citing Data[EB/OL].[2017-03-31].http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/citations.html.

      [18]Roper Center.How to cite Roper Center data[EB/OL].[2017-03-21].http://www.ropercenter.uconn.edu/data_access/data/how_to_cite.html.

      [19]李丹丹,吳振新.研究數(shù)據(jù)引用研究[J].圖書館雜志,2013(5):65-71.

      [20]宋宇,真溱,湯珊紅.數(shù)據(jù)引用的共同原則[J].情報理論與實踐,2015(8):145.

      [21]HONOR L B,HASELGROVE C,FRAZIER J A,et al.Corrigendum:data citation in neuroimaging:proposed best practices for data identification and attribution[J].Frontiers in Neuroinformatics,2016,10:43.

      [22]Project Argo[EB/OL].[2017-03-31].http://argoproject.org/.

      [23]LANE M A.Data citation in the electronic environment[EB/OL].[2017-03-31].http://www.gbif.org/resource/80798.

      [24]韓濤.科學數(shù)據(jù)與科學文獻相關性研究——以生物信息學為例[J].圖書情報知識,2008(3):42-46.

      [25]張靜蓓,呂俊生,田野.國外數(shù)據(jù)共享行為影響因素研究綜述[J].圖書情報工作,2014(4):136-142.

      [26]CANDELA L,CASTELLI D,MANGHI P,et al.Datajournals:a survey[J].Journal of the Association for Information Science and Technology,2015,66(9):1747-1762.

      [27]何琳,常穎聰.科研人員數(shù)據(jù)共享意愿研究[J].圖書與情報,2014(5):125-131.

      [28]DataCite.Citation formatter[EB/OL].[2017-03-31].https://www.datacite.org/citation.html.

      [29]DCC.Cite Datasets[EB/OL].[2017-03-31].http://www.dcc.ac.uk/resources/how-guides/cite-datasets.

      [30]ANDS.Citation and identifiers[EB/OL].[2017-03-31].http://www.ands.org.au/working-with-data/citation-and-identifiers.

      [31]ESIP[EB/OL].[2017-03-31].http://www.esipfed.org/.

      [32]CODATA-ICSTI data citation standards and practices[EB/OL].[2017-03-31].http://www.codata.org/task-groups/data-citationstandards-and-practices.

      [33]RDA.RDA events[EB/OL].[2017-03-31].https://www.rd-alliance.org/.

      [34]UK data service[EB/OL].[2017-03-31].https://www.ukdataservice.ac.uk/.

      [35]KOTARSKI R,REILLY S,SCHRIMPF S,et al.Report on best practices for citability of data and on evolving roles in scholarly communication[EB/OL].[2017-03-31].http://rep4-vm.awi.de/31396/1/ODE-ReportBestPracticesCitabilityDataEvolvingRolesScholarly Communication.pdf.

      [36]湯森路透發(fā)布Data Citation Index促進對全球研究數(shù)據(jù)的發(fā)現(xiàn)[EB/OL].[2017-03-31].http://www.thomsonscientific.com.cn/press/press20121102/.

      [37]ROBINSON-GARCíA N,JIMéNEZ-CONTRERAS E,TORRESSALINAS D.Analyzing data citation practices using the data citation index[J].Journal of the Association for Information Science & Technology,2015,67(12):2964-2975.

      Analysis of External Influencing Factors of Scientific Data Citation

      HUANG GuoBin1, LIU XinRan1, JIANG Ying2
      (1. School of Government, Beijing Normal University, Beijing 100875, China;2. Library of University of International Business and Economics, Beijing 100029, China)

      In order to guide scientific and reasonable scientific data citation, to improve the quality and authority of scientific data, it is necessary to pay attention to the key influencing factors of scientific data citation. By using the literature research method and website research method, combining with the existing research and practical experience at home and abroad, this paper sorts out the main external influencing factors of scientific data citation in scientific data referrers’view. The external influencing factors of scientific data citation include scientific data citation standards and formats, scientific data rights protection and reference permission, scientific data platform and management software. Effective processing and response to these three aspects are the main consideration for scientific data referrers to standardize their behaviors.

      Scientific Data Citation; Influencing Factors; Citation Standards; Citation License

      G255

      10.3772/j.issn.1673-2286.2017.06.001

      規(guī)范指對科學數(shù)據(jù)引用作出規(guī)定的文本,是寬泛的、全面的約束性要求。本文對科學數(shù)據(jù)引用規(guī)范的討論包括科學數(shù)據(jù)的引用規(guī)模及科學數(shù)據(jù)提交與引用規(guī)定。

      黃國彬,男,1979年生,博士,副教授,碩士生導師,研究方向:信息法學、信息分析,E-mail:huanggb@bnu.edu.cn。

      劉馨然,女,1993年生,碩士研究生,研究方向:信息分析,E-mail:bnuliuxinran@163.com。

      姜穎,女,1984年生,碩士,館員,研究方向:信息素養(yǎng)教育,E-mail:uibejying@126.com。

      2017-04-18)

      * 本研究得到國家社會科學基金項目“云計算環(huán)境下圖書館信息資源安全政策法律研究”(編號:11CTQ004)資助。

      猜你喜歡
      數(shù)據(jù)中心科學
      酒泉云計算大數(shù)據(jù)中心
      點擊科學
      點擊科學
      科學大爆炸
      小小藝術家(2019年6期)2019-06-24 17:39:44
      數(shù)據(jù)中心制冷節(jié)能技術及應用
      電子測試(2018年11期)2018-06-26 05:56:38
      民航綠色云數(shù)據(jù)中心PUE控制
      電子測試(2018年11期)2018-06-26 05:56:24
      科學
      基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應用
      科學拔牙
      Overlay Network技術在云計算數(shù)據(jù)中心中的應用
      河南科技(2014年11期)2014-02-27 14:16:49
      郁南县| 大英县| 延川县| 洪江市| 班玛县| 吐鲁番市| 福建省| 和硕县| 石渠县| 繁峙县| 太原市| 莱阳市| 青龙| 高阳县| 勃利县| 九江市| 临桂县| 德保县| 上犹县| 永州市| 铜陵市| 宜丰县| 保靖县| 辽宁省| 曲沃县| 嘉义县| 临西县| 锡林郭勒盟| 滨海县| 河北省| 南涧| 隆林| 屏东市| 鹤岗市| 佛学| 嘉黎县| 赤壁市| 尖扎县| 安仁县| 安多县| 丰都县|