• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      科學數據引用:前提、挑戰(zhàn)與實現(xiàn)機制

      2023-11-15 08:24:48桂婕楊波屈寶強劉蔚陳曉文
      情報工程 2023年4期
      關鍵詞:著錄科學

      桂婕 楊波 屈寶強 劉蔚 陳曉文

      1.中國科學技術信息研究所 北京 100038;

      2.北京科技審評中心 北京 101117

      引言

      引用是表達對他人科研成果利用和致謝的重要方式之一??茖W數據引用(scientific data citation)指通過一定的標識技術和機制,對所使用的科學數據資源進行描述,標識數據的來源,通過科學數據引用在一定程度上促進了科學數據的知識產權保護,便于科學數據使用狀況的追蹤與統(tǒng)計分析。

      學者Dodd 于1979 年就提出把數據看作智力作品,以與美國書目參考文獻標準一致的方式描述和引用數據集[1]。21 世紀以來,隨著數據在科研活動中的重要性不斷增加,對科學數據引用的重要性認識不斷提升,許多機構在推進科學數據引用方面做了大量工作。在科學數據唯一標識體系方面,2009 年成立Datacite,將提供科學數據的DOI 注冊、管理與應用作為一項重要服務。在科學數據引用索引體系構建方面,2012 年,湯森路透旗下知識產權與科技事業(yè)部正式推出科學數據引文索引(DCI)數據庫,提供用戶工具來搜索和發(fā)現(xiàn)與研究有關的研究數據。在科學數據引用原則方面, “FORCE11”于2014 年發(fā)布了“FORCE11數據引用原則共同宣言”,提出了數據引用的八個原則:重要性、榮譽和署名、證據、唯一標識、可獲取、永久性、專指性和可驗證性、互操作性和靈活性[2]。在科學數據出版方面,2012 年5 月,自然出版集團推出數據期刊《科學數據》。在科學數據引用著錄方面,許多國際組織、數據中心和研究人員提出了不同的引用標準[3-6],引用涉及的主要元素包括:作者、標題、出版日期、版本、出版商、標識符、位置等,我國也于2018 年1 月發(fā)布科學數據引用標準。在實現(xiàn)科學數據引用的關鍵技術和體系方面,自動生成引用和創(chuàng)建人機可讀的引用[7]、使用時間戳查詢[8]和版本控制方法[9]等相關方法開展動態(tài)科學數據引用方面都進行了相關探索。但是在學術交流實踐當中,依然存在科學數據引用意識不強、科學數據引用著錄標準推廣不夠、科學數據引用基礎設施不完備以及科學數據粒度和版本帶來的技術問題等。本研究主要從理論上剖析科學數據引用的前提和動機,分析存在的相關問題,提出科學數據引用實現(xiàn)的相關措施。

      1 科學數據引用的前提與動機

      1.1 科學數據引用的前提

      2014 年1 月荷蘭萊頓舉辦的洛倫茲研討會上首次提出FAIR 原則,2016 年3 月Wilkinson等學者在《科學數據》(Scientific Data)上發(fā)表文章對它進行了系統(tǒng)性論述。FAIR 原則即Findable(可查找),Accessible(可訪問),Interoperable(可互操作)和Reusable(可重用),要求在科學研究中產生的數據都需遵從這一原則。從科學數據生命周期管理的角度出發(fā),科學數據引用發(fā)生在數據被研究者使用后,因此在研究過程中發(fā)現(xiàn)、獲取并真正使用了這些數據,是引用產生的重要前提。

      1.1.1 科學數據應該被認為是重要的研究產出

      在學術記錄中,數據引用應與其他研究對象(如出版物)的引用同等重要。隨著數據驅動科研范式的發(fā)展,數據越來越成為重要科研資源,同時科學數據作為研究過程中的重要產出形式得到了認可。例如,2011 年在哈佛大學舉辦的IQSS 會議有關數據引用的討論中,明確提出引用數據“第一原理”:數據應被視為和文獻同等重要的一流產出而實施引用,否則科研人員則不會在使用數據后主動地對其進行引用。

      1.1.2 科學數據可以被發(fā)現(xiàn)和獲取

      科學數據必須要存在于科研過程,只有科研人員能夠比較容易地獲取數據(有可能是自己制作),才有可能在研究過程中使用并引用。如果數據不能被發(fā)現(xiàn)并獲取,就談不上對其引用。因此科學數據引用依賴于數據的出版發(fā)布,以及幫助科研人員發(fā)現(xiàn)數據的基礎設施,包括用于發(fā)現(xiàn)數據的索引、導航、門戶等。

      1.1.3 科學數據的內容和價值應得到使用者的認可且被使用

      真正滿足研發(fā)過程需求的科學數據不僅依賴于數據本身的內容質量,更依賴于其對研究過程中的適應性、可開發(fā)性、可運算性。只有使用者認可了數據內容,并認為其可以在研究過程中起到相關作用,才會觸發(fā)實施數據引用。實施數據引用要求科學數據被真正使用,為了某些計量學指標看上去很好的虛假引用是學術規(guī)范所不容許的,必須是在實際研究過程中支撐研究內容、對研究結論的形成有所幫助的數據,才能對其進行引用。

      1.1.4 使用和重用科學數據所產生的成果正式發(fā)布或者發(fā)表

      使用和重用科學數據所產生的成果必須正式發(fā)布或者發(fā)表,且在發(fā)表的成果中以通用、可理解的格式表達出來才能真正實現(xiàn)科學數據引用,這些發(fā)表的成果是引用表達的場所,著錄的文字表達是其表現(xiàn)形式。

      1.2 科學數據引用的動機

      科學數據引用的核心動力來自于對科研人員數據工作認可的需求、對科學研究過程再現(xiàn)的需求、對科學數據共享和利用效率提升的需求[10]。隨著科學數據引用的發(fā)展,在數據管理、科技管理和情報研究領域,數據發(fā)現(xiàn)和影響力追蹤也成了引用的重要動機。

      1.2.1 科學數據引用是承認數據工作者貢獻的重要方式

      隨著科學研究活動協(xié)作的不斷擴展,在科研過程中需要涉及到科學數據工作相關人員的參與。這就需要記錄不同類型參與者的貢獻,以平衡合作過程中各利益相關者的需求和利益。

      承認數據對相關研究產生貢獻的方式可以有很多,包括致謝、引用、合著[11]。引用行為理論[12]通常認為,引用之前的作品是為了承認知識債務,提供知識的歷史傳承,并引導讀者追本溯源。引用數據集的動力來自對在研究過程中產生的數據進行價值認可,同時數據也會存在于學術發(fā)展的歷史傳承中。對于研究人員來講,這種在學術領域通過歷史傳承或者當前發(fā)布數據而得到尊重、職業(yè)發(fā)展和獲得基金資助等是衡量其成功與否的重要內容。這導致學術群體內產生對規(guī)范性數據引用的期望,同時也引發(fā)通過各種方式對數據引用的宣傳和培訓。

      1.2.2 科學數據引用是提升科學活動透明度的重要途徑

      引用數據提供了驗證科研過程的途徑,讀者能夠通過引用機制直接或間接獲取用于論文的數據文件,把數據用于其他假設、建立模型或與其他數據相結合,對研究結果和過程的驗證,從而使讀者對論文進行評價。例如Applications in Plant Sciences(APPS) 2016 年8 月簽署The Center for Open Science’s Transparency and Openness Promotion(TOP)[13]指南,提出促進數據透明、開放共享和可重現(xiàn)的8 個標準,其中引用是第一標準。數據引用在提高科學透明度和結果再現(xiàn)性方面起著核心作用[14],這在生物醫(yī)學[15]、公共衛(wèi)生[16]和生物學[17]等領域都得到體現(xiàn)。另外,在計算機科學領域,也有通過共享結果、代碼及數據庫研究腳本的方式實現(xiàn)研究過程和結果再現(xiàn)的嘗試[18]。

      1.2.3 科學數據引用是開展數據評價的重要依據

      數據引用要求將更加完整的研究過程和結果提供給其他人,特別是通過適當方式將出版物與支撐其研究結論形成的數據鏈接[19],數據引用著錄內容從客觀上可以提供必要的信息來解釋數據的合法性,這可以作為是數據評價的重要基礎??茖W數據引用還可實現(xiàn)通過跟蹤和溯源數據來間接進行數據質量評價,并且利用科學計量的方法對引用行為記錄進行分析,通過計量結果間接評價數據質量(假設使用頻率越高,說明該數據質量越高;數據存儲依托的數據倉儲權威度越高,說明該數據質量越高),還可以基于數據使用能力和水平開展科研人員、科研機構乃至區(qū)域數據能力評價。

      1.2.4 科學數據引用是學術交流的重要內容

      在表達形式方面,科學數據引用往往通過標準化形式體現(xiàn)引用行為和相關過程。通過研究人員、出版商、讀者等認可的標準模板實現(xiàn)了科學數據引用創(chuàng)造、傳播、組織和檢索??茖W數據引用則實現(xiàn)了科學共同體內對數據利用行為的認同[20]。在目前的科研管理體系當中,科學數據引用已經成為期刊出版商、資助機構和數據倉儲的強制要求??蒲腥藛T遵從這些要求,主動或者被動地開展數據引用,將支撐論文主要觀點的數據、論文使用的數據等內容清晰地著錄,可以幫助科學數據在學術共同體內傳播,也是體現(xiàn)學術素養(yǎng)和學術規(guī)范的重要內容。

      1.3 科學數據引用實施面臨的挑戰(zhàn)

      從科學數據本身來講,由于數據的格式、類型、表現(xiàn)方式不同,數據引用面臨諸多挑戰(zhàn)。

      1.3.1 科學數據多重粒度帶來引用識別不清晰

      在科學出版物中引用的數據可能是全部數據集或者子集,也可能是數據集不同部分的資源聯(lián)合或不同數據集的組合。因此,數據被引用范圍可以從單一數據記錄到數據子集或數據集合,形態(tài)和結構差異較大,這對科學數據引用實施會產生較大影響,也導致難以發(fā)現(xiàn)真正的數據引用行為。

      1.3.2 科學數據多種來源帶來引用溯源不穩(wěn)定

      科學數據引用需要明確科學數據來源,連同上下文信息一起來識別和發(fā)現(xiàn)數據,在此基礎上開展數據溯源,掌握數據的原始狀態(tài),因此溯源模型對于將數據引用集成到數據管理流程具有較強的影響。由于科學數據來源的不確定,以及引用數據類型的多樣化,造成了引用溯源不穩(wěn)定,從而使得數據追蹤和評價不準確。

      1.3.3 科學數據多地存儲帶來引用關聯(lián)不準確

      科學數據引用機制實現(xiàn)的關鍵是數據有固定的存儲位置,且能夠長久存儲。科學數據存儲位置及時效性差異導致引用追蹤、論文與數據關聯(lián)不準確等問題。如果數據存儲在正式的、可信的數據倉儲,則可以更好地保證可以通過永久標識關聯(lián)或解析到數據內容;如果數據存儲在個人或者研究團隊個人電腦的硬盤,則很難保證準確關聯(lián)。

      1.4 科學數據多樣著錄帶來引用追蹤不便捷

      科學數據引用著錄形式不統(tǒng)一,位置多樣,可能在摘要、致謝和方法部分。例如在對某期刊的引用情況分析中發(fā)現(xiàn),在242 次科學數據引用中,出現(xiàn)在標題4 次,摘要59 次,正文167 次,而參考文獻僅為12 次。有些引用著錄描述模糊,讀者不清楚具體是什么數據(無數據名、無作者信息、無獲取信息,無永久的唯一標識符),例如“以德溫特創(chuàng)新索引作為數據源”“利用網頁爬蟲技術獲取新浪微博數據”之類的表達[20]。這種多樣化、模糊的引用著錄造成了對同一文獻中不同數據、不同文獻中同一數據的引用追蹤無從下手。

      2 科學數據引用的實現(xiàn)機制

      科學數據引用對于數據生產者、管理者、使用者等圍繞數據價值實現(xiàn)的利益平衡具有重要作用,其實現(xiàn)依賴于各個利益相關者的共同努力。數據提供者主要是產生特定科學數據的個人、團體、組織,在科學數據引用實現(xiàn)過程中的主要職責包括產生科學數據,對科學數據進行加工整理,提升數據質量;形成科學數據描述性內容和元數據確保數據以可引用的格式存檔,以合適的元數據提交數據;將元數據和數據提交數據倉儲或者存儲中心;在學術履歷中列出其生產的數據集,將其作為一種學術成果。數據用戶指使用科學數據的科研人員。他們應充分了解數據引用規(guī)范、遵守數據使用的各種約束,在使用過程中應對使用的科學數據進行合理規(guī)范著錄,盡可能地使用數據集的唯一標識符(比如DOI),并且通知數據提供者有關數據使用所形成的成果。在發(fā)表相關成果時,將數據作為出版物的附件一起提交或者建立出版物與數據之間的有效關聯(lián)。數據分發(fā)者是數據生產者和使用者之間的中介,這些機構主要管理來自學者或機構提交的科學數據,參與建立統(tǒng)一的數據引用標準,支持并促進唯一標識符使用,推動形成完整的數據出版體系,推動建設科學數據描述、發(fā)現(xiàn)、使用的基礎設施和技術體系,使用自動化工具跟蹤數據查看、搜索、下載、鏈接或引用行為,并反饋給數據生產和提供者。數據共享促進者包括相關國際組織、政府部門、基金資助者、學術共同體、公眾。這些角色應積極參與制定數據共享政策、數據出版政策與引用規(guī)范,開發(fā)數據管理工具及支持性服務并且推動將科學數據納入科研評價體系。

      如本文第一部分指出的,上述各個利益相關者圍繞數據引用標準制定、技術設施建設、政策制度出臺開展了大量工作,但是科學數據引用仍存在較大挑戰(zhàn)。首先,從引用對象角度,需要確??茖W數據大規(guī)模穩(wěn)定存儲、科學精細化管理、詳盡細致性描述,永久長期性標識,把數據當作重要資產看待;其次,從引用行為角度,需要不斷促進引用中的標準化著錄、數據化追蹤、指標化計算和真實性評價反饋,形成科學數據引用的運行體系;從引用實現(xiàn)環(huán)境角度,要求進行科學數據引用便捷性著錄、評價方法針對性植入、技術工具全流程覆蓋、引用意識和水平大幅度提升,將引用嵌入到科研活動過程中去。

      基于上述考慮,本研究認為,科學數據引用的實現(xiàn)需要從以下幾個方面推進:

      圖1 科學數據引用的實現(xiàn)路徑

      2.1 科學數據共享、出版、引用、計量一體化發(fā)展

      將科學數據引用融入科學數據生產制作、發(fā)布出版、共享利用、分析計量的過程,并且全面準確記錄與分析。從科學數據生命周期來看,數據被不同實體基于不同目的而生產、出版、傳播、利用、評價、共享和重用,這些行為之間相互聯(lián)系,相互作用,共同構成數據生命周期??茖W數據引用的出現(xiàn)和推廣改變了傳統(tǒng)的數據管理和使用生態(tài)體系,同時改變了學術交流的模式。

      因此,需要在現(xiàn)有的生命周期中將引用作為重要環(huán)節(jié),強調其對科學數據生產、出版、計量、共享的作用。數據引用可以被視為使用數據的信號,間接體現(xiàn)了數據工作者的能力和水平。數據計量可以測度和評價數據共享貢獻度,促使數據引用走向規(guī)范化和標準化,方便了數據發(fā)現(xiàn)與獲取,使得數據共享更可能發(fā)生。數據出版使得科學數據引用可以更好融入現(xiàn)有學術交流體系,允許更高質量數據以更加正式的方式被使用者發(fā)現(xiàn),促進數據流轉,從而產生數據引用。數據引用為數據計量提供了對象和內容,同時豐富和充實了科學計量相關方法和指標。

      2.2 科學數據政策制度、著錄標準、基礎設施整體性建設

      通過政策引導、基礎設施保障、著錄規(guī)則設定,不斷完善在學術交流體系中科學數據引用行為、特征的規(guī)范化表達。政策指導層面提出數據引用的導向和要求,規(guī)范層面制定數據引用描述與表達的著錄標準,基礎設施層面建設支撐數據引用的工具及服務。

      2.2.1 科學數據引用政策體系

      在科學數據管理和共享過程中,涉及一些硬性的責權約束體系(例如法律政策、合同協(xié)議等)以及軟性的約束體系(例如操作指南、倫理規(guī)范、學術要求等),通過這些可以實現(xiàn)科學數據共享中各個利益相關者的權益[21],提出科學數據引用實施的內容、要求和方法。科學數據引用需要從政策體系、共享協(xié)議和倫理規(guī)范角度分析各個利益方的責任與權益,并通過制定政策、編纂數據共享協(xié)議約束各方的利益關系與行為、規(guī)范數據用戶和數據提供者之間的權利和義務,反思數據獲取中的倫理問題。通過保障科學數據利用過程中各利益相關者權益,使得數據使用更加順暢,進而保障數據引用的實現(xiàn)。

      2.2.2 科學數據著錄標準

      科學數據引用需要對引用行為進行一致的形式化描述、規(guī)范化表達。各類組織、專業(yè)協(xié)會和期刊可以通過提供重要的數據引用標準促進規(guī)范化,同時提出這些表達的模板。由于各類標準化數據引用方法被鼓勵并使用,以及長期穩(wěn)定的數據存儲和技術體系,使得數據使用者可以通過數據引用著錄內容很容易查找和使用數據。

      引用是學術作品交流傳播的足跡,根據這些足跡可以判斷數據流通和傳播的方向,可以為使用/重用這些數據的用戶進行畫像,這些行為的分散和多樣性可以為使用數據是否有序、有目的性提供線索。由引用著錄所體現(xiàn)出客觀存在的數據被不同科研人員使用的特點、模式和規(guī)律,可以不斷充實和豐富科學計量的相關應用,基于數據引用著錄內容開展分析可以幫助分析科研人員思想譜系,形成數據用戶和數據提供者之間的有向網絡,更好把握數據的利用情況。

      2.2.3 科學數據引用基礎設施

      科學數據引用的基礎設施用來支撐數據引用格式和標準形成、確認數據及引用的永久性、方便數據集檢索和互操作、理解數據溯源和貢獻追蹤??茖W數據引用基礎設施應該解決幾個問題:第一,解決科學數據大規(guī)模存儲和管理的問題,為引用實施中數據溯源和驗證提供基礎。主要通過數據倉儲的專業(yè)數據監(jiān)管工作來實現(xiàn)。第二,解決科學數據精細化描述與標識的問題,為引用過程中準確定位和導航提供基礎。主要是通過科學數據唯一標識(DOI、ARK)及其解析系統(tǒng)來實現(xiàn)。第三,解決科學數據引用著錄和生成的問題,為引用行為記錄和自動分析提供基礎。主要是通過統(tǒng)一著錄標準以及相應的工具體系來實現(xiàn)。第四,解決科學數據識別和計量的問題,為引用行為挖掘和規(guī)律總結提供基礎。主要是通過建設不同形式的科學數據引文索引庫,以及以此為數據基礎開展分析評價來實現(xiàn)。

      2.3 科學數據引用利益相關者協(xié)同推進

      科學數據引用要求數據生產者、數據使用者以及其他利益相關者各司其職,協(xié)同推進科學數據引用意識提升、標準執(zhí)行、挖掘利用。從改變科學數據利益相關者關系角度來看,數據引用改變了傳統(tǒng)的科學研究過程中的權益分配和職責范疇。表面上看,數據引用行為主要發(fā)生在數據的使用環(huán)節(jié),但是在數據引用實施過程中,需要各個利益相關者在數據查詢獲取、分析處理、歸檔保存、交流重用等行為各個環(huán)節(jié)各司其職,共同努力[22]。沒有所有利益相關者合作,不可能有效開展科學數據開放共享,建立引用機制,并進行數據影響力度量。

      從參與主體角度來看,科學數據引用的實現(xiàn)依賴于各利益相關者對科學數據引用的認同,從而形成學術群體內遵守的通用行為準則,并協(xié)同進行技術、標準、行為等各個方面的努力。

      3 我國促進科學數據引用的相關建議

      我國將科學數據引用作為推進科學數據共享與管理的重要手段,開展了一系列相關工作。在科學數據引用相關政策方面,2018 年發(fā)布的《科學數據管理辦法》中明確要求:科學數據使用者應遵守知識產權相關規(guī)定,在論文發(fā)表、專利申請、專著出版等工作中注明所使用和參考引用的科學數據。在科學數據著錄標準方面,國家參考文獻著錄標準(GB/T 7714-2015)添加文獻類型標識“DS”數據集,科學數據的引用納入參考文獻著錄內容,同時2018 年實施的科學數據引用標準(GB/T 35294-2017)規(guī)定了科學數據引用元素描述方法、引用元素詳細說明、引用格式等方面的內容。在科學數據引用基礎設施建設方面,已經形成“國家高能物理科學數據中心”等20 個國家科學數據中心、“國家重要野生植物種質資源庫”等30 個國家生物種質與實驗材料資源庫,為可引用科學數據資源的長期存儲和科學管理提供重要基礎。圍繞實現(xiàn)科學數據引用的重要路徑,結合我國科學數據管理辦法落實相關要求,為推動我國科學數據引用的發(fā)展,提出以下建議。

      3.1 加強科學數據引用標準推廣應用

      鼓勵各類基金資助機構、期刊出版社、數據中心形成促進科學數據引用的相關政策,引導和加強學者的數據引用意識。同時,加強科學數據引用的宣傳推廣,讓每一個科研人員能夠認識到其重要性,營造整個科學領域“用則引”的氛圍。在科研過程產生的不同類型、不同形式的產出中盡可能對引用行為開展著錄,體現(xiàn)數據工作的重要性??梢钥紤]使用GB/T 2015-7714 參考文獻著錄標準開展著錄,利用“DS”標識數據引用。也可以以我國2018 年1 月發(fā)布的《信息技術科學數據引用》(GB/T 35294-2017)標準為基礎開展著錄。

      3.2 將科學數據貢獻融入學術評價體系

      破除“四唯”是我國深化科技體制改革激發(fā)創(chuàng)新活力的重要舉措,當“破四唯”成為廣泛共識,如何“立新標”成為重點,科學數據工作理應成為科研評價的重要內容??梢酝ㄟ^記錄數據發(fā)現(xiàn)、瀏覽、使用等全過程,強化計量分析,為科學數據工作改善和價值發(fā)揮提供支撐。在此過程中,加強科學數據描述、檢索、關聯(lián)、發(fā)現(xiàn)、計量等理論方法的研究,開展數據共現(xiàn)、數據共引、數據聚類、數據網絡分析,探索研究提出數據H 指數、數據引用指數等,豐富科學評價內容。加強數據與各類科研產出之間的關聯(lián)分析,以論文與數據之間的鏈接分析為基礎,拓展數據與數據、數據與專利、數據與報告等其他產出關聯(lián)分析的理論方法。

      3.3 強化科學數據引用實現(xiàn)的基礎設施網絡體系

      深化國家科學數據中心、領域數據中心、機構數據倉儲的綜合服務體系建設,既兼顧宏觀上總體領域、區(qū)域布局的合理性,同時注重每個數據倉儲在科學數據獲取、存儲、質量控制、安全等方面的系統(tǒng)性。通過元數據互聯(lián)互通,構建全國一體化科學數據服務網絡,實現(xiàn)從單個數據存儲機構(數據中心、機構知識庫、共享平臺等)服務到協(xié)同服務網絡過渡。探索從其他科技信息資源管理系統(tǒng)的工作流中抽取數據,將科學數據與研究過程中的實體、產出、活動關聯(lián)。

      猜你喜歡
      著錄科學
      常用參考文獻著錄要求
      常用參考文獻著錄要求
      常用參考文獻著錄要求
      常用參考文獻著錄要求
      點擊科學
      點擊科學
      科學大爆炸
      小小藝術家(2019年6期)2019-06-24 17:39:44
      科學
      科學拔牙
      本刊參考文獻著錄要求
      平度市| 福建省| 沁源县| 诸城市| 安阳县| 平乡县| 常州市| 西平县| 绵竹市| 乐亭县| 铁岭市| 会昌县| 莱芜市| 三台县| 青神县| 宝山区| 台江县| 宾川县| 石柱| 阿克苏市| 财经| 得荣县| 卫辉市| 陵川县| 贵阳市| 马山县| 古田县| 林西县| 成安县| 班戈县| 临武县| 宁化县| 凉城县| 墨竹工卡县| 麻城市| 盘锦市| 扎囊县| 亚东县| 玛纳斯县| 宣威市| 和林格尔县|