管茜 董克 夏義堃
摘? ?要:數(shù)據(jù)管理直接影響科研數(shù)據(jù)和科研結(jié)果的可發(fā)現(xiàn)、可獲取、互操作和可重用性,是規(guī)范學(xué)術(shù)行為的重要前提。論文撤稿是保證論文科學(xué)性,建立學(xué)術(shù)信任的重要手段,近年來生命科學(xué)領(lǐng)域頻發(fā)撤稿事件反映了包括數(shù)據(jù)管理在內(nèi)的多種學(xué)術(shù)不端行為。在分析生命科學(xué)領(lǐng)域撤稿論文基本特征基礎(chǔ)上,對撤稿原因進行歸類,對與數(shù)據(jù)、圖像有關(guān)的撤稿論文進一步分析,發(fā)現(xiàn)其在時間、時滯、國家、學(xué)科、期刊等方面的相對發(fā)展趨勢。數(shù)據(jù)、圖像問題是生命科學(xué)論文撤稿的主要原因之一,并呈現(xiàn)波動上升趨勢,數(shù)據(jù)、圖像問題發(fā)生頻率與學(xué)科、期刊等級有關(guān)。應(yīng)當(dāng)從能力提升、制度完善、主體責(zé)任機制、過程監(jiān)督、約束激勵手段等方面來加強科研數(shù)據(jù)管理。
關(guān)鍵詞:數(shù)據(jù)管理;撤稿;生命科學(xué)數(shù)據(jù)
Abstract Data management has a direct impact on the Findable, Accessible, Interoperable and Re-usable of scientific research data and results, and is an important prerequisite for standardizing academic behavior. The retraction of papers is an important means to ensure the scientificity of papers and build academic trust. In recent years, the frequent retraction of papers in the field of life science reflects a variety of academic misconduct, including data management.? Based on the analysis of the basic characteristics of retractions in the field of life science, this paper classifies the reasons for retractions, further analyzes the retractions related to data and images, and finds out their relative development trends in terms of period, time lag, country, discipline, journal and so on. Data and image problems are one of the main reasons for retractions of life science papers, and the frequency of data and image problems is related to discipline and journal level. The management of scientific research data should be strengthened from the aspects of ability promotion, system perfection, subject responsibility mechanism, process supervision, restraint and incentive means, etc.
Key words data management; retracted papers; life scientific data
撤稿是學(xué)術(shù)界自我凈化、自我完善的機制[1],也是維護學(xué)術(shù)誠信、保障期刊質(zhì)量的基本制度保障?!案玫乩斫獬犯宓臐撛谠蛴兄诟淖儺?dāng)前的學(xué)術(shù)文化,并為阻止公眾對學(xué)術(shù)失去信任而提供信息、尋找改進的方向”[2]。近年來,因數(shù)據(jù)誤用、圖像重復(fù)以及數(shù)據(jù)偽造等數(shù)據(jù)管理問題引發(fā)的生命科學(xué)論文撤稿成上升趨勢,如2018年10月,哈佛醫(yī)學(xué)院Anversa教授的多篇論文被舉報存在數(shù)據(jù)、圖像偽造等問題,進而導(dǎo)致其發(fā)表在《NEJM》《Nature》《Cell》《Lancet》等頂級學(xué)術(shù)期刊的31篇研究論文被全部撤稿[3]。從撤稿現(xiàn)象背后的數(shù)據(jù)管理問題進行深度探索,有助于從根源上找出癥結(jié)與解決方法。
1? ?研究回顧與問題的提出
1.1? ? 研究回顧
(1)生命科學(xué)撤稿論文中的數(shù)據(jù)問題認(rèn)知研究。生命科學(xué)領(lǐng)域是撤稿的重災(zāi)區(qū)。Fang等[4]研究發(fā)現(xiàn),自1975年以來,PubMed數(shù)據(jù)庫中已撤稿文章的百分比增加了約10倍。美國科研誠信辦公室(ORI)發(fā)布的《科研不當(dāng)行為的發(fā)現(xiàn)與后果》報告指出,醫(yī)療與公共衛(wèi)生領(lǐng)域24起結(jié)案調(diào)查中有21起涉及到數(shù)據(jù)偽造和/或捏造等情況[5]。韓磊[6]分析了2010-2019我國生物醫(yī)學(xué)領(lǐng)域國際論文撤稿,發(fā)現(xiàn)自2016年起,因數(shù)據(jù)問題、方法與結(jié)果問題被撤銷的論文數(shù)量連續(xù)4年位于第1和第2位,因圖片問題被撤稿的論文數(shù)量多數(shù)年度居第4或第5位。Elisabeth等[7]結(jié)合數(shù)據(jù)欺詐調(diào)查的具體案例,深入探討了撤稿事件背后的數(shù)據(jù)/圖像操縱、誤用等數(shù)據(jù)管理問題。Mike Rossner和Hill[8]進一步指出,修改、重組和偽造數(shù)據(jù)/圖像的部分內(nèi)容以得到想要的但是不客觀的結(jié)果等行為,均屬學(xué)術(shù)不端。Fecher等[9]結(jié)合案例將數(shù)據(jù)濫用行為歸納為四種類型,即“偽造、商業(yè)濫用、競爭性濫用、有缺陷的解釋和不明確的意圖”。
(2)生命科學(xué)撤稿論文中的數(shù)據(jù)問題原因分析。多位學(xué)者通過挖掘期刊數(shù)據(jù)庫和Retraction網(wǎng)站的撤稿聲明,發(fā)現(xiàn)數(shù)據(jù)問題成為引發(fā)生命科學(xué)撤稿的重要因素。如針對PubMed數(shù)據(jù)庫2013年1月1日至2016年12月31日撤稿論文的研究發(fā)現(xiàn),主要撤稿原因包括剽竊(32.7%)和數(shù)據(jù)處理(32.5%)等相關(guān)問題[10]。醫(yī)學(xué)類最常見的撤稿原因是欺詐(數(shù)據(jù)偽造或操縱),占比近一半(49.4%)[11],其中,麻醉學(xué)領(lǐng)域的主要撤稿原因包括數(shù)據(jù)操作/捏造/欺詐(49.4%)、倫理問題(28%)、其他數(shù)據(jù)/方法問題(4.2%)等[12]。
在撤稿論文數(shù)據(jù)問題的原因細分中,既有學(xué)者從生命科學(xué)研究對大規(guī)模實驗數(shù)據(jù)以及對假設(shè)檢驗的高度依賴等角度分析其研究過程與數(shù)據(jù)管理的復(fù)雜性,指出容易導(dǎo)致結(jié)果選擇性偏差、數(shù)據(jù)不完整、不一致以及研究結(jié)果假陽性等數(shù)據(jù)問題[13-15],Christian和Solmaz[16]從生命科學(xué)研究的團隊性以及資助機構(gòu)、期刊出版等利益相關(guān)者角度分析數(shù)據(jù)管理與監(jiān)督的單一性和薄弱性,還有Arturo等[17]從學(xué)術(shù)發(fā)表焦慮、職業(yè)晉升等評價因素角度對撤稿論文數(shù)據(jù)問題的影響。
(3)生命科學(xué)撤稿論文中的數(shù)據(jù)問題應(yīng)對策略研究。目前,國內(nèi)外學(xué)者對于撤稿問題的對策研究主要從期刊撤稿管理與學(xué)術(shù)誠信管理兩方面展開。針對數(shù)據(jù)問題引發(fā)的撤稿處理,一方面,站在期刊管理角度,早在1987年,國際醫(yī)學(xué)期刊編輯委員會(ICMJE)就提出,應(yīng)對不宜在文獻資源中繼續(xù)保存的,或有錯誤的學(xué)術(shù)論文進行撤稿[18]。張維[19]、葉青[20]、Arturo[17]等認(rèn)為期刊應(yīng)采取數(shù)據(jù)可訪問性審核等手段,運用數(shù)據(jù)庫、圖片分析軟件開展原始數(shù)據(jù)審查與圖片原創(chuàng)性比對,并制定圖像完整性標(biāo)準(zhǔn),提高數(shù)據(jù)/圖片鑒別力;另一方面,從加強學(xué)術(shù)誠信角度,有學(xué)者主張撤稿論文不應(yīng)被移除,而應(yīng)被清晰標(biāo)記,并提供訪問,“去除痕跡只會幫助不當(dāng)行為研究人員隱藏該行為”[10]。Esmée等[21]指出團隊合作完成的撤稿論文因人員協(xié)調(diào)問題容易出現(xiàn)數(shù)據(jù)管理漏洞,導(dǎo)致嚴(yán)重的數(shù)據(jù)完整性、真實性問題,應(yīng)對團隊論文進行系統(tǒng)性調(diào)查。李侗桐等[22]進一步指出應(yīng)強化科研人員學(xué)術(shù)誠信教育,提升對數(shù)據(jù)問題引發(fā)的學(xué)術(shù)不端行為的防范能力,在項目資助方、科研機構(gòu)、期刊等實施科學(xué)數(shù)據(jù)審核策略,識別和防范各種形式的數(shù)據(jù)造假。
1.2? ? 撤稿與生命科學(xué)數(shù)據(jù)管理關(guān)系
Karp[23]指出,“生物醫(yī)學(xué)數(shù)據(jù)管理是一項昂貴且費時的工作,但也是共享、管理、集成和分析現(xiàn)有數(shù)據(jù)和新數(shù)據(jù)的最佳方法”。撤稿論文中形形色色的數(shù)據(jù)問題,既檢驗了生命科學(xué)數(shù)據(jù)管理制度實施中的現(xiàn)實困境與不足,也折射出深層次的科學(xué)數(shù)據(jù)管理與學(xué)術(shù)誠信之間緊密的內(nèi)在關(guān)聯(lián)。
(1)撤稿揭示了生命科學(xué)數(shù)據(jù)管理的重要性。因數(shù)據(jù)問題引發(fā)撤稿論文數(shù)量的激增,表明數(shù)據(jù)管理及數(shù)據(jù)共享已經(jīng)成為生命科學(xué)基礎(chǔ)設(shè)施的重要組成部分,數(shù)據(jù)采集方法、分析技術(shù)以及計算工具等有助于研究人員以新的方式和尺度查詢并利用數(shù)據(jù)產(chǎn)生新的數(shù)據(jù)洞察。換言之,“一旦描述了數(shù)據(jù)并進行了數(shù)據(jù)融合與分析,就應(yīng)進行數(shù)據(jù)管理。完成此操作后,才可以將數(shù)據(jù)公開訪問(共享)或提供再利用[24]”。任一環(huán)節(jié)、任一方面的數(shù)據(jù)管理缺失/疏漏都有可能連帶出研究結(jié)論/方法的偏差,相應(yīng)的論文撤稿在所難免。
(2)撤稿折射了生命科學(xué)數(shù)據(jù)管理規(guī)范的復(fù)雜性。實驗數(shù)據(jù)和研究結(jié)論的再現(xiàn)性、可重復(fù)性問題是引發(fā)各方關(guān)注和論文撤稿的重要因素?,F(xiàn)代生命科學(xué)屬于數(shù)據(jù)驅(qū)動型交叉科學(xué),基因測序、遺傳育種等大量生物學(xué)研究建構(gòu)在充分準(zhǔn)確的實驗數(shù)據(jù)基礎(chǔ)之上。同時,數(shù)據(jù)類型的多樣性、術(shù)語邏輯的錯綜復(fù)雜以及對特定實驗環(huán)境、對象客體的高度依賴,導(dǎo)致實施標(biāo)準(zhǔn)化數(shù)據(jù)描述、數(shù)據(jù)組織等數(shù)據(jù)管理工作量的激增。BLAUSTEIN[25]對《PLOS Biology》的調(diào)查發(fā)現(xiàn),研究人員的數(shù)據(jù)共享標(biāo)準(zhǔn)不一,許多人沒有恰當(dāng)?shù)姆椒ū4鎸嶒灁?shù)據(jù)和成果,這些數(shù)據(jù)問題不僅造成后續(xù)研究的不可復(fù)制,也為論文撤稿埋下了隱患。
(3)撤稿反映了生命科學(xué)數(shù)據(jù)管理制度實施的脆弱性?!皬脑加^察到科學(xué)發(fā)現(xiàn),科研合作中的信息流涉及一系列的轉(zhuǎn)換和簡化,流程管理中各項分工的無意疏忽或故意改變,都有可能導(dǎo)致撤稿[26]”。如實驗數(shù)據(jù)記錄的不完整、實驗室筆記數(shù)字化缺失或?qū)?shù)據(jù)記錄在過時的存儲介質(zhì)……,都會造成數(shù)據(jù)復(fù)用的無效,并引發(fā)數(shù)據(jù)再現(xiàn)危機。同時,生命科學(xué)數(shù)據(jù)管理制度的實施還牽涉到多方主體,相關(guān)數(shù)據(jù)活動并未完全遵循常規(guī)的數(shù)據(jù)管理線性路徑(如專注于原始數(shù)據(jù)采集和分析的項目可能會繞過數(shù)據(jù)發(fā)現(xiàn)和整合步驟直接進入數(shù)據(jù)發(fā)布和存儲環(huán)節(jié)),需要全員參與數(shù)據(jù)管理,特別是“溝通和集體監(jiān)督可以讓合作者確保數(shù)據(jù)收集、存儲、處理和分析的完整性”[27]。
(4)撤稿凸顯了生命科學(xué)數(shù)據(jù)管理與學(xué)術(shù)誠信管理的共生性。數(shù)據(jù)是生命科學(xué)學(xué)術(shù)記錄的關(guān)鍵組成部分,撤稿論文的數(shù)據(jù)組織與利用方式不僅反映出作者的數(shù)據(jù)管理態(tài)度與能力,也對學(xué)術(shù)誠信以及數(shù)據(jù)監(jiān)管、共享和復(fù)用發(fā)揮著不可替代的影響。Tijdink[28]對315名比利時生物醫(yī)學(xué)研究人員的調(diào)查發(fā)現(xiàn),出于學(xué)術(shù)發(fā)表和職務(wù)晉升壓力,15%的受訪者承認(rèn)他們在過去3年中有偽造、篡改、剽竊或操縱數(shù)據(jù)的嫌疑,數(shù)據(jù)利用行為成為檢驗學(xué)術(shù)誠信的標(biāo)尺?!霸S多已發(fā)布的科學(xué)數(shù)據(jù)生命周期管理模型反映了基本的學(xué)術(shù)誠信原則,如質(zhì)量控制以及隱私和保密的法律/道德問題[29]”。因而,負(fù)責(zé)任的生命科學(xué)研究應(yīng)包含詳細的數(shù)據(jù)管理計劃與數(shù)據(jù)管理實施、檢查與評估方案。
2? ?基礎(chǔ)生命科學(xué)領(lǐng)域撤稿數(shù)據(jù)分析
2.1? ? 數(shù)據(jù)來源
本研究數(shù)據(jù)來源于Retraction Watch,該網(wǎng)站創(chuàng)建于2010年,旨在關(guān)注科研不端行為,收錄了多個學(xué)科領(lǐng)域的撤稿文獻,基于該數(shù)據(jù)進行的相關(guān)研究已經(jīng)得到了學(xué)界的一致認(rèn)可[30-31]。Retraction Watch數(shù)據(jù)庫中基礎(chǔ)生命科學(xué)領(lǐng)域(不含健康、醫(yī)學(xué)),共包含18個二級學(xué)科,本研究采集了數(shù)據(jù)庫中基礎(chǔ)生命科學(xué)領(lǐng)域截至2021年4月30日的6146篇學(xué)術(shù)論文撤稿記錄,每條數(shù)據(jù)包括被撤稿論文的標(biāo)題、學(xué)科、期刊、出版商、機構(gòu)、作者、撤稿原因、原始文獻發(fā)表日期、撤稿日期、國家10個字段,對于部分字段信息缺失的數(shù)據(jù),由人工補齊。
研究首先分析了基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文原因的總體分布情況,進一步從時間、二級學(xué)科以及期刊的角度,分析了因數(shù)據(jù)問題撤稿論文的分布特征,最后,對這些撤稿論文的數(shù)據(jù)問題進行細分。
2.2? ? 撤稿原因分布
一篇論文可能涉及一條或者多條原因被撤,Retraction Watch對每條撤稿原因均單獨計次。通過數(shù)據(jù)整理發(fā)現(xiàn),被撤稿的6146篇學(xué)術(shù)論文共涉及12146條撤稿原因記錄,去除通知不全、通知無法獲取、通知用語模糊等原因不明確的相關(guān)記錄,共獲得撤稿記錄11018條。Retraction Watch用戶指南將撤稿原因歸為100條[32],可以總結(jié)為12個類別,分別是數(shù)據(jù)、方法與結(jié)果、作者、文章剽竊或重復(fù)發(fā)表、第三方、作者機構(gòu)、期刊/出版商、版權(quán)、同行評審、實驗、引用、倫理、法律糾紛等(基礎(chǔ)生命科學(xué)領(lǐng)域12類撤稿原因的統(tǒng)計分析結(jié)果見表1),從表中可以發(fā)現(xiàn),因圖像和數(shù)據(jù)的錯誤、復(fù)制、偽造、不可信、缺失、操縱等造成的數(shù)據(jù)質(zhì)量問題已經(jīng)成為基礎(chǔ)生命科學(xué)領(lǐng)域論文撤稿的首要原因,占撤稿記錄比例達到了39.30%。
生命科學(xué)研究在復(fù)雜的實驗過程中形成了海量多源異構(gòu)的研究數(shù)據(jù),實驗技術(shù)缺陷、數(shù)據(jù)假陽性及數(shù)理統(tǒng)計分析過程中方法謬誤等非主觀因素,以及數(shù)據(jù)和圖像的偽造、操縱、剽竊、重復(fù)等學(xué)術(shù)不端行為都會導(dǎo)致生命科學(xué)論文撤稿。數(shù)據(jù)問題可能是由于數(shù)據(jù)收集不全面、方法操作有誤、結(jié)果分析錯誤等造成的假陽性;也可能是實驗描述錯漏、不充分等,既涉及數(shù)據(jù)質(zhì)量問題,也包括了數(shù)據(jù)采集描述的標(biāo)準(zhǔn)與處理加工的方法等。
2.3? ? 數(shù)據(jù)問題撤稿論文分布
由于一篇論文可能因多個原因撤稿,因此,4307條與數(shù)據(jù)相關(guān)的撤稿記錄對應(yīng)2686篇撤稿論文(基礎(chǔ)生命科學(xué)領(lǐng)域總體撤稿論文及數(shù)據(jù)問題相關(guān)撤稿論文的時間分布見圖1)。從時間來看,從2004年起,基礎(chǔ)生命科學(xué)領(lǐng)域論文撤稿數(shù)量開始出現(xiàn)快速增加的趨勢,數(shù)據(jù)問題導(dǎo)致的撤稿與總體撤稿在時間分布上表現(xiàn)出一致性。從占比角度來看,2008年以來因數(shù)據(jù)問題導(dǎo)致的撤稿占比呈現(xiàn)出波動上升的趨勢,特別是在2020年,因數(shù)據(jù)原因造成的撤稿論文達到了669篇,占基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的58.0%。
數(shù)據(jù)問題導(dǎo)致的撤稿在二級學(xué)科的分布上存在明顯差異。從總量來看,細胞生物學(xué)、生物化學(xué)、遺傳學(xué)、分析生物學(xué)相關(guān)論文占撤稿總數(shù)的比例較高。這與上述學(xué)科的研究內(nèi)容有關(guān),隨著高通量測序技術(shù)的發(fā)展和應(yīng)用,上述學(xué)科體現(xiàn)出明顯的數(shù)據(jù)驅(qū)動特征,涉及到大量的基因測序、蛋白質(zhì)結(jié)構(gòu)等研究數(shù)據(jù),具有更高的數(shù)據(jù)管理風(fēng)險。進一步分析各二級學(xué)科因數(shù)據(jù)問題導(dǎo)致的撤稿比例,可以發(fā)現(xiàn)植物生物學(xué)/植物學(xué)(Plant Biology/Botany)、遺傳學(xué)(Genetics)、細胞生物學(xué)(Biology-Cellular)、神經(jīng)科學(xué)(Neuroscience)、解剖學(xué)/生理學(xué)(Anatomy/Physiology)、法醫(yī)科學(xué)(Forensic Sciences)、毒理學(xué)(Toxicology)、癌癥生物學(xué)(Biology-Cancer)等二級學(xué)科數(shù)據(jù)質(zhì)量撤稿論文占比均在50%以上,明顯高于平均水平;而營養(yǎng)學(xué)(Nutrition)因數(shù)據(jù)問題導(dǎo)致的撤稿論文占比僅為3.5%,表明各二級學(xué)科內(nèi)部數(shù)據(jù)問題的表現(xiàn)程度存在差異,相比較而言,依賴大規(guī)模數(shù)據(jù)集的學(xué)科撤稿論文比例相對較高。
從期刊的角度來看,2686篇數(shù)據(jù)質(zhì)量撤稿論文來源于841個不同期刊,撤稿論文在15篇及以上的期刊有20個,撤稿論文共972篇,占2686篇撤稿論文的36.19%。進一步結(jié)合JCR的期刊分區(qū)域與撤稿時滯的分析結(jié)果(見圖2),從圖中可以發(fā)現(xiàn),數(shù)據(jù)問題相關(guān)撤稿論文的平均時滯要高于平均撤稿時滯,說明數(shù)據(jù)問題相比于其他學(xué)術(shù)不端行為的發(fā)現(xiàn)更具隱蔽性。此外,隨著期刊影響因子的提升,因數(shù)據(jù)問題的撤稿論文數(shù)量增加,撤稿平均時滯更長,這可能是因為高水平期刊擁有更為嚴(yán)格、規(guī)范的論文審查和數(shù)據(jù)核驗程序,因此其撤稿用時隨著期刊等級而提升,撤稿論文數(shù)量也隨之增加。
2.4? ? 撤稿論文數(shù)據(jù)問題分析
與數(shù)據(jù)、圖像相關(guān)的撤稿原因較為復(fù)雜,從數(shù)據(jù)管理角度來看是一個多維度概念,是一系列數(shù)據(jù)特征的集合,諸多框架中形成了關(guān)于數(shù)據(jù)形式、數(shù)據(jù)內(nèi)容、數(shù)據(jù)效用、數(shù)據(jù)渠道的可獲得性、可理解性、完整性、準(zhǔn)確性、客觀性、可靠性、有效性、有用性、增值性等多層次的質(zhì)量指標(biāo)。從基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的數(shù)據(jù)問題的統(tǒng)計分析結(jié)果(見表2),不難發(fā)現(xiàn),數(shù)據(jù)的準(zhǔn)確性、可靠性和有效性問題與數(shù)據(jù)質(zhì)量撤稿論文高度相關(guān);與準(zhǔn)確性要求相關(guān)的數(shù)據(jù)/圖像操縱、非主觀錯誤、不可信等因素導(dǎo)致的撤稿記錄1584篇,占比36.78%;與可靠性要求相關(guān)的數(shù)據(jù)/圖像重復(fù)、偽造和剽竊等導(dǎo)致的撤稿記錄共1538篇,占比35.71%;有效性強調(diào)數(shù)據(jù)的效用,相關(guān)撤稿記錄共1179篇,占比27.37%;數(shù)據(jù)完整性問題出現(xiàn)頻率較低,相關(guān)撤稿記錄僅6篇,占比0.14%。因此總體來看,基礎(chǔ)生命科學(xué)領(lǐng)域撤稿論文的數(shù)據(jù)問題主要集中在準(zhǔn)確性、可靠性和有效性三個方面。
此外,根據(jù)數(shù)據(jù)問題的產(chǎn)生是否具有主觀故意統(tǒng)計的結(jié)果(見表3)。從表中可以發(fā)現(xiàn),與數(shù)據(jù)/圖像相關(guān)的2686篇被撤論文中,存在數(shù)據(jù)/圖像的偽造、捏造、重復(fù)利用與剽竊等主觀故意的論文1937條,占比45.97%;由于非主觀故意的謄寫、記錄、分析、計算錯誤導(dǎo)致的撤稿記錄2370條,占比55.03%。兩者的比例大體上相當(dāng)。
3? ?撤稿背后的數(shù)據(jù)管理問題歸因
科研過程中的數(shù)據(jù)問題歷來受到關(guān)注,縱觀生命科學(xué)領(lǐng)域形形色色的撤稿事件,不難發(fā)現(xiàn)撤稿背后掩藏著形式多樣、錯綜變幻的數(shù)據(jù)管理問題,其中數(shù)據(jù)不完整、數(shù)據(jù)誤用等非主觀因素導(dǎo)致的撤稿,反映了數(shù)據(jù)管理實施的薄弱,而數(shù)據(jù)捏造、數(shù)據(jù)篡改等數(shù)據(jù)造假行為實質(zhì)上是學(xué)術(shù)不端行為的升級變種。特別是網(wǎng)絡(luò)信息技術(shù)的發(fā)展,如圖片編輯軟件的出現(xiàn),客觀上也為數(shù)據(jù)/圖片修改合成等不當(dāng)數(shù)據(jù)行為提供了便利,有必要從問題歸因角度找出癥結(jié)根源,以便對癥下藥,制定針對性改進舉措。
3.1? ? 數(shù)據(jù)管理意識與數(shù)據(jù)管理能力不足
在數(shù)字化時代,自由而負(fù)責(zé)任的生命科學(xué)研究需要研究人員及相關(guān)主體擁有敏銳的數(shù)據(jù)意識和較高的數(shù)據(jù)開發(fā)利用能力,以保障人們公平獲取生命科學(xué)數(shù)據(jù)、信息和其它研究資源。但在現(xiàn)實中,“對于大多數(shù)生物學(xué)家來說,公共數(shù)據(jù)的計算和統(tǒng)計分析(如跨多個研究的元分析)在技術(shù)上仍然具有挑戰(zhàn)性。如對于缺乏生物信息學(xué)培訓(xùn)的生物學(xué)家來說,獲得或匹配基因表達特征的能力在很大程度上仍遙不可及”[33]。美國的一項調(diào)查發(fā)現(xiàn),很多人缺乏發(fā)現(xiàn)數(shù)據(jù)、識別數(shù)據(jù)集以進行恰當(dāng)分析以及確定數(shù)據(jù)質(zhì)量等技能[34]。許多撤稿事件當(dāng)事人在撤稿聲明中承認(rèn)了數(shù)據(jù)加工處理能力不足、管理不規(guī)范的問題,可見,要真正降低撤稿事件的發(fā)生,需要生命科學(xué)數(shù)據(jù)管理文化以及數(shù)據(jù)技能培訓(xùn)的普及和提升。
3.2? ? 數(shù)據(jù)管理制度不完善
“現(xiàn)代數(shù)據(jù)管理的目標(biāo)不僅僅是簡單地用電子筆記本取代實驗室筆記本,而是要創(chuàng)建一個復(fù)雜的、內(nèi)部一致的、可擴展的數(shù)據(jù)管理制度體系,該體系將不同個人在不同設(shè)備上進行的各種實驗數(shù)據(jù)進行集成并提供利用”[35]。撤稿聲明中提到的數(shù)據(jù)記錄錯誤、實驗描述偏差以及標(biāo)準(zhǔn)使用不一等問題,反映出深層次生命科學(xué)數(shù)據(jù)管理制度體系建設(shè)尚不能滿足和適應(yīng)生命科學(xué)研究發(fā)展的現(xiàn)實需要,還存在著一定程度的制度遺漏。集中表現(xiàn)在以下兩方面:
(1)術(shù)語、格式等數(shù)據(jù)管理標(biāo)準(zhǔn)與規(guī)范的統(tǒng)一問題。生命科學(xué)標(biāo)準(zhǔn)體系復(fù)雜,僅術(shù)語標(biāo)準(zhǔn)就有多種形式,“從可控詞表、術(shù)語表、分類詞表、敘詞表到本體,其形式化程度逐漸增強,功能逐步豐富,復(fù)雜度也大幅度提升[36]”,加之生物醫(yī)學(xué)本體本身有較大的異質(zhì)性,本體間術(shù)語的映射關(guān)系錯綜復(fù)雜,為用戶標(biāo)準(zhǔn)術(shù)語的使用帶來了困惑。同時,并非所有的數(shù)據(jù)類型都有規(guī)范的定義標(biāo)準(zhǔn),需要重新注釋大量現(xiàn)有數(shù)據(jù)?!凹词乖谀承┳宇I(lǐng)域(如系統(tǒng)生物學(xué))具有標(biāo)準(zhǔn)化的數(shù)據(jù)表,選擇標(biāo)準(zhǔn)格式來描述數(shù)據(jù)和元數(shù)據(jù)也不是那么容易,許多現(xiàn)有標(biāo)準(zhǔn)非常復(fù)雜,難以適應(yīng)并且容易出現(xiàn)錯誤陳述”[37]。如果沒有使用標(biāo)準(zhǔn)化的數(shù)據(jù)標(biāo)識,可能會造成數(shù)據(jù)丟失或數(shù)據(jù)理解的誤用,進而難以實現(xiàn)研究成果的再現(xiàn)與復(fù)用,直至論文撤稿。
(2)數(shù)據(jù)規(guī)范執(zhí)行的操作性規(guī)則不健全,數(shù)據(jù)評估與檢查監(jiān)督制度缺位。論文的數(shù)據(jù)質(zhì)量展現(xiàn)了生成它們的生命科學(xué)理論應(yīng)用和實驗條件以及處理數(shù)據(jù)的程序方法。鑒于生命科學(xué)研究過程中的數(shù)據(jù)管理涉及到實驗設(shè)計、樣本采集狀態(tài)、實驗方法、實驗儀器、數(shù)據(jù)采集與加工、分析方法與存儲公開等多個流程,每個流程又觸及更多更為細致的數(shù)據(jù)環(huán)節(jié),需要有健全完善的實施方案或數(shù)據(jù)規(guī)范來具體引導(dǎo)各類人員的數(shù)據(jù)行為。如面對數(shù)據(jù)環(huán)境的豐富性,“僅通過對數(shù)據(jù)進行匿名化或征得用戶的同意使用數(shù)據(jù)就不能可靠地保護隱私[29]”,需要在數(shù)據(jù)采集、加工與發(fā)布共享的各個操作性層面制定相應(yīng)的隱私安全保護條款。再如因?qū)嶒炞⑨尣蛔愣l(fā)的撤稿論文,不僅要有嚴(yán)格的實驗室數(shù)據(jù)管理規(guī)則,“而且還需要開發(fā)易于使用的實驗注釋工具,以實現(xiàn)更好的可重復(fù)性[38]。”
3.3? ? 數(shù)據(jù)主體責(zé)任機制不健全
有效的數(shù)據(jù)管理源自各方主體的數(shù)據(jù)共識與履職約束,生命科學(xué)領(lǐng)域的數(shù)據(jù)管理制度的執(zhí)行源于研究人員、資助機構(gòu)、科研管理部門以及期刊等多主體的共同努力。盡管相關(guān)機構(gòu)已經(jīng)發(fā)布一系列數(shù)據(jù)管理制度,從項目申請的數(shù)據(jù)管理計劃制定到各研究機構(gòu)的《科學(xué)數(shù)據(jù)管理規(guī)定》乃至期刊的《數(shù)據(jù)提交規(guī)范》等,但不同主體在數(shù)據(jù)管理責(zé)任的實施中仍存在較大偏差,未形成多主體數(shù)據(jù)管理的協(xié)同合作機制。
(1)科研團隊未能實現(xiàn)數(shù)據(jù)管理的團隊合作。從實證比較中發(fā)現(xiàn),生命科學(xué)撤稿論文絕大多數(shù)為團隊合作成果,少數(shù)涉及兩個作者,多數(shù)為三到六位合作者[10]。“發(fā)表文章的作者數(shù)量反映了生物醫(yī)學(xué)研究的復(fù)雜性,需要多專業(yè)知識和合作機制來增加樣本量和提高研究的普遍性[39]”,因而也增加了數(shù)據(jù)管理的協(xié)同性要求,即從實驗設(shè)計到從實驗材料中提取有價值數(shù)據(jù)、對數(shù)據(jù)進行分析、圖片編輯和撰寫論文的所有環(huán)節(jié),由研究設(shè)計者、實驗觀察記錄者、數(shù)據(jù)采集者、數(shù)據(jù)統(tǒng)計與分析人員、研究人員以及實驗設(shè)備技術(shù)人員等不僅組成了一個緊密的合作研究網(wǎng)絡(luò),同時也承擔(dān)著相應(yīng)的數(shù)據(jù)記錄、描述、采集與加工管理職責(zé)。但從實際執(zhí)行來看,相較于團隊科研攻關(guān)的一致性,數(shù)據(jù)管理職責(zé)分散、缺乏統(tǒng)一協(xié)調(diào)組織等現(xiàn)象尤為突出,導(dǎo)致個別人員的數(shù)據(jù)造假行為未能及時發(fā)現(xiàn)和制止。
(2)項目資助機構(gòu)、高校/研究機構(gòu)以及期刊等部門未能形成數(shù)據(jù)管理合力。目前,相關(guān)主體對數(shù)據(jù)行為的約束主要通過研究人員的主動報備來體現(xiàn),如提交數(shù)據(jù)管理計劃、隱私保護知情同意書、論文相關(guān)數(shù)據(jù)資料等,既存在著部門內(nèi)部數(shù)據(jù)管理形式單一、手段粗放的問題,也存在著部門間數(shù)據(jù)管理的各自為政與職責(zé)推諉現(xiàn)象。如許多高校/研究機構(gòu)依賴學(xué)術(shù)期刊評估研究成果及價值,進而將數(shù)據(jù)管理與學(xué)術(shù)誠信管理責(zé)任轉(zhuǎn)讓給了學(xué)術(shù)期刊,使得“期刊編輯在學(xué)術(shù)交流中居核心地位,在確保其出版記錄誠信方面具有最重要的作用”[40]。事實上,“盡管生物學(xué)期刊已經(jīng)開始要求作者提供數(shù)據(jù),但通常是在審閱者專門要求提供數(shù)據(jù)時才這樣做[24]”。對于期刊而言,發(fā)現(xiàn)和糾正投稿論文的圖像/數(shù)據(jù)問題既費錢又費時,即便在出版前增加了圖像篩選、數(shù)據(jù)審核環(huán)節(jié),限于資源和人力仍無法獨自履行數(shù)據(jù)管理的核驗、評估職責(zé)。《生物化學(xué)雜志》(Journal of Biological Chemistry)自2017年起就聘請專職人員負(fù)責(zé)圖像審核,而有關(guān)圖像復(fù)制、剽竊或操縱引發(fā)的撤稿現(xiàn)象仍難以杜絕[41]。
3.4? ? 數(shù)據(jù)管理過程監(jiān)督不到位
負(fù)責(zé)任的數(shù)據(jù)管理需要有持續(xù)的數(shù)據(jù)檢查與監(jiān)督評估環(huán)節(jié)。Howe[42]指出,“在建立數(shù)據(jù)管理的正式流程方面,生物學(xué)(35%)處于較低水平”。對生命科學(xué)數(shù)據(jù)采集、匯聚、存儲、加工等全生命周期管理與檢查監(jiān)督缺乏有效實施是導(dǎo)致撤稿論文數(shù)據(jù)問題的重要誘因。其中,項目首席科學(xué)家數(shù)據(jù)管理總體職責(zé)的落實問題不容忽視,如諾貝爾獎獲得者Laureate David Baltimore因未跟蹤檢查其博士后實驗數(shù)據(jù)的收集與分析而導(dǎo)致的多篇論文撤稿與學(xué)術(shù)誠信調(diào)查[43]。由于大多數(shù)生物醫(yī)學(xué)實驗主要由研究生、博士后或技術(shù)人員充當(dāng)主體來完成,一旦首席科學(xué)家以及其他項目組成員間的數(shù)據(jù)/圖像核驗檢查不到位,即數(shù)據(jù)管理的第一道防線缺失,論文寫作中的數(shù)據(jù)/圖像造假與誤用就在所難免。因為,對于那些出現(xiàn)數(shù)據(jù)不當(dāng)行為或產(chǎn)生可疑數(shù)據(jù)結(jié)果的人員而言,嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)審計與過程監(jiān)督既是必要的撤稿防范舉措也是有益的數(shù)據(jù)素養(yǎng)與學(xué)術(shù)誠信教育。當(dāng)然,實驗數(shù)據(jù)生產(chǎn)加工過程與結(jié)果的公開透明也是數(shù)據(jù)管理參與和監(jiān)督的有益補充,但 “由于工作流程(數(shù)據(jù)提取、選擇、操作、分析和報告)通常沒有公開,通常無法檢查已發(fā)布結(jié)果的有效性[44]”,高質(zhì)量數(shù)據(jù)管理的檢查監(jiān)督仍然十分薄弱。
3.5? ? 數(shù)據(jù)管理激勵約束手段不完善
撤稿論文中的數(shù)據(jù)問題促使人們重新思考如何完善數(shù)據(jù)管理的激勵與約束。目前,期刊發(fā)表以及論文和數(shù)據(jù)發(fā)布后的引用已成為研究人員加強數(shù)據(jù)管理和共享數(shù)據(jù)的主要推動力。eLife的調(diào)查顯示,人們不愿意公開數(shù)據(jù)的主要原因包括沒有任何激勵機制促使他們花費時間和精力分享數(shù)據(jù),數(shù)據(jù)過于復(fù)雜而不知該如何分享,對數(shù)據(jù)質(zhì)量、知識產(chǎn)權(quán)的擔(dān)憂等[45]。可見,除學(xué)術(shù)發(fā)表外,總體上依然缺乏有效數(shù)據(jù)管理與數(shù)據(jù)貢獻的衡量標(biāo)準(zhǔn),包括對研究過程中數(shù)據(jù)管理的可持續(xù)資助不足,未能減輕相關(guān)人員數(shù)據(jù)管護的成本負(fù)擔(dān),客觀上有可能導(dǎo)致數(shù)據(jù)管理的不作為。為此,美國國家科學(xué)基金會下屬的科學(xué)研究學(xué)會在其數(shù)據(jù)管理工作坊活動中建議設(shè)立數(shù)據(jù)共享獎,以提高高質(zhì)量數(shù)據(jù)存檔和共享的知名度和認(rèn)可度[46]。同時,除嚴(yán)重數(shù)據(jù)造假引發(fā)大規(guī)模撤稿和學(xué)術(shù)不端的懲處外,對于數(shù)據(jù)誤用等問題并沒有相應(yīng)的數(shù)據(jù)管理責(zé)任追懲制度,包括撤稿聲明的模棱兩可,容易使人產(chǎn)生診療過失致死要追究責(zé)任,而數(shù)據(jù)造假沒有責(zé)任成本的錯覺。
4? ?啟示與思考
“我們生成復(fù)雜、海量數(shù)據(jù)的能力已經(jīng)超過了我們存儲、管理和使用數(shù)據(jù)的能力[47]”。論文撤稿的數(shù)據(jù)問題不僅反映了當(dāng)前生命科學(xué)數(shù)據(jù)管理的薄弱與不足,也揭示出學(xué)術(shù)誠信與數(shù)據(jù)管理二者之間緊密交織、互為促進的依存關(guān)系,促使我們從科學(xué)研究的本質(zhì)與學(xué)術(shù)誠信管理的更廣闊視角來理性看待和分析生命科學(xué)數(shù)據(jù)管理問題:即科學(xué)研究過程以及結(jié)果的數(shù)據(jù)公開與共享有助于防范各類數(shù)據(jù)問題引發(fā)的撤稿現(xiàn)象,有效的數(shù)據(jù)管理既是負(fù)責(zé)任的科學(xué)研究行為的應(yīng)有之義,也是保障學(xué)術(shù)誠信的重要組成部分(見圖3)。
當(dāng)前,生命科學(xué)數(shù)據(jù)以前所未有的速度和數(shù)量產(chǎn)生和傳播,迫切需要有健全完善的數(shù)據(jù)管理制度和規(guī)范統(tǒng)一的數(shù)據(jù)管理標(biāo)準(zhǔn),還需將數(shù)據(jù)管理貫穿于生命科學(xué)數(shù)據(jù)生成、利用、存儲等所有階段,以挖掘數(shù)據(jù)背后的規(guī)律,加速推動生命科學(xué)研究的創(chuàng)新,并從數(shù)據(jù)管理的源頭杜絕數(shù)據(jù)造假等學(xué)術(shù)不端行為和撤稿事件的發(fā)生。同時,對學(xué)術(shù)不端行為的審查,包括對撤稿論文的及時處理,一定程度上也是對生命科學(xué)數(shù)據(jù)管理結(jié)果的糾正和約束行為的補充,從而推動了良好數(shù)據(jù)共享生態(tài)的營造,有利于生命科學(xué)數(shù)據(jù)管理工作的開展。
2007 年,美國國家自然科學(xué)基金會發(fā)布的《面向21世紀(jì)科學(xué)研究的信息化基礎(chǔ)設(shè)施》報告中指出“未來美國科學(xué)和工程上的國際領(lǐng)先地位將越來越取決于在數(shù)字化科學(xué)數(shù)據(jù)開發(fā)利用方面的優(yōu)勢,取決于通過成熟的數(shù)據(jù)挖掘、集成、分析和可視化工具將其轉(zhuǎn)換為信息和知識的能力”[48]。包括生命科學(xué)數(shù)據(jù)在內(nèi)的科學(xué)數(shù)據(jù)管理已經(jīng)受到國內(nèi)外各界的高度重視,撤稿論文中的數(shù)據(jù)問題表明,生命科學(xué)數(shù)據(jù)管理的有效實施還需要從系統(tǒng)性角度,如相關(guān)主體數(shù)據(jù)責(zé)任的履職監(jiān)督、學(xué)術(shù)誠信管理制度、數(shù)據(jù)共享激勵約束機制等深入尋找解決問題的答案與對策。
近幾年來,我國生命科學(xué)領(lǐng)域論文撤稿情況屢見不鮮,2018年,國家衛(wèi)健委制定了《醫(yī)學(xué)期刊編輯出版?zhèn)惱硪?guī)范》,提倡期刊建立規(guī)范的倫理政策和學(xué)術(shù)不端行為處理流程,包括規(guī)范的撤稿機制??傮w而言,加強研究人員的數(shù)據(jù)素養(yǎng)培訓(xùn),強化學(xué)術(shù)誠信教育,完善數(shù)據(jù)管理標(biāo)準(zhǔn)和制度,“建設(shè)符合我國科研人員和數(shù)據(jù)管理人員數(shù)據(jù)管理流程和數(shù)據(jù)建設(shè)環(huán)境,是提升生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)質(zhì)量的重要前提和支撐條件[54]”,也是根除學(xué)術(shù)不端、規(guī)避撤稿事件發(fā)生的可行要素。
參考文獻:
[1]? 魏眾,蔣穎.中國人文社會科學(xué)學(xué)術(shù)期刊撤稿問題研究[J].澳門理工學(xué)報,2020(4):122-133.
[2]? Steen R G,Casadevall A,F(xiàn)ang F C.Why Has the Number of Scientific Retractions Increased?[J].PLoS ONE,2013,8(7):e68397.
[3]? 哈佛大牛被瘋狂撤稿31篇,心肌干細胞領(lǐng)域要涼?[EB/OL].[2020-05-01].http://iras.lib.whu.edu.cn:8080/rwt/401/https/P75YPLC/sohu.com/a/260243674_100293365.
[4]? Fang F C,Steen R G,Casadevall A.Misconduct accounts for the majority of retracted scientific publications[J].Proc Natl Acad Sci USA,2012,109(42):17028-17033.
[5]? Findings and Consequences of Research Misconduct[EB/OL].[2021-05-31].https://ori.hhs.gov/education/products/RIandImages/misconduct_cases/findings_of_misconduct.pdf.
[6]? 韓磊.2010-2019年中國生物醫(yī)學(xué)論文的撤稿趨勢及學(xué)術(shù)不端演變特征[J].中國科技期刊研究,2021,32(2):158-165.
[7]? Elisabeth,M,Bik,et al.The Prevalence of Inappropriate Image Duplication in Biomedical Research Publications[J/OL].[2021-05-31].https://mbio.asm.org/content/7/3/e00809-16.
[8]? Rossner M,Hill E E.Show me the data[J].The Journal of Cell Biology,2007,179(6):1091-1092.
[9]? Fecher B,F(xiàn)riesike,S,Hebing M.What drives academic data sharing?[J/OL].[2021-05-31].https://pubmed.ncbi.nlm.nih.gov/25714752/.
[10]? IsabelCampos-Varela,AlbertoRuano-Ravi?觡a.Misconduct as the main cause for retraction.A descriptive study of retracted publications and their authors[J].Gaceta Sanitaria,2019,33(4):356-360.
[11]? Tijdink J K,Smulders Y M,Vergouwen A,et al.The assessment of publication pressure in medical science;validity and reliability of a Publication Pressure Questionnaire(PPQ)[J].Quality of Life Research,2014,23(7):2055-2062.
[12]? Nair S,Yean C,Yoo J,et al.Reasons for article retraction in anesthesiology:a comprehensive analysisRaisons justifiant la rétractation d'un article en anesthésiologie: une analyse exhaustive[J].Canadian Journal of Anaesthesia,2019(67):57-63.
[13]? Ioannidis JPA.Why most published research findings are false[J].PLoS Med,2005;2(8):e124.
[14]? Borisas B,Ramona B,Benoit B,et al.Minimizing proteome redundancy in the UniProt Knowledgebase[EB/OL].[2021-05-31].https://academic.oup.com/database/article/doi/10.1093/database/baw139/2742069#.
[15]? Casadevall A,Steen R G,F(xiàn)ang F C.Sources of error in the retracted scientific literature[J].Faseb Journal Official Publication of the Federation of American Societies for Experimental Biology,2014,28(9):3847.
[16]? ChristianBerggren,Solmaz FilizKarabag.Scientific misconduct at an elite medical institute:The role of competing institutional logics and fragmented control[J].Research Policy,2019,48(2):428-443.
[17]? Arturo,Casadevall,Lee,et al.A Framework for Improving the Quality of Research in the Biological Sciences[J].mBio,2016,7(4):e01256-16.
[18]? 姜天華,陳靜,耿波,等.數(shù)據(jù)庫中關(guān)于撤銷論文處理的實證分析——PubMed數(shù)據(jù)庫與國內(nèi)數(shù)據(jù)庫的對比[J].中國科技期刊研究,2014,25(5):616-619.
[19]? 張維,吳培紅,汪勤儉,等.國內(nèi)外生物醫(yī)學(xué)期刊撤稿規(guī)范分析及應(yīng)對學(xué)術(shù)不端行為的防范策略[J].編輯學(xué)報,2020,32(3):251-256.
[20]? 葉青,林漢楓,張月紅.圖片中學(xué)術(shù)不端的類型與防范措施[J].編輯學(xué)報,2019,31(1):45-50.
[21]? An investigation of seven other publications by the first author of a retracted paper due to doubts about data integrity[J].European Journal of Obstetrics & Gynecology and Reproductive Biology,2021,261(6):236-241.
[22]? 李侗桐,馮秋蕾,韓鴻賓.科技論文偽造數(shù)據(jù)的識別與防范[J].中國科技期刊研究,2019(8):827-831.
[23]? Karp P D.How much does curation cost?[J].Database the Journal of Biological Databases & Curation,2016(110):1-2.
[24]? Renaut S,AE Budden,Gravel D,et al.Management,Archiving,and Sharing for Biologists and the Role of Research Institutions in the Technology-Oriented Age[J].BioScience,2018,68(6):400-411.
[25]? BLAUSTEIN,RICHARD.Reproducibility Undergoes Scrutiny[J].Bioscience,2014,64(4):368.
[26]? Latour B,Woolgar S.Laboratory Life: The Construction of Scientific Facts[J].Medical History,1986,25(3):341-342.
[27]? Resnik David B,Smith Elise M,Chen Stefanie H.What is Recklessness in Scientific Research The Frank Sauer Case[J].ACCOUNTABILITY IN RESEARCH-POLICIES AND QUALITY ASSURANCE2017(24):497-502.
[28]? Tijdink J K,Verbeke R,Smulders Y M.Publication pressure and scientific misconduct in medical scientists[J].J Empir Res Hum Res Ethics,2014,9(5):64-71.
[29]? Gundersen L C.SCIENTIFIC INTEGRITY AND ETHICAL CONSIDERATIONS FOR THE RESEARCH DATA LIFE CYCLE[M].John Wiley & Sons,Inc,2017.
[30]? R Dal-Ré,Ayuso C.Reasons for and time to retraction of genetics articles published between 1970 and 2018[J].Journal of Medical Genetics,2019,56(11):734-740.
[31]? M D Ribeiro,Vasconcelos S.Correction to:Retractions covered by Retraction Watch in the 2013-2015period:prevalence for the most productive countries[J].Scientometrics,2018(114):719-734.
[32]? Retraction Watch Database User Guide Appendix B:Reasons[EB/OL].[2021-04-23].https://retractionwatch.com/retraction-watch-database-user-guide/retraction-watch-database-user-guide-appendix-b-reasons/.
[33]? Sparks R,Lau W W,Tsang J S.Expanding the Immunology Toolbox:Embracing Public-Data Reuse and Crowdsourcing[J].Immunity,2016,45(6):1191-1204.
[34]? Curty R G,Crowston K,Specht A,et al.Attitudes and norms affecting scientists' data reuse[J].PLOS ONE,2017,12(12):e0189288.
[35]? Matthew,D,Zimmerman,et al.Data Management in the Modern Structural Biology and Biomedical Research Environment[J].Structural Genomics and Drug Discovery,2014(1140):1-25.
[36]? 朱彥,賈李蓉,高博,等.中醫(yī)臨床術(shù)語系統(tǒng)v2.0設(shè)計與構(gòu)建[J].中國中醫(yī)藥圖書情報雜志,2018,42(3):10-15.
[37]? Figueiredo S.Data Sharing: Convert Challenges into Opportunities[J].Frontiers in Public Health,2017,5(4):327.
[38]? Rung J,Brazma A.Reuse of public genome-wide gene expression data[J].Nature Reviews Genetics,2013,14(2):89-99.
[39]? Christopher King.Multiauthor Papers:Onward and Upward[J/OL].[2021-05-31].https://archive.annual-report.thomsonreuters.com/2012/_files/pdf/MultiauthorPapers_ChrisKing.pdf.
[40]? Marusic A,Katavic V,Marusic M.Role of editors and journals in detecting and preventing scientific misconduct: Strengths,weaknesses,opportunities,and threats[J].Medicine and law,2007,26(3):545-566.
[41]? McCook A.Job alert:biology society hiring editors to screen images[EB/OL].[2021-05-31].http://retractionwatch.com/2017/04/21/job-alert-biology-society-hiring-editors-screen-images/.
[42]? Howe N,Giles E,Newbury-Birch D,et al.Systematic review of participants' attitudes towards data sharing:a thematic synthesis[J].Journal of Health Services Research & Policy,2018,23(2):123-133.
[43]? D E Chubin,E J Hackett.Peerless Science[M].State University of New York Press,Albany,NY,1990:267.
[44]? Malika I,Winney I S,Anna K,et al.Striving for transparent and credible research:practical guidelines for behavioral ecologists[J].Behavioral Ecology,2017,28(2):348-354.
[45]? Understanding the demand for reproducible research articles[EB/OL].[2021-05-31].https://elifesciences.org/inside-elife/e832444e/innovation-unde rstanding-the-demand-for-reproducible-researcharticles.
[46]? Jane Maienschein,John N Parker,Manfred Laubichler and Edward J.Hackett[J].Data Management and Data Sharing in Science and Technology Studies.Science,Technology,& Human Values,2019,44(1):143-160.
[47]? Coates H.Ensuring research integrity:The role of data management in current crises[J].College & Research Libraries News,2014,75(11):598-601.
[48]? Cyberinfrastructure vision for 21st century discovery[EB/OL].[2021-05-31].https://www.nsf.gov/pubs/2007/nsf0728/nsf0728.pdf,2007.
[49]? 楊嘯林,楊晟,潘虹潔,等.FAIR準(zhǔn)則與生物醫(yī)學(xué)數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用服務(wù)[J].中國醫(yī)學(xué)倫理學(xué),2020,33(2):153-159.
作者簡介:管茜,女,武漢大學(xué)信息管理學(xué)院碩士研究生;董克,男,武漢大學(xué)信息管理學(xué)院副教授,研究方向:文獻計量與科學(xué)評價;夏義堃,女,武漢大學(xué)信息資源研究中心教授,研究方向:政府?dāng)?shù)據(jù)治理。