謝維熙 張光耀 鄭軒 王賢文
(1.大連理工大學(xué)科學(xué)學(xué)與科技管理研究所暨WISE實(shí)驗(yàn)室,大連,116024;2.大連理工大學(xué)經(jīng)濟(jì)管理學(xué)院,大連,116024)
隨著互聯(lián)網(wǎng)的發(fā)展和開(kāi)放科學(xué)的不斷深入[1],科學(xué)成果傳播和交流的方式也在不斷推陳出新。預(yù)印本便是一種重要的學(xué)術(shù)成果交流形式,研究人員為進(jìn)行更廣泛的學(xué)術(shù)交流,將科研成果通過(guò)網(wǎng)絡(luò)發(fā)布到預(yù)印本平臺(tái)。相較于正式出版的論文,預(yù)印本具有傳播和交流速度快、交流更廣泛更開(kāi)放的特點(diǎn)。研究人員通過(guò)預(yù)印本向同行和公眾及時(shí)分享自己的研究成果,極大地促進(jìn)了科學(xué)成果的傳播和交流。
2019年末爆發(fā)的新冠疫情(COVID-19)對(duì)科學(xué)界產(chǎn)生了巨大的影響,科學(xué)家們?yōu)樽柚共《镜膫鞑ヒ郧八从械乃俣韧度氲较嚓P(guān)研究中。作為傳統(tǒng)以期刊為核心的學(xué)術(shù)交流模式的替代或補(bǔ)充,更多科學(xué)家選擇將研究成果第一時(shí)間發(fā)布在預(yù)印本平臺(tái),預(yù)印本的優(yōu)勢(shì)在這次疫情中得到了充分體現(xiàn)[2]。預(yù)印本可以實(shí)時(shí)分享研究結(jié)果,避免同行評(píng)審的延誤,在新冠肺炎病毒未得到完全解決以及開(kāi)放科學(xué)不斷推進(jìn)的時(shí)代,預(yù)印本在科學(xué)交流體系中的關(guān)鍵作用愈發(fā)明顯[3]。預(yù)印本的擴(kuò)散趨勢(shì)是指預(yù)印本在一段時(shí)間內(nèi),通過(guò)特定的渠道在某一團(tuán)體中傳播的過(guò)程。探究預(yù)印本的擴(kuò)散趨勢(shì)有著重要的意義,然而以往的研究對(duì)此鮮有涉及。因此,本文以bioRxiv預(yù)印本為研究對(duì)象,探究預(yù)印本發(fā)表模式的擴(kuò)散趨勢(shì),從國(guó)家和機(jī)構(gòu)的角度對(duì)其擴(kuò)散趨勢(shì)進(jìn)行分析。
開(kāi)放科學(xué)是一種推進(jìn)科學(xué)開(kāi)放與共享的科學(xué)實(shí)踐,倡導(dǎo)增加科學(xué)的透明度,擴(kuò)大研究成果的訪問(wèn)范圍,是全球科技發(fā)展的重要趨勢(shì),開(kāi)放獲取是組成開(kāi)放科學(xué)的一部分,也是開(kāi)放科學(xué)的核心要素[4]。為促進(jìn)科學(xué)信息的廣泛交流以及提高科學(xué)研究的效率,開(kāi)放獲取為作者免費(fèi)提供在互聯(lián)網(wǎng)上獲取和使用科研文獻(xiàn)的機(jī)會(huì),預(yù)印本平臺(tái)是開(kāi)放獲取相關(guān)實(shí)踐的重要部分[5]。預(yù)印本arXiv最初于1991年推出,主要為物理研究人員在論文正式發(fā)表之前提供分享平臺(tái),而后伴隨開(kāi)放科學(xué)運(yùn)動(dòng)的興起得到迅速發(fā)展,同時(shí),預(yù)印本平臺(tái)也有助于開(kāi)放科學(xué),能夠快速而廣泛地分享研究成果。預(yù)印本是一種為彌合論文提交和出版之間的時(shí)間差而建立的開(kāi)放獲取在線存儲(chǔ)庫(kù)[6],存儲(chǔ)未經(jīng)正式同行評(píng)審的手稿,預(yù)印本的篩選過(guò)程是粗略和快速的,平臺(tái)對(duì)提交到預(yù)印本服務(wù)器上的文章的完整性和是否抄襲以及符合法律和道德規(guī)范進(jìn)行檢查,大多數(shù)預(yù)印本服務(wù)器為每份提交的文章提供DOI[7]。繼arXiv之后,社會(huì)科學(xué)、生物學(xué)和醫(yī)學(xué)等領(lǐng)域也推出了各自的預(yù)印本平臺(tái),分別為SSRN、bioRxiv和medRxiv等。
預(yù)印本的出現(xiàn)不僅推動(dòng)了開(kāi)放科學(xué)運(yùn)動(dòng)[8],讓讀者快速免費(fèi)地獲取科學(xué)內(nèi)容,同時(shí)研究者在將論文提交至期刊之前也可以得到及時(shí)的反饋并確立其研究的優(yōu)先權(quán)[9],研究人員通過(guò)發(fā)布預(yù)印本可以即時(shí)傳達(dá)他們的研究結(jié)果,從而得到及時(shí)的反饋以及促進(jìn)早期合作。研究表明最終發(fā)表的出版物中發(fā)布過(guò)預(yù)印本的文章有更多的關(guān)注和引用[10,11],預(yù)印本的推出還降低了論文發(fā)表的偏見(jiàn),尤其是對(duì)于職業(yè)生涯早期的科研人員[12]。預(yù)印本作為期刊出版物的替代或補(bǔ)充,加速了科學(xué)信息的傳播,在一定程度上還加速了研究的進(jìn)程,同時(shí)還為出版生態(tài)系統(tǒng)的演變提供了可能性[13]。
從學(xué)術(shù)界的態(tài)度來(lái)看,隨著研究進(jìn)程的加快,研究人員對(duì)同行評(píng)審的速度以及已發(fā)表論文的可獲得性愈發(fā)不滿(mǎn),盡管預(yù)印本的可信度因缺乏嚴(yán)格的評(píng)審被詬病[14-15],然而其及時(shí)性對(duì)于科學(xué)交流至關(guān)重要,預(yù)印本也得到了學(xué)術(shù)團(tuán)體、基金組織甚至傳統(tǒng)出版商的認(rèn)可和支持,生物學(xué)出版商鼓勵(lì)提交預(yù)印本[16],Elife等知名期刊直接接受bioRxiv網(wǎng)站的提交,節(jié)省了作者向期刊提交論文的時(shí)間[17]。美國(guó)國(guó)立衛(wèi)生研究院(NIH)和歐洲研究理事會(huì)等主要研究資助者也表達(dá)了對(duì)預(yù)印本的支持[16]。
2019年末爆發(fā)的新冠疫情引發(fā)了科學(xué)文獻(xiàn)的激增,尤其是與新冠肺炎相關(guān)的文獻(xiàn)數(shù)量大幅增加[18]。隨著新型冠狀病毒的傳播,與冠狀病毒有關(guān)的論文出版規(guī)范迅速發(fā)生變化,傳統(tǒng)的論文發(fā)表已經(jīng)無(wú)法滿(mǎn)足人們對(duì)信息的迫切需求,信息的即時(shí)性對(duì)于決策者和普通民眾都至關(guān)重要。預(yù)印本因其傳播速度快而受到廣泛使用,其中醫(yī)學(xué)相關(guān)預(yù)印本論文增長(zhǎng)速度尤其快,最受歡迎的兩個(gè)生物醫(yī)學(xué)領(lǐng)域的預(yù)印本服務(wù)器是bioRxiv和medRxiv[19]。
疫情前期,預(yù)印本占據(jù)冠狀病毒相關(guān)研究的大部分,相比較于學(xué)術(shù)出版物,預(yù)印本獲得了更多的關(guān)注和引用[20],預(yù)印本的廣泛使用促進(jìn)了學(xué)者之間的快速交流,加速了研究進(jìn)程,為疫情防控和疫苗研發(fā)提供即時(shí)信息,也對(duì)政策制定起到了至關(guān)重要的作用[21]。然而,預(yù)印本的質(zhì)量控制問(wèn)題仍令人擔(dān)憂(yōu)[22],預(yù)印本服務(wù)器上發(fā)布的手稿因未經(jīng)嚴(yán)格的同行評(píng)審而飽受爭(zhēng)議,研究結(jié)果可能會(huì)影響臨床實(shí)踐,甚至影響患者的安全[23]。雖然嚴(yán)格的同行評(píng)審過(guò)程能夠保證科學(xué)研究質(zhì)量和完整性,但是即使在學(xué)術(shù)期刊已經(jīng)大幅縮短論文出版時(shí)間的情況下,幾個(gè)月甚至更久的評(píng)審過(guò)程與疫情下對(duì)信息的迫切需求仍然存在巨大的張力[24]。也有研究表示預(yù)印本論文與期刊論文的可靠性相差不大,Brainard對(duì)比疫情期間經(jīng)過(guò)同行評(píng)審發(fā)表在期刊上的文章與發(fā)布在預(yù)印本平臺(tái)上的文章后發(fā)現(xiàn),兩者在可靠性等方面的差距在變小[19]。
為了解疫情期間關(guān)于冠狀病毒預(yù)印本累積數(shù)量的演化模式,Vasconcelos建立模型發(fā)現(xiàn)在疫情爆發(fā)后很短的時(shí)間內(nèi)產(chǎn)生了前所未有數(shù)量的學(xué)術(shù)論文,然而這種增速在幾個(gè)月后降低,甚至文獻(xiàn)數(shù)量有下降趨勢(shì)[25]。Abdill基于bioRxiv預(yù)印本在國(guó)家層面展示了全球參與bioRxiv的大致情況,國(guó)家在bioRxiv上的投稿數(shù)量以及主導(dǎo)地位分布極不均衡[26]。相關(guān)研究還分析了bioRxiv預(yù)印本使用量的變化趨勢(shì),發(fā)現(xiàn)自2013年推出以來(lái)預(yù)印本的提交量和下載量激增,其中首次發(fā)布預(yù)印本的作者數(shù)量也持續(xù)上升,此外大部分論文最終經(jīng)過(guò)同行評(píng)審發(fā)表到期刊上[24]。
預(yù)印本作為一種新興的學(xué)術(shù)交流載體已經(jīng)在許多學(xué)科領(lǐng)域得到廣泛關(guān)注和應(yīng)用,因此探索預(yù)印本的擴(kuò)散趨勢(shì)有著重要的意義。目前國(guó)內(nèi)外關(guān)于bioRxiv以及預(yù)印本的研究,問(wèn)題主要集中于預(yù)印本平臺(tái)的優(yōu)勢(shì)、影響與局限性[27],預(yù)印本的提交量和下載量,最終有多少預(yù)印本在期刊上發(fā)表以及預(yù)印本到最終發(fā)表的版本發(fā)生的變化,預(yù)印本研究領(lǐng)域的變化趨勢(shì)[17,28],預(yù)印本的關(guān)注和引用優(yōu)勢(shì)[11,29]等方面,國(guó)內(nèi)也有學(xué)者從政策角度對(duì)預(yù)印本的發(fā)展態(tài)勢(shì)進(jìn)行分析[30],然而幾乎沒(méi)有研究涉及預(yù)印本在時(shí)間演化和空間擴(kuò)散上的趨勢(shì)。
本文以生物學(xué)領(lǐng)域最大的預(yù)印本平臺(tái)bioRxiv為研究對(duì)象,選取2013-2021年Dimensions平臺(tái)上的bioRxiv數(shù)據(jù)集,使用文獻(xiàn)計(jì)量法從多維度探究bioRxiv在國(guó)家和機(jī)構(gòu)層面的演化規(guī)律,以及疫情對(duì)擴(kuò)散趨勢(shì)的影響,有助于了解bioRxiv的整體格局和發(fā)展趨勢(shì),從預(yù)印本角度總結(jié)學(xué)術(shù)交流演變規(guī)律,為預(yù)印本平臺(tái)建設(shè)和學(xué)術(shù)交流體系發(fā)展提供參考。本研究主要關(guān)注以下幾個(gè)研究問(wèn)題:
(1)國(guó)家層面上,bioRxiv預(yù)印本發(fā)表在國(guó)家經(jīng)濟(jì)發(fā)展水平下呈現(xiàn)什么樣的擴(kuò)散趨勢(shì)?
(2)機(jī)構(gòu)層面上,bioRxiv預(yù)印本發(fā)表從機(jī)構(gòu)科研水平視角下存在什么樣的擴(kuò)散趨勢(shì)?
(3)新冠疫情形勢(shì)下,bioRxiv預(yù)印本發(fā)表的擴(kuò)散趨勢(shì)有何特征?
Digital Science公司于2018年初發(fā)布了一個(gè)新型的綜合科研信息數(shù)據(jù)平臺(tái)——Dimensions(https://app.dimensions.ai/),收錄了大量科研信息資源,包括文獻(xiàn)(期刊和會(huì)議論文、圖書(shū)、預(yù)印本等)、研究數(shù)據(jù)集、基金和專(zhuān)利數(shù)據(jù)、臨床試驗(yàn)和跨數(shù)據(jù)源關(guān)聯(lián)關(guān)系等,為科研人員、出版商以及科研經(jīng)費(fèi)資助機(jī)構(gòu)所需的科技情報(bào)和決策提供數(shù)據(jù)支撐[31]。對(duì)本研究而言,雖然數(shù)據(jù)來(lái)源于bioRxiv,但是需從Dimensions采集。這是因?yàn)閎ioRxiv網(wǎng)站不提供論文元數(shù)據(jù)采集的API,對(duì)于論文作者所屬的機(jī)構(gòu)和國(guó)家信息,從bioRxiv下載的原始字段沒(méi)有經(jīng)過(guò)結(jié)構(gòu)化處理,無(wú)法進(jìn)行本文研究所需的分析;而Dimensions平臺(tái)提供了bioRxiv論文作者的所屬機(jī)構(gòu)和國(guó)家的結(jié)構(gòu)化字段,從Dimensions下載的數(shù)據(jù)可以方便地進(jìn)行分析。
預(yù)印本服務(wù)器bioRxiv于2013年11月由冷泉港實(shí)驗(yàn)室(CSHL)及其出版社(CSHLP)推出,每年提交的論文數(shù)量穩(wěn)步增加[17],現(xiàn)已成為生物科學(xué)領(lǐng)域最大的預(yù)印本平臺(tái),因此在研究疫情相關(guān)問(wèn)題上其數(shù)據(jù)更具有代表性。從研究領(lǐng)域來(lái)看,bioRxiv最初主要包括進(jìn)化生物學(xué)、遺傳學(xué)和計(jì)算生物學(xué)等,現(xiàn)在更多的是神經(jīng)科學(xué)、細(xì)胞和發(fā)育生物學(xué)的內(nèi)容,其他領(lǐng)域的研究者也在bioRxiv上發(fā)布了大量文章[13]。
考慮到bioRxiv的學(xué)科領(lǐng)域和預(yù)印本的及時(shí)性特點(diǎn),以及Dimensions平臺(tái)上數(shù)據(jù)的完整性和可用性,本研究于2022年1月15日在Dimensions平臺(tái)收集了2013-2021年bioRxiv的文獻(xiàn)數(shù)據(jù),去除字段內(nèi)容不完整的數(shù)據(jù),得到了141,731份預(yù)印本作為研究數(shù)據(jù),對(duì)元數(shù)據(jù)進(jìn)行處理后,提取數(shù)據(jù)中的有用信息,包括預(yù)印本的數(shù)字對(duì)象標(biāo)識(shí)符(DOI)、發(fā)布到bioRxiv的日期、作者、所屬機(jī)構(gòu)和國(guó)家等。
從整體角度分析2013-2021年在bioRxiv平臺(tái)上發(fā)布文章的國(guó)家和機(jī)構(gòu)數(shù)量變化情況。國(guó)家和機(jī)構(gòu)數(shù)量及其論文量變化在一定程度上反映了bioRxiv擴(kuò)散程度以及未來(lái)發(fā)展趨勢(shì),也從整體上反映了科學(xué)界對(duì)bioRxiv的認(rèn)可程度。
對(duì)論文量進(jìn)行統(tǒng)計(jì),如圖1所示,bioRxiv從2013年推出以來(lái)論文量穩(wěn)步增長(zhǎng),其中,2016年開(kāi)始,論文量增長(zhǎng)速度明顯加快。在作者的國(guó)家和機(jī)構(gòu)歸屬方面,由于已有大量研究證實(shí)末位作者在研究中有著重要的貢獻(xiàn),尤其是在生物醫(yī)學(xué)領(lǐng)域[26,32]。因此,進(jìn)一步對(duì)每年以末位作者身份在bioRxiv上發(fā)文的國(guó)家和機(jī)構(gòu)數(shù)量及其論文量進(jìn)行統(tǒng)計(jì),bioRxiv上國(guó)家和機(jī)構(gòu)數(shù)量及其論文量在2013-2020年呈現(xiàn)明顯上升的趨勢(shì),但論文量、國(guó)家和機(jī)構(gòu)數(shù)量都在2021年有小幅下降。2019年以后雖然論文量和機(jī)構(gòu)數(shù)量持續(xù)增長(zhǎng),但是到2020年論文量和國(guó)家數(shù)量均有所下降,機(jī)構(gòu)數(shù)量增長(zhǎng)速度減緩。由此可見(jiàn),疫情之前,bioRxiv預(yù)印本的發(fā)文量呈現(xiàn)良好的增長(zhǎng)趨勢(shì),在疫情爆發(fā)后,發(fā)文國(guó)家數(shù)量的增長(zhǎng)趨勢(shì)減緩并在2021年出現(xiàn)回落,發(fā)文機(jī)構(gòu)數(shù)量的增長(zhǎng)趨勢(shì)也在2021年有所放緩。
圖1 2013-2021年bioRxiv 論文量和國(guó)家/機(jī)構(gòu)量及其論文量變化趨勢(shì)Fig.1 Changes in the Number of Countries/ Institutions and Their Papers on bioRxiv from 2013 to 2021
進(jìn)一步從國(guó)家經(jīng)濟(jì)發(fā)展水平角度分析bioRxiv在國(guó)家層面的擴(kuò)散趨勢(shì)。在國(guó)家經(jīng)濟(jì)發(fā)展水平劃分上,綜合世界銀行、國(guó)際貨幣基金組織、聯(lián)合國(guó)開(kāi)發(fā)計(jì)劃署和美國(guó)中央情報(bào)局發(fā)布的資料,將國(guó)家分為發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家,以分析其數(shù)量變化。發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家數(shù)量及其占比變化趨勢(shì)如圖2所示。從國(guó)家經(jīng)濟(jì)發(fā)展水平來(lái)看,2013-2018年發(fā)展中國(guó)家數(shù)量呈上升趨勢(shì),而發(fā)達(dá)國(guó)家相反。兩類(lèi)國(guó)家數(shù)量在2018-2020年基本穩(wěn)定,然而發(fā)展中國(guó)家數(shù)量在2021年小幅下降。
圖2 發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家數(shù)量及其占比變化趨勢(shì)Fig.2 Changes in the Number and Proportion of Developed and Developing Countries
為進(jìn)一步探究國(guó)家層面的演化規(guī)律,取各國(guó)家機(jī)構(gòu)數(shù)量排名、國(guó)家機(jī)構(gòu)數(shù)量的對(duì)數(shù)分別為橫縱坐標(biāo)繪制散點(diǎn)圖,如圖3所示,2013-2021年結(jié)果均呈冪律分布,且冪律分布的長(zhǎng)尾分布特征逐漸減弱,2013-2019年發(fā)展中國(guó)家數(shù)量逐漸增多,但2019年之后,發(fā)展中國(guó)家數(shù)量有所減少??偟膩?lái)說(shuō),bioRxiv預(yù)印本的發(fā)表模式呈現(xiàn)由發(fā)達(dá)國(guó)家向發(fā)展中國(guó)家擴(kuò)散的趨勢(shì),而疫情使得這一擴(kuò)散趨勢(shì)有所逆轉(zhuǎn)。
圖3 發(fā)文機(jī)構(gòu)的冪律分布圖Fig.3 Power Law Distribution of the Institutions Publishing on bioRxiv
bioRxiv發(fā)文機(jī)構(gòu)主要為大學(xué),也包括研究所和醫(yī)院等其他機(jī)構(gòu),為探究機(jī)構(gòu)層面是否存在由頂尖機(jī)構(gòu)向普通機(jī)構(gòu)擴(kuò)散的趨勢(shì),本研究只考慮大學(xué)的排名,使用2021軟科世界大學(xué)學(xué)術(shù)排名(Shanghai Ranking's Academic Ranking of World Universities,ARWU)和U.S.News在生物學(xué)和生物化學(xué)領(lǐng)域的排名作為大學(xué)科研水平的評(píng)價(jià)標(biāo)準(zhǔn),兩個(gè)排名均是世界范圍內(nèi)公認(rèn)的較為權(quán)威的世界大學(xué)排名。對(duì)每年發(fā)文量排名前50的機(jī)構(gòu)的發(fā)文量及其大學(xué)的最新軟科排名進(jìn)行統(tǒng)計(jì),結(jié)果如表1所示。為了解發(fā)文量Top50機(jī)構(gòu)中高??蒲兴脚琶植?,考慮到論文發(fā)布量還計(jì)算了加權(quán)平均排名,結(jié)果如圖4所示,加權(quán)平均值計(jì)算公式見(jiàn)公式1。
公式1中,為加權(quán)平均排名,xn為第n個(gè)高校軟科排名,wn為第n個(gè)高校在bioRxiv上發(fā)表論文量。
由表1中可以看到,哈佛大學(xué)、斯坦福大學(xué)、牛津大學(xué)等一些頂尖大學(xué)發(fā)文量始終位居前列,2015-2019年有許多軟科排名靠后的大學(xué)進(jìn)入發(fā)文量前五十,而2019年之后,發(fā)文量前五十的機(jī)構(gòu)大部分軟科排名靠前。除中國(guó)科學(xué)院大學(xué)在2020和2021年分列26和31位之外,中國(guó)機(jī)構(gòu)很少進(jìn)入發(fā)文量前50。
表1 Top50機(jī)構(gòu)的發(fā)文量Table 1 Number of Documents Published by the Top50 Institutions
如圖4所示,無(wú)論從軟科排名還是U.S.News生物學(xué)排名來(lái)看,高校科研水平排名和加權(quán)平均排名的變化趨勢(shì)基本一致,即2013年和2014年平均排名較高,2015-2019年平均排名呈上升趨勢(shì),2019年之后,平均排名有所下降??偟膩?lái)說(shuō),bioRxiv預(yù)印本發(fā)表模式存在向普通機(jī)構(gòu)擴(kuò)散的趨勢(shì),但疫情的爆發(fā)對(duì)該擴(kuò)散趨勢(shì)有負(fù)向影響。
圖4 發(fā)文量Top50機(jī)構(gòu)中高??蒲兴脚琶植紙DFig.4 Ranking Distribution of Research Level of Colleges and Universities Among the Top 50 Institutions
從整體上對(duì)bioRxiv平臺(tái)上發(fā)布文章的國(guó)家和機(jī)構(gòu)數(shù)量變化趨勢(shì),以及從國(guó)家和機(jī)構(gòu)層面對(duì)bioRxiv擴(kuò)散趨勢(shì)的分析,可知疫情給bioRxiv的擴(kuò)散趨勢(shì)造成了負(fù)面影響。為進(jìn)一步驗(yàn)證結(jié)論,對(duì)每一年消失的國(guó)家和機(jī)構(gòu)(即前一年在bioRxiv上有論文發(fā)布,但該年沒(méi)有)進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表2和表3所示。
表2 疫情前后退出bioRxiv 的國(guó)家對(duì)比Table 2 Comparison of Countries Withdrawing from bioRxiv Before and After the Epidemic
表3 疫情前后退出bioRxiv 的機(jī)構(gòu)對(duì)比Table 3 Comparison of Institutions Withdrawing from bioRxiv Before and After the Epidemic
2013-2019年即疫情前消失的國(guó)家有24個(gè),主要是亞洲、非洲的發(fā)展中國(guó)家,另外還有歐洲的三個(gè)發(fā)達(dá)國(guó)家,分別是盧森堡、斯洛伐克和馬耳他;2019-2021年即疫情期間,消失的國(guó)家有29個(gè)且全部是發(fā)展中國(guó)家,主要分布在北美洲、亞洲和非洲。
對(duì)比疫情前后退出的機(jī)構(gòu)發(fā)現(xiàn),疫情后消失的機(jī)構(gòu)數(shù)量較多,但相比于疫情前,疫情后消失的機(jī)構(gòu)大多數(shù)是科研水平排名靠后的機(jī)構(gòu)。新冠疫情嚴(yán)重影響了國(guó)家和機(jī)構(gòu)的科研活動(dòng),其中對(duì)發(fā)展中國(guó)家和普通機(jī)構(gòu)的影響更大。
預(yù)印本的出現(xiàn)加速了科學(xué)傳播,促進(jìn)了學(xué)術(shù)交流體系的發(fā)展。本文以2013-2021年bioRxiv的預(yù)印本為樣本,采用文獻(xiàn)計(jì)量方法,從時(shí)間演化、國(guó)家經(jīng)濟(jì)發(fā)展水平以及機(jī)構(gòu)科研水平多角度對(duì)bioRxiv在國(guó)家和機(jī)構(gòu)層面的擴(kuò)散趨勢(shì)進(jìn)行探索,并探究新冠疫情對(duì)bioRxiv擴(kuò)散趨勢(shì)的影響。
整體上,越來(lái)越多的國(guó)家和機(jī)構(gòu)的科研人員將研究成果發(fā)布到bioRxiv上,說(shuō)明該平臺(tái)作為生物學(xué)界最大的預(yù)印本平臺(tái)在全球范圍內(nèi)逐漸得到認(rèn)可和關(guān)注。從國(guó)家經(jīng)濟(jì)發(fā)展水平來(lái)看,越來(lái)越多的發(fā)展中國(guó)家在bioRxiv上發(fā)布文章,從參與國(guó)家數(shù)量角度進(jìn)行分析可知,bioRxiv由發(fā)達(dá)國(guó)家向發(fā)展中國(guó)家流行,觀察疫情前后國(guó)家數(shù)量變化,發(fā)現(xiàn)疫情使得少數(shù)發(fā)展中國(guó)家在bioRxiv上的科學(xué)活動(dòng)受到影響,冪律分布圖也證實(shí)了該擴(kuò)散趨勢(shì)的存在。從機(jī)構(gòu)層面來(lái)看,考慮到2013年數(shù)據(jù)僅包括11月和12月的預(yù)印本,論文量較少,且2013-2014年bioRxiv處于發(fā)展初期,尚未在全球范圍內(nèi)得到廣泛使用,因此2013-2014年大學(xué)平均排名較高。2015-2019年bioRxiv發(fā)展迅速,越來(lái)越多的普通大學(xué)發(fā)文量進(jìn)入發(fā)文量前五十,然而,2019年后頂尖大學(xué)更多占據(jù)前列。因此,可以得出結(jié)論:bioRxiv有從頂尖機(jī)構(gòu)向普通機(jī)構(gòu)擴(kuò)散的趨勢(shì),但疫情對(duì)普通機(jī)構(gòu)的影響更大,對(duì)該擴(kuò)散有負(fù)面影響。
新冠疫情對(duì)bioRxiv的擴(kuò)散趨勢(shì)有負(fù)面影響,整體上雖然bioRxiv論文量在疫情前期持續(xù)增長(zhǎng),但在后疫情時(shí)代有所下降。分析國(guó)家和機(jī)構(gòu)的擴(kuò)散趨勢(shì)后發(fā)現(xiàn),疫情對(duì)bioRxiv在國(guó)家和機(jī)構(gòu)視角的擴(kuò)散均存在不同程度的負(fù)向影響。從每年消失的國(guó)家和機(jī)構(gòu)的分析中可以發(fā)現(xiàn),相較于發(fā)達(dá)國(guó)家和頂尖機(jī)構(gòu),疫情對(duì)發(fā)展中國(guó)家和普通機(jī)構(gòu)的科學(xué)工作影響更大,發(fā)展中國(guó)家和普通機(jī)構(gòu)的科學(xué)活動(dòng)較大程度上受到疫情影響。從中國(guó)在bioRxiv的發(fā)文情況來(lái)看,中國(guó)的科研產(chǎn)出能力逐漸增強(qiáng)并僅次于美國(guó),但在機(jī)構(gòu)層面上,單個(gè)機(jī)構(gòu)競(jìng)爭(zhēng)力并不強(qiáng)。
值得注意的是,本文中各種指標(biāo)的增長(zhǎng)趨勢(shì)在2020年后有所減緩,甚至發(fā)生逆轉(zhuǎn),對(duì)于這一現(xiàn)象有必要作出解釋。疫情對(duì)科學(xué)界產(chǎn)生了巨大的影響。雖然疫情的挑戰(zhàn)刺激了科學(xué)研究數(shù)量和速度的大幅提高,但與此同時(shí)社會(huì)隔離和封鎖導(dǎo)致了大量科學(xué)研究的中斷。首先,在預(yù)印本數(shù)量急劇增長(zhǎng)幾個(gè)月后,研究人員很難以疫情初期同樣的速度持續(xù)進(jìn)行科學(xué)研究;其次,研究人員有可能把研究重心從新型冠狀病毒轉(zhuǎn)移到新的或者以前的研究方向,尤其是與公共衛(wèi)生和生物學(xué)無(wú)關(guān)的一些研究人員。此外,對(duì)預(yù)印本科學(xué)可信度的質(zhì)疑導(dǎo)致預(yù)印本篩查審核過(guò)程更加嚴(yán)格,這也會(huì)影響預(yù)印本的提交數(shù)量[25]。
以預(yù)印本為媒介的學(xué)術(shù)交流模式迅速發(fā)展,正在改變傳統(tǒng)以期刊為主的學(xué)術(shù)交流模式,很大程度上推動(dòng)了開(kāi)放科學(xué)的發(fā)展,因此對(duì)預(yù)印本的擴(kuò)散趨勢(shì)進(jìn)行探索是十分有必要的。相比以往的研究,本研究探究了bioRxiv在國(guó)家和機(jī)構(gòu)層面的擴(kuò)散趨勢(shì),多層次分析了預(yù)印本的擴(kuò)散趨勢(shì),同時(shí)從時(shí)間、國(guó)家經(jīng)濟(jì)和機(jī)構(gòu)科研發(fā)展水平多角度反映了bioRxiv的演化趨勢(shì),為預(yù)印本的研究提供了新視角。本研究有助于了解bioRxiv的整體格局及發(fā)展趨勢(shì),了解各國(guó)家和機(jī)構(gòu)在以bioRxiv為載體的學(xué)術(shù)交流體系中的地位和競(jìng)爭(zhēng)力,為預(yù)印本平臺(tái)建設(shè)和學(xué)術(shù)交流體系研究提供基礎(chǔ)。
結(jié)合以上分析和結(jié)論,本文提出以下建議。首先,對(duì)于預(yù)印本平臺(tái)來(lái)說(shuō),加強(qiáng)預(yù)印本在發(fā)展中國(guó)家和普通科研機(jī)構(gòu)的宣傳推廣,擴(kuò)大預(yù)印本的使用受眾范圍。其次,對(duì)于所有國(guó)家和機(jī)構(gòu)來(lái)說(shuō),在后疫情時(shí)代,應(yīng)積極采取措施促進(jìn)科研工作者的科學(xué)活動(dòng)的恢復(fù),盡量減輕或者消除疫情對(duì)科學(xué)活動(dòng)的影響。再次,對(duì)于發(fā)展中國(guó)家和普通科研機(jī)構(gòu)的科研工作者來(lái)說(shuō),應(yīng)積極利用預(yù)印本平臺(tái),如關(guān)注預(yù)印本論文、利用預(yù)印本平臺(tái)發(fā)布論文等,以預(yù)印本為途徑提升在學(xué)術(shù)交流體系中的地位。最后,對(duì)于中國(guó)來(lái)說(shuō),目前我國(guó)已經(jīng)開(kāi)始建設(shè)自己的預(yù)印本平臺(tái)ChinaXiv,建設(shè)過(guò)程中如何吸取國(guó)際上成熟的預(yù)印本平臺(tái)如arXiv、bioRxiv、SSRN等的經(jīng)驗(yàn),尤其是現(xiàn)階段完善ChinaXiv平臺(tái)的基礎(chǔ)架構(gòu)、加大平臺(tái)的宣傳、提升平臺(tái)在國(guó)內(nèi)和國(guó)際上的影響力等是當(dāng)務(wù)之急。
本研究也存在一定局限。首先,研究數(shù)據(jù)集僅限于bioRxiv預(yù)印本;其次,本文從時(shí)間演化、國(guó)家經(jīng)濟(jì)發(fā)展水平和機(jī)構(gòu)科研水平這幾個(gè)角度分析bioRxiv在國(guó)家和機(jī)構(gòu)層面的演化趨勢(shì),地理空間等方面的演化規(guī)律沒(méi)有涉及。在之后的研究中,將從更加多源的數(shù)據(jù)集和更多角度對(duì)預(yù)印本的擴(kuò)散趨勢(shì)進(jìn)行探究。
作者貢獻(xiàn)說(shuō)明
謝維熙:設(shè)計(jì)研究方案,數(shù)據(jù)收集、處理和分析,論文寫(xiě)作;
張光耀:論文寫(xiě)作與修改;
鄭軒:數(shù)據(jù)收集,論文修改;
王賢文:提出研究思路,設(shè)計(jì)研究方案,數(shù)據(jù)收集,論文修改。
支撐數(shù)據(jù)
支撐數(shù)據(jù)可開(kāi)放獲取,獲取地址為:https://doi.org/10.6084/m9.figshare.20224638.v1。
1、王賢文,謝維熙.bioRxiv 歷年發(fā)文國(guó)家數(shù)量統(tǒng)計(jì).xlsx.國(guó)家統(tǒng)計(jì).
2、王賢文,謝維熙.bioRxiv 歷年發(fā)文機(jī)構(gòu)數(shù)量統(tǒng)計(jì).xlsx.機(jī)構(gòu)統(tǒng)計(jì).