趙 旸 張智雄*
1)中國科學院文獻情報中心,北京市海淀區(qū)中關村北四環(huán)西路33號 100190
2)中國科學院大學經濟與管理學院圖書情報與檔案管理系,北京市海淀區(qū)中關村北四環(huán)西路33號 100190
預印本平臺是指為科研人員提供預印本出版?zhèn)鞑デ啦⒋龠M論文交流的學術平臺。自1991年保羅·金斯帕(Paul Ginsparg)在美國洛斯阿拉莫斯(Los Alamos)國家實驗室建立第一個預印本平臺arXiv以來,預印本平臺主要圍繞論文的提交、發(fā)布、檢索、瀏覽等功能展開服務,并不斷改進與更新稿件內容篩選、稿件評議、稿件版本管理等功能機制,旨在提升處理效率,加速論文的發(fā)布與交流。
近年來,隨著開放獲取、開放科學的興起,基于預印本的學術交流在科研學術交流中的作用得到了科學界的高度關注。很多預印本平臺除了提供傳統的稿件提交、存儲、發(fā)布功能之外,也在不斷進行功能創(chuàng)新,提出了一些富有創(chuàng)意與新意的預印本平臺功能,例如arXiv與第三方機構合作,創(chuàng)建開放創(chuàng)新社區(qū),將第三方工具嵌入arXiv平臺的文章記錄界面,進而從不同方面展示該篇文章的相關內容,以提升稿件影響力[1]。秉持著加速研究成果傳播的核心理念,多個預印本平臺(如Research Square)為在預印本學術交流建設中發(fā)揮更大的作用,與國際學術出版界就預印本與傳統期刊的銜接與過渡,合作開展了形式多樣、各具特色的探索性實踐[2]。這一舉措沖擊了傳統的學術交流模式,也為出版行業(yè)的發(fā)展與改革提供了示范。預印本平臺的創(chuàng)新功能可以更好地服務于科研、學科與社會團體,促進了科研工作者之間的學術交流。
目前鮮有研究對預印本平臺新興功能的發(fā)展趨勢進行系統梳理,基于此,本文梳理了國際預印本學術交流平臺不斷涌現的創(chuàng)新功能,與這些平臺的常規(guī)功能形成對比。國際預印本平臺的5個創(chuàng)新方向值得我國平臺借鑒,包括與第三方機構合作構建開放創(chuàng)新社區(qū)、推出支撐科學討論和評閱的評論面板、幫助作者提升論文水平、推動論文開放評審,以及構建支撐科研評估的評估體系。
本文主要對5個功能創(chuàng)新方向進行研究分析,重點闡述它們的新穎之處。希望本文能夠為我國預印本平臺的未來發(fā)展提供參考借鑒,同時也為科技期刊的發(fā)展轉型、出版機制的改善與出版服務創(chuàng)新提供啟示。
綜合考慮平臺規(guī)模、運營組織、影響力、收錄學科等方面,選取5個具有行業(yè)代表性的平臺——arXiv、bioRxiv、Research Square、F1000 Research和SSRN(Social Science Research Network)進行研究。其中,arXiv是國際上第一個預印本平臺,也是當前國際上最重要的預印本平臺。2001年開始,arXiv由康奈爾大學運營。arXiv提供物理學、數學、計算機科學等8個領域的預印本論文存繳、檢索、發(fā)布和交流共享服務。bioRxiv是美國冷泉港實驗室于2013年11月推出的生命科學領域的預印本平臺。bioRxiv在生物學界的大力推動下得到了快速發(fā)展:2017年,以bioRxiv的發(fā)展為標志的“生物學預印本交流興起”入選Science的“年度十大科學突破”[3]。F1000 Research是Taylor & Francis收購的生命和生物醫(yī)學研究預印本平臺;同時,它是一個創(chuàng)新的開放獲取出版平臺,能夠提供快速出版和開放同行評議服務,支持數據存儲和共享。Research Square是Springer Nature投資的多學科預印本平臺,SSRN是Elsevier收購的多學科預印本平臺。
筆者分別訪問這5個平臺的官方網站, 重點關注預印本論文介紹界面。通過對比分析這些平臺的常規(guī)功能(如在線提交/投稿、閱讀瀏覽、檢索、下載[4]),梳理每個平臺的創(chuàng)新功能,以及平臺間共有的創(chuàng)新發(fā)展趨勢。
為擴大預印本的傳播和應用范圍,預印本平臺邀請學術社區(qū)共同開發(fā)可以使科學界受益的工具,以期為平臺發(fā)展與預印本學術交流作出貢獻。例如,arXiv積極融入學術社區(qū),面向個人與組織開放創(chuàng)新合作,于2020年9月推出了一個新的、正式的程序框架——arXivLabs[1]。該框架支持合作者將其開發(fā)的新功能分享到arXiv平臺,并支持合作者將這些新功能嵌入arXiv文章記錄頁面,以幫助用戶發(fā)現更多與文章相關的知識內容,并且該框架會隨著新功能的推出而不斷更新。arXiv已經通過arXivLabs集成了一些創(chuàng)新功能,包括論文引用功能、相關論文發(fā)現功能與數據代碼鏈接功能。
目前論文引用功能集成了3個工具——Bibliographic Explorer、Litmaps和Scite(Smart Citation),它們分別以不同的形式展現了與論文相關的引文信息。Bibliographic Explorer以用戶友好的論文引用導航樹的形式來呈現arXiv 論文的施引文獻和被引文獻,這些信息由Semantic Scholar、Prophy數據庫提供,用戶可按照論文發(fā)表年份、第一作者、題目、影響力4個字段對相關論文進行排序和篩選,具體的界面如圖1所示。Litmaps將arXiv論文的參考文獻之間的關系進行可視化處理,并且用戶可以利用其重點關注某一篇參考文獻的引用關系和引文網絡[5],具體的界面如圖2所示。Scite是一個智能引文平臺[6],它記錄了每篇論文的引用情況。Scite不僅顯示論文的被引頻次,還提供該篇論文在施引文獻中的具體引用內容,并對引用內容進行智能分類,以揭示施引文獻的引用態(tài)度(包括支持、提及和對比)。讀者可以通過相應的Scite報告查看每篇預印本是如何被討論或引用的,還可以查找共引文獻、按引用態(tài)度篩選施引文獻等[7]。
圖1 Bibliographic Explorer中的論文引文信息
圖2 Litmaps中的論文參考文獻可視化分析
相關論文發(fā)現功能可為讀者推薦相關論文,提供閱讀參考;該項功能目前集成了CORE Recommender和Connected Papers 2個工具。CORE Recommender[8]將arXiv等1萬余個開放獲取數據提供者的開放論文資源聚合在一起,可在全球研究存儲庫網絡中篩選與預印本相關的開放獲取論文。Connected Papers[9]可幫助研究人員查找和探索與其工作領域相關的論文。具體而言,Connected Papers的數據庫與Semantic Scholar連接。根據用戶需求,Connected Papers首先在Semantic Scholar中獲取50000篇與預印本相關的論文進行分析,隨后篩選出幾十篇與預印本聯系最緊密的論文。Connected Papers還將相關論文可視化,用戶可更便捷地關注高被引論文。
數據代碼鏈接功能由Papers With Code提供支持,用以推進研究進程。Papers With Code[10]為arXiv上發(fā)布的機器學習領域相關論文提供了一種關聯相關代碼的簡單便捷的方式。除論文中可能提到的官方代碼之外,Papers With Code還將其他人員發(fā)布的與論文相關的社區(qū)代碼關聯起來,使研究人員能夠快速、便捷地使用和借鑒他人的工作。同時,數據代碼鏈接功能提供了論文數據集的鏈接,并顯示其他使用這一數據集的論文,為研究人員提供參考。此外,為使論文數據的可用度更高,arXiv將集成的170萬篇預印本托管到Kaggle數據平臺上供用戶免費使用[11],且每周進行一次更新。Kaggle數據平臺提供論文的標題、作者、類別、摘要、版本信息等元數據字段,用戶可通過調用API(Application Programming Interface)接口批量訪問全文信息。這一arXiv數據集為CORE Recommender等工具以及自然語言處理等技術的發(fā)展提供了豐富的語料資源。
預印本發(fā)布后,良好的學術交流與反饋可以促使作者進一步完善研究內容,為此,許多預印本平臺在預印本界面開發(fā)了評論板塊,以收集來自多方學術團體和社區(qū)的評論意見并公開展示。例如,bioRxiv開發(fā)了能夠便捷訪問多方評論的評論集成面板(Dashboard)[12],倡導讀者對預印本進行評論和討論,并支持讀者以不同的方式向作者提供反饋。評論集成面板可集成讀者評論、同行評議、社區(qū)討論,以及社交媒體和傳統媒體中提及預印本的評論內容,并可鏈接到評論源處,進一步提高了預印本的可發(fā)現性,也使讀者更容易找到和訪問評論信息(圖3)。用戶可通過bioRxiv文章摘要界面上方的啟動欄(Launch Bar)打開評論集成面板,啟動欄中不同的圖標代表不同的預印本討論或評論來源,且顯示評價或互動的數量;點擊其中一個圖標就會打開一個顯示該部分條目詳細信息的評論面板。評論集成面板中提供的信息來自Hypothesis、Disqus、Altmetric、Sciety等第三方平臺和各種社區(qū)。
圖3 bioRxiv評論集成面板
評論集成面板中的“Comments”展示讀者對bioRxiv預印本的評論。讀者可以在 bioRxiv 網站進行評論,也可以通過評論服務平臺Disqus 提交自己的評論。評論主要討論文章的科學內容,包括預印本的研究方法、結果、數據和/或具體問題;評論必須以英文發(fā)布,并且只能提交一次。任何具有冒犯性,與預印本內容不相關或質疑作者的性格、能力或動機的評論都會被屏蔽。所有評論都要經過審核,以確保它們符合bioRxiv的評論政策。審核通常在24~48小時范圍內完成。
評論集成面板中的“TRiP Peer Reviews”顯示的是參與“預印本透明審查”(Transparent Review in Preprints,TRiP)試點的期刊和其他同行評議服務機構提交的評論。TRiP是bioRxiv與其他組織用以促進學術出版生態(tài)系統發(fā)展的一個新試點項目[13]。該項目由網絡評論工具 Hypothesis提供支持,鼓勵參與機構在 bioRxiv上發(fā)布評審意見。作者在向eLife、Review Commons、Peerage of Science等參與機構投稿時,可以選擇加入TriP,這使得期刊和同行評議服務機構能夠在提交預印本的同時公布評審意見。
評論集成面板中的“Community Reviews”展示的是社群對預印本的評論,這些評論內容并未經過bioRxiv平臺或預印本作者的審查。bioRxiv也正在開發(fā)用于篩選和評估預印本的自動化方法,此功能將在“Automated Evaluations”中發(fā)布。為了讓讀者了解社交媒體和傳統媒體對預印本的看法,bioRxiv 還在評論集成面板中加入了“Blog/Media”欄目,欄目中包括博客、報紙和其他媒體對預印本的評論。評論集成面板中的另外2個鏈接可跳轉至預印本的相關視頻(Videos)及其在Twitter上的討論頁面。
除了bioRxiv之外,其他預印本平臺(如Research Square、SSRN、F1000 Research)也都開發(fā)了相應的評論板塊供平臺用戶進行學術討論。同時,用戶亦可通過Hypothesis、Disqus等第三方工具對預印本進行評論與討論。
為幫助預印本在擬投期刊上發(fā)表,預印本平臺提供了一系列新的知識服務,以期最大限度幫助作者提升論文水平。Research Square通過提供作者服務功能,幫助作者進一步完善預印本、提升論文質量,并對預印本進行宣傳推廣,以提升預印本的影響力。作者服務功能包括編輯服務、推廣服務和認證服務3種形式。
編輯服務專注于論文內容質量的提升,具體包括4種服務方式[14]。(1)英語編輯(English Editing):相關領域專家對論文語言進行編輯,仔細糾正拼寫、語法、措辭和標點符號中的錯誤;在保持作者原意、原文結構和邏輯的基礎上,對論文進行優(yōu)化。(2)數字編輯[15](Digital Editing):利用智能技術對論文進行自動編輯。該工具可以在不影響論文內容的前提下改善論文的寫作風格,以修訂模式糾正論文的語法、措辭和參考文獻中的錯誤,以便作者對修改建議進行判斷。同時,該工具還可自動評估論文的寫作質量,并給出語言質量分數。(3)稿件編排(Manuscript Formatting):根據擬投期刊要求編排稿件格式,包括頁面布局、文本格式、參考文獻格式等;檢查參考文獻的準確性,并對標題、摘要、正文和圖例提出修改意見。(4)圖表服務(Figure & Table Services):生成符合擬投期刊規(guī)范的圖例和表格,修改圖例的文件格式、分辨率、色彩、字體、比例、線寬和布局,以提高圖片可讀性和可觀性;改進表格的布局、字體等,以準確、有效地傳達信息。
推廣服務可促使研究論文產生一定的影響力,清晰而準確地傳播研究工作,具體包括3種服務類型[16]。(1)視頻服務(Video Services):為論文制作準確的介紹視頻。視頻可以是標有關鍵詞、簡短標題、簡要描述的時長1分鐘的視頻字節(jié)(Video Byte),用以概述研究及其影響;也可以是2~3分鐘的視頻摘要(Video Abstract),用以向有一定專業(yè)基礎的觀眾解釋研究方法、研究發(fā)現,以及該研究對所屬領域的貢獻;還可以是包括GIF 動畫、宣傳片等在內的自定義視頻(Custom Video)。(2)總結服務(Summary Services):以新聞風格展現研究工作要點,幫助作者向廣大讀者傳達研究成果。該服務包括由專業(yè)團隊提供的研究推廣(Research Promotion)服務,以及形成簡要書面總結的研究亮點(Research Highlight)服務。(3)信息圖表服務(Infographic Services):通過圖表凸顯最重要的研究點,來展示作者的研究,包括以簡潔、醒目且易于理解的方式描述研究的自定義信息圖表(Custom Inforgraphic),以及包括研究背景、方法和主要發(fā)現在內的視覺摘要(Visual Abstract)。
認證服務為發(fā)布在Research Square上的預印本提供徽章認證,以保障文章質量:獲得徽章認證表明預印本符合科學報告的既定標準[17]?;照抡J證具體包括2種類型。(1)方法報告徽章(Methods Reporting Badge):檢查論文的具體細節(jié)、研究設計,以及數據收集和分析、數據軟件/代碼的合理性,確保研究方法的公開透明與可重復;(2)數據報告徽章(Data Reporting Badge):評估統計分析信息與實驗結果數據的嚴謹性。
為使預印本快速正式發(fā)表,預印本平臺積極探索新型出版模式:通過與國際學術出版商開展不同模式的合作,連接投稿系統和預印本平臺,推進稿件評審進程。Research Square、SSRN等預印本平臺紛紛推出期刊預印本專區(qū)[2],提倡投稿至期刊的稿件率先發(fā)布在預印本平臺上。同時,預印本平臺可根據期刊要求,不同程度地公開同行評審意見與審稿過程。此外,預印本平臺打通期刊間的稿件轉投通道,以更加開放透明的方式加速預印本的交流與傳播。
F1000 Research充分結合預印本資源和期刊資源,采用公開透明的同行評議模式,并借助作者驅動模式進行論文評審與出版[18],進而推動論文的開放同行評議。在F1000 Research中,論文發(fā)布后首先被標記為 “Awaiting Peer Review”(等待同行評議)的狀態(tài);該狀態(tài)附在標題旁,并在文章HTML界面和PDF文件中的開放同行評議摘要框中顯示。F1000 Research要求論文作者推薦至少5名其領域內的專家作為審稿人,并要求審稿人在平臺上發(fā)布至少2份同行評議報告。確定審稿人后,審稿人會收到針對不同文章類型的評閱指南,用以評估研究是否科學合理,具體包括以下4個方面:是否在現有文獻資料的基礎上對研究工作進行了適當的討論;是否采用了適當的方法;是否提供了足夠的信息和源數據以保證研究的可重復性;是否得出能夠支撐結論的研究結果。對于某些類型的文章,例如案例報告或綜述文章,審稿人被要求對文章所使用的事實和方法進行評論,而不一定要表述他們是否同意作者的觀點。
除了評審意見外,審稿人還需對論文給出明確答復,具體包括以下3種審批狀態(tài)[19]。(1)通過評審(Approved):審稿人認為論文不需要修改或只需要作少量修改;(2)有保留地通過評審(Approved with Reservations):審稿人認為論文有學術價值,但要求對論文進行一些小的修改,或進行具體的、一些關鍵部分的修訂工作;(3)不通過評審(Not Approved):審稿人認為論文的質量很差,并且存在嚴重破壞研究結果和結論的根本性缺陷。論文經過評審后,審稿人的相關信息、評審結果以及具體評審意見將隨論文一同展示出來。如果作者決定修改論文以回應審稿人的意見,所有審稿人將被邀請為修改后的論文提供補充報告。如果審稿人最初給出的是 “Approved with Reservations”或 “Not Approved”,F1000 Research將鼓勵他們進行重新審查。
F1000 Research支持修改和多次提交,文章的同行評議結果會隨著文章內容的修改而不斷更新,并且無論同行評議結果如何,F1000 Research都會完整地發(fā)表該結果。一旦一篇文章收到2個“Approved”或2個“Approved with Reservations”和1個“Approved”,它將被PubMed和其他數據庫收錄。文章的所有版本以及任何相關的數據集和評審報告都被存儲在PubMed Central中。如果作者在一段時間之內無法邀請到審稿人,則文章可能會被標記為“Peer Review Discontinued”(同行評議停止)。
為了進一步提升預印本的影響力,預印本平臺引入了各種類型的指標體系,從不同角度對論文進行評估評價。例如,SSRN結合相關指標統計平臺論文、作者和組織的相關數據形成評估體系,從多個方面對預印本進行價值評判,以支撐科研評估。SSRN從3個方面衡量一篇論文的影響力:論文統計數據、排名情況和 PlumX 指標(PlumX Metrics)[20]。論文統計數據可以在每篇論文的摘要頁面中查看,包括文章瀏覽量、下載量和其他論文級統計指標(如被引頻次等)。排名情況則是SSRN根據一些相關的衡量標準,對平臺中的論文、作者和組織的排序。其中,論文排名主要是論文下載量的排名,包括歷年下載量最多的10篇論文(歷年Top 10論文),以及在過去60天內SSRN電子期刊發(fā)布的各類論文中下載量排名前10的論文(近期Top 10論文)。參與作者排名的作者必須在SSRN上發(fā)表過公開的學術性論文全文,參與排名的組織必須滿足SSRN的特定標準。PlumX指標主要評估網絡環(huán)境中各項研究成果(文章、會議記錄、書籍等)的傳播效果,其為各類學術研究成果制定了合適的研究指標,包括被引頻次(Citations)、使用情況(Usage)、捕捉量(Captures)、提及量(Mentions)和社交媒體(Social Media)互動量[21]。
除SSRN提供的影響力指標外,其他預印本平臺也在論文界面提供了各自制定的計量指標。bioRxiv的Metrics界面記錄了該篇論文的使用情況,并可顯示其當月或近6個月內的瀏覽量、下載量和Altmetric指標;Research Square的Engagement功能展示了論文在平臺上的瀏覽量與下載量,以及Altmetric、Dimensions指標;F1000 Research中的Metrics數據記錄了論文在平臺上的瀏覽量與下載量,以及其在PubMed Central中的瀏覽量與下載量(每個月更新一次)。同時,F1000 Research的Metrics數據記錄了論文在Scopus數據庫以及PubMed數據庫中的被引頻次,以及論文的Altmetric、Dimensions指標。
基于當前不斷進行功能創(chuàng)新的預印本平臺,本文歸納了以下幾種功能創(chuàng)新方向。
(1) 融入社區(qū),進行開放創(chuàng)新協作。通過與外部機構關聯、合作,提升預印本在整個學術交流生態(tài)中的影響力,促進學術成果的早期傳播與交流,并為相關領域的科研人員提供研究思路。
(2) 引入各類科學討論與評論渠道支撐論文的開放評審,有效推動預印本學術交流與預印本的正式發(fā)表。
(3) 通過預印本平臺增值服務幫助作者進一步完善論文內容,打造高質量論文,推進論文發(fā)表進程。
(4) 有效結合傳統引文計量指標,提供多維度的評估指標,以提升預印本的影響力。更多元的內容指標數據有助于讀者理解研究論文對科學和社會的潛在影響,可幫助讀者快速發(fā)現高質量論文。多元化的指標也可幫助作者評估個人成果的影響力。
(5) 圍繞論文內容展開的數據、資料等學術成果的多樣化發(fā)布途徑逐步被打通。除了研究論文外,預印本平臺也為其他形式的研究成果提供發(fā)布渠道,如:F1000 Research發(fā)布學術海報、幻燈片和文檔,主要涵蓋生命科學和醫(yī)學領域;Research Square可發(fā)布視頻內容與實驗室手冊[22],具體包括實驗過程、計算模型、設備操作方法等,為文章提供客觀的、具有說服力的實驗證據。SSRN通過集成Mendeley Data,允許研究人員在提交論文時或論文提交后上傳研究數據[23],并在文章頁面中顯示。
國際預印本平臺的各種特色功能對我國預印本平臺的未來發(fā)展具有很強的啟示作用,需要引起各界的廣泛關注。我國的預印本平臺亦可借鑒上述平臺功能創(chuàng)新的成功案例,具體舉措包括:與科研團體與學術社區(qū)開展有效的合作,如開發(fā)預印本評論板塊、邀請專家公開提出評審意見、鏈接到社交媒體平臺(微博、知乎、豆瓣等)等;引入各類統計指標評估預印本在各平臺中的影響力,從而進一步擴大預印本的影響范圍;與第三方合作,開展稿件編輯、潤色與推廣等服務,切實滿足作者需求。良好的服務功能將帶給用戶更好的體驗感,并可進一步提升預印本及平臺本身的影響力;在吸引更多潛在用戶的同時,使更加廣泛的群體受益。
經過對五大預印本平臺功能創(chuàng)新方向的梳理可以發(fā)現,平臺的功能創(chuàng)新強化了預印本在學術交流中的主導作用,使預印本平臺能夠更好地融入學術環(huán)境。本文選取相應的預印本平臺,對每個創(chuàng)新功能進行了分析;總結當前功能創(chuàng)新的發(fā)展方向,對我國預印本平臺的功能開發(fā)提出初步建議。國外預印本平臺的功能創(chuàng)新對我國學術出版的各個環(huán)節(jié)具有良好的啟示作用,可為日后學術期刊引入預印本模式,推動出版流程改革,以及提供增資服務提供參考和借鑒。