王樹義 張慶薇 張晉
隨著網(wǎng)絡(luò)和信息技術(shù)的不斷發(fā)展,科研工具在科研活動(dòng)中發(fā)揮著至關(guān)重要的作用[1-2]??蒲泄ぞ叩恼_應(yīng)用,有助于提高科研進(jìn)程的效率和質(zhì)量[3]。然而,因?yàn)榭蒲泄ぷ鞯膹?fù)雜性,沒有任何一款工具可以做到包攬全部研究工作(all-in-one)。因而,科研工作流(scientific workflow)的構(gòu)建受到了學(xué)術(shù)界的重視[4]。其中,軟件應(yīng)用的協(xié)同能力也同樣值得關(guān)注[5]。軟件應(yīng)用輔助組成系統(tǒng)化科研工作流,有助于科研項(xiàng)目的有序管理和科研工作整體協(xié)作能力的提高[6]。這里的觀察角度,是考察“工具”是否可以和其他“工具”有效配合,從而使得信息能夠在不同工具之間有效流轉(zhuǎn)。目前已經(jīng)有學(xué)者針對(duì)科研工作效率的提升展開了對(duì)科研工作流構(gòu)建的相關(guān)研究,但對(duì)每個(gè)階段具體軟件應(yīng)用協(xié)同能力的評(píng)價(jià)研究較為缺乏。
在具體的科研工具選取中,要考慮工具是否支持“人與人”的協(xié)作配合。支持協(xié)作的工具可以讓科研工作者相互之間的配合變得更為簡(jiǎn)單高效,降低合作的摩擦成本[7]。本研究最初是想基于協(xié)同視角,按照“人與人”協(xié)同、“工具與工具”協(xié)同的維度,選擇合適的工具構(gòu)成工作流,從而為科研工作者提供更好的支持工具系統(tǒng),以提升科研效率。
然而,在研究過(guò)程中,AIGC(AI Generated Content)突然崛起,以ChatGPT 為代表的大語(yǔ)言模型迅速吸引了全球研究者的注意力。AIGC是指利用人工智能技術(shù)來(lái)生成內(nèi)容的一類技術(shù)的統(tǒng)稱[8]。AIGC基于大量的訓(xùn)練數(shù)據(jù)和預(yù)訓(xùn)練模型,形成從文本生成文本、從文本生成圖像、從圖像生成文本等模型,具有數(shù)據(jù)巨量化、內(nèi)容創(chuàng)造力、跨模態(tài)融合、認(rèn)知交互力等技術(shù)特征[9-10]。2022年11月30日,OpenAI發(fā)布了基于GPT-3.5模型的ChatGPT,掀起了全球范圍的AI 浪潮[11]。2023年3月14日,OpenAI推出的GPT-4提高了響應(yīng)速度、創(chuàng)造力和推理能力,更是引發(fā)了廣泛的應(yīng)用和討論[12]。
AIGC技術(shù)的快速發(fā)展改變了科研工具發(fā)展的外部環(huán)境。它意味著從協(xié)同角度來(lái)看,只考察“人與人”協(xié)同以及“工具與工具”協(xié)同是不夠的,“人與AI”的協(xié)同也愈發(fā)體現(xiàn)出它與日俱增的重要性。本研究原本打算簡(jiǎn)單合并維度,對(duì)候選軟件工具重新進(jìn)行評(píng)估。但是我們很快發(fā)現(xiàn),大量的科研工具都在迅速吸納ChatGPT等大語(yǔ)言模型,以AI為自身賦能。本研究的研究過(guò)程恰好被ChatGPT推出的時(shí)間節(jié)點(diǎn)自然分割成兩個(gè)階段。在ChatGPT產(chǎn)生之前,研究的調(diào)查結(jié)果保存了“AI賦能”前的科研工具原始樣貌,成為了不可多得的參照數(shù)據(jù)。將前后兩次評(píng)估結(jié)果進(jìn)行對(duì)比,可以展示AIGC 對(duì)科研軟件生態(tài)系統(tǒng)的顯著影響,并且可以給科研工具開發(fā)者和科研工作者帶來(lái)思考和啟示。
故此,本研究并沒有簡(jiǎn)單地將“人與AI”的協(xié)同合并到原先的觀察維度,而是利用原始調(diào)研信息,將傳統(tǒng)意義的“協(xié)同能力”和“AI賦能”分別作為兩個(gè)調(diào)研階段的重點(diǎn)。“分”則通過(guò)對(duì)比,清晰地看到AIGC在科研工具發(fā)展中的影響,以及工具軟件因應(yīng)外部環(huán)境變化的發(fā)展趨勢(shì)?!昂稀眲t通過(guò)總結(jié),構(gòu)建AI賦能視角下的科研工作流,從“人與人”協(xié)同、“工具與工具”協(xié)同、“人與AI”協(xié)同的“廣義協(xié)同”視角出發(fā),為科研工作者選擇科研工具,并將其整合成提升效率的工具系統(tǒng)提供參考。
(1)科研工具的選擇與協(xié)同工作流
從科研工具的篩選標(biāo)準(zhǔn)角度,方彤等[13]從需求匹配、支持貢獻(xiàn)和滿意度三個(gè)方面制定了企業(yè)的智庫(kù)科研工具應(yīng)用情況評(píng)估指標(biāo)體系。Sungur 等[14]從價(jià)格、免費(fèi)存儲(chǔ)空間、導(dǎo)入導(dǎo)出格式標(biāo)準(zhǔn)化、平臺(tái)匹配以及協(xié)作等9個(gè)維度對(duì) EndNote 和 Mendeley 進(jìn)行了比較。Zhang[15]從訪問(wèn)、同步、引用以及協(xié)作等維度對(duì)比分析科研工具。Ron Gilmour 等[16]從導(dǎo)入導(dǎo)出的標(biāo)準(zhǔn)化格式、元數(shù)據(jù)收集、注釋、組織和共享以及引用風(fēng)格等維度對(duì)科研工具進(jìn)行詳細(xì)對(duì)比。Michael 等[17]考慮了跨平臺(tái)和設(shè)備能力、訪問(wèn)和訂閱、數(shù)據(jù)導(dǎo)入導(dǎo)出方式、同步、個(gè)人存儲(chǔ)空間以及文字處理等維度。Basak[18]則從元數(shù)據(jù)導(dǎo)入的質(zhì)量、準(zhǔn)確性以及全面性等方面對(duì)Endnote、Refworks和 Mendeley 進(jìn)行了對(duì)比分析。
關(guān)于工具間的協(xié)同,也有部分研究人員進(jìn)行了探討和分析。例如, Tim等[19]從寫作的角度討論了模塊化的工作流,并說(shuō)明了跨設(shè)備、跨平臺(tái)工具的靈活、便利。Taylor[20]探討了 EndNote 和 Microsoft Office Word 間的協(xié)作使用。也有學(xué)者從文獻(xiàn)閱讀的角度討論分析了一整套學(xué)術(shù)閱讀的工具流構(gòu)建[21]。但是這些研究只局限在科研工作流的某個(gè)階段,并沒有覆蓋科研工作的完整流程。
(2)AIGC的應(yīng)用
目前已有不少關(guān)于AIGC 對(duì)科研工作影響的研究。例如李白楊等[10]探討了AIGC對(duì)信息資源管理在信息組織、數(shù)據(jù)資產(chǎn)管理、用戶研究和信息倫理四個(gè)方面的影響。陸偉等[22]研究了以ChatGPT為代表的大模型在信息資源管理領(lǐng)域?qū)χ嗡惴ㄅc技術(shù)、信息資源建設(shè)、信息組織與信息檢索、信息治理、內(nèi)容安全與評(píng)價(jià)、人機(jī)智能交互與協(xié)同六大方面的影響。張智雄等[23]則探討并總結(jié)了以ChatGPT為代表的人工智能技術(shù)對(duì)文獻(xiàn)情報(bào)工作的啟示和影響。實(shí)際的科研工作中,ChatGPT的出現(xiàn)給科研工作者帶來(lái)了機(jī)遇和挑戰(zhàn)[9],目前已有學(xué)者提供了在學(xué)術(shù)寫作中有效使用ChatGPT的方法,并制作了流程圖[24]。在使用意愿方面,信息資源管理領(lǐng)域科研人員對(duì)ChatGPT的技術(shù)理念和價(jià)值有著積極的態(tài)度和較高的認(rèn)可度[25]。不過(guò),在調(diào)研中尚未發(fā)現(xiàn)目前國(guó)內(nèi)外關(guān)于AIGC 系統(tǒng)化賦能科研工作流的研究。
(3)小結(jié)
目前已有學(xué)者對(duì)科研工具、方法的對(duì)比研究。但大部分研究對(duì)象都是某一個(gè)或某一類型的科研工具或方法。而且這些研究關(guān)注的重點(diǎn)基本都是工具本身是否好用,并沒有對(duì)工具之間的協(xié)同能力展開討論[26]。針對(duì)AIGC、ChatGPT等工具在科研中的應(yīng)用,目前很多研究還停留在宏觀層面,缺少對(duì)有關(guān)科研工作流中軟件應(yīng)用AI化程度的研究。與此同時(shí),外部信息和科技環(huán)境正在發(fā)生顯著變化。如果不能充分利用GPT-4為代表的AIGC 能力,研究者會(huì)在科研競(jìng)爭(zhēng)中處于劣勢(shì)[27]。因此,從協(xié)同能力與AI 賦能兩個(gè)角度綜合研究科研工具選擇與科研工作流構(gòu)建,有其必要性與緊迫性。這構(gòu)成了本研究展開的依據(jù)。
科學(xué)研究大致可分為產(chǎn)生思路、組織設(shè)計(jì)、數(shù)據(jù)收集、數(shù)據(jù)分析、知識(shí)管理以及成果輸出6個(gè)研究階段[28-32]。在實(shí)際工作中,不同學(xué)科研究類型的差異極大,例如質(zhì)性研究與實(shí)證研究在數(shù)據(jù)收集和分析方面有著顯著差異。所以本文結(jié)合相關(guān)文獻(xiàn)著重考察產(chǎn)生思路、 知識(shí)管理以及成果輸出等科研活動(dòng)的共性方面[33],主要關(guān)注科研活動(dòng)中以下幾個(gè)較為具有普遍性的工作階段:文獻(xiàn)檢索、文獻(xiàn)閱讀、文獻(xiàn)分析、文獻(xiàn)管理、筆記管理,以及論文寫作等,如圖1所示。
圖1 本研究關(guān)注的科研普遍性階段工作流Fig.1 Workflow of the Research Universality Stage Focused on in This Study
本研究旨在構(gòu)建一種能增進(jìn)科研人員效率的科研工作流。在研究過(guò)程中,從科研活動(dòng)中各個(gè)階段的單一工具使用出發(fā),關(guān)注工具間的協(xié)作和配合,構(gòu)建一個(gè)整體、系統(tǒng)的工具選擇方案,如圖2所示。
圖2 科研工作流系統(tǒng)圖Fig.2 Diagram of Research Workflow System
本研究最初關(guān)注人與人之間如何利用工具與工具之間的系統(tǒng)能力來(lái)進(jìn)行協(xié)作,以及團(tuán)隊(duì)成員如何在同一工具上共建內(nèi)容,以達(dá)到協(xié)同工作的效果,即經(jīng)典協(xié)同視角下的科研工作流。在研究過(guò)程中,外部環(huán)境發(fā)生變化,AI技術(shù)也在不斷發(fā)展,原本AI僅在極少的功能上作為輔助型工具,而隨著AIGC技術(shù)的出現(xiàn)和發(fā)展,工具在AI賦能下能夠使得人和AI可以緊密協(xié)同合作。于是本研究進(jìn)一步關(guān)注廣義協(xié)同視角,即AI賦能視角下的科研工作流。
針對(duì)圖1中的不同科研工作階段,本研究進(jìn)行的第一輪調(diào)研發(fā)生在ChatGPT 發(fā)布之前,主要關(guān)注軟件工具的協(xié)同能力,以便篩選組合成合適的科研工作流。為此,利用已經(jīng)掌握的不同研究階段的工具應(yīng)用信息,通過(guò)AlternativeTo調(diào)研可供選擇的同類科研工具。同時(shí),基于官方社區(qū)、Discord、Slack 以及Github等渠道查看用戶評(píng)價(jià)做出初步篩選。最后,根據(jù)不同工具的“導(dǎo)入導(dǎo)出格式標(biāo)準(zhǔn)化”“跨設(shè)備、跨平臺(tái)支持”以及“用戶間協(xié)作能力”三個(gè)評(píng)價(jià)維度擇優(yōu)進(jìn)行開放性評(píng)價(jià),并構(gòu)建完整、具體的團(tuán)隊(duì)協(xié)作科研工作流,即圖2中的“協(xié)同視角下的科研工作流”部分。
這里對(duì)本文所選擇的三個(gè)評(píng)價(jià)維度原因做出簡(jiǎn)要說(shuō)明。
“導(dǎo)入導(dǎo)出格式標(biāo)準(zhǔn)化”是考察軟件工具支持的輸入輸出文件格式是開放還是私有,是單一還是多樣。例如,Markdown 是一種開放的文件格式,用不同的Markdown編輯器和瀏覽器都可以正常打開。輸入輸出文件格式開放,可以讓某一款工具與其他工具之間建立溝通渠道,構(gòu)成同一個(gè)工具系統(tǒng)里的組成部分。一款工具支持的開放格式(如JSON,HTML和 Markdown)越多,它能夠與其他支持不同開放格式的工具相互溝通的可能性就越高。
“跨設(shè)備、跨平臺(tái)支持”考察工具在不同平臺(tái)系統(tǒng)的適用性。如果一款工具只支持單一操作系統(tǒng)(例如Windows或 MacOS),其他操作系統(tǒng)的用戶無(wú)法使用它,也就達(dá)不到用戶間交換工作文件的目標(biāo)。
“用戶間協(xié)作能力”指的是一款工具內(nèi)部支持多用戶共同編輯或者快速分享的功能。如果軟件內(nèi)部支持用戶協(xié)作,會(huì)大大減少溝通協(xié)作的中間環(huán)節(jié),有效提升團(tuán)隊(duì)科研與產(chǎn)出的效率。
以上三個(gè)維度中的前兩個(gè),考察的是軟件工具與軟件工具的協(xié)同能力;而第三個(gè)維度考察軟件工具中人與人的協(xié)同能力。這構(gòu)成了經(jīng)典的軟件工具協(xié)同視角。
本研究開展的第二輪調(diào)研發(fā)生在以ChatGPT 為代表的AIGC 工具爆發(fā)后。本研究重點(diǎn)關(guān)注科研工具的AIGC賦能維度,對(duì)之前篩選的科研工具進(jìn)行再一次調(diào)查和整理,從科研工具是否增加AIGC功能出發(fā),選出每個(gè)科研階段中具有代表性的科研工具,形成人與AI協(xié)作的科研工作流,即圖2所示“AI賦能視角下的科研工作流”部分。
本研究開展的兩輪調(diào)研分別關(guān)注狹義協(xié)作(“人與人”“工具與工具”)和廣義協(xié)作(“人與AI”)。綜合兩個(gè)階段的研究結(jié)果,得出協(xié)同與AI 賦能綜合視角下的學(xué)術(shù)工具選擇與科研工作流系統(tǒng)。在這個(gè)科研工作流系統(tǒng)中,重點(diǎn)關(guān)注其中的節(jié)點(diǎn)——單獨(dú)的工具,以及工具之間的聯(lián)系,并且通過(guò)兩種視角對(duì)比,分析AIGC發(fā)展對(duì)科研工具選擇與科研工作流構(gòu)成等帶來(lái)的影響和變化,為科研工作者提供參考。
本研究經(jīng)歷兩次調(diào)研階段。第一階段以協(xié)同視角開展,調(diào)研時(shí)間段為2022年5月至2022年7月。第二階段以AI賦能視角開展,調(diào)研時(shí)間段為2023年5月至2023年6月。下文分別討論兩次調(diào)研的結(jié)果,并對(duì)其進(jìn)行對(duì)比分析。
本研究首先設(shè)定每一階段的典型應(yīng)用作為種子,然后通過(guò)AlternativeTo等網(wǎng)站滾雪球式找尋同類工具,共找到候選工具196款。之后依據(jù)官方社區(qū)、Discord、Slack 以及Github等來(lái)源的用戶評(píng)價(jià),初步篩選各個(gè)研究階段的學(xué)術(shù)軟件共 26款,這26款工具分別對(duì)應(yīng)文獻(xiàn)檢索、文獻(xiàn)閱讀、文獻(xiàn)分析、文獻(xiàn)管理、筆記管理、論文寫作這六個(gè)階段。
(1)文獻(xiàn)檢索
在確定最終的研究主題之前,科研人員可能會(huì)通過(guò)大量的文獻(xiàn)調(diào)研來(lái)尋找潛在的研究主題[34]。根據(jù)工具的功能特點(diǎn)和用戶評(píng)價(jià),初步篩選出以下幾種文獻(xiàn)檢索工具進(jìn)行對(duì)比:Elicit、Semantic Scholar、Web of Science、Research Rabbit 和 Connected Papers。本研究對(duì)上述幾款文獻(xiàn)檢索工具從導(dǎo)入導(dǎo)出格式標(biāo)準(zhǔn)化、跨設(shè)備跨平臺(tái)支持、用戶間協(xié)作能力三個(gè)維度進(jìn)行比對(duì),如表1所示。
表1 基于Web 的文獻(xiàn)檢索工具對(duì)比Table 1 Comparison of Web-based Literature Retrieval Tools
在導(dǎo)入導(dǎo)出格式方面,Web of Science支持的格式最多;在跨平臺(tái)跨設(shè)備方面,所調(diào)查的五個(gè)工具均支持Web平臺(tái)使用;在用戶協(xié)作支持方面,僅Research Rabbit支持不同用戶間的協(xié)作、共享。另外,Elicit基于自然語(yǔ)言的問(wèn)答方式且不需要使用復(fù)雜的檢索式,獨(dú)具特色。最終本研究篩選出的文獻(xiàn)檢索工具為Research Rabbit和Elicit。
(2)文獻(xiàn)閱讀
針對(duì)文獻(xiàn)閱讀,本研究初步篩選獲得的4種軟件工具為:MarginNote、LiquidText、PDF Expert和福昕閱讀器,如表2所示。
表2 文獻(xiàn)閱讀工具對(duì)比Table 2 Comparison of Literature Reading Tools
在導(dǎo)入導(dǎo)出格式方面,MarginNote和LiquidText均支持PDF和Doc的導(dǎo)入導(dǎo)出格式。但是考慮到導(dǎo)入導(dǎo)出的具體操作方式,MarginNote提供了諸多導(dǎo)入文檔的方法,如通過(guò)WiFi連接從PC/Mac添加文檔,也可以從第三方應(yīng)用程序(如Evernote)導(dǎo)入文檔等,功能更為全面。在跨平臺(tái)、設(shè)備這一維度,MarginNote和PDF Expert僅支持在Apple平臺(tái)上使用。另外,福昕閱讀器目前已經(jīng)實(shí)現(xiàn)了Windows、Mac、Linux、Android、iOS、WP、Surface RT等多個(gè)平臺(tái)的覆蓋。同時(shí),福昕閱讀器也支持手機(jī)、電腦等多設(shè)備的文檔同步管理,還支持導(dǎo)入至石墨文檔、金山文檔等第三方PDF文檔。在用戶協(xié)作支持方面,MarginNote和福昕閱讀器均支持不同用戶間的協(xié)作。綜上,最終篩選出來(lái)的文獻(xiàn)閱讀應(yīng)用為福昕閱讀器和MarginNote。
(3)文獻(xiàn)分析
針對(duì)文獻(xiàn)數(shù)據(jù)的文本挖掘有助于對(duì)知識(shí)進(jìn)行再組織,進(jìn)而增強(qiáng)發(fā)現(xiàn)、解決問(wèn)題的洞察力。本研究初步篩選出Scholarcy、InfraNodus和Paper Digest三款文獻(xiàn)分析工具作對(duì)比分析,如表3所示。
表3 文獻(xiàn)分析工具對(duì)比Table 3 Comparison of Literature Analysis Tools
在數(shù)據(jù)導(dǎo)入方面,Scholarcy除了支持上傳本地的PDF、Word、TXT以及RIS等文檔格式的文獻(xiàn)資源,同時(shí)還能夠通過(guò)輸入具體的URL生成摘要抽認(rèn)卡片。其數(shù)據(jù)導(dǎo)出為Markdown格式,由此可以很方便地導(dǎo)入至第三方筆記管理工具(如Roam Research、Obsidian和Notion等)。InfraNodus不僅支持以TXT、PDF、Evernote筆記、Google搜索結(jié)果、推文、RSS新聞提要、Gephi圖和CSV等格式導(dǎo)入文件,還能夠?qū)崟r(shí)編寫文本完成導(dǎo)入。對(duì)于分析結(jié)果可以GEXF、PNG、CSV 的格式保存。雖然Paper Digest可以通過(guò)上傳鏈接和 PDF進(jìn)行文本分析,但局限在于分析結(jié)果不能導(dǎo)出。在跨平臺(tái)設(shè)備方面,三款文獻(xiàn)工具均支持Web使用。在用戶協(xié)作支持方面,三款工具均不支持不同用戶間的協(xié)作。綜上,通過(guò)綜合比較,最終文獻(xiàn)分析階段篩選出來(lái)的應(yīng)用為Scholarcy。
(4)文獻(xiàn)管理
文獻(xiàn)管理軟件作為科研活動(dòng)的自動(dòng)化工具之一,已經(jīng)被科學(xué)領(lǐng)域的研究人員廣泛使用[35]。根據(jù)文獻(xiàn)梳理和用戶評(píng)價(jià),本研究初步篩選出Zotero、EndNote和Mendeley三款文獻(xiàn)管理工具進(jìn)行對(duì)比,如表4所示。
表4 文獻(xiàn)管理工具對(duì)比Table 4 Comparison of Literature Management Tools
在導(dǎo)入導(dǎo)出格式方面,Zotero提供了多種導(dǎo)入導(dǎo)出格式的選擇。在跨平臺(tái)跨設(shè)備方面,Zotero有較強(qiáng)的兼容性,適用于Windows、Linux以及Apple全平臺(tái)等多種系統(tǒng)。Mendeley在下架所有移動(dòng)端的應(yīng)用之后,目前僅支持桌面版的應(yīng)用。在用戶協(xié)作支持方面,Zotero可以通過(guò)郵箱的方式邀請(qǐng)其他成員一起共享和編輯同一個(gè)文獻(xiàn)庫(kù),同時(shí)也可以靈活設(shè)置邀請(qǐng)成員是否可閱讀、編輯的權(quán)利。經(jīng)過(guò)對(duì)比,最終本研究篩選出的文獻(xiàn)管理工具是Zotero。
(5)筆記管理
由于知識(shí)的產(chǎn)生時(shí)間存在差別,實(shí)驗(yàn)發(fā)現(xiàn)或者想法的記錄比較零散且其上下文容易丟失,這給科研人員的知識(shí)回顧和再利用帶來(lái)了一定困難。也正因此,數(shù)字化筆記工具的價(jià)值日益凸顯。根據(jù)用戶評(píng)價(jià),本研究初步篩選出Roam Research、Logseq、Obsidian、Heptabase、Craft和Flomo 6款筆記工具作對(duì)比分析?;诠δ芴匦缘牟煌?,參考How to take smart notes[33]一書,又將其分為臨時(shí)筆記和長(zhǎng)期筆記兩個(gè)類別進(jìn)行對(duì)比,如表5、表6所示。
表5 臨時(shí)筆記工具對(duì)比Table 5 Comparison of Temporary Note-taking Tools
表6 長(zhǎng)期筆記工具對(duì)比Table 6 Comparison of Long-term Note-taking Tools
①臨時(shí)筆記:Craft 和 Flomo
在導(dǎo)入導(dǎo)出格式和跨平臺(tái)跨設(shè)備方面,Craft 支持選擇多種導(dǎo)出格式來(lái)導(dǎo)出記錄的內(nèi)容。在用戶協(xié)作支持方面,Craft 可以通過(guò)鏈接的方式分享內(nèi)容并能與他人進(jìn)行實(shí)時(shí)協(xié)作。在不同設(shè)備上進(jìn)行工作時(shí),文件也都會(huì)實(shí)時(shí)同步和共享,不用再切換至其他的工具。相比之下,F(xiàn)lomo 并不支持那些標(biāo)準(zhǔn)化數(shù)據(jù)格式的導(dǎo)入和導(dǎo)出。最終本研究篩選Craft作為臨時(shí)筆記工具。
②長(zhǎng)期筆記:Roam Research、Logseq、Obsidian 和Heptabase
Roam Research支持EDN、JSON、Markdown 格式的導(dǎo)出和 Markdown、JSON 格式的導(dǎo)入,協(xié)同功能最為全面。Logseq能夠在本地的純文本 Markdown和Org 文件格式上開展工作,同時(shí)還支持JSON、Markdown 和OPML格式文件的導(dǎo)入和導(dǎo)出。Obsidian的使用基于本地的純文本或Markdown格式的文件,同時(shí)還支持以PDF格式進(jìn)行導(dǎo)出。相較于其余三款工具,Heptabase僅支持桌面端的下載使用。最終本研究篩選出Roam Research作為長(zhǎng)期筆記工具。
(6)論文寫作
本研究針對(duì)科研論文寫作的特點(diǎn),通過(guò)初步篩選獲得的5款論文寫作工具為: Overleaf、Zettlr、Word、Notion 以及飛書文檔。如表7所示。
表7 論文寫作工具對(duì)比Table 7 Comparison of Essay Writing Tools
在導(dǎo)入導(dǎo)出格式方面,Zettlr支持以 HTML、PDF、Word、RTF 等 35 種格式的導(dǎo)出,能夠配合 Zotero等第三方文獻(xiàn)管理工具實(shí)現(xiàn)很好地集成,可以方便地完成引文的標(biāo)注工作,Notion支持HTML、PDF、Markdown、CSV、Docx、TXT等格式,飛書文檔則支持Docx、PDF、Markdown、TXT、CSV格式。在跨平臺(tái)跨設(shè)備方面,Zettlr支持Mac、Windows、Linux設(shè)備使用,Notion支 持Windows、Mac、Android、iPhone、Web設(shè)備和平臺(tái)使用,飛書文檔支持Windows、Linux、Mac、iPad、iPhone、Android、Web設(shè)備和平臺(tái)使用。在用戶協(xié)作支持方面,到目前為止Zettlr不支持用戶間的實(shí)時(shí)協(xié)作,Notion和飛書文檔均支持用戶間的協(xié)作、共享。綜上,本研究篩選出Notion作為更適合團(tuán)隊(duì)合作的論文寫作工具。
本研究綜合各類工具的特點(diǎn),篩選出以下工具。根據(jù)各軟件應(yīng)用的核心功能,構(gòu)建面向科研工作流的軟件協(xié)同工作流,如圖3 所示。
圖3 協(xié)同視角下的科研工作流Fig.3 Research Workflow from a Collaborative Perspective
在文獻(xiàn)檢索階段,Elicit通過(guò)與Research Rabbit 智能推薦的反復(fù)迭代,可以獲得更為精準(zhǔn)的檢索結(jié)果,從而節(jié)省大量不必要的檢索時(shí)間。此外Research Rabbit中的文獻(xiàn)資源也可實(shí)現(xiàn)與Zotero的數(shù)據(jù)集成。同時(shí),Research Rabbit所具備的用戶協(xié)作功能,可以使得團(tuán)隊(duì)內(nèi)的所有成員共享文獻(xiàn)資源。
在獲取相應(yīng)的文獻(xiàn)資源后,使用福昕閱讀器或MarginNote進(jìn)行閱讀時(shí)也可以邀請(qǐng)協(xié)作者一起閱讀、做文獻(xiàn)筆記。Zotero不僅可以將獲取的PDF文件下載至福昕閱讀器或MarginNote中閱讀,還能將文獻(xiàn)元數(shù)據(jù)、筆記等信息導(dǎo)入到Roam Research中。同時(shí)Roam Research的實(shí)時(shí)協(xié)作又能夠讓團(tuán)隊(duì)內(nèi)的所有成員及時(shí)地看到這些信息,使之對(duì)信息進(jìn)行完善和補(bǔ)充。通過(guò)Scholarcy分析得到的引文信息,又可以RIS格式導(dǎo)入至Zotero中,從而形成了一個(gè)可以不斷迭代的科研工作鏈條。
上述流程中激發(fā)的靈感和觀點(diǎn),都可以在Roam Research上進(jìn)行記錄。而且,以卡片筆記法的記錄方式通過(guò)累積還可形成長(zhǎng)期的可調(diào)用的模塊??蒲腥藛T在各階段研究中的零散記錄均可通過(guò)Craft來(lái)完成。
Notion的實(shí)時(shí)協(xié)作可以有效地提高寫作的質(zhì)量和效率,因此整個(gè)寫作的過(guò)程可以在Notion中進(jìn)行。對(duì)于學(xué)術(shù)論文的文獻(xiàn)標(biāo)引工作,可以將在Notion中的文稿內(nèi)容以Markdown格式導(dǎo)出并配合Zettlr完成。
不同工具間的有機(jī)結(jié)合可以有效提升科學(xué)研究的產(chǎn)出及其質(zhì)量。流程化的思想和模式有助于科研人員從整體上思考、解決問(wèn)題,使科研人員根據(jù)實(shí)際問(wèn)題對(duì)不同研究階段進(jìn)行綜合考慮。
AIGC應(yīng)用功能包括信息檢索、摘要總結(jié)、文本分析、生成策略等。在第二輪調(diào)研中,本研究從科研工具是否增加AIGC技術(shù)所支撐的功能出發(fā)對(duì)于2022年12月之后迅速發(fā)展的科研工具進(jìn)行了調(diào)研,篩選出每個(gè)科研階段中具有代表性的科研工具。
(1)文獻(xiàn)檢索
Assistant by scite是一個(gè)由scite制作的對(duì)話工具,用戶可以用簡(jiǎn)單的語(yǔ)言提問(wèn),Assistant by scite會(huì)給出答案,提供引文上下文,并且描述文章是否提供支持或?qū)Ρ茸C據(jù)的引文。部分科研用戶飽受大語(yǔ)言模型編造內(nèi)容甚至參考文獻(xiàn)的困擾[36]。和普通的大語(yǔ)言生成模型不同的是,Assistant by scite通過(guò)對(duì)比自己掌握的文獻(xiàn)數(shù)據(jù)庫(kù)避免了普通的生成語(yǔ)言模型可能會(huì)產(chǎn)生幻覺和編造數(shù)據(jù)的情況,保證了有效性。Assistant by scite利用對(duì)文章全文的訪問(wèn)和深度學(xué)習(xí)模型,向用戶展現(xiàn)科學(xué)出版物如何相互引用的定量和定性的情況。為科研人員節(jié)省了尋找、評(píng)估相關(guān)研究的時(shí)間,有效提高了科研人員文獻(xiàn)檢索的效率。此外,用戶可以將對(duì)話內(nèi)容導(dǎo)出為CSV文件進(jìn)行保存,易于分享給合作者,也便于后續(xù)查閱和利用信息[37]。
(2)文獻(xiàn)閱讀
在文獻(xiàn)閱讀環(huán)節(jié),本研究選擇了ChatDOC。Chat DOC是一個(gè)基于ChatGPT的文件閱讀助手,能夠從文檔中快速提取、定位和匯總信息,變線性閱讀為非線性聚焦。ChatDOC憑借強(qiáng)大的總結(jié)能力和語(yǔ)義理解能力,在回復(fù)問(wèn)題時(shí)能夠提供所有被引用的信息來(lái)源,以非線性的方式讓用戶能夠更直觀地核查文獻(xiàn)中關(guān)于某一問(wèn)題的關(guān)鍵信息[38]。
(3)文獻(xiàn)分析
前文已經(jīng)調(diào)查過(guò)的InfraNodus新加入了“GPT4 Chat Mode”功能模塊。“GPT4 Chat Mode”這一模塊在幫助科研人員獲得發(fā)現(xiàn)問(wèn)題的功能上,增加了用GPT-4 AI輔助科研人員分析和開發(fā)想法的功能。用戶可以使用內(nèi)置的AI檢索主要主題和研究問(wèn)題,通過(guò)網(wǎng)絡(luò)圖的變化向內(nèi)置的GPT-4 AI發(fā)送問(wèn)題以產(chǎn)生有價(jià)值的研究想法,為科研人員掃除思維盲區(qū),帶來(lái)新穎的思考視角[39]??紤]到GPT-4在大語(yǔ)言模型綜合排行中以較大優(yōu)勢(shì)排名第一,本研究認(rèn)為InfraNodus的GPT4 Chat Mode模塊比其他AI插件更有效、可靠[40]。
(4)筆記管理
Craft新發(fā)布了基于AIGC技術(shù)的Craft AI Assistant。它基于GPT-3,可以根據(jù)筆記內(nèi)容快速生成新的想法或者快速生成關(guān)鍵詞。研究發(fā)現(xiàn)在一些需要快速記錄信息的情境下,會(huì)出現(xiàn)很多拼寫或語(yǔ)法錯(cuò)誤,而Craft AI Assistant可以一鍵消除這些錯(cuò)誤,并且能夠?qū)⒐P記內(nèi)容翻譯為目標(biāo)語(yǔ)言。這可以幫助科研工作者快速記錄想法并且形成可用的知識(shí)模塊,提升工作效率和創(chuàng)造力[41]。
在長(zhǎng)期筆記工具中,研究發(fā)現(xiàn)了新的知識(shí)管理應(yīng)用 Tana。Tana支持使用移動(dòng)端應(yīng)用Tana Capture來(lái)掃描識(shí)別、圖片識(shí)別、語(yǔ)音錄入信息。經(jīng)過(guò)AIGC賦能的Tana AI Builder可以在語(yǔ)音轉(zhuǎn)換成文本之后,通過(guò)執(zhí)行AI命令,能夠自動(dòng)根據(jù)whisper轉(zhuǎn)寫的文本,生成更加流暢且正式的書面表達(dá)。并且,與Tana的Supertag標(biāo)簽功能相結(jié)合,可以完成對(duì)多條筆記的潤(rùn)色任務(wù)。當(dāng)科研人員在寫作過(guò)程出現(xiàn)卡殼時(shí),可以在Tana AI Builder輸入目前寫作的關(guān)鍵信息,AI可以將所有筆記中與關(guān)鍵信息相關(guān)的內(nèi)容列出,幫助科研人員進(jìn)行頭腦風(fēng)暴,檢查思維漏洞,打破信息繭房。同時(shí),科研人員可以在Tana AI Builder輔助完成整體文章后,迭代和改進(jìn)文章[42]。
(5)論文寫作
Notion增加了Notion AI的功能,可以幫助總結(jié)重要事項(xiàng),分析會(huì)議記錄并生成后續(xù)步驟、生成文本摘要、提取研究中的重要內(nèi)容,幫助提高工作效率,自動(dòng)執(zhí)行繁瑣的任務(wù)。在科研人員的寫作過(guò)程中,Notion AI可以讓科研人員在工作時(shí)無(wú)需在筆記和單獨(dú)的AI驅(qū)動(dòng)工具之間來(lái)回切換,幫助科研人員完成頭腦風(fēng)暴,提高寫作效率[43]。
以上工具中,“Assistant by scite”“Chat DOC”“Tana”三個(gè)工具在第一階段“經(jīng)典協(xié)同視角”的比較中沒有出現(xiàn),為使“廣義協(xié)同視角”下的對(duì)比更全面,對(duì)上述新增應(yīng)用,本研究同樣考察了其經(jīng)典維度上的協(xié)同能力,調(diào)查結(jié)果如表8所示?!案淖冞x擇”列表示相較于第一階段調(diào)研的篩選結(jié)果,第二階段調(diào)研的篩選結(jié)果是否產(chǎn)生變化。
表8 AIGC 工具協(xié)作能力表Table 8 Collaboration Capacity of AIGC Tools
可以看出,篩選的AIGC賦能的科研工具大多支持通用的導(dǎo)入導(dǎo)出格式,而且都支持Web訪問(wèn),只是在工具內(nèi)用戶協(xié)作方面,部分應(yīng)用還有提升空間。
根據(jù)前文介紹的6種工具應(yīng)用的核心功能和AIGC優(yōu)勢(shì),結(jié)合表8中各AIGC工具的協(xié)作能力,本研究進(jìn)一步更新構(gòu)建AIGC工作流。協(xié)同能力依然是工作流構(gòu)建的標(biāo)準(zhǔn),但是其含義已經(jīng)從“人與人”“工具與工具”的狹義協(xié)同轉(zhuǎn)換為包含了“人與AI”的廣義協(xié)同角度。最終結(jié)果如圖4所示。
在AI賦能視角下的科研工作流中,在文獻(xiàn)檢索階段科研人員可以使用Assistant by scite來(lái)提出關(guān)于研究方向的問(wèn)題。該工具會(huì)給出有參考資料支持的答案,使科研人員能夠更準(zhǔn)確地獲取參考資料和檢索結(jié)果并節(jié)省時(shí)間。
在文獻(xiàn)閱讀階段,科研人員還可以將文獻(xiàn)PDF上傳到ChatDOC,利用其提供的非線性閱讀方式快速提取、定位和匯總信息。這可以有效幫助科研人員提升閱讀速度和質(zhì)量。用戶可以將對(duì)話內(nèi)容導(dǎo)出為Markdown、HTML或者PNG格式。在文獻(xiàn)檢索階段使用Assistant by scite檢索到文獻(xiàn)后可以將PDF格式的文獻(xiàn)導(dǎo)入文獻(xiàn)管理工具Zotero進(jìn)行管理,在ChatDOC導(dǎo)出的閱讀信息也可以在Zotero中的對(duì)應(yīng)文獻(xiàn)中做筆記。
在文獻(xiàn)分析階段,科研人員也可以將PDF格式的文獻(xiàn)上傳到InfraNodus,幫助他們獲得問(wèn)題洞察力和有意義的想法。零散的靈感和想法可以在臨時(shí)筆記管理工具Craft AI Assistant中記錄,當(dāng)積累形成長(zhǎng)篇想法時(shí),可使用該工具快速生成關(guān)鍵詞和摘要。最后,將這些記錄導(dǎo)入長(zhǎng)期筆記管理工具Tana,使用Supertag功能進(jìn)行快速匯總。
在寫作過(guò)程中,科研人員可以使用長(zhǎng)期筆記管理工具Tana AI Builder,在頭腦風(fēng)暴方式下找出筆記中的相關(guān)信息。整個(gè)寫作過(guò)程可以在論文寫作工具Notion中進(jìn)行,Notion AI可以生成文本摘要和提取重要內(nèi)容。
在這樣的流程之下,很多原本低效的人工重復(fù)勞動(dòng),都可以變得更加便捷和智能化。這種改進(jìn),將有助于大幅提升科研工作者的工作效率。
本研究在“人與人”協(xié)同、“工具與工具”協(xié)同、“人與AI”協(xié)同的“廣義協(xié)同”視角指引下,通過(guò)兩次調(diào)研,獲得了寶貴的原始數(shù)據(jù),因此有機(jī)會(huì)對(duì)比AIGC 爆發(fā)前后的科研工具生態(tài),構(gòu)建了AI賦能視角下的科研工作流,并且形成了以下分析結(jié)果。
在AIGC 融入科研工具前后,所調(diào)查的科研工作流發(fā)生了較大的變化。這種對(duì)比說(shuō)明了AIGC 對(duì)科研活動(dòng)的影響是重大而深刻的。
文獻(xiàn)檢索階段,Elicit和Research Rabbit被Assistant by scite所替代,Assistant by scite以對(duì)話的形式獲取文獻(xiàn)信息,比經(jīng)典工具更為直觀,同時(shí)該工具通過(guò)對(duì)比數(shù)據(jù)庫(kù)來(lái)避免產(chǎn)生幻覺和編造數(shù)據(jù)的情況,保證了其有效性。
文獻(xiàn)閱讀階段,ChatDOC的非線性閱讀方式以及優(yōu)秀的總結(jié)和理解能力讓它替代了傳統(tǒng)的文獻(xiàn)閱讀工具,不僅讓文獻(xiàn)閱讀更為方便,而且能夠在提高科研人員閱讀文獻(xiàn)效率的同時(shí),保證閱讀質(zhì)量,輔助科研人員加快科研進(jìn)度。
InfraNodus增加了GPT-4插件后,使用GPT-4插件可以可視化顯示文本、參考文獻(xiàn)的關(guān)鍵詞聚類以及聚類之間的差距,進(jìn)而生成連接差距較大的兩類關(guān)鍵詞的靈感想法,幫助研究者快速找到研究領(lǐng)域中的結(jié)構(gòu)洞,并且充分利用“遠(yuǎn)程聯(lián)想”方式加速對(duì)選題的找尋。
長(zhǎng)期筆記工具則是從Roam Research變成了Tana。Tana AI Builder可以幫助用戶依靠上下文自定義各種AI命令。其靈活性和深度集成程度,都是其他筆記軟件目前所不具備的。依靠著AI輔助功能的增加,Tana在方便性和可定制性上都有了質(zhì)的提升,可以更好地融入工作流,和其他工具充分交互協(xié)作。
現(xiàn)有科研工具增加AIGC 功能是必要的。在第一輪調(diào)研中,Craft和Notion等工具靠著出色的協(xié)作能力脫穎而出,被納入?yún)f(xié)同視角下的科研工作流中。在第二輪調(diào)研中,Craft、Notion因其主動(dòng)利用AIGC技術(shù),幫助用戶進(jìn)一步提升筆記與寫作效率,并解決科研活動(dòng)中工作重復(fù)、枯燥的問(wèn)題。在科研工具不斷發(fā)展的情勢(shì)下它們依然保持競(jìng)爭(zhēng)力,大浪淘沙之后依然處于AIGC賦能工作流之中。
如果某一款科研工具能主動(dòng)應(yīng)用AIGC技術(shù),并隨著AI 自動(dòng)化處理優(yōu)勢(shì)不斷擴(kuò)大,功能不斷更新,這款應(yīng)用就能更好地為用戶賦能,獲得更大的用戶群體與更好的口碑。但是,如果科研應(yīng)用忽視AIGC技術(shù),在激烈的競(jìng)爭(zhēng)壓力下,則很可能會(huì)面臨被同行超越、被用戶放棄的局面。例如,文獻(xiàn)閱讀階段的經(jīng)典工具,其功能停留在對(duì)文獻(xiàn)閱讀的基本要求上,沒能在AIGC技術(shù)發(fā)展過(guò)程中加入創(chuàng)新性的功能,就會(huì)被新興工具ChatDOC所替代。再如,文獻(xiàn)分析階段的Scholarcy和InfraNodus,原本二者優(yōu)勢(shì)不相上下,但是在InfraNodus最新添加GPT-4后,二者之間的差距便迅速拉大。
讀者不應(yīng)產(chǎn)生AIGC 是“全能”的這一誤解,它的作用有其邊界。目前較為成熟可用的AIGC服務(wù)應(yīng)用包括信息檢索、摘要總結(jié)、文本分析、生成策略等。AIGC以對(duì)話形式提供信息和回答科研人員的問(wèn)題,或者完成文本摘要、提取重點(diǎn)的任務(wù)等。在這些方面,AIGC能夠部分替代人工完成較為枯燥的機(jī)械化流程,并且給出有效、可靠的處理結(jié)果。
但是對(duì)于科研人員在科研過(guò)程中找尋關(guān)鍵問(wèn)題、形成最終決策等行為,目前是AIGC不能完成的。這些問(wèn)題需要人的理性、智慧甚至閱歷綜合判斷。在這些重要任務(wù)上,AIGC只能起到輔助的作用,不能完成全部科研過(guò)程的關(guān)鍵環(huán)節(jié)。誠(chéng)如Craft的創(chuàng)辦者Balint Orosz所說(shuō):“軟件應(yīng)該是‘心靈的自行車’,放大人腦的力量。它應(yīng)該賦予我們力量,幫助我們更具創(chuàng)造力,幫助我們規(guī)劃并更好地表達(dá)我們的想法”[41]。在科研活動(dòng)中,研究者可以充分利用AI 提升效率,但是不能放棄主導(dǎo)性。否則輕則導(dǎo)致研究出現(xiàn)偏差,重則會(huì)帶來(lái)科研倫理的問(wèn)題。
本研究的局限為:AI化的科研工具正在蓬勃發(fā)展,幾乎每天都有新的工具或新的功能推出。在一些特別新穎的科研工具僅提供內(nèi)部測(cè)試版本的情況下,我們目前的研究無(wú)法覆蓋到所有科研工具。
AIGC 的發(fā)展浪潮方興未艾,本團(tuán)隊(duì)會(huì)繼續(xù)追蹤本領(lǐng)域的發(fā)展,不斷把用戶口碑良好的科研工具作為研究對(duì)象,并進(jìn)行下一步的探究,從而不斷對(duì)科研工作流進(jìn)行更新,為研究者、學(xué)習(xí)者和實(shí)踐者提供更為適合的軟件應(yīng)用與工作流整合建議,使人、工具和 AI之
作者貢獻(xiàn)說(shuō)明
王樹義:提出選題,擬定框架,修改論文;
張慶薇:采集資料,修改論文;
張晉:采集資料,撰寫初稿。