王鵬濤 章紫桐
[摘 要] AI技術(shù)的應(yīng)用為學(xué)術(shù)出版商在知識(shí)生產(chǎn)領(lǐng)域的探索提供了難得機(jī)遇,智能出版的核心價(jià)值在于從已出版文獻(xiàn)、科研實(shí)驗(yàn)數(shù)據(jù)、引用數(shù)據(jù)等資源中發(fā)現(xiàn)知識(shí)間的新關(guān)聯(lián),為科學(xué)進(jìn)步貢獻(xiàn)力量。通過(guò)文獻(xiàn)調(diào)查、比較分析和案例探討,指出AI技術(shù)在數(shù)據(jù)的獲取、利用、審核,學(xué)術(shù)語(yǔ)言的翻譯,智能化的信息關(guān)聯(lián)與知識(shí)推理,推動(dòng)科學(xué)家的合作與知識(shí)分享,預(yù)測(cè)學(xué)科領(lǐng)域前沿等方面提供了前所未有的便利,推動(dòng)了自然科學(xué)領(lǐng)域出版事業(yè)的智能化轉(zhuǎn)型。自然科學(xué)領(lǐng)域知識(shí)生產(chǎn)的內(nèi)在邏輯和AI的獨(dú)有特征,共同決定了在以上場(chǎng)景中學(xué)術(shù)出版企業(yè)的數(shù)智化轉(zhuǎn)型升級(jí)將大有可為。
[關(guān)鍵詞] 人工智能 學(xué)術(shù)出版 知識(shí)生產(chǎn) 自然科學(xué)
[中圖分類號(hào)] G230[文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)] 1009-5853 (2021) 06-0012-08
[Abstract] The Application of AI provides a rare opportunity for academic publishers to explore in the field of knowledge production. The core value of intelligent publishing lies in discovering new knowledge correlation among published resources such as published literature, scientific research data, and citation data. The inherent logical characteristics of knowledge production in the natural sciences include: quantitative and empirical research methods, value neutrality and logical necessity of knowledge content, specialization and formalization of knowledge expression, collaboration and openness of production process, the progressive and non-historical nature of knowledge development. Based on the above characteristics, the development of academic publishing in this field is more reliable and less difficult.
[Key words] Artificial intelligence Academic publishing Knowledge production Natural science
伴隨著新技術(shù)的發(fā)展和應(yīng)用,知識(shí)的生產(chǎn)、存儲(chǔ)與傳播方式發(fā)生了顛覆性改變。傳統(tǒng)出版企業(yè)作為作者與讀者的中間機(jī)構(gòu),強(qiáng)調(diào)自身的篩選、過(guò)濾、聚合、優(yōu)化和傳播功能,知識(shí)生產(chǎn)的核心主體是作者(高??蒲腥藛T、職業(yè)科學(xué)家、專業(yè)作家等);如今,信息服務(wù)商、科技企業(yè)、出版機(jī)構(gòu)也紛紛活躍于知識(shí)生產(chǎn)的舞臺(tái),尤其是學(xué)術(shù)出版商,掌握著大量的學(xué)術(shù)數(shù)據(jù),不再滿足于知識(shí)的把關(guān)人和傳播者身份[1],力求在知識(shí)生產(chǎn)、優(yōu)化、存儲(chǔ)和傳播等環(huán)節(jié)中發(fā)揮更為重要的參與、服務(wù)作用。
1 智能出版給知識(shí)生產(chǎn)帶來(lái)的新機(jī)遇
AI技術(shù)為學(xué)術(shù)出版商在知識(shí)生產(chǎn)領(lǐng)域的創(chuàng)新性探索提供了契機(jī),傳統(tǒng)出版時(shí)期,書籍制度作為一種固定規(guī)范應(yīng)用到知識(shí)生產(chǎn)中,人類的知識(shí)以有形的方式被切割成有限的文本,集聚在統(tǒng)一的書本中,被賦予序言、目錄、標(biāo)題、后記等形式。這種分割體現(xiàn)了人為的創(chuàng)造與建構(gòu),體現(xiàn)了作者的意志和目的,書籍形態(tài)將作為總體的知識(shí)分門別類,使知識(shí)得以集中表達(dá),但是也有學(xué)者認(rèn)為書籍制度使人類的知識(shí)被不合理地?cái)嗔押凸铝㈤_來(lái)。
信息科學(xué)與AI技術(shù)的進(jìn)步催生了人類科研事業(yè)的革命,知識(shí)生產(chǎn)形式發(fā)生了巨大轉(zhuǎn)變。一方面,圖書再次被分離成一句句話或一個(gè)個(gè)段落,重組成面向用戶需求的新文本,如知網(wǎng)的知識(shí)元搜索、亞馬遜的單章圖書售賣等都是典型例證。另一方面,知識(shí)本身又重新進(jìn)入到更大的統(tǒng)一體中,圖書與圖書、期刊與期刊、學(xué)科與學(xué)科間的界限被打破,知識(shí)借力技術(shù)創(chuàng)新經(jīng)過(guò)聚合優(yōu)化重歸于完整。在知識(shí)生產(chǎn)領(lǐng)域,智能出版的關(guān)鍵作用在于突破學(xué)科間的知識(shí)界限,從而在更大的關(guān)聯(lián)網(wǎng)絡(luò)中深化已有知識(shí)并發(fā)現(xiàn)、培育新知識(shí)的“萌芽”。
2 智能出版對(duì)知識(shí)生產(chǎn)的作用機(jī)理
知識(shí)載體的沿革打破了知識(shí)之間的阻隔,創(chuàng)造了新的知識(shí)流動(dòng)空間,智能出版的核心價(jià)值在于發(fā)現(xiàn)新的知識(shí)[2]??蒲袑?shí)驗(yàn)數(shù)據(jù)、已出版文獻(xiàn)、引用數(shù)據(jù)三者按照時(shí)間次序貫穿于知識(shí)生產(chǎn)前期、中期和后期,數(shù)字密集型科研范式的興起將鼓勵(lì)人工智能技術(shù)全方位地介入知識(shí)生產(chǎn)的整個(gè)流程。
2.1 在已出版文獻(xiàn)中發(fā)現(xiàn)新知識(shí)
新知識(shí)發(fā)現(xiàn)的關(guān)鍵在于發(fā)現(xiàn)新關(guān)聯(lián),有學(xué)者認(rèn)為關(guān)聯(lián)本身就是知識(shí),數(shù)據(jù)當(dāng)中隱藏著大量的知識(shí)內(nèi)容和知識(shí)關(guān)系[3],人的思維依照相似聯(lián)系律進(jìn)行活動(dòng),認(rèn)知過(guò)程貫穿著相似信息的搜索、匹配和基于相似的推理,知識(shí)發(fā)現(xiàn)過(guò)程同樣基于相似性原理并采用挖掘算法發(fā)現(xiàn)新關(guān)聯(lián)[4]。近年來(lái),語(yǔ)義技術(shù)與機(jī)器學(xué)習(xí)的進(jìn)展彌補(bǔ)了傳統(tǒng)知識(shí)發(fā)現(xiàn)方法的不足,提升了相似性判斷的準(zhǔn)確性,改善了知識(shí)發(fā)現(xiàn)的效果,比如愛麗思AI(Iris.AI) [5]的分析技術(shù)將詞語(yǔ)與語(yǔ)境語(yǔ)義結(jié)合,UNSILO的全自動(dòng)內(nèi)容加強(qiáng)技術(shù)能夠?qū)崿F(xiàn)跨專業(yè)的內(nèi)容推薦[6]。
從科學(xué)哲學(xué)和科學(xué)史的角度來(lái)看,科學(xué)研究活動(dòng)遵循一定的程式和規(guī)范,科學(xué)家通過(guò)數(shù)據(jù)驅(qū)動(dòng)歸納和理論驅(qū)動(dòng)歸納兩種方式解決問(wèn)題獲得知識(shí)[7]。前者指科學(xué)家先收集大量數(shù)據(jù),然后總結(jié)、發(fā)現(xiàn)規(guī)律,如施普林格·自然通過(guò)對(duì)大量論文進(jìn)行跨語(yǔ)料自動(dòng)摘要,基于相似性聚類自動(dòng)生成了第一本化學(xué)類書籍[8]。后者理論驅(qū)動(dòng)歸納則要求研究者具有豐富的學(xué)術(shù)想象力,預(yù)先提出假設(shè)作為研究準(zhǔn)備。計(jì)算智能擅于多重推理,研究人員正在嘗試如何基于已有研究結(jié)果來(lái)驗(yàn)證現(xiàn)有的科學(xué)假設(shè),甚至通過(guò)揭示不同文獻(xiàn)的研究發(fā)現(xiàn)彼此之間的聯(lián)系,提出指導(dǎo)實(shí)驗(yàn)的新假設(shè)[9]。這兩種方式在人工智能技術(shù)的推動(dòng)下都能夠?yàn)橹R(shí)的創(chuàng)造、優(yōu)化提供新的路徑。
2.2 從引用數(shù)據(jù)中發(fā)現(xiàn)新知識(shí)
引文數(shù)據(jù)本身蘊(yùn)含了作者對(duì)于文獻(xiàn)的專業(yè)判斷,展現(xiàn)了知識(shí)的進(jìn)化過(guò)程,最初借鑒的文章經(jīng)過(guò)層層引用,實(shí)現(xiàn)了知識(shí)的分化、轉(zhuǎn)變和拓展,表面上知識(shí)的原型已難以辨認(rèn)[10],但通過(guò)引證信息的梳理,我們能夠追溯知識(shí)的基礎(chǔ),發(fā)現(xiàn)學(xué)科的歷史和前沿以及不同學(xué)科之間成熟度的差異,等等[11]。在傳統(tǒng)科研環(huán)境中,知識(shí)間充滿阻礙,知識(shí)的發(fā)展過(guò)程難以辨認(rèn),數(shù)字時(shí)代的科研通過(guò)聚集大量文獻(xiàn)實(shí)現(xiàn)了對(duì)知識(shí)發(fā)展過(guò)程的深度解析。
AI的介入使引用數(shù)據(jù)的分析不再局限于分析知識(shí)的統(tǒng)計(jì)學(xué)特征,而是基于對(duì)引用文獻(xiàn)的內(nèi)容理解,縱深挖掘數(shù)據(jù)中含藏的科研價(jià)值。舉例來(lái)說(shuō),引文在文獻(xiàn)中充當(dāng)?shù)慕巧话阌兴姆N:綜述式、繼承式、啟發(fā)式、批評(píng)式[12]。通過(guò)分析引文角色,可以發(fā)現(xiàn)更多的隱性知識(shí),如多次被肯定性引用的文章通常蘊(yùn)含更豐富的價(jià)值[13],啟發(fā)式引用表明知識(shí)在此實(shí)現(xiàn)了深度轉(zhuǎn)化。AI技術(shù)可通過(guò)對(duì)不同引用方式中引用習(xí)慣、引用形式等信息的分析分辨出引用角色,如否定性引用的上下文中可能出現(xiàn)批評(píng)性、轉(zhuǎn)折性詞匯,肯定性引用的上下文通常直接跟上作者本人的觀點(diǎn),啟發(fā)式引用的表達(dá)相較于原文通常發(fā)生較大改變。這些分析在傳統(tǒng)出版時(shí)代必須由讀者自己根據(jù)專業(yè)知識(shí)和閱讀經(jīng)驗(yàn)來(lái)完成,在智能媒體時(shí)代引文數(shù)據(jù)中潛藏的知識(shí)顯然可以借助技術(shù)的力量來(lái)外顯。
2.3 在原始科研實(shí)驗(yàn)數(shù)據(jù)中發(fā)現(xiàn)新知識(shí)
知識(shí)與知識(shí)的碰撞不僅是知識(shí)間的重新關(guān)聯(lián),也是兩個(gè)知識(shí)形成過(guò)程的關(guān)聯(lián)。傳統(tǒng)出版業(yè)僅僅關(guān)注科研鏈條中最為精華的部分,科研數(shù)據(jù)作為記錄科研原始過(guò)程的非正式信息逐步丟失 [14],這一方面不利于學(xué)術(shù)監(jiān)督和知識(shí)記錄,另一方面也不利于充分挖掘科研數(shù)據(jù)的價(jià)值,造成了社會(huì)資源的浪費(fèi)。
事實(shí)上,隨著數(shù)據(jù)密集型科研范式的提出,科研數(shù)據(jù)管理逐步得到各方的重視,1966 年,國(guó)際科技數(shù)據(jù)委員會(huì)(CODATA)成立,它旨在促進(jìn)全球科技數(shù)據(jù)的評(píng)價(jià)、編輯和分發(fā)工作[15]。國(guó)內(nèi)外高校和基金機(jī)構(gòu)也已經(jīng)不同程度地開展了科研數(shù)據(jù)管理工作[16]。學(xué)術(shù)出版領(lǐng)域出現(xiàn)了數(shù)據(jù)期刊和數(shù)據(jù)論文,諸如《地球系統(tǒng)科學(xué)數(shù)據(jù)》(Earth System Science Date,ESSD)等國(guó)際期刊要求將數(shù)據(jù)作為論文的附錄一同公布,甚至自建了完整的存儲(chǔ)數(shù)據(jù)服務(wù)中心[17]。盡管如此,目前的科研數(shù)據(jù)管理仍存在不少缺憾,比如數(shù)據(jù)標(biāo)準(zhǔn)不一、質(zhì)量粗糙,真正能用于科研的資源較少,智能化的科研數(shù)據(jù)管理將逐步改善數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)的利用率。我們認(rèn)為,科研數(shù)據(jù)出版過(guò)程包括數(shù)據(jù)收集、數(shù)據(jù)審核、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)利用五個(gè)階段,在上述流程中智能出版可以起到非常關(guān)鍵的作用,從知識(shí)服務(wù)的角度看,平臺(tái)化、服務(wù)化、社交化和工具化等趨勢(shì)是未來(lái)科研數(shù)據(jù)出版發(fā)展的重要方向。
3 智能出版在自然科學(xué)知識(shí)生產(chǎn)領(lǐng)域應(yīng)用的可行性
目前,國(guó)內(nèi)學(xué)術(shù)出版企業(yè)在智能出版領(lǐng)域已經(jīng)開展了若干探索,如科學(xué)技術(shù)文獻(xiàn)出版社與AI影像公司鷹瞳(Airdoc)等機(jī)構(gòu)合作探索智能化醫(yī)學(xué)知識(shí)服務(wù) [18],中國(guó)科學(xué)院植物研究所開發(fā)了物種的智能識(shí)別應(yīng)用,以服務(wù)農(nóng)業(yè)、地質(zhì)等學(xué)科發(fā)展[19]。人們已經(jīng)認(rèn)識(shí)到,AI介入知識(shí)生產(chǎn)關(guān)乎人的主體地位,涉及價(jià)值理性、文化發(fā)展與科技倫理等問(wèn)題,AI時(shí)代如何合理地運(yùn)用技術(shù)能夠幫助我們?nèi)ニ伎既绾嗡茉煲粋€(gè)更加健康的出版業(yè)[20]。以下將立足于自然科學(xué)與人文社會(huì)科學(xué)兩大部類的共識(shí)性區(qū)分,探討AI在自然科學(xué)知識(shí)生產(chǎn)領(lǐng)域的應(yīng)用機(jī)制。
3.1 智能化的數(shù)據(jù)獲取、審核和利用
從研究方法的角度看,自然科學(xué)探索真理的根本屬性是定量研究,主要解決“是多大”,“有多少”等問(wèn)題[21],科學(xué)文化的發(fā)展是化質(zhì)為量的坎陷過(guò)程,從依據(jù)審美精神而向上到落于實(shí)然而向下[22]。長(zhǎng)期的科學(xué)訓(xùn)練培養(yǎng)了自然科學(xué)家處理仔細(xì)控制的實(shí)驗(yàn)數(shù)據(jù)的能力[23],定量數(shù)據(jù)的采集則主要通過(guò)實(shí)驗(yàn)、觀察、測(cè)量等方式來(lái)完成 [24]。研究方法的定量化與實(shí)證化為智能化的數(shù)據(jù)獲取、審核與利用提供了天然便利,讓AI賦能自然科學(xué)知識(shí)生產(chǎn)有了廣闊的成長(zhǎng)空間。
智能化的數(shù)據(jù)獲取和數(shù)據(jù)利用。智能化的學(xué)術(shù)環(huán)境正在重塑科學(xué)家進(jìn)行定量實(shí)驗(yàn)的方式,實(shí)證數(shù)據(jù)的獲取不再是一次性的、正式的,各種觀測(cè)、實(shí)驗(yàn)設(shè)備都裝備了智能系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)的智能采集和管理[25]。不僅如此,數(shù)據(jù)本身成為了科研活動(dòng)的研究對(duì)象,科研人員通過(guò)與數(shù)據(jù)打交道發(fā)掘潛在規(guī)律,AI為文獻(xiàn)中的實(shí)驗(yàn)數(shù)據(jù)賦予了深度關(guān)聯(lián)的可能性,打破了實(shí)驗(yàn)數(shù)據(jù)孤立存在的局面,例如在線工具源數(shù)據(jù)(SourceData),能夠?yàn)榭蒲腥藛T提供生物實(shí)驗(yàn)數(shù)據(jù)的搜索,可供查詢實(shí)驗(yàn)中生物對(duì)象間的關(guān)系,相關(guān)團(tuán)隊(duì)還將結(jié)合AI與施普林格·自然(Springer Nature)的基因數(shù)據(jù)幫助腫瘤學(xué)家制定診療方案[26],幫助上述領(lǐng)域的科技工作者針砭數(shù)據(jù)離散導(dǎo)致的痛點(diǎn)。
智能化的數(shù)據(jù)審核和加工。量化精神與實(shí)驗(yàn)驗(yàn)證原則塑造了科學(xué)研究的典型特征,科學(xué)實(shí)驗(yàn)及其產(chǎn)生的數(shù)據(jù)通常構(gòu)成一篇論文的關(guān)鍵部分,各種數(shù)據(jù)、公式、圖表占據(jù)了較大篇幅,純粹的思辨性文本數(shù)量較少。量化數(shù)據(jù)的主觀想象空間小,AI在提取和解讀數(shù)據(jù)的過(guò)程中依據(jù)規(guī)范,不易產(chǎn)生錯(cuò)誤和歧義,因此,AI在科技論文的寫作、編輯、審議過(guò)程中大有作為,比如幫助作者和編輯對(duì)實(shí)驗(yàn)樣本、實(shí)驗(yàn)環(huán)境、實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)方法和數(shù)學(xué)公式進(jìn)行核查和檢驗(yàn)[27];為已知的數(shù)據(jù)自動(dòng)生成曲線圖,或進(jìn)行可視化轉(zhuǎn)換;為數(shù)據(jù)生成描述性文本甚至解讀報(bào)告,有效減輕科研工作者的寫作壓力,提高科學(xué)信息交流的效率。
3.2 智能化的學(xué)術(shù)語(yǔ)言翻譯
從表達(dá)方式上看,相較于人文社會(huì)科學(xué)用語(yǔ)的模糊性、多義性和隱喻性等特征,自然科學(xué)的語(yǔ)言大多語(yǔ)義明晰、指稱單一,概念、定義、范疇的用語(yǔ)力圖擺脫日常語(yǔ)言和人為因素的干擾,專業(yè)性和區(qū)分度強(qiáng),利于精準(zhǔn)辨認(rèn),甚至形成了一套形式化、數(shù)學(xué)化、公理化的語(yǔ)言系統(tǒng),奠定了人工智能進(jìn)行計(jì)算知識(shí)生產(chǎn)的基礎(chǔ)[28],知識(shí)表達(dá)的專業(yè)化與規(guī)范化推動(dòng)了AI在學(xué)術(shù)語(yǔ)言翻譯過(guò)程中的應(yīng)用。
隨著詞典研編從傳統(tǒng)的“編者主體經(jīng)驗(yàn)驅(qū)動(dòng)”轉(zhuǎn)變?yōu)椤罢Z(yǔ)言數(shù)據(jù)驅(qū)動(dòng)”,語(yǔ)料庫(kù)成為語(yǔ)言學(xué)家獲取語(yǔ)言學(xué)知識(shí)的可靠來(lái)源,語(yǔ)料詞典學(xué)的焦點(diǎn)也逐漸轉(zhuǎn)變?yōu)槿绾螐拇笠?guī)模數(shù)據(jù)中提取有效的語(yǔ)料信息[29]。自然語(yǔ)言理解等AI技術(shù)通過(guò)文本挖掘,一方面為語(yǔ)言學(xué)研究提供豐富的養(yǎng)料,另一方面在詞典等產(chǎn)品的編纂過(guò)程中,調(diào)取合適的語(yǔ)料以匹配詞匯、自動(dòng)生成條目?jī)?nèi)容、生產(chǎn)專業(yè)出版物。
學(xué)術(shù)出版商的語(yǔ)料數(shù)據(jù)資源規(guī)模并非最大,但專業(yè)性與學(xué)術(shù)性較強(qiáng)。對(duì)專業(yè)語(yǔ)詞的恰當(dāng)理解離不開特定的學(xué)科語(yǔ)境,尤其是一些專業(yè)名詞及其英文字母縮寫,在網(wǎng)絡(luò)論壇、大眾媒體等日常生活領(lǐng)域和在學(xué)術(shù)共同體內(nèi)部表征的含義常常大相徑庭,甚至在不同的學(xué)科中語(yǔ)義也會(huì)相異。學(xué)術(shù)文獻(xiàn)的累積資源提供了眾多科學(xué)共同體的內(nèi)部語(yǔ)言表達(dá)范例,因此,學(xué)術(shù)出版商若能充分利用自身的學(xué)術(shù)語(yǔ)言資料優(yōu)勢(shì),借助于AI編纂出符合專業(yè)科研人員需求的學(xué)術(shù)詞典,那么不僅在知識(shí)生產(chǎn)方面,詞典研編效率和專業(yè)度將能獲得極大提升;在科研輔助方面,論文的閱讀、寫作效率也將大大提高,比如中國(guó)知網(wǎng)開發(fā)的翻譯助手匯集了從中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)中挖掘出的800余萬(wàn)中英文詞條,依托于實(shí)時(shí)更新的數(shù)據(jù)庫(kù),保障了學(xué)術(shù)翻譯的準(zhǔn)確性和時(shí)效性,為科研工作者提供了學(xué)術(shù)語(yǔ)言翻譯方面的有力支持。
此外,專業(yè)化、形式化的語(yǔ)言表達(dá)有利于建構(gòu)一套系統(tǒng)的通用學(xué)科語(yǔ)言規(guī)范,為智能知識(shí)服務(wù)開發(fā)提供便利條件,節(jié)省轉(zhuǎn)換成本,例如人民衛(wèi)生出版社開發(fā)的系列醫(yī)學(xué)知識(shí)服務(wù)系統(tǒng),就是在醫(yī)學(xué)系統(tǒng)命名法—臨床術(shù)語(yǔ)的架構(gòu)以及各個(gè)國(guó)內(nèi)外術(shù)語(yǔ)表的基礎(chǔ)上建立起來(lái)的[30]。 這種共識(shí)性的語(yǔ)言規(guī)范在提高學(xué)術(shù)交流效率方面顯然更有優(yōu)勢(shì)。
3.3 智能化的信息關(guān)聯(lián)與知識(shí)推理
從內(nèi)容特征上看,高度發(fā)達(dá)的概念框架使科學(xué)依據(jù)邏輯必然性向前發(fā)展,新事物在相當(dāng)大程度上是從科學(xué)知識(shí)的已有結(jié)構(gòu)中派生出來(lái)的[31]。有研究者指出[32],形式邏輯、線性理性恰恰是最容易被計(jì)算機(jī)化的,而直觀能力、主觀情感卻難以被AI模仿,價(jià)值中立性使得自然科學(xué)領(lǐng)域的AI應(yīng)用可以揚(yáng)長(zhǎng)避短,發(fā)揮相對(duì)理想的作用。
機(jī)器自動(dòng)發(fā)現(xiàn)知識(shí)間的新關(guān)聯(lián)。在自然科學(xué)領(lǐng)域,知識(shí)間的關(guān)聯(lián)避免了主觀情感與倫理道德上的價(jià)值判斷,依存于較為簡(jiǎn)明的邏輯關(guān)系(如因果關(guān)系、分類關(guān)系等),更有學(xué)者提出數(shù)據(jù)密集型科研關(guān)注相關(guān)性而非因果性[33],相關(guān)性關(guān)涉概率與統(tǒng)計(jì),價(jià)值上保持客觀中立,比如在生物醫(yī)學(xué)領(lǐng)域,可通過(guò)相互關(guān)聯(lián)的數(shù)據(jù)系統(tǒng)發(fā)現(xiàn)阿爾茨海默病與某一具體單核苷酸多態(tài)性(Single Nucleotide ?Polymorphism,SNP)的關(guān)系[34]。在醫(yī)學(xué)知識(shí)庫(kù)的構(gòu)建中,董良廣提出[35],如果A表示一種物質(zhì)的攝入可能導(dǎo)致某生理改變B,而B的生理變化又引發(fā)某一器官的疾病C,D藥物是治療疾病C的非針對(duì)性藥物,這樣就可快速獲得A作用于C和D并影響B(tài)的有用信息,ABCD間的邏輯關(guān)系便于AI快速抓取關(guān)鍵信息。這種新的關(guān)聯(lián)如果靠傳統(tǒng)的知識(shí)生產(chǎn)方式(主要依賴個(gè)體經(jīng)驗(yàn)和思維慣性)來(lái)完成,顯然是比較困難的。
增強(qiáng)科研人員的預(yù)估能力??茖W(xué)預(yù)測(cè)的正確與否是檢驗(yàn)科學(xué)理論的重要標(biāo)準(zhǔn),AI的引入解決了人類難以應(yīng)對(duì)的復(fù)雜推理和計(jì)算,從而增強(qiáng)了科研人員的預(yù)估能力,使科研工作者能發(fā)現(xiàn)簡(jiǎn)單實(shí)驗(yàn)無(wú)法呈現(xiàn)的深層規(guī)律和內(nèi)在機(jī)制。在化學(xué)領(lǐng)域,約翰威立國(guó)際出版公司與美國(guó)化學(xué)文摘社合作,將文摘社的化學(xué)信息與威利公司(Wiley)的化學(xué)合成軟件(Chem Planner)技術(shù)結(jié)合,加速預(yù)測(cè)合成反應(yīng)路線的發(fā)展[36]。正是沿著邏輯必然性的規(guī)律,AI技術(shù)根據(jù)已有化學(xué)公式與大量化學(xué)反應(yīng)數(shù)據(jù),自動(dòng)地完成推理運(yùn)算過(guò)程,預(yù)測(cè)出反應(yīng)結(jié)果,提出了具有預(yù)判價(jià)值的觀點(diǎn),幫助化學(xué)家在目標(biāo)分子和可獲得的起始原料之間選擇最優(yōu)合成路線,提高了新分子的開發(fā)效率,節(jié)約了實(shí)驗(yàn)成本,推動(dòng)化學(xué)領(lǐng)域的知識(shí)發(fā)現(xiàn)。
3.4 推動(dòng)科學(xué)家的合作與知識(shí)分享
從知識(shí)生產(chǎn)過(guò)程來(lái)看,科學(xué)知識(shí)的生產(chǎn)有賴于科學(xué)共同體的互動(dòng)與合作,科學(xué)思想的無(wú)障礙交流和擴(kuò)散離不開科學(xué)知識(shí)的公開 [37]。在智能技術(shù)應(yīng)用普及的時(shí)代背景下,科學(xué)知識(shí)在公開的深度、廣度、即時(shí)性上達(dá)到前所未有的程度,為科學(xué)家間的分享、協(xié)作奠定堅(jiān)實(shí)的基礎(chǔ)。
提升知識(shí)公開的速度與深度。有效的科學(xué)知識(shí)是通過(guò)公開的辯論、協(xié)商、審查、批判和重新表達(dá)而幸存下來(lái)的[38],知識(shí)的快速分享與發(fā)布提高了學(xué)術(shù)信息交流的活躍度,加快了科技創(chuàng)新的速度,AI技術(shù)在選題策劃、編輯校對(duì)、價(jià)值評(píng)審、精準(zhǔn)發(fā)布等方面全方位提升了學(xué)術(shù)出版的速度,比如智能化的同行評(píng)審篩選工具能夠?yàn)榇l(fā)表的稿件快速地匹配合適的審稿人[39]。不僅如此,研究要素的出版以及虛擬學(xué)術(shù)社區(qū)的建立同樣提高了學(xué)術(shù)成果的公開性和知識(shí)分享的自由度。愛思唯爾(Elsevier) [40]、施普林格(Springer)等出版商通過(guò)數(shù)據(jù)論文、負(fù)面研究結(jié)果集、數(shù)據(jù)筆記等文章類型,發(fā)表了研究過(guò)程中的數(shù)據(jù)資料、與學(xué)界主流相悖的研究成果,保障弱勢(shì)學(xué)術(shù)意見的發(fā)表權(quán)利,施普林格推出學(xué)術(shù)社交工具易分享(Sharelt)[41],幫助作者將科研論文免費(fèi)版鏈接發(fā)送到社交媒體、作者網(wǎng)站和機(jī)構(gòu)倉(cāng)儲(chǔ)等各個(gè)平臺(tái),以最快的速度幫助研究者提升其成果的國(guó)際學(xué)術(shù)影響力。此外,知識(shí)分享行為的分析也日益智能化,例如可以利用AI辨析一篇文獻(xiàn)中被引用的研究要素,如實(shí)驗(yàn)數(shù)據(jù)、實(shí)驗(yàn)方法甚至單個(gè)假設(shè)的引用情況等。從這些行為數(shù)據(jù)的分析結(jié)果中,可以看到一些學(xué)科演化的軌跡,以及科學(xué)家互動(dòng)的規(guī)律。
改善科研人員交流方式。在傳統(tǒng)的科研環(huán)境中,由于實(shí)驗(yàn)過(guò)程中的原始數(shù)據(jù)和細(xì)節(jié)信息未能獲得出版機(jī)會(huì),研究者無(wú)法看到一個(gè)結(jié)論背后的細(xì)節(jié)和完整的發(fā)展過(guò)程。科研數(shù)據(jù)的智能化出版使科學(xué)研究的實(shí)驗(yàn)環(huán)境更加清晰地重現(xiàn),不同時(shí)間、不同地點(diǎn)的科研工作者們可以通過(guò)智能化科研網(wǎng)絡(luò)遠(yuǎn)程合作,相互啟發(fā)思維、共同利用實(shí)驗(yàn)數(shù)據(jù)、核查科研成果。杰貝·威爾遜(Jebel Wilson)[42]認(rèn)為,人工智能技術(shù)將不斷地改善科學(xué)工作者的交流方式,鼓勵(lì)研究人員通過(guò)合作網(wǎng)絡(luò)分享觀點(diǎn),科學(xué)家們將更傾向于跨地區(qū)、跨領(lǐng)域合作以實(shí)現(xiàn)更有價(jià)值的科研創(chuàng)新。
3.5 智能化預(yù)測(cè)學(xué)科領(lǐng)域前沿
從知識(shí)發(fā)展過(guò)程來(lái)看,科學(xué)發(fā)展具有毋庸置疑的進(jìn)步性,科學(xué)哲學(xué)家托馬斯·庫(kù)恩(Thomas Kuhn)認(rèn)為[43],科學(xué)革命本質(zhì)上是一個(gè)新范式徹底取代舊范式的過(guò)程,成功的科學(xué)發(fā)現(xiàn)并不需要熟記學(xué)科的發(fā)展歷史,科學(xué)家們只需專注于前沿問(wèn)題的探究??茖W(xué)創(chuàng)新加速度前進(jìn),科技期刊編輯尤其需要具備追蹤前沿的素養(yǎng),預(yù)測(cè)學(xué)科發(fā)展的趨勢(shì)。湯森路透(Thomson Reuters)與全球研究機(jī)構(gòu)合作,通過(guò)分析核心文獻(xiàn)及其引用行為來(lái)捕捉學(xué)術(shù)熱點(diǎn)[44],愛思唯爾充分利用用戶的行為數(shù)據(jù),通過(guò)分析用戶搜索頻率較高的關(guān)鍵詞來(lái)判斷熱點(diǎn)學(xué)科[45]。此外,隨著機(jī)器學(xué)習(xí)與信息抽取技術(shù)在知識(shí)圖譜領(lǐng)域的應(yīng)用,前沿知識(shí)圖譜的構(gòu)建也日益智能化、可視化,參考價(jià)值日益提升。
與文獻(xiàn)計(jì)量和大數(shù)據(jù)分析不同,AI介入選題分析還可以以信息整理的方式進(jìn)行,通過(guò)對(duì)學(xué)術(shù)動(dòng)態(tài)信息的自動(dòng)獲取,整合生成完整的學(xué)術(shù)前沿報(bào)告。傳統(tǒng)科技編輯通過(guò)追蹤權(quán)威學(xué)者的研究動(dòng)態(tài)、權(quán)威數(shù)據(jù)庫(kù)和權(quán)威期刊的文獻(xiàn)出版、國(guó)家的科技政策、國(guó)家級(jí)科研項(xiàng)目立項(xiàng)通知、學(xué)術(shù)會(huì)議主題設(shè)置等信息,把握學(xué)科的前沿動(dòng)態(tài)[46],但是這些信息內(nèi)容混雜、價(jià)值不一、分布離散、更新頻繁,編輯與學(xué)者想要全面地把握這些信息須耗費(fèi)大量的時(shí)間精力。學(xué)術(shù)出版商可通過(guò)自動(dòng)抓取新的政策、會(huì)議、項(xiàng)目信息,追蹤學(xué)科內(nèi)核心學(xué)者的研究行為,對(duì)新發(fā)表的核心論文進(jìn)行自動(dòng)摘要處理和關(guān)鍵詞分析,并將這些內(nèi)容進(jìn)行全方位的整合、分析,生成研究前沿的綜合報(bào)告以提供選題參考,以指導(dǎo)研究者的學(xué)術(shù)寫作和出版活動(dòng)。
4 結(jié) 語(yǔ)
遵循社會(huì)、文化、市場(chǎng)和技術(shù)環(huán)境的演變邏輯,出版商升級(jí)為知識(shí)服務(wù)商的趨向愈來(lái)愈清,出版業(yè)關(guān)注的幾大主題始終是:“出版能提供什么樣的知識(shí)服務(wù)、能通過(guò)什么樣的方式提供知識(shí)服務(wù)”,AI技術(shù)在科學(xué)交流中的融合應(yīng)用,無(wú)疑為知識(shí)生產(chǎn)類型的豐富和知識(shí)傳播方式的創(chuàng)新提供了更多可能[47]。AI技術(shù)在學(xué)術(shù)出版領(lǐng)域的核心價(jià)值在于協(xié)助科研人員在更短時(shí)間內(nèi)發(fā)現(xiàn)新知識(shí)?;谥R(shí)生產(chǎn)邏輯的差別,在一段時(shí)間內(nèi)AI技術(shù)更適用于自然科學(xué)領(lǐng)域知識(shí)的生產(chǎn),人文社會(huì)科學(xué)領(lǐng)域由于其倫理價(jià)值的原生性特質(zhì),而使AI技術(shù)徘徊于核心圈層之外。盡管如此,探討AI在人文社科領(lǐng)域的應(yīng)用邊界不可回避且有著不容輕忽的意義,受篇幅所限本文未能深入探討。
概而言之,目前智能化的知識(shí)發(fā)現(xiàn)成果大多出自科研院所和高校實(shí)驗(yàn)室,學(xué)術(shù)出版商在知識(shí)生產(chǎn)方面的探索還處于起步階段,并且大多尚處于輔助地位。本研究對(duì)出版領(lǐng)域知識(shí)生產(chǎn)功能的探索,可以拓寬科學(xué)工作者和學(xué)術(shù)出版商的創(chuàng)新思路,對(duì)學(xué)術(shù)出版企業(yè)提高應(yīng)用智能技術(shù)實(shí)現(xiàn)創(chuàng)新等問(wèn)題提供了啟示。展望未來(lái),學(xué)術(shù)出版商如何從整體學(xué)術(shù)環(huán)境和技術(shù)應(yīng)用趨勢(shì)出發(fā),搭建智能化出版平臺(tái)幫助科研團(tuán)隊(duì)和機(jī)構(gòu)更好地開展學(xué)術(shù)創(chuàng)新是后續(xù)研究的核心問(wèn)題,而不同學(xué)科領(lǐng)域、不同類型的科研合作方式對(duì)智能學(xué)術(shù)出版平臺(tái)的功能價(jià)值、服務(wù)內(nèi)涵有不同要求,因此,分類探究不同類型智能學(xué)術(shù)出版平臺(tái)及其服務(wù)創(chuàng)新模式將是下一步研究的重點(diǎn)。
注 釋
[1]賀鈺瀅.知識(shí)生產(chǎn)與傳播[D].武漢:武漢大學(xué),2018:1-14
[2]王曉光.人工智能與出版的未來(lái)[J].科技與出版,2017(11):4-6
[3]張曉林.重新認(rèn)識(shí)知識(shí)過(guò)程和知識(shí)服務(wù)[J].圖書情報(bào)工作,2009,53(1):6-8
[4][7]楊炳儒.基于內(nèi)在機(jī)理的知識(shí)發(fā)現(xiàn)理論及其應(yīng)用[M].北京:電子工業(yè)出版社,2004:1-2,211-212
[5]互聯(lián)網(wǎng)金融. Iris.AI:讓人工智能成為你的科研助手[EB/OL]. [2020-11-04]. http://www.Shedejie.com/mingmei/98183.html
[6]任翔.學(xué)術(shù)傳播的數(shù)據(jù)化與智能化:2017年歐美學(xué)術(shù)出版產(chǎn)業(yè)發(fā)展評(píng)述[J].科技與出版,2018(2):6-12
[8]王宏澤.施普林格自然第一本由機(jī)器生成的書籍問(wèn)世[EB/OL]. [2020-12-14]. http://news.gmw.cn/2019-04/03/content_32713781.htm
[9][26]Andy E.How AI technology can tame the scientific literature[J]. Nature,2018,561(7722):273-274
[10]梁永霞,劉則淵,楊中楷.引文分析學(xué)的知識(shí)流動(dòng)理論探析[J].科學(xué)研究,2010,28(5):668-674
[11][12][13]蘇新寧,朱云霞.面向知識(shí)服務(wù)的引文索引數(shù)據(jù)組織研究(Ⅰ):引用數(shù)據(jù)特征及其作用分析[J].圖書與情報(bào),2013(05):1-6
[14]鄧仲華,李志芳.基于情報(bào)學(xué)視角的科學(xué)研究第四范式需求分析[J].情報(bào)科學(xué),2015,33(7):3-6,20
[15]劉磊.從數(shù)據(jù)科學(xué)到第四范式:大數(shù)據(jù)研究的科學(xué)淵源[J].廣告大觀(理論版),2016(2):44-52
[16]彭鑫,鄧仲華.數(shù)據(jù)密集型科研環(huán)境下的科研數(shù)據(jù)管理框架研究[J].數(shù)字圖書館論壇,2017(7):61-67
[17]梁子裕.國(guó)外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究,2017(3):82-85
[18]胡紅亮,郭傳斌.行業(yè)生態(tài)變革中的醫(yī)學(xué)知識(shí)服務(wù)模式創(chuàng)新:以科學(xué)技術(shù)文獻(xiàn)出版社醫(yī)學(xué)出版轉(zhuǎn)型為例[J].出版科學(xué),2018,26(4):47-51
[19]李敏.“花伴侶”:人工智能時(shí)代知識(shí)服務(wù)的新媒介[J].出版參考,2018(8):23-24
[20]王鵬濤.出版業(yè)智能化發(fā)展研究的學(xué)術(shù)構(gòu)想:關(guān)鍵維度與可用視角[J].新聞界,2018(11):95-100
[21]梁祝平.自然科學(xué)與社會(huì)科學(xué)方法的異同及其啟示[J].學(xué)術(shù)論壇,2000(3):12-15
[22]崔樹芝.牟宗三對(duì)西方科學(xué)源流的反思[J].孔子研究,2018(6):122-129
[23]孫小禮.自然科學(xué)方法與社會(huì)科學(xué)方法的相互借鑒和結(jié)合[J].清華大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2005(1):76-80
[24]李醒民.論科學(xué)經(jīng)驗(yàn)方法[J].社會(huì)科學(xué)論壇(學(xué)術(shù)評(píng)論卷),2009(2):5-25
[25][33]黃欣榮.數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)及其哲學(xué)問(wèn)題[J].自然辯證法研究,2015,31(11):48-54
[27]向颯.人工智能對(duì)學(xué)術(shù)出版流程的再造及知識(shí)服務(wù)提升[J].中國(guó)科技期刊研究,2018,29(11):1091-1096
[28][37]李醒民.知識(shí)的三大部類:自然科學(xué)、社會(huì)科學(xué)和人文學(xué)科[J].學(xué)術(shù)界,2012(8):5-33,286
[29]耿云冬,魏向清.科學(xué)研究“第四范式”轉(zhuǎn)向與詞典編纂技術(shù)特征創(chuàng)新研究[J].外語(yǔ)電化教學(xué),2017(2):65-70
[30][35]董良廣.出版企業(yè)基于人工智能開展知識(shí)服務(wù)的路徑探索:以人民衛(wèi)生出版社為例[J].出版廣角,2017(14):16-19
[31]伯納德·巴伯.科學(xué)與社會(huì)秩序[M].北京:生活·讀書·新知三聯(lián)書店,1991:21-22
[32]張祥龍.人工智能與廣義心學(xué):深度學(xué)習(xí)和本心的時(shí)間含義芻議[J].哲學(xué)動(dòng)態(tài),2018(4):13-22
[34]洪娜,錢慶,范煒,等.關(guān)聯(lián)數(shù)據(jù)中關(guān)系發(fā)現(xiàn)的可視化實(shí)踐[J].現(xiàn)代圖書情報(bào)技術(shù),2013(2):11-17
[36]美國(guó)化學(xué)文摘社.約翰威立國(guó)際出版公司與美國(guó)化學(xué)文摘社宣布合作聯(lián)手為全球科研人員提供先進(jìn)的預(yù)測(cè)化學(xué)信息工具[J].上海醫(yī)藥,2017,38(11):32
[38]郭榮茂.共建:科學(xué)知識(shí)生產(chǎn)過(guò)程的“社會(huì)”品格[J].自然辯證法通訊,2018,40(5):88-94
[39]劉銀娣.學(xué)術(shù)出版領(lǐng)域的人工智能應(yīng)用:現(xiàn)狀、挑戰(zhàn)與應(yīng)對(duì)[J].科技與出版,2019, 289(1):64-68
[40]方卿,王一鳴,李舒格.技術(shù)的閘門已開啟:2016年海外學(xué)術(shù)出版技術(shù)熱點(diǎn)分析[J].科技與出版,2017(2):15-19
[41][47]叢挺.基于知識(shí)鏈的全球?qū)W術(shù)出版服務(wù)模式創(chuàng)新研究[J].出版科學(xué),2018,26(1):27-32
[42]杰貝·威爾遜.2018年AI如何在學(xué)術(shù)出版中落地[EB/OL].[2021-06-19].http: // www.cp.com.cn//content /2018 /03-21/1433213430.Html
[43]托馬斯·庫(kù)恩.科學(xué)革命的結(jié)構(gòu)[M].北京:北京大學(xué)出版社,2012:85-87
[44]King C,Pendlebury D. 2013研究前沿:自然科學(xué)與社會(huì)科學(xué)的前100個(gè)探索領(lǐng)域[J].科學(xué)觀察,2013(4):1-21
[45]胡英奎,游濱,王秀玲,等.科技期刊編輯跟蹤學(xué)術(shù)前沿的途徑[J].編輯學(xué)報(bào),2010,22(4):307-308
[46]方卿,王一鳴. 論出版的知識(shí)服務(wù)屬性與出版轉(zhuǎn)型路徑[J].出版科學(xué),2020,28(1):22-29
(收稿日期:2021-07-25)