顏世健,喻國(guó)明
(北京師范大學(xué) 新聞傳播學(xué)院,北京 100875)
科學(xué)研究的目的是對(duì)于事物本質(zhì)的研究和探索,如今人工智能開(kāi)始越來(lái)越多地融入科學(xué)發(fā)現(xiàn)中,加速了科學(xué)研究的進(jìn)程,幫助科學(xué)家提出假設(shè)、設(shè)計(jì)實(shí)驗(yàn)、收集和解釋大量數(shù)據(jù),并獲得傳統(tǒng)科學(xué)方法難以實(shí)現(xiàn)的洞見(jiàn)。(1)Wang H, Fu T, Du Y, et al. Scientific discovery in the age of artificial intelligence[J]. Nature, 2023, 620(7972).當(dāng)生成式AI正在深度嵌入社會(huì)的千行百業(yè),當(dāng)人工智能技術(shù)與科學(xué)研究相遇時(shí),“AI For Science”的概念應(yīng)運(yùn)而生。AI for Science,也被稱為科學(xué)智能,是指利用人工智能的技術(shù)和方法,去研究、模擬、預(yù)測(cè)和優(yōu)化自然界和人類社會(huì)的各種現(xiàn)象和規(guī)律。智能技術(shù)與科學(xué)研究的耦合可以幫助科學(xué)家們更深入地理解自然和人類社會(huì),推動(dòng)科學(xué)發(fā)現(xiàn)和創(chuàng)新。
現(xiàn)代科學(xué)發(fā)展的主要困境之一在于“維數(shù)災(zāi)難”,即隨著自由度的增加,計(jì)算復(fù)雜度呈指數(shù)增加。計(jì)算的復(fù)雜性源于數(shù)據(jù)的爆炸式增長(zhǎng),在生物學(xué)、天文學(xué)、社會(huì)科學(xué)等領(lǐng)域,數(shù)據(jù)的收集和存儲(chǔ)已經(jīng)超出了人類的分析和理解能力。(2)李萬(wàn),鄒蕓.數(shù)字技術(shù)與數(shù)字經(jīng)濟(jì):從無(wú)盡前沿到創(chuàng)新策源[J].科技智囊,2023,(09).傳統(tǒng)的數(shù)學(xué)方法在處理高維度的復(fù)雜問(wèn)題時(shí)往往費(fèi)時(shí)又費(fèi)力,即便是在高性能計(jì)算機(jī)的輔助下仍然難以克服維度增加所帶來(lái)的計(jì)算困境。但隨著AI技術(shù)在科學(xué)研究中的應(yīng)用,特別是深度學(xué)習(xí)(Deep Learning)的應(yīng)用,讓科學(xué)研究的計(jì)算困境遇到了破局的曙光。深度學(xué)習(xí)可以通過(guò)構(gòu)建人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)的方式自動(dòng)地從大量的數(shù)據(jù)中提取特征和模式,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的高效處理和挖掘,使得那些復(fù)雜、高維度和多變量的問(wèn)題逐漸變得可及??傮w來(lái)看,人工智能在科學(xué)研究的破局點(diǎn)在于通過(guò)深度學(xué)習(xí)等技術(shù)分析處理多維度、多模態(tài)、多場(chǎng)景下的模擬和真實(shí)數(shù)據(jù),解決復(fù)雜推演等計(jì)算問(wèn)題,加快科學(xué)研究的發(fā)現(xiàn)、驗(yàn)證和應(yīng)用。
“AI For Science”如今已經(jīng)在科學(xué)實(shí)踐領(lǐng)域取得了令人矚目的成果。例如,在生物科學(xué)領(lǐng)域,谷歌旗下的DeepMind公司開(kāi)發(fā)的AlphaFold2系統(tǒng)利用深度學(xué)習(xí)對(duì)蛋白質(zhì)折疊結(jié)構(gòu)進(jìn)行預(yù)測(cè)。這是第一種在已知沒(méi)有相似結(jié)構(gòu)的情況下構(gòu)建高分辨率預(yù)測(cè)的方法,可以在幾分鐘內(nèi)預(yù)測(cè)由人類基因組編碼和20個(gè)模式生物的幾乎所有已知蛋白,并精確到原子級(jí)。(3)Callaway E. DeepMind’s AI predicts structures for a vast trove of proteins[J]. Nature, 2021,595(7869).AlphaFold2顛覆了蛋白結(jié)構(gòu)解析,這種變革性方法破解了50年來(lái)困擾生物醫(yī)學(xué)研究領(lǐng)域的困境,開(kāi)啟了計(jì)算生物學(xué)的新時(shí)代。這些結(jié)果充分展示了生命科學(xué)的AI基礎(chǔ)模型在理解和生成蛋白質(zhì)序列方面的強(qiáng)大能力和廣闊的應(yīng)用前景,從而加速了與之相關(guān)的藥物設(shè)計(jì)、酶催化、蛋白質(zhì)結(jié)合、配體設(shè)計(jì)等領(lǐng)域的研究。
隨著AI技術(shù)的不斷發(fā)展,生命科學(xué)大模型和蛋白質(zhì)生成等領(lǐng)域的成果將會(huì)不斷向其他學(xué)科開(kāi)枝散葉,為整個(gè)科學(xué)界提供更多的工具和方法來(lái)解決現(xiàn)實(shí)世界中的復(fù)雜問(wèn)題。作為新興的科學(xué)問(wèn)題解決方案,以AI支撐前沿科技發(fā)展的新模式正在改變科學(xué)研究的方式,加速科學(xué)發(fā)現(xiàn)的進(jìn)程,引發(fā)了科學(xué)研究范式的新革命,并產(chǎn)生廣泛的社會(huì)影響。(4)李建會(huì),楊寧.AI for Science:科學(xué)研究范式的新革命[J].廣東社會(huì)科學(xué),2023,(06).在此判斷之上,我們需要看到人工智能作為媒介在科學(xué)研究中的功能統(tǒng)合作用和跨學(xué)科的知識(shí)整合價(jià)值。為了更清楚地探究以技術(shù)為導(dǎo)向的人工智能在學(xué)術(shù)研究領(lǐng)域的媒介價(jià)值和革命性突破,需要將其與現(xiàn)有的科學(xué)生產(chǎn)流相結(jié)合來(lái)分析。結(jié)合AI for Science的概念和AI引導(dǎo)科研工作的不同層面,我們將這種AI技術(shù)對(duì)學(xué)術(shù)生產(chǎn)的賦能定義為智能科學(xué)范式。
以大語(yǔ)言模型為基礎(chǔ)的智能科學(xué)范式,不僅僅是一種技術(shù)工具,更是一種全新的知識(shí)生產(chǎn)方式和實(shí)踐規(guī)范。它將AI技術(shù)引入到科研工作流中,通過(guò)人機(jī)協(xié)同的方式,對(duì)自然和人類社會(huì)規(guī)律進(jìn)行深入學(xué)習(xí)和探索。在智能科學(xué)范式中,人機(jī)協(xié)同是關(guān)鍵,即研究者與大語(yǔ)言模型相輔相成,相互促進(jìn)。模型通過(guò)大規(guī)模學(xué)習(xí)和信息處理為研究者提供龐大的知識(shí)庫(kù)和有價(jià)值的建議與預(yù)測(cè),而研究者則通過(guò)人類的創(chuàng)造性思維和專業(yè)知識(shí),對(duì)模型的輸出進(jìn)行指導(dǎo)和優(yōu)化。這種協(xié)同方式不僅提高了科研效率,還使得科研更加精準(zhǔn)和深入。
智能科學(xué)范式不僅僅局限于傳統(tǒng)學(xué)科的研究,更開(kāi)啟了跨學(xué)科合作的新時(shí)代,使得各領(lǐng)域的專家能夠借助大語(yǔ)言模型的智能分析和綜合能力,快速獲取和理解其他領(lǐng)域的前沿知識(shí),從而推動(dòng)科學(xué)研究的全面協(xié)同和創(chuàng)新發(fā)展。這種深度融合的模式不僅拓展了科研思路,也為解決復(fù)雜問(wèn)題提供了更為全面和高效的途徑,為人類在各個(gè)領(lǐng)域取得更為深遠(yuǎn)的突破奠定了基礎(chǔ)。
圖1 智能科學(xué)范式的基本內(nèi)容
此外,通過(guò)與模型的互動(dòng)和協(xié)同學(xué)習(xí),研究者能夠?qū)徱曌陨淼难芯科谩⒄J(rèn)知偏差以及潛在的盲點(diǎn)。大語(yǔ)言模型作為研究輔助,不僅可以提供對(duì)已有知識(shí)的系統(tǒng)性理解,還能夠幫助研究者挖掘和理解潛在的概念關(guān)聯(lián),從而拓展其認(rèn)知邊界。通過(guò)模型的智能分析,研究者能夠獲取更為全面和深入的知識(shí)結(jié)構(gòu),發(fā)現(xiàn)平常容易被忽視的模式和關(guān)聯(lián)。這種對(duì)知識(shí)的深層理解有助于研究者超越傳統(tǒng)思維模式,拓展自我認(rèn)知的邊界。
根據(jù)以上的分析,本文將智能科學(xué)范式的概念定義為:將AI技術(shù)作為增強(qiáng)工具介入科研工作流,以人機(jī)協(xié)同和跨學(xué)科的方式去學(xué)習(xí)、模擬、預(yù)測(cè)自然和人類社會(huì)規(guī)律的一種知識(shí)生產(chǎn)規(guī)范,通過(guò)提升科研效率與精準(zhǔn)度的方式來(lái)不斷深化人的自我認(rèn)知。
智能研究方法貫穿于科學(xué)研究工作流的全過(guò)程,具體來(lái)說(shuō)可以分為功用層、研究層和思維層。
1.功用層:效率提升與理解增強(qiáng)
功用層的AI賦能主要體現(xiàn)為文獻(xiàn)閱讀和學(xué)術(shù)寫(xiě)作過(guò)程中的輔助性增強(qiáng)。首先,文獻(xiàn)閱讀環(huán)節(jié)的智能支持包括智能翻譯、對(duì)話式輔助閱讀和文獻(xiàn)資源管理等,可以幫助研究者更有效率地進(jìn)行知識(shí)吸收。在文獻(xiàn)管理方面,一些基于生成式AI的工具根據(jù)用戶發(fā)出的指令可以跨語(yǔ)言和跨數(shù)據(jù)庫(kù)地檢索相關(guān)文獻(xiàn),將最大范圍內(nèi)的代表性文獻(xiàn)進(jìn)行匯總和整理后呈現(xiàn)在用戶面前。(5)Golan R, Reddy R, Muthigi A, et al. Artificial intelligence in academic writing: a paradigm-shifting technological advance[J]. Nature Reviews Urology, 2023.基于對(duì)用戶的閱讀習(xí)慣和興趣點(diǎn)的自動(dòng)學(xué)習(xí)和識(shí)別,生成式AI可以個(gè)性化推薦相關(guān)文獻(xiàn),幫助用戶更快地找到潛在的有價(jià)值的研究資料。在文獻(xiàn)閱讀的過(guò)程中,生成式AI可以幫助用戶實(shí)現(xiàn)精細(xì)化閱讀,實(shí)現(xiàn)快速檢索、AI文本分析、論文追蹤、高亮解讀以及解讀數(shù)學(xué)和表格等,不僅提升了閱讀文獻(xiàn)的速度,更有助于高效地進(jìn)行特定主題的結(jié)構(gòu)化閱讀和系統(tǒng)化研究。如Zotero-GPT可以幫助用戶在閱讀一定數(shù)量的文獻(xiàn)后自動(dòng)生成報(bào)告,報(bào)告包括文獻(xiàn)的概述、主要觀點(diǎn)、研究方法和結(jié)果等方面的內(nèi)容,有助于用戶更好地了解文獻(xiàn)的整體情況,為后續(xù)的研究提供參考。
其次,學(xué)術(shù)寫(xiě)作環(huán)節(jié)的智能支持包括輔助寫(xiě)作、智能校對(duì)、文章潤(rùn)色等。目前,許多科研輔助工具如智能寫(xiě)作平臺(tái)和語(yǔ)言校對(duì)軟件已經(jīng)廣泛運(yùn)用于學(xué)術(shù)領(lǐng)域。這些工具基于自然語(yǔ)言處理技術(shù),能夠自動(dòng)生成文稿、修正語(yǔ)法和拼寫(xiě)錯(cuò)誤,甚至提供邏輯一致性檢測(cè)。對(duì)于科研人員來(lái)說(shuō),這些AI工具能夠極大地提高論文書(shū)寫(xiě)的效率,降低語(yǔ)言錯(cuò)誤率,從而為提升論文質(zhì)量提供有力保障。以寫(xiě)作潤(rùn)色功能為例,在知識(shí)推理上,生成式AI能模擬人腦思維方式并持續(xù)優(yōu)化思維能力,通過(guò)思維鏈(Chain-of-Thought,CoT)完成一系列復(fù)雜推理任務(wù)。用戶只需提供推理的前提和目的,它就能生產(chǎn)出邏輯一致的文本內(nèi)容,高度還原客觀知識(shí)本身。在知識(shí)表達(dá)上,生成式AI能夠基于推理過(guò)程連貫地表達(dá)學(xué)術(shù)觀點(diǎn),通過(guò)解讀人類模塊化撰稿的各種特征,模仿不同學(xué)者內(nèi)容創(chuàng)作的特色進(jìn)行續(xù)寫(xiě),或根據(jù)不同期刊的風(fēng)格對(duì)論文進(jìn)行改寫(xiě)和潤(rùn)色。(6)盧宇,余京蕾,陳鵬鶴,等.生成式人工智能的教育應(yīng)用與展望——以ChatGPT系統(tǒng)為例[J].中國(guó)遠(yuǎn)程教育,2023,43(4).
2.研究層:邊界突破與能力躍升
生成式AI在研究層的賦能指人工智能在科研實(shí)踐流程的介入。盡管科學(xué)實(shí)踐和程序在科學(xué)研究的各個(gè)階段有所不同,但人工智能算法的發(fā)展跨越了傳統(tǒng)上孤立的學(xué)科,增強(qiáng)了科學(xué)研究的設(shè)計(jì)和執(zhí)行。研究人員可以通過(guò)人工智能技術(shù)來(lái)優(yōu)化參數(shù)和功能,自動(dòng)化收集、可視化和處理數(shù)據(jù)的程序,探索候選假設(shè)的廣闊空間以形成理論,生成假設(shè)并估計(jì)其不確定性以提出相關(guān)實(shí)驗(yàn)??茖W(xué)界目前較為認(rèn)可的AI賦能科研流程的環(huán)節(jié)包括數(shù)據(jù)收集與管理、數(shù)據(jù)表征、假設(shè)生成和實(shí)驗(yàn)?zāi)M。(7)Wang H, Fu T, Du Y, et al. Scientific discovery in the age of artificial intelligence[J]. Nature, 2023, 620(7972).
(1)數(shù)據(jù)收集與管理(Data Collection and Curation)。科學(xué)發(fā)現(xiàn)和理論的形成基于數(shù)據(jù)的收集、轉(zhuǎn)化和理解,隨著實(shí)驗(yàn)平臺(tái)收集的數(shù)據(jù)規(guī)模及復(fù)雜性不斷增加,要想選擇性地存儲(chǔ)和分析高速生成的數(shù)據(jù),必須依賴實(shí)時(shí)處理及高性能計(jì)算 (HPC)。AI在數(shù)據(jù)處理中主要的方向包括數(shù)據(jù)選擇(Data selection)、數(shù)據(jù)標(biāo)注(Data annotation)、數(shù)據(jù)生成(Data generation)和數(shù)據(jù)精化(Data refinements)。如在數(shù)據(jù)選擇方面,以粒子碰撞實(shí)驗(yàn)為例,其每秒生成的數(shù)據(jù)量超過(guò)100TB,對(duì)現(xiàn)行數(shù)據(jù)傳輸和存儲(chǔ)技術(shù)構(gòu)成了巨大壓力。這類實(shí)驗(yàn)要求實(shí)時(shí)檢測(cè)并過(guò)濾掉99%以上的無(wú)關(guān)元數(shù)據(jù)。深度學(xué)習(xí)、自動(dòng)編碼器等先進(jìn)技術(shù)方法的應(yīng)用,能有效識(shí)別科研過(guò)程中的異常事件,從而顯著降低數(shù)據(jù)傳輸和處理的負(fù)擔(dān)。(8)Karagiorgi G, Kasieczka G, Kravitz S, et al. Machine learning in the search for new fundamental physics[J]. Nature Reviews Physics,2022,4(6).
(2)有意義的數(shù)據(jù)表征(Meaningful representations of scientific data)。深度學(xué)習(xí)能夠在多層次上提取科學(xué)數(shù)據(jù)的有意義的表征,并優(yōu)化這些表征以指導(dǎo)研究。高質(zhì)量的表征應(yīng)該盡可能地保留數(shù)據(jù)相關(guān)信息,同時(shí)保持簡(jiǎn)潔和易于訪問(wèn)。(9)Goodfellow I, Bengio Y, Courville A. Deep learning[M]. MIT press, 2016.目前滿足這些要求的幾種新策略包括幾何先驗(yàn)(Geometric priors)、自監(jiān)督學(xué)習(xí)(Self-supervised learning) 、神經(jīng)算子(Neural Operators)及語(yǔ)言建模(Language modelling)。以自監(jiān)督學(xué)習(xí)為例,他可以使模型能夠在不依賴明確標(biāo)簽的情況下,了解數(shù)據(jù)集的通用特征。他可以作為一個(gè)關(guān)鍵的預(yù)處理步驟,在微調(diào)模型執(zhí)行下游任務(wù)前,從大規(guī)模未標(biāo)注數(shù)據(jù)中學(xué)習(xí)可轉(zhuǎn)移特征,這樣預(yù)先訓(xùn)練好的具有廣泛科研領(lǐng)域理解力的模型是通用的預(yù)測(cè)器,可以適應(yīng)各種任務(wù),從而提高標(biāo)簽效率,超越了純粹的監(jiān)督方法。(10)Wang H, Fu T, Du Y, et al. Scientific discovery in the age of artificial intelligence[J]. Nature, 2023, 620(7972).
(3)假設(shè)生成(Generation of Hypotheses)??沈?yàn)證的假設(shè)是科學(xué)發(fā)現(xiàn)的核心,制定有意義的假設(shè)可能是一個(gè)漫長(zhǎng)的過(guò)程。人工智能方法在假設(shè)生成的過(guò)程中發(fā)揮重要作用。比如,人工智能系統(tǒng)能夠從嘈雜的觀測(cè)數(shù)據(jù)中識(shí)別出潛在的符號(hào)表達(dá)式,進(jìn)而生成假設(shè)。再如,人工智能系統(tǒng)也能夠?qū)W習(xí)假設(shè)的貝葉斯后驗(yàn)分布,并利用這一知識(shí)生成與科學(xué)數(shù)據(jù)和現(xiàn)有知識(shí)相兼容的假設(shè)。(11)Guimerà R, Reichardt I, Aguilar-Mogas A, et al. A Bayesian machine scientist to aid in the solution of challenging scientific problems[J]. Science advances,2020,6(5).
最近的研究表明,無(wú)監(jiān)督語(yǔ)言人工智能模型有可能捕捉復(fù)雜的科學(xué)概念,即將文獻(xiàn)中已有的知識(shí)以數(shù)學(xué)形式進(jìn)行表達(dá),這表明未來(lái)潛在知識(shí)的發(fā)現(xiàn)可能嵌入在過(guò)去的出版物中。(12)Tshitoyan V, Dagdelen J, Weston L, et al. Unsupervised word embeddings capture latent knowledge from materials science literature[J]. Nature, 2019, 571(7763).具體而言,科學(xué)文獻(xiàn)中潛藏著隱含的知識(shí)與關(guān)聯(lián),這可以通過(guò)對(duì)文獻(xiàn)進(jìn)行深度挖掘和分析來(lái)揭示。文獻(xiàn)不僅僅承載著已知的知識(shí),而且還可以作為新知識(shí)及關(guān)聯(lián)的發(fā)掘來(lái)源。盡管文獻(xiàn)中的知識(shí)大多基于先前的研究成果,但其中仍存有大量未被充分挖掘或發(fā)現(xiàn)的信息,這些信息有可能催生新的科學(xué)發(fā)現(xiàn)。這種基于文獻(xiàn)的發(fā)現(xiàn)(Literature-based discovery,LBD)的人工智能方法通過(guò)剖析和整合文獻(xiàn)中的信息,探尋不同領(lǐng)域和概念間的聯(lián)系,以揭示之前未被察覺(jué)的關(guān)聯(lián)和知識(shí)。(13)How artificial intelligence can revolutionise science. (n.d.). The Economist. Retrieved December 15, 2023, from https://www.economist.com/leaders/2023/09/14/how-artificial-intelligence-can-revolutionise-science此外,LBD系統(tǒng)不僅能夠提出新的研究假設(shè),還能識(shí)別潛在的知識(shí)聯(lián)系,推動(dòng)跨學(xué)科的合作。目前,LBD系統(tǒng)的應(yīng)用范圍正在不斷擴(kuò)大,已經(jīng)涵蓋了表格、圖表和數(shù)據(jù)等各種類型的文獻(xiàn)處理,為科研人員提供更為全面的支持。
(4)實(shí)驗(yàn)與模擬(Experimentation and Simulation)。通過(guò)實(shí)驗(yàn)評(píng)估科學(xué)假設(shè)是科學(xué)發(fā)現(xiàn)的關(guān)鍵環(huán)節(jié),以強(qiáng)化學(xué)習(xí)為代表的AI技術(shù)可以提供實(shí)驗(yàn)設(shè)計(jì)和優(yōu)化工具,這些工具可以增強(qiáng)傳統(tǒng)的科學(xué)方法,減少所需的實(shí)驗(yàn)數(shù)量并節(jié)省資源。具體而言,強(qiáng)化學(xué)習(xí)能夠幫助研究者改進(jìn)實(shí)驗(yàn)設(shè)計(jì)、提高實(shí)驗(yàn)效率,并更好地探索數(shù)據(jù)以驗(yàn)證或拒絕假設(shè),并逐步搭建模型。如在實(shí)驗(yàn)設(shè)計(jì)的初期階段,強(qiáng)化學(xué)習(xí)能夠優(yōu)化實(shí)驗(yàn)設(shè)計(jì),協(xié)助確定關(guān)鍵參數(shù)和采樣策略,以最大化信息獲取。而作為智能代理,強(qiáng)化學(xué)習(xí)還能根據(jù)先前的實(shí)驗(yàn)結(jié)果和模型反饋,動(dòng)態(tài)調(diào)整實(shí)驗(yàn)策略,從而更迅速地完成假設(shè)檢驗(yàn)。對(duì)于復(fù)雜的假設(shè)檢驗(yàn),如因果關(guān)系分析,強(qiáng)化學(xué)習(xí)有助于優(yōu)化模型的參數(shù)設(shè)計(jì),增強(qiáng)模型與數(shù)據(jù)的適配性。同時(shí),強(qiáng)化學(xué)習(xí)可以結(jié)合深度學(xué)習(xí)和因果推理方法,為進(jìn)一步的假設(shè)檢驗(yàn)和研究方向提供有力指導(dǎo)。具體的應(yīng)用案例如機(jī)器人科學(xué)家(Robot Scientist),它指的是通過(guò)機(jī)器人和人工智能技術(shù)進(jìn)行科學(xué)實(shí)驗(yàn)和研究的系統(tǒng)。機(jī)器人科學(xué)家們可以通過(guò)數(shù)據(jù)、研究論文和專利的形式獲得有關(guān)特定研究領(lǐng)域的背景知識(shí),然后生成假設(shè)、執(zhí)行實(shí)驗(yàn)、評(píng)估結(jié)果,最終發(fā)現(xiàn)新的科學(xué)知識(shí)。
3.思維層:認(rèn)知拓展與主體性覺(jué)醒
人工智能浪潮被認(rèn)為是第四次工業(yè)革命,是在實(shí)現(xiàn)機(jī)械化、規(guī)?;?、網(wǎng)絡(luò)化的基礎(chǔ)上,促進(jìn)工業(yè)邁向智能化的新階段。工業(yè)革命,即因核心技術(shù)創(chuàng)新和重大需求變動(dòng)而對(duì)工業(yè)生產(chǎn)體系產(chǎn)生深刻而廣泛的影響,使得工業(yè)體系在支柱產(chǎn)業(yè)部門、生產(chǎn)組織方式、價(jià)值分配模式方面發(fā)生了革命性變化。從工業(yè)革命的內(nèi)涵來(lái)看,第四次工業(yè)革命的主導(dǎo)技術(shù)和主導(dǎo)產(chǎn)業(yè)已經(jīng)開(kāi)始形成。(14)李萬(wàn),鄒蕓,錢婭妮.第四次工業(yè)革命興起、發(fā)展與影響——從人的能力延伸以及科技進(jìn)步速率波動(dòng)的視角[J].中阿科技論壇(中英文),2023,(07).縱觀人類歷史上的三次工業(yè)革命,根據(jù)麥克盧漢“媒介是人的延伸”的視角,前三次工業(yè)革命中的技術(shù)都是對(duì)人類身體的“延伸”。如第一次工業(yè)革命中蒸汽機(jī)提供的機(jī)械動(dòng)力是對(duì)雙手的“延伸”,改變了人類生產(chǎn)創(chuàng)造的效率;第二次工業(yè)革命中內(nèi)燃機(jī)是對(duì)雙腳的“延伸”,拓展了人類的活動(dòng)空間;第三次工業(yè)革命中信息技術(shù)是對(duì)感官的“延伸”,增強(qiáng)了人們獲取信息的能力。而以人工智能為代表的第四次技術(shù)革命則是對(duì)人類大腦的“延伸”,將會(huì)拓展人類的思維能力和認(rèn)知邊界,提升發(fā)現(xiàn)問(wèn)題的能力并實(shí)現(xiàn)進(jìn)一步的心智進(jìn)化。
人工智能是人腦力對(duì)象化的產(chǎn)物。AI的研發(fā)過(guò)程就是一部不斷鞏固、放大和提升人類主體性的歷史,人工智能在未來(lái)的每一點(diǎn)進(jìn)步,都是對(duì)人本質(zhì)力量的再一次確證。(15)張勁松.人是機(jī)器的尺度——論人工智能與人類主體性[J].自然辯證法研究,2017,33(01).在人工智能發(fā)展的過(guò)程中,我們可以通過(guò)不斷地對(duì)人工智能進(jìn)行研究和改進(jìn),提高AI的智能水平和應(yīng)用范圍,讓AI更好地為科學(xué)研究服務(wù)。同時(shí),我們也在與AI日益深入的共存中不斷拓展自身認(rèn)知的邊界,實(shí)現(xiàn)自我心智的進(jìn)化。人與機(jī)器的主體間性思辨長(zhǎng)期以來(lái)都是備受爭(zhēng)議的哲學(xué)問(wèn)題,生成式AI所帶來(lái)的生存隱憂其實(shí)恰恰激活了全社會(huì)領(lǐng)域?qū)τ谌诵缘挠^照。這樣的自我反思與觀照,是人類在技術(shù)革命歷史上的一種必然,也是科技文明即將發(fā)生轉(zhuǎn)向時(shí)人類的一種自我“賦意”和主體性覺(jué)醒。
范式(Paradigm)這一概念最初由美國(guó)著名科學(xué)哲學(xué)家托馬斯·庫(kù)恩1962年在《科學(xué)革命的結(jié)構(gòu)》中提出來(lái),指的是常規(guī)科學(xué)所賴以運(yùn)作的理論基礎(chǔ)和實(shí)踐規(guī)范?!胺妒健奔却碇粋€(gè)特定共同體成員共有的信念、價(jià)值等構(gòu)成的整體,又代表著這個(gè)整體的某種精神要素,指引著這個(gè)共同體的功能。“范式”在本質(zhì)上是一種知識(shí)生產(chǎn)方式和知識(shí)存在方式,是科學(xué)共同體的世界觀基礎(chǔ)和方法論遵循,為科學(xué)共同體提供研究根據(jù)、實(shí)踐標(biāo)準(zhǔn)和價(jià)值方向。作為知識(shí)生產(chǎn)方式,“范式”集中表現(xiàn)為科學(xué)共同體對(duì)知識(shí)本體的基本觀念和共有信念,指引著知識(shí)生產(chǎn)主體的實(shí)踐方式選擇與認(rèn)同;作為知識(shí)存在方式,“范式”在知識(shí)生產(chǎn)實(shí)踐的結(jié)果上承載著知識(shí)產(chǎn)品的形式和內(nèi)容,表現(xiàn)為特定的知識(shí)話語(yǔ)體系。
科研范式是常規(guī)科學(xué)所賴以運(yùn)作的理論基礎(chǔ)和實(shí)踐規(guī)范,隨著科學(xué)的發(fā)展以及外部環(huán)境的推動(dòng)不斷發(fā)生變化。由于科學(xué)家對(duì)科學(xué)研究范式的信奉受到時(shí)代認(rèn)知的局限性,某種科學(xué)研究范式總會(huì)在科學(xué)發(fā)展到一定程度后顯示出不足而無(wú)法解決一些問(wèn)題,出現(xiàn)困難、矛盾和困惑,這種矛盾推動(dòng)了科學(xué)家們的反思和進(jìn)一步探索,進(jìn)而逐漸形成新的科學(xué)研究范式。
計(jì)算機(jī)圖靈獎(jiǎng)得主吉姆·格雷(Jim Grey)提出了科學(xué)研究范式發(fā)展的四個(gè)階段:實(shí)驗(yàn)科學(xué)范式、理論科學(xué)范式、計(jì)算科學(xué)范式和數(shù)據(jù)科學(xué)范式。
經(jīng)驗(yàn)科學(xué)范式應(yīng)用于人類最早的科學(xué)研究,主要以記錄和描述自然現(xiàn)象為特征,是以經(jīng)驗(yàn)主義和人的深度思考為主導(dǎo)的科學(xué)研究范式。從原始的鉆木取火,發(fā)展到后來(lái)以伽利略為代表的文藝復(fù)興時(shí)期的科學(xué)發(fā)展初級(jí)階段,經(jīng)驗(yàn)科學(xué)范式作為人類科學(xué)研究的早期范式為人類開(kāi)啟了現(xiàn)代科學(xué)之門。
在研究方法方面,經(jīng)驗(yàn)科學(xué)范式主要采用歸納法,通常涉及較多的盲目性觀測(cè)和實(shí)驗(yàn)。在科學(xué)發(fā)展的早期階段,經(jīng)驗(yàn)科學(xué)方法在生物和化學(xué)領(lǐng)域尤為常見(jiàn)。如17世紀(jì)的科學(xué)家弗朗西斯·培根提出的歸納主義科學(xué)模式,他強(qiáng)調(diào)科學(xué)必須是實(shí)驗(yàn)的、歸納的,所有真理都必須以大量確鑿的事實(shí)材料為依據(jù)。(16)弗蘭西斯·培根.新工具;方法論;人是機(jī)器[M].北京:中國(guó)社會(huì)出版社,1999.他還提出了一套實(shí)驗(yàn)科學(xué)的“三表法”,即尋找因果聯(lián)系的科學(xué)歸納法。這種方法認(rèn)為要把握自然,必須對(duì)自然加以分離和分解,要把事物分解為它的組成因素去加以認(rèn)識(shí)。在培根看來(lái),事物是許多簡(jiǎn)單性質(zhì)的組合和結(jié)合,要把握事物的簡(jiǎn)單形式,就需要把它們從組成同一事物的其他性質(zhì)中分離出來(lái),加以考察研究。(17)張峰.論培根歸納邏輯[J].遼寧大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2008,36(2).
2.理論科學(xué)范式(Theoretical Paradigm)
理論指人類對(duì)自然、社會(huì)現(xiàn)象按照已有的實(shí)證知識(shí)、經(jīng)驗(yàn)、事實(shí)、法則、認(rèn)知以及經(jīng)過(guò)驗(yàn)證的假說(shuō),經(jīng)由一般化與演繹推理等方法,進(jìn)行合乎邏輯的推論性總結(jié)從范式發(fā)展的角度來(lái)看,當(dāng)實(shí)驗(yàn)條件不具備時(shí),第一范式的研究方法可能無(wú)法滿足研究的需要。因此,為了更精確地研究自然現(xiàn)象,新的科學(xué)研究范式應(yīng)運(yùn)而生。第二范式是以建模和歸納的理論學(xué)科和分析為主導(dǎo)的科學(xué)研究范式。與依賴觀察和實(shí)驗(yàn)的第一范式相比,第二范式的科學(xué)理論需要更深入地理解自然界的規(guī)律,并對(duì)其背后的原理進(jìn)行解釋。因此,理論科學(xué)更注重理論總結(jié)和理性概括,強(qiáng)調(diào)具有較高普遍性的理論認(rèn)識(shí),而非直接實(shí)用意義的科學(xué)。在研究方法上,理論科學(xué)以演繹法為主,不僅局限于描述經(jīng)驗(yàn)事實(shí)。
3.計(jì)算科學(xué)范式(Computational science Paradigm)
隨著理論研究的深入,驗(yàn)證理論的難度和經(jīng)濟(jì)投入也越來(lái)越大,第二范式面臨重大瓶頸和挑戰(zhàn),迫切需要提出新的科學(xué)研究范式,第三范式應(yīng)運(yùn)而生。第三范式被稱為計(jì)算科學(xué)范式,是以計(jì)算和模擬為主導(dǎo)的科學(xué)研究范式,由1982年諾貝爾物理學(xué)獎(jiǎng)獲得者肯尼斯·威爾遜(Kenneth Wilson)提出并確立。20世紀(jì)后半葉,伴隨高性能計(jì)算機(jī)和基于大規(guī)模并行計(jì)算的計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展,科學(xué)家嘗試在理論模型指導(dǎo)下,利用計(jì)算機(jī)設(shè)計(jì)數(shù)值求解算法、編寫(xiě)仿真程序來(lái)推演復(fù)雜理論、模擬復(fù)雜物理現(xiàn)象。借助計(jì)算機(jī)的巨大算力,科學(xué)家可以精確地、大規(guī)模地求解方程組,進(jìn)而去探索那些無(wú)法通過(guò)實(shí)驗(yàn)法和理論推導(dǎo)法解決的復(fù)雜問(wèn)題。(18)周剛,王銳,李凱文,等. 覺(jué)悟ChatGPT,科研第五范式即將來(lái)臨[J]. 中國(guó)科技成果,2023,24(12).
4.數(shù)據(jù)密集型科學(xué)(Data-Intensive Paradigm)
第三范式是先提出可能的理論,再搜集數(shù)據(jù)進(jìn)行仿真計(jì)算和驗(yàn)證,然而隨著科學(xué)的發(fā)展和環(huán)境的變化,人們可能已經(jīng)擁有了大量的數(shù)據(jù),但難以直接提出可能的理論,此時(shí)第三范式的指導(dǎo)意義就會(huì)顯得比較有限,需要開(kāi)發(fā)或總結(jié)新的科學(xué)研究范式。第四范式是以數(shù)據(jù)驅(qū)動(dòng)為主導(dǎo),也被稱為數(shù)據(jù)密集型范式,是通過(guò)數(shù)據(jù)和算力探索前沿的科學(xué)研究范式。它與第三范式的區(qū)別在于,隨著數(shù)據(jù)量的高速增長(zhǎng),計(jì)算機(jī)不僅僅局限于按照科學(xué)家設(shè)定的程序規(guī)則開(kāi)展模擬仿真,還能從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,形成基于關(guān)聯(lián)關(guān)系的科學(xué)理論,其本質(zhì)是通過(guò)海量數(shù)據(jù)的收集代替人類傳統(tǒng)的經(jīng)驗(yàn)觀察過(guò)程,借助機(jī)器的高算力代替人類的歸納推理,從而實(shí)現(xiàn)遠(yuǎn)超經(jīng)驗(yàn)范式的理論歸納能力。(19)周剛,王銳,李凱文,等. 覺(jué)悟ChatGPT,科研第五范式即將來(lái)臨[J]. 中國(guó)科技成果,2023,24(12).第四范式強(qiáng)調(diào)借助并行計(jì)算、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)去發(fā)現(xiàn)隱藏在數(shù)據(jù)中的關(guān)系與聯(lián)系。從方法論的角度來(lái)看,第四種范式的基本思想是將數(shù)據(jù)視為數(shù)字空間中真實(shí)世界事物、現(xiàn)象和行為的映射,并相信數(shù)據(jù)自然意味著真實(shí)世界的操作法則。此外,通過(guò)數(shù)據(jù)驅(qū)動(dòng)和數(shù)據(jù)分析方法,數(shù)據(jù)被用作揭示物理世界中現(xiàn)象所包含的科學(xué)規(guī)律的媒介。(20)Xueqi C, Hong M E I, Wei Z, et al. Data science and computing intelligence: concept, paradigm, and opportunities[J]. Bulletin of Chinese Academy of Sciences (Chinese Version), 2020, 35(12).通過(guò)數(shù)據(jù)密集型科學(xué),我們可以利用大數(shù)據(jù)集中的信息來(lái)揭示之前無(wú)法察覺(jué)的模式和關(guān)聯(lián),這種方法可以幫助我們深入了解復(fù)雜的現(xiàn)象。
第四種范式將數(shù)據(jù)科學(xué)與前三種科學(xué)研究范式分開(kāi),并在科學(xué)發(fā)現(xiàn)和思維方面帶來(lái)革命性的變化。海量數(shù)據(jù)讓我們可以直接分析數(shù)據(jù),發(fā)現(xiàn)新模式、新知識(shí),甚至是過(guò)去的科學(xué)研究方法在不依賴模型和假設(shè)的情況下無(wú)法發(fā)現(xiàn)的新規(guī)律。雖然第四范式可以發(fā)現(xiàn)數(shù)據(jù)中的大量相關(guān)性,為科學(xué)發(fā)現(xiàn)提供了新的視野,然而僅依靠第四范式的數(shù)據(jù)驅(qū)動(dòng)方法來(lái)進(jìn)行雜亂無(wú)章的相關(guān)性分析不僅消耗了大量的計(jì)算資源也無(wú)法真正預(yù)測(cè)未來(lái)的趨勢(shì)和變化。因此,從方法論角度來(lái)看,第四范式在揭示事物本質(zhì)規(guī)律方面存在固有局限性,數(shù)據(jù)科學(xué)需要在方法論上突破第四范式。(21)Xueqi C, Hong M E I, Wei Z, et al. Data science and computing intelligence: concept, paradigm, and opportunities[J]. Bulletin of Chinese Academy of Sciences (Chinese Version),2020,35(12).
在常規(guī)科學(xué)時(shí)期,科學(xué)共同體的主要任務(wù)是在范式的指導(dǎo)下從事釋疑活動(dòng),通過(guò)釋疑活動(dòng)推動(dòng)科學(xué)的發(fā)展,“常規(guī)科學(xué)即解難題(Puzzle)”。(22)托馬斯·庫(kù)恩.科學(xué)革命的結(jié)構(gòu).第2版[M].北京:北京大學(xué)出版社,2012.在釋疑活動(dòng)過(guò)程中,一些新問(wèn)題和新事物逐漸產(chǎn)生,并動(dòng)搖了原有的范式,建立新范式的科學(xué)革命隨之產(chǎn)生。
科學(xué)研究從經(jīng)驗(yàn)范式發(fā)展到了數(shù)據(jù)科學(xué)范式,可以實(shí)現(xiàn)從海量數(shù)據(jù)中挖掘出人類智能難以發(fā)現(xiàn)的科學(xué)規(guī)律。但經(jīng)過(guò)多年的科學(xué)實(shí)踐可以發(fā)現(xiàn),不論是計(jì)算科學(xué)還是數(shù)據(jù)科學(xué)范式,在面對(duì)社會(huì)、經(jīng)濟(jì)、人腦智能等復(fù)雜巨系統(tǒng)科研對(duì)象時(shí),都存在數(shù)理模型難以構(gòu)建、數(shù)據(jù)學(xué)習(xí)效率低下、內(nèi)在機(jī)理不明等局限性。(23)周剛,王銳,李凱文,等. 覺(jué)悟ChatGPT,科研第五范式即將來(lái)臨[J]. 中國(guó)科技成果,2023,24(12).基于這樣的現(xiàn)實(shí),吉姆·格雷提出了跨學(xué)科的解決方案,即鼓勵(lì)不同領(lǐng)域的科學(xué)家、工程師和計(jì)算機(jī)科學(xué)家共同研究,共享數(shù)據(jù)、工具和知識(shí),以促進(jìn)科學(xué)研究的進(jìn)步。但實(shí)際上這樣深度的跨學(xué)科合作是不現(xiàn)實(shí)的,因?yàn)楦鞣N領(lǐng)域知識(shí)的專家互相之間并不了解,也不能準(zhǔn)確判斷對(duì)方說(shuō)的是否正確,因此在對(duì)跨學(xué)科領(lǐng)域建模的時(shí)候人類的智能是無(wú)法實(shí)現(xiàn)的。然而,以ChatGPT為代表的生成式AI在近年來(lái)取得的矚目成果展現(xiàn)了人機(jī)融合的巨大潛力,為科學(xué)研究長(zhǎng)期的困境帶來(lái)了新的曙光。
智能科學(xué)范式作為人類科學(xué)革命歷史中的“第五范式”可以理解為一種以AI技術(shù)為核心,以融入人的價(jià)值和知識(shí)為手段,以人機(jī)共融為特征的跨領(lǐng)域科學(xué)研究規(guī)范。與先前的范式相比,第五范式更側(cè)重于人類、機(jī)器和數(shù)據(jù)之間的交互,強(qiáng)調(diào)人類決策機(jī)制和數(shù)據(jù)分析的整合,它體現(xiàn)了數(shù)據(jù)和智能的有機(jī)結(jié)合。目前,人工智能作為一種強(qiáng)大的科學(xué)研究范式已經(jīng)在信息科學(xué)、數(shù)學(xué)、醫(yī)學(xué)、材料科學(xué)、地球科學(xué)、生命科學(xué)、物理和化學(xué)等八個(gè)主要的科學(xué)研究領(lǐng)域產(chǎn)生強(qiáng)大的效用。(24)Xu Y, Liu X, Cao X, et al. Artificial intelligence: A powerful paradigm for scientific research[J]. The Innovation, 2021, 2(4).
1.價(jià)值連接:跨學(xué)科的細(xì)?;?、全要素協(xié)同
以生成式AI為主導(dǎo)的智能研究方法,其核心要義在于通過(guò)AI對(duì)人類已有知識(shí)成果強(qiáng)大的學(xué)習(xí)和整合能力實(shí)現(xiàn)全領(lǐng)域、細(xì)粒度的價(jià)值連接。具體而言,這種連接是全要素、全系統(tǒng)的一種基于細(xì)粒度社會(huì)的價(jià)值匹配,凸顯了智能技術(shù)在學(xué)術(shù)研究領(lǐng)域中通過(guò)中介性、匹配性所實(shí)現(xiàn)的倍加效應(yīng)。智能研究方法能夠使科學(xué)研究在這種連接中實(shí)現(xiàn)更高的效率,更深遠(yuǎn)的探測(cè),更細(xì)粒度的把握。第五范式旨在推斷各種認(rèn)知計(jì)算應(yīng)用的共同點(diǎn),并指導(dǎo)開(kāi)發(fā)互補(bǔ)解決方案,以應(yīng)對(duì)未來(lái)的挑戰(zhàn)。(25)Malitsky N, Castain R, Cowan M. Spark-mpi: Approaching the fifth paradigm of cognitive applications[J]. arXiv preprint arXiv:1806.01110, 2018.
價(jià)值連接主要作用于科學(xué)研究中研究對(duì)象(Subject)的問(wèn)題。AI對(duì)人類知識(shí)成果的整合力可以實(shí)現(xiàn)語(yǔ)言模型跨學(xué)科、跨系統(tǒng)的知識(shí)融合,使吉姆·格雷提出的跨學(xué)科解決路徑成為可能。這使得當(dāng)前諸多因“學(xué)科壁壘”而無(wú)法探測(cè)的巨型復(fù)雜系統(tǒng)逐漸被納入系統(tǒng)化研究的議程,如社會(huì)系統(tǒng)、經(jīng)濟(jì)系統(tǒng)、人腦智能等。換言之,第五范式的出現(xiàn)使諸多常規(guī)科學(xué)無(wú)法深入研究的問(wèn)題變得可及,將科學(xué)研究的對(duì)象拓展至更復(fù)雜、更深層的領(lǐng)域,同時(shí)也打開(kāi)了人類更加廣闊的研究視野。智能研究方法作為科學(xué)研究的“第五范式”目前尚處于起步階段,且需要一個(gè)極其漫長(zhǎng)的過(guò)程,需要建立在開(kāi)源知識(shí)系統(tǒng)、算力平臺(tái)系統(tǒng)和算法模型和軟件系統(tǒng)等多種智能系統(tǒng)之上。
圖2 智能科學(xué)范式作為“第五范式”的意義與價(jià)值
總體而言,第五范式最重要的價(jià)值即在于通過(guò)AI對(duì)人類已有知識(shí)成果強(qiáng)大的學(xué)習(xí)和整合能力實(shí)現(xiàn)全領(lǐng)域、細(xì)粒度的價(jià)值連接。它是一個(gè)連接型的價(jià)值,而不是某一個(gè)專門的工具,我們需要從價(jià)值連接的角度來(lái)理解第五范式。AI模型甚至可能成為一種新的知識(shí)形式,與人類能夠理解的知識(shí)并駕齊驅(qū),共同組成科學(xué)知識(shí),(26)李建會(huì),楊寧.AI for Science:科學(xué)研究范式的新革命[J].廣東社會(huì)科學(xué),2023,(06).它為跨學(xué)科的復(fù)雜系統(tǒng)研究和人類的科學(xué)視野提供了無(wú)可估量的價(jià)值。
2.路徑革命:范式突破與方法統(tǒng)合
在科學(xué)發(fā)展的某一時(shí)期,總有一種主導(dǎo)范式,當(dāng)這種主導(dǎo)范式不能解釋的“異?!狈e累到一定程度時(shí),就無(wú)法再使用舊有的范式去做解釋,科學(xué)共同體將尋求更具備包容性的新范式。(27)托馬斯·庫(kù)恩.科學(xué)革命的結(jié)構(gòu).第2版[M].北京:北京大學(xué)出版社,2012.常規(guī)科學(xué)的前四種范式都有各自的特長(zhǎng),但它們通常不能解決其他范式的問(wèn)題,而且在面對(duì)復(fù)雜的問(wèn)題時(shí),它們之間更不能進(jìn)行有效的協(xié)同、匹配和交叉。
第五研究范式能夠?qū)崿F(xiàn)“范式突破”的原因在于可以利用自身強(qiáng)大的數(shù)據(jù)歸納和分析能力去學(xué)習(xí)科學(xué)規(guī)律和原理。具體而言,以深度學(xué)習(xí)在科學(xué)研究的應(yīng)用為例,深度學(xué)習(xí)中用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)來(lái)自科學(xué)基本方程的數(shù)值解,而非經(jīng)驗(yàn)觀察,從而延展出一種新的知識(shí)創(chuàng)造的思路,即通過(guò)“機(jī)器猜想”的方式實(shí)現(xiàn)科學(xué)智能的應(yīng)用。(28)劉志毅.第五范式的出現(xiàn):科學(xué)智能+機(jī)器猜想 | 數(shù)字之道[N].經(jīng)濟(jì)觀察報(bào),2022-11-25.以深度學(xué)習(xí)為代表的AI技術(shù)兼顧了效率與準(zhǔn)確性,通過(guò)“機(jī)器猜想”的方式應(yīng)用于科學(xué)智能,通過(guò)不同“算法思維”和“應(yīng)用場(chǎng)景”的對(duì)撞,得到不同領(lǐng)域的專業(yè)知識(shí),將未知的結(jié)論推導(dǎo)出來(lái),從而反向推動(dòng)該領(lǐng)域的發(fā)展,得到在經(jīng)驗(yàn)領(lǐng)域具有的前瞻性的結(jié)果。
智能研究方法主導(dǎo)了科學(xué)發(fā)展困境期的一場(chǎng)路徑革命,通過(guò)“科學(xué)智能+機(jī)器猜想”的方式打破了常規(guī)科學(xué)范式之間的邊界,并且在方法論和思維模式上形成對(duì)前四種研究范式的統(tǒng)合,為科學(xué)研究提供了前所未有的路徑。比如,當(dāng)前自然科學(xué)研究中普遍面臨的“維數(shù)災(zāi)難”問(wèn)題,目前的算力無(wú)法處理非常高維的數(shù)學(xué)問(wèn)題,而通過(guò)神經(jīng)網(wǎng)絡(luò)的方法則可以有效地表示或者是逼近高維空間的函數(shù)。例如,分子動(dòng)力學(xué)中對(duì)原子間相互作用的勢(shì)能函數(shù)的描述,即便是通過(guò)量子力學(xué)模型,也要每一步在線地把原子和原子間的相互作用力算出來(lái),且只能處理最多1000個(gè)原子。利用深度學(xué)習(xí)的方法,科學(xué)家們將分子動(dòng)力學(xué)極限從基線提升到了1億原子的驚人數(shù)量,同時(shí)仍保證了從頭算的高精度,效率是之前人類基線水平的1000倍。
總體而言,第五研究范式是一種全新的思維模式和方法論,通過(guò)對(duì)常規(guī)科學(xué)范式的突破和對(duì)研究方法的整合,以更加高效和準(zhǔn)確的路徑推動(dòng)科學(xué)進(jìn)展。
3.主體強(qiáng)化:“人在回路”模式的深度人機(jī)協(xié)作
從范式演進(jìn)的角度來(lái)看,以數(shù)據(jù)密集為特征的第四范式可以發(fā)現(xiàn)數(shù)據(jù)中的大量相關(guān)性,為科學(xué)發(fā)現(xiàn)提供了新的視野。但在具有主觀、非線性、不規(guī)則結(jié)構(gòu)特征的研究對(duì)象上,僅靠數(shù)據(jù)驅(qū)動(dòng)方法進(jìn)行漫無(wú)邊際的相關(guān)性分析,不僅消耗了大量的計(jì)算資源,而且無(wú)法真正預(yù)測(cè)未來(lái)的趨勢(shì)和變化。(29)Xueqi C, Hong M E I, Wei Z, et al. Data science and computing intelligence: concept, paradigm, and opportunities[J]. Bulletin of Chinese Academy of Sciences (Chinese Version), 2020, 35(12).面對(duì)第四研究范式的這些困境,采用“人在回路”學(xué)習(xí)模式的人機(jī)協(xié)作方法開(kāi)始展現(xiàn)其強(qiáng)大的潛力。
人在回路(Human in the loop,HITL)指人類參與算法建構(gòu)的訓(xùn)練和測(cè)試階段,以連續(xù)的方式訓(xùn)練和驗(yàn)證模型,是將機(jī)器和人類智能相結(jié)合以獲得長(zhǎng)期最佳結(jié)果的過(guò)程,簡(jiǎn)言之即:由人主導(dǎo)的迭代。人在回路是監(jiān)督機(jī)器學(xué)習(xí)和主動(dòng)學(xué)習(xí)的結(jié)合,這種將人類和機(jī)器智能結(jié)合起來(lái)的方法創(chuàng)造了一個(gè)持續(xù)的反饋循環(huán),使算法每次都能產(chǎn)生更好的結(jié)果。在常規(guī)的科學(xué)研究中,研究者往往是以觀察者的身份介入到研究中的,如第一范式中人類觀察總結(jié),第二范式中人類歸納推導(dǎo),第三范式中人類建模分析,第四范式中人類設(shè)計(jì)框架等。不論是經(jīng)驗(yàn)范式、理論范式、計(jì)算范式還是數(shù)據(jù)范式,人類總是在觀察、歸納物理世界的客觀現(xiàn)象,用數(shù)理邏輯、理論概念、公式和模型等作為可靠的“抓手”來(lái)處理問(wèn)題。但當(dāng)這些可靠的“抓手”在面對(duì)復(fù)雜問(wèn)題失效時(shí),當(dāng)機(jī)器通過(guò)學(xué)習(xí)掌握了人類創(chuàng)造的知識(shí)之后,人的定位應(yīng)該從幕后走向臺(tái)前。通過(guò)到將人的直覺(jué)性經(jīng)驗(yàn)或?qū)<倚越?jīng)驗(yàn)融合到數(shù)據(jù)模型或者計(jì)算模型當(dāng)中,以人類專家經(jīng)驗(yàn)引導(dǎo)改進(jìn)“機(jī)器”的低效探索,發(fā)揮“機(jī)器”的計(jì)算能力優(yōu)勢(shì)和人類的直覺(jué)性優(yōu)勢(shì),以人機(jī)融合、人在回路的形式進(jìn)行科學(xué)實(shí)踐,以彌補(bǔ)“機(jī)器”無(wú)法感知或推理某些難以量化的科學(xué)規(guī)律上的局限性。
總體來(lái)看,“人在回路”的深度人機(jī)協(xié)作模式為擅長(zhǎng)邏輯推理的機(jī)器賦予人類特有的非線性抽象思維,以機(jī)器積累量變,以人腦觸發(fā)質(zhì)變,以螺旋升級(jí)的方式共同促進(jìn)科學(xué)技術(shù)的進(jìn)步和發(fā)展。
智能科學(xué)范式是一個(gè)充滿潛力和挑戰(zhàn)的領(lǐng)域,它將為科學(xué)研究開(kāi)辟新的視野和路徑,也將對(duì)科學(xué)家的角色和能力提出新的要求。同時(shí),它也帶來(lái)了一些挑戰(zhàn)和風(fēng)險(xiǎn),需要科學(xué)家和AI研究者共同面對(duì)和解決。例如,AI生成結(jié)果的可解釋性(Explainability)問(wèn)題,即AI如何做出決策和推理的過(guò)程往往是不透明的,難以被人類理解和驗(yàn)證。這就需要開(kāi)發(fā)新的方法和工具,揭示AI的內(nèi)部機(jī)制和邏輯,從而提高AI的可信度和可靠性。
可以預(yù)見(jiàn)的是,傳統(tǒng)科學(xué)和傳統(tǒng)產(chǎn)業(yè)在未來(lái)將成為人工智能的重要實(shí)踐場(chǎng),隨著人工智能與社會(huì)各個(gè)領(lǐng)域的深度融合,將會(huì)改變社會(huì)千行百業(yè)的生長(zhǎng)邏輯和內(nèi)部結(jié)構(gòu),并推動(dòng)社會(huì)全實(shí)踐領(lǐng)域?qū)崿F(xiàn)更加智能化、高效化和可持續(xù)化的生產(chǎn)和發(fā)展。放眼未來(lái),AI的前景或許不再僅僅是一種高性能工具,AI模型甚至可能成為一種新的知識(shí)形式,與人類能夠理解的知識(shí)并駕齊驅(qū),共同組成科學(xué)知識(shí)。(30)李建會(huì),楊寧.AI for Science:科學(xué)研究范式的新革命[J].廣東社會(huì)科學(xué),2023,(06).AI所引發(fā)的智能產(chǎn)業(yè)變革,也將極大提升人類的認(rèn)知能力,使得知識(shí)的學(xué)習(xí)和傳播能力極大躍升,進(jìn)而促進(jìn)知識(shí)的創(chuàng)造和應(yīng)用。(31)李萬(wàn),鄒蕓,錢婭妮.第四次工業(yè)革命興起、發(fā)展與影響——從人的能力延伸以及科技進(jìn)步速率波動(dòng)的視角[J].中阿科技論壇(中英文),2023,(07).
科學(xué)研究的歷史是一個(gè)“問(wèn)題—答案—新問(wèn)題”的循環(huán)往復(fù),在過(guò)去的半個(gè)世紀(jì)里,那些深?yuàn)W且充滿挑戰(zhàn)的科學(xué)難題曾吸引無(wú)數(shù)研究者深思與投入,但在其解決過(guò)程中又展現(xiàn)出難以逾越的復(fù)雜性。當(dāng)我們回首過(guò)去可以發(fā)現(xiàn),這些問(wèn)題僅僅是人類科學(xué)演進(jìn)和認(rèn)知拓展過(guò)程中的冰山一角,并暗示著一個(gè)更廣闊、更深層的問(wèn)題域。隨著AI For Science的崛起以及多學(xué)科交叉融合的獨(dú)特研究方法,我們得以窺見(jiàn)一種創(chuàng)新的研究范式。這種范式無(wú)疑為那些長(zhǎng)期困擾科學(xué)界的難題,以及人類在科學(xué)前沿的勇敢探索,注入了前所未有的學(xué)術(shù)活力與可能性。通過(guò)這些先進(jìn)的智能研究途徑,我們能夠更系統(tǒng)、更深入地挖掘科學(xué)知識(shí)的寶藏,進(jìn)一步拓展人類對(duì)自然界的認(rèn)知邊界。而從歷史的角度來(lái)看,科學(xué)研究范式的演進(jìn)絕不會(huì)停留在第五次,人類對(duì)于未知的不懈求索、對(duì)于方法的革新,將同人類文明的演進(jìn)一樣生生不息。