• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      AI預(yù)測可以代替科學(xué)實驗嗎?*
      ——以AlphaFold破解蛋白質(zhì)折疊難題為中心

      2021-12-02 19:15:58趙云波
      醫(yī)學(xué)與哲學(xué) 2021年6期
      關(guān)鍵詞:生物學(xué)解析蛋白質(zhì)

      趙云波

      美國時間2020年11月30日,谷歌旗下的人工智能(artificial intelligence,AI)公司DeepMind宣布:“AlphaFold成功解開了一個困擾人類長達50年之久的生物學(xué)難題——蛋白質(zhì)折疊問題?!盵1]在第14屆國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(critical assessment of protein structure prediction,CASP)上打敗了所有競爭對手。消息一經(jīng)發(fā)出,有人驚呼“結(jié)構(gòu)生物學(xué)家要失業(yè)了”。AI可能會帶來一些行業(yè)性失業(yè)早已不是什么新鮮話題,但在人們分析哪些職業(yè)將受到影響時,科學(xué)家群體很難上榜。然而這一次,可能輪到科學(xué)家自己了。那么,AlphaFold真的“看”到了蛋白質(zhì)結(jié)構(gòu)嗎?會帶來結(jié)構(gòu)生物學(xué)的革命嗎?以此為核心推演開來,AI預(yù)測可以代替科學(xué)實驗嗎?AI計算推理知識是科學(xué)知識嗎?AI可以代替科學(xué)家的工作嗎?這些思考直接關(guān)系A(chǔ)I時代我們?nèi)绾卫斫饪茖W(xué)、如何發(fā)展科學(xué)等深層次問題。

      1 蛋白質(zhì)折疊難題及其主要破解途徑

      1.1 生物學(xué)結(jié)構(gòu)分析的意義及蛋白質(zhì)折疊難題

      簡單來講,蛋白質(zhì)是構(gòu)成生物體的一類大分子,在生命過程中擔任了重要的角色,生物體中很多生命活動都離不開蛋白質(zhì)在其中發(fā)揮特定的作用,如動物血液、骨骼、皮膚、毛發(fā)等由內(nèi)而外的組成部分中都有蛋白質(zhì),動物的繁殖、遺傳、發(fā)育、生長等生命過程都離不開蛋白質(zhì)。而蛋白質(zhì)之所以能在生命活動中發(fā)揮出重要的功能取決于其自身高度復(fù)雜的空間結(jié)構(gòu)。在生物學(xué)的很多領(lǐng)域,解析樣本結(jié)構(gòu)對于理解生命機理非常重要,正如沃森(James Watson)在1964年的一篇文獻中所講:“除非我們首先知道其結(jié)構(gòu),否則不可能在化學(xué)水平精確描述一個分子的功能?!盵2]8實際上這一觀點也正是其本人和克里克(Francis Crick)在1953年的《核酸的分子結(jié)構(gòu)》一文中提出著名的DNA雙螺旋結(jié)構(gòu)的一個非常貼切的注解。也正是雙螺旋結(jié)構(gòu)的提出,分子生物學(xué)誕生,人類真正進入了從基因?qū)用嬲J識人自身、改造人自身,甚至“創(chuàng)造”人自身的時代,由此可見結(jié)構(gòu)解析的重要性。對于解析蛋白質(zhì)結(jié)構(gòu)而言,在科學(xué)機理上科學(xué)家認為將揭示生命體內(nèi)的第二遺傳密碼;在實際應(yīng)用上可以推動疾病治療、醫(yī)藥研發(fā)以及生產(chǎn)分解工業(yè)廢物的酶等。

      蛋白質(zhì)一般是由幾十到幾百個氨基酸脫水縮合組成的多肽鏈,蛋白質(zhì)氨基酸有22種,常見的20種。在肽鏈上一個具體的位置為什么出現(xiàn)特定的氨基酸而不是別的氨基酸,以及為什么與這一氨基酸前后相連的氨基酸也是固定的?這與分子生物學(xué)中心法則密切相關(guān):“DNA轉(zhuǎn)錄RNA、RNA翻譯蛋白質(zhì)?!本唧w來講,DNA上儲存的遺傳信息,也就是堿基序列首先轉(zhuǎn)錄到RNA上,再由RNA上的堿基序列編碼特定的氨基酸序列,以此構(gòu)成蛋白質(zhì)的物質(zhì)基礎(chǔ)。特別是后來人們發(fā)現(xiàn)三個堿基形成一個密碼子,對應(yīng)編碼某一具體的氨基酸,密碼子在基因上的位置決定了氨基酸在肽鏈上的位置,形成了蛋白質(zhì)的一級結(jié)構(gòu),或者,形象地講就是一維線性結(jié)構(gòu)。但是,此時的線性結(jié)構(gòu)還必須折疊形成天然三維結(jié)構(gòu)之后才能具備承擔活體生物所需的獨特功能。然而,50多年來科學(xué)家對蛋白質(zhì)如何從一維結(jié)構(gòu)快速、準確地折疊成具有生物功能的天然三維結(jié)構(gòu)的認知依然非常有限,這就是生物學(xué)領(lǐng)域著名的蛋白質(zhì)折疊難題。

      1.2 開展蛋白質(zhì)結(jié)構(gòu)研究的兩條主要途徑

      第一條途徑是20世紀60年代以來生物學(xué)家借助實驗儀器解析蛋白質(zhì)結(jié)構(gòu),主要有三種方法,以下從實驗儀器發(fā)展簡史及實驗儀器是如何與目標蛋白互動的角度簡要介紹。

      X-射線晶體學(xué)是生物學(xué)中傳統(tǒng)的結(jié)構(gòu)解析方法。上文中提到的DNA雙螺旋結(jié)構(gòu)的提出離不開威爾金斯(Maurice Wilkins)和富蘭克林(Rosalind Franklin)獲得的DNA的X-射線衍射圖譜。人類最早“看”到其三維結(jié)構(gòu)的蛋白質(zhì)是由英國科學(xué)家肯德魯(John Kendrew)、普汝士(Max Perutz)“相繼運用X-射線衍射分析測定的肌紅蛋白(1958年)和血紅蛋白(1960年)晶體結(jié)構(gòu)”[3]。X-射線也被稱為倫琴射線,1895年由德國物理學(xué)家倫琴(Wilhelm R?ntgen)發(fā)現(xiàn)并被廣泛用于生物醫(yī)學(xué)和工業(yè)領(lǐng)域。倫琴于1901 年獲得諾貝爾物理學(xué)獎。X-射線是一種能量很強、波長很短的電磁波,通過晶體時因與晶體中電子發(fā)生作用而產(chǎn)生衍射,從而在背景上(探測器上)得到晶體電子密度分布,以此確定原子的位置,為解析晶體結(jié)構(gòu)提供數(shù)據(jù)。X-射線晶體學(xué)對蛋白質(zhì)結(jié)晶要求較高,但并非所有的蛋白質(zhì)都可以很快形成晶體。另外,X-射線對晶體本身也能造成傷害,而且對于較為復(fù)雜的蛋白質(zhì)結(jié)構(gòu)解析乏力。

      核磁共振技術(shù)來源于科學(xué)家對外磁場作用下原子核性質(zhì)的研究。不考慮部分自旋為0的情況,原子核自旋產(chǎn)生核磁,但大量原子核隨機熱運動,核磁方向雜亂無章,對外不顯磁性。20世紀30年代美國物理學(xué)家拉比(Isidor Isaac Rabi)發(fā)現(xiàn),外加恒定強磁場后所有核磁場方向會與外磁場方向呈現(xiàn)出同向或反向的平行排列;再外加射頻場,原子核自旋方向會發(fā)生偏轉(zhuǎn)。20世紀40年代,瑞士物理學(xué)家布洛赫(Felix Bloch)和美國物理學(xué)家珀塞爾(Edward Mills Purcell)發(fā)現(xiàn),當射頻場關(guān)閉后,原子核回歸到只有外加強磁場狀態(tài),并釋放一次信號;再取消外加強磁場,原子核將回歸最初的無序狀態(tài),并再次釋放一次信號。這就是磁共振成像的基礎(chǔ)。對于蛋白質(zhì)結(jié)構(gòu)而言,通過分析目標蛋白中原子兩次吸收和兩次釋放能量的情況來推斷其結(jié)構(gòu),拉比1944年獲諾貝爾物理學(xué)獎,布洛赫和珀塞爾則分享了1952年諾貝爾物理學(xué)獎。此后一些科學(xué)家在此領(lǐng)域又獲得多個諾貝爾獎,技術(shù)和算法也進一步得到改進,成像越來越清晰并被廣泛應(yīng)用于醫(yī)療以及蛋白質(zhì)結(jié)構(gòu)解析等科研領(lǐng)域。磁共振在較小的蛋白質(zhì)結(jié)構(gòu)性解析上優(yōu)勢突出。

      冷凍電鏡技術(shù)是后起之秀。2013年,加州大學(xué)舊金山分校程亦凡研究組和朱利斯(David Julius)研究組合作,首次在冷凍電鏡技術(shù)解析蛋白質(zhì)結(jié)構(gòu)領(lǐng)域達到了預(yù)期的近原子水平分辨率,之后,許多X-射線晶體學(xué)無法實現(xiàn)的重要復(fù)合體及膜蛋白的原子分辨率結(jié)構(gòu)得以解析,被稱為結(jié)構(gòu)生物學(xué)領(lǐng)域的一場革命。冷凍電鏡技術(shù)起步于20世紀60年代,對其發(fā)展做出重要貢獻的英國分子生物學(xué)家及生物物理學(xué)家亨德森(Richard Henderson)、美國德裔生物物理學(xué)家弗蘭克(Joachim Frank)以及瑞士生物物理學(xué)家迪波什(Jacques Dubochet)于2017年獲得了諾貝爾化學(xué)獎。冷凍電鏡技術(shù)是將含有水份的目標蛋白通過液態(tài)乙烷快速冷凍成不含冰晶體的玻璃態(tài)冰包埋樣品,以此避免電子束和真空腔對生物樣本的破壞,然后激發(fā)電子透過冰層和目標蛋白發(fā)生的散色在背景(探測器)上形成信號,以此解析其結(jié)構(gòu)。簡單來講,就是通過收集電鏡激發(fā)的電子與樣品的相互作用過程中所反饋的信號,在此基礎(chǔ)上開展三維圖像建構(gòu)。與磁共振相反,冷凍電鏡技術(shù)對大分子蛋白質(zhì)結(jié)構(gòu)解析優(yōu)勢突出,但對小分子蛋白效果不佳。

      從科學(xué)活動的角度來看,以上方法盡管科學(xué)原理不盡相同,但在實驗過程中都是借助實驗儀器提升了人類感知目標蛋白結(jié)構(gòu)的能力。從科學(xué)效果上看,上述傳統(tǒng)實驗技術(shù)除了各自的弊端,還存在耗時、費錢等問題。盡管實驗方法在蛋白質(zhì)結(jié)構(gòu)解析方面已經(jīng)取得了很大進步,但到目前為止,人類知道的蛋白質(zhì)有2億多個,但已知結(jié)構(gòu)的蛋白質(zhì)僅有17萬個。因此,需要科學(xué)家探索新的路徑。

      第二條途徑是通過智能計算來預(yù)測蛋白質(zhì)結(jié)構(gòu)。實際上,以上實驗方法都需要和計算機算法緊密結(jié)合,例如,諾貝爾獎委員會評價弗蘭克在冷凍電鏡領(lǐng)域的主要貢獻是“不同取向生物大分子顆粒在電子顯微鏡下得到不同的二維投影,再通過三維重構(gòu)軟件把獲得的二維圖像數(shù)據(jù)轉(zhuǎn)化為三維結(jié)構(gòu)模型”[4]。但是,通過智能計算開展蛋白質(zhì)結(jié)構(gòu)預(yù)測是與之在本質(zhì)上完全不同的解析途徑。

      20世紀70年代,諾貝爾化學(xué)獎獲得者、美國生物學(xué)家埃芬森(Christian Anfinsen)[5]提出:“蛋白質(zhì)的氨基酸序列決定其三維結(jié)構(gòu)?!边@成為開展蛋白質(zhì)結(jié)構(gòu)預(yù)測的基本信念,也就是說,蛋白質(zhì)的所有三維結(jié)構(gòu)信息都蘊含在它的一維序列中。當時,科學(xué)家意識到如果能夠計算出蛋白質(zhì)序列中所有的單個氨基酸之間的相互作用,就可以預(yù)測其三維形狀。然而,每種蛋白質(zhì)有數(shù)十到數(shù)百種氨基酸,每對氨基酸可以以多種方式相互作用,每個序列可能的結(jié)構(gòu)數(shù)量是天文數(shù)字,例如,“對于長度為100個殘基的多肽鏈來說,若從可能的構(gòu)象中隨機篩選出一個特定的構(gòu)象,需要時間為1 027年才能達到”[6]。計算科學(xué)家進入了這個領(lǐng)域,但進展同樣緩慢。

      1994年,美國科學(xué)家穆爾特(Moult)和他的同事共同發(fā)起了兩年一次的CASP。在每屆大賽中,組織方提供大約100種結(jié)構(gòu)未知或尚未公布實驗信息的蛋白質(zhì)的氨基酸序列。一些小組通過算法預(yù)測每個序列的結(jié)構(gòu),而其他小組則通過實驗確定其結(jié)構(gòu)。組織者將計算預(yù)測與實驗結(jié)果進行比較,并給預(yù)測一個全球距離測試(global distance test,GDT)分數(shù)。分數(shù)區(qū)間為0分~100分,其中90分以上被認為與實驗方法相當[7]。就在當年,對于較為復(fù)雜的蛋白質(zhì)結(jié)構(gòu),計算機測試成績僅僅為20分。到了2016年,盡管通過借鑒與CASP目標蛋白密切相關(guān)的已知蛋白質(zhì)結(jié)構(gòu),計算機測試成績也只達到40分。

      2018年,DeepMind研發(fā)的AlphaFold首次參加CASP(第13屆),并取得較高成績,Science網(wǎng)站發(fā)文開篇就評價到“事實證明,進軍象棋和圍棋只是個開始……DeepMind在(蛋白質(zhì)結(jié)構(gòu)預(yù)測)競賽中獲得了至高榮譽”[8]。2020年的第14屆CASP,針對各種目標蛋白,AlphaFold在加強深度學(xué)習(xí)的基礎(chǔ)上開展預(yù)測,GDT中位數(shù)得分為92.4分,對于最具挑戰(zhàn)性的蛋白質(zhì)的中位數(shù)為87分,比第二名高25分,遠遠超出了競爭對手。甚至可以分析X-射線晶體學(xué)很難解決的楔入細胞膜中的蛋白質(zhì)結(jié)構(gòu),這是許多人類疾病的核心。

      2 AI預(yù)測能否代替科學(xué)實驗

      AlphaFold在第14屆CASP上的表現(xiàn)很快引起了科學(xué)界的關(guān)注。Science網(wǎng)站以《游戲發(fā)生了變化,AI在解決蛋白質(zhì)結(jié)構(gòu)方面取得了勝利》[7]為標題發(fā)文。Nature網(wǎng)站以《它將改變一切:DeepMind的AI在解決蛋白質(zhì)結(jié)構(gòu)方面實現(xiàn)了巨大飛躍》[9]為標題報道。CASP發(fā)起人之一穆爾特更是感嘆:“我從未想過在我的有生之年可以見證這一偉大時刻?!盵7]甚至有學(xué)者評價“這可能預(yù)示一場生物學(xué)的革命”[9]。但是,結(jié)構(gòu)生物學(xué)革命真的來臨了嗎?AI蛋白質(zhì)結(jié)構(gòu)預(yù)測真的可以取代實驗生物學(xué)家的科學(xué)實驗嗎?

      2.1 從科學(xué)原理層面分析

      以現(xiàn)有算法思維和途徑看,AI能夠高水平預(yù)測蛋白質(zhì)結(jié)構(gòu)需要滿足一項前置性條件,而且,蛋白質(zhì)結(jié)構(gòu)解析也只是結(jié)構(gòu)生物學(xué)研究的一個中間階段。

      第一,所謂的前置性條件是已經(jīng)有必要,甚至必須有足量的數(shù)據(jù)儲備,亦即足夠多的已知結(jié)構(gòu)的蛋白質(zhì)。AI結(jié)構(gòu)預(yù)測的基本原理是將已知三維結(jié)構(gòu)的蛋白質(zhì)作為數(shù)據(jù)集進行大量訓(xùn)練,輸入一個蛋白質(zhì)的氨基酸序列推算其三維結(jié)構(gòu),并和該蛋白質(zhì)的實驗結(jié)構(gòu)比對,以此強化機器深度學(xué)習(xí)能力和對未知蛋白質(zhì)結(jié)構(gòu)的預(yù)測能力。簡言之,就是大數(shù)據(jù)+智能算法。AlphaFold又進一步引入了新算法,而且在硬件上達到了16個TPU(tensor processing unit)級別,相當于100多個GPU(graphics processing unit)的計算機中央處理器,對所有17萬種已知蛋白質(zhì)結(jié)構(gòu)進行了算法訓(xùn)練。也就是說,此次AlphaFold所取得的驚人成績完全離不開實驗生物學(xué)家已經(jīng)弄清楚結(jié)構(gòu)的蛋白質(zhì)作為其比較或?qū)W習(xí)的模板。而且,AlphaFold蛋白質(zhì)結(jié)構(gòu)預(yù)測也并非解決了所有問題,即使在競賽中,“它明顯地在一種蛋白質(zhì)上搖擺不定,這種蛋白質(zhì)由52個小重復(fù)片段組成,它們在組裝時會扭曲彼此的位置”[7]。

      第二,所謂蛋白質(zhì)結(jié)構(gòu)預(yù)測也只是結(jié)構(gòu)生物學(xué)研究的一個中間階段,是指無論是實驗結(jié)構(gòu)解析還是AI結(jié)構(gòu)預(yù)測,其最終目的是理解生命機理。正如美國普林斯頓大學(xué)顏寧教授所講:“結(jié)構(gòu)生物學(xué)的主語是生物學(xué),是理解生命,是做出生物學(xué)發(fā)現(xiàn)?!盵10]從亞原子到原子再到分子層面依然是物理化學(xué)過程,為什么分子層面的蛋白質(zhì)及其組成的生命具有了化學(xué)活性且能夠繁殖、演化?也就是說,分子層面的蛋白質(zhì)發(fā)生了什么樣的變化以及是如何變化的?解答這些問題才接近理解生命。但是正如上文所言,理解蛋白質(zhì)功能必須理解其結(jié)構(gòu),而結(jié)構(gòu)解析目前遠遠超出了人類的認知能力。也正因如此,很多實驗生物學(xué)家將大量時間、精力投入到蛋白質(zhì)結(jié)構(gòu)實驗解析上,也正因為這一進程發(fā)展緩慢且困難重重,才促使人們另辟蹊徑,借助計算科學(xué)開展結(jié)構(gòu)預(yù)測。在這個意義上說,實驗解析或算法預(yù)測是開展蛋白質(zhì)功能研究及認識生命機理的工具和手段,但是不能說因為在這方面目前還非常困難且是當下結(jié)構(gòu)生物學(xué)的主要工作,作為工具和手段的結(jié)構(gòu)解析或預(yù)測就成為了生物學(xué)的目的。要言之,AI在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域做出了驚人的成績,但這并不意味著AI明白地告訴了我們蛋白質(zhì)折疊的過程與原理。

      2.2 從理解科學(xué)層面分析

      什么是科學(xué)?這大概是自科學(xué)誕生以來大家一直談?wù)摱页K汲P碌脑掝},可以有科學(xué)家的認識,也可以有人文學(xué)者的認識。從人文學(xué)科角度看,又可以有科學(xué)哲學(xué)、科學(xué)史、科學(xué)社會學(xué)等不同角度的定義和解讀。但是,無論何種理解,可能大家都不會反對的是科學(xué)的一個核心傳統(tǒng)就是對自然的觀察與認識,并在此基礎(chǔ)上形成關(guān)于自然的理論化知識。所以,我們往往稱之為自然科學(xué)。此外,近現(xiàn)代科學(xué)發(fā)展日益離不開實驗儀器與技術(shù)的支持,如人類并沒有直接看到電流現(xiàn)象,而是通過安培表等顯示的數(shù)據(jù)得以表征。尤其是對微觀世界的認識,所達到的層次越來越遠離人類的直接觀察能力,越來越需要借助實驗儀器的支持。為了發(fā)現(xiàn)新的基本粒子,動輒需要投入成百上千億資金建設(shè)加速器和對撞機。所以,我們又常常將科學(xué)稱之為實驗科學(xué)。

      但無論是安培表對電流的表征還是對撞機激發(fā)的基本粒子信號,一個本質(zhì)上的共同點在于它們都是通過實驗儀器與物質(zhì)本身發(fā)生相互作用,通過收集和分析物質(zhì)本身發(fā)回的“應(yīng)答”信號來認識物質(zhì)本身。簡言之,離開物質(zhì)本身,我們對物質(zhì)的認識將一無所獲。

      解析蛋白質(zhì)結(jié)構(gòu)的傳統(tǒng)方法,無論是X-射線晶體學(xué)、冷凍電鏡技術(shù)觀察還是磁共振,依然是通過實驗儀器與目標蛋白質(zhì)自身存在的質(zhì)子或電子發(fā)生交互作用而得到回饋信息,并以此為依據(jù)解析其結(jié)構(gòu)。正如諾貝爾獎委員會這樣評價冷凍電鏡技術(shù):“科學(xué)突破往往建立在對人眼不可見物體的成功可視化的基礎(chǔ)上……借助冷凍電子顯微鏡,研究人員現(xiàn)在可以凍結(jié)運動中的生物分子,并將他們以前從未見過的過程可視化?!盵4]

      但AlphaFold所做的工作與上述科學(xué)實驗有著根本的區(qū)別,它并沒有與目標蛋白這種認識客體發(fā)生任何直接或間接的交互作用,而且也并不依賴于這種交互作用,完全依靠歷史數(shù)據(jù)和智能分析推算出了目標蛋白的結(jié)構(gòu)。

      瑞典生物學(xué)家里哈斯(Anders Lijas)等[2]6提到:“結(jié)構(gòu)生物學(xué)領(lǐng)域集中在一個經(jīng)典共識:要真正理解某事,我們需要看見它(的結(jié)構(gòu)),也可以說‘眼見為實’。”但是,AlphaFold所呈現(xiàn)出的讓人親眼所見的目標蛋白的圖像結(jié)構(gòu)是否為“實”,卻需要我們辨析。正如里哈斯等[2]6進一步解釋所謂的經(jīng)典共識:“這個共識對于宇觀研究對象如天文學(xué)與天體物理、宏觀研究對象如設(shè)計機器及修理汽車與鐘表、微觀研究對象如生物系統(tǒng)或粒子物理都是如此。結(jié)構(gòu)生物學(xué)是試圖使生物學(xué)中的亞細胞及分子客體(結(jié)構(gòu))可視化并以此來理解機理的科學(xué)?!?/p>

      客體可視化,很明顯,這里是指在一項科學(xué)活動中研究主體借助實驗或技術(shù)手段感知到原本超出了人類自身感知能力和范圍的研究客體。具體到解析目標蛋白結(jié)構(gòu)中,就是指十分之一納米級的蛋白質(zhì)結(jié)構(gòu)空間遠遠超出了人類自身的直接感知能力,需要借助于實驗儀器與目標蛋白的互動接收到目標蛋白回饋的信息形成可認知的數(shù)據(jù)或圖像。要言之,客體給予(也許是被動地給予)主體感知信號。

      但AlphaFold給予研究主體的可視化圖像并非來源于目標蛋白自身,正如前文所詳細介紹的,是來源于大數(shù)據(jù)統(tǒng)計與智能預(yù)測,并沒有形成一個傳統(tǒng)意義上的主體認知客體的完整環(huán)節(jié),得到的結(jié)構(gòu)圖像并非來源于目標蛋白自身。因此,從實驗科學(xué)根本特點來講,不能說這樣的預(yù)測可以代替科學(xué)實驗,得到的圖像、信號也不能簡單地就被確定為科學(xué)知識。

      3 AI時代的科學(xué)與科學(xué)革命

      3.1 科學(xué)與經(jīng)驗驗證

      從實證主義科學(xué)觀來看,科學(xué)被定義為實證基礎(chǔ)上的關(guān)于自然的體系化知識;科學(xué)發(fā)現(xiàn)被理解為由三個內(nèi)在緊密關(guān)聯(lián)而且往復(fù)循環(huán)的階段構(gòu)成:觀察(實驗)-猜測(假說)-驗證;在此基礎(chǔ)上形成科學(xué)理論的確證觀,即理論必須由經(jīng)驗證實。當科學(xué)哲學(xué)由“證明的邏輯”走上“發(fā)現(xiàn)的邏輯”,特別是英國科學(xué)哲學(xué)家波普(Karl Popper)指出相對于科學(xué)知識結(jié)構(gòu)的研究,更重要的是研究科學(xué)知識的發(fā)展,由此,在科學(xué)觀上發(fā)生一個重大的變化,就是由確認的觀點代替確證的觀點。但是,盡管發(fā)生了這樣的觀念變化,“確認的觀點并不排斥確證的基本思想。確證的合理的基本思想是強調(diào)經(jīng)驗驗證,而經(jīng)驗驗證對于一切真正的科學(xué)認知來說,都是不可或缺的必要條件”[11]141。而且,“通過觀察實驗獲取原始數(shù)據(jù)是科學(xué)認識的基本條件和基本活動”[11]138-139。

      除非未來AI能夠自行與自然對話、自主設(shè)計科學(xué)實驗、開展科學(xué)發(fā)現(xiàn)活動,否則目前AI所做的工作還處于科學(xué)實驗的輔助階段,特別是對理論假說的建構(gòu)具有啟示和借鑒意義。例如,對于實驗科學(xué)方法獲得的尚無法達到理想認知狀態(tài)的結(jié)構(gòu)圖像,結(jié)合 AI結(jié)構(gòu)預(yù)測結(jié)果可以予以補充、修正或啟發(fā)。毋庸置疑,這必將在促進科學(xué)發(fā)現(xiàn)上起很大的推動作用。但整體上講,目前階段AI蛋白質(zhì)結(jié)構(gòu)預(yù)測和人腦在儲備了大量關(guān)于蛋白質(zhì)結(jié)構(gòu)的經(jīng)驗性知識基礎(chǔ)上猜測目標蛋白質(zhì)結(jié)構(gòu)在性質(zhì)上是一樣的,只不過前者更快、更形象化,而且可能也是更接近事實。也許AI應(yīng)用于結(jié)構(gòu)生物學(xué)給我們帶來的是一個全新的課題,那就是需要我們認真思考和研究,AlphaFold是如何預(yù)測出蛋白質(zhì)結(jié)構(gòu)的?正如有學(xué)者提出:“怎么理解這個算法成功的原理?怎么跟原有的熱力學(xué)、物理學(xué)等基本原理相融相通?”[10]

      3.2 科學(xué)革命的邏輯

      談到科學(xué)革命,大家很容易與科學(xué)歷史主義建立聯(lián)系。美國科學(xué)哲學(xué)家?guī)於?Thomas Kuhn)是在攻讀物理學(xué)博士期間轉(zhuǎn)向科學(xué)史與科學(xué)哲學(xué),他的科學(xué)革命的結(jié)構(gòu):“常規(guī)科學(xué)-危機-科學(xué)革命-新常規(guī)科學(xué)”,主要是建立在物理學(xué)史的史料基礎(chǔ)之上,“一般而言,這種結(jié)構(gòu)形式比較符合物理學(xué)、化學(xué)領(lǐng)域發(fā)生過的科學(xué)革命(也不盡然),而未能圓滿解釋生物學(xué)科的科學(xué)革命”[12]185。但引發(fā)科學(xué)革命的原因是出現(xiàn)原有理論范式無法解釋的反?,F(xiàn)象,對我們分析生物學(xué)革命還是有啟發(fā)意義的。正如美國科學(xué)哲學(xué)家勞丹(Larry Laudan)盡管不同意庫恩科學(xué)革命的不可通約性,“革命不像庫恩所說的那么革命,常規(guī)也不像庫恩所說的那么常規(guī)”[12]226,但同樣認為,科學(xué)革命是新發(fā)展出的理論對反常現(xiàn)象的解釋力愈來愈強。

      正如上文分析,AI蛋白質(zhì)結(jié)構(gòu)預(yù)測完全建立于原有的“蛋白質(zhì)的氨基酸序列決定其三維結(jié)構(gòu)”的基本信條上,所預(yù)測出的結(jié)構(gòu)并沒有發(fā)現(xiàn)對這一信條的反常現(xiàn)象,恰恰相反,如果AI預(yù)測的蛋白質(zhì)結(jié)構(gòu)被實驗證明是完全符合實際結(jié)構(gòu)的,那AI所做的工作恰恰是對這一信條的肯定。而且,結(jié)構(gòu)解析還只是生物學(xué)科學(xué)發(fā)現(xiàn)的一個環(huán)節(jié),即使AI發(fā)展到了對所有結(jié)構(gòu)預(yù)測都能達到與事實完全相符合的階段,其科學(xué)意義也僅在促進發(fā)現(xiàn)新的、重大生物學(xué)理論,但AI預(yù)測本身并不是重大生物學(xué)理論發(fā)現(xiàn)。所以,從是否顛覆了原有生物學(xué)理論范式或者構(gòu)建了更具解釋力的新理論層面看,目前AI結(jié)構(gòu)預(yù)測還未達到帶來結(jié)構(gòu)生物學(xué)革命的階段。

      3.3 AI與科學(xué)

      但是,科學(xué)活動的AI時代畢竟走來了,帶來了以往科學(xué)研究所不曾見過的新手段、新工具,在這個層面上,可以認為它是結(jié)構(gòu)生物學(xué)的一種革命。

      第一,學(xué)科交叉是偉大科學(xué)發(fā)現(xiàn)的一條重要途徑。翻看科學(xué)史,這樣的例子比比皆是。上文講到的DNA雙螺旋結(jié)構(gòu)的創(chuàng)造性提出與X-射線晶體學(xué)密不可分。而遺傳學(xué)鼻祖孟德爾,之所以能在實驗生物學(xué)的研究還遠遠沒有進入分子層面的時代,僅靠豌豆個體及其代際之間的性狀特征就超越一個多世紀創(chuàng)造性地提出性狀遺傳規(guī)律,這與他本人有統(tǒng)計學(xué)基礎(chǔ)密不可分。因“對冷凍電鏡技術(shù)的發(fā)展做出突出貢獻”而獲得2017年諾貝爾獎的三位科學(xué)家都有物理學(xué)背景,獲得的也并非生理學(xué)與醫(yī)學(xué)獎,以至于當年就有人評論他三人是“物理學(xué)家因幫助生物學(xué)家得到今年的諾貝爾化學(xué)獎”[13]。AI本身就是計算機科學(xué)、語言學(xué)、腦神經(jīng)科學(xué)、物理學(xué)、生物學(xué)等多學(xué)科交叉的結(jié)果。在現(xiàn)階段,AI成果已經(jīng)應(yīng)用于各學(xué)科領(lǐng)域,成為科學(xué)發(fā)現(xiàn)的有力助手,如“解放”結(jié)構(gòu)生物學(xué)家。

      第二,讓結(jié)構(gòu)生物學(xué)家將更多的精力放在機理研究上。解析蛋白質(zhì)結(jié)構(gòu)的目的是理解蛋白質(zhì)為什么有如此多樣且重要的功能,從而增進人們對生命的理解。但是,以往的蛋白質(zhì)結(jié)構(gòu)解析方法耗費了結(jié)構(gòu)生物學(xué)家大量的精力和時間,傳統(tǒng)X-射線晶體學(xué)往往在實現(xiàn)蛋白質(zhì)結(jié)晶階段就動輒需要數(shù)十年,創(chuàng)造性活動集中在了“看”到蛋白質(zhì)結(jié)構(gòu),而不是理解生命。即使這樣,得到的圖像經(jīng)常無法給予我們一個清晰的三維空間結(jié)構(gòu)。將AlphaFold預(yù)測結(jié)果與實驗生物學(xué)家所得圖像結(jié)合分析,會極大推進對蛋白質(zhì)三維空間的構(gòu)想,在這種意義上講,AI介入結(jié)構(gòu)分析將有利于科學(xué)家從結(jié)構(gòu)分析中解脫出來,將更多的精力和創(chuàng)造性活動集中在理解生命機理的生物學(xué)目標上。

      4 結(jié)語

      人類自誕生以來就開始了對我們所處世界及自身的探索和認知活動,近代科學(xué)革命以后更是加快了這一進程,主要特征之一就是科學(xué)方法的巨大進步。當代科學(xué)新進展不斷催生新的科學(xué)方法和實驗技術(shù),反過來又幫助人類加快、加深對自然和自身的認識與見解。尤其是在15世紀以來人類進入了科學(xué)的時代之后,現(xiàn)在我們進入了科學(xué)時代中的AI時代,AI在廣泛應(yīng)用和促進社會發(fā)展的各個領(lǐng)域的同時,也在科學(xué)研究領(lǐng)域逐漸顯現(xiàn)出強大的功能。生物醫(yī)學(xué)領(lǐng)域很多方面的突破性進展也日益離不開AI的支撐。但是,AI到底在目前階段對科學(xué)是否帶來革命性變革、抑或到底是在哪些方面或?qū)用嫫鹬陵P(guān)重要的作用,需要我們就具體科學(xué)領(lǐng)域具體分析。就結(jié)構(gòu)生物學(xué)而言,以AlphaFold系列算法預(yù)測蛋白質(zhì)結(jié)構(gòu)為代表,已經(jīng)表明作為分析和預(yù)測工具的AI在科學(xué)研究中顯現(xiàn)出了強大的威力,但是在科學(xué)的道路上推進對人自身的認識和對生命的理解,尚需要其與實驗科學(xué)同步推進。

      猜你喜歡
      生物學(xué)解析蛋白質(zhì)
      蛋白質(zhì)自由
      肝博士(2022年3期)2022-06-30 02:48:48
      人工智能與蛋白質(zhì)結(jié)構(gòu)
      海外星云(2021年9期)2021-10-14 07:26:10
      谷稗的生物學(xué)特性和栽培技術(shù)
      三角函數(shù)解析式中ω的幾種求法
      初中生物學(xué)糾錯本的建立與使用
      初中生物學(xué)糾錯本的建立與使用
      睡夢解析儀
      電競初解析
      商周刊(2017年12期)2017-06-22 12:02:01
      蛋白質(zhì)計算問題歸納
      相機解析
      涡阳县| 团风县| 千阳县| 朝阳区| 桃园县| 叶城县| 肃北| 高尔夫| 嘉义县| 韩城市| 桓台县| 屯留县| 芜湖市| 洪洞县| 舟曲县| 上杭县| 淅川县| 赤水市| 宜章县| 三台县| 舟曲县| 扶余县| 利津县| 大田县| 蒙阴县| 大连市| 新巴尔虎右旗| 社会| 建始县| 黔南| 蒲城县| 枞阳县| 自贡市| 奉节县| 绩溪县| 侯马市| 三门县| 姚安县| 嘉鱼县| 甘泉县| 黔西|