• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      融合圖Transformer和Vina-GPU+的多模態(tài)虛擬篩選新方法

      2025-01-22 00:00:00張豪張堃然阮曉東沐勇吳建盛
      關(guān)鍵詞:微調(diào)靶標(biāo)學(xué)習(xí)策略

      關(guān)鍵詞:虛擬篩選,Graph Transformer,Vina?GPU+,多模態(tài),知識(shí)蒸餾,主動(dòng)學(xué)習(xí)

      中圖分類號(hào):Q811. 4 文獻(xiàn)標(biāo)志碼:A

      現(xiàn)代藥物發(fā)現(xiàn)面臨從大型化合物庫(kù)中進(jìn)行大規(guī)模篩選的挑戰(zhàn)[1],提高篩選的速度與精度已是迫切的需求[2]. 隨著化合物庫(kù)規(guī)模的不斷擴(kuò)大,傳統(tǒng)的篩選方法耗時(shí)費(fèi)力,因此,虛擬篩選成為加快藥物研發(fā)的常用手段[3]. 虛擬篩選利用計(jì)算機(jī)模擬分子間的相互作用,能夠快速識(shí)別潛在的活性化合物,所以顯著提升了篩選效率. 另外,在提升虛擬篩選速度的同時(shí),保證其篩選的準(zhǔn)確率也至關(guān)重要,這直接關(guān)系到發(fā)現(xiàn)潛在藥物候選物的成功率[4].

      分子對(duì)接是虛擬篩選的一種重要方法,其利用計(jì)算機(jī)來模擬分子之間的相互作用,揭示靶點(diǎn)與化合物之間的結(jié)合模式[5]. 研究人員通常利用分子對(duì)接軟件對(duì)小分子化合物與藥物靶標(biāo)進(jìn)行分子對(duì)接,再進(jìn)行活性化合物篩選. 分子對(duì)接可快速?gòu)膸资辽习偃f分子中選出可能成藥的活性化合物,大大降低了實(shí)際篩選化合物的數(shù)目,縮短了研究周期,降低了藥物研發(fā)的成本. AutoDock Vi?na 是分子對(duì)接的首選工具之一,以速度和準(zhǔn)確性聞名[6]. 在CASF ? 2016基準(zhǔn)測(cè)試中,AutoDockVina 展示了最佳的對(duì)接性能和在蛋白質(zhì)?配體復(fù)合物測(cè)試集上最佳的評(píng)分能力[7-8]. 由于Auto ?Dock Vina 整體上是串行設(shè)計(jì)的,以前的加速方法主要依賴計(jì)算資源的疊加. GPU (GraphicsProcessing Unit)以其易用性和成本效益已被廣泛應(yīng)用于加速計(jì)算,我們開發(fā)的Vina?GPU[9]和Vina?GPU+[10]利用GPU顯著提高了AutoDock Vina 的效率,分別實(shí)現(xiàn)了最高50倍和65. 6倍的加速,對(duì)于在個(gè)人電腦、工作站服務(wù)器或云計(jì)算等上廣泛實(shí)現(xiàn)大規(guī)模虛擬篩選至關(guān)重要.

      結(jié)合親和力預(yù)測(cè)是虛擬篩選中的另一種重要方法. 機(jī)器學(xué)習(xí)包含的多種模型可以解決分類、回歸和聚類的問題,結(jié)合親和力預(yù)測(cè)并通過機(jī)器學(xué)習(xí)模型來估算受體和配體間的結(jié)合強(qiáng)度[11],這種信息的有機(jī)結(jié)合可以更加全面地考慮分子之間的結(jié)構(gòu)和性質(zhì),提升虛擬篩選的精度. 例如,2021年Yang et al[12]提出一種基于主動(dòng)學(xué)習(xí)的機(jī)器學(xué)習(xí)增強(qiáng)型分子對(duì)接協(xié)議,能識(shí)別得分最高的化合物并探索大范圍的化學(xué)空間,和純貪婪的方法相比,展現(xiàn)了更優(yōu)異的虛擬篩選性能. 2022 年Gen?tile et al[4]提出一種深度對(duì)接平臺(tái),通過對(duì)化學(xué)庫(kù)的一個(gè)子集的對(duì)接來迭代同步預(yù)測(cè)其余的配體,可實(shí)現(xiàn)最多100倍的篩選加速. 2023年Sivula etal[13]提出一種機(jī)器學(xué)習(xí)增強(qiáng)的分子對(duì)接方法,實(shí)現(xiàn)了在超大規(guī)模枚舉化學(xué)庫(kù)上的快速虛擬篩選. 2023 年Yu et al[14]提出一種深度學(xué)習(xí)新方法GEM?Screen,利用與特定靶點(diǎn)對(duì)接化合物的幾何增強(qiáng)分子表示,通過主動(dòng)學(xué)習(xí)策略,對(duì)庫(kù)的一小部分進(jìn)行對(duì)接評(píng)分訓(xùn)練,可以增強(qiáng)基于分子對(duì)接的大規(guī)模虛擬篩選的性能. 2024 年P(guān)opov et al[15]提出一種基于生成模型增強(qiáng)的分子對(duì)接方法HID?DEN GEM,整合了機(jī)器學(xué)習(xí)、生成化學(xué)和大規(guī)?;瘜W(xué)相似性搜索,加速了虛擬篩選過程.

      隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的應(yīng)用越來越廣泛,大規(guī)模預(yù)訓(xùn)練模型在自然語言處理和計(jì)算機(jī)視覺領(lǐng)域取得了巨大成功[16]. 例如,OpenAI 推出的ChatGPT 和Sora 等模型,依托于海量數(shù)據(jù)的預(yù)訓(xùn)練,構(gòu)建了強(qiáng)大的語言理解和圖像識(shí)別能力,在多項(xiàng)任務(wù)上超越了傳統(tǒng)方法. 這一技術(shù)也為藥物虛擬篩選帶來了新思路,為解決數(shù)據(jù)量大、復(fù)雜性高等挑戰(zhàn)提供了可能性[17]. 例如,2022 年同濟(jì)大學(xué)劉琦教授課題組與百度公司合作發(fā)布X?MOL 模型,采用混合注意力Transformer 模型,利用海量訓(xùn)練數(shù)據(jù)對(duì)小分子進(jìn)行有效表征,顯著提升了虛擬篩選性能[18].2022年IBM 研究院發(fā)布MOLFORMER 模型,通過預(yù)訓(xùn)練處理11 億未標(biāo)記分子的SMILES,在分子屬性預(yù)測(cè)等任務(wù)中表現(xiàn)出色[19]. 近期,Mifflin et al[20]的知識(shí)引導(dǎo)的預(yù)訓(xùn)練框架KPGT 集成了專門為分子圖設(shè)計(jì)的圖轉(zhuǎn)換器和知識(shí)引導(dǎo)的預(yù)訓(xùn)練策略,進(jìn)一步改善了分子表示學(xué)習(xí).

      為了進(jìn)一步提高虛擬篩選的速度和精度,本文提出一種新的多模態(tài)虛擬篩選方法Vina?GPUGT,結(jié)合Vina ? GPU+ 分子對(duì)接技術(shù)和預(yù)訓(xùn)練Graph Transformer (GT)模型,能實(shí)現(xiàn)快速準(zhǔn)確的虛擬篩選過程. 該方法結(jié)合了兩種不同維度的分子信息,即分子的序列信息(SMILES)和3D 結(jié)構(gòu)信息(pdbqt)來共同進(jìn)行篩選,可以增強(qiáng)虛擬篩選的性能. Vina?GPU GT 包括三個(gè)步驟. 首先,基于已經(jīng)進(jìn)行分子屬性預(yù)測(cè)的預(yù)訓(xùn)練GT 模型Graphormer 設(shè)計(jì)了一種全新的知識(shí)蒸餾方法來訓(xùn)練一個(gè)輕量級(jí)SMILES Transformer (ST)模型,它可以更高效地學(xué)習(xí)并表示復(fù)雜的分子結(jié)構(gòu)信息;其次,使用訓(xùn)練好的ST 模型對(duì)化合物庫(kù)中的所有分子進(jìn)行推理,根據(jù)主動(dòng)學(xué)習(xí)規(guī)則選擇2% 的分子,利用Vina?GPU+進(jìn)行分子對(duì)接,根據(jù)對(duì)接得分對(duì)ST 模型進(jìn)行微調(diào),以優(yōu)化ST 模型的性能;最后,使用微調(diào)的ST 模型來預(yù)測(cè)化合物庫(kù)分子,并根據(jù)其得分對(duì)分子進(jìn)行排序,完成藥物的虛擬篩選過程.

      在三個(gè)重要蛋白靶點(diǎn)(RIPK1,RIPK3,AmpCβ ?lactamase)和兩個(gè)化合物庫(kù)(DrugBank 和Sel?leck)上進(jìn)行虛擬篩選實(shí)驗(yàn),并與兩種不同的虛擬篩選方法進(jìn)行比較,證明Vina?GPU GT 的虛擬篩選性能最佳. 具體地,和Vina ? GPU 以及Vina ?GPU+相比,其命中率(HIT 1%)平均提升362. 6% 和354%,富集因子(Enrichment Factor,EF 1%)平均提升332. 7% 和323. 1%.

      1 數(shù)據(jù)與方法

      1. 1數(shù)據(jù)

      1. 1. 1蛋白質(zhì)靶標(biāo) 選擇三種非常重要并被廣泛研究的蛋白質(zhì)作為實(shí)驗(yàn)對(duì)象. 第一種是RIPK1蛋白[21],它在細(xì)胞的增殖、分化以及死亡等關(guān)鍵的生命活動(dòng)過程中發(fā)揮信號(hào)傳導(dǎo)作用. 第二種是RIPK3 蛋白[22],以其在壞死性凋亡中的作用而知名,壞死性凋亡是細(xì)胞程序性死亡的一種形式,通常在細(xì)胞的標(biāo)準(zhǔn)凋亡途徑受阻時(shí)發(fā)生. RIPK1和RIPK3對(duì)細(xì)胞死亡和炎癥調(diào)控有至關(guān)重要的作用,而這兩個(gè)過程是維持組織內(nèi)穩(wěn)態(tài)及免疫響應(yīng)不可或缺的,這兩種蛋白質(zhì)的功能失調(diào)與包括癌癥、神經(jīng)退行性疾病和炎癥性疾病在內(nèi)的多種疾病的發(fā)生有關(guān). 第三種是AmpC β?lactamase,這是一種由某些細(xì)菌產(chǎn)生的酶,可導(dǎo)致細(xì)菌對(duì)包括青霉素類、頭孢菌素類和碳青霉烯類在內(nèi)的多種β ? 內(nèi)酰胺類抗生素產(chǎn)生耐藥性. AmpC β ? lac?tamase 細(xì)菌的出現(xiàn)和傳播已成為一個(gè)重要的公共衛(wèi)生問題,因?yàn)樗档土吮姸嗫股氐寞熜В⑹沟糜蛇@些細(xì)菌引起的感染的治療復(fù)雜化.

      1. 1. 2化合物庫(kù) 選擇兩個(gè)廣泛應(yīng)用的分子數(shù)據(jù)庫(kù)進(jìn)行虛擬篩選. 第一個(gè)是DrugBank 數(shù)據(jù)庫(kù)[23],它是一個(gè)綜合性的數(shù)據(jù)庫(kù),提供藥物及其靶點(diǎn)和作用機(jī)制的信息,本研究從DrugBank 網(wǎng)站(https://go. drugbank. com/releases/latest#)選取11582 個(gè)分子及其結(jié)構(gòu). 第二個(gè)是Selleck 數(shù)據(jù)庫(kù),包含一系列小分子化合物,包括各種細(xì)胞靶標(biāo)的抑制劑、激動(dòng)劑、拮抗劑和活化劑,本研究從L460?TargetMol 天然化合物庫(kù)和L1400?Selleck天然產(chǎn)物庫(kù)的131cpds 板中共獲得5148 個(gè)分子.

      1. 2方法 Vina ? GPU 是AutoDock Vina 的GPU 加速版本,通過大幅增加蒙特卡羅搜索中隨機(jī)初始構(gòu)象的個(gè)數(shù),顯著降低了每個(gè)初始構(gòu)象對(duì)應(yīng)的搜索深度,增加了算法的并行度,充分利用GPU 上數(shù)千個(gè)計(jì)算核心,實(shí)現(xiàn)了大規(guī)模的并行化和加速. Vina?GPU+在Vina?GPU 的基礎(chǔ)上,對(duì)能量的網(wǎng)格表計(jì)算進(jìn)行了優(yōu)化,減少了冗余計(jì)算,進(jìn)一步加速了虛擬篩選過程.

      本文提出的方法結(jié)合了Vina?GPU+分子對(duì)接技術(shù)和預(yù)訓(xùn)練GT 模型,實(shí)現(xiàn)了快速而準(zhǔn)確的虛擬篩選過程. 該方法總體分兩個(gè)階段,首先是模型的準(zhǔn)備,然后是基于主動(dòng)學(xué)習(xí)策略的模型微調(diào). 階段一選用GT 模型作為教師模型,ST 模型作為學(xué)生模型,使用知識(shí)蒸餾方法得到具有先驗(yàn)知識(shí)的ST 模型,在此基礎(chǔ)上使用LIT?PCBA 數(shù)據(jù)集[24]中的ALDH1 靶標(biāo)和小分子的Vina?GPU+對(duì)接得分對(duì)蒸餾后的ST 模型進(jìn)行微調(diào). 階段二主要進(jìn)行基于主動(dòng)學(xué)習(xí)策略的分子挑選. 使用階段一準(zhǔn)備好的模型對(duì)待篩選的整個(gè)化合物庫(kù)進(jìn)行推理,升序排列推理得分并選取前20% 的后10%的分子作為對(duì)接分子,再使用Vina?GPU+進(jìn)行對(duì)接,其打分則用于對(duì)ST 模型的進(jìn)一步微調(diào). 微調(diào)好ST 模型之后再一次對(duì)整個(gè)待篩選的化合物庫(kù)進(jìn)行推理,根據(jù)推理得分選取目標(biāo)分子. 本方法的流程框架如圖1 所示.

      1. 2. 1模型的蒸餾與預(yù)訓(xùn)練

      1.2.1.1模型的選取 GT 模型是一種專為解析和處理圖結(jié)構(gòu)信息而設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)模型,具有強(qiáng)大的表征能力,其利用自注意力機(jī)制能有效地捕獲長(zhǎng)距離節(jié)點(diǎn)之間的關(guān)系[25]. GT 模型經(jīng)過預(yù)訓(xùn)練后具備豐富的先驗(yàn)知識(shí),能顯著加速其在下游任務(wù)中的收斂過程,減少計(jì)算資源及時(shí)間的消耗,還可以實(shí)現(xiàn)知識(shí)遷移,提高模型的性能.

      同樣基于Transformer 架構(gòu)但和GT 模型不同,ST 模型使用SMILES 字符串作為輸入,規(guī)避了由SMILES 到圖結(jié)構(gòu)轉(zhuǎn)換的效率損失. 為了進(jìn)一步提升ST 模型的效果,將預(yù)訓(xùn)練GT 模型作為教師模型,ST 模型作為學(xué)生模型,用模型蒸餾技術(shù)實(shí)現(xiàn)從預(yù)訓(xùn)練GT 模型到ST 模型的知識(shí)遷移.

      綜上,本文選用預(yù)訓(xùn)練GT 和ST 模型,并利用Vina?GPU+進(jìn)行得分的微調(diào),以實(shí)現(xiàn)不同模態(tài)間的信息融合,從而加快模型推理的速度,并在虛擬篩選應(yīng)用中進(jìn)一步提高模型的準(zhǔn)確性.

      1.2.1.2知識(shí)蒸餾方法 分別選取GT和ST模型作為教師和學(xué)生模型. 選取小分子數(shù)據(jù)集,使用RDKIT工具包提取SMILES表示中的原子特征和化學(xué)鍵特征. 將SMILES 轉(zhuǎn)換為ST模型的輸入embedding:

      1. 2. 2 基于主動(dòng)學(xué)習(xí)策略的分子挑選、對(duì)接與模型微調(diào) 為了提升ST 模型在預(yù)測(cè)Vina?GPU+打分方面的性能,采用LIT?PCBA 數(shù)據(jù)集中的AL?DH1 靶標(biāo)及其相應(yīng)小分子的Vina?GPU+對(duì)接得分,對(duì)經(jīng)過知識(shí)蒸餾處理的ST 模型進(jìn)行微調(diào),使ST 模型掌握部分Vina?GPU+打分的先驗(yàn)知識(shí).

      以經(jīng)過預(yù)訓(xùn)練得到的ST 模型為基礎(chǔ),進(jìn)入基于主動(dòng)學(xué)習(xí)策略的微調(diào)階段. 首先利用ST 模型對(duì)待篩選數(shù)據(jù)集進(jìn)行推理,按升序規(guī)則對(duì)推理得分排序;然后,依托主動(dòng)學(xué)習(xí)策略,選擇具有最高信息價(jià)值的分子,即排序前20% 的后10% 的分子,作為進(jìn)一步微調(diào)ST 模型的訓(xùn)練集;使用Vina?GPU+對(duì)這部分分子打分,并據(jù)此訓(xùn)練ST模型以擬合這些分?jǐn)?shù). 此過程迭代執(zhí)行,直至完成模型的微調(diào).

      分子對(duì)接的過程如圖2 所示,考慮到分子構(gòu)象生成的速度通??煊诜肿訉?duì)接,為了提升對(duì)接效率,采用基于流水線的處理結(jié)構(gòu),由兩個(gè)子進(jìn)程分別負(fù)責(zé)分子構(gòu)象生成與Vina?GPU+對(duì)接,從而提高整個(gè)分子對(duì)接模塊的吞吐量. 獲取每個(gè)分子的對(duì)接得分后,將其按SMILES 與SCORE鍵值對(duì)的格式整理,構(gòu)成訓(xùn)練數(shù)據(jù)集. 訓(xùn)練過程中選用MAE 作為損失函數(shù),當(dāng)MAE 收斂至較小值時(shí),模型微調(diào)階段完成.

      最終,使用經(jīng)過微調(diào)的ST 模型對(duì)整個(gè)虛擬篩選數(shù)據(jù)集進(jìn)行推理,并根據(jù)模型的推理得分進(jìn)行排序. 根據(jù)研究需求,選取得分最高的Topk 分子,作為虛擬篩選的目標(biāo)分子.

      2 結(jié)果與討論

      2. 1虛擬篩選速度比較 圖3 展示了在Drug?Bank 和Selleck 數(shù)據(jù)庫(kù)上使用三種對(duì)接方法對(duì)三個(gè)靶標(biāo)進(jìn)行虛擬篩選的時(shí)間. 與Vina?GPU 和Vi?na?GPU+相比,Vina?GPU GT 在DrugBank 數(shù)據(jù)庫(kù)上進(jìn)行虛擬篩選的時(shí)間平均減少97. 6% 和96. 3%,在Selleck 數(shù)據(jù)庫(kù)上進(jìn)行虛擬篩選的時(shí)間平均減少98. 9% 和97. 7%. 總體而言,Vina ?GPU GT 和Vina?GPU+相比實(shí)現(xiàn)了31 倍的虛擬篩選加速,和Vina?GPU 相比實(shí)現(xiàn)了53 倍的虛擬篩選加速.

      2. 2在DrugBank數(shù)據(jù)庫(kù)上的虛擬篩選結(jié)果

      圖4 展示了在DrugBank 數(shù)據(jù)庫(kù)上三種對(duì)接方法對(duì)三個(gè)受體的虛擬篩選結(jié)果,由圖可見,Vina ?GPU GT 的HIT 和EF 顯著優(yōu)于Vina?GPU 和Vi?na?GPU+. 具體地,與Vina?GPU 相比,Vina?GPUGT 的HIT(1%,5%,10%)平均提升547. 1%,492. 7%,350. 9%,EF(1%,5%,10%)平均提升552. 1%,491. 8%,351. 3%. 與Vina?GPU+相比,Vina?GPU GT 的HIT(1%,5%,10%)平均提升642. 2%,610. 3%,378. 1%,EF(1%,5%,10%)平均提升644. 9%,616%,378. 8%. 在AmpC β?lactamase 分子對(duì)接結(jié)果中,Vina ? GPU+ 的HIT1% 和EF 1% 高于Vina?GPU GT,這可能是由于在AmpC β?lactamase 這個(gè)靶標(biāo)的數(shù)據(jù)集中,作為正樣本的活性分子有許多SMILES 含有“. ”這種Vina?GPU 和Vina?GPU+分子對(duì)接軟件無法計(jì)算的分子,無法得到這些分子的打分結(jié)果,導(dǎo)致在微調(diào)時(shí)訓(xùn)練的數(shù)據(jù)量不足. 并且,作為活性分子,這些分子的打分信息對(duì)于模型訓(xùn)練可能更關(guān)鍵,這部分信息的缺失使模型的較嚴(yán)苛的HIT 1% 和EF 1% 指標(biāo)的表現(xiàn)不佳.

      綜上,對(duì)DrugBank 數(shù)據(jù)庫(kù)的虛擬篩選,與Vi?na?GPU 和Vina?GPU+兩種方法相比,Vina GPUGT 的篩選結(jié)果更優(yōu).

      2. 3在Selleck 數(shù)據(jù)庫(kù)上的虛擬篩選結(jié)果 圖5展示了在Selleck 數(shù)據(jù)庫(kù)上三種對(duì)接方法對(duì)三個(gè)受體的虛擬篩選結(jié)果,由圖可見,Vina?GPU GT的篩選精度顯著優(yōu)于Vina?GPU 和Vina?GPU+.具體地,與Vina ? GPU 相比,Vina ? GPU GT 的HIT(1%,5%,10%)平均提升99%,349. 3%,263. 5%,EF(1%,5%,10%)平均提升113. 3%,353. 7%,261. 5%. 與Vina ? GPU+ 相比,Vina ?GPU GT 的HIT(1%,5%,10%)平均提升65. 7%,403. 2%,257. 8%,EF(1%,5%,10%)平均提升80. 3%,411. 4%,256. 6%.

      綜上,對(duì)Selleck 數(shù)據(jù)庫(kù)的虛擬篩選,與Vina?GPU 和Vina ? GPU+ 兩種方法相比,Vina ? GPUGT 的篩選結(jié)果更優(yōu).

      2. 4虛擬篩選的得分比較 圖6 展示了在Drug?Bank 數(shù)據(jù)庫(kù)上三個(gè)受體的虛擬篩選得分. 由圖可見,Vina?GPU GT 對(duì)RIPK1 受體的打分主要集中在-8 以內(nèi),對(duì)RIPK3 受體的打分主要集中在-9以內(nèi),對(duì)AmpC β ? lactamase 的打分主要集中在-10 以內(nèi). 與Vina?GPU 和Vina?GPU+的得分相比,Vina?GPU GT 在虛擬篩選時(shí)面對(duì)不同的受體,對(duì)配體的打分差異更明顯. 此外,Vina?GPU GT,Vina?GPU,Vina?GPU+在DrugBank 數(shù)據(jù)庫(kù)上對(duì)RIPK1 的平均得分分別為-4. 8,-6. 6,-6. 6;對(duì)RIPK3 的平均得分分別為-7. 6,-6. 6,-6. 6;對(duì)AmpC β ?lactamase 的平均得分分別為-7. 2,-7. 0,-7. 0. 根據(jù)對(duì)不同受體的得分?jǐn)?shù)據(jù),可以說明Vina?GPU GT 在進(jìn)行虛擬篩選時(shí)更好地考慮了受體的信息. 同時(shí),結(jié)合2. 2和2. 3 中三種方法的虛擬篩選結(jié)果,也證明在三種受體上,Vina?GPU GT 對(duì)于配體的打分和排序更加準(zhǔn)確.

      2. 5消融實(shí)驗(yàn) 為了評(píng)估主動(dòng)學(xué)習(xí)策略對(duì)模型篩選性能的影響,開展了一系列針對(duì)模型主動(dòng)學(xué)習(xí)部分的消融實(shí)驗(yàn). 實(shí)驗(yàn)結(jié)果如圖7~9 所示,分別展現(xiàn)了三個(gè)不同靶標(biāo)在DrugBank和Selleck 兩個(gè)數(shù)據(jù)庫(kù)上的虛擬篩選性能. 由圖可見,除了AmpC β?lactamase 靶標(biāo)在Selleck 數(shù)據(jù)庫(kù)上的虛擬篩選中,主動(dòng)學(xué)習(xí)后的EF 1% 稍低于未經(jīng)主動(dòng)學(xué)習(xí)的結(jié)果外,其他所有實(shí)驗(yàn)場(chǎng)景中,主動(dòng)學(xué)習(xí)策略均帶來了指標(biāo)的顯著提升,證明將主動(dòng)學(xué)習(xí)集成至模型中可以有效地提高虛擬篩選的準(zhǔn)確性.

      3 結(jié)論

      本文提出一種多模態(tài)虛擬篩選新方法Vina?GPU GT,融合了Vina?GPU+分子對(duì)接方法和預(yù)訓(xùn)練圖Transformer 模型. 實(shí)驗(yàn)結(jié)果證明,Vina?GPU GT 的篩選速度和精度都優(yōu)于Vina?GPU 和Vina?GPU+. 不過,其仍然存在一些局限. 例如,該方法的性能高度依賴于預(yù)訓(xùn)練模型的質(zhì)量和用于知識(shí)蒸餾的數(shù)據(jù),并且,只選擇了2% 的分子進(jìn)行對(duì)接和微調(diào),可能忽略了其他具有潛力的分子. 另外,該方法在不同類型的靶點(diǎn)或化合物庫(kù)上的泛化能力有待驗(yàn)證. 未來將進(jìn)一步優(yōu)化Vina?GPU GT 方法,以提高其在更廣泛靶點(diǎn)和化合物庫(kù)中的適用性和準(zhǔn)確性.

      (責(zé)任編輯 楊可盛)

      猜你喜歡
      微調(diào)靶標(biāo)學(xué)習(xí)策略
      “百靈”一號(hào)超音速大機(jī)動(dòng)靶標(biāo)
      納米除草劑和靶標(biāo)生物的相互作用
      一種新型微調(diào)擠塑模具的設(shè)計(jì)及應(yīng)用
      電線電纜(2018年2期)2018-05-19 02:03:44
      靈活易用,結(jié)合自動(dòng)和手動(dòng)微調(diào)達(dá)到好效果 StormAudio ISP 3D.16 ELITE/PA 16 ELITE
      高中生數(shù)學(xué)自主學(xué)習(xí)策略探討
      復(fù)雜場(chǎng)景中航天器靶標(biāo)的快速識(shí)別
      一種使用反向?qū)W習(xí)策略的改進(jìn)花粉授粉算法
      前列腺特異性膜抗原為靶標(biāo)的放射免疫治療進(jìn)展
      基于微博的移動(dòng)學(xué)習(xí)策略研究
      全國(guó)大部省份結(jié)束2014高考 多地高考模式微調(diào)
      普洱| 辽中县| 马鞍山市| 奉化市| 绍兴市| 田东县| 象山县| 上杭县| 焦作市| 汨罗市| 汕尾市| 绵阳市| 西昌市| 丽水市| 怀来县| 扎兰屯市| 濉溪县| 沧源| 松江区| 嵊州市| 湟源县| 无极县| 柯坪县| 塔城市| 杭锦后旗| 梓潼县| 河曲县| 酉阳| 宕昌县| 白银市| 正宁县| 乌拉特中旗| 彩票| 且末县| 吉隆县| 监利县| 永济市| 广东省| 高尔夫| 体育| 青阳县|