單士喆,文博,喬天慈,單光存
(1.中國中醫(yī)科學院廣安門醫(yī)院,北京 100032;2.香港都會大學,香港 999077;3.上海中醫(yī)藥大學附屬岳陽中西醫(yī)結(jié)合醫(yī)院,上海 200437;4.北京航空航天大學儀器科學與光電工程學院/北京大數(shù)據(jù)與精準醫(yī)療高精尖創(chuàng)新中心,北京 100191)
新型冠狀病毒感染(Corona Virus Disease 2019,COVID-19)是由新型冠狀病毒(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)引起的。SARS-CoV-2 是一種β 冠狀病毒,傳染性強,通過飛沫傳播的能力及其在無生命物體表面的穩(wěn)定性均很高,對全球健康造成威脅[1]。2023 年5 月5 日,世界衛(wèi)生組織指出,COVID-19 不再構(gòu)成國際關(guān)注的突發(fā)公共衛(wèi)生事件,然而同時指出,這并不意味著COVID-19作為一種全球健康威脅已經(jīng)結(jié)束,目前是一個既定和持續(xù)的衛(wèi)生問題[2]。2020年以來,COVID-19 的出現(xiàn)和快速蔓延,對社會、經(jīng)濟和公眾健康等構(gòu)成了嚴重挑戰(zhàn)。同時,在尋找有效的COVID-19 治療藥物的過程中,藥物再利用引起廣泛關(guān)注。藥物再利用是發(fā)掘現(xiàn)有藥物在原有適應證之外的新用途,比開發(fā)新藥更快,成本更低,這些優(yōu)勢在COVID-19 全球大流行中尤其明顯[3]。人工智能(artificial intelligence,AI)能夠從龐大復雜的數(shù)據(jù)中挖掘出信息和規(guī)律,具有速度快和效能高的特點,成為藥物再利用的有效工具,可加快研發(fā)速度,降低研發(fā)成本,在較短時間內(nèi)開發(fā)更多的治療策略和候選藥物,展示出突出的應用潛力和發(fā)展前景。目前,AI 應用于藥物再利用的方法分為基于網(wǎng)絡的模型、基于結(jié)構(gòu)的方法和機器/深度學習方法3 類,已在藥物再利用治療COVID-19 研究中取得一定進展。本文對該進展進行綜述,以期為AI 技術(shù)進一步用于治療COVID-19 藥物研究提供參考。
基于AI 的藥物再利用策略已被證明是加速藥物發(fā)現(xiàn)流程的一種高效途徑。在尋求COVID-19治療策略的過程中,已應用該方法開展了諸多研究。本文歸納了AI 在藥物再利用治療COVID-19 研究中應用的3類主要方法:基于網(wǎng)絡的模型、基于結(jié)構(gòu)的方法和機器/深度學習方法。如果研究中使用了混合方法,如同時使用了網(wǎng)絡建模和機器學習的方法,則根據(jù)占主導地位的方法進行歸類。例如,研究中網(wǎng)絡建模的方法占主導地位,則該研究歸為基于網(wǎng)絡的模型。該3 類方法均依托于大型、高質(zhì)量數(shù)據(jù)集,并依據(jù)各自方法特性而各有側(cè)重的數(shù)據(jù)需求。三者在藥物再利用計算過程中常用的數(shù)據(jù)集類型見圖1。
圖1 藥物再利用治療新型冠狀病毒感染(COVlD-19)研究中3類人工智能(Al)驅(qū)動的方法——基于網(wǎng)絡的模型、基于結(jié)構(gòu)的方法和機器/深度學習方法常用的數(shù)據(jù)集(使用Figdraw繪制).SARS-CoV-2:新型冠狀病毒;ACE2:血管緊張素轉(zhuǎn)化酶2.
基于網(wǎng)絡的模型因其整合多源數(shù)據(jù)的優(yōu)勢,在藥物再利用研究中廣泛應用,其原理是通過構(gòu)建包含疾病、藥物及蛋白質(zhì)等生物醫(yī)學實體間相互作用的復雜網(wǎng)絡架構(gòu),涵蓋藥物-藥物靶點相互作用網(wǎng)絡、疾病相關(guān)基因網(wǎng)絡和信號傳導通路網(wǎng)絡等層面[4]。在此框架下,通過解析網(wǎng)絡中的節(jié)點連接關(guān)系和內(nèi)在數(shù)據(jù)特征,實現(xiàn)對已批準藥物針對特定疾病如COVID-19 潛在新用途的預測(圖2)。該方法著重于挖掘潛在關(guān)聯(lián)性,更多地關(guān)注藥物作用在網(wǎng)絡層次上的全局影響,可通過網(wǎng)絡相似性分析、擴散算法和模塊檢測等方法尋找與已知疾病相關(guān)節(jié)點接近的藥物靶點,從而捕獲藥物與疾病間的復雜相互作用,揭示藥物在不同疾病之間的共同作用機制,為藥物再利用研究提供新的研究線索。
圖2 基于網(wǎng)絡的模型、基于結(jié)構(gòu)的方法和機器/深度學習方法的核心原理.在基于網(wǎng)絡的模型和機器/深度學習方法的原理圖中,節(jié)點代表藥物、疾病或其他相關(guān)生物醫(yī)學實體,線段則表示這些實體之間關(guān)聯(lián)性.基于網(wǎng)絡的模型更多地關(guān)注藥物作用在網(wǎng)絡層次上的全局影響,基于結(jié)構(gòu)的方法通過藥物分子與靶標蛋白間的三維結(jié)構(gòu)匹配以實現(xiàn)篩選,機器/深度學習方法側(cè)重于對特征的多層分析.
基于結(jié)構(gòu)的方法著重于分析藥物化學結(jié)構(gòu)與生物靶標的相互作用機制,其核心依賴于運用蛋白質(zhì)和藥物的三維結(jié)構(gòu)信息進行計算模擬與虛擬篩選。該方法的原理建立在結(jié)構(gòu)相似性原理基礎上,即假定結(jié)構(gòu)類似的藥物可能具備相近的生物活性特征。通過構(gòu)建和解析藥物分子的立體構(gòu)型模型,可預測其與目標蛋白質(zhì)間的結(jié)合效能(圖2)。此方法的核心策略在于通過比較藥物分子間的結(jié)構(gòu)相似性揭示其潛在的藥效共性,從而發(fā)掘具有類似結(jié)構(gòu)藥物的再利用潛力[5]。
機器/深度學習方法的原理是立足于大規(guī)模數(shù)據(jù)集,通過深入挖掘疾病信息、藥物屬性數(shù)據(jù)、生物活性資料以及臨床研究等大量數(shù)據(jù),自動提取高階抽象特征,實現(xiàn)對關(guān)鍵特征的有效提取和復雜模式的精準識別。以此為基礎構(gòu)建多層非線性模型,旨在揭示潛在的藥物-疾病作用規(guī)律,并預測可能具有再利用價值的藥物(圖2)。該方法的核心優(yōu)勢在于運用大規(guī)模數(shù)據(jù)資源與復雜模型的強大學習能力,從多層次探尋關(guān)聯(lián)性,從而發(fā)掘藥物的再利用潛力,為藥物在新疾病領(lǐng)域的應用提供前瞻性的預測依據(jù)[6]。
基于網(wǎng)絡的模型適用于分析和挖掘藥物-靶標之間的關(guān)聯(lián)性和蛋白質(zhì)相互作用。依托充足的實驗數(shù)據(jù)庫和臨床試驗成果,此類模型通過實施網(wǎng)絡分析及算法預測手段,能夠揭示潛在的藥物與靶標的新型關(guān)聯(lián),并識別出新的藥物靶點及共享相似作用機制的藥物或藥物組合,從而為藥物再利用提供候選清單[7]。此外,該方法還可應用于探究與疾病相關(guān)的信號通路和基因調(diào)控網(wǎng)絡,精準挖掘藥物靶標及其代謝通路信息,進一步豐富藥物再利用研究的理論依據(jù)。
基于網(wǎng)絡的模型的優(yōu)勢在于可以從系統(tǒng)生物學的角度理解藥物的作用機制,并且可能揭示出藥物對整個生物網(wǎng)絡的調(diào)控效果,從而找到新的治療途徑。然而,由于該模型依賴于相互作用關(guān)系而非具體的結(jié)構(gòu)細節(jié),故在預測準確性上存在固有局限性[8]。同時,其效能受到所用數(shù)據(jù)質(zhì)量和現(xiàn)有知識庫完備程度的顯著制約,在應對如SARS-CoV-2 等新病毒或未充分了解的傳染病場景時,預測效果尤為受限。此外,盡管該模型能挖掘出復雜關(guān)聯(lián)模式,但這些關(guān)聯(lián)并不直接等同于實際的生物化學相互作用,故所獲結(jié)果需經(jīng)過實驗驗證和深入研究加以確認。
基于結(jié)構(gòu)的方法通過分析藥物化學結(jié)構(gòu)及其靶點間三維相互作用,能夠在理論層面上高效鑒別出潛在候選藥物。當目標蛋白的結(jié)構(gòu)數(shù)據(jù)豐富且具有與已知藥物相似結(jié)構(gòu)的化合物庫時,該策略尤顯優(yōu)勢。此法適用于目標蛋白的三維結(jié)構(gòu)已被充分解析且有關(guān)聯(lián)藥物結(jié)構(gòu)數(shù)據(jù)庫的情境,側(cè)重于藥分子構(gòu)型及其交互特性,從而精確預測分子對靶點的結(jié)合能和親和力,篩選可能具有效能的化合物[9]。此法憑借高通量計算模擬和結(jié)構(gòu)導向篩選機制,在大規(guī)模藥物篩選中體現(xiàn)出高效能與高精度特點,通過計算模擬基于蛋白-藥物結(jié)構(gòu)信息的篩選,可迅速縮小候選藥物范圍。借助詳盡的蛋白質(zhì)和藥物結(jié)構(gòu)信息,該方法能夠深入挖掘化學空間中的多樣性化合物,有助于新骨架藥物的發(fā)掘以及創(chuàng)新治療策略的設計[10]。然而,此方法的有效應用依賴于豐富而精確的靶標蛋白和藥物結(jié)構(gòu)信息,若針對的是結(jié)構(gòu)未明確的新型病毒或蛋白,其效用可能受限。此外,考慮到基于結(jié)構(gòu)的設計通常忽視生物體內(nèi)環(huán)境的復雜性,導致其預測結(jié)果可能存在一定偏差。
機器/深度學習方法在處理大數(shù)據(jù)時展現(xiàn)出了顯著優(yōu)勢,其通過整合多元類型的數(shù)據(jù)資源,能夠從多維度訓練模型以識別潛在的候選藥物。該方法憑借高度的靈活性和自動化特性,擅長解析復雜、非線性的數(shù)據(jù)模式,從而有效地學習并揭示深藏其中的相關(guān)性和規(guī)律[11]。在藥物再利用研究領(lǐng)域,此類方法通過對現(xiàn)有藥物的結(jié)構(gòu)特性和作用機制進行深入分析,能夠快速篩選出具有潛在抗病毒活性的候選藥物,并能用于預測特定藥物的抗病毒效果、副作用及毒性等。盡管其具備強大的預測效能,能夠挖掘龐大數(shù)據(jù)集中的隱性知識和特征,但機器/深度學習模型的預測性能高度依賴于高質(zhì)量且充足的訓練數(shù)據(jù)[12]。同時,這類方法的應用需要消耗大量的計算資源和時間來完成模型訓練與優(yōu)化過程。此外,模型復雜性與其解釋性之間的平衡亦是關(guān)鍵挑戰(zhàn)之一,雖然復雜的模型往往能在訓練數(shù)據(jù)上表現(xiàn)出卓越性能,但可能犧牲了可解釋性和可擴展性,使得評估模型的可靠性和泛化能力變得較為困難。
盡管該3類方法在某些方面存在交集且能相互補充,但它們在應用側(cè)重點上仍有所區(qū)分。圖3 比較了三者在不同應用場景下的性能優(yōu)勢及局限性。在實際研究或應用場景中,應依據(jù)具體任務需求和現(xiàn)有數(shù)據(jù)條件,選擇合適的方法或?qū)⒍喾N方法相結(jié)合,以優(yōu)化藥物再利用的研究策略。
基于網(wǎng)絡的模型在藥物再利用研究中占據(jù)重要地位,其能夠整合多種醫(yī)學實體間的相互作用關(guān)系,以發(fā)現(xiàn)潛在藥物及藥物組合。Zhou 等[13]提出了一種整合抗病毒藥物再利用策略,使用網(wǎng)絡方法量化了人類冠狀病毒(human coronavirus,HCoV)與宿主之間的相互作用及人類蛋白質(zhì)網(wǎng)絡中藥物靶點之間的相互作用。通過網(wǎng)絡鄰近性分析,篩選出16種潛在的抗HCoV 藥物,并通過藥物基因特征的富集分析進行驗證。此外,該文還預測了潛在的藥物組合。Sadegh 等[14]開發(fā)了一個用于SARSCoV-2 宿主相互作用組探索和藥物靶點鑒定的在線交互平臺,實現(xiàn)了基于網(wǎng)絡的系統(tǒng)醫(yī)學算法進行候選藥物預測,識別出緩激肽B1 受體是SARSCoV-2 入侵宿主細胞的潛在作用目標,并指出其可由臨床用于治療COVID-19的血管緊張素轉(zhuǎn)化酶抑制劑靶向,同時確定了6種靶向緩激肽B1受體的相關(guān)藥物。Tomazou 等[15]設計了一種結(jié)合多組學數(shù)據(jù)的網(wǎng)絡集成方法,以優(yōu)先排序與COVID-19 高度相關(guān)的基因,據(jù)此重新評估并整理了候選藥物清單。Choudhary 等[16]將基于網(wǎng)絡的預測手段與傾向評分匹配的觀察性研究相結(jié)合,提供了一個綜合網(wǎng)絡醫(yī)學平臺,用于預測COVID-19相關(guān)疾病表現(xiàn),并推薦褪黑激素作為潛在預防和治療COVID-19的藥物選項。Alakwaa 等[17]開發(fā)了一種基于公共單細胞RNA 測序(scRNA-seq)數(shù)據(jù)和藥物干擾數(shù)據(jù)庫的“網(wǎng)絡化細胞信號集成庫”(LINCS),成功識別出數(shù)種有潛力治療COVID-19 的候選藥物,并特別推薦了4種優(yōu)先考慮的藥物。
基于結(jié)構(gòu)的方法能夠通過識別與大分子靶標緊密結(jié)合的小分子化合物,評估化合物與其生物配體的相互作用,從而發(fā)掘現(xiàn)有藥物的新應用潛力[18]。Artese 等[19]運用基于結(jié)構(gòu)的虛擬篩選技術(shù)成功識別了14 種針對SARS-CoV-2 的候選化合物,其中頭孢洛贊(ceftolozane)和還原型輔酶Ⅰ(NADH)表現(xiàn)出優(yōu)秀的多靶點屬性,可能有助于減少耐藥病毒株的產(chǎn)生。Feng等[20]介紹了一種新的計算機識別模式方法——分子復合物表征系統(tǒng)(MCCS),該方法通過考慮關(guān)鍵殘基的作用提升了虛擬篩選的準確性,并推薦了若干抗病毒如人類免疫缺陷病毒和丙肝病毒的藥物,以及對抗糖尿病的藥物作為治療COVID-19的潛在方案。Moovarkumudalvan等[21]運用高通量結(jié)構(gòu)虛擬篩選方法對美國FDA 批準的LOPAC 藥物庫進行研究,發(fā)掘針對SARSCoV-2 細胞入侵機制的病毒進入抑制劑。Yadav等[22]利用分子對接和分子動力學模擬研究了2種已批準的膽汁鹽——鵝去氧膽酸鹽和熊去氧膽酸鹽是否能結(jié)合SARS-CoV-2 包膜蛋白,進而探討其用于COVID-19 治療的可能性。Elfiky 等[23]則結(jié)合了序列分析、建模和對接手段,構(gòu)建了COVID-19 RNA 依賴性RNA 聚合酶(RdRp)模型,并推薦索非布韋(sofosbuvir)、IDX-184、利巴韋林(ribavirin)和瑞德西韋(remidisvir)作為有潛力的治療選項。以美國FDA 批準藥物作為候選藥物的研究為重點,表1匯總了應用基于結(jié)構(gòu)的方法在藥物再利用治療COVID-19研究中獲得的部分進展。
機器/深度學習作為連接特征與先驗知識的有效工具,可以融合例如研究藥物適應證、靶點和不良反應等大量數(shù)據(jù),通過整合豐富的高質(zhì)量數(shù)據(jù)以優(yōu)化特定問題的識別與決策。Zeng 等[39]開發(fā)了1 種集成化網(wǎng)絡深度學習方法——COV-KGE,該方法系統(tǒng)地結(jié)合了藥物、疾病、蛋白質(zhì)/基因、通路和表達數(shù)據(jù)間的復雜聯(lián)系,并對SARS-CoV-2 感染人體細胞產(chǎn)生的轉(zhuǎn)錄組學和蛋白質(zhì)組學數(shù)據(jù)進行深入分析,最終成功鑒別出41 種潛在治療COVID-19 的候選藥物。Giagulli 等[40]構(gòu)建了一個基于隨機森林的機器學習模型,篩選出了230 種可能有助于限制SARS-CoV-2 傳播或降低COVID-19 死亡率的藥物,其中皮質(zhì)類固醇如布地奈德(budesonide)、地塞米松(dexamethasone)和倍他米松(betametha-sone)排名靠前。值得注意的是,雌二醇被確定為針對COVID-19的候選藥物之一,而睪酮及其衍生物未被選中,這進一步支持了男性患者臨床表現(xiàn)較差可能與睪酮水平有關(guān)的理論。Ke 等[41]提出了一種深度學習方法,用于快速高通量篩查具有抑制SARS-CoV-2 活性的化合物。他們建立貓冠狀病毒體外復制細胞模型,采用AI鑒定的藥物進行抗病毒活性驗證,并將抗病毒活性結(jié)果反饋至AI系統(tǒng)進行再訓練。經(jīng)過多次循環(huán)學習預測,AI 系統(tǒng)最終確認了80種具有潛力的上市藥物。Beck等[42]利用名為分子轉(zhuǎn)換體-藥物靶點相互作用(MT-DTI)的深度學習預測模型,篩選可能干擾SARS-CoV-2 病毒組分的抗病毒藥物。Hsieh等[43]構(gòu)建了一個全面的知識圖譜,利用深度圖神經(jīng)嵌入技術(shù)連接病毒誘餌、宿主基因、通路、藥物和表型之間的多重相互作用,并通過該方法鑒定了22 種候選藥物。Han 等[44]則采用細胞圖像特征和機器學習對藥物作用機制進行建模,運用監(jiān)督式學習算法——信息理論度量學習(ITML)以及聚類方法優(yōu)化藥物圖像特征的度量,以發(fā)現(xiàn)具有相似作用機制的藥物。例如,氯喹(chloroquine)通過改變細胞內(nèi)環(huán)境、提高細胞內(nèi)pH 值等方式抑制COVID-19 的內(nèi)吞作用實現(xiàn)抗病毒效果,研究人員通過細胞圖像確認克羅米芬(clomiphene)通過與氯喹類似的抑制內(nèi)吞作用實現(xiàn)抗病毒效果,且已發(fā)現(xiàn)克羅米芬能夠抑制埃博拉病毒侵入細胞,這進一步提示其可能具備針對COVID-19的潛在治療潛力。
在藥物再利用治療COVID-19 的研究中,上述3 類方法已取得實質(zhì)性應用成效,并展現(xiàn)出對其他疾病藥物研發(fā)的潛在適用性。它們的核心原理在于運用大規(guī)模數(shù)據(jù)集成與學習算法預測化合物與疾病間的相互作用關(guān)系。當推廣至不同疾病或藥物時,應根據(jù)特定疾病特性、藥物屬性以及現(xiàn)有數(shù)據(jù)資源,針對性地調(diào)整并優(yōu)化模型訓練過程,確保模型在新疾病場景下的準確性和可靠性,以期獲得更為精確的預測成果。
AI在藥物再利用治療COVID-19研究中發(fā)揮著關(guān)鍵作用,然而迄今所取得的結(jié)果并未達到理想預期。盡管眾多研究預測了藥物潛在的有效性,但不同研究針對同一靶點的藥物篩選結(jié)果往往不一致,實驗驗證層面的有效證據(jù)相對匱乏,且絕大多數(shù)候選藥物尚未在臨床環(huán)境中得到證實。盡管對藥物再利用治療COVID-19 抱有高度期待,但該領(lǐng)域仍面臨嚴峻挑戰(zhàn)。要全面理解AI 在藥物再利用治療COVID-19 過程中的應用瓶頸,需從藥物發(fā)現(xiàn)和開發(fā)、非臨床研究到臨床試驗3 個階段進行深入分析和問題梳理。
AI 模型的訓練依賴大量數(shù)據(jù),而數(shù)據(jù)的質(zhì)量與數(shù)量直接影響模型在藥物再利用中的準確性與有效性。目前,AI 在該領(lǐng)域的貢獻似乎未達到預期水平,其原因可能在于純數(shù)據(jù)驅(qū)動的策略存在局限性,尤其是在缺乏足夠高質(zhì)量數(shù)據(jù)的情況下,難以構(gòu)建出性能優(yōu)異、泛化能力強的模型。對于SARSCoV-2 而言,現(xiàn)有的認識及其與宿主間的相互作用尚處于初級階段,可用的高質(zhì)量數(shù)據(jù)與知識儲備相對匱乏,這進一步凸顯了基礎研究的重要性,基礎研究起到了“源頭活水”的作用,在生物醫(yī)學領(lǐng)域發(fā)展中具有不可替代的地位[45]。此外,基于機制推斷的AI 結(jié)果并不能直接保證臨床療效。盡管AI 是一種強大的工具,但數(shù)據(jù)驅(qū)動的模型僅能提出潛在的候選藥物供進一步研究,即使所提出的藥物靶向病毒致病過程中的關(guān)鍵蛋白,其是否具有抗病毒活性仍需通過后續(xù)實驗驗證。例如,抑制某種輔助因子以防止病毒對宿主蛋白的操縱,也可能產(chǎn)生未預見的不良反應或前病毒效應。因此,對待AI所得的結(jié)果應持審慎態(tài)度,須在通過適當方法驗證藥物靶點后,由臨床專家進行嚴謹審查,并按照規(guī)定的程序和臨床試驗進行評估。
細胞及動物實驗在模擬病毒于人體內(nèi)感染的復雜宿主環(huán)境時存在固有限制。由于體外培養(yǎng)細胞與體內(nèi)真實細胞在蛋白質(zhì)表達、生物學特性上存在顯著差異,這在評估藥物滲透性、吸收性能和代謝途徑時易引入偏差,尤其是對于涉及呼吸系統(tǒng)、消化系統(tǒng)以及免疫反應等多系統(tǒng)交互作用的生理過程無法進行全面再現(xiàn)。而動物模型,因其在解剖結(jié)構(gòu)、生理功能和免疫系統(tǒng)上與人類的顯著差異,難以準確反映病毒在人體內(nèi)的復制、臨床特征和病理反應。因此,可能出現(xiàn)AI預測藥物有效性得到臨床前實驗驗證支持,但當推進至臨床試驗階段時,實際療效卻未達到預期的現(xiàn)象。
首先,候選藥物在原適應證中的優(yōu)化可能限制了其在其他方向的再利用潛力。候選藥物可能已經(jīng)針對初始適應證對特定靶點、劑量或組織分布進行了優(yōu)化,這些優(yōu)化的藥物在應對COVID-19 時可能無法展現(xiàn)最佳的治療效果。此外,AI 模型可能未充分考慮藥物的吸收率和作用機制等可能存在的其他制約臨床應用的關(guān)鍵特性。例如,洛哌丁胺(loperamide)作為潛在藥物,已證實其能抑制中東呼吸綜合征冠狀病毒和SARS-CoV的體外復制[46]。然而,洛哌丁胺口服生物利用率低且不能穿透血腦屏障[47],這些因素在預測其對COVID-19 治療效果時并未得到充分考慮。盡管體外研究顯示出洛哌丁胺治療COVID-19 的潛在價值,但其臨床應用卻面臨挑戰(zhàn)。同時,遺傳異質(zhì)性對臨床治療結(jié)果的影響亦不容忽視。SARS-CoV-2 感染表現(xiàn)出顯著的個體間差異,從無癥狀到致命疾病不等,研究推測遺傳背景可能是決定臨床特征和藥物反應的因素之一[48]。另一方面,COVID-19 是一種復雜的多系統(tǒng)疾病,其臨床表現(xiàn)多樣,從初期的呼吸系統(tǒng)疾病發(fā)展至涉及多個器官系統(tǒng)的復雜病理過程。Carlos等[49]將COVID-19 分為4 個臨床分期:Ⅰ期病毒進入和復制(無癥狀)、Ⅱ期病毒傳播(輕度或中度)、Ⅲ期多系統(tǒng)炎癥(重度)及Ⅳ期內(nèi)皮損傷、血栓和多器官功能障礙(危重),但各階段之間的進展并非絕對線性,部分患者可直接發(fā)展為晚期。不同疾病階段可能導致藥物效應的變化,如RECOVERY 試驗所示,地塞米松能夠降低接受呼吸支持治療的COVID-19 患者的28 d 死亡率,但對無需吸氧的患者并無明顯益處[50],這提示藥物使用的時機或許是導致AI 預測與臨床效果之間存在差距的一個重要因素。
盡管AI 應用于藥物再利用治療COVID-19 研究中面臨多種挑戰(zhàn),但這些挑戰(zhàn)同時也揭示了有待深入挖掘和完善的若干關(guān)鍵領(lǐng)域。具體而言,針對3 類主要的藥物再利用方法,其在治療COVID-19藥物研究中的作用和局限性值得深入分析?;诰W(wǎng)絡的模型擅長整合多源數(shù)據(jù),通過揭示疾病、藥物及生物靶點間的復雜關(guān)系網(wǎng)絡,發(fā)掘潛在的藥物重定位線索。然而,此類方法的有效性受限于現(xiàn)有數(shù)據(jù)的質(zhì)量和完整性,且對新型或未知病毒如SARS-CoV-2 的應用可能因缺乏足夠的背景信息而受到制約。未來發(fā)展方向應注重優(yōu)化數(shù)據(jù)集的構(gòu)建與更新,并借助更高級別的網(wǎng)絡算法提高預測準確度?;诮Y(jié)構(gòu)的方法聚焦于藥物分子與靶點蛋白之間的三維結(jié)構(gòu)相互作用,以識別具有治療潛力的化合物。盡管這類方法能夠提供精確的藥物篩選依據(jù),但依賴于高質(zhì)量的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù),對于新出現(xiàn)的病原體如SARS-CoV-2,由于結(jié)構(gòu)信息不足,可能導致預測結(jié)果的不確定性增大。為克服這一瓶頸,有必要加大對相關(guān)結(jié)構(gòu)生物學研究的支持力度,并開發(fā)更為穩(wěn)健和普適的結(jié)構(gòu)預測工具。機器/深度學習技術(shù)憑借強大的數(shù)據(jù)處理能力和復雜模式識別優(yōu)勢,在藥物發(fā)現(xiàn)與再利用中展現(xiàn)出巨大潛力。它們能有效利用大規(guī)模生物醫(yī)學數(shù)據(jù)集進行訓練,從而預測藥物活性和潛在的新適應癥。然而,當前AI 模型往往被視為“黑盒”,模型的可解釋性、泛化能力及其預測結(jié)果的可靠性仍有待提升,這需要科研人員不斷優(yōu)化模型結(jié)構(gòu),引入更多維度的數(shù)據(jù)并建立嚴格的驗證機制以確保計算結(jié)果的科學性和臨床轉(zhuǎn)化價值。
隨著對SARS-CoV-2 生物學特性的深入理解,以及各類醫(yī)學數(shù)據(jù)資源在質(zhì)量、規(guī)模和開放獲取方面的持續(xù)改進,AI 在挖掘新型候選藥物方面的效能將進一步增強。堅定地推進AI技術(shù)的發(fā)展與優(yōu)化,將有助于實現(xiàn)藥物篩選和評估的更高精度,并有望在未來提供更多創(chuàng)新視角和解決方案,以應對各種復雜疾病的治療需求。