• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于CNN模型的小分子活性預(yù)測

      2023-07-17 09:30:30霍旭祥徐峻
      計算機應(yīng)用文摘 2023年13期
      關(guān)鍵詞:深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

      霍旭祥 徐峻

      摘要:計算機輔助藥物設(shè)計(Computcr-Aidcd Drug Dcsign,CADD)已成為當(dāng)今藥物研發(fā)不可或缺的一部分。采用傳統(tǒng)的方法預(yù)測小分子結(jié)合自由能有一定的局限性,由于傳統(tǒng)方法默認(rèn)了小分子的結(jié)構(gòu)信息與結(jié)合能之間是線性的關(guān)系,而對于結(jié)構(gòu)化學(xué)信息二者之間并不是線性關(guān)系的情況,其預(yù)測結(jié)果并不是十分準(zhǔn)確。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,我們可以通過神經(jīng)網(wǎng)絡(luò)對線性問題或者是非線性問題進行建模,以在小分子的結(jié)構(gòu)信息與其結(jié)合能之間建立線性或者非線性的聯(lián)系,使其預(yù)測的結(jié)果準(zhǔn)確率有所提高。

      關(guān)鍵詞:深度學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);小分子結(jié)合能預(yù)測;計算機輔助藥物設(shè)計

      中圖法分類號:TP391 文獻標(biāo)識碼:A

      1 引言

      計算機輔助藥物設(shè)計已成為現(xiàn)代藥物研發(fā)的重要手段,其在藥物分子設(shè)計、活性預(yù)測、藥效優(yōu)化和副作用評估等方面的應(yīng)用,將為藥物研發(fā)和臨床應(yīng)用做出重要的貢獻[1] 。這種方法的引入不僅可以輔助研發(fā)藥物,甚至成為推動或決定藥物研發(fā)成敗的主要因素,這種方法改變了以往通過大量實驗篩選進行藥物研發(fā)的傳統(tǒng)模式。結(jié)合神經(jīng)網(wǎng)絡(luò)與計算機技術(shù)進行藥物研發(fā)已經(jīng)越來越普遍,北京大學(xué)、中國科學(xué)院上海藥物研究所、中國科學(xué)院長春應(yīng)用化學(xué)研究所等高校和科研單位將人工神經(jīng)網(wǎng)絡(luò)法與分子模擬研究相結(jié)合[2~3] ,并將其直接用于指導(dǎo)實際的藥物合成,取得了很好的研究成果。

      2 相關(guān)工作

      本文主要研究預(yù)測小分子的結(jié)合能,在傳統(tǒng)的預(yù)測小分子結(jié)合能的方法基礎(chǔ)上加入深度學(xué)習(xí)的一些方法,通過卷積神經(jīng)網(wǎng)絡(luò)提取特征,使預(yù)測小分子結(jié)合能的準(zhǔn)確率有所提高。在此研究過程中,使用了三維定量構(gòu)效關(guān)系(3D?QSAR)的方法,所謂三維定量構(gòu)效關(guān)系是引入了分子三維結(jié)構(gòu)信息并結(jié)合物理化學(xué)中常用經(jīng)驗方法的數(shù)學(xué)方法[4~6] 。在此基礎(chǔ)上,利用卷積神經(jīng)網(wǎng)絡(luò)提取小分子的空間特征,小分子的空間特征主要包括小分子中原子的類型、原子的三維坐標(biāo),通過獲取這些空間信息進行特征提取并找到結(jié)合能與其之間的聯(lián)系,從而有利于提高預(yù)測小分子結(jié)合能的準(zhǔn)確率。利用數(shù)學(xué)模型來擬合分子結(jié)構(gòu)和分子活性之間的關(guān)系,使預(yù)測小分子活性值的準(zhǔn)確率有所提高。

      3 預(yù)測模型的網(wǎng)絡(luò)架構(gòu)

      3.1 卷積神經(jīng)網(wǎng)絡(luò)模型架構(gòu)

      3D Convolutional Neural Networks (3D?CNNs) 是一種用于處理三維數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)。3D?CNNs可以學(xué)習(xí)高級特征,并進行分類或回歸。

      三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)是在三維數(shù)據(jù)上進行卷積計算的神經(jīng)網(wǎng)絡(luò)模型,通常用于處理視頻、醫(yī)學(xué)影像等具有時間和空間信息的數(shù)據(jù)。其一般架構(gòu)包括輸入層、卷積層、池化層、全連接層和輸出層。其中,卷積層用于提取輸入數(shù)據(jù)的特征,池化層用于對特征圖進行下采樣,降低數(shù)據(jù)維度,全連接層將池化后的特征圖轉(zhuǎn)化為一維向量,最后通過輸出層將向量映射為分類或回歸結(jié)果。

      3.2 預(yù)測模型網(wǎng)絡(luò)架構(gòu)

      在對預(yù)測模型進行相關(guān)研究后,開始構(gòu)建預(yù)測模型體系結(jié)構(gòu),如圖1 所示。

      其中,總共使用了7 個卷積層和2 個密集層處理網(wǎng)格數(shù)據(jù),以生成嵌入特征。7 個三維卷積層卷積核的大小分別為128,256,512,1024,512,128 和256。模型輸出為復(fù)合物的結(jié)合自由能值。對于L3D?MLP 模型,添加了6 個額外的致密層(即MLP塊),其與生物活性數(shù)據(jù)相關(guān),而在L3D?PLS 模型中,PLS 模型取代了MLP 塊來預(yù)測生物活性。對于這2 種模型,將pIC50 的平均標(biāo)準(zhǔn)誤差作為損失函數(shù),表達式為:

      4 實驗數(shù)據(jù)

      4.1 數(shù)據(jù)來源

      通過爬取各種開源數(shù)據(jù)庫中的數(shù)據(jù)獲得各種不同靶點不同分子的數(shù)據(jù),并將其整理成需要的數(shù)據(jù)集,最終得到20 個不同靶點對應(yīng)的2 000 多個分子的數(shù)據(jù),結(jié)果如表1 所列。

      4.2 模型評估標(biāo)準(zhǔn)與實驗結(jié)果

      在本模型中,使用相關(guān)系數(shù)R2 和交叉驗證Q2 評估了L3D?PLS 在30 個不同公開數(shù)據(jù)集上的性能。對于一組預(yù)測值(ypred )和參考值(yref ),其計算公式為:

      R2 的取值范圍在0~1,其中R2 =1 說明預(yù)測值完全解釋了實際值的變化,模型預(yù)測效果最佳。R2 = 0則表示預(yù)測值完全無法解釋實際值的變化,模型預(yù)測效果最差。我們比較了PyCoMFA,L3D?MLP 和L3D?PLS 3 種QSAR 模型的性能。在20 個測試集上的R2結(jié)果如表2 所列。L3D?PLS 在10 個數(shù)據(jù)集中表現(xiàn)最好,PyCoMFA 和L3D?MLP 分別在7 個和3 個數(shù)據(jù)集上表現(xiàn)最好。與單獨在這20 個基準(zhǔn)測試上的PyCoMFA 模型相比,L3D?MLP 和L3D?PLS 在10 個和12 個數(shù)據(jù)集上顯示出優(yōu)越的性能。

      5 結(jié)束語

      CoMFA 是一種力場與藥物分子活性定量相關(guān)的方法,通過CoMFA,科研可以預(yù)測配體的性質(zhì),并利用其建立定量模型來設(shè)計新的化合物、預(yù)測化合物的活性,以及藥物化學(xué)家可以指導(dǎo)配體的設(shè)計,這也是CoMFA 的一個主要功能。目前,L3D?PLS 模型雖然可以得到更好的預(yù)測pic50 的結(jié)果,但目前仍無法實現(xiàn)。在未來的工作中,我們將探索該模型的更多應(yīng)用來實現(xiàn)這一目標(biāo),同時將嘗試將深度學(xué)習(xí)方法與傳統(tǒng)方法相結(jié)合,以創(chuàng)建更好的算法來解決這些問題。

      參考文獻:

      [1] 呂婷婷,禹文韜,張慧琳.面向抗乳腺癌候選藥物拮抗雌激素受體α 生物活性的定量構(gòu)效關(guān)系模型構(gòu)建[J].中南藥學(xué),2022,20(11):2542?2548.

      [2] 田淇,李耀旺,李博.活性肽定量構(gòu)效關(guān)系建模過程中1 種肽段長度不等的表征方法的建立[J]. 中國食品學(xué)報,2021,21(4):28?38.

      [3] 馬瑤,智敏,殷雁君,等.CNN 和Transformer 在細(xì)粒度圖像識別中的應(yīng)用綜述[J].計算機工程與應(yīng)用,2022,58(19):53?63.

      [4] 鈕嘉銘,楊宇.基于CNN 的人群計數(shù)與密度估計研究綜述[J].軟件導(dǎo)刊,2021,20(8):247?252.

      [5] 陳芳,王建龍,陳麗珍,等.ε?CL?20/ F_(2311)PBXs 力學(xué)性能和結(jié)合能的分子動力學(xué)模擬[J].原子與分子物理學(xué)報,2015,32(3):360?365.

      [6] 劉達山,劉潞琦,張光馳,等.基于深度學(xué)習(xí)的Attention 機制文獻綜述[J].信息技術(shù)與信息化,2023(1):189?194.

      作者簡介:

      霍旭祥(1998—),碩士,研究方向:計算化學(xué)。

      徐峻(1958—),教授,研究方向:中藥藥效組學(xué)、醫(yī)藥化學(xué)、藥物設(shè)計、化學(xué)信息學(xué)、多變量統(tǒng)計分析、化學(xué)結(jié)構(gòu)圖論算法、化學(xué)結(jié)構(gòu)專利文獻檢索引擎、蛋白質(zhì)NMR 結(jié)構(gòu)解析和模擬。

      猜你喜歡
      深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
      電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
      MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
      深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
      基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
      軟件工程(2016年8期)2016-10-25 15:47:34
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
      重型機械(2016年1期)2016-03-01 03:42:04
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      镇平县| 江西省| 山阳县| 玉树县| 高清| 昭平县| 从江县| 通榆县| 揭阳市| 桃江县| 荆州市| 行唐县| 石台县| 珠海市| 崇阳县| 长葛市| 砀山县| 宜州市| 长泰县| 察隅县| 甘德县| 高邮市| 江阴市| 绥棱县| 交城县| 抚宁县| 科技| 玉门市| 白河县| 东光县| 石景山区| 格尔木市| 梁平县| 阳信县| 临夏县| 平武县| 安阳县| 贞丰县| 天台县| 察雅县| 双牌县|