張凱睿 黃鋼
摘 ?要:新藥研發(fā)存在研發(fā)周期長(zhǎng)、成本高和成功率低等問(wèn)題。為了解決這一系列問(wèn)題,提高早期藥物研發(fā)效率,提出一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的虛擬篩選方法,并利用模型對(duì)EGFR(Epidermal Growth Factor Receptor, 表皮生長(zhǎng)因子受體)靶點(diǎn)進(jìn)行虛擬篩選。首先獲取EGFR靶點(diǎn)的相關(guān)數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)處理后用于模型訓(xùn)練;隨后應(yīng)用模型篩選大量化合物,篩選出小分子后,將其與藥物分子進(jìn)行化合物相似性搜索,驗(yàn)證其是否與已知的EGFR藥物存在相似性;同時(shí),將圖卷積神經(jīng)網(wǎng)絡(luò)(Graph Convolutional Networks, GCN)模型與其他傳統(tǒng)機(jī)器學(xué)習(xí)模型進(jìn)行比較,證明本研究模型在各項(xiàng)指標(biāo)中均優(yōu)于其他模型。實(shí)驗(yàn)結(jié)果表明,本研究提出的方法具有較好的預(yù)測(cè)性和準(zhǔn)確性,為發(fā)現(xiàn)潛在藥物提供了助力。
關(guān)鍵詞:圖卷積神經(jīng)網(wǎng)絡(luò);虛擬篩選;EGFR;化合物相似性搜索;機(jī)器學(xué)習(xí)
中圖分類號(hào):TP391 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
Virtual Screening of Small Molecules based on Graph Convolutional Neural Network
ZHANG Kairui1,2, HUANG Gang1,2
(1. School of Health Science and Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China;
2. Shanghai Key Laboratory of Molecular Imaging, Shanghai University of Medicine and Health Sciences, Shanghai 201318, China)
zhangkarry0328@163.com; huanggang@sumhs.cn
Abstract: New drug research and development has the problems of long research and development cycle, high cost and low success rate. In order to solve these problems and improve the efficiency of early drug research and development, this paper proposes a virtual screening method based on graph convolution neural network, and uses the model to perform virtual screening of the EGFR (Epidermal Growth Factor Receptor) targets. Firstly, the relevant data of EGFR targets are obtained and used for model training after data processing. After that, the model is used to screen a large number of compounds, and after small molecules are screened out, they are searched for compound similarity with drug molecules to verify whether they are similar to known EGFR drugs. At the same time, the graph convolution neural network model is also compared with other traditional machine learning models, and the proposed model is superior to other models in all indicators. Experimental results show that the proposed method has good predictability and accuracy, which facilitates the discovery of potential drugs.
Keywords: graph convolutional neural network; virtual screening; EGFR; compound similarity search; machine
learning
1 ? 引言(Introduction)
隨著疾病多樣性以及藥物耐藥性等問(wèn)題的出現(xiàn),對(duì)新藥的需求日益增加,但是新藥研發(fā)存在研發(fā)周期長(zhǎng)、研發(fā)成本高以及成功率低等問(wèn)題。藥物開(kāi)發(fā)是一個(gè)昂貴且耗時(shí)的過(guò)程,通常來(lái)講,一個(gè)新的藥物從開(kāi)始研發(fā)到最終上市,需要花費(fèi)數(shù)十億美元和10—15 年的時(shí)間[1]。在人力、物力投入高和耗時(shí)長(zhǎng)的同時(shí),小分子藥物最終上市的成功率卻只有6.2%,研發(fā)失敗的風(fēng)險(xiǎn)比較高[2]。計(jì)算機(jī)輔助藥物設(shè)計(jì)能夠大幅度地縮短新藥研發(fā)的時(shí)間,提高新藥研發(fā)的成功率。傳統(tǒng)的藥物篩選方法有分子對(duì)接、藥效團(tuán)匹配[3]和相似性搜索[4]等。隨著近年來(lái)計(jì)算機(jī)算力的提升和大數(shù)據(jù)時(shí)代的到來(lái),以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為代表的算法進(jìn)一步促進(jìn)了藥物研發(fā)的進(jìn)程。
虛擬篩選是一種藥物篩選方法,其使用計(jì)算機(jī)算法和模型來(lái)發(fā)現(xiàn)新的生物活性小分子藥物。與高通量篩選(HTS)相比,虛擬篩選具有高效、低成本的特點(diǎn)。虛擬篩選的方法通常分為兩類:基于結(jié)構(gòu)的虛擬篩選和基于配體的虛擬篩選。
在基于結(jié)構(gòu)的虛擬篩選中,算法通過(guò)模擬靶點(diǎn)蛋白質(zhì)與小分子之間的物理相互作用,計(jì)算它們之間的親和度[5-6]。根據(jù)與結(jié)合能相關(guān)的親和度打分函數(shù),對(duì)蛋白質(zhì)和小分子化合物的結(jié)合能力進(jìn)行評(píng)價(jià),最終從大量化合物分子中篩選出結(jié)合方式合理、預(yù)測(cè)分?jǐn)?shù)較高的化合物,用于后續(xù)的生物活性測(cè)試。
在基于配體的虛擬篩選中,通常不需要靶點(diǎn)的信息和結(jié)構(gòu),而是收集一系列作用于這個(gè)靶點(diǎn)的已知小分子化合物,從這些已知小分子開(kāi)始,去發(fā)掘這部分小分子的內(nèi)在結(jié)構(gòu)規(guī)律。根據(jù)化合物相似性或者藥效團(tuán)模型在化合物數(shù)據(jù)庫(kù)中搜索能與之匹配的化學(xué)分子結(jié)構(gòu),最后對(duì)所篩選出來(lái)的化合物進(jìn)行實(shí)驗(yàn)篩選研究。
近年來(lái),隨著計(jì)算機(jī)計(jì)算能力的發(fā)展,深度學(xué)習(xí)[7]被廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別等領(lǐng)域。由于各類組學(xué)以及生物學(xué)數(shù)據(jù)的積累,深度學(xué)習(xí)模型已在藥物研發(fā)的各個(gè)領(lǐng)域嶄露頭角[8],并且在一部分領(lǐng)域展現(xiàn)出優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)模型的優(yōu)勢(shì)。
本文從DUD-E中收集了EGFR靶點(diǎn)的活性化合物和誘餌化合物數(shù)據(jù),并對(duì)這些化合物數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,將其分割成訓(xùn)練集和測(cè)試集。利用收集好的化合物數(shù)據(jù)訓(xùn)練圖卷積神經(jīng)網(wǎng)絡(luò)[9-10]模型,隨后篩選了ZINC數(shù)據(jù)庫(kù)中的大量數(shù)據(jù),將篩選出的10 個(gè)小分子與DrugBank數(shù)據(jù)庫(kù)中收集到的藥物數(shù)據(jù)做相似性搜索,發(fā)現(xiàn)其中4 個(gè)小分子與已知EGFR藥物分子存在較高相似性。同時(shí)利用相同數(shù)據(jù),訓(xùn)練6 個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)模型,結(jié)果表明GCN模型要優(yōu)于機(jī)器學(xué)習(xí)模型。實(shí)驗(yàn)結(jié)果證明了GCN模型在藥物篩選方面具有比較好的預(yù)測(cè)性和準(zhǔn)確性。
2 ? 材料與方法(Materials and methods)
基于圖卷積神經(jīng)網(wǎng)絡(luò)的藥物篩選模型構(gòu)建流程及方法主要包括從化合物數(shù)據(jù)庫(kù)收集相關(guān)數(shù)據(jù),對(duì)藥物數(shù)據(jù)進(jìn)行數(shù)據(jù)處理和篩選,訓(xùn)練圖卷積模型,隨后進(jìn)行藥物篩選及對(duì)篩選結(jié)果的相似性進(jìn)行搜索,如圖1所示。
2.1 ? 數(shù)據(jù)來(lái)源
本研究使用的數(shù)據(jù)來(lái)源于多個(gè)公共化合物數(shù)據(jù)庫(kù),包括DUD-E[11]、ZINC[12]、DrugBank[13]。DUD-E(A Database of Useful Decoys: Enhanced)是由美國(guó)加州大學(xué)舊金山分校藥物化學(xué)系的Shoichet實(shí)驗(yàn)室提供的數(shù)據(jù)庫(kù)(http://dude.docking.org),在Target中可以選擇想要選擇的靶點(diǎn),下載actives_final.ism和decoys_final.ism文件,獲取對(duì)應(yīng)靶點(diǎn)的活性化合物和誘餌化合物數(shù)據(jù),用于訓(xùn)練模型。ZINC數(shù)據(jù)庫(kù)是目前最大的有機(jī)小分子化合物庫(kù)之一,不少類藥分子的前期虛擬篩選都是基于這個(gè)數(shù)據(jù)庫(kù)的,數(shù)據(jù)庫(kù)中包含9.8億多個(gè)小分子,根據(jù)后續(xù)的研究條件和需要設(shè)定過(guò)濾標(biāo)準(zhǔn),將小分子數(shù)量鎖定在10萬(wàn)個(gè)后下載數(shù)據(jù)文件,用于后續(xù)的虛擬篩選。DrugBank數(shù)據(jù)庫(kù)是一個(gè)綜合的、可自由訪問(wèn)的在線數(shù)據(jù)庫(kù),包含有關(guān)藥物和藥物目標(biāo)的信息,在利用模型篩選完ZINC數(shù)據(jù)庫(kù)中下載的小分子后,將篩選出的分子與DrugBank中的藥物分子做相似性搜索,從而驗(yàn)證模型的準(zhǔn)確性。
2.2 ? 數(shù)據(jù)預(yù)處理
為了更好地應(yīng)用來(lái)源于DUD-E數(shù)據(jù)庫(kù)中的數(shù)據(jù)集從而構(gòu)建一個(gè)有效的模型,需要確保活性化合物與誘餌化合物的分子性質(zhì)相似。從DUD-E數(shù)據(jù)庫(kù)中收集到的化合物數(shù)據(jù)都有各個(gè)化合物對(duì)應(yīng)的SMILES(Simplified Molecular-Input Line-Entry System)號(hào)。SMILES是一種用文本字符串定義分子的常用方法,SMILES字符串以既簡(jiǎn)潔又直觀的方式描述了分子的原子和鍵。在本研究中,可以利用化學(xué)信息學(xué)軟件包RDkit,結(jié)合化合物的SMILES號(hào),計(jì)算出化合物的分子量、LogP以及形式電荷,通過(guò)化合物的這些屬性可以比較活性集和誘餌集的分布。根據(jù)活性集和誘餌集的分布,對(duì)其進(jìn)行平衡,為后續(xù)的模型訓(xùn)練做好準(zhǔn)備。
2.3 ? 圖卷積網(wǎng)絡(luò)模型
本文使用圖卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)分子抑制EGFR的能力。圖卷積神經(jīng)網(wǎng)絡(luò)是一類采用卷積操作的圖神經(jīng)網(wǎng)絡(luò),屬于圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network)[14]的一種。
對(duì)于圖,為節(jié)點(diǎn)的集合,為邊的集合。對(duì)于每個(gè)點(diǎn),均有其特征,可以用表示。一個(gè)中有3 個(gè)比較重要的矩陣:鄰接矩陣、度矩陣和特征矩陣。鄰接矩陣用來(lái)表示節(jié)點(diǎn)間的連接關(guān)系。度矩陣是一個(gè)對(duì)角矩陣,每個(gè)節(jié)點(diǎn)的度指的是其連接的節(jié)點(diǎn)數(shù),其中對(duì)角線元素。特征矩陣用于表示節(jié)點(diǎn)的特征,,其中是特征的維度。
深度學(xué)習(xí)中最重要的是學(xué)習(xí)特征:隨著網(wǎng)絡(luò)層數(shù)的增加,特征愈發(fā)抽象,然后用于最終的任務(wù)。對(duì)于圖任務(wù),深度模型從最開(kāi)始的特征出發(fā)學(xué)習(xí)到更抽象的特征。任何一個(gè)圖卷積層都可以寫成如下非線性函數(shù):
(1)
為第一層的輸入,其中,為圖的節(jié)點(diǎn)個(gè)數(shù),為每個(gè)節(jié)點(diǎn)特征向量的維度,為鄰接矩陣。這里指的是網(wǎng)絡(luò)層數(shù),就是網(wǎng)絡(luò)第層的特征。不同模型的差異點(diǎn)在于函數(shù)的實(shí)現(xiàn)不同。
在圖學(xué)習(xí)中,每個(gè)節(jié)點(diǎn)的新特征就是對(duì)該節(jié)點(diǎn)的鄰域節(jié)點(diǎn)特征進(jìn)行變換然后求和。其公式為:
(2)
其中,是學(xué)習(xí)權(quán)重,維度是,是激活函數(shù),這是神經(jīng)網(wǎng)絡(luò)的基本單元。不難看出,乘以鄰接矩陣就相當(dāng)于對(duì)每個(gè)節(jié)點(diǎn)都加上了其相應(yīng)鄰域節(jié)點(diǎn)的特征。這里存在兩個(gè)問(wèn)題,一是計(jì)算節(jié)點(diǎn)的新特征時(shí)并沒(méi)有考慮自身的特征;二是矩陣沒(méi)有正則化,這可能導(dǎo)致網(wǎng)絡(luò)訓(xùn)練過(guò)程中發(fā)生梯度爆炸或者是梯度消失的問(wèn)題。對(duì)于第一個(gè)問(wèn)題,解決方法是對(duì)每一個(gè)節(jié)點(diǎn)加上自環(huán),即為。對(duì)于第二個(gè)問(wèn)題,則是對(duì)矩陣進(jìn)行正則化,使其每一行的和都為1,例如。
圖卷積神經(jīng)網(wǎng)絡(luò)的最終形式為:
(3)
其中,第層網(wǎng)絡(luò)的輸入為(初始輸入為);;為待訓(xùn)練的參數(shù);為相應(yīng)的激活函數(shù)。
2.4 ? 評(píng)估標(biāo)準(zhǔn)
本研究使用馬修斯相關(guān)系數(shù)(Matthews Correlation Coefficient, MCC)、準(zhǔn)確率(Accuracy)、召回率(Recall)和F1分?jǐn)?shù)(F1-Score)作為評(píng)價(jià)指標(biāo)。MCC、Accuracy、Recall及F1-Score的公式如下:
其中,為真正例,表示正類正確預(yù)測(cè)為正類數(shù);為真負(fù)例,表示負(fù)類正確預(yù)測(cè)為負(fù)類數(shù);為假正例,表示負(fù)類錯(cuò)誤預(yù)測(cè)為正類數(shù);為假負(fù)例,表示正類錯(cuò)誤預(yù)測(cè)為負(fù)類數(shù)。
2.5 ? Morgan指紋
化合物相似性搜索在化學(xué)信息學(xué)和新藥研發(fā)中有著悠久的歷史,許多算法都使用相似性搜索來(lái)驗(yàn)證正在研究的新化合物。
本研究通過(guò)計(jì)算化合物的Morgan[15]指紋(Morgan Fingerprints, 摩根分子指紋)來(lái)進(jìn)行化合物相似性搜索。Morgan指紋是一種圓形指紋,也屬于拓?fù)湫椭讣y,是通過(guò)對(duì)標(biāo)準(zhǔn)的Morgan算法進(jìn)行改造后得到的。Morgan指紋具有如下優(yōu)點(diǎn):計(jì)算速度快,沒(méi)有經(jīng)過(guò)預(yù)定義,可以包含手性信息,指紋中的每個(gè)元素代表一種特定子結(jié)構(gòu),可以方便地進(jìn)行分析和解釋,可以根據(jù)不同的需要進(jìn)行相應(yīng)的修改。Morgan指紋設(shè)計(jì)的最初目的是用于搜索與活性相關(guān)的分子特征,也可以用于相似性搜索、聚類、虛擬篩選等方向。
3 ?實(shí)驗(yàn)結(jié)果及分析(Experimental results and analysis)
3.1 ? 虛擬篩選結(jié)果
將DUD-E中獲取的EGFR的活性化合物和誘餌化合物數(shù)據(jù)進(jìn)行數(shù)據(jù)處理、整合之后得到542 個(gè)活性小分子和35,050 個(gè)非活性小分子,將整合好的數(shù)據(jù)分割為訓(xùn)練集和驗(yàn)證集,然后用于GCN模型的訓(xùn)練。
訓(xùn)練好模型后,用模型篩選ZINC數(shù)據(jù)庫(kù)中收集的化合物,將得分最高的10 個(gè)小分子取出。篩選出的小分子信息如表1所示,化學(xué)結(jié)構(gòu)如圖2所示。
3.2 ? 相似性搜索
本研究通過(guò)計(jì)算分子的Morgan指紋將篩選結(jié)果中的小分子與DrugBank數(shù)據(jù)庫(kù)中下載的藥物小分子數(shù)據(jù)進(jìn)行化合物相似性搜索,驗(yàn)證篩選結(jié)果是否與EGFR藥物分子存在相似性。首先讀入DrugBank數(shù)據(jù)庫(kù)中的數(shù)據(jù)和需要查詢相似性的小分子的SMILES號(hào),然后計(jì)算查詢分子與數(shù)據(jù)庫(kù)分子的分子指紋,計(jì)算相似度并排序,輸出相似度最高的前20 個(gè)藥物分子,隨后在DrugBank數(shù)據(jù)庫(kù)中根據(jù)相似度最高的20 個(gè)藥物分子的DRUGBANK_ID查詢其相關(guān)信息,看其是否為EGFR藥物分子。
對(duì)篩選結(jié)果中的10 個(gè)小分子依次進(jìn)行上述操作,結(jié)果顯示4 個(gè)小分子與已知的EGFR藥物分子存在相似性。相似性搜索的結(jié)果如表2所示。
3.3 ? 模型比較
將數(shù)據(jù)處理后得到的EGFR活性化合物和誘餌化合物數(shù)據(jù)應(yīng)用于六種機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,然后與GCN模型進(jìn)行比較。七種模型的MCC、Accuracy、Recall、F1-Score結(jié)果如表3所示。結(jié)果顯示,在四項(xiàng)指標(biāo)中GCN模型均取得了最優(yōu)結(jié)果。本數(shù)據(jù)集存在類別不均衡的情況,在這種情況下,MCC、F1-Score指標(biāo)更具有說(shuō)服力,在這兩項(xiàng)指標(biāo)中,GCN模型遠(yuǎn)遠(yuǎn)優(yōu)于其他幾種模型。
3.4 ? 模型驗(yàn)證
為了防止模型僅對(duì)EGFR靶點(diǎn)產(chǎn)生較好的篩選效果,需針對(duì)其他靶點(diǎn)重復(fù)實(shí)驗(yàn)流程,從而進(jìn)一步驗(yàn)證模型性能。
這里選擇使用DRD3(Dopamine D3 Receptor, 多巴胺受體D3抗體)靶點(diǎn)進(jìn)行模型驗(yàn)證。對(duì)DRD3靶點(diǎn)進(jìn)行虛擬篩選和相似性搜索后得到的結(jié)果如表4所示,結(jié)果顯示篩選出的10 個(gè)小分子中有8 個(gè)小分子與已知的DRD3藥物分子存在相似性,證明模型對(duì)其他靶點(diǎn)也能產(chǎn)生較好的篩選效果。
4 ? 結(jié)論(Conclusion)
本研究從DUD-E、ZINC、DrugBank數(shù)據(jù)庫(kù)收集得到所需相關(guān)數(shù)據(jù),基于圖卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行虛擬篩選工作,并后續(xù)進(jìn)行化合物相似性搜索,對(duì)模型性能進(jìn)行驗(yàn)證,結(jié)果顯示模型具有較好的預(yù)測(cè)性和準(zhǔn)確性。同時(shí),將本文模型與傳統(tǒng)機(jī)器學(xué)習(xí)模型進(jìn)行比較,通過(guò)十折交叉驗(yàn)證,使用MCC、Accuracy、Recall及F1-Score指標(biāo)評(píng)估了模型,結(jié)果表明GCN模型優(yōu)于其他傳統(tǒng)機(jī)器學(xué)習(xí)模型,證明圖卷積神經(jīng)網(wǎng)絡(luò)結(jié)合大數(shù)據(jù)在藥物篩選方面的優(yōu)越性?;趫D卷積神經(jīng)網(wǎng)絡(luò)的虛擬篩選方法提升了早期藥物研發(fā)工作的效率,為后續(xù)的生物實(shí)驗(yàn)及最終發(fā)現(xiàn)潛在藥物提供了助力。
同時(shí),在研究中也注意到圖卷積神經(jīng)網(wǎng)絡(luò)在虛擬篩選中還存在的一些問(wèn)題。當(dāng)從DUD-E數(shù)據(jù)庫(kù)中下載ACE靶點(diǎn)的活性化合物和誘餌化合物數(shù)據(jù)并用于模型訓(xùn)練時(shí),會(huì)發(fā)現(xiàn)模型出現(xiàn)過(guò)擬合現(xiàn)象,這可能是因?yàn)锳CE靶點(diǎn)的相關(guān)數(shù)據(jù)量遠(yuǎn)小于EGFR靶點(diǎn)的相關(guān)數(shù)據(jù)量,數(shù)據(jù)量過(guò)少導(dǎo)致了過(guò)擬合現(xiàn)象的產(chǎn)生。因此應(yīng)當(dāng)注意到,深度學(xué)習(xí)模型需要一定量的樣本用來(lái)訓(xùn)練才能有效避免模型過(guò)擬合。為了解決這一問(wèn)題,在后續(xù)的研究中需要考慮對(duì)模型進(jìn)行改進(jìn),以應(yīng)對(duì)小樣本學(xué)習(xí)任務(wù)。
參考文獻(xiàn)(References)
[1] DIMASI J A, GRABOWSKI H G, HANSEN R W. Innovation in the pharmaceutical industry: New estimates of R&D costs[J]. Journal of Health Economics, 2016, 47:20-33.
[2] WONG C H, SIAH K W, LO A W. Estimation of clinical trial success rates and related parameters[J]. Biostatistics, 2019, 20(2):273-286.
[3] WOLBER G, LANGER T. LigandScout: 3-D pharmacophores derived from protein-bound ligands and their use as virtual screening filters[J]. Journal of Chemical Information and Modeling, 2005, 45(1):160-169.
[4] WILLETT P, BARNARD J M, DOWNS G M. Chemical similarity searching[J]. Journal of Chemical Information and Computer Sciences, 1998, 38(6):983-996.
[5] KITCHEN D B, DECORNEZ H, FURR J R, et al. Docking and scoring in virtual screening for drug discovery: Methods and applications[J]. Nature Reviews Drug Discovery, 2004, 3(11):935-949.
[6] MENG X Y, ZHANG H X, MEZEI M, et al. Molecular docking: A powerful approach for structure-based drug discovery[J]. Current Computer-Aided Drug Design, 2011, 7(2):146-157.
[7] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553):436-444.
[8] CHEN H, ENGKVIST O, WANG Y, et al. The rise of deep learning in drug discovery[J]. Drug Discovery Today, 2018, 23(6):1241-1250.
[9] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[Z/OL]. (2017-02-22) [2022-06-08]. https://arxiv.org/abs/1609.02907.
[10] 徐冰冰,岑科廷,黃俊杰,等.圖卷積神經(jīng)網(wǎng)絡(luò)綜述[J].計(jì)算機(jī)學(xué)報(bào),2020,43(05):755-780.
[11] MYSINGER M M, CARCHIA M, IRWIN J J, et al. Directory of useful decoys, enhanced (DUD-E): Better ligands and decoys for better benchmarking[J]. Journal of Medicinal Chemistry, 2012, 55(14):6582-6594.
[12] STERLING T, IRWIN J J. ZINC 15-ligand discovery for everyone[J]. Journal of Chemical Information and Modeling, 2015, 55(11):2324-2337.
[13] WISHART D S, FEUNANG Y D, GUO A C, et al.
DrugBank 5.0: A major update to the DrugBank database for 2018[J]. Nucleic Acids Research, 2018, 46(D1):D1074-D1082.
[14] SCARSELLI F, GORI M, TSOI A C, et al. The graph neural network model[J]. IEEE Transactions on Neural Networks, 2008, 20(1):61-80.
[15] MORGAN H L. The generation of a unique machine description for chemical structures—a technique developed at chemical abstracts service[J]. Journal of Chemical Documentation, 1965, 5(2):107-113.
作者簡(jiǎn)介:
張凱睿(1996-),男,碩士生.研究領(lǐng)域:生物醫(yī)學(xué)工程.
黃 ?鋼(1961-),男,博士,教授.研究領(lǐng)域:核醫(yī)學(xué)分子影像.本文通信作者.