余冬華 郭茂祖,2,3 劉曉燕 程 爽
1(哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 哈爾濱 150001)2(北京建筑大學(xué)電氣與信息工程學(xué)院 北京 100044)3(建筑大數(shù)據(jù)智能處理方法研究北京市重點(diǎn)實(shí)驗(yàn)室(北京建筑大學(xué)) 北京 100044)4(中國工程物理研究院材料所 四川綿陽 621900)
藥物研發(fā)是醫(yī)藥界的驅(qū)動(dòng)力,也引起了學(xué)術(shù)界的研究熱潮,計(jì)算機(jī)輔助藥物設(shè)計(jì)是對傳統(tǒng)的實(shí)驗(yàn)型藥物發(fā)現(xiàn)的補(bǔ)充,加速了新藥開發(fā)進(jìn)程,縮短藥物研發(fā)時(shí)間,降低藥物研發(fā)成本,同時(shí)提升藥物研發(fā)成功率.
網(wǎng)絡(luò)藥理學(xué)(network pharmacology)[1-2]和藥物重定位(drug repositioning)[3-4]顛覆了傳統(tǒng)的藥物研發(fā)理念,完善了藥物靶標(biāo)作用關(guān)系(drug-target interaction)預(yù)測的理論基礎(chǔ),為計(jì)算機(jī)輔助藥物設(shè)計(jì)提供了新思路,加速了藥物發(fā)現(xiàn)與設(shè)計(jì).隨著公開數(shù)據(jù)庫KEGG[5],DrugBank[6],ChEMBL[7]等中的可用數(shù)據(jù)增多,很多預(yù)測藥物靶標(biāo)作用關(guān)系的計(jì)算方法也被提出[8-13].其主要思路為:建立合適的藥物靶標(biāo)數(shù)據(jù),構(gòu)建作用關(guān)系預(yù)測方法并做出合理的評價(jià),然后進(jìn)行實(shí)際作用關(guān)系預(yù)測.這些計(jì)算方法彌補(bǔ)了實(shí)驗(yàn)方法中的時(shí)間消耗和高昂成本投入的缺陷.
Yamanishi等人[14]在2008年基于KEGG數(shù)據(jù)庫建立了Enzyme,IC(ion channel),GPCR(G -protein-coupled receptor),NR(nuclear receptor)四個(gè)藥物靶標(biāo)作用關(guān)系數(shù)據(jù)集(包括藥物靶標(biāo)作用關(guān)系矩陣、藥物-藥物相似度矩陣、靶標(biāo)-靶標(biāo)相似度矩陣),其中,已經(jīng)驗(yàn)證的藥物靶標(biāo)作用關(guān)系用1表示,未知作用關(guān)系的藥物靶標(biāo)對(unknown interaction)用0表示,受到廣泛接受及認(rèn)同,Google學(xué)術(shù)顯示引用次數(shù)為467次,被認(rèn)為是藥物靶標(biāo)作用關(guān)系預(yù)測模型的標(biāo)準(zhǔn)檢驗(yàn)數(shù)據(jù)集.2009年,Bleakley等人[15]在上述4個(gè)數(shù)據(jù)集的基礎(chǔ)上,提出了經(jīng)典的二分局部模型(bipartite local models, BLM)藥物靶標(biāo)作用關(guān)系預(yù)測方法,并把其當(dāng)作二分類模型,采用ROC(receiver operating characteristic curve)曲線及曲線下方面積(area under curve, AUC)作為該方法的評價(jià)標(biāo)準(zhǔn).
該數(shù)據(jù)集的建立促使了很多預(yù)測方法的誕生,而AUC評價(jià)標(biāo)準(zhǔn)也對后續(xù)方法產(chǎn)生了重要影響.然而,該評價(jià)需要將未知作用關(guān)系的藥物靶標(biāo)對視為負(fù)例,這是一種不合理的假設(shè),因?yàn)楹芏辔粗淖饔藐P(guān)系可能實(shí)際上存在相互作用關(guān)系,只是到目前為止,仍沒有被實(shí)驗(yàn)所證實(shí).況且,預(yù)測方法的目標(biāo)就是需要將潛在的作用關(guān)系預(yù)測出來,即將作用關(guān)系0預(yù)測成1.盡管如此,這種不合理的評價(jià)方式也一直在延續(xù).作為一種彌補(bǔ)手段,會(huì)將預(yù)測結(jié)果中極有可能的藥物靶標(biāo)對(比如TopN,即按照預(yù)測的藥物靶標(biāo)對作用關(guān)系可能性從大到小排序,取前N對)在數(shù)據(jù)庫中查詢驗(yàn)證.Laarhoven等人[16]提出GIP-RLS(Gaussian interaction profile-regularized least squares)方法后,用AUC及AUPR(area under precision-recall curve)進(jìn)行了評價(jià).對于需要預(yù)測的藥物靶標(biāo)作用關(guān)系,僅對每個(gè)數(shù)據(jù)集Top 20查驗(yàn)過KEGG,DrugBank,ChEMBL數(shù)據(jù)庫.Gonen[17]提出的KBMF2K(kernelized Bayesian matrix factori-zation with twin kernels)預(yù)測方法,用AUC進(jìn)行評價(jià),且僅對每個(gè)數(shù)據(jù)集Top 5查驗(yàn)過KEGG,DrugBank,ChEMBL數(shù)據(jù)庫.Mei等人[18]提出BLMNII(bipartite local models with neighbor-based interaction-profile)預(yù)測方法后,用AUC及AUPR進(jìn)行了評價(jià),而沒有對預(yù)測的藥物靶標(biāo)對進(jìn)行數(shù)據(jù)庫的查詢驗(yàn)證,也就沒有驗(yàn)證所預(yù)測的作用關(guān)系中是否存在已經(jīng)被實(shí)驗(yàn)驗(yàn)證的藥物靶標(biāo)對.Hao等人[19]提出的RLS-KF(regularized least squares with kernel fusing)預(yù)測方法,用AUC及AUPR進(jìn)行評價(jià),僅對NR數(shù)據(jù)集中預(yù)測Top 100對藥物靶標(biāo)進(jìn)行數(shù)據(jù)庫查詢驗(yàn)證,雖然其AUC值接近于1,對于二分類模型來說,接近于1的AUC值表示該模型預(yù)測接近于完全正確,但對于NR數(shù)據(jù)集來說,直到Top 100時(shí),才有31對藥物靶標(biāo)已經(jīng)獲得了生物化學(xué)實(shí)驗(yàn)驗(yàn)證,對于目前可以查詢到的已驗(yàn)證的藥物靶標(biāo)對來說,仍然有9對不包含在內(nèi),這也表明,如此之高的預(yù)測精度,在實(shí)際預(yù)測中遠(yuǎn)未達(dá)到理想結(jié)果.Luo等人[20]提出DTINet(network integra-tion pipeline for drug-target interaction)預(yù)測方法,也用AUC及AUPR進(jìn)行了模型評價(jià),并對預(yù)測結(jié)果的Top 150藥物靶標(biāo)對進(jìn)行了數(shù)據(jù)庫查詢驗(yàn)證,特別地,選擇了極有可能具有作用關(guān)系的COX inhibitory進(jìn)行了生物化學(xué)實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果證實(shí)了DTINet模型的預(yù)測準(zhǔn)確.Hao等人[21]提出DNILMF(dual-network integrated logistic matrix factorization)預(yù)測方法,用AUC及AUPR評價(jià)該模型,采用與Yamanishi等人[14]相似的方式收集了一個(gè)新數(shù)據(jù)集,在最后的預(yù)測結(jié)果中,僅對Top 5的藥物靶標(biāo)對進(jìn)行了查詢驗(yàn)證.Olayan等人[22]提出DDR(novel method that improves the drug-target interaction prediction accuracy)預(yù)測方法,在方法的評價(jià)方面,舍棄了AUC評價(jià),而選擇加權(quán)平均AUPR評價(jià),并且對預(yù)測中的Top 25進(jìn)行了查詢驗(yàn)證.Peng等人[23]提出PreNNDS(drug-target identification mode by integrating neighbor interac-tion profiles, nonnegative matrix factorization, discriminative low-rank representation, and sparse representation classification into a unified frame-work)預(yù)測方法,僅采用AUPR進(jìn)行評價(jià),與其他文章按照預(yù)測得分(或概率)選擇TopN個(gè)藥物靶標(biāo)對進(jìn)行查詢驗(yàn)證不同,Peng 等人選擇了2個(gè)靶標(biāo)(ID分別為hsa1132及hsa1124)所對應(yīng)的Top 20的藥物進(jìn)行查詢驗(yàn)證,同樣地,選擇了2個(gè)藥物(ID分別為D00255及D00195)所對應(yīng)的Top 20的靶標(biāo)進(jìn)行查詢驗(yàn)證.Liu等人[24]提出NRLMF(neighbor-hood regularized logistic matrix factorization)預(yù)測方法后,用 AUC及AUPR進(jìn)行評價(jià),該文在KEGG,DrugBank,ChEMBL,Matador數(shù)據(jù)庫中查詢驗(yàn)證了4個(gè)數(shù)據(jù)集中Top 1 000的藥物靶標(biāo)對,因此,其給出了Top 10,Top 30,Top 50的評價(jià)結(jié)果.然而,其并未提供可以快速高效地對如此大量的未知作用關(guān)系藥物靶標(biāo)對查詢驗(yàn)證的方法,無法減輕后續(xù)學(xué)者研究該問題的工作量.實(shí)際上,對于Enzyme,IC,GPCR,NR四個(gè)數(shù)據(jù)集來說,Top 1 000仍然是未知藥物靶標(biāo)作用關(guān)系中很小的一部分.多種方法的查詢驗(yàn)證TopN值總結(jié)見表1:
Table 1 The Checked Top N Values of Various Methods表1 各種方法查詢驗(yàn)證Top N值
因此,如何驗(yàn)證這些預(yù)測結(jié)果的準(zhǔn)確性是研究者面臨的一個(gè)挑戰(zhàn),在目前有限條件下,考慮到時(shí)間消耗及實(shí)驗(yàn)成本,不可能對所有未知的藥物靶標(biāo)作用進(jìn)行生物化學(xué)實(shí)驗(yàn)驗(yàn)證.綜合現(xiàn)有的各種評價(jià)方法,一種可行的方式就是用AUC及AUPR驗(yàn)證預(yù)測方法可行性及預(yù)測精度,并利用數(shù)據(jù)共享,如公開數(shù)據(jù)庫DrugBank,KEGG,ChEMBL,提供的很多藥物靶標(biāo)之間的作用關(guān)系數(shù)據(jù),將預(yù)測的作用關(guān)系逐對在數(shù)據(jù)庫中進(jìn)行查詢驗(yàn)證,確認(rèn)該未知的作用關(guān)系是否已經(jīng)被相關(guān)實(shí)驗(yàn)驗(yàn)證.這種方式得到了學(xué)術(shù)界普遍認(rèn)可.然而,現(xiàn)有的方法也僅僅查詢驗(yàn)證TopN藥物靶標(biāo)對,因?yàn)椴樵凃?yàn)證是一個(gè)重復(fù)且耗時(shí)的工作,且未知作用關(guān)系的藥物靶標(biāo)對占預(yù)測總數(shù)的絕大多數(shù),而更為合理的驗(yàn)證預(yù)測結(jié)果的方式為:對所有未知作用關(guān)系的藥物靶標(biāo)對在數(shù)據(jù)庫上查詢驗(yàn)證一遍.
針對上述問題,本文不僅為藥物靶標(biāo)作用關(guān)系驗(yàn)證提供一種高效、便捷、可行的查詢驗(yàn)證方法DTcheck(drug-target check),并利用DTcheck查詢的結(jié)果對4個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集及AUC評價(jià)做了分析,主要貢獻(xiàn)歸納為
1) 結(jié)合網(wǎng)絡(luò)爬蟲特性,設(shè)計(jì)DTcheck查詢驗(yàn)證方法并實(shí)現(xiàn).
2) 基于KEGG,DrugBank,ChEMBL數(shù)據(jù)庫,通過DTcheck將4個(gè)數(shù)據(jù)集中已經(jīng)驗(yàn)證的藥物靶標(biāo)作用關(guān)系補(bǔ)充完整.
3) 對于(批量)提供KEGG DRUG ID及KEGG GENES ID的藥物靶標(biāo)對,DTcheck可以在線查詢并返回其在KEGG,DrugBank,ChEMBL數(shù)據(jù)庫中的驗(yàn)證結(jié)果.
4) 利用DTcheck查詢的結(jié)果,重新分析了BLM方法的預(yù)測結(jié)果,探討了ROC曲線評價(jià)藥物靶標(biāo)作用關(guān)系的不合理性,并引入TopN評價(jià)指標(biāo),實(shí)際結(jié)果表明AUC值低的BLMd在預(yù)測新的藥物靶標(biāo)作用關(guān)系時(shí)要優(yōu)于AUC值高的BLMmax,給AUC評價(jià)的不合理性提供了依據(jù).
Fig. 1 Technical route and flow of DTcheck圖1 DTcheck 技術(shù)路線及流程
Yamanishi等人[14]提供的標(biāo)準(zhǔn)數(shù)據(jù)集中采用KEGG ID標(biāo)注藥物及靶標(biāo),而DrugBank,ChEMBL有其自己的ID體系.如藥物D02441(KEGG DRUG ID)在DrugBank對應(yīng)的ID為DB00311,在ChEMBL中對應(yīng)的Compound ID為CHEMBL18,而靶標(biāo)hsa766(KEGG GENE ID)需要與UniProt數(shù)據(jù)庫[25]中的P43166(UniProt ID)對應(yīng)起來,通過DrugBank中的藥物或者ChEMBL中的藥物(或化合物)查詢到的對應(yīng)靶標(biāo),會(huì)提供對應(yīng)的UniProt ID.因此,其中一個(gè)關(guān)鍵問題就是需要將3個(gè)數(shù)據(jù)庫中提供的不同ID合理對應(yīng)起來.
藥物靶標(biāo)作用關(guān)系是成對出現(xiàn)的,如D02441~hsa766,因此,在查詢驗(yàn)證過程中,可通過D02441在KEGG DRUG中查找到對應(yīng)靶標(biāo)hsa766,也可在DrugBank中通過DB00311查找到對應(yīng)靶標(biāo)P43166(UniProt ID),而hsa766與P43166代表同一個(gè)靶標(biāo),即不同的ID代表同一個(gè)對象.相對應(yīng)地,也可以從靶標(biāo)hsa766出發(fā),從KEGG GENE中查找到藥物D02441.因此,另一個(gè)關(guān)鍵問題就是在查詢驗(yàn)證中,需要對藥物靶標(biāo)對進(jìn)行雙向查詢驗(yàn)證.
由于KEGG DRUG中提供了該藥物在ChEMBL及DrugBank中的對應(yīng)ID和相應(yīng)的網(wǎng)頁鏈接,因此,利用爬蟲抓取數(shù)據(jù)的特性,讀取該藥物在KEGG DRUG中所提供的對應(yīng)靶標(biāo)ID后,需要額外讀取該藥物在其他2個(gè)數(shù)據(jù)庫中的ID及鏈接.而在KEGG GENE中查詢的數(shù)據(jù)僅是該靶標(biāo)是否有對應(yīng)的藥物即可.因此,在藥物靶標(biāo)對的雙向查詢驗(yàn)證中,可以優(yōu)先查詢靶標(biāo),然后查詢藥物.
從KEGG DRUG中讀取該藥物在ChEMBL,DrugBank中的鏈接后,可以獨(dú)立地進(jìn)行查詢,然后將查詢結(jié)果合并,最后核對待驗(yàn)證的藥物靶標(biāo)對.KEGG DRUG提供的ChEMBL鏈接可能會(huì)有多個(gè),需要遍歷所有可能鏈接,讀取該鏈接返回的ChEMBL Target信息及其跳轉(zhuǎn)鏈接,就可以查詢到該藥物對應(yīng)靶標(biāo)的UniProt ID.從KEGG DRUG還可以讀取該藥物的DrugBank跳轉(zhuǎn)鏈接,利用爬蟲訪問該鏈接,獲取返回信息,從其返回信息中讀取Targets,Enzymes,Carriers,Transporters四個(gè)版塊信息所提供的UniProt ID即可.這樣就可以獲取該藥物在ChEMBL,DrugBank兩個(gè)數(shù)據(jù)庫中所對應(yīng)靶標(biāo)的UniProt ID.
靶標(biāo)的UniProt ID與KEGG GENE ID并不一樣,后者也是4個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集所提供的ID,因此,需要先將UniProt ID轉(zhuǎn)換成KEGG GENE ID才能核查待驗(yàn)證的藥物靶標(biāo)對的作用關(guān)系是否已經(jīng)被證實(shí).此時(shí)可以借助UniProt數(shù)據(jù)庫提供的ID mapping功能,將靶標(biāo)的UniProt ID轉(zhuǎn)換成KEGG GENE ID,這一步的實(shí)現(xiàn)需要借助爬蟲發(fā)送數(shù)據(jù)請求并獲取返回信息的特性.
解決了DTcheck查詢驗(yàn)證中遇到的關(guān)鍵問題,本文設(shè)計(jì)了如圖1所示的技術(shù)路線流程,其代碼鏈接為https:github.comYu123456DTcheck.從圖1中可以看出,雙向查詢分成2個(gè)部分獨(dú)立查詢,最終需要將2部分查詢結(jié)果合并,而3個(gè)數(shù)據(jù)庫之間,需要先從KEGG DRUG中獲取DrugBank,ChEMBL數(shù)據(jù)庫的跳轉(zhuǎn)鏈接,然后依次獲取相應(yīng)數(shù)據(jù)庫中的靶標(biāo)信息,而從這2個(gè)數(shù)據(jù)庫中返回的靶標(biāo)是UniProt ID,為了與待驗(yàn)證的藥物靶標(biāo)對核對,需要增加一步ID轉(zhuǎn)換,把UniProt ID轉(zhuǎn)換成KEGG GENE ID.
Yamanishi等人[14]于2008年建立了Enzyme,IC,GPCR,NR四個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,如表2所示.其中,drug-target interactions代表當(dāng)時(shí)已經(jīng)驗(yàn)證的藥物靶標(biāo)作用關(guān)系;unknown interaction代表當(dāng)時(shí)未知的藥物靶標(biāo)作用關(guān)系;從最后2行已知與未知藥物靶標(biāo)作用關(guān)系具體數(shù)值來看,未知作用關(guān)系遠(yuǎn)多于已知作用關(guān)系.該數(shù)據(jù)集從建立至今已有10年之久,在這期間有很多作用關(guān)系得到生物實(shí)驗(yàn)驗(yàn)證,本文采用DTcheck查詢KEGG,DrugBank,ChEMBL三個(gè)數(shù)據(jù)庫,將新增的作用關(guān)系補(bǔ)充完整.伴隨這4個(gè)數(shù)據(jù)集,Bleakley等人[15]于2009年提出了經(jīng)典的BLM預(yù)測方法,并用AUC進(jìn)行評價(jià),本文將依據(jù)DTcheck查詢到的結(jié)果,重新探討AUC評價(jià)的不合理性,并采用TopN中已經(jīng)被驗(yàn)證的藥物靶標(biāo)對的數(shù)目重新分析預(yù)測結(jié)果.
Table 2 Drug-Target and Their Interactions表2 藥物靶標(biāo)及其作用關(guān)系信息
經(jīng)過DTcheck的查詢,每個(gè)數(shù)據(jù)集都可以找到新驗(yàn)證的藥物靶標(biāo)對,如表3所示.從增長率(increased ratio)來看,新藥物靶標(biāo)關(guān)系增加最快的數(shù)據(jù)集為GPCR;新發(fā)現(xiàn)的藥物靶標(biāo)對數(shù)最多的卻是Enzyme數(shù)據(jù)集,達(dá)到907對;雖然NR藥物靶標(biāo)對的數(shù)目最少,但也將近增加一半,達(dá)到40對.
Table 3 Drug-Target and Their Increased Interactions表3 藥物靶標(biāo)數(shù)據(jù)集新增作用關(guān)系
表4給出了NR數(shù)據(jù)集的DTcheck查詢到的40對已經(jīng)驗(yàn)證的藥物靶標(biāo)作用關(guān)系.其中,DrugID,TargetID分別表示藥物、靶標(biāo)的ID;C,D分別表示在ChEMBL,DrugBank數(shù)據(jù)庫中查詢到該藥物靶標(biāo)對作用關(guān)系;K需要做一個(gè)區(qū)分,在KEGG欄中,表示通過藥物找到了對應(yīng)的靶標(biāo),在KEGGh欄中,則表示通過靶標(biāo)找到了對應(yīng)的藥物;空白表示對應(yīng)數(shù)據(jù)庫中未查詢到相關(guān)信息.表4中出現(xiàn)大量空白,表明3個(gè)數(shù)據(jù)庫之間的信息并沒有完全同步,因此,必須查詢每一個(gè)數(shù)據(jù)庫,避免遺漏.對于NR數(shù)據(jù)集來說,DrugBank提供的已驗(yàn)證作用關(guān)系最多,其次是KEGG,最后才是ChEMBL.
Table 4 New Increased Drug-Target Interactions of NR表4 NR數(shù)據(jù)集新增藥物靶標(biāo)關(guān)系
Continued (Table 4)
Note: The blank indicates that the interaction relationship has not been queried yet.
由于Enzyme,GPCR,IC這3個(gè)數(shù)據(jù)集查詢到的新增作用關(guān)系數(shù)目較多,限于篇幅,不宜在文中直接給出,其查詢的相應(yīng)結(jié)果見https:github.comYu123456Drug-targetChecked.
BLM可以細(xì)分為3個(gè)子方法,即BLMd,BLMt,BLMmax,其中BLMmax是取BLMd,BLMt二者預(yù)測的較大值.Bleakley等人[15]依據(jù)AUC(如表5所示,較優(yōu)者黑體表示)評價(jià)指出,在3個(gè)方法中,BLMmax性能最好,BLMd性能最差.
Table 5 AUC of 4 Datasets表5 AUC 評價(jià)值
Note: The boldface represents the best one of the three methods.
從AUC評價(jià)來看,BLMmax非常顯著地優(yōu)于BLMd,因此,BLMmax對新藥物靶標(biāo)作用關(guān)系的預(yù)測結(jié)果也應(yīng)該優(yōu)于BLMd,然而,表6卻展現(xiàn)出截然相反的結(jié)論.在TopN評價(jià)中,從相同的N中找到更多驗(yàn)證關(guān)系者性能更優(yōu),在表6中較優(yōu)者已經(jīng)加粗表示.在Top 50之前的每一個(gè)TopN中,BLMd預(yù)測正確的藥物靶標(biāo)對均多于BLMmax;在Top 50至Top 1 000之間,才出現(xiàn)后一種方法優(yōu)于前一種方法的趨勢,如Top 1 000時(shí),BLMmax預(yù)測正確的藥物靶標(biāo)對的數(shù)目多于BLMd.然而,開發(fā)藥物靶標(biāo)作用關(guān)系預(yù)測方法的初衷是為實(shí)驗(yàn)生物化學(xué)家提供有實(shí)質(zhì)指導(dǎo)作用的建議,即盡可能少的實(shí)驗(yàn)下找到真正的作用關(guān)系,因?yàn)橛蒙飳?shí)驗(yàn)驗(yàn)證藥物靶標(biāo)作用關(guān)系既耗時(shí)又費(fèi)錢,因此,Top 50評價(jià)會(huì)是一個(gè)更優(yōu)的選擇.從這個(gè)方面來說,BLMd優(yōu)于BLMmax,這也表明僅用AUC評價(jià)藥物靶標(biāo)預(yù)測模型不合理.
Table 6 Comparing New Interaction of Top N Between BLMmax and BLMd表6 BLMmax 與 BLMd 中Top N中新作用關(guān)系比較
Note: The boldface represents the better interaction between BLMd and BLMmax.
本文利用爬蟲特性,設(shè)計(jì)并實(shí)現(xiàn)了DTcheck在KEGG,DrugBank,ChEBML數(shù)據(jù)庫上高效、便捷的藥物靶標(biāo)作用關(guān)系查詢驗(yàn)證,利用DTcheck實(shí)現(xiàn)對標(biāo)準(zhǔn)數(shù)據(jù)集新增作用關(guān)系的擴(kuò)展補(bǔ)充,基于BLM方法的預(yù)測結(jié)果,說明了AUC評價(jià)藥物靶標(biāo)作用關(guān)系預(yù)測的不合理性,及TopN可以給出更加合理的評價(jià).本文提供的藥物靶標(biāo)對在線查詢驗(yàn)證思路及實(shí)現(xiàn),大大節(jié)省研究者查詢驗(yàn)證時(shí)間,使得在方法的驗(yàn)證中不僅僅限于每個(gè)數(shù)據(jù)集僅查詢預(yù)測排序靠前的少數(shù)藥物靶標(biāo)對,有利于更準(zhǔn)確地評價(jià)藥物靶標(biāo)預(yù)測方法.
DTcheck也有待于繼續(xù)擴(kuò)展,目前僅僅查詢KEGG,DrugBank,ChEMBL三個(gè)數(shù)據(jù)庫,實(shí)際上,Matador,SuperTarget等數(shù)據(jù)庫也可以查詢到一些相關(guān)作用關(guān)系.我們將會(huì)繼續(xù)對此工作擴(kuò)展,以期DTcheck更具有廣泛性.