• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      藥物-靶標相互作用預測平臺設計與實現(xiàn)

      2023-05-15 07:27:46任浩然鄧博韜李建華孝大宇
      現(xiàn)代計算機 2023年5期
      關鍵詞:子集靶標內(nèi)核

      任浩然,鄧博韜,李建華,孝大宇

      (東北大學醫(yī)學與生物信息工程學院, 沈陽 110169)

      0 引言

      藥物在疾病的預防和治療中發(fā)揮著重要作用,不斷開發(fā)新的藥物是人類戰(zhàn)勝疾病的必要手段。新藥開發(fā)成本高昂,從抽象概念到市場產(chǎn)品,一種新藥研究和開發(fā)成本估計為1.61~45.4 億美元[1]。舊藥新用,也稱為藥物重定向,是對現(xiàn)有藥物發(fā)現(xiàn)新的適應癥[2]。藥物重定向極大減少了藥物開發(fā)的時間與成本,目前已經(jīng)取得一些突破性的成果。例如,研究發(fā)現(xiàn),傳統(tǒng)的止痛藥阿司匹林具有降低腦卒中復發(fā)、預防心肌梗死等功效。

      自新冠肺炎疫情暴發(fā)以來,藥物重定向成為國內(nèi)外諸多科學家與研究機構的關注焦點。2022 年7 月25 日,中國國家藥監(jiān)局應急附條件批準阿茲夫定用于治療普通型新冠肺炎成年患者,這是我國首個國產(chǎn)新冠口服藥,而該藥原本用于治療艾滋病。

      利用計算機發(fā)現(xiàn)潛在的藥物-靶標相互作用(drug-target interaction,DTI)是藥物重定向的一種重要方法。設計和開發(fā)一款藥物-靶標相互作用預測平臺,對相關生物醫(yī)學知識的科學普及、學生科研訓練及藥物重定向研發(fā)具有重要意義。

      1 平臺框架

      在藥物重定向的過程中,可以先利用計算機預測出可能的藥物-靶標相互作用,然后在實驗室和臨床驗證這些相互作用的真實性。所設計的藥物重定向平臺將實現(xiàn)篩選潛在藥物-靶標相互作用的功能,為了評估平臺的有效性,需要確定實驗的數(shù)據(jù)集、數(shù)據(jù)處理、預測方法、評估標準及測試流程等。預測方法決定著平臺的預測性能,將在第2節(jié)專門介紹。

      1.1 標準數(shù)據(jù)集

      本平臺采用文獻報道的標準數(shù)據(jù)集[3],根據(jù)藥物-靶標相互作用類型數(shù)據(jù)集分為Enzyme、IC、GPCR 和NR 四個子集。每個子集中包括藥物名稱、靶標名稱、藥物-靶標相互作用的信息。同時,對于每種藥物計算了該藥物與其他藥物的化學結構相似性(DS_CS),對于每種靶標計算了該靶標與其他靶標的蛋白質(zhì)序列相似性(TS_Seq)。表1列出了標準數(shù)據(jù)集中各子集包含的藥物、靶標及相互作用的數(shù)量。

      表1 藥物-靶標相互作用預測標準數(shù)據(jù)集

      1.2 相似性計算與Logistic變換

      目前很多藥物是通過靶標蛋白發(fā)揮治療作用的。因此,基于藥物-藥物相似性、靶標蛋白-靶標蛋白相似性及藥物-靶標相互作用可以推測尚未發(fā)現(xiàn)的藥物-靶標關聯(lián)。除了前述標準數(shù)據(jù)集中的DS_CS和TS_Seq,基于藥物-靶標相互作用能夠計算出新的藥物相似性和靶標相似性數(shù)據(jù)。

      藥物-靶標相互作用可以視為由0 和1 組成的矩陣。藥物和靶標分別構成矩陣的行和列,如果藥物與靶標相互作用,那么相應的位置為1,否則為0。藥物di與所有靶標的相互作用情況可用一維向量IP(di)表示,靶標ti與所有藥物的相互作用情況可用一維向量IP(ti)表示。

      根據(jù)向量夾角余弦公式,可得到兩種藥物di和dj的余弦相似性:

      同理,可得到兩種靶標ti和tj的余弦相似性:

      根據(jù)文獻報道的高斯內(nèi)核方法[4],可以計算兩種藥物di和dj的高斯內(nèi)核相似性:

      其中

      類似地,也可以獲得兩種靶標ti和tj的高斯內(nèi)核相似性:

      其中

      一般地,設γd′=1,γt′=1,nd表示藥物的數(shù)量,nt表示靶標的數(shù)量。

      最終,獲得3 種藥物相似性數(shù)據(jù):DS_CS、DS_Cos和DS_Gauss,以及3種靶標相似性數(shù)據(jù):TS_CS、TS_Cos 和TS_Gauss。各種相似性數(shù)據(jù)值域為[0,1]。表2 列出了從Type1 到Type4 共4種組合類型,不同組合對預測結果的影響將在后文闡述,更復雜的組合可按照相同的思路研究。相似性數(shù)據(jù)本質(zhì)上是一個方陣,因此也稱之為相似性矩陣。

      表2 藥物和靶標相似性數(shù)據(jù)的組合

      表2 中的第二、三列是DS和TS,可以選擇是否經(jīng)過Logistic 變換處理,通過對比預測結果,可以確定這種變換的作用。藥物和靶標的Logistic變換如下面公式所示:

      其中,C為常數(shù),可以通過交叉驗證確定,本研究取C=-20。為了處理相似性數(shù)據(jù)為0的情況,設d=log(9999)。

      1.3 驗證方法

      本平臺采用網(wǎng)絡一致性投影(network consistency projection,NCP)法預測潛在的藥物-靶標關聯(lián)[5]。為了評估NCP方法的預測性能,采用5折交叉驗證。將已知的DTI數(shù)據(jù)隨機分為5份,每次取4 份作為訓練集,剩余的1 份作為驗證集,循環(huán)5次,每份都將作一次驗證集。

      將預測結果與驗證集比較,可以得到真陽性率和假陽性率,進而繪制接受者操作特性曲線(receiver operating characteristic curve,ROC)。ROC 曲線下的面積為AUC 值,該值越大,性能越好。本文以AUC值作為評估標準。

      1.4 預測流程圖

      本平臺預測流程如圖1 所示?;谒幬?靶標相互作用可以獲得藥物和靶標的余弦相似性數(shù)據(jù)和高斯內(nèi)核相似性數(shù)據(jù)。將相似性數(shù)據(jù)組合,獲得4種組合類型。每種類型在實驗時選擇是否采用Logistic 變換。然后,藥物相似性數(shù)據(jù)進行網(wǎng)絡一致性投影(DNCP),靶標相似性數(shù)據(jù)進行網(wǎng)絡一致性投影(TNCP),將兩種投影數(shù)據(jù)合成(DTNCP),獲得預測的藥物-靶標關聯(lián)。在每種組合類型下,分別5 折交叉驗證,以AUC值評判預測性能。

      圖1 藥物-靶標相互作用平臺預測流程

      2 預測方法

      每種組合都包含了藥物相似性矩陣DS和靶標相似性矩陣TS。DS中行向量DS(i, :)表示藥物i與其他藥物的相似性,TS中列向量TS(:,j)表示靶標j與其他靶標的相似性。矩陣A表示藥物-靶標相互作用,A中各行表示藥物,各列表示靶標,A(i,:)表示藥物i與各靶標的相互作用信息,A(:,j)表示靶標j與各藥物的相互作用信息。網(wǎng)絡一致性投影預測藥物-靶標關聯(lián)分為三步。

      第一步,通過藥物相似性,計算藥物i和靶標j之間的關聯(lián)值DNCP(i,j):

      第二步,通過靶標相似性,計算藥物i和靶標j之間的關聯(lián)值TNCP(i,j):

      第三步,通過DNCP(i,j)和TNCP(i,j),計算藥物i和靶標j之間的預測關聯(lián)值DTNCP(i,j):

      在上述公式中,對于向量x,‖x‖表示對x取模運算。當采用Logistic變換時,將公式(9)~(11)中的DS和TS分別替換為從公式(7)和(8)得到的DS_L和TS_L。

      3 系統(tǒng)測試與分析

      本系統(tǒng)以Matlab為開發(fā)和運行環(huán)境。Matlab具有強大的矩陣運算能力,適于計算藥物相似性矩陣DS、靶標相似性矩陣TS,并結合藥物-靶標相互作用矩陣A,實現(xiàn)NCP 預測算法。首先,基于原始相似矩陣預測;然后,選擇Logistic變換對原始相似矩陣處理后再進行預測。

      3.1 基于原始相似數(shù)據(jù)的預測

      首先,從Type1 到Type4 組合,4 種組合中DS和TS不采用Logistic 變換,對Enzyme、IC、GPCR 和NR 中藥物-靶標相互作用矩陣A進行5折交叉驗證,實驗結果如表3所示。

      表3 不同相似性組合預測AUC比較

      從表3可見,對于每種標準數(shù)據(jù)子集,采用余弦相似性的Type1 和Type2 總體優(yōu)于采用高斯內(nèi)核相似性的Type3和Type4。Enzyme和IC中包含更多的藥物和靶標,AUC 值高于0.9,GPCR和NR中包含藥物和靶標較少,AUC值低于0.9。

      對于每種標準數(shù)據(jù)子集,Type1對應的AUC值大于Type3的值,意味著僅基于藥物-靶標相互作用數(shù)據(jù),余弦相似性變換優(yōu)于高斯內(nèi)核相似性變換。例如,GPCR 數(shù)據(jù)子集中,Type1 的AUC值為0.8992,而Type3 對應的為0.7641,前者比后者高出17.68%。對于每種標準數(shù)據(jù)子集,Type2 對應的AUC 值均大于Type4 的值,意味著結合藥物化學結構相似性和靶標序列相似性,余弦相似性變換依然優(yōu)于高斯內(nèi)核相似性變換。

      進一步分析發(fā)現(xiàn),對應每種數(shù)據(jù)子集,基于藥物-靶標相互作用獲得的藥物相似性和靶標相似性,在分別結合藥物化學結構相似性和靶標序列相似性后,AUC 提高并不明顯,有些反而下降。例如,在Type1 下,IC 對應的AUC 為0.9340,而在Type2 下,AUC 為0.9356,增加很小;對于Enzyme 和GPCR,AUC 反而有所降低。比較Type4 和Type3,IC、GPCR 和NR 的AUC 提高,只有Enzyme 的AUC 值略有降低,表明采用高斯內(nèi)核相似性變換時,結合藥物化學結構相似性和靶標序列相似性總體上是有利的。

      3.2 基于Logistic變換的預測

      為了對比分析,4 種組合中DS和TS采用Logistic 變換,對Enzyme、IC、GPCR 和NR 中藥物-靶標相互作用矩陣A進行5 折交叉驗證。Logistic 變換中參數(shù)C對結果有影響,為了避免過擬合,實驗中C=-20,實驗結果如表4所示。

      表4 不同組合Logistic變換后預測的AUC比較(C=-20)

      比較表4 和表3,采用余弦相似性的Type1和Type2,經(jīng)過Logistic變換后,8個AUC值中的6 個有所增加,Type2 條件下增加更加明顯,2個降低的值出現(xiàn)在GPCR 中Type1、NR 中Type2。NR 中僅包含54 個藥物,26 個靶標,90個相互作用,因數(shù)據(jù)量小結果不穩(wěn)定。Type2條件下,GPCR 對應的AUC 增加最多,從0.8854增至0.9222,提高了4.16%。就4 個數(shù)據(jù)子集平均而言,對應Type1,AUC 值提高0.65%;對應Type2,AUC 值提高了1.78%,后者的增量是前者的近3倍。

      在表4 中,采用高斯內(nèi)核相似性的Type3 和Type4 與相應表3 中的數(shù)據(jù)比較,Type3 條件下除NR 數(shù)據(jù)子集外,AUC 值反而降低,而Type4條件下AUC值全部提高??傮w上,對于Type3,4個數(shù)據(jù)子集AUC值平均降低3.78%;對于Type4,AUC值平均提高了2.00%。

      由表4數(shù)據(jù)可知,對應任意一種標準數(shù)據(jù)子集,Type2 條件下的AUC 值高于Type1 條件下的,平均提高1.73%。Type4 條件下的AUC 值高于Type3 條件下的,平均提高10.51%。這表明藥物-靶標相互作用矩陣無論采用余弦變換還是高斯內(nèi)核變換,融合藥物化學結構相似數(shù)據(jù)DS_CS 和靶標序列相似數(shù)據(jù)TS_Seq 后,預測性能明顯提高。

      3.3 對比分析

      從上述分析可見,在Type2 條件下,經(jīng)過Logistic 變換后NCP 方法性能最高。將NCP 方法與文獻報道的DVM方法比較[6],除NR數(shù)據(jù)子集外,在其他3 個子集上AUC 值都高于DVM,顯示本方法具有一定的優(yōu)越性。

      表5 NCP與DVM預測結果的AUC比較

      4 結語

      通過計算方法篩選潛在的藥物-靶標相互作用有利于節(jié)約藥物重定向的成本。本研究基于Matlab 語言開發(fā)一個藥物-靶標相互作用預測平臺,實驗證明該平臺是穩(wěn)定、可行的。平臺采用的NCP 預測方法具有一定優(yōu)越性,對于如何更合理設置各種參數(shù)需要深入研究。該平臺基于模塊化思想設計,可靈活替換不同預測方法,快速獲得實驗結果。因此,該平臺的開發(fā)對生物醫(yī)學知識科普、學生科研訓練和藥物重定向研究都是有益的。

      猜你喜歡
      子集靶標內(nèi)核
      由一道有關集合的子集個數(shù)題引發(fā)的思考
      萬物皆可IP的時代,我們當夯實的IP內(nèi)核是什么?
      拓撲空間中緊致子集的性質(zhì)研究
      強化『高新』內(nèi)核 打造農(nóng)業(yè)『硅谷』
      “百靈”一號超音速大機動靶標
      關于奇數(shù)階二元子集的分離序列
      納米除草劑和靶標生物的相互作用
      基于嵌入式Linux內(nèi)核的自恢復設計
      Linux內(nèi)核mmap保護機制研究
      復雜場景中航天器靶標的快速識別
      广宁县| 通化县| 若尔盖县| 天等县| 会理县| 鸡西市| 靖西县| 郑州市| 湖南省| 射洪县| 庆元县| 太谷县| 许昌县| 百色市| 阜阳市| 阜康市| 元阳县| 伊通| 友谊县| 通许县| 龙胜| 南川市| 宜兰市| 广河县| 咸阳市| 芒康县| 右玉县| 喀喇沁旗| 南靖县| 永善县| 新和县| 金平| 海兴县| 平凉市| 科技| 和平区| 平远县| 扎鲁特旗| 永康市| 吉安县| 永昌县|