楊 光, 海渤煜
(沈陽(yáng)師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽(yáng) 110034)
藥物重定位,又被稱為“舊藥新用”“舊壺新酒”。是對(duì)曾經(jīng)用于臨床的藥物包括正使用、不再使用和被臨床評(píng)價(jià)過(guò)的藥物新適應(yīng)癥的發(fā)現(xiàn)和應(yīng)用[1]。傳統(tǒng)的藥物研發(fā)需要經(jīng)歷臨床前研究、新藥的臨床申請(qǐng)和臨床試驗(yàn)等過(guò)程才能批準(zhǔn)上市,過(guò)程漫長(zhǎng),往往需要10~17年,且成功率低于10%,也具有未知的副作用[2-3]。而藥物重定位則只需3~12年,不僅研發(fā)成本降低、時(shí)間縮短,最重要的是風(fēng)險(xiǎn)性也顯著降低[4]。因此藥物重定位成為目前藥物研發(fā)技術(shù)中較好的策略之一,不斷受到廣大科研機(jī)構(gòu)、醫(yī)藥企業(yè)所重視。目前藥物重定位研究主要分為2個(gè)方面:1)高通量、高科技的實(shí)驗(yàn)篩選過(guò)程;2)基于計(jì)算預(yù)測(cè)的分析。由于藥物的種類繁多,疾病相關(guān)數(shù)據(jù)錯(cuò)綜復(fù)雜,因此基于實(shí)驗(yàn)的方法尋找藥物隱藏的新藥效不僅耗時(shí)費(fèi)力,且副作用難以預(yù)知。隨著組學(xué)和藥物信息學(xué)數(shù)據(jù)的累積,基于計(jì)算的分析方法已然成為計(jì)算生物學(xué)與系統(tǒng)生物學(xué)的重要研究方向。應(yīng)用計(jì)算的方法重新定位藥物主要分3個(gè)方面:基于小分子的藥物重定位[5-8]、基于藥物靶標(biāo)的藥物重定位[9-11]和基于網(wǎng)絡(luò)模型的藥物重定位[12-14]。
網(wǎng)絡(luò)模型的構(gòu)建為廣大研究者重新定位藥物拓寬了思路。由傳統(tǒng)的一個(gè)疾病對(duì)應(yīng)一個(gè)靶標(biāo),發(fā)展到從整體的角度,將疾病發(fā)生的復(fù)雜生物過(guò)程以及藥物在機(jī)體的作用規(guī)律呈現(xiàn)出來(lái),是集整體、動(dòng)態(tài)和全面于一體的系統(tǒng)性分析,對(duì)挖掘已獲得數(shù)據(jù)資源中隱含的信息達(dá)到了一個(gè)新的高度。目前,網(wǎng)絡(luò)構(gòu)建技術(shù)作為藥物重定位的重要策略之一,被各大研究機(jī)構(gòu)、醫(yī)藥工業(yè)廣泛應(yīng)用。因此本文對(duì)常見(jiàn)的3種網(wǎng)絡(luò)模型:疾病關(guān)聯(lián)網(wǎng)絡(luò)、藥物關(guān)聯(lián)網(wǎng)絡(luò)和蛋白質(zhì)互作網(wǎng)絡(luò)在藥物重定位研究中的應(yīng)用進(jìn)行綜述。
對(duì)于藥物重定位中的疾病關(guān)聯(lián)網(wǎng)絡(luò),疾病定義為網(wǎng)絡(luò)節(jié)點(diǎn),疾病與疾病、基因和靶標(biāo)等之間的作用關(guān)系定義為邊。其中疾病-疾病網(wǎng)絡(luò)是疾病關(guān)聯(lián)網(wǎng)絡(luò)中應(yīng)用最廣泛的。除此之外,疾病-靶標(biāo)網(wǎng)絡(luò)、基因-基因網(wǎng)絡(luò)和疾病-藥物網(wǎng)絡(luò)等也被應(yīng)用在藥物重定位研究中。對(duì)網(wǎng)絡(luò)構(gòu)建的選擇取決于研究者的研究目標(biāo)、計(jì)算方法和已知數(shù)據(jù)。
疾病網(wǎng)絡(luò)是用來(lái)揭示生物醫(yī)學(xué)實(shí)體之間隱藏的關(guān)系,是最直觀并且有效的方式。隨著多組學(xué)數(shù)據(jù)的不斷涌現(xiàn),一切與疾病相關(guān)的數(shù)據(jù)資源被越來(lái)越多的研究者使用。如表1所示的常見(jiàn)疾病關(guān)聯(lián)網(wǎng)絡(luò)相關(guān)數(shù)據(jù)庫(kù),其中包括GENT、CGED等6個(gè)數(shù)據(jù)庫(kù)。
表1 常見(jiàn)疾病關(guān)聯(lián)網(wǎng)絡(luò)相關(guān)數(shù)據(jù)庫(kù)Table 1 Common disease association network related database
1.2.1 疾病-疾病相似性網(wǎng)絡(luò)
疾病網(wǎng)絡(luò)的構(gòu)建可將多種因素之間的作用關(guān)系形象地表示出來(lái)。因此可通過(guò)疾病表型相關(guān)性、表達(dá)譜相關(guān)性和共享基因或治療藥物等方面挖掘疾病之間隱藏的關(guān)系,用于藥物重定位的研究當(dāng)中。張菁等[15]于2015年,針對(duì)相關(guān)疾病的基因集,計(jì)算其中每對(duì)疾病的相關(guān)性;利用隨機(jī)網(wǎng)絡(luò)進(jìn)行篩選,最終構(gòu)建疾病-疾病相似性網(wǎng)絡(luò);對(duì)網(wǎng)絡(luò)進(jìn)行驗(yàn)證,獲得8種疾病之間的相似性,并推測(cè)出腎上腺皮質(zhì)激素,除了對(duì)乳腺癌、前列腺癌以及風(fēng)濕性關(guān)節(jié)炎存在治愈效果外,對(duì)老年癡呆癥、動(dòng)脈粥樣硬化以及依賴性糖尿病也存在治愈的可能。
此外, Park等[16]于2017年提出一種藥物復(fù)位的網(wǎng)絡(luò)鏡像技術(shù),此方法的依據(jù)是:若2種疾病的相關(guān)作用分子相似,則這2種疾病可能使用相似的藥物。并分別利用蛋白質(zhì)和藥物信息構(gòu)建疾病網(wǎng)絡(luò),應(yīng)用庫(kù)爾貝克-萊布散度進(jìn)行定量比較,通過(guò)對(duì)重定位藥物相關(guān)的疾病進(jìn)行排序,選擇相關(guān)性高的疾病,再基于圖形的SSL算法確定候選疾病的相似疾病,從相似疾病中選擇藥物。
1.2.2 疾病-靶標(biāo)網(wǎng)絡(luò)
通過(guò)構(gòu)建疾病-靶標(biāo)網(wǎng)絡(luò),挖掘未知疾病與靶標(biāo)之間的關(guān)系,進(jìn)而發(fā)現(xiàn)疾病的潛在靶標(biāo),對(duì)藥物重新定位。李梢等[17]于2008年從HerBioMap數(shù)據(jù)庫(kù)、TCMD數(shù)據(jù)庫(kù)和相關(guān)的文獻(xiàn)中得到藥物六味地黃丸的主要化學(xué)成分;通過(guò)計(jì)算藥物化學(xué)結(jié)構(gòu)相似性,利用DRUG CIPHER軟件進(jìn)行靶標(biāo)預(yù)測(cè),構(gòu)建靶點(diǎn)-疾病網(wǎng)絡(luò);利用KEGG分析藥物作用通路,發(fā)現(xiàn)六味地黃丸藥物作用于內(nèi)分泌系統(tǒng)的PPAR通路、免疫系統(tǒng)的Chemokibe通路等,說(shuō)明其具有治療高血壓、膽結(jié)石和肥胖等疾病的可能。
1.2.3 基因-基因網(wǎng)絡(luò)
通過(guò)構(gòu)建基因-基因網(wǎng)絡(luò)挖掘疾病發(fā)生的重要靶標(biāo),為發(fā)現(xiàn)疾病新的治療藥物提供條件。2018年, Jafar[18]構(gòu)建了基于基因表達(dá)和蛋白質(zhì)互作數(shù)據(jù)的基因-基因加權(quán)相互作用網(wǎng)絡(luò);將多源隨機(jī)漫步算法應(yīng)用在該網(wǎng)絡(luò)對(duì)應(yīng)的藥物-藥物相似性網(wǎng)絡(luò)上;依據(jù)已有治療肝癌的藥物,對(duì)相似性網(wǎng)絡(luò)中藥物進(jìn)行打分,重定位其他對(duì)肝癌有治療效果的藥物。
1.2.4 其他疾病相關(guān)網(wǎng)絡(luò)
李梢等[17]于2008年構(gòu)建了一個(gè)代謝疾病網(wǎng)絡(luò),證明了如果2種疾病的酶相關(guān),則這2種疾病相關(guān)聯(lián)。Hidalgo等[19]于2009年建立表型疾病網(wǎng)絡(luò),從合并成對(duì)的癥狀中獲得1萬(wàn)多種疾病之間的聯(lián)系,結(jié)果顯示患者傾向于在他們已患病癥的網(wǎng)絡(luò)附近發(fā)展疾病。Sun等[20]和Albornoz[21]于2014年、2015年整合多數(shù)據(jù),創(chuàng)建基因-疾病-蛋白質(zhì)和基因-疾病-藥物的3方網(wǎng)絡(luò),預(yù)測(cè)疾病-疾病之間的作用關(guān)系;依據(jù)已知疾病相關(guān)信息,構(gòu)建疾病組網(wǎng)絡(luò),對(duì)已知疾病的治療藥物進(jìn)行重新定位。
對(duì)于藥物重定位研究中的藥物關(guān)聯(lián)網(wǎng)絡(luò),主要有藥物-藥物相似性網(wǎng)絡(luò)、藥物-靶標(biāo)相互作用網(wǎng)絡(luò)、藥物-癥狀網(wǎng)絡(luò)以及藥物與副作用等相關(guān)因素構(gòu)建的網(wǎng)絡(luò)。其中,最受歡迎的是藥物-藥物相似性網(wǎng)絡(luò)和藥物-靶標(biāo)網(wǎng)絡(luò)。
藥物關(guān)聯(lián)網(wǎng)絡(luò)的數(shù)據(jù)資源通常來(lái)自檢索數(shù)據(jù)庫(kù)以及收集公開(kāi)發(fā)表文章中的數(shù)據(jù)。相關(guān)常用數(shù)據(jù)庫(kù)如表2所示。
表2 常見(jiàn)藥物關(guān)聯(lián)網(wǎng)絡(luò)相關(guān)數(shù)據(jù)庫(kù)Table 2 Common drug association network related database
2.2.1 藥物-藥物相似性網(wǎng)絡(luò)
Campillos等[22]于2008年,通過(guò)計(jì)算746種藥物的副作用相似性和424種藥物組成的1 018組關(guān)系對(duì),得到藥物相似性網(wǎng)絡(luò)。研究發(fā)現(xiàn)9個(gè)新的藥物-靶標(biāo)關(guān)系對(duì),證實(shí)了副作用相似性越高的藥物,越可能作用于同一個(gè)靶標(biāo)的理論。據(jù)此他們的研究小組于2009年研究發(fā)現(xiàn),藥物阿瑞吡坦原用于治療化療引起的惡心嘔吐等癥狀,也可用于多種癌癥的治療。張菁[15]于2015年建立包含996個(gè)藥物副作用數(shù)據(jù)的藥物相似性網(wǎng)絡(luò),同時(shí)對(duì)疾病癥狀關(guān)系數(shù)據(jù)和藥物副作用關(guān)系數(shù)據(jù)建立矩陣,得到82 858個(gè)藥物疾病關(guān)系對(duì);聚類數(shù)據(jù)的交叉部分獲得藥物和疾病模塊,依據(jù)相似性打分,得分高的藥物具有重定位的可能。Hu等[23]于2009年,利用皮爾遜相關(guān)系數(shù),計(jì)算基因表達(dá)譜數(shù)據(jù)的相似性,表達(dá)譜包括約7 000種藥物,據(jù)此構(gòu)建藥物-藥物相似性網(wǎng)絡(luò);按相似性得分排序分析,洛貝林的作用靶點(diǎn)可能為KCNMAL,TOP2A與調(diào)控細(xì)胞凋亡周期的通路有關(guān),而柔紅霉素作用于TOP2A,因此具有重定位的潛能。
近年來(lái),藥物相似性網(wǎng)絡(luò)與其他網(wǎng)絡(luò)的聯(lián)合應(yīng)用,受到眾多藥物重定位研究者的關(guān)注。Liu等[24]于2016年,將疾病-疾病、藥物-藥物相似性網(wǎng)絡(luò)聯(lián)合分析,實(shí)現(xiàn)異源網(wǎng)絡(luò)上重啟的2遍隨機(jī)游走,接著對(duì)藥物-疾病關(guān)聯(lián)數(shù)據(jù)集進(jìn)行了性能評(píng)價(jià),表明該方法性能較好。對(duì)于阿爾茲海默病研究分析,預(yù)測(cè)的藥物可能對(duì)神經(jīng)退行性疾病有治療作用。趙晉等[25]于2017年,對(duì)藥物相似性網(wǎng)絡(luò)和組織特異性PPI網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行整合;選擇了肝癌與乳腺癌作為案例,利用模塊距離算法進(jìn)行計(jì)算;選擇前5%的藥物進(jìn)行分析,發(fā)現(xiàn)藥物普拉曲沙可能治療乳腺癌,藥物卡巴他賽和長(zhǎng)春地辛可能對(duì)肝癌有治療效果;最后以乳腺癌為案例,構(gòu)建1017個(gè)藥物關(guān)系對(duì),權(quán)值的大小表示關(guān)系的緊密程度,通過(guò)分析得到5個(gè)可能治療乳腺癌的藥物:甲磺酸艾日布林、普奈普酶、那曲肝素、瑞戈非尼和普拉曲沙。
2.2.2 藥物-靶標(biāo)相互作用網(wǎng)絡(luò)
將藥物-靶標(biāo)相互作用網(wǎng)絡(luò)與其他相關(guān)網(wǎng)絡(luò)聯(lián)合分析,對(duì)預(yù)測(cè)冷門(mén)藥物的新靶標(biāo)有重要作用。Chen等[26]于2012年,將蛋白質(zhì)互作網(wǎng)絡(luò)、藥物-靶標(biāo)網(wǎng)絡(luò)和藥物-藥物相似性網(wǎng)絡(luò)聯(lián)合應(yīng)用,應(yīng)用隨機(jī)游走算法得到潛在的藥物靶標(biāo),測(cè)出的37對(duì)藥物-靶標(biāo)在KEGG、DrugBank和Supertarget數(shù)據(jù)庫(kù)中至少有一個(gè)可以查到。Lyu等[27]于2014年基于文獻(xiàn)發(fā)掘方法,構(gòu)建藥物-靶標(biāo)網(wǎng)絡(luò);基于蛋白質(zhì)互作關(guān)系,構(gòu)建靶標(biāo)-靶標(biāo)網(wǎng)絡(luò);通過(guò)蛋白免疫印跡方法,驗(yàn)證網(wǎng)絡(luò)中的靶標(biāo)與通路,發(fā)現(xiàn)12個(gè)蛋白的表達(dá)有差異,存在于靶標(biāo)-靶標(biāo)相互作用網(wǎng)絡(luò)中的中心節(jié)點(diǎn)。結(jié)果表明NF-kB信號(hào)通路可能是五味子素作用于腦血管疾病發(fā)揮作用的重要通路。Shi等[28]基于藥物靶標(biāo)信息、藥物互作網(wǎng)絡(luò)結(jié)構(gòu)和藥物的化學(xué)信息,計(jì)算了藥物和靶標(biāo)的相關(guān)得分;對(duì)藥物-靶標(biāo)相互作用信息分類,得到新的藥物-靶標(biāo)關(guān)系對(duì);依據(jù)新的藥物-靶標(biāo)關(guān)系對(duì),分析藥物的新適應(yīng)癥。Zhang等[29]于2016年通過(guò)基于藥物化學(xué)結(jié)構(gòu)相似性,整合蛋白質(zhì)互作數(shù)據(jù)預(yù)測(cè)藥物與靶標(biāo)之間的關(guān)系,篩選與已知抗抑郁癥藥物有相關(guān)作用靶點(diǎn)的6種藥物。通過(guò)小鼠尾部懸吊和強(qiáng)迫小鼠游泳實(shí)驗(yàn),發(fā)現(xiàn)這6種藥物具有抗抑郁作用,例如阿爾維林是一種胃腸道痙藥,經(jīng)驗(yàn)證其在慢性不可預(yù)測(cè)的抑郁癥壓力模型中顯示抗抑郁作用,因此具有重定位的潛力。
對(duì)于藥物重定位研究中的蛋白質(zhì)互作網(wǎng)絡(luò),蛋白質(zhì)定義為節(jié)點(diǎn),蛋白質(zhì)之間的作用關(guān)系定義為邊。用網(wǎng)絡(luò)來(lái)刻畫(huà)蛋白質(zhì)相互作用關(guān)系,具有內(nèi)在的魯棒性[3-35],且網(wǎng)絡(luò)中的蛋白質(zhì)或基因不是隨機(jī)定位的,而是與特定功能相關(guān)的蛋白質(zhì)傾向于形成簇[36-39]。蛋白質(zhì)相互作用網(wǎng)絡(luò)是目前被研究的最為充分的生物分子網(wǎng)絡(luò)之一,也是規(guī)模最大,最常用的生物分子網(wǎng)絡(luò),在藥物重定位中具有重要的應(yīng)用。
伴隨著高通量技術(shù)的迅速發(fā)展,存儲(chǔ)在公共數(shù)據(jù)庫(kù)當(dāng)中的蛋白質(zhì)相互作用數(shù)據(jù)越來(lái)越豐富,可供廣大科研機(jī)構(gòu)研究者使用。常見(jiàn)蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)庫(kù)如表3所示。
表3 常見(jiàn)蛋白質(zhì)互作網(wǎng)絡(luò)數(shù)據(jù)庫(kù)Table 3 Common protein interaction network database
Xia等[39]于2006年利用皮爾遜相關(guān)系數(shù),量化蛋白質(zhì)互作網(wǎng)絡(luò)中蛋白質(zhì)的關(guān)系,應(yīng)用層次聚類的算法進(jìn)行網(wǎng)絡(luò)分塊,并對(duì)衰老網(wǎng)絡(luò)進(jìn)行研究,發(fā)現(xiàn)該網(wǎng)絡(luò)與其中幾個(gè)網(wǎng)絡(luò)模塊有關(guān),為發(fā)現(xiàn)與衰老相關(guān)的疾病潛在的藥物靶標(biāo)提供了可靠的依據(jù),表明靶標(biāo)相關(guān)的藥物可重定位治療與衰老相關(guān)的疾病。Hwang等[40]于2008年基于哮喘相關(guān)的表達(dá)譜和疾病基因數(shù)據(jù)庫(kù),構(gòu)建了蛋白質(zhì)相互作用網(wǎng)絡(luò)。研究發(fā)現(xiàn),高連接度和高介數(shù)的蛋白多分布在哮喘相關(guān)的信號(hào)通路上,并與哮喘藥物靶標(biāo)直接相互作用,表明這些蛋白具有作為治療哮喘藥物靶標(biāo)的潛力。鄒亞鵬[41]于2015年對(duì)肝癌基因表達(dá)數(shù)據(jù)和蛋白質(zhì)網(wǎng)絡(luò)數(shù)據(jù),利用皮爾遜相關(guān)系數(shù)算法對(duì)蛋白質(zhì)網(wǎng)絡(luò)進(jìn)行加權(quán);在加權(quán)蛋白質(zhì)網(wǎng)絡(luò)上應(yīng)用隨機(jī)游走算法,算出與蛋白質(zhì)對(duì)應(yīng)的藥物-藥物網(wǎng)絡(luò)中藥物關(guān)系;按打分排序,與已知肝癌的治療藥物比較分析,得到9種信任度高的藥物,分別是維他命B12、三磷酸腺苷、帕納替尼、瑞格非尼、達(dá)莎替尼、阿坎酸、丙戊酸、戊巴比妥和司可巴比妥。應(yīng)用CTD標(biāo)準(zhǔn)分析、文獻(xiàn)驗(yàn)證分析以及KEGG pathway重合度分析這9種藥物,結(jié)果顯示其對(duì)肝癌確有治療效果,藥物瑞格非尼在臨床實(shí)驗(yàn)階段的1、2、3期都有不錯(cuò)的療效。
蛋白質(zhì)互作網(wǎng)絡(luò),可以形象的刻畫(huà)出蛋白質(zhì)發(fā)揮功能的動(dòng)態(tài)結(jié)構(gòu)以及蛋白質(zhì)相關(guān)的具體信息。通過(guò)蛋白質(zhì)互作網(wǎng)絡(luò),了解蛋白質(zhì)的基本功能,為發(fā)現(xiàn)藥物新藥效提供新的思路。
在藥物研發(fā)成本如此昂貴的形勢(shì)下,基于網(wǎng)絡(luò)構(gòu)建的藥物重定位研究,必將成為制藥工業(yè)研發(fā)新藥的重要方向。伴隨著網(wǎng)絡(luò)藥理學(xué)、計(jì)算生物學(xué)[42]和計(jì)算機(jī)技術(shù)的快速發(fā)展,海量藥物、基因、靶標(biāo)和蛋白質(zhì)等數(shù)據(jù)資源的不斷涌現(xiàn),多學(xué)科信息資源的交叉與融合,都將為基于網(wǎng)絡(luò)構(gòu)建技術(shù)的藥物重定位研究產(chǎn)生巨大的推動(dòng)作用。