孫艷,王文祥,陳文翰,劉怡波,陳習(xí)瑀,陳思曉,林育萍,鄭備紅*
(1.福建省婦幼保健院,福建醫(yī)科大學(xué)附屬醫(yī)院,福州 350001;2. 福建醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,福州 350108;3. 福建醫(yī)科大學(xué)臨床醫(yī)學(xué)部,福州 350108)
子宮內(nèi)膜異位癥(Endometriosis,EMs)與不孕癥(Infertility)皆是育齡期女性的常見病。EMs與不孕癥之間的因果關(guān)系尚存爭議,目前資料顯示,EMs患者中約30%~50%有不孕的表現(xiàn),不孕癥患者中約30%~50%存在EMs[1-2]。但目前尚缺乏從生物信息學(xué)視角系統(tǒng)探討EMs與不孕癥在基因組學(xué)、蛋白質(zhì)組學(xué)以及相應(yīng)通路的關(guān)聯(lián)。因此,我們整合疾病-基因數(shù)據(jù)庫的信息,尋找兩類疾病的共有靶點與信號通路,以期為EMs與不孕癥的發(fā)病機制、疾病進展與治療提供理論依據(jù)。
以“Endometriosis”、“Infertility”分別為檢索詞,挖掘5個常用疾病-基因數(shù)據(jù)庫信息,剔除重復(fù)出現(xiàn)的基因進行整合,獲得EMs與不孕癥的相關(guān)基因、蛋白。
5個常用疾病-基因數(shù)據(jù)庫分別是:①OMIM數(shù)據(jù)庫(https:∥omim.org/),由約翰斯·霍普金斯大學(xué)創(chuàng)建并維護,是收錄了人類基因和遺傳疾病信息的權(quán)威數(shù)據(jù)庫[3];②MalaCards(https:∥www.malacards.org/MalaCards),是人類疾病數(shù)據(jù)庫,涵蓋了70余個數(shù)據(jù)庫,可將疾病與相關(guān)經(jīng)典基因相關(guān)聯(lián)[4];③DisGeNet(https:∥www.disgenet.org/),是收錄與人類疾病相關(guān)的基因和突變位點信息的最大公共平臺之一,目前包含1 134 942 個基因-疾病關(guān)聯(lián)[5];④NCBI,即美國國家生物信息中心,提供對生物醫(yī)學(xué)和基因組信息,旗下的gene數(shù)據(jù)庫(https:∥www.ncbi.nlm.nih.gov/gene)整合了來自廣泛物種的基因信息,在檢索人類疾病時可將物種限定于“Homo sapiens”[6];⑤Phenopedia(https:∥phgkb.cdc.gov/PHGKB/startPagePhenoPedia.action),以疾病為中心,可對關(guān)聯(lián)文獻進行基因關(guān)鍵詞的頻次統(tǒng)計,隸屬于美國疾病控制與預(yù)防中心(CDC)公共衛(wèi)生基因組學(xué)和精確健康知識庫(PHGKB)[7]。
1.富集分析:將兩類疾病的基因分別導(dǎo)入Venn Diagram網(wǎng)站(http:∥bioinformatics.psb.ugent.be/webtools/Venn/),繪制韋恩圖,獲得疾病在5類數(shù)據(jù)庫中的共有基因與獨有基因。Metascape(https:∥metascape.org)用于系統(tǒng)分析數(shù)據(jù)集,將篩選去重后的兩類疾病的相關(guān)基因按照規(guī)定格式進行整理,導(dǎo)入該平臺,選定物種為“Homo sapiens”進行基因富集分析,獲得生物途徑、相關(guān)通路與蛋白互作網(wǎng)絡(luò)[8]。
2.統(tǒng)計學(xué)處理:采用Metascape平臺處理,進行GO/KEGG富集分析,基于超幾何分布獲得P值,P<0.05為差異有統(tǒng)計學(xué)意義;并根據(jù)需要將P值轉(zhuǎn)化為-Log(P)以便比較,數(shù)值越小代表越特異。應(yīng)用分子復(fù)雜檢測算法(Molecular Complexity Detection,MCODE)來識別蛋白互作網(wǎng)絡(luò)中緊密相關(guān)的蛋白質(zhì)進行聚類構(gòu)建功能模塊。
1.基因挖掘:選取“Endometriosis”為檢索詞,在5大數(shù)據(jù)庫中挖掘與EMs相關(guān)的基因,分別在OMIM數(shù)據(jù)庫中獲得相關(guān)基因89個、MalaCards數(shù)據(jù)庫中獲得相關(guān)基因74個、Phenopedia數(shù)據(jù)庫中獲得相關(guān)基因323個、DisGeNET數(shù)據(jù)庫中獲得相關(guān)基因1 188個以及NCBI gene數(shù)據(jù)庫中獲得相關(guān)基因626個,去重合并后共計1 482個基因(圖1A)。選取“Infertility”為檢索詞,在5大數(shù)據(jù)庫中挖掘與不孕癥相關(guān)的基因,分別在OMIM數(shù)據(jù)庫中獲得相關(guān)基因528個、MalaCards數(shù)據(jù)庫中獲得相關(guān)基因72個、Phenopedia數(shù)據(jù)庫中獲得相關(guān)基因729個、DisGeNET數(shù)據(jù)庫中獲得相關(guān)基因130個以及NCBI gene數(shù)據(jù)庫中獲得相關(guān)基因476個,去重合并后共計1 409個基因(圖1B)。
2.共有基因篩選:取EMs與不孕癥兩類疾病基因數(shù)據(jù)導(dǎo)入Metascape平臺,在基因級別,獲得兩者共有基因366個,將其重疊部分以Circos的方式進一步可視化(圖1C):在外圈中,紅色代表EMs,藍色代表不孕癥;在內(nèi)圈中,以深橙色著色兩個數(shù)據(jù)集的共存基因,以淺橙色顯示單獨存在一個數(shù)據(jù)集的基因;紫色曲線鏈接相同的基因,藍色曲線鏈接屬于相同的富集基因本體模塊的基因,可見兩類疾病關(guān)聯(lián)較為密切。
A:EMs相關(guān)基因;B:不孕癥相關(guān)基因;C:EMs與不孕癥共有基因篩選圖1 EMs與不孕癥相關(guān)基因挖掘及共有基因篩選
將366個共有基因同時導(dǎo)入Metascape平臺,選取GO與KEGG數(shù)據(jù)庫,獲得與之相關(guān)的GO生物學(xué)過程數(shù)為2 967,KEGG通路數(shù)為170,按照-log(P)排名并繪制熱圖,前20包括生殖結(jié)構(gòu)發(fā)育、細胞因子介導(dǎo)的信號通路、癌癥相關(guān)通路、細胞增殖的負調(diào)控、類固醇代謝過程、細胞對脂質(zhì)的反應(yīng)、調(diào)節(jié)激素水平、凋亡信號通路、對有毒物質(zhì)的反應(yīng)、血管發(fā)育、老化、細胞因子-細胞因子受體相互作用、多細胞生物過程、肌肉細胞增殖、調(diào)節(jié)炎癥反應(yīng)、淋巴細胞激活、對激素刺激的細胞反應(yīng)、活性氧代謝過程、節(jié)律過程、炎癥性腸病(圖2A)。進一步分析各模塊之間的關(guān)系,從20個聚類中的每個聚類中選擇具有最佳P值的模塊,并限制每個聚類不超過15個,并且合計不超過250個。使用Cytoscape構(gòu)建網(wǎng)絡(luò)圖,其中每個節(jié)點代表一個模塊,相似性>0.3的模塊則通過曲線鏈接,并按其聚類ID著色(圖2B)。
A:基因富集模塊熱圖;B:基因富集模塊關(guān)系圖圖2 EMs與不孕癥共有基因富集所得的生物過程與信號通路
在Metascape平臺構(gòu)建與366個共有基因相關(guān)的蛋白質(zhì)的全鏈接互作網(wǎng)絡(luò)(圖3A)。因蛋白質(zhì)數(shù)量眾多,故應(yīng)用分子復(fù)雜檢測(Molecular Complexity Detection,MCODE)算法來識別蛋白互作網(wǎng)絡(luò)中緊密相關(guān)的蛋白質(zhì)進行聚類構(gòu)建15個功能模塊,并用15種顏色表示,再將各模塊從蛋白互作網(wǎng)絡(luò)抽離出來,以顯示組成各模塊的重要基因(圖3B)。
將通路和生物過程富集分析應(yīng)用于每個MCODE,且按照P值得分保留各個模塊中三個最相關(guān)的功能描述(表 1)。
A:相關(guān)蛋白互作網(wǎng)絡(luò);B:蛋白聚類構(gòu)建功能模塊圖3 EMs與不孕癥在蛋白組學(xué)層面的關(guān)聯(lián)
表1 蛋白互作網(wǎng)絡(luò)中各個MCODE的P值得分排名前三的生物學(xué)注釋
EMs與不孕癥在育齡女性中發(fā)病率較高,給社會、婦女帶來了較為嚴重的經(jīng)濟負擔(dān),因此,需要將研究和資源的效用最大化來提高對兩種疾病關(guān)系的認識,以便發(fā)展更為有效的治療方法。本研究結(jié)果證實,EMs與不孕癥兩類疾病存在著大量的共有基因,而這些基因則參與了大量的生物學(xué)過程與信號通路。同時,在蛋白質(zhì)組學(xué)層面,共有基因所表達的蛋白質(zhì)可形成蛋白互作網(wǎng)絡(luò),這些共同提示著EMs與不孕癥在基因組學(xué)與蛋白質(zhì)組學(xué)層面有著密切的關(guān)聯(lián)。兩類疾病的共有通路主要集中在生殖結(jié)構(gòu)發(fā)育、細胞因子介導(dǎo)的信號通路、癌癥相關(guān)通路、細胞增殖負調(diào)控、類固醇代謝過程等,與所有模塊最相關(guān)的三大通路為凋亡信號通路、癌癥相關(guān)通路、細胞對激素刺激的反應(yīng)。選取目前已有一定研究基礎(chǔ)的部分機制查找文獻,進一步理解EMs、不孕癥兩類疾病的共性。
由上述結(jié)果分析可知,癌癥相關(guān)通路可能在EMs、不孕癥兩類疾病的發(fā)病機制中伴有重要角色。其中,抑癌基因TP53參與EMs、不孕癥共有基因所構(gòu)建的蛋白互作網(wǎng)絡(luò),在細胞周期調(diào)控、基因組穩(wěn)定性維持、誘導(dǎo)細胞分化和凋亡中都有重要的作用。研究表明,特定的TP53基因多態(tài)性與不孕癥、EMs均有關(guān),并與不孕癥婦女中的卵泡刺激素/黃體生成素比值(FSH/LH)顯著相關(guān)[9-11]。而在蛋白質(zhì)組學(xué)層面,MCODE 1中PD-1信號通路亦可能是疾病的共同相關(guān)發(fā)病機制。近年來,抗PD-1治療在癌癥中的治療作用得到廣泛研究。但新近研究表明,運用免疫檢查點PD-1/PD-L1抑制劑治療腫瘤可能影響內(nèi)分泌功能,存在促性腺激素分泌不足等副作用[12]。國外學(xué)者曾研究PD-1和PD-L1與EMs相關(guān)的不孕癥之間的關(guān)聯(lián),發(fā)現(xiàn)88例腹腔鏡手術(shù)患者血清和腹腔液中PD-1和PD-L1的表達與非EMs對照組之間具有差異性(P<0.05),提出血清sPD-L1可將EMs相關(guān)的不孕癥區(qū)別于其他病理對照組[13]。
除了癌癥相關(guān)通路之外,基因富集的結(jié)果亦顯示兩類疾病的共同基因參與了活性氧代謝過程。EMs患者體內(nèi)存在氧化與抗氧化系統(tǒng)的失衡、氧化標記物數(shù)量的增加,缺氧相關(guān)調(diào)控網(wǎng)絡(luò)可使子宮內(nèi)膜異位細胞進化出包括類固醇生成、血管生成、炎癥和代謝轉(zhuǎn)換等生存模式,使其在腹膜微環(huán)境得以生存[14]。而不明原因不孕癥患者的腹腔液中可見活性氧高水平表達,抗氧化酶谷胱甘肽含量下降,脂質(zhì)過氧化標志物丙二醛明顯高于抗氧化物含量[15]。一項病例對照研究表明,中重度EMs不孕婦女卵丘細胞中超氧化物歧化酶1基因高表達[16]。另一項臨床試驗初步結(jié)果提示,抗氧化劑己酮可可堿可提高EMs不孕婦女腹腔鏡術(shù)后6個月的總?cè)焉锫蔥17]。在氧化代謝過程中,細胞色素P450屬于單加氧酶的一類,參與了生物體內(nèi)的甾體類激素合成過程,值得重點關(guān)注。在MCODE 4中,主要為CYP家族相關(guān)基因,相關(guān)蛋白富集分析獲得結(jié)果為細胞色素P450共同參與兩類疾病的發(fā)病。研究表明,非經(jīng)典的細胞色素P450氧化還原酶缺乏癥與女性不孕癥密切相關(guān)[18]。CYP19基因編碼的芳香化酶細胞色素P450是催化卵巢雌激素生物合成中的關(guān)鍵步驟,CYP19A1表達強度與EMs相關(guān)[19]。同時,在中國女性中CYP19 rs700518AA基因型賦予與EMs相關(guān)的不孕癥的遺傳易感性,其機制可能是異位子宮內(nèi)膜的CYP19基因所表達的芳香化酶影響排卵,從而導(dǎo)致不孕[20]。
根據(jù)在基因組學(xué)與蛋白質(zhì)組學(xué)層面的生物信息學(xué)分析,EMs與不孕癥存在范圍廣、層次多的復(fù)雜關(guān)聯(lián),由富集分析而來的發(fā)病機制部分已得到文獻證實,但仍有許多靶點與信號通路尚需得到進一步實驗證明。通過數(shù)據(jù)庫整合獲得的EMs與不孕癥共有基因與通路,有利于更全面地研究兩類疾病的關(guān)聯(lián),可能成為未來治療兩類疾病的共同藥物的潛在靶點。同時,富集結(jié)果提示類固醇代謝過程、硫氨基酸代謝過程、活性氧代謝過程等均參與兩類疾病的發(fā)病過程,但本研究由于缺乏相關(guān)疾病代謝組學(xué)相關(guān)數(shù)據(jù)庫,因此,兩類疾病在代謝組學(xué)層面之間的關(guān)聯(lián)仍需要在未來通過實驗進一步探索與驗證,以期更加精準地進行臨床治療。