仲紅艷,唐珊,趙飛飛,王大新
肺動脈高壓是一種嚴(yán)重的致命性疾病,其可能是特發(fā)性的,也可能是先天性心臟病、自身免疫病、感染等疾病的最終結(jié)果[1],不管病因為何,病理特征都是肺血管重構(gòu),隨后右心室重構(gòu),如果無有效治療措施,最終可致右心衰竭和死亡[2]。據(jù)估計,全球目前約1%的人口患有肺動脈高壓,在65歲以上的人群中,這一比例高達(dá)10%[3],且在女性中更為流行,男女比例約為1:4[4]。隨著規(guī)范的臨床診療,患者5年生存率已提高到50%~60%[5]。但由于肺動脈高壓分子機制尚不清楚,目前的治療方案通常側(cè)重于緩解癥狀,而不是干預(yù)疾病進(jìn)展。最近幾年,隨著基因測序技術(shù)的發(fā)展,產(chǎn)生了大量的基因信息,肺動脈高壓作為常見重大疾病之一,其基因芯片數(shù)據(jù)的發(fā)展已成為研究新趨勢和熱點。因此,本研究利用信使RNA(mRNA)和微小RNA(microRNA)表達(dá)譜數(shù)據(jù)集來識別肺動脈高壓發(fā)生的關(guān)鍵基因和重要通路,并構(gòu)建microRNA-mRNA網(wǎng)絡(luò),從基因?qū)用娣治龇蝿用}高壓發(fā)生的潛在分子機制,為探索肺動脈高壓治療提供一些新思路。
從美國國立生物中心的基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO)(www.ncbi.nlm.nih.gov/geo)中獲取2個mRNA表達(dá)譜數(shù)據(jù)集GSE113439、GSE117261和1個microRNA表達(dá)譜數(shù)據(jù)集GSE67597,樣本均來源于人肺組織,各個數(shù)據(jù)集的特征見表1。
表1 各數(shù)據(jù)集特征
用R軟件中的“sva”包去除2個mRNA數(shù)據(jù)集批間差后通過“l(fā)imma”包進(jìn)行差異表達(dá)分析,最后以P<0.05和|log2FC | >0.5(“FC”表示差異表達(dá)倍數(shù))為閾值篩選出mRNA數(shù)據(jù)集中的差異表達(dá)基因,另外,用GEO2R在線分析工具處理microRNA數(shù)據(jù)集,以P<0.05和|log2FC | >1為閾值篩選出差異表達(dá)的microRNA。
通過DAVID 6.8在線數(shù)據(jù)庫對差異基因進(jìn)行基因本體論(Gene Ontology, GO)和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析,且GO和KEGG各項以P<0.05為篩選條件。STRING在線數(shù)據(jù)庫構(gòu)建蛋白之間相互作用可視化網(wǎng)絡(luò)圖(PPI),TargetScan在線數(shù)據(jù)庫預(yù)測差異microRNA靶基因,Cytoscape 3.6.1軟件獲取關(guān)鍵基因、關(guān)鍵模塊和構(gòu)建microRNA-mRNA網(wǎng)絡(luò)。
mRNA數(shù)據(jù)集(GSE113439和GSE117261)共包含73個肺動脈高壓樣本和36個正常肺組織樣本。通過R軟件的“sva”包去除批間差(圖1),用“l(fā)imma”包進(jìn)行差異表達(dá)分析,并以P<0.05和|log2FC |>0.5為篩選條件,發(fā)現(xiàn)與正常肺組織相比,肺動脈高壓患者肺組織中有226個基因存在差異表達(dá),其中141個為上調(diào)基因,85個為下調(diào)基因,對這些差異基因做聚類分析,見火山圖(圖2)。另外,microRNA數(shù)據(jù)集(GSE67597)中包含7個肺動脈高壓樣本和8個正常肺組織樣本。利用GEO2R在線分析工具從microRNA表達(dá)譜數(shù)據(jù)集中獲得29個差異表達(dá)microRNA,其中17個表達(dá)上調(diào),12個表達(dá)下調(diào)。
圖2 226個差異基因的火山圖
226個差異基因GO分析包含生物學(xué)過程、細(xì)胞定位、分子功能三部分。這些基因涉及的生物學(xué)過程主要有炎癥反應(yīng)、細(xì)胞趨化、細(xì)胞增殖、黏附等;基因主要位于細(xì)胞外基質(zhì)、細(xì)胞外間隙、質(zhì)膜等;分子功能主要是肝素結(jié)合、整合素結(jié)合、碳水化合物結(jié)合、轉(zhuǎn)運活性、趨化活性等。KEGG富集結(jié)果顯示這些基因主要參與造血細(xì)胞系、性別、錐蟲病、葡萄球菌感染等方面的信號通路。
表2 226個差異基因生物學(xué)過程的GO分析結(jié)果
表3 226個差異基因細(xì)胞定位的GO分析結(jié)果
表4 226個差異基因分子功能的GO分析結(jié)果
表5 226個差異基因KEGG富集分析結(jié)果
將226個差異基因?qū)隨TRING在線數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),利用Cytoscape 3.6.1軟件中的cytoHubba插件對 PPI 網(wǎng)絡(luò)圖中的基因用Degree算法進(jìn)行篩選。如圖3所示,圓圈顏色越深,代表其度值(degree)越大,本研究以度值排名前十的基因作為關(guān)鍵基因,分別為HGF(degree=23)、KIT(degree=24)、VCAM1(degree=29)、CXCL12(degree=30)、ITGAM(degree=47)、FPR1(degree=26)、CXCL9(degree=24)、CXCR1(degree=24)、TLR8(degree=35)、CXCR2(degree=23)。應(yīng)用Cytoscape 3.6.1中的MCODE插件發(fā)現(xiàn)PPI網(wǎng)絡(luò)圖中有一個顯著簇集的模塊(圖4),圖4B模塊中包括12個基因,66個邊。將模塊基因進(jìn)行GO和KEGG分析,發(fā)現(xiàn)其生物過程涉及細(xì)胞趨化、炎癥反應(yīng)、免疫反應(yīng)、血管內(nèi)皮生長因子的產(chǎn)生、血管生成,模塊基因主要位于高密度脂蛋白粒子、細(xì)胞外間隙,KEGG通路涉及趨化因子信號通路、受體相互作用、金黃色葡萄球菌感染、補體系統(tǒng)。
圖3 226個差異基因的PPI網(wǎng)絡(luò)
由于microRNA可促進(jìn)其靶mRNA降解或抑制翻譯,在轉(zhuǎn)錄后水平調(diào)控基因表達(dá),所以用TargetScan數(shù)據(jù)庫分開預(yù)測上調(diào)和下調(diào)的差異microRNA靶基因,并分開與差異基因取交集。結(jié)果顯示,17個表達(dá)上調(diào)的microRNA預(yù)測靶基因11 404個,與前述85個表達(dá)下調(diào)的差異基因取交集后得到37個下調(diào)差異靶基因,如圖5A所示。12個表達(dá)下調(diào)的microRNA預(yù)測靶基因13 679個,與前述141個表達(dá)上調(diào)的差異基因取交集后得到106個上調(diào)差異靶基因,如圖6A所示。將這143個差異靶基因做GO和KEGG分析,發(fā)現(xiàn)其主要參與炎癥反應(yīng)、細(xì)胞趨化等生物學(xué)過程,涉及的通路主要是趨化因子信號通路、Rap1信號通路等。利用Cytoscape 3.6.1軟件構(gòu)建差異microRNA-mRNA網(wǎng)絡(luò)圖,如圖5B、6B所示,網(wǎng)絡(luò)中共有22個microRNA,用degree算法篩選,將度值排名前五的microRNA定為關(guān)鍵microRNA,分別為 hsa-miR-656(degree=52)、hsa-miR-4693-5p(degree=41)、hsa-miR-1253(degree=39)、hsamiR-4704(degree=37)和hsa-miR-302f(degree=34)。DAVID 6.8在線分析這5個關(guān)鍵microRNA對應(yīng)的差異靶基因,發(fā)現(xiàn)其主要參與細(xì)胞增殖、血管生成、炎癥反應(yīng)等過程,涉及的通路主要是腎素-血管緊張素系統(tǒng)、造血細(xì)胞系、磷脂酰肌醇-3-激酶/蛋白激酶 B(PI3K/Akt)、Ras相關(guān)蛋白 1(Rap1) 信號通路等。
圖5 上調(diào)差異microRNA-mRNA網(wǎng)絡(luò)
圖6 下調(diào)差異microRNA-mRNA網(wǎng)絡(luò)
肺動脈高壓是進(jìn)展性難治性疾病,現(xiàn)有治療方法不能完全逆轉(zhuǎn)病理重塑,且尚未完全清楚發(fā)病機制,因此與肺動脈高壓相關(guān)的重要基因和通路有待進(jìn)一步發(fā)現(xiàn)。本研究分析mRNA和microRNA表達(dá)譜,分別獲得226個差異基因(141個上調(diào),85個下調(diào))和29個差異microRNA(17個上調(diào),12個下調(diào)),這說明肺動脈高壓發(fā)病機制復(fù)雜,是多個基因相互作用的結(jié)果。為進(jìn)一步了解這些基因在肺動脈高壓中的作用,本研究對差異基因、PPI網(wǎng)絡(luò)中顯著簇集的模塊基因、microRNA-mRNA網(wǎng)絡(luò)中差異靶基因分別進(jìn)行GO和KEGG富集分析,發(fā)現(xiàn)生物過程主要涉及細(xì)胞增殖、細(xì)胞趨化、炎癥反應(yīng),這與已有研究報道一致,肺血管平滑肌細(xì)胞異常增殖,導(dǎo)致內(nèi)膜增厚、血管順應(yīng)性喪失,使血管腔變窄,阻礙血液流動,肺動脈壓升高。有研究表明趨化因子水平與肺血流動力學(xué)、右心室功能相關(guān),趨化因子也參與肺血管重構(gòu)過程,如促進(jìn)細(xì)胞增殖、遷移等[6]。炎癥研究也越來越受青睞,有報道肺動脈周圍有大量炎性細(xì)胞浸潤,炎性細(xì)胞可釋放各種細(xì)胞因子和趨化因子,導(dǎo)致內(nèi)皮細(xì)胞凋亡,平滑肌細(xì)胞增殖,促進(jìn)肺血管重構(gòu),且肺動脈高壓患者免疫力低下,炎癥容易誘發(fā)肺動脈高壓加重[7],所以靶向抗炎可能是治療肺動脈高壓新方向[8-10]。
根據(jù)PPI網(wǎng)絡(luò)中度值大小識別出HGF、KIT、VCAM1、CXCL12、ITGAM、FPR1、CXCL9、CXCR1、TLR8、CXCR2這10個關(guān)鍵基因。HGF具有刺激肺血管內(nèi)皮細(xì)胞增殖、促進(jìn)新生血管形成作用[11],利用基因轉(zhuǎn)染HGF干預(yù)肺動脈高壓動物模型,發(fā)現(xiàn)HGF能降低肺動脈壓力從而改善肺動脈高壓[12]。KIT編碼的一種Ⅲ型受體酪氨酸激酶,與其受體結(jié)合后磷酸化,參與調(diào)節(jié)細(xì)胞增殖、凋亡、趨化和細(xì)胞分化[13],KIT突變有嚴(yán)重的致癌作用,如胃腸道間質(zhì)瘤、黑色素瘤、急性髓細(xì)胞白血病等[14]。VCAM1編碼由促炎細(xì)胞因子誘導(dǎo)的黏附分子,有研究報道系統(tǒng)性硬化癥合并肺動脈高壓(lSSc-PAH)中VCAM1升高[15],但不能作為lSSc-PAH特異性診斷標(biāo)志物[16]。CXCL9、CXCL12屬于趨化因子中CXC亞家族,研究表明CXCL9與心臟重構(gòu)相關(guān)[17],血中CXCL12水平升高與特發(fā)性肺動脈高壓患者右心室功能障礙有關(guān)[18],利用CXCL12中和作用可減輕肺部巨噬細(xì)胞浸潤,從而改善大鼠肺動脈高壓[19]。CXCR屬于趨化因子受體家族,趨化因子受體和配體結(jié)合發(fā)揮重要生物學(xué)功能,例如CXCL8是CXCR1和CXCR2的共同配體,靶向過表達(dá)CXCL8受體(即CXCR1和CXCR2)的肺動脈內(nèi)皮細(xì)胞,可通過阻斷炎癥細(xì)胞聚集而減輕肺動脈高壓[20]。CXCL12是CXCR4的特異性配體,CXCL12-CXCR4軸參與多種組織的病理過程,缺乏CXCL12或CXCR4的小鼠不能存活,而且有神經(jīng)、血管、心臟方面的發(fā)育缺陷[21]。ITGAM基因編碼CD11b,與系統(tǒng)性紅斑狼瘡易感性有關(guān),調(diào)節(jié)白細(xì)胞活化、遷移、黏附[22]。FPR1對血管系統(tǒng)的動態(tài)可塑性有重要意義[23],抑制FPR1能減輕肺部炎癥和缺氧再灌注心肌損傷[24]。TLR8屬于Toll樣受體家族,TLR8激動劑有顯著的抗腫瘤效應(yīng)[25]。綜上,HGF、VCAM1等6個關(guān)鍵基因已報道與肺動脈高壓發(fā)生發(fā)展相關(guān),KIT、ITGAM、FPR1、TLR8這4個關(guān)鍵基因目前在肺動脈高壓中尚無具體研究,但也可能是潛在治療靶點,需進(jìn)一步研究。
microRNA是一種小的非編碼RNA,研究發(fā)現(xiàn)microRNA失調(diào)與肺動脈高壓的嚴(yán)重程度和預(yù)后相關(guān),本研究從microRNA-mRNA網(wǎng)絡(luò)中識別出hsamiR-656、hsa-miR-4693-5p、hsa-miR-1253、hsamiR-4704和hsa-miR-302f這5個關(guān)鍵microRNA。一項薈萃分析報道m(xù)iR-656與多種癌癥預(yù)后相關(guān)[26],研究發(fā)現(xiàn)長鏈非編碼RNA NORAD通過吸附miR-656促進(jìn)非小細(xì)胞肺癌的發(fā)生發(fā)展[27]。miR-1253通過靶向WNT5A抑制非小細(xì)胞肺癌細(xì)胞增殖和轉(zhuǎn)移,可能是治療非小細(xì)胞肺癌的治療靶點[28]。另外,KIT、VCAM1和CXCL9這三個關(guān)鍵基因是miR-4693-5p靶基因,CXCL9、CXCL12和VCAM1也分別是miR-1253、miR-4704和miR-302f的靶基因。雖然目前尚無這5個關(guān)鍵microRNA在肺動脈高壓中的具體研究,但其GO分析提示可能參與發(fā)病機制,這為以后的研究提供一些參考。
本研究尚有不足之處,首先,這些在肺動脈高壓組中差異表達(dá)的基因,尤其是關(guān)鍵基因和關(guān)鍵microRNA,需要通過細(xì)胞實驗和臨床樣本進(jìn)一步驗證。其次,這些差異表達(dá)基因和差異 microRNA分別是從不同患者肺組織樣本中篩選,所以結(jié)果會因樣本的不同而影響??傊?,本研究結(jié)果除了揭示肺動脈高壓發(fā)生發(fā)展過程中涉及的關(guān)鍵基因和通路及以生物信息學(xué)方法驗證已有研究,也為探索新的治療策略提供了一定的理論依據(jù)。
利益沖突:所有作者均聲明不存在利益沖突