尤紅俊,趙倩倩,任淑婷,壽錫凌,常鳳軍*
(1 陜西省人民醫(yī)院心血管內(nèi)科,西安 710068;2 空軍軍醫(yī)大學(xué)第一附屬醫(yī)院臨床免疫科;3 西安交通大學(xué)醫(yī)學(xué)部基礎(chǔ)醫(yī)學(xué)院;*通訊作者,E-mail:mss0392@126.com)
擴張型心肌病(dilated cardiomyopathy, DCM)是導(dǎo)致心力衰竭的主要原因之一,是心肌對多種遺傳和/或環(huán)境因素共同反應(yīng)的一種非特異性的疾病表型。該病好發(fā)于年輕人,是心臟移植最常見的指征之一[1]。雖然新型抗心衰藥物及器械治療措施更新迭代大大降低了DCM的病死率[2,3],但其預(yù)后仍較差,造成嚴(yán)重的社會經(jīng)濟學(xué)問題。其發(fā)病機制涉及病毒感染、免疫、代謝/內(nèi)分泌、遺傳和環(huán)境毒物接觸等多方面[4],且尚未完全闡明,因此探討其發(fā)病機制對臨床診療提升具有積極的推動作用。
隨著生物大數(shù)據(jù)及信息學(xué)技術(shù)的蓬勃發(fā)展,科研工作者可以便捷運用共享的海量生物樣本數(shù)據(jù)庫對疾病發(fā)病機制進一步深入探討,促進臨床診療水平的提升。本研究基于基因表達綜合數(shù)據(jù)庫(gene expression omnibus, GEO)中的大樣本量DCM表達譜芯片數(shù)據(jù),應(yīng)用生物信息學(xué)手段,尋找疾病差異表達基因(differentially expressed genes, DEGs)和核心(hub)基因,構(gòu)建蛋白質(zhì)相互作用(protein-protein interaction, PPI)網(wǎng)絡(luò),標(biāo)記基因功能,利用比較毒理基因組學(xué)數(shù)據(jù)庫(comparative toxicogenomics database, CTD)評估hub基因與DCM及心衰關(guān)聯(lián)性等,探索DCM的發(fā)病機制,從而為臨床診療提供思路。
在美國國立生物中心的GEO數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/ GEO)[5,6]中搜索“dilated cardiomyopathy”,選取大樣本量數(shù)據(jù)集GSE141910,該數(shù)據(jù)集采用GPL16791 Illumina HiSeq 2500為平臺,收錄包括擴張型心肌病、圍產(chǎn)期心肌病、肥厚型心肌病和正常人心肌組織基因表達譜數(shù)據(jù)。我們從中提取166例擴張型心肌病和166例正常人的左心室組織轉(zhuǎn)錄組數(shù)據(jù)進行分析。數(shù)據(jù)進行預(yù)處理,包括對缺失值自動補全或基因?qū)?yīng)多個探針取均值,及背景校正、標(biāo)準(zhǔn)化等。
采用統(tǒng)計軟件R語言(版本4.1.1)limma包進行差異基因表達分析。以|log fold change|≥1,P<0.05為差異表達基因的篩選條件,并以R語言繪制熱圖可視化DEGs。
將DEGs導(dǎo)入STRING(Search Tool for the Retrieval of Interacting Genes, http://string-db.org/cgi/input.pl),進行蛋白質(zhì)相互作用(protein-protein interaction,PPI)分析,得到PPI網(wǎng)絡(luò)[7]。設(shè)定可信度confidence為0.4,輸出TSV格式文件,用于后續(xù)Cytoscape分析[8]。
使用Cytoscape 3.7.3軟件插件CytoHubba(http://hub.iis.sinica.edu.tw/cytohubba/)篩選出PPI網(wǎng)絡(luò)中的核心(hub)基因。CytoHubba利用12種評分策略剖析PPI網(wǎng)絡(luò),包括最大相關(guān)性標(biāo)準(zhǔn)(maximum correlation criterion,MCC)、Degree等,該12種拓?fù)渌惴o優(yōu)劣之分[9]。MCC代表基因/蛋白間最大相關(guān)性標(biāo)準(zhǔn),我們以MCC值排序前20位的基因作為PPI網(wǎng)絡(luò)中的hub基因。
使用R語言對DEGs和hub基因進行基因本體論(gene ontology, GO, http://www.geneontology.org)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes, KEGG)通路富集分析[10,11]。GO富集分析,分別在生物學(xué)過程(biological processes, BP)、細(xì)胞組分(cellular component, CC)和分子功能(molecular function, MF)3個方面對基因進行功能注釋[12]。KEGG分析展示基因參與的信號通路。利用R語言將結(jié)果可視化。P<0.05被認(rèn)為差異有統(tǒng)計學(xué)意義。
利用CTD數(shù)據(jù)庫(http://ctdbase.org/)的數(shù)據(jù)分析核心基因與DCM及心衰(收縮性)風(fēng)險之間的關(guān)系。CTD整合了包括化合物-基因/蛋白質(zhì)相互作用、化合物-疾病和基因-疾病關(guān)系在內(nèi)的信息,以探索與疾病發(fā)病機制相關(guān)的假設(shè)[13]。
與正常對照相比,DCM心肌組織中共有784個DEGs,其中541個表達上調(diào),243個表達下調(diào)。差異基因表達譜的火山圖見圖1。對差異表達處于前100位的基因繪制熱圖以可視化,結(jié)果見圖2。
每個圓點代表一個基因,部分基因名稱已備注;紅色表示上調(diào)基因;綠色表示下調(diào)基因;黑色為無統(tǒng)計學(xué)差異圖1 擴張型心肌病和正常人左心室組織轉(zhuǎn)錄組數(shù)據(jù)差異基因表達譜的火山圖Figure 1 Volcano map of differential gene expression profiles of left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls
Con:正常對照;Treat:擴張型心肌病;紅色表示上調(diào)基因;綠色表示下調(diào)基因;顏色深淺代表顯著性高低圖2 擴張型心肌病和正常人左心室組織轉(zhuǎn)錄組數(shù)據(jù)差異表達前100基因表達譜熱圖Figure 2 Heatmap of top 100 differential gene expression profiles of left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls
GO富集分析提示DEGs主要參與構(gòu)成細(xì)胞外的結(jié)構(gòu)及基質(zhì)、細(xì)胞質(zhì)膜外側(cè)面,并參與免疫細(xì)胞遷移及活化等生物學(xué)過程或分子功能(見圖3)。
GeneRatio:富集基因數(shù)目/背景基因數(shù)目;Counts:富集基因數(shù)目;p.adjust:校正后的P值;BP:生物學(xué)過程;CC:細(xì)胞組分;MF:分子功能圖3 DEGs GO富集分析部分可視化(氣泡圖)Figure 3 Partial visualization for GO enrichment analysis of DEGs(bubble diagram)
KEGG富集分析提示DEGs顯著富集于細(xì)胞因子-細(xì)胞因子受體相互作用、吞噬體、腎素-血管緊張素系統(tǒng)、細(xì)胞外基質(zhì)受體相互作用、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性、細(xì)胞黏附分子和Th17細(xì)胞分化等信號通路中(見圖4)。
GeneRatio:富集基因數(shù)目/背景基因數(shù)目;Counts:富集基因數(shù)目;p.adjust:校正后的P值圖4 DEGs KEGG富集分析部分可視化氣泡圖Figure 4 Partial visualization for KEGG enrichment analysis of DEGs (bubble diagram)
對784個DEGs進行PPI網(wǎng)絡(luò)分析,將離散節(jié)點隱去后,所構(gòu)建的初始PPI網(wǎng)絡(luò)中節(jié)點(蛋白)數(shù)為775,邊數(shù)(蛋白互作關(guān)系)為3 186,平均節(jié)點度值為8.22,PPI富集P<0.001。輸出TSV格式文件并導(dǎo)入Cytoscape軟件,以CytoHubba插件進行拓?fù)溆嬎?,取MCC排名前20的基因作為hub基因,即:FCGR3A、CD27、CD2、GZMB、PRF1、CCR7、CD247、SELL、TBX21、FCGR3B、ITGAL、LCK、IL10、IL2RB、CD38、CD40LG、CD5、CD3E、KLRB1和ZAP70(見圖5),亮色標(biāo)記的節(jié)點即為hub基因,顏色深淺代表MCC值的大小。20個核心基因的差異分析檢驗數(shù)據(jù)見表1。
色彩鮮明的節(jié)點為20個核心基因,顏色深淺代表MCC值高低;左圖:PPI網(wǎng)絡(luò);右圖:MCC值排名前20的基因構(gòu)建的子網(wǎng)絡(luò)圖5 擴張型心肌病差異表達基因構(gòu)成的PPI網(wǎng)絡(luò)中鑒定核心基因Figure 5 Identification of hub genes from the PPIs network of DEGs for DCM
表1 擴張型心肌病和正常人左心室組織轉(zhuǎn)錄組數(shù)據(jù)核心基因差異表達分析Table 1 Difference analysis of hub genes expression in left ventricular tissue transcriptome data from dilated cardiomyopathy patients and normal controls
對hub基因富集分析,其中最顯著富集的GO子集包括:白細(xì)胞黏附、免疫細(xì)胞活化調(diào)節(jié);細(xì)胞質(zhì)膜外側(cè)面、質(zhì)膜受體復(fù)合物;免疫球蛋白結(jié)合等(見圖6)。
KEGG富集分析發(fā)現(xiàn),它們主要參與自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性、Th1/Th2/Th17細(xì)胞分化、T細(xì)胞受體信號通路、病毒性心肌炎、細(xì)胞黏附分子、細(xì)胞因子-細(xì)胞因子受體相互作用和NF-kappa B信號通路等(見圖7)。
核心基因與DCM和心衰(收縮性)的相互作用關(guān)聯(lián)性評分分析提示,11個核心基因IL10、CD38、SELL、LCK、CD27、GZMB、TBX21、ZAP70、CD5、CD3E和CD2同時與DCM及心衰關(guān)聯(lián)緊密(見圖8)。提示核心基因與DCM/心衰(收縮性)關(guān)聯(lián)性得分情況,得分越高,關(guān)聯(lián)性越大。
GeneRatio:富集基因數(shù)目/背景基因數(shù)目;Counts:富集基因數(shù)目;p.adjust:校正后的P值;BP:生物學(xué)過程;CC:細(xì)胞組分;MF:分子功能圖6 擴張型心肌病核心基因GO富集分析部分可視化 (氣泡圖)Figure 6 Partial visualization for GO enrichment analysis of hub genes for DCM (bubble diagram)
GeneRatio:富集基因數(shù)目/背景基因數(shù)目;Counts:富集基因數(shù)目;p.adjust:校正后的P值圖7 擴張型心肌病核心基因KEGG富集分析可視化 (氣泡圖)Figure 7 Visualization for KEGG enrichment analysis of hub genes for DCM (bubble diagram)
圖8 核心基因與心衰(收縮性)及DCM關(guān)聯(lián)性分析Figure 8 Correlation analysis between hub genes and heart failure(systolic) and DCM
DCM的病理特征是左心室擴張和收縮功能障礙,可并發(fā)心律失常、血栓栓塞或心源性休克等。以往研究提示DCM通常由心肌炎、酒精/藥物/毒素接觸、代謝或內(nèi)分泌紊亂和遺傳等多因素引起[14,15]。由編碼細(xì)胞骨架、肌節(jié)或核膜蛋白的基因突變引起的DCM約占所有病例的35%[15],因而基因/蛋白水平分子機制研究將提升對DCM病理生理學(xué)的認(rèn)知。本研究基于GEO數(shù)據(jù)庫來源的大樣本量DCM心肌組織芯片數(shù)據(jù),篩選DEGs,構(gòu)建PPI網(wǎng)絡(luò),鑒定核心基因,通過GO和KEGG分析,利用CTD數(shù)據(jù)庫評估核心基因與DCM及心衰關(guān)聯(lián)性,探討DCM發(fā)病機制,為臨床診療提供依據(jù)。
首先,本研究發(fā)現(xiàn)DCM心肌組織中共有784個DEGs,主要參與細(xì)胞外結(jié)構(gòu)及基質(zhì)組成、免疫細(xì)胞遷移及活化;含膠原的細(xì)胞外基質(zhì)、質(zhì)膜外側(cè)面;細(xì)胞外基質(zhì)結(jié)構(gòu)成分、黏多糖結(jié)合等。KEGG富集分析提示DEGs主要參與細(xì)胞因子-細(xì)胞因子受體相互作用、吞噬體、腎素-血管緊張素系統(tǒng)(renin-angiotensin system, RAS)、細(xì)胞外基質(zhì)受體相互作用、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性、細(xì)胞黏附分子和Th17細(xì)胞分化等。DCM與心肌及間質(zhì)急慢性炎癥相關(guān),免疫細(xì)胞及其調(diào)控過程貫穿疾病始末,包括白細(xì)胞遷移、黏附、活化及分泌等生物學(xué)過程,并涉及細(xì)胞外基質(zhì)的重塑,GO及KEGG富集結(jié)果與之符合。細(xì)胞因子及其受體是正常免疫及病毒性心肌炎等多種病理生理過程中白細(xì)胞募集的關(guān)鍵調(diào)節(jié)因子,參與免疫反應(yīng)、心臟纖維化及重塑[16]。RAS在各種心力衰竭病理進程中扮演重要角色,早期發(fā)揮代償彌補有效循環(huán)血容量不足,后期推動心臟結(jié)構(gòu)重塑惡化心功能。如血管緊張素Ⅱ已被證明可以激活TGF-β和IL-11,參與了DCM心肌重構(gòu),并與細(xì)胞外基質(zhì)蛋白的表達、心肌纖維化密切相關(guān)[17,18]。研究表明,Th17細(xì)胞分化及分泌IL-17參與心肌炎向心肌病的轉(zhuǎn)歸,在心肌炎發(fā)生后用抗IL-17A單克隆抗體治療心肌炎模型小鼠可消除炎癥誘導(dǎo)的心臟纖維化并改善心功能,揭示IL-17A在心肌炎后心臟重塑和發(fā)展為DCM中起著關(guān)鍵作用,可作為炎性擴張型心肌病的潛在治療靶點[19]。
為了進一步剖析差異基因在DCM發(fā)病機制中的作用,我們構(gòu)建PPI網(wǎng)絡(luò),并利用生物信息學(xué)方法篩選出核心基因,即FCGR3A、CD27、CD2、GZMB、PRF1、CCR7、CD247、SELL、TBX21、FCGR3B、ITGAL、LCK、IL10、IL2RB、CD38、CD40LG、CD5、CD3E、KLRB1和ZAP70。核心基因顯著富集于白細(xì)胞黏附、免疫細(xì)胞活化調(diào)節(jié);細(xì)胞質(zhì)膜外側(cè)面、質(zhì)膜受體復(fù)合物;免疫球蛋白結(jié)合等GO子集中。KEGG富集分析發(fā)現(xiàn),它們主要參與自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性、Th1/Th2/Th17細(xì)胞分化、T細(xì)胞受體信號通路、病毒性心肌炎、細(xì)胞黏附分子、細(xì)胞因子-細(xì)胞因子受體相互作用和NF-kappa B信號通路等。在柯薩奇病毒B3誘導(dǎo)的心肌炎小鼠模型中,Th1免疫應(yīng)答一方面會增加急性炎癥反應(yīng)程度,另一方面也可通過減少病毒復(fù)制及抑制Th2反應(yīng)防止進展為慢性炎癥及DCM;Th2免疫反應(yīng)通過調(diào)節(jié)性T細(xì)胞和抗炎細(xì)胞因子抑制Th1反應(yīng)來削弱急性心肌炎,但也會誘導(dǎo)慢性心肌炎/DCM心臟的重構(gòu);心肌炎急慢性進程中Th17細(xì)胞反應(yīng)也參與DCM的重構(gòu)[20]。這些提示輔助性T細(xì)胞(Th1/Th2/Th17)在心肌炎/心肌病發(fā)生發(fā)展中有著不容忽視且錯綜復(fù)雜的作用。NF-kappa B信號通路是經(jīng)典的炎癥反應(yīng)通路,在多種炎性疾病中扮演重要角色。Pang等[21]研究發(fā)現(xiàn)轉(zhuǎn)化生長因子β結(jié)合蛋白2沉默可通過下調(diào)NF-kappa B信號通路減輕DCM大鼠心肌氧化應(yīng)激損傷、心肌纖維化和心肌重構(gòu)。Hub基因富集的其余相關(guān)通路及GO子集大多與DEGs富集分析結(jié)果相吻合,提示這些hub基因可能在DCM致病過程復(fù)雜調(diào)控網(wǎng)絡(luò)中發(fā)揮作用。
免疫球蛋白γ Fc區(qū)受體Ⅲ-A/B(immunoglobulin gamma Fc region receptor Ⅲ-A/B,F(xiàn)CGR3A/B),即CD16A/B,作為免疫球蛋白IgG Fc區(qū)受體,介導(dǎo)抗體依賴性細(xì)胞毒性和其他抗體依賴性反應(yīng)如吞噬作用等,也是單核細(xì)胞亞群分型標(biāo)志物之一;而外周單核細(xì)胞亞群CD14++CD16-(經(jīng)典型)、CD14++CD16+(中間型)和CD14+CD16++(非經(jīng)典型)的比率動態(tài)變化與心衰病情轉(zhuǎn)歸密切相關(guān)[22,23]。Hub基因富集分析發(fā)現(xiàn),下調(diào)的FCGR3A富集于胞質(zhì)外側(cè)面構(gòu)成、免疫球蛋白結(jié)合、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性等生物過程,提示免疫介導(dǎo)的細(xì)胞毒性作用在DCM發(fā)展中起作用。顆粒酶B(granzyme B,GZMB),細(xì)胞毒性T細(xì)胞和自然殺傷細(xì)胞胞質(zhì)顆粒中含有的一種絲氨酸蛋白酶,參與細(xì)胞介導(dǎo)的細(xì)胞毒性,當(dāng)被遞送到靶細(xì)胞時會激活不依賴于半胱天冬酶的細(xì)胞焦亡和死亡;參與炎癥性疾病的凋亡、炎癥反應(yīng)、細(xì)胞外基質(zhì)重塑和纖維化等[24]。Shen等[25]研究報道,GZMB在人纖維化心肌組織和血管緊張素Ⅱ誘導(dǎo)的小鼠纖維化心臟中均表達上調(diào),其可促進心肌組織基質(zhì)重塑和纖維化,而GZMB缺陷對心臟纖維化是一種保護因素。穿孔素(perforin-1,PRF1),在分泌性顆粒依賴性細(xì)胞死亡和防御病毒感染或腫瘤細(xì)胞中起關(guān)鍵作用,可協(xié)作GZMB發(fā)揮細(xì)胞毒性作用,其與DCM及心衰的研究尚未見報道。T細(xì)胞表面糖蛋白CD3 zeta鏈(T-cell surface glycoprotein CD3 zeta chain,CD247),存在于T淋巴細(xì)胞細(xì)胞表面,在適應(yīng)性免疫反應(yīng)中起重要作用;有研究者報道CD247和非受體酪氨酸蛋白激酶(tyrosine-protein kinase Lck,LCK)可能是心肌壞死的生物標(biāo)志物[26]。LCK及CD27、CD2、C-C趨化因子受體7型(C-C chemokine receptor type 7,CCR7)、T-盒轉(zhuǎn)錄因子X21(T-box transcription factor X21, TBX21)、白介素-10(interleukin-10,IL10)、CD38、CD40配體(CD40 ligand,CD40LG)、CD5、CD3E和酪氨酸蛋白激酶ZAP-70(70 kD zeta-chain associated protein,ZAP70)顯著上調(diào)并富集于免疫細(xì)胞黏附、活化及分化等生物學(xué)過程,提示炎癥細(xì)胞及免疫反應(yīng)在DCM中的重要地位。L-選擇素(L-selectin,SELL),通過與鄰近細(xì)胞上的糖蛋白結(jié)合介導(dǎo)細(xì)胞間黏附及免疫細(xì)胞與細(xì)胞外基質(zhì)成分間的相互作用[27],我們發(fā)現(xiàn)其以上調(diào)方式參與細(xì)胞黏附分子信號通路,提示可能在DCM組織重構(gòu)中起作用。整合素α-L(integrin alpha-L,ITGAL),是細(xì)胞間黏附分子的受體,參與免疫細(xì)胞的黏附和遷移及細(xì)胞毒性T細(xì)胞介導(dǎo)的殺傷作用。白細(xì)胞介素2的受體(interleukin-2 receptor subunit beta,IL2RB),參與受體介導(dǎo)的內(nèi)吞作用并轉(zhuǎn)導(dǎo)IL2的促有絲分裂信號。心力衰竭與心肺組織白細(xì)胞浸潤、促炎細(xì)胞因子和纖維化的增加有關(guān)。IL-2與其單克隆抗體復(fù)合物相互作用后可經(jīng)IL2RB受體促進調(diào)節(jié)性T細(xì)胞分化,減輕心肺炎癥細(xì)胞浸潤及纖維化而改善心功能[28]。殺傷細(xì)胞凝集素樣受體亞家族B成員1(killer cell lectin-like receptor subfamily B member 1,KLRB1),可抑制自然殺傷細(xì)胞的細(xì)胞毒性作用,其與DCM的直接關(guān)系暫未見文獻報道。
綜上所述,DEGs和hub基因可能在DCM的發(fā)生發(fā)展中發(fā)揮著關(guān)鍵作用。盡管關(guān)于DCM發(fā)病機制有廣泛的研究,但并發(fā)左心室功能障礙、心力衰竭或心律失常的炎癥性心肌病預(yù)后仍不良,部分患者發(fā)生擴張型心肌病的原因尚不清楚。我們的研究進一步揭示了免疫細(xì)胞及炎癥介質(zhì)參與DCM的進程,調(diào)控心肌組織中這些基因的表達能可能有助于DCM的治療。本研究也存在一定局限性。例如,本研究僅進行了信息學(xué)數(shù)據(jù)分析,暫未進行基礎(chǔ)實驗的探索;另外本研究僅是初步的分子篩選,距離應(yīng)用到臨床治療還有很長的路要走,仍值得后期深入探究。