吳家炎 袁振光 陳依敏
【摘 要】 目的:采用生物信息學的方法來分析冠心病相關(guān)的基因,通路,轉(zhuǎn)錄因子和miRNA。方法:從公共基因芯片數(shù)據(jù)庫GEO下載冠心病基因表達譜數(shù)據(jù),篩選出差異表達基因(DEGs),并對差異基因進行GO、KEGG以及PPI網(wǎng)絡(luò)分析。最后利用Webgestalt預測CHD相關(guān)的miRNA以及轉(zhuǎn)錄因子,并構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。結(jié)果:共篩選出1449個DEGs。GO功能分析發(fā)現(xiàn)DEGs主要參與炎癥反應(yīng)、細胞 - 細胞信號傳導、神經(jīng)肽信號通路等生物學過程。KEGG通路富集分析發(fā)現(xiàn)DEGs參與神經(jīng)活性配體 - 受體相互作用、蛋白質(zhì)的消化和吸收、維生素的消化吸收等通路。并且篩選出20個與冠心病發(fā)病相關(guān)的基因,特別是發(fā)現(xiàn)了少有文獻報道的POMC、MYOD1等基因。最后我們還預測了與CHD相關(guān)的7個轉(zhuǎn)錄因子和3個miRNA。結(jié)論:通過生物信息學對基因芯片數(shù)據(jù)的分析,我們得到了冠心病相關(guān)的基因、通路、miRNA以及轉(zhuǎn)錄因子,為冠心病的精準治療提供了新思路。
【關(guān)鍵詞】 冠心病;生物信息學;差異表達基因 ;miRNA;轉(zhuǎn)錄因子
【中圖分類號】 R249 【文獻標志碼】A 【文章編號】1005-0019(2018)17-001-01
冠狀動脈粥樣硬化性心臟病(coronary heart disease,CHD) 是由于冠狀動脈粥樣硬化使管腔狹窄或阻塞導致心肌缺血、缺氧而引起的心臟病,簡稱為冠心病,是 21 世紀威脅人類健康的主要疾病之一 [1]。冠心病的發(fā)生和發(fā)展是在遺傳因素和環(huán)境因素基礎(chǔ)上,多重危險因素共同作用導致的[2]。高血壓、糖尿病等疾病,以及過度肥胖、不良生活習慣如吸煙等是誘發(fā)該病的主要因素。冠心病是全球死亡率最高的疾病之一[3],目前對冠心病發(fā)病的遺傳因素還不清楚,對其基因方面的研究相對不足。
近年來,生物信息學發(fā)展迅速,為疾病在基因方面的研究提供了非常廣闊的平臺。生物信息學(Bioinformatics)是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領(lǐng)域之一,同時也是21世紀自然科學的核心領(lǐng)域之一。本文從GEO 數(shù)據(jù)庫下載冠心病相關(guān)基因表達譜數(shù)據(jù),為在基因?qū)哟紊涎芯抗谛牟〉陌l(fā)生發(fā)展及其精準治療提供了新思路。
1 材料與方法
1.1 材料來源 利用美國國立生物技術(shù)信息中心NCBI平 臺 下 的GEO 數(shù)據(jù)庫進行芯片篩選,目標芯片需滿足如下篩選標準:①人類標本,排除細胞株和動物;②入選芯片需具有冠心病信息;③需為基因表達芯片,各探針具有歸一化的表達值; 經(jīng)篩選及芯片質(zhì)量分析,我們選取了6個樣本:冠心病CHD3例和健康對照組3例。
1.2 方法
1.2.1 差異基因篩選 下載CEL格式原始數(shù)據(jù),利用R軟件包affy進行讀取,采用RMA方法進行數(shù)據(jù)標準化預處理(包括Background correction, Normalization, Expression calculation),利用平臺注釋文件對探針進行注釋,去除沒有匹配到基因的探針;對于不同探針映射到同一基因,我們?nèi)〔煌结樀木底鳛檫@個基因最終的表達值?;赗包limma篩選差異表達基因,采用矯正T檢驗計算基因表達顯著性P值,BH方法矯正P值。每個差異表達基因,要求P<0.05。
1.2.2 差異表達基因功能分析 使用常用的富集分析工具DAVID分析差異表達基因參與的GO(gene ontology) 功能和KEGG(Kyoto encyclopedia of genes and genomes) 通路。參數(shù)富集基因個數(shù)count>=2,超幾何檢驗顯著性閾值P <0.05。
1.2.3 差異表達基因的PPI網(wǎng)絡(luò)分析 使用STRING數(shù)據(jù)庫預測分析所有差異表達基因的差異蛋白的PPI網(wǎng)絡(luò),PPI網(wǎng)絡(luò)可揭示蛋白之間的互作關(guān)系。構(gòu)建網(wǎng)絡(luò)軟件為Cytoscape。并統(tǒng)計節(jié)點degree值,觀察節(jié)點之間的連接情況。
1.2.4 miRNA-TF-gene調(diào)控網(wǎng)絡(luò) 利用webgestalt網(wǎng)站分別對差異基因進行轉(zhuǎn)錄因子TF富集預測和miRNA富集預測。取富集結(jié)果顯著的TF和miRNA。并整理TF-gene和miRNA-gene關(guān)系對,構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。
2 結(jié)果
2.1 差異表達基因篩選結(jié)果 最終我們共篩選出1449個差異基因,與對照組相比,冠心病樣品組得到726個上調(diào)基因,723個下調(diào)基因。
2.2 GO功能和KEGG通路富集分析 通過G0功能分類體系對差異基因進行注釋后發(fā)現(xiàn),顯著富集的生物過程GO富集分析發(fā)現(xiàn)DEGs主要參與炎癥反應(yīng)、細胞-細胞信號轉(zhuǎn)導、
神經(jīng)肽信號通路、G蛋白偶聯(lián)受體-環(huán)核苷酸通路、G蛋白偶聯(lián)受體-蛋白信號通路的正調(diào)控等生物學過程。以KEGG數(shù)據(jù)庫中的pathway為基本單位,向背景基因組映射,明確差異基因所參與的主要代謝途徑和細胞轉(zhuǎn)導通路,結(jié)果表明差異基因顯著富集于神經(jīng)活性配體-受體相互作用、蛋白質(zhì)的消化和吸收、黑素瘤、維生素的消化吸收、甘氨酸、絲氨酸和蘇氨酸代謝、脂肪的消化吸收等具有統(tǒng)計學意義的通路。
2.3 PPI網(wǎng)絡(luò)分析 結(jié)合PPI數(shù)據(jù)庫,分別對上調(diào)差異基因和下調(diào)差異基因構(gòu)建網(wǎng)絡(luò)圖,得到的PPI網(wǎng)絡(luò)。上調(diào)ppi網(wǎng)絡(luò)包括392個節(jié)點,下調(diào)ppi網(wǎng)絡(luò)包括419個節(jié)點。上調(diào)基因按照節(jié)點度大小排名的top 20 ,見表1。此處插入表12.4 miRNA-TF-gene調(diào)控網(wǎng)絡(luò):通過Webgestalt,我們找到富集結(jié)果排名前七的轉(zhuǎn)錄因子TF:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及排名前三的miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。整理相應(yīng)的TF和miRNA的靶基因,構(gòu)建miRNA-TF-gene調(diào)控網(wǎng)絡(luò),見圖1。
3 討論
目前對冠心病的發(fā)病機制,還不是特別的清楚。根據(jù)文獻報道,炎癥反應(yīng)對冠狀動脈形成粥樣硬化具有重要的作用。Luczak[4]FanWH[5]楊海燕[6]等研究表明,慢性炎癥反應(yīng)導致細胞產(chǎn)生黏附分子,是動脈粥樣硬化的始動環(huán)節(jié);同時炎癥指標可用來預測心血管疾病的發(fā)生。但是目前在基因水平上對該病的了解還是非常的有限,因此本研究對正常人和冠心病患者的表達譜進行差異基因篩選,共篩選出1449個差異基因。利用string 在線軟件對1449個差異基因編碼蛋白進行蛋白質(zhì)互相作用關(guān)系網(wǎng)絡(luò)分析,按節(jié)點度大小篩選出排名前20的上調(diào)基因:POMC、FPR2、MYOD1、GATA1、C3、GRM4、DRD4、SSTR5、PYY、FGF13、RGS6、CXCR1、、CCR10、SSTR4、CNR2、GALR3、APLN、NPBWR1、CDX2、PTGDR2。
對以上基因進行文獻挖掘,我們發(fā)現(xiàn)已有大量的文獻報道APLN、CXCR1、C3、FPR2與冠心病的發(fā)生、發(fā)展的機制以及預后關(guān)系密切 ;NR2、PYY、NPBWR1、PTGDR2與冠心病發(fā)生的危險因素有關(guān),比如:糖尿病、高血壓、肥胖;POMC、MYOD1等至今少有跟冠心病相關(guān)的報道。Guang Yang等研究表明,載脂蛋白C3單核苷酸多態(tài)性增加了冠心病的發(fā)生風險[7] ;Ye zhang等認為CXCR1通過抑制內(nèi)皮細胞轉(zhuǎn)移,使冠心病發(fā)生的風險增加[8];CAPLN是APJ受體的內(nèi)源性肽配體,已經(jīng)成為心血管系統(tǒng)的新型調(diào)節(jié)劑,APLN的缺乏使血管和內(nèi)皮祖細胞生成減少,從而體內(nèi)心肌血管生成受損,同時也會增加對缺血性損傷的易感性,這也增加了冠心病發(fā)作的風險[9]。值得一提的是,我們發(fā)現(xiàn)POMC、MYOD1等基因與冠心病之間的關(guān)系報道較少。MyoD1基因,別名MYF3,是一種蛋白質(zhì)編碼基因。Davis等人在1987年通過與小鼠MyoD1探針的弱交叉雜交分離出3種不同的人肌源性因子MYF3,MYF4和MYF5的cDNA,證明MYF3是小鼠MyoD1的人類同系物。Weintraub等人在1991年研究發(fā)現(xiàn)MyoD1僅在骨骼肌及其前體中表達,在非肌肉細胞中,基因被特定基因所抑制。但這與冠心病的發(fā)生發(fā)展還需進一步的研究。
值得一提是,我們還利用Webgestalt和Cytoscape構(gòu)建了miRNA-TF-gene調(diào)控網(wǎng)絡(luò)。Webgestalt的富集結(jié)果中,我們得到與CHD關(guān)系最為密切的7個轉(zhuǎn)錄因子:PAX8、EVI1、AR、NRSF、GATA、IK1、MYOD,以及3個miRNA:MIR-26A/B,MIR-29A/B/C,MIR-122A。
總之,通過生物信息學方法對冠心病芯片進行數(shù)據(jù)挖掘,我們得到了冠心病患者和正常健康人之間的差異表達基因。對這些差異表達基因的進一步篩選得到包括MYOD1和POMC在內(nèi)的20個關(guān)鍵基因;同時我們發(fā)現(xiàn)炎癥反應(yīng)、維生素的消化吸收等過程和神經(jīng)活性配體 - 受體相互作用等通路;最后我們進一步研究發(fā)現(xiàn)了一些與CHD相關(guān)的轉(zhuǎn)錄因子和miRNA:PAX8、EVI1、AR、MIR-26A/B、MIR-29A/B/C,MIR-122A。這些基因,轉(zhuǎn)錄因子和miRNA可能在CHD的發(fā)病機制中發(fā)揮重要的作用,但是具體的作用機制還需要進一步的實驗來探討,這對于CHD以后的精準治療具有一定的臨床意義
參考文獻
[1] 楊天,王莉娜,智宏,等. 冠心病合并糖尿病與單純冠心病危險因素及臨床特點比較研究[J]. 南京醫(yī)科大學學報(自然科學版),2014(09):1218-1223.
[2] 高閱春,何繼強,姜騰勇,等. 冠心病患者冠狀動脈病變嚴重程度與冠心病危險因素的相關(guān)分析[J]. 中國循環(huán)雜志,2012(03):178-181.
[3] 謝睿彬,張小新,蘇華,等. 不同類型冠心病介入治療的研究進展[J]. 中國醫(yī)學創(chuàng)新,2013(15):158-159.
[4] Luczak S E, Smits S H, Decker C, et al. The Chlamydia pneumoniae Adhesin Pmp21 Forms Oligomers with Adhesive Properties[J]. J Biol Chem,2016,291(43):22806-22818.
[5] Fan W H, Liu D L, Xiao L M, et al. Coronary heart disease and chronic periodontitis: is polymorphism of interleukin-6 gene the common risk factor in a Chinese population?[J]. Oral Dis,2011,17(3):270-276.
[6] 楊海燕,毛靜飛,吳常裕,等. 肺炎衣原體感染及炎癥反應(yīng)與冠心病的關(guān)系[J]. 中華醫(yī)院感染學雜志,2017(23):5352-5356.
[7] Yang G, Lei M M, Yu C L, et al. Apolipoprotein A5 and apolipoprotein C3 single nucleotide polymorphisms are correlated with an increased risk of coronary heart disease: a case-control and meta-analysis study[J]. Lipids Health Dis,2015,14:113.
[8] Zeng Y, Shen Y, Huang X L, et al. Roles of mechanical force and CXCR1/CXCR2 in shear-stress-induced endothelial cell migration[J]. Eur Biophys J,2012,41(1):13-25.
[9] Wang W, Mckinnie S M, Patel V B, et al. Loss of Apelin exacerbates myocardial infarction adverse remodeling and ischemia-reperfusion injury: therapeutic potential of synthetic Apelin analogues[J]. J Am Heart Assoc,2013,2(4):e249.