冷利華 裴宜斌 周 函 晏晶晶 何小伍 朱 高 黃文勝
(中國人民解放軍海軍安慶醫(yī)院心血管內科,安慶 246003)
冠狀動脈疾?。╟oronary artery disease,CAD)是一種復雜的多因素疾病,是最常見的死亡原因之一,并在全世界造成了沉重的經濟和社會負擔[1]。CAD包括穩(wěn)定/不穩(wěn)定心絞痛、突發(fā)性心臟疾病和心肌梗死(myocardial infarction,MI),病理基礎為動脈粥樣硬化斑塊形成,導致腔隙狹窄/堵塞。斑塊進一步破裂和血栓將阻塞冠狀動脈導致急性心肌梗死(acute myocardial infarction,AMI)[2]。常見的包括高度敏感的肌鈣蛋白、NT-pro BNP、左心室射血分數等,可作為預測穩(wěn)定型冠狀動脈疾?。╯table coronary artery disease,SCAD)向AMI進展的傳統(tǒng)診斷和預后生物標志物,但這些指標僅在初級預防情況下有效,且易受遺傳因素和環(huán)境因素干擾[3-4]。近年AMI早期診斷和治療進展較快,但SCAD患者動脈粥樣硬化斑塊進展為不穩(wěn)定型動脈粥樣硬化斑塊的病理機制尚不清楚。
生物信息學分析結合高通量測序是一種非常有效、準確的方法用于探索疾病基因表達譜差異,能深入挖掘潛在的疾病相關基因,以便開發(fā)新的診斷與治療策略。外周血中基因表達可反映包括心血管疾病在內的各種復雜疾病變化,是檢測和驗證疾病極為重要的生物標志物。TAN等[5]觀察到外周血CPNE3低表達的SCAD患者更易向AMI進展。WANG等[6]采 用GSE71226微 陣 列 數 據 集 結 合RT-qPCR證實,SCAD患者基質金屬蛋白酶(matrix metallopeptidase,MMP)9和C-X-C基序趨化因子受體(C-X-C motif chemokine receptor,CXCR)1表達顯著上調。VIJAY[7]采用GSE66360微陣列數據集探索差異表達基因發(fā)現,AMI患者CXCL2、MMP9、Toll樣受體(Toll-like receptor,TLR)2和TLR4在炎癥反應、免疫應答及細胞因子與細胞因子受體相互作用中顯著富集。本研究將進一步探索GSE71226與GSE66360微陣列數據集,試圖將其整合篩選SCAD向AMI進展的相關核心基因和作用途徑,以期闡述其病理機制。
1.1微陣列數據獲取 在基因表達綜合(gene expression omnibus,GEO,https://www.ncbi.nlm.nih.gov/geo/)數據庫中下載2個獨立數據集GSE71226和GSE66360。GSE71226數據集包括3例SCAD和3例健康對照,取兩組外周血樣本,分別提取總RNA,采用Affymetrix Human Genome U133 Plus 2.0 Array平臺進行分析。GSE66360數據集包括49例AMI患者和50例健康對照,取兩組外周血樣本,分別提取總RNA,Affymetrix Human Genome U133 Plus 2.0 Array平臺分析。
1.2GSE71226和GSE66360數據集處理 在GEO數據庫中下載Series Matrix File和Platforms文件。通過Perl腳本對2個獨立數據集進行注釋和整合,去除1個探針對應多個分子探針,當遇到對應同一個分子探針時,僅保留信號值最大的探針。采用R軟件“sva”包進行表達式值校正和數據歸一化處理,得到基因表達譜文件。采用R語言“l(fā)imma”包進行兩組差異基因分析。篩選標準:P<0.05和|log2 fold change|>1,利用火山圖進行可視化。利用“ggplot2”包對GSE71226和GSE66360數據集得到的差異基因取交集,并定義SCAD向AMI進展的關鍵基因,繪制維恩圖,采用熱圖對關鍵基因進行可視化。
1.3GO和KEGG富集分析GO是一種常用注釋基因功能的生物信息學工具。KEGG是系統(tǒng)分析基因功能,聯系基因組信息和功能信息的知識庫。GSEA是一種廣泛應用的軟件包,可衍生基因集確定兩組間不同生物學功能。以基因計數>2和P<
0.05為篩選閾值。
1.4蛋白質相互作用(protein-protein interaction,PPI)網絡創(chuàng)建和核心基因鑒定 采用檢索相互作用基因的搜索工具(STRING 11.0,https://string-db.org/)創(chuàng)建PPI網絡,以分值>0.4為分界點。采用Cytoscape軟件插件Cytohubba(Cytoscape,3.7.1)顯示關鍵基因的關系,采用Cytoscape軟件插件MCODE 1.5.1鑒定PPI網絡中的核心基因。
1.5核心基因的臨床驗證 選取中國人民解放軍海軍安慶醫(yī)院2019年1月至2020年3月住院的168例SCAD患者作為SCAD組。納入標準:①SCAD診斷標準參照《穩(wěn)定性冠心病診斷與治療指南》[8];②年齡>18歲;③本地常住居民。排除標準:①心臟瓣膜病、先天性心臟病;②合并慢性疾病如阻塞性肺疾病、肝功能、腎功能衰竭;③中樞神經系統(tǒng)疾病或自身免疫系統(tǒng)疾??;④急慢性感染;⑤凝血功能障礙或血液疾病;⑥惡性腫瘤。選擇同期體檢的健康志愿者24例作為對照組。所有SCAD患者均進行有效隨訪,隨訪截止時間為2021年3月,期間共有34例患者發(fā)生AMI,定義為AMI組,未發(fā)生AMI定義為無AMI組(n=134)。AMI診斷標準參照《急性冠脈綜合征急診快速診療指南》[9]。
1.6核心基因表達168例SCAD患者于入院后第1天8:00抽取空腹靜脈血5 ml,室溫靜置15~30 min,3 000 r/min離心10 min。按照ELISA試劑盒說明書檢測血清核心基因表達,終止反應后酶標儀測定450 nm處各孔OD值,以標準品OD值/標準品OD值為縱坐標,以標準品濃度為橫坐標繪制標準曲線,根據檢測標本OD值及標準曲線計算相應濃度。隨訪期間發(fā)生AMI的患者于入院后第1天8:00抽取空腹靜脈血5 ml,核心基因表達檢測同上。對照組檢測血清核心基因表達方法同上。
1.7統(tǒng)計學方法 采用SPSS17.0軟件進行數據分析。計數資料用百分比(%)表示,組間比較采用χ2檢驗。計量資料以±s表示,采用獨立樣本t檢驗。采用ROC曲線分析核心基因診斷SCAD患者進展為AMI的性能。P<0.05為差異有統(tǒng)計學意義。
2.1GSE71226和GSE66360數據集差異基因分析GSE71226數據集中獲得1 122個差異基因,高表達327個,低表達795個(圖1A)。GSE66360數據集中獲得463個差異基因,高表達366個,低表達97個(圖1A)。GSE71226和GSE66360數據集差異基因的交集基因見圖1B,共得到48個關鍵基因,具體表達特點見圖2。
圖1 GSE71226和GSE66360數據集差異基因火山圖及交集基因Fig.1 Volcanic map of differential genes and their intersection genes in GSE71226 and GSE66360 datasets
圖2 GSE71226和GSE66360數據集中48個關鍵基因表達特點熱圖Fig.2 Heat maps of 48 key gene expression characteristics in GSE71226 and GSE66360 datasets
2.248個關鍵基因的GO與KEGG分析48個關鍵基因導入Metascape在線數據庫,結果顯示:GO分析主要富集于環(huán)磷酸腺苷反應、對應力刺激的響應及炎癥反應等;KEGG分析主要富集于IL-17信號通路及PID IL1信號通路等(圖3)。
圖3 48個關鍵基因的GO與KEGG分析Fig.3 GO and KEGG analysis of 48 key genes
2.348個關鍵基因的GSEA分析 為進一步鑒定48個關鍵基因中具有統(tǒng)計學差異的基因集,進行GSEA分析,結果顯示:關鍵基因中正相關的前3位最豐富基因集為線粒體反應途徑、反應途徑及基于CRISPR與初級纖毛發(fā)育相關的基因;負相關的前3位最豐富基因集為中性粒細胞脫顆粒反應、人體補體系統(tǒng)及脊髓損傷(圖4)。
圖4 48個關鍵基因的GSEA分析Fig.4 GSEA analysis of 48 key genes
2.448個關鍵基因的PPI網絡構建和核心基因鑒定 為識別關鍵聚類,將48個關鍵基因導入STRING構建聚類PPI網絡(圖5A),PPI網絡中有38個節(jié)點,23個邊。采用Cytoscape中MCODE插件識別PPI網絡中的核心基因,得分為4分,共獲得4個核心基因:前列腺素內過氧化物合酶2(prostaglandinendoperoxide synthase 2,PTGS2)、轉錄因子AP(transcription factor AP-1,JUN)、CXCL2及MMP9,共4個節(jié)點,6條邊(圖5B)。
圖5 48個關鍵基因的PPI網絡構建和核心基因鑒定Fig.5 PPI network construction and core hub gene identification of 48 key genes
2.5GSE71226和GSE66360數據集的核心基因表達比較2個獨立數據集GSE71226和GSE66360的基因表達譜中,提取核心基因PTGS2、JUN、CXCL2及MMP9表達。GSE71226數據集:SCAD組PTGS2、JUN、CXCL2及MMP9表達均高于健康對照組(P<0.05,圖6A)。GSE66360數據集:AMI組PTGS2、JUN、CXCL2及MMP9表達均高于健康對照組(P<0.05,圖6B)。
圖6 GSE71226、GSE66360數據集中SCAD組與健康對照組PTGS2、JUN、CXCL2及MMP9表達Fig.6 PTGS2,JUN,CXCL2 and MMP9 expressions between SCAD group and healthy control group in GSE71226 and GSE66360 datasets
2.6臨床數據集驗證外周血核心基因表達SCAD組患者PTGS2、JUN、CXCL2、MMP9蛋白表達高于對照組(P<0.05),AMI組患者PTGS2、JUN、CXCL2、MMP9蛋白表達高于非AMI組(P<0.05,表1)。
表1 SCAD組與對照組核心基因表達Tab.1 Hub gene expressions in SCAD group and control group
2.7外周血核心基因蛋白表達ROC曲線分析ROC曲線評估PTGS2、JUN、CXCL2及MMP9表達預測168例SCAD患者發(fā)生AMI的效能,PTGS2、JUN、CXCL2及MMP9 AUC分別為0.747(0.704~0.867)、0.775(0.714~0.887)、0.773(0.708~0.874)、0.850(0.794~0.972),見圖7。
圖7 外周血核心基因蛋白表達ROC曲線Fig.7 ROC curve of peripheral blood hub gene protein expression
SCAD向AMI進展的病理機制尚不清楚。雖有研究發(fā)現,糖尿病、高血壓、高脂血癥、吸煙和陽性家族史是SCAD進展為AMI的重要危險因素,但這些因素并不是SCAD向AMI進展的全部原因[10-11]。AMI患者中,20%患者無任何傳統(tǒng)危險因素,50%患者僅有1個危險因素[12]。因此,闡述SCAD向AMI進展的潛在病理學機制可為AMI防治提供理論依據。本研究根據GEO數據集篩選出48個SCAD向AMI進展的潛在關鍵基因,采用PPI網絡篩選出4個核心基因(PTGS2、JUN、CXCL2及MMP9),通過臨床驗證這些基因表達可靠地預測SCAD向AMI進展。
48個潛在關鍵基因的GO分析主要富集于環(huán)磷酸腺苷反應、對應力刺激的響應及炎癥反應等。劉波等[13]發(fā)現環(huán)磷酸腺苷反應在AMI患者后心肌纖維化中起重要作用,且炎癥反應也起重要作用[14]。KEGG分析主要富集IL-17信號通路及PID IL1信號通路等。自身免疫性疾病、心力衰竭、動脈粥樣硬化和心肌缺血中,IL-17在保護宿主不受細胞外病原體侵襲和促進炎癥病理方面發(fā)揮重要作用[15]。進一步研究表明,IL-17及其下游靶基因表達可能在誘導缺血性心力衰竭中起重要作用[16]。GSEA證明與SCAD向AMI進展相關的前3位顯著富集基因集為線粒體反應途徑、反應途徑及基于CRISPR與初級纖毛發(fā)育相關的基因;負相關的前3位為中性粒細胞脫顆粒反應、人體補體系統(tǒng)及脊髓損傷。表明SCAD向AMI進展的潛在病理機制復雜,是多種機體反應參與及多種信號通路共同作用的結果。
聚類分析顯示,PTGS2、JUN、CXCL2及MMP9是參與SCAD向AMI進展病理機制的核心基因。PTGS2是花生四烯酸轉化為前列腺素的一種酶,與腦卒中和心肌梗死風險降低相關,也可通過促進增殖、抑制凋亡和血管生成參與腫瘤進展[17]。大鼠實驗證實,PTGS2可通過氧化應激和炎癥反應促進AMI進展[18]。JUN是二聚體轉錄復合物家族,參與多種細胞和生理功能,被認為是細胞外信號的主要承擔者,使細胞適應環(huán)境變化,與移植排斥、纖維化、器官損傷、風濕性關節(jié)炎及哮喘等嚴重疾病有關,其介導的炎癥反應途徑能促進內啡肽表達和心肌纖維化[19-20]。研究表明,JUN表達增加與冠心病風險增加有關[19]。此外,JUN在人類頸動脈斑塊中增加,與膽固醇酯相關,表明JUN可能是斑塊易損的生物學標志[21]。CXCL2由激活的單核細胞和中性粒細胞產生并在炎癥部位表達,損害機體心血管系統(tǒng)[22]。臨床觀察到AMI和SCAD患者CXCL2表達失衡,提示AMI患者免疫系統(tǒng)功能紊亂[23]。MMP9是鋅依賴的內蛋白酶,負責組織重塑和細胞外基質蛋白降解,也是SCAD患者動脈粥樣硬化斑塊不穩(wěn)定的獨立預測因子,MMP9水平與冠狀動脈粥樣硬化斑塊不穩(wěn)定及壞死核心大小呈正相關[24-25]。PTGS2、JUN、CXCL2在SCAD向AMI進展中具體的病理機制尚未明確,但被證實與心血管疾病相關。
為進一步明確核心基因的臨床表達,課題組進行了臨床樣本數據集驗證。SCAD患者中觀察到PTGS2、JUN、CXCL2、MMP9蛋白表達高于對照組;AMI組患者PTGS2、JUN、CXCL2、MMP9蛋白表達高于SCAD組。表明PTGS2、JUN、CXCL2、MMP9在SCAD向AMI進展的病理機制中扮演重要角色。ROC曲線分析結果顯示,PTGS2、JUN、CXCL2及MMP9表達預測168例SCAD患者發(fā)生AMI的AUC分別為0.747、0.775、0.773、0.850,表明這些基因可有效預測SCAD向AMI進展。同時其鑒定可為后續(xù)藥物靶點設計與開發(fā)提供理論基礎。
本研究也存在局限性,一是本研究是在GEO數據集中分析篩選SCAD和AMI的外周血生物標志物,入組患者較少;二是經費限制,無法開展細胞層面的核心基因驗證;最后,驗證集樣本量較小,需進一步證實。
綜上,本研究采用GEO數據集鑒定出PTGS2、JUN、CXCL2、MMP9 4個核心基因,可能為SCAD進展為AMI的預防和治療靶點開發(fā)提供理論依據。