周科 向杰 張長江 張莉
[摘要]?目的?篩選心房顫動(atrial?fibrillation,AF)促纖維化的關(guān)鍵基因及信號通路,探討AF誘導(dǎo)的人心房成纖維細胞的促纖維化重塑的分子機制。方法?從公共基因數(shù)據(jù)庫(gene?expression?omnibus,GEO)下載單細胞RNA序列表達譜GSE148506,通過主成分分析和T分布式隨機鄰接嵌入得到差異基因,利用SingleR軟件包進行細胞類型注釋和軌跡分析,使用clusterprofiler軟件包,對成纖維細胞的差異基因進行基因本體(gene?ontology,GO)功能富集分析和京都基因與基因組百科全書(kyoto?encyclopedia?of?genes?and?genome,KEGG)信號通路分析。利用在線STRING數(shù)據(jù)庫和Cytoscape軟件進行蛋白質(zhì)相互作用網(wǎng)絡(luò)和模塊分析。利用插件cytoHubba篩選出關(guān)鍵基因。結(jié)果?共得到6個細胞類型注釋群,包括成纖維細胞、脂肪細胞、內(nèi)皮細胞、單核細胞、成纖維細胞、骨骼肌細胞。共鑒定出367個成纖維細胞差異基因,包括37個下調(diào)基因和330個上調(diào)基因。GO功能富集分析結(jié)果顯示,成纖維細胞的差異基因生物過程主要富集于細胞外基質(zhì)組織等;細胞組成主要富集于含膠原細胞外基質(zhì)等;分子功能主要富集于細胞外基質(zhì)結(jié)構(gòu)成分等。KEGG信號通路分析表明,差異基因主要富集于黏著斑、細胞外基質(zhì)-受體相互作用等。STRING分析從蛋白質(zhì)網(wǎng)絡(luò)互作圖中鑒定出6個成纖維細胞關(guān)鍵基因,即FN1、TIMP1、LAMB1、FBN1、C3、VCAN。結(jié)論?利用生物信息學(xué)分析,鑒定出FN1、TIMP1、LAMB1、FBN1、C3、VCAN在內(nèi)的基因及黏著斑、細胞外基質(zhì)-受體相互作用、磷脂酰肌醇3激酶-蛋白酶信號通路和轉(zhuǎn)化生長因子-β信號通路可能是AF誘導(dǎo)的人心房成纖維細胞促纖維化重塑的重要分子機制。
[關(guān)鍵詞]?心房顫動;單細胞RNA序列;人心房成纖維細胞;生物信息學(xué)分析
[中圖分類號]?R541.7??????[文獻標(biāo)識碼]?A??????[DOI]?10.3969/j.issn.1673-9701.2023.09.001
Bioinformatics?analysis?of?single-cell?RNA-seq?of?atrial?human?fibroblasts?with?atrial?fibrillation
ZHOU?Ke,?XIANG?Jie,?ZHANG?Changjiang,?ZHANG?Li
Cardiology?Department,?Affiliated?Minda?Hospital?of?Hubei?Minzu?University,?Enshi?445000,?Hubei,?China
[Abstract]?Objective?To?screen?key?genes?and?signaling?pathways?for?pro-fibrosis?in?atrial?fibrillation?(AF)?and?explore?the?molecular?mechanisms?of?AF-induced?pro-fibrotic?remodeling?in?human?atrial?fibroblasts.?Methods?Single-cell?RNA-seq?(scRNA-seq)?expression?profile?GSE148506?(AF?and?SR?fibroblasts),?was?downloaded?from?the?gene?expression?omnibus?(GEO)?database.?The?marker?genes?were?obtained?by?quality?control?and?data?filtering,?principal?component?analysis?and?t-distributed?stochastic?neighbor?embedding.?SingleR?package?was?utilized?for?cell?type?annotation?and?trajectory?analysis.?By?using?the?clusterprofiler?package,?the?marker?genes?of?fibroblasts?were?performed?through?gene?ontology?(GO)?and?Kyoto?encyclopedia?of?genes?and?genomes?(KEGG)?pathway?analysis.?Protein-protein?interaction?network?analysis?and?module?analysis?was?performed?using?the?STRING?database?and?Cytoscape?software.?The?hub?genes?were?screened?out?by?utilizing?the?plug-in?cytoHubba.?Results?6?clusters?of?cell?type?annotations?were?obtained,?included?fibroblasts,?adipocytes,?endothelialcells,?monocytes,?fibroblasts,?skeletal?muscle.?A?total?of?367?fibroblasts?marker?genes?were?identified,?included?37?down-regulated?and?330?up-regulated?genes.?GO?functional?enrichment?analysis?results?showed?that?the?marker?genes?for?fibroblasts?were?predominantly?enriched?for?extracellular?matrix?organization?for?biological?process;?collagen-containing?extracellular?matrix?for?cellular?component;?and?extracellular?matrix?structural?constituent?for?molecular?function.?KEGG?pathway?analyses?indicated?that?the?marker?genes?were?meaningfully?enriched?in?Focal?adhesion,?extracellular?matrix?(ECM)-receptor?interaction,?and?so?on.?Top?6?hub?genes?of?fibroblasts?included?FN1,?TIMP1,?LAMB1,?FBN1,?C3,?VCAN.?Conclusion?Using?bioinformatics?analysis,?we?identified?genes?including?FN1,?TIMP1,?LAMB1,?FBN1,?C3?and?VCAN?and?Focal?adhesion,?ECM-receptor?interactions,?PI3K-AKT?signaling?pathway?and?transforming?growth?factor-β?signaling?pathway?as?possible?important?molecular?mechanisms?of?pro-fibrotic?remodeling?in?human?atrial?fibroblasts?in?AF.
[Key?words]?Atrial?fibrillation;?Single-cell?RNA-seq;?Atrial?human?fibroblasts;?Bioinformatics?analysis
心房顫動(atrial?fibrillation,AF)是臨床上常見的心律失常類型之一,其發(fā)病率的增加與許多因素有關(guān),如高血壓、糖尿病、肥胖、吸煙等,導(dǎo)致心房結(jié)構(gòu)和組織病理學(xué)的改變,從而增加對AF的易感性[1]。目前觀點認為,心房纖維化會刺激心房結(jié)構(gòu)的重塑,從而導(dǎo)致AF的發(fā)生和維持[2]。研究表明,AF患者纖維組織的含量和分布與AF發(fā)生的機制、并發(fā)癥和治療失敗的風(fēng)險有關(guān)[3]。成纖維細胞被認為是心肌中豐富的非肌細胞群,它控制著細胞外基質(zhì)的組成和結(jié)構(gòu)[4]。成纖維細胞占心臟細胞數(shù)量的75%,但僅占其質(zhì)量的10%~15%[5]。因此,通過成纖維細胞可更好地了解AF發(fā)生、發(fā)展的分子機制并發(fā)現(xiàn)抗心律失常干預(yù)的新靶點。單細胞RNA測序(single-cell?RNA-seq,scRNA-seq)可在細胞分子水平上全面分析AF的發(fā)生機制,AF的遺傳學(xué)非常復(fù)雜,罕見和常見的突變均會增加對AF的易感性[6]。盡管許多研究已通過微陣列分析獲得與AF相關(guān)的潛在基因和通路,但目前對AF患者成纖維細胞scRNA-seq的研究較少。本研究通過成纖維細胞的scRNA-seq數(shù)據(jù)分析,利用AF和竇性心律(sinus?rhythm,SR)樣本的成纖維細胞以評估AF中的差異基因和潛在信號通路,現(xiàn)報道如下。
1??材料與方法
1.1??scRNA-seq數(shù)據(jù)
篩選公共基因數(shù)據(jù)庫(gene?expression?omnibus,geo)(http://www.ncbi.nlm.nih.gov/geo/)中所有AF成纖維細胞的scRNA-seq表達數(shù)據(jù)集后,選擇GSE148506進行分析,它來自GPL18573平臺Illumina?NextSeq?500(Homo?sapiens),包括4個AF和4個SR的384個樣本的表達譜。
1.2??PCA和T-SNE分析
主成分分析(principal?component?analysis,PCA)和T分布式隨機鄰接嵌入(t-distributed?stochastic?neighbor?embedding,T-SNE)被用于數(shù)據(jù)的降維處理。由于原理和機制不同,T-SNE保留的屬性信息更具代表性,反映樣本間差異,但T-SNE速度較慢,PCA速度相對較快。
1.3??差異基因
經(jīng)T-SNE分析后得到不同聚類,將|log?(fold?change)|>2和P<0.05作為篩選標(biāo)準(zhǔn)尋找每個聚類的差異基因。
1.4??細胞類型注釋和軌跡分析
SingleR是一種計算方法,將單細胞轉(zhuǎn)錄組與參考轉(zhuǎn)錄組數(shù)據(jù)集相關(guān)聯(lián),并迭代改進其推斷,可用于改進scRNA-seq中的細胞類型注釋。Monocle工具被用于分析細胞分化軌跡,以轉(zhuǎn)錄數(shù)據(jù)為基礎(chǔ),使用模型預(yù)測細胞進化/分化過程。
1.5??GO和KEGG通路富集分析
使用R軟件包Clusterprofler比較基因簇之間的生物學(xué)特性,利用其進行基因本體(gene?ontology,?GO)分析探討差異基因的生物學(xué)功能,并進行京都基因與基因組百科全書(Kyoto?encyclopedia?of?genes?and?genomes,KEGG)通路分析以確定差異基因富集的信號通路。
1.6??蛋白互作網(wǎng)絡(luò)分析
使用在線STRING數(shù)據(jù)庫(https://string-db.org/)預(yù)測差異基因的蛋白互作網(wǎng)絡(luò)信息,相互作用論證的最高置信度設(shè)定>0.7。利用Cytoscape(3.7.1版)軟件對蛋白互作網(wǎng)絡(luò)進行可視化分析。通過使用cytoHubba插件最大克里爾中心度和度識別關(guān)鍵基因,包括利用Cytoscape軟件的分子復(fù)合體檢測(molecular?complex?detection,MCODE)插件尋找整個網(wǎng)絡(luò)的模塊,參數(shù)設(shè)置:度值=2,節(jié)點得分值=0.2,k-core=2,最大深度=100。
2??結(jié)果
2.1??PCA和T-SNE分析
經(jīng)PCA分析得到一系列主成分(principal?component,PC),見圖1。實際PC關(guān)鍵基因與理論基因的差異顯示見圖2。選擇前20個PC進行T-SNE分析,得到6個聚類。不同細胞群中基因的表達情況見圖3。各聚類中6個關(guān)鍵基因表達水平的小提琴圖見圖4A;T-SNE中6個關(guān)鍵基因表達水平的散點圖見圖4B;各聚類中6個關(guān)鍵基因表達水平的氣泡圖見圖4C。關(guān)鍵基因的表達主要集中在聚類0和4,選擇聚類0和4(成纖維細胞群)的差異基因進行分析。
2.2??細胞類型注釋和軌跡分析
共得到6個聚類的細胞類型。聚類0,成纖維細胞;聚類1,脂肪細胞;聚類2,內(nèi)皮細胞;聚類3,單核細胞;聚類4,成纖維細胞;聚類5,骨骼肌細胞。6個聚類細胞類型的軌跡分析見圖5。
2.3??差異基因
聚類0中共鑒定出242個標(biāo)記基因,包括205個上調(diào)的差異基因和37個下調(diào)的差異基因;聚類4中共鑒定出125個上調(diào)的差異基因,聚類4中未篩選出下調(diào)的差異基因。
2.4??GO和KEGG通路富集分析
GO功能富集分析結(jié)果顯示,成纖維細胞的差異基因生物過程主要富集于細胞外基質(zhì)組織、細胞外結(jié)構(gòu)組織、結(jié)締組織;細胞組成主要富集于含膠原細胞外基質(zhì)、基底膜、內(nèi)質(zhì)網(wǎng)腔;分子功能主要富集于細胞外基質(zhì)結(jié)構(gòu)成分、糖胺聚糖結(jié)合、肝素結(jié)合。GO富集度前5位的基因及其相關(guān)基因見圖6A、6B。KEGG信號通路分析表明,差異基因主要富集于黏著斑、細胞外基質(zhì)-受體相互作用、血管平滑肌收縮、磷脂酰肌醇3激酶(phosphatidylinositide?3-kinases,PI3K)-蛋白激酶B(protein?kinase?B,AKT)信號通路(PI3K-AKT)、蛋白質(zhì)消化吸收等,前5個KEGG信號通路及其相關(guān)基因見圖6C、6D。
2.5??蛋白互作網(wǎng)絡(luò)、關(guān)鍵基因和模塊分析
使用STRING數(shù)據(jù)庫,創(chuàng)建一個蛋白互作網(wǎng)絡(luò)探討這些差異基因的生物學(xué)特性,包含343個節(jié)點和786條邊。使用Cytoscape-cytoHubba插件,通過最大克里爾中心度和度值的方法篩選出6個關(guān)鍵基因,即FN1、TIMP1、LAMB1、FBN1、C3和VCAN。
3??討論
AF是一種日趨嚴重的臨床疾病,遺傳學(xué)特征復(fù)雜,罕見和常見的基因突變均可極大地增加AF的易感性。近年來生物信息學(xué)取得較大進步,隨著基因芯片技術(shù)的快速發(fā)展,基因芯片技術(shù)在心血管臨床和研究中得到廣泛應(yīng)用。因此,應(yīng)用生物信息學(xué)方法進一步探討AF的發(fā)病機制非常重要,有助于在遺傳水平上發(fā)現(xiàn)預(yù)防和治療AF的新靶點。本研究中,被鑒定出的關(guān)鍵基因和信號通路在AF的研究中已有少量報道,表明綜合生物信息學(xué)分析的結(jié)果具有重要作用。
結(jié)構(gòu)重塑、電重塑和收縮性重塑在AF的發(fā)展和維持中起著關(guān)鍵作用。結(jié)構(gòu)重塑取決于兩個部分:一是細胞結(jié)構(gòu)變化,二是細胞外基質(zhì)分布不平衡[7-8]。大量研究表明,AF的存在與細胞外基質(zhì)沉積和降解平衡關(guān)系的破壞與心房重塑之間存在著極大的相關(guān)性[8]。本研究發(fā)現(xiàn),這些差異基因主要富集在與細胞外基質(zhì)有關(guān)的生物過程中。心肌成纖維細胞主要參與心肌重塑,單核細胞在心肌梗死誘發(fā)的炎癥期間的心臟重塑中也發(fā)揮重要作用[9]。此外,在炎癥和傷口愈合期間,誘發(fā)的心臟纖維化與單核細胞亞群有關(guān),這些證據(jù)表明,單核細胞與AF密切相關(guān)[10]。根據(jù)細胞軌跡分析結(jié)果顯示,單核細胞和成纖維細胞相互毗鄰。金屬蛋白酶組織抑制劑1(tissue?inhibitor?of?metalloproteinases-1,TIMP-1)基因通過控制基質(zhì)金屬蛋白酶(matrix?metalloproteinases,MMPs)的活性在細胞外基質(zhì)重塑中發(fā)揮重要作用。研究表明,血漿和組織中TIMP-1水平的升高與心肌纖維化和舒張功能障礙有著密切的聯(lián)系[11]。同時,TIMP-1對AF的病理生理學(xué)有重大影響,而這種影響是由MMPs和TIMPs間的不平衡所致[12]。Nakano等[13]發(fā)現(xiàn)MMP-9在AF患者的心房組織中高度表達,可能導(dǎo)致AF期間心房結(jié)構(gòu)重塑和心房擴張,因此,本研究結(jié)果進一步表明,TIMP-1/MMPs信號通路是治療AF心房重塑和纖維化的潛在目標(biāo)。
纖連蛋白1(fibronectin?1,F(xiàn)N1)屬于細胞外基質(zhì)的糖蛋白家族,廣泛存在于各種類型的細胞中,與細胞的黏附和遷移過程密切相關(guān),通過整合素跨膜受體參與病理生理過程變化[14-15]。Dong等[16]發(fā)現(xiàn)在心肌纖維化重塑和衰竭過程中,成纖維細胞的FN1表達顯著增加。本研究發(fā)現(xiàn),F(xiàn)N1主要富集在黏著斑、細胞外基質(zhì)-受體相互作用和PI3K-AKT信號通路上,F(xiàn)N1通過影響PI3K/AKT信號傳導(dǎo)調(diào)節(jié)細胞的生物學(xué)特性,通過阻斷PI3K-AKT的激活抑制FN1基因的表達,抑制細胞增殖,促進細胞衰老和凋亡,并減少細胞遷移和侵襲[17]。
通過KEGG信號通路分析,發(fā)現(xiàn)肌原纖維蛋白-1(fibrillin-1,F(xiàn)BN-1)明顯富集于轉(zhuǎn)化生長因子-β(transforming?growth?factor-β,TGF-β)信號通路中。TGF-β被認為是心房纖維化的一個主要介質(zhì),而TGF-β過度表達模型在體外或體內(nèi)研究心房纖維化和AF的發(fā)病機制已被廣泛認可[18-19]。
總之,利用AF和SR患者成纖維細胞的scRNA-seq數(shù)據(jù),確定與AF相關(guān)的差異表達基因,從而在基因水平上探討AF發(fā)生的機制。FN1、TIMP1、LAMB1、FBN1、C3和VCAN在內(nèi)的基因及黏著斑、細胞外基質(zhì)-受體相互作用、PI3K-AKT信號通路和TGF-β信號通路有可能成為AF的新生標(biāo)志物,并可能成為AF的潛在治療目標(biāo)。
[參考文獻][1] STAERK?L,?SHERER?J?A,?KO?D,?et?al.?Atrial?fibrillation:?Epidemiology,?pathophysiology,?and?clinical?outcomes[J].?Circulation?Research,?2017,?120(9):?1501.
[3] ZAHID?S,?COCHET?H,?BOYLE?P?M,?et?al.?Patient-?derived?models?link?re-entrant?driver?localization?in?atrial?fibrillation?to?fibrosis?spatial?pattern[J].?Cardiovascular?Research,?2016,?110:?443–454.