劉 音,楊 濤,謝裕賽,王玉柱
1.北京市海淀醫(yī)院腎內(nèi)科,北京100080;2.中國(guó)醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院病理學(xué)教研室,沈陽110122
系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus,SLE)是一種慢性系統(tǒng)性自身免疫性疾病,其特征是自身抗體產(chǎn)生、補(bǔ)體激活和免疫復(fù)合物沉積。每年全球范圍內(nèi)SLE 的發(fā)生率在0.003%~0.232%[1]。狼瘡性腎炎(lupus nephritis,LN)是SLE患者中最常見、最嚴(yán)重的器官表現(xiàn)之一,其特征通常是血尿、蛋白尿和腎小球?yàn)V過率受損[2]。約50%的SLE 患者會(huì)發(fā)展為臨床特征明顯的腎臟疾病,其中11%的患者在病程5年時(shí)會(huì)發(fā)展為終末期腎臟疾?。╡nd-stage renal disease,ESRD)[3-4]。LN 是導(dǎo)致SLE 患者發(fā)展至ESRD 和死亡的重要原因。LN 的初始和后續(xù)治療主要由免疫抑制劑和糖皮質(zhì)激素組成,這意味著幾乎沒有有效且特異性的療法。因此,研究LN 涉及的分子機(jī)制對(duì)于LN的臨床治療具有重要意義。
LN 的病理生理機(jī)制復(fù)雜。在LN 患者的不同腎小球區(qū)室中,免疫復(fù)合物的形成、先天性免疫信號(hào)途徑的激活、免疫細(xì)胞的滲透和促炎癥介質(zhì)可通過多種途徑損害腎小球細(xì)胞[5]。盡管許多研究已經(jīng)確定了LN 的某些病理機(jī)制,但其發(fā)病機(jī)制仍不清楚。
在基因組水平上追蹤LN 的生物學(xué)變化是一種值得關(guān)注的策略。近年來,許多學(xué)者已經(jīng)進(jìn)行了基因測(cè)序技術(shù)與生物信息學(xué)分析相結(jié)合的研究,以鑒定可能與預(yù)后生物標(biāo)志物有關(guān)的疾病相關(guān)基因,并在未來將其開發(fā)為治療靶標(biāo)。生物信息學(xué)分析可以在極短的時(shí)間內(nèi)處理大量的樣品,并提供有關(guān)疾病的有價(jià)值的信息,而且與SLE密切相關(guān)的幾個(gè)基因已經(jīng)確定,可以驅(qū)動(dòng)研究的創(chuàng)新[6-7]。但是,很少有研究利用生物信息學(xué)分析來鑒定和分析LN背景下的腎臟組織。
盡管LN 會(huì)影響腎臟的所有組成部分,但腎小球是最適合研究的組織,并且與疾病的發(fā)病機(jī)制和治療密切相關(guān)。本研究選擇GEO 數(shù)據(jù)庫中的腎小球組織數(shù)據(jù)集GSE32591 研究LN。應(yīng)用R 語言limma 包獲取GSE32591數(shù)據(jù)集中的差異表達(dá)基因(differentially expressed genes,DEGs)。使用DAVID 數(shù)據(jù)庫來分析這些DEGs 的GO(Gene Ontology)注釋信息,包括生物過程、細(xì)胞組分、分子功能和KEGG (Kyoto Encyclopedia of Genes and Genomes) 通路。構(gòu)建了蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction, PPI) 網(wǎng)絡(luò), 并應(yīng)用Cytoscape 中MCODE 及Cytohubba 插件分析DEGs,鑒定并驗(yàn)證了與LN 相關(guān)的10 個(gè)樞紐基因(hub genes)。最終應(yīng)用GSE99339 數(shù)據(jù)集驗(yàn)證了樞紐基因的顯著差異表達(dá),以期為L(zhǎng)N的診斷和治療提供新的思路。
在GEO 公共數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)[8]中以“l(fā)upus nephritis”及“glomeruli”作為關(guān)鍵詞檢索,選擇GSE32591 數(shù)據(jù)集作為分析數(shù)據(jù)集,GSE99339 數(shù)據(jù)集作為樞紐基因驗(yàn)證數(shù)據(jù)集。下載GSE32591和GSE99339數(shù)據(jù)集矩陣數(shù)據(jù)及平臺(tái)注釋信息。GSE32591 數(shù)據(jù)集基于GPL14663 平臺(tái),其中包含32 例LN 患者和14 例正常供體對(duì)照的腎小球組織基因表達(dá)信息;GSE99339 數(shù)據(jù)集基于GPL19184 平臺(tái),含有30 例LN 患者和8 例腎臟腫瘤切除對(duì)照的腎小球組織基因表達(dá)信息。
應(yīng)用R 軟件(4.0.2 版) limma 包標(biāo)準(zhǔn)化數(shù)據(jù)及篩選差異基因[9],以|log FC|>1 和校正后P<0.05 為閾值篩選差異基因。分別運(yùn)用R 語言ggpubr 和pheatmap 包對(duì)差異基因繪制火山圖及熱圖。
使用GO 分析確定樞紐基因的生物過程、細(xì)胞成分和分子功能屬性[10],通過KEGG 數(shù)據(jù)庫確定其通路功能[11]。DAVID(https://david.ncifcrf.gov/) 是進(jìn)行基因富集分析的常用數(shù)據(jù)庫[12]。應(yīng)用DAVID 在線工具對(duì)篩選的差異表達(dá)樞紐基因進(jìn)行GO和KEGG分析,P<0.05為差異具有統(tǒng)計(jì)學(xué)意義,使用R語言ggplot包繪制柱狀圖及氣泡圖。
STRING 數(shù)據(jù)庫常用來構(gòu)建PPI 網(wǎng)絡(luò)[13]。將DEGs 輸入STRING 在線工具中,篩選combined score>0.9 的互作蛋白。將得到的PPI 結(jié)果導(dǎo)入Cytoscape 軟件中,通過分子復(fù)合物檢測(cè)(molecular complex detection,MCODE),以degree cutoff=2、node score cutoff=0.2、k-core=2 和max.depth = 100 為標(biāo)準(zhǔn),篩選出PPI 中最顯著模塊[14]。在最顯著模塊中應(yīng)用Cytohubba 插件,按degree 算法計(jì)算出評(píng)分位于前10位的樞紐基因[15]。
為了進(jìn)一步驗(yàn)證正常組織和LN 組織中上述樞紐基因的表達(dá)差異,應(yīng)用GEO 數(shù)據(jù)集GSE99339 的數(shù)據(jù),分析樞紐基因的表達(dá)水平。
應(yīng)用limma 包對(duì)GSE32591 數(shù)據(jù)集進(jìn)行數(shù)據(jù)矯正及差異分析,以|log FC|>1 和校正后P<0.05 為閾值,獲得了367個(gè)DEGs,包括253個(gè)上調(diào)基因及114個(gè)下調(diào)基因。使用ggpubr包繪制DEGs的火山圖,按照校正后P值對(duì)顯著DEGs進(jìn)行排序;應(yīng)用pheatmap包繪制出前20個(gè)DEGs的表達(dá)熱圖。結(jié)果顯示,IFI27、MX1、ISG20等基因在LN中顯著高表達(dá)(圖1)。
圖1 DEGs的鑒定Fig 1 Identification of DEGs
應(yīng)用DAVID 軟件對(duì)DEGs 進(jìn)行GO 富集分析和KEGG信號(hào)通路富集分析。GO 富集分析顯示這些DEGs 主要參與病毒反應(yīng)應(yīng)答、對(duì)病毒的防御反應(yīng),并且參與Ⅰ型干擾素信號(hào)通路、活化中性粒細(xì)胞以及負(fù)調(diào)控病毒生命周期等生物過程;主要細(xì)胞成分位于質(zhì)膜外側(cè)、囊腔及膠原纖維(含細(xì)胞外基質(zhì));主要分子功能與Toll 樣受體結(jié)合、有機(jī)酸結(jié)合、補(bǔ)體結(jié)合及免疫受體活性等相關(guān)(圖2A)。KEGG 通路分析顯示,這些差異基因主要參與甲型流感、結(jié)核病、EB 病毒感染、金黃色葡萄球菌感染和補(bǔ)體途徑等信號(hào)通路(圖2B)。
圖2 DEGs的GO分析和KEGG通路分析Fig 2 GO analysis and KEGG pathway analysis of DEGs
通過STRING 在線工具和Cytoscape 軟件對(duì)367 個(gè)DEGs 進(jìn)行PPI 網(wǎng)絡(luò)分析,篩選combined score >0.9 的互作蛋白對(duì)。在Cytoscape中得到206個(gè)節(jié)點(diǎn),831條相互作用的網(wǎng)絡(luò)圖(圖3A)。在PPI 網(wǎng)絡(luò)中,利用Cytoscape 內(nèi)的MCODE 插件, 以 degree cutoff = 2、 node score cutoff = 0.2、k-core = 2 和max.depth = 100 為標(biāo)準(zhǔn),篩選出最顯著模塊。最顯著模塊包括22 個(gè)重要節(jié)點(diǎn)及227 條相互作用(圖3B)。對(duì)最顯著模塊運(yùn)用cytohubba 插件,以degree 算法計(jì)算出總分排名前10 位的樞紐基因,分別是IFI6、IFI27、IFIT1、IFIT2、IFIT3、IFITM3、ISG15、ISG20、MX1、SAMHD1(圖3C,表1)。
圖3通過STRING和MCODE方法篩選樞紐基因Fig 3 Identification of hub genes from the DEGs by STRING and MCODE
表1 10個(gè)樞紐基因的功能Tab 1 Functions of 10 hub genes
Continued Tab
在GEO 數(shù)據(jù)庫檢索其他LN 數(shù)據(jù)集。最終選擇GSE99339 數(shù)據(jù)集,分析LN 與正常對(duì)照之間這些樞紐基因的差異表達(dá)水平(圖4)。在GSE99339數(shù)據(jù)集中,除了缺失IFITM3的探針信息,上述樞紐基因均明顯上調(diào)。說明了樞紐基因篩選結(jié)果的可靠性。
圖4 在GSE99339數(shù)據(jù)集中驗(yàn)證樞紐基因在LN與正常組織之間的表達(dá)差異Fig 4 Differentially expressed levels of the hub genes between LN and normal in GSE99339 datasets
隨著生物信息學(xué)的發(fā)展,人們對(duì)尋找各種疾病樞紐基因的關(guān)注日益增加,收集到的疾病樞紐基因信息可為治療疾病提供新的手段。我們利用基于GPL14663平臺(tái)的數(shù)據(jù)集GSE32591,對(duì)32 例LN 患者的腎小球組織基因表達(dá)數(shù)據(jù)進(jìn)行分析,篩選DEGs。最終篩選出367 個(gè)DEGs,其中包括253 個(gè)上調(diào)基因和114 個(gè)下調(diào)基因;再運(yùn)用ggpubr 和pheatmap 包繪制火山圖及差異表達(dá)顯著的前20個(gè)DEGs 的表達(dá)熱圖。熱圖結(jié)果顯示,IFI27、MX1、ISG20等基因在LN 中顯著高表達(dá),提示這些基因可能參與LN的疾病進(jìn)展。
對(duì)DEGs的功能富集分析顯示,免疫應(yīng)答、感染和干擾素相關(guān)基因參與了LN 的發(fā)病過程。GO 分析和KEGG途徑富集分析表明,DEGs 在病毒防御反應(yīng)、質(zhì)膜外側(cè)、甲型流感、結(jié)核病、EB 病毒感染和補(bǔ)體途徑等方面顯著富集,提示了LN 疾病進(jìn)展中免疫活動(dòng)的增強(qiáng)。本研究應(yīng)用Cytoscape 中MCODE 及Cytohubba 插件分析這些DEGs,鑒定了與LN 相關(guān)的最顯著模塊及10 個(gè)樞紐基因(IFI6、IFI27、IFIT1、IFIT2、IFIT3、IFITM3、ISG15、ISG20、MX1和SAMHD1)。最終,應(yīng)用其他GEO 數(shù)據(jù)集(GSE99339)的數(shù)據(jù)信息,驗(yàn)證了上述樞紐基因顯著表達(dá)的可靠性。
在樞紐基因中,干擾素家族蛋白的表達(dá)顯著上調(diào),這也驗(yàn)證了之前的研究結(jié)果[16-17]。干擾素是一類信號(hào)蛋白,分為Ⅰ型、Ⅱ型和Ⅲ型;其中Ⅰ型干擾素是其最大的家族[18]。GO 分析結(jié)果也表明,Ⅰ型干擾素信號(hào)通路可能與SLE 的發(fā)病機(jī)制密切相關(guān)。SLE 的大多數(shù)樞紐基因都是Ⅰ型干擾素誘導(dǎo)型基因。SLE 患者顯示出較高水平的Ⅰ型干擾素及Ⅰ型干擾素誘導(dǎo)型基因,這些基因在SLE 發(fā)病機(jī)制中起主要作用[19-20]。干擾素誘導(dǎo)的四肽重復(fù)序列1(IFIT1)蛋白質(zhì)也屬于Ⅰ型干擾素家族,在大多數(shù)SLE 人群中IFIT1mRNA 的表達(dá)明顯上調(diào)[21]。IFIT1是首個(gè)鑒定為主要由干擾素-α/β誘導(dǎo)的細(xì)胞質(zhì)和線粒體干擾素刺激基因[22]。IFIT1可調(diào)節(jié)病毒復(fù)制以及翻譯、增殖、凋亡和信號(hào)轉(zhuǎn)導(dǎo)等細(xì)胞過程[23],可能與Rho/Rac鳥嘌呤核苷酸交換因子發(fā)生相互作用,從而參與SLE免疫反應(yīng)。
在本研究中,我們使用系統(tǒng)的生物信息學(xué)方法來分析LN 中腎小球組織表達(dá)信息。研究存在一些局限性,如GEO數(shù)據(jù)庫僅提供了少量LN數(shù)據(jù)集。在后續(xù)研究中,我們將進(jìn)一步收集臨床數(shù)據(jù),以作更深入的探索。
總之,本研究使用GEO 數(shù)據(jù)庫篩選LN 腎小球組織的367 個(gè)DEGs 及10 個(gè)樞紐基因,其可能是LN 潛在的生物標(biāo)志物。生物標(biāo)志物的揭示,有助于提高臨床診斷水平和開發(fā)個(gè)性化治療方法。
參·考·文·獻(xiàn)
[1] Rees F, Doherty M, Grainge MJ, et al. The worldwide incidence and prevalence of systemic lupus erythematosus: a systematic review of epidemiological studies[J]. Rheumatology (Oxford), 2017, 56(11): 1945-1961.
[2] Yu F,Haas M,Glassock R,et al. Redefining lupus nephritis:clinical implications of pathophysiologic subtypes[J]. Nat Rev Nephrol,2017,13(8):483-495.
[3] Almaani S, Meara A, Rovin BH. Update on lupus nephritis[J]. Clin J Am Soc Nephrol,2017,12(5):825-835.
[4] Tektonidou MG, Dasgupta A, Ward MM. Risk of end-stage renal disease in patients with lupus nephritis, 1971-2015: a systematic review and Bayesian meta-analysis[J]. Arthritis Rheumatol,2016,68(6):1432-1441.
[5] Devarapu SK, Lorenz G, Kulkarni OP, et al. Cellular and molecular mechanisms of autoimmunity and lupus nephritis[J]. Int Rev Cell Mol Biol,2017,332:43-154.
[6] Bing PF, Xia W, Wang L, et al. Common marker genes identified from various sample types for systemic lupus erythematosus[J]. PLoS One, 2016,11(6):e0156234.
[7] Coit P, Jeffries M, Altorok N, et al. Genome-wide DNA methylation study suggests epigenetic accessibility and transcriptional poising of interferonregulated genes in na?ve CD4+T cells from lupus patients[J]. J Autoimmun,2013,43:78-84.
[8] Clough E, Barrett T. The gene expression omnibus database[J]. Methods Mol Biol Clifton N J,2016,1418:93-110.
[9] Piao J,Sun J,Yang Y,et al. Target gene screening and evaluation of prognostic values in non-small cell lung cancers by bioinformatics analysis[J]. Gene,2018,647:306-311.
[10] Gene Ontology Consortium. Gene Ontology Consortium: going forward[J].Nucleic Acids Res,2015,43(database issue):D1049-D1056.
[11] Du JL,Yuan ZF, Ma ZW, et al. KEGG-PATH: Kyoto encyclopedia of genes and genomes-based pathway analysis using a path analysis model [J]. Mol Biosyst,2014,10(9):2441-2447.
[12] Dennis G, JR., Sherman BT, Hosack DA, et al. DAVID: Database for annotation, visualization, and integrated discovery[J]. Genome Biol, 2003,4(5):P3.
[13] Kumar MS, Adki KM. Marine natural products for multi-targeted cancer treatment:a future insight[J]. Biomed Pharmacother,2018,105:233-245.
[14] Wang J, Zhong J, Chen G, et al. ClusterViz: a cytoscape APP for cluster analysis of biological network[J]. IEEE/ACM Trans Comput Biol Bioinform,2015,12(4):815-822.
[15] Chin CH,Chen SH,Wu HH,et al. cytoHubba:identifying hub objects and subnetworks from complex interactome[J]. BMC Syst Biol,2014,8(Suppl 4):S11.
[16] Yang H, Li H.CD36identified by weighted gene co-expression network analysis as a hub candidate gene in lupus nephritis[J]. PeerJ, 2019, 7:e7722.
[17] Shu B, Fang Y, He W, et al. Identification of macrophage-related candidate genes in lupus nephritis using bioinformatics analysis[J]. Cell Signal, 2018,46:43-51.
[18] Reder AT, Feng X. Aberrant type I interferon regulation in autoimmunity:opposite directions in MS and SLE,shaped by evolution and body ecology[J].Front Immunol,2013,4:281.
[19] Bezalel S, Guri KM, Elbirt D, et al. Type I interferon signature in systemic lupus erythematosus[J]. Isr Med Assoc J,2014,16(4):246-249.
[20] Chen JY, Wang CM, Chen TD, et al. Interferon-λ3/4 genetic variants and interferon-λ3 serum levels are biomarkers of lupus nephritis and disease activity in Taiwanese[J]. Arthritis Res Ther,2018,20(1):193.
[21] Becker AM, Dao KH, Han BK, et al. SLE peripheral blood B cell, T cell and myeloid cell transcriptomes display unique profiles and each subset contributes to the interferon signature[J]. PLoS One,2013,8(6):e67003.
[22] Reynaud JM,Kim DY,Atasheva S,et al. IFIT1 differentially interferes with translation and replication of alphavirus genomes and promotes induction of type I interferon[J]. PLoS Pathog,2015,11(4):e1004863.
[23] Zhang L, Wang B, Li L, et al. Antiviral effects of IFIT1 in human cytomegalovirus-infected fetal astrocytes[J]. J Med Virol, 2017, 89(4):672-684.