劉一卜,文 敏,彭金剛,范菊娣
(1.貴州醫(yī)科大學(xué)藥學(xué)院,貴州 貴陽(yáng) 550004;2.貴州省化學(xué)合成藥物研發(fā)利用工程技術(shù)研究中心,貴州 貴陽(yáng) 550004)
糖尿病腎?。╠iabetic nephropathy,DN)是糖尿病中最為常見和嚴(yán)重的并發(fā)癥,同時(shí)也是全世界終末期腎病最常見的原因[1]。截至2020 年,我國(guó)糖尿病合并慢性腎病患者數(shù)達(dá)2 430 萬(wàn)[1,2]。DN 發(fā)病機(jī)制復(fù)雜,目前尚無(wú)明確的診斷指標(biāo)[3,4]。臨床上篩查DN 主要針對(duì)尿白蛋白,然而這一指標(biāo)并不靈敏[3-7]。因此,開發(fā)DN 診斷指標(biāo)成為臨床治療的關(guān)鍵和難題。
DN 常伴隨著腎小球、腎小管的損傷以及炎癥反應(yīng)[7]。DN 導(dǎo)致腎小球內(nèi)皮細(xì)胞損傷主要有3 種方式:以多醇通路、蛋白酶C 為靶標(biāo)影響細(xì)胞內(nèi)信號(hào)傳導(dǎo)和代謝;以合成晚期糖基化終產(chǎn)物(AGE)和氧化應(yīng)激為標(biāo)志誘導(dǎo)的腎小球細(xì)胞功能障礙和巨噬細(xì)胞的激活;由高糖等原因誘導(dǎo)的腎小球超濾和高血壓[8,9]。腎小球內(nèi)皮細(xì)胞損傷常將伴有炎癥細(xì)胞(單核細(xì)胞、巨噬細(xì)胞、淋巴細(xì)胞)的富集和浸潤(rùn),造成蛋白尿[10]。而低度腎小球炎癥被認(rèn)為是蛋白尿型腎小球病病程進(jìn)展的共同途徑,抗炎藥物有利于控制DN 病程[11]。研究腎小球炎癥的關(guān)鍵因子有助于發(fā)現(xiàn)DN 炎癥新靶點(diǎn)、制定新策略。
20 世紀(jì)90 年代中期開始,人類基因組計(jì)劃的完成,標(biāo)志著進(jìn)入了生物學(xué)驅(qū)動(dòng)的時(shí)代[12]。隨著分子、結(jié)構(gòu)和化學(xué)生物學(xué)方法的發(fā)展,如基因組測(cè)序、微陣列基因表達(dá)分析、RNA 干擾(RNAi)、高通量結(jié)晶等方法[13],GEO[14]、GeneBank[15]、RefSeq[16]、Uni-Prot[17]數(shù)據(jù)庫(kù)等可以幫助我們快速查找疾病相關(guān)的測(cè)序數(shù)據(jù)和蛋白序列信息,快速鎖定疾病發(fā)生、發(fā)展的通路和相互作用網(wǎng)絡(luò),加速了疾病的臨床和病理研究。
本文利用生物信息學(xué),基于以往相關(guān)文獻(xiàn)對(duì)GEO 數(shù)據(jù)集中的兩組腎小球測(cè)序芯片數(shù)據(jù)GSE96804、GSE30122 進(jìn)行分析,并交集出差異基因(DGEs),對(duì)差異基因進(jìn)行GO 功能注釋和GSEA-KEGG 通路富集,查找造成腎小球病變的關(guān)鍵促炎細(xì)胞因子及對(duì)應(yīng)信號(hào)通路。通過PPI 網(wǎng)絡(luò)鎖定發(fā)病關(guān)鍵基因,聯(lián)合公共數(shù)據(jù)庫(kù)Nephroseq 探討臨床診斷DN 的關(guān)鍵診斷基因,為精確干預(yù)臨床早期診斷、治療提供指導(dǎo)和啟發(fā)。
在GEO 數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)中按關(guān)鍵詞“diabetes kidney glomeruli”進(jìn)行檢索,選擇人源數(shù)據(jù)(Homo sapiens),同時(shí)選定測(cè)序方式為“Expression profilling by array”。在獲得的數(shù)據(jù)中檢查測(cè)序部位是否為腎小球,同時(shí)排除只含患病組或只含對(duì)照組的數(shù)據(jù)集,最終篩選得數(shù)據(jù)集GSE96804、GSE30122用于分析?;拘畔⒁姳?。
表1 數(shù)據(jù)集信息Tab 1 Dataset information
下載兩組數(shù)據(jù)對(duì)應(yīng)矩陣和平臺(tái)文件,使用GEO2R 平臺(tái)(https://www.ncbi.nlm.nih.gov/geo/geo2r/)分析數(shù)據(jù)的質(zhì)量和差異。同時(shí),基于平臺(tái)注釋文件,標(biāo)注矩陣中的探針I(yè)D,將其轉(zhuǎn)化為“ENTREZ_ID”,后轉(zhuǎn)化為基因名用于后續(xù)分析。
通過基于R 語(yǔ)言的limma 包分別對(duì)基因表達(dá)譜進(jìn)行差異分析,以|log2FC|>0.379(FCs>1.3)和P<0.05 作為篩選條件篩選DEGs,利用基于R 的ggplot2 和pheatmap 進(jìn)行可視化,分別繪制火山圖和熱圖。同時(shí),將得到的差異基因通過基因本體論(GO)和基因組百科全書(KEGG)進(jìn)行富集,為篩選出具有統(tǒng)計(jì)學(xué)意義的生物過程(biological process,BP)、細(xì)胞成分(cellular component, CC)和分子功能(molecular function,MF),選用P<0.05 作為篩選條件。
同時(shí),使用基因集富集分析法(GSEA,軟件版本:4.3.2)重新富集可能被篩選閾值過濾的差異基因,使用Molecular Signature Datebase(2023)對(duì)KEGG 術(shù)語(yǔ)(c2.cp.kegg.v2023.1)以及生物學(xué)過程(c5.go.bp.v2023.1)進(jìn)行注釋分析,將|NES|>1,NOMp<0.05 以及FDR<0.25 的基因集視為具有顯著差異進(jìn)行富集。
在線網(wǎng)站STRING(https://www.cn.string-db.org/)中鍵入DEGs 以預(yù)測(cè)蛋白之間相互作用,將交集所得的差異基因(上調(diào)、下調(diào)基因)構(gòu)建的網(wǎng)絡(luò)圖導(dǎo)入Cytoscape 中,利用Cytohubba 插件,針對(duì)整個(gè)網(wǎng)絡(luò),利用MMC 算法,以最短路徑顯示并篩選出排名前十的DEGs 作為Hub 基因。
基于公共臨床數(shù)據(jù)庫(kù)Nephroseq 庫(kù)(https://www.nephroseq.org),驗(yàn)證兩組數(shù)據(jù)集交集后的核心基因在正常組和模型組之間是否具有表達(dá)差異。同時(shí),基于Nephroseq 對(duì)于Hub 基因?qū)εR床特征:與腎小球?yàn)V過率(GFR)、24 小時(shí)蛋白尿、血清肌氨酸的影響進(jìn)行比較和論述,用于篩選具有生物標(biāo)志潛力的Hub 基因。
數(shù)據(jù)庫(kù)數(shù)據(jù)GSE96804、GSE30122 均符合芯片測(cè)序數(shù)據(jù)的質(zhì)量控制要求,模型組和對(duì)照組之間可以較好區(qū)分,如下圖1。GSE96804 通過limma 篩選后共獲得1 235 個(gè)DEGs,其中上調(diào)基因417 個(gè),下調(diào)基因818 個(gè)。GSE30122 篩選得DEGS 1 706 個(gè),其中上調(diào)基因852 個(gè),下調(diào)基因854 個(gè)。通過ggplot2和pheatmap 繪制的火山圖和熱圖展示了DGES 的聚類和不同樣本之間的差異,如圖2 所示。
圖1 芯片數(shù)據(jù)質(zhì)量控制Fig 1 GSE96804 differential gene screening
圖2 GSE96804 差異基因篩選Fig 2 GSE96804 differential gene screening
將兩組篩選得的差異基因分別進(jìn)行GO 富集分析,結(jié)果如圖3。GO 富集結(jié)果涵蓋了糖尿病腎病的主要生物學(xué)過程:外源性刺激、脂質(zhì)水平的變化、免疫系統(tǒng)調(diào)節(jié)能力的激活、細(xì)胞趨化和分化以及腎臟的發(fā)育和代謝過程的異常[10,11]。與炎癥因子相關(guān)的分子主要包括轉(zhuǎn)化因子、促炎癥因子以及相關(guān)黏附因子、趨化因子、Toll 樣受體、脂肪因子、核受體等[3,18]。進(jìn)一步利用GSEA 富集基因和通路,結(jié)果如圖4。收集了包括轉(zhuǎn)錄因子(transcription factors)通路、Toll 樣受體通路、脂肪細(xì)胞因子(adipocytokine)信號(hào)通路、細(xì)胞黏附(adherens)通路、細(xì)胞趨化因子(chemokine)通路,共6 個(gè)通路的基因富集結(jié)果。對(duì)二者富集到的DGEs 進(jìn)行交集,共獲得174個(gè)與炎癥因子相關(guān)的DGEs。
圖3 GO 富集分析結(jié)果Fig 3 GO enrichment analysis results
使用String 數(shù)據(jù)庫(kù)構(gòu)建PPI 網(wǎng)絡(luò),將篩選得174個(gè)DGEs 輸入到Cytoscape 中進(jìn)行篩選,選取排名前10 位的DGEs 作為Hub 基因,結(jié)果如下圖(圖5)所示。
圖5 與炎癥相關(guān)通路排名前10 的關(guān)鍵基因Fig 5 Top 10 key genes associated with inflammatory pathways
將10 個(gè)Hub 基因輸入到Nephroseq V5 數(shù)據(jù)庫(kù)進(jìn)行檢索,檢查是否是臨床樣本上具有表達(dá)差異的基因,結(jié)果如圖6 所示。分析刪除了在正常組與模型組沒有表達(dá)差異的基因CD80,而TNF、CD4、CD80、CD86查詢不到2 型糖尿病模型樣本,而基因CD40LG查詢不到腎小球部位的樣本,故而不考慮。此處,篩選出具有表達(dá)差異的Hub 基因共5 個(gè):CD8A、PTPRC、TLR2、CCL5、ITGAM。5 個(gè)基因在Neohroseq 數(shù)據(jù)集中的模型組(組2)與正常組(組1)表達(dá)量差異如圖7 所示。5 種基因在模型組均上調(diào),而除ITGAM外,其余4 種基因在正常組表達(dá)較少。
圖6 Hub 基因在Nephroseq 數(shù)據(jù)庫(kù)中表達(dá)差異分析Fig 6 Analysis of Hub's gene for differences in expression in the Nephroseq database
通過檢索Nephroseq V5 數(shù)據(jù)庫(kù),對(duì)比上述篩選所得Hub 基因:CD8A、ITGAM、PTPRC、CCL5、TLR2與蛋白尿、血清肌氨酸變化、腎小球?yàn)V過率等功能差異的相關(guān)性。對(duì)此,檢索了正常組與模型組的腎臟樣本進(jìn)行差異分析,結(jié)果如圖9~11。圖8 展示了4 個(gè)Hub 基因表達(dá)量與腎小球?yàn)V過率(mL/min/1.73 m2)之間的相關(guān)性。CD8A、PTPRC、ITGAM、TLR2的高表達(dá)將導(dǎo)致GFR 偏低,引起腎損傷。圖9 展示了3 個(gè)Hub 基因表達(dá)量與蛋白尿(g/24 h)之間的相關(guān)性。在CD8A與ITGAM高表達(dá)的條件下,蛋白尿?qū)⒌玫礁纳?,而ITGAM基因則依賴較低水平的表達(dá)。圖10 展示了Hub 基因表達(dá)量與血清肌氨酸(mg/dL)之間相關(guān)性。如圖,除PTPRC外,ITGAM、CCL5、TLR2的上調(diào)將引起血清肌氨酸水平的上升。由此,5 種Hub 基因與腎病炎癥確有相關(guān)性,可以作為具有臨床潛力的生物標(biāo)志物。
圖8 Hubs 基因表達(dá)情況與GFR 相關(guān)性比較Fig 8 Comparison of Hubs gene expression and GFR correlation
圖10 Hubs 基因表達(dá)情況與血清肌氨酸相關(guān)性比較Fig 10 Comparison of Hubs gene expression with serum sarcosine
DN 成因相當(dāng)復(fù)雜,與腎臟功能障礙和部分腎臟細(xì)胞的變化密切相關(guān)。多項(xiàng)研究已經(jīng)證實(shí),炎癥相關(guān)因子和信號(hào)通路影響了DN 的發(fā)生和發(fā)展[18],篩選有關(guān)炎癥因子可以幫助診斷和制定新的治療方案。
本研究采用生物信息學(xué)的方法,選取兩個(gè)人源腎小球細(xì)胞數(shù)據(jù)集進(jìn)行分析和比對(duì),探索引發(fā)腎小球炎癥的關(guān)鍵基因。通過對(duì)兩個(gè)GEO 生物芯片數(shù)據(jù)集進(jìn)行交集分析,對(duì)比DN 患者和正常人的腎小球組織,通過GO、GSEA 進(jìn)行注釋,最終交集了174個(gè)與炎癥相關(guān)的DGEs,同時(shí)通過Nephroseq 數(shù)據(jù)集進(jìn)行驗(yàn)證并檢查其在關(guān)鍵臨床特征上的表現(xiàn),最終獲得了5 個(gè)潛在的臨床生物標(biāo)志物:CD8A、ITGAM、PTPRC、CCL5、TLR2。ITGAM 通路與巨噬細(xì)胞相關(guān)[19],巨噬細(xì)胞發(fā)生極化、浸潤(rùn)促使DN 炎癥的發(fā)生[20]。CCL5 是一類關(guān)鍵的趨化因子,趨化因子和黏附因子的作用將使得單核細(xì)胞和淋巴細(xì)胞富集,引起DN[21]。酪氨酸蛋白磷酸酶C(PTPYC)是調(diào)節(jié)細(xì)胞內(nèi)信號(hào)傳導(dǎo)代謝的關(guān)鍵基因[22],同時(shí)也是調(diào)節(jié)T 細(xì)胞和B 細(xì)胞的重要調(diào)節(jié)因子,其表達(dá)差異與免疫調(diào)節(jié)和炎癥因子相關(guān)。TLR2 是Toll 樣受體2,其下游的NF-κB 是一類誘發(fā)蛋白尿的重要轉(zhuǎn)錄因子,誘導(dǎo)炎癥因子的釋放[23]。CD8A是屬于CD8 鏈編碼的一個(gè)抗原,通過誘導(dǎo)白細(xì)胞分化,輔助T 細(xì)胞受體識(shí)別抗原并活化T 細(xì)胞[24,25]。Shimokawa 等[26]的研究發(fā)現(xiàn)小鼠體內(nèi)CD8 細(xì)胞活化T 細(xì)胞,將有效預(yù)防由鏈脲佐菌素誘導(dǎo)的小鼠罹患糖尿病。同時(shí),通過與Nephroseq 進(jìn)行比對(duì),DN患者和正常組上述5 個(gè)基因表達(dá)具有差異,且蛋白尿、血清肌氨酸、腎小球?yàn)V過率等指標(biāo)差異顯著,具有臨床診斷潛力。
綜上所述,本研究通過生物信息學(xué)對(duì)DN 患者腎小球炎癥差異基因進(jìn)行分析,結(jié)果富集到174 個(gè)顯著差異的基因,涉及外源性刺激、脂質(zhì)水平的變化、免疫系統(tǒng)調(diào)節(jié)能力的激活、細(xì)胞趨化和分化以及腎臟的發(fā)育和代謝過程的異常等重要生物學(xué)過程。同時(shí)通過對(duì)炎癥通路的篩選和比對(duì),發(fā)現(xiàn)了五個(gè)具有生物標(biāo)志物潛力的關(guān)鍵基因:CD8A、ITGAM、PTPRC、CCL5、TLR2。由于本研究基于公共數(shù)據(jù)集中不同批次的人源腎臟樣本,樣本的病程和研究部位詳細(xì)情況未知,后續(xù)將加大樣本量,進(jìn)一步通過動(dòng)物模型和qPCR 驗(yàn)證核心基因作為生物標(biāo)志物的表達(dá)差異和后期的患者生存曲線,為進(jìn)一步優(yōu)化DN 引起的腎病提供新的診斷方案。
作者貢獻(xiàn)度說(shuō)明:
劉一卜:負(fù)責(zé)論文構(gòu)思、調(diào)查研究和文章撰寫;彭金剛:負(fù)責(zé)數(shù)據(jù)分析、基金資助;文敏:負(fù)責(zé)方法論的審核和文章校對(duì);范菊娣:負(fù)責(zé)寫作指導(dǎo)、項(xiàng)目管理和方法論指導(dǎo)。
所有作者聲明不存在利益沖突關(guān)系。