何海蘭,劉樂凱,張浩軍,柳銳蓮,李寶嘉,李治國
近年來,糖尿病的患病率正在持續(xù)增加, 2017年全球糖尿病患者人數(shù)約有4.51億,預計到2045年還將增加2.42億[1-2]。糖尿病腎病(diabetic kidney disease,DKD)是糖尿病的微血管并發(fā)癥,是導致腎衰竭的首要原因,同時也是導致糖尿病患者死亡的主要原因之一[3]。目前認為DKD與氧化應激、炎癥、免疫、血流動力學的改變密切相關。雖然對DKD的研究取得了一定的進展,但DKD仍缺乏有效的治療手段,具體發(fā)病機制尚未明確。DKD動物模型是研究DKD發(fā)病機制及藥物治療的一種重要手段。而各種動物模型出現(xiàn)的病理變化,激活的信號通路不盡相同,提示一些通路變化是由于各種動物模型的遺傳背景不同造成的,而未必與DKD相關;在多種動物模型上均出現(xiàn)改變的基因和通路改變,可能是DKD發(fā)病過程中關鍵基因和通路,在DKD發(fā)病中起著更加重要的作用[4-6]。
GEO數(shù)據(jù)庫中存貯著大量基因芯片數(shù)據(jù),而基因芯片技術可以一次性的檢測所有基因的變化。而生物信息學技術可以對數(shù)據(jù)庫中儲存的基因芯片等高通量數(shù)據(jù)進行進一步的加工和挖掘[7-8]。本研究對來自GEO數(shù)據(jù)庫GSE33744數(shù)據(jù)集中BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種DKD小鼠的數(shù)據(jù)集進行深入生物信息學分析,發(fā)現(xiàn)3種小鼠共同變化的基因及通路,為發(fā)現(xiàn)DKD發(fā)病機制以及DKD的防治療提供新的思路。
1.1 數(shù)據(jù)來源從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)中下載GSE33744數(shù)據(jù)集,其檢測平臺為GPL1261 [Mouse430-2]Affymetrix Mouse Genome 430 2.0 Arry。其中涉及BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種DKD小鼠模型,3種DKD小鼠均出現(xiàn)明顯的蛋白尿、腎小球系膜擴張和足細胞丟失等典型糖尿病腎病改變[4]。
1.2芯片數(shù)據(jù)預處理利用R語言Bioconductor 工具包 Affy包讀取芯片CEL數(shù)據(jù)文件,將雜交信號轉(zhuǎn)換成表達數(shù)據(jù)。對背景進行校正,利用魯棒多芯片平均算法(Robust Multichip Average algorithm, RMA)對數(shù)據(jù)標準化,利用Bioconductor 中的annotate包對數(shù)據(jù)進行注釋。
1.3篩選共同差異表達基因利用Bioconductor中的limma包進行差異表達基因的分析,篩選出每組DKD小鼠與對應正常小鼠的腎小球的差異基因。篩選標準為P<0.05,F(xiàn)C>1.5,即|logFC|>0.585。對3種鼠模型取交集,找到共同差異表達基因。
1.4富集分析為了確定共同差異基因富集的生物過程、細胞組分、分子功能以及生物途徑,進行基因本體論(Gene Ontology, GO)富集和京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes , KEGG)途徑分析[9],使用生物學信息注釋數(shù)據(jù)庫(the database for annotation,visualization and integrated discovery,DAVID)對差異基因進行GO功能和KEGG通路分析。篩選標準為P<0.05。
1.5蛋白質(zhì)相互作用(protein-protein interaction, PPI)網(wǎng)絡的構建利用STING數(shù)據(jù)庫構建這些差異基因的蛋白質(zhì)相互作用網(wǎng)絡,篩選標準為綜合分數(shù)為≥0.4,并應用Cytoscape軟件可視化并篩選高度(degree)的關鍵基因。
2.1 芯片質(zhì)量控制及標準化基因芯片進行質(zhì)量評估顯示所納入的芯片質(zhì)量合格。 通過RNA降解曲線發(fā)現(xiàn)所有芯片的降解曲線斜率幾乎一致,反應納入的基因芯片合格。RMA標準化后基因均值處于同一水平,可以用于各組間比較。
2.2差異表達基因的篩選BKS db/db、BKS eNOS-/-db/db和DBA-STZ 3種糖尿病腎病小鼠分別有2632個、2466個和551個差異表達基因,三者取交集后有170個共同差異表達基因,其中72個共同上調(diào)基因,72個共同下調(diào)基因。
2.3差異表達基因的GO和KEGG分析應用DAVID對3種DKD小鼠中共同差異基因中表達一致的144個差異表達基因進行GO和KEGG分析,GO分析結果提示:差異基因主要富集在膜上(GO_CC:0016020,membrane),主要具有氧化還原活性(GO_MF:0016491,oxidoreductase activity),參與氧化還原過程(GO_BP:0055114,oxidation-reduction process)等。KEGG分析結果提示:差異基因主要參與PPAR信號通路(KEGG_PATHY:mmu03320, PPAR signaling pathway),花生四烯酸代謝(KEGG_PATHY:mmu00590, Arachidonic acid metabolism),丁酸代謝(KEGG_PATHY:mmu00650, Butanoate metabolism)和晝夜節(jié)律(KEGG_PATHY:mmu04710, Circadian rhythm)。
對上調(diào)差異基因和下調(diào)差異基因分別進行GO和KEGG分析,結果提示:上調(diào)差異基因主要富集在細胞外區(qū)域(GO_CC:0005576, extracellular region),主要具有水解酶活性(GO_MF:0016787, hydrolase activity),參與先天免疫反應(GO_BP:0045087, innate immune response)等,并且富集結核(KEGG_PATHY:mmu05152, Tuberculosis)通路途徑,見圖1。而下調(diào)差異基因主要富集在膜上(GO_CC:0016020, membrane),主要具有氧化還原酶活性(GO_MF:0016491, oxidoreductase activity),參與氧化還原過程(GO_BP:0055114, oxidation-reduction process)等,并且富集花生四烯酸代謝(KEGG_PATHY:mmu00590, Arachidonic acid metabolism),5-羥色胺能突觸(KEGG_PATHY: mmu04726, Serotonergic synapse),亞油酸代謝(KEGG_PATHY: mmu00591, Linoleic acid metabolism),PPAR信號通路(KEGG_PATHY: mmu03320, PPAR signaling pathway)和類固醇激素的合成(KEGG_PATHY: mmu00140, Steroid hormone biosynthesis),見圖2。
2.4差異表達基因的PPI網(wǎng)絡分析利用STRING數(shù)據(jù)庫對144個差異基因構建PPI網(wǎng)絡,PPI網(wǎng)絡由83個節(jié)點和198條邊緣組成,見圖3,每個節(jié)點代表一種蛋白質(zhì),邊緣代表蛋白質(zhì)之間的關系。根據(jù)中樞節(jié)點度選出最大的11個關鍵基因,分別為:Cd68(degree=17)、Ccl6(degree=17)、Fcer1g(degree=16)、Tyrobp(degree=16)、Clec4n(degree=15)、Lyz2(degree=14)、Ms4a6d(degree=13)、Ly86(degree=13)、Ctss(degree=13)、Cfp(degree=11)和Mpeg1(degree=11)。
圖 1 上調(diào)差異基因富集過程
Figure1Enrichmentanalysisofup-regulationDEGs
圖 2 下調(diào)差異基因富集過程
Figure2Enrichmentanalysisofdown-regulationDEGs
紅色是上調(diào)差異基因,綠色是下調(diào)差異基因
圖 3 PPI網(wǎng)絡特性
Figure3PPInetworkcharacteristics
DKD是終末期腎病的主要原因之一,在全球范圍內(nèi)造成沉重的醫(yī)療負擔[10-11]。目前雖然對DND的發(fā)病機制有一定認識,但其發(fā)病詳細機制上不明確。DKD小鼠模型在DKD發(fā)病機制及藥物治療中有重要作用。本研究中涉及3種DKD模型分別是STZ誘導的DBA2/J小鼠模型(1型DKD模型);純合瘦素受體突變的C57BLKS遺傳背景小鼠(BKS db/db小鼠,2型DKD模型)是一種肥胖2型糖尿病小鼠模型;靶向性刪除內(nèi)皮一氧化氮合酶的BKS db/db小鼠(BKS eNOS-/-db/db,2型DKD模型)。我們從GEO數(shù)據(jù)庫下載了GSE33744數(shù)據(jù)集的3種DKD小鼠腎小球數(shù)據(jù)進行了重新分析,篩選出這3種鼠模型中共同差異基因及通路。
與各自正常對照相比,BKS db/db、BKS eNOS-/-db/db和DBA-STZ小鼠模型腎小球中差異基因數(shù)分別為2632、2466和551個。我們可以看到各種鼠模型中差異基因數(shù)目差別很大,提示在不同小鼠基因背景下,參與DKD發(fā)病的基因可能存在很大差異。當然這種改變也有可能是由于每組動物只數(shù)較少,基因芯片準確性較低,抽樣誤差等因素引起。本研究進一步將各組的差異基因取交集,共鑒定出144個共同差異基因,其中上調(diào)和下調(diào)差異基因各72個。GO分析發(fā)現(xiàn),這些差異基因細胞定位顯著富集在膜上,主要參與先天免疫反應、氧化還原過程、免疫系統(tǒng)過程和炎癥反應等,其分子功能主要富集在氧化還原酶活性。KEGG結果提示差異基因富集在PPAR信號通路、花生四烯酸代謝、丁酸代謝和晝夜節(jié)律。并且本研究將上調(diào)和下調(diào)的差異基因做富集分析,提示上調(diào)的差異基因主要富集在細胞外區(qū)域參與先天免疫反應,主要具有水解酶活性,富集肺結核通路途徑;而下調(diào)的差異基因主要富集在膜上,具有氧化還原酶活性,參與氧化還原過程,富集花生四烯酸代謝、PPAR信號途徑和甾體激素的生物合成通路途徑等。有趣的是,結果提示只有下調(diào)基因參與甾體激素的生物合成途徑,甾體激素又稱類固醇激素,其中腎上腺皮質(zhì)激素具有調(diào)控糖代謝,使血糖升高,促進蛋白質(zhì)轉(zhuǎn)化成糖的作用。參與甾體激素的生物合成途徑的基因有AKR1C18、CYP2D12和SRD5A2,據(jù)報道SRD5A2在糖尿病中顯著下調(diào)[12],其具體影響糖尿病腎病的機制有待進一步研究。以前的研究表明,過氧化物酶體增殖物激活受體在DKD的發(fā)展中起著重要作用[13],它屬于核受體家族成員,主要與炎癥、糖脂代謝、胰島素敏感性等密切相關,許多新型PPARγ激動劑有望成為下一代抗糖尿病藥物的候選藥物[14]。內(nèi)源性花生四烯酸能夠模擬血管緊張素II誘導纖連蛋白的表達[15],活性氧和TGF-β與糖尿病腎病的發(fā)病機制有關,糖尿病腎病的早期階段也與腎鈉處理和高血壓的改變有關,兩者都與花生四烯酸代謝過程相關[16]。最近研究發(fā)現(xiàn),晝夜節(jié)律可促進糖尿病腎病的發(fā)展,許多晝夜節(jié)律靶基因是器官特異性的并且是與組織特異性功能有關?,F(xiàn)有證據(jù)表明葡萄糖穩(wěn)態(tài)、促纖維化機制和缺氧信號都受到晝夜節(jié)律的調(diào)節(jié)。很明顯,生物鐘是腎的關鍵調(diào)節(jié)器,但如何調(diào)控糖尿病腎病其機制有待進一步研究[17]。目前,丁酸代謝和DKD之間的研究幾乎沒有,可能為糖尿病腎病的機制研究提供一個新的線索。
對144個差異基因進行蛋白質(zhì)相互作用網(wǎng)絡分析,篩選出與DKD有關的關鍵基因,其中前11個為:Cd68、Ccl6、Fcer1g、Tyrobp、Clec4n、Lyz2、Ms4a6d、Ly86、Ctss、Cfp和Mpeg1。CD68是巨噬細胞標記物,其與DKD的直接研究較少,但其與炎癥浸潤,炎性因子表達水平上調(diào)關系密切[18],這些中樞基因可能為DKD的防治和治療提供新的靶點。有趣的是,在PPI網(wǎng)絡中花生四烯酸代謝途徑過度出現(xiàn),其中Cyp4a14明顯上調(diào),而CYP2J13、ALOX15、CYP4A12A和CYP2J11下調(diào)。據(jù)報道Cyp4a14、CYP2J13、CYP4A12A和CYP2J11屬于細胞色素P450(CYP)家族的成員,細胞色素P450ω-羥化酶4A14(CYP4A14)是人類CYP4A羥化酶的同系物,其主要在小鼠的肝和腎中表達[19],可以催化小鼠中花生四烯酸的ω-羥化反應[20],CYP4A14基因的干擾會導致20-HETE上調(diào);CYP4a12a過表達會導致20-HETE上調(diào)[21],而20-HETE是CYP代謝產(chǎn)物。另外,CYP2J13和CYP2J11在花生四烯酸代謝中也具有活性[22]。
綜上所述,本研究通過信息學手段篩選出了在3種DKD動物模型共同差異基因及共同信號通路研究,提示這些差異基因和通路可能在DKD中扮演重要角色,對這些基因和通路的研究,可能使我們能夠更加深入地理解DKD的發(fā)病機制,為DKD的預防與診治提供新的靶點。