張曦 ,翟麗 ,孫運艷,楊偉,高艷章,雷鳴,潘玉卿
(1.云南省腫瘤醫(yī)院·昆明醫(yī)科大學第三附屬醫(yī)院檢驗科,云南 昆明 650118;2.云南省腫瘤醫(yī)院·昆明醫(yī)科大學第三附屬醫(yī)院血液科,云南 昆明 650118;3.昆明醫(yī)科大學第一附屬醫(yī)院檢驗科云南省實驗診斷研究所云南省檢驗醫(yī)學重點實驗室,云南 昆明 650032)
小兒急性髓系白血?。╝cute myeloid leukemia,AML)約占兒童白血病總數(shù)的20%[1-2]。近年來,由于白血病診療方法和支持治療的改進,AML 患兒的長期生存率有了很大提高。雖然小兒AML 的預后明顯優(yōu)于20 歲以上的成人[3-5],但由于其化療耐藥、緩解率低和緩解期感染等因素阻礙了治愈率的提高[6],尤其是不明原因發(fā)熱、體質(zhì)量減輕、肺部浸潤伴呼吸困難和腎功能衰竭等并發(fā)癥在治療過程中時有發(fā)生[7]。即使在發(fā)達國家,對復發(fā)難治性小兒白血病的治療效果仍不樂觀[8]。目前國內(nèi)外對于小兒AML 的治療主要以放、化療及造血干細胞移植為主,但對于其發(fā)病機制的報道相對較少,故探究小兒AML 的分子機制并制定精準的治療策略對于患兒的生存及預后尤為重要。迄今為止,白血病的病因尚不明確,其仍然是兒童和青少年癌癥死亡的主要原因。本研究利用生物信息學分析手段對小兒AML 患兒基因芯片進行分析,以期發(fā)現(xiàn)與該病相關的生物標志物,為揭示小兒AML 發(fā)生的分子機制提供理論依據(jù)。
1.1 小兒髓系白血病基因芯片數(shù)據(jù)信息獲取從GEO 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)下載相關的基因表達矩陣,以“pediatric acute myeloid leukemia”為關鍵詞篩選相關數(shù)據(jù)集。篩選條件:①mRNA 表達譜數(shù)據(jù)集;②以骨髓為樣本;③以正常骨髓為對照。選擇基于GPL8300平臺的 GSE2191 數(shù)據(jù)集(GeneChip Human Genome U95Av2 oligonucleotide microarray),包括54 例小兒AML 患兒(男性33 例,女性21 例,年齡0 d~15歲)和4名正常骨髓樣本(正常人)。此外,本研究不包括任何對人體細胞或動物進行的實驗。
1.2 基因芯片的處理及差異表達基因(differentially expressed genes,DEGs)的篩選采用GEO 數(shù)據(jù)庫自帶的GEO2R 在線工具對AML 患兒及正常對照組間的DEGs 進行篩選[9],篩選條件:錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.05 且|log2fold change(FC)| ≥2。以logFC ≥2 為上調(diào)基因,logFC ≤-2 為下調(diào)基因。下載MINiML 平臺文件,采用R 語言的ggplot 包繪制DEGs 的火山圖,pheatmap 包繪制差異較大的前50 個DEGs 的熱點圖。
1.3 DEGs 的基因本體功能注釋(GO)富集和京都基因與基因組百科全書(KEGG)通路分析利用DAVID 6.8 數(shù)據(jù)庫分析GO 富集和KEGG 通路富集情況[10]。GO 分析中以FDR <0.05、基因數(shù)(gene counts)>10 作為篩選條件。KEGG 分析中以P<0.05 作為篩選條件。采用R 語言的GOplot包對GO 富集實現(xiàn)可視化,并獲得分子功能(molecular function,MF)、生物學過程(biological process,BP)和細胞成分(cellular component,CC)等注釋分析。
1.4 蛋白互作網(wǎng)絡(PPI)網(wǎng)絡構(gòu)建與核心基因(Hub gene)篩選采用 SRTING 數(shù)據(jù)庫(https://stringdb.org)對本次研究中得到的DEGs 構(gòu)建PPI 網(wǎng)絡[11],并將得到的數(shù)據(jù)下載并導入Cytoscape 軟件(www.cytoscape.org/)進行可視化并去除游離蛋白質(zhì)節(jié)點后,行CytoHubba 插件計算每個節(jié)點的連接度(Degree),將連接度按照降序排列,并獲得排名前20 位的Hub 基因[12]。
1.5 Hub 基因參與疾病譜及相關轉(zhuǎn)錄因子分析將前5 位的Hub 基因通過生物技術信息基因云(gene-cloud of biotechnology information,GCBI)在線數(shù)據(jù)庫進行分析,并采用Cytoscape 中的iRegulon 插件對20 個Hub 基因的相關轉(zhuǎn)錄因子進行預測,篩選條件為標準化富集分數(shù)(normalized enrichment score,NES)>3[13]。
2.1 AML 患兒DEGs 的篩選運用GEO2R 功能進行DEGs 識別,按照上述的DEGs 篩選條件得到600 個DEGs,其中407 個基因上調(diào),193 個基因下調(diào)。數(shù)據(jù)集中的上調(diào)和下調(diào)基因如圖1A所示。前50 個DEGs 如圖1B所示。
2.2 DEGs 的GO 富集和KEGG 通路分析將DEGs 上傳到DAVID 數(shù)據(jù)庫,獲得GO 功能富集和KEGG 通路分析。GO 分析結(jié)果顯示:DEGs 主要富集在細胞成分中,包括核漿、細胞質(zhì)、核膜和核斑點;在分子功能層面,DEGs 主要涉及蛋白質(zhì)及RNA 的poly(A)尾結(jié)合;在生物學過程層面,DEGs 主要涉及白細胞遷移。見圖2和表1。KEGG 通路富集結(jié)果顯示:DEGs 主要富集在腫瘤壞死因子、細胞因子受體相互作用和Jak-STAT 信號通路中。見表2。
表1 DEGs 在GO 富集中的分布Tab.1 Distribution of DEGs in GO enrichment
表2 DEGs 的KEGG 通路富集分析Tab.2 KEGG pathway analysis of DEGs
2.3 PPI 網(wǎng)絡構(gòu)建與Hub 基因篩選利用STRING 數(shù)據(jù)庫構(gòu)建PPI 網(wǎng)絡,網(wǎng)絡共涉及551 個節(jié)點和773 個連接。計算每個蛋白質(zhì)節(jié)點的連接度,結(jié)果表明:PPI 網(wǎng)絡的最大連接度為24,最小連接度為16(圖3)。排名前20 位的Hub 基因分別是甲酰肽受體2(formyl peptide receptor 2,F(xiàn)PR2)、磷酸肌醇3 激酶調(diào)節(jié)亞單位1(phosphoinositide-3-kinase regulatory subunit 1,PIK3R1)、E1A 結(jié)合蛋白p300(E1A binding protein p300,EP300)、熱休克蛋白90α 家族AA1(heat shock protein 90 alpha family AA1,HSP90AA1)、NRAS 原癌基因(NRAS protooncogene,NRAS)、精氨酸酶1(arginase 1,ARG1)、磷脂酰肌醇4,5-二磷酸3-激酶催化亞單位 α(phosphatidylinositol-4,5-bisphosphate 3-kinase catalytic subunit alpha,PIK3CA)、前血小板堿性蛋白(pro-platelet basic protein,PPBP)、CD59 分子(CD59 molecule,CD59)、細胞骨架相關蛋白4(cytoskeleton associated protein 4,CKAP4)、乙酰輔酶a ?;D(zhuǎn)移酶1(acetyl-CoA acyltransferase 1,ACAA1)、抗菌肽(cathelicidin antimicrobial peptide,CAMP)、肽聚糖識別蛋白1(peptidoglycan recognition protein 1,PGLYRP1)、磷脂酶γ-1(phospholipase C gamma 1,PLCG1)、基質(zhì)金屬肽酶8(matrix metallopeptidase 8,MMP8)、乳糖轉(zhuǎn)鐵蛋白(lactotransferrin,LTF)、轉(zhuǎn)氨酶1(transcobalamin 1,TCN1)、嗅介蛋白4(olfactomedin 4,OLFM4)、結(jié)合珠蛋白(haptoglobin,HP)和富半胱氨酸分泌蛋白3(cysteine rich secretory protein 3,CRISP3)。見表3。
2.4 參與白血病的Hub 基因和相關轉(zhuǎn)錄因子篩選GCBI 分析結(jié)果顯示:EP300、HSP90AA1和NRAS 共3 個Hub 基因參與了小兒AML 的發(fā)生發(fā)展(圖4);通過Cytoscape 中的iRegulon 插件預測DEGs 中排名前20 個Hub 基因的轉(zhuǎn)錄因子,結(jié)果顯示:共有55 個轉(zhuǎn)錄因子調(diào)節(jié)DEGs,排名前15 位轉(zhuǎn)錄因子結(jié)果見表4。部分轉(zhuǎn)錄因子的作用關系見圖5。
表3 連接度最高的排名前20 個Hub 基因Tab.3 Top 20 Hub genes with higher degree of connectivity
圖4 Ep300(A)、HSP90AA1(B)和NRAS(C)的相關疾病譜Fig.4 Disease spectrum of EP300(A),HSP90AA1(B),and NRAS(C)
表4 與Hub 基因相關的排名前15 位轉(zhuǎn)錄因子(NES >3)Tab.4 Top 15 transcription factors associated with Hub genes (NES >3)
1~14 歲兒童所患腫瘤中近1/3 是白血病,其中 3/4 為急性淋巴細胞性白血病(acute lymphoblastic leukaemia,ALL)[14]。雖然小兒AML 所占比例不大,但如果不經(jīng)任何治療,AML會在發(fā)病初期對兒童造成極大的危害[15]。在白血病發(fā)生發(fā)展過程中參與造血調(diào)控的基因常發(fā)生突變,導致造血細胞分化缺陷。而每種類型的白血病都有不同的基因突變。臨床上,白血病治療和生存率主要取決于基因突變的類型和診斷分期[16]。為此,本研究從GEO 數(shù)據(jù)庫下載小兒AML 的基因表達矩陣,篩選出可能參與小兒AML 的核心基因,旨在為小兒AML 的發(fā)病機制、診斷及防治提供新的理論依據(jù)和研究視角。
本研究采用STRING 數(shù)據(jù)庫構(gòu)建PPI 網(wǎng)絡后,通過Cytoscape 軟件對網(wǎng)絡進行可視化。利用CytoHubba 插件計算每個蛋白質(zhì)節(jié)點的連接度,共篩選出Ep300、HSP90AA1 和NRAS 等20 個與小兒AML 相關的Hub 基因,對上述基因進行文獻檢索后發(fā)現(xiàn):對維甲酸處理的急性早幼粒細胞能夠顯著增加細胞分化時膜表面的抗炎因子Annexin A1及其受體分子FPR2 的表達[17]。對誘導化療失敗的AML 患兒進行全基因組DNA、轉(zhuǎn)錄組RNA 和miRNA 測序結(jié)果顯示:PIK3R1 參與小兒AML 早期化療耐藥的遺傳機制[18],而PIK3R1 作為白血病的超級增強子抑制了細胞凋亡并促進其增殖[19]。Ep300 基因表達下調(diào)并作為抑癌因子參與小兒AML 的進程[20]。在造血干細胞和祖細胞內(nèi),由于Ep300 基因的缺失直接增強了MAPK 及JAK/STAT 等細胞因子的信號通路,Ep300 基因甚至能夠阻斷造血異常綜合征(human myelodysplastic syndrome,MDS)向AML 的轉(zhuǎn)變[21]。HSP90AA 1 基因作為重要的分子伴侶參與細胞增殖、存活和適應的信號傳導途徑。抑制HSP90AA1 基因的表達活性后,能將其作為研究AML 的重要分子靶標[22]。單核苷酸變異分析[23]顯示:NRAS 在初診為急性早幼粒細胞白血病且維甲酸基因發(fā)生重排的患兒體內(nèi)發(fā)生突變并參與了白血病的發(fā)病機制。NRAS 基因作為熱點區(qū)域突變基因亞群,在小兒AML 的分子流行病學和生物學研究中具有重要意義[24]。通過維甲酸及1,25 二羥基維生素D3 的誘導,髓系白血病細胞能夠成功向M2 型巨核細胞進行分化,此時其表面標記分子ARG1 的表達上調(diào),提示其能夠成為AML 化療成功與否的標志物[25]。
圖5 轉(zhuǎn)錄因子的靶基因作用關系圖Fig.5 Interaction networks of target genes for transcription factors
此外,本研究還應用Cytoscape 中的iRegulon插件預測Hub 基因的轉(zhuǎn)錄因子,并分析轉(zhuǎn)錄因子所調(diào)節(jié)的DEGs,結(jié)果顯示:與20 個Hub 基因相關的轉(zhuǎn)錄因子有55 個,其中有部分轉(zhuǎn)錄因子在白血病中的作用已經(jīng)得到證實。TP63 與長鏈非編碼RNA rs55829688 發(fā)生相互作用,加劇了AML 患者的骨髓抑制,并影響該病的預后[26]。在多發(fā)性骨髓瘤中,長鏈非編碼RNA MALAT1 的拮抗作用下調(diào)了蛋白酶體亞單位基因的2 個主要轉(zhuǎn)錄激活因子(NFE2L1 和NRF2),導致胰蛋白酶、糜蛋白酶和細胞凋亡蛋白酶活性降低,并導致多泛素蛋白的累積[27]。
綜上所述,本研究采用GEO 數(shù)據(jù)庫中的小兒AML 芯片信息,利用一系列的生物信息學手段,探尋小兒AML 相對精準的預后標志物,為其診治提供更為有效的數(shù)據(jù)支持和理論依據(jù)。