陳保林 李佳陽 姜焱 羅承敏 鮑宇翔 閆忠梁 程曉明 呂俊遠
[摘要]?目的?濾泡性甲狀腺癌(follicular?thyroid?carcinoma,FTC)臨床上較少見,其在疾病早期即可發(fā)生血行轉移。本研究利用生物信息學方法探索FTC發(fā)生發(fā)展的關鍵基因、發(fā)掘FTC的致病機制及治療靶點。方法?從基因表達綜合數據庫(gene?expression?omnibus,GEO)下載基因芯片GSE82208,利用R軟件分析以獲得差異表達基因(differentially?expressed?genes,DEGs),利用數據庫注釋、可視化和綜合發(fā)現(database?for?annotation,visualization?and?integrated?discovery,DAVID)在線網站對DEGs進行基因本體論(gene?ontology,GO)功能分析和京都基因與基因組百科全書(Kyoto?Encyclopedia?of?Genes?and?Genomes,KEGG)富集分析。對DEGs行蛋白質–蛋白質相互作用(protein-protein?interaction,PPI)分析,并篩選核心基因,對核心基因進行生存分析。結果?共篩選獲得74個DEGs,其中表達上調基因61個,表達下調基因13個。GO富集在細胞對鋅離子的反應、細胞對鎘離子反應、細胞核及金屬離子結合等過程。KEGG信號通路富集在礦物質吸收信號通路。通過對PPI網絡分析,篩選出核心差異表達基因MT1E、MT1F、MT1G、MT1H、MT1M、MT1X和MT2A共7個金屬硫蛋白基因。生存分析發(fā)現MT1F和MT1M與甲狀腺癌患者預后相關(P<0.05)。結論?金屬硫蛋白介導的金屬離子代謝紊亂與FTC密切相關,有望成為FTC的診治靶點。
[關鍵詞]?濾泡性甲狀腺癌;濾泡狀腺瘤;差異表達基因;生物信息學;金屬硫蛋白
[中圖分類號]?R736.1??????[文獻標識碼]?A??????[DOI]?10.3969/j.issn.1673-9701.2023.21.010
Screening?and?bioinformatics?analysis?of?key?genes?for?follicular?thyroid?carcinoma?based?on?GEO?databases
CHEN?Baolin1,2,?LI?Jiayang3,?JIANG?Yan1,2,?LUO?Chengmin1,2,?BAO?Yuxiang1,2,?YAN?Zhongliang1,2,?CHENG?Xiaoming1,2,?LYU?Junyuan1,2
1.Department?of?General?Surgery,?the?Affiliated?Hospital?of?Zunyi?Medical?University,?Zunyi?563099,?Guizhou,?China;?2.Department?of?Thyroid?and?Breast?Surgery,?the?Affiliated?Hospital?of?Zunyi?Medical?University,?Zunyi?563099,?Guizhou,?China;?3.Office?of?Drug?Clinical?Trial?Institution,?the?Affiliated?Hospital?of?Zunyi?Medical?University,?Zunyi?563099,?Guizhou,?China
[Abstract]?Objective?Follicular?thyroid?carcinoma?(FTC)?is?rare,?and?hematogenous?metastasis?occurs?more?commonly?in?the?early?phase.?In?the?present?study,?a?bioinformatics?approach?was?used?to?identify?key?genes?and?investigate?the?pathogenesis?and?therapeutic?targets?of?FTC.?Methods?The?gene?microarray?data?GSE82208?was?downloaded?from?the?gene?expression?omnibus?(GEO)?database.?We?used?R?software?to?screen?the?differentially?expressed?genes?(DEGs)?from?the?gene?microarray?datas.?The?database?for?annotation,?visualization?and?integrated?discovery?(DAVID)?online?database?was?used?to?perform?the?gene?ontology?(GO)?function?analysis,?Kyoto?Encyclopedia?of?Genes?and?Genomes?(KEGG).?The?protein-protein?interaction?(PPI)?network?of?DEGs?was?analyzed,?screen?the?hub?genes,?and?patient?survival?analysis?were?performed.?Results?A?total?of?74?DEGs?were?screened?out?from?gene?expression?profile,?of?which?61?were?up-regulated?and?13?were?down-regulated.?GO?is?enriched?in?cellular?response?to?zinc?ion,?cellular?response?to?cadmium,?nucleus?and?metal?ion?binding.?KEGG?signaling?pathway?involves?in?mineral?absorption?signaling?pathway.?A?total?of?7?metallothionein?genes?were?screened?out?through?the?PPI?network,?including?MT1E,?MT1F,?MT1G,?MT1H,?MT1M,?MT1X?and?MT2A.?Finally,?we?found?MT1F?and?MT1M?had?a?significant?impact?on?the?survival?rate?of?thyroid?carcinoma?patients?(P<0.05).?Conclusion?The?disorder?of?metal?ion?metabolism?mediated?by?metallothionein?is?closely?related?to?FTC,?and?is?expected?to?become?a?diagnostic?and?therapeutic?target?for?FTC.
[Key?words]?Follicular?thyroid?carcinoma;?Follicular?adenoma;?Differentially?expressed?genes;?Bioinformatics;?Metallothioneins
近年來,甲狀腺癌發(fā)病率居高不下,在過去30年間呈現急劇增長[1]。據統(tǒng)計,2023年全世界將新增甲狀腺癌病例43?720例[2]。濾泡性甲狀腺癌(follicular?thyroid?carcinoma,FTC)是一種少見的分化型甲狀腺癌,具有明顯血管侵犯性,在疾病早期即可通過血行轉移至肺、肝、骨及中樞神經系統(tǒng),使患者預后不良[3-4]。由于FTC較少見,目前缺乏大宗病例研究,對其致病機制及治療靶點知之甚少。因此,本研究利用生物信息學方法分析FTC的關鍵基因,探索其致病機制,并尋找潛在治療靶點。
1??資料與方法
1.1??一般資料
登錄基因表達綜合數據庫(gene?expression?omnibus,GEO)(https://www.ncbi.nlm.nih.gov/geo),以“follicular?thyroid?carcinoma”為關鍵詞檢索,選擇“homo?sapiens”“tissue”“expession?profiling?by?array”,下載符合條件的基因數據矩陣文件GSE82208,該芯片文件來自GPL570平臺[(HG-U133_Plus_2)Affymetrix?Human?Genome?U133?Plus?2.0?Array],數據集包含FTC樣本27例,濾泡狀腺瘤樣本25例,樣本信息見表1。
1.2??數據處理和DEGs篩選
下載基因矩陣數據后,利用perl?5.32.1和R?4.0.5軟件及l(fā)imma、ggplot、clusterProfiler等R包處理。通過背景校正、標準化及表達值計算進行差異表達基因(differentially?expressed?genes,DEGs)篩選,定義滿足條件|log2(FC)|>1和校正后P<0.05為有效的DEGs,即在有統(tǒng)計學意義的條件下DEGs表達水平是對照組的2倍。并將篩選參數log2(FC)>1的DEGs定義為上調基因,log2(FC)<–1的DEGs定義為下調基因,分別得到數據集中具有差異表達的上調基因和下調基因。
1.3??GO功能注釋與KEGG通路富集分析
數據庫注釋、可視化和綜合發(fā)現(database?for?annotation,visualization?and?integrated?discovery,DAVID)(https://david.ncifcrf.gov/)是一種流行的生物信息學資源系統(tǒng),主要用于基因列表的功能注釋和富集分析[5]。為了解DEGs的生物學功能及參與的信號通路,將DEGs上傳至DAVID網站,進行基因本體論(gene?ontology,GO)注釋分析和京都基因與基因組百科全書(Kyoto?Encyclopedia?of?Genes?and?Genomes,KEGG)通路富集分析,研究分析生物過程(biological?process,BP)、分子功能(molecular?function,MF)、細胞組成(cellular?component,CC)和參與的信號通路富集情況,設置條件為P<0.05。
1.4??PPI分析與核心基因篩選
String(https://www.string-db.org)是相互作用信息最大的蛋白質相互作用在線數據庫,可提供大量已知或未知蛋白質之間直接或間接作用關系數據[6]。將所得到的DEGs上傳至String并預測DEGs的蛋白質–蛋白質相互作用(protein-protein?interaction,PPI)網絡作用,物種來源選擇“homo?sapiens”。將得到的String結果上傳至Cytoscape?3.7.2軟件中,利用MCODE插件提取關鍵子網,根據節(jié)點得分從大到小的順序提取出表達較為聚集的子集,將其定義為核心基因。
1.5??生存預后分析
UALCAN(http://ualcan.path.uab.edu)是一個基于TCGA、CPTAC、CBTTC等多平臺的開放數據庫,可進行全面的基因分析,如表達譜分析、臨床特征分析、生存分析、泛癌分析等[7]。鑒于目前缺乏FTC基因表達數據庫,筆者利用UALCAN中的“TCGA分析”功能,分析核心基因對甲狀腺癌患者生存預后的影響曲線,觀察基因高表達與低表達樣本之間的預后差異性。
2??結果
2.1??DEGs的篩選結果
在數據校正及標準化后(圖1),通過對比分析FTC組和濾泡狀腺瘤組表達差異的基因,GSE82208共篩選出74個DEGs,其中表達上調基因61個:LIMK2、ZFYVE21、SLC5A3、MAFB、ITIH5、CBX7、MT1M、C2orf42、SLC43A3、SGK223、GJA1、RSPH1、MIOX、GLUL、LMOD1、IER2、FOS、SCN4B、FCGBP、AFAP1L2、LTF、ID1、MT1G、DUSP1、CSGALNACT1、LOC101929122、SLCO2A1、CRABP1、TIMP3、MT1F、LOC101928303、SELENBP1、SMCO4、TPST2、MT1E、CA4、LRP1B、MT1X、SSPN、GLT8D2、MT1H、RAMP3、RP11-389C8.2、PLAT、DNALI1、CTB-50L17.7、SDF2L1、PRICKLE2、CYYR1、CRELD2、TSHZ3、MT2A、CPQ、CLIC3、GNA14、EMCN、AOC3、MT1HL1、FNDC1、PHYHD1、ID3。表達下調基因13個:ELOVL4、HIST3H2A、CENPK、TOP2A、UBE2C、C2orf88、MKX、MANEAL、SLC7A5、CIART、MST4、EPHX4、UBE2T。筆者通過R語言顯示出數據集的差異基因火山圖(圖2A),并繪制DEGs熱圖,體現出差異基因的聚集程度(圖2B)。
2.2??GO功能注釋與KEGG通路富集分析
將74個DEGs通過DAVID進行GO功能注釋分析和KEGG通路富集分析。GO功能分析顯示,生物過程主要集中在細胞對鋅離子反應、細胞對銅離子反應、負性調控增長和細胞對鎘離子反應等;細胞組成分布在細胞核和高爾基體;分子功能有鋅離子結合和金屬離子結合,見表2。DEGs的KEGG通路富集分析顯示涉及礦物質吸收,見表3。
2.3??PPI分析與核心基因篩選
通過String對74個DEGs進行PPI分析,見圖3A。將得到的String文件上傳至Cytoscape3.7.2軟件,利用MCODE插件按節(jié)點得分從大到小的順序分析得到兩簇交點最多的基因簇,分值為6分,具有7個節(jié)點和18條線,將其定義為核心基因,共獲得7個核心基因,且全部為上調基因,包括MT1E、MT1F、MT1G、MT1H、MT1M、MT1X和MT2A,均屬于金屬硫蛋白(metallothioneins,MTs)基因家族,見圖3B。
2.4??核心基因生存預后
使用UALCAN對MT1E、MT1F、MT1G、MT1H、MT1M、MT1X和MT2A進行生存分析發(fā)現,MT1F和MT1M與甲狀腺癌患者生存預后相關(P<0.05),見圖4,高表達組較低/中表達組預后差,生存時間更短。
3??討論
甲狀腺癌發(fā)病率在全世界已引起廣泛的關注,FTC作為少見的分化型甲狀腺癌,在早期經常侵犯血管或包膜,患者預后較差[8]。因此,早期準確診斷FTC尤為重要。隨著生物信息學的發(fā)展,微陣列技術已廣泛應用于各種癌癥的診斷與治療研究,其中包括甲狀腺癌[9]。因此,應用生物信息學技術探索FTC的有效診斷標志物成為可能。
本研究通過GEO下載的基因數據集,以濾泡狀腺瘤為對照組,對數據集進行整合分析,篩選得到74個DEGs,包括表達上調基因61個,表達下調基因13個。GO功能注釋和KEGG富集分析顯示,DEGs主要富集于細胞對鋅離子反應、細胞對銅離子反應、細胞對鎘離子反應、細胞核及金屬離子結合。這些結果表明FTC的惡性發(fā)展機制可能與細胞對某些金屬離子結合吸收存在根本的聯(lián)系或相關性。已有研究報道,當DNA結合區(qū)域中鋅離子缺失或結合力改變時,突變的TP53蛋白將形成無法降解的超穩(wěn)定的微觀或宏觀聚集體在腫瘤細胞中積累,促進癌細胞的侵襲和轉移,甚至形成耐藥[10]。鎘離子在人體中過度積累易導致肝腎功能障礙、骨軟化及造血系統(tǒng)損害[11]。礦物質是人體七大營養(yǎng)素之一,對維持生命至關重要。研究發(fā)現,礦物質的缺乏和不足可能與癌癥有關或增加患癌風險,如維生素D的有效補充和吸收可預防結直腸癌、乳腺癌、前列腺癌等[12-13]。
本研究通過構建差異表達基因PPI網絡,利用MCODE插件計算出7個核心基因,分別為MT1E、MT1F、MT1G、MT1H、MT1M、MT1X、MT2A,均為上調基因并同屬于MTs亞型。MTs是一種低分子量的富含半胱氨酸的胞質蛋白,大量研究表明MTs的表達與癌癥進展及預后有關[14-15]。研究證實MTs在癌組織中的表達與Ki-67呈正相關,包括基底細胞癌、脂肪肉瘤及滑膜肉瘤等,提示MTs與腫瘤細胞增殖相關[16-17]。此外,MTs的過表達可促進胸膜間皮瘤、大腸癌、卵巢癌等多種腫瘤對鉑類藥物的耐藥性[18-20]。Weinlich等[21]通過對1270例黑色素瘤患者隨訪分析,發(fā)現MTs的過表達嚴重降低患者的生存率。而對甲狀腺癌,MTs可能扮演雙重角色。一方面Królicka等[22]與Schmid等[23]研究均證實MTs在FTC中高表達,盡管目前仍缺乏相關研究明確MTs表達上調對FTC的作用機制,但結合本研究生存分析發(fā)現,MT1F、MT1M與甲狀腺癌預后呈負相關,提示MTs可能是促進FTC發(fā)生發(fā)展的關鍵因子;另一方面,研究表明MTs在甲狀腺癌中高表達而在甲狀腺良性病變中低表達,因此MTs還可作為鑒別甲狀腺癌良惡性病變的標志物[24]。
綜上所述,本研究利用生物信息學方法對公共數據進行分析,闡明FTC發(fā)生發(fā)展的重要生物學過程與信號通路,最終發(fā)現以MT1F、MT1M為代表的MTs家族可能是FTC發(fā)生發(fā)展的關鍵基因,為FTC發(fā)生機制的研究及分子靶向治療提供新的視角。但本研究也有不足之處,由于FTC發(fā)病率低,目前缺乏可提供研究基因表達與FTC預后的數據庫,未能進行MTs與FTC的生存分析,有望后續(xù)結合臨床數據探討MTs對FTC患者生存預后的影響。
[參考文獻][1] SEIB?C?D,?SOSA?J?A.?Evolving?understanding?of?the?epidemiology?of?thyroid?cancer[J].?Endocrinol?Metab?Clin?North?Am,?2019,?48(1):?23–35.
[10] GARUFI?A,?FEDERICI?G,?GILARDINI?MONTANI?M?S,?et?al.?Interplay?between?endoplasmic?reticulum?(ER)?stress?and?autophagy?induces?mutant?p53H273?degradation[J].?Biomolecules,?2020,?10(3):?392.
[18] BORCHERT?S,?SUCKRAU?P?M,?WALTER?R?F?H,?et?al.?Impact?of?metallothionein-knockdown?on?cisplatin?resistance?in?malignant?pleural?mesothelioma[J].?Sci?Rep,?2020,?10(1):?18677.