閆 安 關(guān)煦慧子 蔚 田 繆 剛 趙艷陽(yáng)
(1.北京醫(yī)院/北京老年醫(yī)學(xué)研究所 國(guó)家老年醫(yī)學(xué)中心,北京 100730;2.北京醫(yī)院普通外科,北京 100730)
近年來(lái),我國(guó)甲狀腺癌的發(fā)病率呈快速升高趨勢(shì),2017年新增的患者例數(shù)已居全球甲狀腺癌新增患者例數(shù)首位[1-2]。目前,甲狀腺癌的診斷主要依靠B超引導(dǎo)下甲狀腺穿刺活檢,但其存在明顯不足:1)屬于有創(chuàng)檢查,且穿刺覆蓋面有限,易漏診;2)主要針對(duì)>1 cm的結(jié)節(jié)[3],不適用于早期診斷;3)僅可獲取微量細(xì)胞,準(zhǔn)確診斷需要經(jīng)驗(yàn)豐富的影像學(xué)和病理學(xué)醫(yī)師,基層醫(yī)療機(jī)構(gòu)難以開(kāi)展。因此,尋找適用于甲狀腺癌早期篩查的特異性生物標(biāo)志物是目前亟待解決的問(wèn)題。識(shí)別新的甲狀腺癌易感基因可以為尋找早期篩查甲狀腺癌高危人群的生物標(biāo)志物提供依據(jù)。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)遺傳病因?qū)W研究發(fā)現(xiàn),PTC發(fā)病具有較強(qiáng)的家族遺傳傾向[4-8]和高遺傳異質(zhì)性[5]。家族性PTC占甲狀腺癌總發(fā)病的5%~10%[9]。大型流行病學(xué)研究結(jié)果提示甲狀腺癌患者的一級(jí)親屬是該病的高發(fā)人群[4,10],一級(jí)親屬的患病風(fēng)險(xiǎn)較對(duì)照者高6.8倍[4],其中雙胞胎同胞的患病風(fēng)險(xiǎn)比對(duì)照者高23倍[10]。
目前,國(guó)內(nèi)外學(xué)者相繼完成了7項(xiàng)甲狀腺癌全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS),并在人類(lèi)基因組中定位了28個(gè)PTC風(fēng)險(xiǎn)位點(diǎn),如位于紅細(xì)胞膜蛋白帶4.1樣4A(erythrocyte membrane protein band 4.1 like 4A,EPB41L4A)基因非編碼區(qū)的rs73227498位點(diǎn)[11]。GWAS結(jié)果提示與這些風(fēng)險(xiǎn)位點(diǎn)連鎖的基因中可能存在PTC的易感基因變異。為驗(yàn)證這一推測(cè),本研究擬對(duì)我國(guó)500例無(wú)血緣關(guān)系的散發(fā)PTC患者的外周血白細(xì)胞基因組DNA進(jìn)行全外顯子組測(cè)序(whole exome sequencing,WES),靶向分析GWAS定位的28個(gè)候選基因的蛋白編碼區(qū)和側(cè)翼選擇性剪接位點(diǎn)序列中潛在影響蛋白編碼的罕見(jiàn)變異,并利用多個(gè)大型非腫瘤對(duì)照人群的高質(zhì)量基因分型數(shù)據(jù)進(jìn)行病例-對(duì)照關(guān)聯(lián)分析和變異的功能研究,識(shí)別中國(guó)人群PTC的新易感基因變異,為尋找可用于甲狀腺癌早期篩查且易于檢測(cè)的特異性生物標(biāo)志物提供依據(jù)。
選取2018—2020年北京醫(yī)院行手術(shù)治療的286例PTC患者,其中男81例、女205例,年齡21~80歲,用于識(shí)別PTC候選基因的變異位點(diǎn)。另選取2021—2022年北京醫(yī)院行手術(shù)治療的214例PTC患者,其中男73例、女141例,年齡25~83歲,用于驗(yàn)證變異位點(diǎn)的突變頻率。500例PTC患者均為散發(fā)的、無(wú)血緣關(guān)系的中國(guó)漢族人,其中56例僅有頸部淋巴轉(zhuǎn)移,70例僅有甲狀腺外侵襲,66例同時(shí)有頸部淋巴轉(zhuǎn)移和甲狀腺外侵襲。納入標(biāo)準(zhǔn):1)術(shù)后經(jīng)病理學(xué)檢查確診為PTC;2)能夠獲取外周血白細(xì)胞計(jì)數(shù)結(jié)果和甲狀腺癌組織、癌旁組織。排除標(biāo)準(zhǔn):1)伴有其他部位、其他類(lèi)型的原發(fā)性惡性腫瘤;2)有血緣關(guān)系的PTC患者。對(duì)照人群的基因分型數(shù)據(jù)均來(lái)自公共數(shù)據(jù)庫(kù)的高質(zhì)量WES和全基因組測(cè)序數(shù)據(jù),包括gnomAD數(shù)據(jù)庫(kù)和TOPMed數(shù)據(jù)庫(kù)(包含多人種非腫瘤人群數(shù)據(jù))和ChinaMAP數(shù)據(jù)庫(kù)、HUABIAO數(shù)據(jù)庫(kù)(包含非腫瘤中國(guó)人群的數(shù)據(jù))。本研究經(jīng)北京醫(yī)院倫理委員會(huì)批準(zhǔn)(2021BJYYEC-044-02),所有研究對(duì)象均知情同意。
GWAS定位的28個(gè)PTC候選基因[12-18]為:ARSB、BATF、DIRC3、EPB41L4A、FHIT、FOXA2、FOXE1、GALNT18、HTR1B、IMMP2L、INSR、MBIP、MSRB3、NKX2-1、NREP、NRG1、PCNX2、PTCSC3、RARRES1、SEPTIN11、SLC8B1、SMAD3、SNAPC4、SPATA13、STN1、TERT、VAV3和WDR11。
采集所有患者外周靜脈血2 mL,室溫條件下離心分離白細(xì)胞。采用酚-氯仿法抽提白細(xì)胞DNA。采用TRIzol試劑(美國(guó)Invitrogen公司)提取外周血白細(xì)胞和癌組織、癌旁組織的總RNA。取1 μg白細(xì)胞基因組DNA,采用SureSelect Human All Exon V6 and V8試劑盒(美國(guó)安捷倫公司)建庫(kù),在Novaseq S6000高通量測(cè)序平臺(tái)(美國(guó)Illumina公司)進(jìn)行150 bp雙端測(cè)序。原始測(cè)序數(shù)據(jù)經(jīng)質(zhì)控篩選,采用BWA(ver 0.7.15-r1140)軟件與人類(lèi)基因組參考序列GRCh37進(jìn)行比對(duì),由ANNOVAR分析軟件完成變異注釋。隨后靶向分析28個(gè)PTC關(guān)聯(lián)基因的蛋白編碼區(qū)及其側(cè)翼選擇性剪接序列,篩選出符合下列條件的變異:1)人群中變異頻率<0.1%;2)物種間高度保守;3)生物信息學(xué)預(yù)測(cè)存在損傷蛋白結(jié)構(gòu)和/或功能的單核苷酸變異和微小缺失/插入變異。各物種的蛋白氨基酸序列下載自美國(guó)國(guó)立生物技術(shù)信息中心(the National Center for Biotechnology Information,NCBI)數(shù)據(jù)庫(kù),采用Cluster 3.0軟件進(jìn)行氨基酸同源比對(duì)分析。
采用等位基因特異性定量聚合酶鏈反應(yīng)(allele-specific quantitative polymerase chain reaction,AS-qPCR)檢測(cè)PTC患者組織或白細(xì)胞mRNA 中候選變異的等位基因表達(dá)情況,以管家基因EIF4H作為內(nèi)參。EPB41L4Ars1455421289變異的等位基因特異性引物:野生型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCG-3',下游引物為5'-CCAAAATACAAAGTATATGGAGGTCCAGTGTTGA-3';突變型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCC-3',下游引物為5'-GACGGCCCTGAAGGACATCTTGCT-3'。
采用AS-qPCR檢測(cè)所有患者外周血白細(xì)胞基因組DNA 中候選變異野生型和突變型等位基因的拷貝數(shù)變化。以單拷貝基因FOXP2的DNA拷貝數(shù)作為內(nèi)參。EPB41L4Ars1455421289變異的等位基因特異性引物:野生型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCC-3',突變型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCG-3',共用的下游引物為5'-CCACCTAAAACCATATCAGGAAAAGCCAGAG-3'。
采用SPSS 16.0軟件進(jìn)行統(tǒng)計(jì)分析。通過(guò)病例-對(duì)照關(guān)聯(lián)檢測(cè)評(píng)估變異位點(diǎn)對(duì)PTC發(fā)病風(fēng)險(xiǎn)的影響,采用比值比(odds ratio,OR)值和95%可信區(qū)間(confidence interval,CI)表示風(fēng)險(xiǎn)程度。采用Fisher精確檢驗(yàn)比較2個(gè)組之間變異攜帶頻率的差異。采用Mann-WhitneyU檢驗(yàn)比較變異等位基因表達(dá)和基因組拷貝數(shù)變化。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
WES的測(cè)序深度為97.74×~269.96×,平均測(cè)序深度為126.50×。有97.85%的堿基測(cè)序深度>10×。靶向分析共發(fā)現(xiàn)121個(gè)發(fā)生在蛋白編碼區(qū)的單核苷酸變異,未發(fā)現(xiàn)微小缺失/插入變異。位于EPB41L4A基因上的2個(gè)極罕見(jiàn)錯(cuò)義突變[rs1455421289位點(diǎn)c.163G>C:p.D55H(chr5:112307427,NM_001347887.2)和rs761977647位點(diǎn)c.855G>C:p.W285C(chr5:111576448,NM_001347887.2)]潛在影響了編碼蛋白的功能。rs1455421289是EPB41L4A基因蛋白編碼序列上第165位G到C的堿基突變,該堿基轉(zhuǎn)換導(dǎo)致第55位的天冬氨酸轉(zhuǎn)變?yōu)榻M氨酸。rs761977647是EPB41L4A基因蛋白編碼序列上第855位G到C的堿基變異,該堿基轉(zhuǎn)換導(dǎo)致蛋白第285位的色氨酸突變?yōu)榘牍獍彼?。生物信息學(xué)軟件SIFT、PolyPhen-2和CADD的預(yù)測(cè)分析結(jié)果顯示,rs1455421289位點(diǎn)c.163G>C:p.D55H突變和rs761977647位點(diǎn)c.855G>C:p.W285C突變可能損傷EPB41L4A蛋白的結(jié)構(gòu)或功能,見(jiàn)表1和圖1。這2個(gè)錯(cuò)義突變的野生型氨基酸在物種進(jìn)化上呈現(xiàn)高度保守,見(jiàn)圖2。
表1 EPB41L4A基因2個(gè)極罕見(jiàn)錯(cuò)義突變分析
圖1 rs1455421289位點(diǎn)c.163G>C:p.D55H變異和rs761977647位點(diǎn)c.855G>C:p.W285C變異在EPB41L4A蛋白氨基酸一級(jí)結(jié)構(gòu)中的分布
圖2 rs1455421289位點(diǎn)和rs761977647位點(diǎn)的野生型氨基酸殘基在物種間的進(jìn)化保守性分析
286例PTC患者中,有3例攜帶rs1455421289位點(diǎn)c.163G>C:p.D55H 變異,1 例攜帶rs761977647位點(diǎn)c.855G>C:p.W285C變異。這2個(gè)位點(diǎn)在4個(gè)對(duì)照人群(gnomAD數(shù)據(jù)庫(kù)、TOPMed數(shù)據(jù)庫(kù)、ChinaMAP數(shù)據(jù)庫(kù)、HUABIAO數(shù)據(jù)庫(kù))中的攜帶頻率均<0.05%,見(jiàn)表1。
在214 例PTC 患者中,有1 例攜帶rs1455421289位點(diǎn)c.163G>C:p.D55H變異,未發(fā)現(xiàn)rs761977647位點(diǎn)c.855G>C:p.W285C變異。在所有500例PTC患者中,rs1455421289的突變頻率為0.8%(4/500),rs761977647的突變頻率為0.2%(1/500)。
以4個(gè)大型人群數(shù)據(jù)庫(kù)(gnomAD數(shù)據(jù)庫(kù)、TOPMed數(shù)據(jù)庫(kù)、ChinaMAP數(shù)據(jù)庫(kù)、HUABIAO數(shù)據(jù)庫(kù))中的282 120名非腫瘤個(gè)體的高質(zhì)量基因分型數(shù)據(jù)作為對(duì)照,分別與PTC患者進(jìn)行病例-對(duì)照關(guān)聯(lián)分析,其中g(shù)nomAD數(shù)據(jù)庫(kù)(134 187名)和TOPMed數(shù)據(jù)庫(kù)(132 345名)是非中國(guó)人群的基因分型數(shù)據(jù),ChinaMAP(10 588名)和HUABIAO(5 000名)是中國(guó)人群的基因分型數(shù)據(jù)。在gnomAD數(shù)據(jù)庫(kù)和TOPMed數(shù)據(jù)庫(kù)的對(duì)照人群中,分別有2名和5名攜帶rs1455421289 位點(diǎn)c.163G>C:p.D55H變異,而ChinaMAP數(shù)據(jù)庫(kù)和HUABIAO數(shù)據(jù)庫(kù)中無(wú)個(gè)體攜帶該變異,因此正常人群該位點(diǎn)的突變頻率為0.002 5%(7/282 120)。與4個(gè)對(duì)照人群比較,攜帶rs1455421289位點(diǎn)c.163G>C:p.D55H變異者PTC發(fā)生風(fēng)險(xiǎn)顯著升高(OR值分別為40.3、85.4、213.5、541.1,95%CI分別為4.5~361.5、9.5~765.4、57.2~797.2、98.9~2 960.8,P<0.001 )。
在變異攜帶者的癌組織、癌旁組織中,EPB41L4A基因突變型的mRNA相對(duì)表達(dá)量均顯著高于野生型mRNA(P<0.01)。在變異攜帶者外周血白細(xì)胞mRNA中,野生型等位基因G和突變型等位基因C的相對(duì)拷貝數(shù)差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。見(jiàn)圖3。
圖3 EPB41L4A基因rs1455421289位點(diǎn)野生型和突變型等位基因表達(dá)和基因組拷貝數(shù)比較
識(shí)別甲狀腺癌新易感基因?qū)谞钕侔└呶H巳旱脑缙诤Y查和健康監(jiān)測(cè)具有潛在的臨床應(yīng)用價(jià)值。為精細(xì)定位甲狀腺癌的遺傳病因,研究人員在歐洲和亞洲人群中分別進(jìn)行了數(shù)次甲狀腺癌GWAS[11-12,19],并在人類(lèi)染色體8p12、9q22.33和14q13.3上頻繁定位到PTC的關(guān)聯(lián)信號(hào)[11-12,19-20]。染色體的定位數(shù)據(jù)提示與這3個(gè)區(qū)域緊密連鎖的基因NRG1(8p12)、FOXE1(9q22.33)和NKX2-1(14q13.3)中可能存在PTC的易感變異。然而,本研究對(duì)500例中國(guó)漢族PTC患者的這些基因進(jìn)行蛋白編碼區(qū)和選擇性剪接位點(diǎn)的靶向測(cè)序分析,未發(fā)現(xiàn)潛在的、損害蛋白結(jié)構(gòu)或功能的變異位點(diǎn)。本研究的數(shù)據(jù)提示PTC具有較強(qiáng)的遺傳異質(zhì)性。這3個(gè)候選基因的蛋白非編碼區(qū)也可能存在增加PTC風(fēng)險(xiǎn)的表達(dá)數(shù)量性狀變異位點(diǎn)(expression quantitative trait locus,eQTL)[12]。
EPB41L4A基因編碼的蛋白屬于FERM蛋白家族。該蛋白家族主要參與調(diào)節(jié)細(xì)胞骨架的重排、細(xì)胞內(nèi)運(yùn)輸和WNT/β-catenin癌信號(hào)的傳遞[21]。EPB41L4A在正常甲狀腺組織中的表達(dá)豐度較高,但其在甲狀腺癌中的作用尚不明確。2017年,一項(xiàng)基于冰島人群PTC的GWAS在EPB41L4A基因下游12 kb處識(shí)別到1個(gè)與PTC關(guān)聯(lián)的常見(jiàn)變異rs73227498A>T(OR=1.37,95%CI為1.23~1.49)[11]。后續(xù)的功能實(shí)驗(yàn)數(shù)據(jù)顯示,與攜帶rs73227498野生基因型AA的患者比較,攜帶純和變異基因型TT的患者甲狀腺組織中EPB41L4A的mRNA及其非編碼RNA(EPB41L4A-203)的表達(dá)均顯著增加[22]。該結(jié)果提示rs73227498變異可能以順式調(diào)控的機(jī)制影響上游基因EPB41L4A在PTC患者甲狀腺組織中的表達(dá)。
本研究通過(guò)對(duì)候選基因EPB41L4A進(jìn)行靶向測(cè)序,在4個(gè)無(wú)親緣關(guān)系的中國(guó)PTC患者中識(shí)別到1個(gè)頻發(fā)的新PTC易感變異rs1455421289(c.163G>C:p.D55H),其在患者中的突變頻率為0.8%(4/500)。在包括15 588名中國(guó)對(duì)照個(gè)體在內(nèi)的282 120名非腫瘤對(duì)照人群中,僅有7名個(gè)體攜帶該突變,這一突變?cè)谡€(gè)體中的突變頻率為0.002 5%(7/282 120)。罕見(jiàn)rs1455421289C位點(diǎn)變異攜帶者的PTC發(fā)生風(fēng)險(xiǎn)顯著增加(P<0.001)。
rs1455421289(c.G163C:p.D55H)罕見(jiàn)錯(cuò)義突變位于EPB41L4A基因的FERM功能結(jié)構(gòu)域,氨基酸殘基D55在進(jìn)化中高度保守,提示該天冬氨酸可能在維系EPB41L4A蛋白的正常結(jié)構(gòu)和功能中發(fā)揮重要作用。本研究的功能實(shí)驗(yàn)數(shù)據(jù)表明,rs1455421289(c.G163C:p.D55H)變異是一個(gè)功能性蛋白編碼變異,其C等位基因(突變型)顯著地增加了患者甲狀腺組織和外周血白細(xì)胞中突變mRNA的表達(dá)豐度。在變異攜帶患者的DNA中,本研究對(duì)該變異位點(diǎn)的野生型和突變型等位基因的拷貝數(shù)進(jìn)行分析,排除了突變型mRNA表達(dá)豐度的升高是由突變型等位基因拷貝數(shù)增加所致。這提示該變異可能增強(qiáng)了患者甲狀腺細(xì)胞中突變mRNA的轉(zhuǎn)錄和/或增加了突變mRNA的穩(wěn)定性。結(jié)合rs1455421289在正常對(duì)照人群中的變異頻率、PTC的發(fā)生風(fēng)險(xiǎn),以及生物信息學(xué)預(yù)測(cè)和功能實(shí)驗(yàn)證據(jù),本研究將EPB41L4A(c.G163C:p.D55H)變異判定為潛在致病性變異。
綜上所述,本研究基于WES識(shí)別出1個(gè)中國(guó)人群PTC的高風(fēng)險(xiǎn)變異rs1455421289,在大樣本量PTC患者中驗(yàn)證該變異的突變頻率有助于進(jìn)一步明確其在PTC發(fā)生中的遺傳風(fēng)險(xiǎn)。此外,進(jìn)一步探討該罕見(jiàn)突變的生物學(xué)功能也有助于認(rèn)識(shí)EPB41L4A基因在甲狀腺癌發(fā)生中的作用機(jī)制。