李玫,曾志羽
(廣西醫(yī)科大學(xué)第一附屬醫(yī)院,南寧530021)
·綜述·
冠心病基因組學(xué)方法研究進(jìn)展
李玫,曾志羽
(廣西醫(yī)科大學(xué)第一附屬醫(yī)院,南寧530021)
冠心病(CHD)是導(dǎo)致全球人群死亡和致殘的首要原因之一,其遺傳發(fā)病機(jī)制一直備受關(guān)注。CHD遺傳發(fā)病機(jī)制的基因組學(xué)研究常用方法分為連鎖分析、關(guān)聯(lián)分析、全基因組外顯子測序三種。連鎖分析能發(fā)現(xiàn)部分CHD的致病基因,但精確定位性差,與CHD相關(guān)研究較少。關(guān)聯(lián)分析,特別是全基因組關(guān)聯(lián)分析可彌補(bǔ)連鎖分析的不足,在CHD基因組學(xué)研究方面取得了突破性進(jìn)展,但也存在研究樣本量大、遺傳度丟失等缺點(diǎn)。全基因組外顯子測序具有高通量、高精度、低成本的優(yōu)點(diǎn),是研究CHD遺傳發(fā)病機(jī)制的一種較好方法。
冠狀動脈疾?。贿z傳發(fā)病機(jī)制;連鎖分析;關(guān)聯(lián)分析;全基因組外顯子測序
目前大量研究證明,冠心病(CHD)是由遺傳因素和環(huán)境因素共同作用引起的一種多基因復(fù)雜疾病[1],其中遺傳因素作用占40%~60%[2]。因此從遺傳學(xué)角度來研究CHD有助于在分子水平探究其發(fā)病機(jī)制,使其做到早期診斷及個體化基因治療。長期以來,國內(nèi)外學(xué)者大多應(yīng)用連鎖分析及關(guān)聯(lián)分析兩種方法研究CHD相關(guān)的基因突變位點(diǎn)。近年來,隨著基因組學(xué)研究技術(shù)的快速發(fā)展,推動了一個新的研究方法——全基因組外顯子測序(WES)。目前該方法在單基因疾病和腫瘤的研究中已取得巨大的突破,但是對CHD的研究相對較少?,F(xiàn)就這三種基因組學(xué)方法在CHD的研究進(jìn)展進(jìn)行綜述。
以往CHD基因組學(xué)研究方法大多是通過遺傳標(biāo)記定位尋找與其相關(guān)的基因突變位點(diǎn),采用限制性片段長度多態(tài)性或短串聯(lián)重復(fù)序列標(biāo)記的連鎖分析以及單核苷酸多態(tài)性(SNP)標(biāo)記的關(guān)聯(lián)分析,利用PCR和第一代Sanger測序等技術(shù)對該染色體區(qū)域進(jìn)行分析或定位克隆。
1.1 連鎖分析 連鎖分析主要以家系和同胞對為研究對象,通過遺傳標(biāo)記對其進(jìn)行基因分型,計算遺傳標(biāo)記和性狀基因之間的重組率,估算兩者的連鎖程度和遺傳距離,將候選基因定位到染色體某一區(qū)間內(nèi)的位置。連鎖分析包括參數(shù)連鎖分析和非參數(shù)連鎖分析兩種分析方法,參數(shù)連鎖分析主要以遺傳模式確定的大家系為研究對象;非參數(shù)連鎖分析對多基因疾病的研究有一定優(yōu)勢,主要以同胞對及數(shù)百個小的核心家系為研究對象?,F(xiàn)連鎖分析已成功定位了部分CHD致病基因,如15q26染色體上的MEF2A基因[3]、12q13染色體上的LRP-6基因[4]和13q12-13染色體上的ALOX5AP基因[5]等,但因該方法的局限性,導(dǎo)致僅有少數(shù)基因位點(diǎn)在其他研究中得到了重復(fù)驗證。該方法的局限性有如下幾點(diǎn):第一,該方法因?qū)χ虏⌒愿?,?shù)量少的遺傳變異比較敏感,所以對診斷明確、遺傳與表型一致的單基因疾病更有效,對復(fù)雜性疾病僅提供參考性意見;第二,研究對象主要是目前在世的幾代人,而基因重組在幾代人中發(fā)生的概率較小,所以得到的基因定位區(qū)域往往很大,這導(dǎo)致所得結(jié)果相對準(zhǔn)確、假陽性小,但精細(xì)定位較困難;第三,該方法操作繁瑣且耗時長使得發(fā)現(xiàn)致病基因的效率降低。
1.2 關(guān)聯(lián)分析 關(guān)聯(lián)分析是以散發(fā)人群為研究對象,通過比較病例組和對照組等位基因頻率之間的差異尋找與疾病相關(guān)的基因位點(diǎn),可用于多基因復(fù)雜疾病研究。該方法根據(jù)其掃描對象的不同,分為候選基因關(guān)聯(lián)分析和全基因組關(guān)聯(lián)分析(GWAS)。目前使用較多的是GWAS,它是通過一種高通量基因分型技術(shù)檢測成百上千的SNP,比較病例組和對照組SNP頻率之間的差異,篩選出與疾病性狀相關(guān)聯(lián)的基因位點(diǎn)。與候選基因相比,GWAS是在全基因組范圍內(nèi)尋找與疾病相關(guān)的基因位點(diǎn),所以不需事先做出假設(shè)和篩選出已知的“候選基因”;同時,它具有樣本量大、重復(fù)性好、可多中心研究且一次性可對上萬個SNP進(jìn)行檢測等優(yōu)點(diǎn),因此GWAS在人類遺傳疾病研究得到了廣泛應(yīng)用。
到目前為止,GWAS在CHD遺傳學(xué)方面取得了豐富的成果,共發(fā)現(xiàn)了59個易感基因位點(diǎn)[6]。2007年,WTCCC通過GWAS首次在歐洲人群中發(fā)現(xiàn)了與CHD顯著關(guān)聯(lián)的易感基因位點(diǎn)——9p21區(qū)域[7]。同年,GerMI協(xié)作組通過兩階段的GWAS研究發(fā)現(xiàn)了6個新的遺傳位點(diǎn)[8]。隨后3年,MIGen[9]、心電圖協(xié)會[10]和CHD遺傳協(xié)會[11]等協(xié)作組分別通過對大型數(shù)據(jù)整合,一共發(fā)現(xiàn)了23個新的基因位點(diǎn)。2012年,Lu等[12]在3.3萬余例CHD對照樣本中,成功地鑒定出4個全新的基因位點(diǎn)。2013年,歐洲人群進(jìn)行了更大規(guī)模的數(shù)據(jù)整合,新發(fā)現(xiàn)了15個新的CHD遺傳位點(diǎn)[13]。2015年,Nikpay等[14]在18.5萬病例對照樣本中通過Meta分析,發(fā)現(xiàn)了10個新的基因位點(diǎn)。
盡管GWAS在CHD研究中取得了突破性的進(jìn)展,但目前仍存在許多困難和限制。第一,因GWAS在第一階段研究獲得陽性結(jié)果后,還需進(jìn)行多中心的獨(dú)立樣本驗證,所以需要大量的樣本研究才能獲得較準(zhǔn)確的結(jié)果,這將耗費(fèi)大量的人力和財力,普通的實(shí)驗室難以承擔(dān);第二,種族差異性使結(jié)果難以在不同人群的研究中得到重復(fù)驗證,導(dǎo)致結(jié)果易產(chǎn)生假陽性和假陰性;第三,目前發(fā)現(xiàn)的CHD易感基因,只能解釋小部分的疾病遺傳度,未能解釋的遺傳變異被稱之為遺傳度丟失。隨著易感位點(diǎn)的最小等位基因頻率(MAF)逐漸下降,GWAS需要一定的樣本量才能達(dá)到足夠檢驗效能,所以GWAS鑒定的基因突變位點(diǎn)多為常見變異(MAF>0.05),而對于檢測低頻變異(MAF<0.05)、罕見變異(MAF<0.01)和其他結(jié)構(gòu)的變異較差。
2.1 WES的特點(diǎn) WES是由傳統(tǒng)外顯子捕獲技術(shù)和新一代高通量測序聯(lián)合形成的一種測序方法。由于WES只對外顯子進(jìn)行測序,而外顯子包含蛋白質(zhì)合成所需要的絕大部分信息,雖只占人類基因組約1%,但大約85%的疾病致病突變都位于該區(qū)域,因此與全基因組測序相比,WES具有成本低和效率高的優(yōu)勢。同時,WES也彌補(bǔ)了因GWAS研究得到的基因突變多位于基因間或內(nèi)含子上,很少位于編碼區(qū)的缺陷。另外,WES還具有高通量、高精度等優(yōu)點(diǎn),且對常見變異和罕見變異有高敏感性,能發(fā)現(xiàn)外顯子絕大部分與疾病相關(guān)的變異,尤其是那些基因芯片平臺中不涵蓋的稀有和低頻變異,因此WES既能用于單基因遺傳疾病的研究,也能用于多基因變異引起的常見疾病,以揭示這些疾病的遺傳致病機(jī)理。因該技術(shù)在疾病研究領(lǐng)域的廣泛應(yīng)用和突出貢獻(xiàn),在2010年被《Science》評為年度十大科技突破之一。
2.2 WES的基本流程和原理 WES基本流程包括外顯子序列的富集、高通量測序及數(shù)據(jù)的生物信息學(xué)分析,最后鑒定出相關(guān)基因突變位點(diǎn)。外顯子序列的富集包括捕獲和擴(kuò)增兩個步驟。目前,常用的捕獲方法是雜交法,分為固相雜交或液相雜交,液相雜交因成本低、操作簡單,且具有良好的特異性和均一性被采用得更多,現(xiàn)常用的外顯子捕獲平臺有:Nimble Gen和Agilent Sure Select序列富集系統(tǒng)。富集的主要流程是:先碎片化DNA并在碎片末端連接上接頭,然后與外顯子芯片上的引物進(jìn)行雜交,雜交后洗去未結(jié)合的背景和洗脫雜交的DNA片段,再對富集的DNA片段進(jìn)行PCR擴(kuò)增,最后得到目標(biāo)區(qū)域的富集序列文庫,經(jīng)檢驗合格后進(jìn)行高通量測序。
DNA測序技術(shù)已被廣泛應(yīng)用于生物學(xué)研究的各個領(lǐng)域。新一代高通量測序是一種邊合成邊測序技術(shù),利用循環(huán)芯片測序法對布滿 DNA樣品的芯片進(jìn)行PCR擴(kuò)增以及熒光反應(yīng)來讀取序列。目前,常用的測序技術(shù)平臺有:454基因組測序儀、Illumina測序儀、和SOLID測序。高通量測序的具體流程:利用特定平臺在基因組DNA碎片的兩側(cè)連上接頭,產(chǎn)生幾百萬個PCR單克隆陣列,所有單克隆同時、獨(dú)立地進(jìn)行引物雜交和熒光標(biāo)記的延伸反應(yīng),捕捉熒光標(biāo)記信號,并經(jīng)特殊軟件處理,獲取DNA序列數(shù)據(jù)。
經(jīng)過高通量測序產(chǎn)生的龐大原始數(shù)據(jù),需要進(jìn)行數(shù)據(jù)分析。數(shù)據(jù)分析主要包括圖像信息數(shù)據(jù)分析以及生物信息學(xué)分析。圖像信息數(shù)據(jù)分析是通過特殊的軟件對原始數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)換為序列數(shù)據(jù)。然后利用生物信息學(xué)分析對序列數(shù)據(jù)進(jìn)行過濾、評估以及檢驗其測序深度和覆蓋度,篩選出合格序列,再進(jìn)行序列對比、檢測及注釋SNP、短小的插入或缺失。經(jīng)數(shù)據(jù)分析得到的絕大部分結(jié)果為背景變異,不具有致病性,需要研究者采用各種方法綜合分析得到最后結(jié)果。
2.3 WES在CHD的應(yīng)用 近年來,WES廣泛應(yīng)用于單基因疾病和多基因疾病的研究,有研究表明,對于復(fù)雜疾病而言,散發(fā)病例的易感基因多來源于頻發(fā)的突變或新的突變,而家系的易感基因則大多為可遺傳突變[15]。因此WES對多基因復(fù)雜性疾病,可通過家系樣本進(jìn)行探究,找出致病基因。CHD有明顯的家族聚集性,家族史是其發(fā)病的一個重要危險因素,且獨(dú)立于其他危險因素存在[16]。因此可通過家系研究來尋找其基因突變位點(diǎn)。
迄今,已有多個家系研究利用WES尋找到了CHD的基因突變位點(diǎn)。Erdmann等[17]通過對一個有32例CHD患者的大家系研究發(fā)現(xiàn)了GUCY1A3和CCT7兩個雜合突變,研究者首先對該家系進(jìn)行了微衛(wèi)星連鎖分析,但未發(fā)現(xiàn)與心肌梗死疾病有關(guān)聯(lián)的染色體區(qū)域,然后在家族中篩選出3例有遠(yuǎn)親關(guān)系的患者進(jìn)行WES,在兩個功能性相關(guān)的基因中發(fā)現(xiàn)了這兩個雜合突變位點(diǎn),后經(jīng)過一系列的實(shí)驗對兩個突變位點(diǎn)進(jìn)行功能性分析,最后得出兩個基因突變位點(diǎn)協(xié)同作用引起了心肌梗死。InanlooRahatloo等[18]通過對伊朗一個大家系的研究中發(fā)現(xiàn)了致病基因ST6GALNAC5,他們首先通過連鎖分析得到了三個與候選基因相關(guān)聯(lián)的染色體區(qū)域,然后通過對12例家系成員進(jìn)行了外顯子測序,發(fā)現(xiàn)了ST6GALNAC5基因突變位點(diǎn),接下來分別在伊朗160例患者和800例對照組及美國150例患者和800例對照組進(jìn)行該位點(diǎn)測序驗證,最后得到突變位點(diǎn)為引起CHD的一個致病位點(diǎn)。Xu等[19]在一個四代皆有CHD患者的漢族家系中驗證了一個EFM2A突變,首先研究者通過對該家系的3例患者進(jìn)行外顯子測序,發(fā)現(xiàn)了該突變位點(diǎn),然后利用Sanger測序在7例患者的11號外顯子上發(fā)現(xiàn)了一個6bp堿基的缺失,接著在311例早發(fā)冠心病患者和323例未患病者進(jìn)行了驗證,沒有發(fā)現(xiàn)該突變位點(diǎn),但結(jié)合之前相關(guān)的研究,研究者認(rèn)為該位點(diǎn)對冠心病的發(fā)生仍具有重要意義。Xie等[20]在一個早發(fā)心梗家系中發(fā)現(xiàn)了RECQL5基因突變位點(diǎn),通過對家系中10例成員進(jìn)行外顯子測序,其中4例是CHD患者,在13號染色體上發(fā)現(xiàn)了該突變位點(diǎn),接著利用RT-PCR技術(shù)驗證由于12號外顯子的缺失導(dǎo)致了CHD的發(fā)生。
2.4 WES的局限性 目前,WES在研究人類遺傳疾病上取得了一定成功,但是該技術(shù)也有一定的局限性,主要存在以下問題。首先,WES缺少了對非編碼區(qū)變異和結(jié)構(gòu)變異的研究,雖然大部分的致病基因位于外顯子,但仍有小部分位于非編碼區(qū)或由結(jié)構(gòu)變異引起,所以有可能會導(dǎo)致致病基因的遺漏;其次,該技術(shù)因存在捕獲不均、捕獲偏差等現(xiàn)象,導(dǎo)致不能完全地捕獲變異的外顯子序列,現(xiàn)人類通過增加測序深度,獲得更多的序列信息進(jìn)行統(tǒng)計分析,以盡可能的彌補(bǔ)這些偏差;最后,該技術(shù)的成本較之前降低了很多,但是在研究復(fù)雜疾病的罕見突變時,仍需要龐大的樣本量及高額的測序費(fèi)用。
隨著基因組學(xué)技術(shù)的蓬勃發(fā)展,研究基因組的技術(shù)手段也日新月異。連鎖分析雖然發(fā)現(xiàn)了部分CHD致病基因,但因其精確定位性差等局限性,導(dǎo)致與CHD相關(guān)研究并不多;關(guān)聯(lián)分析的出現(xiàn)彌補(bǔ)了連鎖分析的不足,特別是GWAS,因其各方面的優(yōu)勢,在CHD基因組學(xué)方面取得了突破性進(jìn)展,但也因其樣本量大、遺傳度丟失等缺點(diǎn),使得CHD的研究處于“瓶頸期”;WES的出現(xiàn)提供了一個轉(zhuǎn)機(jī),WES具有高通量、高精度、低成本的優(yōu)點(diǎn),是一種很好的研究CHD的方法。目前CHD通過GWAS研究在散發(fā)人群中已取得了突破性進(jìn)展,但關(guān)于家系的研究仍舊較少,而WES的研究對象既可以是散發(fā)人群也可以是家系,因此可以以家系作為研究對象尋找CHD的基因突變位點(diǎn),現(xiàn)已有研究通過此方法發(fā)現(xiàn)了與CHD相關(guān)的基因突變位點(diǎn),證明此方法是可行的。經(jīng)上述三種方法研究,CHD在基因組學(xué)方面取得了一定的成就,但它們都有各自局限性,因此在今后的研究中,需要繼續(xù)完善各個基因組研究方法,為了解CHD發(fā)病機(jī)制和實(shí)現(xiàn)個體化治療提供新的見解。
[1] 陳偉偉,高潤霖,劉力生,等.《中國心血管病報告2015》概要[J].中國循環(huán)雜志,2016,31( 6):521-528.
[2] McPherson R,Tybjaerg-Hansen A.Genetics of coronary artery disease[J].Circ Res,2016,118(4):564-578.
[3] Wang L,F(xiàn)an C,Topol SE,et al.Mutation of MEF2A in an inherited disorder with features of coronary artery disease[J].Science,2003,302(5650):1578-1581.
[4] Mani A,Radhakrishnan J,Wang H,et al.LRP6 mutation in a family with early coronary disease and metabolic risk factors[J].Science,2007,315(5816):1278-1282.
[5] Helgadottir A,Manolescu A,Thorleifsson G,et al.The gene encoding 5-lipoxygenase activating protein confers risk of myocardial infarction and stroke[J].Nat Genet,2004,36(3):233-239.
[6] Nurnberg ST,Zhang H,Hand NJ,et al.From loci to biology:functional genomics of genome-wide association for coronary disease[J].Circ Res,2016,118(4):586-606.
[7] Wellcome Trust Case Control C.Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls[J].Nature,2007,447(7145):661-678.
[8] Samani NJ,Erdmann J,Hall AS,et al.Genomewide association analysis of coronary artery disease[J].N Engl J Med,2007,357(5):443-453.
[9] Myocardial Infarction Genetics C,Kathiresan S,Voight BF,et al.Genome-wide association of early-onset myocardial infarction with single nucleotide polymorphisms and copy number variants[J].Nat Genet,2009,41(3):334-341.
[10] Schunkert H,Konig IR,Kathiresan S,et al.Large-scale association analysis identifies 13 new susceptibility loci for coronary artery disease[J].Nat Genet,2011,43(4):333-338.
[11] Coronary Artery Disease Genetics C.A genome-wide association study in Europeans and South Asians identifies five new loci for coronary artery disease[J].Nat Genet,2011,43(4):339-344.
[12] Lu X,Wang L,Chen S,et al.Genome-wide association study in Han Chinese identifies four new susceptibility loci for coronary artery disease[J].Nat Genet,2012,44(8):890-894.
[13] Consortium CA,Deloukas P,Kanoni S,et al.Large-scale association analysis identifies new risk loci for coronary artery disease[J].Nat Genet,2013,45(1):25-33.
[14] Nikpay M,Goel A,Won HH,et al.A comprehensive 1,000 genomes-based genome-wide association meta-analysis of coronary artery disease[J].Nat Genet,2015,47(10):1121-1130.
[15] Sebat J,Lakshmi B,Malhotra D,et al.Strong association of de novo copy number mutations with autism[J].Science,2007,316(5823):445-449.
[16] Kim C,Chang HJ,Cho I,et al.Impact of family history on the presentation and clinical outcomes of coronary heart disease:data from the Korea acute myocardial infarction registry[J].Korean J Intern Med,2013,28(5):547-556.
[17] Erdmann J,Stark K,Esslinger UB,et al.Dysfunctional nitric oxide signalling increases risk of myocardial infarction[J].Nature,2013,504(7480):432-436.
[18] InanlooRahatloo K,Parsa AF,Huse K,et al.Mutation in ST6GALNAC5 identified in family with coronary artery disease[J].Sci Rep,2014,4:3595.
[19] Xu DL,Tian HL,Cai WL,et al.Novel 6-bp deletion in MEF2A linked to premature coronary artery disease in a large Chinese family[J].Mol Med Rep,2016,14(1):649-654.
[20] Xie X,Zheng YY,Adi D,et al.Exome sequencing in a family identifies RECQL5 mutation resulting in early myocardial infarction[J].Medicine (Baltimore),2016,95(5):e2737.
10.3969/j.issn.1002-266X.2017.01.036
R541.1
A
1002-266X(2017)01-0099-04
2016-09-05)