葛蕓英,陳 松,張廣峰
?
中國漢族人群GH1基因啟動子區(qū)單體型及與身高的關(guān)系
葛蕓英,陳 松*,張廣峰
(公安部物證鑒定中心,北京 100038)
ABATRACT: Objective The aim of this study is to investigate the single nucleotide polymorphisms (SNPs) located at the GH1 gene proximal to promoter region in Chinese Han population, and to explore its haplotype association with adult height. Methods SNP typing was performed by direct DNA sequencing in a control Chinese population of 109 unrelated male adults. By using both allele-specifi c PCR and the Haploview software, the haplotypes on the basis of the SNPs were obtained. Haplo.stats software was employed to analyze the association between haplotype and adult height. Results 69 samples were successfully genotyped with 34 samples bearing at least two polymorphic sites. 13 SNPs were found in the GH1 gene proximal to promoter region in Chinese Han population, and three of them located at sites of ?261, ?250 and +20, were discovered for the fi rst time. The same results of haplotypes were obtained by using both allele-specifi c PCR and Haploview software. Three tag SNPs were found at ?278, ?57 and ?6 sites. Seven haplotypes were detected (GGA、GGG、GTA、TGA、TGG、TTA、TTG), and statistical results indicated that people with TTA, GGG and TTG haplotypes were signifi cantly shorter in height than those with GTA, the most common type in Chinese Han population (P<0.05). Conclusions Computation of haplotypes on SNPs based on the population data is relatively correct and can be applied to the haplotype analysis independently. The GH1 gene proximal to promoter region in Chinese Han population is highly polymorphic and differs among races, and its haplotypes may contribute to the human height. Taken together, this paper provides essential data on the associations between human height and GH1 proximal haplotypes.
摘要:目的 研究中國漢族人群GH1基因啟動子區(qū)域的單核苷酸多態(tài)性及其在中國漢族人群中的分布規(guī)律,建立其單體型分析方法并探索與成年人身高間的關(guān)系,為今后個體身高特征推測研究奠定基礎(chǔ)。方法 采用直接測序法進行SNP檢測,獲得其分型數(shù)據(jù);采用等位位點特異性PCR方法和基于人群的單體型推斷方法分別進行單體型分析,并采用Haplo.stats軟件構(gòu)建單體型與身高的廣義線性模型。結(jié)果 GH1基因啟動子區(qū)域含有多個SNP位點,在前人研究的基礎(chǔ)上發(fā)現(xiàn)了?261、?250、+20三個新SNP位點;找到? 278、?57、?6三個標(biāo)簽SNP位點,以最常見的單體型GTA為參照,TTA、GGG、TTG攜帶者的身高更矮(P<0.05),差異具有統(tǒng)計學(xué)意義。結(jié)論 基于人群的單體型推斷方法是一種比較準(zhǔn)確可行的方法,可以在后續(xù)的研究中單獨使用,不需要再進行復(fù)雜費時的等位位點特異性PCR操作;GH1基因啟動子區(qū)域在中國漢族人群中表現(xiàn)出高度多態(tài)性,并存在一定的人種差異;GH1基因啟動子區(qū)域的序列及單體型與身高存在一定的關(guān)系。
關(guān)鍵詞:GH1啟動子;單核苷酸多態(tài)性;等位位點特異性PCR;單體型;計算機輔助單體型計算;身高
人的身高是案件分析中對犯罪分子進行刻畫的重要指標(biāo)之一,由環(huán)境因素及多個遺傳基因共同決定。研究表明個體營養(yǎng)、青春期中的能量消耗、疾病、甚至社會心理因素[1]都能顯著影響成年后能達到的最后身高;同時許多研究也表明成人身高具有較強的家庭聚集效應(yīng),其中同卵雙生子間的身高相關(guān)性為0.9,遺傳率估計值為75%~90%[2,3],說明遺傳因素對個體身高差異起主要作用。目前,已發(fā)現(xiàn)的與身高相關(guān)的基因包括維生素D受體、PTH/PTHrP受體基因、雌激素及其受體基因、Y染色體上特異生長基因及GH1基因等。近年來的研究顯示處于連鎖不平衡的、相鄰的SNPs位點傾向于以單體型的形式整體遺傳給后代。單體型研究可減少關(guān)聯(lián)研究中基因分型的工作量,提供比單個SNP更為豐富的信息,并且有助于對低頻率變異(MAF<10%)信息的利用。目前單體型的分析方法分成兩種:一種是通過生物信息學(xué)間接推斷,另一種是通過實驗直接分析[4]。通過信息學(xué)的方法間接推斷單體型的方法分成兩類,一類是基于譜系的單體型推斷方法;一類是基于人群的單體型推斷方法[5]。譜系推斷是通過追溯染色體片段的傳遞來推斷單體型狀態(tài),為緊密連鎖的SNPs提供真實的連鎖相信息[6]。基于人群的單體型推斷方法是基于統(tǒng)計理論進行演算,從而推斷出個體的單體型。而對于單體型的實驗直接分析,則是通過實驗方法將體細(xì)胞二倍體中兩個幾乎相同的同源染色體分離開[7]。耶魯大學(xué)的Kidd等人建立了等位位點特異性PCR方法(allele-specific PCR)[8],該方法選擇一個雜合SNP位點作為分離兩條同源染色體的基礎(chǔ),然后分別用3’端與SNP位點互補的特異引物進行PCR擴增,每次僅擴增同源染色體中的一條DNA鏈,由此將兩條幾乎相同的同源DNA分離;再對分開的DNA鏈上SNP位點進行分析,得到一條鏈上的單體型結(jié)果。另外基于探針雜交和熒光共振能量轉(zhuǎn)移(FRET)的原理判斷PCR擴增產(chǎn)物上的SNPs的解鏈溫度曲線分析(melting curve analysis of hybridization probes)[9]方法和聚合酶克隆法(polymerase colony or polony)[10]也可以直接對單體型進行分析。本研究嘗試采用等位位點特異性PCR和基于人群數(shù)據(jù)的單體型推斷等兩種方法分別構(gòu)建單體型并探索其對身高的影響。
1.1 樣 本
109例中國漢族已知身高的無關(guān)男性志愿者個體的血卡樣本。
1.2 試劑與儀器
MagAttract DNA MiniM48 kit(QIAGEN,德國)、Takara Tag HS酶(Takara,中國)、內(nèi)標(biāo)LIZ-500(Life Technologies,美國)、BioRobot M48(QIAGEN,德國)、Eppendorf梯度PCR儀(QIAGEN,德國)、AB 3130遺傳分析儀(Life Technologies,美國)等。
1.3 實驗方法
1.3.1 血斑.1 DNADNA提取
參照MiniM48 kit操作步驟并作適當(dāng)調(diào)整。
1.3.2 PCRPCR擴增及檢測分析
用Primer3軟件設(shè)計引物GHP5(5’-CTGACCCA GGAGTCCTCAGC-3’)和 GHP3(5’CGCTTACCTGT AGCCATTGC-3’)擴增599 bp的GH1基因啟動子區(qū)域。采用降落PCR(touch down PCR)方法,擴增反應(yīng)采用50 μ L體系,包含:5 μL的10×PCR Buffer (Mg2+Plus),4 μL的dNTP(10 mmol/L),1.25 μL的引物P1/P2(10 μmol/L),1μL的Takara Tag HS酶(5 U/μL)和5 μL的模板DNA。PCR擴增反應(yīng)在Eppendorf梯度PCR儀上進行。
擴增條件:94℃ 5 min;之后94℃ 30 s,69℃~59℃30 s (前10個循環(huán)每循環(huán)降低退火溫度1℃,后25個循環(huán)退火溫度為59℃),72℃ 1 min;72℃ 10 min。
1.3.3 PCRPCR產(chǎn)物測序及序列分析
產(chǎn)物經(jīng)瓊脂糖電泳檢測后進行雙向測序。采用CHROMAS軟件對原始電泳圖進行分析,其中存在SNP多態(tài)性位點用簡并堿基代替。用DNAman對雙向測序結(jié)果進行序列拼接,獲得完整序列。使用Vector NTI軟件進行序列比對。
1.3.4 等位位點特異性PCRPCR
基于測序結(jié)果,選擇包含2個或2個以上多態(tài)性位點的30個樣品進行單體型分析。根據(jù)每個樣品的SNP位點設(shè)計特異性引物對樣品進行等位位點特異性PCR,PCR產(chǎn)物進行直接測序后分析其序列和單體型。結(jié)合第一步兩條同源染色體測序的結(jié)果和其SNP的組成,則可以推斷出另外一條同源染色體的單體型。等位位點特異性PCR引物序列見表1。
1.3.5 連鎖不平衡分析及單體型構(gòu)建
使用 Haploview4.2軟件對樣品GH1基因啟動子區(qū)域的測序結(jié)果進行連鎖不平衡分析。應(yīng)用R2.10.1軟件運行Haplo.stats1.4.3程序包,執(zhí)行haplo.em模塊來估計單體型頻率(實質(zhì)為分布、構(gòu)成比)及每個個體單體型的可能性。
1.3.6 單因素分析及模型構(gòu)建
應(yīng)用Stata 11.2軟件進行統(tǒng)計分析,將各基因型以啞變量的形式引入多元線性回歸模型,對69個樣品進行雙側(cè)檢驗,若P<0.05則認(rèn)為差異有統(tǒng)計學(xué)意義。應(yīng)用R2.14.1軟件運行Haplo.stats 1.5.0程序包,執(zhí)行haplo.glm模塊來構(gòu)建單體型與身高的廣義線性模型。
表 1 片段等位位點特異性PCR引物序列Table 1 Primer information for allele-specifi c PCR
2.1 直接測序結(jié)果
電泳結(jié)果顯示,引物GHP5/GHP3可以對樣品的GH1基因啟動子鄰近區(qū)域進行特異性有效擴增,片段大小為599 bp,與理論預(yù)期值一致。對109個的樣本GH1基因啟動子鄰近區(qū)域進行直接測序,69個樣本獲得測序結(jié)果,其余40個由于產(chǎn)物不純導(dǎo)致測序失敗。在69個測序成功的樣本中,34個樣本含有2個或者2個以上的多態(tài)性位點(見表2),9個樣本含有一個多態(tài)性位點,26個樣本沒有多態(tài)性位點。經(jīng)與相關(guān)文獻數(shù)據(jù)比較,GH1基因啟動子鄰近區(qū)域的SNP位點多態(tài)性頻率在中國漢族人群和高加索人群間分布呈現(xiàn)明顯不同,例如中國漢族人群在- 308的G、?301的G、?75的A及?6的A等4個位點上的頻率明顯高于高加索人群中的比例,提示該基因序列可能具有種群差異性。部分多態(tài)性位點的頻率分析結(jié)果見表3。
表 2 34個樣本GH1基因啟動子鄰近區(qū)域擴增測序結(jié)果Table 2 Sequencing results of GH1 gene proximal to promoter region from 34 samples
2.2 等位位點特異性PCR
對含有2個及以上SNP位點的34個樣品進行片段等位位點特異性PCR,其中12個樣品由于未找到其最佳PCR反應(yīng)條件導(dǎo)致擴增效果不理想,其余22個樣品均獲得特異性PCR產(chǎn)物。對產(chǎn)物進行測序獲得樣品同源染色體中一條鏈的堿基組成,并依據(jù)第一步兩條同源染色體測序的結(jié)果和其SNP的組成,推斷另外一條同源染色體的堿基組成,獲得樣品的單體型信息。22個樣品測序后的SNP序列及其在?278、?57、?6三個SNP位點上的單體型組成結(jié)果見表4。
表 3 GH1基因啟動子區(qū)多態(tài)性位點的頻率分析結(jié)果Table 3 Frequency of SNP in GH1 gene proximal to promoter region
表 4 22個樣品GH1基因啟動子鄰近區(qū)域等位位點特異性PCR測序及單體型分析結(jié)果Table 4 Allele-specifi c PCR sequencing and haplotype results of GH1 gene proximal to promoter region from 22 samples
2.3 連鎖不平衡分析結(jié)果
Haploview4.2軟件對69個樣品GH1基因啟動子鄰近區(qū)域的直接測序結(jié)果進行連鎖不平衡分析,結(jié)果顯示? 476、?364、?339、?168、?31,+16、+25、+59等8個位點不存在多態(tài)性。根據(jù)LD檢驗結(jié)果及相關(guān)選擇標(biāo)簽SNP要求(MAF>0.05,r2>0.8,LDP檢驗<0.05),選擇?278、?57、?6三個位點作為標(biāo)簽SNP位點,Haplo.stats1.4.3對69個樣品中三個標(biāo)簽SNP位點進行單體型推斷及各單體型分布頻率統(tǒng)計,結(jié)果顯示在這三個標(biāo)簽SNP位點上,共檢測到 7種單體型(GGA、GGG、GTA、TGA、TGG、TTA、TTG),其中GTA是最常見的一種單體型,占38.75%,其次是TGA、TGT。對其中通過AS-PCR成功獲得單體型的22個樣品比較其兩種方法(軟件計算及AS-PCR)所獲單體型結(jié)果,發(fā)現(xiàn)兩種方法所獲得的單體型數(shù)據(jù)完全一致。
表 5 單因素分析結(jié)果Table 5 Result of univariate statistical analysis
表 6 單體型與身高之間的交互作用Table 6 Effects of haplotype on the height
2.4 單因素分析及模型構(gòu)建結(jié)果
通過雙側(cè)檢驗,發(fā)現(xiàn)69個樣品中僅?308和?301兩個位點P<0.05,具有統(tǒng)計學(xué)意義,即認(rèn)為攜帶GT的較攜帶GG的身高更矮。具體結(jié)果見表5。以最常見的單體型GTA為參照,TTA、GGG、TTG攜帶者的身高更矮(P<0.05)。具體結(jié)果見表6。
GH1基因是人生長激素的編碼基因,其啟動子區(qū)具有高度單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)[11-14];Giordano M等報道GH1基因啟動子多態(tài)性對成人身高的變異程度最低為3.3%[15]。黃曉萍等人采用直接測序及細(xì)胞克隆的方法對其啟動子區(qū)域多態(tài)性以及部分單個SNP多態(tài)性與身高之間的關(guān)系進行了初步研究,結(jié)果顯示在漢族人群中?308和?57兩處的SNP突變可能影響甚高[16]。
本研究分別采用了等位位點特異性PCR的直接測序方法以及基于人群的單體型的生物信息學(xué)推斷方法對GH1基因啟動子區(qū)域SNP特征及與身高的相關(guān)性進行研究。在實驗初期的共109個樣本中,69個樣本獲得測序結(jié)果,其余40個樣本由于電泳圖譜部分重疊而序列無法分析,提示這些樣品可能擴增產(chǎn)物不唯一而導(dǎo)致測序失敗。對這40個樣品采用分辨率更高的毛細(xì)管電泳方法進行PCR產(chǎn)物分析,發(fā)現(xiàn)這些樣品全部含有分子量不同的兩個PCR產(chǎn)物。經(jīng)查詢International Hapmap Project 網(wǎng)站信息,發(fā)現(xiàn)該基因在?364處存在片斷缺失及?339、?31處存在單堿基缺失現(xiàn)象,故通過常規(guī)Sanger測序法無法獲得其序列。在后續(xù)研究中,將采用PCR產(chǎn)物克隆測序的方法進一步對這些樣品進行SNP多態(tài)性及單體型信息分析。
通過查閱相關(guān)文獻和網(wǎng)站資料,本研究中首次發(fā)現(xiàn)了3個SNP位點(?261、?250、+20),這3個位點均未在漢族人群及其他人群中被發(fā)現(xiàn)報道。雖然間接推斷方法能夠非常方便地對人類單體型進行分析,但有研究表明其錯誤率在19%~48%之間[5],準(zhǔn)確性還有待進一步提高;但在本研究中通過對22個包含2個或2個以上SNP位點的樣本進行等位位點特異性PCR獲得的單體型與運用軟件haplo. stats構(gòu)建的單體型結(jié)果進行比較,22個樣本用兩種方法獲得的單體型結(jié)果完全一致,該結(jié)果提示基于普通統(tǒng)計理論進行演算推斷個體單體型是一種比較準(zhǔn)確可行的方法,可以在后續(xù)研究中單獨使用,可不再進行復(fù)雜費時的等位位點特異性PCR操作,可以節(jié)約大量的實驗時間和成本。
盡管在研究中使用的樣本量有限,但現(xiàn)有結(jié)果表明GH1基因啟動子區(qū)域的序列與身高存在一定的關(guān)系。如對于? 308和?301兩個位點來說,攜帶GT的較攜帶GG的身高更矮;對于?278、?57、?6三個標(biāo)簽SNP位點,以最常見的單體型GTA為參照,TTA、GGG、TTG攜帶者的身高更矮(P<0.05)。
總之,本研究分析了中國部分漢族人群GH1基因啟動子鄰近區(qū)序列,發(fā)現(xiàn)了11個SNP位點,其中3個位點系首次在人群中發(fā)現(xiàn),找到3個標(biāo)簽SNP,建立了單體型分析方法,為今后單體型與調(diào)控人體身高的關(guān)聯(lián)性研究奠定了基礎(chǔ)。
參考文獻
[1] Post B, Kemper H, Weltern D, et al. Dietary pattern and growth and socioeconomic status. Am J Hum Bio, 1997(9):51-62.
[2] Preece MA. The genetic contribution to stature. Horm Res,1996(45):56-58.
[3] Silventoinen K, Kap rio J, Lahelma E, et al. Relative effect of genetic and environmental factors on body height differences across birth cohorts among Finnish men and women. Am J Public Health, 2000(90):627- 630.
[4] 李婧,潘玉春,李亦學(xué),等. 人類基因組單核苷酸多態(tài)性和單倍型的分析及應(yīng)用. 遺傳學(xué)報, 2005(32):879-889.
[5] Tianhua Niu. Algorithms for inferring haplotypes. Genetic Epidemiology, 2004(27):334-347.
[6] Kui Zhang, Hongyu Zhao. A comparison of several methods for haplotype frequency estimation and haplotype reconstruction for tightly linked markers from general pedigrees. Genetic Epidemiology, 2006(30):423-437.
[7] Burgtorf C, Kepper P, Hoehe M, et al. Clone-based systematic haplotyping (CSH): A procedure for physical haplotyping of whole genomes. Genome Research, 2006(13):2717-2724.
[8] Ruano G, Kidd KK. Direct haplotyping of chromosomal segments from multiple heterozygotes via allele-specifi c PCR amplifi cation. Nucleic Acids Res, 1989(17):8392.
[9] Pont-Kingdon G, Lyon E. Direct molecular haplotyping by melting curve analysis of hybridization probes: Beta 2-adrenergic receptor haplotypes as an example. Nucleic Acid Res, 2005,33(10):e89.
[10] Mitra RD, Church GM. In situ localized amplifi cation and contact replication of many individual DNA molecules. Nucleic Acids Res, 1999, 27(24):e34.
[11] Horan M, Millar DS, Hedderich J, et al. Human growth hormone 1 (GH1) gene expression:Complex haplotype-dependent infl uence of polymorphic variation in the proximal promoter and locus control region. Hum Mutat, 2003, 21 (4) :408-423.
[12] Wagner JK, Eble A, Cogan JD, et al. Allelic variations in the human growth hormone-1 gene promoter of growth hormone defi cient patients and normal controls. Eur J Endocrinol, 1997,137 (5):474-481.
[13] Esteban C, Audi L, Carrascosa A, et al. Human growth hormone (GH1) gene polymorphism map in a normal-statured adult population. Clin Endocrinol, 2007, 66 (2): 258-268.
[14] Adkins RM, Campese C, Vaidya R, et al. Association between fetal growth restriction and polymorphisms at sites -1 and +3 of pituitary growth hormone: A case-control study. BMC Pregnancy Childbirth, 2005, 5(1): 2.
[15] Giordano M, Godi M, Giacopelli F, et al. A variation in a Pit-1 site in the growth hormone gene (GH1) promoter induces a differential transcriptional activity. Mol Cell Endocrinol, 2006,249:51-57.
[16] 黃曉萍,肖園,董治亞,等. 中國部分漢族人群GH1基因啟動子區(qū)單核苷酸多態(tài)性與正常人群身高的關(guān)系. 上海交通大學(xué)學(xué)報:醫(yī)學(xué)版,2009, 29(2):162-166.
中圖分類號:DF795.2
文獻標(biāo)識碼:A
文章編號:1008-3650(2016)01-0040-06
收稿日期:2015-10-16
基金項目:中央級公益性科研院所基本科研業(yè)務(wù)費專項資金計劃項目(2008JB004)
作者簡介:葛蕓英,副主任法醫(yī)師,碩士,研究方向為法醫(yī)遺傳學(xué)。 E-mail: 42983784@qq.com
* 通訊作者:陳 松,主任法醫(yī)師,學(xué)士,研究方向為法醫(yī)遺傳學(xué)。 E-mail: chensong@cifs.gov.cn
Haplotyping of GH1 Gene Proximal to Promoter Region and the Association with Adult Height in Chinese Han Population
GE Yunying, CHEN Song*, ZHANG Guangfeng (Institute of Forensic Science, Ministry of Public Security, Beijing 100038, China)
KEY WORDS:GH1 gene; SNP; allele-specifi c PCR; haplotype; computation of haplotype; height