• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      不同人群的SNPs基因型數(shù)據(jù)中r2值對TagSNP數(shù)量的影響*

      2012-03-11 14:02:12張鎦琢鄭娟娟孫遠潔袁重勝
      中國衛(wèi)生統(tǒng)計 2012年3期
      關鍵詞:百分比單體染色體

      張鎦琢 秦 平 李 昂 鄭娟娟 孫遠潔 袁重勝 劉 艷△

      研究人員通過對比病例組和對照組的基因型頻率的不同來發(fā)現(xiàn)基因?qū)膊〉挠绊?,由于單體型(haplotype)整合了各個多態(tài)位點之間的連鎖不平衡(linkage disequilibrium,LD)信息,因此基于單體型的關聯(lián)研究比基于單個單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)的分析能夠提供更高的檢出功效〔1-2〕。與疾病相關的基因型很有可能就存在于病例組和對照組之間基因型頻率不同的染色體區(qū)域內(nèi),理論上對全部的SNPs位點都進行基因分型,就能夠?qū)ふ业竭@樣的區(qū)域〔3〕,但應用這種方法進行鑒定的成本卻過于昂貴。已有研究表明〔4〕,用少部分的遺傳標記仍可保留單體型的大部分信息,例如單體型圖計劃已鑒定出約50萬個標簽SNP(TagSNP)位點,提供了與一千萬個SNPs位點大致相同的圖譜信息,從而大幅度地減少了成本使得研究易于進行。目前,已有幾種根據(jù)基因分型或單體型數(shù)據(jù)篩選tagSNP的方法〔5〕,研究者利用SNPs及其他遺傳變異在染色體上的組成特點,從HapMap中獲得tagSNP的信息,通過軟件分析用來定位與重要醫(yī)學特征相關的基因〔6〕。TagSNP的篩選大大簡化了基因與疾病的關聯(lián)分析,使遺傳疾病的基因定位能夠更為有效的進行。

      材料與方法

      1.數(shù)據(jù)來源

      利用國際人類基因組單體型圖計劃(The International HapMap Project,http://www.hapmap.org) 的通用基因組瀏覽器(HapMap Genome Btowser)下載2009年2月公布的Ⅲ期22號染色體的SNPs基因型數(shù)據(jù)。其中,北京漢族人群(Han Chinese in Beijing,China,CHB)包括84個樣本的18 588個SNPs信息;東京日本人群(Japanese in Tokyo,Japan,JPT)包括86個樣本的18 103個SNPs信息;而來自歐洲北部和西部的猶他州人群(Utah residents with Northern and Western European ancestry from the CEPH collection,CEU)則包括165個樣本的19 660個SNPs信息。

      2.軟件介紹

      在SNPs基因型數(shù)據(jù)分析中,常用的軟件有BEST、GeneDigger、HaploBlock 以及 Haploview,其中 Haploview是由劍橋大學編寫的利用已有的基因型數(shù)據(jù)來計算連鎖不平衡統(tǒng)計量并推斷人群單體型模型的公用軟件包,目前的最新版本為Haploview4.2(可從http://www.broadinstitute.org/haploview/haploview-downloads免費下載),可在1.4版及以上的Java運行環(huán)境(JRE)中使用。

      Haploview中的Tagger計算機程序提供了篩選tagSNP的方法〔7〕,主要參數(shù)是次等位基因頻率(Minor Allele Frequency,MAF)閾值以及 tagSNP和未檢測SNP之間的最小連鎖不平衡相關程度(用r2值來表示),即侯選基因上所有常見 SNPs(即次等位基因頻率大于閾值者),要么作為tag-SNP進行直接檢測,要么與一個待檢SNP相關聯(lián)(r2值超過設定值)。此外,研究者也可以結(jié)合現(xiàn)有文獻選取感興趣的可能的功能位點(如基因編碼區(qū)和調(diào)控區(qū)的多態(tài)位點)作為tagSNP。

      3.篩選tagSNP

      運行Haploview4.2分別讀取HapMap中的CHB、JPT和CEU的22號染色體SNPs基因型數(shù)據(jù),之后首先要對數(shù)據(jù)的信息進行整理,設定Hardy-Weinberg平衡切斷值(HW p-value cutoff)為0.0010,次等位基因頻率(minimum minor allele freq)的最小值為0.0010,未缺失的基因型頻率最小值為75%,最大孟德爾遺傳規(guī)律錯誤的個數(shù)(max mendel errors)為1,Haploview將最終選取滿足這些條件的SNPs進行有效的分析;隨后在tagSNP的篩選過程中設定不同的r2值(0.5~1.0),并記錄tagSNP的數(shù)量。

      4.TagSNP數(shù)量的比例關系

      HapMap所提供的不同人群的相同染色體的SNPs數(shù)量并不完全相同,為了排除所篩選的tagSNP數(shù)量會受到人群總SNPs數(shù)量的影響,需要計算不同人群中不同r2值所對應的tagNP數(shù)量占總SNPs數(shù)量的百分比例。

      結(jié) 果

      運行Haploview4.2分別處理三個人群的SNPs基因型數(shù)據(jù),不同r2值所對應的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例的具體情況見表1。當r2值為0.8(軟件默認值)時,在CHB中篩選出7 752個tag-SNP,這表示由占總SNPs數(shù)量41.70%的這7 752個tagSNP所構(gòu)建的單體型即可反映北京漢族人群整個22號染色體上的18 588個SNPs的大部分信息;與此相比,依然是在 r2值為0.8時,分別需要7 460個(41.21%)和9086個(46.22%)tagSNP才能反映東京日本人群和來自歐洲北部和西部的猶他州人群22號染色體上的單體型信息。即使在相鄰的SNPs位點存在著完全連鎖的情況下(r2值為1)所篩選的tagSNP的數(shù)量還是明顯的低于總SNPs數(shù)量,此時CHB、JPT和CEU的tagSNP數(shù)量分別占總SNPs數(shù)量的65.56%、63.35%和70.05%。

      表1 三個人群中不同r2值所對應的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例

      若以設定的r2值為橫坐標,以所篩選的tagSNP數(shù)量或其占總SNPs數(shù)量百分比例為縱坐標做圖,則可以更為直觀地看到三個人群中北京漢族人群和東京日本人群比較接近,且三個人群均表現(xiàn)出隨著所設定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢;但在r2值相同時三個人群的tagSNP數(shù)量卻存在著一定的差異,表現(xiàn)為日本人群的數(shù)量最少,北京漢族人群其次,歐洲北部和西部的猶他州人群的數(shù)量最多。在三個人群中tagSNP數(shù)量的增加速度都表現(xiàn)為在r2值小于0.9時較為平穩(wěn),r2值大于0.9時增加速度都有所提高,其中以北京漢族人群的增加更為明顯。

      討 論

      運用Haploview軟件進行tagSNP的篩選,可直接分析從HapMap上下載到的階段性SNPs基因型數(shù)據(jù),通過計算連鎖不平衡統(tǒng)計量來推斷人群單體型模型。有研究顯示利用HapMap基因型數(shù)據(jù)所篩選的tagSNP進行關聯(lián)研究比單位點研究的統(tǒng)計效力更高,且可不受數(shù)據(jù)庫完整性的影響〔7〕。本研究即是運用Haploview4.2軟件計算出三個人群(北京漢族人群、東京日本人群和來自歐洲北部和西部的猶他州人群)22號染色體在不同r2值(最小連鎖不平衡相關程度)時所對應的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例,結(jié)果顯現(xiàn)出tagSNP的數(shù)量受r2值的影響較大,雖然三個人群在SNPs連鎖不平衡關系上存在著一定的差異(相對說來,北京漢族人群和東京日本人群的結(jié)果較為接近),但均表現(xiàn)出隨著所設定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢,不過tagSNP數(shù)量的增加速度在三個人群中略有不同。究其增加速度不同的原因,一方面在于HapMap計劃所檢測的三個人群總SNPs位點個數(shù)以及樣本例數(shù)的差異(北京漢族人群和東京日本人群樣本例數(shù)幾乎相等,而歐洲北部和西部的猶他州人群的樣本例數(shù)則幾乎是北京漢族人群和東京日本人群樣本例數(shù)的總和),理論上較大的樣本量意味著位點間有更多的重組機會(重組機會的增多可降低原位點間的r2值),故當固定r2值以篩選tagSNP時,較大的樣本量就可導致有更多的tagSNP被篩選出來;另一方面,影響r2值的因素還包括群體有效大小(Ne)以及位點間重組率(c),三個人群不同的遺傳背景使得位點間重組率和重組率圖(相鄰的SNPs位點間的重組率即組成了重組率圖) 產(chǎn)生差異,因 E(r2)=1/(1+4Nec)〔8〕,從而也導致了三個人群的tagSNP在數(shù)量及增加速度上的差異。所以,在實際研究中要依據(jù)目標人群、研究經(jīng)費等方面的具體情況設置合理的r2值,若因研究經(jīng)費有限需要檢測的SNPs位點數(shù)量較少時,可通過降低r2值來減少tagSNP的數(shù)量,尤其是當研究人群不同時,不應盲目地遵從由參考樣本數(shù)據(jù)所計算出的r2值,應更相信從實際研究數(shù)據(jù)中所計算得到的r2值。此外,當估算出位點間的r2值后,還可進一步推斷群體有效大小,因為群體有效大小是一個重要參數(shù),有助于解釋人群是如何進行演變和擴大的,并可提高對復雜性狀遺傳模式的理解和建?!?〕。

      目前,在疾病的病因?qū)W研究中,盡管已在發(fā)現(xiàn)疾病的危險等位基因方面取得了很大的進步,但大多數(shù)的遺傳風險仍然無法解釋。在廣泛的人群中全面的檢測所有常見和稀有的等位基因可對疾病的遺傳風險有一個更為完整的認識〔8〕。但對全部SNPs位點進行關聯(lián)研究確實存在著諸多困難(工作量大、成本較高等),而利用少量的tagSNP就能提供與全基因組SNPs位點大致相同的圖譜信息的方式,則可以良好的解決這些問題。相信,隨著生命科學的不斷發(fā)展和進步,提取tagSNP的算法將會得到逐步完善,從而在分子流行病學和生命科學的研究中發(fā)揮積極的作用。

      1.Akey J,Jin L,Xiong M.Haplotypes vs single marker linkage disequilibrium tests:what do we gain?Eur J Hum Genet,2001,9(4):291-300.

      2.鄒莉玲,趙耐青,秦國友,等.應用關聯(lián)規(guī)則篩選疾病相關的SNP位點及其組合的分析方法.中國衛(wèi)生統(tǒng)計,2009,26(3):226-233.

      3.Johnson GC,Esposito L,Barratt BJ,et al.Haplotype tagging for the identification of common disease genes.Nat Genet,2001,29(2):233-237.

      4.Patil N,Berno AJ,Hinds DA,et al.Blocks of limited haplotype diversity revealed by high-resolution scanning of human chromosome 21.Science,2001,294(5547):1669-1670.

      5.Gopalakrishnan S,Qin ZS.TagSNPselection based on pairwise LD criteria and power analysis in association studies.Pac Symp Biocomput,2006,511-522.

      6.Xu Z,Kaplan NL,Taylor JA.Tag SNPselection for candidate gene association studies using HapMap and gene resequencing data.Eur J Hum Genet,2007,15(10):1063-1070.

      7.Bakker PI,Yelensky R,Pe'er I,et al.Efficiency and power in genetic association studies.Nat Genet,2005,37(11):1217-1223.

      8.Sved JA.Correlation measures for linkage disequilibrium within and between populations.Genet Res(Camb),2009,91(3):183-192.

      9.Tenesa A,Navarro P,Hayes BJ,et al.Recent human effective population size estimated from linkage disequilibrium.Genome Res,2007,17(4):520-526.

      猜你喜歡
      百分比單體染色體
      多一條X染色體,壽命會更長
      科學之謎(2019年3期)2019-03-28 10:29:44
      為什么男性要有一條X染色體?
      科學之謎(2018年8期)2018-09-29 11:06:46
      單體光電產(chǎn)品檢驗驗收方案問題探討
      普通照明用自鎮(zhèn)流LED燈閃爍百分比測量不確定度分析
      電子制作(2017年20期)2017-04-26 06:57:46
      能忍的人壽命長
      肝癌患者外周血Treg、Th17百分比及IL-17水平觀察
      相變大單體MPEGMA的制備與性能
      再論高等植物染色體雜交
      巨無霸式醫(yī)療單體的選擇
      類姜黃素及其單體對β-內(nèi)分泌酶活性的抑制作用
      五华县| 乐至县| 晋城| 屏南县| 白玉县| 拉萨市| 井陉县| 平凉市| 天峨县| 思南县| 平和县| 洪江市| 慈利县| 宁城县| 彰武县| 清水河县| 奎屯市| 内丘县| 越西县| 定安县| 岑溪市| 温州市| 炎陵县| 牙克石市| 兴隆县| 浙江省| 德保县| 屏东市| 平湖市| 溧水县| 乐陵市| 平果县| 高雄县| 临泽县| 大悟县| 绵阳市| 拉萨市| 泸溪县| 荆州市| 洛浦县| 兰考县|