刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,廣東 廣州 510642)
杜洛克豬全基因組連鎖不平衡分析
刁淑琪,羅元宇,蔡 迪,陳桂華,陳贊謀,張 豪,李加琪,張 哲
(華南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,廣東 廣州 510642)
利用豬Illumina Porcine SNP60K芯片對(duì)福建某核心種豬場(chǎng)杜洛克豬216個(gè)個(gè)體進(jìn)行基因型檢測(cè),基于該高密度SNP芯片數(shù)據(jù),運(yùn)用Haploview軟件計(jì)算全基因組連鎖不平衡并構(gòu)建杜洛克豬連鎖不平衡圖譜。結(jié)果表明,該杜洛克豬群體不同染色體上相鄰標(biāo)記間r2存在波動(dòng),波動(dòng)范圍為0.46~0.59,相鄰標(biāo)記間的平均連鎖不平衡程度r2為0.52,SSC10的r2最低(平均為0.46),SSC6的r2最高(平均為0.59),連鎖不平衡水平隨著標(biāo)記間距的增加而衰減、變異程度隨之減小。該研究結(jié)果可為杜洛克豬遺傳分析及全基因組選擇研究提供參考。
豬;連鎖不平衡;杜洛克;SNP
連鎖不平衡(Linkage Disequilibrium,LD)又稱等位基因關(guān)聯(lián),是指同一條染色體上,等位基因間廣泛存在的非隨機(jī)組合現(xiàn)象[1]。連鎖不平衡是群體遺傳學(xué)研究的重要內(nèi)容之一,在分子生物學(xué)研究與動(dòng)物遺傳育種領(lǐng)域,群體基因組連鎖不平衡信息是數(shù)量性狀基因座定位、群體遺傳結(jié)構(gòu)分析和全基因組選擇的基礎(chǔ)。連鎖不平衡受選擇、突變和遺傳漂變等因素的影響。隨著科學(xué)技術(shù)的發(fā)展,覆蓋全基因組的高密度遺傳標(biāo)記已廣泛運(yùn)用于人和動(dòng)植物的連鎖不平衡研究,并取得了很大的研究進(jìn)展。在人類基因組學(xué)研究中,將單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNP)作為遺傳標(biāo)記來(lái)深入研究連鎖不平衡已成為一種趨勢(shì)。結(jié)合關(guān)聯(lián)分析和功能研究,將包括復(fù)雜疾病及其中間表型在內(nèi)的人類各種表型特征,與基因組上以SNP為主的多態(tài)性位點(diǎn)聯(lián)系起來(lái),這對(duì)疾病預(yù)測(cè)、預(yù)防和治療等的突破具有重要作用[2]。
目前,在畜禽方面有很多基于連鎖不平衡的研究。在牛的連鎖不平衡研究中,Mckay等[3]利用2 670個(gè)SNP標(biāo)記構(gòu)建了8個(gè)不同品種的連鎖不平衡圖譜,并發(fā)現(xiàn)其LD區(qū)域長(zhǎng)度不超過(guò)500 kb。Lu等[4]利用SNP標(biāo)記對(duì)安格斯牛、夏洛萊牛和雜交牛3個(gè)群體進(jìn)行LD分析,發(fā)現(xiàn)當(dāng)標(biāo)記間距小于30 kb時(shí),3個(gè)品種的LD分別為0.29、0.22和0.21,認(rèn)為不同品種和不同染色體間LD強(qiáng)度具有顯著差異。Ross等[5]以r2作為L(zhǎng)D的度量指標(biāo),利用SNP標(biāo)記估計(jì)了澳大利亞荷斯坦牛、澳洲安格斯牛、新西蘭黑白花奶牛和娟姍牛4個(gè)群體的LD,其大小分別為0.35、0.25、0.22和0.14。
在豬的連鎖不平衡研究方面,Amaral等[6]通過(guò)分析中國(guó)家豬、歐洲家豬和歐洲野豬的371個(gè)SNP,發(fā)現(xiàn)歐洲豬種的LD程度高于中國(guó)豬種。Badke等[7]以r2作為度量指標(biāo)對(duì)長(zhǎng)白豬、約克夏、杜洛克和漢普夏的LD進(jìn)行比較,發(fā)現(xiàn)在標(biāo)記間距較小時(shí),杜洛克豬的LD較高;而標(biāo)記間距較大時(shí),漢普夏豬的LD較低。此外,Ai等[8]比較了中國(guó)地方豬和西方家豬的LD,發(fā)現(xiàn)西方家豬的LD高于中國(guó)地方豬。
本研究以杜洛克豬為研究對(duì)象,基于SNP芯片基因組數(shù)據(jù)分析杜洛克豬群體的連鎖不平衡水平及其衰減規(guī)律,旨在為杜洛克豬的連鎖不平衡研究提供一定的參考。
1.1 試驗(yàn)材料
試驗(yàn)對(duì)象為福建某核心種豬場(chǎng)的216頭杜洛克豬(公豬20頭,母豬196頭),試驗(yàn)豬均在常規(guī)條件下飼養(yǎng),體況正常。使用OMEGA Tissue DNA Kit對(duì)所有個(gè)體的耳組織抽提基因組DNA。采用Illumina Porcine SNP60K芯片[9]進(jìn)行SNP基因分型[10],共得到61 565個(gè)SNP。
1.2 基因型質(zhì)量控制
采用美國(guó)農(nóng)業(yè)部和愛(ài)荷華州立大學(xué)于2010年9月聯(lián)合組裝的豬基因組(Sus scrofa Build 10)作為參考序列(http://www.animalgenome. org/blast/),利用Plink軟件[11]對(duì)供試的216個(gè)個(gè)體和61 565個(gè)SNPs進(jìn)行基因型質(zhì)量控制。質(zhì)控標(biāo)準(zhǔn)為:個(gè)體檢出率(call rate)>0.95,SNP檢出率>0.95,最小等位基因頻率(Minor allele frequency,MAF)>0.05和哈迪-溫伯格平衡P值(Hardy-Weinberg equilibrium,HWE)≥10-6。經(jīng)過(guò)質(zhì)控后,剩余215個(gè)個(gè)體和32 186個(gè)有效SNP用于后續(xù)研究。
1.3 LD度量
連鎖不平衡程度通常用D'[12]和r2[13]進(jìn)行度量,本研究選用r2作為L(zhǎng)D的度量標(biāo)準(zhǔn)。r2表示兩個(gè)位點(diǎn)統(tǒng)計(jì)上和遺傳上相關(guān)程度的關(guān)系(0< r2<1),其表現(xiàn)較穩(wěn)定r2,對(duì)基因頻率的變化不敏感。r2的計(jì)算公式為:
式中,PA1和PB1是兩個(gè)標(biāo)記位點(diǎn)上第1個(gè)等位基因的頻率,PA1B1是等位基因之間形成的單倍型頻率。
采用Haploview軟件[15]計(jì)算各SNP之間的r2值,采用R軟件進(jìn)行后續(xù)的統(tǒng)計(jì)分析。
圖1 杜洛克豬質(zhì)量控制后SNP最小等位基因頻率分布
2.1 基因型質(zhì)量控制
供試的216個(gè)個(gè)體和61 565個(gè)SNPs進(jìn)行基因型質(zhì)量控制后,剩余215個(gè)個(gè)體和32 186個(gè)有效SNP進(jìn)行后續(xù)分析。質(zhì)控后的SNP最小等位基因頻率(MAF)分布情況見(jiàn)圖1。從圖1可以看出,MAF呈均勻分布,本研究中稀有突變位點(diǎn)極少。其中,70%以上SNP的MAF>0.20,說(shuō)明本研究中杜洛克豬群體中的SNP多態(tài)性較高,分型數(shù)據(jù)適用于LD的計(jì)算和圖譜的構(gòu)建。
2.2 杜洛克豬各染色體LD
杜洛克豬18條常染色體和X染色體r2的衰減趨勢(shì)如圖2所示。從圖2可以看出,相鄰標(biāo)記間的LD水平隨標(biāo)記間物理距離的增大而衰減。此外,除了SSC6、SSC14、SSC16、SSC17和SSC18等染色體外,其他染色體上個(gè)別間距較大的標(biāo)記之間也存在高r2現(xiàn)象。
2.3 杜洛克豬全基因組LD及LD圖譜
圖2 杜洛克豬各染色體的r2分布
杜洛克豬全基因組r2的衰減趨勢(shì)如圖3所示,在全基因組水平上,LD變化趨勢(shì)與各染色體LD一致,即LD水平隨標(biāo)記間距的增加而衰減,LD的變異程度也隨之減小。但在某些距離較遠(yuǎn)的SNP標(biāo)記之間,LD程度也很高。
本研究還構(gòu)建了杜洛克豬全基因組連鎖不平衡圖譜(圖4),圖4中顏色越深代表LD程度越強(qiáng)。結(jié)果表明,除了在相同染色體上的標(biāo)記間存在LD,不同染色體上的標(biāo)記間也存在一定程度的LD。
2.4 杜洛克豬不同標(biāo)記間距的LD分布
本研究統(tǒng)計(jì)了杜洛克豬各染色體上相鄰標(biāo)記間的r2分布情況,從表1可見(jiàn),杜洛克豬不同染色體上相鄰標(biāo)記間的r2存在波動(dòng),波動(dòng)范圍為0.46~0.59。
對(duì)杜洛克豬的r2統(tǒng)計(jì)發(fā)現(xiàn),不同染色體上標(biāo)記間的LD程度存在差異。本研究分別統(tǒng)計(jì)了杜洛克豬在標(biāo)記間距為50 kb、500 kb、1 Mb和5 Mb時(shí)各染色體的LD分布,結(jié)果(表1)表明,SSC10的連鎖不平衡程度較低,SSC6的連鎖不平衡程度較高。
圖3 杜洛克豬全基因組的r2分布
圖4 杜洛克豬全基因組連鎖不平衡圖譜
本研究利用Illumina Porcine SNP60K芯片,對(duì)216頭杜洛克豬進(jìn)行了全基因組LD分析,揭示了該杜洛克豬群體中LD的變化規(guī)律,成功構(gòu)建了杜洛克豬的高密度連鎖不平衡圖譜,為杜洛克豬QTL定位、群體遺傳結(jié)構(gòu)分析及基因組選擇等研究提供了參考。
在相鄰標(biāo)記(標(biāo)記間距平均為82 kb)之間,該杜洛克豬群體的平均LD程度為0.52,結(jié)果與Badke等[16]對(duì)4個(gè)外種豬的LD研究結(jié)果(r2=0.46,相鄰標(biāo)記間距約為70 kb)相似。在每條染色體之間,杜洛克的LD程度波動(dòng)范圍為0.46~0.59。這說(shuō)明杜洛克擁有較高的連鎖不平衡水平,推測(cè)其在進(jìn)化過(guò)程中受到高強(qiáng)度的人工選擇,長(zhǎng)期的選育也導(dǎo)致了杜洛克豬種的高度純化,從而使其LD程度較高。此外,本研究比較了標(biāo)記間距為50 kb、500 kb、1 Mb和5 Mb時(shí)各染色體的r2分布,發(fā)現(xiàn)SSC10的r2較小,SSC6的r2較大。這與Uimari等[17]對(duì)芬蘭長(zhǎng)白豬和芬蘭約克夏豬LD進(jìn)行分析的研究中SSC10 r2偏小的結(jié)果相同。同時(shí),也與Lei等[18]對(duì)3個(gè)丹麥豬種進(jìn)行LD分析研究得到SSC10的r2偏小的結(jié)果相同。
表1 杜洛克豬各染色體上標(biāo)記間的r2分布情況
LD隨著標(biāo)記間距的增加呈衰減趨勢(shì),標(biāo)記間r2逐漸降低,本研究結(jié)果與上述規(guī)律一致。但在本研究中發(fā)現(xiàn)某些距離較遠(yuǎn)的標(biāo)記間也存在強(qiáng)LD,這可能和參考基因組序列有關(guān)[19-20]。通過(guò)比較不同物種間相鄰標(biāo)記間的連鎖不平衡發(fā)現(xiàn),杜洛克豬的LD程度高于人類的LD水平[21-22],也高于綿羊的LD水平[23]。參考GWAS和GS的研究,將有用的LD界定為相鄰標(biāo)記間平均r2>0.3[24],這在本研究中SNP密度是充足的,但質(zhì)控后的SNP在基因組上呈非均勻分布,這可能會(huì)影響到SNP芯片在相關(guān)研究中的應(yīng)用效果。
[1]Hill W G,Robertson A. Linkage disequilibrium in finite populations[J]. TAG. Theoretical and applied genetics. Theoretische und angewandteGenetik,1968,38(6):226-231.
[2]Wall J D,Pritchard J K. Haplotype blocks and linkage disequilibrium in the human genome[J]. Nat Rev Genet,2003,4(8):587-597.
[3]McKay S D,Schnabel R D,Murdoch B M,et al. Whole genome linkage disequilibrium maps in cattle[J]. BMC GENET,2007,8(1):74.
[4]Lu D,Sargolzaei M,Kelly M,et al. Linkage disequilibrium in Angus,Charolais,and Crossbred beef cattle[J]. Frontiers in Genetics,2012,3.
[5]de Roos Al APWD,Hayes B J,Spelman R J ,et al. Linkage Disequilibrium and Persistence of Phase in Holsten-Friesian,Jersey and Angus Cattle[J]. Genetics,2008,179(3):1503-1512.
[6]Amaral A J,Megens H J,Crooijmans R P M A,et al. Linkage Disequilibrium Decay and Haplotype Block Structure in the Pig[J]. Genetics,2008,179(1):569-579.
[7]Badke Y M,Bates R O,Ernst C W,et al Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[8]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,2(8):e56001.
[9]Ramos A M,Crooijmans R P M A,Affara N A,et al. Design of a High Density SNP Genotyping Assay in the Pig Using SNPs Identified and Characterized by Next Generation Sequencing Technology[J]. Plos One,2009,8(4):e6524.
[10]Heaton M P,Harhay G P,Bennett G L,et al. Selection and use of SNP markers for animal identification and paternity analysis in U.S. beef cattle[J]. Mamm Genome,2002,13(5):272-281.
[11]Purcell S,Neale B,Todd-Brown K,et al. PLINK:A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses[J]. The American Journal of Human Genetics,2007,81(3):559-575.
[12]Lewontin R C. The Interaction of Selection and Linkage. I. General Considerations;Heterotic Models[J]. Gnentics,1964,1(49):49-67.
[13]Hill W G. Estimation of linkage disequilibrium in randomly mating populations.[J]. Heredity,1974,33(2):229-239.
[14]Zhao H,Nettleton D,Soller M,et al. Evaluation of linkage disequilibrium measures between multi-allelic markers as predictors of linkage disequilibrium between markers and QTL[J]. Genet Research,2005,86(1):77-87.
[15]Barrett J C,F(xiàn)ry B,Maller J,et al. Haploview: analysis and visualization of LD and haplotype maps[J]. Bioinformatics,2005,21(2):263-265.
[16]Badke Y M,Bates R O,Ernst C W,et al. Estimation of linkage disequilibrium in four US pig breeds[J]. Bmc Genomics,2012,1(13):1-10.
[17]Uimari P,Tapio M. Extent of linkage disequilibrium and effective population size in Finnish Landrace and Finnish Yorkshire pig breeds[J]. J Anim Sci,2011,89(3):609-614.
[18]Wang L,Rensen P S,Janss L,et al. Genomewide and local pattern of linkage disequilibrium and persistence of phase for 3 Danish pig breeds[J]. Bmc Genet,2013,1(14):1-11.
[19]Farnir F,Coppieters W,Arranz J J,et al. Extensive Genome-wide Linkage Disequilibrium in Cattle[J]. Genome Res,2000,10(2):220-227.
[20]Smith E M,Wang X,Littrell J,et al. Comparison of linkage disequilibrium patterns between the HapMap CEPH samples and a family-based cohort of Northern European descent[J]. Genomics,2006,88(4):407-414.
[21]Dunning A M,Durocher F,Healey C S,et al. The extent of linkage disequilibrium in four populations with distinct demographic histories[J]. Am J Hum Genet,2000,67(6):1544-1554.
[22]Kruglyak L. Prospects for whole-genome linkage disequilibrium mapping of common disease genes.[J]. Nat Genet,1999,2(22):139-144.
[23]Zhao F P,Wang G K,Zeng T,et al. Estimations of genomic linkage disequilibrium and effective population sizes in three sheep populations[J]. Livest Sci,2014,170:22-29.
[24]Ai H S,Huang L S,Ren J. Genetic Diversity,Linkage Disequilibrium and Selection Signatures in Chinese and Western Pigs Revealed by Genome-Wide SNP Markers[J]. Plos One,2013,8:e560012.
(責(zé)任編輯 崔建勛)
Genome-wide linkage disequilibrium analysis in Duroc pigherd
DIAO Shu-qi,LUO Yuan-yu,CAI Di,CHEN Gui-hua,CHEN Zan-mou,ZHANG Hao,LI Jia-qi,ZHANG Zhe
(College of Animal Science,South China Agricultural University,Guangzhou 510642,China)
In this study,we collected 216 Duroc pigs from a breeding herd in Fujian province and genotyped them with Illumina Porcine SNP60K Bead Chip. Based on the high-density SNP data,the genome-wide LD was calculated with Haploview. Results showed that LD reduced as the marker intervals increasing. The r2between adjacent markers ranged from 0.46 to 0.59 in the Duroc population. The mean r2was 0.52 among adjacent markers across the genome,with the minimum in SSC10 (r2=0.46),and the maximum in SSC6 (r2=0.59). This study provides useful information for further genome-wide analysis of Duroc pig.
pig;linkage disequilibrium;Duroc;SNP
S828.2;Q343.1
A
1004-874X(2016)11-0116-06
2016-08-10
廣東省自然科學(xué)基金(2014A03031345);國(guó)家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系項(xiàng)目(CARS-36);華南農(nóng)業(yè)大學(xué)大學(xué)生創(chuàng)新訓(xùn)練項(xiàng)目(201410564155)
刁淑琪(1993-),女,在讀碩士生,E-mail:saradiao@126.com
張哲(1984-),男,博士,副教授,E-mail:zhezhang@scau.edu.cn
刁淑琪,羅元宇,蔡迪,等.杜洛克豬全基因組連鎖不平衡分析[J].廣東農(nóng)業(yè)科學(xué),2016,43(11):116-121.