• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于不同密度SNP 芯片在杜洛克公豬中的全基因組選擇效果分析

      2019-12-26 05:01:26劉成琨劉德武王克君吳珍芳方美英
      中國(guó)畜牧雜志 2019年12期
      關(guān)鍵詞:錯(cuò)誤率低密度高密度

      王 玨,劉成琨,2,劉德武,王克君,4,陳 潔,吳珍芳,方美英*

      (1.中國(guó)農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,北京 100086;2.北京貝瑞和康生物技術(shù)有限公司,北京 102200;3.華南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,廣州廣東 510642;4.河南農(nóng)業(yè)大學(xué)牧醫(yī)工程學(xué)院,河南鄭州 450002)

      全基因組選擇自2001 年提出以來[1],在奶牛育種工作中已被廣泛應(yīng)用,但在其他物種中應(yīng)用還處于起步階段?;蚪M選擇基于SNP 標(biāo)記與數(shù)量性狀位點(diǎn)(QTL)之間的關(guān)聯(lián)開展,因此SNP 芯片中標(biāo)記的密度對(duì)于基因組選擇的準(zhǔn)確性十分重要,而高密度SNP 芯片的成本較高,使其應(yīng)用受限;另一方面,由于性狀和群體的差異,篩選對(duì)所有性狀都具有遺傳效應(yīng)的共同SNP 位點(diǎn)較為困難?;蛐吞畛淇梢栽谝欢ǔ潭壬辖鉀Q這一問題[2-3]?;蛐吞畛涫抢靡延械姆中托畔?duì)實(shí)際未分型的位點(diǎn)進(jìn)行基因型預(yù)測(cè)[4]。大部分基因型填充是根據(jù)已有的單倍型信息進(jìn)行單倍型構(gòu)建填充,這其中又根據(jù)是否利用家系信息分為不依賴于家系信息而僅利用群體連鎖不平衡信息構(gòu)建單倍型、根據(jù)家系信息和標(biāo)記連鎖信息共同構(gòu)建單倍型2 種策略[5]。根據(jù)算法不同,使用單倍型進(jìn)行填充又有3 種不同方法:馬爾可夫-門特卡羅方法(Markov Chain Monte Carlo,MCMC),如IMPUTE2[6]、BEAGLE[7]等;最大簡(jiǎn)約法(Maximum Parsimony,MP),如findhap[8];最大期望法(Expectation-Maximization,EM),如plink[9]。基因型填充方法眾多,填充的可靠性以及效率在生產(chǎn)過程中最被關(guān)注。Johnston 等[10]研究發(fā)現(xiàn)Beagle[11]、Fimpute[12]和Findhap[13]3 種軟件填充的準(zhǔn)確率都在95%左右。Larmer等[14]也比較了Beagle2[11]和Fimpute[12]在不同牛染色體上的填充效果,結(jié)果表明,雖然兩種方法在不同品種中表現(xiàn)不同,但總體都可以得到95%以上的較高基因型填充準(zhǔn)確率。

      現(xiàn)階段基因組選擇在奶牛中主要用于縮短世代間隔[1,15],可將傳統(tǒng)后裔測(cè)定由5~6 年的世代間隔縮短到1.5 年[16-17]。豬的全基因組選擇應(yīng)用正在逐步推進(jìn),但與奶牛不同的是,豬的世代間隔時(shí)間較短,通過全基因組選擇方法降低豬的世代間隔意義不如奶牛明顯。全基因組選擇在豬育種中的應(yīng)用主要是提高選種的準(zhǔn)確性以期獲得更大的遺傳進(jìn)展,同時(shí)可根據(jù)其基因組育種值進(jìn)行早期選種以節(jié)約飼養(yǎng)成本。本研究選取1 068 頭杜洛克公豬作為研究對(duì)象,分別采用高密度SNP 芯片、與性狀緊密關(guān)聯(lián)的低密度SNP 芯片、與性狀緊密關(guān)聯(lián)的低密度SNP 芯片與基因型填充并用的3 種不同分析策略進(jìn)行基因組育種值估計(jì),以探索低密度SNP 芯片在豬全基因組選擇中應(yīng)用的可能性,同時(shí)也為今后基因組選擇技術(shù)在豬育種中的應(yīng)用提供參考。

      1 材料與方法

      1.1 實(shí)驗(yàn)群體 本實(shí)驗(yàn)選用的1 068 頭杜洛克公豬均來自于廣東溫氏食品集團(tuán)國(guó)家生豬種業(yè)工程技術(shù)研究中心的沙湖種豬場(chǎng)。所有個(gè)體均為67 個(gè)父本和464 個(gè)母本的后代。樣本采集時(shí)取活體耳組織樣,裂解液裂解后用氛仿法提取基因組DNA,取3 μg 基因組DNA,稀釋至50 ng/μL,-20℃保存。

      1.2 性能測(cè)定 用于實(shí)驗(yàn)分析的性狀包括日增重(Average Daily Gain,ADG)、背膘厚(Back Fat Thickness,BF)以及飼料轉(zhuǎn)化率(Feed Conversion Ratio,F(xiàn)CR)。

      控制待測(cè)公豬體重在85~105 kg,稱重前停料12 h以上,記錄體重及測(cè)定日期,使用公式校正日齡=測(cè)定日齡-(實(shí)測(cè)體重-100)/CF 計(jì)算校正日齡,其中CF=實(shí)測(cè)體重×1.826040、測(cè)定日齡。

      使用SFK2 背膘儀PIGLOG105 測(cè)定活體兩點(diǎn)背膘厚:背膘A 為倒數(shù)第3~4 腰椎距背中線約7 cm;背膘B 為倒數(shù)第3~4 肋骨、距背中線7 cm 處,取A 與B 的平均值,并用公式校正背膘厚(cm)=實(shí)測(cè)背膘厚×CF進(jìn)行校正,其中CF=16.684/(13.648+0.11525×實(shí)測(cè)體重-100)。

      ADG(kg/d)=(100-入試體重)/(100kg 日齡-入試日齡)

      FCR=采食量/測(cè)定期增重

      1.3 SNP 芯片檢測(cè) 使用Illumina 公司研發(fā)的Porcine SNP60 芯片對(duì)1 068 個(gè)個(gè)體進(jìn)行SNP 分型,分析工作由DNA Landmarks 公司完成,其使用的SNP 分型平臺(tái)為Illumina Infinium 平臺(tái)。

      1.4 數(shù)據(jù)質(zhì)控 Call Rate 小于95% 的位點(diǎn)和個(gè)體;最小等位基因頻率(Minor Allele Frequency,MAF)小于1% 的位點(diǎn);哈代溫伯格平衡卡方檢驗(yàn)(Hardy-Weinberg Equilibrium,HWE)P值小于10-4 的位點(diǎn)。質(zhì)控后共得到35 694 個(gè)SNP 位點(diǎn)。

      1.5 低密度SNP 位點(diǎn)的選擇 如圖1 所示,從Porcine 60K 芯片中篩選一部分位點(diǎn)模擬低密度SNP。在染色體上每105 劃分一個(gè)區(qū)域,在區(qū)段內(nèi)分別選出ADG、BF、FCR 3 個(gè)性狀SNP 效應(yīng)最高的位點(diǎn)。本實(shí)驗(yàn)中SNP 效應(yīng)使用GBLUP-CE 進(jìn)行計(jì)算。經(jīng)過篩選,共得到5 989 個(gè)SNP 可用于低密度芯片構(gòu)建,每條染色體上的芯片分布如圖2 所示。

      圖2 篩選得到的低密度SNP 芯片在每條染色體上的部分情況

      1.6 基因型填充分析 已有的研究表明[18-20],參考群與驗(yàn)證群之間的親緣關(guān)系會(huì)對(duì)填充的準(zhǔn)確性產(chǎn)生一定影響。本研究將參考群和驗(yàn)證群設(shè)計(jì):①隨機(jī)填充:從1 068 個(gè)個(gè)體中隨機(jī)抽取317 個(gè)個(gè)體作為填充群體,使用其余751 個(gè)個(gè)體作為參考群體;②全同胞填充:從1 068 個(gè)個(gè)體中按全同胞的關(guān)系抽取317 個(gè)個(gè)體作為填充群體,其余751 個(gè)個(gè)體作為參考群體,即填充群體和參考群體之間為全同胞關(guān)系。利用Beagle 4.0[7]中的MCMC 算法,分別針對(duì)不同的群體在考慮系譜和不考慮系譜2 種條件下進(jìn)行填充。

      1.7 準(zhǔn)確性估計(jì) 在準(zhǔn)確性估計(jì)過程中為了更準(zhǔn)確地進(jìn)行比較,未被填充的基因型不應(yīng)被考慮到準(zhǔn)確性的計(jì)算公式中。同時(shí),等位基因的計(jì)算方法忽略了基因型的整體性,采用公式進(jìn)行準(zhǔn)確性評(píng)估。錯(cuò)誤率(Er)=填充錯(cuò)誤的基因型/所有被填充的基因型。

      1.8 育種值估計(jì) 本實(shí)驗(yàn)使用了3 種基因型數(shù)據(jù)分別進(jìn)行育種值估計(jì)。根據(jù)已有報(bào)道,GBLUP-CE 對(duì)復(fù)雜性狀估計(jì)的準(zhǔn)確性有一定優(yōu)勢(shì)[21],因此使用該方法對(duì)3 種SNP 芯片(低密度SNP 芯片、經(jīng)過填充得到的高密度SNP 芯片和高密度SNP 芯片)的數(shù)據(jù)分別估計(jì)ADG、BF 和FCR 的GEBV。GBLUP-CE方法由GVCBLUP軟件[22]提供。

      1.9 相關(guān)性比較 經(jīng)過育種值估計(jì)后,將使用低密度SNP 芯片與使用基因型填充后的SNP 芯片估計(jì)得到的GEBV 分別與使用高密度SNP 芯片估計(jì)得到的GEBV進(jìn)行比較,計(jì)算皮爾遜積矩相關(guān)系數(shù)[23],從而比較SNP 芯片密度對(duì)GEBV 估計(jì)的影響。

      2 結(jié)果

      2.1 低密度SNP 芯片篩選與基因型填充方案分析 本研究使用PorcineSNP60 芯片對(duì)1 068 個(gè)杜洛克公豬個(gè)體進(jìn)行基因型分型,經(jīng)過質(zhì)控后共獲得35 694 個(gè)SNP 位點(diǎn)作為高密度SNP 芯片數(shù)據(jù)用于后續(xù)分析。通過篩選高密度SNP 芯片數(shù)據(jù)中選取與ADG、BF 和FCR 3 個(gè)性狀關(guān)聯(lián)效應(yīng)最高的位點(diǎn),共得到5 989 個(gè)SNP 位點(diǎn),將其作為低密度SNP 芯片數(shù)據(jù)。

      為了探索全同胞個(gè)體與隨機(jī)個(gè)體對(duì)GEBV 準(zhǔn)確性估計(jì)的影響,本實(shí)驗(yàn)分別使用隨機(jī)填充和全同胞填充2種設(shè)計(jì)方案在考慮系譜和不考慮系譜2 種條件下進(jìn)行基因型填充。如果使用全同胞填充得到的SNP 芯片數(shù)據(jù)與隨機(jī)填充得到的SNP 芯片數(shù)據(jù)之間沒有明顯差異,則表明當(dāng)群體的遺傳背景一致性較高時(shí)可使用隨機(jī)個(gè)體進(jìn)行基因型填充以獲得更大的便利性。填充后,通過與原有高密度SNP 芯片進(jìn)行比較,4 種方案填充后的錯(cuò)誤率如表1 所示,不管是使用隨機(jī)個(gè)體還是全同胞個(gè)體進(jìn)行基因型填充,系譜信息的有無都沒有對(duì)本實(shí)驗(yàn)中的基因型填充的準(zhǔn)確性產(chǎn)生影響。使用隨機(jī)個(gè)體進(jìn)行基因型填充的錯(cuò)誤率為6.19%,而使用全同胞的錯(cuò)誤率則為6.00%,可以看出當(dāng)使用全同胞個(gè)體進(jìn)行填充時(shí),其基因型填充錯(cuò)誤率更低。進(jìn)一步觀察4 種方案的每個(gè)SNP 的填充錯(cuò)誤率,發(fā)現(xiàn)4 種不同填充方案之間的錯(cuò)誤率分布沒有明顯差異,每個(gè)SNP 的填充錯(cuò)誤率都在0~0.75,而在每個(gè)染色體兩端的區(qū)域錯(cuò)誤率較高(圖3)。

      表1 不同方案基因型填充平均錯(cuò)誤率表

      2.2 不同密度的SNP 芯片在全基因組選擇中的效果分析 如表2 所示,低密度SNP 芯片數(shù)據(jù)與原有的高密度SNP 芯片數(shù)據(jù)在估計(jì)3 個(gè)性狀的GEBV 時(shí)兩者的相關(guān) 性 都 在0.95 以 上(ADG:0.971 9,BF:0.958 0,F(xiàn)CR:0.953 6),表明與原有的高密度SNP 芯片相比,沒有經(jīng)過基因型填充的低密度SNP 芯片就已經(jīng)可以達(dá)到較高的準(zhǔn)確性。因此,與性狀緊密相關(guān)的基因位點(diǎn)組成的低密度SNP 芯片雖然不能完全代替高密度SNP 芯片,但在經(jīng)費(fèi)投入有限的情況下仍擁有一定的使用價(jià)值。

      圖3 不同方案基因型填充錯(cuò)誤率示意圖

      進(jìn)一步使用不考慮系譜的隨機(jī)填充方案得到的高密度SNP 芯片數(shù)據(jù)時(shí),其估計(jì)GEBV 結(jié)果和原有高密度SNP 芯片估計(jì)結(jié)果的相關(guān)性有了進(jìn)一步提升,ADG、BF、FCR 分別達(dá)到0.991 8、0.990 0、0.990 8,即經(jīng)過基因型填充后估計(jì)所得的GEBV 相關(guān)性都達(dá)到了99%以上,其GEBV 估計(jì)幾乎和原有的高密度SNP 芯片一致。說明在SNP 芯片密度相同的情況下,使用經(jīng)過基因型填充得到的SNP 芯片和高密度SNP 芯片估計(jì)GEBV 所得到的結(jié)果沒有顯著差異,而基因型填充SNP芯片的成本較高密度SNP 芯片直接分型更有優(yōu)勢(shì)。

      表2 低密度SNP 芯片與高密度SNP 芯片估計(jì)性狀GEBV 的相關(guān)性分析

      總體而言,雖然和性狀緊密相關(guān)的低密度SNP 芯片已經(jīng)擁有了較高的準(zhǔn)確性,但是由于芯片密度的差異還是使得其與高密度SNP 芯片結(jié)果之間一致性較低。當(dāng)使用基因型填充技術(shù)提高芯片密度時(shí),GEBV 的估計(jì)準(zhǔn)確性有了巨大提升。以上研究結(jié)果表明,低密度SNP芯片與基因型填充技術(shù)聯(lián)合使用可替代高密度SNP 芯片用于分子選種。

      3 討 論

      本實(shí)驗(yàn)通過將含有5 989 個(gè)位點(diǎn)的低密度SNP 芯片進(jìn)行填充,研究了不同的基因型填充方案的準(zhǔn)確性差異,結(jié)果顯示不論是親緣關(guān)系還是系譜信息,對(duì)基因型填充的準(zhǔn)確率都沒有顯著影響。根據(jù)之前的研究[24-25],參考群體與驗(yàn)證群體的親緣關(guān)系對(duì)準(zhǔn)確性有一定影響。當(dāng)參考群與驗(yàn)證群之間的親緣關(guān)系較近時(shí),會(huì)共享較多的單倍型片段,因此準(zhǔn)確率會(huì)有一定提升。本研究發(fā)現(xiàn),使用隨機(jī)個(gè)體進(jìn)行填充時(shí)錯(cuò)誤率為6.19%,而使用全同胞群體進(jìn)行填充時(shí)錯(cuò)誤率為6.00%??梢钥闯鍪褂萌麄€(gè)體進(jìn)行填充,準(zhǔn)確率雖然有所提升,但是提升不明顯。這可能是由于本實(shí)驗(yàn)所用的個(gè)體均來自于同一個(gè)種豬場(chǎng),其中大部分個(gè)體的親緣關(guān)系本身較近,再加上本實(shí)驗(yàn)使用的杜洛克豬樣本具有較高的遺傳關(guān)聯(lián),上述因素導(dǎo)致了本實(shí)驗(yàn)中親緣關(guān)系對(duì)填充的準(zhǔn)確率作用較小這一結(jié)果。

      另一方面,針對(duì)本實(shí)驗(yàn)所使用的Beagle 填充軟件,其從4.0 版本開始可以結(jié)合系譜信息進(jìn)行基因型填充,但并未報(bào)道系譜的有無對(duì)于基因型填充準(zhǔn)確率的影響。本實(shí)驗(yàn)結(jié)果顯示,在2 種不同的群體中,不管使用系譜與否,其得到的結(jié)果基本一致,說明Beagle 軟件能在群體內(nèi)親緣關(guān)系較近的情況下有效利用基因型當(dāng)中包含的潛在系譜信息進(jìn)行基因型填充,這在實(shí)際的豬育種工作中,可以極大地簡(jiǎn)化信息采集工作。

      從整條染色體上的填充錯(cuò)誤率分布來看,在每條染色體的兩端均出現(xiàn)了較高的填充錯(cuò)誤率,這可能是由于染色體兩端連鎖的SNP 較少從而導(dǎo)致基因型填充過程中信息不全。另外,Larmer 等[14]比較了在荷斯坦奶牛中的結(jié)果,其基因型填充錯(cuò)誤率在5%左右,略低于本研究結(jié)果,但是差異不大。

      本研究所使用的低密度SNP 芯片是由豬的60K SNP 芯片經(jīng)過基因關(guān)聯(lián)分析而來的,因此低密度SNP芯片和性狀具有較高的相關(guān)性。但本研究結(jié)果顯示,經(jīng)過填充的高密度SNP 芯片的準(zhǔn)確性更高。也就是說,即使在低密度SNP 芯片和性狀相關(guān)性較高的前提下,對(duì)芯片進(jìn)行基因型填充可以進(jìn)一步提高育種值估計(jì)的準(zhǔn)確性。

      4 結(jié) 論

      本研究研究結(jié)果表明,應(yīng)用與目標(biāo)性狀緊密關(guān)聯(lián)的低密度SNP 芯片結(jié)合基因型填充技術(shù)可以達(dá)到較高的育種值估計(jì)準(zhǔn)確性,并發(fā)現(xiàn)在遺傳背景較為類似的群體中親緣關(guān)系對(duì)基因型填充結(jié)果的準(zhǔn)確性影響不大,不會(huì)影響個(gè)體基因組育種值的估計(jì)效果。

      猜你喜歡
      錯(cuò)誤率低密度高密度
      限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類錯(cuò)誤率膨脹*
      低密度隔熱炭/炭復(fù)合材料高效制備及性能研究
      高密度電法在斷裂構(gòu)造探測(cè)中的應(yīng)用
      高密度電法在尋找地下水中的應(yīng)用
      低密度超音速減速器
      軍事文摘(2018年24期)2018-12-26 00:57:40
      正視錯(cuò)誤,尋求策略
      教師·中(2017年3期)2017-04-20 21:49:49
      解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯(cuò)誤原因
      城市高密度環(huán)境下的建筑學(xué)探討
      一種低密度高強(qiáng)度導(dǎo)電橡膠組合物
      降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
      新闻| 荆州市| 新津县| 宜君县| 安溪县| 彝良县| 若羌县| 婺源县| 金溪县| 固始县| 吉林省| 闵行区| 河北区| 古蔺县| 砚山县| 蒙城县| 东阿县| 黄骅市| 阳曲县| 高邑县| 房山区| 二连浩特市| 抚州市| 会宁县| 中宁县| 安国市| 呼图壁县| 临猗县| 武义县| 绿春县| 美姑县| 雷山县| 绥芬河市| 农安县| 察隅县| 定陶县| 蓝山县| 兴山县| 通城县| 湘潭县| 万安县|