常振華,王世康,亐開興,夏小婷,黃永震,雷初朝*
(1.渭南職業(yè)技術(shù)學(xué)院,陜西渭南 714026;2.西北農(nóng)林科技大學(xué)動物科技學(xué)院,陜西楊凌 712100;3.楚雄師范學(xué)院,云南楚雄 675000)
郟縣紅牛是我國優(yōu)良地方黃牛品種,主要分布于河南省平頂山市郟縣、寶豐縣和魯山縣,分布區(qū)域位于東經(jīng)112°14'~113°45'、北緯33°08'~34°20',屬于暖溫帶大陸性季風(fēng)氣候。郟縣紅牛具有體格大、耐粗飼、適應(yīng)性強、肉質(zhì)紅潤細嫩等特點。但目前郟縣紅牛育種工作中仍存在諸多問題,如良種的保護與開發(fā)不足所導(dǎo)致種群數(shù)量逐年減少、品種生產(chǎn)水平較低等,需要通過現(xiàn)代育種原理與方法進一步選育提高與開發(fā)利用。
動物Y 染色體常被作為研究動物父系遺傳進化和親緣關(guān)系的重要工具。種公牛對牛品種選育具有重要作用,因此需要分析其Y 染色體基因組遺傳變異(主要是Y 染色體單拷貝區(qū)SNP)來研究家牛的起源。家牛Y染色體包括擬常染色體區(qū)(Pseudoautosomal Region,PAR)和雄性特異區(qū)(Male-Specific Region,MSY)。家牛MSY 區(qū)在減數(shù)分裂期間不與X 染色體重組。家牛MSY 區(qū)包含X-退化區(qū)、X-轉(zhuǎn)移區(qū)和擴增區(qū)。其中X-退化區(qū)位于MSY 區(qū)的兩端,包含2 段單拷貝區(qū)域。經(jīng)過注釋,共有12 個單拷貝基因位于X-退化區(qū),分別為。Chen 等對世界家牛的Y 染色體雄性特異區(qū)SNP 進行掃描,將家牛父系起源更細致地劃分為:Y1、Y2a、Y2b、Y3a 和Y3b。然而,關(guān)于郟縣紅牛品種父系起源的研究,目前只采用Y 染色體雄性特異基因SNP 與微衛(wèi)星標記方法進行過研究,尚未對郟縣紅牛進行Y 染色體基因組水平的系統(tǒng)研究。因此,本研究使用郟縣紅牛MSY 區(qū)中X-退化區(qū)單拷貝基因進行全基因組掃描,以分析郟縣紅牛的父系遺傳多樣性與起源。
1.1 數(shù)據(jù)來源 本研究使用的16 頭郟縣紅牛Y 染色體基因組數(shù)據(jù)來源于本團隊發(fā)表的黃牛全基因組文獻,但Xia 等發(fā)表的論文并未分析郟縣紅牛Y 染色體基因組的多樣性。本研究選取Chen 等研究中使用的5 個Y 染色體基因組單倍型:Y1(SRR1365144,安格斯牛)、Y2a(SRR5507257,哈薩克牛)、Y2b(SRR934415,韓牛)、Y3a(SRR5507285,廣豐牛)和Y3b(SRR2016752,吉爾牛)作為對照,對照個體數(shù)據(jù)從NCBI 下載。
1.2 Y 染色體基因組遺傳多樣性與父系起源分析 使用GATK3.8 軟件的GenotypeGVCFs 模塊對16 頭郟縣紅牛和5 頭對照組牛Y 染色體基因組數(shù)據(jù)進行基因分型。使用VCFtools-0.1.16 軟件提取集合中牛Y 染色體X-退化區(qū)單拷貝基因SNP 做后續(xù)分析。用SnpEFF 軟件對Y 染色體X-退化區(qū)SNP 進行注釋,DnaSP v5 軟件進行序列比對,計算單倍型多樣度Hd 和核苷酸多樣度Pi。隨后,使用RAxML-master v8.2.12 軟件構(gòu)建系統(tǒng)發(fā)育樹。參數(shù)設(shè)置為:-f a -x 123 -p 23 -# 100 -m GTRGAMMA,結(jié)果文件通過FigTree v1.4.3 實現(xiàn)可視化。最后使用Network 10.2.0.0 軟件構(gòu)建Y-SNP 單倍型網(wǎng)絡(luò)圖。
2.1 郟縣紅牛Y 染色體SNP 多態(tài)性 對16 頭郟縣紅牛和5 頭對照組牛Y 染色體X-退化區(qū)單拷貝基因位點進行提取,共篩選到1 346 個位點,去掉存在缺失的位點后剩余827 個位點,其中有210 個位點存在多態(tài)性,在郟縣紅牛群體中有178 個Y-SNP 多態(tài)位點。轉(zhuǎn)換和顛換比值(Ts/Tv)為1.69,表明轉(zhuǎn)換比例大于顛換比例,符合堿基替換的特征。使用snpEFF 注釋這些位點,共包含7 個基因,分別是。郟縣紅牛的平均變異數(shù)(K)為51.14,單倍型多樣度(Hd±SD)為0.717±0.095,核苷酸多樣度(Pi±SD)為0.061 8±0.019 8。遺傳多態(tài)性分析結(jié)果表明郟縣紅牛Y 染色體序列遺傳多樣性豐富。
2.2 群體結(jié)構(gòu)分析 以5 頭已知Y 染色體單倍型組的家牛個體作為對照組,對郟縣紅牛Y 染色體基因組的序列變異進行分析,使用Fig Tree v1.4.3 軟件構(gòu)建郟縣紅牛的最大似然樹(圖1)。結(jié)果表明郟縣紅牛中共定義了5 種單倍型(JXR1~5),JXR4 屬于主要單倍型,占50%(8/16);最大似然樹將郟縣紅牛Y 染色體基因組序列分為3 個單倍型組:Y1、Y2 和Y3。Y2 被細分為Y2a 和Y2b;Y3 又分為Y3a 和Y3b。郟縣紅牛中81.25%(13/16)屬于Y2 單倍型組,還有18.75%(3/16)的郟縣紅牛屬于Y3 單倍型組。參考個體均位于對應(yīng)支系中,說明構(gòu)樹結(jié)果正確。
圖1 郟縣紅牛Y 染色體進化樹
2.3 構(gòu)建單倍型網(wǎng)絡(luò)圖 為進一步分析單倍型之間的系統(tǒng)發(fā)育關(guān)系,本研究利用Network 5.0 軟件構(gòu)建郟縣紅牛的Network 網(wǎng)絡(luò)圖(圖2)。單倍型分析共鑒定10個單倍型,其中郟縣紅牛有5 個單倍型,各單倍型分布與構(gòu)建的最大似然樹相符,單倍型信息見表1。結(jié)果顯示,所研究的郟縣紅牛群體可分為普通牛(Y2a 和Y2b)單倍型組和瘤牛(Y3a)單倍型組。其中Y2b 為主要亞單倍型組,占75%(12/16),其次是Y3a,占18.75%(3/16),Y2a 最低,占6.25%(1/16),沒有Y1 和Y3b 單倍型組。
圖2 郟縣紅牛Y 染色體單倍型網(wǎng)絡(luò)圖
表1 郟縣紅牛單倍型信息表
Y 染色體的MSY 區(qū)域已經(jīng)廣泛應(yīng)用于遺傳多樣性與父系起源的研究。從Y-SNPs到Y(jié)-STR再到二者的合用,對于MSY 區(qū)域的研究手段也層出不窮。先前的研究僅將郟縣紅牛劃分為Y2 和Y3 2 個單倍型組。本研究利用全基因組重測序數(shù)據(jù),對郟縣紅牛Y 染色體MSY 的X-退化區(qū)Y-SNPs 進行掃描、聚類分析,結(jié)果顯示郟縣紅牛品種中Y2b 亞單倍型組占絕對優(yōu)勢,這與Chen 等的結(jié)論基本一致,但與之不同的是,Chen 等的研究結(jié)果中5 頭郟縣紅牛僅存在Y2b 和Y3a 亞單倍型組,而未在郟縣紅牛中檢測到Y(jié)2a 亞單倍型組,可能是其用到的樣本量太少所致。本研究首次在郟縣紅牛品種中發(fā)現(xiàn)Y2a 亞單倍型組,表明郟縣紅牛作為中國中原地區(qū)黃牛,同時受到北方普通牛和南方瘤牛的影響。該結(jié)論與之前有關(guān)郟縣紅牛Y 染色體形態(tài)與線粒體D-loop 區(qū)核苷酸變異的結(jié)果一致。
單倍型多樣性描述了從群體中隨機選取的兩條序列間存在核苷酸差異的概率,使用不同的標記計算所得單倍型多樣度會有所不同。以郟縣紅牛為例,Li 等使用基因序列標記位點計算所得單倍型多樣度明顯小于使用4 個Y-SNPs 和2 個Y-STRs 計算的單倍型多樣度。本研究中郟縣紅牛的Y 染色體單倍型多樣度(H±SD)為0.717±0.095,略高于Li 等所發(fā)現(xiàn)的郟縣紅牛Y 染色體單倍型多樣度(0.623±0.073),其原因是本研究所使用的Y-SNP 位點數(shù)增多從而提高了其單倍型多樣度。與此同時,該結(jié)果也大于中國地方黃牛的平均單倍型多樣度(0.607±0.016),說明郟縣紅牛具有豐富的遺傳資源。
中國黃牛主要有Y2a、Y2b 和Y3a 3 個父系起源,少量的Y1 單倍型組可能是最近歐洲肉牛品種雜交的結(jié)果。在郟縣紅牛中未檢測到Y(jié)1 單倍型,說明采集的樣本較純,未受到雜交影響。近年來,受到外來引入品種和存欄量下降的影響,許多地方品種到達瀕危的邊緣,郟縣紅牛也不例外。在引入外來品種的同時,需要采取措施保護郟縣紅牛等地方黃牛品種資源,避免造成種質(zhì)不純等問題。
本研究以Y 染色體X-退化區(qū)單拷貝基因為目標研究郟縣紅牛的父系遺傳背景,將郟縣紅牛的父系起源進一步明確和細化。在郟縣紅牛品種中共檢測到Y(jié)2a、Y2b 和Y3a 3 種亞單倍型組,并以Y2b 亞單倍型組為主;16 個郟縣紅牛共分為5 個單倍型(JXR1-5),JXR1 屬于Y2a;JXR2、JXR3 和JXR4 均屬于Y2b;JXR5 屬于Y3a 亞單倍型組。郟縣紅牛為北方普通牛和南方瘤牛父系基因交流的產(chǎn)物,具有較為復(fù)雜的父系起源、較高的單倍型多樣性與核苷酸多樣性。