劉玲玲,孟 軍,菲茹扎,王 瓊,曹 行,劉武軍
(新疆農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,新疆烏魯木齊 830052)
毛色是動(dòng)物的一種重要特征,其能夠在偽裝、模仿、社會(huì)交流和抵御太陽(yáng)輻射有害影響等方面保護(hù)動(dòng)物[1]。毛色還與某些動(dòng)物疾病有關(guān),例如銀色馬的先天性眼異常綜合癥[2]。人類(lèi)對(duì)毛色具有偏好性。20 世紀(jì)50 年代初,花馬僅出現(xiàn)在愛(ài)爾蘭,因英國(guó)人對(duì)此毛色的馬匹不感興趣,無(wú)法引入英國(guó),但吉普賽人對(duì)花馬比較偏愛(ài),且以此馬為親本培育出毛色以黑白相間為主的吉普希凡尼馬品種[3]。決定馬匹毛色的主要因素是黑色素[4],影響毛色的基因能夠調(diào)節(jié)黑色素的產(chǎn)生與分布,進(jìn)而形成各種各樣的毛色。影響家養(yǎng)動(dòng)物豬[5]、牛[6]、羊[7]毛色性狀的主要基因及機(jī)制已有相關(guān)研究。Cho 等[8]利用全基因組關(guān)聯(lián)分析對(duì)雜交豬的毛色進(jìn)行研究,發(fā)現(xiàn)KIT(V-Kit Hardy-Zuckerman 4 Feline Sarcoma Viral Oncogene Homolog)是影響雜交豬毛色的基因。KIT基因也是決定韓國(guó)濟(jì)州島馬與純血馬的雜交后代馬中毛色呈斑點(diǎn)狀的主要基因[9]。Edea 等[6]基于高密度芯片對(duì)187 頭埃塞俄比亞牛進(jìn)行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)MITF基因是影響牛毛色呈斑點(diǎn)狀的基因。關(guān)于影響馬毛色性狀的主要基因和突變位點(diǎn)研究也有報(bào)道,如Brunberg 等[10]研究發(fā)現(xiàn)PME17基因第11 外顯子處發(fā)生缺失突變導(dǎo)致該處氨基酸排列從精氨酸突變?yōu)榘腚装彼?,該突變顯示與多種馬品種的銀色表型完全相關(guān)。
為進(jìn)一步鑒別影響馬毛色性狀的主要基因和突變位點(diǎn),本研究基于馬670K SNP 芯片,利用全基因組關(guān)聯(lián)分析(GWAS)方法,對(duì)控制馬騮毛和栗毛毛色性狀的基因進(jìn)行研究,旨在挖掘影響伊犁馬毛色性狀的關(guān)鍵基因,探究馬毛色性狀的遺傳基礎(chǔ)。
1.1 實(shí)驗(yàn)動(dòng)物 研究群體包括119 匹伊犁馬(年齡5~7歲),來(lái)自伊犁哈薩克自治州昭蘇馬場(chǎng)。
1.2 血樣采集 頸靜脈采血5 mL,枸櫞酸鈉抗凝,-20℃保存。
1.3 DNA 提取及測(cè)序 將采集的血樣送至北京博奧公司,提取馬基因組DNA 及芯片測(cè)序。
1.4 表型數(shù)據(jù)測(cè)定 伊犁馬毛色以栗毛和騮毛居多,根據(jù)毛色分類(lèi)方法和實(shí)驗(yàn)群體的毛色種類(lèi)將毛色分為騮毛和栗毛,栗毛對(duì)應(yīng)編碼為1,騮毛對(duì)應(yīng)編碼為2。
1.5 基因型數(shù)據(jù)的質(zhì)量控制 利用Plink(v1.9)軟件,對(duì)119 個(gè)個(gè)體及670 796 個(gè)SNPs 數(shù)據(jù)進(jìn)行質(zhì)量控制。實(shí)驗(yàn)剔除了檢出率小于90% 的個(gè)體;剔除了分型成功率(call rate)小于90%的染色體位點(diǎn)和等位基因頻率(MAF)小于0.03 的染色體位點(diǎn)。
1.6 群體分層評(píng)估 為消除連鎖不平衡對(duì)個(gè)體間遺傳相關(guān)估計(jì)的偏差,選用獨(dú)立的SNPs,利用Plink(1.9)進(jìn)行SNPs 篩選,以50 個(gè)位點(diǎn)為一個(gè)窗口,以5 個(gè)位點(diǎn)為步長(zhǎng),r2設(shè)為0.2。利用主成分分析(PCA)方法對(duì)群體結(jié)構(gòu)進(jìn)行分析,應(yīng)用Rv3.4.4 作圖[11]。
1.7 統(tǒng)計(jì)分析模型 全基因組關(guān)聯(lián)分析使用Plink1.9 軟件(http://www.cog-genomics.org/plink/1.9/)中的卡方檢驗(yàn)進(jìn)行Case-Control 設(shè)計(jì)。
1.8 多重校正 應(yīng)用Bonferroni 方法進(jìn)行多重校正,并確定全基因組顯著閾值,計(jì)算方法是常規(guī)的顯著P值除以檢測(cè)的SNP 個(gè)數(shù),對(duì)檢驗(yàn)的SNP 的P<0.05/N 或P<1/N 分別表示SNP 達(dá)到基因組水平顯著關(guān)聯(lián)或潛在關(guān)聯(lián)(N 為質(zhì)控后和連鎖不平衡后的獨(dú)立SNP 數(shù)目)[12];即P<5.19E-7(0.05/96 903)時(shí),SNP 與毛色性狀顯著關(guān)聯(lián);SNP 的P<1.03E-5(1/96 903)時(shí),SNP 與毛色性狀潛在關(guān)聯(lián)。
1.9 位置候選基因注釋 利用馬基因組EquCab2.0 序列信息結(jié)合NCBI(http://www.ncbi.nlm.nih.gov/)、UCSC(http://genome.ucsc.deu/)、Ensembl(http://asia.ensembl.org/index.html)等生物信息學(xué)數(shù)據(jù)庫(kù),對(duì)顯著的SNPs位置進(jìn)行定位,沒(méi)有處在基因內(nèi)部的SNPs 標(biāo)記,考慮到標(biāo)記之間的連鎖不平衡,則分別檢索顯著SNP 位點(diǎn)上、下游1 000 kb 范圍內(nèi)的候選基因。通過(guò)在線軟件Genecards(www.genecards.org/)和KEGG 來(lái)查找和分析候選基因功能。
2.1 毛色性狀表型描述性統(tǒng)計(jì) 在本研究的119 匹伊犁馬中,栗毛色的馬匹為41 匹,騮毛色的馬匹為78 匹。
2.2 質(zhì)控結(jié)果 合格的樣本經(jīng)過(guò)Affymetrix 的GTC 平臺(tái)分型,經(jīng)過(guò)嚴(yán)格的質(zhì)量控制之后,檢出率<90%的SNP標(biāo)記有22 649 個(gè),MAF<0.03 的SNP 標(biāo)記有154 010 個(gè),最終剩余494 137 個(gè)SNPs 和119 個(gè)個(gè)體用于后續(xù)分析;經(jīng)過(guò)連鎖不平衡分析,估算的獨(dú)立SNP 數(shù)目為107 680,去除未知染色體上的SNP 數(shù)后,獨(dú)立SNP 數(shù)為96 903(用于計(jì)算Bonferroni 校正P值)。
2.3 群體結(jié)構(gòu) 由圖1 可知,實(shí)驗(yàn)群體不存在分層現(xiàn)象。為保證結(jié)果更準(zhǔn)確,同樣將群體因素作為協(xié)變量加入到全基因組關(guān)聯(lián)分析模型中。
圖1 群體主成分分析圖
2.4 GWAS 結(jié)果 圖2 反映了對(duì)應(yīng)毛色性狀顯著相關(guān)的SNPs,且能看到位點(diǎn)在各個(gè)染色體上的分布情況。Y值為6.285 所對(duì)應(yīng)的線代表全基因組顯著水平閾值,位于此線之上的位點(diǎn)表示其與目標(biāo)性狀相關(guān)性達(dá)到全基因組顯著水平。GWAS 結(jié)果表明,有2 個(gè)SNPs 達(dá)到全基因組顯著水平。
圖2 GWAS 曼哈頓圖
2.5 基因注釋結(jié)果 注釋結(jié)果如表1 所示,2 個(gè)SNP 共注釋出39 個(gè)基因,其中2 個(gè)SNP 的共同基因?yàn)镃PNE7、DPEP1、CDK10、PATA2L、VPS9D1、ZNF276、FANCA、SPIRE2、TCF25、MC1R、DEF8、GAS8,且AX-104199007是顯著性最高的SNP。
表1 毛色性狀基因注釋結(jié)果
2.6 富集分析結(jié)果 基因功能分析結(jié)果發(fā)現(xiàn)MC1R通過(guò)調(diào)節(jié)細(xì)胞內(nèi)cAMP 水平對(duì)酪氨酸酶進(jìn)行調(diào)控,最終形成不同毛色。
隨著高通量測(cè)序技術(shù)的革新,GWAS 方法逐漸成為研究哺乳動(dòng)物基因的主要方法。在牛上,利用GWAS成功找出與生產(chǎn)和繁殖性狀相關(guān)的基因[13-14];在馬上,目前僅找出與疾病相關(guān)的基因[15]。本研究旨在找出與伊犁馬毛色性狀關(guān)聯(lián)的基因。Sponenberg 等[16]將馬的毛色分為2 類(lèi),即黑色和非黑色。Thiruvenkadan 等[4]將毛色分為3 類(lèi),第1 類(lèi)毛色為基礎(chǔ)毛色,即黑色、騮色、栗色;第2 類(lèi)毛色為稀有毛色,即奶油色、褐色、銀棕色、香檳色;第3 類(lèi)為以白色為基礎(chǔ)的毛色。韓國(guó)才等[17]將毛色分為單毛色和復(fù)毛色兩大類(lèi)(13 個(gè)小分類(lèi))。伊犁馬群體中毛色較多的為騮毛和栗毛。本研究將毛色分為騮毛和栗毛,屬于韓國(guó)才[17]一書(shū)中單毛色的分類(lèi)。
黑素皮質(zhì)素受體1(MC1R)能夠調(diào)節(jié)產(chǎn)生黑色素細(xì)胞刺激激素(α-Melanocyte Stimulating Hormone,α-MSH),同時(shí)它是G-偶聯(lián)蛋白家族受體之一[18]。環(huán)磷酸腺苷cAMP(Cyclic Adenosine 3’,5’-Monophosphate,cAMP)信號(hào)通路為真黑素形成的關(guān)鍵調(diào)節(jié)通路。MC1R 與α-MSH 結(jié)合使cAMP 被激活,升高細(xì)胞內(nèi)的cAMP 水平,隨后激活酪氨酸激酶,從而活化粗面型內(nèi)質(zhì)網(wǎng)以及游離核糖體上合成的酪氨酸酶。黑色素細(xì)胞被催化,并且酪氨酸從血液中被攝取,多巴被高爾基復(fù)合體形成,當(dāng)黑色素小體內(nèi)的多巴積累到一定程度后,黑色素被釋放,形成動(dòng)物的毛色[19]。Agouti 位點(diǎn)編碼刺鼠信號(hào)蛋白(ASIP),它能與α-MSH 進(jìn)行競(jìng)爭(zhēng)性結(jié)合MC1R,使得cAMP 水平下降,減少黑色素含量[20]。本研究得出MC1R基因可能是影響伊犁馬毛色的主要基因之一。根據(jù)NCBI 收錄信息,MC1R基因位于馬3 號(hào)染色體,全長(zhǎng)1 721 bp,外顯子區(qū)954 bp。在家養(yǎng)動(dòng)物豬[21]、羊[22]、雞[23]、狗[24]、貓[25]中,關(guān)于MC1R基因的研究較多。Mahmoud[26]研究沙特阿拉伯綿羊品種MC1R基因的DNA 多態(tài)性,在MC1R基因中檢測(cè)到5個(gè)單核苷酸多態(tài)性(SNPs),顯性Ed 等位基因最常見(jiàn)的單體型(H3)分別與Najdi 和Sawaknee 綿羊的黑色或棕色毛色相關(guān)。在緬甸貓中發(fā)現(xiàn)一種新的毛色,被稱(chēng)為赤褐色,MC1R基因是影響這一毛色的候選基因[25]。在馬中關(guān)于MC1R基因的研究較少,Marklund 等[27]研究發(fā)現(xiàn)MC1R基因的一個(gè)錯(cuò)義突變(83 bp)與栗色毛的產(chǎn)生有關(guān)。Wanger 等[28]利用限制性TaqI 的方法發(fā)現(xiàn)MC1R基因84 bp(GAC →AAC)處具有突變位點(diǎn),導(dǎo)致MC1R基因中第2 個(gè)氨基酸替換(Asp →Asn),進(jìn)而產(chǎn)生栗毛。Rieder 等[29]研究發(fā)現(xiàn)雜合子的表型為淺棕色,而純合子表型為深棕色。趙姍姍等[30]利用限制性?xún)?nèi)切酶片段長(zhǎng)度多態(tài)性(RFLP)對(duì)馬MC1R基因多態(tài)性與毛色進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)MC1R基因存在3個(gè)多態(tài)位點(diǎn),在騮毛馬群體中存在EE 和Ee 2 種基因型,栗毛馬中存在ee 和eea2 種基因型。在本研究中雖沒(méi)有發(fā)現(xiàn)其他注釋的基因與毛色有關(guān),但它們可能未被發(fā)掘,后續(xù)將繼續(xù)挖掘。
本研究首次利用馬670K 高密度芯片對(duì)馬毛色性狀進(jìn)行全基因組關(guān)聯(lián)分析,經(jīng)過(guò)Bonferroni 校正后,發(fā)現(xiàn)2 個(gè)與馬毛色性狀顯著相關(guān)的SNPs,注釋出已知與毛色性狀相關(guān)的基因MC1R,為進(jìn)一步的基因功能驗(yàn)證提供前期基礎(chǔ)數(shù)據(jù)。