宋玉樸,孫永峰*,馮自強,周宇軒,張 磊,李晟毅,閆曉敏,許云鵬
(1.吉林農(nóng)業(yè)大學動物科學技術學院,吉林長春 130118;2.江西省畜牧技術推廣站,江西南昌 330000)
單核苷酸多態(tài)性(Single Νucleotide Polymorphism,>SΝP)是一類重要的遺傳標記,具有數(shù)量大、二態(tài)性、穩(wěn)定遺傳和易于自動化檢測等特點[1]。伴隨著人類基因組計劃的開展和完成,世界各地的科研人員陸續(xù)開展了囊括大量物種的基因組測序工作,公布了大量的基因組DΝA 序列,同時構建了包含基因組序列、基因標簽、突變位點等生物信息的數(shù)據(jù)庫。基因組學的研究成果極大促進了SΝP 的發(fā)掘和檢測技術的發(fā)展。SΝP 檢測與分型技術已廣泛應用于畜禽遺傳學研究、品種選育、種質資源保護等領域,促進了畜禽產(chǎn)業(yè)的發(fā)展。本文對SΝP 的形成、分類、檢測方法以及SΝP 檢測技術的發(fā)展和在畜禽中的研究與應用進行綜述,分析各類SΝP檢測方法的優(yōu)缺點,以拓展其應用領域。
SΝP 即單核苷酸多態(tài)性,是基因組水平上單個核苷酸變異所導致的DΝA 堿基序列的改變,屬于第3 代遺傳標記,于1996 年由人類基因組中心科學家Lander等第1 次提出此概念[2]。SΝP 主要來源是DΝA 復制過程中的錯誤匹配、遺傳物質的化學損傷和腺嘌呤、鳥嘌呤的自發(fā)脫氨基,主要呈現(xiàn)為堿基的轉換、顛換、插入和缺失4 種形式[3-6]。
根據(jù)堿基變異所發(fā)生的位置,可分為編碼區(qū)SΝP和非編碼區(qū)SΝP,其中非編碼區(qū)SΝP 又可細分為基因間SΝP(iSΝP)和基因內SΝP[7-9]。根據(jù)是否造成編碼氨基酸或功能性RΝA 堿基的改變,又可分為同義SΝP和非同義SΝP。同義SΝP 的形成并不影響蛋白質的翻譯過程;非同義突變包括錯義突變和無義突變,錯義突變是指點突變后使編碼氨基酸改變[10];無義突變則使編碼氨基酸突變成終止密碼子(圖1)。SΝP 作為一種核苷酸水平變異造成的遺傳標記,編碼區(qū)非同義SΝP成為研究人員的廣泛關注的研究對象[11]。
SΝP 檢測樣本一般為基因組DΝA[12],檢測SΝP的方法有很多,根據(jù)不同的檢測原理可分為以下八大類(表1)。
表1 SΝP 檢測方法及其優(yōu)缺點
2.1 測序法 測序法是最便捷的SΝP 檢測方法,其基本原理是通過對目的DΝA 序列進行測序,將結果與參考DΝA 序列進行對比,以判斷目的DΝA 是否發(fā)生堿基突變[13]。測序法具有檢出率極高的特點,應用測序法可獲知核苷酸突變的類型和突變位點,為后續(xù)的SΝP 分型提供重要基礎。
第1 代測序包括由Sanger 等[14]首創(chuàng)的鏈終止法和Maxam 等[15]提出的化學法,Sanger 是DΝA 測序金標準[16]。Sanger 法雖然堿基讀取率接近100%,但當2 個或多個位點為雜合子時,它不能從基因組DΝA 中確定單個SΝP 的等位基因之間的順反式關系[17],且測序通量不高、檢測速度較慢、實驗花費高。經(jīng)改進的測序技術降低了測序成本,大幅提高了測序效率[18]。二代測序基于邊合成邊測序的基本原理,實現(xiàn)了真正意義上的高通量。基于單分子讀取技術的第3 代測序技術有數(shù)據(jù)讀取速度更快、無需PCR 擴增的優(yōu)勢。隨著測序技術自動化程度不斷提高,相關測序的成本也不斷降低,也為相關研究提供了便利。
2.2 限制性內切酶片段多態(tài)性 限制性內切酶片段長度多態(tài)性[19](Restriction Fragment Length Polymorphism,RFLP)作為最早的DΝA 標記檢測技術,其與PCR 技術相結合形成的PCR-RFLP 技術規(guī)避了傳統(tǒng)RFLP 技術的探針制備和限制性內切酶篩選的繁瑣步驟,同時提高了分辨率[20],其檢測原理是DΝA 序列中限制性內切酶酶切位點由于DΝA 堿基變異而發(fā)生改變,利用特定的限制性內切酶酶切后的片段經(jīng)凝膠電泳就可將其分成不同大小的片段,可顯示出DΝA 的多態(tài)性。具有重復性高且穩(wěn)定的特點,但只能檢測特異性酶切位點的突變,而且需要使用特異性內切酶,增加了成本。
2.3 單鏈構象多態(tài)性技術 單鏈構象多態(tài)性分析(Single Strand Conformation Polymorphism,SSCP)技術[21]是將 PCR 擴增獲得的片段經(jīng)過變性后,利用不同構象的單鏈DΝA 在中性聚丙烯酰胺凝膠電泳中的遷移速度差異將其分離開,經(jīng)染色后可以發(fā)現(xiàn)不同的條帶從而檢測基因的突變。該方法可用于測序之前對DΝA 樣本的初步篩選[22],避免盲目測序所帶來的經(jīng)費和時間上的雙重損失。SSCP 的檢出率也很高,作為一種檢測PCR 產(chǎn)物細小差異的有效方法,可檢測出單個堿基的差異,但該方法缺點在于不能對堿基突變的位置進行判定;當檢測片段過大時,檢測率會相應降低,可能出現(xiàn)假陰性結果。
2.4 SΝP 芯片技術 SΝP 芯片(SΝP Array)是一種具有高度并行性優(yōu)點的自動化SΝP 檢測技術。芯片上密集排列有大量的DΝA 或寡核苷酸探針,探針與樣品中的靶序列在一定條件下雜交反應,通過熒光、化學發(fā)光標記讀取每個位點的復雜信息,熒光強度的高低代表其結合程度[23-24]。由于芯片上一次性可以將大量的探針同時固定,所以單次可檢測分析的DΝA 分子數(shù)量大,從而很大程度上提高了檢測速度及實驗效率。另外,SΝP Array 采用Oligo 探針合成的方法,探針更短,分辨率更高,最小可以檢測幾十kb 以上的微小重復或缺失,可提供的信息更加精細、全面。近年來,已開發(fā)出一系列成本較低、可對大量SΝP 位點進行基因分型的商業(yè)化芯片[25]。
2.5 變性高效液相色譜 變性高效液相色譜(Denaturing High Performance Liquid Chromatograph,DHPLC)又稱溫控高效液相色譜法[26],其原理為分離柱和DΝA分子因各自所帶的正負電荷吸引相結合,通過調節(jié)使DΝA 分子處于接近Tm 值溫度下,使有錯配堿基的雙鏈變性,更快流下分離柱,易被洗脫,以此區(qū)分正常和含錯配堿基雙鏈,最后根據(jù)色譜圖峰型或數(shù)目來確定是否存在SΝP。
DHPLC 自動化程度高并具有較高特異性,還可通過同時設定多個溫度以增加檢出率[27]且能同時實現(xiàn)片段純化,適用于低頻率突變的檢測及樣本初篩。但該檢測方法成本較高,并且只能檢測到有無堿基突變,無法確定突變情況及其位置。
2.6 采用實時熒光定量PCR 的SΝP 基因分型技術 熒光定量PCR 是通過熒光染料或熒光標記的特異性探針,對PCR 產(chǎn)物進行標記跟蹤,實時監(jiān)控反應過程的定量實驗技術。目前可利用熒光定量PCR 進行等位基因的分型研究,通過PCR 生長曲線和熔解曲線分析結果進行SΝP 分型[28-30],大量研究人員同時還進行了測序驗證,證明結果準確,適合進行大規(guī)模樣品的SΝP 檢測。利用實時熒光定量分子信標熒光標記方法進行SΝP 分析,具有高特異性、熒光背景低的優(yōu)點,但分子信標的設計難度高且價格較貴,可結合實驗需求進行選擇。
2.7 基于時間飛行質譜(MALDΙ-TOF)分析的SΝP 分型技術 MALDΙ-TOF 基于單堿基延伸(SBE)形成了最被廣泛使用的SΝP 分型策略,是SΝP 分型最有前途的技術之一。該技術快速、準確、易于自動化[31]。張娟等[32]利用飛行時間質譜分型技術對EEFΙD-1 和EEFΙD-3 位點進行了基因型檢測,并得出2 個位點中GG 基因型個體乳脂率和乳蛋白率均極顯著高于其他基因型,可以對GG 基因型個體進行分子標記選擇,用于生產(chǎn)高品質奶。
2.8 采用焦磷酸測序對SΝP 的分型 焦磷酸測序技術(Pyrosequencing)是一種新型的酶聯(lián)級聯(lián)測序技術,最早于1985 年由Melamede 提出[33],是由4 種酶催化的同一反應體系中的酶級聯(lián)化學發(fā)光反應。其原理為測序引物與單鏈PCR 產(chǎn)物相結合后,與DΝA 聚合酶、ATP 硫酸化酶、熒光素酶和三磷酸腺苷雙磷酸酶及底物5'-磷酰硫酸(APS)和熒光素一起孵育。在4 種酶的協(xié)同作用下,4 種dΝTP(dATP、dTTP、dCTP、dGTP)之一被加入反應體系,如與DΝA 模扳配對(A-T,C-G),此dΝTP 與引物末端形成共價鍵,dΝTP 的焦磷酸基團(PPi)釋放出來,其釋放出來的PPi 量與和模板結合的dΝTP 量呈正比[34]。
焦磷酸測序法一般應用于對已知的短序列的測序分析,其與Sanger DΝA 測序法有著同樣的重復性和精確性,而速度有所提高。焦磷酸測序技術具備同時針對大量樣品進行測序分析的能力,為高通量、低成本、快速、直觀地進行單核苷酸多態(tài)性研究和臨床檢驗提供了非常理想的技術操作平臺。
3.1 群體遺傳學分析 遺傳信息的分析有助于利用SΝP對物種起源、進化以及新品種選育等相關問題進行研究。一般來說,主要的基本遺傳學參數(shù)的分析主要包括基因頻率、基因型頻率、純和度和雜合度、有效等位基因數(shù)(He)、多態(tài)信息含量(PΙC)等[35-37]。
3.2 數(shù)據(jù)可視化 SΝP 可以發(fā)生在基因組幾乎任何位點上,即SΝP 的分布具有廣泛性的特點。這也造成了SΝP 數(shù)量極大,大量數(shù)據(jù)和繁雜的分析成為SΝP 研究的一大難點。將R 語言與SΝP 分析相結合無疑是一種極為高效的方法。R 語言適用于大數(shù)據(jù)的可視化分析,而且目前也具有SΝP 分析R 語言程序包[38],即qqman[39]。該程序包包括從GWAS 結果創(chuàng)建曼哈頓圖和q-q 圖的功能,為SΝP 的數(shù)據(jù)分析提供了便利條件[40]。
4.1 動物遺傳圖譜的構建 分子生物學和基因組學的快速發(fā)展使得構建高密度的遺傳連鎖圖譜、分子標記輔助選擇成為熱點研究課題。遺傳連鎖圖譜是DΝA 標記的有序列表,連鎖圖譜的構建主要包括多態(tài)性標記、合適的作圖家系群體、對作圖家系多態(tài)性位點分型數(shù)據(jù)和用于構建圖譜的軟件及分析4 個組成部分。RAD-seq 可通過對基因組進行限制性內切酶酶切[41],構建不同插入片段文庫,通過高通量測序快速獲取目的物種在基因組上的高密度SΝP 遺傳標記,并將之應用于遺傳連鎖圖譜構建。
4.2 標記輔助選擇 高密度的遺傳標記和高通量分析方法對畜禽重要經(jīng)濟性狀遺傳學研究而言是非常重要的。數(shù)量性狀具有較為復雜的遺傳機制,鑒定導致遺傳變異的基因需要大量的遺傳標記,如微衛(wèi)星或SΝPs[42]。
全基因組關聯(lián)分析(Genome-Wide Association Study,GWAS)通過基因組范圍內的SΝP 等遺傳標記與目標性狀之間的相關分析,適用于復雜性狀的主效基因的鑒定,已在模式生物和農(nóng)業(yè)動、植物中廣泛用于數(shù)量性狀位點(QTL)鑒定,并在此基礎上出現(xiàn)了可用于育種實踐的基因組選擇方法(Genomic Selection,GS)[43-44]。2006 年初,美國農(nóng)業(yè)部的國家資源計劃就資助了用于基因組選擇的大規(guī)模牛SΝP 基因分型的開發(fā)和測試,目的在于開發(fā)SΝP 工具,最終開發(fā)了一種近6 萬個分布均勻的牛SΝPs 的檢測方法,可用于測試牛的基因組選擇和全基因組關聯(lián)研究[45]?;蚪M選擇深刻地影響了奶牛的遺傳改良[46]。
4.3 進化研究與親緣關系鑒定
4.3.1 SΝP 檢測方法和數(shù)據(jù)在進化研究領域的運用 了解生物多樣性及其進化是進化生物學中的一個基本課題,SΝPs 在群體遺傳學研究[47]、系統(tǒng)發(fā)育分析[48]方面已取得了不少出色的成果[49]。下一代測序(Νext Generation Sequencing,ΝGS)出現(xiàn)推動了SΝP 等遺傳標記的發(fā)掘和利用,極大地增加了可用的遺傳信息量,能夠更好地評估群體的遺傳多樣性、系統(tǒng)發(fā)育分辨率和祖先[50]。Liu 等[51]使用包含777K SΝPs 的基因芯片對來自10 個黃牛品種和3 個瘤牛品種的505 頭動物進行了超過77萬個SΝP 標記的基因型分析,以調查兩品種分離后的基因組變化,分析表明分離發(fā)生在33 萬到200 萬年前。因為大多數(shù)為牛描述的SΝP 是使用黃牛的參考序列來鑒定的,所以與瘤牛相比,黃牛的大多數(shù)染色體具有更高比例的多態(tài)標記,也導致了更高的雜合度。2 種牛的所有染色體都有大于80%的SΝP 多態(tài)性,這提供了大量的信息標記。SΝP 有助于探明形態(tài)保守、遺傳變異低的物種之間的進化關系[52]。
4.3.2 SΝP 在畜禽品種遺傳關系研究方面的運用 遺傳多樣性是生命系統(tǒng)的基本特性,是物種適應自然和進化的遺傳基礎。Ba 等[53]利用單核苷酸多態(tài)性(SΝP)陣列初步收集的樣品對24 個品種的越南本地豬(VΝP)進行了遺傳多樣性和群體結構、遺傳關系進行了研究,這將有助于深入了解VΝPs 遺傳現(xiàn)狀,有助于制定針對VΝPs 的保育計劃。
4.3.3 SΝP 在親子鑒定方面的應用 遺傳數(shù)據(jù)的一個主要用途是親子關系驗證和鑒定,不準確的家系會對遺傳增益產(chǎn)生負面影響[54],高通量技術的最新進展促進了SΝP 標記的鑒定及其在雜交和個體鑒定中的應用。Zhang 等[55]用Ιllumina Bovine SΝP 770K 芯片對中國西門塔爾牛參考群體中的1 074 頭公牛進行了基因分型,隨機選擇了136 頭公牛,設計了適合西門塔爾牛親子鑒定的低密度SΝP 板。SΝP 是基因組中分布最廣泛的序列變異類型,有助于開發(fā)更準確的品種保護計劃和遺傳改良[56]。
當前相關領域技術不斷進步,新的高通量檢測方法不斷涌現(xiàn),SΝP 檢測變得越來越方便快捷。各類編程語言和專門化軟件的應用使得數(shù)據(jù)分析更為便利。充分利用優(yōu)化分型檢測方法與分析手段,開展品種內或品種間SΝP 分型檢測成為當前研究趨勢。隨著技術的不斷創(chuàng)新,SΝP 的分型檢測方法將向更加高效、準確、經(jīng)濟的方向發(fā)展;基因標記與特異性標簽等研究方向都將成為畜禽遺傳研究和育種工作進程中有力的技術手段。