胡景杰,任紅艷
( 國家自然科學(xué)基金委員會生命科學(xué)部,北京 100085 )
RAD測序技術(shù)是利用限制性內(nèi)切酶消化降低基因組的復(fù)雜度,對特定的酶切片段進(jìn)行高通量測序,實現(xiàn)基因分型的技術(shù)。RAD測序技術(shù)操作簡便,能夠不依賴參考基因組序列進(jìn)行大規(guī)模SNP位點的開發(fā),成為非模式生物尤其是水生生物最為有效、經(jīng)濟(jì)的SNP 開發(fā)方法,RAD測序技術(shù)已經(jīng)應(yīng)用于群體進(jìn)化、遺傳圖譜構(gòu)建、QTL定位、性狀關(guān)聯(lián)和系統(tǒng)發(fā)生分析等研究領(lǐng)域,提供了解析重要的復(fù)雜性狀分子機(jī)制的有效途徑。與此同時,在RAD測序基礎(chǔ)上發(fā)展起來了多種新型的RAD測序技術(shù)為研究者提供了更多的選擇。筆者綜述了RAD測序技術(shù)的原理、幾種RAD測序技術(shù)的比較及RAD測序技術(shù)在水生生物研究中的應(yīng)用。
RAD標(biāo)記是緊鄰限制性內(nèi)切酶酶切位點的一段短的DNA序列標(biāo)簽[1],廣泛分布于整個基因組。隨著二代測序技術(shù)的快速發(fā)展和成本的降低,RAD-seq技術(shù)成為更具活力和應(yīng)用價值的簡化基因組測序方法[2-3],RAD-seq技術(shù)在動植物的群體進(jìn)化研究、遺傳圖譜構(gòu)建和QTL定位以及全基因組關(guān)聯(lián)分析上均得到了廣泛的應(yīng)用。RAD測序的流程主要為:(1)利用限制性內(nèi)切酶對基因組進(jìn)行酶切;(2)連接酶切片段與P1接頭,P1接頭序列包含有Illumina的通用引物結(jié)合位點和用于區(qū)分不同個體的barcode序列;(3)然后將帶有接頭的片段隨機(jī)打斷;(4)打斷后連接上另一端接頭P2;(5)對連接產(chǎn)物進(jìn)行片段選擇;(6)片段選擇后的連接產(chǎn)物進(jìn)行PCR擴(kuò)增,富集得到兩端含有正確接頭的產(chǎn)物,最后進(jìn)行高通量測序。RAD標(biāo)簽構(gòu)成了一個簡化的基因組,便于獲得酶切位點附近的序列信息,從而發(fā)現(xiàn)SNP;選擇的不同限制性內(nèi)切酶,可以篩選出所需的足夠數(shù)量的SNP標(biāo)記。RAD-seq優(yōu)點不僅體現(xiàn)在低成本的測序,更主要的是可對基因組所有酶切位點進(jìn)行測序和分型,并且雙末端測序平臺的應(yīng)用能夠獲得SNP位點的側(cè)翼序列,為后續(xù)的研究帶來極大的便利。對于無參考基因組的物種,也可進(jìn)行大規(guī)模的SNP位點篩查,具有較高的準(zhǔn)確性,可在較短的時間內(nèi)完成變異檢測及其他的生物學(xué)分析。RAD-seq技術(shù)廣泛應(yīng)用在模式生物和非模式生物的遺傳分析,如三棘刺魚(Gasterosteusaculeatus)的群體分化和選擇的研究[4],蚊子的系統(tǒng)進(jìn)化研究[5],虹鱒(Oncorhynchusmykiss)SNP標(biāo)記開發(fā)[6],大麥(Hordeumvulgare)高精度圖譜構(gòu)建的研究[7]等。
隨著研究的深入,基于RAD-seq的改進(jìn)技術(shù)也不斷涌現(xiàn),包括2b-RAD[8]、ddRAD[9]、ezRAD[10]和Rapture[11]等,這些方法在文庫構(gòu)建的難易程度、酶切標(biāo)簽的基因組覆蓋度等方面存在一定差異。RAD-seq也為甲基化的檢測提供了思路,例如,EpiRAD[12]和MethylRAD[13]技術(shù),為缺乏基因組信息的非模式生物的甲基化研究提供了新的高效的方法。
2b-RAD技術(shù)是對等長RAD標(biāo)簽進(jìn)行測序分型的RAD技術(shù)[8]。IIB型限制性內(nèi)切酶的能夠識別雙鏈DNA的6個特異堿基對,在識別位點的上下游將DNA酶切,產(chǎn)生出3′端帶有3個隨機(jī)堿基突出的33 bp標(biāo)簽。通過黏性末端的匹配使標(biāo)簽和接頭連接,再經(jīng)PCR擴(kuò)增富集目的片段后進(jìn)行高通量測序。該方法的準(zhǔn)確性和實用性在模式生物擬南芥(Arabidopsisthaliana)中得到驗證。由于等長標(biāo)簽擴(kuò)增效率的一致性,使2b-RAD技術(shù)的分型準(zhǔn)確率較高;無需片段選擇,文庫構(gòu)建簡便快捷,更為突出的特點是,2b-RAD技術(shù)可通過接頭添加選擇性堿基來調(diào)節(jié)獲得基因組標(biāo)簽的密度,可以根據(jù)研究目的和需求開發(fā)SNP標(biāo)記,易于控制成本。水生生物研究中往往進(jìn)行樣本數(shù)目較多的遺傳分析,應(yīng)用2b-RAD技術(shù)大規(guī)模開發(fā)SNP標(biāo)記是一種低成本的快速有效的手段。Jiao等[14]利用2b-RAD技術(shù)對櫛孔扇貝(Chlamysfarreri)全同胞F1作圖家系進(jìn)行了大規(guī)模SNP位點的開發(fā),構(gòu)建了高密度遺傳連鎖圖譜。目前該技術(shù)已經(jīng)廣泛應(yīng)用于馬氏珠母貝(Pinctadamartensii)[15]、仿刺參(Apostichopusjaponicus)[16]、中華絨螯蟹(Eriocheirsinensis)[17]等水產(chǎn)生物的SNP標(biāo)記的開發(fā)、遺傳圖譜構(gòu)建和全基因組選育等[18]。
Peterson等[9]在2012年發(fā)明了ddRAD-seq(雙酶切RAD測序)技術(shù),以白足鼠(Peromyscus)為例,描述了其流程,并證實其方便實用。ddRAD-seq技術(shù)主要包括:(1)同時使用一種高頻酶和一種低頻酶酶切基因組DNA;(2)接頭與酶切片段連接,其中P1接頭和P2 接頭分別設(shè)計有不同的突出序列,能夠分別與兩種酶的黏性末端互補(bǔ)進(jìn)行連接;(3)連接產(chǎn)物混合后進(jìn)行片段選擇;(4)PCR擴(kuò)增富集文庫,引入索引序列增加平行測序樣本通量。ddRAD技術(shù)與RAD-seq技術(shù)主要有兩方面的改進(jìn):無需隨機(jī)打斷和末端修復(fù),采用兩種限制性內(nèi)切酶同時處理基因組DNA,酶切標(biāo)簽數(shù)目提升,且起始DNA用量降低;其次,采用更為精準(zhǔn)的片段大小選擇方法,片段大小均勻性提高,進(jìn)而個體間分型重復(fù)性和分型準(zhǔn)確性均有提高。此外,ddRAD整個流程耗時8 h以內(nèi),比RAD-seq技術(shù)更為簡易和節(jié)省成本。ddRAD-seq技術(shù)可應(yīng)用于各種生物學(xué)問題的解析,Kai等[19]利用ddRAD技術(shù)篩選日本鰻鱺(Anguillajaponica)SNP標(biāo)記,將2672 個SNP標(biāo)記整合到遺傳連鎖圖譜。目前該技術(shù)已經(jīng)應(yīng)用于貝類SNP標(biāo)記開發(fā)和基因分型[20]、小丑魚(Amphiprionbicinctus)景觀遺傳學(xué)研究[21]等。
Toonen等[10]在2013年發(fā)表了ezRAD(限制性酶切RAD)技術(shù),其主要包括:(1)使用內(nèi)切酶(一種或幾種)消化基因組DNA至300~500 bp的片段范圍;(2)使用Illumina TruSeq試劑盒建庫并測序。由于使用商品化的試劑盒建庫,流程簡單快速,操作更為容易,但成本相對較高。其他RAD-seq技術(shù)通常需要通過選擇特殊的內(nèi)切酶或者通過選擇不同的接頭調(diào)整RAD標(biāo)簽的密度,但ezRAD對消化基因組的內(nèi)切酶沒有特殊要求,只要能將DNA酶切到一定片段長度范圍即可。Toonen等[10]以珊瑚、軟體動物、海星和海豚等多種非模式生物作為研究對象,對ezRAD技術(shù)的實用性和靈活性進(jìn)行了評價,結(jié)果表明,該技術(shù)對各門類物種都具有廣泛的適用性。
Ali等[11]在2016年發(fā)表了Rapture(RAD捕捉)技術(shù),其主要針對已知位點的標(biāo)記開發(fā),主要包括:RAD標(biāo)簽的分離、文庫的測序及分析。該技術(shù)結(jié)合了RAD和捕獲測序的優(yōu)勢,能夠以較低的成本快速高效的對大量個體的測序位點進(jìn)行分析。使用的物理方法富集RAD標(biāo)簽?zāi)軌蛳齈CR引入的擴(kuò)增偏離效應(yīng),覆蓋更多的唯一比對位點,提高測序效率。Ali等[11]在虹鱒中證實了Rapture技術(shù)的可靠性,并分析了虹鱒的種群結(jié)構(gòu)。該技術(shù)可廣泛應(yīng)用于農(nóng)業(yè)、環(huán)境和生物醫(yī)學(xué)等方面,提高遺傳分析的效率。
在ddRAD技術(shù)基礎(chǔ)上,Schield等[12]發(fā)明了EpiRAD技術(shù),該技術(shù)的將ddRAD技術(shù)中的一種酶替換為甲基化敏感性的內(nèi)切酶HpaⅡ,通過對非甲基化位點的測序來檢測基因組甲基化狀態(tài)的變化。研究人員利用該技術(shù)檢測了在有無捕食者的不同試驗條件下,來源于同一克隆種群的水蚤(Daphniaambigua)世代間的基因組甲基化狀態(tài)。結(jié)果顯示,由于捕食者的存在,水蚤產(chǎn)生了表觀遺傳的變化,導(dǎo)致其生活史特征的改變。通過表觀遺傳分析探究了水蚤對魚類捕食的適應(yīng)方式及表型變化的主要機(jī)制。另外,研究人員還指出EpiRAD方法不僅可以用于無性繁殖群體的變異檢測,對有性繁殖群體或者試驗群體的檢測同樣適用。
MethylRAD技術(shù)[13]是在2b-RAD基礎(chǔ)上發(fā)展起來的一種適用于非模式生物的高效、低成本的全基因組DNA甲基化檢測技術(shù),與2b-RAD技術(shù)具有相似的建庫流程,簡便易操作。其原理是利用甲基修飾依賴型內(nèi)切酶對基因組進(jìn)行酶切產(chǎn)生包含有甲基化位點的標(biāo)簽,只對獲取的甲基化標(biāo)簽進(jìn)行測序,從而檢測基因組范圍內(nèi)的甲基化位點。MethylRAD技術(shù)為非模式生物的甲基化研究提供了全新的技術(shù)方法和思路,可以通過表觀調(diào)控水平上的比較分析篩選與性狀調(diào)控相關(guān)的候選基因。Wang等[13]利用MethylRAD技術(shù)對“海大金貝”和普通蝦夷扇貝(Patinopectenyessoensis)進(jìn)行了全甲基化組比較分析,篩查得到調(diào)控“海大金貝”閉殼肌類胡蘿卜素積累的重要候選基因LPCAT1。
任何一種RAD-seq技術(shù)都有其優(yōu)點和不足,對5種RAD技術(shù)的比較見表1。RAD-seq、ddRAD以及ezRAD技術(shù)構(gòu)建的文庫均具有較長的插入片段,使無參照基因組的RAD數(shù)據(jù)更易于de novo拼接,從而能夠獲得更多的基因組信息,方便位點的功能注釋和SNP側(cè)翼序列的引物設(shè)計。RAD-seq需要超聲打斷,超聲打斷具有片段長度選擇的偏好性,會影響測序位點的基因組代表性及位點間測序深度的均勻度[22]。RAD-seq技術(shù)文庫的構(gòu)建流程過于繁瑣,周期長,需要配備超聲波DNA破碎儀等。Rapture技術(shù)使用物理方法富集RAD標(biāo)簽?zāi)軌蛳齈CR引入的擴(kuò)增偏離,覆蓋更多的獨立比對位點。2b-RAD、ddRAD和ezRAD技術(shù)建庫流程相對要簡單得多,ez-RAD技術(shù)可以利用Illumina TruSeq Kit試劑盒,易于操作,并且結(jié)合Illumina的無需PCR的樣品制備方法,能夠消除PCR擴(kuò)增過程中的偏向性,但成本較高。2b-RAD和dd-RAD建庫流程簡便,可以通過多種方式(ddRAD通過選擇不同的內(nèi)切酶和片段大小,2b-RAD通過接頭添加選擇性堿基)靈活控制獲得SNP數(shù)目,能夠以很低的成本獲得每個個體幾百個數(shù)目的SNP位點,特別適用于只需少量位點的大樣本的群體結(jié)構(gòu)分析。2b-RAD可以對等長RAD標(biāo)簽進(jìn)行測序,無需片段選擇,所有酶切位點標(biāo)簽均能擴(kuò)增測序,等長標(biāo)簽擴(kuò)增時具有較好的一致性,因此標(biāo)簽在文庫之間重現(xiàn)性強(qiáng)。值得一提的是,ddRAD技術(shù)采用了更精確的片段選擇手段——全自動核酸電泳和片段回收系統(tǒng),一定程度上可以降低片段選擇過程對相同位點在文庫間代表性的影響,另外通過試驗初期的監(jiān)測,可以評估樣品酶切片段的均勻度,排除轉(zhuǎn)座子等高頻出現(xiàn)的片段。ddRAD可有效的應(yīng)用于基因組較大并且未測序的物種。此外,RAD和ezRAD技術(shù)對起始基因組DNA質(zhì)量的要求相對更高,2b-RAD技術(shù)建庫不涉及打斷和長片段選擇的過程,DNA的降解對建庫和結(jié)果的影響小,建庫的起始量可低至1 ng[23-25]。
表1 5種RAD方法比較
RAD-seq技術(shù)在圖譜構(gòu)建、全基因組育種及遺傳進(jìn)化等多個領(lǐng)域得到廣泛應(yīng)用,由于海量的數(shù)據(jù)分析,與RAD-seq技術(shù)相關(guān)的生物信息分析和高通量數(shù)據(jù)處理迅速發(fā)展。目前,常用的RAD-seq的生物信息學(xué)軟件主要有Stacks[26]、RADtyping[27]、RADtools[28]和pyRAD[29]等。
Stacks是由俄勒岡大學(xué) Julian Catchen 開發(fā)的適用于 RAD-seq序數(shù)據(jù)分析的軟件[26]。該軟件將最大似然法應(yīng)用到無參考基因組的de novo SNP分型中,能消除測序錯誤對分型準(zhǔn)確性的影響,可以處理各種類型的RAD-seq數(shù)據(jù)文件,適用于遺傳圖譜、群體基因組學(xué)及系統(tǒng)發(fā)生分析等研究。Stacks核心處理步驟主要包括5個模塊:(1)利用process_radtags程序按照barcode區(qū)分樣本序列并剔除掉測序質(zhì)量不高的序列;(2)物種無參照基因組信息時,利用ustcaks聚類組成基因座位,有參考基因組信息時選擇Pstacks程序;(3)利用cstcaks將雙親的基因座位進(jìn)行整合;(4)通過stacks程序?qū)⒂H本和子代的基因座位進(jìn)行查找對應(yīng);(5)根據(jù)不同的研究方向,選擇population或者genotypes進(jìn)行群體或者圖譜分析。
RADtyping是一套集成共顯性和顯性標(biāo)記分型的流程化軟件包,尤其適用于無參照基因組的非模式生物2b-RAD數(shù)據(jù)分析。對顯性標(biāo)記的分型有效提高了標(biāo)記的利用率,能夠降低測序成本。該軟件提出了一種基于混合泊松/正態(tài)分布模型的de novo SNP分型新算法(iML),能夠有效消除重復(fù)序列對分型的干擾,通過模擬數(shù)據(jù)和實際測序數(shù)據(jù)的分析結(jié)果顯示,iML的分型準(zhǔn)確率明顯提高,假陽性率可降低20%[27]。RADtyping整合了共顯性和顯性標(biāo)記de novo分型算法實現(xiàn)所需的所有perl腳本,不僅可以處理單端測序的RAD數(shù)據(jù),還適用于其他類型的雙端測序的RAD數(shù)據(jù)。軟件實現(xiàn)無參考基因組SNP de novo分型的核心步驟有3步:(1)利用親本標(biāo)簽序列混合聚類構(gòu)建代表性參考序列;(2)根據(jù)改進(jìn)的極大似然法(iML)去除由于測序錯誤造成的低覆蓋度的序列和重復(fù)序列造成的高覆蓋度的序列,構(gòu)建高質(zhì)量的參考序列,并將獲得的參考序列分為雙親共享和親本特異的兩種類型;(3)個體數(shù)據(jù)與兩種類型的參考序列進(jìn)行比對,根據(jù)軟件算法進(jìn)行共顯性和顯性標(biāo)記的分型。
水生生物的主要經(jīng)濟(jì)性狀大都屬于數(shù)量性狀,其遺傳機(jī)制比較復(fù)雜,受到多基因控制,要精確定位進(jìn)行輔助育種需要高密度的連鎖圖譜。伴隨著二代測序技術(shù)的快速發(fā)展和RAD-seq等簡化基因組測序技術(shù)的出現(xiàn),一次試驗可篩查到數(shù)以千計的SNP標(biāo)記,為高密度圖譜構(gòu)建提供了充裕的標(biāo)記數(shù)目。RAD-seq技術(shù)不依賴于物種的基因組信息,在水生生物大規(guī)模分子標(biāo)記開發(fā)和高密度遺傳連鎖圖譜構(gòu)建等研究領(lǐng)域得到了廣泛應(yīng)用。已發(fā)表的利用RAD-seq技術(shù)構(gòu)建遺傳圖譜的水生生物包括斑馬魚、海帶、海參、扇貝、虹鱒、尼羅羅非魚(Oreochromisniloticus)、日本囊對蝦(Marsupenaeusjaponicus)、比目魚等等[14, 16, 30-35]。Li等[36]利用RAD-seq技術(shù)篩選了1373個分離的SNP標(biāo)記構(gòu)建了馬氏珠母貝的遺傳連鎖圖譜,對 7個生長性狀進(jìn)行了連鎖分析。Ao等[37]利用RAD-seq技術(shù)構(gòu)建的大黃魚(Larimichthyscrocea)的圖譜包含了10150個標(biāo)記,標(biāo)記間的平均間距0.54 cM。由4994個SNP標(biāo)記構(gòu)建的海帶圖譜,為評價種質(zhì)資源和重要經(jīng)濟(jì)性狀的遺傳基礎(chǔ)解析提供了有力的工具[34]。綜上所述,利用RAD技術(shù)構(gòu)建的水生生物圖譜的標(biāo)記數(shù)目都是數(shù)以千計,大大地突破了以往利用傳統(tǒng)方法篩查標(biāo)記所構(gòu)建的圖譜密度,對推動水生生物的遺傳學(xué)研究具有重要的意義。
在種群遺傳研究中通常利用少數(shù)個體進(jìn)行標(biāo)記開發(fā),選取多態(tài)性高的位點進(jìn)行種群遺傳學(xué)分析,這些標(biāo)記往往只反映該物種的一小部分多態(tài)性而難以準(zhǔn)確推斷不同種群的遺傳距離和親緣關(guān)系。RAD-seq技術(shù)可使SNP開發(fā)和分型同時完成,避免了上述缺點,為缺乏參考基因組或有著復(fù)雜進(jìn)化史的生物種群多樣性研究提供了有效手段。Hohenlohe等[4]通過RAD-seq技術(shù)研究了三棘刺魚不同群體的種群分化,選取來自2個阿拉斯加南部的海洋群體和 3 個淡水群體的100 個個體,鑒定了基因組范圍內(nèi)45 789個SNP。評估了三棘刺魚群體的遺傳多樣性, 發(fā)現(xiàn)2個海洋群體盡管相隔較遠(yuǎn),但由于存在劇烈的基因流而無顯著遺傳分化。淡水群體和海水群體之間則表現(xiàn)出相對較大的遺傳分化,在6個連鎖群的9個區(qū)域有分化,這些區(qū)域覆蓋12.2 Mb,包括590個基因,其中31個與骨骼發(fā)育和滲透壓調(diào)節(jié)性狀相關(guān),這些基因?qū)Φ倪m應(yīng)起重要作用,初步揭示了淡水三棘刺魚適應(yīng)性的平行進(jìn)化機(jī)制。Larson等[44]對來自于阿拉斯加西部的5個大鱗大麻哈魚(O.tshawytscha)的群體結(jié)構(gòu)及趨異適應(yīng)性問題進(jìn)行了研究。利用RAD技術(shù)開發(fā)了10 944個SNP位點,對個體溯源的效率顯著提高,同時還鑒定到733個位點和3個受選擇的基因組區(qū)域。
海洋中存在數(shù)目巨大的浮游動物,由于沒有天然的物理隔離屏障,有高頻的基因交換,地理群體分化的研究一直是一個難題。RAD技術(shù)能夠獲得幾百上千的SNP位點,能發(fā)現(xiàn)群體中存在的微小的遺傳變異,高密度的SNP標(biāo)記使群體分化系數(shù)和群體結(jié)構(gòu)等參數(shù)的計算更為準(zhǔn)確,為海洋生態(tài)群落結(jié)構(gòu)的研究提供一種新的技術(shù)手段和方法。Blancobercial等[45]利用2b-RAD技術(shù)分析了北大西洋的海洋橈足類(Centropagestypicus)的群體結(jié)構(gòu),其結(jié)果與已知的形態(tài)學(xué)特征分析的結(jié)果一致。同時還研究了西北太平洋大陸架生態(tài)海域的群體遺傳結(jié)構(gòu),比較了幾種不同遷移方向的群體,結(jié)果表明應(yīng)用2b-RAD技術(shù)進(jìn)行海洋浮游動物群體結(jié)構(gòu)的研究分析要顯著優(yōu)于其他技術(shù)方法。
全基因組選擇是利用基因組范圍內(nèi)的遺傳標(biāo)記對生產(chǎn)性狀進(jìn)行育種值估算,從而達(dá)到標(biāo)記輔助選擇育種的目的。全基因組選擇的前提是要有高密度的遺傳標(biāo)記。高通量低成本的簡化基因組的SNP分型技術(shù)為水生生物的遺傳育種研究提供了契機(jī)。Dou等[18]以蝦夷扇貝(Patinopectenyessoensis)為材料,分析了2b-RAD技術(shù)在全基因選擇育種中的應(yīng)用潛力。模擬分析表明盡管該技術(shù)只獲得基因組部分標(biāo)記信息,但能夠準(zhǔn)確的估計出個體的育種值。值得一提的是2b-RAD技術(shù)具有標(biāo)簽密度易于調(diào)節(jié)的優(yōu)勢,為研究人員在分型成本和育種準(zhǔn)確率之間提供了更多選擇。同時對5個家系的349個蝦夷扇貝進(jìn)行2b-RAD標(biāo)記分型(2364個高質(zhì)量SNPs標(biāo)記),通過5倍交叉驗證表明育種值的估計準(zhǔn)確率約為0.4。這些分析表明2b-RAD技術(shù)可以為水生生物分子育種研究提供理想的標(biāo)記分型平臺。
隨著基因組時代的到來,研究人員可以通過基因組序列探討物種間的進(jìn)化關(guān)系。但是對于經(jīng)濟(jì)價值不高、基因組過大的物種來說,全基因組測序的方法并不合適。研究表明,RAD技術(shù)能夠提供更多的基因組變異信息,是研究系統(tǒng)發(fā)生的有力工具[46]。山鳉(Orestias)是安第斯高原特有魚類,形態(tài)特征聚類分析表明的的喀喀湖的山鳉魚分為4個組,RAD-seq數(shù)據(jù)的分子系統(tǒng)學(xué)研究表明其中3個為共同起源[47]。Takahashi等[48]利用RAD數(shù)據(jù),重建了東非洲麗魚科的系統(tǒng)樹,RAD數(shù)據(jù)構(gòu)建的系統(tǒng)樹與以前的研究結(jié)果有所不同,但RAD數(shù)據(jù)構(gòu)建的系統(tǒng)樹的自展值更高,結(jié)果更加可靠。RAD-seq技術(shù)可以不依賴基因組信息,就實現(xiàn)全基因組水平上的系統(tǒng)發(fā)生分析,侯睿[49]利用2b-RAD技術(shù)分析了扇貝科10個物種的系統(tǒng)發(fā)生關(guān)系,基于種間共享的2b-RAD標(biāo)簽構(gòu)建的系統(tǒng)樹與已知的根據(jù)形態(tài)分類的結(jié)果很相近。
比較基因組是通過不同物種基因組水平的比較,揭示基因組進(jìn)化特征和機(jī)制,包括基因組保守性、重排和復(fù)制等。遺傳連鎖圖譜是水生生物等非模式生物進(jìn)行比較基因組研究的有力工具,利用RAD技術(shù)構(gòu)建高密度圖譜,能夠提供更為全面的基因組結(jié)構(gòu)信息。Braasch等[50]利用RAD-seq技術(shù)構(gòu)建了斑雀鱔(Lepisosteusoculatus)的遺傳圖譜,利用圖譜上將近1000個編碼區(qū)的RAD標(biāo)記對硬骨魚、斑雀鱔和人的染色體進(jìn)行了比較基因組學(xué)分析,證實了斑雀鱔與硬骨魚的分化要先于硬骨魚的基因組加倍,并且與硬骨魚相比,斑雀鱔與人類基因組結(jié)構(gòu)更為相似。Kakioka等[51]將鯉科屬(Gnathopogon)2個近緣種雜交獲得F2群體,利用RAD-seq技術(shù),構(gòu)建了包含有1622個標(biāo)記的連鎖圖譜,平均圖距為0.97 cM。根據(jù)獲得的RAD標(biāo)簽序列,與斑馬魚、三棘刺魚、青鳉魚和河鲀進(jìn)行了比較基因組學(xué)分析。結(jié)果表明該魚有13個連鎖群和斑馬魚染色體是共線性的,而其他的連鎖群和斑馬魚染色體之間存在著重排。Lien等[52]以來源于142個家系的3297條大西洋鮭(Salmosalar)為材料,利用RAD技術(shù)構(gòu)建了包含5650個SNPs的遺傳圖譜,并與三棘刺魚進(jìn)行了比較基因組分析,通過同源區(qū)域和變異區(qū)域,推測大西洋鮭具有特殊的性別特異性重組。
隨著測序成本降低和測序能力的提高,不久的將來對每個研究對象個體進(jìn)行全基因組測序?qū)⒊蔀榭赡埽珜τ诖蠖嘌芯慷?,全基因組測序往往得到過多的數(shù)據(jù),造成信息量過剩,使分析復(fù)雜化,產(chǎn)生浪費。RAD測序技術(shù)由于具有的簡便性、有效性、低成本等優(yōu)勢,水生生物無論基因組大小,是否具有參考基因組序列,均可應(yīng)用RAD測序技術(shù)大規(guī)模開發(fā)SNP標(biāo)記,實現(xiàn)精確的基因分型,開展遺傳解析。因此,RAD測序技術(shù)在水生生物高密度遺傳圖譜的構(gòu)建、QTL精細(xì)定位以及群體遺傳和進(jìn)化等領(lǐng)域具有廣泛的應(yīng)用前景。通過RAD測序技術(shù)獲得的豐富的遺傳標(biāo)記信息能夠有效地對水生生物群體的遺傳多樣性和系統(tǒng)發(fā)育進(jìn)行分析,揭示群體的遺傳結(jié)構(gòu),為水生生物育種和遺傳改良提供基礎(chǔ)性資料,對于優(yōu)良性狀的培育、種質(zhì)資源研究等具有重要的意義。
[1] Miller M R, Dunham J P, Amores A, et al. Rapid and cost-effective polymorphism identification and genotyping using restriction site associated DNA (RAD) markers[J]. Genome Research, 2007, 17(2):240-248.
[2] Baird N A, Etter P D, Atwood T S, et al. Rapid SNP discovery and genetic mapping using sequenced RAD markers[J]. PLOS ONE, 2008, 3(10):e3376.
[3] Etter P D, Bassham S, Hohenlohe P A, et al. SNP discovery and genotyping for evolutionary genetics using RAD sequencing[J]. Molecular Methods for Evolutionary Genetics, 2011:157-178.
[4] Hohenlohe P A, Bassham S, Etter P D, et al. Population genomics of parallel adaptation in threespine stickleback using sequenced RAD tags[J]. PLOS Genetics, 2010, 6(2):e1000862.
[5] Emerson K J, Merz C, Catchen J M, et al. Resolving postglacial phylogeography using high-throughput sequencing[J]. Proceedings of the National Academy of Sciences of the United States of America, 2010, 107(37):16196-16200.
[6] Hohenlohe P A, Amish S J, Catchen J M, et al. Next-generation RAD sequencing identifies thousands of SNPs for assessing hybridization between rainbow and westslope cutthroat trout[J]. Molecular Ecology Resources, 2011(11):117-122.
[7] Chutimanitsakun Y, Nipper R, Cuestamarcos A, et al. Construction and application for QTL analysis of a restriction site associated DNA (RAD) linkage map in barley[J]. BMC Genomics, 2011, 12(1):4.
[8] Wang S, Meyer E, Mckay J K, et al. 2b-RAD: a simple and flexible method for genome-wide genotyping[J]. Nature Methods, 2012, 9(8):808-810.
[9] Peterson B K, Kay E H, Fisher H S, et al. Double digest RADseq: an inexpensive method forDeNovoSNP discovery and genotyping in model and non-model species[J]. PLOS ONE, 2012, 7(5): e37135.
[10] Toonen R J, Puritz J B, Forsman Z H, et al. ezRAD: a simplified method for genomic genotyping in non-model organisms[J]. Peer J, 2013(1):e203.
[11] Ali O A, O′Rourke S M, Amish S J, et al. RAD capture (Rapture): flexible and efficient sequence-based genotyping[J]. Genetics, 2016, 202(2):389-400.
[12] Schield D R, Walsh M R, Card D C, et al. EpiRADseq: scalable analysis of genome wide patterns of methylation using next-generation sequencing[J]. Methods in Ecology and Evolution, 2016, 7(1):60-69.
[13] Wang S, Lv J, Zhang L, et al. MethylRAD: a simple and scalable method for genome-wide DNA methylation profiling using methylation-dependent restriction enzymes[J]. Open Biology, 2015, 5(11):150130.
[14] Jiao W, Fu X, Dou J, et al. High-resolution linkage and quantitative trait locus mapping aided by genome survey sequencing: building up an integrative genomic framework for a bivalve mollusc[J]. DNA Research, 2014, 21(1):85-101.
[15] Shi Y, Kui H, Guo X, et al. Genetic linkage map of the pearl oyster,Pinctadamartensii(Dunker) [J]. Aquaculture Research, 2009, 41(1):35-44.
[16] Tian M, Li Y, Jing J, et al. Construction of a high-density genetic map and quantitative trait locus mapping in the sea cucumberApostichopusjaponicus[J]. Scientific Reports, 2015(5):14852.
[17] Cui Z, Hui M, Liu Y, et al. High-density linkage mapping aided by transcriptomics documents ZW sex determination system in the Chinese mitten crabEriocheirsinensis[J]. Heredity, 2015, 115(3):206-215.
[18] Dou J, Li X, Fu Q, et al. Evaluation of the 2b-RAD method for genomic selection in scallop breeding[J]. Scientific Reports, 2016(6):19244.
[19] Kai W, Nomura K, Fujiwara A, et al. A ddRAD-based genetic map and its integration with the genome assembly of Japanese eel (Anguillajaponica) provides insights into genome evolution after the teleost-specific genome duplication[J].BMC Genomics, 2014,15(1):233.
[20] Kess T, Gross J, Harper F, et al. Low-cost ddRAD method of SNP discovery and genotyping applied to the periwinkleLittorinasaxatilis[J]. Journal of Molluscan Studies,2016,82(1):104-109.
[21] Saenz-Agudelo P, Dibattista J D, Piatek M J, et al. Seascape genetics along environmental gradients in the Arabian Peninsula: insights from ddRAD sequencing of anemonefishes[J]. Molecular Ecology, 2015, 24(24):6241-6255.
[22] Davey J W, Cezard T, Fuentesutrilla P, et al. Special features of RAD sequencing data: implications for genotyping[J]. Molecular Ecology, 2013, 22(11):3151-3164.
[23] Good J M, Miller M, Luikart G, et al. Harnessing the power of RADseq for ecological and evolutionary genomics[J]. Nature Reviews Genetics, 2016, 17(2):81-92.
[24] Hohenlohe P A, Miller M R, Hand B K, et al. Trade‐offs and utility of alternative RADseq methods: reply to Puritz et al[J]. Molecular Ecology, 2014, 23(24):5943-5946.
[25] Puritz J B, Matz M V, Toonen R J, et al. Demystifying the RAD fad[J]. Molecular Ecology, 2014, 23(24):5937-5942.
[26] Catchen J M, Amores A, Hohenlohe P A, et al.Stacks: building and genotyping lociDeNovofrom short-read sequences[J]. G3: Genes, Genomes, Genetics, 2011, 1(3):171-182.
[27] Fu X, Dou J, Mao J, et al. RADtyping: an integrated package for accuratedenovocodominant and dominant RAD genotyping in mapping populations[J]. PLOS ONE, 2013, 8(11): e79960.
[28] Baxter S W, Davey J W, Shelton A M, et al. Linkage mapping and comparative genomics using next-generation RAD sequencing of a non-model organism[J].PLOS ONE, 2011, 6(4): e19315.
[29] Eaton D A R. PyRAD: assembly ofdenovoRADseq loci for phylogenetic analyses[J]. Bioinformatics, 2014(30):1844-1849.
[30] Niu Y, Rastas P, Liu Y, et al. Genome-wide SNP identification for the construction of a high-resolution genetic map of Japanese flounder (Paralichthysolivaceus): applications to QTL mapping ofVibrioanguillarumdisease resistance and comparative genomic analysis[J]. DNA Research, 2015, 22(2):161-170.
[31] Lu X, Luan S, Hu L Y, et al. High-resolution genetic linkage mapping, high-temperature tolerance and growth-related quantitative trait locus (QTL) identification inMarsupenaeusjaponicus[J]. Molecular Genetics and Genomics, 2016, 291(3):1391-1405.
[32] Palaiokostas C, Bekaert M, Khan M G Q, et al. Mapping and validation of the major sex-determining region in Nile tilapia (OreochromisniloticusL.) using RAD sequencing[J]. PLOS ONE, 2013, 8(7): e68389.
[33] Hecht B C, Thrower F P, Hale M C, et al. Genetic architecture of migration-related traits in rainbow and steelhead trout,Oncorhynchusmykiss[J]. G3: Genes, Genomes, Genetics, 2012(2):1113-1127.
[34] Zhang N, Zhang L, Tao Y, et al. Construction of a high density SNP linkage map of kelp (Saccharinajaponica) by sequencingTaqI site associated DNA and mapping of a sex determining locus[J]. BMC Genomics, 2015, 16(1):189.
[35] Wilson C, High S, Mccluskey B M, et al. Wild sex in zebrafish: loss of the natural sex determinant in domesticated strains[J]. Genetics, 2014, 205(4):1291.
[36] Li Y, He M. Genetic mapping and QTL analysis of growth-related traits inPinctadafucatausing restriction-site associated DNA sequencing[J]. PLOS ONE, 2014, 9(11): e111707.
[37] Ao J, Li J, You X, et al. Construction of the high-density genetic linkage map and chromosome map of large yellow croaker (Larimichthyscrocea) [J]. International Journal of Molecular Sciences, 2015, 16(11):26237-26248.
[38] Wan S, Liu H, Zhao B, et al. Construction of a high-density linkage map and fine mapping of QTLs for growth and gonad related traits in blunt snout bream[J].Scientific Report, 2017(7): 46509.
[39] Houston R D, Davey J W, Lowe N R, et al. Characterization of QTL-linked and genome-wide restriction site-associated DNA (RAD) markers in farmed Atlantic salmon[J]. BMC Genomics, 2012, 13(1):244.
[40] Quin C T O, Drilea A C, Conte M A, et al. Mapping of pigmentation QTL on an anchored genome assembly of the cichlid fish,Metriaclimazebra[J]. BMC Genomics, 2013, 14(1):2.
[41] Oquin K E, Yoshizawa M, Doshi P, et al. Quantitative genetic analysis of retinal degeneration in the blind cavefishAstyanaxmexicanus[J]. PLOS ONE, 2013, 8(2): e57281.
[42] Brown J K, Taggart J B, Bekaert M, et al. Mapping the sex determination locus in the hāpuku (Polyprionoxygeneios) using ddRAD sequencing[J]. BMC Genomics, 2016, 17(1):448.
[43] Palaiokostas C, Bekaert M, Davie A, et al. Mapping the sex determination locus in the Atlantic halibut (Hippoglossushippoglossus) using RAD sequencing[J]. BMC Genomics, 2013, 14(1):566.
[44] Larson W A, Seeb L W, Everett M V, et al. Genotyping by sequencing resolves shallow population structure to inform conservation of chinook salmon (Oncorhynchustshawytscha) [J]. Evolutionary Applications, 2014, 7(3):355-369.
[45] Blancobercial L, Bucklin A. New view of population genetics of zooplankton: RAD-seq analysis reveals population structure of the North Atlantic planktonic copepodCentropagestypicus[J]. Molecular Ecology, 2016, 25(7):1566-1580.
[46] Rubin B E R, Ree R H, Moreau C S. Inferring phylogenies from RAD sequence data[J]. PLOS ONE, 2012(7): e33394.
[47] Takahashi T, Moreno E. RAD-based phylogenetics forOrestiasfishes from Lake Titicaca[J]. Molecular Phylogenetics and Evolution, 2015,(93):307-317.
[48] Takahashi T, Sota T. A robust phylogeny among major lineages of the East African cichlids[J]. Molecular Phylogenetics and Evolution, 2016(100):234-242.
[49] 侯睿. 蝦夷扇貝基因組結(jié)構(gòu)特征與進(jìn)化基因組學(xué)分析[D].青島:中國海洋大學(xué), 2012.
[50] Braasch I, Gehrke A R, Smith J J, et al. The spotted gar genome illuminates vertebrate evolution and facilitates human-teleost comparisons[J].Nature Genetics,2016,48(4): 427-437.
[51] Kakioka R, Kokita T, Kumada H, et al. A RAD-based linkage map and comparative genomics in the gudgeons (genusGnathopogon, Cyprinidae)[J]. BMC Genomics, 2013, 14(1):32.
[52] Lien S, Gidskehaug L, Moen T, et al. A dense SNP-based linkage map for Atlantic salmon (Salmosalar) reveals extended chromosome homeologies and striking differences in sex-specific recombination patterns[J]. BMC Genomics, 2011, 12(1):615.