劉其則,陳忠蔭,廖征藍(lán),夏 巖,郭 坤,杜 宇,林熾賢
(1.海南熱帶海洋學(xué)院a.水產(chǎn)與生命學(xué)院;b.海南省兩棲爬行動(dòng)物研究重點(diǎn)實(shí)驗(yàn)室;c.熱帶海洋生物資源利用與保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室,海南 三亞,572022;2.溫州大學(xué) 生命與環(huán)境科學(xué)學(xué)院,浙江 溫州 325035)
SSR(Simple sequence repeat)是一類常用的微衛(wèi)星分子標(biāo)記,通常是由1~6個(gè)堿基組成的基本單位重復(fù)多次組成的一小段DNA序列[1]。SSR在真核生物基因組中廣泛存在,具有豐富的多態(tài)性。SSR廣泛用于遺傳圖譜構(gòu)建、遺傳多樣性分析、數(shù)量性狀基因座(QTL)分析和系譜分析等[2-5]。傳統(tǒng)的SSR開(kāi)發(fā)技術(shù)的過(guò)程煩瑣,效率較低。基于轉(zhuǎn)錄組測(cè)序得到的SSR具有數(shù)目多和質(zhì)量?jī)?yōu)等特點(diǎn),已被廣泛用于植物種質(zhì)資源分析和譜系分析[6-7]。近年來(lái),科研工作者對(duì)多種魚(yú)類進(jìn)行了基于轉(zhuǎn)錄組測(cè)序的SSR位點(diǎn)開(kāi)發(fā),為輔助分子育種提供了良好的遺傳信息基礎(chǔ)[8]151,[9]123,[10]。
北草蜥(Takydromusseptentrionalis)是蜥蜴科草蜥屬的一種爬行動(dòng)物,為中國(guó)特有種,這種方式的SSR位點(diǎn)開(kāi)發(fā)在越來(lái)越多的類群中都有不同程度的開(kāi)展,以此進(jìn)行種群遺傳、親子鑒定和遺傳圖譜等相關(guān)研究[11]。北草蜥廣泛分布于我國(guó)的華北地區(qū),其系統(tǒng)發(fā)育樹(shù)的構(gòu)建和遺傳結(jié)構(gòu)的分析有助于人們了解爬行動(dòng)物的進(jìn)化過(guò)程中的重要事件。北草蜥生境類型較多,體色變化具有環(huán)境溫度依賴性,在其不同種群間也存在體色變化能力的差異[12]。說(shuō)明北草蜥皮膚顏色和變化能力都與環(huán)境有很強(qiáng)相關(guān)性,在基因水平上也可能存在很大的種群差異性。本文基于北草蜥皮膚的轉(zhuǎn)錄組測(cè)序結(jié)果分析,得到了大量的SSR位點(diǎn)和SNP信息;從SSR位點(diǎn)和SNP信息的分布特點(diǎn)、出現(xiàn)的頻率等方面進(jìn)行分析,旨在為北草蜥的基因克隆、遺傳圖譜構(gòu)建和進(jìn)化關(guān)系分析等提供理論方法。
依據(jù)文獻(xiàn)報(bào)道[12]8,下載北草蜥轉(zhuǎn)錄組測(cè)序數(shù)據(jù)。該數(shù)據(jù)是對(duì)來(lái)自湖南桂陽(yáng)種群的雄性北草蜥皮膚樣品,進(jìn)行Illumina HiSeq測(cè)序后,通過(guò)Trinity軟件拼接得到unigenes。
通過(guò)SSR分析軟件Micro SAtellite(MI-SA)對(duì)417 190條unigenes序列進(jìn)行SSR搜索,設(shè)定篩選條件:重復(fù)單位的堿基數(shù)目為1~6個(gè),SSR序列總長(zhǎng)度大于10 bp,單堿基的重復(fù)基元的重復(fù)次數(shù)大于10,剩余的重復(fù)基元的重復(fù)次數(shù)大于5次[13]。
通過(guò)Trinity拼接了9個(gè)樣本的轉(zhuǎn)錄組測(cè)序結(jié)果(表1),得到417 190條轉(zhuǎn)錄本序列,合計(jì)全長(zhǎng)479 055 094 bp。共計(jì)識(shí)別到60 968個(gè)SSR位點(diǎn),其中包含SSR位點(diǎn)的轉(zhuǎn)錄本數(shù)目為56 456條(占總轉(zhuǎn)錄本數(shù)目的13.53%)。所有轉(zhuǎn)錄本序列中的10 644個(gè)unigenes有1個(gè)以上的SSR位點(diǎn),存在復(fù)合形式的SSR位點(diǎn)的數(shù)量有4 513個(gè)。北草蜥中存在豐富的SSR類型,1~6個(gè)核苷酸重復(fù)的類型都存在。不同類型的核苷酸重復(fù)含量差異較大,單核苷酸重復(fù)型有27 028個(gè)(44.33%);2核苷酸重復(fù)型和3核苷酸重復(fù)型分別有17 876個(gè)(29.31%)和13 332個(gè)(21.87%);4~6核苷酸重復(fù)型含量極少,位點(diǎn)總數(shù)占比只有4.48%,其中,4核苷酸重復(fù)型有2 580個(gè)(4.23%),5核苷酸重復(fù)型和6核苷酸重復(fù)型分別只有112個(gè)(0.18%)和40個(gè)(0.07%)。不同個(gè)類型的SSR位點(diǎn)的序列總長(zhǎng)度不一樣,從大到小依次:1、2、3、4、5、6核苷酸重復(fù)型。SSR位點(diǎn)的平均長(zhǎng)度為15.80 bp(963 422 bp÷60 968),各SSR位點(diǎn)的平均長(zhǎng)度依次:11.15、17.32 、19.76、32.60、32.68、32.10 bp。從整體上看,在北草蜥轉(zhuǎn)錄組中,平均約7.86 kb出現(xiàn)1個(gè)SSR位點(diǎn)。
表1 北草蜥SSR類型和分布情況
在北草蜥轉(zhuǎn)錄組的SSR位點(diǎn)中,完美型重復(fù)(P型)有52 498個(gè),復(fù)合型重復(fù)(C型)有3 957個(gè)。P型SSR位點(diǎn)有6種,分別為完美單堿基重復(fù)(P1)、完美雙堿基重復(fù)(P2)、完美3堿基重復(fù)(P3)、完美4堿基重復(fù)(P4)、完美5堿基重復(fù)(P5)和完美6堿基重復(fù)(P6)。其中:P1、P2和P3數(shù)量較多,分別為274.46、251.49、224.04 kb;其次是P4,為69.10 kb;而P5和P6數(shù)量很少,分別只有3.48 kb和1.03 kb。在北草蜥轉(zhuǎn)錄組中,平均每Mb上有0.009個(gè)完美重復(fù)的SSR。
依據(jù)北草蜥轉(zhuǎn)錄組中不同類型的SSR位點(diǎn)重復(fù)次數(shù)分布的結(jié)果顯示,一共有106種重復(fù)基元,1~6核苷酸重復(fù)基元的種類依次為2、4、10、33、31和26。單核苷酸重復(fù)型有A/T和C/G 2種,其出現(xiàn)的次數(shù)占絕對(duì)優(yōu)勢(shì),分別有8 665個(gè)和18 363個(gè),占總SSR數(shù)目的14.21%和30.12%。2核苷酸重復(fù)型中,AC/GT和AG/CT出現(xiàn)相對(duì)較多,分別有9 968和5 670個(gè),占總SSR數(shù)目的16.35%和9.30%。3核苷酸重復(fù)型中,AAT/ATT數(shù)量最多有5 252個(gè),占總SSR數(shù)目的8.61%;其次是AGG/CCT和AGC/CTG,分別有1 252和1 236個(gè)。4核苷酸重復(fù)型中的重復(fù)基元只有9個(gè)出現(xiàn)的次數(shù)超過(guò)100次,依次為AAGG/CCTT、AGAT/ATCT、AAAG/CTTT、AAAC/GTTT、AAAT/ATTT、AGGG/CCCT、AGGC/CCTG、ACAG/CTGT、ACAT/ATGT。5~6核苷酸重復(fù)型的基元較多,但是每個(gè)基元出現(xiàn)的次數(shù)都很少。
在北草蜥轉(zhuǎn)錄組SSR位點(diǎn)中,重復(fù)的次數(shù)有5~94次,其中,10次重復(fù)出現(xiàn)的概率最大,有14 700個(gè)位點(diǎn)出現(xiàn)10次重復(fù),占比24.11%;其次是6次重復(fù)出現(xiàn)的概率,共有10 157個(gè)位點(diǎn),占比16.66%;重復(fù)次數(shù)為13次及以上的位點(diǎn)較少,總占比10.96%。單核苷酸重復(fù)型、2~3核苷酸重復(fù)型的SSR位點(diǎn)的重復(fù)次數(shù)比4~6核苷酸重復(fù)型的SSR位點(diǎn)的重復(fù)次數(shù)更多,其中,以單核苷酸重復(fù)型SSR的重復(fù)次數(shù)類型的數(shù)目最多(表2)。
表2 北草蜥不同類型SSR重復(fù)次數(shù)分布
對(duì)SSR的長(zhǎng)度分析發(fā)現(xiàn),北草蜥轉(zhuǎn)錄組SSR的長(zhǎng)度分布在10~102 bp。其中:小于12 bp的SSR位點(diǎn)為20 727個(gè);12~20 bp的SSR位點(diǎn)為31 297個(gè);大于20 bp的SSR位點(diǎn)為8 944個(gè)。在所有SSR位點(diǎn)中,高度多態(tài)性和中度多態(tài)性的SSR位點(diǎn)占總數(shù)的66%。
通過(guò)分析得到SNP位點(diǎn)有1 097 299個(gè),平均每kb有5.73個(gè)SNP位點(diǎn)。其中:轉(zhuǎn)換型SNP位點(diǎn)有C/T和A/G 2種,其位點(diǎn)分別有366 261和372 000個(gè),占總位點(diǎn)數(shù)的比例為67.28%;顛換型SNP位點(diǎn)有A/T、A/C、T/G和C/G 4種,其位點(diǎn)分別有89 567、87 601、88 436和93 434個(gè),占總位點(diǎn)數(shù)的比例為32.72%。
本研究在417 190條unigenes覆蓋的參考基因組序列中,共檢測(cè)到P型和C型2種SSR位點(diǎn)共計(jì)60 968 個(gè),其中:P型位點(diǎn)較多,占位點(diǎn)總數(shù)的86.11%;C型位點(diǎn)極少,只占位點(diǎn)總數(shù)的6.50%。在所有SSR位點(diǎn)中,低核苷酸(1~3)重復(fù)型出現(xiàn)次數(shù)占所有核苷酸重復(fù)類型(1~6核苷酸重復(fù)型)出現(xiàn)次數(shù)的比例明顯高于多核苷酸(4~6)重復(fù)型出現(xiàn)的比例,這與魚(yú)類和昆蟲(chóng)中的研究結(jié)果類似[8]151,[9]125,[14]104,[15]12,[16]1803,[17]47,[18]54,[19]11。中度多態(tài)性的SSR位點(diǎn)的數(shù)目也明顯多于高度多態(tài)性SSR位點(diǎn)數(shù)目,這也與魚(yú)類和昆蟲(chóng)的研究結(jié)果類似[8]151,[9]125,[14]104,[15]12,[16]1803,[17]47,[18]54,[19]11。
在魚(yú)類中,銀鯧(Pampusargenteus)和江鱈(Lotalota)中的SSR以單核苷酸重復(fù)的數(shù)目最多;牙鲆(Paralichthysolivaceus)和印尼虎魚(yú)(Datnioidesmicrolepis)中則以2核苷酸重復(fù)型的數(shù)目最多[9]125,[14]103,[16]1802,[19]10。分析具體使用的篩選條件時(shí)發(fā)現(xiàn):銀鯧和江鱈中,重復(fù)序列的閾值設(shè)定在了10 bp[14]103,[15]11;牙鲆和印尼虎魚(yú)中,篩選閾值設(shè)定在了15 bp[9]123,[19]10。因此,篩選條件的差異可能是影響單核苷重復(fù)型和2核苷酸重復(fù)型SSR的數(shù)目產(chǎn)生差異的原因之一。但是在昆蟲(chóng)中,溫帶臭蟲(chóng)中SSR以單核苷酸重復(fù)型的數(shù)目最多;印度谷螟(Plodiainterpunctella)中SSR以2核苷酸重復(fù)型的數(shù)目最多;桔小實(shí)蠅(Bactroceradorsalis)中SSR以3核苷酸重復(fù)型的數(shù)目最多[16]1803,[18]54。研究其分析方法發(fā)現(xiàn),在這3種昆蟲(chóng)的研究中選擇的閾值是相同的[16]1802,[18]53,說(shuō)明不同物種間SSR類型還是存在顯著差異。但總體來(lái)說(shuō),低核苷酸(1~3)重復(fù)型出現(xiàn)次數(shù)占所有核苷酸重復(fù)類型(1~6核苷酸重復(fù))出現(xiàn)數(shù)目的比例明顯高于多核苷酸(4~6)重復(fù)型出現(xiàn)的比例,中度多態(tài)性的SSR位點(diǎn)的數(shù)目也明顯多于高度多態(tài)性SSR位點(diǎn)數(shù)目[8]151,[9]125,[14]104,[15]11,[16]1803,[17]46,[18]54,[19]11。由于本研究采用的篩選閾值較為寬泛,因此可以篩選到更多的SSR位點(diǎn),這有利于后續(xù)關(guān)于北草蜥體色種群遺傳的相關(guān)性研究。
在對(duì)北草蜥轉(zhuǎn)錄組中的SSR位點(diǎn)進(jìn)行分析發(fā)現(xiàn),單核苷酸重復(fù)型有C/G的出現(xiàn)的次數(shù)顯著多于A/T出現(xiàn)的次數(shù)。但是在江鱈、印尼虎魚(yú)等魚(yú)類,溫帶臭蟲(chóng)(Cimexlectularius)、印度谷螟(Plodiainterpunctella)等昆蟲(chóng)中,以及在大熊貓(Ailuropodamelanoleuca)等哺乳類的大多數(shù)物種中,單核苷酸重復(fù)型中A/T基因序列最為豐富[14]104,[16]1803,[17]47,[19]11,[20]。因此,北草蜥中單核苷酸重復(fù)型中C/G基因序列的高豐度可能是較為獨(dú)特的存在。2核苷酸重復(fù)型中,AC/GT和AG/CT出現(xiàn)頻率較高,而AC/GT基因序列最為豐富,這與江鱈、印尼虎魚(yú)和奧地利羅非魚(yú)(Oreochromisniloticus)等物種中的發(fā)現(xiàn)相一致[8]151,[15]11,[19]10。但是在印度谷螟和桔小實(shí)蠅等昆蟲(chóng)中,AT/AT基因序列出現(xiàn)的頻率最高[18]53,[19]10。北草蜥中3核苷酸重復(fù)型和4核苷酸重復(fù)型的基元主要以AAT/ATT和AAGG/CCTT為主,而江鱈中主要以CTC/GAG和ATAC/GTAT為主[15]13,印度谷螟中則以CCG/CGG和AAAT/ATTTT為主[17]45。這表明3核苷酸重復(fù)型和4核苷酸重復(fù)型在物種中的變異比單核苷酸重復(fù)型和2核苷酸重復(fù)型都大。這可能與3核苷酸重復(fù)型基因序列除了形成了不同的DNA結(jié)構(gòu)外,還可能與物種進(jìn)化中產(chǎn)生物種特異性細(xì)胞因子時(shí)發(fā)揮著重要作用有關(guān)[21]。
(責(zé)任編輯:潘學(xué)峰)