張 芹, 王延暉, 王冰柯, 屈長義
(河南省水產(chǎn)科學(xué)研究院,河南鄭州 450044)
團(tuán)頭魴()隸屬于鯉形目(Cypriniformes)鯉科(Cyprinidae)鲌亞科(Culterinae)魴屬(),為中國特有的淡水經(jīng)濟(jì)魚類。由于團(tuán)頭魴具有養(yǎng)殖成本低、生長快、成活率高、易捕撈、肉質(zhì)好等優(yōu)點(diǎn),早在20世紀(jì)60年代就作為優(yōu)良的草食性魚類在全國推廣,成為池塘養(yǎng)殖的主要品種之一。微衛(wèi)星標(biāo)記(microsatellite),又稱為短串聯(lián)重復(fù)序列(simple tandem repeats,STRs)或簡單重復(fù)序列(simple sequence repeats,SSRs),是均勻分布于真核生物基因組中的簡單重復(fù)序列,由2~6個(gè)核苷酸的串聯(lián)重復(fù)片段構(gòu)成。SSR分子標(biāo)記具有重復(fù)性好、多態(tài)性高、對(duì)模板 DNA 要求低等優(yōu)點(diǎn),已廣泛應(yīng)用于鯉魚、扇貝、中華鳑鲏等水生動(dòng)物的種質(zhì)資源鑒定及遺傳多樣性研究,是水生動(dòng)物種質(zhì)鑒定、親緣關(guān)系及種質(zhì)分類等研究的理想標(biāo)記。采用傳統(tǒng)方法開發(fā)SSR分子標(biāo)記效率低且成本高,與轉(zhuǎn)錄組SSR相比,基因組SSR的多態(tài)性更高,且在基因組中分布廣泛,從而獲得更好的圖譜覆蓋率。利用高通量測序技術(shù)開發(fā)SSR分子標(biāo)記能極大提高開發(fā)效率,并有效降低成本,已成功應(yīng)用于多種水生動(dòng)物的SSR分子標(biāo)記開發(fā)。
該研究旨在利用生物信息學(xué)方法分析團(tuán)頭魴基因組數(shù)據(jù),發(fā)掘 SSR 位點(diǎn),了解其特征及分布規(guī)律,包括基序結(jié)構(gòu)和類型、比例、重復(fù)次數(shù),并設(shè)計(jì)和合成 SSR 引物,驗(yàn)證其多態(tài)性,為團(tuán)頭魴種質(zhì)資源的分子指紋圖譜構(gòu)建、品種間遺傳多樣性分析及分子育種的推進(jìn)奠定基礎(chǔ)。
2020年9月從河南省嵩縣陸渾水庫伊河魴魚種廠采集團(tuán)頭魴伊河群體100尾,從湖北省鄂州國家級(jí)團(tuán)頭魴原種場采集團(tuán)頭魴華海1號(hào)群體100尾,所有個(gè)體測量體長、體質(zhì)量,剪尾鰭用無水乙醇保存,并將樣品帶回河南省水產(chǎn)科學(xué)研究院實(shí)驗(yàn)室進(jìn)行后續(xù)試驗(yàn)。
1.2.1 團(tuán)頭魴DNA的提取 采用磁珠法基因組DNA提取試劑盒(天根生化)提取團(tuán)頭魴 DNA,經(jīng) 1%瓊脂糖凝膠電泳檢測,采用超微量分光光度計(jì)(NanoDrop One spectroph otometer)檢測 DNA 濃度和純度,置于-20 ℃低溫保存。
1.2.2 SSR位點(diǎn)的查找和引物的設(shè)計(jì) 從NCBI中搜索團(tuán)頭魴(),得到團(tuán)頭魴基因組序列信息,將這段基因組序列下載下來后,使用MISA軟件進(jìn)行SSR位點(diǎn)的搜索,搜索的標(biāo)準(zhǔn):重復(fù)基元長度2~6 bp,二核苷酸重復(fù)基序的最小重復(fù)數(shù)為6;三核苷酸、四核苷酸、五核苷酸和六核苷酸重復(fù)基序的最小重復(fù)數(shù)均為5。2個(gè)SSR序列間隔最小值為100 bp。
將得到的SSR位點(diǎn)信息經(jīng)Primer 5.0軟件設(shè)計(jì)引物,通過嚴(yán)格的篩選,得到9 000余條待選引物。引物篩選的標(biāo)準(zhǔn):去除重復(fù)單元全部由G/C堿基構(gòu)成的位點(diǎn)(高GC序列不利于批量擴(kuò)增);每一條參考序列上只選取1個(gè)位點(diǎn);去除引物長度不是20的位點(diǎn);選取目的產(chǎn)物在110~350 bp的引物;去掉重復(fù)單元重復(fù)次數(shù)5、6次及以下的位點(diǎn);不同位點(diǎn)間如果有1條或2條引物序列完全相同的,只保留1個(gè)位點(diǎn)。
1.2.3 PCR擴(kuò)增及SSR檢測 從9 000余條待選引物中隨機(jī)挑選288對(duì)SSR引物,其中,每對(duì)引物的正向引物(F引物)均加了通用M13接頭序列(TGTAAAACGACGGCCAGT),另外合成加FAM熒光基團(tuán)的M13熒光接頭引物。選擇8份團(tuán)頭魴基因組DNA作為模板對(duì)引物進(jìn)行篩選,選擇條帶清晰、多態(tài)性好的引物進(jìn)行后續(xù)試驗(yàn)。
采用兩步PCR法進(jìn)行擴(kuò)增。第一步PCR反應(yīng)體系(10.0 μL):2×PCR Master Mix 5.0 μL,基因組DNA 1.0 μL,接頭上游引物(10p)0.3 μL,下游引物(10p)0.3 μL,ddHO 3.4 μL。PCR擴(kuò)增程序:95 ℃ 預(yù)變性3 min;95 ℃ 變性 30 s,62 ℃→52 ℃ touch down退火 30 s,72 ℃ 延伸 30 s,共10個(gè)循環(huán);95 ℃ 變性30 s,52 ℃ 退火 30 s,72 ℃ 延伸30 s,共25個(gè)循環(huán);72 ℃ 終延伸 20 min。第二步PCR反應(yīng)體系(10.0 μL):2×PCR Master Mix 5.0 μL,第一步PCR產(chǎn)物 1.0 μL,熒光引物(10p)0.3 μL,下游引物(10p)0.3 μL,ddHO 3.4 μL。PCR擴(kuò)增程序:95 ℃預(yù)變性 5 min;95 ℃變性 30 s,52 ℃退火 30 s,72 ℃延伸30 s,共25個(gè)循環(huán);72 ℃末端延伸 5 min。
1.2.4 熒光毛細(xì)管電泳檢測 PCR產(chǎn)物進(jìn)行定量稀釋后,取1 μL PCR稀釋產(chǎn)物加9 μL甲酰胺(含1%內(nèi)標(biāo))變性后上DNA測序儀ABI 3730xl進(jìn)行毛細(xì)管熒光電泳檢測。
1.2.5 結(jié)果處理 將毛細(xì)管電泳檢測結(jié)果導(dǎo)入到Gene Marker分析軟件中,進(jìn)行數(shù)據(jù)整理,每對(duì)引物導(dǎo)出PDF峰圖文件,結(jié)果匯總統(tǒng)計(jì)后進(jìn)行分析。
將已獲得的團(tuán)頭魴基因組數(shù)據(jù)進(jìn)行 SSR位點(diǎn)分析,共檢測序列 18 243 條,其中含有 SSR位點(diǎn)的序列為 3 940 條,占總檢測序列條數(shù)的21.60%,檢測出 SSR位點(diǎn)共350 898 個(gè),平均約3.1 kb 出現(xiàn)1個(gè)SSR位點(diǎn)。含有2 個(gè)及2 個(gè)以上SSR位點(diǎn)的序列有 2 450 條。其中,二核苷酸重復(fù)的位點(diǎn)236 613條,占總SSR位點(diǎn)的67.43%;三核苷酸重復(fù)的位點(diǎn)51 527條,占總SSR位點(diǎn)的14.68%;四核苷酸重復(fù)的位點(diǎn)52 042條,占總SSR位點(diǎn)的14.83%;五核苷酸重復(fù)的位點(diǎn)10 149條,占總SSR位點(diǎn)的2.89%;六核苷酸重復(fù)的位點(diǎn)567條,占總SSR位點(diǎn)的0.16%(圖1)。
團(tuán)頭魴基因組中含有豐富的SSR 類型,搜索得到的350 898 個(gè) SSR 位點(diǎn)中,共檢測出 1 106 種類型的核苷酸重復(fù),不同核苷酸重復(fù)類型出現(xiàn)的比例相差較大,其中,二核苷酸重復(fù)類型最少,只有 12 種,占SSR位點(diǎn)重復(fù)類型的1.08%;三核苷酸重復(fù)類型 60 種,占SSR位點(diǎn)重復(fù)類型的5.42%;四核苷酸重復(fù)類型217種,占SSR位點(diǎn)重復(fù)類型的19.62%;五核苷酸的重復(fù)類型最多,達(dá) 556 種,占SSR位點(diǎn)重復(fù)類型的50.27%;六核苷酸重復(fù)類型 261 種,占SSR位點(diǎn)重復(fù)類型的23.60%。
此外,從SSR位點(diǎn)的平均分布距離來看,二核苷酸、三核苷酸、四核苷酸重復(fù)在團(tuán)頭魴基因組中分布距離較小,分別為4.6、21.1、20.9 kb,而五核苷酸、六核苷酸重復(fù)位點(diǎn)的平均分布距離分別為107.1 kb和1.9 Mb。二核苷酸、三核苷酸、四核苷酸類型重復(fù)位點(diǎn)的密度遠(yuǎn)遠(yuǎn)高于其他2 種類型重復(fù)位點(diǎn)的密度。
由圖2可知,團(tuán)頭魴基因組SSR中,二核苷酸重復(fù)單元長度為12~144 bp,分布范圍主要集中在6~34次,占91%;三核苷酸重復(fù)單元長度為12~144 bp,主要集中在5~17次,占99%;四核苷酸重復(fù)單元長度在20~200 bp,分布范圍主要集中在 5~29次,占99%;五核苷酸重復(fù)單元長度為25~225 bp,主要集中分布在5~17次,占97%;六核苷酸重復(fù)單元長度30~162 bp,分布范圍主要集中在5~15次,占99%。團(tuán)頭魴基因組中不同重復(fù)SSR類型中的重復(fù)長度不同,且長度的變異較大。每種重復(fù)SSR類型都隨著重復(fù)長度的遞增,微衛(wèi)星豐度呈遞減趨勢,即SSR長度越長,微衛(wèi)星出現(xiàn)頻率越低。
從團(tuán)頭魴基序類型分布看,由表1可知,350 898 個(gè)SSR位點(diǎn)中共有257種重復(fù)基序,二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重復(fù)基序類型分別有4、10、32、95、116種。
表1 團(tuán)頭魴基因組部分SSR基序類型的分布特征
二核苷酸重復(fù)基序類型有4種,即AC/GT、AG/CT、AT/AT和CG/CG,占總SSR位點(diǎn)類型的67.43%,其中,AT/AT所占比例最高,為29.46%,CG/CG所占比例最低,為0.12%;三核苷酸重復(fù)類型基序有10種,其中,AAT/ATT重復(fù)類型基序最多,為8.56%;四核苷酸重復(fù)類型基序有32種,其中,AGAT/ATCT所占比例最多(4.57%);五核苷酸重復(fù)類型基序以AATAT/ATATT所占比例最多(0.97%);六核苷酸重復(fù)類型以AACCCT/AGGGTT所占比例最高(0.06%)。
以8份團(tuán)頭魴DNA為材料,對(duì)設(shè)計(jì)合成的288對(duì)SSR熒光引物進(jìn)行多態(tài)性篩選,有149對(duì)引物能夠穩(wěn)定擴(kuò)增出與預(yù)期產(chǎn)物一致的條帶,引物有效率為51.7%;93對(duì)引物表現(xiàn)出多態(tài)性。由表2可知,多態(tài)性引物占32.3%;其中,18對(duì)引物表現(xiàn)出高度多態(tài)性,等位基因數(shù)大于3,可以穩(wěn)定擴(kuò)增且沒有雜峰。由圖3可知其中1對(duì)引物HNF209在4份團(tuán)頭魴材料中的毛細(xì)管電泳檢測結(jié)果。
表2 篩選的 18 對(duì)團(tuán)頭魴基因組 SSR 位點(diǎn)引物信息
在團(tuán)頭魴基因組序列共檢測出 SSR位點(diǎn) 350 898 個(gè),平均約3.1 kb出現(xiàn)1個(gè)SSR位點(diǎn),低于木荷、甘草等植物,高于卵形鯧鲹、翹嘴鱖等水生生物中SSR位點(diǎn)的出現(xiàn)頻率,說明團(tuán)頭魴基因組 SSR 位點(diǎn)較為豐富。
在大多數(shù)物種基因組中,具有短核苷酸重復(fù)基元(單核苷酸、二核苷酸、三核苷酸)的序列較長核苷酸重復(fù)基元(四核苷酸、五核苷酸、六核苷酸)的序列更豐富。在團(tuán)頭魴SSR序列中,隨著核苷酸重復(fù)基元的增加,其數(shù)量迅速減少,其中,二核苷酸重復(fù)的位點(diǎn) 236 613 條,占總SSR位點(diǎn)的67.43%,六核苷酸重復(fù)的位點(diǎn)占總SSR位點(diǎn)的0.16%。這個(gè)結(jié)果與卵形鯧鲹、胡子鲇和長體圓鲹等魚類的研究結(jié)果相似。
團(tuán)頭魴基因組SSR各重復(fù)類別中,從SSR位點(diǎn)的平均分布距離來看,六核苷酸重復(fù)(1.9 Mb)>五核苷酸重復(fù)(107.1 kb)>三核苷酸重復(fù)(21.1 kb)>四核苷酸重復(fù)(20.9 kb)>二核苷酸重復(fù)(4.6 kb)。
Weber發(fā)現(xiàn)完美重復(fù)序列PIC值隨著重復(fù)次數(shù)的增加呈現(xiàn)增加的趨勢。該研究中,三核苷酸、四核苷酸和五核苷酸重復(fù)型SSR位點(diǎn)的PIC值與SSR長度均呈正相關(guān),與石榴中的結(jié)果一致,說明我們以后在選擇SSR標(biāo)記時(shí)應(yīng)相應(yīng)選擇重復(fù)次數(shù)較多、序列較長的SSR位點(diǎn),可能會(huì)獲得更高的多態(tài)性水平。
該研究首次利用生物信息學(xué)技術(shù),對(duì)團(tuán)頭魴基因組SSR序列進(jìn)行搜索和分析,發(fā)掘了大量團(tuán)頭魴 SSR 位點(diǎn),統(tǒng)計(jì)分析團(tuán)頭魴基因組SSR數(shù)量、長度、頻率和密度等生物信息學(xué)特征,豐富團(tuán)頭魴分子標(biāo)記類型,為團(tuán)頭魴群體遺傳結(jié)構(gòu)和遺傳多樣性分析提供數(shù)據(jù)基礎(chǔ),有利于加快建立團(tuán)頭魴種質(zhì)資源評(píng)價(jià)與保護(hù)機(jī)制,也有利于進(jìn)一步研究團(tuán)頭魴種質(zhì)資源多樣性和品種選育。
致謝:感謝華中農(nóng)業(yè)大學(xué)王衛(wèi)民教授在團(tuán)頭魴樣品采集過程中給予的幫助。