楊 尉,司圓圓,許瑞雯,陳興漢
陽(yáng)江職業(yè)技術(shù)學(xué)院,廣東 陽(yáng)江 529566
疣吻沙蠶 (Tylorrhynchusheterochaetus) 又名疵吻沙蠶,屬環(huán)節(jié)動(dòng)物門、多毛綱、葉須蟲目、沙蠶科,俗稱禾蟲、流蜞,在中國(guó)東南沿海河口地區(qū)的泥沙質(zhì)淺灘或稻田中廣泛分布[1-2]。作為一種經(jīng)濟(jì)價(jià)值極高的多毛類,其味道鮮美且營(yíng)養(yǎng)豐富,是中國(guó)廣東、廣西、福建、香港、澳門及東南亞各地獨(dú)具特色的水產(chǎn)品,素有“水中冬蟲夏草”之美譽(yù)[2-3]。更重要的是,疣吻沙蠶與水稻具有天然的共生關(guān)系,發(fā)展疣吻沙蠶稻田綜合種養(yǎng)模式可顯著增加水稻種植的經(jīng)濟(jì)效益[4]?!八?疣吻沙蠶”生態(tài)綜合種養(yǎng)技術(shù)正日趨成熟,自2021 年起連續(xù)3 年入選廣東省農(nóng)業(yè)主推技術(shù),在助力鄉(xiāng)村振興、保障國(guó)家糧食安全等方面應(yīng)用潛力巨大。然而,疣吻沙蠶具有生境狹窄、種群地理隔離、群體恢復(fù)力低等物種特性,受棲息地破壞、過(guò)度捕撈、環(huán)境污染等因素的影響其自然種群呈逐年衰退的趨勢(shì),在有些地區(qū)甚至已經(jīng)絕跡[4-5]。在突破疣吻沙蠶全人工繁殖技術(shù)的基礎(chǔ)上,近年已實(shí)現(xiàn)其苗種的規(guī)?;嘤鲳B(yǎng)殖業(yè)的發(fā)展以及技術(shù)的革新培育了大量的人工繁育群體,但因遺傳育種研究的滯后,疣吻沙蠶種質(zhì)開始出現(xiàn)生長(zhǎng)性能及抗逆性下降等退化現(xiàn)象[4]。為建立疣吻沙蠶資源管理策略并促進(jìn)其可持續(xù)開發(fā)利用,特別是避免常年的產(chǎn)業(yè)化增養(yǎng)殖引起遺傳結(jié)構(gòu)單一化,防止人工繁育群體污染自然種群,有必要采用分子手段科學(xué)地分析及評(píng)估其種質(zhì)現(xiàn)狀,揭示種群遺傳多樣性水平與遺傳結(jié)構(gòu),并以此指導(dǎo)新品種的培育與遺傳改良研究。
目前,國(guó)內(nèi)外針對(duì)疣吻沙蠶的研究主要集中在形態(tài)學(xué)、生活史、繁殖生物學(xué)、增養(yǎng)殖技術(shù)、營(yíng)養(yǎng)與活性成分分析等方面[3,5]。Chen 等[5-6]完成了疣吻沙蠶線粒體基因組測(cè)序,并基于線粒體COI 序列分析了7 個(gè)地理群體的遺傳結(jié)構(gòu),除此之外,遺傳學(xué)相關(guān)的研究鮮有報(bào)道;分子遺傳信息的匱乏制約了疣吻沙蠶資源保護(hù)利用研究的深入開展。微衛(wèi)星標(biāo)記具有多態(tài)性豐富、共顯性遺傳、基因組覆蓋廣泛等優(yōu)點(diǎn)[7],該技術(shù)操作簡(jiǎn)便、檢測(cè)周期短、穩(wěn)定性高、重復(fù)性好,已廣泛應(yīng)用于譜系鑒定、親緣關(guān)系檢測(cè)、遺傳多樣性分析、種質(zhì)資源評(píng)價(jià)、遺傳圖譜構(gòu)建及基因定位等領(lǐng)域[8]?;蚪Msurvey 是利用高通量測(cè)序技術(shù)實(shí)施小片段、低深度測(cè)序,然后基于Lander-Waterman 模型進(jìn)行k-mer 分析,并根據(jù)k-mer 頻率和深度的統(tǒng)計(jì)結(jié)果評(píng)估物種基因組的大小與復(fù)雜程度等關(guān)鍵特征[9]?;蚪Msurvey 不僅能為全基因組測(cè)序及高質(zhì)量組裝提供科學(xué)依據(jù),而且對(duì)無(wú)參考基因組序列的物種而言,利用基因組survey 數(shù)據(jù)大規(guī)模開發(fā)微衛(wèi)星標(biāo)記是當(dāng)前最高效的策略之一,較傳統(tǒng)方法具有效率高、周期短、成本低的優(yōu)勢(shì)[9]?;蚪M微衛(wèi)星鑒定研究在水產(chǎn)經(jīng)濟(jì)動(dòng)物中已廣泛開展,篩選的標(biāo)記獲得了良好的遺傳分析效果。例如,張永德等[9]在卵形鯧鲹 (Trachinotus ovatus) 基因組survey 數(shù)據(jù)中檢測(cè)到190 121 個(gè)微衛(wèi)星位點(diǎn)并成功開發(fā)了多態(tài)分子標(biāo)記,為全基因組測(cè)序與組裝、漁業(yè)資源保護(hù)利用及良種選育奠定了基礎(chǔ);上官清等[10]分析了斑鱧 (Channamaculata) 基因組微衛(wèi)星特征,并篩選到20 個(gè)多態(tài)性位點(diǎn)用于群體遺傳多樣性和遺傳結(jié)構(gòu)分析,為該物種的遺傳監(jiān)測(cè)、親緣關(guān)系鑒定、種質(zhì)資源養(yǎng)護(hù)及管理提供了技術(shù)支持。
本研究對(duì)疣吻沙蠶基因組進(jìn)行低深度高通量測(cè)序,通過(guò)k-mer 分析預(yù)測(cè)基因組大小、雜合度和重復(fù)比例等信息,對(duì)測(cè)序數(shù)據(jù)初步組裝后搜索組裝序列中的微衛(wèi)星位點(diǎn),分析其特征與分布規(guī)律,初步驗(yàn)證標(biāo)記的有效性和多態(tài)性,以期指導(dǎo)基因組精細(xì)圖譜的繪制,并為群體遺傳學(xué)研究提供可靠的標(biāo)記資源。
疣吻沙蠶采集自陽(yáng)江市廣東陽(yáng)海農(nóng)業(yè)技術(shù)發(fā)展有限公司疣吻沙蠶增養(yǎng)殖試驗(yàn)基地(111°55'23"E、21°49'16"N) 保種的越南海防群體。用于基因組測(cè)序的疣吻沙蠶幼體用適量無(wú)菌水洗滌3 次,解剖后剪取體壁肌肉組織裝入2 mL 凍存管,液氮速凍后置于-80 ℃保存。微衛(wèi)星標(biāo)記多態(tài)性驗(yàn)證群體的30 尾個(gè)體經(jīng)無(wú)菌水洗滌后,解剖剪取體壁肌肉組織,置于體積分?jǐn)?shù)為95%的乙醇中在-20 ℃下保存。
運(yùn)用苯酚-氯仿法提取疣吻沙蠶基因組DNA,經(jīng)1.0% (w) 瓊脂糖凝膠電泳檢測(cè)完整度后,用NanoDrop 2000 超微量分光光度計(jì) (ThermoFisher,美國(guó)) 檢測(cè)濃度和純度。利用Covaris 超聲波破碎儀將基因組DNA 片段化,篩選合適長(zhǎng)度的DNA片段,經(jīng)末端修復(fù)、加A 尾、添加測(cè)序接頭、純化及PCR 擴(kuò)增等步驟建立350 bp 小片段文庫(kù)。測(cè)序文庫(kù)經(jīng)Qubit 2.0 (ThermoFisher,美國(guó)) 和Agilent 2100 Bioanalyzer (Agilent,美國(guó)) 檢測(cè)濃度和插入片段大小后,用Illumina HiseqTMX Ten 平臺(tái)進(jìn)行雙末端測(cè)序?;蚪M測(cè)序工作委托北京諾禾致源科技股份有限公司完成。原始數(shù)據(jù)經(jīng)質(zhì)控和過(guò)濾后,用GCE 1.0.0[11]軟件對(duì)有效數(shù)據(jù)進(jìn)行k-mer 分析。運(yùn)用SOAPdenovo 2.01[12]軟件,選擇k-mer=41 將有效數(shù)據(jù)組裝至contig 和scaffold 級(jí)別,并統(tǒng)計(jì)GC 含量和覆蓋深度等信息。
使用MISA (Microsatellite identification tool) 軟件(http://pgrc.ipk-gatersleben.de/misa/misa.html)在長(zhǎng)度大于500 bp 的序列中搜索微衛(wèi)星位點(diǎn)。運(yùn)行參數(shù)為:重復(fù)基序長(zhǎng)度1~6 bp,單堿基重復(fù)次數(shù)≥12 次,二堿基重復(fù)次數(shù)≥6 次,三堿基、四堿基重復(fù)次數(shù)≥5 次,五堿基、六堿基重復(fù)次數(shù)≥4 次;將間隔區(qū)域長(zhǎng)度小于100 bp 的相鄰微衛(wèi)星歸為1 個(gè)復(fù)合型位點(diǎn)?;谖⑿l(wèi)星側(cè)翼序列,用Primer 5[13]批量設(shè)計(jì)引物,主要參數(shù)為:引物長(zhǎng)度18~27 bp,擴(kuò)增產(chǎn)物100~300 bp,退火溫度(Tm) 55~65 ℃,GC 含量40%~60%,正、反向引物退火溫差≤5 ℃;盡量避免出現(xiàn)發(fā)卡結(jié)構(gòu)、二聚體、錯(cuò)配和引物二聚體;每個(gè)微衛(wèi)星位點(diǎn)生成3~5 對(duì)候選引物。隨機(jī)選取50 對(duì)微衛(wèi)星引物委托生工生物工程(上海)股份有限公司合成。
使用天根生化科技(北京)有限公司的海洋動(dòng)物組織基因組DNA 提取試劑盒從疣吻沙蠶體壁肌肉組織中提取基因組DNA。PCR 反應(yīng)體系為20 μL,正、反向引物 (10 μmol·L-1) 各0.5 μL,DNA 模板(15 ng·μL-1) 1.0 μL,2×PCR Mix 10 μL,用超純水補(bǔ)至20 μL。擴(kuò)增反應(yīng)由Bio-Rad My Cycler Thermal Cycler (Bio-Rad,美國(guó)) 完成,運(yùn)行程序?yàn)椋?5 ℃預(yù)變性5 min;95 ℃變性30 s,59~60 ℃退火30 s,72 ℃延伸30 s,25 個(gè)循環(huán);72 ℃延伸5 min。PCR 產(chǎn)物先進(jìn)行1.5% (w) 瓊脂糖凝膠電泳分析,參照預(yù)期片段大小篩選出有效擴(kuò)增引物。有效擴(kuò)增引物加熒光接頭后 (正向引物5'端添加FAM 熒光素),在30 尾疣吻沙蠶個(gè)體的基因組DNA 中擴(kuò)增以驗(yàn)證其多態(tài)性。PCR 產(chǎn)物送至上海翼禾應(yīng)用生物技術(shù)有限公司用3730XL 測(cè)序分析儀 (Applied Biosystems,美國(guó)) 進(jìn)行毛細(xì)管電泳分析,使用GeneMapper 3.2 軟件 (Applied Biosystems,美國(guó)) 進(jìn)行基因分型。
使用Excel 2016 軟件完成微衛(wèi)星位點(diǎn)分布特征信息的統(tǒng)計(jì)分析和圖表繪制。微衛(wèi)星發(fā)生頻率=含微衛(wèi)星的序列總數(shù)/序列總數(shù)×100%;微衛(wèi)星出現(xiàn)頻率=微衛(wèi)星總數(shù)/序列總數(shù)×100%;微衛(wèi)星豐度(個(gè)·Mb-1)=微衛(wèi)星總數(shù)/序列總長(zhǎng)度[14]。用GenAlEx 6.5 軟件[15]計(jì)算等位基因數(shù) (Na)、有效等位基因數(shù)(Ne)、觀測(cè)雜合度 (Ho)、期望雜合度 (He)、多態(tài)信息含量 (PIC)。用Genepop 在線軟件 (https://genepop.curtin.edu.au/) 檢驗(yàn)位點(diǎn)間的連鎖不平衡及群體的哈迪-溫伯格平衡 (Hardy-Weinberg Equilibrium,HWE),并用Bonferroni 法對(duì)顯著性閾值進(jìn)行校正。
低深度高通量測(cè)序產(chǎn)生的原始數(shù)據(jù)經(jīng)質(zhì)控后共獲得57.48 Gb 有效數(shù)據(jù),堿基錯(cuò)誤率為0.05%,Q20 和Q30 分別為95.56%和89.70%,表明基因組測(cè)序質(zhì)量較高 (表1)。對(duì)有效數(shù)據(jù)進(jìn)行k-mer 分析(k=17),結(jié)果顯示在深度為57 時(shí)出現(xiàn)主峰值(圖1),總k-mer 為44 257 233 158,排除錯(cuò)誤k-mer的誤差影響后得到修正的基因組大小為759.53 Mb,雜合率為1.41%,重復(fù)序列比例為45.92%。選擇k-mer=41 將有效讀段初步組裝至contig 和scaffold 水平,最終獲得的contig 總長(zhǎng)度為821 637 022 bp,最大長(zhǎng)度為84 713 bp,N50 為548 bp;scaffold 總長(zhǎng)度為840 375 821 bp,最大長(zhǎng)度為89 326 bp,N50 為662 bp。
表1 疣吻沙蠶基因組 survey 測(cè)序數(shù)據(jù)統(tǒng)計(jì)Table 1 Statistics of genomic survey sequencing data of T.heterochaetus
圖1 疣吻沙蠶基因組 k-mer 種類頻率分布Fig.1 Frequency distribution of k-mer species in genome of T.heterochaetus
用MISA 軟件在109 881 條組裝序列中檢測(cè)到130 216 個(gè)微衛(wèi)星位點(diǎn),長(zhǎng)度共計(jì)2 341 179 bp;微衛(wèi)星發(fā)生頻率5.04%,出現(xiàn)頻率5.97%,分布豐度為154.9 個(gè)·Mb-1。疣吻沙蠶微衛(wèi)星位點(diǎn)以單堿基和二堿基重復(fù)最為豐富,分別有45 582 和42 298 條,各占35.00%和32.48%;其次是三堿基重復(fù) (18 782條),占14.42%;六堿基數(shù)量最少,僅占2.44%(圖2)。微衛(wèi)星序列的重復(fù)數(shù)范圍為4~56 拷貝,主要集中在4~18 拷貝,重復(fù)19 次及以上的有3 703 條,僅占3.50%;單堿基重復(fù)以12~16 次最常見 (40 706條,89.30%),二堿基重復(fù)集中在6~18 次 (42 035條,99.38%),三堿基重復(fù)以5~12 次為主 (18 526條,98.64%),四堿基重復(fù)以5~10 次為主 (12 173條,98.91%),而五堿基和六堿基重復(fù)主要為4~8 次 (共11 176 條,99.37%) (圖2—圖3)。
圖2 疣吻沙蠶基因組 6 種類型微衛(wèi)星的數(shù)量與比例Fig.2 Number and proportion of six motif types of microsatellite loci in genome of T.heterochaetus
圖3 疣吻沙蠶基因組微衛(wèi)星重復(fù)數(shù)分布特征Fig.3 Distribution pattern of microsatellite repeat number in genome of T.heterochaetus
疣吻沙蠶基因組微衛(wèi)星共包含320 種重復(fù)基序類型:?jiǎn)螇A基2 種、二堿基4 種、三堿基10 種、四堿基31 種、五堿基91 種、六堿基182 種。單堿基重復(fù)基序拷貝數(shù)集中在12~15 次,以C/G 為主,占比58.02%;二堿基重復(fù)拷貝數(shù)多為6~10 次,以AT/AT 最為豐富,占比62.38%,其次是AC/GT(27.37%)、AG/CT (10.22%),而CG/CG 數(shù)量稀少(0.02%);在三堿基重復(fù)中,拷貝數(shù)多為5~12 次,占比最高的是AAT/ATT,有6253 條 (33.29%),其次是ATC/GAT (32.15%),而CCG/CGG 數(shù)量最少,僅占0.06%;四堿基拷貝數(shù)多為5~8 次,優(yōu)勢(shì)重復(fù)基序是AAAT/ATTT,有3567 條 (28.98%),其次是AATC/GATT (14.08%)、ACTC/GAGT(9.60%)、ATCC/GGAT (7.38%);五堿基、六堿基拷貝數(shù)集中在4~7 次,優(yōu)勢(shì)重復(fù)基序分別是AAAAT/ATTTT (17.07%) 和AACCCT/AGGGTT (11.73%)(圖4)。
根據(jù)重復(fù)序列長(zhǎng)度可將微衛(wèi)星位點(diǎn)分為兩類:一類是長(zhǎng)度達(dá)20 bp 及以上的高度多態(tài)I 型,另一類則是長(zhǎng)度介于12~19 bp 的中度多態(tài)II 型[16]。疣吻沙蠶基因組微衛(wèi)星位點(diǎn)的長(zhǎng)度分布區(qū)間為12~336 bp,I 型微衛(wèi)星位點(diǎn)有43 240 條,占33.21%,剩余的II 型位點(diǎn)占66.79%;絕大部分I 型微衛(wèi)星位點(diǎn)的長(zhǎng)度為20~39 bp,超過(guò)50 bp 的位點(diǎn)僅占0.51% (圖5-a)。進(jìn)一步分析發(fā)現(xiàn),在I 型微衛(wèi)星位點(diǎn)中,二、三、四、五堿基是最主要的重復(fù)類型,占85.92%,在后續(xù)多態(tài)標(biāo)記的篩選中有較高的開發(fā)價(jià)值(圖5-b)。
圖5 疣吻沙蠶基因組微衛(wèi)星長(zhǎng)度分布特征注:a.不同長(zhǎng)度區(qū)間微衛(wèi)星數(shù)量及比例;b.不同類型微衛(wèi)星長(zhǎng)度分布特征。Fig.5 Distribution pattern of length of microsatellite loci genome of T.heterochaetusNote: a.Number and percentage of microsatellite loci at different length intervals; b.Length distribution of the six motif types of microsatellite loci.
使用Primer 5 成功對(duì)37 370 個(gè)微衛(wèi)星位點(diǎn)設(shè)計(jì)了引物。隨機(jī)選取50 個(gè)位點(diǎn)合成引物并進(jìn)行PCR 驗(yàn)證,共獲得41 對(duì) (82%) 有效擴(kuò)增引物,表明MISA 軟件鑒定的微衛(wèi)星位點(diǎn)具有較高有效性。多態(tài)性篩選結(jié)果顯示,15 個(gè) (30%) 微衛(wèi)星位點(diǎn)的引物表現(xiàn)出穩(wěn)定且可重復(fù)的多態(tài)性 (表2,圖6)。在30 尾疣吻沙蠶中,15 對(duì)引物共檢測(cè)到87 個(gè)等位基因,平均等位基因數(shù)5.800,等位基因頻率為0.060~0.400,其中ThGM021 位點(diǎn)的等位基因數(shù)最少 (Na=2.000),ThGM004 位點(diǎn)的等位基因數(shù)最多(Na=12.000)。Ne為1.164~6.713,平均值為3.328;Ho為0.050~0.879,平均值為0.487;He為0.141~0.789,平均值為0.561;PIC 為0.136~0.776,平均值為0.511 (表3)。在15 個(gè)位點(diǎn)中,8 個(gè)屬高度多態(tài)性位點(diǎn) (PIC>0.5),5 個(gè)屬中度多態(tài)性位點(diǎn)(0.25<PIC≤0.5),2 個(gè)屬低度多態(tài)性位點(diǎn) (PIC≤0.25),表明該群體的遺傳多樣性較豐富。經(jīng)Bonferroni 校正后,有3 個(gè)位點(diǎn) (ThGM006、ThGM011、ThGM040) 偏離HWE,其中ThGM040 屬于高度多態(tài)性位點(diǎn)。各位點(diǎn)間無(wú)連鎖不平衡現(xiàn)象。
表2 疣吻沙蠶 15 對(duì)多態(tài)微衛(wèi)星引物信息Table 2 Information of 15 polymorphic microsatellite loci in genome of T.heterochaetus
表3 15 個(gè)多態(tài)微衛(wèi)星位點(diǎn)在疣吻沙蠶群體中的遺傳特征Table 3 Genetic characteristics of 15 polymorphic microsatellite loci in a T.heterochaetus population
圖6 部分多態(tài)微衛(wèi)星標(biāo)記的毛細(xì)管電泳分型結(jié)果Fig.6 A set of polymorphic microsatellite loci visualized by high-resolution capillary electrophoresis
不同物種間基因組的大小和復(fù)雜程度有明顯差異,會(huì)直接影響到測(cè)序策略的選擇及基因組的組裝效果。因此,進(jìn)行全基因組測(cè)序前須先評(píng)估物種基因組的基本特征。疣吻沙蠶基因組survey 測(cè)序及k-mer 分析估計(jì)其基因組為759.53 Mb,遠(yuǎn)大于水蛭 (Helobdellarobusta)[17]和寬體金線蛭 (WhitmaniaPigra)[18]等所有已報(bào)道的蛭綱物種,也較多毛綱的海蠕蟲 (Capitellateleta)[17]、歐文蟲 (Owenia fusiformis)[19]、巨型管蟲 (Riftiapachyptila)[20]、Lamellibrachialuymesi[21]的大;與寡毛綱通俗腔蚓(Metaphirevulgaris)[22]及多毛綱搓稚蟲 (Streblospio benedicti)[23]的大小 (約0.7 Gb) 相當(dāng);但明顯小于安德愛勝蚓 (Eiseniaandrei)[24]、赤子愛勝蚓 (E.fetida)[25],以及多毛綱的旋鰓蟲(Spirobranchuslamarcki)[26]和深海管蟲 (Paraescarpiaechinospica)[27](1.0~1.3 Gb)。物種間基因組大小的差異性在一定程度上與重復(fù)序列比例的高低有關(guān)。疣吻沙蠶基因組的重復(fù)序列比例 (45.92%) 低于旋鰓蟲[26]和深海管蟲[27],但顯著高于海蠕蟲[17]、巨型管蟲[20],以及所有已公布的蛭綱動(dòng)物 (重復(fù)比例均低于34%)[15-18];其基因組雜合率 (1.41%) 與安德愛勝蚓[24]和赤子愛勝蚓[25]相當(dāng),遠(yuǎn)遠(yuǎn)高于L.luymesi(0.60%)[21]、搓稚蟲 (0.29%)[23]與深海管蟲 (0.63%)[27],是目前已報(bào)道的雜合率最高的多毛類。此外,組裝的contig和scalffold 總長(zhǎng)分別為821 637 022 和840 375 821 bp,N50 分別為548 和662 bp,提示過(guò)高的雜合率會(huì)造成組裝序列長(zhǎng)度大于預(yù)估基因組大小,并導(dǎo)致顯著偏低的N50 指標(biāo)[28]。綜上所述,疣吻沙蠶基因組屬?gòu)?fù)雜基因組類型,繪制染色體級(jí)別高質(zhì)量全基因組圖譜應(yīng)優(yōu)先考慮“PacBio+Illumina+Hi-C”策略。該研究數(shù)據(jù)為后續(xù)全基因組測(cè)序與組裝提供了基礎(chǔ)資料。
水生動(dòng)物基因組中單堿基重復(fù)微衛(wèi)星占優(yōu)勢(shì)的現(xiàn)象較少,已報(bào)道的有中華絨螯蟹 (Eriocheirsinensis)[29]、鯉 (Cyprinuscarpio)[30]、脊尾白蝦 (Exopalaemoncarinicauda)[31]和胡鯰 (Clariasbatrachus)[32]。在疣吻沙蠶基因組中檢測(cè)到 130 216 個(gè)微衛(wèi)星位點(diǎn),位點(diǎn)數(shù)量隨重復(fù)基序堿基數(shù)的增加而迅速減少,單堿基重復(fù)微衛(wèi)星最豐富 (35.00%),其次為二堿基重復(fù) (32.48%)、三堿基重復(fù) (14.42%),這與以二堿基或三堿基為優(yōu)勢(shì)類型的魚[9,33-35]、蝦[36-37]、貝類[38]明顯不同,特別是與親緣關(guān)系較近的蛭類、寡毛類相比也表現(xiàn)出較大差異。寬體金線蛭[39]、天錫杜拉蚓 (Drawidagisti)[40]基因組中三堿基重復(fù)占絕對(duì)優(yōu)勢(shì),主要基序類型分別是AAT、ATA 和ATT、AAT。王斌等[41]對(duì)4 種蛭類的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,同樣發(fā)現(xiàn)三堿基重復(fù)微衛(wèi)星占優(yōu)勢(shì),在寬體金線蛭中甚至高達(dá)68.00%。作為最特殊的微衛(wèi)星重復(fù)類型,三堿基重復(fù)微衛(wèi)星可形成復(fù)雜的環(huán)-折疊構(gòu)型來(lái)穩(wěn)定DNA 結(jié)構(gòu),從而更有利于轉(zhuǎn)錄過(guò)程中的解旋和蛋白質(zhì)識(shí)別[33]。此外,疣吻沙蠶轉(zhuǎn)錄組中二堿基AT/TA 重復(fù)基序頻率 (32.19%) 最高,單堿基A/T 重復(fù)類型(21.17%)其次,之后是三堿基AGC/GCT (29.06%) 基序 (未發(fā)表數(shù)據(jù)),表明微衛(wèi)星類型特征在轉(zhuǎn)錄組和基因組水平上存在差異,類似的差異性在圓鰭魚 (Cyclopteruslumpus)[42]、凡納濱對(duì)蝦[36,43]、寬體金線蛭[39,41]中也被證實(shí)。不同物種表現(xiàn)出不同的微衛(wèi)星優(yōu)勢(shì)類型分布規(guī)律,可能與其進(jìn)化水平有關(guān)。
疣吻沙蠶基因組微衛(wèi)星核心區(qū)集中在4~18 拷貝,隨著重復(fù)次數(shù)的增加,微衛(wèi)星數(shù)量呈顯著降低趨勢(shì),這可能與重復(fù)單元長(zhǎng)度的不斷增加使得微衛(wèi)星穩(wěn)定性降低或基序高頻次重復(fù)導(dǎo)致更高的突變率有關(guān)[44]。進(jìn)一步分析發(fā)現(xiàn),二堿基至六堿基微衛(wèi)星重復(fù)單元中A/T 含量顯著高于G/C 含量,即微衛(wèi)星序列表現(xiàn)出明顯的A/T 堿基優(yōu)勢(shì),這與許多水生動(dòng)物如脊尾白蝦[31]、凡納濱對(duì)蝦[36]、蝦夷扇貝 (Mizuhopectenyessoensis)[38]、寬體金線蛭[39]及舊金山灣鹵蟲 (Artemiafranciscana)[45]中的研究結(jié)果一致。早期觀點(diǎn)認(rèn)為,微衛(wèi)星富含A/T 的原因可能是由于CpG 甲基化后的C 易脫氨基轉(zhuǎn)變?yōu)門,導(dǎo)致G/C 比例不斷縮小,而突變的A/T 堿基類型相應(yīng)增多[33];后來(lái)卻發(fā)現(xiàn)這也可能與微衛(wèi)星位點(diǎn)的產(chǎn)生方式,即與DNA 的復(fù)制滑動(dòng)存在一定關(guān)系[29,46]。微衛(wèi)星富含A/T 的原因可能是A/T 含量高則Tm值降低,其序列容易發(fā)生DNA 解鏈,并通過(guò)復(fù)制滑動(dòng)機(jī)制和重組機(jī)制產(chǎn)生高A/T 含量的重復(fù)類型的概率更高[38]。
微衛(wèi)星是重要的分子遺傳學(xué)研究工具,開發(fā)多態(tài)標(biāo)記是其廣泛應(yīng)用的關(guān)鍵。與傳統(tǒng)方法相比,基于高通量測(cè)序技術(shù)開發(fā)微衛(wèi)星標(biāo)記更具優(yōu)勢(shì),產(chǎn)生的基因組或轉(zhuǎn)錄組數(shù)據(jù)是標(biāo)記開發(fā)的重要資源。然而與轉(zhuǎn)錄組微衛(wèi)星相比,基因組微衛(wèi)星的多態(tài)性往往更高且分布更廣泛,可獲得更優(yōu)的基因組覆蓋率[42]。Temnykh 等[16]認(rèn)為長(zhǎng)度≥20 bp 的微衛(wèi)星位點(diǎn)多態(tài)性較高,長(zhǎng)度10~20 bp 的為中等多態(tài)性,小于10 bp 的多態(tài)性低。在疣吻沙蠶基因組中共篩選到43 240 條序列長(zhǎng)度≥20 bp 的I 型微衛(wèi)星位點(diǎn),占比超過(guò)33%,遠(yuǎn)高于其轉(zhuǎn)錄組序列中20%的I 型位點(diǎn)比例 (未發(fā)表數(shù)據(jù))。挑選50 個(gè)微衛(wèi)星位點(diǎn)進(jìn)行有效性及多態(tài)性驗(yàn)證,有41 個(gè) (82%)位點(diǎn)的引物可擴(kuò)增出特異性條帶,其中15 個(gè) (30%)表現(xiàn)出穩(wěn)定且可重復(fù)的多態(tài)性。疣吻沙蠶基因組多態(tài)微衛(wèi)星標(biāo)記的篩選成功率與卵形鯧鲹[9]、凡納濱對(duì)蝦[36]、寬體金線蛭[39]中的結(jié)果相當(dāng)。由此可見,疣吻沙蠶微衛(wèi)星標(biāo)記篩選成功率較高,獲得的微衛(wèi)星位點(diǎn)具有良好的開發(fā)潛力,是豐富且可靠的標(biāo)記資源。
用微衛(wèi)星標(biāo)記開展群體遺傳分析時(shí),一般認(rèn)為有效等位基因數(shù)越接近觀測(cè)等位基因數(shù),群體等位基因分布就越均勻;然而在實(shí)際分析中,通常會(huì)將全部條帶視為有效等位基因,無(wú)效等位基因過(guò)剩便會(huì)造成等位基因分布不均[47]。從疣吻沙蠶基因組篩選的15 個(gè)多態(tài)微衛(wèi)星位點(diǎn)中,僅3 個(gè)位點(diǎn)(ThGM021、ThGM035、ThGM041) 的等位基因數(shù)接近有效等位基因數(shù),提示大部分位的等位基因分布不均,這可能是因?yàn)轵?yàn)證群體的樣本容量偏小引起了主效等位基因的缺失[9]。有研究表明,群體的最小樣本容量一般與遺傳分析選用的參數(shù)有關(guān)。利用He、PIC 以及香農(nóng)指數(shù)等評(píng)估遺傳多樣性時(shí),群體樣本容量達(dá)到27 便能使分析結(jié)果接近總體水平的95%;但選擇Na時(shí),樣本容量則需達(dá)到52 以上[48]。疣吻沙蠶的群體樣本量為30,故而選擇He、PIC 可更好地評(píng)價(jià)微衛(wèi)星位點(diǎn)的多態(tài)性。15個(gè)位點(diǎn)的平均Ho(0.487)、平均He(0.561)和平均PIC (0.511)共同表明,疣吻沙蠶驗(yàn)證群體具有較豐富的遺傳多樣性,這與Chen 等[5]利用COI 標(biāo)記的分析結(jié)果并不完全一致,可能是因?yàn)槲⑿l(wèi)星屬于核標(biāo)記,多態(tài)性更高且受選擇性作用更小,其揭示遺傳變異的靈敏度高于線粒體標(biāo)記。通常認(rèn)為,PIC 越接近1,則群體雜合個(gè)體的比例越大、多態(tài)性越高:PIC<0.25 為低度多態(tài)性,0.25≤PIC<0.5 為中度多態(tài)性,PIC≥0.5 為高度多態(tài)性[47]。在15 個(gè)多態(tài)微衛(wèi)星位點(diǎn)中,僅2 個(gè)為低度多態(tài)性,其余13 個(gè) (86.7%) 均為高度或中度多態(tài)性。因此,基于疣吻沙蠶基因組序列篩選的微衛(wèi)星標(biāo)記多態(tài)性高且遺傳信息豐富,可為群體遺傳分析、種質(zhì)資源評(píng)價(jià)、分子育種研究提供優(yōu)質(zhì)工具。
疣吻沙蠶基因組屬于高雜合、高重復(fù)的復(fù)雜基因組,其微衛(wèi)星位點(diǎn)的類型豐富且具備較好的多態(tài)性潛能,可作為有效資源用于微衛(wèi)星標(biāo)記的大規(guī)模開發(fā),對(duì)種質(zhì)資源評(píng)價(jià)與保護(hù)利用、種群遺傳學(xué)以及分子育種研究具有實(shí)際價(jià)值。