田 鎮(zhèn),陳愛(ài)華,吳楊平,陳素華,張 雨,曹 奕,張志東,李秋潔
(1.上海海洋大學(xué)水產(chǎn)科學(xué)國(guó)家級(jí)實(shí)驗(yàn)教學(xué)示范中心,上海201306;2.江蘇省海洋水產(chǎn)研究所,南通 226007)
文蛤(Meretrix meretrix)隸屬簾蛤目(Veneroida),簾蛤科(Veneridae),是一種廣溫、廣鹽性灘涂埋棲型經(jīng)濟(jì)貝類(lèi),為我國(guó)主要養(yǎng)殖貝類(lèi)和出口水產(chǎn)品之一[1]。近年來(lái),有關(guān)文蛤生物學(xué)特性以及基因資源挖掘等多方面研究越來(lái)越多,極大地促進(jìn)了文蛤養(yǎng)殖業(yè)持續(xù)健康發(fā)展[2]。目前,關(guān)于文蛤生理脅迫[3-5]、呼吸代謝[6]、過(guò)氧化氫酶分析[7]、遺傳多樣性[8-9]等方面的研究已有眾多報(bào)道,但在轉(zhuǎn)錄組水平SSR微衛(wèi)星特征生物信息學(xué)分析方面的研究鮮有報(bào)道。
微衛(wèi)星(microsatellites),也稱(chēng)簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR),為1~6個(gè)核苷酸組成的短串聯(lián)重復(fù)序列[10],具有高穩(wěn)定性、特異性和共顯性等優(yōu)點(diǎn),多應(yīng)用于水產(chǎn)生物遺傳多樣性分析和分子標(biāo)記育種等領(lǐng)域[11]。隨著高通量測(cè)序技術(shù)發(fā)展,通過(guò)轉(zhuǎn)錄組、基因組等測(cè)序平臺(tái)大量快速測(cè)定DNA分子序列技術(shù),利用生物信息學(xué)分析開(kāi)發(fā)出數(shù)量龐大的SSR標(biāo)記,已在多種水產(chǎn)動(dòng)物中得到廣泛應(yīng)用[12]。
本研究采用第二代高通量測(cè)序技術(shù)對(duì)文蛤進(jìn)行轉(zhuǎn)錄測(cè)序(RNA-sequencing,RNA-Seq),通過(guò)對(duì)文蛤轉(zhuǎn)錄組中不同類(lèi)型微衛(wèi)星的統(tǒng)計(jì)與分析,了解其微衛(wèi)星分布頻率和數(shù)量,從轉(zhuǎn)錄組水平闡明文蛤SSR組成特征,對(duì)進(jìn)一步利用微衛(wèi)星標(biāo)記技術(shù)開(kāi)展遺傳標(biāo)記輔助育種和種群遺傳學(xué)研究具有重要的參考價(jià)值。
實(shí)驗(yàn)用文蛤于2017年3月取自江蘇省文蛤良種場(chǎng)(南通),隨機(jī)挑選外形完整、無(wú)損傷的廣西和江蘇原種個(gè)體各30粒。取其鰓、肝胰腺組織樣品浸沒(méi)在RNAlater溶液(天根,中國(guó))中,并于-80℃儲(chǔ)存。
提取文蛤鰓、肝胰臟組織樣本的總RNA,送生工生物工程(上海)股份有限公司采用PacBio SMRT測(cè)序技術(shù)和Illumina RNA-Seq技術(shù)進(jìn)行轉(zhuǎn)錄組測(cè)序,通過(guò)整合PacBio SMRT和Illumina測(cè)序數(shù)據(jù),生成高質(zhì)量的文蛤轉(zhuǎn)錄組數(shù)據(jù),以此作為分析數(shù)據(jù)。
用Krait10.2軟件[13]對(duì)文蛤轉(zhuǎn)錄組中的SSR位點(diǎn)進(jìn)行搜索和統(tǒng)計(jì)。搜索參數(shù)為:?jiǎn)魏塑账?、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸,最少重?fù)次數(shù)分別為12、7、5、4、4、4。SSR分布的平均距離=總Unigene長(zhǎng)度/搜索到的SSR數(shù)量,出現(xiàn)頻率=搜索到的SSR數(shù)量/總Unigene數(shù)量[14]。用Perl語(yǔ)言操作系統(tǒng)下MISA軟件進(jìn)行檢驗(yàn)。
文蛤的轉(zhuǎn)錄組中共檢索到98 598條編碼序列(coding sequence,CDS),總長(zhǎng)110 964 842 bp,GC含量約為36.17%。通過(guò)對(duì)文蛤進(jìn)行SSR位點(diǎn)搜索,共發(fā)現(xiàn)完整的SSR位點(diǎn)8 856個(gè),SSR總長(zhǎng)度為162 416 bp,平均長(zhǎng)度18.34 bp,約占總序列長(zhǎng)度的0.15%。SSR詳細(xì)信息見(jiàn)表1。
文蛤SSR位點(diǎn)堿基重復(fù)數(shù)量統(tǒng)計(jì)見(jiàn)表2。單堿基重復(fù)序列在文蛤轉(zhuǎn)錄組中所占比例最高(33.89%),其次為三、四堿基重復(fù)序列占比(分別為25.45%、24.84%),二、五堿基重復(fù)序列占比再次之(分別為11.88%、3.79%),六堿基重復(fù)序列占比最低(0.15%)。每種重復(fù)堿基類(lèi)型的分布密度情況為:四堿基>三堿基>單堿基>二堿基>五堿基>六堿基;SSR發(fā)生頻率大小依次為:?jiǎn)螇A基>三堿基>四堿基>二堿基>五堿基>六堿基。
表1 文蛤轉(zhuǎn)錄組中SSR位點(diǎn)搜索結(jié)果Tab.1 Search results of SSR in RNA-sequencing of Meretrix meretrix
表2 文蛤微衛(wèi)星SSR位點(diǎn)類(lèi)型Tab.2 SSR types of Meretrix meretrix
本次檢索的8 856個(gè)SSR位點(diǎn)中共包含26種重復(fù)堿基元(表3)。單、二、三、四、五、六堿基重復(fù)分別有2、4、5、5、5、5種。在單堿基重復(fù)中,A/T重復(fù)基元所占比例最大(31.72%);二堿基重復(fù)基元(AT/TA)、三堿基重復(fù)基元(AAC/TTG)和四堿基重復(fù)基元(AAAC/TTTG)占比相近(分別為6.33%、10.24%、6.64%);五堿基重復(fù)基元(AAAAC/TTTTG)和六堿基重復(fù)基元(AATACC/TTATGG和AATCCC/TTAGGG)占比最少(分別為0.25%、0.02%、0.02%)。這表明在文蛤轉(zhuǎn)錄組中微衛(wèi)星位點(diǎn)的分布對(duì)A/T具有偏好性。
SSR重復(fù)類(lèi)型的重復(fù)數(shù)存在較大差異(圖1)。SSR位點(diǎn)數(shù)量隨著重復(fù)次數(shù)的增加而呈明顯減少的趨勢(shì),四堿基、五堿基、六堿基重復(fù)隨著重復(fù)次數(shù)超過(guò)4、4、5次時(shí)數(shù)量呈平滑曲線(xiàn)減少;單堿基重復(fù)、二堿基重復(fù)和三堿基重復(fù)隨著重復(fù)次數(shù)增加到11、6、4次后,SSR位點(diǎn)數(shù)量開(kāi)始呈線(xiàn)性升高,重復(fù)次數(shù)超過(guò)5、7、12次,平緩下降,直至為0。二堿基重復(fù)、三堿基重復(fù)、四堿基重復(fù)、五堿基重復(fù)和六堿基重復(fù)的重復(fù)次數(shù)大多分布在4~11,僅單堿基重復(fù)的重復(fù)次數(shù)為11~19。
文蛤轉(zhuǎn)錄組中所發(fā)現(xiàn)的8 856個(gè)完整型微衛(wèi)星位點(diǎn)中,微衛(wèi)星的長(zhǎng)度差異不大,片段長(zhǎng)度范圍為10~35 bp,平均長(zhǎng)度18.34 bp(圖2)。其單堿基、三堿基、四堿基重復(fù)片段長(zhǎng)度分別為12 bp、15 bp、16 bp時(shí)SSR位點(diǎn)數(shù)量最高(分別為1 219條、1 193條、1 225條)約占完整微衛(wèi)星總數(shù)的41%。除單堿基重復(fù)隨著重復(fù)片段長(zhǎng)度的增加,位點(diǎn)數(shù)量呈平滑曲線(xiàn)下降。其他堿基重復(fù)分布特點(diǎn)呈“波浪形”分布并逐漸下降。
表3 文蛤轉(zhuǎn)錄組SSR中優(yōu)勢(shì)重復(fù)堿基組成和頻率統(tǒng)計(jì)Tab.3 Composition and frequency of dom inant repeatmotifs in the RNA-sequencing of Meretrix meretrix(in consideration of sequence com plementarity)
圖1 文蛤轉(zhuǎn)錄組中每種類(lèi)型SSR數(shù)量隨重復(fù)次數(shù)分布Fig.1 Variation of repeat times w ith the number ofm icrosatellites in the RNA-sequencing of Meretrix meretrix
圖2 文蛤轉(zhuǎn)錄組中微衛(wèi)星的長(zhǎng)度分布Fig.2 Length distribution ofm icrosatellites in the RNA-sequencing of Meretrix meretrix
本研究共獲得8 856個(gè)完整性SSR位點(diǎn),SSR的發(fā)生頻率為8.98%,平均分布長(zhǎng)度為18.34 bp。文蛤SSR發(fā)生頻率與櫛江珧(Atrina pectinata)(8.2%)[15]、墨西哥灣扇貝(Argopecteni rradiansconcentricus)(10%)[16]、縊蟶(Sinonovaculaconstricta)(8.89%)[17]相似,但比泥蚶(Tegillarcagranosa)(14.83%)[18]、馬氏珠母貝(Pinctadamartensii)(13.34%)[19]略低,說(shuō)明文蛤SSR位點(diǎn)分布豐度處于較低的水平。這也可能與數(shù)據(jù)庫(kù)的大小、SSR位點(diǎn)的搜索標(biāo)準(zhǔn)以及物種間的分布特征有關(guān)[20]。
基于轉(zhuǎn)錄組水平搜索的文蛤微衛(wèi)星重復(fù)類(lèi)型中,單堿基重復(fù)類(lèi)型的占比最高為33.89%,其次為三堿基、四堿基重復(fù)類(lèi)型(分別占25.49%、24.84%),這與通過(guò)EST-SSR方法開(kāi)發(fā)出的文蛤[21]、馬 氏 珠 母 貝[19]、菲 律 賓 蛤 仔(Ruditapes philippinarum)[22]、羅 氏 沼 蝦(Macrobrachium rosenbergii)[23]、斑鱧(Channamaculata)[24]和扁玉螺(Neveritadidyma)[25]SSR位點(diǎn)中呈現(xiàn)出單堿基重復(fù)數(shù)量最多,二堿基重復(fù)、三堿基重復(fù)和四堿基重復(fù)數(shù)量依次遞減的趨勢(shì)相似;但與櫛孔扇貝(Chlamysfarreri)[26]、三 角 帆 蚌(Hyriopsis cumingii)[27]、黑鯛(Acanthopagrusschlegelii)和真鯛(Pagrusmajor)[28]SSR三堿基重復(fù)類(lèi)型數(shù)量最多有所不同。不同物種間的堿基重復(fù)類(lèi)型不同,研究認(rèn)為高等水生動(dòng)物以低重復(fù)基元居多,而低等水生動(dòng)物以高重復(fù)基元居多,但文蛤作為低等貝類(lèi)動(dòng)物以單堿基重復(fù)和三、四堿基重復(fù)類(lèi)型的比例高,可能暗示該科貝類(lèi)具有更高的進(jìn)化水平、更長(zhǎng)的進(jìn)化時(shí)間或更高的突變頻率[14]。目前大部分的SSR標(biāo)記采用的是二堿基重復(fù)SSR,擴(kuò)增出的產(chǎn)物常會(huì)出現(xiàn)影子帶,對(duì)于結(jié)果分析存在一定的干擾性。而四堿基重復(fù)SSR相比二堿基重復(fù)SSR標(biāo)記不但多態(tài)性更高,而且遺傳穩(wěn)定性更好[29-30]。根據(jù)文蛤SSR特征,可以嘗試開(kāi)發(fā)三堿基、四堿基重復(fù)的SSR標(biāo)記,為今后開(kāi)展文蛤等貝類(lèi)種群遺傳多樣性分析等研究提供新的思路。
通過(guò)單堿基、三堿基和四堿基3種重復(fù)類(lèi)型中各重復(fù)單元比較發(fā)現(xiàn),在各重復(fù)長(zhǎng)度中,A/T較G/C含量高出很多,這與很多水產(chǎn)生物基因組SSR具有的特點(diǎn)相一致,如金烏賊(Sepia esculenta)[31]、中 國(guó) 明 對(duì) 蝦(Fenneropenaeus chinensis)[32]、三 疣 梭 子 蟹(Portunustri tuberculatus)[33]SSR。水生生物中微衛(wèi)星富含A/T的原因可能是由于DNA復(fù)制滑動(dòng)機(jī)制和重組機(jī)制,導(dǎo)致A/T重復(fù)類(lèi)型的機(jī)率更高[34]。也有研究認(rèn)為,由于基因組DNA中的CpG的甲基化使之突變,甲基化的胞苷酸C易通過(guò)脫氨基作用變?yōu)樾叵汆奏,而少量的GC又是維持DNA熱力學(xué)穩(wěn)定性所必需的,故突變的A/T類(lèi)型相應(yīng)增加[35]。
SSR分子標(biāo)記多態(tài)性的高低決定其潛在利用價(jià)值,其多態(tài)性取決于其SSR片段長(zhǎng)度大?。?6]:當(dāng)長(zhǎng)度小于12 bp時(shí),呈低多態(tài)性;片段長(zhǎng)度為12~20 bp時(shí),呈中度多態(tài)性;長(zhǎng)度大于20 bp時(shí),呈高多態(tài)性[37]。從SSR片段長(zhǎng)度來(lái)看,本次基于轉(zhuǎn)錄組開(kāi)發(fā)的文蛤微衛(wèi)星中71.22%的長(zhǎng)度處于12~20 bp之間,屬于中度多樣性。這對(duì)后續(xù)微衛(wèi)星分子標(biāo)記開(kāi)發(fā)有一定的利用價(jià)值。
本研究利用生物信息學(xué)軟件分析比較了文蛤轉(zhuǎn)錄組中微衛(wèi)星序列的分布特征,結(jié)果顯示:文蛤具有以單堿基為主、三四堿基重復(fù)次之的微衛(wèi)星序列;文蛤轉(zhuǎn)錄組SSR共包含26種重復(fù)基元,其中優(yōu)勢(shì)基元為單堿基重復(fù)A/T有2 809個(gè),其次為三堿基重復(fù)AAC/TTG有907個(gè),四堿基和二堿基重復(fù)中的AAAC/TTTG、AT/TA分別有588、561個(gè),說(shuō)明文蛤轉(zhuǎn)錄組微衛(wèi)星位點(diǎn)的分布對(duì)A/T具有偏好性。本研究結(jié)果將為研究文蛤SSR標(biāo)記開(kāi)發(fā)、群體遺傳多樣性、遺傳連鎖圖譜、種質(zhì)資源鑒定和分子遺傳育種等后續(xù)研究提供基礎(chǔ)數(shù)據(jù)。