盧婷, 王晨, 杜超, 劉姝, 沈詠梅, 張修月, 岳碧松*
(1. 四川大學(xué)生命科學(xué)學(xué)院,四川省瀕危野生動(dòng)物保護(hù)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,成都610064;2.四川省藥用動(dòng)物工程技術(shù)研究中心,成都610081)
?
林麝全基因組微衛(wèi)星分布規(guī)律研究
盧婷1#, 王晨1#, 杜超1, 劉姝2, 沈詠梅2, 張修月1, 岳碧松1*
(1. 四川大學(xué)生命科學(xué)學(xué)院,四川省瀕危野生動(dòng)物保護(hù)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,成都610064;2.四川省藥用動(dòng)物工程技術(shù)研究中心,成都610081)
林麝Moschusberezovskii是中國(guó)重要的資源動(dòng)物,也是國(guó)家Ⅰ級(jí)重點(diǎn)保護(hù)野生動(dòng)物。本研究使用生物信息學(xué)方法,分析林麝全基因組中完美型微衛(wèi)星的分布特征。在林麝2.53 Gb的基因組序列中,共搜索到665 524個(gè)完美型微衛(wèi)星,總長(zhǎng)度為11 517 784 bp,占基因組序列總長(zhǎng)度的0.42%,總豐度為244個(gè)/Mb。林麝基因組中,單堿基微衛(wèi)星序列數(shù)量最多,為221 058個(gè),約占總微衛(wèi)星數(shù)的33.22%,豐度為81.05個(gè)/Mb,然后依次為二堿基、五堿基、三堿基、四堿基、六堿基重復(fù)類(lèi)型微衛(wèi)星。林麝基因組中數(shù)目最多的10種微衛(wèi)星類(lèi)別依次為:A、AACTG、AGC、AC、AT、AG、AAAT、AAC、AAT和AAAC,占所有基因組微衛(wèi)星的93.2%,表現(xiàn)出明顯的A、T偏好。林麝基因組微衛(wèi)星序列分布研究表明,其在外顯子(2 530個(gè))上的分布數(shù)量遠(yuǎn)低于內(nèi)含子(200 906個(gè))和基因間隔區(qū)(454 596個(gè)),與前人關(guān)于微衛(wèi)星在非編碼區(qū)的分布多于編碼區(qū)的結(jié)論一致。本研究為深入研究林麝基因組特征及篩選更多優(yōu)良微衛(wèi)星標(biāo)記提供了基礎(chǔ)數(shù)據(jù)。
林麝;全基因組;微衛(wèi)星;分布規(guī)律
微衛(wèi)星序列由核心序列和側(cè)翼序列組成,其核心序列由l~6個(gè)核苷酸基序串聯(lián)重復(fù)構(gòu)成(蔣雪梅等,2015)。微衛(wèi)星廣泛分布于真核生物、原核生物和病毒的基因組中(Tautz,1989;李午佼等,2014),除分布于基因組的非編碼區(qū)(如內(nèi)含子和基因間隔區(qū))外,也存在于編碼區(qū)(Ellegren,2004;Huangetal.,2015)。微衛(wèi)星核心序列的重復(fù)數(shù)具有高可變性,使其在不同個(gè)體中有差異,并且同一位點(diǎn)在不同個(gè)體中存在多個(gè)等位基因(李玉芝,2012),因而微衛(wèi)星具有高度多態(tài)性。但微衛(wèi)星的側(cè)翼序列相對(duì)保守,可以根據(jù)它的保守性設(shè)計(jì)引物,再通過(guò)PCR方法對(duì)基因組DNA進(jìn)行擴(kuò)增得到微衛(wèi)星標(biāo)記。微衛(wèi)星不僅在基因組中分布廣泛、多態(tài)性高,而且還具有雜合子比率高、選擇中性、共顯性遺傳、分析方法簡(jiǎn)單、實(shí)驗(yàn)結(jié)果穩(wěn)定等優(yōu)點(diǎn),被廣泛用于遺傳圖譜構(gòu)建(Massaultetal.,2010)、親緣關(guān)系鑒定(Serbezovetal.,2010)、種群遺傳多樣性分析(戚文華等,2014)等研究。
林麝Moschusberezovskii隸屬于偶蹄目Cetartiodactyla麝科Moschidae麝屬M(fèi)oschus。成體雄麝香腺囊分泌的麝香具有較高的經(jīng)濟(jì)價(jià)值和藥用價(jià)值(Mengetal.,2006),野外亂捕濫獵猖獗,加之其棲息地破壞,野生林麝已經(jīng)瀕臨滅絕(王淯等,2006;Huangetal.,2013)。我國(guó)20世紀(jì)50年代開(kāi)始人工飼養(yǎng)研究,取得了可喜成果,但存在管理粗放、近交退化、疾病多、繁殖力低等問(wèn)題,阻礙了人工養(yǎng)麝業(yè)的正常發(fā)展(王淯等,2006;Sheng & Liu,2007;許珂等,2013)。本研究在完成林麝全基因組測(cè)序的基礎(chǔ)上,對(duì)微衛(wèi)星序列特征和分布規(guī)律進(jìn)行統(tǒng)計(jì)分析,對(duì)進(jìn)一步篩選高質(zhì)量的林麝微衛(wèi)星分子標(biāo)記和林麝分子遺傳學(xué)研究具有重要意義。
1.1數(shù)據(jù)來(lái)源
林麝基因組大小為2.53 Gb,文件為FASTA格式,由北京諾禾致源生物信息科技有限公司測(cè)序,本實(shí)驗(yàn)室組裝和注釋。
1.2微衛(wèi)星搜索
使用本實(shí)驗(yàn)室開(kāi)發(fā)的微衛(wèi)星搜索統(tǒng)計(jì)軟件MSDBv2.4(Duetal.,2013),從林麝基因組中掃描搜索微衛(wèi)星序列。設(shè)置的統(tǒng)計(jì)標(biāo)準(zhǔn)如下:(1)重復(fù)次數(shù),單堿基微衛(wèi)星重復(fù)次數(shù)為12次及以上,二堿基和三堿基微衛(wèi)星重復(fù)次數(shù)分別為7次和5次及以上,四、五、六堿基微衛(wèi)星重復(fù)次數(shù)為4次及以上;(2)重復(fù)序列的側(cè)翼序列長(zhǎng)度大于200 bp。
1.3微衛(wèi)星定位
根據(jù)林麝基因組的注釋信息,使用本實(shí)驗(yàn)室編寫(xiě)的Python腳本對(duì)搜索到的微衛(wèi)星序列進(jìn)行定位,判斷微衛(wèi)星在基因組的具體位置。
2.1不同重復(fù)類(lèi)型的微衛(wèi)星的總體分布特征
在林麝2.53 Gb的基因組序列中搜索到完美型微衛(wèi)星序列總數(shù)為665 524個(gè);重復(fù)序列總長(zhǎng)度為11 517 784 bp,占基因組序列總長(zhǎng)度的0.42%;總豐度為244個(gè)/Mb。
不同重復(fù)類(lèi)型微衛(wèi)星的數(shù)量分布特征如表1所示:林麝基因組中,單堿基微衛(wèi)星序列數(shù)量最多,為221 058個(gè),約占微衛(wèi)星總數(shù)的33.22%,豐度為81.05個(gè)/Mb;其次是二堿基微衛(wèi)星,為144 258個(gè),約占微衛(wèi)星總數(shù)的21.68%,豐度為52.89個(gè)/Mb;六堿基微衛(wèi)星數(shù)目最少,為567個(gè),只占微衛(wèi)星總數(shù)的0.09%,豐度為0.21個(gè)/Mb。
表1 微衛(wèi)星各重復(fù)類(lèi)型的數(shù)目、總長(zhǎng)度、比例和豐度Table 1 The number, percent and abundance of microsatellites in different types of repeats
注: 重復(fù)類(lèi)型中的Mono-, Di-, Tri-, Tetra-, Pentra-和Hexa-的后綴都是nucleotide。
Notes: The suffix of Mono-, Di-, Tri-, Tetra-, Pentra-and Hexa- is nucleotide.
2.2各重復(fù)類(lèi)型微衛(wèi)星核心序列重復(fù)次數(shù)分布
林麝基因組中,不同類(lèi)型微衛(wèi)星重復(fù)次數(shù)范圍有較大的差異。單堿基微衛(wèi)星的重復(fù)次數(shù)主要分布在12~16次,數(shù)量占單堿基微衛(wèi)星總數(shù)的88.90%,重復(fù)12次的數(shù)目高達(dá)65 000個(gè),最高重復(fù)次數(shù)為733次;二堿基微衛(wèi)星序列重復(fù)拷貝數(shù)主要分布在7~10次,數(shù)量占二堿基微衛(wèi)星總數(shù)的77.69%,重復(fù)7次的二堿基微衛(wèi)星最多,有51 305個(gè),最高重復(fù)次數(shù)達(dá)1 560次;三堿基微衛(wèi)星重復(fù)拷貝數(shù)主要分布在5~7次,占95.56%,重復(fù)5次的數(shù)量超過(guò)了三堿基微衛(wèi)星總數(shù)一半,為67 308個(gè),最高重復(fù)次數(shù)為175次;四堿基微衛(wèi)星中,4次重復(fù)拷貝的微衛(wèi)星數(shù)目最多,為3 224個(gè),占所有四堿基微衛(wèi)星總數(shù)的82.65%,最高重復(fù)次數(shù)為437次;五堿基微衛(wèi)星數(shù)目最多的也是4次重復(fù)拷貝,達(dá)100 000個(gè),占所有五堿基微衛(wèi)星數(shù)量的73.22%,最高重復(fù)次數(shù)為111次;在總數(shù)只有567個(gè)的六堿基微衛(wèi)星中,其重復(fù)拷貝數(shù)在4~26次,但重復(fù)4次的六堿基微衛(wèi)星超過(guò)了450個(gè),占六堿基微衛(wèi)星總數(shù)的83.07%,最高重復(fù)次數(shù)為26次。6種重復(fù)類(lèi)型微衛(wèi)星的最高重復(fù)次數(shù)所對(duì)應(yīng)的微衛(wèi)星數(shù)量都為1個(gè),且重復(fù)次數(shù)與微衛(wèi)星數(shù)量表現(xiàn)出隨著重復(fù)次數(shù)的增加,微衛(wèi)星數(shù)量逐漸減少的趨勢(shì)。
2.3含量豐富的微衛(wèi)星類(lèi)別
林麝基因組微衛(wèi)星序列中,除了不同重復(fù)類(lèi)型的微衛(wèi)星數(shù)量差異明顯外,同種微衛(wèi)星類(lèi)型不同類(lèi)別的數(shù)量也有很大差別(表2)。在單堿基和五堿基微衛(wèi)星中,A和AACTG重復(fù)序列數(shù)量占絕對(duì)優(yōu)勢(shì),分別占同類(lèi)微衛(wèi)星數(shù)量的98.67%和95.46%;其余4種微衛(wèi)星類(lèi)型中最多的重復(fù)拷貝類(lèi)別分別為:AC、AGC、AAAT和AACCCT。除六堿基微衛(wèi)星外,單堿基至五堿基微衛(wèi)星都表現(xiàn)出一種重復(fù)拷貝類(lèi)別數(shù)量占明顯優(yōu)勢(shì)的結(jié)果,如三堿基微衛(wèi)星中,AGC重復(fù)類(lèi)別數(shù)量為97 662個(gè),占三堿基微衛(wèi)星總數(shù)(120 319)的81.17%,遠(yuǎn)超過(guò)剩下所有重復(fù)類(lèi)別的總和。所有微衛(wèi)星重復(fù)類(lèi)別中,數(shù)目最多的10種依次為:A(32.77%),AACTG(20.13%),AGC(14.67%),AC(14.00%),AT(5.92%),AG(1.70%),AAAT(1.66%),AAC(0.81%),AAT(0.80%)和AAAC (0.72%),有明顯的A、T偏好。這10種重復(fù)拷貝類(lèi)別的數(shù)量都大于4 500個(gè),占所有基因組微衛(wèi)星總數(shù)的93.2%。
表2 二堿基至六堿基微衛(wèi)星數(shù)目最多的重復(fù)拷貝類(lèi)別Table 2 The most frequent microsatellite motifs in 2-6 repeats
2.4微衛(wèi)星在基因組上的分布特征
林麝基因組微衛(wèi)星在基因組上的定位結(jié)果表明,共有203 375個(gè)微衛(wèi)星分布在基因上,在基因間區(qū)的有454 596個(gè)。對(duì)分布在基因上的微衛(wèi)星進(jìn)一步定位分析,結(jié)果如表3,有2 530個(gè)微衛(wèi)星在外顯子上,占基因上微衛(wèi)星總數(shù)的0.38%,包括1~6堿基微衛(wèi)星個(gè)數(shù)分別為:27、19、2 363、22、16和83個(gè)。外顯子上三堿基微衛(wèi)星數(shù)量最多,共由10種三堿基微衛(wèi)星重復(fù)拷貝類(lèi)別組成:CCG(702),AGC(630),AGG(398),ACC(396),ATC(107),AAG(66),AAC(33),ACG(26),AAT(3)和ACT(2)。除ATC與ACT對(duì)應(yīng)的是終止密碼子外,其余8種都是氨基酸密碼子,它們所對(duì)應(yīng)的氨基酸分別是:CCG-Gly,AGC-Ser,AGG-Ser,ACC-Trp,AAG-Phe,AAC-Leu,ACG-Cys和AAT-Leu。內(nèi)含子上有200 906個(gè)微衛(wèi)星,占基因上微衛(wèi)星總數(shù)的30.53%,其數(shù)量遠(yuǎn)多于外顯子微衛(wèi)星的數(shù)量。內(nèi)含子中最多的微衛(wèi)星重復(fù)類(lèi)型是單堿基微衛(wèi)星,共有72 718個(gè),占33.19%,其次是二堿基微衛(wèi)星和三堿基微衛(wèi)星。
本研究以實(shí)驗(yàn)室組裝的林麝基因組序列為基礎(chǔ),利用生物信息學(xué)方法對(duì)林麝基因組中完美型微衛(wèi)星序列進(jìn)行搜索統(tǒng)計(jì)。微衛(wèi)星序列含量分析表明,林麝的微衛(wèi)星序列占基因組比例(0.42%)與哺乳綱Mammalia物種如牛Bostaurus(0.48%)、綿羊Ovisaries(0.48%)(戚文華等,2013)、牦牛Bosgrunniens(0.47 %)(Ma,2015)等物種基本一致,而低于大熊貓Ailuropodamelanoleuca(0.64%)、北極熊Ursusmaritimus(0.79%)(李午佼等,2014)、人類(lèi)Homosapiens(3%)(Subramanianetal.,2003)和小鼠Musmusculus(2.85%)(童曉玲等,2006)。此結(jié)果與王月月等(2015)的研究一致,他們認(rèn)為,親緣關(guān)系越近,物種基因組微衛(wèi)星特征越相似。
表3 微衛(wèi)星在基因內(nèi)外的數(shù)量分布Table 3 Number, percentage, and relative abundanceof microsatellites in different regions
研究表明,不同物種基因組微衛(wèi)星的數(shù)量、重復(fù)類(lèi)型、密度等都存在很大差別(Websteretal.,2002;汪自立等,2013)。林麝基因組微衛(wèi)星中單堿基微衛(wèi)星數(shù)量占優(yōu)勢(shì)(33.22%),這與牛、綿羊(戚文華等,2013)、牦牛(Ma,2015)等物種基因組中優(yōu)勢(shì)微衛(wèi)星類(lèi)型相同。在嚙齒類(lèi)和節(jié)肢動(dòng)物基因組中,二堿基微衛(wèi)星數(shù)量占優(yōu)勢(shì),而酵母Saccharomycescerevisiae和絲狀真菌Neurosporacrassa(黃杰等,2012)等基因組中,三堿基微衛(wèi)星占主導(dǎo)地位。
在林麝基因組微衛(wèi)星中,6種堿基重復(fù)類(lèi)型都表現(xiàn)出同種重復(fù)類(lèi)型的微衛(wèi)星隨著微衛(wèi)星核心序列重復(fù)次數(shù)的增加,其對(duì)應(yīng)的微衛(wèi)星數(shù)量逐步減少的趨勢(shì),如單堿基微衛(wèi)星主要集中在重復(fù)12~16次,而最高重復(fù)數(shù)733次的單堿基微衛(wèi)星只有1個(gè),從而使單堿基微衛(wèi)星序列的長(zhǎng)度主要集中在12~16 bp。這個(gè)規(guī)律與Ellegren(2000)的研究相符,他們認(rèn)為在基因座上,長(zhǎng)等位基因傾向于變短,從而阻止微衛(wèi)星長(zhǎng)度的無(wú)限增長(zhǎng),因此微衛(wèi)星序列的長(zhǎng)度一般會(huì)維持在一定范圍內(nèi)。這可能與微衛(wèi)星的穩(wěn)定性有關(guān),隨著微衛(wèi)星長(zhǎng)度的增加,其穩(wěn)定性會(huì)下降(Wierdletal.,1997),而長(zhǎng)微衛(wèi)星數(shù)量不多可能是由于它們有下調(diào)的突變偏好且存在時(shí)間短(Harr & Schl?tterer,2000)。
微衛(wèi)星在林麝基因組中的分布也有差異,其在外顯子(2 530個(gè))上的分布數(shù)量遠(yuǎn)低于非編碼區(qū),如內(nèi)含子(200 906個(gè))和基因間隔區(qū)(454 596個(gè)),此結(jié)果支持前人關(guān)于微衛(wèi)星在非編碼區(qū)的分布多于編碼區(qū)的結(jié)論(Ellegren,2004)。外顯子所有微衛(wèi)星序列中,三堿基微衛(wèi)星數(shù)量最為豐富,占外顯子微衛(wèi)星總數(shù)的93.40%,這可能是編碼區(qū)中非三堿基微衛(wèi)星類(lèi)型的突變會(huì)導(dǎo)致移碼突變,而生物的選擇作用將會(huì)減少這些非三堿基微衛(wèi)星的固定,從而減少其含量(Metzgaretal.,2000;Doyleetal.,2013)。
微衛(wèi)星作為遺傳標(biāo)記的應(yīng)用實(shí)踐表明,相對(duì)于二堿基、三堿基微衛(wèi)星,四堿基微衛(wèi)星位點(diǎn)在PCR過(guò)程中,不易出現(xiàn)滑帶(stutter bands)或陰影帶(shadow bands),相對(duì)能產(chǎn)生更穩(wěn)定、更精確的基因分型結(jié)果(Archieetal.,2003;Lietal.,2010)。然而,目前已公布的微衛(wèi)星標(biāo)記全部為二堿基微衛(wèi)星(Zouetal.,2005;Xiaetal.,2006;Zhangetal.,2007;Zhaoetal.,2008)。根據(jù)林麝基因組四堿基微衛(wèi)星序列分析結(jié)果,共搜索到四堿基微衛(wèi)星38 989個(gè),但絕大多集中在低重復(fù)次數(shù)(重復(fù)4次),重復(fù)5次以上的很少,林麝四堿基微衛(wèi)星數(shù)量有限,這是到目前為止分離篩選得到的高質(zhì)量四堿基微衛(wèi)星分子標(biāo)記較少的重要原因。
黃杰, 杜聯(lián)明, 李玉芝, 等. 2012. 紅原雞全基因組中微衛(wèi)星分布規(guī)律研究[J]. 四川動(dòng)物, 31(3): 358-363.
蔣雪梅, 胡廷章, 向興勝, 等. 2015. 楊樹(shù)全基因組微衛(wèi)星序列的統(tǒng)計(jì)及其生物信息學(xué)分析[J]. 西南農(nóng)業(yè)學(xué)報(bào), 28(2): 527-533.
李午佼, 李玉芝, 杜聯(lián)明, 等. 2014. 大熊貓和北極熊基因組微衛(wèi)星分布特征比較分析[J]. 四川動(dòng)物, 33(6): 874-878.
李玉芝. 2012. 大熊貓基因組微衛(wèi)星序列分析和遺傳標(biāo)記篩選[D]. 成都: 四川大學(xué).
戚文華, 蔣雪梅, 肖國(guó)生, 等. 2013. 牛和綿羊全基因組微衛(wèi)星序列的搜索及其生物信息學(xué)分析[J]. 畜牧獸醫(yī)學(xué)報(bào), 44(11): 1724-1733.
戚文華, 蔣雪梅, 肖國(guó)生, 等. 2014. 豬全基因組中微衛(wèi)星分布規(guī)律[J]. 畜牧與獸醫(yī), 46(8): 9-13.
童曉玲, 代方銀, 李斌, 等. 2006. 小鼠基因組中的微衛(wèi)星重復(fù)序列的數(shù)量、分布和密度[J]. Current Zoology, 52(1): 138-152.
汪自立, 黃杰, 杜聯(lián)明, 等. 2013. 二斑葉螨和肩突硬蜱基因組微衛(wèi)星分布規(guī)律研究[J]. 四川動(dòng)物, 32(4): 481-486.
王月月, 劉雪雪, 董坤哲, 等. 2015. 7種家養(yǎng)動(dòng)物全基因組微衛(wèi)星分布的差異研究[J]. 中國(guó)畜牧獸醫(yī), 42(9): 2418-2426.
王淯, 姜海瑞, 薛文杰, 等. 2006. 林麝(Moschusberezovskii)研究概況和進(jìn)展[J]. 四川動(dòng)物, 25(1): 195-200.
許珂, 卜書(shū)海, 梁宗鎖, 等. 2013. 林麝研究進(jìn)展[J]. 黑龍江畜牧獸醫(yī), (7): 147-150.
Archie EA, Moss CJ, Alberts SC. 2003. Characterization of tetranucleotide microsatellite loci in the African Savannah elephant (Loxodontaafricanaafricana)[J]. Molecular Ecology Notes, 3(2): 244-246.
Doyle JM, Siegmund G, Ruhl JD,etal. 2013. Microsatellite analyses across three diverse vertebrate transcriptomes (Acipenserfulvescens,Ambystomatigrinum, andDipodomysspectabilis)[J]. Genome, 56: 407-414.
Du LM, Li YZ, Zhang XY,etal. 2013. MSDB: a user-friendly program for reporting distribution and building databases of microsatellites from genome sequences[J]. Journal of Heredity, 104(1): 154-157.
Ellegren H. 2000. Heterogeneous mutation processes in human microsatellite DNA sequences[J]. Nature Genetics, 24(4): 400-402.
Ellegren H. 2004. Microsatellites: simple sequences with complex evolution[J]. Nature Reviews Genetics, 5(6): 435-445.
Harr B, Schl?tterer C. 2000. Long microsatellite alleles inDrosophilamelanogasterhave a downward mutation bias and short persistence times, which cause their genome-wide underrepresentation[J]. Genetics, 155(3): 1213-1220.
Huang J, Li YZ, Li P,etal. 2013. Genetic quality of the Miyaluo captive forest musk deer (Moschusberezovskii) population as assessed by microsatellite loci[J]. Biochemical Systematics & Ecology, 47(8): 25-30.
Huang J, Li YZ, Du LM,etal. 2015. Genome-wide survey and analysis of microsatellites in giant panda (Ailuropodamelanoleuca), with a focus on the applications of a novel microsatellite marker system[J]. BMC Genomics, 16(1): 1-12.
Li YZ, Xu X, Shen FJ,etal. 2010. Development of new tetranucleotide microsatellite loci and assessment of genetic variation of giant panda in two largest giant panda captive breeding populations[J]. Journal of Zoology, 282(1): 39-46.
Ma Z. 2015. Genome-wide characterization of perfect microsatellites in yak (Bosgrunniens)[J]. Genetica, 143(4): 1-6.
Massault C, Hellemans B, Louro B,etal. 2010. QTL for body weight, morphometric traits and stress response in European sea bassDicentrarchuslabrax[J]. Animal Genetics, 41(4): 337-345.
Meng X, Zhou C, Hu J,etal. 2006. Musk deer farming in China[J]. Animal Science An International Journal of Fundamental & Applied Research, 82(1): 1-6.
Metzgar D, Bytof J, Wills C. 2000. Selection against frameshift mutations limits microsatellite expansion in coding DNA[J]. Genome Research, 10(1): 72-80.
Serbezov D, Bernatchez L, Olsen EM,etal. 2010. Mating patterns and determinants of individual reproductive success in brown trout (Salmotrutta) revealed by parentage analysis of an entire stream living population[J]. Molecular Ecology, 19(15): 3193-3205.
Sheng HL, Liu ZX. 2007. The musk deer in China[M]. Shanghai: The Shanghai Scientific & Technical Publishers.
Subramanian S, Mishra RK, Singh L. 2003. Genome-wide analysis of microsatellite repeats in humans: their abundance and density in specific genomic regions[J]. Genome Biology, 4(2): 1-10.
Tautz D. 1989. Hyper variability of simple sequences as a general source for polymorphic DNA markers[J]. Nucleic Acids Research, 17(16): 6463-6471.
Webster MT, Smith NGC, Ellegren H. 2002. Microsatellite evolution inferred from human-chimpanzee genomic sequence alignments[J]. Proceedings of the National Academy of Sciences of the United States of America, 99(13): 8748-8753.
Wierdl M, Dominska M, Petes TD. 1997. Microsatellite instability in Yeast: dependence on the length of the microsatellite[J]. Genetics, 146(3): 769-779.
Xia S, Zou FD, Yue BS. 2006. Six microsatellite loci in forest musk deer,Moschusberezovskii[J]. Molecular Ecology Notes, 6(1): 113-115.
Zou F, Yue B, Liu X,etal. 2005. Isolation and characterization of microsatellite loci from forest musk deer (Moschusberezovskii)[J]. Zoological Research, 22(5): 593-598.
Zhang SC, Yue BS, Zou FD. 2007. Isolation and characterization of microsatellite DNA markers from forest musk deer (Moschusberezovskii)[J]. Zoological Research, 690(24): 6227-6232.
Zhao SS, Xuan C, Fang SG,etal. 2008. Development and characterization of 15 novel microsatellite markers from forest musk deer (Moschusberezovskii)[J]. Conservation Genetics, 9(3): 723-725.
DistributionRegularityofMicrosatellitesinMoschusberezovskiiGenome
LU Ting1#, WANG Chen1#, DU Chao1, LIU Shu2, SHEN Yongmei2, ZHANG Xiuyue1, YUE Bisong1*
(1. Sichuan Key Laboratory of Conservation Biology on Endangered Wildlife, College of Life Sciences, Sichuan University,Chengdu 610064, China; 2. Sichuan Medicinal Animal Engineering Technology Research Center, Chengdu 610081, China)
Forest musk deer (Moschusberezovskii) is a critically endangered species. Perfect microsatellite number and distribution regularity of microsatellites in forest musk deer genome were analyzed by microsatellite search tool. A repertoire of 665 524 perfect SSRs with 1-6 bp nucleotide motifs accounting for 0.42% of forest musk deer genome (2.53 Gb) were scanned, and the abundance of microsatellites was 244 no./Mb. Mono-nucleotide was the most abundant category with the highest relative abundance (81.05 no./Mb), accounting for 33.22% of all the SSRs, followed by di-nucleotide (21.68%), pentra-nucleotide (21.09%), tri-nucleotide (18.08%), tetra-nucleotide (5.86%), and hexa-nucleotide (0.09%). The most abundant microsatellite repeats in forest musk deer genome were A, AACTG, AGC, AC, AT, AG, AAAT, AAC, AAT, and AAAC, totally accounting 93.2% of the scanned microsatellites and showed an apparent A and T preference. The number of microsatellites located on the coding sequences (n=2 530) was less than that on the non-coding sequence such as introns (n=200 906) and intergenic regions (n=454 596), and this was consistent with previous studies. This study provides adequate material for the future study of forest musk deer.
Moschusberezovskii; genome; microsatellite; distribution regularities
2017-02-17接受日期:2017-04-26
四川省科技支撐計(jì)劃(2014NZ0107)
盧婷(1991—), 女, 碩士研究生, 從事動(dòng)物分子生物學(xué)研究, E-mail:619016141@qq.com#同等貢獻(xiàn)第一作者
*通信作者Corresponding author, E-mail:bsyue@scu.edu.cn
10.11984/j.issn.1000-7083.20170044
Q959.8
: A
: 1000-7083(2017)04-0420-05