涂飛云,劉曉華,杜聯(lián)明,嚴(yán)超超,黃曉鳳*
(1.江西省林業(yè)科學(xué)院,江西 南昌 330013;2.四川大學(xué) 生命科學(xué)學(xué)院/四川省瀕危野生動(dòng)物保護(hù)生物學(xué)重點(diǎn)實(shí)驗(yàn)室,四川 成都 610064)
微衛(wèi)星又稱簡(jiǎn)單序列重復(fù)(simple sequence repeats,SSRs),是指1~6 bp的核苷酸為基本重復(fù)單位的串聯(lián)重復(fù)序列,其長(zhǎng)度大多在100 bp以內(nèi)[1],廣泛存在于真核生物和一些原核生物的基因組中[2]。微衛(wèi)星因突變速率快、多態(tài)性高等特性,廣泛應(yīng)用于動(dòng)物個(gè)體識(shí)別[3-5]、群體遺傳研究[6-7]、基因定位[8]、系統(tǒng)發(fā)育[9]及遺傳疾病研究[10]。
隨著基因測(cè)序技術(shù)發(fā)展,更多物種的全基因組被測(cè)定和公布,有關(guān)動(dòng)物基因組微衛(wèi)星報(bào)道也越來越多。到目前為止,有關(guān)哺乳動(dòng)物全基因的序列公布有43種(http://asia.ensembl.org/info/data/ftp/index.html),但哺乳動(dòng)物全基因微衛(wèi)星分布規(guī)律研究報(bào)道文獻(xiàn)僅見4篇[11-14]。大鼠是繼人類、小鼠之后第三個(gè)被測(cè)定全基因組的哺乳動(dòng)物,是極好的模式生物,作為實(shí)驗(yàn)材料廣泛地應(yīng)用于醫(yī)學(xué)、藥學(xué)研究中。Tóth等[15]利用嚙齒類81個(gè)物種的基因序列(其中大鼠基因序列貢獻(xiàn)率是18.25%)進(jìn)行微衛(wèi)星序列分析。迄今為止,大鼠全基因組微衛(wèi)星分布狀況未見報(bào)道。本研究通過生物信息學(xué)方法搜索大鼠全基因組微衛(wèi)星,并對(duì)微衛(wèi)星數(shù)量、分布、頻率進(jìn)行分析,為進(jìn)一步開發(fā)大鼠微衛(wèi)星的標(biāo)記提供數(shù)據(jù)支持。
大鼠全基因組序列是從NCBI數(shù)據(jù)庫(kù)下載的版本名為Rnor_6.0(2014年8月發(fā)布)的基因組序列(ftp://ftp.ncbi.nlm.nih.gov/genomes/Rattus_norvegicus)。該基因組包括 20 個(gè)常染色體、2 個(gè)性染色體(X,Y)和未定位到染色體上的序列(其中已經(jīng)定位到染色體上的序列占全基因組的99%),基因組總長(zhǎng)度約2.8 Gb,所有序列都以FASTA格式保存。
1.2.1 微衛(wèi)星序列統(tǒng)計(jì)術(shù)語(yǔ)的定義 微衛(wèi)星序列統(tǒng)計(jì)術(shù)語(yǔ)的定義參照戚文華等[12-13]的研究。
1.2.2 微衛(wèi)星搜索及統(tǒng)計(jì)分析 MSDB是用Perl語(yǔ)言編開發(fā)的界面友好的分析軟件,能快速識(shí)別和搜索全基因組微衛(wèi)星。與其他微衛(wèi)星搜索軟件如TRF、SSRTT、MSATCOMMANDER等軟件相比,MSDB具有運(yùn)算速度快,操作簡(jiǎn)便,易于分析等特點(diǎn)[16]。本研究利用微衛(wèi)星搜索軟件MSDBv2.4.3[16]對(duì)不同染色體基因序列進(jìn)行微衛(wèi)星搜索及統(tǒng)計(jì)。本研究的搜索標(biāo)準(zhǔn)采用軟件默認(rèn)設(shè)置,模式設(shè)置為Perfect Search,最小重復(fù)(Minimum repeats)設(shè)置為單堿基12次重復(fù)以上、二堿基7次重復(fù)以上、三堿基5次以上、四堿基、五堿基和六堿基4次以上[16]。利用SPSS軟件對(duì)大鼠染色體序列長(zhǎng)度與微衛(wèi)星數(shù)量分析。參照堿基互補(bǔ)配對(duì)原則和統(tǒng)計(jì)拷貝數(shù)起始?jí)A基順序的排列差異,利用Perl語(yǔ)言腳本將同類重復(fù)兼并為一種重復(fù)拷貝類型代表,如三堿基AAC,可以與之兼并的有ACA、CAA、TTG、TGT和GTT。
大鼠基因組全長(zhǎng)2 860 318 831 bp,微衛(wèi)星總數(shù)1 483 525個(gè),其總長(zhǎng)度是40 198 048 bp,占全基因組的1.41%(表1)。大鼠各染色體中,1號(hào)染色體的微衛(wèi)星數(shù)量最多,有144 384個(gè),占微衛(wèi)星總數(shù)的9.7%,出現(xiàn)的頻率是511個(gè)/Mb,其長(zhǎng)度合計(jì)3 941 664 bp,其次是2號(hào)、4號(hào)、3號(hào)染色體,分別占微衛(wèi)星總數(shù)的8.5%、6.3%、6.2%(表1),20號(hào)染色體分布的微衛(wèi)星數(shù)量最低,僅占總數(shù)的2.3%。從各染色體微衛(wèi)星分布頻率看,12號(hào)染色體最高,其次是10號(hào),最低X性染色體。通過線性回歸分析表明,大鼠染色體DNA序列越長(zhǎng),所含微衛(wèi)星數(shù)量越多(r=0.978,P<0.000 1)。大鼠性染色體微衛(wèi)星數(shù)量存在顯著差異,X染色體微衛(wèi)星數(shù)量有62 578,占總數(shù)的4.2%,而Y染色體微衛(wèi)星數(shù)量?jī)H有35 067,僅占2.4%(表1)。
從表1看,整個(gè)大鼠全基因組中不同重復(fù)類型微衛(wèi)星占全基因組微衛(wèi)星比例表現(xiàn)為二堿基(46.9%)>單堿基(22.6%)>四堿基(17.4%)>三堿基(8.4%)>五堿基(2.4%)>六堿基(2.0%)。
不同重復(fù)類型微衛(wèi)星在染色體分布數(shù)量上,6種重復(fù)類型(單堿基、二堿基、三堿基、四堿基、五堿基、六堿基)微衛(wèi)星總數(shù)在1號(hào)染色體分布最多,其次是2號(hào)染色體。不同重復(fù)類型微衛(wèi)星分布數(shù)量最少的染色體并不一致(表1)。
從不同重復(fù)類型微衛(wèi)星重復(fù)拷貝類別數(shù)量比例看,單堿基以A微衛(wèi)星數(shù)量占優(yōu)勢(shì),分別占單堿基微衛(wèi)星總數(shù)的46.6%。二堿基微衛(wèi)星類型搜索到4種,有AC、AG、AT、CG,整個(gè)大鼠全基因組序列以AC類型最多,占二堿基微衛(wèi)星總數(shù)的64.6%,其次是AG,占24.9%,CG最少,僅占0.6%。共兼并及統(tǒng)計(jì)三堿基微衛(wèi)星重復(fù)類型 10 種,包括 AAC、AAG、AAT、ACC、ACG、ACT、AGC、AGG、AGT、CCG,其中AGG類型數(shù)量最多,占三堿基微衛(wèi)星總數(shù)的 21.2%,依次是 AAC、AAT,占20.8%、13.5%;CCG 類型最少,其次是AGC,分別占0.9%和3.4%。四堿基微衛(wèi)星類型以AAAC類型最多,占四堿基微衛(wèi)星總數(shù)的14.9%,其次是AGAT和AAAG,占11.9%和11.1%。五堿基微衛(wèi)星以AAACA占優(yōu)勢(shì),占39.8%。六堿基以ACAGAG占優(yōu)勢(shì),占18.9%。
表1 大鼠不同染色體上不同類型微衛(wèi)星數(shù)量的分布情況Tab.1 Distribution of SSRs in each chromosome of rat
本研究首次利用生物信息學(xué)方法搜索、統(tǒng)計(jì)、分析大鼠全基因組微衛(wèi)星數(shù)量、分布及頻率。大鼠全基因組共搜索到微衛(wèi)星總數(shù)1 483 525,其序列長(zhǎng)度占全基因組的1.41%。本研究表明微衛(wèi)星數(shù)量與其所在染色體DNA序列長(zhǎng)度具有相關(guān)性(r=0.978,P<0.000 1),反映了SSRs在染色體上的分布具有隨機(jī)性,與先前其他研究結(jié)果一致[13、17],進(jìn)一步支持Hancock[18]提出的微衛(wèi)星數(shù)量與染色體大小相關(guān)的假說。
不同物種基因組優(yōu)勢(shì)類型微衛(wèi)星有所不同。秀麗隱桿線蟲Caenorhabditis elegans[18]、肩突硬蜱Ixodes scapularis[19]、紅原雞 Gallus gallus[17]、四川山鷓鴣 Arborophila rufipectus[20]、牛 Bos taurus[12]、綿羊Ovis aries[12]、豬 Sus scrofa[13]等全基因組均以單堿基占優(yōu)勢(shì);二斑葉螨 Tetranychus urticae[19]全基因組以三堿基占優(yōu)勢(shì);蚊子Anopheles gambiae[21]以六堿基占優(yōu)勢(shì)。本研究大鼠基因組微衛(wèi)星以二堿基微衛(wèi)星占絕對(duì)優(yōu)勢(shì),與果蠅 Drosophila melanogaster[22]、家蠶 Bombyx mori[23]、蜜蜂 Apis mellifera[24]、河豚 Fugu rubripes[25]、全基因組及中國(guó)對(duì)蝦 Fenneropenaeus chinensis[26]、嚙齒類[19]部分基因組中二堿基微衛(wèi)星占主導(dǎo)結(jié)果一致。
本研究中大鼠全基因組單堿基微衛(wèi)星以A占優(yōu)勢(shì),與人類、紅原雞、豬等物種研究結(jié)果一致[15],其余不同重復(fù)類型微衛(wèi)星在不同類群中具有差異。大鼠二堿基微衛(wèi)星以AC最為豐富,與人類、果蠅、蚊子、豬、牛和綿羊的結(jié)果一致,不同于中國(guó)對(duì)蝦、蜜蜂、紅原雞二堿基以AT最豐富。三堿基、四堿基、五堿基、六堿基分別以 AGG、AAAC、AAACA、ACAGAG占優(yōu)勢(shì),而其他物種如豬、牛、羊并非以此四種(AGG、AAAC、AAACA、ACAGAG)類型微衛(wèi)星占優(yōu)勢(shì),可能是不同物種優(yōu)勢(shì)類型微衛(wèi)星有所不同。
致謝:特別感謝四川大學(xué)生命科學(xué)學(xué)院李午佼博士對(duì)研究的幫助。
[1]Li Y C,Korol A B,F(xiàn)ahima T,et al.Microsatellites:genomic distribution,putative functions and mutational mechanisms:a review[J].Molecular Ecology,2002,11(12):2453-2465.
[2]Tautz D.Hypervariability of simple sequences as a general source for polymorphic DNA markers[J].Nucleic Acids Research,1989,17(16):6463-6471.
[3]Amavet P,Rosso E,Markarian R,et al.Microsatellite DNA markers applied to detection of multiple paternity in Caiman latirostris in Santa Fe,Argentina[J].Journal of Experimental Zoology,2008,309A:637-642.
[4]王靜,劉丑生,張利平,等.微衛(wèi)星在種公牛個(gè)體識(shí)別與親緣鑒定方面的應(yīng)用[J].遺傳,2009,31(3):285-289.
[5]管昊,林清賢,周曉平,等.白鷺脫落羽毛的微衛(wèi)星個(gè)體識(shí)別研究[J].廈門大學(xué)學(xué)報(bào):自然科學(xué)版,2013,52(5):710-717.
[6]Hu Y B,Guo Y,Qi D W,et al.Genetic structuring and recent demographic history of red pandas(Ailurus fulgens)inferred from microsatellite and mitochondrial DNA[J].Molecular Ecology,2011,20:2662-2675.
[7]Wu S J,Luo J,Li Q Q,et al.Ecological genetics of Chinese rhesus macaque in response to mountain building:all things are not equal[J].Plos One,2013,8(2):55315.
[8]徐寧迎,Thomsen H,Reinsch N,等.利用微衛(wèi)星進(jìn)行奶牛數(shù)量形狀基因定位的研究[J].遺傳學(xué)報(bào),2000,27(9):772-776.
[9]Estoup A,Lionel G.Microsatellite variation in honey bee(Apis mellifera L.)populations:hierarchical genetic structure and test of the infinite allege and stepwise mutation models[J].Genetics,1995,140(2):679-695.
[10]陳翠敏,府偉靈,張曉莉.應(yīng)用微衛(wèi)星多態(tài)位點(diǎn)對(duì)X連鎖型視網(wǎng)膜色素變性疾病進(jìn)行遺傳連鎖分析的研究[J].重慶醫(yī)學(xué),2006,35(6):501-502.
[11]童曉玲,代方銀,李斌,等.小鼠基因組中的微衛(wèi)星重復(fù)序列的數(shù)量、分布和密度[J].動(dòng)物學(xué)報(bào),2006,52(1):138-152.
[12]戚文華,蔣雪梅,肖國(guó)生,等.牛和綿羊全基因組微衛(wèi)星序列的搜索及其生物信息學(xué)分析[J].畜牧獸醫(yī)學(xué)報(bào),2013,44(11):1724-1733.
[13]戚文華,蔣雪梅,肖國(guó)生,等.豬全基因組中微衛(wèi)星分布規(guī)律[J].畜牧與獸醫(yī),2014,46(8):9-12.
[14]李午佼,李玉芝,杜聯(lián)明,等.大熊貓和北極熊基因組微衛(wèi)星分布特征比較分析[J].四川動(dòng)物,2014,33(6):874-878.
[15]Tóth G,Gáspári Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome Research,2000,10:967-981.
[16]Du L M,Li Y Z,Zhang X Y,et al.MSDB:a user-friendly program for reporting distribution and building databases of microsatellites from genome sequences[J].Journal of Heredity,2013,104(1):154-157.
[17]黃杰,杜聯(lián)明,李玉芝,等.紅原雞全基因組中微衛(wèi)星分布規(guī)律研究[J].四川動(dòng)物,2012,31(3):358-363.
[18]Hancock J M.Simple sequences and the expanding genome[J].Bioessays,1996,18(5):421-425.
[19]汪自立,黃杰,杜聯(lián)明,等.二斑葉螨和肩突硬蜱基因組微衛(wèi)星分布規(guī)律研究[J].四川動(dòng)物,2013,32(4):481-486.
[20]黃杰,周瑜,劉與之,等.基于454 GS FLX高通量測(cè)序的四川山鷓鴣基因組微衛(wèi)星特征分析[J].四川動(dòng)物,2015,34(1):8-14.
[21]余泉友,李斌,李關(guān)榮,等.蚊子全基因組中微衛(wèi)星的豐度及其分布[J].生物化學(xué)與生物物理進(jìn)展,2005,32(5):435-441.
[22]Schug M D,Wetterstrand K A,Gaudette M S,et al.The distribution and frequency of microsatellite loci in Drosophila melanogaster[J].Molecular Ecology,1998,7(1):57-70.
[23]Li B,Xia Q Y,Lu C,et al.Analysis on frequency and density of microsatellites in coding sequences of several eukaryotic genomes[J].Genomics,Proteomics and Bioinformatics,2004,2(1):24-31.
[24]魏朝明,孔光耀,廉振民,等.蜜蜂全基因組中微衛(wèi)星的豐度及其分布[J].昆蟲知識(shí),2007,44(4):501-504.
[25]崔建洲,申雪艷,楊官品,等.紅鰭東方鲀基因組微衛(wèi)星特征分析[J].中國(guó)海洋大學(xué)學(xué)報(bào),2006,36(2):249-254.
[26]高煥,劉萍,孟憲紅,等.中國(guó)對(duì)蝦(Fenneropenaeus chinensis)基因組微衛(wèi)星特征分析[J].海洋與湖沼,2004,35(5):424-431.