石汝杰,張?jiān)拢Y雪梅,戚文華*
(1.重慶三峽學(xué)院 生物與食品工程學(xué)院,重慶 404120;2.重慶三峽學(xué)院 環(huán)境與化學(xué)工程學(xué)院,重慶 404120)
鐵皮石斛(Dendrobiumofficinale)為蘭科(Orchidaceae)石斛屬(Dendrobium)最為珍稀名貴的種,藥用部位為新鮮或干燥莖,具有益胃生津、滋陰清熱、潤(rùn)肺止咳、明目強(qiáng)身等功效。20世紀(jì)90年代之前主要利用野生資源,導(dǎo)致資源枯竭而列為國(guó)家保護(hù)中藥材[1]。進(jìn)入21世紀(jì),鐵皮石斛引種栽培技術(shù)及快繁體系日趨成熟,產(chǎn)業(yè)化的關(guān)鍵科學(xué)技術(shù)問(wèn)題得以解決,使鐵皮石斛產(chǎn)業(yè)從無(wú)到有,并形成百億級(jí)產(chǎn)業(yè)[2]。鐵皮石斛種質(zhì)資源的研究工作主要還是局限于野生資源的普查以及引種栽培,缺乏從育種學(xué)角度進(jìn)行品種改良的工作。對(duì)鐵皮石斛種質(zhì)資源研究有利于野生資源的保護(hù),也可為育種工作奠定基礎(chǔ),分子輔助標(biāo)記育種是現(xiàn)代分子育種學(xué)的一種主要手段,而相對(duì)于其他分子標(biāo)記而言,微衛(wèi)星標(biāo)記多態(tài)性高、重復(fù)性好,而且操作簡(jiǎn)單,已廣泛用于動(dòng)植物群體遺傳多樣性研究[3-7]。微衛(wèi)星DNA,又被稱(chēng)簡(jiǎn)單重復(fù)序列(simple sequence repeats),是均勻分布于真核生物基因組中的簡(jiǎn)單重復(fù)序列,由2~6個(gè)核苷酸的串聯(lián)重復(fù)片段構(gòu)成[4]。鐵皮石斛全基因組測(cè)序研究結(jié)果表明:鐵皮石斛為二倍體,有38條染色體,基因組大小為1.11 Gb,28 910個(gè)蛋白編碼基因[8]。目前,有關(guān)鐵皮石斛全基因組SSRs分布規(guī)律及其所蘊(yùn)含的生物學(xué)信息未有相關(guān)報(bào)道,因此,本研究利用現(xiàn)代生物學(xué)方法搜索和統(tǒng)計(jì)鐵皮石斛全基因組SSRs序列,揭示其全基因組或染色體上SSRs序列分布規(guī)律,并比較分析其生物信息學(xué)特征,以期為開(kāi)發(fā)鐵皮石斛和蘭科石斛屬植物通用SSR標(biāo)記、遺傳多樣性和SSR引物篩選等提供一定的理論依據(jù)。
鐵皮石斛全基因組序列均下載于https://www.ncbi.nlm.nih.gov/網(wǎng)站,鐵皮石斛屬于蘭科植物,其基因組總大小為932.30 Mb。按SSR分布的類(lèi)型分為完全型微衛(wèi)星、不完全型微衛(wèi)星和復(fù)合型微衛(wèi)星3種類(lèi)型進(jìn)行分析[9]。采用微衛(wèi)星序列搜索和統(tǒng)計(jì)軟件MSDB(v2.4)(Microsatellite Search and Building Database)對(duì)鐵皮石斛全基因組中完整型微衛(wèi)星序列及其特征進(jìn)行生物信息學(xué)分析。搜索和統(tǒng)計(jì)標(biāo)準(zhǔn)為單核苷酸重復(fù)至少12次,二核苷酸重復(fù)至少7次,三核苷酸重復(fù)至少5次,四至六核苷酸重復(fù)至少4次;重復(fù)序列兩端的側(cè)翼序列為200 bp;其他統(tǒng)計(jì)標(biāo)準(zhǔn)參考相關(guān)報(bào)道及SSRs序列統(tǒng)計(jì)術(shù)語(yǔ)參考相關(guān)報(bào)道的定義[10]。
鐵皮石斛基因組中,微衛(wèi)星序列總數(shù)量為215 661個(gè)位點(diǎn),微衛(wèi)星序列長(zhǎng)度為4.07 Mb,占全基因組總長(zhǎng)度的比率為0.44%。其總豐度為231.84個(gè)·Mb-1,總密度為4 031.927 bp·Mb-1。鐵皮石斛基因組微衛(wèi)星各重復(fù)類(lèi)型的數(shù)量、頻率順序依次為:?jiǎn)螇A基>二堿基>三堿基>五堿基>四堿基>六堿基,密度和豐度依次為:二堿基>單堿基>三堿基>四堿基>五堿基>六堿基,在鐵皮石斛全基因組所有重復(fù)類(lèi)型,以單堿基重復(fù)類(lèi)型數(shù)量最多,占微衛(wèi)星序列總數(shù)量比例約為47.49%,頻率為101.55個(gè)·Mb-1;其次是二堿基和三堿基重復(fù)類(lèi)型,占微衛(wèi)星序列總數(shù)量比例分別為34.34%和13.36%,頻率分別為73.44和28.58個(gè)·Mb-1;數(shù)量最少的是六堿基,占微衛(wèi)星序列總數(shù)量比例為0.37%,頻率為0.78個(gè)·Mb-1(表1)。
表1 鐵皮石斛基因組微衛(wèi)星各重復(fù)類(lèi)型的數(shù)量、頻率和密度
在單堿基重復(fù)拷貝類(lèi)別中,A重復(fù)拷貝類(lèi)別的數(shù)量約為C拷貝類(lèi)別數(shù)量的7倍,其頻率和密度也存在明顯差異。在二核苷酸重復(fù)拷貝類(lèi)別中,AG和AT重復(fù)拷貝類(lèi)別的數(shù)量占多數(shù),其出現(xiàn)頻率分別為38.03和27.94個(gè)·Mb-1,CG和AC兩種拷貝類(lèi)型出現(xiàn)頻率僅分別為0.06和7.42個(gè)·Mb-1(表2)。
在三堿基重復(fù)類(lèi)型中,AAT和AAC兩種類(lèi)型拷貝數(shù)量最多,豐度也最高;其次為AAG、AGG、ACC、AGT、ACT、CCG、ACG類(lèi)型拷貝;AGC數(shù)量最低,豐度最低。可將三堿基重復(fù)拷貝類(lèi)別AAC、AAT、AAG歸類(lèi)為AAX(X代表除A以外的任何堿基),ACG、ACT、ACC歸類(lèi)為ACX(X代表除A以外的任何堿基),AGC、AGT、AGG歸類(lèi)為AGX(X代表除A以外的任何堿基),AAX的出現(xiàn)頻率為25.94個(gè)·Mb-1,ACX的出現(xiàn)頻率為2.33個(gè)·Mb-1,AGX的出現(xiàn)頻率為2.36個(gè)·Mb-1。由此可知,鐵皮石斛基因組三堿基重復(fù)拷貝類(lèi)別AAX和AGX數(shù)量最多,ACX次之,CCG最少(表2)。
表2 鐵皮石斛全基因組單核苷酸至三核苷酸SSRs序列各重復(fù)拷貝類(lèi)別的數(shù)量、頻率和密度
鐵皮石斛基因組四堿基重復(fù)拷貝類(lèi)別有30多種類(lèi)型,在此只列舉數(shù)量較多和密度較高的16種重復(fù)拷貝類(lèi)別。在四堿基重復(fù)類(lèi)型中,數(shù)量較多和密度較高均為AAAT、AATT,其次是AAAG、ACAT、AGGG、AGAT、AAAC、AACT、AATC、ACTC、CCGG、AAGT、AATG,較低的是ACGT、AAGG、AACC等,其中,AAAT數(shù)量最多,有4 419個(gè),頻率為4.74個(gè)·Mb-1,其余類(lèi)型頻率均在1個(gè)·Mb-1以下(表3)。
表3 鐵皮石斛基因組四堿基重復(fù)拷貝類(lèi)別的數(shù)量、頻率和密度
鐵皮石斛五堿基重復(fù)拷貝類(lèi)別有100多種,其中AAATA數(shù)量最多,其次是AAATT和AAAGA,數(shù)量超過(guò)100,其余所有五堿基SSRs重復(fù)拷貝類(lèi)別的數(shù)量少于100個(gè),其中數(shù)量最少的重復(fù)拷貝類(lèi)別AGCCC,僅有47個(gè)。鐵皮石斛全基因組六堿基SSRs重復(fù)拷貝類(lèi)別有300多種,各拷貝類(lèi)別的數(shù)量均較少,其中AATAAA數(shù)量最多,為78個(gè),其余所有六堿基SSRs重復(fù)拷貝類(lèi)別的數(shù)量少于70個(gè)(表4)。
表4 鐵皮石斛基因組五堿基和六堿基重復(fù)拷貝類(lèi)別的數(shù)量、頻率和密度(各列舉10種)
本文利用生物信息學(xué)方法搜索和統(tǒng)計(jì)鐵皮石斛基因組SSRs序列,分析其全基因組SSRs序列的分布、出現(xiàn)頻率和密度等生物信息學(xué)特征。共統(tǒng)計(jì)了215 661個(gè)SSRS序列,其全基因組SSRs序列出現(xiàn)頻率為213.84個(gè)·Mb-1。鐵皮石斛全基因組SSRs各重復(fù)類(lèi)型中,單核苷酸SSRs序列出現(xiàn)頻率最高(101.55個(gè)·Mb-1),其次是二核苷酸SSRs序列(73.44個(gè)·Mb-1),之后依次為三核苷酸SSRs序列(28.58個(gè)·Mb-1)>四核苷酸SSRs序列(7.51個(gè)·Mb-1)>五核苷酸SSRs序列(1.98個(gè)·Mb-1)>六核苷酸SSRs序列(0.78個(gè)·Mb-1)。這與蔣雪梅等[10]對(duì)毛果楊全基因組SSRs的研究結(jié)果相似,毛果楊各重復(fù)類(lèi)型中,單核苷酸SSRs序列出現(xiàn)頻率最高(141.76個(gè)·Mb-1),其次是二核苷酸SSRs序列(97.61個(gè)·Mb-1),之后依次為三核苷酸SSRs序列(57.07個(gè)·Mb-1)>四核苷酸SSRs序列(22.22個(gè)·Mb-1)>五核苷酸SSRs序列(7.79個(gè)·Mb-1)>六核苷酸SSRs序列(4.82個(gè)·Mb-1)。但史潔等[11]對(duì)油茶的基因組SSRs序列研究表明,二核苷酸SSRs序列最豐富(146.20個(gè)·Mb-1)。鄭燕等[12]對(duì)水稻、玉米、高粱的全基因組中微衛(wèi)星序列研究發(fā)現(xiàn),它們優(yōu)勢(shì)重復(fù)類(lèi)型都是三核苷酸SSRs序列,其次是六核苷酸SSRs序列。由此可見(jiàn),不同種屬生物基因組的優(yōu)勢(shì)SSRs序列重復(fù)類(lèi)型不一定相同,甚至分布有較大差異,這可能是由于物種之間全基因組大小不同,核苷酸含量不同,所以造成SSRs序列重復(fù)類(lèi)型頻率差異。
分析鐵皮石斛全基因組微衛(wèi)星分布規(guī)律得出,在單堿基重復(fù)類(lèi)型中,占優(yōu)勢(shì)的是A堿基重復(fù)拷貝類(lèi)別,C堿基重復(fù)拷貝類(lèi)別較少。在二堿基重復(fù)類(lèi)型中,占優(yōu)勢(shì)的是AG重復(fù)拷貝類(lèi)別,AT和AC次之,CG最少。在三堿基重復(fù)類(lèi)型中,占優(yōu)勢(shì)的是AAT和AAC重復(fù)拷貝類(lèi)別,AAG、AGG、ACC次之,ACG和AGC最少。在四堿基重復(fù)類(lèi)型中,AAAT重復(fù)拷貝類(lèi)別最多,AATT和AAAG次之,CCCG和AGGC最少。在五堿基重復(fù)類(lèi)型中,AAATA和AAATT重復(fù)拷貝類(lèi)別最多,AAAGA、AGCTC和AAACA次之。在六堿基重復(fù)類(lèi)型中,AATAAA、AGAGGG和AAGAAA重復(fù)拷貝類(lèi)別最多,ATTATA、AGAAGG、AAACAA和AGAGGA次之。由此推測(cè),重復(fù)拷貝類(lèi)別較豐富的微衛(wèi)星富含A或T,而富含G和C堿基的微衛(wèi)星出現(xiàn)頻率較少,這與鐵皮石斛的近緣種金釵石斛以及對(duì)水稻、玉米、高粱等禾本科植物基因組SSRs序列研究結(jié)果一致[12-13]。
通過(guò)對(duì)鐵皮石斛全基因組中單核苷酸至六核苷酸SSRs序列分析,發(fā)現(xiàn)單核苷酸SSRs序列有2種重復(fù)拷貝類(lèi)別,二核苷酸SSRs序列有4種重復(fù)拷貝類(lèi)別,三核苷酸SSRs序列有10種重復(fù)拷貝類(lèi)別,四核苷酸SSRs序列有30多種重復(fù)拷貝類(lèi)別,五核苷酸SSRs序列有100多種重復(fù)拷貝類(lèi)別,六核苷酸SSRs序列有300多種重復(fù)拷貝類(lèi)別,從單核苷酸到六核苷酸SSRs序列隨著拷貝類(lèi)別種類(lèi)的增加,而SSRs序列的數(shù)量明顯減少,據(jù)研究表明,親緣關(guān)系較近的物種,其基因組中SSRs序列的重復(fù)類(lèi)型和分布特征具有相似性,這反映了SSRs序列與生物進(jìn)化存在關(guān)聯(lián)性[14-20]。
本文利用生物信息學(xué)方法搜索和統(tǒng)計(jì)鐵皮石斛基因組SSRs序列,分析其全基因組SSRs序列的分布、出現(xiàn)頻率和密度等生物信息學(xué)特征。共統(tǒng)計(jì)了215 661個(gè)SSRS序列,其全基因組SSRs序列出現(xiàn)頻率為213.84個(gè)·Mb-1。鐵皮石斛全基因組中單核苷酸SSRs序列數(shù)量最多,其次依次是二核苷酸>三核苷酸>四核苷酸>五核苷酸>六核苷酸重復(fù)類(lèi)型。本研究?jī)?nèi)容可以為鐵皮石斛的品種鑒定、遺傳多樣性評(píng)價(jià)、遺傳圖譜構(gòu)建以及分子標(biāo)記育種提供科學(xué)理論依據(jù)。