王恒波 肖乃衍 朱專為 劉翠翠 Intikhab ALAM 陳平華 盧運(yùn)海
?
基于甘蔗熱帶種(LA-purple)全基因組序列的SSR開發(fā)及特征分析
王恒波 肖乃衍 朱專為 劉翠翠 Intikhab ALAM 陳平華 盧運(yùn)海*
福建農(nóng)林大學(xué)農(nóng)業(yè)部福建甘蔗生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室 / 作物遺傳育種與綜合利用教育部重點(diǎn)實(shí)驗(yàn)室 / 作物科學(xué)學(xué)院, 福建福州 350002
現(xiàn)代甘蔗栽培品種(2= 100~130)是由甘蔗熱帶種(2= 80)與割手密(2= 40~128)種間雜交而來, 形成異源多倍體、非整倍體作物, 使得甘蔗栽培品種中80%~90%的染色體來源于熱帶種。開發(fā)熱帶種基因組SSR分子標(biāo)記, 有助于甘蔗遺傳多樣性分析、分子標(biāo)記輔助選擇、遺傳圖譜的構(gòu)建等。本研究基于熱帶種LA-purple的全基因組測序數(shù)據(jù)的255 398個(gè)預(yù)測基因序列(累計(jì)總長為1 029 222 285 bp), 利用Perl程序與生物信息學(xué)軟件結(jié)合, 發(fā)掘SSR位點(diǎn), 獲得了153 150個(gè)SSR位點(diǎn), 平均每1.67個(gè)基因有1個(gè)SSR位點(diǎn), 其中二、三核苷酸重復(fù)基序分別為39 556個(gè)和50 072個(gè), 占總SSR位點(diǎn)數(shù)的58.5%。在二核苷酸重復(fù)基序中, TA/AT所占比例最高, 占41.4%, CG/GC所占比例最低, 占4.6%; 在三核苷酸堿基重復(fù)基序中, TGT/ACA所占比例最高, 為15.6%。在TA/AT重復(fù)類型中選取100個(gè)基序重復(fù)次數(shù)在60~90之間的SSR位點(diǎn), 進(jìn)行引物設(shè)計(jì)與合成, 在12個(gè)甘蔗屬材料中進(jìn)行PCR擴(kuò)增分析, 從中篩選出52對具有多態(tài)性SSR引物, 其中有27對引物在研究的2個(gè)甘蔗栽培品種間表現(xiàn)為多態(tài)。這些基因組SSR標(biāo)記的開發(fā), 不僅可以用于甘蔗栽培品種DNA指紋圖譜分析, 而且為甘蔗屬不同種的遺傳圖譜構(gòu)建、遺傳多樣性分析和重要性狀的遺傳機(jī)制解析奠定基礎(chǔ), 為甘蔗分子育種研究提供重要支撐。
甘蔗; 基因組; SSR; 標(biāo)記開發(fā); 多態(tài)性
甘蔗為禾本科(Poaceae)甘蔗屬(L.)植物, 是一種多年生、可宿根栽培的C4作物, 具有生物量高、二氧化碳補(bǔ)償點(diǎn)低等優(yōu)點(diǎn), 是世界上最重要的糖料作物之一, 是人類食糖的重要來源[1], 在我國農(nóng)業(yè)經(jīng)濟(jì)中占有重要地位[2]?,F(xiàn)代甘蔗栽培品種絕大多數(shù)都是由熱帶種(L., 2= 80, x = 10)和割手密(L., 2= 40~128, x = 8)種間雜交而來, 且與熱帶種進(jìn)行了多次回交[3], 其染色體數(shù)目在2= 100~130之間, 其中80%~90%的染色體來自于熱帶種, 10%~20%來自于割手密, 而染色體的5%~17%為2個(gè)種間的染色體重組類型[4-5]。由于甘蔗的高度多倍體及非整倍體的復(fù)雜遺傳背景, 使得甘蔗的遺傳、育種及基因組測序等都面臨巨大的困難和挑戰(zhàn)[5-6]。
簡單重復(fù)序列(simple sequence repeats, SSR), 也被稱為微衛(wèi)星(microsatellites)序列, 是指由1~6個(gè)核苷酸組成的不同類型基序多次重復(fù)而形成的相對較短、廣泛分布于真核生物基因組上的DNA序 列[7-8]。它們在基因組上雖然是隨機(jī)分布[9], 但更偏向于低重復(fù)、富含基因的區(qū)域[10]。每一個(gè)SSR序列在DNA復(fù)制時(shí)產(chǎn)生錯(cuò)誤的比率較高, 因而可以在種內(nèi)或種間產(chǎn)生大量的SSR序列長度的變異[11]。作為分子標(biāo)記, SSR具有多態(tài)性高、重復(fù)性好、操作簡便及共顯性等優(yōu)點(diǎn), 因而被廣泛應(yīng)用于各種動(dòng)、植物的品種指紋圖譜鑒定、遺傳圖譜構(gòu)建及目標(biāo)性狀分子標(biāo)記篩選等領(lǐng)域[12]。
SSR標(biāo)記在甘蔗屬植物上也得到了較為廣泛的應(yīng)用[13-30], 已有數(shù)個(gè)關(guān)于在甘蔗上開發(fā)SSR標(biāo)記的報(bào)道, 如Oliveira等[20]從甘蔗SUCEST (sugarcane EST database)數(shù)據(jù)庫中找出2005個(gè)含有SSR的EST序列, 對其中的342個(gè)EST-SSRs進(jìn)行了PCR分析, 發(fā)現(xiàn)有224個(gè)(65.5%)呈多態(tài)性; Singh等[27]從2個(gè)甘蔗栽培品種的4085個(gè)EST序列中鑒定出351個(gè)EST-SSRs, 對其中227個(gè)進(jìn)行了PCR分析, 發(fā)現(xiàn)有134個(gè)呈多態(tài)性; Shamshad等[28]從NCBI數(shù)據(jù)庫中獲得10 000個(gè)EST序列(累計(jì)長4201kb), 從中鑒定出406個(gè)SSRs, 對其中的63個(gè)進(jìn)行了PCR分析, 發(fā)現(xiàn)有42個(gè)具有多態(tài)性。但是目前可公開獲得的甘蔗屬的SSR分子標(biāo)記數(shù)量仍然十分有限, 大部分甘蔗屬的SSR標(biāo)記的引物序列依然沒有公開, 而傳統(tǒng)的SSR標(biāo)記開發(fā)存在諸多缺點(diǎn), 耗費(fèi)人力、物力、且效率低下, 尤其是對于多倍體的甘蔗; 加之, 甘蔗又為同源多倍體, 其基因組大小預(yù)測為10 Gb[31], 遠(yuǎn)遠(yuǎn)高于其他禾本科作物, 而甘蔗的“高貴化”育種策略造成現(xiàn)代甘蔗品種遺傳基礎(chǔ)狹窄[3-6]{McCouch, 2002 #23;Dobrovolskaya, 2016 #27}{McCouch, 2002 #23;Dobrovolskaya, 2016 #27}。因此, 甘蔗SSR標(biāo)記的開發(fā)和應(yīng)用比較緩慢, 現(xiàn)有的SSR標(biāo)記數(shù)目有限, 不能滿足在甘蔗屬植物上開展各項(xiàng)研究的需要, 嚴(yán)重制約了甘蔗的分子遺傳研究進(jìn)展[22]。
本研究旨在挖掘熱帶種(LA-purple)的基因組數(shù)據(jù), 利用生物信息學(xué)方法, 分析全基因組基因序列上SSR位點(diǎn)的數(shù)量和分布規(guī)律, 包括基序結(jié)構(gòu)和類型、比例、重復(fù)次數(shù), 進(jìn)而設(shè)計(jì)和合成SSR引物, 開發(fā)多態(tài)的SSR分子標(biāo)記, 為未來甘蔗屬不同種的遺傳多樣性分析、遺傳圖譜構(gòu)建、重要農(nóng)藝性狀形成的遺傳機(jī)制研究及開展分子育種研究提供SSR標(biāo)記數(shù)據(jù)庫支撐。
所有材料均為甘蔗屬材料, 包括2個(gè)大莖野生種()、4個(gè)熱帶種()、4個(gè)割手密()和2個(gè)栽培品種(hybrid), 除科5來自廣州甘蔗糖業(yè)研究所海南甘蔗育種場外, 其他材料都來自國家甘蔗種質(zhì)資源圃(National Germplasm Repository of Sugarcane)(表1)。
福建農(nóng)林大學(xué)基因組與生物技術(shù)研究中心Ming Ray教授團(tuán)隊(duì)采用第三代高通量測序技術(shù), 從頭組裝, 對熱帶種(LA-purple)進(jìn)行了全基因組序列測定工作(數(shù)據(jù)暫未公布), 并對獲得序列上的基因進(jìn)行了預(yù)測。本研究采用的序列(genomic gene sequence)為其中的 255 398個(gè)基因, 累計(jì)總長1 029 222 285 bp, 平均每個(gè)基因的長度為4030 bp。
表1 供試甘蔗種質(zhì)資源名稱及來源
本研究采用Perl語言編寫的MISA (microsatellite identification tool)軟件掃描甘蔗基因組序列, 查找序列中的SSR位點(diǎn), 該軟件下載自http://pgrc.ipk- gatersleben.de/misa/, 以MISA工具高通量識別和查找簡單重復(fù)序列。該軟件還提供一個(gè)與批量設(shè)計(jì)引物Primer 3的接口工具, 把MISA識別出來的SSR序列轉(zhuǎn)為Primer 3需要的格式, 從而方便批量設(shè)計(jì)引物。SSR位點(diǎn)查找標(biāo)準(zhǔn)條件為, 將核苷酸重復(fù)基序(motif)分為二(dinucleotide repeats, DNRs)、三(trinucleotide repeats, TNRs)、四(tetranucleotide repeats, TtNRs)、五(pentanucleotide repeats, PNRs)、六(hexanucleotide repeats, HNRs), 其最低重復(fù)數(shù)分別定為6、5、4、3、3; 剔除掉重復(fù)的SSR引物設(shè)計(jì)位點(diǎn), 對SSR位點(diǎn)兩側(cè)保守序列設(shè)計(jì)引物, 用Primer 3 (http://frodo.wi.mit.edu/primer3/)在線設(shè)計(jì)引物, 引物參數(shù)設(shè)計(jì)為primer length 18~28 bp; annealing temperature 55~65℃; amplicon size 100~500 bp; GC content 45%~65%[27]。
在幼苗期采集幼嫩葉片, 用液氮研磨后, 按照CTAB方法[32]提取基因組DNA。提取所有參試材料的基因組DNA后, 用NanoDrop 2000超微量紫外分光光度計(jì)(Thermo Fisher Scientific)檢測基因組DNA的純度和濃度, 以1×TE (上海生工生物)將其稀釋至25 ng μL–1。于–20℃冰箱保存, 用于后續(xù)實(shí)驗(yàn)。PCR反應(yīng)體系含25 ng μL–1DNA樣品2.0 μL、10×PCR buffer (Mg2+plus) 2.5 μL、25 mmol L–1dNTPs 1.2 μL、10 μmol L–1引物各0.5 μL、0.5 U μL–1酶 0.1 μL, 最后用ddH2O補(bǔ)足25 μL。PCR擴(kuò)增程序?yàn)?4℃預(yù)變性5 min; 94℃變性30 s, 65℃退火30 s, 72℃延伸30 s, 共10個(gè)循環(huán), 每個(gè)循環(huán)退火溫度降低0.7℃; 94℃變性30 s, 55℃退火30 s, 72℃延伸30 s, 共25個(gè)循環(huán); 最后72℃延伸7 min, 4℃保存。酶、dNTP等試劑購自北京康為世紀(jì)生物科技有限公司。參照Liu等[23]方法, 所有PCR產(chǎn)物在1.5%的高強(qiáng)度瓊脂糖凝膠中分離, 120 V恒壓下, 電泳1.5 h, 染色、照相及保存。
參照梅嘉洺等[33]SSR電泳圖譜統(tǒng)計(jì)分析方法, 針對每一對SSR引物, 首先在12個(gè)甘蔗屬材料上PCR產(chǎn)物的電泳圖譜整體分析比較, 鑒定出所有變異類型, 依次被命名為a、b、c、d、e、f等。然后針對每個(gè)變異類型(可被看作1個(gè)分子標(biāo)記)統(tǒng)計(jì)其在12個(gè)材料中的分布情況, 屬于該變異類型的記為1, 不屬于該變異類型的記為0, 根據(jù)統(tǒng)計(jì)的結(jié)果建立原始數(shù)據(jù)(0, 1)矩陣。利用NTSYS-pc 2.1軟件中的子程序SIMQUAL對矩陣進(jìn)行樣本間的相似性系數(shù)(SM)計(jì)算, 然后用子程序SAHN中的非加權(quán)類平均法(UPGMA)進(jìn)行聚類分析, 最后用Tree plot繪制樹狀聚類圖。
通過MISA軟件掃描熱帶種LA-purple的255 398個(gè)基因序列(累計(jì)總長為1 029 222 285 bp)來查找二、三、四、五、六堿基5種基序類型的SSR, 共找到153 150個(gè)SSR位點(diǎn), 其中三核苷酸重復(fù)基序類型出現(xiàn)的頻率最高, 共找出50 072個(gè)位點(diǎn), 占總數(shù)的32.70%; 二核苷酸重復(fù)基序類型次之, 共找出39 556個(gè)位點(diǎn), 占總數(shù)的25.83%, 兩者合計(jì)占總數(shù)的58.53%。而四、五、六核苷酸類型及復(fù)合型所占的比例相對較低, 分別為9.53%、16.66%、13.73%和1.55%, 合計(jì)占總數(shù)的41.47%。平均每1.67個(gè)基因或6720 bp含有1個(gè)SSR位點(diǎn)(表2)。
針對每個(gè)SSR核苷酸重復(fù)基序類型, 重復(fù)次數(shù)越少, 出現(xiàn)的頻率就越高。在二核苷酸重復(fù)基序類型中, 35.0%的SSR位點(diǎn)含有6個(gè)重復(fù), 72.3%的SSR位點(diǎn)的重復(fù)次數(shù)集中在6~10之間; 在三核苷酸重復(fù)基序類型中, 59.4%的SSR位點(diǎn)含有5個(gè)重復(fù), 97.1%的SSR位點(diǎn)的重復(fù)次數(shù)集中在5~10之間; 在四核苷酸重復(fù)基序類型中, 71.3%的SSR位點(diǎn)含有4個(gè)重復(fù), 99.8%的SSR位點(diǎn)的重復(fù)次數(shù)集中在4~10之間; 在五核苷酸重復(fù)基序類型中, 83.1%的SSR位點(diǎn)含有3個(gè)重復(fù), 99.6%的SSR位點(diǎn)的重復(fù)次數(shù)集中在3~10之間; 在六核苷酸重復(fù)基序類型中, 82.7%的SSR位點(diǎn)含有3個(gè)重復(fù), 99.4%的SSR位點(diǎn)的重復(fù)次數(shù)集中在3~10之間(表2)。
在二核苷酸重復(fù)基序類型中, TA/AT所占的比例最高, 為41.3%; 而CT/GA、TC/AG、TG/AG、GT/CA和CG/GC所占比例相對較低, 分別為17.9%、14.5%、11.5%、10.2%和4.6% (圖1)。在三核苷酸重復(fù)基序類型中, TGT/ACA所占比例最高, 為15.6%; CGC/GCG、GGC/CCG和GCC/CGG所占比例次之, 分別為10.8%、9.3%和9.2%; 而其余類型單個(gè)所占比例分布在0.5%~4.0%之間(圖2)。由于四、五、六核苷酸重復(fù)基序類型呈現(xiàn)指數(shù)上升(分別為252、1020和4092), 因而使其不同類型基序所出現(xiàn)的頻率遠(yuǎn)遠(yuǎn)低于二、三核苷酸重復(fù)基序。
為了驗(yàn)證上述從熱帶種(LA-purple)全基因組基因序列上查找出的SSR位點(diǎn)的擴(kuò)增效率和多態(tài)性, 從二核苷酸SSR位點(diǎn)中選擇絕對數(shù)量最多的AT/TA重復(fù)基序類型開發(fā)引物, 根據(jù)Schl?tterer[34]的研究結(jié)果, SSR位點(diǎn)基序重復(fù)次數(shù)越多, 多態(tài)性表現(xiàn)越好,鑒于此, 本研究選取基序重復(fù)次數(shù)在60~90范圍內(nèi)的100個(gè)SSR位點(diǎn)開發(fā)引物, 對其進(jìn)行了引物設(shè)計(jì)和合成, 然后利用合成的100對引物對12個(gè)甘蔗屬遺傳材料的DNA進(jìn)行PCR擴(kuò)增和多態(tài)性分析, 結(jié)果顯示, 共有84對引物能夠給出清晰的PCR擴(kuò)增條帶, 而其余16對引物沒有給出條帶或者給出的條帶不夠清晰, 有52對引物在12個(gè)實(shí)驗(yàn)材料上呈現(xiàn)多態(tài)性, 每對引物給出2~7種擴(kuò)增類型, 共給出159個(gè)擴(kuò)增類型(平均每一對引物給出3.1種擴(kuò)增類型), 其中有27對引物在2個(gè)甘蔗栽培品種(科5和桂糖35)之間給出多態(tài)性擴(kuò)增(表3)。圖3僅展示了其中4對不同SSR引物在12個(gè)供試甘蔗屬材料上的代表性PCR分析圖譜, 其中除引物SoLaSSR096外, 其他3對引物均給出清晰的PCR擴(kuò)增條帶, 并且SoLaSSR007和SoLaSSR070在12個(gè)試驗(yàn)材料上呈現(xiàn)多態(tài)性。
圖1 二核苷酸重復(fù)基序的次數(shù)分布
基于上述52對SSR引物所給出的159種PCR擴(kuò)增類型, 對12個(gè)甘蔗屬材料進(jìn)行了UPGMA聚類分析, 從圖4可以看出, 供試材料之間的遺傳相似系數(shù)分布在0.64~0.86之間, 其中熱帶種材料之間的相似性系數(shù)為0.64~0.77, 2個(gè)大莖野生種材料之間的相似性系數(shù)為0.66, 割手密材料之間的相似性系數(shù)為0.77~0.87, 2個(gè)甘蔗栽培品種(科5和桂糖35)之間的遺傳相似系數(shù)為0.715。整體來看, 12個(gè)試驗(yàn)材料沒有明顯按照種類分組, 但4個(gè)割手密材料(云南75-2-11、福建89-1-1、廣東21和貴78-2-28)被聚合到同一個(gè)小組, 而2個(gè)栽培品種與3個(gè)熱帶種(路達(dá)士、克里斯塔林娜和拔地拉)聚在一個(gè)大組, 表明栽培品種與熱帶種血緣關(guān)系較近。
隨著測序技術(shù)的快速發(fā)展, 越來越多植物基因組序列被測序并公布于眾, 這給全基因組水平上查找SSR位點(diǎn)、大規(guī)模開發(fā)SSR標(biāo)記創(chuàng)造了極好的條件[35]。到目前為止, 基于基因組測序數(shù)據(jù)來查找、開發(fā)SSR標(biāo)記的報(bào)道越來越多[36–50], 比如, 擬南芥基因組上平均每1.14 kb就有1個(gè)SSR位點(diǎn)[36], 水稻基因組上平均每3.6 kb就有1個(gè)SSR位點(diǎn)[37], 甘藍(lán)基因組上平均每4 kb就有1個(gè)SSR位點(diǎn)[39], 大豆基因組上平均每4.5 kb就有1個(gè)SSR位點(diǎn)[41]等。本研究從甘蔗熱帶種(LA-purple)全基因組的255 398個(gè)預(yù)測基因序列(累計(jì)總長為1 029 222 285 bp)中共找到153 150個(gè)SSR位點(diǎn), 平均每1.67個(gè)基因或6720 bp含有1個(gè)SSR位點(diǎn)。由于甘蔗熱帶種(LA-purple)的全基因組測序工作還沒有結(jié)束, 本研究只用到其部分基因序列, 因此該結(jié)果還不能與上述其他植物上的SSR數(shù)據(jù)直接比較, 但足以證明SSR在甘蔗熱帶種(LA-purple)基因組上的廣泛分布。
圖3 4對不同SSR引物在12個(gè)供試甘蔗屬材料上的代表性PCR擴(kuò)增圖譜
1: 57NG208; 2: NG77-004; 3: 云南75-2-11; 4: 福建89-1-1; 5: 廣東21; 6: 貴州78-2-28; 7: 黑車?yán)锉? 8: 路達(dá)士; 9: 克里斯塔林娜; 10: 拔地拉; 11: 桂糖35; 12: 科5; M: 100 bp DNA ladder。
1: 57NG208; 2: NG77-004; 3: YN75-2-11; 4: FJ89-1-1; 5: GD21; 6: GZ78-2-28; 7: Black cheribon; 8:Loethers; 9: Crystalina; 10:Badila; 11: GT35; 12: K5; M: 100 bp DNA ladder.
在SSR基序的類型方面, 本研究結(jié)果顯示甘蔗熱帶種全基因組基因上三核苷酸重復(fù)最多(32.70%), 二核苷酸重復(fù)次之(25.83%)。這可能是因?yàn)楸狙芯空页龅腟SR位點(diǎn)位于基因內(nèi)部, 富集了基因上可翻譯成蛋白質(zhì)序列的三核苷酸重復(fù)序列。這個(gè)結(jié)果和基于表達(dá)序列標(biāo)簽(EST)中開發(fā)SSR (EST-SSR)的結(jié)果相一致[35,37,42], 雖然大多數(shù)基因組序列上查找SSR位點(diǎn)的結(jié)果都顯示基因組上均以二核苷酸重復(fù)的SSR位點(diǎn)最多, 而三核苷酸重復(fù)的SSR位點(diǎn)次之[36,46-47]。
在SSR基序的結(jié)構(gòu)方面, 本研究結(jié)果顯示甘蔗熱帶種基因組基因序列中的二核苷酸重復(fù)基序SSR類型以AT/TA基序結(jié)構(gòu)出現(xiàn)次數(shù)最高, 該結(jié)果與煙草[47]、玉米[44]、大豆[38]、可可[45]、高粱[42]的研究結(jié)果一致, 但是與水稻、二穗短柄草等AG/TC結(jié)構(gòu)出現(xiàn)次數(shù)最高的結(jié)果不一致[42]; 三核苷酸重復(fù)基序類型以TGT/ACA出現(xiàn)次數(shù)最多, 其次是CCG/CGG類型, 這與擬南芥[36]、玉米[44]、水稻[36,42]、高粱[42]、二穗短柄草[42]相類似。產(chǎn)生這種結(jié)果很可能是和堿基對所含氫鍵有關(guān), 即改變GC鍵需要的能量要高于AT鍵所需, 因此, DNA復(fù)制時(shí)滑移產(chǎn)生的SSR重復(fù)序列, 需要較少能量的AT結(jié)構(gòu)類型就比較容易產(chǎn)生[47]。
在查出的SSR位點(diǎn)的遺傳變異水平方面, 本研究在數(shù)量最多的AT/TA重復(fù)基序類型中, 選取了100個(gè)基序重復(fù)次數(shù)最高(60~90)的SSR位點(diǎn), 分析它們在12個(gè)甘蔗屬材料上的PCR擴(kuò)增及多態(tài)性情況。結(jié)果顯示, 共有84對引物給出期望的PCR擴(kuò)增條帶, 其中有52對引物在12個(gè)實(shí)驗(yàn)材料上呈現(xiàn)多態(tài)性, 每對給出2~7種擴(kuò)增類型(平均每一對引物給出3.1種擴(kuò)增類型); 有27對引物在2個(gè)甘蔗栽培品種(科5和桂糖35)之間給出多態(tài)性擴(kuò)增, 這27對引物可以直接用來分析已經(jīng)制成的“科5′桂糖35”雜交后代分離群體, 參與甘蔗遺傳連鎖圖譜的構(gòu)建。這個(gè)擴(kuò)增結(jié)果及多態(tài)性引物的比例可望在今后使用優(yōu)化的PCR擴(kuò)增條件及改良的電泳條件(如聚丙烯酰胺電泳技術(shù))而得到進(jìn)一步的改進(jìn)和提高, 特別在對本研究找出的SSR位點(diǎn)進(jìn)行大規(guī)模的PCR擴(kuò)增測試和SSR標(biāo)記開發(fā)時(shí), 需要結(jié)合優(yōu)化的實(shí)驗(yàn)條件以便獲得最好的效果。
本研究鑒定出的SSR位點(diǎn)全部來自甘蔗熱帶種基因組基因序列, 這將有利于在甘蔗上尋找與性狀顯著關(guān)聯(lián)的功能SSR標(biāo)記。但是由于基因在進(jìn)化過程中的保守性, 這些基于基因序列的SSR位點(diǎn)(特別是那些位于外顯子區(qū)域)的多態(tài)性會(huì)低于那些來自基因組上非編碼區(qū)的SSR。此外, 熱帶種基因組為同源多倍體, 現(xiàn)代甘蔗品種80%~90%的染色體都來自熱帶種, 這些特征都會(huì)降低SSR位點(diǎn)的多態(tài)性以及PCR擴(kuò)增質(zhì)量。因此, 未來在熱帶種全基因組序列被公布之后, 需要進(jìn)一步開發(fā)非編碼區(qū)的SSR位點(diǎn), 同時(shí)也要開發(fā)來自于甘蔗屬內(nèi)其他種(特別是割手密)的SSR標(biāo)記, 以便在甘蔗上開發(fā)大量的高質(zhì)量多態(tài)性SSR標(biāo)記。這些新開發(fā)的以及前人[13-30]已經(jīng)開發(fā)的SSR標(biāo)記, 需要在改良的實(shí)驗(yàn)條件下統(tǒng)一分析、鑒定和去重復(fù), 從而篩選出一批擴(kuò)增效果好、擴(kuò)增譜簡單、數(shù)量充足的多態(tài)性SSR標(biāo)記, 可以被廣泛應(yīng)用在甘蔗及其近緣種的種質(zhì)資源鑒定、遺傳多樣性分析、遺傳連鎖圖譜構(gòu)建及QTL定位等方面的研究, 為甘蔗的品種鑒定、種質(zhì)資源的管理和利用、重要農(nóng)藝性狀的遺傳研究及分子輔助育種等提供良好的條件。
甘蔗熱帶種(LA-purple)全基因組預(yù)測基因序列對開發(fā)高質(zhì)量、多態(tài)性SSR標(biāo)記具有巨大的潛力, 為甘蔗及其近緣種的品系鑒定、遺傳多樣性分析、遺傳圖譜構(gòu)建及重要性狀的遺傳機(jī)制解析等提供了重要的分子標(biāo)記庫支撐。
[1] 劉燕群, 李玉萍, 梁偉紅, 宋啟道, 秦小立, 葉露. 國外甘蔗產(chǎn)業(yè)發(fā)展現(xiàn)狀. 世界農(nóng)業(yè), 2015, (8): 147–152 Liu Y Q, Li Y P, Liang W H, Song Q D, Qin X L, Ye L. Current situation of sugarcane industry in the world., 2015, (8): 147–152 (in Chinese with English abstract)
[2] 李明, 田洪春, 黃智剛. 我國甘蔗產(chǎn)業(yè)發(fā)展現(xiàn)狀研究. 中國糖料, 2017, 39(1): 67–70 Li M, Tian H C, Huang Z G. Research on the development status of sugarcane industry in China., 2017, 39(1): 67–70 (in Chinese with English abstract)
[3] Hermann S, Aitken K S, Jackson P A, George A W, Piperidis N, Wei X, Kilian A, Detering F. Evidence for second division restitution as the basis for 2+maternal chromosome transmission in a sugarcane cross., 2012, 187: 359–368
[4] D'Hont A, Grivet L, Feldmann P, Glaszmann J C, Rao S, BerdingN. Characterisation of the double genome structure of modern sugarcane cultivars (spp) by molecular cytogenetics., 1996, 250: 405–413
[5] Piperidis G, Piperidis N, D’Hont A. Molecular cytogenetic investigation of chromosome composition and transmission in sugarcane., 2010, 284: 65–73
[6] Wang H B, Chen P H, Yang Y Q, D’Hont A, Lu Y H. Molecular insights into the origin of the brown rust resistance gene1 amongspecies., 2017, 130: 2431–2443
[7] Ellegren H. Microsatellites: simple sequences with complex evolution., 2004, 5: 435–445
[8] Sharma P. Mining microsatellites in eukaryotic genomes., 2007, 25: 490–498
[9] Smith D N, Devey M E. Occurrence and inheritance of microsatellites in., 1994, 37: 977–983
[10] Morgante M, Hanafey H, Powell W. Microsatellites are preferentially associated with nonrepetitive DNA in plant genome., 2002, 30: 194–200
[11] Klintschar M, Dauber E M, Ricci U, Cerri N, Immel U D, Kleiber M, Mayr W R. Haplotype studies support slippage as the mechanism of germline mutations in short tandem repeats., 2004, 25: 3344–3348
[12] 張?jiān)龃? 侯喜林. SSR分子標(biāo)記開發(fā)策略及評價(jià). 遺傳, 2004, 26: 763–768 Zhang Z C, Hou X L. Strategies for development of SSR molecular markers., 2004, 26: 763–768
[13] Cordeiro G M, Casu R, McIntyre C L, Manners J M, Henry R J. Microsatellite markers from sugarcane (spp.) ESTs cross transferable toand., 2001, 160: 1115–1123
[14] Aitken K S, Jackson P A, McIntyre C L. A combination of AFLP and SSR markers provides extensive map coverage and identification of homo(eo)logous linkage groups in a sugarcane cultivar., 2005, 110: 789–801
[15] Pan Y B. Highly polymorphic microsatellite DNA markers for sugarcane germplasm evaluation and variety identity testing., 2006, 8: 246–256
[16] Edmé S J, Glynn N G, Comstock J C. Genetic segregation of microsatellite markers inand., 2006, 97: 366–375
[17] Aitken K S, Jackson P A, McIntyre C L. Quantitative trait loci identified for sugar related traits in a sugarcane (spp.) cultivar ×population., 2006, 112: 1306–1317
[18] Garcia A A, Kido E A, Meza A N, Souza H M, Pinto L R, Pastina M M, Leite C S, Silva J A, Ulian E C, Figueira A, Souza A P. Development of an integrated genetic map of a sugarcane (spp.) commercial cross, based on a maximum-likelihood approach for estimation of linkage and linkage phases., 2006, 112: 298–314
[19] Aitken K S, Jackson P A, McIntyre C L. Construction of a genetic linkage map forincorporating both simplex and duplex markers to increase genome coverage., 2007, 50: 742–756
[20] Oliveira K M, Pinto L R, Marconi T G, Mollinari M, Ulian E C, Chabregas S M, Falco M C, Burnquist W, Garcia A A, Souza A P. Characterization of new polymorphic functional markers for sugarcane., 2009, 52: 191–209
[21] Parida S K, Kalia S K, Kaul S, Dalal V, Hemaprabha G, Selvi A, Pandit A, Singh A, Gaikwad K, Sharma T R, Srivastava P S, Singh N K, Mohapatra T. Informative genomic microsatellite markers for efficient genotyping applications in sugarcane, 2009, 118: 327–338
[22] 劉新龍, 毛鈞, 陸鑫, 馬麗, Aitken K S, Jackson P A, 蔡青, 范源洪. 甘蔗SSR和AFLP分子遺傳連鎖圖譜構(gòu)建. 作物學(xué)報(bào), 2010, 36: 177–183 Liu X L, Mao J, Lu X, Ma L, Aitken K S, Jackson P A, Cai Q, Fan Y H. Construction of molecular genetic linkage map of sugarcane based on SSR and AFLP markers.2010, 36: 177–183 (in Chinese with English abstract)
[23] Liu P, Que Y X, Pan Y B. Highly polymorphic microsatellite DNA markers for sugarcane germplasm evaluation and variety identity testing, 2011, 13: 129–136
[24] Andru S, Pan Y B, Thongthawee S, Burner D M, Kimbeng C A. Genetic analysis of the sugarcane (spp.) cultivar ‘LCP 85-384’: I. Linkage mapping using AFLP, SSR, and TRAP markers., 2011, 123: 77–93
[25] Devarumath R M, Kalwade S B, Kawar P G, Sushir K V. Assessment of genetic diversity in sugarcane germplasm using ISSR and SSR markers., 2012, 14: 334–344
[26] 黃啟星, 張雨良, 王俊剛, 伍蘇然, 張樹珍, 郭安平. 甘蔗EST-SSR標(biāo)記的開發(fā)和多樣性分析. 熱帶農(nóng)業(yè)科學(xué), 2012, 32(12): 33–42Huang Q X, Zhang Y L, Wang J G, Wu S R, Zhang S Z, Guo A P. Data-mining and diversity analysis of EST-SSRs from sugarcane., 2012, 32(12): 33–42 (in Chinese with English abstract)
[27] Singh R K, Jena S N, Khan S, Yadav S, Banarjee N, Raghuvanshi S, Bhardwaj V, Dattamajumder S K, Kapur R, Solomon S, Swapna M, Srivastava S, Tyagi A K. Development, cross- species/genera transferability of novel EST-SSR markers and their utility in revealing population structure and genetic diversity in sugarcane., 2013, 524: 309–329
[28] Shamshad UH, KumarP, SinghRK, VermaK S, BhattR, SharmaM, Kachhwaha S, Kothari SL.Assessment of functional EST-SSR markers (sugarcane) in cross-species transferability, genetic diversity among Poaceae plants, and bulk segregation analysis., 2016, 2016: 7052323
[29] 劉新龍, 李旭娟, 劉洪博, 馬麗, 徐超華, 范源洪. 云南甘蔗常用親本資源遺傳多樣性的SSR分析. 植物遺傳資源學(xué)報(bào), 2015, 6: 1214–1222 Liu X L, Li X J, Liu H B, Ma L, Xu C H, Fan Y H. Genetic diversity analysis of Yunnan commonly-used parents by using SSR marker., 2015, 6: 1214–1222 (in Chinese with English abstract)
[30] Liu P, Chandra A, Que Y, Chen P H, Grisham M, White W, Dalley C, Tew T, Pan Y B. Identification of quantitative trait loci controlling sucrose content based on an enriched genetic linkage map of sugarcane (spp. hybrids) cultivar LCP 85-384., 2016, 207: 527–549
[31] Wang J, Roe B, Macmil S, Yu Q, Murray J E, Tang H, Chen C, Najar F, Wiley G, Bowers J, Van Sluys M A, Rokhsar D S, Hudson M E, Moose S P, Paterson A H, Ming R. Micro-collinearity between autopolyploid sugarcane and diploid sorghum genomes., 2010, 11: 261–278
[32] Murray H G, Thompson W F. Rapid isolation of high molecular weight plant DNA., 1980, 8: 4321–4325
[33] 梅嘉洺, 黃小霞, 王詠, 朱美蘭, 林輝, 陽宴清, 盧運(yùn)海. 46份菌草種質(zhì)資源PEPC基因的PCR-RFLP多樣性分析. 熱帶農(nóng)業(yè)科學(xué), 2015, 35(11): 45–50 Mei J M, Huang X X, Wang Y, Zhu M L, Lin H, Yang Y Q, Lu Y H. Polymorphism analysis of PEPC gene family among 46 Juncao germplasms by PCR-RFLP., 2015, 35(11): 45–50 (in Chinese with English abstract)
[34] Schl?tterer C. Evolutionary dynamics of microsatellite DNA.. 2000, 109: 365–371
[35] Gerard L C, Jeanne J, Samantha J B, Jifeng TRoeland E V, Jack A MHerman V E, Ben V. Large-scale identification of polymorphic microsatellites using anapproach., 2008, 9: 374–386
[36] Lawson M J, Zhang L. Distinct patterns of SSR distribution in theand rice genomes., 2006, 7: R14
[37] Zhang Z, Deng Y, Tan JHu S, Yu J, Xue Q. A genome-wide microsatellite polymorphism database for theandrice., 2007, 14: 37–45
[38] Blair M W, Buendia H F, Giraldo M C, Metais I, Peltier D. Characterization of AT-rich microsatellites in common bean (L.)., 2008, 118: 91–103
[39] Iniguez F L, Voort A V, Osborn T C. Development of a set of public SSR markers derived from genomic sequence of a rapid cyclingL. genotype., 2008, 117: 977–985
[40] Yonemaru J I, Ando T, Mizubayashi T, Kasuga S, Matsumoto T, Yano M. Development of genome-wide simple sequence repeat markers using whole-genome shotgun sequences of sorghum ((L.) Moench)., 2009, 16: 187–193
[41] Song Q, Jia G, Zhu Y, Grant D, Nelson R T, Wang E Y, Hyten D L, Cregan P BAbundance of SSR motifs and development of candidate polymorphic SSR markers (BARCSOYSSR1.0) in Soybean., 2010, 50: 1950–1960
[42] 鄭燕, 張耿, 吳為人. 禾本科植物微衛(wèi)星序列的特征分析和比較. 基因組學(xué)與應(yīng)用生物學(xué), 2011, 30: 513–520 Zheng Y, Zhang G, Wu W R. Characterization and comparison of microsatellites in gramineae., 2011, 30: 513–520 (in Chinese with English abstract)
[43] 儀澤會(huì), 盧有飛, 郭曉芹, 惠麥俠, 張魯剛, 張明科. 大白菜簡單序列重復(fù)(SSR)和插入/缺失(InDel)標(biāo)記的開發(fā)及通用性分析. 農(nóng)業(yè)生物技術(shù)學(xué)報(bào), 2012, 12: 1398–1406 Yi Z H, Lu Y F, Guo X Q, Hui M X, Zhang L G, Zhang M K. Development of simple sequence repeat (SSR) and insertion/deletion (InDel) markers in Chinese cabbage (ssp. pekinesis) and analysis of their transferability., 2012, 12: 1398–1406 (in Chinese with English abstract)
[44] 原志敏. 玉米全基因組SSRs分子標(biāo)記開發(fā)與特征分析. 四川農(nóng)業(yè)大學(xué)碩士學(xué)位論文, 四川雅安, 2013 Yuan Z M. Development and Characterization of SSR Markers Providing Genome-wide Coverage and High Resolution in Maize. MS Thesis of Sichun Agriculture University, Ya’an, China, 2013 (in Chinese with English abstract)
[45] 曹恒春, 王毅, 黃莉莎, 王玉軍, 于元杰, 楊龍. 可可全基因組SSR標(biāo)記的開發(fā)及分析. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 44: 340–344 Cao H C, Wang Y, Huang L S, Wang Y J, Yu Y J, Yang L. Large-scale development of SSR markers in the genome of cacao.(Natural Science Edition), 2013, 44: 340–344 (in Chinese with English abstract)
[46] Wei X, Wang L, Zhang Y, Qi X, Wang X, Ding X, Zhang J, Zhang X. Development of simple sequence repeat (SSR) markers of sesame () from a genome survey., 2014, 19: 5150–5162
[47] 童治軍, 焦芳嬋, 肖炳光. 普通煙草及其祖先種基因組SSR位點(diǎn)分析. 中國農(nóng)業(yè)科學(xué), 2015, 48: 2108–2117 Tong Z J, Jiao F C, Xiao B G. Analysis of SSR loci ingenome and its two ancestral species genome., 2015, 48: 2108–2117 (in Chinese with English abstract)
[48] Song X, Ge T, Li Y, Hou X. Genome-wide identification of SSR and SNP markers from the non-heading Chinese cabbage for comparative genomic analyses., 2015, 16: 328
[49] Motalebipour E Z, Kafkas S, Khodaeiaminjan M, ?oban N, G?zel H. Genome survey of pistachio (L.) by next generation sequencing: Development of novel SSR markers and genetic diversity inspecies., 2016, 17: 998
[50] Gil J, Um Y, Kim S, Kim O T, Koo S C, Reddy C S, Kim S C, Hong C P, Park S G, Kim H B, Lee D H, Jeong B H, Chung J W, Lee Y. Development of genome-wide SSR markers fromNakai using next generation sequencing.(Basel), 2017, 8: E238
Development and Characterization of SSR Markers from the Whole Genome Sequences of(LA-purple)
WANG Heng-Bo, XIAO Nai-Yan, ZHU Zhuan-Wei, LIU Cui-Cui, Intikhab ALAM, CHEN Ping-Hua, and LU Yun-Hai*?
Key Laboratory of Ministry of Agriculture for Sugarcane Biology and Genetic Breeding (Fujian), Key Laboratory of Ministry of Education for Genetics, Breeding and Multiple Utilization of Crops, College of Crop Science, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China
Modern sugarcane cultivars (2= 100–130) are derived from interspecific hybridization and backcross breeding between(2= 80) and(2= 40–128), forming polyploid and aneuploid crops. The main components (80%–90%) of the sugarcane cultivars’ genome are originated from. The development and mining of genomic SSR molecular marker of, will benefit sugarcane genetic diversity analysis, molecular marker assisted selection, and construction of genetic maps. In this study, we explored the SSR loci from 255 398 predicted gene sequences (with a cumulative length of 1 029 222 285 bp) derived from the whole genome sequencing project of aclone LA-purple, by combining Perl program with bioinformatics software. A total of 153 150 SSR loci, with an average of 1.67 genes per SSR locus, were identified, of which 39 556 (25.8%) were dinucleotide repeat motifs and 50 072 (32.7%) were tri-nucleotide repeat motifs. Among the dinucleotide repeat motifs, TA/AT had the highest proportion, accounting for 41.4%, while CG/GC had the lowest proportion, accounting for only 4.6%. Among the trinucleotide repeat motifs, TGT/ACA had the highest proportion, accounting for 15.6%. One hundred SSR loci with 60–90 repeats of TA/AT motifs were selected and analyzed by PCR amplification in 12 representative Saccharum clones, of which 52 were polymorphic among the 12 clones and 27 were polymorphic between the tested two modern sugarcane cultivars. The genome-wide development of these gene-based SSR markers will not only facilitate the DNA fingerprinting analysis of sugarcane cultivars, but also help to construct the genetic maps, analyze the genetic diversity, study the genetic mechanism of important traits in Saccharum species, and provide important support to the molecular breeding in sugarcane.
sugarcane; genome sequence; SSR; marker development; polymorphism
2017-11-20;
2018-03-26;
2018-04-09.
10.3724/SP.J.1006.2018.01400
盧運(yùn)海, E-mail: yunhai.lu@fafu.edu.cn
E-mail: wanghengbo_0354@126.com
本研究由國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng)(CARS-20-1)和國家甘蔗工程技術(shù)研究中心2017年主任課題基金項(xiàng)目(ptjh1500117) 資助。
This study was supported by the China Agriculture Research System (CARS-20-1) and the National Sugarcane Engineering Research Center of Director Project Fund in 2017 (ptjh1500117).
URL: http://kns.cnki.net/kcms/detail/11.1809.S.20180409.1434.034.html