宋佳 王玨 劉蕾 王輝
摘要:以擬南芥中控制硫苷生物合成相關(guān)基因家族GS-Elong的全長CDS及蛋白序列為參考序列,在甘藍(lán)(Brassica oleracea L.)基因組數(shù)據(jù)庫中進(jìn)行BLASTN和BLASTP檢索,得到具備Score≥100、E-value≤10-10。和Coverage I>70%條件的甘藍(lán)注釋基因作為擬南芥GS-Elong位點(diǎn)基因的候選同源基因,并進(jìn)一步對其進(jìn)行同源性和基因結(jié)構(gòu)比較及聚類分析。結(jié)果顯示,在甘藍(lán)GS-Elong位點(diǎn)發(fā)現(xiàn)4個旁系同源基因(Bo1020647、Bo1017070、B01037823和B01017071)。甘藍(lán)和擬南芥GS-Elong位點(diǎn)同源基因在核酸水平上的一致性為66.1%~84.3%;甘藍(lán)4個旁系同源基因問的一致性在62.0%~83.7%之間。甘藍(lán)和擬南芥GS-Elong位點(diǎn)基因在外顯子數(shù)目、大小方面高度一致,但B01017071和B01037823分別較擬南芥GS-Elong位點(diǎn)基因少3個和1個外顯子。系統(tǒng)進(jìn)化及共線性分析初步確定,甘藍(lán)中存在2個BoMAM1(B01017070和B01020647)和2個BoMAM3(B01017071和B01037823)。
關(guān)鍵詞:十字花科植物;甘藍(lán);硫代葡萄糖苷;GS-Elong
中圖分類號:S635:Q781 文獻(xiàn)標(biāo)識號:A 文章編號:1001—4942(2016)03—0005—04
甘藍(lán)(BrCLssica oleracea L.)為十字花科蕓薹屬植物,源于地中海至北海沿岸,是世界上廣泛種植培育的一種蔬菜,具有較高的經(jīng)濟(jì)和食用價值。隨著生活水平的提高,人們對蔬菜作物的營養(yǎng)品質(zhì)及保健作用要求也逐漸提高。甘藍(lán)類蔬菜作物是人們公認(rèn)的抗癌蔬菜之一,其抗癌活性主要來源于包括異硫氰酸鹽在內(nèi)的硫代葡萄糖苷。硫代葡萄糖苷(Glucosinolate)簡稱硫苷,又叫芥子油苷(Mustard oil glucoside),是植物中一種富含硫和氮的次生代謝產(chǎn)物。目前已明確結(jié)構(gòu)的硫苷至少有120種,其中大多數(shù)分布于十字花科植物中,它們作為風(fēng)味物質(zhì)存在于十字花科蔬菜和調(diào)味類作物中而被人類社會認(rèn)識已久。在近幾十年中人們漸漸發(fā)現(xiàn),這種含氮和硫的植物次生代謝物質(zhì)具有抗癌、生物殺菌和保護(hù)植物作用,其重要性越來越受到人們的重視和關(guān)注。例如,保健蔬菜西蘭花中的抗癌活性物質(zhì)蘿卜硫素(Sulforaphane)就是4-甲基亞磺酰丁基硫苷(Glucoraphanin,GRA)的降解產(chǎn)物。
通過對擬南芥中控制脂肪族硫苷側(cè)鏈長度的GS-Elong QTL位點(diǎn)的克隆,人們發(fā)現(xiàn)了三個基因MAM1、MAM2和MAM3。研究發(fā)現(xiàn),MAM1在側(cè)鏈延伸的前3個循環(huán)中具有催化作用,MAM2僅對第1個循環(huán)起作用,而MAM3負(fù)責(zé)前6個循環(huán)?;蚯贸@示,MAM2只對參與1次側(cè)鏈延伸的脂肪族硫苷生成具有重要作用,MAMl主要控制參與2次側(cè)鏈延伸循環(huán)的脂肪族硫苷的合成,MAM3則可以生成所有長度的脂肪族硫苷,但特別容易生成發(fā)生1次、5次和6次循環(huán)的硫苷。在所有的擬南芥基因型中,僅有1個(Sorbo)同時存在MAMl和MAM2,其它的只含有MAMl和MAM2中的1個。MAM位點(diǎn)的多態(tài)性導(dǎo)致了硫苷結(jié)構(gòu)的多樣性,這可能是為了更好地適應(yīng)生態(tài)環(huán)境的挑戰(zhàn)。
CS-Elong位點(diǎn)負(fù)責(zé)擬南芥和蕓薹屬植物中占主導(dǎo)地位的3或4碳脂肪族硫苷的產(chǎn)生,在Streptanthus中,GS-Elong位點(diǎn)也負(fù)責(zé)5碳硫苷的生成,在其它物種中甚至負(fù)責(zé)更長碳鏈硫苷的合成,這可能是由位點(diǎn)的進(jìn)化引起的。GS-Elong位點(diǎn)基因編碼MAM酶家族,該酶家族既直接影響硫苷側(cè)鏈長度,也通過控制GS-PRO位點(diǎn)進(jìn)一步影響硫苷側(cè)鏈不同基團(tuán)的形成。
CS-Elong的功能在擬南芥中研究得比較透徹,但在甘藍(lán)中的研究很少。本研究主要以生物信息學(xué)分析為主要技術(shù)手段,充分詳細(xì)地挖掘甘藍(lán)EST數(shù)據(jù)庫,并對甘藍(lán)GS-Elong候選基因進(jìn)行預(yù)測分析和討論,為甘藍(lán)GS-Elong基因的克隆以及硫苷甘藍(lán)新品種的選育提供理論基礎(chǔ)。
1材料與方法
1.1試驗(yàn)材料
擬南芥GS-Elong位點(diǎn)基因(At5g23010、At5g23020和AJ486899)均來源于TAIR(www.ar-abidopsis.org)和NCBI數(shù)據(jù)庫(www.ncbi.nlm.nih.gov);甘藍(lán)基因組及基因注釋數(shù)據(jù)庫來源于NCBI(http:∥Brassicadb.org);白菜GS-Elong基因來源于BRAD(http:∥Brassieadb.org),并且參考Wang等的研究;系統(tǒng)進(jìn)化樹構(gòu)建所涉及蛋白序列均來源于UniProt(WWW.uniprot.org)、TAIR(www.arabidopsis.org)和BRAD(http:∥Brassi-cadb.org)。
1.2試驗(yàn)方法
利用擬南芥GS-Elong基因的全長CDS及蛋白序列在NCBI(www.ncbi.nlm.nih.gov)中對甘藍(lán)基因組及注釋基因數(shù)據(jù)庫進(jìn)行BLASTN及BLASTP檢索,得到具備Score≥100、E-value≤1010。和Coverage≥70%條件的甘藍(lán)注釋基因作為擬南芥GS-Elong位點(diǎn)基因的候選同源基因。多序列比對及聚類分析采用Mega軟件。序列一致性分析和點(diǎn)陣圖分別采用EMBOSS軟件包的Needle程序和Polydot程序(emboss.source-forge.net)。
2結(jié)果與分析
2.1甘藍(lán)GS-Elong位點(diǎn)基因的預(yù)測
針對擬南芥GS-Elong位點(diǎn)中3個硫苷生物合成基因(MAM1、MAM2和MAM3),采用BLASTN和BLASTP程序?qū)Ω仕{(lán)基因組和44 940個注釋基因(http:∥brassicadb.org/brad/)進(jìn)行檢索分析,共發(fā)現(xiàn)4個同源基因(B01020647、B01017070、B01037823和Bol017071)。
GS-Elong位點(diǎn)基因是脂肪族硫苷側(cè)鏈延伸的直接作用基因,擬南芥中該位點(diǎn)存在的3個旁系同源基因MAM1、MAM2和MAM3均位于第5號染色體,并且MAM1(At5g23010)與MAM3(At5g23020)為tandem基因。甘藍(lán)中該位點(diǎn)預(yù)測的4個基因中的2個tandem基因B01017070和B01017071位于第6號染色體,另外2個基因B01020647和B01037823分別位于第3號和第4號染色體。
2.2甘藍(lán)與擬南芥GS—Elong位點(diǎn)基因的同源比較
經(jīng)在核酸水平上的一致性比較發(fā)現(xiàn),甘藍(lán)和擬南芥GS-Elong位點(diǎn)基因高度同源(表1),擬南芥3個旁系同源基因問的一致性在82.7%~97.2%之間,其中MAM1和MAM2間的一致性高達(dá)97.2%。甘藍(lán)4個旁系同源基因與擬南芥同源基因的一致性維持在66.1%~84.3%之間;其中B01017070、B01020647與擬南芥同源基因問的一致性較高,均在80%以上;B01037823與擬南芥同源基因問一致性次之,在72.5%以上;B01017071與擬南芥同源基因問的一致性最低,維持在66%左右。甘藍(lán)4個旁系同源基因問的一致性保持在62.0%~83.7%之間,其中B01017071與甘藍(lán)中其他同源基因存在62.0%~67.3%的一致性,其他3個同源基因間的一致性則維持在比較高的水平(73.8%~83.7%)。
2.3擬南芥和甘藍(lán)GS-Elong位點(diǎn)基因結(jié)構(gòu)比較
擬南芥與甘藍(lán)GS-Elong位點(diǎn)同源基因結(jié)構(gòu)比較如圖1所示,6個基因整體結(jié)構(gòu)較為類似,尤其是外顯子數(shù)目和大小高度一致,只有B01017071和B01037823分別較擬南芥GS-Elong位點(diǎn)基因少3個和1個外顯子,內(nèi)含子的大小是導(dǎo)致各GS-Elong位點(diǎn)基因全長存在較大差異的主要原因。
擬南芥和甘藍(lán)GS-Elong位點(diǎn)在基因外顯子數(shù)目、大小及所占基因比例等方面的比較如表2所示,擬南芥MAM1和MAM3均包含10個外顯子,并且其全基因長度、CDS長度、CDS所占全基因的比例均較為一致,僅在Exon10上MAM1較MAM3多9個堿基。甘藍(lán)GS-Elong位點(diǎn)的4個基因在全基因長度方面差異較大,B01037823最長,為4258 bp;B01017070最短,為2795 bp。擬南芥和甘藍(lán)GS-Elong位點(diǎn)CDS長度差別不大,B01017070最長,為1 527 bp;B01017071最短,為1236 bp。B01017070、B01017071、B01020647和B01037823分別含有10、7、10和9個外顯子。B01017070的Exonl~Exon8與擬南芥GS-Elong位點(diǎn)基因大小一致,僅在Exon9和Exon10中稍有差別;B01017071缺少Exon7、Exon8和Exon10,另外Exonl和Exon9較擬南芥GS-Elong位點(diǎn)基因分別少15和3個堿基;B01020647的Exon2~Ex-on9與擬南芥GS-Elong位點(diǎn)基因大小一致,而Exonl少12個堿基,Exon10稍長于擬南芥GS-Elong位點(diǎn)基因;B01037823在Exon2、Exon3、Ex-or6~Exon9與擬南芥GS-Elong位點(diǎn)基因保持一致,但缺少Exon4,另外,Exonl和Exonl0較短。擬南芥和甘藍(lán)GS-Elong位點(diǎn)基因CDS所占全基因的比例在各基因間存在較大差別,其中擬南芥MAM1和MAM3所占比例相差較小,分別為40.00%和40.66%;而甘藍(lán)4個基因的比例范圍相差較大,為30.58%~54.63%,其中B01037823最小,B01017070最大。
2.4 GS-Elong位點(diǎn)基因的系統(tǒng)進(jìn)化分析
對擬南芥(AT)、白菜(CC)和甘藍(lán)(B0)3個已有參考基因組物種的GS-Elong位點(diǎn)蛋白序列進(jìn)行系統(tǒng)聚類分析,結(jié)果(圖2)顯示,擬南芥MAM1與MAM2親緣關(guān)系較近,與MAM3親緣關(guān)系相對較遠(yuǎn)。參考甘藍(lán)和擬南芥基因組、甘藍(lán)和白菜基因組間的共線性,初步確定甘藍(lán)中分別存在2個BoMAM1(Bo1017070和Bo1020647)和2個BoMAM3(Bo1017071和Bo1037823)。
3小結(jié)與討論
本研究借助生物信息學(xué)分析技術(shù),在甘藍(lán)GS-Elong位點(diǎn)預(yù)測到4個旁系同源候選基因(Bol020647、Bol017070、Bol037823和Bol017071)。甘藍(lán)和擬南芥GS-Elong位點(diǎn)同源基因間在核酸水平上的一致性為66.1%~84.3%;甘藍(lán)GS-Elong位點(diǎn)4個旁系同源問的一致性保持在62.0%~83.7%之間。甘藍(lán)和擬南芥GS-Elong位點(diǎn)基因在外顯子數(shù)目、大小方面高度一致,但其中2個甘藍(lán)GS-Elong位點(diǎn)基因Bol017071和B01037823分別較擬南芥GS-Elong位點(diǎn)基因少3個和1個外顯子。系統(tǒng)進(jìn)化及共線性分析初步確定,甘藍(lán)中分別存在2個BoMAM1(Bol017070和Bol020647)和2個BoMAM3(Bol017071和Bol037823)。
擬南芥、甘藍(lán)和白菜基因組大小分別為157、520 Mb和485 Mb。有研究表明白菜和甘藍(lán)基因組存在多倍化事件,與多倍化事件理論上伴隨的同源基因多拷貝現(xiàn)象相呼應(yīng),在擬南芥中存在3個MAM旁系同源基因(其中MAM2僅在擬南芥1個生態(tài)型中出現(xiàn)),在白菜中發(fā)現(xiàn)了7個旁系同源基因(http:∥Brassicadb.org),本研究在甘藍(lán)中發(fā)現(xiàn)4個旁系同源基因。本研究結(jié)果為利用生物技術(shù)手段人為操縱甘藍(lán)中有益硫苷的結(jié)構(gòu)和數(shù)量、創(chuàng)制甘藍(lán)新品種及今后甘藍(lán)基因組學(xué)的研究奠定基礎(chǔ)。