徐珍珍 倪萬潮 張香桂 郭琪 徐鵬 沈新蓮
YABBY基因家族屬于鋅指蛋白超家族(Zinc finger super-family)的亞家族,在調(diào)控植物葉和花器官發(fā)育過程中起著重要的作用,是一類植物特有的轉(zhuǎn)錄因子家族,與植物形態(tài)建成有關(guān)[1-4]。該基因家族有兩個(gè)保守的結(jié)構(gòu)域,位于N端的C2C2鋅指結(jié)構(gòu)域和位于C端的YABBY結(jié)構(gòu)域,又稱與HMG box相似的“螺旋-環(huán)-螺旋”結(jié)構(gòu)域[5-7]。
目前,在很多植物中都有YABBY基因家族的相關(guān)報(bào)道,在模式生物擬南芥中研究的較為清楚。擬南芥YABBY基因家族有6個(gè)成員:FIL(FILAMENTOUS FLOWER)、CRC(CRABSCLAW)、INO(INNER NO OUTER)(YABBY4)、YAB2(YABBY2)、YAB3(YABBY3)和 YAB5(YABBY5)[8-12], 擬 南芥YABBY基因家族的6個(gè)成員在其側(cè)生器官發(fā)育過程中發(fā)揮著不同的作用。FIL參與花器官和葉的發(fā)育[10,13];CRO 和 INO 基因有一定的組織特異性,CRC參與蜜腺和心皮遠(yuǎn)軸端的發(fā)育,INO基因則在外部珠被的發(fā)育中起著重要的作用[11,14-16];YAB2、YAB3和YAB5基因主要在擬南芥的營養(yǎng)組織中特異表達(dá)[3,17]。
棉花作為重要的經(jīng)濟(jì)作物,其纖維是紡織工業(yè)重要的天然纖維來源。隨著基因組學(xué)和測序技術(shù)的發(fā)展,二倍體D組雷蒙德氏棉(Gossypium raimondii L.)、A組亞洲棉石系亞1號(G. arboreum)以及陸地棉遺傳標(biāo)準(zhǔn)系TM-1(G. hirsutum L. acc. TM-1)相繼完成了測序工作[18-22],從而為全基因組范圍內(nèi)分析基因家族奠定了一定的數(shù)據(jù)基礎(chǔ)。當(dāng)前關(guān)于棉花YABBY基因家族的研究,鮮有報(bào)道。本研究利用公布的陸地棉TM-1的基因組數(shù)據(jù),對YABBY基因家族進(jìn)行全基因組掃描,并進(jìn)一步分析其亞細(xì)胞定位、染色體分布、基序、進(jìn)化關(guān)系和組織表達(dá)情況等,旨在為進(jìn)一步深入探索YABBY基因家族的功能提供理論依據(jù)。
兩份陸地棉標(biāo)準(zhǔn)系TM-1(G. hirsutum L.)蛋白和CDS數(shù)據(jù):中國農(nóng)業(yè)科學(xué)院棉花研究所(http://cgp.genomics.org.cn/page/species/index.jsp)和 Pytozome 網(wǎng)站(http://www.phytozome.net/);擬南芥 YABBY 基因家族的氨基酸蛋白序列和陸地棉EST數(shù)據(jù)來自NCBI(http://www.ncbi.nlm.nih.gov/protein/)數(shù)據(jù)庫;衣藻(Chlamydomonas reinhardtii)YABBY基因家族的氨基酸序列來自PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)數(shù)據(jù)庫。
1.2.1 棉花YABBY基因家族的鑒定與進(jìn)化樹分析 將下載的擬南芥6條YABBY基因家族成員在SMART網(wǎng)站進(jìn)行結(jié)構(gòu)域預(yù)測,然后在Pfam(http://pfam.janelia.org/)網(wǎng)站下載鑒定到的YABBY結(jié)構(gòu)域的種子文件(PF04690.9),最終利用HMMER3.1b1程序在TM-1蛋白數(shù)據(jù)庫中搜索棉花YABBY基因家族成員。
利用MEGA 5.1生物信息軟件對鑒定的TM-1基因組中YABBY基因家族氨基酸序列和擬南芥中6條YABBY基因家族的氨基酸序列進(jìn)行多重序列比對,采用鄰接(Neighbor-Joining,NJ)算法構(gòu)建進(jìn)化樹,進(jìn)行1000次Boot strap抽樣。
1.2.2 棉花YABBY基因家族的染色體定位和亞細(xì)胞定位 結(jié)合Perl語言編程,在TM-1基因組數(shù)據(jù)中的gff3文件中提取YABBY基因家族成員的染色體起始和結(jié)束位置,然后利用MapInspect軟件繪制YABBY基因家族的染色體物理分布圖;利用在線軟件 CELLO:Subcellular Localization Predictive System預(yù)測棉花YABBY基因家族成員的亞細(xì)胞定位。
1.2.3 棉花YABBY基因家族的基序分析 利用MEME軟件分析棉花YABBY基因家族成員的motif類型和排列順序。參數(shù)設(shè)置如下:基序的最大發(fā)現(xiàn)數(shù)目是10個(gè),其它參數(shù)為默認(rèn)值。
1.2.4 棉花的YABBY基因家族的組織表達(dá)分析 在NCBI數(shù)據(jù)庫下載330 520條陸地棉的EST序列。利用Blastn程序,搜索棉花YABBY基因家族成員CDS序列與陸地棉EST序列的匹配,分析棉花YABBY基因家族成員的組織表達(dá)類型,參數(shù)設(shè)定標(biāo)準(zhǔn)為E≤10-10,其他參數(shù)為默認(rèn)值。
通過結(jié)構(gòu)域預(yù)測,發(fā)現(xiàn)擬南芥的6條YABBY蛋白的氨基酸序列都含有YABBY結(jié)構(gòu)域。因此,利用Pfam網(wǎng)站中下載的YABBY結(jié)構(gòu)域的種子文件在陸地棉標(biāo)準(zhǔn)系TM-1蛋白數(shù)據(jù)庫中搜索,又在SMART網(wǎng)站進(jìn)行進(jìn)一步確認(rèn)和人工校對,最終在TM-1基因組中鑒定到23條YABBY蛋白。根據(jù)一般植物蛋白的命名方法,對鑒定到的23條棉花YABBY蛋白進(jìn)行了命名,并統(tǒng)計(jì)了它們對應(yīng)的蛋白ID號、所在的亞基因組以及對應(yīng)的蛋白長度,從159個(gè)氨基酸到220個(gè)氨基酸不等(表1)。
我們以衣藻(Chlamydomonas reinhardtii)作為外類群,利用陸地棉標(biāo)準(zhǔn)系TM-1基因組中鑒定的23條YABBY蛋白和擬南芥的6條YABBY蛋白的氨基酸序列構(gòu)建了系統(tǒng)進(jìn)化樹(圖1)。與擬南芥類似,棉花的YABBY基因家族也分為4個(gè)亞組(Ⅰ-Ⅳ),且每個(gè)亞組都有與擬南芥同源的基因:GhYABBY15、GhYABBY5、GhYABBY17、GhYABBY6、GhYABBY8、GhYABBY19、GhYABBY4、GhYABBY16、GhYABBY1和GhYABBY23屬于Ⅲ亞組,與擬南芥AtYABBY5屬于一個(gè)亞組;GhYABBY10、GhYABBY18和GhYABBY7屬于亞組Ⅳ,與擬南芥AtYABBY2屬于一個(gè)亞組;GhYABBY22、GhYABBY12、GhYABBY9、GhYABBY20、GhYABBY11和 GhYABBY21屬于亞組Ⅰ,與擬南芥FIL和AtYABBBY3屬于一個(gè)亞組;GhYABBY3、GhYABBY14、GhYABBY13和 GhYABBY2屬于亞組Ⅱ,與擬南芥CRC和AtYABBY4屬于一個(gè)亞組。
表1 陸地棉TM-1全基因組YABBY基因家族的基本信息
圖1 陸地棉TM-1和擬南芥YABBY基因家族的進(jìn)化樹
陸地棉標(biāo)準(zhǔn)系TM-1基因組中23個(gè)YABBY基因家族成員分布在16條染色體和1條Scaffold上,分 別 為 A01、D01、D02、A03、A04、A05、D05、A06、D06、A07、D07、A09、A11、D11、A12、D12和 Scaffold3715_D01(圖 2);除了 A07和 D07染色體上分別有3個(gè)成員外,其他染色體上只有1-2個(gè)成員(圖2);在TM-1的A亞組和D亞組具有成對的平行進(jìn)化同源YABBY基因,分布在D01、A01、Scaffold3715_D01、A05、D05、A07、D07、A11、D11、A12和D12染色體上;共有9對共線性基因,分別為GhYABBY13和GhYABBY2、GhYABBY1和 GhYABBY23、GhYABBY5和 GhYABBY15、GhYABBY6和 GhYABBY17、GhYABBY7和GhYABBY18、GhYABBY8和 GhYABBY19、GhYABBY9和 GhYABBY20、GhYABBY11和 GhYABBY21、GhYABBY12和 GhYABBY22。
圖2 陸地棉TM-1基因組上YABBY基因家族的染色體分布
TM-1基因組中23個(gè)YABBY基因家族成員的亞細(xì)胞定位預(yù)測結(jié)果(表1)表明,13個(gè)YABBY基因家族成員具有1個(gè)亞細(xì)胞定位,定位到細(xì)胞核或胞外;8個(gè)成員具有2個(gè)亞細(xì)胞定位,定位到細(xì)胞核和胞外;2個(gè)成員具有3個(gè)亞細(xì)胞定位,定位到細(xì)胞核、胞外和線粒體上。
棉花的YABBY基因組家族分為4個(gè)亞組(Ⅰ-Ⅳ),23個(gè)YABBY基因家族成員的基序分析結(jié)果顯示,每個(gè)亞組的成員具有相同或類似的基序類型和排列順序,而且9對同線性基因具有相同的基序類型和排列順序(圖3)。GhYABBY15、GhYABBY5、GhYABBY17、GhYABBY6、GhYABBY8、GhYABBY19、GhYABBY4、GhYABBY16、GhYABBY1和GhYABBY23具有相似的motifs(7-8個(gè)),motif排列順序也基本相同;GhYABBY18、GhYABBY10和GhYABBY7具有類似的motifs(4-6個(gè)),排序順序 也 類 似 ;GhYABBY22、GhYABBY12、GhYABBY9、GhYABBY20、GhYABBY11和 GhYABBY21具有完全相同的6個(gè)motifs,而且排列順序完全相同;GhYABBY3、GhYABBY14、GhYABBY13和 GhYABBY2具有相似的4-5個(gè)motifs,排序順序類似。
圖3 陸地棉TM-1基因組上YABBY基因家族的基序類型
TM-1全基因組中的23個(gè)YABBY基因家族成員在棉花的根、莖、葉、花、蕾、幼胚珠、胚珠、纖維、莖端分生組織、分生區(qū)和胚性愈傷組織中廣泛表達(dá)(表2)。進(jìn)一步分析發(fā)現(xiàn),所有的23個(gè)YABBY基因家族成員在2個(gè)及兩個(gè)以上的組織中表達(dá);23個(gè)YABBY基因家族成員全部在花、蕾和莖端分生組織中表達(dá),大部分成員在根、莖和分生區(qū)域表達(dá),還有部分基因在胚珠和胚性愈傷組織表達(dá)。
本研究通過生物信息學(xué)和基因組學(xué)手段在陸地棉標(biāo)準(zhǔn)系TM-1全基因組中共鑒定了23條YABBY基因家族成員,其中有9對為共線性基因(A亞組和D亞組),只有5個(gè)基因不是共線性基因,這與以往的報(bào)道一致,二倍體A組亞洲棉和D組雷蒙德氏棉基因組之間存在很強(qiáng)的共線性[22];9對共線性基因中,除了GhYABBY9和GhYABBY20、GhYABBY13和GhYABBY2以外,其余7對共線性基因的氨基酸長度完全相同;除了GhYABBY13和GhYABBY2這一對共線性基因外,其余的每對共線性基因具有完全相同的亞細(xì)胞定位;9對共線性基因在進(jìn)化上非常保守,在進(jìn)化樹上分布在相同的分支上;motif分析表明,除GhYABBY13和GhYABBY2外,其余的每對共線性基因具有完全相同的motif類型和排列順序。
擬南芥YABBY基因家族有6個(gè)成員FIL、CRC、AtYABBY4、AtYABBY2、AtYABBY3 和 AtYABBY5,其中每個(gè)成員的功能都已研究得較為清楚[8-12]。進(jìn)化樹分析表明,本研究在陸地棉標(biāo)準(zhǔn)系TM-1基因組中鑒定的23個(gè)YABBY基因家族成員與擬南芥一樣,分為4個(gè)亞組,且每一個(gè)亞組都有與擬南芥同源的基因,由此推測,棉花和擬南芥YABBY基因家族成員在功能上可能具有一定的相似性。因此,研究棉花YABBY基因家族成員的功能,在一定程度上可以參考擬南芥的研究結(jié)果。
表2 陸地棉TM-1全基因組YABBY基因家族的組織表達(dá)模式
組織表達(dá)分析(表2)表明,TM-1全基因組中的23個(gè)YABBY基因家族成員具有較為廣泛的組織表達(dá)類型。其中,23個(gè)YABBY基因家族成員全部在花、蕾和莖端分生組織中表達(dá),這在一定程度上暗示棉花的YABBY基因家族成員可能參與了花、蕾和莖端分生組織的發(fā)育;亞組Ⅰ的6個(gè)成員和亞組Ⅲ的部分成員都在根、莖和分生區(qū)域表達(dá),這在一定程度上暗示這些基因可能參與了根、莖和分生區(qū)域的發(fā)育。
本研究從陸地棉標(biāo)準(zhǔn)系TM-1(Gossypium hirsutum L. acc. TM-1)基因組中鑒定到23個(gè)YABBY基因家族成員,具有不同的亞細(xì)胞定位和染色體定位,且具有較為廣泛的組織表達(dá)類型。這些成員分為4個(gè)亞組,每個(gè)亞組成員間具有相似的基序類型和排列順序。
[1]Bowman JL. The YABBY gene family and abaxial cell fate[J].Curr Opin Plant Biol, 2000, 3(1):17-22.
[2]Reinhardt D, Frenzm M, Mandel T, et al. Microsurgical and laser ablation analysis of leaf positioning and dorsoventral patterning in tomato[J]. Development, 2005, 132(1):15-26.
[3]Eckardtn A. YABBY genes and the development and origin of seed plant leaves[J]. Plant Cell, 2010, 22(7):2103.
[4]Yamada T, Yokota S, Hirayama Y, et al. Ancestral expression patterns and evolutionary diversification of YABBY genes in angiosperms[J]. Plant J, 2011, 67(1):26-36.
[5]Kanaya E, Nakajima N, Okada K. Non-sequence-specific DNA binding by the FILAMENTOUS FLOWER protein from Arabidopsis thaliana is reduced by EDTA[J]. J Biol Chem, 2002, 277(14):11957-11964.
[6]Sieber P, Petrascheck M, Barberis A, et al. Organ polarity in Arabidopsis NOZZLE physically interacts with members of the YABBY family[J]. Plant Physiol, 2004, 135(4):2172-2185.
[7]Golz JF, Roccaro M, Kuzoff R, et al. GRAMINIFOLIZ promotes growth and polarity of Antirrhinum leaves[J]. Development, 2004,131(15):3661-3670.
[8]Siegfried KR, Eshed Y, Baum SF, et al. Members of the YABBY gene family specify abaxial cell fate in Arabidopsis[J]. Development,1999, 126(18):4117-4128.
[9]Villanueva JM, Broadhvest J, Hayser BA, et al. INNER NO OUTER regulates abaxial-adaxial patterning in Arabidopsis ovules[J].Genes Dev, 1999, 13(23):3160-3169.
[10]Sawa S, Watanabe K, Goto K, et al. FILAMENTOUS FLOWER, a meristem and organ identity gene of Arabidopsis, encodes a protein with a zinc finger and HMG-related domains[J]. Genes Dev,1999, 13(9):1079-1088.
[11]Bowman JL, Smyth DR. CRABS CLAW, a gene that regulates carpel and nectary development in Arabidopsis, encodes a novel protein with zinc finger and helix-loop-helix domains[J]. Development,1999, 126(11):2387-2396.
[12]Lee JY, Baum SF, Oh SH, et al. Recruitment of CRABS CLAW to promote nectary development within the eudicot clade[J].Development, 2005, 132:5021-5032.
[13]Stahle MI, Kuehlich J, Staron L, et al. YABBYs and the transcriptional corepressors LEUNIG and LEUNIG_HOMOLOG maintain leaf polarity and meristem activity in Arabidopsis[J].Plant Cell, 2009, 21(10):3105-3118.
[14]Zhang XL, Yang ZP, Zhang J, et al. Ectopic expression of BraYAB1-702, a member of YABBY gene family in Chinese cabbage, causes leaf curling, inhibition of development of shoot apical meristem and flowering stage delaying in Arabidopsis thaliana[J]. J Mol Sci, 2013, 14(7):14872-14891.
[15]Shamimuzzaman M, Vodkin L. Genome-wide identification of binding sites for NAC and YABBY transcription factors and coregulated genes during soybean seedling development by ChIPSeq and RNASeq[J]. BMC Genomics, 2013, 14(1):477.
[16]Ha CM, Jun JH, Fletcher JC. Control of Arabidopsis leaf morphogenesis through regulation of the YABBY and KNOX families of transcription factors[J]. Genetics, 2010, 186(1):197-206.
[17]Sarojam R, Sappl PG, Goldshmidt A, et al. Differentiating Arabidopsis shoots from leaves by combined YABBY activities[J].Plant Cell, 2010, 22(7):2113-2130.
[18]Wang KB, Wang ZW, Li FG, et al. The draft genome of a diploid cotton Gossypium raimondii[J]. Nat Genet, 2012, 44:1098-1103.
[19]Parerson AH, Wendel JF, Gundlach H, et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres[J]. Nature, 2012, 492:423-427.
[20]Li FG, Fan GY, Wang KB, et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics, 2014, 46(6):562-574.
[21]Li FG, Fan GY, Lu CR, et al. Genome sequence of cultivatedUpland cotton(Gossypium hirsutum TM-1)provides insights into genome evolution[J]. Nature Biotechnology, 2015, doi:10.1038/nbt. 3208.
[22]Zhang TZ, Hu Y, Jiang WK, et al. Sequencing of allotetraploid cotton(Gossypium hirsutum L. acc. TM-1)provides a resource for fiber improvement[J]. Nature Biotechnology, 2015, doi:10.1038/nbt. 3207