夏承東 方大偉
摘要?FAR-RED IMPAIRED RESPONSE 1(FAR1)?基因在植物生長發(fā)育中起著重要的調(diào)控作用。該研究采用生物信息學的方法,從辣椒基因組中鑒定得到20個CaFAR1轉錄因子家族成員,系統(tǒng)進化分析表明,20個?CaFAR1基?因分為6個亞家族,其中18個?CaFAR1?基因分布在8條染色體上,8 號染色體上有3個,2號、6號、7號、12號染色體各分布1個,6號和10號染色體上各分布2個,3號染色體上有6個。GO功能注釋表明,20個CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過程(BP)、細胞成分(CC)和分子功能(MF)。
關鍵詞?辣椒;?FAR?基因家族;生物信息學;全基因組分析
中圖分類號?Q943.2?文獻標識碼?A
文章編號?0517-6611(2020)14-0097-06
doi:10.3969/j.issn.0517-6611.2020.14.027
Abstract?FAR-RED IMPAIRED RESPONSE 1 (FAR1)?gene plays an important regulatory role in plant growth and development.In this study,bioinformatics was used to identify 20 CaFAR1 transcription factor family members from the pepper genome.Phylogenetic analysis showed that 20?CaFAR1?genes were divided into 6 subfamilies.Of all 20?CaFAR1?genes,18 genes were mapped to the 8 chromosomes.Three genes were mapped to chromosome 3,four genes were mapped to chromosome 2,6,7 and 12 with one for each.Two genes were mapped to the chromosome 6 and 10.There are 6 genes were mapped to the chromosome 3.GO analysis showed that the functions of 20?CaFAR1?genes were enriched in biological process,cell component and molecular function.
Key words?Pepper;?FAR?gene family;Bioinformatics;Whole genome analysis
FAR-RED IMPAIRED RESPONSE 1(FAR1)是轉座酶衍生的一類轉錄因子,是能夠在遠紅光下直接激活FHY1/FHL的基因表達,其在植物淀粉合成代謝和碳饑餓引發(fā)的能量匱乏過程中起著重要調(diào)控作用[1-2]。目前,已在擬南芥中分離得到了14個FAR1家族成員被鑒定,編碼的蛋白長度為531~851個氨基酸[3]。而在棉花中鑒定出88個?FAR1?基因,其中亞洲棉27個、雷蒙氏棉35個、陸地棉26個,編碼的蛋白長度為158~1 134個氨基酸[4]。辣椒是我國一種重要的蔬菜作物,光照時間、光照強度以及不同光質對辣椒產(chǎn)量和品質都有很大的影響。然而關于辣椒光敏色素調(diào)控相關基因的報道鮮見。該研究利用生物信息學方法,篩選、鑒定辣椒?FAR1?基因家族成員,通過分析其系統(tǒng)進化關系、基因結構,以及染色體定位,探索辣?椒FAR1?基因功能及其應用。
1?材料與方法
1.1?植物序列來源
辣椒?(Capsicum annuum?L.)FAR1轉錄因子家族數(shù)據(jù)來源于NCBI(https:∥www.ncbi.nlm.nih.gov/genome/?term=Capsicum+annuum)與PlantTFDB(http:∥planttfdb.cbi.pku.edu.cn)等數(shù)據(jù)庫。擬南芥?(Arabidopsis thaliana)與番茄(Solanum lycopersicum)?FAR1轉錄因子氨基酸序列來源于PlantTFDB數(shù)據(jù)庫。
1.2?辣椒FAR1轉錄因子家族基因的篩選
從TAIR(https:∥www.arabidopsis.org)數(shù)據(jù)庫中下載擬南芥FAR1轉錄因子序列,利用BlastP篩選出辣椒的FAR1轉錄因子,得到候選CaFAR1蛋白序列。將這些序列導入CD-HIT Suite(http:∥weizhongli-lab.org/cdhit_suite/cgi-bin/index.cgi)在線網(wǎng)站中去除冗余序列,再經(jīng)過SMART(http:∥smart.embl-heidelberg.de/opennewwindow)在線預測,得到具有FAR1保守結構域的蛋白序列。參考Lin等[5]的分類方法,將辣椒FAR1蛋白序列歸為6類。
1.3?辣椒FAR1轉錄因子家族理化分析與進化樹構建
利用在線ProtParam網(wǎng)站(https:∥web.expasy.org/protparam/)對鑒定出的辣椒FAR1蛋白進行理化性質分析。 使用MEGA 7.0軟件內(nèi)置的 Clustal W程序對鑒定出的FAR1類蛋白序列和擬南芥FAR1家族、番茄FAR1家族蛋白序列進行序列比對,采用鄰接(neighbor-joining,N)法構建系統(tǒng)發(fā)育樹,選用Poisson模型并設置Bootstrap value為1 000,缺失值處理方式為配對刪除(pairwise deletion),其他參數(shù)使用默認值[5]。
1.4?辣椒FAR1轉錄因子家族氨基酸序列比對、保守結構域分析?將辣椒FAR1轉錄因子家族的氨基酸序列上傳至DNAMAN8.0中進行比對,得到氨基酸序列比對結果。利用MEME在線軟件(http:∥meme suit.org)對辣椒FAR1轉錄因子保守元件進行預測分析,將motif數(shù)量設為10。對辣椒FAR1轉錄因子保守元件進行圖形化顯示。
1.5?辣椒FAR1轉錄因子家族基因結構與染色體定位分析
利用本地軟件UltraEdit得到辣椒FAR1轉錄因子家族基因結構信息與染色體信息,將辣椒FAR1轉錄因子家族基因結構信息上傳至在線軟件GSDS(http:∥gsds.cbi.pku.edu.cn/)中得到基因結構示意圖。用在線軟件MG2C(http:∥mg2c.iask.in/mg2c_v2.0/)對辣椒FAR1轉錄因子家族的染色體信息進行圖形化顯示。
1.6?辣椒FAR1轉錄因子家族基因GO注釋分析
使用Blast2GO的非冗余蛋白質數(shù)據(jù)庫軟件與默認參數(shù),首先將CaFAR1氨基酸序列與NCBI進行BlastP比對。然后對每一個CaFAR1都獲取GO注釋,得到GO注釋的ID,導出數(shù)據(jù)之后使用GraphPad作圖。
2?結果與分析
2.1?CaFAR1轉錄因子家族的鑒定及特征?利用本地 Blast 軟件對辣椒全基因組蛋白序列進行檢索,同時手動剔除重復序列,只保留一個FAR1結構域的蛋白序列。最后得到20個只具有一個FAR1結構域的轉錄因子家族成員[6],利用ExPASy(https:∥web.expasy.org/cgi-bin/protparam/protparam)在線軟件對CaFAR1轉錄因子家族進行分析,得到CaFAR1轉錄因子的氨基酸大小、分子量和等電點等信息(表1)。辣椒FAR1轉錄因子家族成員蛋白序列含有氨基酸數(shù)目為220(XP_016567405.1)~877(XP_016580413.1),利用 Expasy 軟件預測CaFAR1分子量大小為 25 546.68(XP_016567405.1)~100 799.3 Da (XP_016580413.1),等電點為 5.12(XP_016553207.1)~9.39 (XP_016567405.1),除CaFAR1-14之外,其余CaFAR1蛋白都不穩(wěn)定。從以上理化性質來分析,辣椒FAR1轉錄因子家族成員之間的各項指標跨度較大,具有差異性,在篩選出的20個轉錄因子家族成員中,有13個轉錄因子的等電點小于7,占 65%,呈弱酸性。
2.2?CaFAR1轉錄因子家族系統(tǒng)進化樹?PlantTFDB v5.0(http:∥planttfdb.cbi.pku.edu.cn)在線軟件中下載擬南芥與番茄的FAR1轉錄因子家族,利用MEGA7系統(tǒng)進化樹構建軟件構建擬南芥、番茄與辣椒的系統(tǒng)進化樹。系統(tǒng)進化樹的構建使用最大近似然法,MEGA7參數(shù)采用系統(tǒng)默認值,最終得到圖1所示的進化樹。根據(jù)Lin等[5]對擬南芥的分類方法對得到的系統(tǒng)進化樹進行亞家族分類,共分為6個亞家族,命名為I~VI。
2.3?氨基酸序列比對
使用DANMAN8.0 序列分析軟件對辣椒?FAR1?基因保守結構域進行分析,結果表明,20個蛋白序列均含有FAR1 保守結構域(圖2、3)。所有FRS亞組的大多數(shù)成員都具有N末端C2H2鋅指結構域,N末端FAR1 DNA結合結構域是WRKY-神經(jīng)膠質細胞缺失(WRKY-GCM1)超家族中的一種C2H2鋅指結構域,它與多種靶標的啟動子區(qū)域中的特定順式元件結合。
2.4?CaFAR1保守結構域與基因結構分析
將CaFAR1氨基酸序列上傳至在線軟件MEME(http:∥meme suit.org)對辣椒FAR1序列的保守元件進行預測分析,將motif數(shù)量設為10,分析結果如圖4B所示。發(fā)現(xiàn),IV亞家族中除CaFAR1-10與CaFAR1-20外均含有10個motif;亞家族Ⅰ中所有CaFAR1都含有10個motif,亞家族Ⅲ中缺少motif 9;亞家族V中均含有motif 3;亞家族VI中均含有motif 1與motif 8。
通過辣椒GFF注釋文件中獲得CaFAR1的內(nèi)含子外顯子的數(shù)據(jù),上傳至在線軟件GSDS(http:∥gsds.cbi.pku.edu.cn/)對辣椒?FAR1?基因家族的基因結構進行分析。由圖4C可知,不同亞組成員的內(nèi)含子數(shù)量存在差異。亞家族I中基因內(nèi)含子較為相似,內(nèi)含子數(shù)量較多,CaFAR1-16內(nèi)含子有10個,在所有CaFAR1中數(shù)量最多;亞家族Ⅱ的成員含有1~3個內(nèi)含子;亞家族Ⅲ的CaFAR1-5內(nèi)含子有1個,CaFAR1-8有2個內(nèi)含子;亞家族Ⅳ成員含有2~5個內(nèi)含子;亞家族Ⅴ成員含有2~5個內(nèi)含子;亞家族Ⅵ成員含有2~6個內(nèi)含子。
2.5?染色體定位
通過辣椒GFF注釋文件中獲得?CaFAR1的?位置信息,上傳至在線軟件mg2c(http:∥mg2c.iask.in/mg2c_v2.0/)中,將18?個 CaFAR1?基因定位到辣椒染色體上,有2?個CaFAR1基?因未被定位到染色體上。 如圖5所示,辣椒的18個?CaFAR1?基因分布在8條染色體上,8 號染色體上有3個,2號、6號、7號、12號染色體各分布1個,6號和10號染色體上各分布2個,3號染色體上有6個。
2.6?GO分析?使用Blast2GO的非冗余蛋白質數(shù)據(jù)庫軟件與默認參數(shù),首先將CaFAR1氨基酸序列與NCBI進行BlastP比對。然后對每一個CaFAR1都獲取GO注釋,得到GO注釋的ID,導出數(shù)據(jù)之后使用GraphPad作圖(圖6)??梢园l(fā)現(xiàn),20個CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過程(BP)、細胞成分(CC)和分子功能(MF),大部分CaFAR1與離子結合相關,顯然與CaFAR1的鋅指結構域功能吻合。CaFAR1在細胞成分(CC)和分子功能(MF)這兩方面發(fā)揮了很大的作用,由此可以推斷CaFAR1在辣椒的生長發(fā)育與信號傳遞中發(fā)揮了很大的作用。
3?討論與小結
光是植物生長和發(fā)育的能量來源,光敏色素(phytochromes)是高等植物光受體網(wǎng)絡中不可或缺的一個,其通過感受紅光和遠紅光,直接或間接調(diào)控下游的轉錄因子,從而控制下游基因表達,影響植物的種子萌發(fā)、幼苗去黃化、葉綠體運動等生長發(fā)育進程[4,7-10]。FAR1是phyA信號通路中重要的正向調(diào)控因子之一。已在擬南芥、棉花中分離得到了多個FAR1家族成員[3-4]。該研究通過對辣椒全基因組掃描,從中鑒定得到了20個CaFAR1轉錄因子家族成員,結合基因結構分析與系統(tǒng)進化分析,20個?CaFAR1基?因分為6個亞家族。其中,18個?CaFAR1基?因分布在8條染色體上。而對其功能注釋表明,20個CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過程(BP)、細胞成分(CC)和分子功能(MF)。
參考文獻
[1]陳芳,鄧興旺.遠紅光受體伴侶蛋白FHY1在介導基因表達和植物生長發(fā)育過程中的獨特作用[J].遺傳,2014,36(9):958.
[2]CASAL J J.Phytochromes,cryptochromes,phototropin:Photoreceptor interactions in plants[J].Photochemistry & photobiology,2000,71(1):1-11.
[3]LIN R C,WANG H Y.Arabidopsis?FHY3/FAR1?gene family and distinct roles of its members in light control of Arabidopsis development[J].Plant physiology,2004,136(4):4010-4022.
[4]袁娜,王彤,劉廷利,等.棉花FAR1/FHY3基因家族的全基因組分析[J].棉花學報,2018,30(1):1-11.
[5]LIN M ,GANG L.FAR1-RELATED SEQUENCE (FRS) and FRS-RELATED FACTOR (FRF) family proteins in arabidopsis growth and development[J].Frontiers in plant science,2018, 9:692.
[6]惠甜,沈兵琪,王連春,等.桑樹bHLH轉錄因子家族全基因組鑒定與分析[J].分子植物育種,2019,17(17):5624-5637.
[7]HEIJDE M,ULM R.UV-B photoreceptor-mediated signalling in plants[J].Trends in plant science,2012,17(4):230-237.
[8]劉圈煒,何云,齊勝利,等.光敏色素研究進展[J].中國農(nóng)學通報,2005,21(5):237-241.
[9]FURUYA M.Phytochromes:Their molecular species,gene families,and functions[J].Annual review of plant physiology and plant molecular biology,1993,44(1):617-645.
[10]TEPPERMAN J M,ZHU T,CHANG H S,et al.Multiple transcription-factor genes are early targets of phytochrome A signaling[J].Proceedings of the national academy of sciences of the United States of America,2001,98(16):9437-9442.