官玲亮 查英 白琳 于福來 陳振夏 陳曉鷺 謝小麗 王凱 黃梅
摘 ?要:MYB轉錄因子是植物中龐大的轉錄因子家族之一,在植物體內有著廣泛的生物學功能?;诎{香全長轉錄組數據庫,利用DNAMAN 6.0、MEGA 5.05軟件以及ProtParam、WebLogo和SOPMA在線網站分析艾納香MYB轉錄因子家族蛋白的分類、理化性質、氨基酸序列高級結構、保守結構域、系統(tǒng)進化等。結果表明,挖掘到127個BbMYB基因,預測47條具有MYB轉錄因子保守結構域的蛋白序列;根據結構域可分為1R-BbMYB和R2R3-MYB 2個亞類,其中R2-BbMYB與R3-BbMYB基序中都含有3個保守的色氨酸,而R1-BbMYB基序只有2個保守的色氨酸;艾納香MYB家族蛋白均為親水性蛋白,熱穩(wěn)定性較高且富含堿性氨基酸,大部分蛋白以無規(guī)則卷曲為主,其中R2R3-BbMYB3、R2R3-BbMYB4與1R-BbMYB15蛋白是以α-螺旋為主;與擬南芥MYB轉錄因子家族共同構建的進化樹發(fā)現,艾納香MYB家族在進化上包括2個大類,6個亞類,通過艾納香與擬南芥MYB蛋白序列相鄰或是進化關系近可以預測艾納香MYB基因功能,為進一步對艾納香MYB家族基因研究及其功能鑒定提供科學依據。
關鍵詞:艾納香;MYB轉錄因子;生物信息學中圖分類號:S31??????文獻標識碼:A
Bioinformatics Analysis of MYB?Transcription Factor Family inBlumea balsamifera
GUAN Lingliang1, ZHA?Ying1,2, BAI?Lin1,2, YU?Fulai1*,?CHEN?Zhenxia1, CHEN?Xiaolu1, XIE?Xiaoli1, WANG?Kai1,?HUANG?Mei1
1. Tropical Crops Genetic Resources Institute, Chinese Academy of Tropical Agricultural Sciences?/ Hainan Provincial Engineering Research Center forBlumea balsamifera,?Haikou, Hainan?571101, China; 2. College of Agricultural, Heilongjiang Bayi Agricultural University, Daqing, Heilongjiang?163319, China
Abstract: MYB is one of the largest transcription factors family and has a wide range of biological functions in plants.?Based on the full-length transcriptome database ofBlumea balsamifera,?DNAMAN?6.0, MEGA?5.05 software and ProtParam, WebLogo and SOPMA online sites were used to analyze?and predict the types, physicochemical properties,?advanced structure of amino acid sequence,?conserved domain and phylogenetic evolution of MYB transcription factor inB.?balsamifera,?The results showed that 127BbMYBgenes were extracted, and 47 protein sequences with MYB conserved domains were predicted. According to the domain, they could?be divided into 1R-BbMYB and R2R3-MYB.?Meanwhile, the R2-BbMYB and R3-BbMYB motifs contained?three conserved tryptophans, while R1-BbMYB contained?only two. Morever, all proteins?of MYB family?inB.?balsamiferawere?hydrophilic with high thermal stability and rich in basic amino acids. And most of the proteins were?irregular curls?except the R2R3-BbMYB3, R2R3-BbMYB4 and 1R-BbMYB15. The MYB family ofB.?balsamiferaevolved into two?major categories?and six subcategories?by comparing with the evolutionary tree?ofArabidopsis thaliana.?It would provide a method for further research on the functional identification of the MYB family?inB.?balsamiferaby the adjacent or evolutionary relationship with the same function.
Keywords: Blumea balsamifera;?MYB transcription factor;?bioinformatics
DOI: 10.3969/j.issn.1000-2561.2020.07.004
自1987年轉錄因子基因首次被報道以來,參與調控植物生長發(fā)育、次生代謝以及抗逆等相關的數百種轉錄因子不斷被分離[1]。其中,MYB轉錄因子是參與植物代謝和調控的一類重要的轉錄因子[2]。MYB蛋白N端具有由R基序(R1, R2和R3)組成的保守的MYB結構域,且每個R基序含約52個氨基酸,折疊形成螺旋-轉角-螺旋(HTH)結構[3]。根據結構域特征將MYB家族分為1R-MYB/MYB-related、R2R3-MYB、R1R2R3- MYB和4R-MYB 4個亞類[4]。其中,1R-MYB/ MYB-related在維持染色體結構的完整性和調節(jié)基因轉錄上起重要作用[5];而R2R3-MYB蛋白參與調節(jié)植物的生長發(fā)育[6]以及次級代謝[7-8]等。
艾納香[Blumea balsamifera(L.) DC.]為菊科艾納香屬植物,是我國一種重要的民族藥材,主要分布在我國華南、西南地區(qū),在黎族、苗族、壯族等少數民族中有著悠久的藥用歷史[9]。艾納香以根、嫩枝、葉入藥,用于治療傷風感冒以及病毒性感染等[10]。研究表明艾納香還具有抗腫瘤、保肝護肝、抗氧化、抗酪氨酸激酶等藥理作用,其中起生物活性的化學成分是黃酮、萜類、噻吩、苯丙素、揮發(fā)油等[11]。艾納香素是艾納香中一種重要的黃酮類化合物[12],能修復肝細胞藥源性損傷而具有保肝作用[13]。夏奇峰等[14]預測了艾納香中黃酮類物質的代謝途徑,表明查耳酮合成酶(CHS)與查耳酮異構酶(HCT)是該路徑中的關鍵酶,可通過調節(jié)這些關鍵酶基因的表達量來提高艾納香黃酮類成分的含量,從而提高艾納香的品質。大量研究表明,MYB轉錄因子參與黃酮類次生代謝產物生物合成的調控,如黃芩[15](Scutellaria baicalensisGeorgi)、擬南芥[16](Ar a b i dopsis thaliana)、苦蕎[17] [Fagopyrum tataricum(L.) Gaertn.],但在艾納香中未見相關報道。
本研究在前期艾納香全長轉錄組測序的基礎上,利用生物信息學挖掘艾納香MYB家族轉錄調控因子,并對其結構域、系統(tǒng)進化、蛋白質理化性質及氨基酸高級結構進行分析,為進一步對艾納香MYB家族基因的研究及其功能鑒定提供科學依據。
1.1序列來源
從艾納香全長轉錄組數據庫中挖掘到127條BbMYB序列,通過SMART(http://smart.embl.de/)和NCBI BLAST(https://blast.ncbi.?nlm.nih.gov/?Blast.?cgi)預測得到47條具有MYB轉錄因子保守結構域的蛋白序列,并通過NCBI的CCD(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrp sb.cgi)數據庫對蛋白保守結構域進行鑒定。根據牛義嶺等[2]對MYB基因家族的結構分類,將47條艾納香MYB蛋白序列歸類到1R-MYB、R2R3-MYB類轉錄因子中。擬南芥(Arabidopsis thaliana,At)的MYB蛋白序列從TAIR(https:// www.arabidopsis.org/)中下載。
1.2 ?序列分析
利用ExPASy提供的在線ProtParam軟件(http://web.expasy.org/protparam/)對艾納香MYB轉錄因子編碼蛋白的氨基酸數目、分子量、等電點、脂肪族氨基酸數和蛋白質疏水性等理化性質進行分析。
通過WebLogo網站(http://weblogo.berkeley. edu/)對艾納香MYB轉錄因子蛋白進行保守氨基酸基序分析。
利用DNAMAN 6.0軟件對47條艾納香MYB轉錄因子蛋白和與其結構相似的26條擬南芥MYB轉錄因子的氨基酸序列進行比對。然后利用MEGA 5.05軟件繪制候選艾納香MYB基因與26個擬南芥MYB基因的進化樹,采用鄰接法(neighbor-joining method),參數選擇P-distance、pairwise deletion和Bootstrap method=1000,其他參數選擇默認值。
利用SOPMA(https://npsa-prabi.ibcp.fr/NPSA/ npsa_sopma.html)在線軟件進行艾納香MYB轉錄因子蛋白二級結構分析,并利用Swiss-Model(https://swissmodel.expasy.org/interactive/)程序對艾納香MYB轉錄因子編碼蛋白進行三級結構同源建模。
2.1 艾納香MYB轉錄因子家族基因的挖掘以及蛋白序列的分類
本研究從艾納香全長轉錄組數據庫中挖掘到127條BbMYB堿基序列,通過SMART和NCBI BLAST預測,去除重復序列及冗余轉錄本后,最終得到47條具有完整MYB保守結構域的序列,命名為BbMYB1~BbMYB47,其中屬于1R-MYB轉錄因子的堿基序列有32條,長度分布在916~ 3185?bp,屬于R2R3-MYB類的堿基序列有15條,長度分布在1615~5173 bp。
2.2 艾納香MYB轉錄因子家族蛋白理化性質分析
通過ProtParam在線軟件對艾納香MYB轉錄因子家族蛋白的理化性質(表1)進行分析可知,艾納香R2R3-MYB轉錄因子的氨基酸殘基數為158~1307,1R-MYB轉錄因子的氨基酸殘基數為140~799;蛋白等電點在堿性范圍內的數量多于酸性范圍的數量,表明該家族蛋白富含堿性氨基酸;整個家族蛋白的總平均親水性GRAVY均為負值,表明艾納香MYB轉錄因子家族均為親水性蛋白,且熱穩(wěn)定性較高。
2.3 ?艾納香MYB轉錄因子家族蛋白保守基序分析
利用DNAMAN 6.0和WebLogo網站對47個艾納香R2R3-MYB以及1R-MYB類轉錄因子分別進行多序列比對,保守區(qū)域以及2個亞類的基序特征進行分析(圖1)。結果表明,R1結構在第5位和第24位有一個保守的色氨酸(W),而
第3個色氨酸被組氨酸(H)、賴氨酸(K)以及精氨酸(R)取代。通過分析R2R3-MYB類蛋白的保守結構域,發(fā)現R2、R3結構都包括3個極度保守的色氨酸,且色氨酸之間間隔19~20個氨基酸,符合MYB結構域特征;其次R3基序除第2個色氨酸高度保守外,第1個和第3個色氨酸處還包括苯丙氨酸(F);此外R2、R3結構域中
還包括其他保守的氨基酸殘基,如R2結構中的谷氨酸(E)、天冬氨酸(D)、天冬酰胺(N)、半胱氨酸(C)、精氨酸(R)和亮氨酸(L);R3結構中的谷氨酸(E)、脯氨酸(P)、甘氨酸(G)、天冬酰胺(N)、精氨酸(R)和賴氨酸(K),這些氨基酸殘基對維持MYB轉錄因子功能域的HTH結構有關。
2.4 ?艾納香MYB轉錄因子家族系統(tǒng)進化分析
利用MEGA 5.05軟件構建艾納香和擬南芥MYB蛋白家族系統(tǒng)進化樹(圖2),結果顯示艾納香和擬南芥MYB基因被聚為2個大類(Ⅰ、Ⅱ),其中1R-MYB主要是分布在Ⅰ類,占艾納香總1R-MYB類轉錄因子的76.9%,R2R3-MYB主要被聚在第Ⅱ類中,占艾納香總R2R3-MYB類轉錄因子的58.3%。第Ⅰ大類又被分為5個亞類,1R-BbMYB24與1R-BbMYB15是最先被分化的,其中1R-BbMYB24與1RMYB-At2G470210相鄰,而在1R-BbMYB15基礎上進化出相鄰的1R-Bb MYB40與1R-BbMYB19,在第5個亞類基礎上衍生出R2R3-MYB類。由此可以看出,第Ⅱ類是在第Ⅰ類基礎上進化來的,其中1R-BbMYB2與R2R3-BbMYB13相鄰且與R2R3MYB-At1 G1 4350、R2R3MYB-At2G02820位于同一進化亞類不同分支;R2R3-BbMYB14與R2R3-BbMYB16相鄰且是在R2R3-BbMYB17基礎上進化來的;R2R3-BbMYB3、R2R3MYB-At1G09770與R2R3- Bb MYB8、R2R3-AtMYB44分別相鄰,表明其進化關系更近。在該進化樹中存在著不同結構域但同源性較高的情況,如R2R3-BbMYB1與1R-BbMYB41相鄰;同時存在著相同結構域同源性高的情況,如1R-BbMYB42與1R-BbMYB35,1R-BbMYB26與1RMYB-At3G09600分別相鄰。總體表明,艾納香MYB家族蛋白與擬南芥MYB家族蛋白同源性高,在相鄰或較近進化關系上的
2.5艾納香MYB轉錄因子家族蛋白高級結構分析
2.5.1 ?蛋白質二級結構分析??利用SOPMA對艾納香MYB蛋白質進行二級結構預測(圖3),結果顯示大部分蛋白都以無規(guī)則卷曲為主,α-螺旋、β-轉角、β-折疊散布于整個蛋白序列;其中R2R3- BbMYB3、R2R3-BbMYB4與1R-BbMYB15蛋白是以α-螺旋為主,β-轉角、β-折疊以及無規(guī)則卷曲分布在蛋白序列中。值得注意的是,α-螺旋恰
藍色:α-螺旋;紅色:β-折疊;綠色:β-轉角;紫色:無規(guī)則卷曲。
Blue: α-helix; Red: β-sheet; Green: β-turn;Purple: Random?coil.
好是MYB基因保守結構域的位置。因此,推測α-螺旋參與維持MYB轉錄因子家族的HTH結構。
2.5.2 ?蛋白質三級結構分析??分別選取R2R3- BbMYB9、R2R3-BbMYB4、1R-BbMYB2、1R- BbMYB15序列進行三級結構同源建模(圖4),結果表明,艾納香MYB家族所有蛋白均具有α-螺旋、無規(guī)則卷曲、β-折疊和β-轉角,這與二級結構預測相符合。R2R3-BbMYB亞族蛋白三級結構相似性較高,R2、R3結構分別有3個α-螺旋,能明顯看到HTH結構,主要是在無規(guī)則卷曲長度有所不同。對于1R-BbMYB亞族蛋白,主要在α-螺旋數量上存在差異。
3 討論
本研究鑒定出32個1R-BbMYB和15個R2R3- BbMYB基因,相對于擬南芥基因組中的118個2R-MYB基因[18]偏少。通過對其翻譯的氨基酸序列中保守結構域基序分析,表明R2R3-BbMYB結構域比1R-BbMYB結構域保守。其中,R2-BbMYB與R3-BbMYB基序中都含有3個保守的色氨酸,色氨酸之間的間隔氨基酸數目分別為20、20與20、19。R3-BbMYB基序第1個和第3個色氨酸處還包括疏水氨基酸苯丙氨酸,這與黑果枸杞R3-MYB基序一致[19],表明MYB基因家族N端在不同植物間高度保守,對于維持HTH的構型有著重要的作用[20];其中R2-BbMYB基序中2個色氨酸之間的間隔與杜海[21]描述大豆植物R2R3- MYB一致,說明艾納香R2-BbMYB基序的色氨酸非常保守;而R3-BbMYB基序中色氨酸比大豆中少1個氨基酸殘基,表明艾納香R2R3-BbMYB類轉錄因子中的R3-Bb MYB基序發(fā)生氨基酸缺失,該區(qū)域可能是其植物進化和功能分化的熱點區(qū);而R1-BbMYB基序只有2個保守的色氨酸且間隔19個氨基酸,第3個色氨酸被組氨酸(H)、賴氨酸(K)以及精氨酸(R)取代。蛋白理化性質表明艾納香蛋白富含堿性氨基酸,均屬于親水性蛋白以及熱穩(wěn)定性好。分別對1R-BbMYB和R2R3-BbMYB蛋白進行二級結構預測,分析表明所有蛋白都具α-螺旋、β-轉角、β-折疊及無規(guī)則卷曲結構,且大部分為無規(guī)則卷曲為主,只R2R3- BbMYB3、R2R3-BbMYB4與1R-?BbMYB15蛋白是以α-螺旋為主;從2個亞族中選取具有代表性的序列R2R3-BbMYB9、R2R3-BbMYB4、1R- BbMYB2、1R-BbMYB15進行三級結構同源建模,發(fā)現R2R3-BbMYB亞族中的蛋白質三級結構相似性較高,在無規(guī)則卷曲長度上略有不同;而1R-BbMYB亞族蛋白,主要是在α-螺旋數量上差異較大。通過對艾納香MYB轉錄因子的保守結構域基序分析以及氨基酸高級結構的預測,為研究艾納香屬及菊科其他植物的MYB轉錄因子的結構和功能進化奠定基礎。
擬南芥作為一種模式植物,其MYB轉錄因子的功能研究已經比較清楚,如AtMYB123/ TT2、AtMYB4、AtMYB7和AtMYB24參與調控擬南芥花青素的合成[22-23];研究者認為可以根據進化樹中位于同一分枝中擬南芥蛋白功能來預測研究物種蛋白的功能,如在構建的進化樹中,與擬南芥R2R3-MYB處于相鄰位置上的葡萄、水稻的R2R3-MYB轉錄因子被認為具有相同或相似功能[19];本研究用所得47條艾納香MYB類轉錄因子蛋白與22條擬南芥MYB蛋白作系統(tǒng)進化樹,結果顯示艾納香和擬南芥MYB基因被聚為2個大類,其中1R-MYB分布廣泛,在Ⅰ類中占艾納香總1R-MYB類轉錄因子的76.9%,R2R3-MYB主要被聚在第Ⅱ類中,占艾納香總R2R3-MYB類轉錄因子的58.3%;在該進化樹中存在著不同結構域但與相同結構域相鄰的情況??傮w表明,艾納香MYB家族蛋白與擬南芥MYB家族蛋白同源性高。其中,R2R3-BbMYB8與R2R3-AtMYB44相鄰;R2R3-AtMYB11與R2R3- AtMYB12相鄰且在R2R3-BbMYB9基礎上進化來的。研究表明擬南芥中黃酮類物質主要受AtMYB11、AtMYB12和AtMYB111以及AtMYB75/?PAP1、AtMYB90、AtMYB114調控[24-25]。因此可以推測R2R3-BbMYB9可能具有相似的功能,可能與艾納香中黃酮類次生代謝產物的生物合成有關,這將為艾納香MYB轉錄因子的功能研究提供參考。
本研究參考擬南芥MYB轉錄因子家族,通過多種生物信息學軟件分析艾納香MYB基因家族的結構特征,為進一步研究艾納香MYB轉錄因子的結構和功能奠定基礎。
參考文獻
[1]?楊致榮, 王興春, 李西明, 等. 高等植物轉錄因子的研究進展[J]. 遺傳, 2004, 26(3): 403-408.
[2]?牛義嶺, 姜秀明, 許向陽. 植物轉錄因子MYB基因家族的研究進展[J]. 分子植物育種, 2016, 14(8): 2050-2059.
[3]?Lipsick J S. One billion years of Myb[J]. Oncogene, 1996, 13(2): 223-235.
[4]?祝志欣, 魯迎青. 花青素代謝途徑與植物顏色變異[J]. 植物學報, 2016, 51(1): 107-119.
[14]?夏奇峰, 趙??致, 劉紅昌, 等. 艾納香黃酮類物質生物合成途徑分析[J]. 中國中藥雜志, 2016, 41(19): 3630-3636.
[15]?伍??翀. 黃芩MYB轉錄因子功能初步研究[D]. 武漢: 武漢工業(yè)學院, 2012.
[16]?Borevitz J O, Xia Y J, Blount J,et al. Activation tagging identifies a conserved MYB regulator of phenylpropanoid biosynthesis[J]. The Plant Cell, 2000, 12(12): 2383-2394.
[17]?趙海霞, 吳小峰, 白悅辰, 等. 苦蕎芽期黃酮合成關鍵酶和MYB轉錄因子基因的表達分析[J]. 農業(yè)生物技術學報, 2012, 20(2): 121-128.
[18]?Stracke R, Werber M, Weisshaar B. The R2R3-MYB gene family inArabidopsis thaliana[J]. Current Opinion in Plant Biology, 2001, 4(5): 447-456.
[19]?嚴??莉, 王翠平, 陳建偉, 等. 基于轉錄組信息的黑果枸杞MYB轉錄因子家族分析[J]. 中國農業(yè)科學, 2017, 50(20): 3991-4002.
[20]?Jin H, Martin C. Multifunctionality and diversity within the plant MYB-gene family[J]. Plant Molecular Biology, 1999, 41(5): 577-585.
[21]?杜??海. 植物MYB轉錄因子家族的分子進化機制及調控類黃酮生物合成MYB基因的鑒定[D]. 雅安: 四川農業(yè)大學, 2013.
[22]?Lepiniec L, Debeaujon I, Routaboul J M,et al. Genetics and biochemistry of seed flavonoids[J]. Annual Review of Plant Biology, 2006, 57(1): 405-430.
[23]?Song S S, Qi T C, Huang H,et al. The Jasmonate-ZIM domain proteins interact with the R2R3-MYB transcription factors MYB21 and MYB24 to affect Jasmonate-regulated stamen development inArabidopsis[J]. The Plant Cell, 2011, 23(3): 1000-1013.
[24]?Stracke R, Ishihara H, Huep G,et al. Differential regulation of closely related R2R3-MYB transcription factors controls?flavonol accumulation in different parts of theArabidopsisthalianaseedling[J]. The Plant Journal, 2007, 50(4): 660-?677.
[25]?Gonzalez A, Zhao M, Leavitt J M,et al. Regulation of the anthocyanin biosynthetic pathway by the TTG1/bHLH/Myb transcriptional complex inArabidopsisseedlings[J]. The Plant Journal, 2008, 53(5): 814-827.