崔力文, 鄭 婷, 張克坤, 張 川, 上官凌飛, 房經(jīng)貴
(南京農(nóng)業(yè)大學(xué)園藝學(xué)院, 江蘇 南京 210095)
葡萄Actin基因家族的鑒定及進(jìn)化和表達(dá)分析
崔力文, 鄭 婷, 張克坤, 張 川, 上官凌飛, 房經(jīng)貴①
(南京農(nóng)業(yè)大學(xué)園藝學(xué)院, 江蘇 南京 210095)
采用生物信息學(xué)方法從葡萄(VitisviniferaLinn.)全基因組中鑒定Actin基因家族,并對(duì)各基因的染色體定位和結(jié)構(gòu)特征,編碼蛋白質(zhì)的理化性質(zhì)、亞細(xì)胞定位、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)和系統(tǒng)進(jìn)化,以及不同組織的基因表達(dá)進(jìn)行研究。結(jié)果表明:葡萄Actin基因家族16個(gè)基因分布在12條染色體上。16個(gè)基因的結(jié)構(gòu)特征及其編碼蛋白質(zhì)的理化性質(zhì)差異較大。16個(gè)基因的長(zhǎng)度及其內(nèi)含子總長(zhǎng)度的變化范圍較大,編碼序列(CDS)和外顯子總長(zhǎng)度的變化范圍較小。除登錄號(hào)GSVIVG01008254001和GSVIVG01014035001的基因外,其他14個(gè)基因的GC含量均低于其CDS的GC含量。除登錄號(hào)GSVIVG01008254001的基因外,其他15個(gè)基因編碼的蛋白質(zhì)的理論相對(duì)分子質(zhì)量為12 534.54~82 612.33,理論等電點(diǎn)為pI 4.92~pI 9.13。16個(gè)基因編碼蛋白質(zhì)的消光系數(shù)為14 105~73 645,脂肪族氨基酸指數(shù)為65.54~92.06,其中9個(gè)為穩(wěn)定蛋白,7個(gè)為不穩(wěn)定蛋白。除登錄號(hào)GSVIVG01014035001的基因外,其他15個(gè)基因編碼的蛋白質(zhì)均為親水性蛋白。登錄號(hào)GSVIVG01016517001的基因編碼的蛋白質(zhì)定位于細(xì)胞質(zhì)和細(xì)胞核,其他15個(gè)基因編碼的蛋白質(zhì)定位于細(xì)胞質(zhì)。二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)顯示:葡萄Actin基因家族16個(gè)基因編碼的蛋白質(zhì)均由α螺旋、無(wú)規(guī)則卷曲和延伸鏈構(gòu)成,且總體以無(wú)規(guī)則卷曲為主。系統(tǒng)進(jìn)化分析和不同組織的基因表達(dá)分析結(jié)果顯示:與擬南芥〔Arabidopsisthaliana(Linn.) Heynh.〕相似,葡萄Actin基因家族16個(gè)基因編碼的蛋白質(zhì)分為3個(gè)亞家族,ClassⅡ亞家族(營(yíng)養(yǎng)型)包括登錄號(hào)GSVIVG01003099001和GSVIVG01026580001的基因編碼的蛋白質(zhì),這2個(gè)基因在所有組織中的表達(dá)均較高;ClassⅢ亞家族(生殖型)包括登錄號(hào)GSVIVG01033494001、GSVIVG01024980001和GSVIVG01016550001的基因編碼的蛋白質(zhì),這3個(gè)基因在花粉、雄蕊和花中的表達(dá)均較高;ClassⅠ亞家族包括其他11個(gè)基因編碼的蛋白質(zhì),這11個(gè)基因在各組織中的表達(dá)總體上較低。研究結(jié)果顯示:葡萄Actin基因家族的表達(dá)具有組織特異性。
葡萄;Actin基因家族; 系統(tǒng)進(jìn)化; 基因表達(dá)
Abstract:Actingene family was identified from the whole genome ofVitisviniferaLinn. by bioinformatics method, and chromosome localization and structural characteristics of each gene, physicochemical property, subcellular localization, secondary structure, tertiary structure and phylogeny of proteins encoded, and gene expression in different tissues were researched. The results show that sixteen genes inActingene family ofV.viniferaare distributed on twelve chromosomes. There are great differences in structural characteristics of sixteen genes and physicochemical property of their proteins encoded. Variation ranges of length of sixteen genes and their total length of introns are large, and those of total length of coding sequences (CDSs) and exons are small. Except genes with accession number of GSVIVG01008254001 and GSVIVG01014035001, GC contents in other fourteen genes are lower than those in their CDSs. Except gene with accession number of GSVIVG01008254001, theoretical relative molecular mass of proteins encoded by other fifteen genes is 12 534.54-82 612.33, and their theoretical isoelectric point is pI 4.92-pI 9.13. Extinction coefficient of proteins encoded by sixteen genes is 14 105-73 645, their aliphatic amino acid index is 65.54-92.06, in which, there are nine stable proteins and seven instable proteins. Except gene with accession number of GSVIVG01014035001, proteins encoded by other fifteen genes are hydrophilic proteins. Protein encoded by gene with accession number of GSVIVG01016517001 is located in cytoplasm and nucleus, and those encoded by other fifteen genes are located in cytoplasm. The secondary and tertiary structures show that proteins encoded by sixteen genes inActingene family ofV.viniferaare composed withαhelix, random coil and extended strand, and in general, random coil is the main component. Analysis results of phylogeny and gene expression in different tissues show that being similar toArabidopsisthaliana(Linn.) Heynh., proteins encoded by sixteen genes inActingene family ofV.viniferacan be divided into three subfamilies. Class Ⅱ subfamily (vegetative type) includes proteins encoded by genes with accession number of GSVIVG01003099001 and GSVIVG01026580001, and the expression of these two genes in all tissues is higher. Class Ⅲ subfamily (reproductive type) includes proteins encoded by genes with accession number of GSVIVG01033494001, GSVIVG01024980001 and GSVIVG01016550001, and the expression of these three genes in pollen, stamen and flower is higher. Class Ⅰ subfamily includes proteins encoded by the rest of eleven genes, and the expression of these eleven genes in all tissues is generally low. The results of gene expression analysis show that there is tissue specificity in expression ofActingene family ofV.vinifera.
Keywords:VitisviniferaLinn.;Actingene family; phylogeny; gene expression
自從在脊椎動(dòng)物骨骼細(xì)胞中發(fā)現(xiàn)肌動(dòng)蛋白(actin)以來,陸續(xù)在真菌、高等植物[1]以及藻類中發(fā)現(xiàn)了肌動(dòng)蛋白的存在。肌動(dòng)蛋白廣泛存在于植物界,是微絲的主要組分。肌動(dòng)蛋白參與許多對(duì)植物發(fā)育至關(guān)重要的生理活動(dòng),如細(xì)胞形狀的維持,胞質(zhì)流動(dòng)以及細(xì)胞的分裂分化、重力感應(yīng)和信號(hào)傳導(dǎo)等[2];在尖端生長(zhǎng)的花粉管中,膜泡和生殖細(xì)胞基于肌動(dòng)蛋白的運(yùn)動(dòng)而移動(dòng)[3]。有關(guān)多核糖體與微絲共定位的研究認(rèn)為,微絲骨架影響多核糖蛋白在細(xì)胞內(nèi)的分布[4]。植物肌動(dòng)蛋白豐富的功能和作用由Actin基因家族的多樣性決定。多細(xì)胞植物具有10個(gè)及以上Actin基因,如擬南芥〔Arabidopsisthaliana(Linn.) Heynh.〕[5]有10個(gè)Actin基因,碧冬茄(PetuniahybridaVilm.)[6]的基因組中有100多條Actin基因序列,從豌豆(PisumsativumLinn.)[7]卷須中克隆出18個(gè)Actin基因。高等植物的Actin基因家族成員具有多樣性和表達(dá)差異。McDowell等[8]研究了擬南芥Actin基因家族的結(jié)構(gòu)及進(jìn)化關(guān)系,認(rèn)為擬南芥Actin基因家族至少包含2個(gè)古代基因類型,在陸地植物進(jìn)化早期分化產(chǎn)生生殖和營(yíng)養(yǎng)2種類型,然后進(jìn)一步分化產(chǎn)生6種肌動(dòng)蛋白亞類,其中5種肌動(dòng)蛋白亞類具有不同的組織特異性表達(dá)模式。擬南芥肌動(dòng)蛋白的8個(gè)異型體中有大量的非保守氨基酸替換,所有氨基酸替換都發(fā)生在分子表面,除1個(gè)Actin基因外,在其余Actin基因的核苷酸序列中的同一位置均含有3個(gè)內(nèi)含子,且每個(gè)Actin基因都含有1個(gè)180~220 nt的3′-非翻譯區(qū)(untranslated region,UTR)[9-10]。豌豆肌動(dòng)蛋白異型體可分為3種類型[11],這3類肌動(dòng)蛋白異型體基因在根、莖、葉、卷須、花粉和幼嫩果實(shí)中均可表達(dá),但在發(fā)育時(shí)間以及表達(dá)強(qiáng)度上存在明顯差異,而且具有組織特異性[12-13]。對(duì)豌豆Ⅱ類肌動(dòng)蛋白異型體3個(gè)基因的全序列測(cè)定結(jié)果顯示:3個(gè)基因的核苷酸序列完全相同,差別僅在于3′-UTR的長(zhǎng)度不同。此外,豌豆卷須中3類肌動(dòng)蛋白異型體基因的核苷酸序列同源性為80%,其氨基酸序列同源性為94%[11]。
葡萄(VitisviniferaLinn.)是世界最古老的果樹樹種之一,也是世界性的重要水果。2007年,葡萄基因組草圖測(cè)序完成[14],為后續(xù)通過生物信息學(xué)方法挖掘、鑒定和分析葡萄基因組奠定了基礎(chǔ)。本研究采用生物信息學(xué)方法對(duì)葡萄全基因組中的Actin基因家族進(jìn)行鑒定,對(duì)Actin基因家族中各基因的結(jié)構(gòu)特征,編碼蛋白質(zhì)的理化性質(zhì)、亞細(xì)胞定位、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)和系統(tǒng)進(jìn)化,以及各基因的組織表達(dá)模式進(jìn)行分析,以期為進(jìn)一步研究葡萄Actin基因的功能提供基礎(chǔ)資料。
1.1 材料
葡萄全基因組信息由Phytozome v12.0(https:∥phytozome.jgi.doe.gov/pz/portal.html)數(shù)據(jù)庫(kù)提供。葡萄芯片表達(dá)數(shù)據(jù)來源于NCBI的GEO數(shù)據(jù)庫(kù),編號(hào)GSE36128,包括葡萄54個(gè)不同組織樣品,覆蓋了葡萄不同生長(zhǎng)發(fā)育階段的大部分器官[15]。
1.2 方法
1.2.1Actin基因家族數(shù)據(jù)集的建立和染色體定位分析 首先利用葡萄全基因組序列,構(gòu)建本地BLAST數(shù)據(jù)庫(kù),以擬南芥Actin基因家族序列為靶序列執(zhí)行本地BLAST搜索;同時(shí),利用Pfam數(shù)據(jù)庫(kù)工具建立葡萄全基因組蛋白質(zhì)結(jié)構(gòu)域模型,利用HMMER程序篩選含有Actin典型結(jié)構(gòu)域(PF00022)的蛋白質(zhì)序列[16]。采用E值對(duì)篩選結(jié)果進(jìn)行可靠性評(píng)價(jià),E值越低越可靠。本研究選用E值小于等于10-5的序列作為候選蛋白質(zhì)序列,刪除重復(fù)序列。
從Phytozome v12.0數(shù)據(jù)庫(kù)下載的葡萄全基因組信息中提取Actin基因家族各基因的登錄號(hào)和染色體定位信息。
1.2.2 基因結(jié)構(gòu)特征分析 根據(jù)Phytozome v12.0數(shù)據(jù)庫(kù)提供的信息,分析基因長(zhǎng)度以及編碼序列(coding sequence,CDS)、外顯子、內(nèi)含子、3′-非翻譯區(qū)(UTR)和5′-UTR的數(shù)量和總長(zhǎng)度,采用DNASTAR軟件計(jì)算GC含量。
1.2.3 編碼蛋白質(zhì)的理化性質(zhì)分析 利用ProtParam tool(http:∥web.expasy.org/protparam/)分析Actin基因家族中各基因編碼蛋白質(zhì)的基本理化性質(zhì),包括氨基酸殘基數(shù)量、理論相對(duì)分子質(zhì)量、理論等電點(diǎn)、平均親水系數(shù)、消光系數(shù)、不穩(wěn)定系數(shù)及脂肪族氨基酸指數(shù)[17]。1.2.4 編碼蛋白質(zhì)的亞細(xì)胞定位、二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)分析 參照董晨等[18]的方法利用Plant-mPLoc sever程序進(jìn)行Actin基因家族各基因編碼蛋白質(zhì)的亞細(xì)胞定位;利用SOPMA程序分析蛋白質(zhì)二級(jí)結(jié)構(gòu);利用Phyre2(http:∥www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)在線繪制蛋白質(zhì)三級(jí)結(jié)構(gòu)圖。
長(zhǎng)期以來,我國(guó)危險(xiǎn)貨物國(guó)際運(yùn)輸和國(guó)內(nèi)運(yùn)輸在船舶技術(shù)條件、貨物適運(yùn)條件等方面是差異化要求,國(guó)際運(yùn)輸適用相關(guān)國(guó)際公約和規(guī)則,國(guó)內(nèi)運(yùn)輸則適用國(guó)內(nèi)法規(guī)和技術(shù)規(guī)范。但由于國(guó)際和國(guó)內(nèi)運(yùn)輸?shù)呢浳镞m運(yùn)條件不一致,導(dǎo)致危險(xiǎn)貨物國(guó)內(nèi)運(yùn)輸轉(zhuǎn)國(guó)際運(yùn)輸時(shí)需按照國(guó)際公約規(guī)定重新包裝、積載、隔離,給貨主與船東造成很大不便,也增加安全監(jiān)管與執(zhí)法難度。同時(shí),《危險(xiǎn)化學(xué)品安全管理?xiàng)l例》對(duì)危險(xiǎn)化學(xué)品的適運(yùn)要求統(tǒng)一適用于國(guó)際和國(guó)內(nèi)運(yùn)輸,未有所區(qū)分。在實(shí)踐中,長(zhǎng)期以來國(guó)內(nèi)運(yùn)輸包裝危險(xiǎn)貨物已在參照國(guó)際公約管理。
1.2.5 系統(tǒng)發(fā)育樹的構(gòu)建 通過Clustal Omega程序?qū)M南芥和葡萄Actin基因家族中各基因編碼的蛋白質(zhì)進(jìn)行多序列聯(lián)配比對(duì)分析并構(gòu)建系統(tǒng)發(fā)育樹。1.2.6Actin基因家族的組織表達(dá)分析 在葡萄芯片表達(dá)數(shù)據(jù)庫(kù)中選取Actin基因家族各基因的表達(dá)值,將原值以2為底取對(duì)數(shù)后采用MeV軟件繪制熱圖。
2.1 葡萄Actin基因家族的全基因組鑒定
葡萄Actin基因家族的信息見表1。由表1可見:葡萄Actin基因家族共包括16個(gè)基因,且各基因在染色體上的分布比較分散,分別分布在01、04、06、08、11、12、13、14、16、17、18和19號(hào)共12條染色體上,其中,13號(hào)染色體分布的基因數(shù)量最多(3個(gè)),11和17號(hào)染色體均分布2個(gè)基因,其他染色體均分布1個(gè)基因。
表1葡萄Actin基因家族的信息
Table1InformationofActingenefamilyofVitisviniferaLinn.
編號(hào)No.登錄號(hào)Accessionnumber染色體定位Chromosomelocalization1GSVIVG01000587001ch01:6782564-68104572GSVIVG01003099001ch12:8678866-86811353GSVIVG01008254001ch17:4031362-40614774GSVIVG01008255001ch17:4013614-40309335GSVIVG01014035001ch16:9532118-95324446GSVIVG01014840001ch19:10434342-104440227GSVIVG01015049001ch11:713295-7148608GSVIVG01015556001ch11:4862914-48670369GSVIVG01016517001ch13:3197303-320762310GSVIVG01016550001ch13:2880916-288302211GSVIVG01024980001ch06:5548568-555219112GSVIVG01026580001ch04:21427667-2143096813GSVIVG01032120001ch13:22480789-2249677614GSVIVG01033049001ch14:25325845-2533437115GSVIVG01033494001ch08:20249818-2025260016GSVIVG01036362001ch18:4225053-4229977
2.2 葡萄Actin基因家族的結(jié)構(gòu)特征分析
葡萄Actin基因家族的結(jié)構(gòu)特征見表2。由表2可見:葡萄Actin基因家族16個(gè)基因含1~16個(gè)編碼序列(CDS)和外顯子以及0~15個(gè)內(nèi)含子,登錄號(hào)GSVIVG01008254001的基因中外顯子和內(nèi)含子數(shù)量最多,登錄號(hào)GSVIVG01014035001的基因中外顯子和內(nèi)含子數(shù)量最少。葡萄Actin基因家族16個(gè)基因長(zhǎng)度的變化范圍較大,為327~30 116 bp。除登錄號(hào)GSVIVG01014035001的基因不含內(nèi)含子外,其他15個(gè)基因中內(nèi)含子總長(zhǎng)度的變化范圍較大,為314~28 412 bp。葡萄Actin基因家族16個(gè)基因中CDS和外顯子總長(zhǎng)度的變化范圍均較小,分別為327~2 178和326~2 544 bp。
由表2還可見:葡萄Actin基因家族16個(gè)基因中GC含量的變化范圍為30.48%~43.68%,CDS中GC含量的變化范圍為34.09%~50.23%。除登錄號(hào)GSVIVG01008254001和GSVIVG01014035001的基因外,其他14個(gè)基因的GC含量均低于其CDS的GC含量。
由表2還可見:葡萄Actin基因家族16個(gè)基因中登錄號(hào)GSVIVG01008255001、GSVIVG01014035001和GSVIVG01015556001的基因不含3′-非翻譯區(qū)(UTR),其他13個(gè)基因均含1個(gè)3′-UTR,且這13個(gè)基因中3′-UTR的總長(zhǎng)度為120~1 171 bp。登錄號(hào)分別為GSVIVG01008254001、GSVIVG01014035001、GSVIVG01015049001、 GSVIVG01015556001、GSVIVG01016550001和GSVIVG01036362001的基因不含5′-UTR,登錄號(hào)GSVIVG01024980001和GSVIVG01033494001的基因含2個(gè)5′-UTR,其他8個(gè)基因均含1個(gè)5′-UTR,且這10個(gè)基因中5′-UTR總長(zhǎng)度的變化范圍較小,為10~373 bp。
表2葡萄Actin基因家族的結(jié)構(gòu)特征1)
Table2StructuralcharacteristicsofActingenefamilyofVitisviniferaLinn.1)
登錄號(hào)Accessionnumber基因長(zhǎng)度/bpGenelengthGC含量/%GCcontentCDS外顯子 Exon數(shù)量Number總長(zhǎng)度/bpTotallengthGC含量/%GCcontent數(shù)量Number總長(zhǎng)度/bpTotallengthGSVIVG010005870012789438.2311114945.87112110GSVIVG01003099001227041.98586748.1051315GSVIVG010082540013011634.3916132934.09161655GSVIVG010082550011732037.88853141.818644GSVIVG0101403500132741.28132741.281326GSVIVG01014840001968130.4812142245.08121772GSVIVG01015049001156643.684113146.774952GSVIVG01015556001412339.197130250.2371302GSVIVG010165170011032135.9412217844.21122544GSVIVG01016550001210742.764113447.1841440GSVIVG01024980001362438.274113147.6651611GSVIVG01026580001330239.926122746.2162118GSVIVG010321200011598837.407108644.1171464GSVIVG01033049001852734.5815117043.50151680GSVIVG01033494001278340.32587048.5161327GSVIVG01036362001492543.29374145.8831913登錄號(hào)Accessionnumber內(nèi)含子 Intron3'-UTR5'-UTR數(shù)量Number總長(zhǎng)度/bpTotallength數(shù)量Number總長(zhǎng)度/bpTotallength數(shù)量Number總長(zhǎng)度/bpTotallengthGSVIVG01000587001102580215861373GSVIVG0100309900149551436110GSVIVG0100825400115284121325——GSVIVG01008255001716746——1112GSVIVG010140350010—————GSVIVG010148400011179091273175GSVIVG0101504900133141120——GSVIVG0101555600162821————GSVIVG010165170011177771320144GSVIVG0101655000136671305——GSVIVG010249800013109313562121GSVIVG010265800015118516751213GSVIVG0103212000161434012551121GSVIVG0103304900114683713381180GSVIVG0103349400148311376278GSVIVG010363620012301311171——
1)CDS: 編碼序列Coding sequence; UTR: 非翻譯區(qū)Untranslated region. —: 無(wú)數(shù)據(jù)No datum.
2.3葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的理化性質(zhì)分析
葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的理化性質(zhì)見表3。結(jié)果顯示:葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的氨基酸殘基數(shù)量為108~725,登錄號(hào)GSVIVG01016517001的基因編碼蛋白質(zhì)的氨基酸殘基數(shù)量最多,登錄號(hào)GSVIVG01014035001的基因編碼蛋白質(zhì)的氨基酸殘基數(shù)量最少。除登錄號(hào)GSVIVG01008254001的基因外,葡萄Actin基因家族中其他15個(gè)基因編碼蛋白質(zhì)的理論相對(duì)分子質(zhì)量為12 534.54~82 612.33,理論等電點(diǎn)為pI 4.92~pI 9.13,其中,12個(gè)基因編碼蛋白質(zhì)的理論等電點(diǎn)小于pI 6.5,顯酸性,3個(gè)基因編碼蛋白質(zhì)的理論等電點(diǎn)大于pI 8.0,顯堿性。葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的消光系數(shù)為14 105~73 645,脂肪族氨基酸指數(shù)為65.54~92.06。葡萄Actin基因家族16個(gè)基因中,9個(gè)基因編碼蛋白質(zhì)的不穩(wěn)定指數(shù)小于40,為穩(wěn)定蛋白;其他7個(gè)基因編碼蛋白質(zhì)的不穩(wěn)定指數(shù)大于40,為不穩(wěn)定蛋白。除登錄號(hào)GSVIVG01014035001的基因編碼的蛋白質(zhì)為疏水性蛋白外,葡萄Actin基因家族中其他15個(gè)基因編碼的蛋白質(zhì)為親水性蛋白。
表3葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的理化性質(zhì)1)
Table3PhysicochemicalpropertyofproteinsencodedbysixteengenesinActingenefamilyofVitisviniferaLinn.1)
登錄號(hào)Accessionnumber氨基酸殘基數(shù)量Numberofaminoacidresidues理論相對(duì)分子質(zhì)量Theoreticalrelativemolecularmass理論等電點(diǎn)Theoreticalisoelectricpoint平均親水系數(shù)Grandaverageofhydropathicity消光系數(shù)Extinctioncoefficient不穩(wěn)定指數(shù)Instabilityindex脂肪族氨基酸指數(shù)AliphaticaminoacidindexGSVIVG0100058700138242106.905.59-0.1323968537.0779.08GSVIVG0100309900128831542.225.85-0.1073851537.8286.01GSVIVG01008254001442——-0.1642478532.5065.54GSVIVG0100825500117619488.904.94-0.0441882540.0369.20GSVIVG0101403500110812534.548.710.0141410534.9587.31GSVIVG0101484000147353012.419.13-0.0387098551.6985.14GSVIVG0101504900137642098.455.23-0.1574724542.3688.88GSVIVG0101555600143248477.535.68-0.2043500544.9689.10GSVIVG0101651700172582612.335.77-0.6387364551.7573.56GSVIVG0101655000137741814.815.31-0.1994609035.5382.52GSVIVG0102498000137541436.475.31-0.1744460036.9685.33GSVIVG0102658000140845329.115.59-0.1264758039.7388.43GSVIVG0103212000136039635.104.92-0.1343028542.4792.06GSVIVG0103304900138944158.945.52-0.2024382036.1991.65GSVIVG0103349400128931675.335.85-0.1353851538.3984.36GSVIVG0103636200124627642.638.67-0.1783624548.8078.46
1)—: 不明確Undefined.
2.4葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的亞細(xì)胞定位、二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)分析
葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的亞細(xì)胞定位和二級(jí)結(jié)構(gòu)見表4,16個(gè)基因編碼蛋白質(zhì)的三級(jí)結(jié)構(gòu)見圖1。
2.4.1 亞細(xì)胞定位 由表4可見:葡萄Actin基因家族中僅登錄號(hào)GSVIVG01016517001的基因編碼的蛋白質(zhì)定位于細(xì)胞質(zhì)和細(xì)胞核,其他15個(gè)基因編碼的蛋白質(zhì)均定位于細(xì)胞質(zhì)。
2.4.2 二級(jí)結(jié)構(gòu) 由表4還可見:葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)均由α螺旋、無(wú)規(guī)則卷曲和延伸鏈組成,且總體以無(wú)規(guī)則卷曲為主。登錄號(hào)GSVIVG01000587001、GSVIVG01003099001、GSVIVG01008255001、 GSVIVG01014035001、GSVIVG01033494001和GSVIVG01036362001的基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)中,各構(gòu)成元件所占比例由高到低依次為無(wú)規(guī)則卷曲、延伸鏈、α螺旋;登錄號(hào)GSVIVG01008254001的基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)中,各構(gòu)成元件所占比例由高到低依次為延伸鏈、無(wú)規(guī)則卷曲、α螺旋;其余9個(gè)基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)中,各構(gòu)成元件所占比例由高到低依次為無(wú)規(guī)則卷曲、α螺旋、延伸鏈。
表4葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的亞細(xì)胞定位及二級(jí)結(jié)構(gòu)
Table4SubcellularlocalizationandsecondarystructureofproteinsencodedbysixteengenesinActingenefamilyofVitisviniferaLinn.
登錄號(hào)Accessionnumber亞細(xì)胞定位1)Subcellularlocalization1)比例/%2) Percentage2)HRCES登錄號(hào)Accessionnumber亞細(xì)胞定位1)Subcellularlocalization1)比例/%2) Percentage2)HRCESGSVIVG01000587001C20.4257.8521.73GSVIVG01016517001C,N36.4645.5817.96GSVIVG01003099001C22.5750.3527.08GSVIVG01016550001C 29.7148.2822.02GSVIVG01008254001C23.9835.9740.05GSVIVG01024980001C 34.3145.4820.21GSVIVG01008255001C5.1165.9128.98GSVIVG01026580001C 27.2146.8125.98GSVIVG01014035001C12.0462.0425.93GSVIVG01032120001C 37.9546.8115.24GSVIVG01014840001C33.1942.7124.10GSVIVG01033049001C 33.9347.8118.25GSVIVG01015049001C37.2342.8219.95GSVIVG01033494001C 22.4950.1727.34GSVIVG01015556001C26.6452.1922.17GSVIVG01036362001C 13.4157.7228.86
1)C: 細(xì)胞質(zhì)Cytoplasm; N: 細(xì)胞核Nucleus.
2)H:α螺旋αhelix; RC: 無(wú)規(guī)則卷曲Random coil; ES: 延伸鏈Extended strand.
圖中編號(hào)為基因登錄號(hào)Numbers in figures are accession numbers of genes.圖1 葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的三級(jí)結(jié)構(gòu)Fig. 1 Tertiary structure of proteins encoded by sixteen genes in Actin gene family of Vitis vinifera Linn.
2.4.3 三級(jí)結(jié)構(gòu) 由圖1可見:葡萄Actin基因家族中,由α螺旋數(shù)量來看,登錄號(hào)GSVIVG01016517001的基因編碼的蛋白質(zhì)中α螺旋數(shù)量最多,為26個(gè);登錄號(hào)GSVIVG01008254001和GSVIVG01024980001的基因編碼的蛋白質(zhì)均包含14個(gè)α螺旋;登錄號(hào)分別為GSVIVG01000587001、 GSVIVG01003099001和GSVIVG01003099001的基因編碼的蛋白質(zhì)均包含8個(gè)α螺旋;登錄號(hào)GSVIVG01008255001的基因編碼的蛋白質(zhì)中α螺旋數(shù)量最少,僅2個(gè)。
由延伸鏈數(shù)量來看,登錄號(hào)GSVIVG01016517001的基因編碼的蛋白質(zhì)中延伸鏈數(shù)量最多,為31個(gè);登錄號(hào)GSVIVG01000587001、GSVIVG01008254001、GSVIVG01033049001和GSVIVG0100309900的基因編碼的蛋白質(zhì)均包含17個(gè)延伸鏈;登錄號(hào)分別為GSVIVG01036362001、 GSVIVG01024980001和GSVIVG01033494001的基因編碼的蛋白質(zhì)均包含16個(gè)延伸鏈;登錄號(hào)GSVIVG01014035001的基因編碼的蛋白質(zhì)中延伸鏈最少,僅6個(gè)。
此外,雖然登錄號(hào)GSVIVG01000587001和GSVIVG01003099001的基因編碼的蛋白質(zhì)含有相同的α螺旋和延伸鏈數(shù)量,但二者的三級(jí)結(jié)構(gòu)存在一定差異,推測(cè)這些差異導(dǎo)致二者在功能上有所區(qū)別。
2.5葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的系統(tǒng)進(jìn)化分析
基于葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)的全長(zhǎng)序列構(gòu)建的系統(tǒng)發(fā)育樹見圖2。參照擬南芥Actin基因家族的分類方法[18],葡萄Actin基因家族16個(gè)基因編碼蛋白質(zhì)分為ClassⅠ、ClassⅡ和ClassⅢ 3個(gè)亞家族,其中,ClassⅡ亞家族屬于營(yíng)養(yǎng)型,包括登錄號(hào)GSVIVG01003099001和GSVIVG01026580001的基因編碼的蛋白質(zhì);ClassⅢ亞家族屬于生殖型,包括登錄號(hào)GSVIVG01033494001、GSVIVG01024980001和GSVIVG01016550001的基因編碼的蛋白質(zhì);ClassⅠ亞家族包括其他11個(gè)基因編碼的蛋白質(zhì)。
*: 來自擬南芥From Arabidopsis thaliana (Linn.) Heynh.圖2 葡萄與擬南芥Actin基因家族中各基因編碼蛋白質(zhì)的系統(tǒng)發(fā)育樹Fig. 2 Phylogenetic tree of proteins encoded by each gene in Actin gene family of Vitis vinifera Linn. and Arabidopsis thaliana (Linn.) Heynh.
2.6 葡萄Actin基因家族的組織表達(dá)分析
通過葡萄基因芯片平臺(tái),對(duì)葡萄Actin基因家族(登錄號(hào)GSVIVG01036362001的基因在GSE36128數(shù)據(jù)集未出現(xiàn))進(jìn)行組織表達(dá)分析(圖3)。結(jié)果顯示:ClassⅡ亞家族中登錄號(hào)GSVIVG01003099001和GSVIVG01026580001的基因在所有組織中的表達(dá)均較高;ClassⅢ亞家族中登錄號(hào)GSVIVG01033494001、GSVIVG01024980001和GSVIVG01016550001的基因在花粉、雄蕊和花中的表達(dá)均較高,其中,登錄號(hào)GSVIVG01033494001的基因在果皮中的表達(dá)也較高;ClassⅠ亞家族中除登錄號(hào)GSVIVG01016517001、GSVIVG01000587001和GSVIVG01032120001的基因在各組織中均有一定表達(dá)之外,ClassⅠ亞家族中其他基因在各組織中的表達(dá)均較低,尤其是登錄號(hào)GSVIVG01014035001的基因在所有組織中幾乎不表達(dá)。
1-15: 基因登錄號(hào)Accession number of genes. 1: GSVIVG01014840001; 2: GSVIVG01016517001; 3: GSVIVG01015556001;4: GSVIVG01008255001; 5: GSVIVG01014035001; 6: GSVIVG01000587001; 7: GSVIVG01008254001; 8: GSVIVG01032120001;9: GSVIVG01033049001; 10: GSVIVG01015049001; 11: GSVIVG01003099001; 12: GSVIVG01026580001; 13: GSVIVG01033494001; 14: GSVIVG01024980001; 15: GSVIVG01016550001.圖3 葡萄Actin基因家族的組織表達(dá)模式Fig. 3 Tissue expression pattern of Actin gene family of Vitis vinifera Linn.
肌動(dòng)蛋白是存在于真核生物細(xì)胞質(zhì)中最豐富的蛋白質(zhì),其氨基酸序列也是保守性最高的蛋白質(zhì)氨基酸序列之一,在整個(gè)進(jìn)化過程中幾乎沒有改變。肌動(dòng)蛋白的氨基酸序列在不同種類藻類和人類中的差異不超過20%[19]。擬南芥中10個(gè)Actin基因顯示出不同的表達(dá)模式,并涉及一系列不同細(xì)胞功能[20]?;跀M南芥中10個(gè)Actin基因表達(dá)類型,其中2個(gè)Actin基因?yàn)榧倩?,其?個(gè)Actin基因可以分為營(yíng)養(yǎng)型和生殖型2類,表現(xiàn)出不同的表達(dá)模式,并且同一類中各基因間緊密相關(guān)[21]。目前,已有關(guān)于擬南芥、大豆和蕪青(BrassicarapaLinn.)Actin基因家族的全基因組分析[19],并根據(jù)其功能分為不同的類型,為進(jìn)一步研究葡萄Actin基因家族提供了重要的參考價(jià)值。
本研究通過對(duì)葡萄Actin基因家族進(jìn)行全基因組生物信息學(xué)分析,共鑒定出16個(gè)基因,這16個(gè)基因編碼蛋白質(zhì)的亞家族分類與擬南芥和蕪青[19]相似,說明葡萄Actin基因家族是植物進(jìn)化中非常保守的家族。雖然Actin基因家族在葡萄全基因組中只有16個(gè)基因,但這16個(gè)基因的結(jié)構(gòu)特征及其編碼蛋白質(zhì)的理化性質(zhì)差異較大。其中,基因長(zhǎng)度和內(nèi)含子總長(zhǎng)度的差異較大,分別相差29 789和28 098 bp;內(nèi)含子數(shù)量變化范圍也較大,在0~15之間。內(nèi)含子不同程度的插入和缺失構(gòu)成了基因結(jié)構(gòu)的多樣性,在一定程度上,內(nèi)含子的進(jìn)化歷程反映了基因結(jié)構(gòu)的進(jìn)化[22]。除登錄號(hào)GSVIVG01014035001的基因外,葡萄Actin基因家族其他15個(gè)基因編碼的蛋白質(zhì)為親水性蛋白,其理化性質(zhì)存在較大差異,體現(xiàn)在氨基酸殘基數(shù)量相差549,理論相對(duì)分子質(zhì)量相差63 123.43,理論等電點(diǎn)相差pI 4.21。
本研究中,葡萄Actin基因家族中Class Ⅱ和Class Ⅲ亞家族分別屬于營(yíng)養(yǎng)型和生殖型,這2個(gè)亞家族中的基因在葡萄生長(zhǎng)發(fā)育過程中具有重要作用[23]。ClassⅡ和ClassⅢ亞家族Actin基因中,基因和編碼序列(CDS)的GC含量以及CDS、外顯子、內(nèi)含子、3′-非翻譯區(qū)(UTR)和5′-UTR的數(shù)量接近,其中,Class Ⅱ和Class Ⅲ亞家族基因的GC含量分別相差2.06%和4.49%,CDS的GC含量相差更少,分別僅1.89%和1.33%。Class Ⅱ和Class Ⅲ亞家族基因編碼蛋白質(zhì)的理論等電點(diǎn)均小于pI 6.5,顯酸性;并且,不穩(wěn)定指數(shù)均小于40,為穩(wěn)定蛋白,在一定程度上反映出其功能的穩(wěn)定性。
與其他植物相比,擬南芥的芯片數(shù)據(jù)更加全面,并已得到廣泛驗(yàn)證。本研究通過聚類分析比較了葡萄和擬南芥Actin基因家族中各基因編碼蛋白質(zhì)間的進(jìn)化關(guān)系,認(rèn)為這2種植物間的進(jìn)化關(guān)系具有保守性,同一亞家族中的Actin基因可能具有相似的基因功能。葡萄Actin基因家族中,Class Ⅱ亞家族基因在所有組織中的表達(dá)均較高,Class Ⅲ亞家族基因在花粉、雄蕊和花中的表達(dá)均較高,ClassⅠ亞家族中多數(shù)基因在各組織中的表達(dá)均較低,這與擬南芥Actin基因家族的表達(dá)情況相似,因此,可根據(jù)擬南芥中已有功能注釋的Actin基因,對(duì)葡萄Actin基因進(jìn)行功能預(yù)測(cè)。擬南芥中ACT7基因(登錄號(hào)AT5G09810.1)不僅在愈傷組織形成過程中發(fā)揮著重要作用[5],還可能是對(duì)外界刺激反應(yīng)最強(qiáng)烈的Actin基因[24]。葡萄Actin基因家族中登錄號(hào)GSVIVG01026580001和GSVIVG01003099001的基因與擬南芥中ACT7基因共同聚在Class Ⅱ亞家族中,推測(cè)這2個(gè)基因可能具有相似的功能。擬南芥中ACT12(登錄號(hào)AT3G46520.1)和ACT4(登錄號(hào)AT5G59370.1)基因主要在花粉管伸長(zhǎng)過程中表達(dá)[23],推測(cè)與二者共同聚在Class Ⅲ亞家族中登錄號(hào)GSVIVG01016550001的基因也可能在花粉管伸長(zhǎng)過程中起重要作用。說明葡萄Actin基因家族的表達(dá)在調(diào)控葡萄生長(zhǎng)發(fā)育過程中發(fā)揮著重要作用。3個(gè)亞家族中基因的表達(dá)具有組織特異性,暗示Actin基因家族中不同基因具有特異性功能,但每個(gè)亞家族中的基因?qū)ζ咸焉L(zhǎng)發(fā)育進(jìn)程的具體調(diào)控機(jī)制尚有待進(jìn)一步研究。
本研究采用生物信息學(xué)方法,對(duì)葡萄Actin基因家族進(jìn)行全基因組分析,為驗(yàn)證其基因功能提供了重要參考信息,但基因的具體功能還需進(jìn)一步研究。
[1] 閻龍飛, 石德權(quán). 高等植物中的收縮蛋白[J]. 生物化學(xué)與生物物理學(xué)報(bào), 1963, 3(4): 490-496.
[2] 劉 曦, 張少斌, 汪 澈. 植物肌動(dòng)蛋白功能的研究進(jìn)展[J]. 生物技術(shù)通報(bào), 2010(3): 13-16.
[3] MASCARENHAS J P. Molecular mechanisms of pollen tube growth and differentiation[J]. The Plant Cell, 1993, 5: 1303-1314.
[4] ITO Y, ABE S, DAVIES E. Co-localization of cytoskeleton proteins and polysomes with a membrane fraction from peas[J]. Journal of Experimental Botany, 1994, 45: 253-259.
[5] KANDASAMY M K, MCKINNEY E C, MEAGHER R B. Functional nonequivalency of actin isovariants inArabidopsis[J]. Molecular Biology of the Cell, 2002, 13: 251-261.
[6] BAIRD W V, MEAGHER R B. A complex gene superfamily encodes actin in petunia[J]. The EMBO Journal, 1987, 6: 3223-3231.
[7] 曹曉風(fēng), 王榮臣, 閻隆飛, 等. 豌豆卷須cDNA文庫(kù)構(gòu)建及肌動(dòng)蛋白基因序列分析[J]. 科學(xué)通報(bào), 1993, 38(19): 1804-1808.
[8] MCDOWELL J M, HUANG S, MCKINNEY E C, et al. Structure and evolution of the actin gene family inArabidopsisthaliana[J]. Genetics, 1996, 142: 587-602.
[9] AN Y Q, HUANG S, MCDOWELL J M, et al. Conserved expression of the ArabidopsisACT1 andACT3 actin subclass in organ primordia and mature pollen[J]. The Plant Cell, 1996, 8: 15-30.
[10] HUANG S, AN Y Q, MCDOWELL J M, et al. TheArabidopsisthalianaACT4/ACT12 actin gene subclass is strongly expressed throughout pollen development[J]. The Plant Journal, 1996, 10: 189-202.
[11] 胡松年, 閻隆飛. 豌豆卷須肌動(dòng)蛋白Ⅱ類異型體cDNA克隆的序列分析[J]. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào), 1999, 15(6): 857-860.
[12] 凌 毅, 趙武玲. 豌豆肌動(dòng)蛋白異型體基因的特異性表達(dá)[J]. 植物學(xué)通報(bào), 2001, 18(1): 76-80.
[13] JIANG Y Q, ZHAO W L. Expression and phylogenetic analysis of pea actin isoforms[J]. 植物學(xué)報(bào)(英文版), 2002, 44(12): 1456-1461.
[14] JAILLON O, AURY J M, NOEL B, et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla[J]. Nature, 2007, 449: 463-468.
[15] FASOLI M, SANTO S D, ZENONI S, et al. The grapevine expression atlas reveals a deep transcriptome shift driving the entire plant into a maturation program[J]. The Plant Cell, 2012, 24: 3489-3505.
[16] 郭景康, 陳青云, 戢 茜, 等. 擬南芥、水稻和楊樹ACTIN家族全基因組分析[J]. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009, 15(4): 426-431.
[17] ARTIMO P, JONNALAGEDDA M, ARNOLD K, et al. ExPASy: SIB bioinformatics resource portal[J]. Nucleic Acids Research, 2012, 40: W597-W603.
[18] 董 晨, 賈利強(qiáng), 決登偉, 等. 香蕉α-淀粉酶基因家族的系統(tǒng)進(jìn)化分析[J]. 中國(guó)南方果樹, 2016, 45(5): 12-17, 22.
[19] GUNNING P W, GHOSHDASTIDER U, WHITAKER S, et al. The evolution of compositionally and functionally distinct actin filaments[J]. Journal of Cell Science, 2015, 128: 2009-2019.
[21] MEAGHER R B, MCKINNEY E C, KANDASAMY M K. Isovariant dynamics expand and buffer the responses of complex systems: the diverse plantactingene family[J]. The Plant Cell, 1999, 11: 995-1005.
[22] 魏 瀟, 劉威生, 劉 寧, 等. 果實(shí)軟化相關(guān)PG基因的進(jìn)化分析和基因組定位[J]. 園藝學(xué)報(bào), 2011, 38(9): 1791-1799.
[23] 張少斌, 劉國(guó)琴. 植物肌動(dòng)蛋白異型體研究進(jìn)展[J]. 植物學(xué)通報(bào), 2006, 23(3): 242-248.
[24] MCDOWELL J M, AN Y Q, HUANG S, et al. The ArabidopsisACT7 actin gene is expressed in rapidly developing tissues and responds to several external stimuli[J]. Plant Physiology, 1996, 111: 699-711.
(責(zé)任編輯: 張明霞)
Identification,evolutionandexpressionanalysesofActingenefamilyofVitisvinifera
CUI Liwen, ZHENG Ting, ZHANG Kekun, ZHANG Chuan, SHANGGUAN Lingfei, FANG Jinggui①
(College of Horticulture, Nanjing Agricultural University, Nanjing 210095, China),J.PlantResour. &Environ., 2017,26(3): 1-10
Q943.2; S663.1
A
1674-7895(2017)03-0001-10
10.3969/j.issn.1674-7895.2017.03.01
2017-03-22
國(guó)家自然科學(xué)基金資助項(xiàng)目(31672131)
崔力文(1991—),女,山東莒縣人,碩士研究生,主要從事果樹遺傳育種與分子生物學(xué)方面的研究。
①通信作者E-mail: fanggg@njau.edu.cn