王珊珊,任艷艷,馬 宇,路宏朝,張 濤,王 令
(陜西理工大學 生物科學與工程學院,陜西漢中 723001)
蛋白質的甲基化修飾是指將甲基轉移至特定氨基酸殘基上共價結合的過程,是最常見的蛋白質翻譯后修飾之一。甲基化修飾是一種極為精細和專一的活性調節(jié)方式[1],參與真核生物和原核生物的多種細胞進程,如轉錄調節(jié)、細胞定位、核糖體裝配、RNA加工、蛋白質相互作用、細胞內信號傳導等[2]。甲基化修飾由S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)依賴的甲基轉移酶(Methyltransferases)催化發(fā)生[3]。目前,已知大多數甲基化反應發(fā)生在蛋白質的賴氨酸和精氨酸位點上,且存在不同的甲基化類型,如賴氨酸殘基可發(fā)生單甲基化、二甲基化和三甲基化[4]。甲基轉移酶樣21(Methyltransferase like21,METTL21)是甲基轉移酶家族的一類遠親成員,包括METTL21A、METTL21B、METTL21C和METTL21D四個成員[5]。其中,METTL21C具有蛋白質賴氨酸N端甲基轉移酶活性,涉及多種細胞功能和生物學過程的翻譯后修飾[6]。已有研究基于GWAS(Genome wide-association studies)分析發(fā)現METTL21C基因在高品質牛肉中表達水平較高[7];METTL21C基因突變后與人類肌肉減少癥有關,可能通過調節(jié)鈣濃度平衡促進肌細胞的分化[8];Wiederstein等[9]以小鼠為研究模型,發(fā)現METTL21C蛋白的表達與I型慢肌纖維的比例呈正相關。由此可見,METTL21C作為甲基轉移酶成員可能參與機體多種生命活動過程,發(fā)揮重要的調控作用。
隨著新一代DNA測序技術的發(fā)展和應用,越來越多物種的METTL21C基因及其編碼蛋白得以發(fā)現。盡管METTL21C是進化上高度保守的蛋白家族,然而不同物種METTL21C蛋白的催化機制和生理功能可能不同。因此,對METTL21C家族蛋白進行系統(tǒng)的生物信息學分析,對了解該家族成員的分子進化和生理功能非常重要。然而迄今為止,對METTL21C的研究報道非常有限,且主要集中于單一物種METTL21C的表達和功能分析,尚無該家族全面系統(tǒng)的分子進化的報道。本試驗在蛋白質信息數據庫UniprotKB中選取了36個代表物種的METTL21C蛋白,利用生物信息學對蛋白理化性質、motif序列、系統(tǒng)進化樹、空間結構和蛋白互作網絡等進行分析,探討不同物種METTL21C蛋白的序列特征、空間結構及分子進化,為進一步深入研究METTL21C參與和調控多種細胞進程奠定了理論基礎。
利用蛋白質信息數據庫UniProtKB(http://www.uniprot.org/),以METTL21C為關鍵詞搜索,選擇具有代表性物種的METTL21C蛋白,下載其一級序列信息。借助蛋白質理化性質預測工具ProtParam(https://web.expasy.org/protparam/)對METTL21C家族蛋白成員進行分子量、等電點、相對分子質量、親疏水性等理化參數進行分析預測[10]。
利用在線多序列比對工具Clustal Omega(https://www.ebi.ac.uk/Tools/msa/),對不同物種METTL21C蛋白的一級結構進行多序列比對,將比對結果載入ENDscript/ESPript 3.0(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi/)中進行作圖與分析[11]。將多序列比對結果導入系統(tǒng)進化樹構建軟件MEGA 7.0[12],采用鄰位歸并法(Neighbor-joining,NJ)構建不同物種METTL21C蛋白的分子進化樹,結果載入iTOL(http://itol.embl.de/)進行處理。
基于在線motif分析工具MEME(http://meme-suite.org/tools/meme),對不同物種METTL21C蛋白進行motif分析。在蛋白質結構數據庫RCSB PDB(http://www.rcsb.org/)中搜索已解析METTL21C的空間結構。利用蛋白質結構預測服務器SWISS-MODEL(https://swissmodel.expasy.org /interactive)對未解析三維結構的蛋白進行同源建模。采用LigPlot+軟件分析蛋白質與配體之間的相互作用[13]。通過PyMOL軟件進行蛋白質空間結構的展示和分析[14]。
采用String在線軟件(http://string-db.org/)預測人METTL21C與其他蛋白質的互作網絡。
在UniProtKB中搜索METTL21C蛋白,共獲得185個相關結果,其中絕大多數來源于脊椎動物。選擇36種代表物種的METTL21C蛋白,哺乳動物有21種,其中陸地哺乳動物包括人、黑猩猩、小鼠、大鼠、川金絲猴、牛、家犬、家貓、豬、綿羊、山羊、大熊貓、北極熊、非洲象、火狐、馬、雜交牛和兔,海洋哺乳動物長江豚和抹香鯨,以及原始哺乳動物鴨嘴獸;鳥類共10種,包括原雞、火雞、北部野鴨、巖鴿、帝企鵝、朱鹮、短嘴鴉、啄木鳥、大杜鵑和火烈鳥;爬行類共3種,包括揚子鱷、中華鱉和變色龍;魚類共2種,包括鬼鯊和大西洋鮭魚。
借助ProtParam對不同物種METTL21C蛋白進行理化參數分析(表1)。一級序列中氨基酸殘基個數差異較大,為190~335,平均長度為254個殘基,其中序列最短的是帝企鵝,最長的是馬。分子質量為21 531.63~37 217.35 u,平均分子質量為28 557.79 u。理論等電點為4.54~5.86,平均等電點為4.93,說明不同物種METTL21C均為偏酸性蛋白。帶負電荷氨基酸(Asp + Glu)的個數為22~44,帶正電荷氨基酸(Arg + Lys)的個數為13~34。不穩(wěn)定指數為34.93~55.83,其中低于40.00的僅有8個,表征為較穩(wěn)定的蛋白,其余為不穩(wěn)定蛋白。脂肪指數為76.13~ 103.61,總親水性平均系數為-0.516~0.045,絕大多數為親水性蛋白,僅帝企鵝和短嘴鴉METTL21C蛋白的親水性平均系數分別0.030和 0.045,表現為弱疏水性蛋白。
表1 不同物種METTL21C蛋白理化性質分析
通過多序列比對發(fā)現,不同物種METTL21C的N末端氨基酸序列差異較大,與人、小鼠、大鼠等哺乳動物相比,馬和兔METTL21C蛋白在N端增加了額外的氨基酸序列。與哺乳動物相比,大杜鵑、帝企鵝、朱鹮等鳥類METTL21C蛋白在N端有大段序列缺失。然而,不同物種METTL21C在52~259區(qū)氨基酸序列相似度較高,特別是在117~141區(qū)有多個連續(xù)的絕對保守位點(圖1),其中亮氨酸(Leu,L)、谷氨酸(Glu,E)和甘氨酸(Gly,G)的出現頻率較高,這可能提示這些氨基酸在分子進化中對維持METTL21C蛋白的穩(wěn)定性和生物功能有重要意義。
在多序列比對的基礎上,通過鄰位歸并法創(chuàng)建不同物種METTL21C蛋白的系統(tǒng)進化樹,結果顯示進化樹共分為4支。哺乳類為第一支,包括人、黑猩猩、豬等21種。其中,人METTL21C與黑猩猩和川金絲猴的親緣關系最近,其次為豬;牛與雜交牛、山羊與綿羊、家犬與紅狐、北極熊與大熊貓、海洋動物長江豚與抹香鯨的親緣關系較近;原始卵生哺乳動物鴨嘴獸METTL21C與其他胎生哺乳動物親緣性較遠。爬行類為第二支,揚子鱷與中華鱉親緣關系較近,變色龍為相對獨立的小分枝,親緣關系較遠。鳥類為第三支,原雞與火雞、啄木鳥與朱鹮、火烈鳥與大杜鵑的親緣關系較近,北部野鴨、短嘴鴉、巖鴿和帝企鵝分別為獨立的小分枝,與其他鳥類親緣關系較遠。魚類為第四支,鬼鯊和大西洋鮭魚與其他物種的親緣關系較遠,處于相對獨立進化的蛋白(圖2)。
采用MEME分析不同物種METTL21C蛋白的一級序列,共獲得10個motif(圖3)。Motif 1和motif 2評分最高,序列長達50個氨基酸殘基,是所有物種METTL21C蛋白最保守的區(qū)域,除大西洋鮭魚的motif 1內部多余兩個氨基酸位點外,其他物種中均含有motif 1和motif 2序列。Motif 3包含41個氨基酸殘基,在不同物種中有絕對保守的位點,也有相對可變的區(qū)域,32種METTL21C蛋白含有motif 3,在一些鳥類(帝企鵝和短嘴鴉)中有部分序列的缺失,魚類(鬼鯊和大西洋鮭魚)中無motif 3結構。36種METTL21C均含有motif 4和motif 5,氨基酸序列長度分別為30和15,絕對保守和部分保守位點交替出現,推測此區(qū)域可能定位于蛋白的外側,不同物種METTL21C在進化過程中,在保留基本構象的基礎上,一些氨基酸發(fā)生了適應性突變,使構象具有一定的柔性,以利于蛋白空間結構穩(wěn)定和底物識別催化。Motif 7位于METTL21C的N末端,主要在哺乳動物中出現(17種),而鳥類、爬行類和魚類中無此序列。Motif 10和motif 8依次位于motif 7之后,也主要在哺乳動物METTL21C中出現,而在鳥類和爬行類中無此motif 序列,說明METTL21C蛋白在進化過程中,N端序列差異較大,哺乳動物保留了這些片段,而鳥類有大段缺失。Motif 6和motif 9序列位于METTL21C的C末端,雖有部分位點的重復,但序列差異較大,motif 6多在哺乳類、爬行類和部分鳥類METTL21C中出現,而motif 9多在鳥類中出現,表明METTL21C蛋白的C端序列,在進化過程中也表現出一定程度的差異。
目前,蛋白質結構數據庫RCSB PDB中僅公布了人METTL21C蛋白的三維結構(PDB登錄號:4MTL)。人METTL21C的整體結構為同型二聚體,由兩條多肽鏈組成,A鏈中包含57~264殘基的空間排布,B鏈中包含45~263殘基的空間排布,N端結構的缺失推測可能是由于METTL21C N端有大段無序結構,自由度較高,構象變化較大,導致無法通過X射線晶體衍射法精確解析此區(qū)域的構象。A鏈和B鏈均與配體S-腺苷同型半胱氨酸(S-adenosyl-L-homocysteine,SAH)結合,定位于疏水空腔中(圖4-A)。每個單體由9個β-折疊片段(β1~β9)和 6個α-螺旋片段(α1~α6)交替組成,反平行折疊的β1和β2位于N端,β3~β9位于結構內部,α1~α3和 α4~α6分別位于β3~β9折疊結構的兩側,形成特殊的松散內核、緊密表面的空間結構(圖4-B)。
在人METTL21C與配體SAH的復合體結構中,SAH定位于疏水口袋中,與氨基酸殘基Trp92、Gly120、Trp172和Ser193形成氫鍵。在A鏈中SAH與Ala21、Tyr87、Gly88、Val91、Ala95、Gly122、Asp141、Leu142、Val145、Leu170、Val171、Asp194、Tyr197、Phe201存在疏水相互作用;在B鏈中SAH與Val91、Ala95、Ala121、Gly122、Asp141、Leu142、Leu170、Val171、Asp194、Tyr200、Ser228存在疏水相互作用,以維系SAH的構象(圖 5)。
以人METTL21C為模板,利用SWISS-MODEL同源建模獲得其他物種METTL21C的空間結構。其中,黑猩猩與人METTL21C蛋白的序列一致性最高,達99.18%;大西洋鮭魚和鬼鯊與人METTL21C蛋白的序列一致性最低,分別為49.53%和53.00%,表明同源建模獲得的三維結構可信度較高。通過比較不同哺乳動物METTL21C的空間結構,發(fā)現絕大部分區(qū)域的構象近乎完全重疊,僅有局部肽段有一定程度的差異,黑猩猩與人METTL21C結構差異主要體現在N端區(qū)域,呈反平行式排列的β1和β2結構更長(圖6-A);與人METTL21C相比,抹香鯨METTL21C在β8與β9之間的構象由β-轉角變?yōu)棣?螺旋(圖6-B),鴨嘴獸METTL21C的氨基酸殘基個數相對較少,在N端有大部分缺失,同時β8和β9的構象更短,局部轉變?yōu)闊o規(guī)卷曲(圖6-C)。通過比較人與其他非哺乳動物METTL21C的空間結構,發(fā)現大杜鵑與揚子鱷的結構類似,大西洋鮭魚與抹香鯨的結構類似,與人METTL21C的結構差異均主要體現在β1~β2和β8~β9區(qū)域(圖6-D~F)。
String數據庫基于試驗數據、文本挖掘、綜合其他數據庫資源,以及生物信息學分析(基因臨近、基因融合、基因共存、共表達、同源性)進行綜合評分,預測蛋白質相互作用網絡。以人METTL21C為中心的直接相關蛋白有11種。其中FAM86A的評分最高(0.804),作為甲基轉移酶能夠三甲基化修飾真核延伸因子2(EEF2)的Lys-525位點,但目前沒有明確報道FAM86A與METTL21C具有相互作用,僅推測可能在其他物種中METTL21C作為同源蛋白具有潛在的相關性[15]。其次是甲基轉移酶METTL18 (0.798)、METTL20(0.787)[16]、METTL10 (0.725)[17]和鉀電壓門控通道亞家族A成員KCNA2(0.674)[18],在相關文獻中與METTL21C共同出現,并在其他物種中存在共同表達。BMP10[18]、SUCNR1[18]、CAMKMT、N6AMT2、FAM173A、EEF2的評分較低,僅在文獻中與METTL21C共同出現。此外,有9種蛋白與METTL21C間接相關。其中BMPR1A、NKX2-5、BMPR2和ACVRL1蛋白為一簇,與BMP10直接相關;KCNAB1、KCNAB2、KCNAB3、CTTN蛋白為一簇,與KCNA2直接相關(圖7)。
甲基轉移酶METTL21C參與多種細胞進程的翻譯后修飾,在生命活動中發(fā)揮重要的調控作用[19]?;诘鞍踪|信息數據庫UniProtKB已公布的蛋白信息,發(fā)現絕大多數METTL21C來源于脊椎動物,特別是哺乳類、鳥類和魚類,說明METTL21C在脊椎動物中普遍存在,是一個較為古老的蛋白。本課題組前期研究發(fā)現,在略陽烏雞的多種組織中METTL21C均有表達,在心肌和骨骼肌中表達量最高,推測METTL21C可能在肌肉生長發(fā)育中發(fā)揮重要的生物學功能[20-21]。
36個代表物種METTL21C蛋白的理化參數分析結果顯示,一級序列中氨基酸殘基個數差異較大,平均為254個氨基酸殘基,大多為偏酸親水性蛋白。系統(tǒng)進化樹分為哺乳類、爬行類、鳥類和魚類共4支,與物種的親緣進化關系基本吻合,表明METTL21C的分子進化過程符合物種的進化規(guī)律。多序列比對和MEME分析顯示36種METTL21C的平均一致性為16.52%,平均相似度為62.30%,一級結構中有多段高度保守序列,10個motif幾乎覆蓋了全長多肽鏈,大多都含有motif 1~motif 5,表明這些序列是METTL21C家族執(zhí)行重要生物功能或組成結構不可缺少的部分。但N端序列差異較大,哺乳動物中含特有的motif 7、motif 8和motif 10,在進化過程中作為獨立的一個較大分支;而在多種鳥類中有大段缺失,推測在進化過程中丟棄了冗余序列以適應在空中飛行;魚類作為最早出現的脊椎動物分支,N端序列與其他物種的差異較大??臻g結構對比發(fā)現,不同物種METTL21C的構象絕大部分區(qū)域近乎完全重疊,僅有自由度較高的局部肽段有一定程度的差異,如轉角和無規(guī)卷曲區(qū)。表明不同物種METTL21C在進化過程中雖然一級序列有一定的差異,但是空間構象極為相似,高度保守。
以人METTL21C為中心的蛋白質互作網絡,直接相關的11種蛋白質中,主要是與其他甲基轉移酶在相關文獻中共同出現,或在其他物種中共同表達,如FAM86A能甲基化修飾真核延伸因子2 (EEF2)[22],METTL10能甲基化修飾真核延伸因子α (eEF1A),從而影響蛋白質的翻譯與表達[23]。METTL20作為線粒體賴氨酸甲基轉移酶,選擇性甲基化修飾黃素蛋白ETFβ,并對其功能起負調節(jié)作用[24]。與METTL21C有較弱相互關系的KCNA2和BMP10,作為核心蛋白又與其他多種蛋白直接相關。說明METTL21C作為蛋白質互作網絡中心,直接或間接參與多種細胞進程,從而影響機體的生命活動。目前在基因水平已有報道,METTL21C基因在高pH牛肉中表達上調,可能影響Ca2+轉運和氧化代謝途徑[25];METTL21C能夠調節(jié)骨骼和肌肉的內穩(wěn)態(tài),通過NF-κB信號通路促進小鼠成肌細胞分化[8];中國青年男性METTL21C基因的多態(tài)性與骨密度和脂肪總量相關,影響骨質疏松癥和肥胖[26]。然而,在蛋白質層次有關METTL21C的催化機制和生物學功能的報道較少,僅在小鼠中發(fā)現METTL21C能夠三甲基化修飾p97的Lys-315位點,是骨骼肌中蛋白降解的重要調制器[9],三甲基化修飾熱激蛋白(Hspa8)的Lys-561位點,以增強分子伴侶介導的自噬過程[27]。由此可見,METTL21C作為重要的甲基化修飾酶,可能參與多種胞內蛋白的甲基化修飾過程,從而調控機體的多種生命進程。在不同物種中METTL21C參與和調控的多種生理功能有待未來進一步深入研究。
本研究基于蛋白質信息數據庫UniprotKB,通過對36個代表物種METTL21C蛋白的生物信息學分析,表明雖然不同物種METTL21C的氨基酸殘基個數差異較大,N端序列差異較大,但在進化上高度保守,整體一級序列相似度較高,10個motif序列幾乎覆蓋了全長多肽鏈,哺乳類和鳥類METTL21C分別含其特有的motif序列。不同物種METTL21C的空間構象絕大部分區(qū)域近乎完全重疊,僅有少部分自由度較高的局部肽段有一定程度的差異。作為蛋白質互作網絡中心與多種蛋白相關,直接或間接參與多種細胞進程,調控機體的生命活動,為進一步深入研究不同物種METTL21C的生物學功能及其分子機制提供了理論基礎。