鮑思元 劉衛(wèi)東 李冬波
摘要[目的]對(duì)水稻OsARAB1基因進(jìn)行電子克隆,并對(duì)其進(jìn)行生物信息學(xué)分析。[方法]以NP 174188.1為查詢探針,通過(guò)電子克隆獲得OsARAB1基因全長(zhǎng)cDNA,用生物信息學(xué)軟件對(duì)其核苷酸序列和蛋白質(zhì)序列進(jìn)行生物信息學(xué)分析。[結(jié)果]獲得了OsARAB1基因全長(zhǎng)cDNA,基因編碼區(qū)序列(CDS)全長(zhǎng)1 086 bp。電子定位于第五染色體基因組序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp區(qū)域。OsARAB1蛋白屬于親水性的胞外蛋白,比較穩(wěn)定,偏堿性。二級(jí)結(jié)構(gòu)以α螺旋和無(wú)規(guī)則卷曲為主。具有2個(gè)功能結(jié)構(gòu)域:SGNH水解酶型酯酶、GDSL脂肪酶。有21個(gè)磷酸化位點(diǎn)、7個(gè)糖基化位點(diǎn)。推定的活性位點(diǎn)的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336。與玉米酯酶亞型B4FM12親緣關(guān)系最近。OsARAB1基因的表達(dá)對(duì)水稻的發(fā)育和形態(tài)發(fā)生起重要作用,與水稻抗稻瘟病有關(guān)。[結(jié)論]該研究為用試驗(yàn)方法克隆該基因和功能鑒定奠定了基礎(chǔ)。
關(guān)鍵詞水稻;脂肪酶;生物信息學(xué);氨基酸序列;OsARAB1基因
中圖分類號(hào)S188;Q943.2文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)0517-6611(2015)31-038-07
In Silico Cloning and Bioinformatics Analysis of ARAB1like Gene from Rice
BAO Siyuan1, LIU Weidong2, LI Dongbo3
(1. College of Basic Medical, Hubei University of Science and Technology, Xianning, Hubei 437100; 2. School of Nuclear Technology and Chemistry & Biology, Hubei University of Science and Technology, Xianning, Hubei 437100; 3. Horticultural Research Institute, Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007)
Abstract [Objective] The aim of this study was to clone the OsARAB1 gene from rice in silico, and to analyze its biological information. [Method] Using NP 174188.1 as the probe, the fulllength cDNA sequence of OsARAB1 gene was obtained by in silico cloning; its nucleotide sequence and protein were analyzed by bioinformatics softwares. [Result] The full length cDNA of OsARAB1 gene was obtained, and the sequence of the gene encoding region (CDS) was 1086 bp, encoded a protein of 361 amino acid residues. OsARAB1 gene was located in the genome sequence NC 008398.2( 6 769 813—6 773 213 bp region) by in silico mapping. OsARAB1 protein belonged to hydrophilic extracellular protein, and it was relatively stable, partial alkaline. The secondary structure of this protein was mainly composed of alpha helix and random coil. It belonged to SGNH lipase, and had 21 phosphorylation sites, 7 OβGlcNAc glycosylation sites. The putative active sites of amino acid residues were Ser34, Gly107, Asn167, Asp333, His336. It had the closest relationship with the esterase isoform B4FM12 from maize. The expression of OsARAB1 gene played an important role in development and morphogenesis of rice, and had a relationship with the rice blast resistance. [Conclusion] This study laid a foundation for OsARAB1 gene clone and functional identification using experimental method.
Key words Rice; Lipase; Bioinformatics; Amino acid sequence; OsARAB1 gene
脂肪酶(EC 3.1.1.3)是一類水解酶,廣泛分布于植物、動(dòng)物、微生物中,催化多種生化反應(yīng),包括水解、醇解、酸解、酯化、酯交換、氨解。GDSL脂肪酶是一類重要的脂肪酶家族,具有一個(gè)GDSL模體(GXSXXXXG),活性位點(diǎn)的絲氨酸靠近多肽鏈的N端[1-2];而GXSXG模體的α/β折疊型水解酶超家族活性位點(diǎn)的絲氨酸位于多肽鏈的中間[3]。具有5塊高度保守的同源序列[1],由于4個(gè)高度保守的殘基:絲氨酸、甘氨酸、天冬氨酰、組氨酸分別位于塊I、塊II、塊III、塊V,GDSL脂肪酶被建議更名為“SGNH-hydrolases”[4]。GDSL脂肪酶的催化位置易于變構(gòu),因此該酶具有廣泛的底物特異性[5]。然而,大多數(shù)GDSL脂肪酶的天然底物仍未知。
大量的細(xì)菌GDSL脂肪酶已被克隆,其功能已被研究清楚,一些GDSL脂肪酶的晶體結(jié)構(gòu)已經(jīng)構(gòu)建[6-8]。植物GDSL脂肪酶也被發(fā)現(xiàn),其特性和功能研究已成為非常有吸引力的課題。一些植物GDSL脂肪酶已被分離、克隆和表征,如擬南芥、蘿芙木屬、紫花苜蓿、橡膠樹、穗看麥娘的幾個(gè)候選基因[2,9-13]。Mayfield等[14]報(bào)道6個(gè)從擬南芥花粉表皮分離的胞外脂肪酶。Teissre等[15]從發(fā)芽后的向日葵種子中分離純化了一個(gè)GDSL酶,并顯示有脂肪?;ニ饷傅幕钚?。擬南芥GDSL脂肪酶GLIP1具有脂肪酶和抗微生物活性,能直接破壞真菌孢子的完整性;在乙烯信號(hào)傳導(dǎo)的作用下,GLIP1在植物抗黑斑病過(guò)程中可能發(fā)揮關(guān)鍵作用[13]。到目前為止,這些已克隆或表征的GDSL脂肪酶主要參與植物發(fā)育、形態(tài)發(fā)生、次生代謝產(chǎn)物的合成和防御反應(yīng)的調(diào)節(jié)。
搜索水稻數(shù)據(jù)庫(kù),發(fā)現(xiàn)水稻GDSL脂肪酶家族有114個(gè)成員[16-17],但只有幾個(gè)GDSL酯酶/脂肪酶基因被研究。在水稻生產(chǎn)國(guó),天然脂肪酶可以用來(lái)提高糙米、米糠油的質(zhì)量,以及生產(chǎn)相關(guān)產(chǎn)品。目前,2個(gè)GDSL酯酶/脂肪酶基因GER1、WDL1被克隆,它們分別在苗期調(diào)節(jié)胚芽鞘伸長(zhǎng)和植物生長(zhǎng)[18-19]。筆者利用電子克隆的方法克隆了水稻OsARAB1基因,獲得全長(zhǎng)cDNA,預(yù)測(cè)其編碼蛋白質(zhì)的一級(jí)結(jié)構(gòu)、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)的特點(diǎn),同時(shí)還利用電子表達(dá)分析技術(shù)對(duì)該基因的表達(dá)進(jìn)行了分析,為用試驗(yàn)方法克隆該基因和功能鑒定奠定了基礎(chǔ)。
1材料與方法
1.1氨基酸序列
擬南芥脂肪酶基因ARAB1蛋白質(zhì)的氨基酸序列NP 174188.1下載自NCBI的蛋白質(zhì)數(shù)據(jù)庫(kù)。tr|B4FM12|、tr|Q6K4Z3|、tr|G7IKB1|、tr|A0A0B2QCD5|、tr|B9H2K5|、tr|A0A061GEQ6|、tr|D7MSQ0|、sp|Q9FJ45|下載自UniProtKB蛋白質(zhì)數(shù)據(jù)庫(kù)。
1.2水稻OsARAB1基因的電子克隆
以擬南芥脂肪酶基因ARAB1蛋白質(zhì)的氨基酸序列為查詢探針對(duì)水稻EST數(shù)據(jù)庫(kù)進(jìn)行tblastn同源性檢索,獲得與擬南芥脂肪酶基因ARAB1同源性較高的一系列水稻EST序列;從獲得的水稻EST序列中挑選出同源性最高的EST序列作為種子序列,用種子序列對(duì)水稻EST數(shù)據(jù)庫(kù)進(jìn)行blastn檢索,得到多條與之高度同源的水稻EST序列;找到部分重疊的EST序列用CAP3軟件進(jìn)行拼接,獲得序列重疊群;以獲得的重疊群反復(fù)對(duì)水稻EST數(shù)據(jù)庫(kù)進(jìn)行blastn檢索、拼接,直到?jīng)]有新的EST 可供拼接為止。最后,將可能的新基因序列在非冗余數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)搜索,進(jìn)行新基因確認(rèn)。
1.3序列分析和系統(tǒng)發(fā)育樹構(gòu)建
用FGENESH軟件進(jìn)行基因預(yù)測(cè)[20];用ProtParam軟件進(jìn)行蛋白質(zhì)的理化性質(zhì)分析[21];用FoldIndex軟件進(jìn)行無(wú)序區(qū)域預(yù)測(cè)[22];用Pepinfo軟件進(jìn)行蛋白質(zhì)疏水性/親水性預(yù)測(cè);用PREDATOR 軟件進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)[23];用TargetP 1.1軟件預(yù)測(cè)蛋白質(zhì)的亞細(xì)胞定位[24-25];用SignalP 4.1軟件預(yù)測(cè)信號(hào)肽[26];用TMHMM 2.0軟件進(jìn)行蛋白質(zhì)跨膜螺旋預(yù)測(cè)[27];用NetPhos 2.0軟件進(jìn)行磷酸化位點(diǎn)預(yù)測(cè)[28];用YinOYang 1.2軟件進(jìn)行Oβ葡萄糖糖基化位點(diǎn)預(yù)測(cè)[29-30];用InterProScan 5軟件進(jìn)行蛋白質(zhì)功能結(jié)構(gòu)域預(yù)測(cè);用ProtFun 2.2軟件預(yù)測(cè)蛋白質(zhì)的功能分類[31-32];用PSIBLAST軟件進(jìn)行序列相似性搜索;用DNAMAN V6軟件進(jìn)行氨基酸的多序列比對(duì)和系統(tǒng)發(fā)育樹構(gòu)建;用SWISSMODEL同源建模軟件預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)[33-35]。
1.4水稻OsARAB1基因的電子表達(dá)分析
以水稻OsARAB1基因的編碼序列對(duì)水稻多個(gè)組織的EST數(shù)據(jù)庫(kù)進(jìn)行blastn,選取同源性較高的EST序列作為該基因的EST,對(duì)每條EST來(lái)源的cDNA進(jìn)行分析,得到文庫(kù)構(gòu)建的詳細(xì)情況,其中包括組織來(lái)源、發(fā)育階段、脅迫類型等。根據(jù)這些EST序列的組織來(lái)源及其在不同組織中出現(xiàn)的頻率以及來(lái)源于生物或非生物脅迫材料分析該基因的組織特異性表達(dá)和不同脅迫條件下的表達(dá)特性。
1.5數(shù)據(jù)處理
1.5.1總平均親水性值(GRAVY)計(jì)算。所有氨基酸疏水性參數(shù)的總和與氨基酸數(shù)量的比值,負(fù)值越大表示親水性越強(qiáng),正值越大表示疏水性越強(qiáng)。
1.5.2水稻OsARAB1基因的電子表達(dá)分析。將水稻EST數(shù)據(jù)庫(kù)中檢索出的與OsARAB1基因有同源性的所有EST序列進(jìn)行分類統(tǒng)計(jì)、分析,分別統(tǒng)計(jì)組織類型和脅迫類型的EST數(shù)量,并在Excel表格中根據(jù)統(tǒng)計(jì)數(shù)據(jù)作出柱狀圖。
2結(jié)果與分析
2.1水稻OsARAB1基因的電子克隆及序列分析
將NP 174188.1序列作為查詢探針,利用tblastn工具對(duì)GenBank中水稻EST數(shù)據(jù)庫(kù)進(jìn)行同源性檢索。從結(jié)果中選擇與探針序列同源性最高的EST序列CT845802作為種子序列。用CT845802對(duì)水稻EST數(shù)據(jù)庫(kù)進(jìn)行blastn檢索,得到多條與之高度同源的水稻EST序列,剔除冗余序列后找到2條對(duì)CT845802有延伸作用的EST序列CA758743.1、CR286331.1,用CAP3軟件進(jìn)行拼接。CAP3軟件拼接結(jié)果顯示CR286331.1不能拼接,CT845802.1和CA758743.1能拼接,獲得一個(gè)長(zhǎng)為1 555 bp的序列重疊群。以獲得的序列重疊群對(duì)水稻EST數(shù)據(jù)庫(kù)進(jìn)行blastn檢索,沒(méi)有找到有延伸作用的新的EST序列,表明所得的序列重疊群已不能再延伸。
用FGENESH軟件對(duì)序列重疊群進(jìn)行基因預(yù)測(cè),得到一個(gè)基因,含有一個(gè)外顯子,位于160~1 245 bp,PolA開始位點(diǎn)位于1 295 bp處。起始密碼子上游3位為A,下游+4位為G,符合Kozak規(guī)則。說(shuō)明序列延伸得到的序列重疊群是水稻脂肪酶ARAB1類似基因的全長(zhǎng)cDNA。將水稻脂肪酶ARAB1類似基因命名為OsARAB1,基因編碼區(qū)序列(CDS)全長(zhǎng)1 086 bp(圖1),編碼361個(gè)氨基酸殘基的蛋白質(zhì)(圖2)。
安徽農(nóng)業(yè)科學(xué)2015年
2.2OsARAB1基因的電子定位
以O(shè)sARAB1基因的編碼區(qū)序列對(duì)GenBank水稻染色體數(shù)據(jù)庫(kù)blastn,結(jié)果顯示OsARAB1與水稻第五染色體基因組序列NC 008398.2的一致性達(dá)99%,查詢覆蓋度達(dá)100%,匹配區(qū)段5個(gè)。NC 008398.2全長(zhǎng)30 039 014 bp,比對(duì)區(qū)域是6 769 813~6 773 213 bp,其中6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp區(qū)段沒(méi)有參與匹配。因此OsARAB1基因的編碼序列位于第五染色體(基因組序列NC 008398.2 )6 769 813~6 773 213 bp區(qū)域,4個(gè)沒(méi)有參與匹配的區(qū)段是該基因的4個(gè)內(nèi)含子。Map Viewer顯示OsARAB1基因臨近區(qū)域存在多個(gè)基因,其中的2個(gè)基因Os05g0209600、Os05g0210100分別位于NC 008398.2 (6 769 736~6 773 472)、NC 008398.2 (6 806 624~6 809 353),參考狀態(tài)為臨時(shí)基因(PROVISIONAL gene),功能注釋為SGNH植物脂肪酶。
2.3蛋白質(zhì)的理化性質(zhì)分析和蛋白質(zhì)疏水性/親水性預(yù)測(cè)
理化性質(zhì)分析表明,OsARAB1編碼一條361個(gè)氨基酸殘基的多肽,分子量為38 902.5 Da,理論等電點(diǎn)(pI)為8.83,帶負(fù)電荷的殘基(Asp + Glu)總數(shù)為23個(gè),帶正電荷的殘基(Arg + Lys)總數(shù)為31個(gè),表明該蛋白為堿性蛋白質(zhì)。分子式為C1744H2678N470O500S21。不穩(wěn)定系數(shù)為28.56,表明該蛋白為穩(wěn)定蛋白。脂肪族指數(shù)為81.11。無(wú)序區(qū)域預(yù)測(cè)表明該蛋白在243~268位殘基處存在一個(gè)無(wú)序區(qū)域,該區(qū)域包含26個(gè)氨基酸殘基,占總殘基數(shù)的7.2%,因此這對(duì)OsARAB1蛋白折疊、表達(dá)水平干擾較小。
蛋白質(zhì)的折疊主要由氨基酸的親疏水性驅(qū)動(dòng),通過(guò)對(duì)親疏性分布圖的分析,可以反映蛋白質(zhì)的折疊情況;蛋白質(zhì)在折疊時(shí)形成疏水的內(nèi)核和親水的表面,同時(shí)潛在跨膜區(qū)會(huì)出現(xiàn)高疏水性結(jié)構(gòu)域,據(jù)此可以判定跨膜結(jié)構(gòu)域和蛋白質(zhì)表面氨基酸分布。利用Pepinfo軟件對(duì)蛋白質(zhì)進(jìn)行疏水性/親水性分析,采用Kyte & Doolittle標(biāo)度計(jì)算,其中正值為疏水性,負(fù)值為親水性。結(jié)果顯示,多肽鏈11位蛋氨酸疏水性參數(shù)最高,為3.100;308位天冬酰胺疏水性參數(shù)最低,為-2.400;N端存在一個(gè)較強(qiáng)的疏水性區(qū),推測(cè)其N端可能含有信號(hào)肽;總平均親水性值(GRAVY)為-0.015,說(shuō)明OsARAB1蛋白為親水性蛋白(圖3)。
2.4蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果顯示,該蛋白由3種二級(jí)結(jié)構(gòu)構(gòu)成,其中,25.21%的氨基酸殘基構(gòu)成α螺旋(Hh),14.40%的氨基酸殘基構(gòu)成延伸鏈(Ee),60.39%的氨基酸殘基構(gòu)成無(wú)規(guī)則卷曲(Cc)。α螺旋和無(wú)規(guī)則卷曲是OsARAB1蛋白的主要二級(jí)結(jié)構(gòu),延伸鏈散布于整個(gè)蛋白質(zhì)中(圖4)。
2.5亞細(xì)胞定位預(yù)測(cè)和蛋白質(zhì)跨膜螺旋預(yù)測(cè)
亞細(xì)胞定位預(yù)測(cè)結(jié)果顯示OsARAB1蛋白是一條含有22個(gè)氨基酸殘基信號(hào)肽的分泌蛋白。信號(hào)肽預(yù)測(cè)結(jié)果顯示OsARAB1蛋白含有信號(hào)肽,信號(hào)肽切割位點(diǎn)位于Ala22與Glu23之間。幾個(gè)已知生物功能的GDSL脂肪酶,如來(lái)源于穗看麥娘的酯酶[11]、來(lái)源于龍舌蘭屬植物葉表皮的SGNH水解酶[36]、來(lái)源于蘿芙木屬的乙?;}芙木堿乙酰酯酶[12]、來(lái)源于甘藍(lán)型油菜的GDSL脂肪酶[37],它們都是胞外蛋白,在細(xì)胞外發(fā)揮作用。
蛋白質(zhì)跨膜螺旋預(yù)測(cè)結(jié)果顯示,OsARAB1蛋白第一個(gè)氨基酸殘基位于膜內(nèi),在2~21位氨基酸殘基處存在一個(gè)跨膜螺旋,22~361位氨基酸殘基位于膜外(圖5)。由于前60個(gè)氨基酸跨膜螺旋中預(yù)期氨基酸數(shù)為18.816 13,遠(yuǎn)大于10,提示N端可能不是跨膜結(jié)構(gòu)而是存在一個(gè)信號(hào)肽。結(jié)合疏水性∕親水性預(yù)測(cè)、亞細(xì)胞定位預(yù)測(cè)、信號(hào)肽預(yù)測(cè),可以推測(cè)OsARAB1蛋白N端存在一個(gè)信號(hào)肽。在信號(hào)肽酶切除信號(hào)肽后,OsARAB1蛋白進(jìn)入內(nèi)質(zhì)網(wǎng)腔,通過(guò)分泌途徑分泌到細(xì)胞外,在胞外參與脂類代謝。
2.6蛋白質(zhì)功能結(jié)構(gòu)域及蛋白質(zhì)功能分類預(yù)測(cè)
蛋白質(zhì)功能結(jié)構(gòu)域預(yù)測(cè)結(jié)果表明,OsARAB1蛋白具有2個(gè)功能結(jié)構(gòu)域:SGNH水解酶型酯酶(InterPro ID:IPR013830)、GDSL脂肪酶(InterPro ID:IPR001087)。SGNH水解酶型酯酶超家族SSF52266位于3個(gè)區(qū)域:28~44位殘基處、72~86位殘基處、325~351位殘基處。GDSL脂肪酶功能結(jié)構(gòu)域位于28~347位殘基處。由此可推斷OsARAB1蛋白為GDSL脂肪酶。
蛋白質(zhì)功能分類預(yù)測(cè)結(jié)果表明,OsARAB1蛋白屬于在細(xì)胞外具有激素作用的酶。Kiba等[38]、Cao等[39]發(fā)現(xiàn)GDSL脂肪酶參與與生長(zhǎng)過(guò)程有關(guān)的激素途徑。
2.7翻譯后修飾位點(diǎn)預(yù)測(cè)
用NetPhos 2.0軟件進(jìn)行serine、threonine和tyrosine磷酸化位點(diǎn)預(yù)測(cè),結(jié)果顯示,Ser磷酸化位點(diǎn)12個(gè),Thr磷酸化位點(diǎn)3個(gè),Tyr磷酸化位點(diǎn)6個(gè)。Ser磷酸化位點(diǎn)分別位于30、34、70、91、110、144、247、248、257、318、321、344位氨基酸上。Thr磷酸化位點(diǎn)分別位于66、180、224位氨基酸上。Tyr磷酸化位點(diǎn)分別位于222、234、249、276、342、354位氨基酸上。說(shuō)明磷酸化位點(diǎn)修飾對(duì)OsARAB1蛋白的功能可能非常重要,這些磷酸位點(diǎn)也可能參與該蛋白活性的調(diào)控。
Oβ葡萄糖糖基化位點(diǎn)預(yù)測(cè)結(jié)果表明,Ser糖基化位點(diǎn)有3個(gè):Ser30、Ser91、Ser118;Thr糖基化位點(diǎn)有1個(gè):Thr66;YinYang位點(diǎn)有3個(gè): Ser30、Thr66、Ser91,這些位點(diǎn)在不同時(shí)期可逆地、動(dòng)態(tài)地Oβ葡萄糖糖基化或磷酸化修飾。
2.8氨基酸的多序列比對(duì)和系統(tǒng)發(fā)育樹分析
將OsARAB1蛋白氨基酸序列對(duì)蛋白質(zhì)數(shù)據(jù)庫(kù)UniProtKB進(jìn)行PSIBLAST,結(jié)果顯示,有500個(gè)GDSL蛋白質(zhì)與其同源,一致性最大值為99%,最小值為43%。從不同植物種類中選取8個(gè)GDSL脂肪酶和ARAB1蛋白(sp|Q38894|)、OsARAB1蛋白進(jìn)行氨基酸多序列比對(duì)和系統(tǒng)發(fā)育樹構(gòu)建(表1)。多序列比對(duì)結(jié)果表明,氨基酸序列一致性為59.48%,存在較多的同源序列,4個(gè)保守序列區(qū)域與SGNH水解酶保守序列塊包含的氨基酸非常相似[5]。根據(jù)同源序列區(qū)域的相似性,推定OsARAB1蛋白活性位點(diǎn)的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336,Ser34靠近多肽鏈的N端(圖5)。
在多序列比對(duì)分析的基礎(chǔ)上用DNAMAN V6軟件構(gòu)建系統(tǒng)發(fā)育樹(圖6)。系統(tǒng)發(fā)育樹顯示OsARAB1蛋白與玉米酯酶亞型B4FM12親緣關(guān)系最近,序列同源性最大,其次是粳稻脂肪酶Q6K4Z3;與可可脂肪酶A0A061GEQ6、楊樹脂肪酶B9H2K5親緣關(guān)系最遠(yuǎn),序列同源性最小。這是因?yàn)樗九c玉米同屬于禾本科植物,在進(jìn)化上親緣關(guān)系較近,粳稻是水稻的一個(gè)亞種。但OsARAB1脂肪酶與粳稻脂肪酶Q6K4Z3的親緣關(guān)系不及玉米酯酶亞型B4FM12,這說(shuō)明OsARAB1脂肪酶與玉米酯酶亞型B4FM12的功能更相似。
2.9三級(jí)結(jié)構(gòu)預(yù)測(cè)為了更好地研究OsARAB1蛋白的功能,將OsARAB1蛋白氨基酸序列提交同源建模服務(wù)器SWISSMODEL進(jìn)行三級(jí)結(jié)構(gòu)預(yù)測(cè),以在PDB晶體庫(kù)中與OsARAB1蛋白氨基酸序列一致性高達(dá)21.09%的銅綠假單胞菌全長(zhǎng)轉(zhuǎn)運(yùn)EstA的晶體結(jié)構(gòu)(PDBid :1tibA)作為模板預(yù)測(cè)OsARAB1蛋白的三級(jí)結(jié)構(gòu)(圖7)。OsARAB1蛋白的三級(jí)結(jié)構(gòu)特點(diǎn)是5個(gè)β折疊組成了一個(gè)平面,外部由6個(gè)α螺旋包圍,整個(gè)結(jié)構(gòu)呈球狀。這個(gè)結(jié)構(gòu)特點(diǎn)符合脂肪酶的結(jié)構(gòu)特點(diǎn),脂肪酶活性位點(diǎn)位于疏水口袋里,底物與酶接觸時(shí),α螺旋結(jié)構(gòu)蓋子打開[40]。
2.10OsARAB1基因的電子表達(dá)分析
blastn共搜索到154條高度同源的EST,分別來(lái)源于不同的cDNA文庫(kù)(圖8)。整合分析后表明,OsARAB1基因在水稻的愈傷組織、花、稻芽、幼苗葉片、感稻瘟病菌的成熟葉子、發(fā)芽種子的根和嫩芽、全株苗、發(fā)芽的種子、種子、開花后的穗中都表達(dá),在莖、營(yíng)養(yǎng)分生組織的cDNA文庫(kù)中未發(fā)現(xiàn)EST序列,說(shuō)明該基因的表達(dá)有組織和器官特異性特點(diǎn)。在愈傷組織中表達(dá)量最高,說(shuō)明OsARAB1基因的表達(dá)在愈傷組織的分化中起重要作用。在葉子中表達(dá)量較高,在幼苗葉片cDNA文庫(kù)中發(fā)現(xiàn)了9條EST序列,說(shuō)明OsARAB1基因的表達(dá)與葉子的形態(tài)發(fā)生有重要關(guān)系;在感稻瘟病菌的成熟葉子cDNA文庫(kù)中發(fā)現(xiàn)了3條EST序列,說(shuō)明OsARAB1基因受稻瘟病菌的誘導(dǎo)而表達(dá),與水稻抗稻瘟病有關(guān)。在發(fā)芽種子的根和嫩芽、開花后不同時(shí)期的穗cDNA文庫(kù)中分別發(fā)現(xiàn)了6、7條EST序列,說(shuō)明OsARAB1基因?qū)λ痉N子的萌發(fā)和穗的發(fā)育起重要作用。與擬南芥GDSL脂肪酶ARAB1基因在種子萌發(fā)過(guò)程中表達(dá),行使水解酶活性的研究結(jié)論一致[2]。在NAA處理的愈傷組織中發(fā)現(xiàn)了2條EST序列,說(shuō)明NAA可誘導(dǎo)OsARAB1基因的表達(dá),而NAA可促進(jìn)根的生長(zhǎng)。NAA是一種植物激素,推測(cè)OsARAB1基因可能參與植物激素信號(hào)通路應(yīng)答。
3討論
電子克隆是依托現(xiàn)有的網(wǎng)絡(luò)資源(EST數(shù)據(jù)庫(kù)、核苷酸數(shù)據(jù)庫(kù)、蛋白質(zhì)數(shù)據(jù)庫(kù)、基因組數(shù)據(jù)庫(kù)等)采用生物信息學(xué)方法進(jìn)行基因克隆的新策略,且伴隨著基因組計(jì)劃和EST計(jì)劃的實(shí)施而逐漸興起。利用電子克隆技術(shù)克隆基因不僅可以快速地發(fā)現(xiàn)新基因,更能為基因的結(jié)構(gòu)研究和功能預(yù)測(cè)提供新思路[41-42]。電子克隆與傳統(tǒng)的克隆方法相比,具有成本低、效率高、技術(shù)要求低和針對(duì)性強(qiáng)等優(yōu)點(diǎn)[43]。但由于某些基因存在多種剪切方式,電子克隆獲得的結(jié)果只能作為參考;另外由于生物大分子結(jié)構(gòu)和功能的復(fù)雜性,許多分析軟件的輸出結(jié)果存在較大偏差,因此利用生物信息學(xué)進(jìn)行“虛擬”克隆的結(jié)果必需回到實(shí)驗(yàn)室作進(jìn)一步的試驗(yàn)驗(yàn)證。水稻是模式植物,基因組測(cè)序已完成,具有豐富的基因組序列和EST序列,截至目前,在NCBI 的EST 數(shù)據(jù)庫(kù)中可以檢索到1 695 551條水稻的EST序列,且這一數(shù)據(jù)量還將不斷擴(kuò)大,這為水稻基因的電子克隆提供了很好的生物信息學(xué)平臺(tái)。該研究以NP 174188.1為查詢探針,通過(guò)搜索水稻EST數(shù)據(jù)庫(kù)和EST序列的拼接,用電子克隆的方法克隆了水稻脂肪酶基因OsARAB1。OsARAB1基因cDNA全長(zhǎng)1 555 bp,基因編碼區(qū)序列(CDS)全長(zhǎng)1 086 bp,編碼一個(gè)含有361個(gè)氨基酸殘基的蛋白質(zhì)。用生物信息學(xué)軟件對(duì)OsARAB1蛋白的結(jié)構(gòu)、功能、進(jìn)化等進(jìn)行了分析。OsARAB1蛋白N端具有信號(hào)肽,屬于親水性的胞外蛋白,比較穩(wěn)定,偏堿性。二級(jí)結(jié)構(gòu)以α螺旋和無(wú)規(guī)則卷曲為主,延伸鏈散布于整個(gè)蛋白質(zhì)中。具有2個(gè)功能結(jié)構(gòu)域:SGNH水解酶型酯酶、GDSL脂肪酶,因此OsARAB1蛋白屬于SGNH脂肪酶。有21個(gè)磷酸化位點(diǎn)、7個(gè)糖基化位點(diǎn),其中Ser30、Thr66、Ser91與OsARAB1蛋白的活性調(diào)控有關(guān),在不同時(shí)期可逆地糖基化或磷酸化修飾。氨基酸多序列比對(duì)和系統(tǒng)發(fā)育樹分析表明OsARAB1蛋白與其他物種GDSL脂肪酶的氨基酸序列具有較高的一致性;推定的活性位點(diǎn)的氨基酸殘基為Ser34、Gly107、Asn167、Asp333、His336;與玉米酯酶亞型B4FM12親緣關(guān)系最近,一致性達(dá)到82%,由此推斷OsARAB1蛋白和玉米酯酶亞型B4FM12可能具有類似的生理功能。
電子表達(dá)分析是通過(guò)整合某物種中特定基因的所有相關(guān)表達(dá)序列標(biāo)簽信息,從而獲得該基因表達(dá)相關(guān)信息的一種新型基因表達(dá)分析技術(shù)[44-45]。目前,電子表達(dá)分析常與電子克隆技術(shù)相結(jié)合,共同應(yīng)用于新基因挖掘和基因功能分析,已被成功應(yīng)用于多種植物目標(biāo)基因的表達(dá)分析。White等[46]利用電子表達(dá)分析方法發(fā)掘了擬南芥中一批種子發(fā)育特異表達(dá)基因。Fei等[47]建立了一個(gè)包含15 000個(gè)非處理Unigene和6 000個(gè)規(guī)范化Unigene數(shù)據(jù)在內(nèi)的番茄電子表達(dá)分析數(shù)據(jù)庫(kù)。Mochida等[48]利用電子表達(dá)分析技術(shù)在小麥上鑒定了一批在抗旱和ABA處理中相應(yīng)的基因。上官凌飛等[45]利用GenBank中大量葡萄EST序列,建立了基因電子表達(dá)分析的有效平臺(tái),并通過(guò)RTPCR技術(shù)對(duì)電子表達(dá)分析結(jié)果的準(zhǔn)確性驗(yàn)證,結(jié)果顯示電子表達(dá)分析結(jié)果與RTPCR分析結(jié)果高度一致。由此可見,電子克隆技術(shù)與電子表達(dá)分析方法可作為新基因挖掘與功能分析的有效手段。OsARAB1基因的電子表達(dá)分析表明,OsARAB1基因的表達(dá)有組織和器官特異性特點(diǎn),但也受稻瘟病病原菌誘導(dǎo)表達(dá),說(shuō)明OsARAB1基因的表達(dá)對(duì)水稻的發(fā)育和形態(tài)發(fā)生起重要作用,在水稻受到稻瘟病感染時(shí),成熟葉子中OsARAB1基因被誘導(dǎo)表達(dá)形成對(duì)稻瘟病菌的防御反應(yīng)。已克隆的基因PR1和幾丁質(zhì)酶基因的表達(dá)也有組織和器官特異性,在辣椒受到病原侵染時(shí)表達(dá)增強(qiáng)構(gòu)成防御反應(yīng)[49-52]。
OsARAB1基因的編碼區(qū)序列電子定位于第五染色體基因組序列NC 008398.2核苷酸序列6 769 813~6 773 213 bp區(qū)域,通過(guò)對(duì)匹配區(qū)段和4個(gè)沒(méi)有參與匹配區(qū)段的分析可以推測(cè)該基因有5個(gè)外顯子、4個(gè)內(nèi)含子,4個(gè)內(nèi)含子分別位于6 770 051~6 770 128、6 770 337~6 770 519、6 770 670~6 771 078、6 771 356~6 772 994 bp區(qū)段。該基因的編碼區(qū)序列與臨時(shí)基因Os05g0209600的染色體區(qū)域重疊,說(shuō)明OsARAB1和Os05g0209600可能是同一個(gè)基因。因此,在克隆OsARAB1和研究OsARAB1功能時(shí),可以參考臨時(shí)基因Os05g0209600的資料,提高試驗(yàn)克隆和功能鑒定的效率。在該基因的附近還存在一個(gè)SGNH植物脂肪酶Os05g0210100,推測(cè)這2個(gè)基因可能由同一個(gè)脂肪酶基因經(jīng)序列復(fù)制而產(chǎn)生,其后又在各個(gè)復(fù)制片段上逐漸積累了突變而形成現(xiàn)在這種基因結(jié)構(gòu)[53]。
參考文獻(xiàn)
[1]
UPTON C,BUCKLEY J T.A new family of lipolytic enzymes[J].Trends Biochem Sci,1995,20:178-179.
[2] BRICK D J,BRUMLIK M J,BUCKLEY J T,et al.A new family of lipolytic plant enzymes with members in rice,arabidopsis and maize[J].FEBS Lett,1995,377:475-480.
[3] BRENNER S.The molecular evolution of genes and proteins:A tale of two serines[J].Nature,1988,334(6182):528-530.
[4] MLGAARD A,KAUPPINEN S,LARSEN S.Rhamnogalacturonan acetylesterase elucidates the structure and function of a new family of hydrolases[J].Structure,2000,8(4):373-383.
[5] AKOH C C,LEE G C,LIAW Y C,et al.GDSL family of serine esterases/lipases[J].Prog Lipid Res,2004,43(6):534-552.
[6] CHEESEMAN J D,TOCILJ A,PARK S,et al.Structure of an aryl esterase from Pseudomonas fluorescens[J].Acta Crystallogr D Biol Crystallogr,2004,60(Pt 7):1237-1243.
[7] MATHEWS I,SOLTIS M,SALDAJENO M,et al.Structure of a Novel Enzyme that catalyzes acyl transfer to alcohols in aqueous conditions[J].Biochemistry,2007,46(31):8969-8979.
[8] VAN DEN BERG B.Crystal structure of a fulllength autotransporter[J].J Mol Biol,2010,396(3):627-633.
[9] PRINGLE D,DICKSTEIN R.Purification of ENOD8 proteins from Medicago sativa root nodules and their characterization as esterases[J].Plant Physiol Biochem,2004,42(1):73-79.
[10] ARIF S A,HAMILTON R G,YUSOF F,et al.Isolation and characterization of the early nodulespecific protein homologue (Hev b 13),an allergenic lipolytic esterase from Hevea brasiliensis latex[J].J Biol Chem,2004,279:23933-23941.
[11] CUMMINS I,EDWARDS R.Purification and cloning of an esterase from the weed blackgrass (Alopecurus myosuroides),which bioactivates aryloxyphenoxypropionate herbicides[J].Plant J,2004,39(6):894-904.
[12] RUPPERT M,WOLL J,GIRITCH A,et al.Functional expression of an ajmaline pathwayspecific esterase from Rauvolfia in a novel plantvirus expression system[J].Planta,2005,222(5):888-898.
[13] OH I S,PARK A R,BAE M S,et al.Secretome analysis reveals an Arabidopsis lipase involved in defense against Alternaria brassicicola[J].Plant Cell,2005,17:2832-2847.
[14] MAYFIELD J A,F(xiàn)IEBIG A,JOHNSTONE S E,et al.Gene families from Arabidopsis thaliana pollen coat proteome[J].Science,2001,292:2482-2485.
[15] TEISSERE M,BOREL M,CAILLOL B,et al.Purification and characterization of a fatty acylester hydrolase from postgerminated sunflower seeds[J].Biochim Biophys Acta,1995,1255:105-112.
[16] YOUENSCLARK K,BUCKLER E,CASSTEVENS T,et al.Gramene database in 2010:Updates and extensions[J].Nucleic Acids Res,2010,39:1085-1094.
[17] OUYANG S,ZHU W,HAMILTON J,et al.The TIGR Rice Genome Annotation Resource:improvements and new features[J].Nucleic Acids Res,2007,35:883-887.
[18] RIEMANN M,GUTJAHR C,KORTE A,et al.GER1,a GDSL motifencoding gene from rice is a novel early light and jasmonateinduced gene[J].Plant Biol (Stuttg),2007,9(1):32-40.
[19] PARK J J,JIN P,YOON J,et al.Mutation in Wilted Dwarf and Lethal 1 (WDL1) causes abnormal cuticle formation and rapid water loss in rice[J].Plant Mol Biol,2010,74(1-2):91-103.
[20] SOLOVYEV V V.Statistical approaches in Eukaryotic gene prediction[C]//BALDING D J,CANNINGS C,BISHOP M.Handbook of Statistical genetics.3d edition.Hoboken, NJ:WileyInterscience,2007:1616.
[21] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identification and analysis tools on the ExPASy server[C]//WALKER J M.The proteomics protocols handbook.Totowa,NJ:Humana Press,2005:571-607.
[22] PRILUSKY J,F(xiàn)ELDER C E,RYDBERG E,et al.Foldlndex:A simple tool to predict whether a given protein sequence is intrinsically unfolded[J].Bioinformatics,2005,21(16):3435-3438.
[23] COMBET C,BLANCHET C,GEOURJON C,et al.NPS@:Network protein sequence analysis[J].TIBS,2000,25(3):147-150.
[24] EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their Nterminal amino acid sequence[J].Mol Biol,2000,300:1005-1016.
[25] NIELSEN H,ENGELBRECHT J,BRUNAK S,et al.Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites[J].Protein Engineering,1997,10:1-6.
[26] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:Discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8:785-786.
[27] SONNHAMMER E L L,HEIJNE G V,KROGH A.A hidden Markov model for predicting transmembrane helices in protein sequences[C]//GLASGOW J,LITTLEJOHN T,MAJOR F,et al.Proc of Sixth Int Conf on Intelligent Systems for Molecular Biology.Menlo Park,CA:AAAI Press,1998:175-182.
[28] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structurebased prediction of eukaryotic protein phosphorylation sites[J].Journal of Molecular Biology,1999, 294(5):1351-1362.
[29] GUPTA R.Prediction of glycosylation sites in proteomes:From posttranslational modifications to protein function[D].CBS,2001.
[30] GUPTA R,BRUNAK S.Prediction of glycosylation across the human proteome and the correlation to protein function[J].Pac Symp Biocomput,2002,7:310-322.
[31] JUHL JENSEN L,GUPTA R,BLOM N,et al.Ab initio prediction of human orphan protein function from posttranslational modifications and localization features[J].J Mol Biol,2002,319:1257-1265.
[32] JENSEN L J,GUPTA R,STAERFELDT H H,et al.Prediction of human protein function according to Gene Ontology categories[J].Bioinformatics,2003,19(5):635-642.
[33] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISSMODEL:Modelling protein tertiary and quaternary structure using evolutionary information[J].Nucleic Acids Res,2014,42:252-258.
[34] ARNOLD K,BORDOLI L,KOPP J,et al.The SWISSMODEL workspace:A webbased environment for protein structure homology modelling[J].Bioinformatics,2006,22:195-201.
[35] BENKERT P,BIASINI M,SCHWEDE T.Toward the estimation of the absolute quality of individual protein structure models[J].Bioinformatics,2011,27:343-350
[36] REINA J J,GUERRERO C,HEREDIA A.Isolation,characterization,and localization of AgaSGNH cDNA:A new SGNHmotif plant hydrolase specific to Agave americana L.leaf epidermis[J].J Exp Bot,2007,58(11):2717-2731.
[37] LING H,ZHAO J,ZUO K,et al.Isolation and expression analysis of a GDSLlike lipase gene from Brassica napus L.[J].J Biochem Mol Biol,2006,39:297-303.
[38] KIBA T,NAITOU T,KOIZUMI N,et al.Combinatorial microarray analysis revealing Arabidopsis genes implicated in cytokinin responses through the His->Asp phosphorelay circuitry[J].Plant Cell Physiol,2005,46:339-355.
[39] CAO D,CHENG H,WU W,et al.Gibberellin mobilizes distinct DELLAdependent transcriptomes to regulate seed germination and floral development in Arabidopsis[J].Plant Physiol,2006,142:509-525.
[40] SVENDSEN A.Lipase protein engineering[J].Biochimica et Biophyscia Acta,2000,1543:223-238.
[41] 陳國(guó)強(qiáng),孟鵬,劉李黎,等.高粱抗壞血酸過(guò)氧化物酶基因的電子克隆及序列分析[J].生物信息學(xué),2011,9(2):125-130.
[42] 林立霞,郭海,黃少偉,等.火炬松DREB1基因的電子克隆與生物信息學(xué)分析[J].生物信息學(xué),2010,8(1):43-46.
[43] FENG Y J,ZHANG H M,JIANG M G,et al.In silico cloning of full length cDNA of Cryphonectria parasitica ubiquitin conjugated enzyme gene (CpUBC) [J].Chinese J Bioinformatics,2004,2:5-9.
[44] 黃寧,張玉葉,闕友雄,等.甘蔗二氨基庚二酸異構(gòu)酶基因的克隆與表達(dá)分析[J].熱帶作物學(xué)報(bào),2013,34(11):2200-2208.
[45] 上官凌飛,王晨,房經(jīng)貴,等.利用GenBank中大量葡萄 EST序列分離有效基因的電子表達(dá)分析平臺(tái)[J].中國(guó)農(nóng)業(yè)科學(xué),2011,44(13):2748-2759.
[46] WHITE J A,TODD J,NEWMAN T,et al.A new set of Arabidopsis expressed sequence tags from developing seeds.The metabolic pathway from carbohydrates to seed oil[J].Plant Physiol,2000,124(4):1582-1594.
[47] FEI Z,TANG X,ALBA R,et al.Tomato Expression Database(TED):A suite of data presentation and analysis tools[J].Nucleic Acids Res,2006,34:D766-770.
[48] MOCHIDA K,KAWAURA K,SHIMOSAKA E,et al.Tissue expression map of a large number of expressed sequence tags and its application to in silico screening of stress response genes in common wheat[J].Molecular Genetics and Genomics,2006,276(3):304-312.
[49] KIM Y J,HWANG B K.Pepper gene encoding a basic pathogenesis-related 1 protein is pathogen and ethylene inducible[J].Physiol Plant,2000,108:51-60.
[50] LEE Y K,HIPPESANWALD S,LEE S C,et al.In situ localization of PR1 mRNA and PR1 protein in compatible and incompatible interactions of pepper stems with Phytophthora capsici[J].Protoplasma,2000,211:64-75.
[51] HONG J K,HWANG B K.Induction by pathogen,salt and drought of a basic class II chitinase mRNA and its in situ localization in pepper (Capsicum annuum)[J].Physiol Plant,2002,114(4):549-558.
[52] HONG J K,LEE S C,HWANG B K.Activation of pepper basic PR-1 gene promoter during defense signaling to pathogen,abiotic and environmental stresses[J].Gene,2005,356:169-180.
[53] 本杰明·盧因.基因 VIII[M].余龍,江松敏,趙壽元,主譯.北京:科學(xué)出版社,2004:95-124.