齊燕妮 李聞娟 趙麗蓉 李 雯 王利民 謝亞萍 趙 瑋 黨 照 張建平,*
亞麻生氰糖苷合成關(guān)鍵酶CYP79基因家族的鑒定及表達分析
齊燕妮1李聞娟1趙麗蓉2李 雯2王利民1謝亞萍1趙 瑋1黨 照1張建平1,*
1甘肅省農(nóng)業(yè)科學(xué)院作物研究所, 甘肅蘭州 730070;2甘肅農(nóng)業(yè)大學(xué)農(nóng)學(xué)院 / 甘肅省干旱生境作物重點實驗室 / 甘肅省作物遺傳改良與種質(zhì)資源創(chuàng)新重點實驗室, 甘肅蘭州 730070
CYP79蛋白是生氰糖苷合成關(guān)鍵酶, 但關(guān)于亞麻基因的研究鮮有報道。本研究對包括亞麻在內(nèi)的9種作物的CYP79基因家族進行了鑒定, 并分析了亞麻基因的序列特征、復(fù)制事件、共線性關(guān)系、系統(tǒng)進化、順式作用元件及表達模式。結(jié)果表明, 在亞麻、白亞麻、毛果楊、木薯、芝麻、高粱、大豆、葡萄及水稻中分別鑒定到9、9、3、2、5、7、6、16和4個CYP79家族成員; 系統(tǒng)進化分析顯示,基因的進化具有物種特異性;不均勻分布在4條染色體上, 具有1~3個外顯子, 其啟動子區(qū)含大量激素與逆境響應(yīng)相關(guān)元件; 共克隆到8個亞麻CYP79基因的全長DNA序列及5個成員的全長cDNA序列; LuCYP79蛋白序列長度為282~565 aa, 等電點為5.84~9.14, 分子量為31.56~62.86 kD, 均為親水性蛋白, 定位于內(nèi)質(zhì)網(wǎng); 共有5對基因發(fā)生復(fù)制事件, 占全部基因的77.8%, 全部經(jīng)歷了強烈的純化選擇, 其中和在擬南芥和木薯中均具有同源基因。表達分析表明, LuCYP79家族成員具有組織特異性, 且各成員在不同遺傳背景下表達模式不同, 其中、、和在4個品種中的表達差異顯著。相關(guān)分析表明, 50 d時的/與成熟亞麻籽中生氰糖苷含量呈極顯著正相關(guān), 20 d時的/及()/分別與成熟亞麻籽中生氰糖苷含量呈極顯著正相關(guān), 初步推測其可能是亞麻籽生氰糖苷合成的關(guān)鍵基因。研究結(jié)果對進一步闡明亞麻CYP79蛋白的功能具有積極意義, 并為培育低生氰糖苷亞麻品種提供了理論參考。
亞麻; CYP79基因家族; 生氰糖苷; 生物信息學(xué); 表達分析
亞麻(L.), 是一種一年生的自花授粉的二倍體作物(2= 2= 30)[1]。因其油用、纖用、飼用及工業(yè)等價值, 至今仍被廣泛種植[2-3]。亞麻籽富含α-亞麻酸、木酚素(3%)、維生素E、膳食纖維等多種營養(yǎng)物質(zhì), 已經(jīng)應(yīng)用于奶制品、烤制品、肉制品等多種功能性食品[4]。亞麻籽中α-亞麻酸含量是油料作物中最高的(55%以上), 是人類從膳食中攝取α-亞麻酸的重要來源之一。此外, 亞麻籽還被添加于動物飼料中, 以改善其健康狀況并提高其營養(yǎng)價值[3]。然而, 亞麻籽中還含有劇毒化學(xué)物質(zhì), 即氰化物生氰糖苷。人和動物如果長期攝入含生氰糖苷的食物會引起氰化物慢性中毒, 主要癥狀為生長發(fā)育遲緩和甲狀腺腫大[5-7]。生氰糖苷的存在對亞麻籽食用或加工品質(zhì)具有極大的影響, 導(dǎo)致亞麻及其相關(guān)產(chǎn)業(yè)發(fā)展嚴(yán)重受限, 因此將亞麻籽生氰糖苷含量控制在合理的水平具有非常重要的意義。
在高等植物中, 生氰糖苷的合成是以氨基酸為底物, 由CYP79、CYP71及糖基轉(zhuǎn)移酶催化的串聯(lián)反應(yīng), 其中CYP79催化氨基酸轉(zhuǎn)化成相應(yīng)的醛肟, 這是生氰糖苷合成的起始限速步驟[8]。1995年, 首次在高粱中發(fā)現(xiàn)CYP79A1, 催化L-酪氨酸轉(zhuǎn)化為p-羥基苯乙醛肟, 最終產(chǎn)生蜀黍苷[9], 隨后在擬南芥[10]、木薯[11]、毛果楊[12]及玉米[13]等多個物種中鑒定到CYP79蛋白, 這說明CYP79廣泛存在于高等植物中。Bark等[14]通過對白芥CYP79B1、高粱CYP79A1、擬南芥CYP79B2及旱金蓮、番木瓜、油菜的CYP79氨基酸序列進行分析發(fā)現(xiàn), CYP79家族相當(dāng)保守, 同源性很高, 而且都含有CYP79家族特有的FXP (E/D)RH及亞鐵血紅素結(jié)合序列SFSTG (K/R)RGC(A/I)A, 表明不同植物中催化第一步反應(yīng)的酶都是由保守的CYP79家族同源基因編碼。研究發(fā)現(xiàn), 表達了高粱基因的擬南芥, 其硫代葡萄糖苷含量比對照增加了3.5~4.5倍[15]。擬南芥和突變體中, 最終產(chǎn)物短鏈芥子油甙和長鏈芥子油甙大幅度減少甚至完全消失[16-17]。此外, CYP79具有底物特異性, 從而產(chǎn)生不同種類的防御物質(zhì)[18]。擬南芥中CYP79B2與CYP79B3以L-色氨酸為底物分別參與吲哚類硫苷和植保素的形成[19], CYP79A2催化苯丙氨酸生成苯基乙醛肟[20], 而CYP79F1和CYP79F2分別以短鏈和長鏈甲硫氨酸衍生物為底物[16-17]。木薯CYP79D1和CYP79D2分別以L-纈氨酸和L-異亮氨酸為底物, 最終產(chǎn)物分別為亞麻苦苷和百脈根苷[21]。歐洲紫衫CYP79A118優(yōu)先催化L-酪氨酸, 最終產(chǎn)生紫衫氰醇苷[22]。
近年來, 隨著亞麻全基因組測序工作的完成(登錄號為QMEI02000000), 利用生物信息學(xué)方法進行基因家族分析已經(jīng)成為挖掘亞麻功能基因的重要手段。目前已經(jīng)在擬南芥[23]和玉米[12]中分別鑒定到7個和4個基因, 但亞麻中關(guān)于基因的研究鮮有報道。本研究擬鑒定亞麻基因組中CYP79基因家族成員并對其進行克隆, 通過對序列特征、系統(tǒng)進化、共線性關(guān)系及時空表達模式等方面進行全面系統(tǒng)的分析, 以期為進一步解析亞麻家族各成員的功能奠定基礎(chǔ), 為利用分子手段定向控制亞麻生氰糖苷的含量提供新的途徑。
本研究選取4個亞麻品種, 隴亞10號、R2、匈牙利3號和張亞2號, 均種植于甘肅省農(nóng)業(yè)科學(xué)院試驗基地。出苗后10 d、20 d、30 d、40 d分別采集4個品種的根、莖、葉; 開花初期采集根、莖、葉、花; 并且采集開花后10 d、20 d、30 d、40 d、50 d的根、莖、葉、種子。樣品于液氮中速凍后儲存在-80℃, 用于DNA和RNA提取。
亞麻和野生白亞麻基因組相關(guān)數(shù)據(jù)來自本研究室(亞麻基因組序列已上傳至NCBI, http://www.ncbi. nlm.nih.gov/, 登錄號為QMEI02000000; 亞麻和白亞麻CDS序列, 蛋白質(zhì)序列及gff文件已分別上傳至https://doi.org/10.6084/m9.figshare.13614311.v3和https://doi.org/10.6084/m9.figshare.19119737.v1)。擬南芥、毛果楊、木薯、高粱、大豆、葡萄及水稻基因組序列和注釋文件從植物基因組數(shù)據(jù)庫(phytozome v9.0, http://www.phytozome.net/)下載, 芝麻全基因組蛋白序列, 擬南芥、木薯及玉米等已知CYP79蛋白序列從NCBI下載。利用Blastp, 將已知CYP79蛋白序列與亞麻、野生白亞麻、毛果楊、木薯、芝麻、高粱、大豆、葡萄及水稻全基因組蛋白數(shù)據(jù)庫分別進行比對, 之后用Pfam和NCBI 保守結(jié)構(gòu)域數(shù)據(jù)庫(CDD)進行結(jié)構(gòu)域確認(rèn), 最后確認(rèn)候選序列是否含有CYP79蛋白特有的FXP(E/D)RH位點和血氧紅素結(jié)合位點SFSTG(K/R)RGC(A/I)A。
用試劑盒Plant Easy Spin RNA Miniprep Kit(BIOMIGA, 美國)提取各樣品RNA, 隨后利用NanoDrop2000分光光度計和凝膠電泳對RNA的濃度和純度進行檢測。采用PrimeScriptRT Reagent Kit with gDNA Eraser (Perfect Real Time; TaKaRa)進行基因組DNA去除和cDNA合成。使用CP Plant Miniprep Kit (BIOMIGA, 美國)提取出苗后20 d的葉片DNA。
根據(jù)從隴亞10號基因組獲取的序列, 利用Primer Premier 5.0設(shè)計基因全長擴增引物(附表1)。分別以DNA和cDNA為模板, 利用KOD FX高保真酶(TOYOBO)進行PCR擴增。PCR產(chǎn)物純化后克隆到pENTR/D-TOPO克隆試劑盒(Invitrogen, 美國)提供的載體上并進行測序。用MEGA6.0進行序列分析, 最后將所有序列上傳至GenBank數(shù)據(jù)庫。
利用GSDS (http://gsds.cbi.pku.edu.cn/)進行基因結(jié)構(gòu)分析及可視化[24]。利用ExPASy ProtParam (http://web.wxoasy.org/protparam/)[25]和Plant-mPloc (http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)分別對LuCYP79蛋白的理化性質(zhì)和亞細(xì)胞定位進行預(yù)測; 同時使用ExPASy ProtScale (https:// web.expasy.org/protscale/)預(yù)測LuCYP79蛋白的親疏水性。分別利用SOPMA (https://npsa-prabi.ibcp.fr/cgi- bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和SWISS-MODEL(https://swissmodel.expasy.org/ interactive)預(yù)測LuCYP79蛋白的二級和三級結(jié)構(gòu)。利用MEME在線軟件(http://alternate.meme-suite.org/ tools/meme)分析LuCYP79蛋白的保守基序[26]。
利用在線軟件Map Gene to Chromosome (http://mg2c.iask.in/mg2c_v2.0/)將基因定位到染色體。采用MCScanX, 在默認(rèn)參數(shù)下分析基因在亞麻基因組中的串聯(lián)復(fù)制和片段復(fù)制事件[27], 利用TBtools分析亞麻基因組內(nèi)及亞麻與木薯、擬南芥、葡萄、芝麻、水稻、高粱之間的共線性并進行可視化。利用MGEA6.0將發(fā)生復(fù)制事件的基因的CDS序列轉(zhuǎn)化為氨基酸序列, 進行MUSCLE比對之后重新轉(zhuǎn)化為核苷酸序列。將比對文件導(dǎo)入DnaSP6, 計算非同義替換率(Ka)和同義替換率(Ks), 利用Ka/Ks比值進行選擇壓力分析。一般來講, Ka/Ks > 1、= 1 和 < 1 分別表示正向選擇、中性選擇和純化選擇。對發(fā)生復(fù)制的每一個基因?qū)? 用Mya (million years ago) = Ks/(2×6.1×10–9)×10–6計算分歧時間[28]。
從亞麻基因組序列中提取基因起始位置上游2000 bp的序列, 通過PlantCARE數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析順式作用元件[29]。
利用MEGA6.0軟件的ClustalW對亞麻、白亞麻、擬南芥、毛果楊、木薯、芝麻、高粱、大豆、葡萄、玉米及水稻等11個物種CYP79蛋白序列進行多序列比對, 隨后采用鄰接法(Neighbor-Joining method)構(gòu)建系統(tǒng)進化樹, Bootstrap校驗參數(shù)為1000次[30]。
引物設(shè)計、qRT-PCR反應(yīng)體系及程序參考Zhang等[31]的方法, 引物見附表2。試驗儀器為Eco Real-Time PCR System (Illumine), 以為內(nèi)參基因[32]。每個樣品3次重復(fù), 采用2–ΔΔCt法計算基因的相對表達量[33]。
參考寇向龍等[34]方法測定隴亞10號、R2、匈牙利3號和張亞2號4個品種成熟籽粒中生氰糖苷含量。采用SPSS 19.0進行顯著性差異分析和相關(guān)性分析。
通過Blastp比對, CDD和Pfam數(shù)據(jù)庫進行結(jié)構(gòu)域分析以及CYP79家族保守位點的確認(rèn), 在亞麻、野生白亞麻、毛果楊、木薯、芝麻、高粱、大豆、葡萄及水稻基因組中分別鑒定到9、9、3、2、5、7、6、16和4個CYP79成員(表1和附表3)。栽培亞麻與野生白亞麻基因數(shù)目相同, 但不同物種間CYP79家族成員的數(shù)量具有顯著差異。根據(jù)亞麻基因在染色體上的位置, 將其依次命名為~。
以隴亞10號的DNA和cDNA分別作為模板, 對基因進行擴增。除, 其余基因均可得到完整的DNA序列(圖1-A), 但只有、、、和獲得了完整的CDS序列(圖1-B)?;駾NA序列長度在1096~2116 bp之間, CDS長度在849~1698 bp之間, 從而推測出蛋白序列長度在282~565 aa之間(表1)。將序列提交至 NCBI 數(shù)據(jù)庫, GenBank登錄號分別為OM688195、OM688196、OM688197、OM688198、OM688199、OM688200、OM688201、OM688202和OM688203。
表1 亞麻CYP79基因家族主要特征
ER: 內(nèi)質(zhì)網(wǎng)。ER: endoplasmic reticulum.
圖1 LuCYP79基因全長DNA擴增(A)和cDNA擴增(B)
(A) M: DL 5000 marker; 1–8:,,,,,,, and, respectively. (B) M: DL 2000 marker; 1–5:,,,, and, respectively.
基因結(jié)構(gòu)分析結(jié)果表明, 除-5和分別具有1個和3個外顯子外, 其余基因均具有2個外顯子(表1和圖2)。理化性質(zhì)分析結(jié)果表明, LuCYP79蛋白分子量在31.56~62.86 kD之間; 等電點在5.84~9.14之間, 只有LuCYP79-1和LuCYP79-6為酸性蛋白, 其余均為堿性蛋白; 所有LuCYP79蛋白為親水性蛋白(附圖1)。亞細(xì)胞定位結(jié)果表明, 所有LuCYP79蛋白均定位在內(nèi)質(zhì)網(wǎng)。對LuCYP79蛋白二級結(jié)構(gòu)進行預(yù)測發(fā)現(xiàn), α-螺旋含量最多, 其次為無規(guī)則卷曲和延伸鏈, β-轉(zhuǎn)角含量最少(附表4)。LuCYP79蛋白三級結(jié)構(gòu)預(yù)測結(jié)果與二級結(jié)構(gòu)一致(附圖2)。對LuCYP79蛋白進行保守基序分析發(fā)現(xiàn), 9個LuCYP79蛋白共預(yù)測到14個保守基序(Motif), 其中有5個成員具有14個Motif, LuCYP79-1含有的Motif最少(圖2和附圖3)。Motif 1、Motif 4和Motif 8存在于所有LuCYP79成員, 而且Motif 1和Motif 4分別含有CYP79家族高度保守的血氧紅素結(jié)合位點SFSTG(K/R)RGC(A/I)A和FXP(E/D)RH位點(圖3)。此外, 除Motif14, 其余10個Motif存在于8個LuCYP79蛋白。
圖2 LuCYP79系統(tǒng)進化、基因結(jié)構(gòu)及Motif分析
圖3亞麻LuCYP79家族SFSTG(K/R)RGC(A/I)A和FXP(E/D)RH保守位點
LuCYP79家族成員分布在4條染色體上, 其中、和分布在2號染色體,和分布在6號染色體,、和分布在12號染色體, 15號染色體僅有分布(圖4)。亞麻基因組內(nèi)部共線性分析顯示, 2對基因(/、/)存在共線性關(guān)系, 分布在4條染色體上(圖5-A)。進一步分析發(fā)現(xiàn), 有5對基因發(fā)生復(fù)制事件, 其中3對為串聯(lián)復(fù)制(//、/), 2對發(fā)生片段復(fù)制(/、/) (圖4和表2)。串聯(lián)復(fù)制基因占全部基因的55.6%, 說明串聯(lián)復(fù)制事件在LuCYP79基因家族擴張中起主要作用。通過Ka/Ks比值判斷基因有無選擇壓力。復(fù)制基因的Ka/Ks比值全部小于1, 說明所有發(fā)生復(fù)制的基因經(jīng)歷了純化選擇(表2)。有4對基因的Ka/Ks比值在0.1左右, Ka/Ks平均值為0.1548, 說明基因進化非常保守。對復(fù)制事件發(fā)生的分歧時間進行計算發(fā)現(xiàn),發(fā)生串聯(lián)復(fù)制的分歧時間最短和最長分別在5412萬和9053萬年前, 發(fā)生片段復(fù)制的分歧時間最短和最長分別在134萬和8796萬年前。為進一步了解亞麻家族的進化機制, 分別分析其與擬南芥、木薯、芝麻、葡萄、高粱、水稻之間的共線性關(guān)系, 3個基因與擬南芥存在共線性關(guān)系,,和在亞麻中有1~2個同源基因; 2個與木薯存在共線性關(guān)系, MeCYP79D2在亞麻中有2個同源基因(圖5-B); 亞麻基因與葡萄、芝麻及2個單子葉植物沒有共線性。
為進一步研究基因的轉(zhuǎn)錄調(diào)控機制和潛在功能, 提取起始密碼子上游2000 bp預(yù)測順式作用元件。如表3所示,啟動子區(qū)除含有真核生物基本元件(TATA-box、CAAT-box)外, 均含有厭氧誘導(dǎo)必需的響應(yīng)元件(ARE)和光響應(yīng)元件(G-box、GT1-motif、Box 4和GATA-motif等)。啟動子區(qū)還含有4類激素響應(yīng)元件, 分別為脫落酸響應(yīng)元件(ABRE)、茉莉酸甲酯響應(yīng)作用元件(TGACG-motif和CGTCA-motif)、生長素響應(yīng)元件(TGA-element、AuxRR-core和AuxRE)和赤霉素響應(yīng)元件(GARE-motif和P-box)。所有基因啟動子區(qū)都含有ABRE; 除外, 其余8個基因都含有TGACG-motif和CGTCA-motif; 有6個基因含有不同類型的生長素響應(yīng)元件。啟動子還含有與逆境脅迫相關(guān)的作用元件, 其中有5個基因含有低溫響應(yīng)元件(LTR), 4個基因含有干旱響應(yīng)元件(MBS)。此外,啟動子還含有種子調(diào)控元件(RY-element)、分生組織相關(guān)調(diào)控元件(CAT-box)和玉米醇溶蛋白代謝相關(guān)的調(diào)控元件(O2-site)等。
圖4 LuCYP79基因在亞麻染色體的分布
灰色線條和紅色矩形分別代表片段復(fù)制和串聯(lián)復(fù)制。
Gray line and red rectangle indicates segmental and tandem duplication, respectively.
圖5 亞麻基因組內(nèi)LuCYP79基因共線性及其與擬南芥和木薯間的共線性
A: 灰色線條表示具有共線性的基因?qū)?。B: 灰色線條表示亞麻與其他物種的共線性區(qū)域, 彩色線條表示與不同物種具有共線性的基因?qū)Α?/p>
A: the gray lines indicate the colineargene pairs. B: the gray lines show the collinear regions between flax and other species, and the color lines represent the collineargene pairs between different species.
表2 LuCYP79基因復(fù)制事件、選擇壓力及分歧時間
表3 LuCYP79啟動子順式作用元件
(續(xù)表3)
為明確不同物種CYP79家族成員間的進化關(guān)系, 本研究利用8個雙子葉植物(亞麻、野生白亞麻、擬南芥、大豆、葡萄、芝麻、木薯、毛果楊)及3個單子葉植物(水稻、玉米和高粱)的全長蛋白序列構(gòu)建了系統(tǒng)進化樹。如圖6所示, CYP79蛋白可分為五大支。第1支含有亞麻、白亞麻、木薯全部CYP79以及擬南芥AtCYP79B2和AtCYP79B3; 第2支含有毛果楊和大豆全部CYP79; 第3支包括芝麻全部CYP79及擬南芥AtCYP79C1、AtCYP79C2、AtCYP79F1和AtCYP79F2; 第4支含有高粱、玉米、水稻等單子葉植物全部CYP79; 第5支為葡萄CYP79。結(jié)果表明, LuCYP79與LbCYP79親緣關(guān)系最近, 同時它們與木薯MeCYP79D1和MeCYP79D2具有相當(dāng)近的親緣關(guān)系, 而且與擬南芥AtCYP79B2和AtCYP79B3親緣關(guān)系密切, 而其他物種的CYP79大多分別聚在一起, 表明CYP79具有物種特異性。
圖6 CYP79家族系統(tǒng)進化樹
利用qRT-PCR分析9個LuCYP79家族成員在4個亞麻品種不同發(fā)育階段種子中的表達模式發(fā)現(xiàn), 各基因在不同品種中具有不同的表達模式, 如、和在隴亞10號開花后40 d的種子中表達量最高, 但在R2中的表達量在開花后20 d達到最高, 而在匈牙利3號中, 其在開花后30 d的種子中表達量最高;在隴亞10號、張亞2號、R2及匈牙利3號中的表達量分別在開花后50 d、40 d、20 d及30 d的種子中達到最高;在4個品種種子中的表達量分別在50 d、40 d、50 d、20 d達到最高;在不同品種種子中的表達量高峰分別為10 d、50 d、20 d、20 d;的表達量高峰分別在30 d、40 d、20 d、20 d;分別在30 d、40 d、20 d、30 d的種子中表達量較高(圖7)。總的來說, 各基因在張亞2號不同發(fā)育階段種子中的表達量普遍低于其他3個品種。除表達模式外, 不同發(fā)育階段各基因的累積表達量在不同品種中具有明顯差異(圖8), 其中、、和在4個品種中的差異最明顯, 最高表達量是最低表達量的4倍以上, 差異最大的可達到28倍。
圖7 LuCYP79家族在4個亞麻品種不同發(fā)育階段種子中的表達模式
圖8 LuCYP79家族在4個亞麻品種種子發(fā)育階段的累積表達量
為進一步解析、、和的功能, 本研究分析了它們在不同品種、不同組織、不同發(fā)育階段的表達模式。結(jié)果表明, 各基因在不同組織均有表達, 呈現(xiàn)出組織特異性表達, 且各基因表達模式不同(圖9)。在莖中的表達量總體高于其他組織, 且在苗期莖中的表達量高于發(fā)育后期莖中的表達量;在莖、葉及種子中都有較高的表達量, 莖中的表達量苗期高于發(fā)育后期, 但在葉中的表達量發(fā)育后期高于苗期;和在根和莖中的表達量較高, 而且都是營養(yǎng)生長階段的表達量總體高于生殖生長階段。
本研究對隴亞10號、張亞2號、R2和匈牙利3號4個亞麻品種成熟籽粒中生氰糖苷含量進行測定發(fā)現(xiàn), 這4個亞麻品種成熟籽粒中生氰糖苷含量差異顯著(≤0.05) (圖10)。相關(guān)分析表明,與在開花后50 d亞麻籽中基因表達量的比值與成熟亞麻籽中生氰糖苷含量呈極顯著正相關(guān)(≤0.01) (圖11-A); 在開花后20 d的亞麻籽中,與及+與基因表達量的比值分別與成熟籽粒中生氰糖苷含量表現(xiàn)為極顯著正相關(guān) (≤0.01) (圖11-B, C)。
(圖9)
R1~R4: 出苗后10 d、20 d、30 d、40 d根; R5: 開花初根; R6~R10: 開花后10 d、20 d、30 d、40 d、50 d根; S1~S4: 苗期10 d、20 d、30 d、40 d莖; S5: 開花初莖; S6~S10: 開花后10 d、20 d、30 d、40 d、50 d莖; L1~L4: 苗期10 d、20 d、30 d、40 d葉; L5: 開花初葉; L6~L10: 開花后10 d、20 d、30 d、40 d、50 d葉; F: 花; 10~50 d: 開花后10~50 d種子。
R1–R4: 10 days, 20 days, 30 days, and 40 days root at seeding stage; R5: root at early blooming stage; R6–R10: 10 days, 20 days, 30 days, 40 days, and 50 days root after flowering; S1–S4: 10 days, 20 days, 30 days, and 40 days stem at seeding stage; S5: stem at early blooming stage; S6–S10: 10 days, 20 days, 30 days, 40 days, and 50 days stem after flowering; L1–L4: 10 days, 20 days, 30 days, and 40 days leaf at seeding stage; L5: leaf at early blooming stage; L6–L10: 10 days, 20 days, 30 days, 40 days, and 50 days leaf after flowering; F: flower; 10–50 d: 10–50 days seeds after flowering.
隨著生活質(zhì)量的提高, 人們對食品安全問題日益重視, 亞麻籽中有毒氰化物生氰糖苷的存在已成為限制亞麻相關(guān)產(chǎn)業(yè)發(fā)展的重要原因之一。亞麻基因組的釋放使亞麻分子生物學(xué)研究進入一個新的階段, 從分子水平上控制生氰糖苷的合成或加速其代謝是降低亞麻籽中生氰糖苷含量的有效途徑之一。CYP79家族是生氰糖苷合成的限速酶[8], 在植物中廣泛存在, 目前已經(jīng)在擬南芥[16-17,35]、木薯[11]、毛果楊[12]、玉米[13]、青花菜[36]等物種中相繼被克隆, 但關(guān)于亞麻基因的結(jié)構(gòu)特征及功能尚不清楚。
圖10 4個亞麻品種成熟籽粒中生氰糖苷含量
不同小寫字母表示在0.05水平具有顯著性差異。
Different lowercase letters mean significant differences at the 0.05 probability level.
本研究在亞麻、白亞麻、毛果楊、木薯、芝麻、高粱、大豆、葡萄及水稻等9個物種中分別獲得9、9、3、2、5、7、6、16和4個CYP79成員, 顯示不同物種間CYP79家族成員數(shù)量存在顯著差異, 這與不同物種進化中基因的缺失及擴張有關(guān)。但栽培亞麻與其祖先種白亞麻數(shù)量相同, 表明在亞麻馴化過程中CYP79家族的進化較為保守。本研究并未克隆到全部基因, 這可能是因為LuCYP79家族成員序列相似性較高, 難以進行特異性擴增, 或是表達量較低, 無法獲得足夠的擴增產(chǎn)物進行克隆。對LuCYP79蛋白進行保守基序分析發(fā)現(xiàn), Motif 1、Motif 4和Motif 8存在于所有成員, 而且Motif 1和Motif 4分別含有該家族保守位點SFSTG(K/R)RGC(A/I)A和FXP(E/D)RH, 說明這3個Motif是LuCYP79家族的特征性基序。亞細(xì)胞定位顯示該蛋白在內(nèi)質(zhì)網(wǎng), 表明LuCYP79在內(nèi)質(zhì)網(wǎng)中起作用。系統(tǒng)進化分析結(jié)果顯示,與其野生種親緣關(guān)系最近, 基本成對聚在一起, 其次為木薯和擬南芥, 這與物種間親緣關(guān)系不盡一致[31], 而且其他物種基本單獨聚在一起, 說明在各物種中的進化具有特異性。所有單子葉植物的單獨聚為一支, 表明在單子葉植物與雙子葉植物分化后獨立進化。
圖11 LuCYP79基因表達量與成熟亞麻籽中生氰糖苷含量的相關(guān)性
Y: 成熟亞麻籽中生氰糖苷含量; A、B及C中的分別代表與、與及與基因表達量的比值。
Y: cyanogenic glycoside concentration in mature flaxseed;in A, B, and C represents the gene expression ratio ofto,to, and+to, respectively.
基因復(fù)制事件是基因家族擴張及功能分化的重要原因, 主要有全基因組復(fù)制/片段復(fù)制和串聯(lián)復(fù)制2種方式[37-38]。在進化中也發(fā)生了復(fù)制事件, 有3對基因發(fā)生了串聯(lián)復(fù)制, 2對基因發(fā)生了片段復(fù)制, 發(fā)生復(fù)制的基因占全部基因的77.8%, 說明串聯(lián)復(fù)制和片段復(fù)制在LuCYP79基因家族擴張中起關(guān)鍵作用。的Ka/Ks比值都小于1, 平均Ka/Ks比值為0.1548, 說明LuCYP79家族經(jīng)歷了非常強烈的純化選擇, 進一步說明在進化過程中的保守性。共線性分析結(jié)果顯示, 分別有3個和2個亞麻基因在擬南芥與木薯中具有同源基因, 其中和在2個物種中都有同源基因, 說明這2個基因在進化中比較保守; 但與葡萄、芝麻及單子葉植物并無共線性, 這與系統(tǒng)進化分析結(jié)果相符, 進一步說明基因在各物種中的進化具有特異性。
基因表達受其上游區(qū)順式作用元件的調(diào)控, ABRE為脫落酸響應(yīng)的作用元件[39]; LTR是響應(yīng)低溫誘導(dǎo)的作用元件[40]; MYB轉(zhuǎn)錄因子結(jié)合順式元件參與植物對干旱的應(yīng)答[41]。通過分析LuCYP79家族的順式作用元件, 可以進一步了解LuCYP79家族的調(diào)控機理及其可能參與的生物過程。本研究發(fā)現(xiàn),啟動子區(qū)含有ABRE、TGACG-motif、TGA-element、GARE-motif等多個激素響應(yīng)元件以及逆境脅迫(干旱、低溫)相關(guān)元件MBS和LTR, 這表明LuCYP79除催化生氰糖苷合成外, 還參與調(diào)控亞麻對激素及非生物脅迫的響應(yīng)等多個生理過程, 同時還說明基因的表達受多種因素調(diào)控。
基因表達模式對深入研究基因功能具有非常重要的作用。為進一步了解LuCYP79家族各成員的功能, 本研究在不同品種、不同組織、不同發(fā)育時期對基因進行了表達分析?;蛟陔]亞10號、張亞2號、R2及匈牙利3號4個品種亞麻籽中具不同的表達趨勢, 這可能與各品種的遺傳背景相關(guān)。此外, 各基因在張亞2號中的表達量普遍較低, 這與生氰糖苷含量測定結(jié)果相一致, 張亞2號成熟籽粒中生氰糖苷含量顯著低于其他3個品種。對各基因在種子不同發(fā)育階段的累積表達量進行分析發(fā)現(xiàn), 各成員的累積表達量在籽粒生氰糖苷含量具有顯著差異的4個亞麻品種中差異極大, 其中、、和在4個品種中的差異達到4倍以上, 差異最大的可達到28倍。且本研究發(fā)現(xiàn), 花后50 d籽粒中與基因表達量的比值, 花后20 d籽粒中與、與基因表達量的比值分別與成熟籽粒中生氰糖苷含量呈極顯著正相關(guān)(≤0.01), 說明這幾個基因可能在亞麻籽生氰糖苷合成中起關(guān)鍵作用。進一步分析、、和在不同組織中的表達模式發(fā)現(xiàn), 這幾個基因呈現(xiàn)出不同的組織特異性表達, 且具有不同的表達趨勢, 此外, 同一個基因在不同品種中的時空表達模式也不盡相同, 說明這些基因可能在不同基因型亞麻品種生氰糖苷合成或是其他生理過程中發(fā)揮不同的作用, 但各成員具體的功能還需深入探究。
本研究在亞麻基因組中共鑒定到9個LuCYP79家族成員, 均含有CYP79家族特有的保守位點, 并對其理化性質(zhì)、基因結(jié)構(gòu)、染色體定位、復(fù)制事件、共線性關(guān)系、進化特征等進行了分析, 預(yù)測到基因啟動子區(qū)含有多種激素及逆境脅迫相關(guān)元件。在不同遺傳背景下LuCYP79基因家族各成員具有不同的時空表達模式,、、和可能是調(diào)控亞麻籽生氰糖苷合成的關(guān)鍵基因。
附表和附圖 請見網(wǎng)絡(luò)版: 1) 本刊網(wǎng)站http://zwxb.chinacrops.org/; 2) 中國知網(wǎng)http:// www.cnki.net/; 3) 萬方數(shù)據(jù)http://c.wanfangdata. com.cn/Periodicalzuowxb.aspx。
[1] Zohary D. Monophyletic vs. polyphyletic origin of the crops on which agriculture was founded in the near east., 1999, 46: 133–142.
[2] Oomah B D. Flaxseed as a functional food source., 2001, 81: 889–894.
[3] Turner T D, Mapiye C, Aalhus J L, Beaulieu A D, Patience J F, Zijlstra R T. Flaxseed fed pork: n-3 fatty acidenrichment and contribution to dietary recommendations., 2014, 96: 541–547.
[4] Goyal A, Sharma V, Upadhyay N, Gill S, Sihag M. Flax and flaxseed oil: an ancient medicine & modernfunctional food., 2014, 9: 1633–1653.
[5] Oomah B D, Mazza G, Kenaschuk E O. Cyanogenic compounds in flaxseed., 1992, 40: 1346–1348.
[6] Conn E E. Cyanogenic glycosides., 1981, 7: 479–500.
[7] Nelson L. Acute cyanide toxicity mechanisms and manifestations., 2006, 32: 8–10.
[8] Ganjewala D, Kumar S, Devi A, Ambika K. Advances in cyanogenic glycosides biosynthesis and analyses in plants., 2010, 54: 1–14.
[9] Sibbesen O, Koch B, Halkier B A, Moller B L. Cytochrome P-450TYR is a multifunctional heme-thiolate enzyme catalyzing the conversion of L-tyrosine to p-hydroxyphenylacetaldehyde oxime in the biosynthesis of the cyanogenic glucoside dhurrin in(L.) Moench., 1995, 270: 3506–3511.
[10] Wang C W, Dissing M M, Agerbirk N, Crocoll C, Halkier B A. Characterization ofCYP79C1 and CYP79C2 by glucosinolate pathway engineering inshows substrate specificity toward a range of aliphatic and aromatic amino acids., 2020, 11: 57.
[11] Andersen M D, Busk P K, Svendsen I, M?ller B L. Cytochromes P-450 from cassava (Crantz) catalyzing the first steps in the biosynthesis of the cyanogenic glucosides linamarin and lotaustralin: cloning, functional expression in, and substrate specificity of the isolated recombinant enzymes., 2000, 275:1966–1975.
[12] Irmisch S, McCormick A C, Boeckler G A, Schmidt A, Reichelt M, Schneider B, Block K, Schnitzler J, Gershenzon J, Unsicker S B, K?llner T G. Two herbivore-induced cytochrome P450 enzymes CYP79D6 and CYP79D7 catalyze the formation of volatile aldoximes involved in poplar defense., 2013, 25: 4737–4754.
[13] Irmisch S, Zeltner P, Handrick V, Gershenzon J, K?llner T G. The maize cytochrome P450 CYP79A61 produces phenylacetaldoxime and indole-3-acetaldoxime in heterologous systems and might contribute to plant defense and auxin formation., 2015, 15: 128–139.
[14] Bak S, Nielsen H L, Halkier B A. The presence of CYP79 homologues in glucosinolate-producing plants shows evolutionary conservation of the enzymes in the conversion of amino acid to aldoxime in the biosynthesis of cyanogenic glucosides and glucosinolates., 1998, 38: 725–734.
[15] Petersen B L, Andreasson E, Bak S, Agerbirk N, Halkier B A. Characterization of transgenicwith meta-bolically engineered high levels of p-hydroxybenzylglucosinolate., 2001, 212: 612–618.
[16] Reintanz B, Lehnen M, Reichelt M, Gershenzon J, Kowalczyk M, Sandberg G, Godde M, Uhl R, Palme K. Bus, a bushyCYP79F1 knockout mutant with abolished synthesis of short-chain aliphatic glucosinolates., 2001, 13: 351–367.
[17] Chen S X, Glawischnig E, J?rgensen K, Naur P, J?rgensen B, Olsen C E, Hansen C H, Rasmussen H, Pickett J A, Halkier B A. CYP79F1 and CYP79F2 have distinct functions in the biosynthesis of aliphatic glueosinolates in., 2003, 33: 923–937.
[18] Bak S, Paquette S M, Morant M, Morant V M, Saito S, Bjarnholt N, Zagrobelny M, Jorgensen K, Osmani S, Simonsen H T, Perez R S, Heeswijck T B, Jorgensen B, Moller B L. Cyanogenic glycosides a case study for evolution and application of cytochromes P450., 2006, 5: 309–329.
[19] Hull A K, Vij R, Celenza J L.cytochrome P450s that catalyze the first step of tryptophan-dependent indole-3-acetic acid biosynthesis., 2000, 97: 2379–2384.
[20] Wittstock U, Halkier B A. Cytochrome P450 CYP79A2 fromL. catalyzes the conversion of l-phenylalanine to phenylacetaldoxime in the biosynthesis of benzylglucosinolate., 2000, 275:14659–14666.
[21] Jorgensen K, Morant A V, Morant M, Jensen N B, Olsen C E, Kannangara R, Motawia M S, Moller B L, Bak S. Biosynthesis of the cyanogenic glucosides linamarin and lotaustralin in cassava isolation biochemical characterization and expression pattern of CYP71E7 the oxime-metabolizing cytochrome P450 enzyme., 2011, 155: 282–292.
[22] Luck K, Jia Q D, Huber M, Handrick V, Wong G K, Nelson D R, Chen F, Gershenzon J, K?llner T G. CYP79 P450 monooxygenases in gymnosperms: CYP79A118 is associated with the formation of taxiphyllin in., 2017, 95: 169–180.
[23] Halkier B A, Hansen C H, Naur P, Mikkelsen M D, Wittstock U. The Role of Cytochromes P450 in Biosynthesis and Evolution of Glucosinolates. Amsterdam: Elsevier Science Press, 2002. pp 223–248.
[24] Hu B, Jin J P, Guo A Y, Zhang H, Luo J C, Gao G. GSDS 2.0: anupgraded gene feature visualization server., 2015, 31: 1296–1297.
[25] Wilkins M R, Gasteiger E, Bairoch A, Sanchez J C, Williams K L, Appel R D, Hochstrasser D F. Protein identification and analysis tools on the ExPASy server., 1999, 112: 531–552.
[26] Bailey T L, Johnson J, Grant C E, Noble W S. The MEME suite., 2015, 43: W39–W49.
[27] Wang Y P, Li J P, Paterson A H. MCScanX-transposed: detecting transposed gene duplications based on multiple collinearity scans., 2013, 29: 1458–1460.
[28] Lynch M, Conery J S. The evolutionary fate and consequences of duplicate genes., 2000, 290: 1151–1155.
[29] Lescot M, Dehais P, Thijs G, Marchal K, Moreau Y, Van de Peer Y, Rouze P, Rombauts S. PlantCARE, a database of plantacting regulatory elements and a portal to tools for in silico analysis of promoter sequences., 2002, 30: 325–327.
[30] Tamura K, Stecher G, Peterson D, Filipski A, Kumar S. MEGA6: molecular evolutionary genetics analysis version 6.0., 2013, 30: 2725–2729.
[31] Zhang J P, Qi Y N, Wang L M, Wang L L, Yan X C, Dang Z, Li W J, Zhao W, Pei X W, Li X M, Liu M, Tan M L, Wang L, Long Y, Wang J, Zhang X W, Dang Z H, Zheng H K, Liu T M. Genomic comparison and population diversity analysis provide insights into the domestication and improvement of flax., 2020, 23: 100967.
[32] Huis R, Hawkins S, Neutelings G. Selection of reference genes for quantitative gene expression normalization in flax (L.)., 2010, 10: 71.
[33] Antonov J, Goldstein D R, Oberli A, Baltzer A, Pirotta M, Fleischmann A, Altermatt H J, Jaggi R. Reliable gene expression measurements from degraded RNA by quantitative real-time PCR depend on short amplicons and a proper normalization., 2005, 85: 1040–1050.
[34] 寇向龍, 徐美蓉, 張建平, 趙賓賓, 韓舜愈. 響應(yīng)面法優(yōu)化亞麻籽氫氰酸提取條件. 食品工業(yè)科技, 2016, 37(21): 201–204.
Kou X L, Xu M R, Zhang J P, Zhao B B, Han S Y. Optimization of extraction conditions for hydrocyanic acid in flaxseed by response surface methodology., 2016, 37(21): 201–204 (in Chinese with English abstract).
[35] Mikkelsen M D, Hansen C H, Wittstock U, Halkier B A. Cytochrome P450 CYP79B2 fromcatalyzes the conversion of tryptophan to indole-3-acetaldoxime, a precursor of indole glucosinolates and indole-3-acetic acid., 2000, 275: 33712–33717.
[36] 李占省, 劉玉梅, 方智遠(yuǎn), 楊麗梅, 莊木, 張揚勇, 呂紅豪. 青花菜 P450全長克隆、表達及其與不同器官中萊菔硫烷含量的相關(guān)性分析. 中國農(nóng)業(yè)科學(xué), 2018, 51: 2357–2367.
Li Z S, Liu Y M, Fang Z Y, Yang L M, Zhuang M, Zhang Y Y, Lyu H H. Full length cloning, expression and correlation analysis of P450gene with sulforaphane content in different broccoli organs., 2018, 51: 2357–2367 (in Chinese with English abstract).
[37] Ren R, Wang H F, Guo C C, Zhang N, Zeng L P, Chen Y M, Ma H, Qi J. Widespread whole genome duplications contribute to genome complexity and species diversity in angiosperms., 2018, 11: 414–428.
[38] Zhu Y, Wu N N, Song W L, Yin G J, Qin Y J, Yan Y M, Hu Y K. Soybean () expansin gene superfamily origins: segmental and tandem duplication events followed by divergent selection among subfamilies., 2014, 14: 93.
[39] 華靜靜, 陳曉靜. 植物體中WD40蛋白的研究進展. 黑龍江農(nóng)業(yè)科學(xué), 2015, (5): 153–156.
Hua J J, Chen X J. Progress of WD40 proteins in plant., 2015, (5): 153–156 (in Chinese with English abstract).
[40] Mehlgarten C, Jablonowski D, Wrackmeyer U, Tschitschmann S, Sondermann D, J?ger G, Gong Z, Bystr?m A S, Schaffrath R, Breunig K D. Elongator function in tRNA wobble uridine modification is conserved between yeast and plants., 2010, 76: 1082–1094.
[41] 楊琳, 王宇, 楊劍飛, 李玉花. 花青素積累相關(guān)負(fù)調(diào)控因子的研究進展. 園藝學(xué)報, 2014, 41: 1873–1884.
Yang L, Wang Y, Yang J F, Li Y H. Research advances on negative regulators of anthocyanin accumulation., 2014, 41: 1873–1884 (in Chinese with English abstract).
Identification and expression analysis of CYP79 gene family, a key enzyme for cyanogenic glycoside synthesis in flax
QI Yan-Ni1, LI Wen-Juan1, ZHAO Li-Rong2, LI Wen2, WANG Li-Min1, XIE Ya-Ping1, ZHAO Wei1, DANG Zhao1, and ZHANG Jian-Ping1,*
1Institute of Crop Sciences, Gansu Academy of Agricultural Sciences, Lanzhou 730070, Gansu, China;2College of Agronomy, Gansu Agricultural University / Key Laboratory of Arid Land Crop Science in Gansu Province / Gansu Key Laboratory of Crop Improvement and Germplasm Enhancement, Lanzhou 730070, Gansu, China
CYP79 is a key enzyme in the synthesis of cyanogenic glycoside. However, there is no systematical study ofgenes in flax. In this study, we identifiedgene family in 9 crops including flax, and focused on the sequence characteristics, duplication events, collinearity, evolution,-acting elements and expression patterns ofgenes. The results revealed that a total of 9, 9, 3, 2, 5, 7, 6, 16, and 4 CYP79 family members were identified in flax, pale flax, poplar, cassava, sesame, sorghum, soybean, grape, and rice, respectively. Phylogenetic analysis showed that the evolution ofgenes was species-specific.were distributed unevenly on four chromosomes and had 1–3 exons. The promoter region ofcontained lots of elements involved in response to hormone and stress. 8 full-length DNA sequences and 5 full-length cDNA sequences of flaxgenes were cloned. LuCYP79 proteins contained 282–565 amino acid residues with molecular weight of 31.56–62.86 kD, and isoelectric point of 5.84–9.14. All LuCYP79 members were hydrophilic protein and located in endoplasmic reticulum. There were five pairs ofgenes with duplication events, accounting for 77.8% of all genes, and all the duplication genes underwent strong purification selection. Bothandhad homologous genes inand cassava. The relative expression levels showed that LuCYP79 family members were tissue-specific and had different expression patterns under different genetic backgrounds. There were significantly different in the relative expression of,,, andin the four cultivars. Moreover, correlation analysis showed that/in 50 days flaxseed was significantly positively correlated with the concentration of cyanogenic glycosides in mature flaxseed./and ()/in 20 days flaxseed were significantly positively correlated with the concentration of cyanogenic glycosides in mature flaxseed, respectively. It was preliminarily speculated that they might be the key genes in the synthesis of cyanogenic glycoside in flaxseed. These results have positive significance for further elucidating the function of CYP79 proteins in flax and provide theoretical references for breeding flax varieties with low cyanogenic glycoside.
flax;gene family; cyanogenic glycoside; bioinformatics; the relative expression level
10.3724/SP.J.1006.2023.24042
本研究由甘肅省農(nóng)業(yè)科學(xué)院現(xiàn)代生物育種項目(2020GAAS08, 2022GAAS04), 財政部和農(nóng)業(yè)農(nóng)村部國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(油料), 國家自然科學(xué)基金項目(31760426), 甘肅省知識產(chǎn)權(quán)計劃項目(21ZSCQ026)和甘肅省科技計劃項目(21JR7RA722, 21JR1RA354)資助。
This study was supported by the Modern Biology Breeding Project of Gansu Academy of Agricultural Sciences (2020GAAS08, 2022GAAS04), the China Agriculture Research System (Oil) of MOF and MARA, the National Natural Science Foundation of China (31760426), the Intellectual Property Planning project of Gansu Province (21ZSCQ026), and the Science and Technology Project of Gansu Province (21JR7RA722, 21JR1RA354).
通信作者(Corresponding author):張建平, E-mail: zhangJPzw3@gsagr.ac.cn
E-mail: xbsdqyn@126.com
2022-02-21;
2022-07-21;
2022-08-19.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20220818.1625.006.html
This is an open access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).