• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      棉花苯丙氨酸解氨酶基因家族的生物信息學分析

      2021-02-05 09:38:50李雨哲邢淋雪劉夢潔劉蘇瑤鮑夢楠劉震
      棉花學報 2021年1期
      關鍵詞:海島棉雷蒙德共線性

      李雨哲,邢淋雪,劉夢潔,劉蘇瑤,鮑夢楠,劉震

      (安陽工學院,河南安陽45500)

      棉花是重要的纖維作物,棉花產(chǎn)業(yè)對中國經(jīng)濟發(fā)展有著重要的作用。 二倍體棉種分為8 個基因組(即A~G 和K),而常見的四倍體棉種(陸地棉、海島棉)為異源四倍體,由A 和D 兩個二倍體亞組組成[1]。 二倍體亞洲棉(Gossypium arboreum,A 組)[2]、雷蒙德氏棉(G.raimondii,D 組)[3]及四倍體陸地棉 (G.hirsutum,AD 組)、 海島棉(G.barabdense,AD 組)[4-5]的基因組已經(jīng)公布。 同時,NCBI-SRA 數(shù)據(jù)庫也公布了棉屬大量的表達數(shù)據(jù),為開展基因家族的全基因組鑒定與生物信息學分析提供了基礎信息。

      苯丙烷代謝途徑是植物重要的三大次生途徑之一, 其上游起始是以L- 苯丙氨酸或酪氨酸為底物,在苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL,EC 4.3.1.5)的催化下脫氨,產(chǎn)生反式肉桂酸,最終生成香豆酰輔酶A,并以此為底物進入下游的類黃酮代謝、木質素代謝、香豆素代謝等分支[6-7]。 苯丙烷類代謝途徑的中間產(chǎn)物酚類物質和終產(chǎn)物黃酮、異類黃酮、木質素等物質參與植物的抗病原菌侵入過程,從而防御病原生物的侵染[8]。 PAL 是初級代謝途徑和苯丙烷類代謝途徑第一步反應的連接酶,是苯丙烷代謝的關鍵限速酶;它也被認為是一種防御酶,其編碼基因屬于多基因家族成員, 不同物種其拷貝數(shù)各異,成員從幾個至幾十個不等[9-10]。 PAL 表達量和活性的提高能促進木質素及酚類等次生物質的合成[11]。木質素是植物細胞次生壁的重要成分,次生壁加厚能在細胞形態(tài)結構上抵抗黃萎病菌的入侵,是棉株抗黃萎病菌的第一道屏障,次生壁中的木質素含量與棉花品種的耐病程度成正比。 已有研究表明,PAL 對阻礙棉花黃萎病菌的侵染具有重要作用[12]。 酚類物質作為莽草酸途徑的中間產(chǎn)物, 在棉花抗病防御反應中也有重要作用,它能抑制真菌水解酶的合成和分泌,避免棉花木質部結構的分解或導管的堵塞[11]。 生物信息學的方法在全基因組分析中發(fā)揮著越來越重要的作用, 棉花的多個重要基因家族已經(jīng)通過生物信息學的全基因組分析取得了重要成果[13-14]。 本研究依據(jù)已公布的陸地棉、海島棉、亞洲棉和雷蒙德氏棉的基因組數(shù)據(jù), 系統(tǒng)地分析了棉花PAL基因家族成員的進化、基因結構、共線性關系和基因表達等, 為深入研究棉花PAL 功能提供數(shù)據(jù)支撐。

      1 材料與方法

      1.1 棉花PAL 基因家族的全基因組鑒定與理化性質分析

      下載陸地棉(https://www.cottongen.org/)、海島棉(https://www.cottongen.org/)、亞洲棉(ftp://bioinfo.ayit.edu.cn/downloads/) 和 雷 蒙 德 氏 棉(https://cottonfgd.org/) 的基因組序列和注釋數(shù)據(jù)。 依據(jù)PAL 家族的隱馬爾可夫模型文件PF00221,利用HMMER 程序[15];同時依據(jù)擬南芥PAL 家族蛋白序列,利用BLASTP 程序[16](E 值設為1e-10), 搜尋上述4 個棉種的PAL 家族蛋白序列。 進一步通過在線工具NCBI CD-Search(https://www.ncbi.nlm.nih.gov/cdd/)和Search Pfam(http://pfam.xfam.org/search)進行驗證,去除保守結構域不完整的序列,得到PAL 家族成員序列。

      借助在線工具ExPASy(https://www.expasy.org/)計算棉花PAL 家族成員的分子量和等電點。 利用亞細胞定位工具WoLF PSORT(https://wolfpsort.hgc.jp/)預測棉花PAL 家族的亞細胞定位。

      1.2 棉花PAL 基因家族的進化與基因結構分析

      利用MEGA-X[17]內(nèi)置的Clustal W[18]對棉花PAL 蛋白序列進行比對,采用鄰接法(Neibourjoining method),Bootstrap 重復1 000 次構建進化樹。 利用在線工具GSDS(http://gsds.cbi.pku.edu.cn/)分析棉花PAL 基因家族成員的基因結構。 利用在線工具MEME(http://meme-suite.org/)分析PAL 蛋白序列的保守結構域,最大發(fā)現(xiàn)基序設置為10,其他參數(shù)為默認值。

      1.3 棉花PAL 基因家族的染色體定位與順式作用元件分析

      依據(jù)陸地棉、海島棉、亞洲棉和雷蒙德氏棉的基因組注釋文件,利用MapChart[19]軟件繪制PAL 基因家族在染色體上的位置圖。編寫perl 腳本,從基因組序列中提取PAL 基因上游1 500 bp(base pair, 堿基對)作為啟動子序列,利用在線工具PlantCARE[20]分析啟動子的順式作用元件。

      1.4 棉花PAL 基因家族成員的共線性分析

      利用MCScanX[21]軟件分析PAL 基因家族在陸地棉、海島棉、亞洲棉和雷蒙德氏棉中成員的共線性關系,最小模塊設置為10 個基因,并通過KaKs_Calculator 2.0[13]計算PAL 基因的選擇壓力。

      1.5 棉花PAL 基因家族的表達分析

      從NCBI SRA(https://www.ncbi.nlm.nih.gov/sra/)數(shù)據(jù)庫下載高溫、低溫、鹽和PEG 脅迫下的陸地棉轉錄數(shù)據(jù)(NCBI BioProject:PRJNA248163),并下載陸地棉和海島棉在不同組織中的轉錄數(shù)據(jù)(NCBI BioProject: PRJNA490626)。 使用軟件Trimmomatic[22]去除轉錄序列兩邊的接頭,并對數(shù)據(jù)做質量控制。 通過軟件hisat2[23]將read 序列比對到基因組,使用軟件cufflinks[24]得出基因的表達量標準值FPKM (Fragments per kilobase million),將表達數(shù)據(jù)進行l(wèi)og2(FPKM+1)處理后,使用MeV[25]軟件將表達數(shù)據(jù)可視化。

      2 結果與分析

      2.1 棉花PAL 基因家族成員的數(shù)量及其理化性質

      綜合HMMER 和BLASTP 程序的分析結果(表1),共從陸地棉、海島棉、亞洲棉和雷蒙德氏棉中鑒定出40 個棉花PAL 基因, 其中陸地棉12 個、海島棉13 個、亞洲棉7 個、雷蒙德氏棉8 個。 PAL 蛋白包含491~753 個氨基酸殘基,等 電 點 為5.85 ~9.09; 除GB_D04G1317 和GH_D04G1248 的編碼蛋白外,均呈酸性,分子量為54 360.02~78 879.87。 亞細胞定位結果顯示PAL 蛋白全部在細胞質中(表1)。

      2.2 棉花PAL 基因家族的結構

      進化分析結果表明棉花40 個PAL 基因家族成員可分為6 組,依次命名為Group1~Group6(圖1)。同一組內(nèi)的PAL 基因具有相近的序列長度。 Group1 中GB_D04G1317 有6 個外顯 子,GH_D04G1248 有5 個外顯子,Gorai.009G416400有4 個外顯子;Group6 中均只有1 個外顯子;其余的PAL 基因家族成員均含2 個外顯子。

      表1 棉花PAL 基因家族成員信息Table 1 Information of cotton PAL gene family members

      表1 (續(xù))Table 1 (Continued)

      我們將從PAL 蛋白序列中找到的10 個保守基序依次命名為Motif 1~Motif 10(圖1)。 棉花40 個PAL 家族成員中有36 個具有全部的10個Motif,且順序相同。 在4 個缺失Motif 的PAL基因中,3 個是來自Group1 中“內(nèi)含子- 外顯子”結構發(fā)生變化的基因, 另外一個是Group4 中的Gorai.007G373700 基因。

      順式作用元件分析結果表明,陸地棉、海島棉、 亞洲棉和雷蒙德氏棉中的PAL 基因含有較多 的 光 響 應 相 關 元 件(ATCT-motif、GT1-motif、box-4、TCT-motif 等19 種)、 激素反應相關元件(ABRE、TGA-element、GARE-motif 等8 種)、脅迫響應相關元件 (LTR、WUN-motif、ARE 等6種) 和 生 長 發(fā) 育 相 關 元 件 (RY-element 和CAT-box 等3 種)。 其中光反應元件的數(shù)量較多且種類豐富。 在激素響應元件中,乙烯響應元件含量較多(圖2)。

      2.3 棉花PAL 基因家族的染色體分布與共線性關系

      棉花PAL 基因家族在染色體上的分布比較分散, 每條染色體包含1 個或2 個PAL 基因。 2 個PAL 基因位于同一染色體的則兩者距離非常近(圖3)。 在分析的4 個棉種之間共發(fā)現(xiàn)271 個PAL 共線性基因對; 結合PAL 基因家族的分組數(shù)據(jù)(圖1),發(fā)現(xiàn)除一條染色體上有2 個PAL 基 因 外(Ga04G0847、GB_A04G0957、Gorai.009G416400.1,GB_D04G1317,GH_D04G1248,Gorai.007G373700.1),同一組的PAL 基因之間均具有共線性關系(圖4)。

      2.4 棉花PAL 基因家族的表達

      圖1 PAL 基因的結構與保守基序Fig. 1 Gene structure and conserred motif of PAL gene in cotton

      圖2 順式作用元件位置圖Fig. 2 Location diagram of cis-acting element

      圖3 PAL 基因在染色體上的位置Fig. 3 Location of PAL gene on chromosome

      總的來看, 陸地棉PAL 基因家族的表達量隨高溫、鹽和PEG 脅迫時間變化而增加,而在低溫脅迫下的表達量隨時間變化而逐漸減少。GH_D09G1608 和GH_D04G1247 基因分別在低溫和高溫脅迫12 h 后的表達量最高、GH_A01G2316 基因在鹽和PEG 脅迫12 h 后的表達量最高;GH_D04G1248 在本實驗所有條件下都不表達。在低溫脅迫下,GH_A06G0814 呈現(xiàn)上升趨勢(圖5)。 我們進一步分析了陸地棉和海島棉PAL 基因家族成員在不同組織中的表達情況(圖6), 結果表明,PAL 基因在不同組織中的表達量不同,根、莖中的表達量較高,萼片中的表達量則較 低。 陸 地 棉 GH_D04G1248 和 海 島 棉GB_D04G1317 在所有檢測的組織都不表達。

      3 討論

      圖4 棉花PAL 基因共線性分析圖Fig. 4 Collinear analysis diagram of PAL genes in cotton

      PAL 蛋白在植物防御系統(tǒng)中起著重要作用,參與植物響應病原菌的過程。 有研究表明,PAL與棉花黃萎病抗性有關[12],PAL 酶活也可以作為植物抗病的標志酶[26]。 PAL 基因家族是一個相對較小的多基因家族,存在于多種植物,如擬南芥中有4 個PAL 基因[27],胡桃中有12 個[28],黃瓜中有13 個[29]。 依據(jù)進化分組數(shù)據(jù)和共線性關系,我們推測亞洲棉和雷蒙德氏棉分化之前的二倍體祖先共有6 個PAL 基因, 分別對應于本研究中的6 個分組。 其中Group1(4 號染色體祖先)中的PAL 基因進行了一次復制,因此該二倍體祖先有7 個PAL 基因祖先。我們還推測最初的四倍體祖先有14 個PAL 基因,在隨后的進化過程中丟失了1 個(位于D06 染色體)。 四倍體分化之后,陸地棉再丟失1 個PAL 基因 (位于A04 染色體)。此外,分化之后,雷蒙德氏棉的PAL 也發(fā)生了復制和丟失的情況,最終在陸地棉、海島棉、亞洲棉和 雷 蒙 德 氏 棉 中 分 別 有12、13、7、8 個PAL 基因。

      圖5 陸地棉PAL 基因家族在非生物脅迫下的表達Fig. 5 Expression of PAL gene family under different stress in G. hirsutum

      圖6 PAL 基因家族在陸地棉和海島棉不同組織的表達Fig. 6 Expression of PAL gene family in different tissues of G. hirsutum and G. barabdense

      棉花PAL 基因在不同逆境脅迫下的表達變化趨勢也不盡相同。 在高溫、 鹽以及PEG 脅迫下,陸地棉PAL 基因的表達量明顯升高,這可能與PAL 基因參與木質素、 黃酮類等苯丙烷類代謝物的生成有關。 但在低溫脅迫下,基因的表達量呈下調(diào)趨勢, 推測低溫可能會影響PAL 基因的表達。 GH_D04G1248 在本實驗所有條件下都不表達。 參考基因結構和保守域分析結果,該基因含有5 個外顯子, 缺失motif 7 與motif 9 保守域; 同時, 在該基因附近有另一個PAL 基因GH_D04G1247,因此我們推測GH_D04G1248 可能已經(jīng)喪失了生物學活性,成為假基因。

      4 結論

      本研究分析了陸地棉、海島棉、亞洲棉和雷蒙德氏棉基因組中PAL 基因家族成員的理化性質、基因結構、保守結構域、順式作用元件、染色體分布、進化、共線性關系和表達,推測了棉花PAL 基因家族成員數(shù)量的進化歷程。研究發(fā)現(xiàn)棉花PAL 基因家族在不同條件、 不同器官中的表達均有差異, 個別PAL 基因家族成員可能已經(jīng)喪失了表達能力。 這些研究結果為深入解析棉花PAL 基因的功能提供了參考。

      猜你喜歡
      海島棉雷蒙德共線性
      銀行不良貸款額影響因素分析
      科學與財富(2021年3期)2021-03-08 10:56:02
      雷蒙德·卡佛:《你們?yōu)槭裁床惶鴤€舞?》
      文氏圖在計量統(tǒng)計類課程教學中的應用
      ——以多重共線性內(nèi)容為例
      不完全多重共線性定義存在的問題及其修正建議
      遲到的斷想
      蜂鳥
      雷蒙德·卡佛的短篇小說
      轉Bt基因海島棉分子檢測及抗蟲性鑒定
      棉花陸海雜交親本及子代光合葉綠素熒光參數(shù)分析
      新疆海島棉生產(chǎn)現(xiàn)狀與發(fā)展建議
      望城县| 高邮市| 泽普县| 康保县| 盐池县| 翼城县| 天长市| 日照市| 白银市| 泾川县| 柯坪县| 凉山| 枣强县| 溧水县| 洛宁县| 易门县| 广灵县| 赣州市| 连云港市| 鄢陵县| 黄山市| 闸北区| 财经| 安陆市| 隆化县| 通城县| 仙居县| 依兰县| 渑池县| 昌邑市| 呼图壁县| 武邑县| 香港 | 梅河口市| 和平区| 通辽市| 金华市| 筠连县| 普定县| 从江县| 武冈市|