• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      豬蛋白編碼基因3'UTR 中IRPRE1 元件 的鑒定及其基因特征分析

      2020-07-11 02:33:02趙為民曹靜邢菲王麗任守文付言峰李碧俠方曉敏
      關(guān)鍵詞:元件基因組編碼

      趙為民,曹靜,邢菲,王麗,任守文,付言峰,李碧俠,方曉敏*

      (1.江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所,江蘇 南京 210014;2.江蘇省農(nóng)業(yè)種質(zhì)資源保護(hù)與利用平臺(tái),江蘇 南京 210014;3.江蘇省農(nóng)業(yè)科學(xué)院動(dòng)物品種改良和繁育重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210014;4.江蘇農(nóng)科傳媒有限公司,江蘇 南京 210014;5.南京農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,江蘇 南京 210095)

      蛋白編碼基因的 3'端非翻譯區(qū)(untranslated region,UTR)是指從終止密碼子到轉(zhuǎn)錄終止位點(diǎn)的這段區(qū)域。該區(qū)域雖然不編碼蛋白質(zhì),但卻含有豐富的調(diào)控元件,以調(diào)控本身mRNA 的表達(dá)水平,從而豐富基因調(diào)控的多樣性與復(fù)雜性。如蛋白編碼基因3'UTR 含有microRNA 結(jié)合的種子序列,使microRNA 通過(guò)調(diào)節(jié)基因mRNA 的穩(wěn)定性來(lái)調(diào)控各種生理活動(dòng)[1-3]。

      Alu 是短散在核重復(fù)序列(SINEs)中最豐富的1 種重復(fù)元件,約占人基因組的10%,廣泛存在于靈長(zhǎng)類(lèi)生物基因的內(nèi)含子、5'和3'端非翻譯區(qū)(UTR)[4-5]。研究表明,Alu 元件在調(diào)控基因的選擇性剪接[5]、基因的轉(zhuǎn)錄與翻譯[6-7]、RNA 的A-to-I 編輯[5,8-10]中具有重要作用。此外,當(dāng)?shù)鞍拙幋a基因的3'UTR 存在反向重復(fù)Alu(IRAlu)時(shí),可導(dǎo)致該基因的mRNA 滯留于細(xì)胞核,而不能運(yùn)出到細(xì)胞質(zhì)進(jìn)行翻譯,從而實(shí)現(xiàn)對(duì)該基因蛋白水平的調(diào)控,進(jìn)而影響細(xì)胞的各種生理活動(dòng)[11-13]。

      Alu 重復(fù)元件雖然特異存在于靈長(zhǎng)類(lèi)動(dòng)物[14],然而在小鼠和豬中已發(fā)現(xiàn)與Alu 元件相對(duì)應(yīng)的B1、B2、B4 元件和PRE1 元件。有研究[15-16]表明,這些相對(duì)應(yīng)元件的結(jié)構(gòu)和功能非常類(lèi)似于靈長(zhǎng)類(lèi)動(dòng)物的Alu。這說(shuō)明存在于豬蛋白編碼基因3'UTR 中的IRPRE1 元件可能與IRAlu 具有類(lèi)似調(diào)控基因的蛋白表達(dá)水平的功能。鑒于此,本研究中,對(duì)豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 中的IRPRE1 重復(fù)元件進(jìn)行鑒定,并對(duì)其對(duì)應(yīng)基因的特征進(jìn)行分析,旨在為研究這些含有IRPRE1 元件的蛋白編碼基因的功能提供依據(jù)。

      1 材料與方法

      1.1 材料

      DH5a 感受態(tài)菌株購(gòu)于北京全式金生物技術(shù)有限公司。蘇紫豬組織樣品來(lái)源于江蘇省農(nóng)業(yè)科學(xué)院六合動(dòng)物實(shí)驗(yàn)基地。采集3 頭健康成年母豬的心、肝、脾、肺、腎、小腸、背肌組織,投入液氮迅速冷凍,于-80 ℃保存,備用。

      1.2 主要試劑

      RNA 提取試劑盒(Takara MiniBEST Universal RNA Extraction Kit)、cDNA 反轉(zhuǎn)錄試劑盒(PrimeScript? RT Master Mix)、DNA Marker 和pMD19-T 購(gòu)于Takara;Golden Star T6 Super PCR Mix(1.1×)購(gòu)于北京擎科新業(yè)生物技術(shù)有限公司;DNA 純化回收試劑盒(DNA Clean & Concentrator)購(gòu)于Zymo Research。

      1.3 豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 中IRPRE1 元件的分析

      從Ensemble 網(wǎng)站的BioMart 中下載豬全基因組(Sscrofa11.1,Ensemble92)范圍內(nèi)的蛋白編碼基因的3'UTR 序列,整理成Fasta 格式。由于PRE1 元件屬于SINE/tRNA,使用RepeatMasker 在線網(wǎng)站對(duì)豬蛋白編碼基因3'UTR 序列先進(jìn)行重復(fù)序列分析,篩選條件中search engine 為cross_match,DNA source為pig,挑選含有SINE/tRNA 元件的蛋白編碼基因;進(jìn)一步選取SINE/tRNA 中含有Pre0_SS 和PRE1x (包括PRE1a、PRE1b、PRE1c、PRE1d、PRE1d2、PRE1e、PRE1f、PRE1f2、PRE1g、PRE1h、PRE1i、PRE1j、PRE1k)元件的蛋白編碼基因;再選擇Pre0_SS 和PRE1x 長(zhǎng)度≥100 bp,且其中至少有1 對(duì)IR 的Pre0_SS 和PRE1x 元件為最終候選蛋白編碼基因。

      1.4 GO 與KEGG 分析

      采用DAVID(Database for Annotation, Visualization and Integrated Discovery)對(duì)候選蛋白編碼基因進(jìn)行GO(Gene Ontology)和KEGG pathway (Kyoto Ency- clopedia of Genes and Genomes)分析,選擇人的對(duì)應(yīng)基因作為背景,研究這些蛋白編碼基因參與的生物學(xué)功能與途徑。篩選條件選擇Count 為2,EASE 為0.01,fold enrichment 不小于1.5。

      1.5 候選蛋白編碼基因IRPRE1 元件的鑒定與組織表達(dá)

      參照Takara MiniBEST Universal RNA Extraction Kit 說(shuō)明書(shū)提取豬組織樣品的總RNA,并進(jìn)行DNaseI 處理。參照PrimeScript? II 1st Strand cDNA Synthesis Kit說(shuō)明書(shū)進(jìn)行反轉(zhuǎn)錄,對(duì)每個(gè)組織的1 μg總RNA 進(jìn)行反轉(zhuǎn)錄,反轉(zhuǎn)錄完后用滅菌水稀釋5倍,于-20 ℃保存。按照Golden Star T6 Super PCR Mix(1.1×)說(shuō)明書(shū)進(jìn)行PCR,HPRT1基因?yàn)閮?nèi)參基因,所有引物列于表1。引物合成與測(cè)序驗(yàn)證均由南京擎科生物科技有限公司完成。對(duì)3 個(gè)蛋白編碼基因TRMO、RCSD1和DBT的3'UTR 中的IRPRE1 元件進(jìn)行組織表達(dá)譜分析。由于選取的IRPRE1 元件位于3'UTR 且都是位于單個(gè)外顯子上,為了避免RNA 樣品中的DNA 污染,利用基因組上的引物(Genome)進(jìn)行PCR 檢測(cè),以檢測(cè)RNA 樣品中是否含有DNA。

      表1 引物序列信息 Table 1 Primer sequence information

      2 結(jié)果與分析

      2.1 豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 序列的重復(fù)元件

      對(duì)Ensemble 網(wǎng)站中豬的全基因組范圍內(nèi)蛋白編碼基因分析發(fā)現(xiàn),一共有22 342 個(gè)蛋白編碼基因,對(duì)應(yīng)45 788 個(gè)轉(zhuǎn)錄本。對(duì)45 788 個(gè)轉(zhuǎn)錄本的3'UTR 序列進(jìn)行重復(fù)序列分析發(fā)現(xiàn),其含有重復(fù)序列中的2 大類(lèi)型,即分散重復(fù)序列與串聯(lián)重復(fù)序列。分散重復(fù)序列中的DNA 轉(zhuǎn)座子(DNA transposon)、長(zhǎng)末端重復(fù)序列(LTR)、長(zhǎng)散在重復(fù)序列(LINE)和短散在重復(fù)序列(SINE)分別占總數(shù)的7.31%、5.36%、14.87%和27.58%;串聯(lián)重復(fù)序列中的簡(jiǎn)單重復(fù)序列 (simple_repeat)和低復(fù)雜度序列(low_complexity)分別占總數(shù)的31.08%和4.09%;其他種類(lèi)重復(fù)序列占總數(shù)的9.71%。進(jìn)一步發(fā)現(xiàn)SINE 與簡(jiǎn)單重復(fù)序列種類(lèi)的重復(fù)序列所占比例較高,其次為L(zhǎng)INE,其余的都低于10%。

      2.2 豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 中SINE/tRNA 的種類(lèi)

      對(duì)豬的全基因組范圍內(nèi)蛋白編碼基因3'UTR中僅含有SINE/tRNA 的序列分析發(fā)現(xiàn),其亞種類(lèi)繁多,每個(gè)種類(lèi)都占有一定的比例,而其中Pre0_SS和PRE1x 所占的比例分別為41.83%和37.51%(表2),這2 類(lèi)重復(fù)元件所占比例較高。

      表2 豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 中SINE/tRNA 的種類(lèi)占比 Table 2 Analysis of SINE/tRNA type within 3'UTR sequences of genome-wide of protein-coding genes in porcine genome

      2.3 豬全基因組范圍內(nèi)蛋白編碼基因3'UTR 含有IRPRE1 元件的鑒定結(jié)果

      先去除豬全基因組范圍內(nèi)的22 342 個(gè)蛋白編碼基因3'UTR 中不含有SINE/tRNA 重復(fù)元件的基因,留下5 017 個(gè)蛋白編碼基因;再去除SINE/tRNA重復(fù)元件中不含Pre0_SS 與PRE1x 元件的基因,留下4 486 個(gè)蛋白編碼基因;然后去除Pre0_SS 與PRE1x 元件全部為同一方向、長(zhǎng)度小于100 bp 的Pre0_SS 和PRE1x 的基因,最終得到1 094 個(gè)候選蛋白編碼基因,對(duì)應(yīng)1 636 個(gè)轉(zhuǎn)錄本,進(jìn)一步分析發(fā)現(xiàn),這1 636 個(gè)轉(zhuǎn)錄本中PRE1 家族元件的長(zhǎng)度為10~323 bp。如表3 所示,1 094 個(gè)蛋白編碼基因在豬不同染色體上的分布不同,其中Y 染色體上的最少,只有3 個(gè)。1~4 號(hào)和6 號(hào)染色體上的較多,其中6 號(hào)染色體的最多,達(dá)117 個(gè)。

      表3 候選蛋白編碼基因在染色體上的分布 Table 3 The number distribution of candidate protein–coding genes on chromosomes

      2.4 候選蛋白編碼基因的GO 分析結(jié)果

      候選蛋白編碼基因一共參與38 個(gè)生物學(xué)過(guò)程,22 個(gè)細(xì)胞組分和15 個(gè)分子功能(P<0.05)。以P值顯著性程度來(lái)衡量,生物過(guò)程、細(xì)胞組分和分子功能中排前十的注釋列于圖1。

      圖1 候選蛋白編碼基因的GO 注釋 Fig.1 GO analysis of candidate protein–coding genes

      2.5 候選蛋白編碼基因的KEGG pathway 分析結(jié)果

      如表4 所示,以P值顯著性程度來(lái)衡量,候選蛋白編碼基因一共參與9 個(gè)生物學(xué)通路(P<0.05)。

      表4 KEGG 通路中基因相關(guān)信息 Table 4 Gene information involved in KEGG pathway

      2.6 候選蛋白編碼基因IRPRE1 元件的鑒定與組織表達(dá)結(jié)果

      圖2 為3 個(gè)蛋白編碼基因TRMO、RCSD1和DBT的3'UTR 中IRPRE1 元件方向示意圖。從圖3可知,陰性對(duì)照與DNaseI 消化后的各個(gè)組織RNA均檢測(cè)不到Genome擴(kuò)增產(chǎn)物,而作為陽(yáng)性對(duì)照的基因組DNA 中能檢測(cè)到Genome擴(kuò)增產(chǎn)物,說(shuō)明提取的組織RNA 中消除了DNA 的污染。從圖4 可知,TRMO、RCSD1和DBT中IRPRE1 元件在各個(gè)組織中都有不同程度的表達(dá);TRMO基因的IRPRE1元件在心、肝、脾、肺、腎和肌肉中的表達(dá)較高,小腸中表達(dá)較弱;RCSD1基因的IRPRE1 元件在肌肉中表達(dá)較高,其他組織表達(dá)較弱,小腸中幾乎檢測(cè)不到;DBT基因的IRPRE1 元件在肌肉中表達(dá)較高,其他組織表達(dá)較弱,肺中幾乎檢測(cè)不到。

      圖2 TRMO 和RCSD1 及DBT 基因的3'UTR 中IRPRE1 元件 Fig.2 A diagram of IRPRE1 elements of 3'UTR of TRMO,RCSD1 and DBT gene

      圖3 RNA 樣品的DNA 污染檢測(cè)結(jié)果 Fig.3 DNA contamination detection for the RNA sample

      圖4 候選蛋白編碼基因IRPRE1 元件的組織表達(dá)譜 Fig.4 Tissue expression profile of IRPRE1 element of candidate protein coding genes

      3 結(jié)論與討論

      Ensemble 數(shù)據(jù)庫(kù)對(duì)每個(gè)蛋白編碼基因有完善的注釋信息,包括轉(zhuǎn)錄起始和終止位點(diǎn)、5'UTR 和3'UTR 的序列信息、cDNA 序列、CDS 序列等等,而且每隔一段時(shí)間就會(huì)發(fā)布一個(gè)新版本,非常有利于查詢(xún),很多研究對(duì)基因的注釋信息都采用Ensemble[17-18]。NCBI 數(shù)據(jù)庫(kù)對(duì)蛋白編碼基因的結(jié)構(gòu)注釋信息,尤其是UTR 序列信息沒(méi)有Ensemble數(shù)據(jù)庫(kù)完善,且NCBI 數(shù)據(jù)庫(kù)與Ensemble 數(shù)據(jù)庫(kù)對(duì)基因的轉(zhuǎn)錄本數(shù)量及UTR 的序列注釋差異也較大,目前對(duì)這種差異性還不能有效地驗(yàn)證哪一個(gè)數(shù)據(jù)庫(kù)注釋的正確。在對(duì)Ensemble 數(shù)據(jù)庫(kù)中的蛋白編碼基因3'UTR 分析的同時(shí),也查閱了相應(yīng)NCBI 數(shù)據(jù)庫(kù)中的信息,發(fā)現(xiàn)存在很多差異,如在選取的3個(gè)基因TRMO、RCSD1、DBT中,RCSD1和DBT基因的3'UTR 序列在Ensemble 和NCBI 數(shù)據(jù)庫(kù)中一致,但TRMO 基因的3'UTR 序列的IRPRE1 元件序列在NCBI 的注釋中沒(méi)有,在Ensemble 的注釋中有,且試驗(yàn)也驗(yàn)證了TRMO基因3'UTR 序列的IRPRE1 元件的表達(dá);因此,在本研究中采用了Ensemble 數(shù)據(jù)庫(kù)。

      重復(fù)序列元件廣泛存在于哺乳動(dòng)物基因組中,人的基因組中有將近一半的序列為重復(fù)元件[4]。LINE 和SINE 作為重復(fù)元件的主要類(lèi)型,在基因的多樣性中發(fā)揮重要作用[14,19-20]。在豬的基因組序列中,LINE 和SINE 分別占17.5%和11.4%[16]。本研究中,LINE 和SINE 分別占3'UTR 總重復(fù)元件的14.87%和27.58%,且SINE 的占比僅僅稍低于簡(jiǎn)單重復(fù)序列(31.08%),表明SINE 相對(duì)于LINE 在3'UTR 序列可能發(fā)揮更加重要的調(diào)控作用。研究[16]表明,Pre0_SS 是非常相似于PRE1 的元件,故本研究中把Pre0_SS 元件也歸納到PRE1 元件家族中。本研究中,SINE/tRNA 中,Pre0_SS 和PRE1x 所占的比例分別為41.83%和37.51%,是SNINE/tRNA中最豐富的元件,這與對(duì)應(yīng)人物種中Alu 元件占SINE 比例最高是一致的[4]。

      Alu 元件的長(zhǎng)度約為300 bp[21],而PRE1 家族元件的長(zhǎng)度約為250 bp[16]。本文研究中,PRE1 家族元件的長(zhǎng)度為10~323 bp,說(shuō)明有些蛋白編碼基因3'UTR 中的PRE1 元件的長(zhǎng)度并不完整,有些只是PRE1 的部分序列。有研究[22-23]表明,IRAlu 中的2 個(gè)反向的Alu 元件長(zhǎng)度大于100 bp 時(shí)才能形成有效的雙鏈RNA,從而發(fā)揮生物學(xué)功能,故本研究中對(duì)IRPRE1 元件的分析中也選取了蛋白編碼基因3'UTR 中長(zhǎng)度大于100 bp 的PRE1。本研究中,IRPRE1 的2 個(gè)相反的PRE1 元件之間的間隔序列長(zhǎng)度從幾十到上千個(gè)堿基,目前尚不清楚這種長(zhǎng)度大小對(duì)IRPRE1 發(fā)揮的功能有何具體影響,且這種間隔長(zhǎng)度大小變化也見(jiàn)于IRAlu 中[12],需要后續(xù)進(jìn)一步研究。

      KEGG pathway 分析發(fā)現(xiàn),有1 094 個(gè)蛋白編碼基因參與多種生物學(xué)通路,其中包括TNF 信號(hào)通路與RIG-I 樣受體信號(hào)等。TNF 與RIG-I 信號(hào)通路是響應(yīng)細(xì)胞內(nèi)外信號(hào)的通路,可影響多種細(xì)胞的生理活動(dòng)[24-25],其相關(guān)基因的表達(dá)水平在上述通路中發(fā)揮重要功能,表明這些候選基因的IRPRE1 元件可能在調(diào)控其基因的表達(dá)水平中發(fā)揮著作用,進(jìn)而影響基因本身在這些通路中的調(diào)控作用。

      猜你喜歡
      元件基因組編碼
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
      《全元詩(shī)》未編碼疑難字考辨十五則
      子帶編碼在圖像壓縮編碼中的應(yīng)用
      電子制作(2019年22期)2020-01-14 03:16:24
      Genome and healthcare
      QFN元件的返工指南
      在新興產(chǎn)業(yè)看小元件如何發(fā)揮大作用
      寶馬i3高電壓元件介紹(上)
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      Cu4簇合物“元件組裝”合成及其結(jié)構(gòu)與電催化作用
      耒阳市| 广平县| 天等县| 三门峡市| 灌云县| 珠海市| 米林县| 慈利县| 龙胜| 乐安县| 武威市| 广河县| 湖州市| 佛教| 林州市| 来安县| 应城市| 金秀| 内丘县| 云龙县| 留坝县| 屯昌县| 枝江市| 博爱县| 江安县| 阿克苏市| 锡林郭勒盟| 通州区| 封开县| 沁水县| 鄢陵县| 保山市| 盘山县| 武胜县| 乐平市| 汾西县| 莱芜市| 达拉特旗| 寻甸| 渝中区| 苏尼特右旗|