王瑞雪 劉佳森 李蘊(yùn)華 成立新 岳林芳 馬萬(wàn)山 趙艷紅
(1.內(nèi)蒙古自治區(qū)農(nóng)牧業(yè)科學(xué)院 畜牧研究所,呼和浩特 010031;2.內(nèi)蒙古農(nóng)業(yè)大學(xué) 動(dòng)物科學(xué)學(xué)院,呼和浩特 010018)
lncRNA作為2012年度新興起的生命科學(xué)研究之一[1],在生物眾多生命活動(dòng)中起著至關(guān)重要的調(diào)控作用,是繼mRNA和miRNA之后最熱門的分子生物學(xué)研究領(lǐng)域之一。lncRNA 是一類長(zhǎng)度均>200 nt且不具備或很少具有蛋白質(zhì)編碼能力的 RNA[2],并缺乏明顯的開放閱讀框。最初有研究認(rèn)為 lncRNA 是基因組轉(zhuǎn)錄過程中形成的“噪音”,在生物體內(nèi)不發(fā)揮任何生物學(xué)功能[3]。但近期的研究表明,lncRNA可參與細(xì)胞核和細(xì)胞質(zhì)中的 X 染色體失活、染色體結(jié)構(gòu)改變、基因印記、轉(zhuǎn)錄激活/沉默和核內(nèi)運(yùn)輸?shù)汝P(guān)鍵生命活動(dòng)[4]。Cesana等[5]通過研究人和小鼠的骨骼肌生長(zhǎng)發(fā)育時(shí)發(fā)現(xiàn),特異性表達(dá)的長(zhǎng)鏈非編碼 RNA linc-MD1可以結(jié)合miR-133和miR-135來調(diào)控肌肉特異性基因MAML1和MEF2C的表達(dá)。Zhu等[6]研究發(fā)現(xiàn),lnc-mg 通過結(jié)合miR-125b調(diào)控骨骼肌發(fā)生的關(guān)鍵調(diào)節(jié)因子-IGF2的蛋白質(zhì)水平,進(jìn)而調(diào)節(jié)肌肉的生長(zhǎng)發(fā)育。近年來,在畜禽領(lǐng)域逐漸開展了lncRNA的相關(guān)研究。Ren等[7]在豬的胎兒滋養(yǎng)層鑒定出一種新的lncRNA,發(fā)現(xiàn)其在豬胎兒骨骼肌中表達(dá)上調(diào),并顯著影響豬胎兒骨骼肌的發(fā)育。Li等[8]通過RNA-seq技術(shù)和生物信息學(xué)分析方法,在雞基因組中鑒定出281種與雞骨骼肌發(fā)育相關(guān)的新lncRNA。
綿羊肌肉發(fā)育相關(guān)的lncRNA研究正處于起步階段,劉瑞鑿等[9]利用轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)烏珠穆沁羊和特克賽爾羊腓腸肌進(jìn)行l(wèi)ncRNA測(cè)序,發(fā)現(xiàn)lncRNA TCONS_00102859只在特克賽爾羊腓腸肌中表達(dá),并且隨著發(fā)育其表達(dá)量逐漸增高。進(jìn)一步研究顯示,TCONS_00102859的過表達(dá)會(huì)引起肌肉分化相關(guān)基因MyoD和MyoG表達(dá)上調(diào),MSTN表達(dá)下調(diào),證明TCONS_00102859可能在成肌細(xì)胞的增殖分化中發(fā)揮作用。吳明明[10]通過對(duì)胚胎期綿羊90 d和120 d背最長(zhǎng)肌樣本進(jìn)行高通量測(cè)序,共鑒定出1 114個(gè)lncRNA,其中有466個(gè)差異表達(dá)lncRNA,并進(jìn)一步證明,差異表達(dá)lnc-SEMT在肌肉發(fā)育中起正調(diào)控作用。Li等[11]對(duì)新疆地方品種-哈薩克羊進(jìn)行了系統(tǒng)的分析,在哈薩克羊出生前后骨骼肌的比較中鑒定了1 566個(gè)lncRNA,其中差異表達(dá)的lncRNA為404個(gè)。蘇尼特羊,也叫戈壁羊,主要產(chǎn)于內(nèi)蒙古自治區(qū)錫林郭勒盟蘇尼特左旗和右旗,是經(jīng)過長(zhǎng)期的自然選擇和人工選育而形成的地方良種。蘇尼特羊肉肌肉飽滿,瘦肉率高,蛋白質(zhì)含量高、脂肪低,膻味輕,深受國(guó)內(nèi)外用戶的好評(píng)。蘇尼特羊肌肉發(fā)育相關(guān)lncRNA的研究尚未有相關(guān)報(bào)道,因此,本研究以蘇尼特羊肌肉為研究對(duì)象,對(duì)120 d胎兒和5月齡羔羊背最長(zhǎng)肌進(jìn)行RNA-seq測(cè)序分析,以期為解析蘇尼特羊肌肉發(fā)育的分子機(jī)制提供理論基礎(chǔ),同時(shí)為分子輔助育種提供參考。
試驗(yàn)樣本所用群體來自內(nèi)蒙古蘇尼特右旗某蘇尼特羊原種場(chǎng)。對(duì)妊娠120 d蘇尼特羊和5月齡蘇尼特羊羔羊靜脈注射40 mg/kg BW的戊巴比妥鈉麻醉,屠宰,采集120 d蘇尼特羊胎兒背最長(zhǎng)肌樣本3個(gè)、5月齡羔羊背最長(zhǎng)肌樣本2個(gè),樣品采集后立即置于液氮中,然后儲(chǔ)存于實(shí)驗(yàn)室-80 ℃冰箱中。利用Trizol法分別提取胎兒120 d和5月齡羔羊背最長(zhǎng)肌的總RNA。利用1%的瓊脂糖凝膠電泳分析RNA降解程度以及是否有污染,Nanodrop 2 000檢測(cè)RNA的純度及濃度。
按照測(cè)序要求進(jìn)行l(wèi)ncRNA文庫(kù)構(gòu)建,由于采集樣本的日期不同,首先對(duì)3個(gè)120 d 胎兒背最長(zhǎng)肌RNA樣本進(jìn)行等量混池測(cè)序(MFH_MLcn),然后對(duì) 5月齡羔羊背最長(zhǎng)肌進(jìn)行并行測(cè)序(S5BZ_MS)。測(cè)序平臺(tái)為Illumina HiseqTM2500。利用fastx_toolkit(V0.0.13)軟件對(duì)測(cè)序得到的Raw reads進(jìn)行質(zhì)控過濾。使用Tophat 2(V2.0.9)將過濾后的測(cè)序序列比對(duì)到綿羊參考基因組,應(yīng)用cufflinks軟件對(duì)比對(duì)后的bam文件進(jìn)行轉(zhuǎn)錄本的拼接。
首先通過5步篩選法進(jìn)行基本的篩選:轉(zhuǎn)錄本exon個(gè)數(shù)篩選、轉(zhuǎn)錄本長(zhǎng)度篩選、轉(zhuǎn)錄本已知注釋篩選、轉(zhuǎn)錄本表達(dá)量篩選和編碼潛能篩選,然后利用CPC、CNCI和pfam蛋白結(jié)構(gòu)域及PhyloCSF分析方法進(jìn)行編碼潛能的分析,最后取交集鑒定新的候選lncRNA。從候選lncRNA中篩選出差異表達(dá)的lncRNA,差異表達(dá)分析使用Cuffdiff軟件,差異表達(dá)分析標(biāo)準(zhǔn)為∣log2(Fold change)∣≥1且q<0.05。使用Cuffdiff(http:∥cufflinks.cbcb.umd.edu/manual.html#cuffdiff)軟件對(duì)篩選所得到的lncRNA進(jìn)行定量分析,從而得到各樣品中l(wèi)ncRNA的FPKM信息,對(duì)差異表達(dá)lncRNA的cis作用靶基因設(shè)定為lncRNA的上下游100 kb鄰近基因。
利用GOseq軟件[12]對(duì)預(yù)測(cè)的靶基因進(jìn)行GO分析。使用KOBAS軟件[13]進(jìn)行KEGG 通路分析。
隨機(jī)選取8個(gè)lncRNA,進(jìn)行實(shí)時(shí)熒光定量PCR反應(yīng)。內(nèi)參基因選擇β-actin,引物均由生工生物工程(上海)股份有限公司合成,引物序列信息如表1所示。熒光定量PCR反應(yīng)總體系20 μL:上、下游引物(10 μmol/L)各0.8 μL,cDNA 2 μL,ddH2O 6 μL,TB Green Premix Taq Ⅱ 10 μL,Rox reference dye Ⅱ 0.4 μL。PCR反應(yīng)條件:95 ℃ 3 min;95 ℃ 10 s, 60 ℃ 30 s,共40個(gè)循環(huán),3個(gè)重復(fù)。用2-ΔΔCt法計(jì)算羔羊lncRNA的相對(duì)表達(dá)量,并與轉(zhuǎn)錄組測(cè)序結(jié)果進(jìn)行比對(duì)驗(yàn)證。
表1 lncRNA引物序列信息Table 1 lncRNA primer sequence information
對(duì)測(cè)序得到的原始數(shù)據(jù)(Raw reads)進(jìn)行過濾分析,如表2所示,2組樣本的總Clean reads 的大小分別為17.94 G和 25.27 G。Q20和Q30的比列均在95%以上,表明測(cè)序質(zhì)量可靠。
表2 數(shù)據(jù)產(chǎn)出質(zhì)量情況Table 2 Statement of data output quality
質(zhì)控后的Clean reads比對(duì)到綿羊參考基因組結(jié)果見表3。結(jié)果顯示,120 d胎兒組(MFH_MLcn) 樣本中Clean reads的86.42%能定位到基因組上的測(cè)序序列,4.67%在參考序列上有多個(gè)比對(duì)位置,reads在參考序列上唯一比對(duì)率為81.75%;羔羊組(S5BZ_MS)樣本中的Clean reads比對(duì)到基因組上的比例均為80%以上,比對(duì)到參考序列上多個(gè)比對(duì)位置的比例為5.3%~5.64%, reads在參考序列上唯一比對(duì)率為75.06%~77.17%。
表3 Reads 與參考基因組比對(duì)Table 3 Summary of the alignment of reads with the reference genome
利用cufflinks對(duì)轉(zhuǎn)錄片段進(jìn)行拼接,初步篩選出10 3307個(gè)轉(zhuǎn)錄本。然后對(duì)這些轉(zhuǎn)錄本進(jìn)行分步篩選,最終鑒定到1 112個(gè)候選lncRNA轉(zhuǎn)錄本,其中包括586個(gè)已知lncRNA和526個(gè)新lncRNA,詳細(xì)結(jié)果見圖1(a)。進(jìn)一步對(duì)候選lncRNA進(jìn)行分類,如圖1(b)所示,基因間型lncRNA占90.3%,反義型lncRNA 占9.7%。未發(fā)現(xiàn)有內(nèi)含子型的lncRNA。
圖1 候選lncRNA 篩選與類型分布Fig.1 Screening and type distribution of candidate lncRNA
為研究蘇尼特羊肌肉中 lncRNA 的基本特征,對(duì)比分析了 lncRNA 與 mRNA的轉(zhuǎn)錄本長(zhǎng)度、外顯子數(shù)、ORF長(zhǎng)度及轉(zhuǎn)錄本表達(dá)水平。結(jié)果顯示,與mRNA相比,lncRNA長(zhǎng)度區(qū)間在200~3 000 bp的lncRNA數(shù)為890個(gè),占總數(shù)lncRNA的80.0%。每個(gè)lncRNA平均長(zhǎng)度為2 517 bp,平均2.5個(gè)外顯子數(shù)(圖2(a))。包含2個(gè)和3個(gè)外顯子的lncRNA數(shù)占所有l(wèi)ncRNA的87.3%(971個(gè))(圖2(b))。對(duì)lncRNA的開放讀碼框(ORF)進(jìn)行分析發(fā)現(xiàn),多數(shù)lncRNA的長(zhǎng)度在500 bp以內(nèi),平均數(shù)為123 bp。如圖2(c)所示,mRNA的ORF長(zhǎng)度明顯大于lncRNA。這一結(jié)果也提示lncRNA在轉(zhuǎn)錄及轉(zhuǎn)錄后等表觀調(diào)控方面起著重要的作用。對(duì)測(cè)序獲得的 lncRNA與 mRNA 的表達(dá)量進(jìn)行比較,發(fā)現(xiàn)mRNA的整體表達(dá)量明顯高于lncRNA(圖2(d))。
(a) lncRNA與mRNA的轉(zhuǎn)錄本長(zhǎng)度;(b) lncRNA與mRNA外顯子數(shù)目;(c) lncRNA與mRNA ORF長(zhǎng)度;(d) lncRNA與mRNA轉(zhuǎn)錄本表達(dá)量;縱坐標(biāo)中的密度表示對(duì)應(yīng)橫坐標(biāo)軸數(shù)值的因子數(shù)/檢測(cè)因子的總數(shù);FPKM表示每百萬(wàn)測(cè)序堿基中每千個(gè)轉(zhuǎn)錄子測(cè)序堿基中所包含的測(cè)序片段數(shù)。(a) lncRNA and mRNA transcripts length; (b) lncRNA and mRNA exon number; (c) lncRNA and mRNA ORF length; (d) lncRNA and mRNA transcript expression level; Density in Y-axis represent the number of factors corresponding to the value of the abscissa axis/the total number of detection factors; FPKM represent number of sequenced fragments contained in every thousand transcripts of sequenced bases per million of sequenced bases.圖2 lncRNA與mRNA的結(jié)構(gòu)特征比較分析Fig.2 Comparative analysis of structural characteristics between lncRNA and mRNA
在|log2(Fold change)|>1和q<0.05條件下,2組樣本之間的差異表達(dá)結(jié)果見圖3。結(jié)果顯示,在胎兒120 d組和 5月齡羔羊組中獲得399個(gè)差異表達(dá)的 lncRNA,其中212個(gè)表達(dá)上調(diào),187個(gè)表達(dá)下調(diào)。
圖3 差異表達(dá) lncRNA 火山圖Fig.3 Volcano map of differentially expressed IncRNA
對(duì)差異表達(dá)的lncRNA進(jìn)行層次聚類分析來判斷差異轉(zhuǎn)錄本在不同實(shí)驗(yàn)條件下的表達(dá)模式,由圖4(a)可知,羔羊組樣本間聚類在一起,與胎兒組差異明顯。此外,胎兒組上調(diào)基因?qū)?yīng)下調(diào)基因,而羔羊組與胎兒組基因表達(dá)模式有不同,羔羊組lncRNA的表達(dá)模式下調(diào)基因多于上調(diào)基因。之后,兩兩之間的差異表達(dá)組之間進(jìn)行了韋恩圖(Venn)分析,結(jié)果如圖4(b)所示,共有11個(gè)lncRNA在所有差異表達(dá)組中被檢測(cè)到。差異表達(dá)lncRNA在不同樣本中的表達(dá)量見圖5,值得注意的是ENSOART00000028118、ENSOART00000028271、LNC_000424和LNC_000978轉(zhuǎn)錄本在2個(gè)組中都有較高表達(dá)。此外,LNC_000422在胎兒120 d中有表達(dá),在5月齡羔羊中無表達(dá);LNC_000942在5月齡羔羊中有表達(dá),在胎兒120 d中無表達(dá)。ENSOART00000028384和LNC_000421在胎兒120 d中的表達(dá)量更高;LNC_000311和LNC_000719在5月齡羔羊中的表達(dá)量更高。
圖4 差異表達(dá)lncRNA分析Fig.4 Differential expression analysis of lncRNA
為進(jìn)一步驗(yàn)證測(cè)序結(jié)果,并檢測(cè)其在綿羊肌肉中的表達(dá),隨機(jī)選擇8個(gè)差異表達(dá)的lncRNA,其中LNC_000074, LNC_000196, LNC_000588在轉(zhuǎn)錄組數(shù)據(jù)中表現(xiàn)為上調(diào),LNC_000233, LNC_000276,LNC_000408, LNC_000586和 LNC_000649在轉(zhuǎn)錄組數(shù)據(jù)中表現(xiàn)為下調(diào),并通過qRT-PCR檢測(cè)其在胎兒及羔羊肌肉中的表達(dá)。由圖6可知,經(jīng) qRT-PCR 驗(yàn)證,LNC_000074,LNC_000196和LNC_000588均上調(diào)表達(dá),與RNA-seq測(cè)序結(jié)果上調(diào)一致;LNC_000223,LNC_000276,LNC_000408,LNC_000586和LNC_000649均下調(diào)表達(dá),與RNA-seq測(cè)序結(jié)果下調(diào)一致。證明實(shí)時(shí)熒光定量結(jié)果與轉(zhuǎn)錄組測(cè)序結(jié)果表達(dá)趨勢(shì)一致。
圖5 差異表達(dá)lncRNA在不同樣本中的表達(dá)量Fig.5 Expression of differentially expressed lncRNA in different samples
圖6 差異表達(dá)lnRNA qRT-PCR與RNA-seq比較分析Fig.6 Comparison analysis of differentially expressed lncRNA by qRT-PCR and RNA-seq
利用lncRNA和mRNA的定位來預(yù)測(cè)lncRNA在順式調(diào)控關(guān)系中的潛在目標(biāo)。將共同位置的閾值設(shè)置為lncRNA的上下游100KB,結(jié)果表明,626個(gè)差異表達(dá)lncRNA中503個(gè)lncRNA存在鄰近基因。對(duì)應(yīng)于1 273個(gè)靶基因。其中多個(gè)lncRNA具有共同的靶基因,如LNC_000421和LNC_000422的靶基因?yàn)镽TL1等。也有l(wèi)ncRNA具有多個(gè)可變剪切靶向多個(gè)編碼基因,如編碼基因TNNT1,PPP1R12C,EPS8L1是LNC_000311的潛在目標(biāo)等,并且這些lncRNA呈現(xiàn)不同方向的調(diào)控作用。
對(duì)這些鄰近基因進(jìn)行功能注釋分析,GO結(jié)果分別從生物學(xué)過程(Biological process,BP)、細(xì)胞組分(Cellular component,CC)和分子功能(Molecular function,MF)3個(gè)條目進(jìn)行分類。結(jié)果如圖7顯示,MFH_MLcn vs S5BZ_MS差異表達(dá)lncRNA的靶基因顯著富集到了60個(gè)GO term條目中,其中,涉及代謝過程的調(diào)控,生物合成BP,蛋白結(jié)合GC以及免疫反應(yīng)MF等相關(guān)。另外,在其他GO term條目中也發(fā)現(xiàn)了包括肌肉結(jié)構(gòu)發(fā)育、骨骼肌細(xì)胞分化,骨骼肌收縮、橫紋肌細(xì)絲,肌肉組織發(fā)育等與骨骼肌發(fā)育緊密相關(guān)的GO term,提示這些lncRNA在肌肉發(fā)育的不同階段起著重要的調(diào)控作用。
圖7 差異lncRNA 的GO富集分析Fig.7 GO enrichment analysis of differential lncRNA
對(duì)這些靶基因基因進(jìn)行KEGG通路分析,結(jié)果如圖8所示,這些靶基因主要涉及Wnt信號(hào)傳導(dǎo)途徑、Notch信號(hào)通路、Gap連接和甲狀腺激素合成等,都可能與骨骼肌的生長(zhǎng),發(fā)育和功能有關(guān)。這些結(jié)果表明lncRNA可能在骨骼肌的發(fā)育和生長(zhǎng)中起重要作用,可根據(jù)以上功能注釋信息對(duì)這些lncRNA開展肌肉發(fā)育相關(guān)的研究提供了重要的信息。
圖8 差異表達(dá)lncRNA靶基因KEGG分析Fig.8 KEGG analysis of differentially expressed lncRNA target gene
近年來,隨著綿羊基因組研究的不斷深入,對(duì)其基因組進(jìn)行了大量的注釋和功能分析,但對(duì)內(nèi)蒙古地方品種—蘇尼特羊長(zhǎng)鏈非編碼RNA的研究鮮有報(bào)道。因此,本研究以蘇尼特羊肌肉為研究對(duì)象,對(duì)120 d胎兒和5月齡羔羊背最長(zhǎng)肌進(jìn)行RNA-seq測(cè)序分析,以期為解析蘇尼特羊肌肉發(fā)育的分子機(jī)制提供理論基礎(chǔ),同時(shí)為分子輔助育種提供參考。
在本研究中,通過對(duì)蘇尼特羊胎兒120 d和5月齡蘇尼特羊背最長(zhǎng)肌組織中的lncRNA進(jìn)行轉(zhuǎn)錄組測(cè)序分析,進(jìn)一步預(yù)測(cè)lncRNA的靶基因以揭示他們的功能。經(jīng)過生物信息學(xué)分析,對(duì)比分析了 lncRNA 與 mRNA 的長(zhǎng)度、外顯子數(shù)、外顯子大小及表達(dá)水平,發(fā)現(xiàn)與mRNA相比,lncRNA長(zhǎng)度區(qū)間在200~3 000 bp的lncRNA數(shù)占總數(shù)lncRNA的80.0%,說明lncRNA保守性較差。包含2個(gè)和3個(gè)外顯子的lncRNA數(shù)占所有l(wèi)ncRNA的87.3%,平均為2.5個(gè)外顯子數(shù),外顯子數(shù)量比較少,與Cabili等[14]的研究結(jié)果一致。mRNA的ORF長(zhǎng)度明顯大于lncRNA,說明蛋白質(zhì)編碼基因具有更長(zhǎng)的ORF。對(duì)測(cè)序獲得的 lncRNA與 mRNA 的表達(dá)量進(jìn)行比較,發(fā)現(xiàn)mRNA的整體表達(dá)量明顯高于lncRNA,可能與lncRNA沒有編碼蛋白質(zhì)的能力有關(guān)。Li等[11]通過對(duì)綿羊的lncRNA和mRNA進(jìn)行特征分析,結(jié)果發(fā)現(xiàn),與mRNA相比,lncRNA的外顯子數(shù)量集中分布在2個(gè)或3個(gè),且ORF長(zhǎng)度較短,表達(dá)水平較低。本研究與Li等的研究結(jié)果一致,這些相似之處說明本研究中分析的lncRNA可靠性較高。在本研究中總共鑒定了 1 112 個(gè)候選lncRNA,包括586個(gè)已知lncRNA和526個(gè)新lncRNA,得到靶向mRNA編碼基因?yàn)? 273個(gè),這些基因也為今后的研究提供了數(shù)據(jù)基礎(chǔ)。
進(jìn)一步對(duì)對(duì)胎兒120 d組(MFH_MLcn)和 5月齡羔羊組(S5BZ_MS)進(jìn)行差異表達(dá)分析,共獲得399個(gè)差異表達(dá)的 lncRNA,其中212個(gè)表達(dá)上調(diào),187個(gè)表達(dá)下調(diào),說明不同發(fā)育時(shí)期蘇尼特羊肌肉的生長(zhǎng)發(fā)育具有不同的lncRNA調(diào)控機(jī)制。Zhan等[15]通過構(gòu)建山羊胎兒(45、60和105 d妊娠)和出生后(出生后3 d)背最長(zhǎng)肌的RNA文庫(kù),在不同發(fā)育階段骨骼肌庫(kù)之間的配對(duì)比較中,共發(fā)現(xiàn)577個(gè)差異表達(dá)轉(zhuǎn)錄本。蘇尼特羊lncRNA和山羊lncRNA之間的差異可能歸結(jié)于品種和階段特異性。通過對(duì)lncRNA在不同樣本中的FPKM值進(jìn)行比較,結(jié)果說明ENSOART00000028118、ENSOART00000028271、LNC_000424和LNC_000978均在胎兒120 d和5月齡羔羊中有表達(dá),ENSOART00000028271、LNC_000978、LNC_000311和LNC_000719在5月齡羔羊中的表達(dá)量較高,ENSOART00000028118和LNC_000424則與之相反。其中,ENSOART00000028118和LNC_000424在5月齡羔羊組中的表達(dá)量顯著上調(diào),該結(jié)果進(jìn)一步證明ENSOART00000028118和LNC_000424在不同發(fā)育時(shí)期的蘇尼特羊肌肉組織中具有不同的調(diào)控作用,調(diào)控機(jī)制可能為:在胎兒120 d肌肉組織發(fā)育中起負(fù)調(diào)控作用,在5月齡羔羊肌肉組織發(fā)育中起正調(diào)控作用。ENSOART00000028271、LNC_000311和LNC_000719在5月齡羔羊肌肉組織中的表達(dá)量顯著下調(diào),可能說明其在胎兒120 d肌肉組織發(fā)育中起正調(diào)控作用,在5月齡羔羊肌肉組織發(fā)育中起負(fù)調(diào)控作用。說明lncRNA的表達(dá)調(diào)控在不同時(shí)期有不同的表達(dá)方向,但仍需要進(jìn)一步的實(shí)驗(yàn)驗(yàn)證。
文獻(xiàn)研究顯示,在本研究鑒定到顯著差異的lncRNA中, ENSOART00000028118、 ENSOART00000028384、ENSOART00000027214、ENSOART00000028894、LNC_000196、LNC_00023、LNC_000269、LNC_000307、LNC_000311、LNC_000421、LNC_000422、LNC_00459 和 LNC_000879分別靶向?qū)?yīng)與綿羊肌肉生長(zhǎng)發(fā)育相關(guān)的基因PPP1R12C、EPS8L1、RTL1、SIRT1、TRIM7、KLHL40、TNNI1、MEF2C、FOSB、JPH2和MYH1。研究表明,RTL1基因被證實(shí)參與促進(jìn)小鼠肌肉的增長(zhǎng)[16],并且可顯著調(diào)控綿羊的肌肉肥大[17]。研究發(fā)現(xiàn)SIRT1基因?qū)∪夂椭镜陌l(fā)育均具有調(diào)控作用[18]。TRIM7為糖原蛋白相互作用蛋白(GNIP),并被證明在骨骼肌中高表達(dá)[19]。Chao等[20]的研究發(fā)現(xiàn),KLHL40基因被預(yù)測(cè)為L(zhǎng)OC105603392的一個(gè)順式調(diào)控基因,并且被證明為肌肉的特異轉(zhuǎn)錄基因位點(diǎn)[21]。而作為慢骨骼肌鈣蛋白基因,TNNT1、TNNI1和TNNC1在綿羊肌肉中具有一致的表達(dá)模式[22],同時(shí)有研究證明他們是維持緩慢肌纖維的重要基因[23]。Potthoff等[24]研究發(fā)現(xiàn),骨骼肌中 MEF2C 的缺失會(huì)導(dǎo)致肌節(jié)組織出現(xiàn)異常。此外,F(xiàn)OSB作為FOS家族的一員,在細(xì)胞增殖、分化和骨骼發(fā)育中起著重要的作用。FOS家族編碼亮氨酸拉鏈蛋白,與JUN家族的蛋白質(zhì)二聚體結(jié)合,形成轉(zhuǎn)錄因子復(fù)合物AP-1,參與細(xì)胞的增殖、分化和轉(zhuǎn)化[25]。研究也表明JPH2基因被認(rèn)為是心肌細(xì)胞內(nèi)T-小管成熟的關(guān)鍵調(diào)節(jié)物,其突變可導(dǎo)致擴(kuò)張型心肌病[26],由此可以證明JPH2具有調(diào)節(jié)骨骼肌中生物學(xué)功能的作用。此外發(fā)現(xiàn) 120 d 羔羊胎兒與5月齡羔羊中LNC_000421和LNC_000422與其靶基因RTL1之間呈正調(diào)控,說明LNC_000421和LNC_000422通過對(duì)靶基因RTL1的調(diào)控來促進(jìn)肌肉生長(zhǎng)。ENSOART00000028118與其靶基因IGF2之間呈正調(diào)控,LNC_000311與其對(duì)應(yīng)的靶基因TNNI3之間也呈現(xiàn)正調(diào)控趨勢(shì),說明ENSOART00000028118和LNC_000311參與了蘇尼特羊胚胎期至性成熟期發(fā)育階段骨骼肌的發(fā)育過程。這些結(jié)果進(jìn)一步揭示了lncRNA及其靶基因的協(xié)同關(guān)系,提示接下來可以側(cè)重研究這些lncRNA在蘇尼特羊肌肉中的功能及作用機(jī)制。
在對(duì)差異表達(dá)的lncRNA進(jìn)行GO和KEGG富集分析發(fā)現(xiàn),在一些lncRNA在肌肉調(diào)節(jié)中起重要作用的通路中顯著富集。主要涉及Wnt信號(hào)通路[27]、Notch信號(hào)通路、Gap連接[28]和甲狀腺激素合成[29]等相關(guān)通路,均與肌肉發(fā)育相關(guān),證明這些差異表達(dá)的lncRNA可以通過以上信號(hào)通路對(duì)肌肉的生長(zhǎng)發(fā)育進(jìn)行調(diào)控。Li等[11]通過對(duì)哈薩克羊進(jìn)行KEGG分析發(fā)現(xiàn)主要涉及Wnt信號(hào)傳導(dǎo)途徑、鈣信號(hào)傳導(dǎo)途徑、Gap連接、河馬信號(hào)傳導(dǎo)和甲狀腺激素合成等信號(hào)通路,其可能與骨骼肌的生長(zhǎng),發(fā)育和功能有關(guān)。本研究結(jié)果與Li的部分相似,進(jìn)一步提高了本研究預(yù)測(cè)關(guān)鍵基因及其相關(guān)通路的準(zhǔn)確性。
本研究利用高通量測(cè)序技術(shù)對(duì)蘇尼特羊不同發(fā)育階段肌肉進(jìn)行了初步的鑒定和分析,發(fā)現(xiàn)在蘇尼特羊肌肉中存在大量的lncRNA,其表達(dá)水平在不同的發(fā)育階段存在著一定的差異。通過GO和KEGG富集分析,這些差異表達(dá)lncRNA涉及代謝過程的調(diào)控,生物合成,基因表達(dá),蛋白結(jié)合以及mTOR信號(hào)通路、FoxO信號(hào)通路、胰島素信號(hào)、肌動(dòng)蛋白細(xì)胞骨架的調(diào)節(jié)、Wnt信號(hào)通路、間隙連接等信號(hào)通路。并篩選出13個(gè)與不同發(fā)育階段骨骼肌相關(guān)的候選lncRNA和靶基因,為從lncRNA的角度更好地理解蘇尼特羊肌肉生長(zhǎng)發(fā)育的遺傳調(diào)控機(jī)制提供了理論基礎(chǔ),也為綿羊分子輔助育種提供參考。
中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào)2021年1期