劉陽光,章會斌,文浩宇,謝 帆,趙世明,丁月云,鄭先瑞,殷宗俊,張曉東
(安徽農業(yè)大學動物科技學院,合肥 230036)
轉錄組測序又被稱為RNA-seq,即將生物組織或細胞中全部的RNA(這其中包括了非編碼RNA)反轉錄為cDNA并建立專屬的cDNA文庫,隨后使用高通量測序技術對cDNA文庫進行掃描,并將結果映射到生物體參考基因組,通過統(tǒng)計相關的基因Reads,從而獲得轉錄本的具體表達量[1]。SNP(single nucleotide polymorphism)主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列改變,其數(shù)量龐大,多態(tài)性豐富[2]。從理論上看,每一個SNP位點可以擁有4 種不同的變異形式(轉換、顛換、插入或缺失),但實際上發(fā)生的只有兩種,即轉換和顛換[3-5]。由于RNA-seq技術的高靈敏性,這項技術能夠發(fā)現(xiàn)基因組上的SNP/InDel位點。如,在利用RNA-seq技術對高產和低產莊河大骨雞的下丘腦和垂體組織的研究中,研究人員發(fā)現(xiàn)SNP/InDel純合子變異體數(shù)量高于雜合子變異體數(shù)量,且垂體組織中的SNP/InDel數(shù)量高于下丘腦組織;在SNP類型中,雖然轉換類型的種類少于顛換類型,但轉換類型的數(shù)量卻遠遠高于顛換[6]。在對高、低產雙黃蛋高郵鴨的轉錄組測序中,在基因外顯子區(qū)域發(fā)現(xiàn)108 206~115 478個SNPs位點,且轉換類型總數(shù)極顯著高于顛換類型總數(shù)[7]。
對于雌性動物而言,卵泡發(fā)育貫穿了一生,卵泡的質量決定其繁殖能力[8]。一般認為,激素是卵泡發(fā)育中的重要調節(jié)物質,但近期研究發(fā)現(xiàn)在卵泡液微環(huán)境中存在著一種微小的物質,可能參與卵巢發(fā)育相關的調節(jié)機制,這種微小的物質被證明為外泌體[9-12]。
外泌體(exosome)是細胞外囊泡(extracellular vesicles,EVs)的一種類型, 直徑在30~150 nm[13]。外泌體首次被發(fā)現(xiàn)時,被視為細胞的代謝廢棄物[14]。在隨后的研究中,研究人員發(fā)現(xiàn)外泌體可能在細胞間通訊過程中起到重要作用。在人卵泡液的研究中,卵泡液中的外泌體具有攜帶供體細胞microRNA和調節(jié)受體細胞生理活動的功能[15]。此外,外泌體在動物體內也普遍存在并發(fā)揮著相似的作用。在2012年,卵泡液外泌體首次從馬的卵泡液中分離[16]。隨后,在研究中發(fā)現(xiàn),卵泡液外泌體能夠影響GCs中TGF-β/BMP信號通路中的成員,對馬發(fā)情中期和排卵前的卵泡發(fā)育起調節(jié)作用[17]。在牛的外泌體研究報道中,卵泡液外泌體可以增強卵母細胞功能并改善溫度對卵泡發(fā)育造成的負面影響[18]。此外,在豬的生殖研究中,利用蛋白質組學技術對性成熟后備母豬的卵泡液外泌體中的蛋白進行掃描,鑒定出249種關鍵的蛋白質,通過功能注釋發(fā)現(xiàn)這些蛋白質與卵泡發(fā)育和功能以及排卵和黃體等重要的信號過程相關[19]。雖然當前有關卵泡液外泌體的研究層出不窮,但有關外泌體對受體細胞基因組突變的影響尚未被報道。因此,本研究利用RNA-seq技術對豬卵巢顆粒細胞和與外泌體共培養(yǎng)的豬卵巢顆粒細胞進行高通量測序,得到位于基因的SNP/InDel位點,通過與差異基因比較篩選候選基因,并進行生物信息學分析,探究卵泡液外泌體對顆粒細胞的影響,為揭示外泌體在生殖調控上所發(fā)揮的功能提供幫助。
試驗所用新鮮豬卵巢采自合肥市某商業(yè)屠宰場。豬屠宰后立即采集、分離卵巢,將卵巢保存在含500 IU·mL-1青、鏈霉素的37 ℃無菌生理鹽水中,2 h內用保溫瓶運回實驗室備用。采用抽提法提取卵泡液,利用梯度離心得到POGCs和卵泡液外泌體。將外泌體溶于PBS溶液中。將純化后的POGCs接種至細胞培養(yǎng)板,待細胞在培養(yǎng)板內增殖到70%~80%的匯合度時,加入外泌體繼續(xù)培養(yǎng)24 h。分組情況:豬卵巢顆粒細胞記為GC組(n=3);與外泌體共培養(yǎng)的豬卵巢顆粒細胞記為GCE組(n=3)。
使用Magzol試劑(Magen,China)從樣品中提取總RNA。分別使用K5500(中國北京凱奧)和Agilent 2200 TapeStation(美國安捷倫科技公司)評估RNA的數(shù)量和完整性,合格后進行RNA測序。
基于Illumina平臺對構建的文庫進行測序,測序長度為150 bp。通過去除帶接頭的序列(Reads)、低質量序列及無效堿基后得到純凈序列(Clean Reads)用于后續(xù)分析。使用HISAT2 2.10用于將干凈讀數(shù)映射到Sus scrofa 11.1參考基因組(http:∥ftp.ensembl.org/pub/release-103/fasta/sus_scrofa/)。并使用TPM(Transcripts Per Kilobase of exon model per Million mapped reads)值來表示基因的表達水平。
使用samtools和picard-tool軟件對結果進行對比處理,最后對原始結果進行過濾,得到SNP/InDel的分析結果。
使用clusterProfiler R軟件包對候選基因進行基因本體(Gene Ontology,GO)富集分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Gens and Genomes,KEGG)通路富集分析,以P<0.05為條件進行差異篩選,并利用ggplot2 R軟件包繪制候選基因功能柱狀圖和氣泡圖。
利用SPSS 軟件(v26.0)對數(shù)據(jù)進行統(tǒng)計學分析,方差分析和顯著性檢驗使用t-test和 one-way ANOVA,以P<0.05記為差異顯著,并在 GraphPad 8.4軟件上繪圖。
如圖1所示,在透射電子顯微鏡下觀察到外泌體完整的囊泡結構,NTA分析顯示外泌體直徑范圍在100~150 nm,平均直徑在150.54 nm。通過Western blot檢測外泌體的特異性表面標志物CD9和CD63,在25 ku處有明顯條帶。這些結果表明已經成功地從豬卵泡液中分離出外泌體。
A、B.外泌體電鏡結果;C.外泌體NTA結果;D.外泌體Western blot結果A, B.Transmission electron microscopic (TEM) image of exosomes in follicular fluid; C. Nanoparticle tracking analysis showing particle size distribution in exosomes derived from porcine follicular fluid; D.Western blot result of known exosome markers (CD63 and CD9)
RNA-seq完成后,通過過濾、去除冗余reads。經統(tǒng)計,GC組和GCE組每個樣品平均獲得5.54×107條clean reads,Q20和Q30質量得分均在92%以上(表1)。該結果表明,本次測序數(shù)據(jù)質量高,可用于后續(xù)分析使用。
表1 樣品轉錄組數(shù)據(jù)統(tǒng)計表
利用samtools和picard-tool工具對SNP/InDel數(shù)據(jù)進行統(tǒng)計,如表2所示,在GC和GCE組的樣品共獲得1 310 979個SNPs突變和104 498個InDel突變,其中純合型SNP突變數(shù)量為118 831個,純合型InDel突變數(shù)量為51 594個;雜合型SNP突變數(shù)量為1 192 148個,雜合型InDel突變數(shù)量為52 904個。此外,在與GC組相比較,加入外泌體后,顆粒細胞基因的SNP/InDel數(shù)量明顯增加。
表2 樣本SNP/InDel數(shù)量統(tǒng)計表
當基因發(fā)生SNP突變時,突變位點存在轉換和顛換的變化,即A-G、G-A、C-T、T-C、A-T、T-A、C-G、G-C、T-G、G-T、A-C、C-A的12種突變類型。據(jù)此對6個樣品中突變類型進行統(tǒng)計。如表3所示,在6個樣品中SNP轉換類型共計973 003個,顛換類型339 974個,轉換的類型顯著高于顛換類型。此外,通過組間比較發(fā)現(xiàn),在外泌體加入后顆粒細胞的SNP的突變轉換和顛換類型均顯著高于對照組(P<0.05),結果見圖2。
表3 SNP突變類型
*. P<0.05,**. P<0.01
為了解這些SNP/InDel位點具體在基因上的分布區(qū)域,使用SNPPEff工具對6個樣品中的SNP和InDel位點進行基因位置注釋。如圖3所示,SNP突變位點主要來自基因上的8個區(qū)域,即3′UTR、5′UTR、基因間隔區(qū)、內含子區(qū)、外顯子區(qū)、基因剪切、基因上游區(qū)域和基因下游區(qū)域。其中3′UTR、基因間隔區(qū)、內含子區(qū)和外顯子區(qū)是基因發(fā)生SNP突變的主要區(qū)域,尤其在內含子區(qū)SNP突變數(shù)量最多,共有784 205個,其次位于外顯子和3′UTR區(qū)域,共計187 689和206 060個。
圖3 SNPs注釋分類Fig.3 SNPs annotation classification
按照上述方法對InDel突變進行注釋。如圖4所示,InDel突變主要來源于基因上的3′UTR和內含子區(qū)。其中位于內含子的InDel突變總計54 375個,位于3′UTR的突變總計為30 105個。另外,還有部分突變位于基因間隔區(qū)和外顯子。
圖4 InDel注釋分類Fig.4 InDel annotation classification
雖測序后獲取大量SNP/InDel突變信息,但較多集中在非編碼區(qū)域??紤]到生物體內基因轉錄和翻譯遵循中心法則,因此,對SNP/InDel突變僅發(fā)生在外顯子區(qū)域的基因進行了統(tǒng)計,并與差異表達的基因進行對比,共獲得1 583個候選基因,結果見圖5。
A.SNP和InDel韋恩圖; B.突變基因和差異基因維恩圖A. Venn diagram of SNP and InDel; B. Venn diagram of mutant and differential genes
為了解候選基因在外泌體調控中的作用,使用cluster Profiler包在R軟件中對1 583個候選基因進行富集分析,并使用ggplot2包對所得結果進行可視化展示。GO功能富集主要從生物過程、分子功能和細胞組成3個方面闡述基因在細胞內的功能。如圖6及表4所示,以P<0.05為篩選條件,在生物過程方面候選基因顯著富集在細胞周期、細胞分類以及對細胞增殖調控過程中;在細胞組分方面這些基因顯著富集在細胞質、細胞核、細胞體中;在分子功能上候選基因顯著與ATP、蛋白激酶以及鈣離子結合相關。此外,利用KEGG基因庫對所篩選的基因進行通路富集,結果見圖7及表5,以P<0.05為篩選條件,結果顯示候選基因主要在細胞周期以及細胞增殖/凋亡相關通路顯著富集。例如,細胞周期、Rap1信號通路、TNF 信號通路、細胞衰老和FoxO信號通路。
表4 突變基因GO富集條目
表5 突變基因KEGG富集條目
圖6 候選基因GO富集分析Fig.6 GO enrichment analysis of candidate genes
對KEGG和GO富集的結果進行統(tǒng)計,共發(fā)現(xiàn)14個基因被多次富集到細胞周期、增殖/凋亡相關通路。利用STRING軟件對14個基因進行互作關系驗證,發(fā)現(xiàn)11個基因存在互作關系,如圖8所示。
圖8 突變基因PPI網絡圖Fig.8 PPI network of mutant genes
生物體內遺傳信息的傳遞遵循著中心法則,信使RNA(mRNA)的存在搭建起了DNA與蛋白質之間的溝通橋梁[20-23],以第二代高通量測序技術為基礎的RNA-seq是一種無需探針,高效且快速的基因組篩查方法[24]。利用RNA-seq技術,可以將機體內大量的基因信息以數(shù)字的形式進行展示,結合生物信息學技術可獲取大量遺傳數(shù)據(jù),為深入研究生物體基因結構和功能提供了基礎[25-27]。目前,RNA-seq技術發(fā)展迅速,已被廣泛應用于基因轉錄本水平檢測、基因轉錄本結構變異挖掘、基因表觀遺傳功能研究以及SNP標記開發(fā)等方面。
本研究通過RNA-seq技術在GC和GCE組的6個樣品中共獲得1 310 979個SNPs突變和104 498個InDel突變,其中純合型突變數(shù)量為170 426個,雜合型突變數(shù)量為1 245 052個??梢?以SNP突變?yōu)橹鞯幕蛲蛔儼l(fā)生率較高。相似的結果在前人的研究中也有被發(fā)現(xiàn),如,在120日齡隱性白羽洛克雞的轉錄組測序的研究中,發(fā)現(xiàn)SNPs 位點103 926個,可變剪接位點29 525個[28]。利用轉錄組技術在快長與慢長草魚的肝臟、肌肉和腦組織中共篩選出4 580個SNPs標記,并發(fā)現(xiàn)4個與生長性狀相關的SNP標記分別位于生長催乳素α基因、早期生長反應蛋白-1基因和肌球蛋白重鏈基因上[29]。此外,二者所挖掘的基因突變中均為SNP突變類型較多。另外,本研究發(fā)現(xiàn)外泌體所造成的受體細胞基因突變類型中,轉換類型突變顯著高于顛換類型突變??梢?當基因出現(xiàn)SNP突變時,堿基轉換類型的發(fā)生頻率較高。如,在東風螺的研究中,研究人員利用轉錄組技術共掃描到673 782個 SNPs 位點,且轉換位點發(fā)生的頻率遠高于顛換位點[30]。在中華鱉的SNP特征分析研究中, 前人發(fā)現(xiàn)SNP變異類型以轉換類型為主,轉換類型占70.05%,顛換類型占29.95%[31]。此外,利用轉錄組技術對開產前和產蛋高峰期泰州鵝卵巢進行測序,在1 734個差異表達基因上共檢測出73 776~80 478個SNPs位點,這些位點多數(shù)分布在內含子區(qū)域,且A-G和C-T的轉換類型突變發(fā)生頻率最高[32]。
卵泡液外泌體在卵泡微環(huán)境中起著信號傳導的作用,能夠通過影響顆粒細胞的生理狀態(tài),調控卵泡發(fā)育進程。為了進一步了解卵泡液外泌體對顆粒細胞基因功能的影響,本研究對突變出現(xiàn)在外顯子區(qū)域的基因進行了統(tǒng)計篩選,并對所篩選的基因進行了GO和KEGG功能富集。GO富集的結果顯示,這些突變基因顯著富集在細胞周期、細胞增殖調控、ATP結合、蛋白激酶以及鈣離子結合等GO條目;在KEGG功能富集上,突變基因主要在細胞周期以及細胞增殖/凋亡相關通路顯著富集,例如,細胞周期、Rap1信號通路和FoxO信號通路。這與前人的研究結果類似,如在卵泡液外泌體處理后的顆粒細胞,相較于對照組,其差異基因主要富集在細胞周期和細胞增殖調控相關的GO條目和KEGG通路上[33]。本研究還發(fā)現(xiàn)了11個具有互作關系的候選基因,分別為FLT1、AKT3、CREB3L1、ITGB3、PIK3CD、MYC、KITLG、EPHA2、THBS1、INSR、IGF1R。其中,AKT3是絲氨酸/蘇氨酸蛋白激酶家族成員,參與多種生物過程,包括細胞增殖、分化、凋亡[34],前人發(fā)現(xiàn)卵泡液外泌體能夠通過調節(jié)PTEN表達,介導PI3K/Akt/mTOR途徑,促進顆粒細胞增殖[35]。IGF1R具有酪氨酸激酶活性。它在大多數(shù)惡性組織中高度過表達,通過增強細胞存活作為抗凋亡劑發(fā)揮作用[36]。據(jù)此推測,卵泡外泌體能夠使細胞周期調控相關的基因發(fā)生突變,從而調節(jié)卵巢顆粒細胞的生理狀態(tài),影響卵泡發(fā)育過程。這些發(fā)現(xiàn)為研究外泌體介導的機制提供了理論幫助,對后續(xù)研究外泌體影響細胞的機制具有指導意義。
本試驗通過對豬卵巢顆粒細胞,與外泌體共培養(yǎng)的顆粒細胞進行RNA-seq。共發(fā)現(xiàn)1 310 979個SNPs突變和104 498個InDel突變,其中純合型突變數(shù)量為170 426個,雜合型突變數(shù)量為1 245 052個。另外,在本研究中發(fā)現(xiàn)SNP/InDel的轉換類型突變顯著高于顛換類型突變。通過GO和KEGG功能富集發(fā)現(xiàn)這些突變基因與細胞周期和細胞增殖調控過程中顯著相關。此外,發(fā)現(xiàn)14個與細胞周期、增殖/凋亡調控相關的候選基因,其中11個基因存在互作關系。這些發(fā)現(xiàn)為研究外泌體在母豬生殖上的調控提供了理論依據(jù)。