聶澤彤 綜述 胡博杰 審校
天津醫(yī)科大學(xué)眼科醫(yī)院 天津醫(yī)科大學(xué)眼科研究所 天津醫(yī)科大學(xué)眼視光學(xué)院 300384
自發(fā)現(xiàn)轉(zhuǎn)錄組是基因組和蛋白質(zhì)組間的關(guān)鍵中間體以來,轉(zhuǎn)錄本的鑒定和基因表達(dá)的量化一直是分子生物學(xué)研究的核心內(nèi)容[1]。20世紀(jì)90年代初,表達(dá)序列標(biāo)簽和基因表達(dá)序列分析是早期分析基因表達(dá)的方法,90年代末,微陣列由于其高通量的特性迅速成為研究基因表達(dá)的首選方法[2-4]。RNA-seq是一種使用深度測序技術(shù)的轉(zhuǎn)錄組學(xué)分析方法,可準(zhǔn)確地捕捉數(shù)千個(gè)基因和RNA分子亞型,目前已成為轉(zhuǎn)錄組基因表達(dá)定量的金標(biāo)準(zhǔn)[5-7]。其利用高通量下一代測序技術(shù)來調(diào)查、表征和量化轉(zhuǎn)錄組,并且允許識(shí)別新的外顯子、剪接位點(diǎn)和轉(zhuǎn)錄本[8-10]。RNA-seq現(xiàn)已廣泛應(yīng)用于神經(jīng)系統(tǒng)、心血管系統(tǒng)、血液系統(tǒng)、消化系統(tǒng)等研究領(lǐng)域,并逐漸取代DNA微陣列,成為轉(zhuǎn)錄組分析的首選方法[11]。在眼科研究領(lǐng)域中,RNA-seq日漸成為一種重要的測序工具,在多種眼科疾病的研究中都取得了一定進(jìn)展,為進(jìn)一步明確診斷、發(fā)掘潛在致病基因、探索致病機(jī)制和臨床方法提供新的思路[12-16]。本文從RNA-seq技術(shù)的優(yōu)勢、測序平臺(tái)的選擇、文庫制備和數(shù)據(jù)分析以及該技術(shù)在糖尿病視網(wǎng)膜病變(diabetic retinopathy,DR)中取得的進(jìn)展進(jìn)行綜述。
RNA-seq技術(shù)與微陣列相比有明顯的優(yōu)勢。第一,RNA-seq可用于檢測已知的轉(zhuǎn)錄本,也可以識(shí)別、表征和量化新的剪接亞型,檢測等位基因的特異性表達(dá)[11];而微陣列僅可以對帶注釋的轉(zhuǎn)錄組進(jìn)行全面采樣,不能對整個(gè)轉(zhuǎn)錄組進(jìn)行測序、發(fā)現(xiàn)新的基因和研究可變剪切轉(zhuǎn)錄本[8,17]。第二,它可以使研究人員對基因組進(jìn)行正確注釋,并在單核苷酸分辨率下定義基因的轉(zhuǎn)錄邊界和表達(dá)單核苷酸多態(tài)性[18]。第三,相對于微陣列而言,RNA-seq的“背景信號(hào)”低,沒有量化上限,可以更加準(zhǔn)確測定RNA的表達(dá)水平,因此可以在更大動(dòng)態(tài)范圍內(nèi)檢測到轉(zhuǎn)錄表達(dá)水平的變化情況[19]。第四,RNA-seq可以與不同類型的生化分析相結(jié)合,分析RNA生物學(xué)的許多其他方面,如RNA蛋白結(jié)合、RNA結(jié)構(gòu)和RNA相互作用,或者結(jié)合其他組學(xué)數(shù)據(jù),將基因表達(dá)與基因組特征(如表觀遺傳變化、DNA序列改變和蛋白質(zhì)相互作用)聯(lián)系起來[6]。
在使用RNA-seq技術(shù)之前,首先要根據(jù)試驗(yàn)樣本選擇一個(gè)合適的測序平臺(tái),雖然大多數(shù)測序平臺(tái)都遵循相似的處理步驟,但是在處理生物化學(xué)和產(chǎn)生陣列的方式上存在差異,因此獲得的數(shù)據(jù)也大不相同[20]。當(dāng)RNA樣本數(shù)量有限時(shí),首選Helicos測序,用于Helicos測序的樣品制備步驟相對簡單,同時(shí)省略了聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增步驟。然而Helicos測序有1個(gè)固有的錯(cuò)誤率,所以當(dāng)要求測序錯(cuò)誤率(<1%)時(shí),則首選Illumina或SOLiD,二者相對于其他的測序方式在測序深度和測序能力上有極大的優(yōu)勢。當(dāng)采用1種測序方法無法獲取滿意結(jié)果時(shí),可以聯(lián)合使用多種RNA測序方法,例如首先通過Illumina或SOLiD獲得足夠深度的短序列,其次使用Roche 454獲得長序列,從而獲取滿意結(jié)果[21-22]。
在應(yīng)用RNA-seq技術(shù)制備文庫前需要采用化學(xué)水解或酶消化方法將RNA或互補(bǔ)DNA(complementary DNA,cDNA)片段化,以達(dá)到適合測序的尺寸,但是部分小RNA如微小RNA(microRNA,miRNA)不需要片段化處理。隨后通過使用隨機(jī)引物的逆轉(zhuǎn)錄酶將RNA轉(zhuǎn)化為cDNA,然后將適配器寡核苷酸連接到cDNA進(jìn)行擴(kuò)增和測序。測序完成后,用軟件來分析測定的序列。測序數(shù)據(jù)分析主要分為2個(gè)階段:首先,必須從數(shù)據(jù)集中刪除測序工件和錯(cuò)誤數(shù)據(jù);其次,使用合適的定位器將處理后的數(shù)據(jù)對準(zhǔn)參考基因組,并進(jìn)行下游數(shù)據(jù)分析[20]。目前可做的分析有信號(hào)通路網(wǎng)絡(luò)構(gòu)建(Pathway)、加權(quán)基因共表達(dá)網(wǎng)絡(luò)構(gòu)建(WGCNA)、時(shí)間序列分析(Time Course)、功能層次網(wǎng)絡(luò)構(gòu)建(GO Network)、基因表達(dá)趨勢分析(STC)、差異基因統(tǒng)計(jì)分析(聚類分析、GO富集分析、KEGG富集分析)及其他常規(guī)分析。
DR是糖尿病常見的微血管并發(fā)癥,據(jù)估計(jì),DR在成人糖尿病人群中的患病率為34.6%,是工作年齡人群致盲的主要原因[23]。近年來越來越多的研究表明,miRNA、環(huán)狀RNA、長鏈非編碼RNA(long non-coding RNA,lncRNA)等非編碼RNA可作為DR早期診斷和預(yù)測預(yù)后的潛在生物標(biāo)志物,在DR發(fā)病機(jī)制和進(jìn)展中發(fā)揮重要作用[24]。RNA-seq技術(shù)可以準(zhǔn)確檢測在DR發(fā)病機(jī)制中發(fā)揮重要作用的mRNA和非編碼RNA,為擴(kuò)大DR研究范圍以及確定潛在治療靶點(diǎn)提供基礎(chǔ)。
RNA-seq技術(shù)通過檢測血清生物標(biāo)志物有助于早期檢測DR,有望實(shí)現(xiàn)DR的早發(fā)現(xiàn)、早診斷、早治療。一項(xiàng)研究應(yīng)用RNA-seq分析2型糖尿病伴DR、2型糖尿病無DR患者和健康對照組人群的血清miRNA表達(dá)差異。發(fā)現(xiàn)由hsa-let-7a-5p、hsa-miR-new-chr5_15976和hsa-miR-28-3p組成的一組miRNA對2型糖尿病患者有無DR的鑒別有非常高的敏感性和特異性;深入研究發(fā)現(xiàn)hsa-let-7a-5p的過度表達(dá)可顯著促進(jìn)人視網(wǎng)膜微血管內(nèi)皮細(xì)胞的增生,從而參與DR的發(fā)病過程[25]。另一項(xiàng)研究通過對輕度非增生性DR和增生性DR患者的血清進(jìn)行RNA-seq分析,發(fā)現(xiàn)了6個(gè)顯著差異表達(dá)的基因(CCDC144NL、DYX1C1、KCNH3、LOC100506476、LOC285847和ZNF80),并交叉驗(yàn)證此類基因表達(dá)可以作為早期檢測糖尿病患者增生性DR的潛在生物標(biāo)志物[26]。
RNA-seq技術(shù)有助于準(zhǔn)確認(rèn)識(shí)DR動(dòng)物模型病理過程中的基因調(diào)控。視網(wǎng)膜的發(fā)育依賴于復(fù)雜而精確的轉(zhuǎn)錄作用和轉(zhuǎn)錄調(diào)控,糖尿病會(huì)引起多種視網(wǎng)膜轉(zhuǎn)錄組發(fā)生變化[27]。Liu等[28]通過對鏈脲佐菌素誘導(dǎo)的糖尿病模型大鼠視網(wǎng)膜進(jìn)行RNA-seq分析發(fā)現(xiàn),與正常對照組大鼠相比,糖尿病模型組視網(wǎng)膜中共鑒定出868個(gè)差異表達(dá)基因,其中上調(diào)基因565個(gè),下調(diào)基因303個(gè)。在差異表達(dá)基因中,檢測到94個(gè)凋亡基因和凋亡調(diào)節(jié)基因,19個(gè)炎癥基因,KEGG通路顯著富集分析結(jié)果顯示細(xì)胞黏附分子富集,補(bǔ)體和凝血級聯(lián)富集,抗原處理和表達(dá)富集。Fan等[29]通過對患有2型糖尿病的食蟹獼猴的視網(wǎng)膜色素上皮(retinal pigment epithelium,RPE)細(xì)胞進(jìn)行RNA-seq分析發(fā)現(xiàn),與非糖尿病組相比糖尿病組RPE細(xì)胞中共有2 744個(gè)差異表達(dá)基因,其中上調(diào)基因1 694個(gè),下調(diào)基因1 050個(gè),這些差異表達(dá)基因主要與補(bǔ)體激活,AGE/RAGE激活和炎癥反應(yīng)有關(guān)。
RNA-seq技術(shù)有助于尋找DR潛在治療靶點(diǎn)。Dong等[30]通過對高糖誘導(dǎo)的猴視網(wǎng)膜血管內(nèi)皮細(xì)胞進(jìn)行RNA-seq分析發(fā)現(xiàn),與正常對照組相比高糖組有449個(gè)差異表達(dá)基因,其中上調(diào)基因297個(gè),下調(diào)基因152個(gè),進(jìn)一步研究發(fā)現(xiàn)其中BMP4基因表達(dá)可能是DR抗血管內(nèi)皮生長因子(vascular endothelial growth factor,VEGF)和抗纖維化治療的潛在靶點(diǎn)。Niu等[31]分別對高糖聯(lián)合抗VEGF、高糖聯(lián)合抗VEGF及結(jié)締組織生長因子雙靶點(diǎn)干預(yù)作用下的2個(gè)組猴視網(wǎng)膜血管內(nèi)皮細(xì)胞進(jìn)行RNA-seq分析,發(fā)現(xiàn)卵泡抑素樣蛋白1可能參與了DR的發(fā)病過程,是DR潛在的基因治療靶點(diǎn)。
RNA-seq技術(shù)可精確揭示不同因素對DR模型干預(yù)后分子特征的變化,有助于探索其分子作用機(jī)制。吳綿綿等[32]通過RNA-seq探索α-黑素細(xì)胞刺激素(α-melanocyte stimulating hormone,α-MSH)對高糖高脂刺激下視網(wǎng)膜血管內(nèi)皮細(xì)胞中mRNA及l(fā)ncRNA表達(dá)的影響,發(fā)現(xiàn)α-MSH可能通過上調(diào)lncRNA的表達(dá)來下調(diào)下游基因的mRNA表達(dá)。Savage等[33]應(yīng)用RNA-seq技術(shù)檢測過氧化物酶體增生物激活受體β/δ(PPARβ/δ)的拮抗劑和反向激動(dòng)劑GSK0660在腫瘤壞死因子α(tumor necrosis factor,TNF-α)誘導(dǎo)視網(wǎng)膜內(nèi)皮細(xì)胞的炎癥中的作用,發(fā)現(xiàn)GSK0660可阻斷TNF-α對白細(xì)胞募集相關(guān)細(xì)胞因子CCL8、CCL17和CXCL10表達(dá)的影響,從而干預(yù)TNF-α誘導(dǎo)的視網(wǎng)膜白細(xì)胞停滯,影響細(xì)胞增生、創(chuàng)傷反應(yīng)、細(xì)胞識(shí)別和鈣離子依賴性的胞吐作用。
DR是一種多因素的視網(wǎng)膜進(jìn)展性疾病,其發(fā)病機(jī)制復(fù)雜,涉及多種不同的細(xì)胞、分子和通路。RNA-seq有可能提供關(guān)于DR的發(fā)病機(jī)制、未知通路和網(wǎng)絡(luò)有價(jià)值且詳細(xì)的信息,有助于更全面地探索DR的基因調(diào)控及分子機(jī)制,為DR的早期診斷、預(yù)防和尋找新的治療靶點(diǎn)提供幫助。雖然RNA-seq已經(jīng)成為各研究領(lǐng)域普遍使用的一項(xiàng)工具,但是其仍然面臨許多挑戰(zhàn),例如大分子RNA的分割以及對龐大數(shù)據(jù)集進(jìn)行分析[7-8,34]。此外,RNA-seq不能對單個(gè)細(xì)胞的基因組和轉(zhuǎn)錄組進(jìn)行測序,無法識(shí)別樣本中不同細(xì)胞之間的異質(zhì)性[35]。然而隨著越來越多的深入研究的進(jìn)行,RNA-seq技術(shù)會(huì)更加優(yōu)化,其未來的發(fā)展將為臨床醫(yī)生診斷和治療眼科疾病提供更強(qiáng)有力的幫助。
利益沖突所有作者均聲明不存在利益沖突