邱曉芬,陳潔晶,薛 雯,林 華,楊 明△,湯冬娥,戴 勇,▲
(1.廣西師范大學生命科學學院,廣西桂林 541006;2.中國人民解放軍聯(lián)勤保障部隊第九二四醫(yī)院 中心實驗室/廣西代謝性疾病研究重點實驗室,廣西桂林,541002;3.暨南大學第二臨床醫(yī)學院/深圳市人民醫(yī)院臨床醫(yī)學研究中心,廣東深圳 518020)
由于基因組和表觀基因組的重編程及細胞分裂和分化過程中的DNA復(fù)制錯誤,單個細胞水平會呈現(xiàn)不同的基因組、轉(zhuǎn)錄組和表觀基因組[1]。傳統(tǒng)轉(zhuǎn)錄組測序方法是對群體水平細胞簇的轉(zhuǎn)錄組進行測序,是對組織平均表達水平的剖析,難以揭示其中單個細胞的基因表達情況,如腫瘤細胞的異質(zhì)性、循環(huán)腫瘤細胞(CTC)、最早的胚胎干細胞和腫瘤干細胞[2],如法醫(yī)鑒定中痕量生物樣本,這些細胞的轉(zhuǎn)錄組難以通過常規(guī)測序技術(shù)進行分析。單細胞轉(zhuǎn)錄組測序(sc RNA-seq)技術(shù)的發(fā)展和改進用于細胞異質(zhì)性發(fā)現(xiàn),也可用于微量樣品的轉(zhuǎn)錄組分析,可更全面地理解真核生物轉(zhuǎn)錄組基因復(fù)雜性,單細胞測序技術(shù)可以確定單核苷酸多態(tài)性(SNP)、拷貝數(shù)變異、單細胞基因組的基因組結(jié)構(gòu)變異、基因表達水平、基因融合、可變剪接及單細胞表觀基因組中的DNA甲基化狀態(tài)[3],有助于充分了解疾病與生命活動進程,進而找到治療疾病的方法。
sc RNA-seq技術(shù)首先要從微生物群落或細胞團中分離出單個細胞。目前已開發(fā)出多種適合不同情況的單細胞分離技術(shù),主要包括連續(xù)稀釋法、顯微操作法、激光捕獲顯微切割技術(shù)(LCM)、熒光激活細胞分選技術(shù)(FACS)、微流體控技術(shù)、拉曼鑷子技術(shù)(ROT)[4]。單個細胞易受外界環(huán)境的影響,應(yīng)注意避免機械力與化學作用對單個細胞的破壞。連續(xù)稀釋法是將細胞置于特定的細胞懸液中梯度稀釋,最終獲得單個細胞的方法,該方法對設(shè)備依賴小,只需手工操作就能實現(xiàn)單細胞分離,成本低廉、操作簡單,缺點是不能特異性篩選靶細胞,在操作過程中容易發(fā)生分離錯誤,甚至丟失細胞,因此,更適合分離均一性好的樣本。顯微操作法是低通量方法[3],在高倍顯微鏡下用顯微操作鑷子分離單個細胞,基于細胞形態(tài)和著色特征的視覺辨別中在顯微鏡下觀察和拍攝每個獨立的單細胞,實現(xiàn)無偏差分離,但耗費人力,因此,常用于從人工培養(yǎng)的細胞系或早期胚胎中分離單個細胞。LCM是在顯微鏡下觀察組織細胞,直接從固定組織的切片中切割和分離單個細胞的方法,可特異性獲得目的細胞,同時可以將不需要的細胞切除而獲得單個細胞[5]。LCM的缺點是分離的單個細胞的完整性可能會被破壞,并且激光能量進行微切割也可能對DNA造成直接損害而導(dǎo)致遺傳物質(zhì)損失,且通量低、成本高。FACS是流式細胞儀基于熒光標記物的細胞特異性特征,如不同的光散射信號實現(xiàn)自動化高通量方式分離單個細胞的技術(shù)[3],F(xiàn)ACS需要大量懸浮細胞作為起始材料,因此,不適合從數(shù)量低的細胞群中分離出單個細胞。ROT是光學鑷子和拉曼光譜相組合的技術(shù)[6],前者通過輪廓區(qū)分細胞而無需染色,后者利用激光捕獲細胞,具有同時操作和表征單個細胞而無標簽或物理接觸的優(yōu)點,在腫瘤和微生物細胞的異質(zhì)性研究中起重要作用。微流體控技術(shù)廣泛應(yīng)用于DNA測序、藥物篩選、化學合成等領(lǐng)域,具有代表性的有兩種:液滴式微控和芯片式微流控,這兩種方法都是將細胞分離至納升級的微容器中,提高單細胞制備效率,其中芯片式微流控技術(shù)可利用不同特性材料的芯片作為反應(yīng)容器,將傳統(tǒng)生化分析實驗室操作集成于微小芯片上,集采樣、反應(yīng)與分離一體,幾乎囊括全部化驗室功能??衫蒙倭繕悠泛突瘜W試劑實現(xiàn)單個細胞的識別和分離技術(shù),具有靈敏度高,精確度好,少污染,靈活組合,精確操控、高效篩選目的細胞的優(yōu)勢[7]。微流體控技術(shù)是一種較新的單細胞分離技術(shù),被認為是一種較合適的方法,在分離單細胞的應(yīng)用中具有廣闊的前景。
RNA-seq是以單個細胞為研究對象進行轉(zhuǎn)錄組水平測序,并對所得數(shù)據(jù)進行生物信息學統(tǒng)計分析的技術(shù)。單個哺乳動物細胞總RNA水平僅約為10 pg,通常mRNA最多只有0.5 pg[8]。但一般高通量測序建文庫至少需要幾十納克DNA,細胞內(nèi)核酸擴增需十萬倍以上構(gòu)建cDNA文庫達到測序水平,首要解決的問題是用微量RNA準確建庫,避免擴增偏倚,提高靈敏度和可重復(fù)性,并獲得細胞追溯來源。cDNA文庫構(gòu)建的核心技術(shù)是全面捕獲目標樣本內(nèi)的總RNA,其中關(guān)鍵步驟是全轉(zhuǎn)錄組擴增,將RNA反轉(zhuǎn)錄成cDNA,然后再進行cDNA擴增,必須將RNA完全反轉(zhuǎn)錄成cDNA進行線性擴增才能表征單個細胞的轉(zhuǎn)錄組特征。目前主要的方法可分為同聚物加尾唐氏法、模板轉(zhuǎn)換法Smart-seq/Smart-seq2、STRT-seq[9]、體外轉(zhuǎn)錄擴增CEL-Seq、Quartz-seq[3,10-11]等,以下簡要介紹其中幾種。
2.1同聚物加尾唐氏法 TANG等[12]首次使用Tang′s RNA-seq在單個小鼠卵母細胞和卵裂球進行轉(zhuǎn)錄組分析,是利用同聚物加尾擴增的一種方法。分離單個細胞并通過轉(zhuǎn)移到裂解物緩沖液中并直接在全細胞裂解物上進行反轉(zhuǎn)錄。通過核酸外切酶除去游離引物,用末端脫氧核苷酸轉(zhuǎn)移酶將poly(A)尾添加到第一鏈cDNA的3′末端,PCR循環(huán)擴增單細胞cDNA,得到100~200 ng擴增的cDNA用于構(gòu)建測序文庫,文庫用于SOLiD系統(tǒng)進行深度測序。
2.2體外轉(zhuǎn)錄擴增CEL-Seq CEL-Seq是體外線性(IVT)擴增單細胞轉(zhuǎn)錄組的方法。利用含有oligo-dT序列、獨特條形碼、Illumina測序接頭和T7啟動子的引物將單細胞RNA反轉(zhuǎn)錄成一鏈cDNA。在合成第2條鏈后,合并幾個樣品的cDNA用于IVT。然后將T7轉(zhuǎn)錄的RNA片段化并與Illumina銜接子連接,反轉(zhuǎn)錄為cDNA,從而可以選擇含有Illumina銜接頭與條形碼的30個最大片段。由于IVT是線性擴增方法,與其他基于PCR的擴增方法比較,可減少擴增偏倚,同時與基于PCR的擴增方法比較,CEL-Seq具有更高的可重復(fù)性和靈敏度。HASHIMSHONY等[10]通過研究早期秀麗隱桿線蟲胚胎發(fā)育表明,早在胚胎時期兩細胞之間已存在轉(zhuǎn)錄產(chǎn)物的差異,CEL-Seq轉(zhuǎn)錄組定量方法可用于含有不同細胞類型群體的復(fù)雜組織的轉(zhuǎn)錄組學分析。
2.3模板轉(zhuǎn)換法Smart-seq/Smart-seq2 DANIEL等[2]通過Smart-seq捕獲來自黑素瘤的潛在循環(huán)腫瘤細胞,篩選黑素瘤循環(huán)腫瘤細胞的生物標志物,Smart-seq明顯增加長度超過1 kb的所有轉(zhuǎn)錄本的全長覆蓋率。測定前列腺(PC3和LNCaP)和膀胱(T24)癌細胞系細胞的12個單個細胞的基因表達情況,在這3個細胞系中鑒定數(shù)百個差異表達的基因,對數(shù)十個起始細胞總量少的RNA檢測靈敏度較高。PICELLI等[13]在開發(fā)的Smart-seq2在Smart-seq的基礎(chǔ)上進一步完善反轉(zhuǎn)錄,模板轉(zhuǎn)換和預(yù)擴增等流程已獲得高產(chǎn)量cDNA。Smart-seq2可以增加單細胞的cDNA文庫產(chǎn)量和平均長度,并且可以實現(xiàn)更高的靈敏度,降低擴增偏倚,可同時分析數(shù)百個細胞,可回收全長cDNA,可分析每個轉(zhuǎn)錄物的所有外顯子并檢測不同的剪接變體,可實現(xiàn)全面的SNP和突變分析,應(yīng)用領(lǐng)域?qū)拸V[14]。
sc RNA-seq其主要應(yīng)用是分析稀有細胞類型及揭示細胞間異質(zhì)性[15],在免疫系統(tǒng)[16]、神經(jīng)細胞[17-18]、胚胎干細胞[19-20]、細胞圖譜構(gòu)建[21]、腫瘤及微環(huán)境[22]等領(lǐng)域應(yīng)用。
3.1揭示細胞新亞型 JAITIN等[23]對來自超過4 000個小鼠脾單細胞的RNA進行測序,篩選1 575個差異基因,鑒定出細胞類型特異性應(yīng)答基因組,如巨噬細胞中的Tnf和Marco,自然殺傷細胞(NK細胞)中的Xcl1和Gzmb,以及大量Ⅰ型干擾素應(yīng)答基因(Irf7、Stat2、Ifit1、Cxcl10)。
POWELL等[24]第一次直接測量了單個CTC中的高維基因表達,與正常細胞系比較,轉(zhuǎn)移NPTN、S100A4、S100A9和上皮間充質(zhì)轉(zhuǎn)變相關(guān)的基因升高,VIM、TGFβ1、ZEB2、FOXC1,CXCR4的轉(zhuǎn)錄水平較高。CTC轉(zhuǎn)錄分析受白細胞污染的限制,克服這個問題的方法是單細胞分析。晚期癌癥患者的藥物選擇,血液含有具有這些不同表型的CTC的患者可以在優(yōu)化的多種藥物治療方案中得到更好的治療。FREDRIK等[25]在單細胞轉(zhuǎn)錄組水平上分析了從一只成年大鼠海馬體CA1亞區(qū)捕獲的單細胞,表達譜分析揭示,CA1中至少有兩種不同的神經(jīng)元細胞類型。DOMINIC等[26]隨機選擇小鼠腸類器官的數(shù)百個細胞進行sc RNA-seq,并開發(fā)RaceID算法與之結(jié)合,將Reg4鑒定為腸內(nèi)分泌細胞的新標記物,腸內(nèi)分泌細胞是一種罕見的激素產(chǎn)生的腸細胞群,揭示了罕見腸細胞類型的存在。
3.2腫瘤微環(huán)境研究 有研究表明,基因突變是腫瘤發(fā)生的根本原因,腫瘤微環(huán)境研究有助于揭示腫瘤發(fā)生的具體機制,CTC是在實體瘤患者的血液中發(fā)現(xiàn)的罕見瘤細胞,實體瘤和CTC明顯是不同克隆起源[27],可能在癌癥傳播中起關(guān)鍵作用,揭示CTC表型為治療提供了可能的途徑,對于推測分析來自不同腫瘤區(qū)域的細胞能闡明腫瘤的進展。TIROSH等[28]從19例患者分離的445個單細胞進行單細胞測序,分析腫瘤微環(huán)境中惡性腫瘤細胞、免疫細胞、基質(zhì)細胞等在細胞個體、空間、功能和轉(zhuǎn)錄組的異質(zhì)性,結(jié)果揭示,黑素瘤細胞系可能存在潛在的耐藥群體。
3.3免疫系統(tǒng) MONIKA等[29]已經(jīng)通過PCR技術(shù)在多發(fā)性肌炎患者的肌肉和血液中鑒定了CD8 T細胞的克隆擴增,包括T細胞受體(TCR)互補決定區(qū)(CDR)3長度分析(分型)。將CDR3光譜分型、激光顯微切割和單細胞PCR結(jié)合來檢測這些克隆擴增的T細胞可能的致病作用,接觸、侵入和破壞骨骼肌纖維的單個細胞毒性T細胞,通過CDR3光譜類型篩選鑒定的寡克隆峰與形態(tài)學表征的顯微切割的T細胞相關(guān)聯(lián)。1例患者中部分顯微切割的T細胞攜帶共同的TCR-BV氨基酸CDR3基序和CDR3區(qū)域中的保守核苷酸交換,結(jié)果表明,CDR3譜型和單細胞分析可以結(jié)合起來識別、跟蹤血液和靶組織中的自身攻擊性T細胞克隆起源。這種方法適合其他炎癥和自身免疫性疾病。
3.4細胞圖譜構(gòu)建 AIZARANI等[30]用sc RNA-seq技術(shù)對來自9例人類供體正常肝臟組織約10 000個細胞進行測序分析,創(chuàng)建了所有重要肝臟細胞類型的人類肝臟細胞圖譜,其中包含肝細胞、肝臟主要代謝細胞、血管內(nèi)皮細胞、肝臟巨噬細胞等,鑒定一個膽管細胞亞群之前未知的特性,很可能是肝前體細胞或祖細胞。AIZARANI等[30]解釋這類祖細胞在肝臟再生中起重要作用,并且可能參與肝臟疾病或腫瘤產(chǎn)生。VENTO-TORMO等[31]對妊娠早期(6~14周)胎盤約7萬個細胞進行單細胞轉(zhuǎn)錄組測序并繪制胎盤細胞圖譜,鑒定出蛻膜dNK細胞的3個主要亞群。初次妊娠者dNK1細胞亞群細胞與特定的胎盤細胞之間相互作用可能使dNK1細胞能夠更加有效地應(yīng)答再次妊娠時的胎盤植入,這一新發(fā)現(xiàn)對理解早期妊娠有指導(dǎo)意義,給診治妊娠相關(guān)疾病提供了新思路。
自然界99%的微生物還不能人工培養(yǎng)[32],只有少數(shù)CTC可以從癌癥患者的外周血中分離,這些還難以研究的目標都可以通過單細胞測序技術(shù)來解決。利用單細胞水平上的高通量RNA測序已經(jīng)在生命研究中有大量新發(fā)現(xiàn),從新細胞類型的鑒定到隨機基因表達全局模式的研究,還可以同時應(yīng)用多組學來共同揭示生物生長發(fā)展機制。目前,scRNA-seq除了要克服檢測技術(shù)上的通量、效率、靈敏度、成本等問題外,還要克服具體計算策略和分析的挑戰(zhàn)。盡管用于分析來自大量細胞群體的RNA-seq數(shù)據(jù)的一些工具可以容易地應(yīng)用于scRNA-seq數(shù)據(jù),但是相信隨著生物信息學的發(fā)展,許多新的計算策略可以充分利用起來解讀數(shù)據(jù)[33],并且能夠在基因表達的基礎(chǔ)上進行全面詳細的分析。