王丹蕊 沈文麗 魏子艷 王尚 鄧曄,,3
(1. 中國科學院生態(tài)環(huán)境研究中心,北京 100085;2. 山東大學海洋研究院,青島 266237;3. 中國科學院大學資源與環(huán)境學院,北京 100049)
單細胞測序技術是指在單細胞水平上,通過全基因組或轉(zhuǎn)錄組擴增,對核酸分子進行高通量測序的技術。該技術能夠揭示單個細胞的基因結(jié)構和基因表達水平,反映細胞間的異質(zhì)性,剖析單個細胞對生態(tài)系統(tǒng)或有機體的貢獻[1-2]。1990 年,Iscove等[3]首次提出對單細胞進行轉(zhuǎn)錄組分析的構想,并用 PCR技術實現(xiàn)了對 cDNA 分子的指數(shù)級擴增。1992年,Telenius等[4]開發(fā)出寡核苷酸引物PCR(Degenerate oligonucleotide primed PCR,DOPPCR)的方法,用簡并寡核苷酸序列擴增基因組,為單細胞測序提供了思路。直到2001年,Dean等[5]首次使用隨機六聚體引物和φ29 DNA聚合酶進行反應實現(xiàn)了DNA的滾環(huán)擴增,隨后Raghunathan和Lasken等[6-7]于2005年發(fā)明了多重置換擴增技術(Multiple displacement amplification,MDA),實現(xiàn)了對單細胞全基因組的擴增與測序。但此時的單細胞擴增技術在覆蓋度和擴增偏好性方面有明顯的局限性,隨后一些研究者致力于克服這些問題。例如,Stepanauskas等[8]于2017年 使 用φ29 DNA聚合酶的熱穩(wěn)定突變體提高了單細胞基因組測序的覆蓋度;哈佛大學謝曉亮團隊[9]于2012年發(fā)明了多次退火環(huán)狀循環(huán)擴增技術(Multiple annealing and looping based amplification cycles,MALBAC),通 過擬線性的擴增過程降低了指數(shù)擴增的序列偏好性。發(fā)展至今,單細胞測序技術在神經(jīng)生物學、微生物學、胚胎發(fā)育、器官發(fā)生和免疫學研究中取得了廣泛應用,臨床上也已用于輔助生殖和腫瘤的診斷與治療[10]。Nature Methods于2011年將單細胞研究方法列入最值得關注的技術領域,又于2013 年將相關應用列為年度最重要的方法學進展;近日Nature再次將單細胞測序技術評為2020年度最受期待的技術之一。
相比擴增子測序和宏基因組測序,單細胞擴增和測序技術有其獨特的不可替代的優(yōu)點。擴增子測序是指對微生物的特定基因進行測序[11],傳統(tǒng)針對16S rDNA、18S rDNA或ITS(內(nèi)轉(zhuǎn)錄間隔區(qū))基因進行的擴增子測序雖然可以滿足檢測微生物群落多樣性的需求,但這種方法很難準確鑒定到屬以下的分類等級,也無法深入探究物種的功能信息[12]。宏基因組測序又稱環(huán)境基因組測序或群落基因組測序,直接對樣本中所有微生物的全基因組進行測序,可以同時對物種和功能基因做出鑒定,也有助于發(fā)掘潛在代謝途徑。然而該方法容易忽視某些稀有種[13],且測序結(jié)果的組裝也始終是一大難題[14-15]。如果說宏基因組數(shù)據(jù)集是捕獲整個群落信息的一張巨網(wǎng)[16],那么單細胞測序方法則是分離目標基因組的“手術刀”和深入探究目標群落的“放大鏡”,能不斷細化、深化我們對微生物群落的認識[17]。
本綜述重點介紹了在微生物生態(tài)學領域使用過或具有應用前景的單細胞分離技術和單細胞基因組擴增技術,并詳細論述了單細胞測序技術在獲得單細胞基因組、剖析種群異質(zhì)性、探究種間關系、聯(lián)合系統(tǒng)發(fā)育和功能信息等方面的應用,最后在此基礎上對其在微生物生態(tài)學領域的發(fā)展做出了一些展望。
通常單細胞測序的完整流程包括樣品保存與制備、單細胞分離、細胞裂解、全基因組擴增(WGA)與產(chǎn)物的系統(tǒng)發(fā)育篩選、文庫制備與測序、測序結(jié)果的質(zhì)量控制[18],其中單細胞分離與全基因組擴增是最為關鍵的步驟,諸多技術已被開發(fā)并應用于微生物的相關領域,而如何根據(jù)科學問題對分離和擴增的方法進行選擇或改進對科學研究具有重大意義。
細胞分離是單細胞測序的第一步,其準確性將直接影響后續(xù)的測序和分析。提高通量、減少樣品與試劑的消耗、提高細胞分離捕獲的靈敏度和精確性一直是研究者的目標。常用的細胞分離技術包括有限稀釋法(Limited dilution)、顯微操作法(Micromanipulation)、激光捕獲顯微分離技 術(Laser capture microdissection)、拉 曼 鑷 子(Raman tweezers)、渦旋與相分隔(Vortex and phaseseparation)、熒光激活細胞分選技術(Fluorescenceactivated cell sorting,F(xiàn)ACS)和微流控技術(Microfluidics)[19-21](表1)。其中微流控技術因其較低的成本、較高的通量和理想的分離效果在近10年發(fā)展迅速,成為細胞分離技術的主流方向[22]。
單細胞分離之后需要通過單細胞基因擴增技術使單個細胞內(nèi)極微量的DNA放大至納克或微克水平,同時也將較長的DNA片段化,滿足下一步測序的需要。目前常用的方法包括簡并寡核苷酸引物PCR、多重置換擴增技術、多次退火環(huán)狀循環(huán)擴增技術、Tn5轉(zhuǎn)座酶技術[28],以及新興的細胞內(nèi)融合基因技術(Emulsion,paired isolation and concatenation PCR,epicPCR)[20]。
簡并寡核苷酸引物PCR(圖1-A)使用隨機簡并引物對全基因組進行擴增。由于隨機引物退火溫度的不均一性,不同序列擴增效率的差異被PCR反應成倍放大,產(chǎn)生大量擴增不足的區(qū)域,導致基因 組 覆 蓋 率 較 低[4]。2017年,Blagodatskikh等[29]改進了該技術并命名為iDOP-PCR(Improved DOPPCR),新的方案使用具有熱穩(wěn)定性的聚合酶,并調(diào)整了引物設計,可顯著提高文庫質(zhì)量。
表1 常見單細胞分離技術一覽
圖1 常見單細胞基因組擴增技術原理示意圖
多重置換擴增技術(圖1-B)是目前環(huán)境微生物領域最為成熟也是應用最廣的單細胞基因組擴增技術。由于φ29 DNA聚合酶具有3'-5'核酸外切酶活性和校正活性,因此與DOP-PCR相比,多重置換擴增技術(Multiple displacement amplification,MDA)具有更高的序列覆蓋度和保真度[30],但也存在外源DNA污染、序列覆蓋不均、嵌合體干擾、序列組裝與分析困難等不足[31]。由于MDA的偏差在一定程度上是隨機的,所以通??梢酝ㄟ^多個數(shù)據(jù)集的混合拼接來減小這種偏差同時提高組裝的完整性[32]。研究表明,2-5個單細胞擴增基因組數(shù)據(jù)集混合組裝得到的基因組完整性中位數(shù)>97%,高于單個單細胞組裝完整性的中位數(shù)(30%-90%)[33]。隨后Povilaitis等[34]基于多重置換擴增的原理改進得到全基因組擴增技術WGA-X,使用耐熱的突變體φ29DNA聚合酶將延伸溫度從30℃提高到45℃,大大提高了從CG含量高的單個環(huán)境細胞或病毒體回收基因組的能力。
多次退火環(huán)狀循環(huán)擴增技術(Multiple annealing and looping-based amplification cycles,MALBAC)(圖1-C)通過準線性預放大來減少與非線性放大相關的偏差。該技術利用特殊引物,使得擴增子的結(jié)尾互補而成環(huán),從而很大程度上防止了DNA的指數(shù)性擴增[9]。MALBAC所使用的引物3'端是8個隨機的核苷酸序列,5'端是27個固定的核苷酸序列,最大的特點在于它是準線性擴增而非指數(shù)擴增,因此拷貝數(shù)變異(Copy number variation,CNV)檢測的準確性高且單核苷酸變異(Single nucleotide variants,SNV)檢測的假陰性率低;而且,MALBAC的偏差具有可重復性,因此可進行降噪和歸一化處理。然而,由于該技術使用的DNA聚合酶保真度低于φ29 DNA聚合酶,SNV檢測的假陽性率高于MDA。目前MALBAC主要用于醫(yī)療診斷[35],在微生物單細胞的準確組裝方面相比MDA優(yōu)勢不明顯,在微生物生態(tài)學領域的應用前景不及MDA[36]。
Tn5轉(zhuǎn)座酶(圖1-D)最初用于二代測序的文庫構建,將DNA片段化、末端修復、接頭連接等簡化為一步,大大簡化建庫步驟的同時為單細胞測序提供了有力工具?;赥n5轉(zhuǎn)座酶,謝曉亮團隊[37]于2017年提出了改良的單細胞全基因組擴增方法(Linear amplification via transposon insertion,LIANTI),用Tn5轉(zhuǎn)座子結(jié)合T7啟動子形成的轉(zhuǎn)座復合體隨機插入單細胞基因組DNA,將基因組片段化并與T7啟動子連接。隨后T7啟動子行使體外轉(zhuǎn)錄功能,用轉(zhuǎn)錄獲得大量線性擴增的轉(zhuǎn)錄本,再經(jīng)逆轉(zhuǎn)錄得到大量擴增產(chǎn)物,進行建庫測序。該過程進行的是線性擴增,大大增強了擴增的穩(wěn)定性,使LIANTI在遺傳疾病的檢測方面更加有效和精確。同年,Lan等[21]利用微流控技術將單細胞測序技術的通量提高到50 000個細胞/次,使得轉(zhuǎn)座酶適用于環(huán)境基因組研究。
細胞內(nèi)融合基因技術(圖1-E)是單細胞分離技術、融合PCR、巢式PCR和測序技術的結(jié)合,廣義而言也可歸于單細胞測序的范疇。首先,通過稀釋和渦旋將樣品分散成單細胞體系;然后對待研究的系統(tǒng)發(fā)育基因和功能基因進行融合擴增;隨后進行巢式PCR,建庫并進行二代測序[20]。該技術的成本遠低于普通單細胞全基因組測序,單次實驗的通量可高達107個細胞,在解決物種與功能、種間關系等科學問題方面有良好的應用前景[38]。
目前,關于微生物生態(tài)的研究大多是群體水平,比如基于宏基因組學的研究能夠獲得群體的遺傳潛力,盡管信息量很大,但無法探究個體的遺傳潛力,細胞間的關聯(lián)和異質(zhì)性等問題也沒有得到很好的解決[39]。單細胞測序與單細胞組學等新技術、新方法的出現(xiàn)為探索復雜環(huán)境中的單細胞生態(tài)學提供了嶄新的機會[40]。單細胞基因組學的組裝過程不依賴宏基因組數(shù)據(jù)的組裝和分箱算法,因此能夠較為準確地獲得單個細胞內(nèi)質(zhì)粒、病毒等遺傳信息[41],深入發(fā)掘不可培養(yǎng)的未知微生物的功能[42];該方法在個體細胞尺度上對樣本進行研究[43],從而為探究種群異質(zhì)性提供了有效手段。此外,單細胞基因組學也常用于研究基因之間的相互作用,破譯微生物間或微生物與宿主的交流行為[44],揭示各種生態(tài)系統(tǒng)中微生物群落的結(jié)構和功能等[45]。
地球有豐富的微生物資源。根據(jù)比例法則結(jié)合生物多樣性的對數(shù)正態(tài)模型進行的預測估計,全球微生物物種可能高達1012種[46]。其中大多數(shù)微生物是不可培養(yǎng)或還未被充分認識的,所以由于其未知性也被稱作生態(tài)系統(tǒng)的暗物質(zhì)[47]。無需培養(yǎng)的微生物分析鑒定方法(如宏基因組測序),自2004年出現(xiàn)以來一直廣受歡迎[48]。然而,環(huán)境中微生物通常由個別豐度高的物種和大量豐度低的物種組成[49],由于采樣方法、測序深度等限制,大多數(shù)研究都是針對豐度較高的種群開展的。Schlos等[50]對近11.3萬個細菌和古菌OTU進行普查后發(fā)現(xiàn)環(huán)境中存在大量的稀有物種,且基于傳統(tǒng)方法得到的信息非常有限。單細胞測序技術為獲取稀有物種的基因組、發(fā)現(xiàn)新的代謝通路提供了支持[32]。
單細胞測序技術對細菌和古菌的暗物質(zhì)基因組百科(GEBA-MDM)項目有很大貢獻,推動了微生物的功能預測和系統(tǒng)發(fā)育鑒定[51],極大拓展了系統(tǒng)發(fā)育樹上的微生物多樣性[52]。2017年,Yu 等[53]基于微流控技術開發(fā)出一種具有單細胞分辨率的微型宏基因組方法,并用它分析了黃石國家公園的兩個溫泉樣本,從中獲得了29個新的基因組草圖。Sieracki等[54]用單細胞基因組學方法研究了一系列海洋樣品中小型原生生物的多樣性,揭示了生態(tài)系統(tǒng)中新的相互作用和代謝途徑。Ahrendt等[55]使用單細胞基因組學方法對8種不可培養(yǎng)真菌的基因組進行了測序,結(jié)果表明,通過結(jié)合多個擴增基因組,可以獲得90%以上的單細胞基因組。
常用于物種鑒定的系統(tǒng)發(fā)育基因是高度保守的,僅可在屬水平上作為物種鑒定的參考,不能反映生態(tài)系統(tǒng)中單細胞物種基因組的多樣性[56];宏基因組測序中,應用最普遍的二代測序都基于短片段序列,通常會破壞種內(nèi)變異,經(jīng)拼接得到的也都是忽略個體差異的泛基因組[57];三代測序可讀取較長片段,但目前準確性和通量都比較低[58-59]。相較之下,單細胞測序可以通過捕捉細胞間的基因組變異來剖析自然環(huán)境中的種群異質(zhì)性。因此,它可以闡明微生物多樣性和生態(tài)位劃分,也能夠用于基因水平轉(zhuǎn)移的研究[32]。
Kashtan等[60]利用從1 000個原氯球菌細胞產(chǎn)生的大型單細胞擴增基因組文庫來確定同一物種的不同生態(tài)型在整個季節(jié)變化中的基因組變異。測序結(jié)果顯示,該種群由數(shù)百個具有不同“基因組骨架”(Genomic backbones)的亞種群組成,每個骨架包括一組不同的關鍵等位基因和一些特有的可變基因。Yoon等[61]對3個海洋原生生物(皮膽蟲)進行單細胞鳥槍法測序,發(fā)現(xiàn)這些細胞代表了3種不同的微生態(tài)系,也為紅藻亞界存在異養(yǎng)門提供了證據(jù)。Engel等[62]成功地應用單細胞基因組學評估了蜜蜂腸道微生物群中兩個共生菌在物種水平上的異質(zhì)性,揭示了菌株和生態(tài)位在代謝方面的特異性。2018年,Jochum等[63]對來自奧胡斯灣沉積物中的7個單細胞基因組進行了測序和分析,以了解它們在芳香化合物降解和能量代謝方面的潛力。研究證實了該種群具有代謝多樣性,反映出微生物應對不同的能量條件和硫酸鹽限制的生存策略。微生物所表現(xiàn)的這種種群異質(zhì)性是一種適應性特征,可以提高微生物對多變或非均質(zhì)環(huán)境條件的適應能力[64]。
對微生物而言,每個細胞都是一個完整的遺傳個體,包含了自身染色體、質(zhì)粒、細胞器、病毒和其他內(nèi)共生體的全部遺傳信息。單細胞基因組學可以無差別地獲得細胞內(nèi)包含的所有遺傳物質(zhì),從而在染色體DNA和其他遺傳信息之間建立聯(lián)系[65]。近五年的研究表明噬菌體與30多種細菌或古菌有關[66];還發(fā)現(xiàn)了一些能感染真核細胞的巨病毒[67]。2011年,Yoon等[61]在從海洋中分離出的單細胞中檢測到了內(nèi)生菌和病毒的遺傳信息,揭示了單個細胞間的相互作用;于2014年,Roux等[68]結(jié)合單細胞測序和宏基因組測序取得了127個不可培養(yǎng)細菌的單細胞擴增基因組發(fā)現(xiàn),SUP05病毒會使其宿主的能量代謝重構;2019年,Martinez-Hernandez等[69]發(fā)現(xiàn)遠洋桿菌是海洋中數(shù)量極其豐富但未經(jīng)培養(yǎng)的37-F6病毒的宿主;Labonte等[70]使用單細胞基因組學研究了擴散流、低溫熱液噴口中噬菌體與宿主的相互作用,結(jié)果表明,噬菌體感染后發(fā)生溶原化但不裂解宿主,與宿主共進化且增強了宿主對有毒金屬和抗生素的抗性。
除此之外,單細胞測序也可用于探究細胞間的相互作用,發(fā)現(xiàn)微生物間的共生體,例如Nanoarchaeota和Ignicoccus的 共 生 關 系[71]、Actinomyces odontolyticus和Candidatus Saccharibacteria的寄生關系等[72]。低溫透射電鏡顯示,酸性礦山廢水中古菌之間常常存在物理性的胞間連接,例如細胞質(zhì)橋、菌毛等[73]。如果胞間的相互作用足夠強,不會在細胞分離過程中被破壞,單細胞測序技術則可將兩個或多個細胞視作一個整體進行測序。Munson-McGee等[41]結(jié)合單細胞基因組測序和宏基因組測序發(fā)現(xiàn),高溫酸性溫泉中專性共生納米古菌與宿主的物理關聯(lián)。2019年,Nakayama等[74]為了深入了解海洋藍藻共生,對宿主遠洋鞭毛藻進行單細胞測序并分析其中的藍藻基因組。系統(tǒng)發(fā)育分析顯示,樣本中藍藻屬于新的分支,它與宿主鞭毛藻嚴格共存且經(jīng)歷了獨立的進化,這種密切的共生關系導致它無法被傳統(tǒng)宏基因組學檢測到。因此,單細胞測序?qū)Πl(fā)掘物種的多樣性、生活方式、代謝途徑和進化過程具有重大意義。
隨著細胞內(nèi)融合技術的發(fā)展成熟,2019年,F(xiàn)lorenza等[38]建議使用epicPCR探究環(huán)境中真核生物和原核生物的相互作用關系,如固氮菌和浮游生物之間的互利共生[75],藻細胞周圍的微型“生物圈”中有以碳水化合物為食的異養(yǎng)細菌[76],還有病原菌感染細胞并在宿主細胞中增殖[77]。該方法將單個真核細胞和伴生的原核細胞形成的單個細胞簇分散到液滴中,既實現(xiàn)了單個真核細胞的分隔,又保持了真核生物和相關原核生物之間緊密的聯(lián)系。該方法也有一定局限性:只能揭示物理上緊密結(jié)合的相互作用,即在封裝時緊密相連的相互作用,包括共生、捕食、寄生等,但無法區(qū)分相互作用關系發(fā)生在真核細胞的內(nèi)部還是外部,也不能探究相互作用的分子機制。
2016年,Spencer等[20]首先開發(fā)了epicPCR技術,并將其用于硫酸鹽還原細菌的研究,拓展了硫酸鹽還原菌(Sulfate-reducing bacteria,SRB)的系統(tǒng)發(fā)育多樣性。2019年,Qin等[78]用該技術對青藏高原鹽湖沉積物中硫酸鹽還原原核生物(Sulfatereducing prokaryotes,SRPs)的系統(tǒng)發(fā)育進行了鑒定,研究表明西藏鹽湖中有多種新的特有的SRP。隨后,研究者將epicPCR技術用于抗性基因及其宿主的研究。由于抗性基因相對豐度較低且易在宿主間轉(zhuǎn)移,傳統(tǒng)的研究方法存在很大局限性,epicPCR技術的應用大大提高了抗性基因風險評估的精確度水平[79]。
2017年,Lan等[21]首先提出了結(jié)合微流控技術、片段化和序列標簽的單細胞基因組測序Sic-seq,并使用這種方法來分析了環(huán)境樣本中微生物耐藥基因、毒力因子和噬菌體序列的分布。2020年,Chijiiwa等[80]發(fā)現(xiàn)借助單細胞基因組測序技術可以在沒有參考基因組的情況下在物種水平上識別代謝應答者,為區(qū)分鑒定微生物群落中具有特定功能的未培養(yǎng)微生物提供了方法。Doud等[81]通過識別和捕獲基于其原位功能或特征的單個微生物,擴充了功能驅(qū)動的單細胞基因組學。該方法先用熒光標記微生物含有的纖維素顆粒,然后通過熒光激活細胞分選方法分離單細胞進行宏基因組鳥槍法測序,結(jié)合16S rRNA基因擴增子測序進行系統(tǒng)發(fā)育定位,并對纖維素酶進行基因鑒定、表達檢測和活性測試。這種功能驅(qū)動的單細胞方法可以將微生物分類直接與原位功能聯(lián)系起來,具有廣泛的應用前景和重大的實際意義。
2018年12月,英國皇家學會舉辦了一場以“單細胞生態(tài)學”為主題的跨學科會議,使用物理和分子領域相關的最新方法,在單細胞尺度研究生物現(xiàn)象,揭示同一物種的個體(或個體群)與其他個體、環(huán)境,以及不同種個體的相互作用[82]。操縱細胞的物理學家、研究微生物群落性質(zhì)的微生物學家和開發(fā)新的單細胞方法的基因組學家齊聚一堂,產(chǎn)生了諸多新的見解與靈感?,F(xiàn)在正是單細胞測序技術的飛速發(fā)展期,它的產(chǎn)生與完善推動了多個學科的進展,在各領域的廣泛應用又促進了技術的成熟。目前已有一些較成熟的單細胞測序平臺和商品化試劑盒上市,如10×genomic公司的10×Chromium Single Cell Gene Expression Solution 和Chromium Single Cell DNA Reagent Kits,BD公司的BD RhapsodyTMSingle-Cell Analysis System,Wafergen公司的ICELL8 Single-Cell System,Bio-Rad公 司 的SureCell ATACSeq Library Preparation Kit和與Illumina合作開發(fā)的llumina?Bio-Rad?Single-Cell Sequencing Solution等。但由于單細胞測序的成本依然較高而能夠同時檢測的細胞數(shù)量也較為有限,其主要的應用熱點依然以醫(yī)學領域為主,環(huán)境微生物和微生物生態(tài)的應用才剛剛起步。而根據(jù)微生物生態(tài)研究的特點,領域內(nèi)也有專家對單細胞測序的儀器使用方法進行了一系列優(yōu)化,如結(jié)合單細胞測序技術將復雜群落分割成多個微型亞群再進行宏基因組測序的微型宏基因組(Mini-metagenome)技術[83],該技術降低了樣品復雜性,同時具有傳統(tǒng)宏基因組測序所不具備的單細胞分辨率,與單細胞技術相比又提高了測序通量,解決了嵌合體問題,非常適用于環(huán)境樣本。單細胞測序技術有望成為微生物生態(tài)研究強大有力的主流技術力量,對于深入研究不可培養(yǎng)的微生物、加深對微生物生命之樹的探索具有重大意義。