王小琪,段子淵
(中國科學院遺傳與發(fā)育生物學研究所,北京100101)
非損傷性取樣(非侵入式)是在不傷害動物的前提下,采集動物的糞便、尿液、毛發(fā)或含有口腔脫落細胞的食物殘渣等可能含有遺傳信息的樣本(周璨林等,2015)。相比于傷害性取樣,非損傷性取樣方法更加簡單方便,對動物機體沒有傷害。在動物研究中,尤其是在野生動物的研究中使用較為廣泛。其中,糞便樣本因其易獲得、識別性高和含有多元遺傳信息的優(yōu)點,極大地促進了動物學的相關研究(單磊等,2018),并由此誕生了一門新的學科:分子糞便學。目前,糞便是應用最廣泛的非損傷性樣本,利用糞便樣本可對動物開展食性分析、腸道微生態(tài)研究、標記物篩選、種群遺傳多樣性分析等多方面的深入研究。尤其是近20年來,二代測序技術的出現(xiàn),標志著測序正式進入到高通量時代,為遺傳信息的發(fā)掘提供了大量、高效且可靠的數(shù)據(jù),快速推動了各類組學的發(fā)展。糞便在動物研究中的傳統(tǒng)應用方式已被多次報道(劉丙萬,蔣志剛,2002;周璨林等,2015),本文就目前利用測序技術提取糞便樣本中分子遺傳信息的研究予以簡要概述。
動物的食性研究是了解動物與環(huán)境相互關系的前提。然而對于野生動物或放牧家畜來說,食物是不可控的,不了解它們吃了什么,就無法進一步研究其活動范圍、飲食結構及營養(yǎng)代謝。除了對糞便樣本的視覺觀察,從20世紀80年代起,基于DNA的鑒定方法出現(xiàn),到21世紀初期,DNA條形碼正式出現(xiàn)并被標準化(Hebertet al.,2003)。DNA條形碼是一個特定的短序列DNA 片段,具有物種特異性,可以被用來準確快速地識別物種。但尚未有適用于所有物種的通用條形碼,為了獲得更高的覆蓋度和準確率,通常組合使用DNA 條形碼,這些組合條形碼主要來自以下基因片段:動物線粒體細胞色素C氧化酶Ⅰ基因,植物核糖體大亞基的核酮糖1,5-二磷酸羧化酶基因,葉綠體成熟酶K 基因,葉綠體trnL 內含子區(qū)和核糖體內轉錄間隔區(qū)(Group CPW,2009;Valentiniet al.,2009;Taberletet al.,2012;張瑞瑩,2013)等。DNA宏條形碼是隨著二代測序技術發(fā)展而誕生的用于檢測混合樣本的條形碼技術,可以快速、大規(guī)模地鑒定糞便樣本中的DNA,確定食物范圍、種類和成分。由于動物有肉食性、草食性和雜食性,所以需要對被檢動物的飲食情況有所了解,才能夠選擇合適的引物用于DNA宏條形碼檢測;同時,還需要采集當?shù)氐闹参锘騽游飿颖?,建立適用于當?shù)氐腄NA 條形碼數(shù)據(jù)庫,用于比對測序得到的宏條形碼(劉剛等,2018)。
胃腸道微生物數(shù)量眾多,與宿主共同進化,保持動態(tài)平衡有助于維持宿主腸道健康(Relman,2012),也對宿主的生長、營養(yǎng)代謝和免疫調控起重要作用(B?ckhedet al.,2004;Kataoka,2016)。當腸道內穩(wěn)態(tài)受到干擾時,胃腸道和其他器官(大腦、肝臟等)的功能會受到損害。探索腸道微生物群落結構和功能,有助于了解微生物組對宿主健康的作用、微生物組特性與宿主特性之間的關系,以及微生物組在疾病中的作用(Stulberget al.,2016)。采集糞便樣本避免了腸道內取樣對動物體可能造成的傷害,但在腸道微生物組研究中,有關糞便樣品是否能代表腸道內容物用于腸道微生物組研究一直存在爭議(Ingalaet al.,2018;Yanet al.,2019)。近期,多國科研人員共同提出了糞便微生物組倡議(Sapountziset al.,2021),并歸納了使用糞便樣本進行微生物組研究的優(yōu)勢:(1)能可靠地代表腸道末端的微生物群落;(2)不違背動物福利及動物倫理;(3)可能含有來自瘤胃和小腸的部分微生物,這對于瘤胃和小腸內微生物的相關研究也具有意義;(4)新鮮的糞便還可以用于培養(yǎng)組學,分離可培養(yǎng)微生物;(5)可分離核苷酸或蛋白質材料,用于組學測序、診斷性PCR 和其他分子和生化研究;(6)用于鑒定非消化飼料成分的化學分析;(7)可用于體內和體外實驗。
通常,絕大多數(shù)的胃腸道微生物是細菌,還有極少量的古菌、病毒、真菌和原生動物(Parkeret al.,2020)。針對微生物組的高通量測序方式常用的是:宏基因組、擴增子、宏病毒組和宏轉錄組。其中擴增子測序包含針對細菌和古菌的16S rRNA測序,針對真核生物的18S rRNA 測序和ITS 測序,部分常見的PCR擴增引物見表1。
表1 用于擴增子檢測的PCR擴增引物Table 1 PCR primers for amplicon sequencing
細菌占腸道微生物總量的90% 以上,有500~1 000 種(Kataoka,2016),被認為是腸道微生態(tài)平衡的主導者。研究表明,人類腸道細菌的穩(wěn)態(tài)平衡與多種疾病,如炎癥性腸病、肥胖、糖尿病、非酒精性脂肪性肝炎、慢性心臟病、癌癥和自閉癥等有關(Zhanget al.,2015)。目前,糞便樣本在腸道細菌研究的應用上已極為成熟,對于人、家畜、實驗動物和野生動物,基于擴增子(16S rRNA)測序,可以分析群落多樣性,揭示細菌群落與宿主代謝、免疫的關聯(lián);利用宏基因組測序,可以解析微生物組的基因功能分布等。對于野生動物,糞便樣本不僅可以幫助了解腸道細菌群落組成(Huanget al.,2020;Ishida-Kurokiet al.,2020),也可以協(xié)助鑒定腸道細菌特有的功能基因(張呈波,2021)。此外,通過宏基因組測序還可挖掘野生動物糞便細菌的功能基因,合成具有醫(yī)藥、食品等應用潛力的生化制品。楊金茹等(2022)從西黑冠長臂猿Nomascus concolor糞便宏基因組中篩選出的丙氨酸消旋酶基因,經擴增、重組及異源表達后,得到了穩(wěn)定性更好、催化活性更高的丙氨酸消旋酶;楊正鳳(2018)通過滇金絲猴Rhinopithecus bieti糞便微生物宏基因組,獲得了具有優(yōu)良工業(yè)特性的幾丁質酶和β-半乳糖苷酶。
腸道真菌可能參與宿主的炎癥性腸炎等疾病,但腸道內真菌群落的穩(wěn)定性不如細菌群落,容易受環(huán)境因素影響(Iliev & Cadwell,2021)。由于必須滿足能在37°C 下生長的條件,目前檢測到能在腸道內生長和定植的真菌種類較少,主要是念珠菌屬Candida(假絲酵母屬)和雙足囊菌科Dipo?dascaceae(Hallen-Adams&Suhr,2017)。宏基因組測序結果顯示,真菌只占人類腸道微生物的0.01%(Nashet al.,2017)。盡管真菌群落的穩(wěn)定性較差,但Hoffmann等(2013)對96份糞便樣本進行擴增子(ITS 區(qū))檢測,人類微生物組計劃通過對317 份糞便樣本的ITS區(qū)和18S rRNA基因測序(Behret al.,2018),Sun 等(2021)通過宏基因組測序對取自中國不同地域的6個民族(傣族、哈尼族、藏族、白族、苗族和漢族)的942 份糞便樣本測序,發(fā)現(xiàn)酵母菌屬Saccharomyces和念珠菌屬的含量最高;其中,Sun 等(2021)還進一步確定城市化對真菌群落影響最大,會顯著降低真菌豐富度。在動物腸道真菌群落研究中,通過ITS 區(qū)測序技術,糞便樣本被用于評估仔豬斷奶后胃腸道中真菌定植的波動情況,用以干預斷奶過渡期仔豬的健康和生長狀況(Arfkenet al.,2020)。蘇日娜等(2022)比較了原麝Moschus moschiferus和 林麝Moschus berezovskii腸 道真菌菌群結構特性及季節(jié)因素對真菌菌群多樣性的影響。
基于廣泛使用的多相分類法(Vandammeet al.,1996),古菌不等同于細菌,被歸類為一個單獨的原核生物類群。盡管16S rRNA 基因序列有過于保守導致序列同源性過高的缺點,但目前依舊被認為是推斷原核生物系統(tǒng)發(fā)育關系最重要的“標準”(Schleifer,2009)。相較于細菌和真菌,古菌有獨特的遺傳、生化和細胞特征。與細菌相比,古菌與真核生物有更多共同之處,包括基因組結構、轉錄和翻譯機制等(Doolittle&Logsdon,1998)。大多數(shù)的古菌門存在于海洋、火山等環(huán)境中,對生物地化循環(huán)起著至關重要的作用(Bakeret al.,2020)。人或動物腸道中定植的古菌屬僅有少數(shù)幾種:甲烷短 桿 菌 屬Methanobrevibacter、Methanomethylophi?lus屬 、Methanomassiliicoccus屬 、甲 烷 球 形 菌 屬Methanosphaera、甲烷粒菌屬Methanocorpusculum、甲烷桿菌屬Methanobacterium、嗜鹽古菌屬Haloferax和鹽紅菌屬Halorubrum(Chibaniet al.,2022)等。其中,廣古菌門Euryarchaeota 包含廣泛分布的產甲烷菌,也是研究最廣泛的古菌門。盡管在豬的腸道中還存在少量其他古菌屬,但豐度最高的也是與產甲烷相關的菌屬(Denget al.,2021)。此外,人類腸道中的古菌含量變化與宿主的代謝、免疫有關,比如兒童哮喘、腸道功能紊亂、肥胖、結直腸癌等(Triantafyllouet al.,2014;Barnettet al.,2019;Cokeret al.,2020)。目前,對人或野生動物腸道古菌的研究,常通過采集糞便樣本進行16S rRNA 測序分析,如對大熊貓Ailuropoda mela?noleuca、林麝糞便古菌結構組成的研究(徐誼英,2015);而經濟動物(牛等)的糞便樣本也可用于表征腸道古菌群落(Cendronet al.,2020)。
腸道病毒包括感染細菌的噬菌體和感染真核細胞的病毒,它們與細菌和腸道上皮細胞的相互作用可以激活宿主的保護性免疫途徑(Iliev &Cadwell,2021)。腸道病毒檢測的常規(guī)方法是有針對性地設計病毒相關引物或探針,對糞便或肛拭子中提取的病毒核酸進行熒光定量PCR 檢測,成本低且靈敏度高,是目前通過人或動物糞便檢測諾如病毒(錢明明等,2015)、豬δ 冠狀病毒(肖帥,2018)、新型冠狀病毒(吳冰珊等,2020)等單一病毒的常規(guī)方法。隨著高通量測序技術的發(fā)展,了解腸道病毒的手段也發(fā)生了革命性進步,利用宏病毒組,也稱為病毒宏基因組,不僅可以檢測樣本中所有病毒的遺傳物質、確定病毒組成,還可以進行病毒溯源(Rosario&Breitbart,2011)。對糞便樣本進行宏病毒組測序已經是了解野生動物糞便病毒群落結構和發(fā)現(xiàn)新病毒不可或缺的工具。古文鵬和代解杰(2019)探索樹鼩Tupaia belangeris腸道病毒的群落結構和分布特征、文隴英等(2022)評估四川邛海濕地公園9種鳥類的病毒多樣性等。
人畜共患寄生蟲會對人、野生動物和家畜的生產生活造成了極大的負面影響。由于大部分寄生蟲的蟲卵、卵囊或幼蟲可以隨宿主糞便排出,檢查糞便可以確定寄生蟲感染的情況(谷玉,道力高,1999)。使用涂片、沉淀、漂浮和培養(yǎng)等傳統(tǒng)檢查方法,無法獲得寄生蟲的分子遺傳信息,也不適用于處理較大的樣本量。野生動物中常見的人畜共患寄生蟲主要分為原蟲和蠕蟲(線蟲、絳蟲和吸蟲)(車麗美等,1996)。以常見的人畜共患隱孢子蟲Cryptosporidiumspp.、畢氏腸微孢子蟲Enterocyto?zoon bieneusi和十二指腸賈第蟲Giardia duodenalis為例,通過設計特異性引物(針對小亞基rRNA)進行巢式PCR 可以檢測出來。Zhang 等(2019)利用該方法對青藏高原地區(qū)放牧的牦牛、藏綿羊和駱駝等動物的糞便樣本分析了上述3 種寄生蟲的流行病學情況。多項流行病學調查可發(fā)現(xiàn),動物中常常出現(xiàn)寄生蟲混合感染的情況(陳小麗,2013;李東方等,2018;李瑞琪等,2020),而擴增子等高通量測序技術可以靈敏、高效且全面地檢測動物是否感染寄生蟲和寄生蟲的感染種類及亞型。在目前使用ITS區(qū)檢測寄生蟲的測序中,18S rRNA 基因的V4 和V9 區(qū)是最常用的目的序列(Hadziavdicet al.,2014)。對云南獨龍牛Bos frontalis糞便樣本寄生蟲調查(岳鳳嬌,2021)、野生大鼠糞便蠕蟲多樣性評估(Tanakaet al.,2014)。由于ITS 區(qū)和大亞基rRNA(28S rRNA 等)的多樣性高于18S rRNA,ITS 區(qū)和28S rRNA 基因也可被用于擴增子測序(Kounosuet al.,2019)。
生物標記物可應用于疾病診斷、疾病分期和分類,預后指標、干預措施的臨床反應預測和監(jiān)測;還可用于臨床轉化研究,加快藥物的研發(fā)進程(Group BDW,2001)。常利用PCR、熒光定量PCR、酶聯(lián)免疫吸附法(ELISA)、擴增子或宏基因組、代謝組和蛋白質組等技術篩選和鑒定生物標記物。
由于腸道微生態(tài)平衡與宿主的健康息息相關,當宿主的健康狀況發(fā)生改變時,腸道內微生物穩(wěn)態(tài)會嚴重失衡,其中豐度發(fā)生顯著變化的微生物,可能是與此類疾病密切相關的微生物標記物。王小琪等(2022)基于16S rRNA 測序數(shù)據(jù),篩選出了12 個與柴達木馬腹瀉相關的糞便微生物標記物。此外,還有中性粒細胞釋放的乳鐵蛋白和鈣衛(wèi)蛋白、腸道菌群產生的短鏈脂肪酸等,都可以通過宿主的體循環(huán)隨糞便排出,當宿主出現(xiàn)炎癥時,其含量會發(fā)生極大變化,此類代謝物也可以作為相關疾病的生物標記物。目前已有多種糞便微生物和代謝物被確定為疾病相關的標記物(表2),成為診斷或治療疾病的潛在靶點。
表2 疾病相關的部分糞便生物標記物Table 2 Disease-related fecal biomarkers
在一定區(qū)域內,糞便微生物群落結構組成具有宿主的特異性(Erenet al.,2015)。檢測環(huán)境中具宿主特異性的糞便微生物,可以追溯污染物來源,因此,此類糞便微生物可以被認定為污染溯源標記物。糞便樣本中不僅含有微生物及其食用的動植物的遺傳物質,還存在宿主脫落的腸道細胞。線粒體基因進化速率高、特異性較高(Brownet al.,1979),因此,糞便中宿主的mtDNA 也常作為標記物被用于動物物種鑒定及追溯污染物來源的宿主標記物,部分經典標記物如表3所示。目前的研究尚未發(fā)現(xiàn)任何一種標記具有絕對的宿主特異性,且一個標記物很難同時具有高敏感性和高特異性(Zhanget al.,2020)。
表3 部分糞便溯源標記物Table 3 Fecal markers for source tracking
基于糞便樣本中宿主的遺傳信息,可以對研究動物進行群體遺傳學方向的研究,遺傳多樣性、種群分化、種群遺傳結構、環(huán)境異質性影響、種群動態(tài)和基因流等,進而對動物及其生境進行管理和保護(Yamazakiet al.,2011;周蕓蕓等,2014;Ntieet al.,2017;Baaset al.,2018)。
由于糞便含有宿主的遺傳物質,基于糞便樣本可以對宿主進行性別鑒定、物種鑒定、微衛(wèi)星(simple sequence repeat,SSR)分型或單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)分型、種群遺傳多樣性評估等群體遺傳學研究。與性別決定相關的基因有SRY、SOX3、NR5A1和WT?1等,其中的SRY位于Y染色體上,是使用最為廣泛的性別鑒定基因(Guneset al.,2016)。SSR 和SNP 是人們在種群評估中使用較多的2種技術,都有其自身的優(yōu)勢和局限性。SSR 篩選位點的費用、所需DNA 質量、操作要求和評估需要的位點數(shù)量更低,而SNP由于通量更高,更為高效(Grover&Sharma,2016)。在國內,用于評估大熊貓遺傳多樣性的整個SSR體系已發(fā)展得非常成熟并一直被優(yōu)化(寇潔等,2022)。由于糞便中的宿主DNA 通常是碎片化的,直接從糞便中提取遺傳物質往往只適用于基因片段的研究,但隨著DNA 富集技術的發(fā)展,實現(xiàn)了從糞便樣品中高效捕獲宿主基因組DNA 及宿主全基因組測序數(shù)據(jù)(王李玲等,2021),可以在動物的保護基因組學等方向上進行深入研究(Fuentes-Pardo& Ruzzante,2017;Orkinet al.,2021)。王李玲等(2021)對富集糞便中宿主DNA 的方法(雜交捕獲法和甲基化CpG 島富集法)進行了深入分析和比較,甲基化CpG 島富集法近幾年才出現(xiàn),穩(wěn)定且成本低,富集效率與樣品CpG 甲基化程度成正比。Chiou 和 Bergey(2018)利用Papio屬狒狒的糞便樣本對改進的甲基化CpG 島富集法進行了驗證。目前,此方法應用最多。Tyagi 等(2022)通過該方法從糞便樣本中獲得了叢林貓Felis chaus的全基因組SNP 數(shù)據(jù)。Taylor 等(2022)研究稱,可以不進行宿主基因組DNA 捕獲,直接從糞便的粘膜層中提取DNA 測序,進而獲得了馴鹿Rangifer tarandus的全基因組數(shù)據(jù)。
糞便樣本可提取的分子遺傳信息較多,是非常便利的無損傷取樣獲得的樣本,適用于野生動物、放牧動物、家養(yǎng)動物,甚至人類的研究,且各種測序技術和組學技術的發(fā)展也降低了檢測成本,提高了檢測效率。但是,糞便樣本的使用也存在許多限制,比如糞便新鮮程度、保存時間及溫度、環(huán)境污染等,都可能影響糞便中易揮發(fā)的代謝物以及核酸的降解,降低檢測結果的準確率。此外,DNA 提取方法、標記位點、測序方法及深度、分析方法等不同也會導致檢測結果出現(xiàn)較大差異(田新民,張明海,2008;單磊等,2018)。因此,盡量使用無菌器具收集新鮮糞便,是提高結果準確性的基礎。研究人員已經對糞便樣本保存、DNA 提取、PCR擴增等實驗技術持續(xù)進行優(yōu)化,比如糞便樣本保存液的研發(fā),DNA 提取方法、基因分型技術體系的優(yōu)化,一代測序與二代測序結合檢測,數(shù)據(jù)分析方法改進等。相信隨著實驗和檢測方法的完善,對糞便樣本遺傳信息的提取將更為全面。