• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      環(huán)境DNA宏條形碼技術(shù)在藍(lán)藻群落監(jiān)測中的應(yīng)用

      2021-03-02 03:04:50李小闖霍守亮張含笑金小偉李文攀張軍毅張靖天
      環(huán)境科學(xué)研究 2021年2期
      關(guān)鍵詞:藍(lán)藻條形碼群落

      李小闖, 霍守亮*, 張含笑, 金小偉, 李文攀, 張軍毅, 張靖天

      1.中國環(huán)境科學(xué)研究院, 環(huán)境基準(zhǔn)與風(fēng)險(xiǎn)評(píng)估國家重點(diǎn)實(shí)驗(yàn)室, 北京 100012 2.中國環(huán)境監(jiān)測總站, 北京 100012 3.無錫市環(huán)境監(jiān)測中心站, 江蘇 無錫 214023

      水體富營養(yǎng)化和氣候變暖背景下,藍(lán)藻水華暴發(fā)頻率、范圍、周期在不同程度上有所增加[1-2]. 部分水華藍(lán)藻產(chǎn)生藻毒素和異味物質(zhì),嚴(yán)重威脅飲用水源地水質(zhì)安全,限制水體的生態(tài)服務(wù)功能,對(duì)社會(huì)經(jīng)濟(jì)發(fā)展產(chǎn)生重要影響[3-4],迫切需要大規(guī)模和長周期的藍(lán)藻群落監(jiān)測. 基于形態(tài)特征的顯微鏡鏡檢方法耗時(shí)、耗力,無法滿足大量樣品觀測需求. 另外,鏡檢需要熟悉藍(lán)藻分類系統(tǒng)并具備樣品觀察經(jīng)驗(yàn)的專業(yè)人員,分析結(jié)果因個(gè)人主觀經(jīng)驗(yàn)的干擾而差異較大. 有研究讓兩位分類學(xué)家同時(shí)觀察17株藍(lán)藻培養(yǎng)物,發(fā)現(xiàn)僅3株在種水平鑒定結(jié)果一致,6株在屬水平結(jié)果一致,7株鑒定為不同的屬[5]. 長期項(xiàng)目或跨區(qū)域合作項(xiàng)目往往需要多個(gè)藻類分析員,保持監(jiān)測結(jié)果一致性和可比性存在困難. 另外,鏡檢容易忽視超微藻類群(粒徑<2 μm),當(dāng)環(huán)境中藍(lán)藻未形成典型形態(tài)特征時(shí),如厚壁孢子、異形胞、末端特殊結(jié)構(gòu)等,往往無法鑒定到種水平或出現(xiàn)鑒定錯(cuò)誤[6-7].

      藍(lán)藻的原核特征被發(fā)現(xiàn)之前,一直被認(rèn)為是真核藻類,物種命名以形態(tài)特征為基礎(chǔ),遵循植物學(xué)命名系統(tǒng). 直至20世紀(jì)60年代,由于電鏡和分子信息等技術(shù)發(fā)展,發(fā)現(xiàn)藍(lán)藻屬于原核生物[8]. 細(xì)菌學(xué)者認(rèn)為,藍(lán)藻應(yīng)采用細(xì)菌學(xué)命名系統(tǒng),物種命名基于模式菌株(純培養(yǎng)物)的觀察而確定[9]. 藍(lán)藻的原核特征被發(fā)現(xiàn)后,藍(lán)藻的命名采用植物學(xué)分類系統(tǒng)或細(xì)菌學(xué)分類系統(tǒng). 同一藍(lán)藻物種在兩個(gè)分類學(xué)系統(tǒng)下描述和命名,一物種兩學(xué)名給藍(lán)藻分類系統(tǒng)造成了困擾. 20世紀(jì)80年代以來,Anagnostidis和Komrek提出多相分類學(xué)方法(polyphasic approach),融合形態(tài)特征、超微結(jié)構(gòu)、繁殖方式、生理生態(tài)特征和分子數(shù)據(jù)等進(jìn)行綜合分析,逐步完善了藍(lán)藻分類系統(tǒng)[10-11],形成經(jīng)典的藍(lán)藻四目系統(tǒng)(色球藻目、顫藻目、念珠藻目、真枝藻目),該分類系統(tǒng)流傳廣、接受程度高. 2000年以來,分子數(shù)據(jù)以指數(shù)倍增長,通過分子系統(tǒng)發(fā)育分析對(duì)基于形態(tài)特征描述的藍(lán)藻分類系統(tǒng)進(jìn)行校正和修訂,大量新的藍(lán)藻種屬被描述和確立. 更高層次的藍(lán)藻分類單元(如色球藻目和顫藻目)并非單系類群,Komárek等[12]基于形態(tài)特征、類囊體結(jié)構(gòu)以及分子數(shù)據(jù)對(duì)四目系統(tǒng)進(jìn)行修訂,提出了八目系統(tǒng),即粘桿菌目、聚球藻目、螺旋藻目、色球藻目、寬球藻目、顫藻目、擬甲色球藻目、念珠藻目.

      形態(tài)特征是基因表達(dá)的外化,是基因和環(huán)境共同作用的結(jié)果. 基于形態(tài)特征描述的藍(lán)藻分類系統(tǒng)不能反映各類群間進(jìn)化關(guān)系,形態(tài)特征相似的物種可能進(jìn)化上起源不同,而形態(tài)特征差異大的物種可能起源相同[13]. 分子數(shù)據(jù)的應(yīng)用可以描摹出藍(lán)藻類群間進(jìn)化關(guān)系,分子系統(tǒng)發(fā)育分析是現(xiàn)代藍(lán)藻分類學(xué)修訂中最重要的方法之一. 基于分子特征修訂的藍(lán)藻分類系統(tǒng)可以克服基于形態(tài)特征的弊端,更能準(zhǔn)確地揭示藍(lán)藻物種多樣性組成.

      2000年后,以高測序通量為顯著優(yōu)勢的二代測序技術(shù)發(fā)展快速,高效的生物信息學(xué)處理方法和軟件相繼研發(fā),進(jìn)一步推進(jìn)了eDNA宏條形碼技術(shù)用于藍(lán)藻群落監(jiān)測的探索研究,以獲得藍(lán)藻群落組成、物種豐度及反映物種間進(jìn)化關(guān)系的注釋結(jié)果. 基于分子特征修訂的藍(lán)藻分類系統(tǒng)還未完善,處于持續(xù)修訂中,但eDNA宏條形碼為快速和大規(guī)模藍(lán)藻群落監(jiān)測提供了可能,有必要推進(jìn)eDNA宏條形碼在藍(lán)藻群落監(jiān)測中的應(yīng)用. eDNA宏條形碼在藍(lán)藻群落監(jiān)測中應(yīng)用處于初步探索階段,該研究從引物選擇、序列聚類、注釋方法和絕對(duì)定量4個(gè)層面概括宏條形碼數(shù)據(jù)處理方法,并對(duì)eDNA宏條形碼技術(shù)在藍(lán)藻群落監(jiān)測中的應(yīng)用提出了參考建議,以推進(jìn)eDNA宏條形碼在藍(lán)藻群落監(jiān)測中的應(yīng)用.

      1 eDNA宏條形碼技術(shù)內(nèi)涵及在藍(lán)藻群落監(jiān)測中的應(yīng)用

      eDNA指從環(huán)境樣本中提取的DNA,eDNA宏條形碼指利用特定分子標(biāo)記對(duì)eDNA進(jìn)行擴(kuò)增,擴(kuò)增產(chǎn)物進(jìn)行高通量測序獲得DNA序列,通過序列檢索比對(duì)鑒定多個(gè)物種,廣義上宏條形碼不僅限于高通量測序. 簡單來說,eDNA宏條形碼是指利用特定分子標(biāo)記檢測eDNA來同時(shí)鑒定多個(gè)物種. eDNA宏條形碼一次產(chǎn)生數(shù)萬條以上目標(biāo)基因擴(kuò)增子序列,由于測序通量大,藍(lán)藻多樣性遠(yuǎn)高于鏡檢方法,不僅可以揭示藍(lán)藻群落組成,還有助于發(fā)現(xiàn)新物種[14]. 宏條形碼技術(shù)能實(shí)現(xiàn)大批量樣品的同時(shí)處理,試驗(yàn)操作流程可標(biāo)準(zhǔn)化和自動(dòng)化,分析結(jié)果不因操作人員或不同實(shí)驗(yàn)室而異,有利于高效、準(zhǔn)確地獲得大規(guī)模藍(lán)藻監(jiān)測數(shù)據(jù),為藍(lán)藻生物地理學(xué)分布特征研究提供可能[15].

      eDNA宏條形碼已開始應(yīng)用在藍(lán)藻群落監(jiān)測,涉及湖、庫、河流、極地融雪水體、以及湖庫沉積物[16-18]. 一些研究關(guān)注特殊生境藍(lán)藻群落,如沙漠結(jié)皮、湖底或岸邊藍(lán)藻席、超微藍(lán)藻等[13,19-20]. eDNA宏條形碼檢測藍(lán)藻多樣性顯著高于鏡檢法,且兩種方法檢測的物種數(shù)目呈顯著相關(guān),eDNA宏條形碼在藍(lán)藻群落監(jiān)測中有較高的優(yōu)勢[18]. 用擴(kuò)增子深度測序的方法對(duì)我國3個(gè)富營養(yǎng)狀態(tài)湖庫藍(lán)藻群落開展研究,發(fā)現(xiàn)微囊藻(Microcystis)是優(yōu)勢類群,但一定環(huán)境條件下,聚球藻(Synechococcus)在水面形成優(yōu)勢類群[16]. 聚球藻是超微藻類,在淡水和海洋常見,物種多樣性高,適應(yīng)多種環(huán)境條件[21],是潛在的藍(lán)藻水華形成物種. 常規(guī)監(jiān)測中超微藻類易被忽略,考慮到聚球藻具有發(fā)生藍(lán)藻水華的潛在態(tài)勢,超微藻類應(yīng)納入為一項(xiàng)常規(guī)監(jiān)測指標(biāo).

      eDNA宏條形碼用于南極洲雪融水體棲生藍(lán)藻席研究,發(fā)現(xiàn)藍(lán)藻多樣性較高,絕大多數(shù)藍(lán)藻席(cyanobacterial mats)存在微囊藻毒素和擬柱孢藻毒素[19]. 另外,eDNA宏條形碼可以實(shí)現(xiàn)長時(shí)間序列藍(lán)藻群落變化研究,揭示歷史藍(lán)藻群落組成和水生態(tài)健康狀況. Tse等[17]采用eDNA宏條形碼和古湖沼學(xué)技術(shù)探究加拿大一水庫藍(lán)藻群落百年尺度變化,發(fā)現(xiàn)近幾年長孢藻(Dolichospermum)相對(duì)豐度增加,與微囊藻毒素基因(mcyA)基因拷貝數(shù)變化趨勢相同.

      2 eDNA宏條形碼技術(shù)在藍(lán)藻群落監(jiān)測中的方法進(jìn)展和關(guān)鍵技術(shù)

      2.1 引物選擇

      eDNA宏條形碼技術(shù)需要構(gòu)建分子標(biāo)簽擴(kuò)增子數(shù)據(jù)庫,擴(kuò)增產(chǎn)物一般要求低于500個(gè)堿基對(duì). 擴(kuò)增引物遵循以下兩個(gè)原則:①選定基因序列易于PCR擴(kuò)增,且方便設(shè)計(jì)通用引物;②選定條形碼區(qū)域能凸顯種間差異,但種內(nèi)差異小[22].

      核糖體小亞基16S核糖核酸基因(16S small ribosomal subunit RNA gene, 16S rRNA gene)是藍(lán)藻多樣性研究應(yīng)用最廣的基因,既有高度保守性區(qū)域,又有多個(gè)高度變異性區(qū)域,可同時(shí)用于反映物種間的親緣關(guān)系和物種間的差異[23]. 近年來,GenBank數(shù)據(jù)庫藍(lán)藻16S rRNA 基因序列呈指數(shù)趨勢增加(見圖1),提升了藍(lán)藻分子鑒定的精確度和分子系統(tǒng)發(fā)育構(gòu)建的穩(wěn)健性,以及評(píng)估引物的特異性. 二代測序受測序讀長限制,只能選擇1~3個(gè)可變區(qū)作為擴(kuò)增片段,不同可變區(qū)突變點(diǎn)位分布不均,選擇的擴(kuò)增片段不同往往導(dǎo)致物種的分子鑒定結(jié)果出現(xiàn)偏差. 三代測序集合了Sanger測序的讀長優(yōu)勢和二代測序的高通量優(yōu)勢,可用較低的成本獲得16S rRNA 基因全長序列,避免了因選擇不同可變區(qū)域?yàn)閿U(kuò)增片段而影響藍(lán)藻物種分子鑒定結(jié)果的準(zhǔn)確性. 16S rRNA 基因全長測序用于對(duì)23個(gè)培養(yǎng)菌株形成的模擬群落研究,發(fā)現(xiàn)16S rRNA 基因全長序列鑒定準(zhǔn)確度高達(dá)99%,且重復(fù)性高;更全面的序列信息提高了物種鑒定的準(zhǔn)確性,有利于種水平物種鑒定,對(duì)系統(tǒng)發(fā)育、群落鑒定和代謝通路預(yù)測研究更有優(yōu)勢[24].

      16S rRNA基因在結(jié)構(gòu)和功能上較保守,物種間16S rRNA基因序列差異小,不適合在物種水平上進(jìn)行區(qū)分[25]. 16S-23S rRNA基因間隔區(qū)域(internal transcribed spacer, ITS)序列長、變異大,屬內(nèi)物種間差異顯著[26]. 基于ITS基因系統(tǒng)發(fā)育分析,擬圓孢藻屬(Sphaerospermopsis)3個(gè)物種各自形成單系類群,能彼此區(qū)分[27]. 相對(duì)核基因,功能基因進(jìn)化快、含有變異信息多,能反映物種適應(yīng)環(huán)境變化的生理生態(tài)特征,已被廣泛用于尋找物種間差異,比較常用的基因包括依賴于脫氧核糖核酸的核糖核酸聚合酶基因(DNA-dependent RNA polymerase gene,rpoC1)、藻藍(lán)蛋白及其轉(zhuǎn)錄間隔區(qū)(phycocyanin operon with intergenic spacer region,cpcBA-IGS)等[28]. 微囊藻是全球最普遍的水華藍(lán)藻物種,據(jù)AlgaeBase數(shù)據(jù)庫統(tǒng)計(jì)已有113個(gè)形態(tài)種,但形態(tài)物種間區(qū)分鮮少得到分子證據(jù)的支持. 基于cpcBA-IGS基因系統(tǒng)進(jìn)化分析,惠氏微囊藻(M.wesenbergii)形成一獨(dú)立進(jìn)化枝,可以和其他微囊藻物種區(qū)分開[29]. 功能基因有利于屬內(nèi)物種間區(qū)分,應(yīng)繼續(xù)探究其他功能基因在形態(tài)物種間區(qū)分的分子證據(jù). 筆者基于GenBank數(shù)據(jù)庫統(tǒng)計(jì),認(rèn)為目前ITS間隔區(qū)及功能基因序列數(shù)目顯著低于16S rRNA基因序列數(shù)目,且不同功能基因序列數(shù)目各異,不利于環(huán)境樣品浮游植物物種精準(zhǔn)鑒定(見圖1).

      注: 折線上數(shù)字代表去除未培養(yǎng)藻株序列數(shù)目. 1993年包括1993年以前數(shù)據(jù),數(shù)據(jù)收集截止至2020年4月2日.圖1 GenBank數(shù)據(jù)庫藍(lán)藻16S rRNA、ITS、rpoC1、藻藍(lán)蛋白基因序列(>200 堿基對(duì))數(shù)目隨時(shí)間變化量Fig.1 Number of gene sequences larger than 200 base pairs within GenBank for the cyanobacterial 16S rDNA, ITS, rpoC1 and phycocyanin loci over time

      藍(lán)藻水華通常由部分關(guān)鍵藍(lán)藻物種引發(fā),探究水華藍(lán)藻種群結(jié)構(gòu)、時(shí)空動(dòng)態(tài)變化、基因多樣性,解析藍(lán)藻水華演替機(jī)制,可為藍(lán)藻水華防控和水質(zhì)管理提供理論依據(jù). 微囊藻、長孢藻、擬柱孢藻(Cylindrospermopsis)是世界范圍內(nèi)常見的水華藍(lán)藻類群,目前針對(duì)3個(gè)類群的引物已研發(fā)出來并進(jìn)行基因型和水華種源的挖掘[30]. 通過構(gòu)建克隆文庫發(fā)現(xiàn)太湖長孢藻存在兩個(gè)主基因型,主基因型隨著季節(jié)變化進(jìn)行演替,表明不同水華階段由不同長孢藻生態(tài)型組成[31]. 基于高通量測序的eDNA宏條形碼檢測到微囊藻基因多樣性遠(yuǎn)高于克隆文庫,發(fā)現(xiàn)的微囊藻多樣性和富營養(yǎng)化水平呈負(fù)相關(guān)[32]. eDNA宏條形碼用于水華藍(lán)藻基因型研究鮮見報(bào)道.

      2.2 序列聚類

      eDNA宏條形碼數(shù)據(jù)處理的第一步是將擴(kuò)增子序列聚類為操作分類單元(operational taxonomic unit, OTU). 通過設(shè)定物種間分類閾值,將相似度超過該閾值的序列聚類為相同OTU. 然而分類閾值易使序列信息差異太小的物種被掩蓋,導(dǎo)致生物多樣性被低估. 近年來,序列差異低至單核苷酸變異的處理方法被提出,克服了物種丟失的弊端,可以檢出序列高度相似但屬于不同種屬的物種和生態(tài)型[33].

      通過距離度量方法計(jì)算不同序列之間的相似性,序列相似性高于分類閾值的聚為同一OTU. 采用OTUs聚類對(duì)eDNA宏條形碼數(shù)據(jù)進(jìn)行處理,不僅縮減工作量,提高分析效率,而且剔除了擴(kuò)增過程中的嵌合體以及測序過程中高通量測序儀器引入的錯(cuò)誤序列[34],提高了分析的準(zhǔn)確性. Qiime分析流程提供的OTU聚類方法有3種,包括denovo、closed-reference、open-reference聚類.

      無參OTUs聚類(denovoOTUs clustering). eDNA宏條形碼序列通過距離度量計(jì)算序列之間的相似性,每一序列都需與其余序列比對(duì),比較序列間距離相似度和設(shè)定的分類閾值,將上萬條序列聚類成OTUs[35]. 數(shù)據(jù)通量越高,錯(cuò)誤測序序列和單堿基變異的序列(unique sequence)增加,分層的無參聚類方法計(jì)算代價(jià)和時(shí)間以幾何倍數(shù)增長;序列比對(duì)不能同時(shí)進(jìn)行,比對(duì)數(shù)據(jù)量大、耗時(shí),適用于小規(guī)模數(shù)據(jù)集分析[36]. 無參聚類根據(jù)分類閾值聚類OTUs,可以消除一些錯(cuò)誤序列. 對(duì)原核生物16S rRNA 基因的eDNA宏條形碼研究中,OTUs聚類的分類閾值通常設(shè)置為97%[37],后續(xù)處理中OTUs被當(dāng)成物種,用來評(píng)價(jià)物種多樣性. 然而,該分類閾值是人為設(shè)定的,序列相似度高于該閾值的不同物種可能被掩蓋,不能準(zhǔn)確體現(xiàn)物種間的進(jìn)化關(guān)系,OTUs的生物學(xué)意義有待校驗(yàn). 不同的數(shù)據(jù)集OTUs難以合并分析,不利于不同研究的比較分析.

      有參OTUs聚類(closed-reference OTUs clustering). 與無參聚類不同,有參聚類需要參考數(shù)據(jù)庫,通過設(shè)定分類閾值,將輸入序列和參考序列距離相似度在閾值范圍內(nèi)的擴(kuò)增序列歸為相同OTU[38]. 參考數(shù)據(jù)庫挑選高質(zhì)量的基因全長序列,參考序列間相似度低于97%,每一參考序列代表不同物種[36]. 有參聚類會(huì)出現(xiàn)輸入序列和多個(gè)參考序列相似度在分類閾值范圍內(nèi),導(dǎo)致序列注釋不明確[39]. 有參聚類會(huì)設(shè)定聚類中心,序列比對(duì)可同時(shí)進(jìn)行,數(shù)據(jù)處理高效,適用于大數(shù)據(jù)集分析[40]. 有參聚類產(chǎn)生的OTUs具有生物學(xué)意義,不同數(shù)據(jù)集采用相同的參考數(shù)據(jù)庫,可以進(jìn)行不同研究的比較分析. 有參聚類不能鑒別新物種,如果輸入序列和參考數(shù)據(jù)庫所有序列相似度均低于分類閾值,該序列被舍棄,丟棄了參考數(shù)據(jù)庫以外的新物種. 隨著參考數(shù)據(jù)庫不斷完善,這一缺點(diǎn)會(huì)逐漸弱化.

      注: 無參OTUs聚類方法限于自身數(shù)據(jù)集內(nèi),有參OTUs聚類方法不能得到數(shù)據(jù)集外的生物學(xué)變異,擴(kuò)增子序列變異方法能得到所有的數(shù)據(jù)和生物學(xué)變異[43]. 圖2 基于研究數(shù)據(jù)集的3種序列聚類方法有效性程度Fig.2 The extent of the validity of de novo OTUs, closed-reference OTUs and ASVs methods determined from the study dataset

      開放式有參OTUs聚類(open-reference OTUs clustering). 開放式有參聚類融合了無參聚類和有參聚類的優(yōu)勢,輸入序列先通過有參聚類方法聚類成OTUs,未匹配序列再通過無參聚類生成OTUs,產(chǎn)生的OTUs具有生物學(xué)意義,也保留了數(shù)據(jù)庫以外的新物種[41]. 因無參聚類方法存在,不能避免耗時(shí)長的弊端,不利于大數(shù)據(jù)集處理. 二次抽樣開放式有參聚類(subsampled open-reference OTU clustering)是開放式有參聚類方法的優(yōu)化版本,通過隨機(jī)抽取與數(shù)據(jù)庫參考序列未匹配的擴(kuò)增序列,增加為參考數(shù)據(jù)庫序列,序列聚類可并行運(yùn)行,從而有效地縮短聚類時(shí)間,適用于大數(shù)據(jù)集分析[42].

      擴(kuò)增子序列變異(amplicon sequence variants, ASVs)在引入錯(cuò)誤序列之前得到有生物學(xué)意義的序列,基于熵值在單核苷酸的精度上區(qū)分序列之間的差異,可以用于區(qū)分生態(tài)型[43]. ASVs的核心思想是具有生物學(xué)意義的序列可以和錯(cuò)誤序列區(qū)分,且數(shù)目遠(yuǎn)大于錯(cuò)誤序列數(shù). 錯(cuò)誤序列在有效控制下,ASVs的準(zhǔn)確度會(huì)增加. ASVs代表了具有生物學(xué)意義的序列,因此不受數(shù)據(jù)集的限制,不同的數(shù)據(jù)集之間可以進(jìn)行比較分析. ASVs數(shù)據(jù)分析可重復(fù),能更準(zhǔn)確、更全面地評(píng)估eDNA宏條形碼數(shù)據(jù)結(jié)果. 若物種基因組的基因片段有多個(gè)拷貝,會(huì)得到多個(gè)ASVs,導(dǎo)致該物種區(qū)分不明確. 目前,ASVs分析有以下幾種方法,包括DADA2[44]、Unoise2[45]、Deblur[46]、Oligotyping[33]、Minimum Entropy Decomposition[47]、Sub-OTU resolution method[48]. 這些方法不需要參考數(shù)據(jù)庫,經(jīng)過質(zhì)量控制的序列降噪去除擴(kuò)增與測序過程中的錯(cuò)誤序列,得到具有生物學(xué)意義的序列(見圖2).

      基于Sub-OTU resolution method分析微生物群落,發(fā)現(xiàn)基于97%分類閾值聚類的OTU內(nèi)多達(dá)20個(gè)亞群落,這20個(gè)亞群落生態(tài)特征明顯不同,序列低至一個(gè)核苷酸差異(99.2%相似度)[48]. Oligotyping分析沼澤存在22個(gè)遠(yuǎn)洋桿菌屬(Pelagibacter)寡核苷型,其中2個(gè)優(yōu)勢寡核苷型序列差異低至一個(gè)核苷酸(99.57%相似度),一個(gè)寡核苷型在冷季占優(yōu)勢,另一個(gè)在暖季占優(yōu)勢,表現(xiàn)不同的季節(jié)演替[33]. 低至單核苷酸差異的序列可以表現(xiàn)不同的生態(tài)特征,若以分類閾值聚類OTUs可能忽略這些生態(tài)型.

      2.3 注釋方法

      序列比對(duì)的物種注釋方法是通過與數(shù)據(jù)庫參考序列距離相似度比較給予物種名稱,注釋結(jié)果的準(zhǔn)確度與參考數(shù)據(jù)庫的選擇息息相關(guān). 現(xiàn)有的16S rRNA 基因數(shù)據(jù)庫,如SILVA[49]、RDP[50]、Greengenes[51],由高質(zhì)量16S rRNA 基因全長序列組成,數(shù)據(jù)庫大多數(shù)序列由環(huán)境樣品擴(kuò)增而來,序列注釋的物種名稱多是基于預(yù)測獲得,許多序列未注釋物種名稱[52]. 由于參考數(shù)據(jù)庫的完善性,eDNA宏條形碼序列比對(duì)注釋結(jié)果存在一定比例未注釋的序列[19-20]. 另外,大量藍(lán)藻純培養(yǎng)物基于形態(tài)特征的鑒定結(jié)果缺陷,擴(kuò)增的基因序列提交至數(shù)據(jù)庫[9],若序列未核查和修訂,會(huì)導(dǎo)致eDNA宏條形碼序列錯(cuò)誤的注釋結(jié)果.

      基于系統(tǒng)進(jìn)化位置(phylogenetic placement method)注釋的方法可以對(duì)參考序列進(jìn)行修正,提升輸入序列注釋的準(zhǔn)確性,并且反映了輸入序列之間的進(jìn)化關(guān)系[53]. 分子數(shù)據(jù)是現(xiàn)在藍(lán)藻分類學(xué)修訂最重要的指標(biāo)之一,藍(lán)藻屬的修訂和新屬的提出需滿足進(jìn)化分枝是單系類群[9-10]. 由于分枝未延伸到屬以下的分類單元,沒有界定種水平需滿足單系類群. 系統(tǒng)進(jìn)化種(phylogenetic species concept)是系統(tǒng)進(jìn)化關(guān)系能可靠推斷出的最小分類單元. 從譜系學(xué)的角度來看,系統(tǒng)進(jìn)化種規(guī)定物種產(chǎn)生于進(jìn)化關(guān)系間的轉(zhuǎn)變,可以在系統(tǒng)進(jìn)化關(guān)系上將系譜關(guān)系連接起來[54]. 分類學(xué)和系統(tǒng)發(fā)育分析的結(jié)果常常不一致,系統(tǒng)發(fā)育分析的結(jié)果和序列質(zhì)量、序列比對(duì)質(zhì)量以及方法和參數(shù)息息相關(guān).

      基于最大似然法的系統(tǒng)發(fā)育分析,是推斷未知序列分類學(xué)最可靠的方法,由于計(jì)算復(fù)雜性和缺乏系統(tǒng)進(jìn)化信號(hào),不適用于大數(shù)據(jù)分析[55]. 系統(tǒng)進(jìn)化位置的注釋方法,首先基于參考序列構(gòu)建系統(tǒng)發(fā)育樹,輸入序列通過序列比對(duì)添加到參考系統(tǒng)發(fā)育樹上,該方法可以對(duì)數(shù)以萬計(jì)的輸入序列快速又準(zhǔn)確的注釋,相關(guān)軟件有EPA (evolutionary placement algorithm)[56]和pplacer[55]. EPA和pplacer分析速度和準(zhǔn)確度相當(dāng),pplacer的參考系統(tǒng)進(jìn)化樹和進(jìn)化枝是固定的;而EPA優(yōu)化了參考系統(tǒng)進(jìn)化樹的進(jìn)化枝長度以及輸入序列在進(jìn)化枝的位置,每一個(gè)輸入序列的注釋推導(dǎo)是基于略有差異的參考系統(tǒng)進(jìn)化樹.

      2.4 絕對(duì)定量

      eDNA宏條形碼分析往往僅考慮物種的相對(duì)豐度,然而相對(duì)豐度不能反映樣本中真實(shí)的絕對(duì)豐度. 相對(duì)豐度相同的樣本絕對(duì)豐度可能差別很大,相對(duì)豐度差別很大的樣本絕對(duì)豐度可能相同,因此相對(duì)豐度可能導(dǎo)致錯(cuò)誤的預(yù)估結(jié)果,掩蓋了生理學(xué)和生態(tài)學(xué)潛在的有價(jià)值的信息[57-58]. 相對(duì)豐度不能體現(xiàn)物種在不同樣本中的絕對(duì)含量的變化,不利于不同樣本間的比較分析. 定量PCR常用于獲得樣本微生物總豐度,但分析結(jié)果因DNA提取和擴(kuò)增效率的不同而出現(xiàn)偏差[59-60]. 以細(xì)菌基因組或人工合成的嵌合體DNA作為內(nèi)參的內(nèi)標(biāo)法[58,61],以及利用細(xì)胞生物量和拷貝數(shù)間關(guān)系的細(xì)胞體積校正系數(shù)法[62]等絕對(duì)定量方法,為跨樣本間物種豐度的比較分析提供了可能.

      內(nèi)標(biāo)法是在樣本微生物基因組提取之前,將內(nèi)標(biāo)DNA添加到樣本中,與樣本微生物共提取基因組并進(jìn)行擴(kuò)增,根據(jù)內(nèi)標(biāo)DNA豐度推算樣本微生物總豐度. 內(nèi)標(biāo)DNA可以來源于細(xì)菌[61,63],或者合成的嵌合DNA[58]. 內(nèi)標(biāo)DNA的加入量應(yīng)根據(jù)樣本DNA總量來決定,在0.1%~1.0%之間均可,加入量既要保證有足夠的內(nèi)標(biāo)序列來分析,也要避免加入太多造成對(duì)原始微生物群落的檢測帶來影響[61]. 細(xì)菌應(yīng)選取不存在于樣本群落中且與樣本中任何普遍存在的物種相似度都不高,避免對(duì)樣本中微生物絕對(duì)定量分析的影響. 合成的嵌合DNA可以彌補(bǔ)這一缺陷,嵌合DNA設(shè)計(jì)包含以下3個(gè)關(guān)鍵要素:①目標(biāo)研究類群基因的引物結(jié)合位點(diǎn);②與擴(kuò)增產(chǎn)物相同長度和GC含量的優(yōu)化合成填充序列;③合成嵌合DNA的來源易于獲得. 樣本中可同時(shí)加入針對(duì)多個(gè)類群(細(xì)菌、真菌、真核生物)的嵌合DNA,能一次實(shí)現(xiàn)多個(gè)類群的絕對(duì)定量,可以在生物域水平揭示菌群結(jié)構(gòu)的變化〔見圖3(a)〕.

      內(nèi)標(biāo)法只能對(duì)樣本微生物總基因拷貝數(shù)進(jìn)行絕對(duì)定量,不能直接獲得微生物絕對(duì)豐度. 每種微生物細(xì)胞含有一到多個(gè)16S rRNA基因拷貝數(shù),擴(kuò)增后測序會(huì)放大這種基數(shù)效應(yīng),造成物種的序列數(shù)產(chǎn)生偏差. 雖然rrnDB在線數(shù)據(jù)庫可以基于物種全基因組對(duì)基因拷貝數(shù)進(jìn)行評(píng)估和矯正來獲取eDNA宏條形碼數(shù)據(jù)每個(gè)物種絕對(duì)豐度[64],但現(xiàn)僅有400個(gè)藍(lán)藻藻株基因組,且大多數(shù)藻株來自于海洋和法國巴斯德研究所保存的淡水藍(lán)藻株,只能覆蓋極少數(shù)藍(lán)藻物種[65]. 因此,基于rrnDB數(shù)據(jù)庫只能對(duì)部分藍(lán)藻物種基因拷貝數(shù)進(jìn)行矯正,且校正結(jié)果因不同研究區(qū)域而有所偏差.

      圖3 eDNA宏條形碼絕對(duì)定量方法[61-62]Fig.3 Methods of absolute quantification of eDNA metabarcoding[61-62]

      細(xì)胞體積校正系數(shù)法(correction factor, CF)是通過物種細(xì)胞體積和細(xì)胞含有的基因拷貝數(shù)目之間建立聯(lián)系得到校正系數(shù),實(shí)現(xiàn)eDNA宏條形碼物種豐度的絕對(duì)定量. 該方法已對(duì)環(huán)境魚類、兩棲動(dòng)物[66]、寡毛綱[67]、細(xì)菌[68]、古菌[68]以及硅藻[62]進(jìn)行評(píng)估和定量,而關(guān)于藍(lán)藻類群的研究還鮮見報(bào)道.

      Vasselon等[62]發(fā)現(xiàn)硅藻8個(gè)物種細(xì)胞體積、長度、寬度和rbcL拷貝數(shù)顯著相關(guān). 基于8個(gè)物種混合類群評(píng)估,eDNA宏條形碼數(shù)據(jù)經(jīng)過CF校正和顯微鏡鏡檢得到物種絕對(duì)豐度結(jié)果一致,而未經(jīng)CF校正的豐度和鏡檢數(shù)據(jù)存在很大差異〔見圖3(b)〕. 基于環(huán)境硅藻類群評(píng)估,經(jīng)過和未經(jīng)CF校正的eDNA宏條形碼數(shù)據(jù),優(yōu)勢類群發(fā)生明顯變化,表明eDNA宏條形碼數(shù)據(jù)未經(jīng)過CF校正直接影響硅藻群落結(jié)構(gòu)變化,如大體積物種豐度被高估,而小體積物種豐度被低估,這一變化導(dǎo)致了生態(tài)學(xué)意義的差異[62]. 經(jīng)過CF校正的環(huán)境樣本硅藻和寡毛類絕對(duì)豐度,由其推導(dǎo)的水質(zhì)評(píng)價(jià)結(jié)果和鏡檢結(jié)果是可比的,可以替代形態(tài)監(jiān)測方法進(jìn)行水體生態(tài)評(píng)價(jià)[62,67].

      CF假定細(xì)胞基因拷貝數(shù)和細(xì)胞體積是穩(wěn)定的,但它們會(huì)因生理狀態(tài)的不同而發(fā)生變化,如不同環(huán)境和生活周期等[69]. 雖然細(xì)胞體積因環(huán)境條件而改變,但Mann[70]發(fā)現(xiàn)環(huán)境水體硅藻細(xì)胞大小分布是呈正態(tài)分布的,大、小個(gè)體數(shù)目均衡克服了這一缺陷. 未來研究需考慮細(xì)胞基因拷貝數(shù)和細(xì)胞體積的變化對(duì)CF的影響;另外,還需評(píng)估更多物種細(xì)胞體積和基因拷貝數(shù)之間聯(lián)系,以獲得更準(zhǔn)確的CF值.

      3 結(jié)論與展望

      eDNA宏條形碼因通量高、易發(fā)現(xiàn)新物種,相比形態(tài)方法,可以更準(zhǔn)確地揭示微生物群落結(jié)構(gòu)和組成. eDNA宏條形碼已經(jīng)應(yīng)用于探究各種生境藍(lán)藻群落組成,檢測物種多樣性遠(yuǎn)高于顯微鏡檢法,群落組成可以反映不同季節(jié)和不同富營養(yǎng)化程度水體之間差異,研究發(fā)現(xiàn)聚球藻等超微藻類可能是潛在的水華發(fā)生類群,eDNA宏條形碼在藍(lán)藻群落監(jiān)測和水生態(tài)健康評(píng)價(jià)中表現(xiàn)出極大的優(yōu)勢性. 但以往研究在eDNA宏條形碼數(shù)據(jù)處理過程中未考慮生態(tài)型且注釋結(jié)果未反映物種間的進(jìn)化關(guān)系,導(dǎo)致潛在的生理學(xué)和生態(tài)學(xué)信息被掩蓋,不利于對(duì)水體生態(tài)健康進(jìn)行科學(xué)評(píng)價(jià)和管控. 因此,筆者從以下幾個(gè)方面對(duì)eDNA宏條形碼技術(shù)在藍(lán)藻群落監(jiān)測的數(shù)據(jù)處理方法優(yōu)化提出了建設(shè)性意見,以準(zhǔn)確地揭示藍(lán)藻群落結(jié)構(gòu)和組成.

      a) 引物選擇. 針對(duì)藍(lán)藻,引物選擇應(yīng)能覆蓋廣譜的藍(lán)藻物種;針對(duì)水華藍(lán)藻類群以及產(chǎn)毒、產(chǎn)異味類群,選擇合適的基因并對(duì)設(shè)計(jì)引物進(jìn)行測試. 目前16S rRNA 基因是eDNA宏條形碼最常用的選擇,因該基因數(shù)據(jù)庫涵蓋藍(lán)藻物種范圍廣. 但16S rRNA基因在屬內(nèi)物種間區(qū)分效果不好; 再者,16S rRNA基因數(shù)據(jù)庫含有部分物種名稱注釋錯(cuò)誤的序列,導(dǎo)致eDNA宏條形碼序列注釋錯(cuò)誤. 應(yīng)對(duì)數(shù)據(jù)庫16S rRNA基因序列進(jìn)行修正,追溯到原始發(fā)表文章進(jìn)行基于形態(tài)特征鑒定的核驗(yàn),為eDNA宏條形碼序列準(zhǔn)確的注釋提供高質(zhì)量源頭序列. ITS基因以及功能基因變異大、含有更多序列變異信息,在藍(lán)藻屬內(nèi)物種間具有較好的區(qū)分,但基因數(shù)據(jù)庫體量小,未來研究應(yīng)擴(kuò)充數(shù)據(jù)庫ITS基因以及功能基因序列,為eDNA宏條形碼在藍(lán)藻物種水平注釋提供可能.

      b) 單核苷酸變異序列具有生物學(xué)意義. OTUs聚類通過設(shè)定物種間分類閾值且序列相似度高于該閾值的序列聚類為相同OTU,然而序列信息差異過低的物種和生態(tài)型可能被忽視,導(dǎo)致生物多樣性被低估. ASVs可以在單核苷酸的精度上區(qū)分序列,用于區(qū)分生態(tài)型,ASVs代表了具有生物學(xué)意義的序列,實(shí)現(xiàn)了跨數(shù)據(jù)集間的比較分析.

      c) 基于系統(tǒng)進(jìn)化位置的注釋方法反映物種間的進(jìn)化關(guān)系. 系統(tǒng)進(jìn)化位置方法不僅可以對(duì)參考數(shù)據(jù)庫序列進(jìn)行修正,提升輸入序列注釋的準(zhǔn)確性,另外也反映了序列間進(jìn)化關(guān)系. 系統(tǒng)進(jìn)化位置方法能同時(shí)對(duì)數(shù)以萬計(jì)的輸入序列快速又準(zhǔn)確的注釋,注釋準(zhǔn)確度和分辨率隨著數(shù)據(jù)庫物種多樣性增加和藍(lán)藻分類學(xué)系統(tǒng)的持續(xù)修訂及完善而提升.

      d) 絕對(duì)定量. 相對(duì)豐度不能反映樣本中真實(shí)的絕對(duì)豐度,相對(duì)豐度和絕對(duì)豐度可能存在巨大反差,因此基于樣本相對(duì)豐度分析可能導(dǎo)致錯(cuò)誤的預(yù)估結(jié)果,掩蓋了生理學(xué)和生態(tài)學(xué)潛在的有價(jià)值的信息. 內(nèi)標(biāo)DNA法和細(xì)胞體積校正系數(shù)法為eDNA宏條形碼用于藍(lán)藻豐度的絕對(duì)定量提供了可能,為物種豐度的跨樣本間分析提供了可能.

      猜你喜歡
      藍(lán)藻條形碼群落
      大學(xué)生牙齦炎齦上菌斑的微生物群落
      創(chuàng)意條形碼
      合成微生物群落在發(fā)酵食品中的應(yīng)用研究
      南美白對(duì)蝦養(yǎng)殖池塘藍(lán)藻水華處理舉措
      從條形碼到二維碼
      從條形碼到二維碼
      針對(duì)八月高溫藍(lán)藻爆發(fā)的有效處理方案
      條形碼大變身
      可怕的藍(lán)藻
      春季和夏季巢湖浮游生物群落組成及其動(dòng)態(tài)分析
      南充市| 澄城县| 大姚县| 济南市| 万全县| 金乡县| 延庆县| 平湖市| 巴东县| 共和县| 丰镇市| 东安县| 北辰区| 赣榆县| 井冈山市| 东丰县| 黄石市| 海南省| 瓮安县| 洛南县| 印江| 大兴区| 崇礼县| 宜良县| 华坪县| 永仁县| 乐清市| 白山市| 施甸县| 定结县| 绥阳县| 内江市| 沅陵县| 莱阳市| 江都市| 壶关县| 神木县| 南宁市| 偏关县| 班玛县| 内黄县|