章廣能
實(shí)現(xiàn)樣本分類需要提取不同狀態(tài)的樣本差異性特征,本文深入研究了不同樣本的16S rRNA基因序列,通過(guò)分析模擬數(shù)據(jù),驗(yàn)證群落結(jié)構(gòu)的可行性。保障樣本多樣性,可以提升樣本物種豐富的信息,同時(shí)可以降低樣本特征維度。多樣性特征還結(jié)合了群落獨(dú)立進(jìn)化信息和舞種豐度,是非常理想的樣本特征。
宏基因組學(xué)主要是研究環(huán)境樣本中國(guó)提取的微生物遺傳物質(zhì)。針對(duì)傳統(tǒng)的微生物研究,主要是分離培養(yǎng)和提純微生物,但是利用分離培養(yǎng)方法會(huì)破壞微生物的多樣性。而宏基因組分學(xué)突破了一直以來(lái)對(duì)于微生物的研究,宏基因組主要是通過(guò)研究物質(zhì),為拓展了相關(guān)課題研究的思路[1]。
在自然環(huán)境各處都存在微生物,此外在人體環(huán)境中也存在大量的微生物,利用傳統(tǒng)的分離培養(yǎng)技術(shù),沒有充分地認(rèn)識(shí)人類和微生物的關(guān)系。因此,在研究階段開始利用宏基因組學(xué)。宏基因組學(xué)首先是研究單一微生物的群落聚集,其次,系比較不同微生物群落,最后分析微生物之間的關(guān)系。選擇研究方法包括功能篩選和序列分析等,發(fā)展利用宏基因組學(xué),可以為各種難題提出針對(duì)性方法。例如選擇功能篩選,因?yàn)楹昊蚪M測(cè)序數(shù)據(jù)中包含微生物的基因序列,利用費(fèi)培養(yǎng)研究方法,有利于研究未知微生物。此外,在研究過(guò)程中利用宏基因組學(xué),可以獲得新的活性物質(zhì),例如在宏基因組樣本中發(fā)現(xiàn)阿霉素和四環(huán)素等天然產(chǎn)物。
在宏基因組學(xué)研究中利用序列分析方式,通過(guò)分析微生物基因序列的生物信息學(xué),一方面有利于研究環(huán)境微生物多樣性,工作人員在研究階段可以利用相關(guān)方法探索各種微生物群落。另一方面可以根據(jù)序列對(duì)比,明確微生物群落的結(jié)構(gòu)特征。通過(guò)分析不同的微生物樣本,明確不同微生物的基因序列,從而明確其中的差異性,對(duì)于未知微生物也可以起到預(yù)測(cè)作用[2]。
近些年,在各個(gè)行業(yè)發(fā)展研究階段都開始利用宏基因組的相關(guān)知識(shí)和方法,可以拓展整體工作思路。例如在醫(yī)學(xué)領(lǐng)域當(dāng)中,可以利用宏基因組分類分析方法研究口腔微生物,根據(jù)這一微生物的特征和習(xí)性等,確定相關(guān)疾病的治療方法。例如,醫(yī)學(xué)人員通過(guò)在倡導(dǎo)菌群研究中利用紅基因組學(xué)分析樣本的微生物序列,確定兒童孤獨(dú)者患者通常都具有紊亂的長(zhǎng)大菌群結(jié)構(gòu)。在生態(tài)學(xué)中,利用宏基因組分類分析方法分析微生物多樣性和降解基因豐度,利用研究結(jié)果,可以在水污染治理中利用活性污泥。
當(dāng)前,在各個(gè)領(lǐng)域的微生物研究中都開始利用宏基因組分類分析方法,同時(shí)這一方法還具有良好的應(yīng)用前景,在實(shí)際工作中不斷出現(xiàn)海量微生物基因序列樣本,因此更多的研究者注重分析宏基因組分類分析方法。利用宏基因組分類分析方法,可以對(duì)于醫(yī)學(xué)診斷和人體生理狀態(tài)檢定等方面提出新型思路。當(dāng)前我國(guó)主要是在微生物全基因組序列中利用宏基因組分類分析方法,但是很少研究基于微生物保守序列的樣本分類方法[3]。
根據(jù)16 rRNA測(cè)序數(shù)據(jù),明確宏基因組分類的分析流程,并且結(jié)合模擬數(shù)據(jù)評(píng)估分析六層的正確率。結(jié)合宏基因組的測(cè)序計(jì)劃,得出以下的流程步驟:
(1)計(jì)算樣本{S1,S2,…,Sn}的OTU表{T1,T2,…,Tn};
(2)根據(jù)樣本的OTU表{T1,T2,…,Tn},選擇樣本特征為豐度,主要分為α多樣性或者β多樣性;
(3)工作人員可以利用隨機(jī)森林分類算法,在計(jì)算階段秩序?qū)颖咎厥鈹?shù)據(jù)輸入進(jìn)入,即可實(shí)現(xiàn)樣本分類。
在宏基因組分類過(guò)程中,首先需要明確不同樣本的特征,隨后再利用隨機(jī)森林的分類算法,針對(duì)不同宏基因組樣本狀態(tài)實(shí)施分類,因此,獲取各種時(shí)間和各種空間的樣本[4]。
2.2.1 物種相對(duì)豐度
微生物菌群的相對(duì)豐度對(duì)于環(huán)境和素質(zhì)產(chǎn)生的影響具有較大的差異性。例如,通過(guò)分析腸道菌群的擬桿菌門,發(fā)現(xiàn)肥胖癥患者的相對(duì)豐度通常較低,因此宏基因組的樣板特征可以選擇群落的相對(duì)豐度,在樣本分類中可以利用群落相對(duì)豐度。
通過(guò)16 rRNA測(cè)序數(shù)據(jù),可以計(jì)算出菌群的相對(duì)豐度值,在實(shí)際計(jì)算階段:工作人員首先需要分別統(tǒng)計(jì)樣本微生物,根據(jù)計(jì)算結(jié)果制定OTU分類學(xué)綜合信息表。數(shù)據(jù)和數(shù)據(jù)庫(kù)經(jīng)過(guò)預(yù)處理之后,再經(jīng)過(guò)篩選和過(guò)濾之后,將不符合要求的序列去掉。經(jīng)過(guò)聚類獲取序列相似性信息。分別統(tǒng)計(jì)樣本中OTU中reads數(shù)目,因此確定每個(gè)樣本的OTU豐度。其次,完成分類分析,工作人員可以對(duì)照silva庫(kù)中參考序列鑒定樣本舞種。最后,需要結(jié)合物種分類學(xué)信息注釋OTUtable,因此建立OTU分類學(xué)綜合信息表,同時(shí)利用統(tǒng)計(jì)學(xué)分析方法計(jì)算物種相對(duì)豐度。樣本特征選取群落物種相對(duì)豐度,在樣本類別判斷階段,需要選取群落的微生物數(shù)量差異。利用這一特征,可以對(duì)于各行業(yè)的問(wèn)題落實(shí)樣本分類分析。
2.2.2 α多樣性
利用α多樣性可以準(zhǔn)確地描述物種多樣性。例如改變?nèi)梭w微生物群落物種多樣性,人體健康將會(huì)受到影響,對(duì)比較胖的人群,較瘦人群具有較高的腸道微生物物種多樣性。如果某人胃內(nèi)油門螺旋桿菌處于陽(yáng)性,那么油門螺旋桿菌將會(huì)破壞胃內(nèi)微生物群落多樣性,這類人很容易感染潰瘍等疾病。
在實(shí)際工作中加入其他的樣本特征信息,加入特征可以是時(shí)間、地點(diǎn)以及年齡等,例如研究人體皮膚表面的微生物群的過(guò)程中,為了保障研究結(jié)果的可靠性和代表性,研究人員需要提取身體各個(gè)部位的皮膚樣本,因?yàn)槿伺c人之間具有巨大的差異性,因此在分析階段可能會(huì)發(fā)生樣本分類錯(cuò)誤問(wèn)題,因此在α多樣性特中加入特征信息,可以使樣本分類的準(zhǔn)確性得到提高[5]。
2.2.3 β多樣性
在針對(duì)兩個(gè)群落物種開展研究的過(guò)程中可以利用β多樣性,同時(shí)可以將群落物種的變化顯示出來(lái)。在群落間差異分析階段可以利用很多傳統(tǒng)的度量方法,但是根據(jù)系統(tǒng)發(fā)育關(guān)系的β多樣性指數(shù),可以將反應(yīng)群落差異準(zhǔn)確地反映出來(lái)。
當(dāng)前在很多微生物分析過(guò)程中都開始利用群落β多樣性,這一理念的基礎(chǔ)是系統(tǒng)發(fā)育,通過(guò)分析不同群落之間的β多樣性,可以明確不同群落之間的相似性和差異性。例如,在哺乳動(dòng)物腸道菌群進(jìn)化階段,通過(guò)比較分析微生物群落,可以明確生物圈進(jìn)化情況。通過(guò)研究健康成人的微生物群落,因?yàn)殡S著時(shí)間和空間的變化,人體微生物群落也會(huì)發(fā)生變化,這些變化可以確定微生物對(duì)于人體疾病預(yù)防的作用,同時(shí)也可以明確人類治病原因。
綜上所述,α多樣性代表微生物群落結(jié)構(gòu)信息,其中包括群落物種個(gè)數(shù)和物種比例等信息,α多樣性和β多樣性以及群落微生物功能的基礎(chǔ)為物種豐度的基礎(chǔ)都是物種豐度,因此,物種豐度可以各種樣本特征。
微生物和人們生產(chǎn)和生活具有緊密的聯(lián)系,通過(guò)研究和應(yīng)用宏基因組分類分析方法,有利于研究整體環(huán)境微生物基因,幫助人員更好地揭示微生物世界。但是因?yàn)槲⑸锉容^復(fù)雜,僅此在今后工作中,需要根據(jù)實(shí)際工作情況進(jìn)一步改進(jìn)宏基因組分類分析方法,提高樣本分裂的準(zhǔn)確率。