• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      健康青年人腸道菌群的分布特征研究

      2021-12-30 03:13:14田學(xué)梅王慧梁靜宣王耘北京中醫(yī)藥大學(xué)中藥信息工程研究中心北京102488
      中南藥學(xué) 2021年11期
      關(guān)鍵詞:菌群聚類人群

      田學(xué)梅,王慧,梁靜宣,王耘(北京中醫(yī)藥大學(xué)中藥信息工程研究中心,北京 102488)

      人類腸道內(nèi)存在大量的微生物,在參與維持正常生理過程的同時(shí),與疾病的發(fā)生發(fā)展也息息相關(guān)[1]。腸道微生物不僅可以調(diào)控肥胖[2],干預(yù)多糖和纖維素在體內(nèi)消化吸收[3],還影響胃腸道疾病如炎癥性腸病、心血管疾病如高血壓、代謝類疾病如肥胖、自身免疫性疾病等[4-6]。微生物組菌群結(jié)構(gòu)的變化與人類健康和疾病的發(fā)生發(fā)展密切相關(guān),利用腸道菌群的分布差異進(jìn)行個(gè)體疾病、健康等的相關(guān)研究已逐漸增多。例如2型糖尿病患者與健康個(gè)體相比,其腸道內(nèi)雙歧桿菌數(shù)量減少[7],膽汁淤積性肝病患者與健康對(duì)照者相比,腸道菌群存在特征性改變,韋榮氏球菌屬(Veillonella)相對(duì)高豐度表達(dá)與膽汁淤積性肝病強(qiáng)相關(guān)[8]等。腸道菌群的狀態(tài)會(huì)以各種方式反饋給宿主[9],健康個(gè)體在不同生活方式、藥物、飲食、疾病狀態(tài)、地域以及年齡階段,其腸道菌群的分布存在很大差異[10-11]。通過研究不同健康人的腸道菌群的分布特征,調(diào)理腸道菌群的狀態(tài)以改善健康狀況。因此是否可以利用不同健康人群間腸道菌群的分布差異對(duì)健康人群進(jìn)行分類,以此來評(píng)價(jià)個(gè)體健康狀態(tài)并對(duì)個(gè)體健康進(jìn)行有效精準(zhǔn)的健康管理呢?基于以上思考,本研究利用16S rRNA技術(shù)[12]獲得的腸道菌群種層面相對(duì)豐度數(shù)據(jù)并轉(zhuǎn)換為定性數(shù)據(jù),聚類分析將健康青年人群進(jìn)行分類,根據(jù)不同分類的健康青年人群間的差異菌通過數(shù)據(jù)挖掘方法[13-14],建立以不同健康青年人分類間腸道菌群的分布差異為指標(biāo)的健康青年人群分類模型,并探討不同分類的健康青年人腸道菌群分布特征。以期為青年個(gè)性化的健康管理研究奠定基礎(chǔ)。

      1 數(shù)據(jù)獲得

      1.1 樣本來源

      選擇就讀于北京中醫(yī)藥大學(xué)大一、大二的本科生4000人,隨機(jī)抽樣后共納入研究對(duì)象114人,男女性別比例1∶1,年齡18~22歲。研究經(jīng)學(xué)校倫理委員會(huì)批準(zhǔn)通過,所有研究對(duì)象均了解并簽署項(xiàng)目知情同意書。

      1.2 納入及排除標(biāo)準(zhǔn)

      納入標(biāo)準(zhǔn):健康大學(xué)生且正常飲食無明顯飲食偏頗情況。排除標(biāo)準(zhǔn):① 患有潰瘍性結(jié)腸炎、克羅恩病等炎癥性腸病及慢性便秘、慢性腹瀉等其他腸道疾病患者;② 使用抗菌藥物、進(jìn)行闌尾手術(shù)等的患者;③ 合并急性冠脈綜合征、急性腦血管意外等危急重癥者;④ 有嚴(yán)重情緒或精神異常而無法配合者;⑤ 重大疾病患者。

      1.3 腸道菌群數(shù)據(jù)的收集與整理

      受試者均無嚴(yán)重疾病,入組后前一個(gè)月避免抗菌藥物、胃腸道藥物等使用并正常飲食,取受試者的早餐前糞樣,通過16S rRNA 測序[15]技術(shù)進(jìn)行腸道微生物菌種的組成測定,獲得研究樣本腸道菌群種層面相對(duì)豐度數(shù)據(jù)。將腸道菌群種層面相對(duì)豐度數(shù)據(jù)轉(zhuǎn)變?yōu)槎ㄐ詳?shù)據(jù)(相對(duì)豐度>0即定為含有這種菌,用1表示;沒有相對(duì)豐度即定為不含這種菌,用0表示)。

      2 方法及原理

      2.1 腸道菌群定性數(shù)據(jù)的聚類分析方法

      聚類分析(clustering analysis)[13]是數(shù)據(jù)挖掘中的一個(gè)重要部分,屬于無監(jiān)督的學(xué)習(xí)方法。根據(jù)研究目的,本文所選用的是凝聚聚類算法中的離差平方和法[16],采用歐氏距離作為聚類分析的指標(biāo),對(duì)“1.3”項(xiàng)下腸道菌群種層面定性數(shù)據(jù)進(jìn)行聚類分析,聚類分析工作基于軟件Orange 2.7實(shí)現(xiàn)。

      離差平方和方法:如果有兩個(gè)樣本類G1、G2,n1、n2分別為G1、G2樣本個(gè)數(shù)

      若G1,G2內(nèi)部點(diǎn)與點(diǎn)距離很小,則它們能很好地各自聚為一類,并且這兩類又能充分分離(D12很大),這時(shí)D就很大。

      2.2 聚類分析結(jié)果差異菌的篩選

      基于“2.1”項(xiàng)下的結(jié)果發(fā)現(xiàn),114名樣本的腸道菌群種層面組成個(gè)體間有顯著差異。為了提高后續(xù)人群分類模型構(gòu)建時(shí)建模數(shù)據(jù)的質(zhì)量,加快挖掘速度并且使挖掘出的規(guī)則更準(zhǔn)確易懂,本研究分析了受試樣本在不同分類時(shí)組間的差異菌,并對(duì)其進(jìn)行初步篩選得到人群分類的屬性指標(biāo)。

      利用腸道菌群種層面相對(duì)豐度數(shù)據(jù)對(duì)不同組間進(jìn)行差異菌分析。當(dāng)聚類數(shù)為2,通過Welch’st-test統(tǒng)計(jì)分析方法進(jìn)行兩組差異菌的分析(P<0.05);當(dāng)聚類數(shù)為3~5時(shí),通過方差分析進(jìn)行多組間差異菌的分析(P<0.05)。不同分類間差異菌的篩選通過STAMP軟件進(jìn)行[17]。

      2.3 基于差異菌的數(shù)據(jù)建立人群分類模型方法

      首先將聚類后每類樣本差異菌的定性數(shù)據(jù)及屬性指標(biāo)分別作為模型輸入指標(biāo),再分別利用樸素貝葉斯(NB)算法[18]、K最近鄰(IBK)算法[19]、決策樹(J48)算法[20]、隨機(jī)森林(RF)算法[21]進(jìn)行模型的構(gòu)建,并依據(jù)曲線下面積(AUC)選出優(yōu)的算法及分類,為后續(xù)模型的優(yōu)化奠定基礎(chǔ)。將各分類樣本集隨機(jī)劃分70%作為訓(xùn)練集,30%作為測試集。訓(xùn)練集用于構(gòu)建模型,同時(shí)運(yùn)用Cor(Correlation-based Attribute Evaluation)[22]屬性篩選算法進(jìn)行篩選,優(yōu)化訓(xùn)練模型;測試集用于驗(yàn)證模型,最終得到基于腸道菌群的人群分類模型,具體模型構(gòu)建思路如圖1所示。

      圖1 基于腸道菌群的人群分類模型構(gòu)建方法Fig 1 Construction of population classification models based on the intestinal flora

      本文中涉及分類算法和特征屬性選擇算法均在10折交叉的環(huán)境下運(yùn)行,交叉驗(yàn)證是數(shù)據(jù)建模中常用且有效的一種內(nèi)部驗(yàn)證方法,常用來測試模型或算法的準(zhǔn)確性[23-24]。所有操作均通過數(shù)據(jù)挖掘平臺(tái)軟件Weka 3.8實(shí)現(xiàn);運(yùn)行過程中所有參數(shù)均采用平臺(tái)默認(rèn)的參數(shù)設(shè)置。

      2.4 模型評(píng)價(jià)指標(biāo)

      在本文中使用ROC的AUC,為ROC曲線提供了量化值,可以通過比較AUC值的大小來評(píng)估分類模型的性能[25-27]。

      3 結(jié)果與討論

      3.1 腸道菌群在門、種水平的微生物含量組成分析

      在門水平上,研究對(duì)象的微生物含量組成如圖2所示:最終將所有的序列鑒定為22個(gè)門,其中擬桿菌門(Bacteroidetes)、硬壁菌門(Firmicutes)、變形菌門(Proteobacteria)、放線菌門(Actinobacteria)的含量較高,占測序序列總數(shù)的97%以上,其他菌門如梭桿菌門(Fusobacteria)、疣微菌門(Verrucomicrobia)、無壁菌門(Tenericutes)、TM7、黏膠球形菌門(Lentisphaerae)等的含量較低。

      圖2 門水平微生物含量組成Fig 2 Composition of microbial content at the phylum level

      個(gè)體腸道菌群的組成在種水平上具有很大的差異,研究中的種水平的腸道菌群組分構(gòu)成,最終將序列鑒定為257個(gè)種,相對(duì)豐度比例最高的前50個(gè)種構(gòu)成的組分柱狀圖見如圖3。

      圖3 受試者在種水平微生物相對(duì)豐度組成Fig 3 Relative abundance composition of subjects at the species level

      3.2 腸道菌群定性數(shù)據(jù)的聚類分析

      目前的聚類算法大多數(shù)需要預(yù)先給定聚類數(shù),再對(duì)樣本進(jìn)行聚類分析。確定最佳聚類數(shù)是聚類分析中的關(guān)鍵步驟。因此為了確定最佳的聚類數(shù),保證數(shù)據(jù)集的劃分和評(píng)判結(jié)果是有效正確的,本研究依據(jù)腸道菌群種層面定性數(shù)據(jù)將受試人群劃分為2~5類的結(jié)果,通過后續(xù)建立人群分類模型的結(jié)果選擇最終的聚類數(shù)。聚類結(jié)果見表1。

      表1 樣本分為兩至五類時(shí)聚類結(jié)果 Tab 1 Clustering of categories when divided into two to five categories

      3.3 聚類分析結(jié)果差異菌的篩選

      針對(duì)“3.2”項(xiàng)下不同分類人群差異菌的分析,以P<0.05為檢驗(yàn)水平,發(fā)現(xiàn)當(dāng)數(shù)據(jù)樣本分為兩類時(shí),組間差異菌有50個(gè);當(dāng)分為三類時(shí),組間差異菌有68個(gè);當(dāng)分為四類時(shí),組間差異菌有67個(gè);當(dāng)分為五類時(shí),組間差異菌有73個(gè),如表2。可以看出不同的人群其差異菌的類別與其分類程度成正相關(guān)。

      表2 聚類數(shù)為兩至五類時(shí)組間差異菌 Tab 2 Differences in bacteria between groups when divided into two to five categories

      3.4 人群分類最優(yōu)模型的選擇與評(píng)價(jià)

      為了進(jìn)一步說明可以依據(jù)差異性的腸道菌群對(duì)人群分類的可行性,基于前面試驗(yàn)結(jié)果將聚類后的每類樣本的差異菌的定性數(shù)據(jù)分別作為模型輸入指標(biāo),再分別利用NB、IBK、J48、RF四種算法進(jìn)行模型的構(gòu)建。并篩選出不同人群分類模型中AUC值最高的算法及分類,所建模型的應(yīng)用算法及構(gòu)成模型的腸道菌屬性集結(jié)果見表3。

      表3 聚類結(jié)果為兩至五類時(shí)人群分類模型 Tab 3 Crowd classification model when the clustering results are two to five types

      基于不同分類人群間差異菌所建各類模型的評(píng)價(jià)指標(biāo)如表4所示,ROC曲線圖見圖4。所建模型的訓(xùn)練集和測試集,各個(gè)指標(biāo)結(jié)果都趨近,這表明在應(yīng)用未知數(shù)據(jù)時(shí),所建模型不會(huì)發(fā)生故障。

      圖4 受試者工作特征曲線 Fig 4 Receiver operating characteristic curve

      表4 聚類結(jié)果為兩至五類時(shí)模型各項(xiàng)指標(biāo) Tab 4 Indicators of the model when the clustering results in two to five types

      通過綜合比較每種模型的ROC曲線圖、準(zhǔn)確性、SE、SP、BACC選擇最優(yōu)模型。最終,基于腸道菌群分為四類時(shí),所建模型為最優(yōu)。對(duì)于最優(yōu)模型的選取,與各模型性能相關(guān)的多項(xiàng)評(píng)價(jià)指標(biāo),及各模型的ROC曲線圖進(jìn)行了分析。最優(yōu)模型的性能是從訓(xùn)練集和測試集兩個(gè)角度進(jìn)行評(píng)價(jià)的。模型10折交叉驗(yàn)證測試的準(zhǔn)確性在82.50%~100%,平衡精度在0.672~1.000,受試者工作特征AUC在0.842~1.000。測試集的準(zhǔn)確性在85.29%~94.12%,平衡精度在0.808~0.904,受試者工作特征AUC在0.990~0.971。

      續(xù)表2

      續(xù)表3

      由以上結(jié)果最終可將受試者分為四類,通過各評(píng)價(jià)指標(biāo)的數(shù)據(jù)表明,本文建立的基于腸道菌群建立的受試人群分類模型有較高的可靠性,而且還說明了通過腸道菌群建立健康青年人群分類模型是可行的。對(duì)于每一類人群其優(yōu)勢菌群在一定程度上影響人體健康,同時(shí)宿主也會(huì)影響腸道菌群。① 第一類人群以Mitsuokai、Dolichum、Citroniae等為主要的優(yōu)勢菌群,高脂飲食會(huì)導(dǎo)致其豐度增加腹部內(nèi)臟脂肪區(qū)[28],腸道中短鏈脂肪酸的缺乏會(huì)影響宿主健康,常常與缺乏可發(fā)酵纖維有關(guān),因此這類人群應(yīng)多食用膳食纖維,不僅可以促進(jìn)有益菌代謝產(chǎn)生人體所需的短鏈脂肪酸,還可以降低這類人群的優(yōu)勢菌群豐度[29]。② 第二類人群主要以intestinihominis、eggerthii、onderdonkii、indistinctus等為主要優(yōu)勢菌群,其中intestinihominis過度擴(kuò)張是微生態(tài)失衡的標(biāo)志[30],其定植可降低血漿中具有抗炎作用的皮質(zhì)酮的水平,從而促進(jìn)腸道中的炎癥應(yīng)答[31];eggerthii可以合成短鏈脂肪酸,食用高脂低碳水使得eggerthii增多導(dǎo)致棕櫚酸和硬脂酸等增加;onderdonkii、indistinctus菌群失調(diào)與炎癥、癌癥以及心理健康具有很高的相關(guān)性[32]。③ 第三類人群主要以longicatena、lactaris、johnsonii、putredinis等為主要優(yōu)勢菌群,longicatena屬于Dorea屬,是潛在等有益菌[33],在帕金森患者中其豐度降低[34],經(jīng)常使用小麥、黑麥、大麥、燕麥會(huì)使其豐度會(huì)增加[35];此外lactaris具有降脂應(yīng)用效果[36];Johnsonii是腸道中的有益菌,能提高血液中的還原型谷胱甘肽水平,從而改善肝臟的線粒體形態(tài)和功能,減少肝臟脂質(zhì)、改善系統(tǒng)性的糖代謝[37];高鹽飲食通過改變腸道菌群的組成及代謝,減少Putredinis,從而提升皮質(zhì)酮水平以促進(jìn)高血壓,而Putredinis可通過其代謝產(chǎn)物花生四烯酸抑制皮質(zhì)酮的產(chǎn)生[38]。④ 第四類人群以lenta、symbiosum、cateniformis為主要優(yōu)勢菌群,lenta被認(rèn)為是潰瘍性結(jié)腸炎、肝臟和肛門膿腫以及全身性菌血癥的原因[39];高脂飲食會(huì)導(dǎo)致symbiosum豐度增加[28];經(jīng)常食用土豆抗性淀粉、玉米抗性淀粉,腸道中的有益益生菌Clostridioforme顯著增加,菌群產(chǎn)生丁酸能力更強(qiáng)[40]??傊?,不同的人群其優(yōu)勢菌群不僅影響人體腸道微環(huán)境,還會(huì)間接或直接影響人體的消化、免疫以及情緒等,針對(duì)不同人群優(yōu)勢菌群作出不同的飲食管理、生活方式改變將有益于我們對(duì)健康管理,為個(gè)體化食療、醫(yī)療提供新的方向。

      4 總結(jié)與展望

      本研究闡釋了基于腸道菌群分類的健康青年人群分類模型的構(gòu)建的方法及原理?;谀c道菌群種層面數(shù)據(jù),通過聚類分析獲得基于腸道菌群定性數(shù)據(jù)的健康青年人群分類,再依據(jù)分類的組間差異菌,運(yùn)用數(shù)據(jù)挖掘算法構(gòu)建了健康青年人群分類模型。構(gòu)建模型的準(zhǔn)確性、靈敏度、特異性、平衡精度、AUC值等幾個(gè)指標(biāo)驗(yàn)證了所建模型的可靠性。

      人體的腸道微生物與宿主是共同生長的,人體不同狀態(tài)呈現(xiàn)不同的菌群特征。曾有研究通過隨機(jī)森林算法,構(gòu)建了基于腸道菌群區(qū)分酒精性脂肪肝的模型[41]。這為本文通過數(shù)據(jù)挖掘的方法進(jìn)行基于腸道菌群分類探討健康青年人群分類的研究提供佐證,進(jìn)一步證明了以腸道菌群分布差異作為客觀指標(biāo)對(duì)健康青年人群進(jìn)行分類的可能性。不僅為處理微生物數(shù)據(jù)提供了一種新的策略,而且為未來深入研究腸道菌群與人體健康關(guān)系提供了參考。

      猜你喜歡
      菌群聚類人群
      “云雀”還是“貓頭鷹”可能取決于腸道菌群
      中老年保健(2022年2期)2022-08-24 03:20:50
      在逃犯
      “水土不服”和腸道菌群
      科學(xué)(2020年4期)2020-11-26 08:27:06
      糖尿病早預(yù)防、早控制
      我走進(jìn)人群
      百花洲(2018年1期)2018-02-07 16:34:52
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      財(cái)富焦慮人群
      基于改進(jìn)的遺傳算法的模糊聚類算法
      肉牛剩余采食量與瘤胃微生物菌群關(guān)系
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      双牌县| 墨玉县| 任丘市| 平山县| 小金县| 阳曲县| 双城市| 布尔津县| 通榆县| 通城县| 启东市| 马山县| 保康县| 儋州市| 克东县| 平定县| 永修县| 拜泉县| 元朗区| 襄城县| 淮南市| 陈巴尔虎旗| 阳曲县| 洪湖市| 河北区| 绥芬河市| 鹤峰县| 清河县| 余干县| 黄浦区| 五峰| 古丈县| 崇州市| 阳新县| 横峰县| 汉源县| 蚌埠市| 永登县| 祁连县| 贵溪市| 绥宁县|