• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      微生物二元網(wǎng)絡(luò)作用關(guān)系研究

      2015-07-28 12:40高紅艷
      現(xiàn)代電子技術(shù) 2015年11期
      關(guān)鍵詞:信息論生物信息學(xué)

      高紅艷

      摘 要: 基因測(cè)序技術(shù)的快速發(fā)展產(chǎn)生了大量海洋微生物數(shù)據(jù),使難培養(yǎng)的海洋微生物種群研究成為可能。很多學(xué)者在海洋微生物種群作用模式多樣性、組成多樣性及功能多樣性方面展開(kāi)了相應(yīng)研究,有助于大家認(rèn)識(shí)海洋微生物的分布特征及其在海洋生態(tài)系統(tǒng)中的功能和所扮演的角色。然而,海洋微生物在生長(zhǎng)過(guò)程中不僅受到其他微生物的影響,也受到海洋環(huán)境(溫度,鹽度等)的影響,而在這方面的研究進(jìn)展很小。通過(guò)信息論的方法構(gòu)建微生物與環(huán)境因子的二元網(wǎng)絡(luò),并對(duì)其進(jìn)行社團(tuán)挖掘,從環(huán)境的角度去發(fā)現(xiàn)海洋微生物種群作用模式的多樣性。

      關(guān)鍵詞: 生物信息學(xué); 網(wǎng)絡(luò)構(gòu)建; 信息論; 社團(tuán)挖掘

      中圖分類(lèi)號(hào): TN99?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2015)11?0091?04

      Research on interaction relationship in microorganism binary networks

      GAO Hong?yan

      (Institute of Physics and Optoelectronics Technology, Baoji University of Arts and Science, Baoji 721016, China)

      Abstract: With the rapid development of gene sequencing technology, a large number of marine microorganism data is produced, which makes the research of more hard cultivating marine microbial population possible. The corresponding researched in diversity of interaction mode, constitute, function for marine microbial population were conducted by many scholars, which is helpful to understand the distribution features of marine microorganism, and functions and characters in marine ecosystem. The growth process of marine microorganism is not only influenced by other microbes, but also influenced by marine environment (temperature, salinity, etc.). However, the research progress in this field is little. The binary networks of microorganism and environment factors are constructed by information theory, the community detection for binary networks is proceeded. The diversity of interaction mode in marine microbial population is discovered in the view of environment.

      Keywords: bioinformatics; network construction; information theory; community detection

      0 引 言

      海洋微生物是海洋生態(tài)系統(tǒng)中的重要組成部分,對(duì)海洋微生物種群作用模式多樣性、組成多樣性及功能多樣性開(kāi)展研究,將有助于人們認(rèn)識(shí)海洋微生物的分布特征及其在海洋生態(tài)系統(tǒng)中的功能和所扮演的角色,對(duì)深入開(kāi)展海洋生態(tài)環(huán)境研究具有重要的意義[1?2]?,F(xiàn)代微生物學(xué)研究表明,99%以上的海洋微生物目前不能(或很難)被純培養(yǎng),也就是說(shuō)目前對(duì)海洋微生物的認(rèn)知只占其總量[1]的l%。近幾年,隨著微生物基因組學(xué)、PCR和高通量、低成本測(cè)序技術(shù)的發(fā)展,環(huán)境基因組學(xué)推動(dòng)了海洋微生物多樣性研究的快速發(fā)展。運(yùn)用環(huán)境基因組學(xué)技術(shù)(如16S/18S rRNA基因序列分析)研究海洋微生物生態(tài)系統(tǒng),不僅可以獲得有關(guān)海洋微生物生理多樣性和生物功能的詳細(xì)信息,還有助于了解微生物如何響應(yīng)環(huán)境脅迫,并將其應(yīng)用于海洋病害防治。

      16SrRNA基因是細(xì)菌染色體上編碼rRNA相對(duì)應(yīng)的DNA序列,存在于所有細(xì)菌的染色體基因組中,由于其高信息量、高保守性及與大多數(shù)生理、遺傳標(biāo)記一致,16SrRNA基因檢測(cè)技術(shù)已經(jīng)成為微生物種群多樣性及作用模式研究的有力工具。如Hewson等在澳大利亞莫頓灣的八個(gè)采樣點(diǎn)上取樣本[3],采用Pyrosequencing技術(shù)產(chǎn)生細(xì)菌浮游生物16S/23S rRNA序列,在不同序列相似度閾值水平上生成微生物操作分類(lèi)單元(Operation Tax Unit,OTU),通過(guò)統(tǒng)計(jì)OTU在不同采樣點(diǎn)的微生物豐度值,研究不同地點(diǎn)的海洋微生物種群分布特性;Huhrman和Martiny等人采用遺傳指紋圖譜技術(shù)[4],基于判別分析、時(shí)間序列分析、多元回歸分析等多種統(tǒng)計(jì)方法對(duì)美國(guó)加州南部海域微生物的時(shí)間和空間分布模式進(jìn)行了研究;Andersson等在波羅的海海域一個(gè)采樣位點(diǎn)上進(jìn)行8次表層海水采樣[5],時(shí)間跨度長(zhǎng)達(dá)兩年,采用Pyrosequencing技術(shù)產(chǎn)生269 420條細(xì)菌浮游生物16SrRNA序列,在97%序列相似性水平下聚類(lèi)生成4 624個(gè)OTU,基于Spearman秩相關(guān)性分析了OTU與環(huán)境因子的作用模式;Gilbert等人在2003~2008年間從西英海峽觀(guān)測(cè)站采樣點(diǎn)采集76個(gè)表層海水樣本[6],采用Pyrosequencing技術(shù)產(chǎn)生968 140條16SrRNA序列,采用α?多樣性計(jì)算、判別分析等統(tǒng)計(jì)方法分析了不同季節(jié)下的海洋微生物分布特性,發(fā)現(xiàn)了豐度值最高、分布最廣泛的微生物種群,并且得出了微生物種群在不同季節(jié)下的分布差異較大,而不同年份間分布差異較小的結(jié)論。上述這些研究為分析海洋微生物種群組成多樣性、物種間復(fù)雜聯(lián)系多樣性及生物功能提供了基礎(chǔ)。然而這些研究大多基于統(tǒng)計(jì)學(xué)方法,且沒(méi)有考慮海洋環(huán)境因子的影響,無(wú)法深程度地挖掘隱含在這些大量數(shù)據(jù)中的海洋微生物作用模式。

      一般地,同一個(gè)生態(tài)系統(tǒng)下的各個(gè)物種與環(huán)境因子(Environment,ENV)之間也存在相關(guān)關(guān)系,可以通過(guò)種群數(shù)量隨時(shí)間的變化趨勢(shì)來(lái)判斷,當(dāng)物種和環(huán)境之間的數(shù)量呈同步變化時(shí),它們可能存在依賴(lài)關(guān)系;也有可能存在非線(xiàn)性關(guān)系,有時(shí)從曲線(xiàn)變化趨勢(shì)中很難得到。本文以季節(jié)為時(shí)間單位,分別構(gòu)建春、夏、秋、冬四個(gè)季節(jié)下的OTU?ENV二元作用網(wǎng)絡(luò),通過(guò)二元網(wǎng)絡(luò)挖掘方法研究海洋微生物的作用模式。

      1 數(shù)據(jù)集和理論方法

      1.1 數(shù)據(jù)集

      本文16SrRNA數(shù)據(jù)和環(huán)境因子來(lái)自文獻(xiàn)[6],在2003年1月—2008年12月共采集76個(gè)樣本,通過(guò)多種子策略的啟發(fā)式454序列聚類(lèi)方法,獲得969 400條16SrRN序列,這些序列可從VAMPS(http://vamps.mbl.edu/index.php)上下載。其春(4~6月)、夏(7~9月)、秋(10~12月)、冬(1~3月)四個(gè)季節(jié)的采樣數(shù)分別為24、21、15和16,四個(gè)季節(jié)相應(yīng)的16SrRNA序列數(shù)分別為276 932、247 907、212 921和231 640條。環(huán)境因子共有18個(gè),也是76個(gè)時(shí)間點(diǎn),與16SrRNA的采樣時(shí)間點(diǎn)一一對(duì)應(yīng),但有的時(shí)間點(diǎn)有缺失值,本文通過(guò)取近鄰平均值來(lái)補(bǔ)全缺失值,得到18個(gè)ENV。

      生物學(xué)研究表明,序列相似性越高的物種在生物進(jìn)化樹(shù)上越相近,一般認(rèn)為相似度大于99%的序列在微生物分類(lèi)學(xué)上屬于同一物種。本文采用多種子策略基于啟發(fā)式的序列聚類(lèi)算法[7],該算法具有良好的魯棒性能,與傳統(tǒng)的啟發(fā)式序列聚類(lèi)算法相比,該算法能降低OTU過(guò)估計(jì)問(wèn)題,提高聚類(lèi)精度,有效地進(jìn)行操作分類(lèi)單元計(jì)算。在99%序列相似性閾值下對(duì)968 140條16SrRNA序列進(jìn)行聚類(lèi),可生成6 793個(gè)OTUs。

      1.2 理論方法

      信息論:相對(duì)于皮爾遜相關(guān)系數(shù)而言,互信息考慮了向量間的非線(xiàn)性關(guān)系[8]。在介紹互信息之前,先介紹一下信息熵。一個(gè)隨機(jī)向量[X={x1,x2,…,xN},][D=][max(X)-min(X)]。將[D]分成[M]個(gè)區(qū)間,得到一個(gè)區(qū)間集[{Dj}, j=1,2,…,M。]滿(mǎn)足[?j{Dj}=D]和[Dj?Dk=?,]如果[j≠k,][M]是將[D]分成的區(qū)間個(gè)數(shù)。定義[δ]函數(shù):

      [δ(Δxi,Dj)=1,if Δxi∈Dj0,else, i=1,2,…,N;j=1,2,…,M]

      區(qū)間[Dj]的概率為:

      [pX(Dj)=1Ni=1Nδ(Xi,Dj), j=1,2,…,M] (1)

      根據(jù)香農(nóng)理論,變量[X]的信息熵是:

      [H(X)=-j=1MpX(Dj)logpX(Dj)] (2)

      根據(jù)上文提到的[δ]函數(shù),現(xiàn)有兩個(gè)隨機(jī)向量[X={x1,x2,…,xN}]和[Y={y1,y2,…,yN}。]定義聯(lián)合[δ]函數(shù):

      [δ(Δxi,Δyi,Dj,Dk)=1, if Δxi∈Dj and Δyi∈Dk0, else, i=1,2,…,N;j,k=1,2,…,M]

      聯(lián)合區(qū)間[{Dj,Dk}]的概率是:

      [pX,Y(Dj,Dk)=1Ni=1Nδ(Δxi,Δyi,Dj,Dk), j,k=1,2,…,M]

      類(lèi)似的,可定義聯(lián)合熵[H(X,Y)]:

      [H(X,Y)=-j=1Mk=1MpX,Y(Dj,Dk)logpX,Y(Dj,Dk)]

      聯(lián)合熵不大于各自的熵之和,即:

      [H(X,Y)≤H(X)+H(Y)] (3)

      如果[X]和[Y]在統(tǒng)計(jì)上是獨(dú)立的,則有:

      [H(X,Y)=H(X)+H(Y)] (4)

      兩個(gè)向量間的互信息定義為:

      [MI(X,Y)=H(X)+H(Y)-H(X,Y)] (5)

      根據(jù)等式(3),有:[MI(X,Y)≥0。]根據(jù)等式(4)可知:如果[X]和[Y]在統(tǒng)計(jì)上是獨(dú)立的,則它們的互信息是0。綜上所述,由公式(5)得到的互信息可以用來(lái)度量?jī)蓚€(gè)OTU之間或OTU與ENV之間的依賴(lài)關(guān)系,不管是線(xiàn)性的還是非線(xiàn)性的。

      LP(Label Propagation)算法,目前,二元網(wǎng)絡(luò)的研究通常有兩種思路:第一種把二元網(wǎng)絡(luò)投影到單頂點(diǎn)網(wǎng)絡(luò),然后進(jìn)行網(wǎng)絡(luò)分析。單頂點(diǎn)網(wǎng)絡(luò)無(wú)法完整描述出原始二分網(wǎng)絡(luò)的全部信息,即造成了原始二分網(wǎng)絡(luò)信息的丟失。第二種是直接基于原始二分網(wǎng)絡(luò)進(jìn)行分析,最大程度上保留了原始二分網(wǎng)絡(luò)的信息。Newman將科學(xué)家合作網(wǎng)投影到單頂點(diǎn)網(wǎng)絡(luò)進(jìn)行了研究[9],網(wǎng)絡(luò)的連邊是帶權(quán)重的。Lambiotte和Ausloos提出了一種聚類(lèi)方法——PIB(percolation Idea?Based),并在聽(tīng)眾與歌曲網(wǎng)中加以實(shí)現(xiàn)[10],得到聽(tīng)眾節(jié)點(diǎn)的社團(tuán)結(jié)構(gòu)和歌曲的社團(tuán)結(jié)構(gòu),但無(wú)法得出兩類(lèi)節(jié)點(diǎn)之間的聯(lián)系。Barber在二元網(wǎng)絡(luò)模塊度[Q]基礎(chǔ)上去挖掘二元網(wǎng)絡(luò)[11],當(dāng)[Q]值最大時(shí)得到最佳社團(tuán)結(jié)構(gòu),但其方法得需先知道分團(tuán)數(shù)。本文采用Raghavan等人提出的LP算法[12]去分析海洋微生物網(wǎng)絡(luò),LP算法思想簡(jiǎn)單,復(fù)雜度小,準(zhǔn)確度也高。LP算法思想如下:

      (1) 初始化,二元網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)都有一個(gè)單獨(dú)的標(biāo)簽,即開(kāi)始時(shí)都屬于一個(gè)單獨(dú)的團(tuán)。

      (2) 更新每個(gè)節(jié)點(diǎn)的標(biāo)簽。使每個(gè)節(jié)點(diǎn)的標(biāo)簽等于其鄰居節(jié)點(diǎn)標(biāo)簽個(gè)數(shù)最大的標(biāo)簽。如果其鄰居節(jié)點(diǎn)標(biāo)簽個(gè)數(shù)最大的標(biāo)簽不止一個(gè),則隨機(jī)選取。

      (3) 重復(fù)步驟(2),直到每個(gè)節(jié)點(diǎn)的標(biāo)簽都等于其鄰居節(jié)點(diǎn)標(biāo)簽個(gè)數(shù)最大的標(biāo)簽。

      2 實(shí)驗(yàn)結(jié)果仿真分析

      為了研究四個(gè)季節(jié)微生物與環(huán)境因子之間的相互作用,用互信息構(gòu)建海洋微生物相關(guān)作用網(wǎng)絡(luò),得到四個(gè)季節(jié)下的OTU?ENV作用網(wǎng)絡(luò)。春季網(wǎng)絡(luò)有29個(gè)節(jié)點(diǎn),22條邊;夏季網(wǎng)絡(luò)有45個(gè)節(jié)點(diǎn),45條邊;秋季網(wǎng)絡(luò)有106個(gè)節(jié)點(diǎn),159條邊;冬季網(wǎng)絡(luò)有66個(gè)節(jié)點(diǎn),64條邊。其中秋季的作用網(wǎng)絡(luò)如圖1所示,圓點(diǎn)表示OTU,三角形表示ENV。由此可知,春、夏、冬三個(gè)季節(jié)的網(wǎng)絡(luò)圖比較簡(jiǎn)單,有的就是一個(gè)單獨(dú)的團(tuán),秋季網(wǎng)絡(luò)圖節(jié)點(diǎn)比較多,相對(duì)來(lái)說(shuō)復(fù)雜一點(diǎn)。

      用LP算法直接在四個(gè)季節(jié)網(wǎng)絡(luò)中進(jìn)行挖掘,秋季網(wǎng)絡(luò)的挖掘結(jié)果如圖2所示。每個(gè)季節(jié)挖掘出的團(tuán)數(shù)如表1所示。實(shí)驗(yàn)結(jié)果顯示,環(huán)境因子E3、E5和E12在四個(gè)季節(jié)里均出現(xiàn),說(shuō)明這三個(gè)環(huán)境因子在微生物的生長(zhǎng)階段有一定的影響。E3、E5和E12分別是DX1、PAR和NO2+NO3。

      文獻(xiàn)[6]也構(gòu)建了微生物和環(huán)境因子的網(wǎng)絡(luò),可以看出E12(NO2+NO3)在微生物的四季生長(zhǎng)中起著重要作用。本文通過(guò)二元網(wǎng)絡(luò)的挖掘,也發(fā)現(xiàn)E12對(duì)海洋微生物的重要影響,所以重點(diǎn)分析E12。生物分類(lèi)學(xué)家用域、界、門(mén)、綱、目、科、屬、種七個(gè)類(lèi)對(duì)生物進(jìn)行分類(lèi),本文參照此分類(lèi)對(duì)各個(gè)季節(jié)的網(wǎng)絡(luò)進(jìn)行了分析。其中秋季網(wǎng)絡(luò)中有7個(gè)OTUs和E12相連,7個(gè)OTUs全是變形菌門(mén)(Proteobacteria)。在綱級(jí)下,5個(gè)OTUs是α?變形菌綱(Alphaproteobacteria),1個(gè)OTU是γ?變形菌綱(Gammaproteobacteria),1個(gè)OTU是δ?變形菌綱(Deltaproteobacteria)。在目級(jí)下,有3個(gè)OTUs是立克次體目(Rickettsiales),1個(gè)OTU是紅螺菌目(Rhodospirillales),1個(gè)OTU是交替單胞菌目(Alteromonadales),1個(gè)OTU是脫硫桿菌目(Desulfobacterales),1個(gè)OTU是海洋螺菌目(Oceanospirillales)。在科級(jí)下,2個(gè)OTUs是SAR11群,1個(gè)OTU是紅螺菌科(Rhodospirillaceae),1個(gè)OTU是交替單胞菌科(Alteromonadaceae),1個(gè)OTU是Nitrospinaceae科,其他2個(gè)OTU未知。

      通過(guò)四個(gè)季節(jié)對(duì)E12(NO2+NO3)所在團(tuán)的分析,得出E12(NO2+NO3)環(huán)境因子在變形菌的生長(zhǎng)過(guò)程中起著一定的作用,而且在不同的季節(jié)里,變形菌和擬桿菌共同出現(xiàn)的可能性很大,說(shuō)明這兩種菌類(lèi)在生長(zhǎng)過(guò)程中相互影響,究竟是共生、寄生、捕食和競(jìng)爭(zhēng)哪種關(guān)系,需要進(jìn)一步的研究。

      3 結(jié) 語(yǔ)

      挖掘海洋微生物的多樣性對(duì)海洋資源的開(kāi)發(fā)起著關(guān)鍵的作用。運(yùn)用宏基因組技術(shù)研究海洋微生物,不僅可以獲得有關(guān)海洋微生物的作用模式、生理多樣性和生物功能的詳細(xì)信息,還有助于了解微生物如何響應(yīng)環(huán)境脅迫。本文采用多種子策略基于啟發(fā)式的序列聚類(lèi)算法將16SrRNA基因序列聚類(lèi)成OTU,用微生物豐度向量表示OTU單元,基于互信息定義OTU單元與環(huán)境因子間是否存在網(wǎng)絡(luò)連接邊,分別構(gòu)建春、夏、秋、冬四季微生物二元作用網(wǎng)絡(luò),進(jìn)而采用二元網(wǎng)絡(luò)LP算法進(jìn)行挖掘。挖掘結(jié)果分析表明:春、夏、秋、冬海洋微生物與環(huán)境因子間作用網(wǎng)絡(luò)滿(mǎn)足復(fù)雜網(wǎng)絡(luò)“小世界”和“無(wú)尺度”特性;四個(gè)季節(jié)下的海洋微生物與環(huán)境因子的作用模式存在一定的差異,且四個(gè)季節(jié)下海洋微生物間的作用模式也存在一定差異。

      參考文獻(xiàn)

      [1] KARL D M. Microbial oceanography: paradigms, processes and promise [J]. Nature Reviews Microbiology, 2007, 5(10): 759?767.

      [2] FALKOWSKI P G, VARGAS C D. Shotgun sequencing in the sea: a blast from the past? [J]. Science, 2004, 304(5667): 58?60.

      [3] HEWSON I, FUHRMAN J A. Richness and diversity of bacterioplankton species along an estuarine gradient in Moreton Bay, Australia [J]. Applied and Environmental Microbiology, 2004, 70(6): 3425?3433.

      [4] FUHRMAN J A, STEELE J A, HEWSON I, et al. A latitudinal diversity gradient in planktonic marine bacteria [J]. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105(22): 7774?7778.

      [5] ANDERSON A F, RIEMANN L, BERTILSSON S. Pyrosequencing reveals contrasting seasonal dynamics of taxa within Baltic Sea bacterioplankton communities [J]. The ISME Journal, 2009, 4(2): 171?181.

      [6] GILBERT J A, STEELE J A, CAPORASO J G, et al. Defining seasonal marine microbial community dynamics [J]. The ISME journal, 2011, 6(2): 298?308.

      [7] CHEN W, CHENG Y, ZHANG C, et al. MSClust: A multi?seeds based clustering algorithm for microbiome profiling using 16S rRNA sequence [J]. Journal of Microbiological Methods, 2013, 94(3): 347?355.

      [8] COVER T M, THOMAS J A. Elements of information theory [M]. New York: Wiley, 1991.

      [9] NEWMAN M E. Scientific collaboration networks. I. Network construction and fundamental results [J]. Physical Review E, 2001, 64(1): 543?551.

      [10] LAMBIOTTE R, AUSLOOS M. Uncovering collective listening habits and music genres in bipartite networks [J]. Physical Review E, 2005, 72(6): 1102?1108.

      [11] BARBER M J. Modularity and community detection in bipartite networks [J]. Physical Review E, 2007, 76(6): 326?331.

      [12] RAGHAVAN U N, ALBERT R, KUMARA S. Near linear time algorithm to detect community structures in large?scale networks [J]. Physical Review E, 2007, 76(3): 426?432.

      猜你喜歡
      信息論生物信息學(xué)
      信息論與應(yīng)用數(shù)學(xué)關(guān)聯(lián)教學(xué)法研究
      基于超像素和信息論的SAR圖像目標(biāo)檢測(cè)研究
      從信息論角度探析漢譯英過(guò)程中文化信息的冗余平衡
      淺談醫(yī)學(xué)院校生物信息學(xué)專(zhuān)業(yè)青年教師規(guī)范培訓(xùn)模式的建立
      “PBL+E—learning”教學(xué)模式探索
      移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
      中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
      生物信息學(xué)課堂危機(jī)及對(duì)策研究
      安全通論(11)——《信息論》、《博弈論》與《安全通論》的融合:刷新您的通信觀(guān)念
      信息論翻譯的多維度探索
      赫章县| 武陟县| 威信县| 电白县| 阜新市| 瓦房店市| 酒泉市| 阜宁县| 陆河县| 瓦房店市| 辽中县| 东兰县| 台中县| 锦州市| 南康市| 沙坪坝区| 娱乐| 平泉县| 新建县| 谷城县| 永兴县| 昭通市| 长寿区| 蚌埠市| 巴塘县| 卓尼县| 察雅县| 全椒县| 新建县| 望江县| 望奎县| 乌海市| 曲周县| 汉沽区| 江城| 南江县| 渝北区| 吉首市| 化德县| 麻栗坡县| 荔浦县|