• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      組織特異性蛋白質(zhì)復(fù)合體的識(shí)別

      2017-09-15 05:58:03丁霞張曉飛易鳴
      數(shù)學(xué)雜志 2017年5期
      關(guān)鍵詞:復(fù)合體特異性聚類

      丁霞,張曉飛,易鳴

      (1.武漢大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北武漢430072)

      (2.華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,湖北武漢430079)

      (3.華中農(nóng)業(yè)大學(xué)理學(xué)院,湖北武漢430070)

      組織特異性蛋白質(zhì)復(fù)合體的識(shí)別

      丁霞1,張曉飛2,易鳴3

      (1.武漢大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北武漢430072)

      (2.華中師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,湖北武漢430079)

      (3.華中農(nóng)業(yè)大學(xué)理學(xué)院,湖北武漢430070)

      本文研究了組織特異性蛋白質(zhì)復(fù)合體的識(shí)別問(wèn)題.利用蛋白質(zhì)相互作用網(wǎng)絡(luò)數(shù)據(jù)以及組織特異性基因表達(dá)數(shù)據(jù)構(gòu)建組織特異性蛋白網(wǎng)絡(luò),利用多種代表性聚類算法對(duì)該網(wǎng)絡(luò)進(jìn)行聚類,并利用非負(fù)矩陣分解對(duì)聚類結(jié)果進(jìn)行合并聚類,得到了組織特異性蛋白質(zhì)復(fù)合體.結(jié)果表明,聚類效果得到明顯提升,并且能識(shí)別出組織特異性蛋白質(zhì)復(fù)合體.

      蛋白質(zhì)相互作用網(wǎng)絡(luò);復(fù)合體識(shí)別;組織特異性;非負(fù)矩陣分解

      1 引言

      在現(xiàn)如今的后基因組時(shí)代,對(duì)細(xì)胞間模塊以及基因的關(guān)系進(jìn)行系統(tǒng)分析和全面了解是一個(gè)非常重要的課題.隨著生物信息學(xué)的高速發(fā)展,基因組學(xué)中大規(guī)模的高通量技術(shù),如基于質(zhì)譜的串聯(lián)親和純化[1,2]、酵母雙雜交[3,4]以及蛋白芯片技術(shù)為我們提供了海量的大規(guī)模生物網(wǎng)絡(luò),也為我們對(duì)生物網(wǎng)絡(luò)進(jìn)行系統(tǒng)的分析創(chuàng)造了可能.

      眾所周知,蛋白質(zhì)很少單獨(dú)行動(dòng),它們往往結(jié)合在一起形成復(fù)合體在生命體中進(jìn)行生物功能[5].蛋白質(zhì)復(fù)合體的綜合研究有助于揭示蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)的結(jié)構(gòu)、預(yù)測(cè)蛋白質(zhì)的功能,更有助于闡明各種疾病的細(xì)胞機(jī)制[6].經(jīng)過(guò)10多年的快速發(fā)展,已經(jīng)涌現(xiàn)出了許多基于不同聚類機(jī)理的蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢驗(yàn)方法.

      盡管在此方面已經(jīng)有不少研究,但是這些方法主要關(guān)注靜態(tài)的蛋白質(zhì)相互作用網(wǎng)絡(luò),而忽略了蛋白質(zhì)功能作用的動(dòng)態(tài)變化及組織特異機(jī)制.幸運(yùn)的是,DNA微陣列技術(shù)的出現(xiàn),使數(shù)以千計(jì)的基因的差異表達(dá)的各種實(shí)驗(yàn)條件被同時(shí)且定量監(jiān)視,它提供了許多有關(guān)于時(shí)間以及組織特異的信息[7].目前也有少許算法研究動(dòng)態(tài)網(wǎng)絡(luò),并探測(cè)動(dòng)態(tài)復(fù)合體,但還沒(méi)有算法涉及到組織特異的復(fù)合體偵測(cè).

      本文通過(guò)結(jié)合組織特異性基因表達(dá)數(shù)據(jù)以及人類蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建出一系列組織特異性蛋白網(wǎng)絡(luò),嘗試探索組織特異功能模塊的研究.本文的主要方法為對(duì)所構(gòu)建的組織特異性蛋白網(wǎng)絡(luò)利用多種方法對(duì)其進(jìn)行聚類,并對(duì)結(jié)果進(jìn)行組裝,最后使用非負(fù)矩陣分解模型對(duì)組裝的結(jié)果進(jìn)行有效合并.實(shí)驗(yàn)結(jié)果表明,本文的方法與其他聚類方法相比,在檢測(cè)蛋白質(zhì)復(fù)合體上結(jié)果更好.

      因?yàn)榻M織特異性蛋白復(fù)合體對(duì)于理解生物學(xué)功能以及確定生物標(biāo)志物和功能靶標(biāo)十分重要[8],因此探索組織特異功能模塊很有必要.

      2 方法

      在本節(jié)中,本文首先介紹如何構(gòu)建組織特異性蛋白網(wǎng)絡(luò),隨后介紹如何檢測(cè)組織特異性復(fù)合體.

      2.1 構(gòu)建組織特異性蛋白網(wǎng)絡(luò)

      組織特異性蛋白網(wǎng)絡(luò)是結(jié)合蛋白質(zhì)相互作用網(wǎng)絡(luò)以及組織特異性基因表達(dá)數(shù)據(jù)兩者來(lái)構(gòu)建的.給定一個(gè)PPI網(wǎng)絡(luò),可以用圖G=(V,E)來(lái)表示[9],其中V包含|V|=N個(gè)蛋白質(zhì),而E包含|E|條邊.圖G可以表示成一個(gè)鄰接矩陣A,其中若有一條邊連接蛋白質(zhì)i與j,則Aij=1,否則Aij=0,在這種情況下,識(shí)別蛋白質(zhì)復(fù)合體這一問(wèn)題就轉(zhuǎn)化為點(diǎn)的聚類問(wèn)題.組織特異性基因表達(dá)數(shù)據(jù)是這N個(gè)蛋白質(zhì)在T個(gè)組織中的基因水平,可以用一個(gè)N×T維矩陣F表示.

      本文將利用矩陣A以及矩陣F來(lái)構(gòu)建組織特異性蛋白網(wǎng)絡(luò).若蛋白質(zhì)i與j有相關(guān)關(guān)系,即Aij=1,并且在組織t中,蛋白質(zhì)i與蛋白質(zhì)j均顯著表達(dá),即Fit>0并且Fjt>0,則蛋白質(zhì)i與蛋白質(zhì)j在組織t中存在相關(guān)關(guān)系.根據(jù)上述方法,對(duì)T個(gè)組織進(jìn)行構(gòu)建,則可得到T個(gè)組織特異性蛋白網(wǎng)絡(luò).

      2.2 識(shí)別組織特異性蛋白質(zhì)復(fù)合體

      在本節(jié)中,本文先對(duì)組織特異性蛋白質(zhì)相關(guān)關(guān)系網(wǎng)絡(luò)中的每一個(gè)組織分別使用基本聚類方法,并使用非負(fù)矩陣分解模型來(lái)合并相似組織特異性蛋白質(zhì)復(fù)合物,得到新的復(fù)合體,算法的基本流程如圖1所示.

      2.2.1 基本聚類方法

      本文首先利用7種基本的聚類方法分別對(duì)這T個(gè)組織特異蛋白網(wǎng)絡(luò)進(jìn)行聚類,構(gòu)建蛋白質(zhì)復(fù)合體,所用的7種方法分別為MCL、MCODE、MINE、ClusterONE、DPClus、SPICi、CoAch.

      MCL是通過(guò)模擬在PPI網(wǎng)絡(luò)中流的自由行走來(lái)檢測(cè)蛋白質(zhì)復(fù)合體的經(jīng)典算法,它定義了指派節(jié)點(diǎn)概率的Expansion操作和改變節(jié)點(diǎn)游走概率的In fl ation操作來(lái)模擬隨機(jī)游走的擴(kuò)展和收縮行為[10,11].

      MCODE是一種基于蛋白質(zhì)的連接值來(lái)檢測(cè)蛋白質(zhì)復(fù)合體的計(jì)算方法,它首先利用節(jié)點(diǎn)的局部鄰域密度給PPI網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)進(jìn)行加權(quán),然后選擇具有最高權(quán)值的節(jié)點(diǎn)作為初始聚類的種子節(jié)點(diǎn),并由種子節(jié)點(diǎn)向外擴(kuò)張形成最后的簇(蛋白質(zhì)模塊)[11,14].

      MINE是一種類似于MCODE的凝聚聚類算法,但它使用了一個(gè)改進(jìn)的頂點(diǎn)加權(quán)策略,并且可以衡量網(wǎng)絡(luò)模塊性,而這兩者都有助于避免使用生長(zhǎng)群內(nèi)包含的臨界點(diǎn)來(lái)定義模塊的邊界[13].

      DPClus是一種通過(guò)簇邊界的跟蹤進(jìn)行聚類的算法,它不僅利用模塊密度而且利用新定義的粗特性CP完成復(fù)合體檢驗(yàn)[11,14].

      ClusterONE是一種能識(shí)別帶重疊的蛋白質(zhì)復(fù)合體的一種算法,它依賴于重疊領(lǐng)域擴(kuò)張[15].

      CoAch是一種利用核心依附關(guān)系進(jìn)行復(fù)合體檢測(cè)的算法,該算法分為兩個(gè)階段,第1階段從鄰接圖中定義核心頂點(diǎn),然后從中檢測(cè)蛋白質(zhì)復(fù)合體的核心蛋白質(zhì),第2階段為將附屬蛋白質(zhì)逐個(gè)連接到核心蛋白質(zhì)所代表的復(fù)合體中[11,16].

      SPICi是一種高效算法,SPICi種子集群根據(jù)其加權(quán)度的節(jié)點(diǎn),如果支撐足夠高,并且集群的密度低于用戶定義的閾值,則此非集群節(jié)點(diǎn)將會(huì)添加到集群中,否則,群集被輸出,這個(gè)簇的節(jié)點(diǎn)將會(huì)從網(wǎng)絡(luò)中移除[17].

      2.2.2 非負(fù)矩陣分解模型

      對(duì)每一個(gè)組織,分別使用上述7種聚類方法,可以得到7個(gè)復(fù)合體矩陣V1,V2,···,V7,Vi(i=1:7)為N×Pi(i=1:7)矩陣,其中N代表蛋白質(zhì)的個(gè)數(shù),Pi為第i種聚類方法所識(shí)別的蛋白質(zhì)復(fù)合體的個(gè)數(shù).對(duì)于矩陣Vi,若蛋白質(zhì)Ni,Nj,···,Nk組成第e個(gè)復(fù)合體(1<=e<=Pi),則在第e列中,除了蛋白質(zhì)Ni,Nj,···,Nk所對(duì)應(yīng)的元素為1外,其余元素為0.將這7個(gè)復(fù)合體矩陣V1,V2,···,V7橫向排列,得到矩陣V=[V1,V2,···,V7],V為N行P列的矩陣依造此方法,可構(gòu)建出T個(gè)矩陣.

      接著,我們使用了非負(fù)矩陣分解模型來(lái)合并相似瞬時(shí)蛋白質(zhì)復(fù)合物.它提供了一種對(duì)非負(fù)矩陣的低秩逼近,并且已被廣泛地運(yùn)用到聚類當(dāng)中[18,19].Lee和Seung的非負(fù)矩陣分解方法,設(shè)定模型為

      利用更新法則

      最后得到矩陣W(N×K)和H(K×P),本文只對(duì)矩陣W進(jìn)行研究,將其橫向歸一,即令Uik=Wik/Wi..得到U之后,設(shè)定過(guò)濾閾值τ,若Uij>τ,則蛋白質(zhì)Ni是復(fù)合體Kj的組成部分.由上可知,本次算法共有兩個(gè)參數(shù),所識(shí)別的復(fù)合體的個(gè)數(shù)K以及過(guò)濾閾值τ.由于復(fù)合體大多是由3個(gè)及3個(gè)以上的蛋白質(zhì)組合而成,因此對(duì)所識(shí)別出的復(fù)合體進(jìn)行過(guò)濾,將蛋白質(zhì)個(gè)數(shù)<2的復(fù)合體舍去.

      3 結(jié)果

      3.1 構(gòu)建組織特異性蛋白質(zhì)子網(wǎng)絡(luò)

      本文從BIOGPS項(xiàng)目中的Af f ymetrix數(shù)據(jù)集中獲得了83個(gè)人體組織和細(xì)胞系的轉(zhuǎn)錄水平[20],并從BioGrid網(wǎng)站[21]中下載到人體蛋白質(zhì)-蛋白質(zhì)相互作用關(guān)系,構(gòu)建了83個(gè)組織特異性蛋白網(wǎng)絡(luò),具體處理數(shù)據(jù)以及構(gòu)造方法詳見(jiàn)文獻(xiàn)[20],本文挑選了蛋白質(zhì)對(duì)個(gè)數(shù)>10000的26個(gè)組織進(jìn)行分析,這26個(gè)組織或者細(xì)胞分別為:BDCA 4+樹(shù)突狀細(xì)胞、支氣管上皮細(xì)胞、CD105+內(nèi)皮、CD19+B細(xì)胞、髓細(xì)胞、造血干細(xì)胞、CD4+T細(xì)胞、CD56+自然殺傷細(xì)胞、CD71+早期紅細(xì)胞前體細(xì)胞、CD8+T細(xì)胞、心臟肌細(xì)胞、腸和直腸腺癌、慢性粒細(xì)胞性白血病k-562、早幼粒細(xì)胞性白血病淋巴細(xì)胞(MOLT-4)、白血病HL-60、淋巴瘤burkitt(Daudi)、淋巴瘤burkitt(Raji)、日間松果體、夜間松果體、前額葉皮層、視網(wǎng)膜、前列腺、平滑肌、甲狀腺、全血.

      3.2 黃金標(biāo)準(zhǔn)蛋白質(zhì)復(fù)合體

      為了衡量所檢測(cè)出的復(fù)合體的精確性,本文選擇了一個(gè)廣泛使用的復(fù)合體標(biāo)準(zhǔn)作為黃金標(biāo)準(zhǔn),該標(biāo)準(zhǔn)是從哺乳動(dòng)物蛋白質(zhì)復(fù)合體的CORUM[22]數(shù)據(jù)庫(kù)中得到,最終獲得由2151個(gè)蛋白質(zhì)組成的324個(gè)復(fù)合體,本文中只選取其中蛋白質(zhì)個(gè)數(shù)大于3個(gè)的復(fù)合體.

      3.3 評(píng)價(jià)標(biāo)準(zhǔn)

      我們將判斷預(yù)測(cè)的復(fù)合體是否能很好地對(duì)應(yīng)到已知的復(fù)合體作為評(píng)判標(biāo)準(zhǔn).ACC[23]是用來(lái)測(cè)量幾何精度的,在這項(xiàng)研究中,它被用來(lái)評(píng)估預(yù)測(cè)的復(fù)合體與參考的復(fù)合體之間的相似性.MMR(the Maximum Matching Ratio)由Paccanaro提出的用來(lái)評(píng)估相對(duì)于參考蛋白質(zhì)復(fù)合體來(lái)說(shuō)預(yù)測(cè)的蛋白質(zhì)復(fù)合體是否符合期望的一個(gè)評(píng)價(jià)標(biāo)準(zhǔn).

      圖2:參數(shù)τ在不同組織識(shí)別出不同復(fù)合體的曲線圖

      3.4 基本聚類方法的參數(shù)選擇

      MCL有一個(gè)用來(lái)調(diào)整聚類的間隔尺寸的參數(shù),俗稱膨脹率,本文設(shè)定其取值范圍從3.0到5.0,步長(zhǎng)為0.2;MCODE設(shè)定蛋白質(zhì)個(gè)數(shù)為3,其余參數(shù)默認(rèn);MINE設(shè)定蛋白質(zhì)個(gè)數(shù)為3,其余參數(shù)默認(rèn);DPCLUS有兩個(gè)參數(shù),最小密度d以及最小聚類性質(zhì)參數(shù)cp,本文設(shè)定其值分別為0.7以及0.5;ClusterOne參數(shù)設(shè)為默認(rèn);CoAch有一個(gè)參數(shù)ω,用來(lái)過(guò)濾冗余的核心蛋白質(zhì),本文設(shè)定取值范圍為0.225到0.925,步長(zhǎng)為0.05;SPICi有兩個(gè)參數(shù),其中我們?cè)O(shè)定密度閾值這一參數(shù)的取值范圍為0.1到1,步長(zhǎng)為0.1.

      對(duì)于以上7種算法,挑選出使得每種算法的ACC和MMR的調(diào)和平均數(shù)最大的參數(shù)值作為最后選定的參數(shù)值.

      3.5 參數(shù)選擇

      本文的算法中,共有兩個(gè)參數(shù)K以及τ,K為所識(shí)別的蛋白質(zhì)復(fù)合體的個(gè)數(shù),根據(jù)過(guò)往者的經(jīng)驗(yàn),設(shè)定其取值范圍從600到1600,步長(zhǎng)為200,τ為過(guò)濾閾值,設(shè)置其取值范圍為0到0.9,步長(zhǎng)為0.1.在對(duì)26個(gè)組織分別進(jìn)行上述算法后,得到表1.

      表1:ACC-結(jié)果比較

      在對(duì)所有組織計(jì)算中發(fā)現(xiàn),一般復(fù)合體個(gè)數(shù)在600-2000并且閾值在0或者0.1的情況下表現(xiàn)良好,由于篇幅有限,僅挑選出4個(gè)組織進(jìn)行參數(shù)分析,分別為:甲狀腺、B細(xì)胞、前額葉皮層、T細(xì)胞,如圖2.

      3.6 與其他聚類方法進(jìn)行比較分析

      在這一章中,我們將本文的算法與其他7種算法對(duì)這26個(gè)組織或者細(xì)胞的蛋白質(zhì)網(wǎng)絡(luò)進(jìn)行聚類之后的結(jié)果進(jìn)行比較.對(duì)于其他7種基本聚類方法,我們?nèi)∑銩CC和MMR的調(diào)和平均數(shù)為這26個(gè)組織最后的結(jié)果,從表1中可以看出,本文的算法最后得到的ACC值在24個(gè)組織中處于最大值,兩個(gè)組織中居于第二.

      本文將26個(gè)組織所用的7種方法得到的最高值與本文所用的方法進(jìn)行比較,提升最高的組織是前列腺,提高值為13%.在與其他7種方法分別單獨(dú)比較時(shí),提高最高的百分比分別為:51.61%、33.33%、39.53%、122.22%、27.03%、25.00%、27.91%,具體提升情況可參見(jiàn)圖3,從圖中我們可以看出,MCODE算法所得到的結(jié)果最差,在26個(gè)組織中,使用非負(fù)矩陣分解得到的結(jié)果均比其提高30%以上;其次是MCL,提高了8%到40%;而CLusterONE表現(xiàn)最好,有兩個(gè)組織比本文的算法分別高出1.96%、3.08%.

      圖3:與其他組織比較,NMF提升百分比的頻數(shù)圖

      從上述結(jié)果中可以看出,本文所提出的算法與其他7種方法相比是具有優(yōu)越性的.

      4 討論與分析

      組織特異性蛋白質(zhì)復(fù)合體對(duì)于理解生物學(xué)功能以及確定生物標(biāo)志物和功能靶標(biāo)十分重要,這也是本文的研究動(dòng)機(jī).同一個(gè)蛋白質(zhì)在不同的組織中會(huì)與不同的蛋白質(zhì)相結(jié)合,舉例來(lái)說(shuō),轉(zhuǎn)運(yùn)蛋白1(TNPO1)在樹(shù)突狀細(xì)胞中與蛋白質(zhì)CD4、PPP3CA、TNPO3結(jié)合,在髓細(xì)胞中與SRP19、TNPO3相結(jié)合,而在平滑肌中則與蛋白質(zhì)IPO5、IPO7、NUTF2、RAN、SRP19結(jié)合形成復(fù)合體,由此可以看出在不同的組織中其會(huì)與不同的蛋白質(zhì)相結(jié)合,而TNPO1與TNPO3則同時(shí)出現(xiàn)在不同組織的同一個(gè)復(fù)合體中,這與生命活動(dòng)也是相符合的.

      在真正的生命活動(dòng)中,蛋白質(zhì)會(huì)在不同的組織中與不同的蛋白質(zhì)相結(jié)合,而許多現(xiàn)有的檢測(cè)蛋白質(zhì)復(fù)合物模型都是在靜態(tài)PPI網(wǎng)絡(luò)模型中直接檢測(cè),而忽略了蛋白質(zhì)復(fù)合體的空間特異性.本文利用多種方法對(duì)不同的組織構(gòu)建組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò),并使用非負(fù)矩陣分解模型對(duì)其他聚類結(jié)果進(jìn)行合并聚類,并在獲取組織特異性蛋白質(zhì)復(fù)合體時(shí)得到了良好的結(jié)果.同時(shí),本文也有一些不足,雖然本文的結(jié)果在ACC標(biāo)準(zhǔn)中表現(xiàn)良好,但在MMR這一標(biāo)準(zhǔn)中仍需改進(jìn),同時(shí),本文僅選取一個(gè)黃金標(biāo)準(zhǔn)復(fù)合體,在接下來(lái)的工作中,我們可以參考多組黃金標(biāo)準(zhǔn)復(fù)合體進(jìn)行方法之間的比較.

      [1]Aebersold R,Mann M.Mass spectrometry-based proteomics[J].Nature,2003,422(6928):198-207.

      [2]Ho Y,Gruhler A,Heilbut A,et al.Systematic identif i cation of protein complexes in Saccharomyces cerevisiae by mass spectrometry[J].Nature,2002,415(6868):180-183.

      [3]Ito T,Chiba T,Ozawa R,Yoshida M,Hattori M,Sakaki Y.A comprehensive two-hybrid analysis to explore the yeast protein interactome[J].Proceed.National Acad.Sci.United States America, 2001,98(8):4569-4574.

      [4]Uetz P,Giot L,Cagney G,Mansf i eld T A,et al.A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae[J].Nature,2000,403(6770):623-627.

      [5]Gavin A C,B sche M,Krause R,et al.Functional organization of the yeast proteome by systematic analysis of protein complexes[J].Nature,2002,415(6868):141-147.

      [6]Lage K,Karlberg E O,St?rling Z M,et al.A human phenome-interactome network of protein complexes implicated in genetic disorders[J].Nature Biotechnology,2007,25(3):309-316.

      [7]Lo K,Raftery A E,Dombek K M,et al.Integrating external biological knowledge in the construction of regulatory networks from time-series expression data[J].BMC Sys.Bio.,2012,6(2):101.

      [8]Vasmatzis G,Klee E W,Kube D M,Therneau T M,Kosari F.Quantitating tissue specif i city of human genes to facilitate biomarker discovery[J].Bioinformatics,2007,23(11):1348-1355.

      [9]Li D,Li J,Ouyang S,Wang J,Wu S,Wan P,Zhu Y,Xu X,He F.Protein interaction networks of Saccharomyces cerevisiae,Caenorhabditis elegans and Drosophila melanogaster:large-scale organization and robustness[J].Proteomics,2006,6(2):456-461.

      [10]Enright A J,Dongen S V,Ouzounis C A.An efficient algorithm for largescale detection of protein families[J].Nucleic Acids Res,2012,30(7):1575-1584.

      [11]冀俊忠,劉志軍,劉紅欣,劉椿年.蛋白質(zhì)相互作用網(wǎng)絡(luò)功能模塊檢測(cè)的研究綜述[J].自動(dòng)化學(xué)報(bào),2014, 40(4):577-593.

      [12]Bader G D,Hogue C W V.An automated method for f i nding molecular complexes in large protein interaction networks[J].BMC Bioinformatics,2003,4(1):2.

      [13]Rhrissorrakrai K,Gunsalus K C.MINE:module identif i cation in networks[J].BMC Bioinformatics, 2011,12(1):192.

      [14]Altaf-Ul-Amin M,Shinbo Y,Mihara K,Kurokawa K,Kanaya S.Development and implementation of an algorithm for detection of protein complexes in large interaction networks[J].BMC Bioinformatics,2006,7(1):207.

      [15]Nepusz T,Yu H,Paccanaro A.Detecting overlapping protein complexes in protein-protein interaction networks[J].Nature Methods,2012,9(5):471-472.

      [16]Wu M,Li X L,Kwoh C K,Ng C K.A core-attachment based method to detect protein complexes in PPI networks[J].BMC Bioinformatics,2009,10(1):169.

      [17]Jiang P,Singh M.SPICi:a fast clustering algorithm for large biological networks[J].Bioinformatics, 2010,26(8):1105-1111.

      [18]Lee D D,Seung H S.Learning the parts of objects by non-negative matrix factorization[J].Nature, 1999,401(6755):788-791.

      [19]Ding C,He X F,Simon H D.On the equivalence of nonnegative matrix factorization and spectral clustering[J].Siam Intern.Confer.Data Min.,2005,5:606-610.

      [20]Lopes T J,Schaefer M,Shoemaker J,Matsuoka Y,Fontaine J F,Neumann G,Andrade-Navarro M A,Kawaoka Y,Kitano H.Tissue-specif i c subnetworks and characteristics of publicly available human protein interaction databases[J].Bioinformatics,2011,27(17):2414-2421.

      [21]Chatr-aryamontri A,Breitkreutz B J,Heinicke S,et al.The Biogrid interaction database:2013 update[J].Nucleic Acids Research,2013,41(2):816-823.

      [22]Havugimana P C,Hart G T,Nepusz T,et al.A census of human soluble protein complexes[J].Cell, 2012,150(5):1068-1081.

      [23]Li X,Wu M,Kwoh C K,et al.Computational approaches for detecting protein complexes from protein interaction networks:a survey[J].BMC Genomics,2010,11(4):S3.

      [24]Ou-Yang L,Dai D Q,Zhang X F.Protein complex detection via weighted ensemble clustering based on bayesian nonnegative matrix factorization[J].Plos One,2013,8(5):639-642.

      [25]Ou-Yang L,Dai D Q,Li X L,Wu M,Zhang X F,Yang P.Detecting temporal protein complexes from dynamic protein-protein interaction networks[J].BMC Bioinformatics,2014,15(1):16001-16005.

      [26]Zhang X F,Dai D Q,Ou-Yang L,Yan H.Detecting overlapping protein complexes based on a generative model with functional and topological properties[J].BMC Bioinformatics,2014,15(2):836-842.

      [27]Zhang W,Zou X F.A new method for detecting protein complexes based on the three node cliques[J]. IEEE/ACM Trans Comput.Biol.Bioinform,2015,12(4):879-886.

      [28]涂俐蘭.兩兩序列比對(duì)的一種新方法[J].數(shù)學(xué)雜志,2006,26(1):67-70.

      IDENTIFICATION OF THE TISSUE SPECIFIC PROTEIN COMPLEXES

      DING Xia1,ZHANG Xiao-fei2,YI Ming3
      (1.School of Mathematics and Statistics,Wuhan University,Wuhan 430072,China)
      (2.School of Mathematics and Statistics,Central China Normal University,Wuhan 430079,China)
      (3.School of Science,Huazhong Agricultural University,Wuhan 430070,China)

      In this paper,we study the identif i cation problem of tissue-specif i c protein complexes.By using a variety of typical clustering algorithm to cluster the network,we construct a tissue-specif i c protein-protein interaction network based on the protein-protein interaction networks as well as the tissue-specif i c gene expression data,then merge the results with non-negative matrix factorization model to obtain tissue-specif i c protein complexes.The results show that clustering ef f ect has been signif i cantly improved,and can identify tissue-specif i c protein complexes.

      protein-protein interaction networks;complexes identif i cation;tissue-specif i c; non-negative matrix factorization

      O212.4;O212.5

      A

      0255-7797(2017)05-1093-08

      2015-01-06接收日期:2015-05-06

      國(guó)家自然科學(xué)基金資助(11275259);國(guó)家自然科學(xué)基金資助(91330113).

      丁霞(1990-),女,湖北鄂州,碩士,主要研究方向:生物信息.

      2010 MR Subject Classif i cation:92B05

      猜你喜歡
      復(fù)合體特異性聚類
      基于DBSACN聚類算法的XML文檔聚類
      精確制導(dǎo) 特異性溶栓
      BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應(yīng)用
      基于改進(jìn)的遺傳算法的模糊聚類算法
      重復(fù)周圍磁刺激治療慢性非特異性下腰痛的臨床效果
      CoFe2O4/空心微球復(fù)合體的制備與吸波性能
      兒童非特異性ST-T改變
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      3種多糖復(fù)合體外抗腫瘤協(xié)同增效作用
      长沙市| 遂川县| 铜梁县| 江川县| 全南县| 札达县| 将乐县| 西峡县| 屏山县| 萝北县| 龙岩市| 双流县| 正定县| 景东| 密云县| 万全县| 天祝| 敖汉旗| 达拉特旗| 淳安县| 政和县| 和静县| 如皋市| 黄浦区| 海宁市| 汤阴县| 密山市| 西林县| 桐柏县| 本溪市| 思南县| 会宁县| 平山县| 弥勒县| 洛川县| 扎囊县| 荔浦县| 淮阳县| 建始县| 宜宾市| 永兴县|