胡 楓,劉 猛,趙 靜,雷 蕾
(1.青海師范大學(xué),西寧 810008;2.青海省藏文信息處理與機(jī)器翻譯重點(diǎn)實(shí)驗(yàn)室,西寧 810008;3.藏文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,西寧 810008;4.陸軍勤務(wù)學(xué)院,重慶 401331)
隨著超網(wǎng)絡(luò)理論的發(fā)展與完善,研究者們構(gòu)建了許多基于超圖結(jié)構(gòu)的超網(wǎng)絡(luò)模型,并從中取得了一些有價(jià)值的成果。王建偉等[6]構(gòu)建了一種超網(wǎng)絡(luò)動態(tài)演化模型,該模型每次增加若干個(gè)新節(jié)點(diǎn),并與原網(wǎng)絡(luò)中已存在的一個(gè)舊節(jié)點(diǎn)優(yōu)先連接生成新的超邊;胡楓等給出了另一種超網(wǎng)絡(luò)演化模型,該模型的增長機(jī)理與王建偉等模型相對偶,并將BA網(wǎng)絡(luò)視為該模型的特例[7],此外,她還研究分析了基于超圖結(jié)構(gòu)的科研合作網(wǎng)絡(luò)[8];索琪等研究了超網(wǎng)絡(luò)中信息動態(tài)傳播問題[9],并且根據(jù)超網(wǎng)絡(luò)演化模型分析供應(yīng)鏈網(wǎng)絡(luò)的演化機(jī)制[10],此外,她研究了基于超網(wǎng)絡(luò)結(jié)構(gòu)的電視節(jié)目競爭關(guān)系[11]、輿情傳播模型[12]和超網(wǎng)絡(luò)演化的內(nèi)在驅(qū)動力[13]等問題;郭進(jìn)利等研究了非均勻超網(wǎng)絡(luò)中標(biāo)度率涌現(xiàn)問題[14],并且構(gòu)建了非均勻超網(wǎng)絡(luò)和加權(quán)超網(wǎng)絡(luò)模型,以此來研究這兩類超網(wǎng)絡(luò)的超度分布問題[15];張子柯等[16]給出了一種基于用戶背景知識和對象、標(biāo)簽雙重優(yōu)先連接機(jī)制的超圖增長模型。
1.2.1 度
在超網(wǎng)絡(luò)H中,為了與復(fù)雜網(wǎng)絡(luò)的普通圖表示一致,超邊內(nèi)部節(jié)點(diǎn)之間采用全連接的方式。等同于復(fù)雜網(wǎng)絡(luò)中度的定義,節(jié)點(diǎn)i的度Ki被定義為與i直接相鄰的節(jié)點(diǎn)的個(gè)數(shù)。設(shè)H的鄰接矩陣A=(aij)N×N,則節(jié)點(diǎn)i的度Ki為:
(1)
1.2.2 超度
在超網(wǎng)絡(luò)H中,節(jié)點(diǎn)j的超度Dj是指包含該節(jié)點(diǎn)的超邊數(shù)量。設(shè)超網(wǎng)絡(luò)H的關(guān)聯(lián)矩陣C=(cij)M×N,則節(jié)點(diǎn)j的超度Dj為:
(2)
其中,cij為關(guān)聯(lián)矩陣C的元素,若節(jié)點(diǎn)j包含在超邊i中,則cij=1;否則,cij=0。
1.2.3 聚類系數(shù)
平均聚類系數(shù)是指與同一節(jié)點(diǎn)相連的任意兩個(gè)鄰居節(jié)點(diǎn)之間存在超邊的平均概率。Estrada等[23]給出了超網(wǎng)絡(luò)的聚類系數(shù)C2(H)的計(jì)算公式。該公式為
(3)
在超網(wǎng)絡(luò)H中,超三角形被定義為由三個(gè)不同的節(jié)點(diǎn)和三條不同的超邊構(gòu)成的閉合序列,該序列表示為vi,Ep,vj,Eq,vk,Er,vi,其中三個(gè)節(jié)點(diǎn)彼此相鄰。長度為2的路指的是形如vi,Ep,vj,Eq,vk的序列,在路中所有節(jié)點(diǎn)和超邊都不能相同。
1.2.4 子圖中心度
中心性反映了網(wǎng)絡(luò)中各節(jié)點(diǎn)的相對重要性。子圖中心度定義為網(wǎng)絡(luò)中的節(jié)點(diǎn)在不同子圖中的參與情況。超網(wǎng)絡(luò)中節(jié)點(diǎn)i的子圖中心度是指超網(wǎng)絡(luò)H中起止于該節(jié)點(diǎn)的不同長度的閉合路徑之和。在文獻(xiàn)[23]中給出了節(jié)點(diǎn)的子圖中心度CSH(i)的計(jì)算公式。該公式為
(4)
其中,λj是超網(wǎng)絡(luò)H的鄰接矩陣A的特征值,U=(uij)N×N是一個(gè)正交矩陣,且滿足每一列都是特征值λj對應(yīng)的特征向量,這些向量構(gòu)成了N維歐幾里得空間的一個(gè)正交基。在已知各節(jié)點(diǎn)的子圖中心度的情況下,超網(wǎng)絡(luò)H的子圖中心度的計(jì)算公式為:
(5)
由式(5)可知,超網(wǎng)絡(luò)的子圖中心度與網(wǎng)絡(luò)規(guī)模N和鄰接矩陣A的特征值λj有關(guān)。
蛋白復(fù)合物數(shù)據(jù)來自數(shù)據(jù)庫CORUM(Comprehensive Resource of Mammalian protein complexes)[25]。該數(shù)據(jù)庫包含了2 314個(gè)人類蛋白質(zhì)以及它們之間相互作用形成的1 342個(gè)復(fù)合物?;谠摂?shù)據(jù)集,本文構(gòu)建了基于超圖結(jié)構(gòu)的超網(wǎng)絡(luò)模型。在該超網(wǎng)絡(luò)模型中,節(jié)點(diǎn)表示蛋白質(zhì),超邊表示多個(gè)蛋白質(zhì)構(gòu)成的復(fù)合物。該超網(wǎng)絡(luò)的構(gòu)造算法如下:
1)初始化。
超網(wǎng)絡(luò)中的節(jié)點(diǎn)為vi和超邊ek,其中i=1,2,3,…,n,k=1,2,3,…,m。
2)遞歸如下操作:
檢查超網(wǎng)絡(luò)中的所有節(jié)點(diǎn),若節(jié)點(diǎn)vi和節(jié)點(diǎn)vj在同一個(gè)復(fù)合物中,則將節(jié)點(diǎn)vi和vj添加到該復(fù)合物對應(yīng)的超邊ek中;
3)直至所有節(jié)點(diǎn)全部檢查完畢,算法結(jié)束。
根據(jù)蛋白質(zhì)復(fù)合物數(shù)據(jù)集和2.1節(jié)的構(gòu)造算法,本文構(gòu)建了蛋白復(fù)合物超網(wǎng)絡(luò)。由于該超網(wǎng)絡(luò)規(guī)模較大且復(fù)雜度較高,故本文僅給出了該超網(wǎng)絡(luò)的局部結(jié)構(gòu)示意圖。如圖1所示。圖1描述了86號蛋白質(zhì)構(gòu)成復(fù)合物的情況,用超邊的不同顏色區(qū)分它加入的不同復(fù)合物。86節(jié)點(diǎn)的超度值等于24,說明在該超網(wǎng)絡(luò)中有24個(gè)復(fù)合物包含86號蛋白質(zhì)。由于圖中每條超邊中的節(jié)點(diǎn)數(shù)并不一致,故該超網(wǎng)絡(luò)是一個(gè)非均勻超網(wǎng)絡(luò)。從構(gòu)建出的超網(wǎng)絡(luò)發(fā)現(xiàn)該蛋白復(fù)合物超網(wǎng)絡(luò)是不連通的,它有120個(gè)連通分支,其中主連通分支的節(jié)點(diǎn)為1 824,約占總節(jié)點(diǎn)的79%。在蛋白質(zhì)超網(wǎng)絡(luò)中,蛋白質(zhì)復(fù)合物有大有小,圖2表示3690號蛋白質(zhì)的示意圖,同樣,采用不同的超邊顏色區(qū)分加入的不同復(fù)合物,3690號蛋白質(zhì)的超度值等于27,說明在該超網(wǎng)絡(luò)中包含該蛋白質(zhì)的復(fù)合物有27種。比較圖1和圖2,可以看出86號蛋白構(gòu)成的復(fù)合物包含蛋白質(zhì)的數(shù)量較大,而3690號構(gòu)成復(fù)合物較小,這些復(fù)合物一般由3~4個(gè)蛋白質(zhì)組成。此外,由蛋白質(zhì)數(shù)據(jù)集可知,最大的復(fù)合物包含了143個(gè)蛋白質(zhì),而最小的復(fù)合物僅有一個(gè)蛋白質(zhì)。
圖1 蛋白質(zhì)復(fù)合超網(wǎng)絡(luò)的局部結(jié)構(gòu)示意圖
圖2 節(jié)點(diǎn)3690的示意圖
表1 蛋白質(zhì)超網(wǎng)絡(luò)的超度分布
圖3 蛋白質(zhì)復(fù)合超網(wǎng)絡(luò)的超度分布
在蛋白復(fù)合物超網(wǎng)絡(luò)中,節(jié)點(diǎn)的超度表示的是包含該蛋白質(zhì)的復(fù)合物的個(gè)數(shù),該參數(shù)是反映節(jié)點(diǎn)重要程度的指標(biāo),也是判斷是否為關(guān)鍵蛋白質(zhì)的重要依據(jù)。節(jié)點(diǎn)的超度分布P(DH)是指超度為DH的節(jié)點(diǎn)在網(wǎng)絡(luò)中所占的比例。表1給出了蛋白質(zhì)超網(wǎng)絡(luò)的超度分布情況。
從表1中不難發(fā)現(xiàn),在蛋白復(fù)合物超網(wǎng)絡(luò)中,絕大多數(shù)節(jié)點(diǎn)的超度值很小,其中超度小于5的節(jié)點(diǎn)幾乎占總節(jié)點(diǎn)的85%,說明在該超網(wǎng)絡(luò)中絕大多數(shù)蛋白質(zhì)構(gòu)成的復(fù)合物的數(shù)量很少。在生物學(xué)上通過對S.cerevisiae和E.Coil的移除分析已經(jīng)證實(shí),關(guān)鍵蛋白通常比其他蛋白具有更多的交互數(shù)量[19]。由此可知,關(guān)鍵節(jié)點(diǎn)(即關(guān)鍵蛋白質(zhì))的度通常高于非關(guān)鍵節(jié)點(diǎn)的度。在超網(wǎng)絡(luò)中,若僅根據(jù)節(jié)點(diǎn)的超度識別關(guān)鍵節(jié)點(diǎn),則蛋白質(zhì)超網(wǎng)絡(luò)僅有少量節(jié)點(diǎn)具有很高的超度,超度大的節(jié)點(diǎn)表明參與的復(fù)合物多,但并不代表與其他蛋白質(zhì)交互多,所以這些節(jié)點(diǎn)有可能是超網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)。分析實(shí)際數(shù)據(jù)集可知,節(jié)點(diǎn)360、361、437以及節(jié)點(diǎn)790可能是關(guān)鍵節(jié)點(diǎn),它們的超度值分別為53、38、49和33。
基于表1的數(shù)據(jù),圖3給出了蛋白復(fù)合物超網(wǎng)絡(luò)中節(jié)點(diǎn)的超度分布情況。由圖3可知,節(jié)點(diǎn)的超度分布服從于冪律分布,采用雙對數(shù)線性回歸方法擬合數(shù)據(jù)后發(fā)現(xiàn)Slope=-2.18,相關(guān)系數(shù)R2為0.914。由此可知,蛋白質(zhì)復(fù)合物超網(wǎng)絡(luò)具有明顯的無標(biāo)度特性。此外,該分布曲線與絕大多數(shù)無標(biāo)度網(wǎng)絡(luò)的度分布相似,具有明顯的胖尾現(xiàn)象,表明蛋白質(zhì)參與的復(fù)合物數(shù)量是非均勻的。由無標(biāo)度超網(wǎng)絡(luò)的形成機(jī)制[26]推斷,蛋白質(zhì)復(fù)合物超網(wǎng)絡(luò)的演化機(jī)制是完全擇優(yōu)連接,當(dāng)新的節(jié)點(diǎn)加入到該超網(wǎng)絡(luò)時(shí),一般會選擇與超度大的節(jié)點(diǎn)形成復(fù)合物,以提高自身的關(guān)鍵性,并且使得這些蛋白質(zhì)的超度越來越大,從而造成“富者越富”現(xiàn)象,最終使得節(jié)點(diǎn)的超度分布服從于冪律分布。
表2 蛋白質(zhì)復(fù)合物超網(wǎng)絡(luò)的度分布
在蛋白復(fù)合物網(wǎng)絡(luò)中,節(jié)點(diǎn)的度表示蛋白質(zhì)之間的聯(lián)系程度,關(guān)鍵蛋白通常比其他蛋白具有更多的交互數(shù)量,也就是說關(guān)鍵蛋白傾向于具有更高的節(jié)點(diǎn)度。針對蛋白復(fù)合物數(shù)據(jù)庫CORUM中的蛋白質(zhì)的度分布較為發(fā)散,使得無法給出完整的度分布情況。表2僅給出了該蛋白質(zhì)超網(wǎng)絡(luò)中排在前面的部分蛋白質(zhì)的度分布情況。
由表2可知,在蛋白復(fù)合物超網(wǎng)絡(luò)中,節(jié)點(diǎn)的度分布較為發(fā)散,各度值的比例都非常的小,其中度值為2的節(jié)點(diǎn)數(shù)最多,但其比例僅占10%。其次,絕大多數(shù)節(jié)點(diǎn)的度較小,只有少數(shù)節(jié)點(diǎn)具有很高的度值,例如度值小于4的節(jié)點(diǎn)數(shù)為731,幾乎占總節(jié)點(diǎn)數(shù)的三分之一。度值最高的節(jié)點(diǎn)是939號蛋白質(zhì),度為400,其次是節(jié)點(diǎn)360、361、790、1054和941,他們的度值為別為393、318、303、370和369。故將上述節(jié)點(diǎn)移除后,許多蛋白質(zhì)復(fù)合物將無法形成,從而使細(xì)胞的生物學(xué)功能受到影響,甚至使得生物體無法生存。
綜上所述可知,在蛋白質(zhì)超網(wǎng)絡(luò)中,若依據(jù)節(jié)點(diǎn)的超度判斷,則節(jié)點(diǎn)360、361、437以及790為關(guān)鍵節(jié)點(diǎn);而若根據(jù)節(jié)點(diǎn)的度值判斷,則節(jié)點(diǎn)939、360、361、790、1054和941為關(guān)鍵節(jié)點(diǎn)。出現(xiàn)上述2種不同判斷結(jié)果的原因在于節(jié)點(diǎn)超度的大小僅與超邊的數(shù)量(即參與的復(fù)合物)有關(guān),而節(jié)點(diǎn)度的大小與超邊的數(shù)量以及每條超邊內(nèi)部的節(jié)點(diǎn)數(shù)有關(guān)(因超邊內(nèi)節(jié)點(diǎn)是全連接)。以節(jié)點(diǎn)939為例,該節(jié)點(diǎn)的超度值為15,但其度值卻為400,說明該節(jié)點(diǎn)參與構(gòu)成的復(fù)合物包含蛋白質(zhì)的數(shù)量較大?;谶@一原因,使得該節(jié)點(diǎn)在超度值遠(yuǎn)小于節(jié)點(diǎn)360的情況下,仍然能夠成為該超網(wǎng)絡(luò)中度值最大的節(jié)點(diǎn)。在超網(wǎng)絡(luò)結(jié)構(gòu)中,由于節(jié)點(diǎn)具有度和超度兩個(gè)指標(biāo),故若根據(jù)節(jié)點(diǎn)的超度和度兩個(gè)指標(biāo)判斷,則節(jié)點(diǎn)360、361以及790為關(guān)鍵節(jié)點(diǎn)。
基于完整度分布數(shù)據(jù),圖4給出了蛋白質(zhì)超網(wǎng)絡(luò)的度分布圖。由圖4可知,當(dāng)度值處在(0,70]之間時(shí),盡管分布曲線存在一定的波動,但其整體趨勢是下降的;當(dāng)度值大于70時(shí),該分布曲線的整體趨勢呈現(xiàn)出先升高后下降的趨勢,原因在于極個(gè)別度值的節(jié)點(diǎn)數(shù)較大,特別是度值為124的節(jié)點(diǎn)有50個(gè),曲線在此處出現(xiàn)了第二個(gè)峰值。
為了能夠?qū)Ρ确治龅鞍踪|(zhì)復(fù)合物超網(wǎng)絡(luò)中的度和超度的值,圖5給出了部分節(jié)點(diǎn)相對度的對比情況,其中RDi表示相對度,i表示節(jié)點(diǎn)序號,方框表示度,圓圈表示超度。相對度是指節(jié)點(diǎn)的超度(度)值除以超網(wǎng)絡(luò)的最大超度(度)值。從圖5不難發(fā)現(xiàn),首先,度值在節(jié)點(diǎn)939處達(dá)到最大值,而超度卻在360處達(dá)到最大值。在蛋白復(fù)合物超網(wǎng)絡(luò)中,超度值排在前十的大部分節(jié)點(diǎn),其度值卻未出現(xiàn)在前十中。這種情況與Estrada等在文獻(xiàn)[23]中關(guān)于“生成圖”合作網(wǎng)絡(luò)的描述相一致。出現(xiàn)這種情況的原因在于節(jié)點(diǎn)超度的大小僅與超邊的數(shù)量(即參與的復(fù)合物)有關(guān),而節(jié)點(diǎn)度的大小不僅與超邊的數(shù)量有關(guān),還取決于超邊內(nèi)部的節(jié)點(diǎn)數(shù)。
圖4 蛋白復(fù)合物超網(wǎng)絡(luò)的度分布
圖5 蛋白質(zhì)復(fù)合超網(wǎng)絡(luò)超度和度的對比圖
圖6 子超圖和子圖中心性對比圖
從節(jié)點(diǎn)的超度與度是無法全面準(zhǔn)確地判斷出超網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),因此僅分析節(jié)點(diǎn)的超度和度是遠(yuǎn)遠(yuǎn)不夠的,而子圖中心度也是判斷關(guān)鍵蛋白的重要指標(biāo)。文獻(xiàn)[20]中指出,從結(jié)構(gòu)上看,子圖中心度比度更能夠提供關(guān)鍵蛋白的重要信息。圖6描述了蛋白復(fù)合物超網(wǎng)絡(luò)中部分節(jié)點(diǎn)的相對子圖中心度情況,其中RCi表示相對子圖中心度,i為節(jié)點(diǎn)序號,方框表示超網(wǎng)絡(luò),圓圈表示復(fù)雜網(wǎng)絡(luò)。由圖6可知,超網(wǎng)絡(luò)的子圖中心度在節(jié)點(diǎn)941處達(dá)到最大值,而節(jié)點(diǎn)1054是其對應(yīng)復(fù)雜網(wǎng)絡(luò)中相對子圖中心度最大的節(jié)點(diǎn),且節(jié)點(diǎn)941也具有很大的相對值。此外,兩條曲線的整體趨勢完全不同,說明在超網(wǎng)絡(luò)和其對應(yīng)復(fù)雜網(wǎng)絡(luò)中大部分節(jié)點(diǎn)的相對子圖中心度的差值較大。在蛋白質(zhì)超網(wǎng)絡(luò)中子圖中心度排在前十的大多數(shù)節(jié)點(diǎn),其在復(fù)雜網(wǎng)絡(luò)中對應(yīng)的數(shù)值卻沒有排在前十中。依據(jù)超網(wǎng)絡(luò)中節(jié)點(diǎn)的子圖中心度判斷關(guān)鍵蛋白,則節(jié)點(diǎn)939、941和節(jié)點(diǎn)1054為該超網(wǎng)絡(luò)的關(guān)鍵蛋白。由此可得,超網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)的子圖中心度區(qū)別比復(fù)雜網(wǎng)絡(luò)更明顯,在識別關(guān)鍵節(jié)點(diǎn)的時(shí)候更加有效、合理。根據(jù)式(5)計(jì)算可知,蛋白復(fù)合物超網(wǎng)絡(luò)的平均子圖中心性為6.556×1082,其對應(yīng)的復(fù)雜網(wǎng)絡(luò)的結(jié)果為2.443 1×1060。
蛋白質(zhì)的關(guān)鍵性與其在超網(wǎng)絡(luò)中對應(yīng)節(jié)點(diǎn)的拓?fù)涮匦悦芮邢嚓P(guān),而節(jié)點(diǎn)的超度、度和子圖中心度是反映節(jié)點(diǎn)的拓?fù)涮匦缘闹匾獏?shù)。在蛋白質(zhì)網(wǎng)絡(luò)中,單個(gè)參數(shù)只能從某個(gè)方面反映節(jié)點(diǎn)的部分信息,而尋找一個(gè)能夠全面反映節(jié)點(diǎn)的拓?fù)涮匦缘莫?dú)立參數(shù)非常困難。因此,文獻(xiàn)[21]中提出了一種基于復(fù)合參數(shù)識別關(guān)鍵蛋白的思想,復(fù)合參數(shù)是依據(jù)兩種或兩種以上參數(shù)評判下都位于關(guān)鍵蛋白位置的節(jié)點(diǎn)才識別為網(wǎng)絡(luò)中的關(guān)鍵蛋白?;谠撍枷耄舾鶕?jù)節(jié)點(diǎn)的超度與度的復(fù)合參數(shù)判斷,則節(jié)點(diǎn)360、361、790和939是該超網(wǎng)絡(luò)的關(guān)鍵蛋白;若根據(jù)節(jié)點(diǎn)的度和子圖中心性的復(fù)合參數(shù)判斷,則節(jié)點(diǎn)939、941和1054為超網(wǎng)絡(luò)的關(guān)鍵蛋白;若根據(jù)節(jié)點(diǎn)的超度和子圖中心性的復(fù)合參數(shù)判斷,則節(jié)點(diǎn)939是超網(wǎng)絡(luò)的關(guān)鍵蛋白。但如果基于節(jié)點(diǎn)的超度、度和子圖中心性的復(fù)合參數(shù)判斷,則節(jié)點(diǎn)939為超網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)。
必需基因是生物體正常存活所必不可少的基因,這些基因的突變會引起生物體的死亡。有些基因的必需性是條件依賴性的。例如,編碼淀粉分解酶的基因只有在淀粉是唯一的能量來源時(shí),是必需基因。必需基因所編碼的蛋白是生物體正常存活的關(guān)鍵蛋白。為了驗(yàn)證我們所找到的超網(wǎng)絡(luò)中的關(guān)鍵蛋白是否對應(yīng)生物體的關(guān)鍵蛋白,我們查詢了在線基因必需性數(shù)據(jù)庫[27]。表3列出了我們用不同方法從超網(wǎng)絡(luò)中識別出的關(guān)鍵蛋白。從該表可以看出,我們識別的關(guān)鍵蛋白都是必需基因或條件依賴性的必需基因。尤其是用復(fù)合方法識別到的939號蛋白就是必需基因編碼的蛋白。
續(xù)表3Tab.3(Cont.)
評判方法節(jié)點(diǎn)序號蛋白ID蛋白名稱基因必需性度值939SNRPD1Small nuclear ribonucleoprotein Sm D1essential360HDAC1Histoconditionaldeacetylase 1conditional361HDAC2Histoconditionaldeacetylase 2conditional790RBBP4Histoconditional-binding protein RBBP4essential941SNRPD3Small nuclear ribonucleoprotein Sm D3conditional1054U2AF1Splicing factor U2AF 35 kDa subunitconditional子圖中心性939SNRPD1Small nuclear ribonucleoprotein Sm D1essential941SNRPD3Small nuclear ribonucleoprotein Sm D3conditional1054U2AF1Splicing factor U2AF 35 kDa subunitconditional936SNRPBSmall nuclear ribonucleoprotein-associated proteins B and B′essential超度和度的復(fù)合參數(shù)360HDAC1Histoconditionaldeacetylase 1conditional361HDAC2Histoconditionaldeacetylase 2conditional790RBBP4Histoconditional-binding protein RBBP4essential939SNRPD1Small nuclear ribonucleoprotein Sm D1essential度和子圖中心性的復(fù)合參數(shù)939SNRPD1Small nuclear ribonucleoprotein Sm D1essential941SNRPD3Small nuclear ribonucleoprotein Sm D3conditional1054U2AF1Splicing factor U2AF 35 kDa subunitconditional超度和子圖中心性的復(fù)合參數(shù)939SNRPD1Small nuclear ribonucleoprotein Sm D1essential超度、度和子圖中心性的復(fù)合參數(shù)939SNRPD1Small nuclear ribonucleoprotein Sm D1essential
本文基于蛋白復(fù)合物數(shù)據(jù)庫CORUM的數(shù)據(jù),構(gòu)建了一個(gè)以蛋白質(zhì)為節(jié)點(diǎn),以復(fù)合物為超邊的超網(wǎng)絡(luò)模型,并研究分析蛋白質(zhì)復(fù)合物超網(wǎng)絡(luò)的結(jié)構(gòu)特征。利用矩陣?yán)碚摵统W(wǎng)絡(luò)思想,計(jì)算并分析了超網(wǎng)絡(luò)中節(jié)點(diǎn)的度和超度、子圖中心度拓?fù)鋮?shù)的結(jié)果。結(jié)果表明節(jié)點(diǎn)的超度分布服從于冪律分布,而度分布卻不滿足任何形式的分布特征。此外,本文采用復(fù)合參數(shù)思想識別超網(wǎng)絡(luò)的關(guān)鍵蛋白質(zhì)。通過分析節(jié)點(diǎn)的超度、度以及子圖中性可知,節(jié)點(diǎn)939(即6632號蛋白質(zhì))為該蛋白質(zhì)復(fù)合物超網(wǎng)絡(luò)的關(guān)鍵蛋白。當(dāng)該節(jié)點(diǎn)被移除后,其構(gòu)成的復(fù)合物的功能可能會喪失,并且網(wǎng)絡(luò)的連通性也會下降。以上分析表明,采用超網(wǎng)絡(luò)方法研究蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)涮匦詴r(shí)切實(shí)可行。本文為今后將超網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)用于其他網(wǎng)絡(luò)的研究提供了思路和參考。