• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      格蘭杰因果關(guān)系在復(fù)雜網(wǎng)絡(luò)中的應(yīng)用*

      2013-08-06 00:31:32王芳娟
      關(guān)鍵詞:格蘭杰網(wǎng)絡(luò)結(jié)構(gòu)因果關(guān)系

      王芳娟

      (浙江師范大學(xué)數(shù)理與信息工程學(xué)院,浙江金華 321004)

      0 引 言

      格蘭杰因果關(guān)系在經(jīng)濟(jì)、生物、計(jì)算神經(jīng)科學(xué)等領(lǐng)域已有廣泛的應(yīng)用.其中,對(duì)于二維的時(shí)間序列,可以直接用兩變量格蘭杰因果關(guān)系分析數(shù)據(jù)之間的內(nèi)在聯(lián)系.但對(duì)于多維的時(shí)間序列,用兩變量格蘭杰因果關(guān)系已不能正確判斷變量之間的關(guān)系是直接的還是間接的,因此提出了條件格蘭杰因果關(guān)系[1].在實(shí)際應(yīng)用中,若把外部公共輸入和隱變量的影響因素考慮在內(nèi),則要用到偏相關(guān)格蘭杰因果關(guān)系才能真正刻畫變量之間的內(nèi)在聯(lián)系[1].

      格蘭杰因果關(guān)系是一種很常用的分析方法,在研究變量之間的因果關(guān)系時(shí),通常情況下要求變量的時(shí)間序列的長(zhǎng)度遠(yuǎn)遠(yuǎn)大于變量個(gè)數(shù)[1-2],此時(shí),格蘭杰因果關(guān)系法效果顯著.但在實(shí)際應(yīng)用中,可以提取到的時(shí)間序列長(zhǎng)度是有限的,對(duì)于數(shù)以萬(wàn)計(jì)的蛋白質(zhì)、基因變量,每個(gè)變量可以測(cè)量到的時(shí)間序列長(zhǎng)度相當(dāng)短.此時(shí),變量維數(shù)比時(shí)間序列長(zhǎng)度要大,若仍然用通常的格蘭杰因果關(guān)系法研究變量之間的內(nèi)在因果關(guān)系,就會(huì)得到錯(cuò)誤的結(jié)論.為了解決這個(gè)問(wèn)題,將提出一種新的方法,在兩變量格蘭杰因果關(guān)系、條件格蘭杰因果關(guān)系和偏相關(guān)格蘭杰因果關(guān)系的基礎(chǔ)上,把簡(jiǎn)單的格蘭杰因果關(guān)系應(yīng)用到復(fù)雜網(wǎng)絡(luò)中.從模擬數(shù)據(jù)的結(jié)果可以看出:該方法能比較有效地揭示復(fù)雜網(wǎng)絡(luò)中變量之間真實(shí)的內(nèi)在聯(lián)系.

      1 預(yù)備知識(shí)

      1.1 線性偏相關(guān)格蘭杰因果關(guān)系

      兩變量格蘭杰因果關(guān)系和條件格蘭杰因果關(guān)系廣泛應(yīng)用于實(shí)際數(shù)據(jù)處理過(guò)程中.然而,這2種方法都沒(méi)有考慮到外部輸入和隱變量的影響.如果在實(shí)際分析時(shí)不將這些因素考慮在內(nèi),那么得到的網(wǎng)絡(luò)結(jié)構(gòu)可能是不正確的.為了更好地處理實(shí)際數(shù)據(jù)中出現(xiàn)的外部輸入和隱變量的影響,提出了線性偏相關(guān)格蘭杰因果關(guān)系[1].

      考慮2個(gè)時(shí)間序列Xt和Zt,它們的聯(lián)合自回歸表示為

      其中:εit為白噪聲;為外部輸入;Bi(L為隱變量;i=1,2.

      令ui(t)=εit++Bi(L),i=1,2,則誤差項(xiàng)協(xié)方差矩陣為

      若考慮3個(gè)變量Xt,Yt和Zt,它們之間的聯(lián)合自回歸模型為

      對(duì)S,若不考慮u2(t)=的影響,則u1t的方差可以表示為

      對(duì)Σ,類似地可以考慮去除u5(t)=ε5t+εE5t+B5(L)εL5t的影響,則u3t的方差可以表示為

      定義1 Z條件下,Y對(duì)X的偏相關(guān)格蘭杰因果關(guān)系為

      1.2 Bootstrap 方法

      Bootstrap法類似重復(fù)抽樣法,先對(duì)原始的數(shù)據(jù)擬合向量自回歸模型[3],利用最小二乘估計(jì)法[3]計(jì)算其系數(shù)矩陣A和誤差項(xiàng)方差E;再利用已知條件,構(gòu)造系數(shù)矩陣為A、誤差項(xiàng)均值為0、方差為E的多元正態(tài)分布白噪聲模型,共模擬M(M=500)次,每次計(jì)算相應(yīng)的因果關(guān)系或偏相關(guān)因果值.其中,3倍的σ(均方差)作為置信區(qū)間,若置信區(qū)間下限小于0,則表示因果關(guān)系不存在,否則,存在因果關(guān)系.

      2 格蘭杰因果關(guān)系在復(fù)雜網(wǎng)絡(luò)中的應(yīng)用

      一般情況下,格蘭杰因果關(guān)系主要用于研究簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu).在計(jì)算過(guò)程中,用最小二乘法估計(jì)多變量向量自回歸模型(MVAR)的參數(shù)時(shí),在理論上有一個(gè)約束條件,即每個(gè)時(shí)間序列長(zhǎng)度要大于模型中估計(jì)的參數(shù)個(gè)數(shù),對(duì)于一個(gè)一階的模型,時(shí)間序列長(zhǎng)度要大于變量個(gè)數(shù)的平方[2].但在實(shí)際應(yīng)用中,對(duì)于數(shù)以萬(wàn)計(jì)的蛋白質(zhì)、基因變量,每個(gè)變量可以測(cè)量到的時(shí)間序列長(zhǎng)度相當(dāng)短.當(dāng)變量個(gè)數(shù)超過(guò)時(shí)間序列長(zhǎng)度時(shí),就會(huì)出現(xiàn)“維數(shù)災(zāi)難”,通常的格蘭杰因果關(guān)系就會(huì)失效.為了解決這個(gè)問(wèn)題,提出了一種利用格蘭杰因果關(guān)系法進(jìn)行迭代計(jì)算的復(fù)雜網(wǎng)絡(luò)研究方法.

      2.1 有關(guān)概念

      在有向網(wǎng)絡(luò)圖中,將對(duì)目標(biāo)節(jié)點(diǎn)T有直接或間接作用的所有節(jié)點(diǎn)統(tǒng)稱為節(jié)點(diǎn)T的源節(jié)點(diǎn);并將所有對(duì)目標(biāo)節(jié)點(diǎn)T有直接作用的節(jié)點(diǎn)統(tǒng)稱為節(jié)點(diǎn)T的父節(jié)點(diǎn).對(duì)任何一個(gè)給定的目標(biāo)節(jié)點(diǎn)T,若可以找到所有對(duì)它有直接作用的節(jié)點(diǎn)(即父節(jié)點(diǎn)),則可構(gòu)造出整個(gè)網(wǎng)絡(luò).因此,對(duì)于給定一個(gè)目標(biāo)節(jié)點(diǎn)T,希望找到它所有的父節(jié)點(diǎn).圖1(a)表示一個(gè)包含目標(biāo)節(jié)點(diǎn)T和它所有源節(jié)點(diǎn)的網(wǎng)絡(luò).假設(shè){X1,X2,…,Xn}中的每個(gè)點(diǎn)到目標(biāo)節(jié)點(diǎn)T只有1條路徑,{Y1,Y2,…,Yn}中的每個(gè)點(diǎn)到目標(biāo)節(jié)點(diǎn)T有2條不同的路徑.圖1(b)中通過(guò)1條路徑連接的間接點(diǎn)都被刪除了,剩下的間接點(diǎn)Y1,Y2,…,Yn通過(guò)2條不同路徑連接.圖1(c)中通過(guò)1條路徑和2條不同路徑連接的間接點(diǎn)都被刪除了,只剩下目標(biāo)節(jié)點(diǎn)T的父節(jié)點(diǎn)T1,T2,T3.

      圖1 目標(biāo)節(jié)點(diǎn)T的父節(jié)點(diǎn)的篩選步驟圖

      2.2 具體算法

      首先,應(yīng)用兩變量格蘭杰因果關(guān)系,尋找目標(biāo)節(jié)點(diǎn)T的所有源節(jié)點(diǎn),用點(diǎn)集A0(T)表示.在圖1(a)中,A0(T)={T1,T2,T3,X1,X2,…,Xn,Y1,Y2,…,Yn}.

      其次,進(jìn)一步檢測(cè)第1步中找到的連接是直接的還是間接的.執(zhí)行如下迭代過(guò)程[4]:

      1)對(duì) A0(T)中的每個(gè)節(jié)點(diǎn) a∈{T1,T2,T3,X1,X2,…,Xn,Y1,Y2,…,Yn},計(jì)算所有 a→T|b(b∈A0(T),b≠a)的偏相關(guān)格蘭杰因果關(guān)系值.若經(jīng)計(jì)算存在某個(gè)b∈A0(T),b≠a,使得a→T|b的偏相關(guān)格蘭杰因果關(guān)系值用Bootstrap法(M=500)計(jì)算得到的3δ置信區(qū)間下限小于0,則表示a→T的連接是間接的,它們之間不存在直接連接,把a(bǔ)從A0(T)中刪除.重復(fù)上述步驟,刪除所有通過(guò)1條路徑連接的間接點(diǎn).圖1(a)中,{X1,X2,…,Xn}是通過(guò)單一路徑連接的間接點(diǎn)集,將其從A0(T)中刪除,剩下的點(diǎn)構(gòu)成一個(gè)新的點(diǎn)集,記為 A1(T)={T1,T2,T3,Y1,Y2,…,Yn}.

      2)對(duì) A1(T)中的每個(gè)節(jié)點(diǎn) a∈{T1,T2,T3,Y1,Y2,…,Yn},按上述方法計(jì)算所有 a→T|b,c(b,c∈A1(T),c≠a;b≠c)的偏相關(guān)格蘭杰因果關(guān)系值,其中,b和c的組合共C2n+2種.從而刪除通過(guò)2條路徑連接的間接點(diǎn).圖1(b)中,{Y1,Y2,…,Yn}是通過(guò)2條不同路徑連接的間接點(diǎn)集,將其從A1(T)中刪除,剩下的新點(diǎn)集為 A2(T)={T1,T2,T3}.

      3)繼續(xù)上述步驟,直到不能再?gòu)狞c(diǎn)集Ak(T)中移去任何點(diǎn)為止[4].

      2.3 基本原理

      若計(jì)算得到的兩變量格蘭杰因果關(guān)系值FY→X很大,但在第3個(gè)變量Z條件下,偏相關(guān)格蘭杰因果關(guān)系值FY→X|Z顯著降低,則表示Y→X的連接是間接的,應(yīng)刪除.利用這個(gè)原理,可以尋找每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn).

      第1階段,先用兩變量格蘭杰因果關(guān)系法,找出使得Y→X的因果值比較大的所有節(jié)點(diǎn)Y,構(gòu)成候選集A0.

      第2階段,過(guò)濾點(diǎn)集A0,保留Y∈A0,滿足在任意一個(gè)剩余變量Z∈A0,Z≠Y條件下的偏相關(guān)格蘭杰因果關(guān)系值FY→X|Z都很大,得到剩余點(diǎn)集A1.

      第3階段,利用新點(diǎn)集A1,再次過(guò)濾點(diǎn)集A1,保留Y∈A1,滿足在任意2個(gè)剩余變量Z1,Z2∈A0(Z1,Z2≠Y;Z1≠Z2)條件下的偏相關(guān)格蘭杰因果關(guān)系值FY→X|Z1,Z2都很大,得到剩余點(diǎn)集A2.

      第4階段,再利用點(diǎn)集A2,以其中任意3個(gè)不同剩余變量為條件,繼續(xù)上述步驟,直到這種迭代進(jìn)行不下去為止.

      通過(guò)上述迭代步驟,將格蘭杰因果關(guān)系法應(yīng)用到復(fù)雜網(wǎng)絡(luò)中,使得每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一列父節(jié)點(diǎn),就可以得到復(fù)雜網(wǎng)絡(luò)的因果關(guān)系圖.

      3 數(shù)值模擬

      下面驗(yàn)證本文方法在復(fù)雜網(wǎng)絡(luò)中應(yīng)用的有效性(能否用格蘭杰因果關(guān)系法正確刻畫長(zhǎng)度有限的多變量之間的因果關(guān)系).首先,利用一個(gè)模擬的例子(由12個(gè)時(shí)間序列組成)來(lái)進(jìn)一步說(shuō)明.其次,利用例子擬合的多維數(shù)據(jù),將本文的新方法和簡(jiǎn)單網(wǎng)絡(luò)中的偏相關(guān)格蘭杰因果關(guān)系法的計(jì)算結(jié)果進(jìn)行比較.

      例1 假設(shè)12個(gè)變量的時(shí)間序列由如下的動(dòng)力方程確定:

      其中,εi(i=1,2,…,12)是相互獨(dú)立、均值為0、方差為1的白噪聲.由這個(gè)模型直接可得12個(gè)變量之間的因果關(guān)系,如圖2(b)所示,共有18條連接邊.取模型中每個(gè)變量的200個(gè)時(shí)間點(diǎn)作為擬合數(shù)據(jù),所得數(shù)據(jù)軌跡如圖2(a)所示.為了增加可視性,將X1,X2,…,X12進(jìn)行了平移,依次從下到上排列.

      圖2 數(shù)據(jù)的軌跡及相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)

      利用上述方法研究該擬合數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu).先對(duì)數(shù)據(jù)計(jì)算兩變量格蘭杰因果關(guān)系值,用Bootstrap法得到的連接圖如圖3(a)所示,共有95條連接邊,比真實(shí)的網(wǎng)絡(luò)多出很多邊,原因是兩變量格蘭杰因果關(guān)系不能區(qū)分連接是直接的還是間接的,在其中混雜了許多間接連接的邊.

      接著,按上述迭代步驟,依次計(jì)算1個(gè)、2個(gè)變量條件下的偏相關(guān)格蘭杰因果關(guān)系值,分別用于除去通過(guò)1條、2條路徑連接的間接點(diǎn),用Bootstrap法后所得的結(jié)果如圖3(b)和(c)所示,分別有19條和18條邊.它們和圖3(a)相比已經(jīng)去掉了很大一部分間接連接邊,比較接近真實(shí)結(jié)構(gòu).說(shuō)明該模擬數(shù)據(jù)利用上述迭代步驟可以比較正確地判別出網(wǎng)絡(luò)結(jié)構(gòu).

      最后,作為比較,對(duì)12個(gè)變量?jī)蓛芍g直接計(jì)算偏相關(guān)格蘭杰因果關(guān)系值(對(duì)研究的2個(gè)變量,以其他剩余的所有變量為條件),用Bootstrap法后所得的網(wǎng)絡(luò)結(jié)構(gòu)如圖3(d)所示,與真實(shí)的網(wǎng)絡(luò)結(jié)構(gòu)相比缺少一些連接邊.該方法所得結(jié)果和真實(shí)結(jié)構(gòu)相比誤差比較大.這是由于模型的階為4,在模型中要估計(jì)的參數(shù)總數(shù)是12×12×4=576,而已有的時(shí)間序列長(zhǎng)度只有200,不足以用它來(lái)估計(jì)所有參數(shù),導(dǎo)致計(jì)算得到錯(cuò)誤的因果連接.

      圖3(A),(B),(C),(D)表示網(wǎng)絡(luò)圖 3(a),(b),(c),(d)的關(guān)系圖.若某種關(guān)系(行指標(biāo)表示原因,列指標(biāo)表示結(jié)果)經(jīng)Bootstrap法得到的置信區(qū)間下限小于0,則為黑色,表示變量之間沒(méi)有因果關(guān)系;若下限大于0,則為白色,表示變量之間有因果關(guān)系存在.

      圖3 不同方法所得的網(wǎng)絡(luò)結(jié)構(gòu)圖

      4 結(jié) 語(yǔ)

      在實(shí)際應(yīng)用中,研究的網(wǎng)絡(luò)通常是多變量復(fù)雜網(wǎng)絡(luò),此時(shí)直接應(yīng)用偏相關(guān)格蘭杰因果關(guān)系得到的結(jié)果往往是不穩(wěn)定的,與真實(shí)的網(wǎng)絡(luò)結(jié)構(gòu)存在很大偏差.為了解決“維數(shù)災(zāi)難”這個(gè)難題,把格蘭杰因果關(guān)系法應(yīng)用到復(fù)雜網(wǎng)絡(luò)中,基于兩變量格蘭杰因果關(guān)系、條件格蘭杰因果關(guān)系、偏相關(guān)格蘭杰因果關(guān)系,用迭代法一步步除去通過(guò)1條單一路徑、2條不同路徑等的間接連接,直至除去所有間接連接.最后剩下每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn),從而構(gòu)造出相應(yīng)復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu).格蘭杰因果關(guān)系在復(fù)雜網(wǎng)絡(luò)中的迭代應(yīng)用是對(duì)通常格蘭杰因果關(guān)系的優(yōu)化,彌補(bǔ)了其對(duì)維數(shù)限制的不足.該方法對(duì)今后利用格蘭杰因果關(guān)系法研究其他各種復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)有很大的幫助.

      [1]Guo Shuixia,Seth A K,Kendriek K M,et al.Partial granger causality-eliminating exogenous inputs and latent variables[J].Journal of Neuroscience Methods,2008,172(1):79-93.

      [2]Gopikrishna D,Stephan L C,George A J,et al.Multivariate granger causality analysis of fMRI data[J].Human Brain Mapping,2009,30(4):1361-1373.

      [3]何書元.應(yīng)用時(shí)間序列分析[M].北京:北京大學(xué)出版社,2003:300-305.

      [4]Zou Cunlu,Christophe L,Guo Shuixia,et al.Identifying interactions in the time and frequency domains in local and global networks:A granger causality approach[J].BMC Bioinformatics,2010,11:337-341.

      猜你喜歡
      格蘭杰網(wǎng)絡(luò)結(jié)構(gòu)因果關(guān)系
      玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
      做完形填空題,需考慮的邏輯關(guān)系
      幫助犯因果關(guān)系芻議
      基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
      知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)維對(duì)于創(chuàng)新績(jī)效的作用機(jī)制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
      滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實(shí)證分析
      復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對(duì)算法研究進(jìn)展
      格蘭杰因果關(guān)系在神經(jīng)科學(xué)領(lǐng)域的發(fā)展及缺陷
      電子科技(2015年8期)2015-12-18 13:17:56
      介入因素對(duì)因果關(guān)系認(rèn)定的影響
      榜單
      太湖县| 会泽县| 望谟县| 仙居县| 龙口市| 五莲县| 边坝县| 怀化市| 澄江县| 宿迁市| 鄄城县| 三门县| 华坪县| 海丰县| 江源县| 德庆县| 胶南市| 连州市| 石首市| 蒙山县| 华阴市| 海南省| 繁昌县| 山东省| 延边| 突泉县| 山东省| 青冈县| 平湖市| 双流县| 个旧市| 绥江县| 宁陕县| 宝丰县| 桐乡市| 凤翔县| 嵩明县| 镇原县| 南召县| 英德市| 正阳县|