• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向非平穩(wěn)時(shí)間序列的因果關(guān)系發(fā)現(xiàn)算法

      2024-03-08 03:51:42周嘉穎周躍進(jìn)
      關(guān)鍵詞:時(shí)滯因果關(guān)系分析法

      周嘉穎,周躍進(jìn)

      (安徽理工大學(xué)數(shù)學(xué)與大數(shù)據(jù)學(xué)院,安徽 淮南 232001)

      0 引言

      時(shí)間序列數(shù)據(jù)是指在相同間隔的時(shí)間段內(nèi),觀察某個(gè)研究對(duì)象的數(shù)據(jù)變化過(guò)程及將這些數(shù)據(jù)按照時(shí)間先后順序排列所形成的序列數(shù)據(jù)。在日常生活中,時(shí)間序列數(shù)據(jù)廣泛存在于農(nóng)業(yè)、醫(yī)學(xué)、工業(yè)等多個(gè)領(lǐng)域[1-3]。隨著大數(shù)據(jù)時(shí)代的不斷發(fā)展,產(chǎn)生了海量、非平穩(wěn)、非線性的時(shí)間序列數(shù)據(jù),這為挖掘其有效信息增加了難度。因此,挖掘復(fù)雜時(shí)間序列數(shù)據(jù)的潛在信息,揭示未來(lái)發(fā)展規(guī)律,成為當(dāng)前一個(gè)重要研究方向。

      分析事物或現(xiàn)象之間的因果關(guān)系是現(xiàn)實(shí)中的常見(jiàn)問(wèn)題,例如分析大腦不同區(qū)域間因果關(guān)系以構(gòu)建大腦網(wǎng)絡(luò)[4]和分析商品價(jià)格與房產(chǎn)價(jià)格之間的雙向因果關(guān)系[5]等。由于時(shí)間序列的時(shí)序性,通過(guò)了解時(shí)序變量之間的因果關(guān)系,預(yù)測(cè)事物或現(xiàn)象的發(fā)展情況,因此因果關(guān)系分析方法得到廣大學(xué)者關(guān)注。GRANGER[6]首次提出了Granger因果關(guān)系分析法,是一種判別二元時(shí)間序列之間是否存在因果關(guān)系的方法,其關(guān)鍵假設(shè)是:(1)因果關(guān)系產(chǎn)生的過(guò)程可以用一組結(jié)構(gòu)方程來(lái)表示;(2)任何時(shí)間點(diǎn)產(chǎn)生的因果效應(yīng)均受到過(guò)去時(shí)間點(diǎn)的影響。由于傳統(tǒng)的Granger因果關(guān)系分析法只能用于判別二元線性時(shí)間序列,因此出現(xiàn)了大量改進(jìn)模型。GEWEKE[7]提出了條件Granger因果模型,用于判別多元時(shí)間序列之間的因果關(guān)系。Granger因果關(guān)系通常是在線性系統(tǒng)的背景下研究的,隨著研究的深入,學(xué)者們開(kāi)始探索在非線性系統(tǒng)中的因果關(guān)系。ANCONA等[8]在Granger因果關(guān)系和徑向基函數(shù)的基礎(chǔ)上提出了可用于判別非線性時(shí)間序列的RBF-Granger因果模型。

      傳統(tǒng)的Granger因果關(guān)系分析法及其推廣分析法只能給出定性分析結(jié)果,分析高維時(shí)間序列時(shí)容易產(chǎn)生虛假的因果關(guān)系?;诖?SCHREIBER[9]首次提出了轉(zhuǎn)移熵的概念,一種基于信息理論的因果關(guān)系分析法,可以捕獲時(shí)間序列的非線性特征和定量分析因果關(guān)系的強(qiáng)弱。在Granger因果關(guān)系分析法和轉(zhuǎn)移熵因果關(guān)系分析法中,均假設(shè)時(shí)間序列的因果關(guān)系都受到原因的影響且時(shí)滯是固定的,受固定滯后時(shí)間序列影響仍然存在于Granger因果關(guān)系和轉(zhuǎn)移熵結(jié)果中。因果關(guān)系之間的時(shí)滯是固定的假設(shè)對(duì)于現(xiàn)實(shí)生活中自然和社會(huì)現(xiàn)象來(lái)說(shuō)是過(guò)于絕對(duì)的,時(shí)間序列的時(shí)滯并不是固定的,不同情況下時(shí)滯會(huì)隨時(shí)間變化,一組時(shí)間序列可以由多組原因序列影響。因此,AMORNBUNCHORNVEJ[10]提出了一種時(shí)滯可變的轉(zhuǎn)移熵(Variable-Lag Transfer Entropy,VL-TE),可以分析具有任意時(shí)滯時(shí)間序列之間的因果關(guān)系,轉(zhuǎn)移熵值越大,其因果關(guān)系越強(qiáng)。

      傳統(tǒng)的Granger因果關(guān)系分析法及其推廣分析法、轉(zhuǎn)移熵法及VL-TE法只能分析平穩(wěn)時(shí)間序列間的因果關(guān)系,而不能直接分析非平穩(wěn)時(shí)間序列之間的關(guān)系。為了解決此問(wèn)題,本文提出一種基于分段聚合近似可變時(shí)滯轉(zhuǎn)移熵(Piecewise Aggregate Approximated Variable-Lag Transfer Entropy, PAAVL-TE)因果關(guān)系發(fā)現(xiàn)算法。該算法利用分段聚合近似法對(duì)時(shí)間序列進(jìn)行轉(zhuǎn)換,提取時(shí)間序列的特征信息,使用動(dòng)態(tài)時(shí)間彎曲距離尋找相似程度最高的時(shí)間序列進(jìn)行轉(zhuǎn)移熵的計(jì)算,能夠?qū)崿F(xiàn)在具有可變時(shí)滯的非平穩(wěn)時(shí)間序列中的因果關(guān)系判定。最后在模擬數(shù)據(jù)集及真實(shí)數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),并與Granger因果關(guān)系分析法、轉(zhuǎn)移熵法及VL-TE法對(duì)比,通過(guò)實(shí)驗(yàn)驗(yàn)證本文方法的有效性和應(yīng)用性。

      1 相關(guān)理論

      1.1 信息理論基礎(chǔ)

      SHANNON[11]提出了香農(nóng)熵的概念來(lái)表示系統(tǒng)的混亂程度和隨機(jī)變量所含信息量的多少及其不確定性的程度。系統(tǒng)混亂程度越高,熵值越大,隨機(jī)變量的不確定性就越大。香農(nóng)熵H(X)定義為:

      (1)

      為了衡量多個(gè)變量含有的共同信息量,提出了聯(lián)合熵H(X,Y)的概念,其定義為:

      (2)

      同時(shí),為了衡量在一個(gè)條件下隨機(jī)變量的復(fù)雜程度,提出了條件熵H(Y|X)的概念,其定義為:

      (3)

      為了衡量?jī)蓚€(gè)隨機(jī)變量的相關(guān)程度,提出了互信息(Mutual Information,MI)的概念,反映變量之間信息交互情況的度量。互信息值越大,變量之間的相關(guān)性也越高?;バ畔I定義為:

      (4)

      基于信息理論中香農(nóng)熵、聯(lián)合熵、條件熵及互信息的概念,有學(xué)者提出了多種基于互信息理論的因果分析法,其中包括轉(zhuǎn)移熵(Transfer Entropy,TE)。

      1.2 轉(zhuǎn)移熵與VL-TE

      由于互信息無(wú)法得到信息的傳遞方向,Schreiber基于互信息理論提出了轉(zhuǎn)移熵的概念。轉(zhuǎn)移熵是一種基于兩個(gè)隨機(jī)過(guò)程的過(guò)去值及當(dāng)前值來(lái)測(cè)量?jī)蓚€(gè)過(guò)程的信息傳遞方向及信息傳遞量的因果關(guān)系分析方法。給定時(shí)間序列{Xt}和{Yt},從{Xt}到{Yt}的轉(zhuǎn)移熵定義為:

      (5)

      基于香農(nóng)熵作信息量含量不確定性的度量時(shí),香農(nóng)轉(zhuǎn)移熵的定義為:

      (6)

      然而,這不符合實(shí)際中時(shí)間序列的時(shí)滯階數(shù)是可變的現(xiàn)實(shí)。AMORNBUNCHORNVEJ[10]提出了一種時(shí)滯階數(shù)可變的轉(zhuǎn)移熵(VL-TE),可以判定具有可變時(shí)滯時(shí)間序列之間的因果關(guān)系,VL-TE的定義為:

      (7)

      為了判定存在可變時(shí)滯時(shí)X是否是導(dǎo)致Y變化的原因,定義了可變時(shí)滯轉(zhuǎn)移熵比值:

      (8)

      當(dāng)T(X,Y)VLr大于1時(shí),表示在可變時(shí)滯轉(zhuǎn)移熵中X是導(dǎo)致Y變化的原因。比值越大,X導(dǎo)致Y變化的原因程度也越大。

      由于實(shí)際中的時(shí)間序列不都是平穩(wěn)的,而VL-TE只可發(fā)現(xiàn)平穩(wěn)時(shí)間序列的因果關(guān)系。因此,本文的工作是探究非平穩(wěn)的時(shí)滯階數(shù)可變時(shí)間序列的因果關(guān)系。

      2 基于分段聚合近似可變時(shí)滯轉(zhuǎn)移熵的因果關(guān)系發(fā)現(xiàn)算法

      2.1 時(shí)間序列預(yù)處理

      對(duì)于缺失的數(shù)據(jù),采用多重插補(bǔ)法進(jìn)行填補(bǔ),再對(duì)處理過(guò)后的時(shí)間序列進(jìn)行Z-Score標(biāo)準(zhǔn)化,即將數(shù)據(jù)轉(zhuǎn)換成均值為0、標(biāo)準(zhǔn)差為1的數(shù)據(jù):

      (9)

      其中,X′和X分別表示標(biāo)準(zhǔn)化后的數(shù)據(jù)和原始數(shù)據(jù),μ和σ分別表示原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差。

      對(duì)預(yù)處理過(guò)后的時(shí)間序列,采用分段聚合近似表示法(Piecewise Aggregate Approximation,PAA)進(jìn)行處理。

      2.2 分段聚合近似表示法

      (10)

      分段聚合近似表示法把長(zhǎng)度為70的時(shí)間序列平均分成10段,如圖1所示。

      圖1 基于分段聚合近似的時(shí)間序列降維示意圖

      (11)

      其中,c為最大壓縮比,θ為允許誤差,F為時(shí)間序列的變化頻率,k為常數(shù),n為時(shí)間序列的數(shù)據(jù)總數(shù)。

      2.3 動(dòng)態(tài)時(shí)間彎曲距離

      動(dòng)態(tài)時(shí)間彎曲距離用于度量?jī)蓚€(gè)時(shí)間序列之間的距離,是一種度量待分類的兩個(gè)時(shí)間序列間相似性的方法。通過(guò)對(duì)時(shí)間序列上不同時(shí)間點(diǎn)對(duì)應(yīng)的元素進(jìn)行動(dòng)態(tài)彎曲調(diào)整,獲取一條最優(yōu)路徑,以檢測(cè)不同時(shí)間序列的相似程度,從而最大限度地減少了時(shí)間移位和失真的影響。

      給定兩個(gè)時(shí)間序列{Xt1,t1=1,2,…,m},{Yt2,t2=1,2,…,n}進(jìn)行距離度量,構(gòu)造一個(gè)矩陣D={d(i,j)}m×n,其中距離度量d(i,j)=(Xi-Yj)2。動(dòng)態(tài)時(shí)間彎曲則是需要在矩陣D中所有彎曲路徑P={p1,p2,…,pK}找到一條連續(xù)的最優(yōu)路徑P*,其中第k個(gè)元素為pk=(i,j)k且(max{m,n}≤K

      (12)

      (13)

      圖2 動(dòng)態(tài)時(shí)間彎曲路徑

      動(dòng)態(tài)時(shí)間彎曲距離的代碼如下所示:

      輸入:時(shí)間序列{Xt1,t1=1,2,…,m}, {Yt2,t2=1,2,…,n}

      建立元素距離矩陣D={d(i,j)}m×n,其中d(i,j)=(Xi-Yj)2

      fort1=2∶m

      end for

      fort2=2∶n

      end for

      fort1=2∶m,t2=2∶n

      end for

      設(shè)定pK(i,j)=(m,n)

      whilepK(i,j)≠(1,1)

      end

      記P的長(zhǎng)度為K,長(zhǎng)度為K的最優(yōu)動(dòng)態(tài)彎曲路徑P*=P(K-l+1),l∈{1,2,…,K}

      輸入:時(shí)間序列{Xt}和{Yt}

      由動(dòng)態(tài)時(shí)間彎曲距離算法得到動(dòng)態(tài)彎曲路徑P={p1,p2,…,pl,…,pK}

      設(shè)定互相關(guān)時(shí)間序列{Xt}和{Yt}的結(jié)果為P0={p0,…,p0,…}

      for alll

      ifS(Xt-pl,Yt)

      else if

      end if

      end for

      本文提出的基于分段聚合近似可變時(shí)滯轉(zhuǎn)移熵因果關(guān)系發(fā)現(xiàn)算法(PAAVL-TE)的基本思想是:首先對(duì)各個(gè)時(shí)間序列進(jìn)行分段聚合近似(PAA)計(jì)算,得到特征時(shí)間序列。然后對(duì)這些特征時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)間彎曲距離計(jì)算,找到相似程度最高的新的時(shí)間序列,最后計(jì)算轉(zhuǎn)移熵值分析因果關(guān)系。

      基于分段聚合近似可變時(shí)滯轉(zhuǎn)移熵因果關(guān)系發(fā)現(xiàn)算法如下:

      輸入:時(shí)間序列{Xt1,t1=1,2,…,m}, {Yt2,t2=1,2,…,n},可能的最大滯后階數(shù)δmax,分段數(shù)目nX和nY

      輸出:轉(zhuǎn)移熵因果分析結(jié)果,TX→Y,TY→X

      數(shù)據(jù)預(yù)處理:得到新時(shí)間序列{X′t1,t1=1,2,…,m}, {Y′t2,t2=1,2,…,n}

      計(jì)算壓縮比cX′=m/nX,cY′=n/nY

      fort1=1∶nX

      fort2=1∶nY

      分別計(jì)算轉(zhuǎn)移熵值TX→Y,TY→X,

      ifT(X,Y)r>1

      存在X→Y的因果關(guān)系

      else if

      不存在X→Y的因果關(guān)系

      end if

      3 仿真模擬

      為了驗(yàn)證本文提出的PAAVL-TE算法的有效性,使用具有可變時(shí)滯的模擬數(shù)據(jù)集對(duì)算法進(jìn)行實(shí)驗(yàn)評(píng)估,并與G、TE、VL-TE算法進(jìn)行對(duì)比。

      在模擬數(shù)據(jù)集中生成了固定時(shí)滯無(wú)法判別因果關(guān)系而可變時(shí)滯可以判別的時(shí)間序列,每次生成每組長(zhǎng)度為500的時(shí)間序列,正常模型的時(shí)間序列值來(lái)自標(biāo)準(zhǔn)正態(tài)分布N(0,1),自回歸模型(Autoregressive Model,AR)的時(shí)間序列值來(lái)自:

      Xt=0.5Xt-1+1.2Xt-2+εt,εt~N(0,1).

      模擬生成5類時(shí)間序列數(shù)據(jù)集,具體來(lái)說(shuō):(1)15組存在明顯因果關(guān)系的時(shí)間序列{Xt}和{Yt}的數(shù)據(jù)集,其中{Yt}具有時(shí)滯階數(shù)p=5,Yt=Xt-p+0.1εt,εt~N(0,1)。為確保時(shí)滯的可變性,{Yt}在第200至250時(shí)間步長(zhǎng)直接保持不變,模仿第180時(shí)間步長(zhǎng)的{Xt},使{Yt}受到X的可變滯后的影響;(2)15組{Xt}和{Yt}獨(dú)立生成的不存在因果關(guān)系的時(shí)間序列,確保PAAVL-TE不會(huì)判別出錯(cuò)誤的因果關(guān)系;(3)15組時(shí)間序列{Xt}和{Yt}存在因果關(guān)系的AR模型數(shù)據(jù)集;(4)15組時(shí)間序列{Xt}和{Yt}不存在因果關(guān)系的AR模型;(5)15組時(shí)間序列{Xt}來(lái)自正常模型數(shù)據(jù)集,{Yt}來(lái)自AR模型。

      生成的模擬數(shù)據(jù)集的真實(shí)因果關(guān)系如圖3所示。圖3中的箭頭所指方向表示從原因時(shí)間序列(如{X1})到結(jié)果時(shí)間序列(如{Y1})的因果方向,{Yij}表示存在滯后的時(shí)間序列。{X1,X2,X3}由正常模型及AR模型生成,每次模擬生成15組時(shí)間序列,設(shè)置最大時(shí)滯階數(shù)δmax=12。此外,本文將F檢驗(yàn)顯著性水平α設(shè)為0.05。當(dāng)T(X,Y)r>1時(shí),才判定存在因果關(guān)系。

      圖3 模擬數(shù)據(jù)集的真實(shí)因果關(guān)系圖 圖4 不同方法的ROC曲線

      對(duì)于算法評(píng)價(jià),本文采用ROC曲線下的面積AUC(Area Under Curve)指標(biāo)進(jìn)行評(píng)價(jià)。ROC曲線是以假陽(yáng)率(FPR)為橫坐標(biāo),真陽(yáng)率(TPR)為縱坐標(biāo),由各閾值下的點(diǎn)坐標(biāo)構(gòu)成的曲線,其中假陽(yáng)率和真陽(yáng)率的計(jì)算公式如下:

      其中,將預(yù)測(cè)因果關(guān)系的結(jié)果與實(shí)際因果關(guān)系的結(jié)果作對(duì)比,真陽(yáng)性TP是實(shí)際有因果關(guān)系且預(yù)測(cè)也有因果關(guān)系的數(shù)量;真陰性TN是實(shí)際無(wú)因果關(guān)系且預(yù)測(cè)也無(wú)因果關(guān)系的數(shù)量;假陽(yáng)性FP是實(shí)際無(wú)因果關(guān)系但預(yù)測(cè)有因果關(guān)系的數(shù)量;假陰性FN是實(shí)際有因果關(guān)系但預(yù)測(cè)無(wú)因果關(guān)系的數(shù)量,(FPR,TPR)為各閾值下的點(diǎn)坐標(biāo)。AUC指數(shù)越高,算法預(yù)測(cè)效果越好,與實(shí)際因果關(guān)系越接近。

      為了評(píng)估PAAVL-TE從非平穩(wěn)時(shí)間序列中推斷出正確的因果圖邊,同時(shí)采用精確率(Precision)、召回率(Recall)和F1得分評(píng)價(jià)本文方法及其他對(duì)比方法的效果。

      其中,P表示精確率,R表示召回率,F1表示F1得分,Tp表示事實(shí)與預(yù)測(cè)結(jié)果都有Xi→Yj因果圖邊的數(shù)量,Fp表示因果圖事實(shí)無(wú)邊但預(yù)測(cè)有邊的數(shù)量,FN表示事實(shí)有Xi→Yj因果圖邊但預(yù)測(cè)無(wú)邊的數(shù)量。

      圖4給出了G、TE、VL-TE、PAAVL-TE四種方法的ROC曲線圖。從圖4可以看出,本文方法預(yù)測(cè)效果最好。相比已有方法,本文具有更好的性能。

      表1給出了模擬數(shù)據(jù)集中G、TE、VL-TE、PAAVL-TE四種方法的實(shí)驗(yàn)結(jié)果。從表1可以看出,PAAVL-TE在精確率及F1得分上明顯優(yōu)于其他方法,這表明PAAVL-TE方法可以有效處理復(fù)雜時(shí)間序列的因果推理任務(wù),分析出正確時(shí)滯可變時(shí)的因果關(guān)系,排除其他方法不能排除的無(wú)關(guān)因素,提高精確率。

      表1 模擬數(shù)據(jù)集中不同方法的實(shí)驗(yàn)結(jié)果

      圖5給出了在改變最大時(shí)滯階數(shù)δmax時(shí)四種方法推斷因果方向的平均準(zhǔn)確度。從圖5可以看出,無(wú)論最大時(shí)滯階數(shù)δmax為何種情況,在δmax變化的范圍內(nèi)PAAVL-TE方法的平均準(zhǔn)確度均高于其他方法,這表明在非平穩(wěn)時(shí)間序列中提出的PAAVL-TE方法具有更好的表現(xiàn)。總體來(lái)說(shuō),PAAVL-TE算法在具有可變時(shí)滯的時(shí)間序列的因果關(guān)系發(fā)現(xiàn)問(wèn)題上具有較好的實(shí)驗(yàn)效果。

      圖5 改變最大時(shí)滯階數(shù)δmax時(shí)不同方法推斷因果方向的平均準(zhǔn)確度

      4 應(yīng)用實(shí)例

      以2013年3月1日至2017年2月28日北京市昌平區(qū)的PM2.5濃度、污染物濃度及氣象時(shí)間序列為研究對(duì)象分析因果關(guān)系,數(shù)據(jù)來(lái)源于UCI數(shù)據(jù)庫(kù)的Beijing Multi-Site Air-Quality數(shù)據(jù),一共有11維數(shù)據(jù)(PM2.5濃度、SO2濃度、NO2濃度、CO濃度、O3濃度、溫度、壓強(qiáng)、露點(diǎn)、降雨量、風(fēng)速、風(fēng)向),其中包含5維空氣污染物濃度數(shù)據(jù)和6維氣象數(shù)據(jù)。利用PAAVL-TE方法找出影響PM2.5濃度變化的主要因素,同時(shí)與其他方法進(jìn)行對(duì)比。

      首先,對(duì)數(shù)據(jù)進(jìn)行缺失填補(bǔ)及Z-Score標(biāo)準(zhǔn)化,再進(jìn)行PAA處理。然后,以PM2.5濃度為分析目標(biāo),利用PAAVL-TE尋找影響PM2.5濃度變化的因素,計(jì)算各因變量對(duì)應(yīng)的可變時(shí)滯轉(zhuǎn)移熵比值,剔除無(wú)關(guān)和冗余變量。比值大于1則認(rèn)為有因果關(guān)系,且比值越大,因果關(guān)系程度越強(qiáng)。最后,使用保留有因果關(guān)系的相關(guān)變量,進(jìn)行預(yù)測(cè)建模。

      四種因果分析方法顯示的影響PM2.5濃度的因素如表2所示。根據(jù)本文方法得到,對(duì)PM2.5濃度變化有因果關(guān)系的變量有SO2濃度、NO2濃度、CO濃度、溫度、降雨量、風(fēng)速及風(fēng)向。隨著北京市發(fā)展及汽車的普及程度增高,汽車尾氣排放、煤炭燃燒及工業(yè)排放等會(huì)造成大氣污染,汽車尾氣排放的污染物主要有SO2、NO2、CO等。由于在大氣中SO2、NO2、CO存在二次轉(zhuǎn)化過(guò)程,如NO2經(jīng)過(guò)一系列復(fù)雜物理化學(xué)反應(yīng)可轉(zhuǎn)化為硝酸鹽二次顆粒,使得PM2.5濃度上升。因此,PM2.5濃度變化會(huì)受到SO2、NO2、CO污染物濃度的影響。此外,北京市位于華北平原的西北緣,且地形呈簸箕狀。當(dāng)風(fēng)向?yàn)槲鞅憋L(fēng)時(shí),容易生成更大風(fēng)速的風(fēng),使得污染物更易擴(kuò)散,空氣中PM2.5濃度也隨之下降。反之,東南風(fēng)則會(huì)把污染物吹向簸箕地形,不利于污染物的擴(kuò)散,從而PM2.5濃度升高。降雨量及溫度也影響污染物濃度,如當(dāng)近地面大氣溫度較高時(shí),大氣的對(duì)流作用加劇,使得PM2.5濃度降低,所以PM2.5濃度也受溫度及降雨量的影響。因此,運(yùn)用PAAVL-TE法的因果關(guān)系分析所得到的結(jié)果,與北京市PM2.5濃度變化的影響關(guān)系一致,驗(yàn)證了本文方法的有效性。

      表2 PM2.5在不同方法下的預(yù)測(cè)結(jié)果

      得出影響PM2.5濃度變化的因素后,本文建立長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)預(yù)測(cè)模型,通過(guò)這些因素進(jìn)行建模預(yù)測(cè)并驗(yàn)證分析的結(jié)果,針對(duì)每一種方法的預(yù)測(cè)結(jié)果,取不同參數(shù)下10折交叉驗(yàn)證所得到的最好結(jié)果。采用平均絕對(duì)誤差(MAE)、對(duì)稱平均絕對(duì)百分比誤差(SMAPE)和均方根誤差(RMSE)三個(gè)指標(biāo)來(lái)衡量預(yù)測(cè)的精度,定義如下:

      表2給出了PM2.5在G、TE、VL-TE、PAAVL-TE四種方法下的預(yù)測(cè)結(jié)果。由表2可見(jiàn),本文方法在三種誤差的預(yù)測(cè)評(píng)價(jià)指標(biāo)均小于其他方法,表明其預(yù)測(cè)精度最高。同時(shí)用于預(yù)測(cè)的變量數(shù)目為7,小于數(shù)據(jù)集的原始變量數(shù)目,減小了預(yù)測(cè)過(guò)程中的計(jì)算難度及成本。相比之下,本文方法能夠有效應(yīng)用于具有可變時(shí)滯的非平穩(wěn)時(shí)間序列因果關(guān)系分析,為模型預(yù)測(cè)選擇合適的輸入變量,提高預(yù)測(cè)精度。這表明本文方法表現(xiàn)良好,具有現(xiàn)實(shí)應(yīng)用價(jià)值。

      5 結(jié)語(yǔ)

      針對(duì)具有可變時(shí)滯的非平穩(wěn)時(shí)間序列因果關(guān)系分析問(wèn)題,本文提出了PAAVL-TE方法,利用分段近似聚合和動(dòng)態(tài)時(shí)間彎曲距離的方法找到與原序列相似程度最高的時(shí)間序列,并計(jì)算可變時(shí)滯轉(zhuǎn)移熵,克服了傳統(tǒng)的Granger因果關(guān)系分析法及其推廣分析法、轉(zhuǎn)移熵法及VL-TE法難以運(yùn)用于非平穩(wěn)時(shí)間序列因果關(guān)系分析的不足。同時(shí),有效分析出正確的因果關(guān)系和因果關(guān)系程度的高低,減少了計(jì)算時(shí)間,說(shuō)明該算法具有良好的應(yīng)用性。在未來(lái)的工作中將研究基于狀態(tài)空間的因果分析方法,在相空間重構(gòu)時(shí)嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)以確定Granger因果模型的延遲階數(shù)和嵌入維數(shù),降低模型的復(fù)雜度。

      猜你喜歡
      時(shí)滯因果關(guān)系分析法
      異步機(jī)傳統(tǒng)分析法之困難及其克服
      玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
      帶有時(shí)滯項(xiàng)的復(fù)Ginzburg-Landau方程的拉回吸引子
      做完形填空題,需考慮的邏輯關(guān)系
      基于時(shí)間重疊分析法的同車倒卡逃費(fèi)探析
      幫助犯因果關(guān)系芻議
      層次分析法在SWOT分析法中的應(yīng)用
      AHP和SWOT分析法在規(guī)劃編制中的應(yīng)用
      一階非線性時(shí)滯微分方程正周期解的存在性
      介入因素對(duì)因果關(guān)系認(rèn)定的影響
      昌平区| 盘锦市| 商南县| 漾濞| 雅安市| 清水县| 桑植县| 防城港市| 邯郸市| 关岭| 桐乡市| 麻栗坡县| 吉木乃县| 兰考县| 永胜县| 揭东县| 镇坪县| 禄劝| 盱眙县| 康马县| 安化县| 蒙山县| 新巴尔虎左旗| 大关县| 大宁县| 偏关县| 澜沧| 论坛| 丰原市| 镇平县| 大石桥市| 阜康市| 沁阳市| 陕西省| 宜良县| 新民市| 开远市| 万盛区| 永胜县| 马山县| 始兴县|