• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于VAR模型的多元時間序列預(yù)測研究

      2024-01-03 08:41:56張安妮婁立都胡欣雨
      現(xiàn)代計算機(jī) 2023年21期
      關(guān)鍵詞:因果關(guān)系差分可視化

      張安妮,周 曉,婁立都,胡欣雨

      (南華大學(xué)計算機(jī)學(xué)院,衡陽 421000)

      0 引言

      時間序列是按照時間排序的隨機(jī)變量集合,通常在相等間隔的時間段內(nèi)以給定的采樣率對某種潛在過程進(jìn)行觀測[1]。時間序列預(yù)測可分為單變量預(yù)測和多變量預(yù)測[2]。在單變量預(yù)測中,每次分析時序數(shù)據(jù)集時獨立進(jìn)行序列,不交叉學(xué)習(xí)。ARIMA(autoregressive integrated moving average)模型因其豐富的統(tǒng)計基礎(chǔ)和Box-Jenkins方法的選擇過程而備受青睞[3]。

      多元時間序列預(yù)測廣泛應(yīng)用于交通、能源、經(jīng)濟(jì)學(xué)等領(lǐng)域[4-6]。在多元時間序列建模中,變量的預(yù)測不僅與它們自身的歷史值有關(guān),還受到其他變量的影響。這種影響可能是直接的,也可能是間接的。例如,在一個城市的溫度預(yù)測中,不僅要考慮該城市過去的溫度,還需要考慮周圍城市的溫度對該城市的影響。VAR(vector autoregressive)模型作為一種早期多維時間序列的分析方法,可以用來探究多個相關(guān)聯(lián)的經(jīng)濟(jì)變量之間的動態(tài)關(guān)系[7]。

      為了進(jìn)一步研究序列之間的相關(guān)性是否會對VAR 模型預(yù)測結(jié)果產(chǎn)生影響,采用傳統(tǒng)ARIMA和VAR方法,對給定的中國銀行數(shù)據(jù)(開盤價Open、最高價High、最低價Low、關(guān)盤價Close和成交量Volume)進(jìn)行多元時間序列預(yù)測。

      1 數(shù)據(jù)與方法

      1.1 數(shù)據(jù)集選擇

      本次我們選擇網(wǎng)上公開的2014年1月1日至2014 年4 年30 日(即1~4 月)中國銀行數(shù)據(jù),將其劃分為訓(xùn)練集(1~3 月數(shù)據(jù))和測試集(4 月數(shù)據(jù))。

      1.2 ARMIA模型

      ARIMA(p,d,q)模型全稱為差分自回歸移動平均模型,其中AR 是自回歸,p是自回歸項;MA是移動平均,q是移動平均項數(shù);d是時間序列變得平穩(wěn)時所做的差分次數(shù)[8]。

      ARIMA(p,d,q)模型是ARMA(p,q)模型的擴(kuò)展。ARIMA(p,d,q)模型可以表示為

      其中,L是滯后算子(Lag operator),d∈Z,d>0。

      1.3 VAR模型

      向量自回歸模型,簡稱VAR 模型[9],是AR模型的推廣,是一種常用的計量經(jīng)濟(jì)模型,是AR 模型的擴(kuò)展。它由克里斯托弗·西姆斯于1980 年提出。VAR 模型考慮了多個變量之間的相互影響,因此比單純的AR 模型更為全面。在某些條件下,多元MA和ARMA模型也可以轉(zhuǎn)化成VAR 模型。在VAR 模型中,每個變量都被回歸到所有變量的當(dāng)前值和滯后值上。

      模型的基本形式是弱平穩(wěn)過程的自回歸表達(dá)式,描述的是在同一樣本期間內(nèi)的若干變量可以作為它們過去值的線性函數(shù)。

      其中,Yt表示k維內(nèi)生變量列向量,Yt-1,i=1,2,…,p為滯后的內(nèi)生變量,Yt表示d維外生變量列向量,p和T分別是滯后階數(shù)和樣本個數(shù),?i即?1,?2,…,?p為k×k維的待估矩陣,B為k×d維的待估矩陣,εt~N(0, Σ)為k維白噪聲向量。

      2 具體實現(xiàn)

      2.1 總體技術(shù)路線

      為了更直觀地展示實驗過程,總體技術(shù)路線如圖1所示。

      圖1 總體技術(shù)路線

      2.2 原數(shù)據(jù)可視化

      先將2014 年1 月1 日至2014 年4 年30 日(即1~4 月)的所有指標(biāo)(即Open,High,Low,Close,Volume)數(shù)據(jù)可視化,如圖2所示。

      圖2 ChinaBank數(shù)據(jù)可視化

      2.3 因果分析

      本次選擇VAR 做預(yù)測,首先對五個序列進(jìn)行因果分析。結(jié)果見表1。

      表1 因果分析表格

      如果p值小于0.05,則表明存在格蘭杰因果性[10]。從結(jié)果來看,Open、High、Low 和Close是存在因果關(guān)系的,但是Volume 跟這四個指標(biāo)之間的因果關(guān)系不大。因此可以將前面四個和最后一個序列分開預(yù)測。

      2.4 ADF檢驗

      在進(jìn)行實驗之前,有必要先檢查單個變量的穩(wěn)定性。雖然從可視化過程中也可以看出這幾個序列不穩(wěn)定,但為了更科學(xué)地判斷,本文對數(shù)據(jù)進(jìn)行了ADF測試。結(jié)果表明:前四組序列是不平穩(wěn)的,只有“Volume”序列是穩(wěn)定的。因此,將這兩個序列分開預(yù)測能夠更加合理和準(zhǔn)確。

      2.5 VAR+ARIMA模型建立和預(yù)測

      由于前四個序列都不平穩(wěn),首先對前面四個序列使用VAR預(yù)測。對這四個序列做協(xié)整檢驗,看是否存在線性組合平穩(wěn)。結(jié)果如圖3所示。

      圖3 前四個序列協(xié)整檢驗

      由圖3可知,不存在線性組合。因此需要先差分使它們平穩(wěn)。劃分訓(xùn)練集(1~3 月數(shù)據(jù))和測試集(4月數(shù)據(jù))。對訓(xùn)練集全部進(jìn)行一階差分之后重新進(jìn)行ADF 檢驗,發(fā)現(xiàn)四個一階差分序列平穩(wěn),之后再建立模型并訓(xùn)練。

      模型建立需要根據(jù)AIC 值做模型測試,從結(jié)果發(fā)現(xiàn)lag=6 時達(dá)到局部最優(yōu),且擬合結(jié)果較好,因此選擇lag=6 建立模型。然后檢驗殘差項中是否還存在相關(guān)性,這一步的目的是確保模型已經(jīng)解釋了數(shù)據(jù)中所有的方差和模式,檢驗值越接近2,說明模型越好。結(jié)果見表2。

      表2 前四個序列殘差檢驗表

      從表2 可以看出,結(jié)果都接近2,說明模型可以用于下一步預(yù)測。根據(jù)檢驗數(shù)據(jù),完全有理由使用VAR模型進(jìn)行預(yù)測,將差分結(jié)果還原,得到前四個序列最終的預(yù)測結(jié)果。

      單獨對“Volume”進(jìn)行預(yù)測。重新導(dǎo)入數(shù)據(jù),并且劃分訓(xùn)練集和測試集。因為之前已經(jīng)對“Volume”序列做過ADF 檢驗,確定是平穩(wěn)序列,所以這里直接使用訓(xùn)練集數(shù)據(jù)通過ACF和PACF判斷參數(shù)。結(jié)果如圖4所示。

      圖4 Volume序列ADF和PADF檢驗

      從圖4可以發(fā)現(xiàn)是零階,所以采用遍歷尋優(yōu)的方法,選擇BIC 的最小值作為模型參數(shù),經(jīng)測試,選擇AR1 和MA0 作為模型參數(shù)。使用訓(xùn)練集訓(xùn)練ARIMA(1,0,0)模型,對結(jié)果進(jìn)行預(yù)測,將結(jié)果可視化,如圖5所示。

      圖5 ARIMA預(yù)測Volume可視化

      2.6 VAR模型建立和預(yù)測

      基于最初的ADF 檢驗,首先對五個序列做一次協(xié)整檢驗,結(jié)果表明:不存在使序列平穩(wěn)的線性組合。

      對訓(xùn)練集前四個序列進(jìn)行差分,然后將差分之后的結(jié)果重新與第五個序列做拼接。之后對五個序列重新進(jìn)行ADF 檢驗,五個序列全部平穩(wěn)。根據(jù)AIC值,做模型測試,結(jié)果表明lag=2 時達(dá)到局部最優(yōu),所以選擇lag=2,擬合效果好。檢查殘差項發(fā)現(xiàn)其結(jié)果都接近2,說明模型可用于進(jìn)行下一步預(yù)測。根據(jù)檢驗數(shù)據(jù),完全有理由使用VAR 模型。使用VAR 預(yù)測,并將前面四個序列的差分結(jié)果還原,最后得到原始數(shù)據(jù)和預(yù)測數(shù)據(jù),估計預(yù)測誤差。

      3 結(jié)果

      3.1 評價指標(biāo)

      假設(shè)A和B分別為真實值矩陣和預(yù)測值矩陣,都是n× 5 的矩陣,用下面公式評價預(yù)測誤差:

      3.2 對比實驗結(jié)果

      本文進(jìn)行了VAR+ARIMA 模型和純VAR 模型實驗。通過評價指標(biāo)計算最后預(yù)測偏差和,結(jié)果見表3。

      表3 模型偏差和對比

      對于前四個序列,純VAR 模型的偏差和平均達(dá)到0.9,VAR+ARIMA 模型對應(yīng)值平均為0.5,結(jié)果表明:VAR+ARIMA 模型結(jié)合了VAR模型和ARIMA 模型的優(yōu)點,能夠更好地捕捉多個變量之間的相互影響以及時間序列的季節(jié)性和趨勢性。對于沒有因果關(guān)系的Volume 序列,強(qiáng)行加入前四個序列采用VAR 直接預(yù)測反而影響預(yù)測精度。

      4 結(jié)語

      本文通過對中國銀行數(shù)據(jù)進(jìn)行多元時間序列分析,探究因果時序采用VAR 模型做預(yù)測的影響,得到結(jié)果如下:

      (1)通過對比具有因果關(guān)系前四組序列和不具因果關(guān)系第五組序列預(yù)測偏差發(fā)現(xiàn),具有因果關(guān)系的序列組預(yù)測效果更佳。

      (2)相反,非因果序列的預(yù)測效果可能會受到影響,并且還可能導(dǎo)致因果序列的擬合效果下降。這是因為非因果序列中的變量可能會引入噪聲或誤差,從而干擾因果序列中變量之間的真實關(guān)系。

      此外,本實驗存在一些不足之處,比如:本文只使用了一種數(shù)據(jù)集進(jìn)行多元時間序列分析,因此結(jié)果可能受到數(shù)據(jù)集的限制。同時,數(shù)據(jù)集中可能存在一些噪聲或錯誤數(shù)據(jù),這可能會影響到分析結(jié)果的準(zhǔn)確性。但是結(jié)果仍然具有一定的參考價值。在將來的研究中,可以通過增加數(shù)據(jù)集的數(shù)量、提高數(shù)據(jù)集的質(zhì)量、選擇更適合的模型、正確判斷因果關(guān)系以及增加樣本的代表性等方式來改進(jìn)研究方法,提高分析結(jié)果的可靠性和泛化能力。

      猜你喜歡
      因果關(guān)系差分可視化
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      數(shù)列與差分
      玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
      基于CGAL和OpenGL的海底地形三維可視化
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      做完形填空題,需考慮的邏輯關(guān)系
      幫助犯因果關(guān)系芻議
      基于差分隱私的大數(shù)據(jù)隱私保護(hù)
      介入因素對因果關(guān)系認(rèn)定的影響
      遂溪县| 丹寨县| 长顺县| 景宁| 乌拉特中旗| 奈曼旗| 乃东县| 柳林县| 正安县| 岱山县| 桑植县| 苏州市| 遂川县| 嘉兴市| 吉木萨尔县| 通城县| 东阿县| 冀州市| 德令哈市| 乌兰浩特市| 慈溪市| 安国市| 彭州市| 双鸭山市| 东至县| 东港市| 舟山市| 怀化市| 孟连| 大城县| 革吉县| 荣昌县| 贡山| 彭泽县| 集安市| 铅山县| 嘉荫县| 绥棱县| 交城县| 宝丰县| 高唐县|