• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      機(jī)器學(xué)習(xí)方法擬合宏觀經(jīng)濟(jì)變量優(yōu)于傳統(tǒng)統(tǒng)計(jì)方法嗎
      ——基于經(jīng)濟(jì)政策不確定指數(shù)的擬合

      2022-01-24 09:09:50董雅菁
      統(tǒng)計(jì)理論與實(shí)踐 2021年12期
      關(guān)鍵詞:方根機(jī)器神經(jīng)網(wǎng)絡(luò)

      袁 靖 劉 響 董雅菁 馬 騰

      (山東工商學(xué)院 統(tǒng)計(jì)學(xué)院,山東 煙臺(tái) 264005)

      一、引言及文獻(xiàn)綜述

      經(jīng)濟(jì)政策是為實(shí)現(xiàn)既定的宏觀經(jīng)濟(jì)目標(biāo)、增進(jìn)社會(huì)福利而制定的解決經(jīng)濟(jì)問題的指導(dǎo)原則和措施。受經(jīng)濟(jì)政策自身特征和國內(nèi)外環(huán)境因素的影響,經(jīng)濟(jì)政策往往具有不同程度的不確定性,即未來與經(jīng)濟(jì)相關(guān)的政策變動(dòng)中包含的各類無法預(yù)知的成分。近年來,突發(fā)事件凸顯不確定沖擊是影響宏觀經(jīng)濟(jì)運(yùn)行的主要沖擊,尤其經(jīng)濟(jì)政策不確定是引起宏觀經(jīng)濟(jì)波動(dòng)的原因,并且對(duì)經(jīng)濟(jì)變量總體上表現(xiàn)為負(fù)面效應(yīng)(Bloom,2009;Caggiano等,2014;Jurado等 2015;Arouri等,2016;Dinb 等,2018;Dayorg zhang 等,2019;Tao Li等,2019;Shen Huayu 等,2021;FengHe等,2020;Dhole等,2021;Altig等,2020)。2020年全球爆發(fā)了新冠肺炎疫情,疫情凸顯不確定性對(duì)經(jīng)濟(jì)造成巨大沖擊,隨著經(jīng)濟(jì)環(huán)境不確定性增強(qiáng),經(jīng)濟(jì)政策不確定指數(shù)的波動(dòng)也呈現(xiàn)長期加強(qiáng)趨勢(shì)。

      對(duì)經(jīng)濟(jì)政策不確定指數(shù)(EPU)的構(gòu)建,最具代表性的是Baker等(2016)利用媒體文本,分析構(gòu)造的經(jīng)濟(jì)政策不確定性指數(shù),研究者選取各個(gè)國家主流報(bào)紙構(gòu)建相關(guān)詞庫,通過詞頻統(tǒng)計(jì)構(gòu)建經(jīng)濟(jì)政策不確定性指數(shù)(EPU指數(shù)),該指數(shù)被廣泛使用。我們可以從網(wǎng)站http://www.policyuncertainty.com下載26個(gè)國家的EPU數(shù)據(jù)。已有文獻(xiàn)對(duì)EPU的分析均為EPU對(duì)經(jīng)濟(jì)波動(dòng)的影響效應(yīng)分析,對(duì)EPU波動(dòng)擬合的文獻(xiàn)僅有一篇,文章采用高維VAR模型,基于18個(gè)發(fā)達(dá)國家的EPU,對(duì)巴西、中國、印度、俄羅斯(金磚四國)的EPU進(jìn)行了擬合。

      近年來,宏觀經(jīng)濟(jì)預(yù)測(cè)領(lǐng)域應(yīng)用ML方法的研究日益增多(Ahmed 等,2010;Stock 和 Watson,2012;Li和Chen,2014;Kim 和 Swanson,2018;Smeekes 和 Wijler,2018;Chen 等,2019;Milunovich,2020;Coulombe 等,2020),采用計(jì)量經(jīng)濟(jì)模型AR和隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)以及增強(qiáng)樹三種機(jī)器學(xué)習(xí)方法重點(diǎn)預(yù)測(cè)了美國經(jīng)濟(jì)的五個(gè)代表性宏觀經(jīng)濟(jì)指標(biāo):工業(yè)生產(chǎn)、失業(yè)率、消費(fèi)者物價(jià)指數(shù)、10年期國債固定到期利率與聯(lián)邦基金利率之差和住房開工率。結(jié)論認(rèn)為,機(jī)器學(xué)習(xí)非參數(shù)非線性是最顯著的特征,因此大大提高了所有宏觀經(jīng)濟(jì)變量的預(yù)測(cè)精度,特別是在大數(shù)據(jù)背景下做長期預(yù)測(cè)時(shí)效果更為顯著。

      本文采用ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)、長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM以及將統(tǒng)計(jì)方法與機(jī)器學(xué)習(xí)融合在一起的隨機(jī)森林分位數(shù)回歸方法,對(duì)美國、英國的經(jīng)濟(jì)政策不確定指數(shù)進(jìn)行擬合對(duì)比,擬合效果顯示,長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM預(yù)測(cè)效果最優(yōu),ARIMA模型擬合效果最差,相同樣本期內(nèi)ARIMA模型擬合均方根誤差幾乎達(dá)到LSTM方法預(yù)測(cè)均方根誤差的3倍,隨機(jī)森林分位數(shù)回歸及BP神經(jīng)網(wǎng)絡(luò)擬合效果居中。這為今后采用機(jī)器學(xué)習(xí)方法對(duì)宏觀經(jīng)濟(jì)變量進(jìn)行擬合及預(yù)測(cè)提供了新思路。

      二、機(jī)器學(xué)習(xí)方法及ARIMA模型

      (一)BP神經(jīng)網(wǎng)絡(luò)

      BP神經(jīng)網(wǎng)絡(luò)是一種多層前向神經(jīng)網(wǎng)絡(luò),由于在網(wǎng)絡(luò)的訓(xùn)練中,調(diào)整權(quán)閾值的訓(xùn)練算法遵循了誤差反向傳播方式,所以它是神經(jīng)網(wǎng)絡(luò)中比較成熟和完美的一部分。通常BP神經(jīng)網(wǎng)絡(luò)是一種具有3層或者3層以上神經(jīng)元的神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,上下層之間實(shí)現(xiàn)全連接,但同一層神經(jīng)元之間無連接。

      (二)長短期記憶神經(jīng)網(wǎng)絡(luò) STM

      LSTM模塊由多個(gè)同構(gòu)單元格構(gòu)成,單元格常被稱作節(jié)點(diǎn)。每個(gè)節(jié)點(diǎn)內(nèi)部包括遺忘門、輸入門、輸出門以及由它們控制的輸入到輸出的各種連接。三個(gè)門是LSTM的核心,可以看作是在LSTM內(nèi)部流動(dòng)時(shí)的調(diào)節(jié)者。具體功用如下:遺忘門負(fù)責(zé)對(duì)此前狀態(tài)空間中的信息進(jìn)行過濾調(diào)節(jié);輸入門調(diào)節(jié)各節(jié)點(diǎn)輸入信息進(jìn)入狀態(tài)空間的比例;輸出門對(duì)當(dāng)前節(jié)點(diǎn)下狀態(tài)空間所保存的信息流入隱層的過程進(jìn)行調(diào)控。

      (三)隨機(jī)森林分位數(shù)回歸

      隨機(jī)森林是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法,它的基本單元是決策樹,而它的本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支——集成學(xué)習(xí)方法。隨機(jī)森林算法是一種非線性模型,即將多個(gè)決策樹集成為森林的一種模型。分位數(shù)隨機(jī)森林(QRF)由分位數(shù)回歸和隨機(jī)森林發(fā)展得到,但保留了兩種算法的優(yōu)點(diǎn),其輸出值為不同分位點(diǎn)的回歸預(yù)測(cè)結(jié)果。QRF運(yùn)算速度快,模型性能受參數(shù)影響小,且具有較強(qiáng)容噪性。

      分位數(shù)回歸森林可以被看作是一個(gè)適應(yīng)性近鄰分類和回歸過程。對(duì)每一個(gè)X=x,都可以得到原始n個(gè)觀察值權(quán)重集合 wi(x),i=1,2,...,n。記 θ為隨機(jī)參數(shù)向量,決定決策樹的生長(比如每個(gè)結(jié)點(diǎn)對(duì)哪些變量分割),對(duì)應(yīng)的決策樹記為T(θ),記B為X的域。

      具體說,設(shè)訓(xùn)練樣本為(Xi,Yi),i=1,...,n,其中特征向量X為P維,即X∈Rp。決策樹是一種樹形結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)基于一個(gè)屬性進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果的不同繼續(xù)分配到不同的分支,每個(gè)葉節(jié)點(diǎn)代表最終輸出的類別,設(shè)θ為單顆決策樹的參數(shù),決定每個(gè)節(jié)點(diǎn)的分裂變量和樹的深度等條件,決策樹的葉子節(jié)點(diǎn)記為l,l=1,...,L。每個(gè)樣本的特征向量x都屬于葉子中的一個(gè)區(qū)域,記為X∈Rl,同時(shí)將這個(gè)節(jié)點(diǎn)記為l(x,θ)。對(duì)訓(xùn)練樣本Xi,考慮其對(duì)應(yīng)葉子節(jié)點(diǎn)上的權(quán)重向量wi(x,θ)為:

      式中,(I·)為示性函數(shù),顯然上式的權(quán)重和為1。

      對(duì)隨機(jī)森林算法來說,新觀測(cè)值條件均值的估計(jì)E(Y|X=x)即為k棵決策樹的平均。設(shè)每棵決策樹的參數(shù) θt為獨(dú)立同分布,t=1,...,k,則權(quán)重向量w(ix)為各個(gè)決策樹平均:

      則隨機(jī)森林最終的預(yù)測(cè)為對(duì)因變量的加權(quán)平均:

      分位數(shù)回歸森林建立在隨機(jī)森林的基礎(chǔ)上,對(duì)因變量全部的條件分布進(jìn)行估計(jì),設(shè)給定條件X=x時(shí)因變量Y的條件分布為:

      利用隨機(jī)森林估計(jì)的權(quán)重wi(x),條件分布的估計(jì)可以看成對(duì)示性函數(shù)I(Yi≤y)的加權(quán)平均,因而給出對(duì)條件分布的估計(jì)為:

      進(jìn)一步可得到利用樣本數(shù)據(jù)估計(jì)的Y的條件分位點(diǎn)Qτ(Y)

      分位數(shù)回歸森林中,模型的參數(shù)主要有兩個(gè),分別為樹的數(shù)量和每個(gè)節(jié)點(diǎn)參與分裂變量的個(gè)數(shù)。這里:對(duì)最優(yōu)參數(shù)的選取方法為:在樣本內(nèi)數(shù)據(jù)集上進(jìn)行訓(xùn)練,使該參數(shù)建立的模型在樣本內(nèi)失敗個(gè)數(shù)N更接近于理論失敗個(gè)數(shù)。

      (四)ARIMA 模型

      具有如下結(jié)構(gòu)的模型稱為求和自回歸移動(dòng)平均模型,簡單記為 ARIMA(p,d,q)模型:

      式中,Δd=(1-B)d;Φ(B)=1-φ1B-L-φpBp,為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項(xiàng)式;Θ(B)=1-θ1B-L-θqBq,為平穩(wěn)可逆 ARMA(p,q)模型的移動(dòng)平滑系數(shù)多項(xiàng)式。ARIMA模型的建立和預(yù)測(cè)方法已經(jīng)成熟,因此,利用合理階數(shù)的差分運(yùn)算來平穩(wěn)化,就能滿足對(duì)非平穩(wěn)系統(tǒng)輸出簡便有效的建模。

      三、基于機(jī)器學(xué)習(xí)方法及ARIMA模型對(duì)經(jīng)濟(jì)政策不確定指數(shù)擬合

      (一)數(shù)據(jù)

      本文選取美國經(jīng)濟(jì)政策不確定指數(shù)、英國經(jīng)濟(jì)政策不確定指數(shù)歷史數(shù)據(jù)(美國數(shù)據(jù)從1985年1月1日至2021年3月19日,英國數(shù)據(jù)從2001年1月1日至2021年3月19日),數(shù)據(jù)來源為http://www.polic yuncertainty.com/index.html。

      (二)擬合評(píng)價(jià)指標(biāo)

      確定性點(diǎn)擬合誤差評(píng)價(jià)指標(biāo)采用平均相對(duì)誤差(Mean Percentage Error)和均方根誤差(Root Mean Square Error)統(tǒng)計(jì),分別按以下方法計(jì)算:

      1.平均相對(duì)誤差δ

      2.均方跟誤差(RMSE)

      (三)美國、英國經(jīng)濟(jì)政策不確定指數(shù)擬合效果對(duì)比分析

      1.BP神經(jīng)網(wǎng)絡(luò)構(gòu)建、參數(shù)調(diào)優(yōu)及擬合結(jié)果

      BP神經(jīng)網(wǎng)絡(luò)以EPU滯后數(shù)據(jù)為特征向量從輸入層輸入,因此采用滑動(dòng)窗口法得到輸入矩陣,具體方法為:依次將美國、英國EPU數(shù)據(jù)的n個(gè)滯后值作為特征向量輸入,當(dāng)前EPU數(shù)據(jù)作為輸出,構(gòu)建前n個(gè)EPU數(shù)據(jù)和之后1個(gè)EPU數(shù)據(jù)的非線性映射,最終m個(gè)EPU樣本觀測(cè)值滑動(dòng)生成m-n個(gè)訓(xùn)練集樣本,即(m-n)×n輸入矩陣。本文輸入層的節(jié)點(diǎn)數(shù)目為8,輸出層的節(jié)點(diǎn)數(shù)目為1,根據(jù)美國1985—2021年EPU數(shù)據(jù),滑動(dòng)生成10575個(gè)訓(xùn)練集樣本,根據(jù)英國2000—2021年EPU數(shù)據(jù),滑動(dòng)生成7375個(gè)訓(xùn)練集樣本,繪制BP神經(jīng)網(wǎng)絡(luò)模型的擬合曲線,并用虛線表示測(cè)試集真實(shí)的EPU數(shù)據(jù),實(shí)線為BP神經(jīng)網(wǎng)絡(luò)擬合EPU指數(shù),圖1為美國、英國經(jīng)濟(jì)政策不確定指數(shù)BP神經(jīng)網(wǎng)絡(luò)全樣本擬合圖,美國EPU擬合均方根誤差為63.87,英國EPU擬合均方根誤差為140.14。

      圖1 美國、英國EPU的BP神經(jīng)網(wǎng)絡(luò)全樣本擬合圖

      2.長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM構(gòu)建、參數(shù)調(diào)優(yōu)及擬合結(jié)果

      在單步EPU指數(shù)多維數(shù)據(jù)自回歸模型中,采用每步長都即時(shí)更新的真實(shí)歷史數(shù)據(jù)進(jìn)行序列自回歸,即時(shí)間滑動(dòng)窗口每向下移動(dòng)一步時(shí)更新真實(shí)歷史數(shù)據(jù),輸入的數(shù)據(jù)維度為[1,7],記錄預(yù)測(cè)值,繪制隨每次迭代的損失函數(shù)變化圖像。為防止擬合LSTM層的神經(jīng)元個(gè)數(shù)過多,模型總計(jì)四層,經(jīng)調(diào)整后模型具體參數(shù)如下:

      第一層:LSTM層,神經(jīng)元個(gè)數(shù)為4個(gè),輸入步長為8,單步多維序列自回歸數(shù)據(jù)輸入維度為7。

      第二層:隱藏層,神經(jīng)元個(gè)數(shù)為4個(gè)。

      第三層:全連接層,輸出神經(jīng)元個(gè)數(shù)為1,激活函數(shù)為linear線性激活。

      圖2為美國、英國經(jīng)濟(jì)政策不確定指數(shù)LSTM全樣本測(cè)試集的擬合圖,虛線為EPU真實(shí)值,實(shí)線為EPU擬合值,美國EPU擬合均方根誤差為60.12,英國EPU擬合均方根誤差為128.31。

      圖2 美國、英國EPU的長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM全樣本擬合圖

      3.隨機(jī)森林分位數(shù)回歸參數(shù)選擇及擬合結(jié)果

      基于多次實(shí)驗(yàn),選擇樹的數(shù)量為500,分裂變量為自動(dòng)選取優(yōu)化。圖3為隨機(jī)森林方法對(duì)美國、英國EPU的擬合圖,虛線為真實(shí)值,實(shí)線為擬合值,美國EPU擬合均方根誤差為61.19,英國EPU擬合均方根誤差為138.26。

      圖3 美國、英國EPU的隨機(jī)森林分位數(shù)回歸全樣本擬合圖

      4.ARIMA模型擬合效果

      根據(jù)AIC和BIC準(zhǔn)則,確定美國EPU數(shù)據(jù)的最優(yōu)模型是 ARIMA(4,1,2),英國 EPU 數(shù)據(jù)的最優(yōu)模型是 ARIMA(1,1,1),繪制 ARIMA 模型的擬合曲線如圖4所示,其中虛線表示測(cè)試集真實(shí)的EPU數(shù)據(jù),實(shí)線為ARIMA模型擬合的EPU指數(shù),美國EPU擬合均方根誤差為169.25,英國EPU擬合均方根誤差為142.08。

      圖4 美國、英國EPU的ARIMA模型擬合圖

      5.總結(jié)

      我們將四種方法對(duì)美國、英國EPU擬合效果總結(jié)如下:

      表1 誤差比較

      由此可以得出結(jié)論,長短期記憶LSTM方法擬合美國EPU擬合效果最優(yōu),傳統(tǒng)ARIMA模型擬合效果最差,其均方根誤差幾乎是長短期記憶LSTM方法擬合均方根誤差的3倍,BP神經(jīng)網(wǎng)絡(luò)及隨機(jī)森林分位數(shù)回歸方法居中。長短期記憶神經(jīng)網(wǎng)絡(luò)LSTM在經(jīng)濟(jì)學(xué)現(xiàn)有文獻(xiàn)中均用于股票收益率預(yù)測(cè),本文將其運(yùn)用于宏觀經(jīng)濟(jì)變量EPU擬合,效果很好。對(duì)英國EPU擬合效果,四種方法擬合均方根誤差差異接近,由于英國EPU數(shù)據(jù)時(shí)間維度不如美國EPU數(shù)據(jù)時(shí)間維度長,因而采用機(jī)器學(xué)習(xí)方法擬合效果雖好但不明顯。

      四、結(jié)論

      機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)的交叉已經(jīng)成為經(jīng)濟(jì)學(xué)的重要研究領(lǐng)域。由于大數(shù)據(jù)的可用性,特別是在微觀經(jīng)濟(jì)應(yīng)用中,機(jī)器學(xué)習(xí)方法已經(jīng)得到重視(Belloni,2017和Athey,2019)。

      本文采用機(jī)器學(xué)習(xí)與計(jì)量經(jīng)濟(jì)模型相結(jié)合的方法對(duì)美國、英國歷史EPU數(shù)據(jù)進(jìn)行擬合,由于機(jī)器學(xué)習(xí)方法能夠體現(xiàn)數(shù)據(jù)的非線性特征,因而擬合效果優(yōu)于傳統(tǒng)統(tǒng)計(jì)模型(ARIMA模型),這與Coulombe等(2020)的研究結(jié)論是一致的。數(shù)據(jù)時(shí)間維度越長,采用機(jī)器學(xué)習(xí)擬合效果越好,數(shù)據(jù)時(shí)間維度短則機(jī)器學(xué)習(xí)優(yōu)越度不明顯,換句話說,在大數(shù)據(jù)背景下機(jī)器學(xué)習(xí)方法的優(yōu)良性能夠更好地顯現(xiàn)出來。對(duì)宏觀經(jīng)濟(jì)核心指標(biāo)進(jìn)行預(yù)測(cè)一直是統(tǒng)計(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)等領(lǐng)域的重要研究課題,近年來我國學(xué)者致力于改進(jìn)預(yù)測(cè)模型,提高預(yù)測(cè)精度,隨著未來經(jīng)濟(jì)環(huán)境的不確定性增加,非線性日益成為經(jīng)濟(jì)變量顯著特征,在宏觀經(jīng)濟(jì)高度不確定性、金融壓力及經(jīng)濟(jì)衰退時(shí)期,非線性的表現(xiàn)尤其被放大,此時(shí)機(jī)器學(xué)習(xí)方法在預(yù)測(cè)宏觀經(jīng)濟(jì)變量時(shí)表現(xiàn)出優(yōu)越性,因而未來機(jī)器學(xué)習(xí)方法將更多適用于宏觀經(jīng)濟(jì)預(yù)測(cè)。

      猜你喜歡
      方根機(jī)器神經(jīng)網(wǎng)絡(luò)
      方根拓展探究
      機(jī)器狗
      機(jī)器狗
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      未來機(jī)器城
      電影(2018年8期)2018-09-21 08:00:06
      均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
      揭開心算方根之謎
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      無敵機(jī)器蛛
      正定县| 万州区| 会理县| 鄂尔多斯市| 井陉县| 敦化市| 墨竹工卡县| 襄垣县| 武鸣县| 永城市| 城固县| 怀化市| 武清区| 吉安县| 洪江市| 漳州市| 巴林右旗| 依安县| 沿河| 长海县| 柳林县| 永福县| 汝南县| 咸阳市| 龙里县| 叙永县| 金阳县| 龙山县| 富宁县| 巫山县| 新野县| 舟曲县| 临桂县| 广安市| 文成县| 阿克| 九龙县| 宣城市| 北川| 咸丰县| 米泉市|