• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于隨機(jī)森林方法的甲醇期貨價(jià)格預(yù)測(cè)與交易策略研究

      2023-06-21 10:28:16季晨洋林杰
      上海管理科學(xué) 2023年1期
      關(guān)鍵詞:隨機(jī)森林

      季晨洋 林杰

      摘 要: ??甲醇是重要的新型清潔能源,其期貨產(chǎn)品上市已近10年,論文采用機(jī)器學(xué)習(xí)技術(shù)研究甲醇期貨價(jià)格的預(yù)測(cè)模型和交易規(guī)則。論文采用隨機(jī)森林算法構(gòu)造甲醇期貨價(jià)格預(yù)測(cè)模型,使用甲醇產(chǎn)業(yè)鏈上下游產(chǎn)品的基本面特征作為輸入變量,并對(duì)輸入變量進(jìn)行歸一化處理構(gòu)造對(duì)照模型,結(jié)合使用基于Aberration策略思想構(gòu)建的交易策略集合,使用夏普比率對(duì)交易策略進(jìn)行篩選,構(gòu)造有效的甲醇期貨量化交易模型。研究結(jié)果顯示,論文模型在保證交易策略良好泛化能力的情況下可以實(shí)現(xiàn)高出同期10年期國(guó)債收益率1.2倍以上的年化收益率,也表明利用甲醇產(chǎn)業(yè)鏈上下游產(chǎn)品的基本面特征能夠很好地解釋甲醇期貨價(jià)格,并結(jié)合使用夏普比率篩選的基于Aberration交易策略思想的交易規(guī)則能夠構(gòu)建有效的甲醇期貨量化投資模型。

      關(guān)鍵詞: ?甲醇期貨;價(jià)格預(yù)測(cè);隨機(jī)森林;交易策略泛化

      中圖分類號(hào): ?G 11;G 13;G 19

      文獻(xiàn)標(biāo)志碼: ??A

      Research on Methanol Futures Price Forecast andTrading Strategy Based on Random Forest Method

      JI Chenyang LIN Jie

      (School of Economics & Management, Tongji University, Shanghai 200092, China)

      Abstract: ?Methanol is an important new type of clean energy. Its futures products have been on the market for nearly 10 years. This article uses machine learning technology to study the prediction models and trading rules of methanol futures prices. The paper uses the random forest algorithm to construct a methanol futures price prediction model, uses the fundamental characteristics of the upstream and downstream products of the methanol industry chain as input variables, ?and normalizes the input variables to construct a control model, combined with the use of Aberration strategy ideas to build a set of trading strategies. Use Sharpe ratio to screen trading strategies and construct an effective quantitative trading model for methanol futures. The research results show that the model in this paper can achieve an annualized rate of return that is 1.2 times higher than the rate of 10-year Treasury bonds in the same period while ensuring a good generalization ability of the trading strategy. It also shows that the use of the fundamental characteristics data of the upstream and downstream products of the methanol industry chain can well explain the methanol futures price, and combined with the use of Sharpe ratio screening, the trading rules based on the Aberration trading strategy idea can construct an effective methanol futures quantitative investment model.

      Key words: ?methanol futures; price prediction; random forest; strategy generalization

      期貨交易是市場(chǎng)經(jīng)濟(jì)發(fā)展到一定階段的產(chǎn)物,成熟的期貨交易市場(chǎng)在一定程度上可以認(rèn)為是完全競(jìng)爭(zhēng)市場(chǎng),是經(jīng)濟(jì)學(xué)中最理想的市場(chǎng)形式。我國(guó)第一個(gè)商品期貨交易所的出現(xiàn)要追溯到20世紀(jì)90年代,而世界上最早的期貨交易市場(chǎng)出現(xiàn)在19世紀(jì)50年代,相比于這些成熟國(guó)外期貨市場(chǎng),我國(guó)的期貨交易市場(chǎng)還不成熟,期貨理論對(duì)現(xiàn)實(shí)期貨交易的支持還不夠。國(guó)內(nèi)甲醇期貨產(chǎn)品于2011年10月28日在鄭州商品交易所上市,已有十多年之久。由于我國(guó)能源結(jié)構(gòu)的逐步改善,甲醇作為新型清潔能源而被廣泛使用,相關(guān)企業(yè)和投資者對(duì)甲醇期貨的關(guān)注度也在不斷上升,分析甲醇期貨價(jià)格對(duì)國(guó)內(nèi)甲醇期現(xiàn)貨市場(chǎng)的健康發(fā)展,以及相關(guān)企業(yè)和投資者進(jìn)行甲醇期現(xiàn)貨交易具有重要意義。

      在現(xiàn)有期貨價(jià)格研究中,研究方法主要可分為計(jì)量經(jīng)濟(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法。其中,計(jì)量模型包括自回歸模型、差分自回歸移動(dòng)平均模型、廣義自回歸條件異常模型等。機(jī)器學(xué)習(xí)方法主要是決策樹、支持向量機(jī)、隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)等(陳標(biāo)金等人,2019)。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,機(jī)器學(xué)習(xí)也逐漸被應(yīng)用到金融領(lǐng)域的研究中,并表現(xiàn)出良好的研究性能。Einav和Levin(2014)認(rèn)為在經(jīng)濟(jì)學(xué)研究領(lǐng)域中,經(jīng)濟(jì)模型關(guān)注的重點(diǎn)主要放在能夠代表工序變化的因素上,研究人員需要對(duì)數(shù)據(jù)的異質(zhì)性進(jìn)行校正,并嘗試使估計(jì)參數(shù)的異方差與標(biāo)準(zhǔn)誤差和協(xié)方差一致,此外還需要通過(guò)不同模型來(lái)評(píng)估模型的魯棒性。經(jīng)典統(tǒng)計(jì)模型更強(qiáng)調(diào)模型的結(jié)構(gòu)和理論性質(zhì),具有一定的可解釋性,單對(duì)復(fù)雜數(shù)據(jù)結(jié)構(gòu)的擬合不夠(周亞,2021)。與傳統(tǒng)計(jì)量模型相比,機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)的前提假設(shè)較少,它以數(shù)據(jù)為驅(qū)動(dòng),將重點(diǎn)放在模型的輸出結(jié)果上,進(jìn)而揭示出特征對(duì)模型的解釋能力(Alessandro Vespignani,2009)。隨機(jī)森林是眾多算法中適應(yīng)能力較強(qiáng)的算法之一。Breiman(2001)指出隨機(jī)森林算法不需要考慮多元回歸模型中需要考慮的多重共線性問(wèn)題。方匡南、吳見彬、朱建平和謝邦昌(2011)指出隨機(jī)森林對(duì)異常值和噪聲有很好的容忍度,并且預(yù)測(cè)精度高。Pérez-Rave、Correa-Morales和González-Echavarría(2019)也指出隨機(jī)森林算法可以有效避免模型的過(guò)擬合,是一個(gè)能夠做出精確預(yù)測(cè)的穩(wěn)健算法。

      關(guān)于期貨價(jià)格預(yù)測(cè)模型輸入特征變量的選擇,已有眾多實(shí)證研究指出產(chǎn)業(yè)鏈上下游相關(guān)產(chǎn)品的基本面特征對(duì)預(yù)測(cè)期貨價(jià)格具有重要作用。姬培森(2020)通過(guò)基本面分析對(duì)商品期貨價(jià)格的走勢(shì)進(jìn)行充分預(yù)測(cè);李順平和朱昂明(2019)使用螺紋鋼產(chǎn)業(yè)鏈上下游相關(guān)產(chǎn)品的基本面特征變量很好地解釋了螺紋鋼期貨價(jià)格;金志峰、崔楠楠和宋歆欣(2021)利用SVAR回歸發(fā)現(xiàn)供需會(huì)對(duì)鐵礦石期貨價(jià)格變化產(chǎn)生顯著影響。

      鑒于此,本文利用2016年1月2日至2021年5月31日的甲醇期貨主力合約收盤價(jià)序列作為被預(yù)測(cè)變量,基于經(jīng)濟(jì)學(xué)生產(chǎn)理論以及供需關(guān)系準(zhǔn)則選取產(chǎn)業(yè)鏈上甲醇上下游產(chǎn)品的基本面特征作為備選預(yù)測(cè)變量,利用相關(guān)性分析篩選甲醇期貨價(jià)格預(yù)測(cè)模型的預(yù)測(cè)變量;分別以選取的特征變量以及去除量綱后的特征變量作為預(yù)測(cè)變量,利用隨機(jī)森林算法構(gòu)造甲醇期貨價(jià)格預(yù)測(cè)模型對(duì)照組,選取預(yù)測(cè)能力強(qiáng)的模型作為甲醇期貨價(jià)格預(yù)測(cè)模型;使用夏普比率進(jìn)行基于Aberration交易策略思想的回測(cè)交易規(guī)則篩選及該交易策略的泛化能力檢驗(yàn),進(jìn)而間接檢驗(yàn)甲醇期貨價(jià)格預(yù)測(cè)模型的預(yù)測(cè)能力。

      1 預(yù)測(cè)變量篩選方法

      期貨價(jià)格預(yù)測(cè)效果取決于預(yù)測(cè)變量的選擇和預(yù)測(cè)模型的構(gòu)建。在預(yù)測(cè)變量的選擇上,眾多實(shí)證研究表明產(chǎn)業(yè)鏈上下游產(chǎn)品的基本面數(shù)據(jù)對(duì)金融資產(chǎn)價(jià)格預(yù)測(cè)具有重要意義(馬鄭瑋等,2021)。

      1.1 甲醇產(chǎn)業(yè)鏈結(jié)構(gòu)分析

      甲醇是合成氣生產(chǎn)的重要化學(xué)品之一,是一種化工原料和燃料,目前市場(chǎng)上交易的甲醇以工業(yè)甲醇為主,其生產(chǎn)原材料主要為煤、焦油、天然氣等,其生產(chǎn)過(guò)程不會(huì)出現(xiàn)任何副產(chǎn)品,消耗的過(guò)程中也沒有污染物排放。甲醇自工業(yè)化生產(chǎn)以來(lái),生產(chǎn)方式也發(fā)生了很大的改變,由原先的以煤、焦油作為主要生產(chǎn)原料轉(zhuǎn)變?yōu)榱艘蕴烊粴鉃樯a(chǎn)原料。由于我國(guó)獨(dú)特的能源結(jié)構(gòu)分布,我國(guó)的甲醇生產(chǎn)依舊是以煤作為主要原料,目前我國(guó)仍以煤作為原料的甲醇生產(chǎn)產(chǎn)能約占總產(chǎn)能的65%。

      甲醇產(chǎn)業(yè)鏈的下游產(chǎn)品也很多,包括醋酸、甲醛、二甲醚等,還可用作動(dòng)力燃料,涉及行業(yè)諸多,包含化工、建材、能源等。

      1.2 備選預(yù)測(cè)變量選取

      根據(jù)上述上下游產(chǎn)業(yè)鏈結(jié)構(gòu)分析可知,甲醇產(chǎn)業(yè)鏈的上下游產(chǎn)品主要有煤、天然氣、焦?fàn)t氣,下游產(chǎn)品主要有甲醛、二甲醚、醋酸等。根據(jù)生產(chǎn)理論,上游產(chǎn)品作為下游產(chǎn)品的生產(chǎn)原料,其銷售價(jià)格將作為下游產(chǎn)品生產(chǎn)的直接費(fèi)用,并直接反映到下游產(chǎn)品的銷售價(jià)格當(dāng)中。從供需關(guān)系角度出發(fā),當(dāng)產(chǎn)品供給充足時(shí),價(jià)格會(huì)出現(xiàn)下降趨勢(shì),反之則會(huì)出現(xiàn)上升的趨勢(shì),呈現(xiàn)出負(fù)相關(guān)關(guān)系,而產(chǎn)品的消費(fèi)量、出口量和產(chǎn)能、進(jìn)口量將直接影響產(chǎn)品的庫(kù)存量,并分別表現(xiàn)出正、負(fù)相關(guān)性。從商品期貨市場(chǎng)交易過(guò)程來(lái)看,期貨交易最終將以現(xiàn)貨的方式進(jìn)行交割,張宗成、王駿(2005)通過(guò)對(duì)上海期貨交易的實(shí)證分析已驗(yàn)證我國(guó)期貨與現(xiàn)貨價(jià)格之間存在著雙向因果關(guān)系。

      根據(jù)上述分析,并結(jié)合我國(guó)甲醇產(chǎn)業(yè)鏈的實(shí)際情況以及數(shù)據(jù)的可獲性,本文選擇的上下游產(chǎn)品分別為煤和醋酸,備選預(yù)測(cè)變量為:煤現(xiàn)貨價(jià)格、產(chǎn)量、進(jìn)口量、庫(kù)存量;甲醇現(xiàn)貨價(jià)格、產(chǎn)量、進(jìn)口量、出口量、庫(kù)存量、毛利;醋酸現(xiàn)貨價(jià)格、進(jìn)口量、出口量、庫(kù)存量、消費(fèi)量、毛利。

      1.3 備選預(yù)測(cè)變量預(yù)處理及預(yù)測(cè)變量篩選方法

      在上述選取的備選預(yù)測(cè)變量中,部分特征變量是日序列數(shù)據(jù),部分是周、月序列數(shù)據(jù),需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。本文對(duì)周以及月序列數(shù)據(jù)的處理方式是當(dāng)前樣本觀察日期與上一樣本觀察日期區(qū)間內(nèi)的各觀察樣本值均設(shè)定為上一樣本觀察值;將備選預(yù)測(cè)變量樣本數(shù)據(jù)滯后一個(gè)交易日后與被預(yù)測(cè)變量進(jìn)行配對(duì)形成樣本向量。

      將上述備選預(yù)測(cè)變量與甲醇期貨價(jià)格進(jìn)行相關(guān)性檢驗(yàn),選取與甲醇期貨價(jià)格顯著相關(guān)的備選預(yù)測(cè)變量作為模型的預(yù)測(cè)變量。

      2 隨機(jī)森林預(yù)測(cè)模型構(gòu)建及回測(cè)檢驗(yàn)規(guī)則設(shè)計(jì)

      2.1 隨機(jī)森林預(yù)測(cè)模型構(gòu)建

      隨機(jī)森林是決策樹模型的集成算法,它的實(shí)用性以及高預(yù)測(cè)精度已在大量實(shí)證分析中得到論證。 它是將n棵決策樹的預(yù)測(cè)結(jié)果結(jié)合起來(lái)以做出比單棵決策樹更為精確的預(yù)測(cè)。隨機(jī)森林在構(gòu)造單棵決策樹時(shí)除了在選擇樣本時(shí)使用隨機(jī)抽樣,在構(gòu)建單棵決策樹的輸入特征時(shí)也采用隨機(jī)抽樣的方式從原有特征空間中選擇子特征空間,此做法有效提高了模型的穩(wěn)定性。隨機(jī)森林回歸模型的預(yù)測(cè)結(jié)果由眾多弱評(píng)估器的預(yù)測(cè)結(jié)果進(jìn)行平均而得,即眾多決策樹預(yù)測(cè)結(jié)果的平均值作為整體模型的回歸值。本文選用擬合優(yōu)度(R2)和平均絕對(duì)百分比誤差(MAPE)作為選取預(yù)測(cè)模型的標(biāo)準(zhǔn),并設(shè)計(jì)交易規(guī)則進(jìn)行回測(cè)交易以檢驗(yàn)選定的預(yù)測(cè)模型的跟蹤交易效果。

      2.1.1 隨機(jī)森林預(yù)測(cè)模型構(gòu)建方法

      隨機(jī)森林回歸模型的構(gòu)建方法是:首先,從N個(gè)交易日時(shí)間序列樣本集中,按7∶3比例有序?qū)С?0%的樣本量作為模型的訓(xùn)練集D,30%樣本量作為模型的測(cè)試集;其次,使用bootstrap重抽樣方法從訓(xùn)練集D中抽取同樣數(shù)量的子樣本集,重復(fù)此步驟n次生成子樣本集Di,i=1,2,3,…,n;接著,以隨機(jī)抽樣的方式對(duì)上述生成的各個(gè)子樣本集進(jìn)行特征抽樣,抽樣的特征數(shù)量保持在總特征數(shù)量的70%以上,各個(gè)樣本集根據(jù)特征抽樣的結(jié)果進(jìn)行訓(xùn)練子集數(shù)據(jù)的重新生成;再次,根據(jù)抽樣的各子樣本集構(gòu)建決策樹,并將n棵決策樹的算術(shù)平均值作為模型的預(yù)測(cè)結(jié)果;最后,對(duì)上述模型參數(shù)進(jìn)行調(diào)整,選擇預(yù)測(cè)效果較優(yōu)的隨機(jī)森林回歸模型。

      2.1.2 對(duì)照模型構(gòu)建

      考慮到本文所選取的預(yù)測(cè)變量的量綱不同,可能會(huì)對(duì)模型的預(yù)測(cè)結(jié)果產(chǎn)生影響。為了避免預(yù)測(cè)變量的不同量綱對(duì)預(yù)測(cè)模型造成負(fù)面影響,本文對(duì)被預(yù)測(cè)變量和篩選出的預(yù)測(cè)變量進(jìn)行歸一化處理,使用上述相同的方式構(gòu)建隨機(jī)森林回歸模型,形成對(duì)照模型,對(duì)比模型回歸結(jié)果選取甲醇期貨價(jià)格的最終預(yù)測(cè)模型。歸一化處理的方法為:

      X′ij= Xij-Mini Maxi-Mini , i=1,2,3,…,14, j=1,2,3,…

      Y′j= Yj-Min Max-Min , j=1,2,3,…

      其中,Xij為第i個(gè)特征變量的第j個(gè)樣本值,Mini為第i個(gè)特征變量的樣本最小值,Maxi為第i個(gè)特征變量的樣本最大值,Maxi為第i個(gè)特征變量的第j個(gè)經(jīng)過(guò)歸一化后的樣本值;Yj為被預(yù)測(cè)變量的第j個(gè)樣本值,Min為被預(yù)測(cè)變量的樣本最小值,Max為被預(yù)測(cè)變量的樣本最大值;Y′j為被預(yù)測(cè)變量的第j個(gè)經(jīng)過(guò)歸一化后的樣本值。

      2.1.3 模型評(píng)估指標(biāo)

      本文采用的模型評(píng)估指標(biāo)為MAPE和R2。設(shè)n為樣本數(shù),yi和y′i分別表示為被預(yù)測(cè)變量的樣本值和預(yù)測(cè)值,其計(jì)算方式為:

      MAPE= 100% n ∑ n i | y′i-yi yi |

      R2=1- SSR SST , SSR= ∑ n i (yi-y′i)2,SST=∑ n i (yi- )2

      其中, 為被預(yù)測(cè)變量的樣本均值。

      2.2 模型回測(cè)檢驗(yàn)方法

      依據(jù)兩種預(yù)測(cè)模型各自評(píng)估指標(biāo)結(jié)果,選定最終的甲醇期貨價(jià)格預(yù)測(cè)模型。使用選定的預(yù)測(cè)模型對(duì)樣本訓(xùn)練集進(jìn)行預(yù)測(cè)得到預(yù)測(cè)樣本集,針對(duì)得到的預(yù)測(cè)樣本集構(gòu)建回測(cè)交易規(guī)則。本文選用的回測(cè)交易策略為基于Aberration策略思想所構(gòu)建的策略集合,并使用夏普比率來(lái)確定交易策略的相關(guān)參數(shù),進(jìn)而確定最終的回測(cè)交易策略。

      Aberration交易策略分為兩個(gè)部分,該策略的第一部分是相關(guān)參數(shù)的計(jì)算:

      UpperBandt=MAt+K1*σt,t=1,2,3,…

      LowerBandt=MAt+K2*σt,t=1,2,3,…

      MAt= ∑Ni=1Closeti N , t=1,2,3,…

      σt=2 ??∑Ni=1(Closeti-Close )2 N ?, t=1,2,3,…

      其中,UpperBandt,t=1,2,3,…為上軌線在t時(shí)刻的向上突破值,LowerBandt,t=1,2,3,…為下軌線在t時(shí)刻的向下突破值,MAt,t=1,2,3,…為甲醇期貨收盤價(jià)在t時(shí)刻的移動(dòng)時(shí)長(zhǎng)為N的移動(dòng)平均值,σt,t=1,2,3,…為甲醇期貨收盤價(jià)在t時(shí)刻移動(dòng)時(shí)長(zhǎng)為N的移動(dòng)標(biāo)準(zhǔn)差,K1和K2為閾值。

      第二部分是交易規(guī)則,Aberration交易策略是基于布林格通道Bollinger Bands理論的策略。Bollinger Bands理論是由John Bollinger在20世紀(jì)60年代提出,該理論指出股價(jià)將主要在由移動(dòng)平均線以及在移動(dòng)平均值基礎(chǔ)上增加和減少一個(gè)單位的移動(dòng)標(biāo)準(zhǔn)差形成的上軌線和下軌線之間波動(dòng),當(dāng)產(chǎn)品價(jià)格觸及上軌線或者下軌線時(shí),價(jià)格將有很大可能性重新回到移動(dòng)平均線附近。Keith Fitschen根據(jù)此理論進(jìn)行了大量實(shí)驗(yàn)后發(fā)現(xiàn)布林格通道的上軌線和下軌線其實(shí)是價(jià)格突破信號(hào),即價(jià)格靠近上軌線或下軌線附近的時(shí)候?qū)⒂泻艽罂赡苄猿^(guò)上軌值或者跌破下軌值。本文采用的交易策略基于Aberration交易策略結(jié)合甲醇期貨價(jià)格預(yù)測(cè)模型進(jìn)行改進(jìn),具體方法為:當(dāng)使用選定的甲醇期貨價(jià)格預(yù)測(cè)模型預(yù)測(cè)第二交易日價(jià)格上漲超過(guò)上軌線時(shí)進(jìn)行買多操作,并在價(jià)格回落到移動(dòng)平均線下方時(shí)進(jìn)行平倉(cāng)操作;當(dāng)使用選定的甲醇期貨價(jià)格預(yù)測(cè)模型預(yù)測(cè)的第二交易日的預(yù)測(cè)價(jià)格跌破下軌線時(shí)進(jìn)行買空操作,并在價(jià)格上升到移動(dòng)平均線上方時(shí)進(jìn)行平倉(cāng)操作。

      由于夏普比率能夠同時(shí)對(duì)收益和風(fēng)險(xiǎn)進(jìn)行考慮,能夠很好地評(píng)估回測(cè)交易效果,所以本文將根據(jù)夏普比率來(lái)進(jìn)行交易策略的篩選,其計(jì)算方法為:

      SharpeRatio= ?E(Rp)-Rf σP

      其中,E(Rp)是投資組合預(yù)期年化報(bào)酬率,Rf為年化無(wú)風(fēng)險(xiǎn)利率,本文采用同期10年期國(guó)債收益率代替,σP是投資組合年化報(bào)酬率的標(biāo)準(zhǔn)差。根據(jù)回測(cè)交易策略的夏普比率確定基于Aberration交易策略的策略參數(shù)N、K1、K2,再根據(jù)確定后的交易策略來(lái)評(píng)估基于基本面特征的甲醇期貨價(jià)格預(yù)測(cè)模型的預(yù)測(cè)能力。

      使用回測(cè)交易方法檢驗(yàn)甲醇期貨價(jià)格預(yù)測(cè)模型有效跟蹤交易效果的具體步驟為:首先,根據(jù)兩組對(duì)照模型的表現(xiàn)結(jié)果進(jìn)行預(yù)測(cè)模型的選擇;其次,根據(jù)選定的甲醇期貨價(jià)格預(yù)測(cè)模型對(duì)價(jià)格預(yù)測(cè)模型的訓(xùn)練樣本集進(jìn)行預(yù)測(cè)得出甲醇期貨價(jià)格預(yù)測(cè)序列;再次,根據(jù)不同N、K1、K2參數(shù)進(jìn)行策略回測(cè)交易,本文中N的取值范圍為[20,60),步長(zhǎng)為1,K1的取值范圍為[0.6, 2),步長(zhǎng)為0.1,K2的取值范圍為[0.6, 2),步長(zhǎng)為0.1, 并計(jì)算各交易策略的夏普比率;最后根據(jù)策略交易回測(cè)收益以及夏普比率選定交易策略作為甲醇期貨價(jià)格預(yù)測(cè)模型所能帶來(lái)的收益,進(jìn)而評(píng)估甲醇期貨價(jià)格預(yù)測(cè)模型的預(yù)測(cè)能力。為了提高交易策略的現(xiàn)實(shí)可用性,本文將使用甲醇期貨價(jià)格預(yù)測(cè)模型預(yù)測(cè)前一段時(shí)間區(qū)間內(nèi)的甲醇期貨價(jià)格,并使用此時(shí)間區(qū)間內(nèi)的樣本進(jìn)行交易策略的篩選,然后使用剩余時(shí)間區(qū)間的樣本進(jìn)行選定的交易策略的測(cè)試,以檢驗(yàn)交易策略的泛化能力。

      3 甲醇期貨價(jià)格隨機(jī)森林預(yù)測(cè)模型構(gòu)建與檢驗(yàn)

      3.1 樣本數(shù)據(jù)說(shuō)明

      本文選取2016年1月2日至2021年5月30日甲醇期貨主力合約收盤價(jià)作為被預(yù)測(cè)變量。備選預(yù)測(cè)變量為焦煤現(xiàn)貨價(jià)格、產(chǎn)量、進(jìn)口量、庫(kù)存量,甲醇現(xiàn)貨價(jià)格、產(chǎn)量、進(jìn)口量、出口量、庫(kù)存量、毛利,醋酸現(xiàn)貨價(jià)格、進(jìn)口量、出口量、庫(kù)存量、消費(fèi)量、毛利,共16個(gè)特征變量。其中現(xiàn)貨價(jià)格數(shù)據(jù)來(lái)源于生意社網(wǎng)站,期貨價(jià)格數(shù)據(jù)來(lái)源于大智慧行情系統(tǒng),其他特征變量來(lái)源于鋼聯(lián)客戶端。備選預(yù)測(cè)變量中包含日序列、周序列、月序列數(shù)據(jù),本文采取的處理方式是交易日若無(wú)前一交易日對(duì)應(yīng)的特征變量樣本值,則選用已有的離本交易日最近的樣本值與之匹配,形成日序列預(yù)測(cè)向量,使用向后偏移一個(gè)交易日的預(yù)測(cè)向量與交易日被預(yù)測(cè)變量進(jìn)行匹配構(gòu)成一條觀測(cè)樣本。

      3.1.1 備選預(yù)測(cè)變量預(yù)處理

      在上述選取的備選預(yù)測(cè)變量中,部分特征變量是日序列數(shù)據(jù),部分是周、月序列數(shù)據(jù),需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。本文對(duì)周以及月序列數(shù)據(jù)的處理方式是將兩個(gè)相鄰樣本日期之間所有交易日的數(shù)據(jù)均取值為距現(xiàn)在較近樣本相對(duì)應(yīng)的取值,將備選預(yù)測(cè)變量樣本數(shù)據(jù)滯后一個(gè)交易日后與被預(yù)測(cè)變量進(jìn)行配對(duì)形成樣本向量。

      3.1.2 備選預(yù)測(cè)變量相關(guān)性分析及預(yù)測(cè)變量篩選

      對(duì)上述預(yù)處理后獲得樣本數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn)。本文選用SPSS統(tǒng)計(jì)軟件對(duì)樣本數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),檢驗(yàn)結(jié)果如表1所示。

      本文僅將被預(yù)測(cè)變量與各備選預(yù)測(cè)變量之間的Pearson相關(guān)性檢驗(yàn)結(jié)果呈現(xiàn)于表1上。根據(jù)相關(guān)性檢驗(yàn)結(jié)果可以看出,在0.01顯著水平(雙側(cè)檢驗(yàn))下,除了煤進(jìn)口量、醋酸消費(fèi)量之外的所有特征變量均與甲醇期貨價(jià)格顯著相關(guān)。此外,根據(jù)相關(guān)性檢驗(yàn)結(jié)果,各備選預(yù)測(cè)變量?jī)蓛芍g,共120對(duì)的相關(guān)性檢驗(yàn)結(jié)果中,有109對(duì)相關(guān)性檢驗(yàn)結(jié)果是顯著的,表明預(yù)測(cè)變量之間存在多重共線性。此外,將被預(yù)測(cè)變量與預(yù)測(cè)變量進(jìn)行Spearman和Kendall相關(guān)性檢驗(yàn),結(jié)果和Pearson檢驗(yàn)結(jié)果一樣,本文未將Spearman和Kendall檢驗(yàn)結(jié)果呈現(xiàn)出來(lái)。根據(jù)相關(guān)性檢驗(yàn)結(jié)果,本文將煤進(jìn)口量和醋酸消費(fèi)量之外的共14個(gè)備選特征變量選為預(yù)測(cè)變量。

      3.2 價(jià)格預(yù)測(cè)模型實(shí)驗(yàn)結(jié)果

      將上述篩選出的14個(gè)特征變量和甲醇期貨價(jià)格分別作為隨機(jī)森林算法模型的預(yù)測(cè)變量和被預(yù)測(cè)變量構(gòu)造預(yù)測(cè)模型1,并對(duì)這些變量進(jìn)行歸一化處理構(gòu)造對(duì)照模型2。根據(jù)本文選擇的模型評(píng)估指標(biāo)R2和MAPE對(duì)兩個(gè)模型的參數(shù)進(jìn)行調(diào)整,選取相對(duì)最優(yōu)模型。調(diào)整后的兩個(gè)預(yù)測(cè)模型的實(shí)驗(yàn)結(jié)果見表2。

      比較上述模型的結(jié)果可以看出,經(jīng)過(guò)歸一化處理的樣本數(shù)據(jù)在MAPE評(píng)估指標(biāo)上要和模型1的結(jié)果相差7.5倍,而在R2這一評(píng)估指標(biāo)上也并未能表現(xiàn)更好,而僅僅只提高了0.1%左右,表明對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理無(wú)法很好地提高模型的預(yù)測(cè)精度。因而,本文選擇未經(jīng)歸一化處理的預(yù)測(cè)模型1作為甲醇期貨價(jià)格預(yù)測(cè)模型。

      3.3 回測(cè)檢驗(yàn)結(jié)果

      使用模型1對(duì)所選樣本時(shí)間區(qū)間的甲醇期貨價(jià)格進(jìn)行預(yù)測(cè)得出甲醇期貨價(jià)格預(yù)測(cè)值,在2016年5月1日至2020年5月1日甲醇期貨價(jià)格模型預(yù)測(cè)值上使用前述的交易策略進(jìn)行回測(cè)交易。由于不同的交易參數(shù)組合將產(chǎn)生不同的交易策略,進(jìn)而可進(jìn)行交易的次數(shù)也隨之不同,本文除去那些在5年內(nèi)交易次數(shù)小于5次以及交易次數(shù)大于25次并且買多或者買空次數(shù)總數(shù)低于2次的交易策略,以確保一年內(nèi)可以實(shí)現(xiàn)至少一次的交易機(jī)會(huì),并且摒棄交易次數(shù)過(guò)多的交易策略。交易策略的統(tǒng)計(jì)結(jié)果為:符合要求的交易策略共274個(gè),其中能夠帶來(lái)正收益的策略共139個(gè);在能夠帶來(lái)正收益的策略中,僅有4個(gè)策略的K2值為0.7,其余均為0.6,并且這4個(gè)交易策略的收益分別為455、432、364、298,屬于收益較小的策略,夏普比率均小于0.7,因而將這4個(gè)策略排除作為最終策略模型的候選項(xiàng),并將K2的值設(shè)定為0.6;將K2其他取值的策略舍棄后僅剩下135條策略,在所剩的135個(gè)策略中,K1取值為0.9時(shí)策略的收益和夏普比率均處于前列,并且兩者的最大值均在其中,因而將K1的值設(shè)定為0.9;將K1其他取值的策略舍棄后僅剩30條策略,再去除夏普比率小于2的策略后僅剩下4條策略,篩選后的相對(duì)最優(yōu)交易策略檢驗(yàn)結(jié)果見表3。

      根據(jù)表3所示,當(dāng)N的取值為44時(shí),策略的夏普比率達(dá)到了2.1884,為所選策略中的第二大取值,但是此時(shí)的收益為所有策略中的最大值,因而N的取值可設(shè)定為44,即最終的交易策略中參數(shù)N、K1、K2取值分別為44、0.9、0.6時(shí),模型的收益達(dá)到最優(yōu),策略的累積收益為792,將此策略的收益作為甲醇期貨價(jià)格預(yù)測(cè)模型的收益。以在交易過(guò)程中需要的最大本金作為本次交易的本金,為2306,因而此次長(zhǎng)期交易的收益率為34.35%,平均年收益率為6.87%,高于同期的10年期固定國(guó)債的利率3.1%一倍多。

      為了檢驗(yàn)上述回測(cè)交易策略的泛化能力,在2020年5月1日至2021年5月1日應(yīng)用該交易策略進(jìn)行回測(cè)交易?;販y(cè)交易的結(jié)果顯示,依據(jù)此策略進(jìn)行投資,投資收益可達(dá)414,年化收益率為21.25%,超過(guò)同期10年期固定國(guó)債利率5.8倍多。

      可以看出,在結(jié)合本文提出的及與之相應(yīng)的基于Aberration策略思想的交易規(guī)則后,基于產(chǎn)業(yè)鏈上下游產(chǎn)品基本面特征的隨機(jī)森林甲醇期貨價(jià)格預(yù)測(cè)模型具有很高的實(shí)用價(jià)值。

      4 結(jié)論與啟示

      本文發(fā)現(xiàn),以甲醇產(chǎn)業(yè)鏈上下游相關(guān)產(chǎn)品的基本面特征作為模型的預(yù)測(cè)變量來(lái)預(yù)測(cè)甲醇的期貨價(jià)格具有很好的預(yù)測(cè)能力,結(jié)合基于Aberration交易策略思想構(gòu)建的交易策略能夠?qū)崿F(xiàn)穩(wěn)定且較高的交易收益。

      首先,本文借助經(jīng)濟(jì)學(xué)原理中的生產(chǎn)成本理論以及供需關(guān)系準(zhǔn)則初步選取了模型的備選預(yù)測(cè)變量,從提高模型實(shí)用性角度出發(fā)將周序列、月序列數(shù)據(jù)細(xì)化為日序列數(shù)據(jù),將被預(yù)測(cè)變量與向前偏移一個(gè)交易日的預(yù)測(cè)變量數(shù)據(jù)進(jìn)行匹配形成樣本向量,通過(guò)相關(guān)性檢驗(yàn)后篩選出模型的預(yù)測(cè)變量。

      其次,考慮到變量的不同量綱可能會(huì)對(duì)模型造成負(fù)面影響,本文采用了歸一化的方式去除量綱可能帶來(lái)的影響,構(gòu)造對(duì)照模型。根據(jù)兩組對(duì)照模型的R2和MAPE模型評(píng)估指標(biāo)結(jié)果選擇甲醇期貨價(jià)格預(yù)測(cè)模型。結(jié)果發(fā)現(xiàn),對(duì)變量進(jìn)行歸一化處理并沒有提高模型的精確度,反而大大增大了模型的誤差。

      最后,結(jié)合基于Aberration交易策略思想構(gòu)建的交易策略集合,使用2016年5月1日至2020年5月1日的甲醇期貨價(jià)格模型預(yù)測(cè)的結(jié)果進(jìn)行回測(cè)交易,并使用夏普比率對(duì)交易策略進(jìn)行篩選,根據(jù)選定的交易策略在價(jià)格預(yù)測(cè)模型的測(cè)試樣本集上的表現(xiàn)結(jié)果來(lái)評(píng)估預(yù)測(cè)模型的實(shí)際價(jià)值。研究發(fā)現(xiàn),在交易策略中周期取值為44,上軌線中的系數(shù)取0.9,下軌線的系數(shù)取0.6時(shí),交易策略的累積平均收益可以達(dá)到較大值,平均年化收益率可以達(dá)到6.87%,超過(guò)同期10年期國(guó)債利率1.2倍多。將此策略應(yīng)用于2020年5月1日至2021年5月1日的甲醇期貨價(jià)格預(yù)測(cè)模型中,預(yù)測(cè)值所獲得的收益達(dá)到414,年化收益率達(dá)到21.25%,超過(guò)同期10年期固定國(guó)債利率5.8倍多。策略的泛化結(jié)果表明,上文提出的甲醇期貨價(jià)格預(yù)測(cè)模型結(jié)合使用改進(jìn)后的Aberration交易策略能夠?qū)崿F(xiàn)很好的投資收益。

      參考文獻(xiàn):

      [1] ?陳標(biāo)金,王鋒.宏觀經(jīng)濟(jì)指標(biāo)、技術(shù)指標(biāo)與國(guó)債期貨價(jià)格預(yù)測(cè):基于隨機(jī)森林機(jī)器學(xué)習(xí)的實(shí)證檢驗(yàn)[J].統(tǒng)計(jì)與信息論壇,2019,34(6):29-35.

      [2] 范俊明,劉洪久,胡彥蓉.基于LSTM深度學(xué)習(xí)的大豆期貨價(jià)格預(yù)測(cè)[J].價(jià)格月刊,2021(2):7-15.

      [3] 周亞.基于XGBoost與彈性網(wǎng)絡(luò)回歸的集成模型對(duì)上證指數(shù)日極差的預(yù)測(cè)分析[J].中國(guó)物價(jià),2021(4/5):68-71.

      [4] 方匡南,吳見彬,朱建平,等.隨機(jī)森林方法研究綜述[J].統(tǒng)計(jì)與信息論壇, 2011, 26(3):32-38.

      [5] 姬培森.基本面和技術(shù)面在期貨市場(chǎng)分析中的價(jià)值研究[J].時(shí)代金融,2020, 4 (13):93-94.

      [6] 李順平,朱昂明.基本面數(shù)據(jù)對(duì)螺紋鋼期貨價(jià)格的指示作用研究[J].時(shí)代金融, 2019, 4(17):96-99.

      [7] 金志峰,崔楠楠,宋歆欣.鐵礦石市場(chǎng)價(jià)格主導(dǎo)因素實(shí)證研究[J].冶金經(jīng)濟(jì)與管理, 2021,4(1):8-13.

      [8] 馬鄭瑋,琚心然,姚瑜,等.基于產(chǎn)業(yè)鏈視角對(duì)石油期貨與PTA期貨價(jià)格關(guān)聯(lián)性的分析[J/OL].現(xiàn)代化工,(3/4/5):1-16[2021-07-20].http://kns.cnki.net/kcms/detail/11.2172.tq.20200910.0845.005.html.

      [9] 張宗成,王駿.世界鐵礦石的生產(chǎn)與貿(mào)易和我國(guó)鐵礦石供需的經(jīng)濟(jì)學(xué)分析[J].國(guó)際貿(mào)易問(wèn)題,2005,4(9):28-33.

      [10] EINAV L, LEVIN J. Economics in the age of big data[J]. Science,2014,346(6210).

      [11] VESPIGNANI A. Predicting the Behavior of Techno-Social Systems[J]. Science, 2009, 325(5939).

      [12] BREIMAN L. Random forests[J]. Machine Learning,2001(5):5-32.

      [13] PREZ-RAVE, ORREA-MORALES, ONZLEZ-ECHAVARRA. A machine learning approach to big data regression analysis of real estate prices for inferential and predictive purposes[J]. Journal of Property Research, 2019,36(1).

      猜你喜歡
      隨機(jī)森林
      隨機(jī)森林算法在中藥指紋圖譜中的應(yīng)用:以不同品牌夏桑菊顆粒指紋圖譜分析為例
      基于隨機(jī)森林的登革熱時(shí)空擴(kuò)散影響因子等級(jí)體系挖掘
      基于隨機(jī)森林的HTTP異常檢測(cè)
      個(gè)人信用評(píng)分模型比較數(shù)據(jù)挖掘分析
      隨機(jī)森林在棉蚜蟲害等級(jí)預(yù)測(cè)中的應(yīng)用
      基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
      軟件(2016年7期)2017-02-07 15:54:01
      拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
      基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
      基于奇異熵和隨機(jī)森林的人臉識(shí)別
      軟件(2016年2期)2016-04-08 02:06:21
      基于隨機(jī)森林算法的B2B客戶分級(jí)系統(tǒng)的設(shè)計(jì)
      怀集县| 堆龙德庆县| 电白县| 河南省| 灵宝市| 华蓥市| 信宜市| 台山市| 岳阳市| 固阳县| 宁乡县| 喀喇| 淮阳县| 平乐县| 昌都县| 米易县| 福清市| 巫溪县| 神农架林区| 阿拉善盟| 广平县| 家居| 龙南县| 博乐市| 大田县| 鹤壁市| 安西县| 天气| 安多县| 比如县| 融水| 大宁县| 庆安县| 扶沟县| 昌邑市| 隆回县| 延边| 隆尧县| 定襄县| 凌海市| 东平县|