劉培培 張肖肖
【摘要】原油和化工產品在國民經濟和生活中的作用越來越大,把握其價格運行規(guī)律對于企業(yè)生產經營意義重大。本文提出了一種改進的模糊時間序列預測方法,將其應用到了上海原油期貨和鄭州盯A期貨的價格預測當中。通過樣本數據的檢驗,不僅證明了算法的有效性,同時證明了對企業(yè)業(yè)務經營也具有指導意義。
【關鍵詞】原油期貨;PTA期貨;模糊時間序列;價格預測
隨著中國經濟的發(fā)展和產業(yè)的升級,能源和化工行業(yè)在國民經濟生活中的影響越來越大。上述兩行業(yè)作為上下游既緊密聯系,同時又各具特點。傳統(tǒng)能源例如原油、煤炭和天然氣等產品,對國民經濟的正常運行起到至關重要的作用。而下游石化行業(yè)部門龐大,牽涉到工業(yè)和民用的方方面面。原油和化工市場參與者眾多、價格波動率高,而且通常具有波動性集簇效應。如果能夠把握能源化工產品的價格走勢規(guī)律,那么對于降低市場風險,提高企業(yè)運行效率,乃至保障國計民生都將起到重要作用。
從影響力上看,原油是我國最重要的能源之一,2018年我國對外依存度已經達到70%。原油價格主要受到供給面、地緣政治、天氣和市場投機因素的影響。PTA作為原油產業(yè)鏈的終端標準化產品之一,價格受到上游原料、行業(yè)產能和下游需求等因素影響。同時,由于期貨市場具有價格發(fā)現和套期保值的功能,本文選取上海原油和鄭州PTA期貨作為研究對象,討論對這兩種產品的價格預測。
一、模糊時間序列方法
國內學界和業(yè)界對能源化工產品的研究很多,如文獻[6,7]等。但是多數研究非常重視數學和算法的作用,較容易出現過度擬合和為了預測而預測的問題。此外,如果過度依靠優(yōu)化算法,就容易忽視人的主觀能動性作用。
模糊時間序列最早由文獻[8]提出,最初主要應用到大學錄取人數預測、股票指數預測等。文獻[11]將模糊時間序列應用到了國際油價的預測當中,但文獻的研究具有以下局限性:
1)缺乏對模糊區(qū)間的有效性說明。
2)針對樣本,僅僅將每年前10個月數據用作訓練數據,后2個月的數據作為驗證數據,進行價格預測未能充分利用市場信息。
3)僅將數據運用到了WT原油的研究中,缺乏對中國市場運行特點的研究。
針對文獻[11]的不足之處,本文相應進行了改進。第一,模糊時間序列法相對于純算法預測來說,最大的優(yōu)點在于能夠將人的主觀判斷融合到預測過程當中。我們對模糊區(qū)間選取方法進行改進。我們邀請油氣以及化工行業(yè)中的11位行業(yè)專家,采用專家咨詢的方法考察模糊區(qū)間的劃定原則。專家們一致認為,把模糊區(qū)間劃分為5個,更符合人類的認知過程,更有利于調動決策者的積極性。第二,計算方法上,不再把每年的數據單獨分割為訓練數據和驗證數據,采取自啟動分步油價預測方法,能夠及時和充分利用市場中新的交易信息,提高市場預測的準確度。第三,將模糊時間序列應用到了中國市場中,分別就上海原油和鄭州PTA期貨價格進行分析,得出了上述兩市場的特點。
模糊時間序列的基本概念定義如下:
1)對于模糊時間序列F(t),如果存在模糊集上的關系R(t+1,t),使得F(t+1)=F(t)。R(t+1,t),那我們就關系R(t+1,t)稱為F(t)→F(t+1)。
2)如果有兩個連續(xù)的模糊序列值F(t)=4和F(t+1)=Aj,那么我們就稱上述兩個模糊值存在關系Ai→Aj。
3)在給定的模糊時間序列中,模糊域定義為u=[Umin-D1,Umax+D2],其中Umax和Umin代表了樣本區(qū)間內的原油期貨最高價和最低價。
本文提出一種改進的模糊時間序列算法,其基本計算步驟如下。第一步,從當前油價時間序列中,選定前n個交易日的價格序列P(t1),P(t2),…,P(tn),形成自啟動樣本St;第二步,對自啟動樣本St,定義模糊域Ut;第三步,將模糊時間序列價格轉化為模糊語言數字:第四步,建立模糊時間序列關系,計算自啟動樣本的權重矩陣,并對自啟動樣本的下一期油價進行預測:第五步,將價格p(tn+1)加入到原始啟動樣本St中,形成新的樣本St+1,并重新計算模糊定義域Ut+1;第六步,繼續(xù)按照模糊時間序列方法,利用樣本St+1預測價格P(tn+2);第七步,繼續(xù)對剩余樣本重復第四步和第五步,直至完成對價格的預測。
二、期貨價格數據
本文所采用的期貨價格為上海能源交易所的原油期貨主力合約和鄭州商品交易所PTA期貨主力合約的收盤價。其中上海原油期貨上市時間較短,樣本數量相對少。上海原油期貨價格區(qū)間為2018年3月26日至2019年3月6日,共計230個交易日,合約均價為471元/桶。鄭商所PTA價格數據起止日期為2006年12月18日至2019年3月6日,共計2970個交易日,合約均價為7012元/噸。
期貨價格樣本對應的統(tǒng)計樣本特性見下表??傮w來看,上海原油和鄭州PTA期價總體上服從正態(tài)分布。雖然上述兩種期貨價格的極端分布頻次較少,但原油和PTA期價呈現較大波動性,標準差分別為233.54元和1692.7元。由此可見,能源化工產品面臨極端價格的影響,如果能夠對期貨價格進行有效預測,將有助于行業(yè)企業(yè)進行套期保值業(yè)務和現貨交易業(yè)務。
三、模型預測結果
同時,我們對所有樣本的價格、預測價格、標準差和均方根誤差進行作圖。從價格走勢上看,本文所采用的模糊時間序列算法,在對應無論是對僅有230個數據的上海原油小樣本,還是對有2970個大樣本的鄭州PTA期價預測均起到了較好的結果,預測出來的價格總體上能較緊密地貼近實際價格走勢。其次,在方向性預測的方面,在價格出現較大波動的時候,模糊時間序列能及時反映出價格變化的方向。
四、結論和意義
從現實指導意義上看,采用本文提出的模糊時間序列預測方法,能夠協(xié)助原油和PTA產業(yè)鏈企業(yè)做好價格預測,降低價格波動所帶來的風險。當市場波動加劇時,預示著市場可能進一步出現波動,必須做好套期保值業(yè)務。同時,在市場價格形成趨勢的時候,往往會沿著目前方向繼續(xù)運行,必須提前做好市場預測和分析。最后,也應當看到,雖然模糊時間序列方法輔助了價格預測,但是在預測的精確度上仍有誤差。下一步研究工作的重點在于提高模型的準確度方面。