王宏濤, 李 嵐
(西安郵電大學(xué) 經(jīng)濟(jì)與管理學(xué)院, 陜西 西安 710121)
期貨[1]是指以某種大宗商品或金融資產(chǎn)為標(biāo)的可交易的標(biāo)準(zhǔn)化遠(yuǎn)期合約,標(biāo)的物為實物商品的期貨合約是商品期貨,標(biāo)的物為金融產(chǎn)品的期貨合約是金融合約。股票指數(shù)(簡稱股指)[1]是反映和衡量所選擇的一組股票的價格的平均變動的指標(biāo),它可以作為一種交易標(biāo)的物進(jìn)行現(xiàn)貨或期貨交易。我國主要的股票指數(shù)有:滬深300指數(shù)、上證50指數(shù)和中證500指數(shù)等[1]。股票價格指數(shù)期貨(簡稱股指期貨)[1]是以股票指數(shù)這種金融產(chǎn)品為標(biāo)的資產(chǎn)的標(biāo)準(zhǔn)化期貨合約,與現(xiàn)貨相對應(yīng),并由現(xiàn)貨衍生而來。在金融市場中,由于價格波動性[2]是反應(yīng)市場價格行為、質(zhì)量和效率的有效指標(biāo),因此資產(chǎn)價格波動性的研究,是眾多國內(nèi)外研究者對金融市場進(jìn)行定量研究的選擇對象,是分析資產(chǎn)定價,金融風(fēng)險防范等問題的前提基礎(chǔ)[2]。
目前關(guān)于我國股指期貨價格波動性的研究,主要以對滬深300股指期貨在不同發(fā)展階段與現(xiàn)貨之間的價格波動關(guān)系為主。期貨上市初期,文獻(xiàn)[3]采用滬深300股指期貨上市以來的15個月內(nèi)每分鐘交易數(shù)據(jù),將其分成3段構(gòu)建廣義自回歸條件異方差(generalized auto-regressive conditional heteroscedasticity, GRACH)模型,認(rèn)為股指期貨市場和股指現(xiàn)貨市場之間存在雙向的波動溢出效應(yīng),這種差異表現(xiàn)在不同時間段,短期效應(yīng)以現(xiàn)貨市場為主,而期貨合約上市初期以期貨市場為主,但該文獻(xiàn)沒有從長期角度考察期貨的推出對指數(shù)波動率的影響[4]。文獻(xiàn)[5]使用市場每5分鐘交易數(shù)據(jù)研究在股指期貨市場初期,滬深300股指期貨與現(xiàn)貨之間的波動相關(guān)性與溢出效應(yīng),認(rèn)為期貨市場與現(xiàn)貨市場在整體上具有很強(qiáng)的正相關(guān)性和時變性,表現(xiàn)出較強(qiáng)的雙向溢出效應(yīng),期貨市場的波動影響程度大于現(xiàn)貨市場的波動影響,但該文獻(xiàn)沒有使用日間隔交易數(shù)據(jù)考察兩市場隔夜價格之間的引導(dǎo)關(guān)系[6]。文獻(xiàn)[7]使用中國和國際股市的數(shù)據(jù),采用面板數(shù)據(jù)政策評估方法構(gòu)建現(xiàn)貨市場波動,避免了現(xiàn)有文獻(xiàn)中不受控制的市場因素導(dǎo)致的潛在遺漏變量偏差,分析了股指期貨市場對中國股市現(xiàn)貨價格波動的影響,認(rèn)為引入股指期貨交易顯著降低了中國股市的波動性,但該文獻(xiàn)并沒有考察期貨與現(xiàn)貨市場間的動態(tài)波動聯(lián)動性[8]。在期貨上市4年到5年時期,文獻(xiàn)[9]使用2015年股市“瘋?!迸c“股災(zāi)”兩個階段的數(shù)據(jù),研究對比了不同階段期貨市場對現(xiàn)貨市場的波動影響,認(rèn)為無論市場處于哪個時期,股指期貨對現(xiàn)貨的波動溢出效應(yīng)都更強(qiáng),且都具有顯著的動態(tài)相關(guān)性與時變性,但未考慮不同階段下市場信息在期貨與現(xiàn)貨間的傳遞關(guān)系[10]。
另一方面,期貨與現(xiàn)貨價格的預(yù)測問題也是投資者與研究者關(guān)注的主題。由于股指期貨常被投資者利用,與其他金融工具一起構(gòu)建各種靈活的投資組合,來實現(xiàn)風(fēng)險管理與套期保值等,近些年,眾多研究者關(guān)注如何能在價格波動中,提高股票和股指期貨的預(yù)測能力,從而獲得更高的投資收益,其中神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法被廣泛用于金融資產(chǎn)價格預(yù)測方面。文獻(xiàn)[11]使用神經(jīng)網(wǎng)絡(luò)對IBM公司的日報酬率進(jìn)行預(yù)測,實驗過程發(fā)現(xiàn)由于優(yōu)化方法的局部性,導(dǎo)致研究結(jié)果并不理想。文獻(xiàn)[12]與文獻(xiàn)[13]使用神經(jīng)網(wǎng)絡(luò)技術(shù),分別對東京證劵交易所的加權(quán)平均指數(shù)和道瓊斯工業(yè)指數(shù)進(jìn)行預(yù)測,驗證神經(jīng)網(wǎng)絡(luò)模型的預(yù)測能力,認(rèn)為該預(yù)測方法相比簡單地統(tǒng)計學(xué)算法更加好。文獻(xiàn)[14]使用BP網(wǎng)絡(luò)做了股價漲跌的預(yù)測實驗,認(rèn)為人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于中國股票市場的預(yù)測,是可行和有效的,但預(yù)測精度還有待提升[15]。
隨著國內(nèi)外眾多研究者的不斷實驗,發(fā)現(xiàn)長短期記憶(long-term and short-term, LSTM)神經(jīng)網(wǎng)絡(luò)算法[15]能夠通過循環(huán)結(jié)構(gòu)引入內(nèi)部記憶單元,保存一些歷史信息,從中發(fā)現(xiàn)序列之間的長期依賴關(guān)系,因此更適用于時間序列的預(yù)測。文獻(xiàn)[15]使用LSTM神經(jīng)網(wǎng)絡(luò)算法結(jié)合技術(shù)分析指標(biāo),利用歷史股價預(yù)測了未來股價走勢,認(rèn)為與其他機(jī)器學(xué)習(xí)方法和投資策略相比,LSTM神經(jīng)網(wǎng)絡(luò)算法能夠較好地預(yù)測且性能更好,但此方法沒有應(yīng)用于中國金融市場[16]。文獻(xiàn)[17]構(gòu)造了深層LSTM神經(jīng)網(wǎng)絡(luò)算法,對全球30個股票指數(shù)進(jìn)行了預(yù)測研究,發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)算法具有較好的預(yù)測精度,但沒有對訓(xùn)練方法進(jìn)行改進(jìn),未提升預(yù)測精度[17]。
本文擬分析股指期貨與現(xiàn)貨市場之間的價格傳導(dǎo)關(guān)系與波動相關(guān)性,使用VAR模型[18]均值方程的DCC-GRACH模型[19],分析國內(nèi)滬深300股指期貨上市5年到8年時期,股指期貨市場與現(xiàn)貨市場的價格波動聯(lián)系,并利用日間隔交易數(shù)據(jù)與每5分鐘間隔交易數(shù)據(jù)進(jìn)行分析對比。另一方面,基于期貨市場與現(xiàn)貨市場的影響關(guān)系,利用LSTM神經(jīng)網(wǎng)絡(luò)算法,使用滬深300股指期貨的歷史價格,對滬深300股指現(xiàn)貨的價格走勢進(jìn)行預(yù)測,并從序列長度方面分析算法的性能。
股票價格是金融市場的晴雨表,以股票價格指數(shù)作為交易標(biāo)的的股指期貨,能使信息在現(xiàn)貨與期貨市場之間傳遞與吸收[20]。假設(shè)時間為動態(tài)變量t,F(xiàn)t是t時期股指期貨的交易價格,股指期貨的交易價格與股指現(xiàn)貨交易價格的函數(shù)關(guān)系[21]為
Ft=Ste(r-d)(T-t)。
(1)
其中,St為t時期股指現(xiàn)貨的交易價格,e()為指數(shù)函數(shù),r為貨幣市場無風(fēng)險利率,d為持股利息,r-d為凈息差,T為期貨合約期,T-t為t時期合約剩余有效期。在無交易成本完全有效和連續(xù)的市場中,期貨合約期內(nèi)的每一個時刻都應(yīng)滿足與現(xiàn)貨價格的函數(shù)關(guān)系式(1)。
設(shè)股指現(xiàn)貨的t時期價格漲幅(即價格波動率)為RS,t,其計算公式為
RS,t=Ln(St-St-1)。
(2)
其中,t-1表示t時期的前一時期,St-1和St分別表示在t-1和t時期的股指現(xiàn)貨價格。
設(shè)股指期貨的t時期價格波動率為RF,t,其計算公式為
RF,t=Ln(Ft-Ft-1)。
(3)
其中,F(xiàn)t-1和Ft分別表示在t-1和t時期的股指期貨價格。
股指現(xiàn)貨的價格波動率,等于股票組合的凈套利成本加上期貨合約的價格波動率,表示為
RS,t=(r-d)+RF,t。
(4)
假設(shè)股票指數(shù)的短期利率和股息收益率是恒定的,而股指期貨市場和股票市場是有效的和連續(xù)的,則應(yīng)實現(xiàn)以下持有成本理論[20]。
(a)期貨合約收益率的標(biāo)準(zhǔn)差,等于標(biāo)的股指收益率的標(biāo)準(zhǔn)差。
(b)期貨合約的同期收益率與標(biāo)的股票組合的同期收益率,完全正相關(guān)。
(c)股票指數(shù)組合的預(yù)期價格增值率,等于凈息差加上期貨合約的預(yù)期回報率等含義。
但現(xiàn)實中股指期貨市場存在各種因素,使得上述理論并不總是成立的。
首先,指數(shù)內(nèi)交易不頻繁,個別股票的市場并不是完全連續(xù)的,因此,股票指數(shù)價格作為成分股最后交易價格的平均值,滯后于股票市場的實際發(fā)展[20]。假設(shè)股指期貨價格能夠即時反映新的信息,由于交易的不頻繁,觀察到的期貨收益就會領(lǐng)先于觀察到的股指收益。
其次,指數(shù)期貨市場作為允許投資者做空市場的第一種方式,有助于投資者快速將其負(fù)面信息轉(zhuǎn)化為市場價格,并在下行趨勢的市場中發(fā)揮作用,因此表現(xiàn)出價格發(fā)現(xiàn)功能[20]?;谝陨侠碚摚疚奶岢龅谝粋€研究假設(shè):期貨市場與現(xiàn)貨市場之間存在一定的價格傳遞關(guān)系與長期均衡關(guān)系。
最后,計算收益時使用的價格是交易價格,市場弱有效條件下,這些交易價格在買賣水平之間往往隨機(jī)波動,從而產(chǎn)生噪聲,在連續(xù)交易中,買入價和賣出價之間的隨機(jī)價格變動,導(dǎo)致觀察到的收益率出現(xiàn)負(fù)的相關(guān)性[21]。本文提出第二個研究假設(shè):股指期貨與現(xiàn)貨價格波動之間存在一定的動態(tài)相關(guān)性。
選取中國金融期貨交易所滬深300股指期貨和滬深300股指現(xiàn)貨,從2016年9月到2019年4月每5分鐘間隔的交易價格,作為本文分析的日內(nèi)數(shù)據(jù)[6],選取從2010年4月到2019年4月的日間隔交易價格,作為本文分析的日間數(shù)據(jù)[22],所有數(shù)據(jù)來源于wind數(shù)據(jù)庫[6]。分別選取交易時間段9時35分到11時25分和13時05分到14時55分[6],剔除期貨市場與現(xiàn)貨市場交易時間不一致的數(shù)據(jù),得到完全匹配的日內(nèi)數(shù)據(jù)共16 383條數(shù)據(jù),日間數(shù)據(jù)集得到2 174條數(shù)據(jù)。由于進(jìn)行價格預(yù)測的方法選擇了LSTM神經(jīng)網(wǎng)絡(luò)算法[23],該算法的訓(xùn)練過程依賴于較大的數(shù)據(jù)量,因此使用數(shù)量較多的5分鐘間隔數(shù)據(jù)作為預(yù)測實驗的數(shù)據(jù)集,以滿足數(shù)據(jù)集充足的原則[24]。價格波動率的計算使用式(2)與式(3),表1為期貨價格與現(xiàn)貨價格的描述性統(tǒng)計。
表1 期貨價格和現(xiàn)貨價格的描述性統(tǒng)計
注Jarque-Bera值是對樣本數(shù)據(jù)是否具有符合正態(tài)分布的偏度和峰度的擬合優(yōu)度的檢驗,值越大,表示數(shù)據(jù)越不具有正態(tài)分布。
從表1可以看出,日間數(shù)據(jù)中,期貨收益率相比現(xiàn)貨收益率波動更大,而日內(nèi)數(shù)據(jù)中,期貨與現(xiàn)貨波動情況相當(dāng)。從偏度統(tǒng)計量可以看出,現(xiàn)貨的日間數(shù)據(jù)與日內(nèi)數(shù)據(jù)均呈現(xiàn)左偏分布,期貨的日間數(shù)據(jù)呈現(xiàn)左偏分布,但日內(nèi)數(shù)據(jù)呈現(xiàn)右偏分布。從峰度統(tǒng)計量可以看出,所有樣本數(shù)據(jù)都高于正態(tài)分布的極端值,均符合金融序列波動率的尖峰厚尾特征。所有樣本jarque-bera(JB)統(tǒng)計值都很大且概率P值為0,說明4個樣本數(shù)據(jù)均不服從正態(tài)分布。
DCC-GRACH模型[19]在描述金融變量之間的動態(tài)作用機(jī)制方面具有顯著的效果,通過計算動態(tài)條件系數(shù),可以有效地反映變量之間的波動相關(guān)性。首先利用VAR模型構(gòu)建均值方程[18]
(5)
Yt=[RS,t,RF,t]′。
(6)
其中,Yt為t時期現(xiàn)貨價格波動率RS,t與期貨價格波動率RF,t的列向量,A0為常數(shù)矩陣,n為滯后階數(shù),Ai為第i階滯后變量的2×2參數(shù)矩陣,Yt-i為t時期滯后i階的波動率列向量,εt=[ε1,t,ε2,t]′是均值為0的殘差列向量,VAR模型的實驗結(jié)果可以確定股指期貨與現(xiàn)貨價格傳導(dǎo)過程是否具有超前滯后的關(guān)系。
假設(shè)股指期貨與現(xiàn)貨價格,都服從多元正態(tài)分布,則構(gòu)建DCC-GRACH模型[18-19]檢驗價格波動相關(guān)性,該模型可以表示為
(7)
其中,Ht是條件方差一階方差矩陣,Dt是一個包含單變量GARCH模型時變標(biāo)準(zhǔn)差的2×2矩陣,Rt為t時期的動態(tài)相關(guān)矩陣,diag()為對角矩陣函數(shù),hi,t為條件方差,Qt為2×2正定矩陣,diag(Qt)-1表示標(biāo)準(zhǔn)化正定矩陣的逆矩陣,S是2×2的協(xié)方差矩陣,εt表示t時期的誤差向量,ε′t表示εt的轉(zhuǎn)置向量,Qt-1為前一時期的正定矩陣,α和β則是DCC-GARCH模型重點觀察的系數(shù),α用于解釋當(dāng)前信息對下一期價格波動性的影響程度,β用來衡量現(xiàn)有波動的持續(xù)性,α+β越接近于1,則表明波動持續(xù)的時間越久。
若上述提出的兩個實驗的結(jié)果成立,即證明了股指期貨與股指現(xiàn)貨之間存在超前滯后關(guān)系,且價格波動具有顯著相關(guān)性,則使用領(lǐng)先關(guān)系的股指期貨價格建立LSTM算法,對滯后關(guān)系的股指現(xiàn)貨價格進(jìn)行走勢預(yù)測。
為了利于模型的訓(xùn)練和結(jié)果的預(yù)測,使股價信息充分被利用,在進(jìn)行LSTM神經(jīng)網(wǎng)絡(luò)算法對股價預(yù)測的實驗之前,對數(shù)據(jù)進(jìn)行預(yù)處理。首先,對原始數(shù)據(jù)特征進(jìn)行簡單的人工處理,即計算股指期貨的標(biāo)準(zhǔn)差、方差,不同買手的方差、標(biāo)準(zhǔn)差,價格的漲跌率,價格的變化量,價格的交易量等。經(jīng)過預(yù)處理之后的數(shù)據(jù)集的維度為數(shù)據(jù)個數(shù)、序列數(shù)據(jù)長度與特征維度三者之積。
其次,對于序列數(shù)據(jù),使用高斯噪聲完成了數(shù)據(jù)增廣,將數(shù)據(jù)擴(kuò)充到原始數(shù)據(jù)的10倍。最后使用均值轉(zhuǎn)換,將價格歸一化處理為0~1之間的浮點數(shù),使數(shù)據(jù)更適合模型訓(xùn)練,減少模型崩潰發(fā)生的可能性,歸一化處理公式[23]為
(8)
其中,x=(x1,x2,…,xt),x1是現(xiàn)貨價格數(shù)據(jù)集中第一個時期的價格,x2是現(xiàn)貨價格數(shù)據(jù)集中第二個時期的價格,xt是現(xiàn)貨價格數(shù)據(jù)集中第t個時期的價格,max(x)表示現(xiàn)貨價格數(shù)據(jù)集中價格的最大值,min(x)表示現(xiàn)貨價格數(shù)據(jù)集中價格的最小值。
LSTM擁有復(fù)雜的動態(tài)單元,可以更方便記錄一定步長的序列數(shù)據(jù)的上下文信息,具體結(jié)構(gòu)如圖1所示。
圖1 LSTM單元結(jié)構(gòu)
圖1中,Cell代表一個完整的LSTM單元,LSTM單元包含一個輸入門、一個遺忘門和一個輸出門,設(shè)輸入門為z,輸出門為o,調(diào)制門為g,遺忘門為f,ct為遺忘門轉(zhuǎn)換的狀態(tài)單元。設(shè)x為現(xiàn)貨價格輸入向量,則x=(x1,x2,…,xt),設(shè)y為預(yù)測價格輸出向量,則y=(y1,y2,…,yt),LSTM的各個組件之間的工作原理如式(9)至式(13)所示,zt表示t時期輸入門的輸出結(jié)果,表達(dá)式為
zt=sigmoid(Wzxxt+Wzyyt-1)。
(9)
其中,sigmoid函數(shù)被用作神經(jīng)網(wǎng)絡(luò)的激活函數(shù),xt為t時期的現(xiàn)貨價格輸入向量,Wzx表示輸入門輸入向量xt的權(quán)重系數(shù)矩陣,yt-1表示t-1時期的預(yù)測價格輸出向量,Wzy表示輸入門輸出向量yt-1的權(quán)重系數(shù)矩陣。
ft表示t時期遺忘門的輸出結(jié)果,表達(dá)式為
ft=sigmoid(Wfxxt+Wfyyt-1)。
(10)
其中,Wfx表示遺忘門輸入向量xt的權(quán)重系數(shù)矩陣,Wfy遺忘門輸出向量yt-1的權(quán)重系數(shù)矩陣。
ot表示t時刻輸出門的輸出結(jié)果,表達(dá)式為
ot=sigmoid(Woxxt+Woyyt-1)。
(11)
其中,Wox表示輸出門輸入向量xt的權(quán)重系數(shù)矩陣,Woy輸出門輸出向量yt-1的權(quán)重系數(shù)矩陣。ct表示t時期輸出門非直線轉(zhuǎn)換的輸出結(jié)果,表達(dá)式為
ct=ft⊙ct-1+zt⊙Wcyyt。
(12)
其中,ct-1表示t-1時期輸出門非直線轉(zhuǎn)換的輸出結(jié)果,Wcy表示轉(zhuǎn)換后輸出向量yt的權(quán)重系數(shù)矩陣,符號⊙為邏輯運算符“同或”。
設(shè)LSTM單元在t時期最終的輸出結(jié)果為ht,則ht由輸出門、輸入門、遺忘門和前一時刻的輸出進(jìn)行邏輯運算后得出,表達(dá)式為
ht=zt⊙ct+ft⊙ht-1。
(13)
具體到時間序列中,ht表示時間序列信息在初始狀態(tài)下的t時期所對應(yīng)的數(shù)據(jù)。LSTM算法之所以能夠記憶序列數(shù)據(jù)的上下文信息,關(guān)鍵之處在于其中的遺忘門[24]。遺忘門轉(zhuǎn)換的狀態(tài)單元 用于保存數(shù)據(jù)的上下文信息。當(dāng)一個序列的股票信息按照時間順序依次輸入到LSTM單元中,遺忘門就會記錄數(shù)據(jù)的上一個狀態(tài)信息,并將其應(yīng)用到對下一個序列數(shù)據(jù)的特征提取中,最后通過計算對后續(xù)的數(shù)據(jù)進(jìn)行預(yù)測。
由于單層LSTM神經(jīng)網(wǎng)絡(luò)提取的特征,不足以挖掘數(shù)據(jù)的深層信息,在實際的算法設(shè)計中,一般使用 層LSTM神經(jīng)網(wǎng)絡(luò)對序列數(shù)據(jù)的預(yù)測[24],在使用層LSTM神經(jīng)網(wǎng)絡(luò),低層LSTM的輸出作為高層LSTM的輸入。第一層LSTM中輸入的數(shù)據(jù)為原始期貨信息,信息中包含開盤價、收盤價、最高價、成交量、差離值指標(biāo)和隨機(jī)指標(biāo)等信息。在LSTM逐層計算過程中,前一層的序列數(shù)據(jù)經(jīng)過運算之后更新為新的序列數(shù)據(jù)輸入到下一層,最后以序列數(shù)據(jù)的形式輸出。
3.1.1 序列平穩(wěn)性檢驗
所有時間序列模型都要求樣本序列為平穩(wěn)性時間序列,因此在構(gòu)建模型之前首先對期貨與現(xiàn)貨收益率數(shù)據(jù)做單位根檢驗,單位根檢驗結(jié)果如表2所示。
表2 單位根檢驗結(jié)果
注***代表估計結(jié)果通過1%水平檢驗。
從表2中可以看出,股指期貨與現(xiàn)貨日間價格數(shù)據(jù)和日內(nèi)價格數(shù)據(jù),均在1%水平下拒絕了存在單位根的原假設(shè),因此數(shù)據(jù)皆為平穩(wěn)性序列,不會出現(xiàn)偽回歸現(xiàn)象,可以做后續(xù)的模型建設(shè)。
3.1.2 VAR模型與Johenson協(xié)整檢驗
為了檢驗期貨市場與現(xiàn)貨市場的價格傳遞關(guān)系及長期均衡關(guān)系,使用VAR模型和Johenson協(xié)整[25]進(jìn)行驗證。首先建立VAR模型選擇滯后階數(shù),滯后階數(shù)信息準(zhǔn)則表如表3所示。
根據(jù)AIC和SC取值最小時確定階數(shù),如果AIC和SC并不是同時取值最小,則采用LR檢驗進(jìn)行取舍[18]。通過信息準(zhǔn)則最終選取日間價格數(shù)據(jù)的最優(yōu)滯后階數(shù)為3,日內(nèi)價格數(shù)據(jù)的最優(yōu)滯后階數(shù)為2,說明期貨市場與現(xiàn)貨市場之間的價格傳導(dǎo)過程中,存在一定的超前滯后關(guān)系,股指期貨市場的價格傳導(dǎo)速度至少領(lǐng)先股指現(xiàn)貨市場2分鐘,驗證了上述第一個假設(shè)成立。
通過選取的滯后階數(shù)進(jìn)行協(xié)整檢驗,根據(jù)數(shù)據(jù)特征和單位根檢驗的結(jié)果,選擇協(xié)整檢驗只含截距不含趨勢項的模型,協(xié)整檢驗結(jié)果如表4所示。
表3 滯后階數(shù)信息準(zhǔn)則表
注*表示模型選擇的滯后階數(shù),logL表示系統(tǒng)的似然估計, LR表示似然比統(tǒng)計量,NA表示空值,F(xiàn)PE表示最終預(yù)測誤差準(zhǔn)則,AIC表示系統(tǒng)信息準(zhǔn)則,SC表示施瓦茲信息準(zhǔn)則,HQ表示Hannan-Quinn信息準(zhǔn)則。
表4 股指期現(xiàn)貨價格間協(xié)整檢驗結(jié)果
從表4可以看出,期貨與現(xiàn)貨價格之間存在協(xié)整關(guān)系,說明股指期貨市場與股指現(xiàn)貨市場之間具有長期穩(wěn)定的均衡關(guān)系。
3.1.3 ARCH效應(yīng)
使用自回歸條件異方差(auto-regressive conditional heteroskedasticity ARCH )效應(yīng)的拉格朗日乘數(shù)[20]檢驗期貨市場與現(xiàn)貨市場的收益率殘差序列的ARCH效應(yīng),ARCH效應(yīng)檢驗結(jié)果如表5所示。
從表5的結(jié)果看出,兩組數(shù)據(jù)P值均小于1%,拒絕原假設(shè),因此都存在ARCH效應(yīng),即存在明顯的異方差性,可以構(gòu)造GRACH模型。
表5 ARCH效應(yīng)檢驗結(jié)果
3.1.4 DCC-GRACH模型估計
通過上述檢驗,驗證了樣本數(shù)據(jù)符合GRACH模型的條件需求,下文建立DCC-GRACH模型對兩市場間波動相關(guān)性進(jìn)行檢驗,從而驗證上述第二個假設(shè)。首先對收益率序列進(jìn)行單方程GRACH(1,1)參數(shù)估計,GRACH模型估計結(jié)果如表6所示。
從表6可以看出,日間與日內(nèi)數(shù)據(jù)中,股指期貨市場收益率序列與股指現(xiàn)貨市場收益率序列的ARCH項 和GRACH項 均在1%水平下顯著為正, 小于1且接近于1,說明期貨與現(xiàn)貨價格波動具有顯著連續(xù)性和持續(xù)性; 可以看作是信息系數(shù), 值越高,說明最近的新聞對價格變化的影響越大,實驗結(jié)果表明,日間隔夜信息對價格的影響作用更大,這是由于新信息在日內(nèi)可以較快的通過交易流被市場吸收,因此呈現(xiàn)出新信息使日間隔波動率增大的結(jié)果。 是滯后方差項的系數(shù),它反應(yīng)了與前一天之前到達(dá)的消息對價格變化的影響,結(jié)果表明,日內(nèi)數(shù)據(jù)中,舊消息對當(dāng)今的價格變化的影響較大,說明信息對日內(nèi)價格波動的沖擊持久性更強(qiáng)。接著,進(jìn)行DCC模型估計,DCC模型估計結(jié)果如表7所示。
從表7估計結(jié)果可以看出,所有系數(shù)在1%水平下顯著不為0,且系數(shù)之和均小于1,模型結(jié)果估計有效,表明不管日間和日內(nèi),股指期貨與現(xiàn)貨兩市場間均存在顯著的動態(tài)相關(guān)性,驗證了上述假說二成立。b值越接近1,動態(tài)相關(guān)性越具有持久性,因此日間期現(xiàn)貨之間的動態(tài)相關(guān)關(guān)系更具有持久性。a值越大,表明近期波動率的沖擊對相關(guān)系數(shù)的影響越大,因此日內(nèi)波動率的沖擊對相關(guān)系數(shù)的影響更明顯。
表6 GRACH模型估計結(jié)果
注括號中為 統(tǒng)計值;***代表估計結(jié)果在1%水平上顯著,**代表估計結(jié)果在5%水平上顯著,*代表估計結(jié)果在10%水平上顯著。
表7 DCC模型估計結(jié)果
注括號中為 統(tǒng)計值;***代表估計結(jié)果在1%水平上顯著,**代表估計結(jié)果在5%水平上顯著,*代表估計結(jié)果在10%水平上顯著。
為了更好揭示期貨與現(xiàn)貨兩市場動態(tài)相關(guān)性的變化,日內(nèi)數(shù)據(jù)的動態(tài)條件相關(guān)系數(shù)分布如圖2所示。 從圖2可以看出,日內(nèi)數(shù)據(jù)下,兩個市場之間呈雙向相關(guān)。日間數(shù)據(jù)的動態(tài)條件相關(guān)系數(shù)分布如圖3所示。從圖3可以看出,日間數(shù)據(jù)的結(jié)果表明主要以期貨市場影響現(xiàn)貨市場為主。期貨與現(xiàn)貨市場的動態(tài)波動性都不是一成不變的,而是隨著不同時間上下浮動,說明期貨與現(xiàn)貨市場動態(tài)相關(guān)性具有時變特征。此外,還發(fā)現(xiàn)在2015年至2016年間,此時段的波動相關(guān)性系數(shù)相對最低,在該時間段中國股市由“瘋?!彪A段大幅度轉(zhuǎn)變成“股災(zāi)”階段,該結(jié)果驗證了此次股災(zāi)的元兇并不是期貨交易。
圖2 日內(nèi)數(shù)據(jù)動態(tài)相關(guān)系數(shù)分布
圖3 日間數(shù)據(jù)動態(tài)相關(guān)系數(shù)分布
對動態(tài)條件相關(guān)系數(shù)進(jìn)行了描述性統(tǒng)計結(jié)果如表8所示。由表8結(jié)果可以看出,日內(nèi)數(shù)據(jù)的動態(tài)條件相關(guān)系數(shù)波動浮動較大,最小值為-0.428 6,最大值為0.953 4。日間數(shù)據(jù)的動態(tài)條件相關(guān)系數(shù)最小值為0.823 0,最大值為0.992 5。進(jìn)一步說明兩市場收益率之間具有明顯的動態(tài)時變特征。
表8 動態(tài)條件相關(guān)系數(shù)的描述性統(tǒng)計結(jié)果
從以上實證結(jié)果總結(jié)得出,滬深300股指期貨與滬深300股指現(xiàn)貨的價格傳導(dǎo)過程,存在一定的超前滯后關(guān)系,其中股指期貨價格為超前項,股指現(xiàn)貨價格為滯后項,期貨價格至少領(lǐng)先現(xiàn)貨價格2分鐘,且存在長期穩(wěn)定的均衡關(guān)系;兩市場的價格波動之間存在顯著動態(tài)相關(guān)性,主要以期貨影響現(xiàn)貨為主,且信息對市場的沖擊在日內(nèi)被價格吸收的更快且沖擊更明顯。此結(jié)果為下文價格預(yù)測的數(shù)據(jù)選取、輸入向量和輸出向量的確定提供了有效支撐,基于上述兩個市場的影響關(guān)系,使用股指期貨與股指現(xiàn)貨的日內(nèi)數(shù)據(jù),即2016年9月到2019年4月5分鐘的收盤價,利用超前項(股指期貨)的相關(guān)向量對滯后項(股指現(xiàn)貨)的價格進(jìn)行預(yù)測。
依據(jù)以上實證結(jié)果,選取滬深300股指期貨與現(xiàn)貨每5分鐘間隔高頻數(shù)據(jù),利用前N天的期貨價格構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)算法對當(dāng)天的現(xiàn)貨價格進(jìn)行預(yù)測,將前90%的數(shù)據(jù)作為訓(xùn)練集,后10%的數(shù)據(jù)作為測試集,對算法的不同參數(shù)進(jìn)行設(shè)定,對比不同參數(shù)下模型的預(yù)測結(jié)果。在實驗過程中設(shè)定序列長度參數(shù)分別為10和30進(jìn)行實驗,分析預(yù)測期間隔為10和30的較近與較遠(yuǎn)的期貨價格對現(xiàn)貨價格預(yù)測精度的影響,為投資者制定投資策略及選擇長線或短線量化選股提供參考。
在固定LSTM層數(shù)和特征向量維度情況下,分析模型序列長度參數(shù)為10時對股價預(yù)測的影響,模型序列長度參數(shù)為10的預(yù)測結(jié)果如圖4所示。
(a) 訓(xùn)練集結(jié)果
(b) 測試集結(jié)果
圖4(a)是序列長度參數(shù)為10的訓(xùn)練集預(yù)測結(jié)果,圖4(b)是序列長度參數(shù)為10的測試集預(yù)測結(jié)果,實線表示真實值,虛線表示預(yù)測值,從訓(xùn)練集與測試集的預(yù)測圖中可以看出,原始價格與預(yù)測價格的誤差較大,模型性能不高。在訓(xùn)練集數(shù)據(jù)量從第10 000到20 000個數(shù)據(jù)之間,價格的響應(yīng)范圍最大,隨著數(shù)據(jù)的增多,模型性能有所提高;在測試集中,隨著數(shù)據(jù)的增多,模型性能呈下降趨勢,預(yù)測誤差明顯增大。
在固定LSTM層數(shù)和固定特征向量維度的情況下,分析當(dāng)模型的序列長度參數(shù)為30時對股價預(yù)測的影響,模型序列長度參數(shù)為30的預(yù)測結(jié)果如圖5所示。
(a) 訓(xùn)練集結(jié)果
(b) 測試集結(jié)果
圖5(a)是序列長度參數(shù)為30的訓(xùn)練集預(yù)測結(jié)果,圖5(b)是序列長度參數(shù)為30的測試集預(yù)測結(jié)果,從結(jié)果可以看出,原始價格與預(yù)測價格走勢趨于一致,誤差小且模型性能高,訓(xùn)練集與測試集的預(yù)測精度均較高。
從以上兩組實驗結(jié)果可以看出,序列長度的增加可以提高算法預(yù)測精度,序列長度較長的模型相比序列長度較短的模型學(xué)習(xí)速率更快,即離預(yù)測期較遠(yuǎn)的數(shù)據(jù)對預(yù)測數(shù)據(jù)的影響比較近的數(shù)據(jù),對預(yù)測數(shù)據(jù)的影響更大。投資者可以通過觀察期貨長期價格區(qū)間波動特征對現(xiàn)貨價格走勢進(jìn)行分析與預(yù)測,并選取合理的投資組合從而降低投資風(fēng)險,提高投資收益。
為了分析滬深300股指期貨價格與滬深300股指現(xiàn)貨價格的傳導(dǎo)關(guān)系與市場波動聯(lián)動性,利用期貨市場的走勢來分析判斷現(xiàn)貨市場的走勢,使用滬深300指數(shù)的期貨與現(xiàn)貨價格從日間隔和5分鐘間隔兩種樣本構(gòu)建VAR模型與DCC-GRACH模型驗證了期貨與現(xiàn)貨市場間存在價格傳導(dǎo)關(guān)系與波動動態(tài)相關(guān)性,使用期貨日內(nèi)價格數(shù)據(jù)構(gòu)建LSTM算法對現(xiàn)貨價格走勢進(jìn)行了預(yù)測。實證結(jié)果表明:(1)滬深300股指期貨價格與滬深300股指現(xiàn)貨的價格傳導(dǎo)過程中存在領(lǐng)先滯后關(guān)系,期貨市場至少領(lǐng)先現(xiàn)貨市場2分鐘,投資者可以通過此領(lǐng)先關(guān)系,密切關(guān)注二者的時變動態(tài),預(yù)測投資組合未來的變化趨勢,把握投資或止損時機(jī),從而增加投資收益或降低投資風(fēng)險。(2)股指期貨與現(xiàn)貨價格波動之間,存在呈連續(xù)性和持續(xù)性的顯著動態(tài)相關(guān)關(guān)系,其中在日內(nèi)價格波動與日間價格波動相比下,日間隔夜信息對價格的影響作用更大,但市場信息對日內(nèi)價格波動的沖擊持久性更強(qiáng)。通過對波動相關(guān)性系數(shù)進(jìn)行描述性分析與繪圖對比后發(fā)現(xiàn),期貨與現(xiàn)貨市場的動態(tài)波動性都不是一成不變的,而是隨著不同時間上下浮動,說明兩市場動態(tài)相關(guān)性具有時變特征,主要以期貨影響現(xiàn)貨市場為主。由于波動性能夠顯著反映市場信息對資產(chǎn)價格的波動影響,研究者們可以利用股指期貨現(xiàn)貨間的波動聯(lián)動性完善和補(bǔ)充資產(chǎn)定價理論。(3)LSTM神經(jīng)網(wǎng)絡(luò)能有效的應(yīng)用于時間序列預(yù)測中,通過設(shè)定不同時間序列長度參數(shù),對比了算法的預(yù)測精度后發(fā)現(xiàn),提高時間序列長度可以增加模型性能從而提高預(yù)測精度,即選擇長期股指價格對現(xiàn)貨價格的預(yù)測效果比選擇短期股指價格的預(yù)測效果更好,說明市場價格的長期觀測比短期觀測更有效。通過對模型精度的不斷優(yōu)化,可以有效刻畫期貨預(yù)測現(xiàn)貨價格的變化趨勢,能為投資者選取合理的投資組合提供建議。