王咪咪,丁 輝
(滁州學(xué)院 數(shù)學(xué)與金融學(xué)院,安徽 滁州 239000)
在金融交易市場(chǎng)中,常常會(huì)有在一個(gè)時(shí)間段內(nèi)連續(xù)被記錄的數(shù)據(jù)。譬如,在股指期貨交易市場(chǎng)上,任意小的交易時(shí)間區(qū)間內(nèi)都會(huì)產(chǎn)生交易,衍生出很多高頻數(shù)據(jù)。高頻數(shù)據(jù)可以看成一個(gè)時(shí)間區(qū)間內(nèi)連續(xù)被記錄的數(shù)據(jù)。因此,可視為函數(shù)型數(shù)據(jù),函數(shù)型數(shù)據(jù)分析是分析和處理高頻數(shù)據(jù)的必備利器。國(guó)內(nèi)外已有一些學(xué)者在函數(shù)型數(shù)據(jù)視角下研究金融經(jīng)濟(jì)市場(chǎng)中的內(nèi)在規(guī)律,也得到了一些寶貴研究成果。郭均鵬通過(guò)函數(shù)型主成分分析方法研究了Shibo市場(chǎng)中的各期限利率的波動(dòng)問(wèn)題[4];劉春義等通過(guò)使用函數(shù)型聚類分析方法研究了我國(guó)經(jīng)濟(jì)發(fā)展的周期問(wèn)題[7];龍文等借助于函數(shù)型主成分分析探討了不同國(guó)家之間的金融危機(jī)時(shí)期經(jīng)濟(jì)發(fā)展的差異性[8];趙煜[10]在函數(shù)型數(shù)據(jù)分析視角下對(duì)生態(tài)經(jīng)濟(jì)系統(tǒng)的分析前景進(jìn)行展望。然而,上述所有研究均無(wú)法刻畫(huà)因變量的過(guò)去對(duì)其產(chǎn)生的影響。實(shí)際上,因變量的過(guò)去時(shí)刻常常會(huì)對(duì)其產(chǎn)生影響。因此,通過(guò)自回歸的介入,在函數(shù)型線性的模型上加入自回歸部分來(lái)刻畫(huà)因變量的過(guò)去時(shí)刻的影響,即函數(shù)型部分線性自回歸模型。該模型既能刻畫(huà)函數(shù)型協(xié)變量與因變量之間的關(guān)系,又能表現(xiàn)因變量的過(guò)去時(shí)刻對(duì)當(dāng)前時(shí)刻的影響。
給出函數(shù)型部分線性自回歸模型:
(1)
其中,X(t)是區(qū)間I上平方可積的函數(shù)型變量,Y是因變量,p是滯后階數(shù),誤差項(xiàng)ε滿足Eε=0,Varε=σ2。自回歸模型為此模型的一個(gè)特例(β(t)≡0 ),函數(shù)型線性模型同樣也為此模型的一個(gè)特例(φ1=…=φp=0)。
關(guān)于該模型的估計(jì),我們采用剖面最小二乘估計(jì)[1]:
(2)
(3)
(4)
(5)
可以求出模型的參數(shù)φ1,…,φp和非參數(shù)函數(shù)g(·)的估計(jì)。
令Y=(Yp+1,…,Yn)T,Φ=(1,φ1,…,φp)T,W=ζ(ζTζ)-1ζT,Z0=(1,…,1)T(n-p)×1,Z1=(Yp,…,Yn-1)T,Z2=(Yp-1,…,Yn-2)T,…,Zp=(Y1,…,Yn-p)T,Z=(Z0,Z1,…,Zp)T,Y*=(I-W)Y,Z*=Z(I-W) ,I為n-p階單位陣。于是(2.5)可化為(Y*-Z*TΦ)T(Y*-Z*TΦ),則:
(6)
把(6)帶回(4)得:
(7)
到目前為止,已經(jīng)求得了模型參數(shù)的估計(jì)。然而,在求解模型的參數(shù)估計(jì)過(guò)程中必然會(huì)涉及到滯后階數(shù)p的選取,統(tǒng)計(jì)模擬時(shí)采取交叉驗(yàn)證準(zhǔn)則來(lái)選擇p。
按照下面的模型來(lái)生成數(shù)據(jù):
表1 估計(jì)均值和標(biāo)準(zhǔn)差(括號(hào))或RASEs和標(biāo)準(zhǔn)差(括號(hào))結(jié)果表
從表1可見(jiàn),α,φ1,…,φ3估計(jì)偏差與估計(jì)標(biāo)準(zhǔn)差β(t)估計(jì)均方誤RASE均隨著樣本量的增加而減少,因此,可以看出估計(jì)方法的優(yōu)良性。
選擇2015年6月1日至2016年3月1日總共183個(gè)股市交易日的上證指數(shù)數(shù)據(jù)。模型的因變量為開(kāi)盤(pán)價(jià)Y,函數(shù)型協(xié)變量為每個(gè)交易日每5分鐘的上證指數(shù)X(t),每個(gè)交易日每5分鐘的數(shù)據(jù)共48個(gè)。首先進(jìn)行預(yù)處理,對(duì)開(kāi)盤(pán)價(jià)Y和每5分鐘的上證指數(shù)X(t) 取對(duì)數(shù),目標(biāo)為尋找合適的模型對(duì)開(kāi)盤(pán)價(jià)進(jìn)行預(yù)測(cè)。顯然,開(kāi)盤(pán)價(jià)既受過(guò)去時(shí)期開(kāi)盤(pán)價(jià)的影響,又與Xi(t)有關(guān),考慮函數(shù)型部分線性自回歸模型:
(8)
表2 不同模型及其相對(duì)應(yīng)的平均預(yù)測(cè)誤差(單位×10-5)
從表2可知,函數(shù)型部分線性自回歸模型平均預(yù)測(cè)誤差最小,比線性模型的預(yù)測(cè)效果提升了65.8%,比自回歸模型的預(yù)測(cè)效果提升了97.6%。可見(jiàn),函數(shù)型部分線性自回歸模型擬合效果最好。
函數(shù)型部分線性自回歸模型既刻畫(huà)了函數(shù)型協(xié)變量與因變量之間的關(guān)系,又考慮了自回歸效應(yīng),體現(xiàn)了因變量過(guò)去時(shí)刻的影響,因而具有廣泛的適用性,可為今后研究函數(shù)型數(shù)據(jù)提供一種新的工具。
參考文獻(xiàn):
[1] H?rdle W,Liang H,Gao J. Partially linear models[M].New York: Springer,2000.
[2] Ramsay J O, Silverman B W.Functional Data Analysis[M].New York: Springer,1997.
[3] Ramsay J O,Hooker G,Graves S.Functional Data Analysis with R and MATLAB[M].New York: Springer,2009.
[4] 郭均鵬,孫欽堂,李汶華.Shibor市場(chǎng)中各期限利率波動(dòng)模式分析:基于FPCA方法[J].系統(tǒng)工程,2012(12):88-92.
[5] 姜高霞,王文劍.經(jīng)濟(jì)周期波動(dòng)的函數(shù)型時(shí)序分解方法:基于CPI的實(shí)證分析[J].統(tǒng)計(jì)與信息論壇,2014,29(3):22-28.
[6] 李敏.基于函數(shù)型主成分分析方法的用水量數(shù)據(jù)分析[J].合肥學(xué)院學(xué)報(bào),2014,24(4):21-25.
[7] 劉春義,劉黎明,王少國(guó).經(jīng)濟(jì)周期測(cè)算的新視角:基于函數(shù)型數(shù)據(jù)分析方法[J].調(diào)研世界,2015(6):42-46.
[8] 龍文,李楠,王惠文,等.金融危機(jī)過(guò)程中不同類型國(guó)家經(jīng)濟(jì)發(fā)展的差異性比較:基于函數(shù)數(shù)據(jù)分析方法[J].管理評(píng)論,2014,26(3):3-10.
[9] 米子川,趙麗琴.函數(shù)型數(shù)據(jù)分析的研究進(jìn)展和技術(shù)框架[J].統(tǒng)計(jì)與信息論壇,2012,27(6):13-20.
[10] 趙煜,秦增舉.函數(shù)型數(shù)據(jù)分析及其在生態(tài)經(jīng)濟(jì)系統(tǒng)中的應(yīng)用展望[J].甘肅科技,2015,31(16):66-68.