周若其,李俊林,董安強(qiáng)
(太原科技大學(xué) 應(yīng)用科技學(xué)院,太原030024)
1965年美國(guó)芝加哥大學(xué)著名教授尤金·法瑪(Eugene Fama)在《商業(yè)學(xué)刊》發(fā)表論文《股票市場(chǎng)價(jià)格行為》,1970年對(duì)該理論進(jìn)行深化并提出有效市場(chǎng)假說(shuō)(efficient markets hypothesis),并因此獲得2013年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
有效市場(chǎng)假說(shuō)理論認(rèn)為,在一個(gè)充滿信息交流和信息競(jìng)爭(zhēng)的社會(huì)里,一個(gè)特定的信息能夠在股票市場(chǎng)上迅即被投資者知曉。資產(chǎn)價(jià)格反映了一種資產(chǎn)價(jià)值的所有公開(kāi)的、可獲得的信息。根據(jù)這一理論,股票市場(chǎng)表現(xiàn)出信息有效,即以理性方式反映所有可獲得的信息的有關(guān)資產(chǎn)價(jià)格的描述。當(dāng)信息改變時(shí),股票價(jià)格就會(huì)變動(dòng)。但是,在任何一個(gè)時(shí)點(diǎn)上,市場(chǎng)價(jià)格是以可獲得信息為依據(jù)的公司價(jià)值的最好估算[1]。
對(duì)于有效市場(chǎng)假說(shuō)理論,美國(guó)賓夕法尼亞大學(xué)沃頓商學(xué)院金融學(xué)教授、經(jīng)濟(jì)學(xué)家Jeremy Siegel認(rèn)為,這個(gè)假說(shuō)并不認(rèn)為市場(chǎng)價(jià)格總是正確的。相反,它意味著市場(chǎng)上的價(jià)格經(jīng)常是錯(cuò)誤的,但在某一既定時(shí)點(diǎn)上,根本不能輕易地判斷這些價(jià)格是太高還是太低[1]。
這表明有效市場(chǎng)假說(shuō)的缺陷。國(guó)內(nèi)學(xué)者[2]認(rèn)為,除了地震、戰(zhàn)爭(zhēng)等突發(fā)事件外,絕大多數(shù)新的信息形成都需要一段時(shí)間,新的信息整合到股價(jià)中需要一個(gè)過(guò)程。資金是證券市場(chǎng)的唯一驅(qū)動(dòng)力,新的股價(jià)不是一蹴而就的,它是由連續(xù)不斷的資金買(mǎi)入推高或資金賣(mài)出壓低。新的信息被整合到股價(jià)中的過(guò)程就是資金的流動(dòng)過(guò)程。目前反映國(guó)內(nèi)外股票市場(chǎng)波動(dòng)的指數(shù)全部都是“價(jià)格”類(lèi)的,稱(chēng)為股票價(jià)格指數(shù),簡(jiǎn)稱(chēng)股價(jià)指數(shù)。它們是以個(gè)股的股價(jià)為變量,應(yīng)用綜合指數(shù)計(jì)算公式而計(jì)算得出一個(gè)數(shù)字。然而,由于證券市場(chǎng)的驅(qū)動(dòng)力是資金,反映股票市場(chǎng)波動(dòng)和趨勢(shì)的應(yīng)該是以資金為變量的“資金”類(lèi)指數(shù)。李俊林提出的股票資金流強(qiáng)度(strength of stock fund flows)指數(shù)就是一種“資金”類(lèi)指數(shù)。它是為了能夠更全面地洞察股票市場(chǎng)的運(yùn)行特征和市場(chǎng)信息而提出的一種同時(shí)考慮股票價(jià)格與成交量的綜合性指標(biāo)[2-3]。
文獻(xiàn)[3]中的股票資金流強(qiáng)度的模型為:
股票資金流強(qiáng)度=
其數(shù)學(xué)表達(dá)式為:
(1)
其中:Sj為第j天股票資金流強(qiáng)度;Pj(i)為第j天的第i次成交價(jià);Qj(i)為第j天的第i次成交量;L為流通量,指股票的流通總股,是確定的常數(shù);φ為參考價(jià),是人為選擇的常數(shù),一經(jīng)確定便固定不變;n為時(shí)間T內(nèi)成交總次數(shù)。
文獻(xiàn)[3]中有詳細(xì)的介紹與說(shuō)明。文獻(xiàn)[4]-[7]在基于上述模型得到的股票資金流強(qiáng)度基礎(chǔ)上對(duì)其進(jìn)行一系列的統(tǒng)計(jì)分析,包括驗(yàn)證其有效性,研究與股票收益率等常用指標(biāo)的相關(guān)性,及其自身的波動(dòng)性等等。
但是該模型亦有自身缺陷。首先,計(jì)算結(jié)果的精度不夠,導(dǎo)致計(jì)算結(jié)果大量為0;其次,無(wú)法處理高頻數(shù)據(jù)。盡管文獻(xiàn)[8]對(duì)模型進(jìn)行一定的優(yōu)化,但依然無(wú)法克服這些問(wèn)題。
本文致力于解決這些問(wèn)題。
針對(duì)上述所提的問(wèn)題,對(duì)模型進(jìn)行如下優(yōu)化。
式(1)中Pj(i),Qj(i)是離散函數(shù),連續(xù)化后記為Pj(t),Qj(t)。Pj(t)和Qj(t)分別為連續(xù)的價(jià)格函數(shù)與成交量函數(shù)。
記:
將式(1)積分化,即為:
(2)
計(jì)算式(2)得:
(3)
只需計(jì)算積分:
(4)
(5)
即可。
同時(shí)需要指出式(3)是協(xié)變量為函數(shù),響應(yīng)變量為標(biāo)量的函數(shù)型線性回歸模型。
函數(shù)型數(shù)據(jù)分析的首要工作是將得到的離散數(shù)據(jù)轉(zhuǎn)化為函數(shù)[9]?;窘鉀Q方法是基函數(shù)擬合。
基函數(shù)擬合是將采樣得到的有限多個(gè)離散的數(shù)據(jù)值轉(zhuǎn)化成函數(shù)。對(duì)比于傳統(tǒng)的擬合方法,基函數(shù)擬合往往可以更好地?cái)M合數(shù)據(jù)分布復(fù)雜的曲線圖形。
函數(shù)型數(shù)據(jù)分析的數(shù)學(xué)前提是無(wú)窮維函數(shù)空間,且是Hilbert空間。它將離散的數(shù)據(jù)轉(zhuǎn)化為函數(shù),該函數(shù)是函數(shù)空間中的一個(gè)元素,可以用空間的基進(jìn)行線性表示。
設(shè)無(wú)窮維函數(shù)空間的基為:{φk(t),k=1,2,…},則對(duì)于任意屬于該空間的函數(shù)可表示為:
f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)+…
注意到無(wú)窮維函數(shù)空間是Hilbert空間,即完備的內(nèi)積空間,故有[10]:
?k∈N+, s.t.
f(t)=c1φ1(t)+c2φ2(t)+…+ckφk(t)
基函數(shù)擬合是通過(guò)求解系數(shù){ck(t),k=1,2,…},進(jìn)而得到f(t)的表達(dá)式。
常用系數(shù)計(jì)算方法是最小二乘法。
其中{ck,k=1,2,…,K,K∈N+}為基所對(duì)應(yīng)的系數(shù)。
最小二乘法計(jì)算ck:
即:
解得:
Cp=(Φ′Φ)-1ΦP
同理:
Cq=(Φ′Φ)-1ΦQ
進(jìn)而式(4),式(5)為:
其次,需要考慮所選的基函數(shù),即上述中的φk(t).常用的基函數(shù)系統(tǒng)有:多項(xiàng)式基函數(shù)(Polynomial basis function),傅里葉基函數(shù)(Fourier basis function)和B-樣條基函數(shù)(B-Spline basis function).
最后,需要考慮選取的基函數(shù)個(gè)數(shù),即上述中的K。一般選取的原則有模型選擇(model selection)和交叉驗(yàn)證(Cross-Validation).
本文有不同的觀點(diǎn)。本文選取基函數(shù)個(gè)數(shù)的原則:?jiǎn)蝹€(gè)函數(shù)的數(shù)據(jù)個(gè)數(shù)等于基函數(shù)個(gè)數(shù)。
例如,五分鐘均衡價(jià)格數(shù)據(jù),一天有48個(gè)數(shù)據(jù),則選取48個(gè)基函數(shù)。
對(duì)比來(lái)看:
設(shè)有限維歐氏空間F和無(wú)窮維Hilbert空間E.且有x∈F,f(t)∈E.
F的基為:{ek,k=1,2,…,n}
E的基為:{φk(t),k=1,2,…,n,…}
對(duì)于F而言:
dim(F)=1時(shí):
x=(x1)=〈x·e1〉·e1.
dim(F)=2時(shí):
x=(x1,x2)=〈x·e1〉·e1+〈x·e2〉·e2.
dim(F)=n時(shí):
x=(x1,x2,…,xn)=〈x·e1〉·e1+〈x·e2〉·e2+…+〈x·en〉·en.
對(duì)于E而言:
f(t)=〈f(t)·φ1(t)〉·φ1(t)+〈f(t)·
φ2(t)〉φ2(t)+…+〈f(t)·φk(t)〉φk(t)+…
〈·〉是內(nèi)積運(yùn)算,指元素在基上的投影。
當(dāng)dim(F)每多一個(gè)數(shù)據(jù)時(shí),便多一個(gè)基。對(duì)于無(wú)窮維函數(shù)空間E而言,函數(shù)的數(shù)據(jù)意味著函數(shù)在基上的投影。最小二乘法逼近問(wèn)題本質(zhì)上是用空間E中一個(gè)有限維子空間逼近空間E中無(wú)窮維的函數(shù),理論上,子空間維數(shù)越高越接近原函數(shù)。如果采集到的單個(gè)函數(shù)數(shù)據(jù)個(gè)數(shù)為n,則意味著函數(shù)在空間E中的n個(gè)基上有投影,進(jìn)而可以用這n個(gè)基構(gòu)成的子空間逼近空間E中無(wú)窮維的函數(shù)。
另一方面,以此為準(zhǔn)的擬合結(jié)果顯示,數(shù)據(jù)會(huì)全部落到函數(shù)中。本文并不認(rèn)為這是包含干擾信息或者是過(guò)擬合現(xiàn)象,而這恰恰是和有效市場(chǎng)假說(shuō)形成相互印證,即資產(chǎn)的價(jià)格(成交量)表達(dá)了市場(chǎng)的全部信息。
介紹兩種計(jì)算方法。
直接計(jì)算:
得到價(jià)格函數(shù)和成交量函數(shù)的估計(jì)表達(dá)式后直接利用式(3)計(jì)算。
基函數(shù)展開(kāi):
則式(3)為:
(6)
(7)
首先闡明一個(gè)觀點(diǎn)。函數(shù)型線性回歸模型最為直接的應(yīng)用是預(yù)測(cè)。在回歸中的問(wèn)題是系數(shù)函數(shù)的估計(jì)。利用部分?jǐn)?shù)據(jù)估計(jì)出系數(shù)函數(shù),即可得到回歸模型。預(yù)測(cè)是指在得到回歸模型中,將剩余數(shù)據(jù)作為協(xié)變量帶入回歸模型中得出響應(yīng)變量[12]。按照此過(guò)程,本文的估計(jì)可以理解為預(yù)測(cè)。不同的是,式(3)所代表的函數(shù)型線性回歸模型中的系數(shù)函數(shù)是有具體現(xiàn)實(shí)意義的,是人為規(guī)定的。
對(duì)于基函數(shù)展開(kāi)法的計(jì)算,若為非正交基,則用式(6)計(jì)算;若為正交基,則用式(7)計(jì)算。實(shí)際上,正交基的運(yùn)算效率要高于非正交基的運(yùn)算效率,為此可通過(guò)Karhunen-Loève展開(kāi)即主成分分析得到新的正交基,即主成分基。
Karhunen-Loève展開(kāi):
以Pj(t)為例。
即有:
Pj(t)=μp(t)+
令Xj(t)=Pj(t)-μp(t),則有:
故有Pj(t)和Qj(t):
(3)式變?yōu)椋?/p>
(8)
取前K個(gè)主成分時(shí):
(9)
關(guān)于K的選擇采取累計(jì)貢獻(xiàn)率的方法.
易知,通過(guò)函數(shù)型主成分分析,得到的主成分基{fi(t),i=1,2,…,K,K∈N+}是正交基。進(jìn)而股票資金流強(qiáng)度可以利用式(9)估計(jì)。
股票名稱(chēng):貴州茅臺(tái)。
股票代碼:600519.
時(shí)間范圍:2018年7月2日至2018年9月28日,共64天。
數(shù)據(jù)結(jié)構(gòu):五分鐘均衡數(shù)據(jù),包括股價(jià)數(shù)據(jù)和成交量數(shù)據(jù)。
基函數(shù)選擇:傅里葉基函數(shù)。
累計(jì)貢獻(xiàn)率:95%
數(shù)學(xué)軟件:MATLAB.
由于數(shù)據(jù)雜多,僅展示9月份的計(jì)算結(jié)果,如表1所示。
表1 600519股票資金流強(qiáng)度(9月)
兩種計(jì)算方法耗時(shí)如表2所示:
表2 兩種方法耗時(shí)
采用滾動(dòng)估計(jì)的方法。
先對(duì)前60天的價(jià)格函數(shù)和成交量函數(shù)做函數(shù)型主成分分析,得到主成分函數(shù);然后計(jì)算第61天的價(jià)格函數(shù)和成交量函數(shù)的主成分得分,最后利用式(9)估計(jì)第61天的股票資金流強(qiáng)度。
以此類(lèi)推,估計(jì)后四天的股票資金流強(qiáng)度。結(jié)果如表3所示:
表3 估計(jì)結(jié)果
相對(duì)于文獻(xiàn)[3]的計(jì)算結(jié)果,優(yōu)化后的模型提高了股票資金流的計(jì)算精度,同時(shí)解決無(wú)法處理高頻數(shù)據(jù)的困境。另外相比文獻(xiàn)[4],利用函數(shù)型主成分分析估計(jì)股票資金流強(qiáng)度的結(jié)果更為準(zhǔn)確。
函數(shù)型數(shù)據(jù)分析是近些年蓬勃發(fā)展的新型非參數(shù)統(tǒng)計(jì)方法,相比于傳統(tǒng)的統(tǒng)計(jì)方法有著得天獨(dú)厚的優(yōu)勢(shì)。本文首次將函數(shù)型數(shù)據(jù)分析的方法應(yīng)用于股票資金流強(qiáng)度的研究。將求和模型優(yōu)化為積分模型,優(yōu)化后的模型是協(xié)變量為函數(shù),響應(yīng)變量為標(biāo)量的函數(shù)型線性回歸模型。實(shí)證結(jié)果表明,優(yōu)化后的模型可以提高股票資金流的計(jì)算精度,克服無(wú)法處理高頻數(shù)據(jù)的問(wèn)題,同時(shí)在估計(jì)方面也更為精確。此外,對(duì)于基函數(shù)個(gè)數(shù)的選擇上,筆者也有著不同的看法。對(duì)于函數(shù)型數(shù)據(jù)分析的最小二乘問(wèn)題,就是在無(wú)窮維空間中找一個(gè)有限維子空間來(lái)逼近無(wú)窮維空間的元素?;瘮?shù)的個(gè)數(shù)其實(shí)就是有限維子空間的維度。通過(guò)與有限維空間的對(duì)比,筆者認(rèn)為采集的數(shù)據(jù)實(shí)際上是函數(shù)在無(wú)窮維空間基上的投影,那么有多少個(gè)數(shù)據(jù)即意味著在多少個(gè)基上有投影,所以選取基函數(shù)的原則是數(shù)據(jù)個(gè)數(shù)。