姜麗
摘 要:文章在前期市場狀態(tài)研究的基礎(chǔ)上,重點(diǎn)研究了三類影響市場狀態(tài)的事件,建立了事件模型,并采用改進(jìn)的ID3數(shù)據(jù)挖掘算法,得到了一組市場狀態(tài)在事件刺激下的轉(zhuǎn)化規(guī)則。最后,文章對(duì)得到的規(guī)則進(jìn)行了分析。
關(guān)鍵詞:事件;證券市場;數(shù)據(jù)挖掘;ID3算法
1 概述
證券市場在國家金融體系中占有舉足輕重的地位。對(duì)證券市場的運(yùn)行狀態(tài)的研究,能夠?yàn)槭袌霰O(jiān)管部門進(jìn)行有效的市場監(jiān)管提供依據(jù)。在前期的研究中,我們通過聚類分析的方法,將證券市場劃分成五個(gè)狀態(tài):
低迷態(tài):市場波動(dòng)不大,流動(dòng)性很差,收益率很低。低健康態(tài):市場波動(dòng)不大,流動(dòng)性較差,收益率較低,但是換手率、波動(dòng)率較高,中小盤股交易較為活躍。健康態(tài):市場波動(dòng)平穩(wěn),流動(dòng)性高,收益率較高??簥^態(tài):市場有一定的波動(dòng),流動(dòng)性很高,收益率非常高,大量資金流入市場。災(zāi)難態(tài):表現(xiàn)為市場波動(dòng)非常大,常常伴有千股跌?;蛘咔Ч蓾q停的現(xiàn)象,流動(dòng)性喪失,收益率低,市場極為不穩(wěn)定。
但是證券市場的狀態(tài)顯然是動(dòng)態(tài)演化的,尤其當(dāng)發(fā)生了某種敏感的事件刺激時(shí),市場的狀態(tài)就可能發(fā)生變化,演進(jìn)到下一個(gè)狀態(tài)。文章著眼于影響證券市場的事件,挖掘事件導(dǎo)致的市場狀態(tài)變化的規(guī)則。
2 影響證券市場的事件模型
影響證券市場的因素很多,比如國家的政策調(diào)整,上市公司的季報(bào)、年報(bào),各類交易規(guī)則,散布的各類消息、公告,也包括內(nèi)幕信息等等。把這些影響證券市場狀態(tài)的因素統(tǒng)稱為“事件”。有些事件來源于正常渠道,比如上市公司季報(bào)、年報(bào),按照交易規(guī)則對(duì)上市公司采取的各種措施等。而另外一些事件的來源就不那么明確,比如散布的各種消息,內(nèi)幕信息,甚至某些人為的預(yù)測(cè)、評(píng)價(jià)等。文章的目的在于研究事件對(duì)市場狀態(tài)的影響,因此選取了影響力最大的三類事件:利率變動(dòng),匯率變動(dòng),通貨膨脹率變動(dòng)。
3 證券市場事件影響規(guī)則挖掘
對(duì)事件建立模型后,進(jìn)一步利用數(shù)據(jù)挖掘方法研究事件對(duì)市場狀態(tài)的影響,建立市場狀態(tài)在事件刺激下的轉(zhuǎn)化規(guī)則。
3.1 數(shù)據(jù)準(zhǔn)備
收集歷年來利率、匯率、通貨膨脹率的變化情況,以及事件發(fā)生前后,市場狀態(tài)的差異情況,制成類似表1的形式。其中市場狀態(tài)以月為周期。
3.2 改進(jìn)的ID3規(guī)則挖掘算法
Gain(A)是指由于知道屬性A的值而導(dǎo)致的熵的期望。熵是一個(gè)衡量系統(tǒng)混亂程度的統(tǒng)計(jì)量。熵越大,表示系統(tǒng)越混亂。對(duì)于決策樹而言,最佳的分裂方案是使熵減少量最大的分裂方案。所以,最佳分裂就是使Gain(A)最大的分裂方案。
將ID3算法應(yīng)用于事件影響規(guī)則挖掘的過程中,由于該算法標(biāo)記葉結(jié)點(diǎn)的條件過于嚴(yán)格得到的規(guī)則過于細(xì)化,支持這一規(guī)則的樣本數(shù)目很少。這樣的規(guī)則沒有實(shí)用價(jià)值。
文章對(duì)ID3算法進(jìn)行了改進(jìn),使其能夠適用于事件影響規(guī)則的挖掘。改進(jìn)主要體現(xiàn)在兩點(diǎn):(1)柔性的葉結(jié)點(diǎn)標(biāo)記規(guī)則。當(dāng)子集中樣本數(shù)過少時(shí),合并相鄰子集,生成唯一的葉節(jié)點(diǎn),以優(yōu)勢(shì)屬性值來標(biāo)記該葉節(jié)點(diǎn)。(2)增加剪枝規(guī)則。當(dāng)葉節(jié)點(diǎn)中的樣本數(shù)過少,或者葉節(jié)點(diǎn)中的樣本的決策屬性發(fā)生矛盾時(shí),刪除該葉節(jié)點(diǎn)。
3.3 規(guī)則挖掘結(jié)果及分析
文章采用改進(jìn)的ID3挖掘算法對(duì)采集到的數(shù)據(jù)樣本進(jìn)行規(guī)則挖掘,得到一組規(guī)則,選摘如下:(1)市場處于低迷狀態(tài)時(shí),若發(fā)生利率變動(dòng)事件(利率下降),市場仍然處于低迷狀態(tài)。(2)市場處于低健康狀態(tài)時(shí),若發(fā)生利率變動(dòng)事件(利率下降),市場進(jìn)入健康狀態(tài)。(3)市場處于亢奮狀態(tài)時(shí),若發(fā)生利率變動(dòng)事件(利率上升),市場進(jìn)入健康狀態(tài)。(4)市場處于健康狀態(tài)時(shí),若發(fā)生匯率變動(dòng)事件(匯率下調(diào)),市場進(jìn)入低健康狀態(tài)。(5)市場處于亢奮狀態(tài)時(shí),若發(fā)生通貨膨脹變動(dòng)事件(通貨膨脹率上升),市場進(jìn)入健康狀態(tài)。
……
對(duì)規(guī)則進(jìn)行分析后,發(fā)現(xiàn)這些規(guī)則在一定程度上與現(xiàn)有的認(rèn)知相吻合。比如一般利率下降時(shí),股市上漲;利率上升時(shí),股市下降。再比如國家的貨幣是實(shí)行升值的基本方針,股價(jià)就會(huì)上漲,一旦貨幣貶值,股價(jià)隨之下跌。
但是,規(guī)則中也存在一些與現(xiàn)有的認(rèn)知或者預(yù)期不吻合的情況。比如:市場處于低迷狀態(tài)時(shí),若發(fā)生利率變動(dòng)事件(利率下降),預(yù)期市場應(yīng)該好轉(zhuǎn),但規(guī)則顯示市場大概率仍然處于低迷狀態(tài)??赡苡邢旅鎺追N原因?qū)е铝诉@種情況:(1)影響市場的因素太多,其他為研究的因素干擾了事件規(guī)則的挖掘。(2)事件的影響要在一段時(shí)間后才顯現(xiàn)出來,規(guī)則挖掘中狀態(tài)周期應(yīng)該針對(duì)不同的事件進(jìn)行不同的調(diào)整。(3)周期事件的疊加影響要大于單一事件影響,而現(xiàn)有的規(guī)則挖掘算法中沒有討論事件疊加的情況。(4)市場狀態(tài)的劃分粒度不夠細(xì),導(dǎo)致規(guī)則的結(jié)果單一,缺乏多樣性。
4 結(jié)束語
文章在前期市場狀態(tài)研究的基礎(chǔ)上,重點(diǎn)研究了三類事件模型,以及它們對(duì)市場狀態(tài)的影響。文章為利率變動(dòng)、匯率變動(dòng)和通貨膨脹率變動(dòng)建立了事件模型,據(jù)此對(duì)采集到的數(shù)據(jù)進(jìn)行了規(guī)則挖掘,得到了一組事件影響市場狀態(tài)的規(guī)則。
文章最后對(duì)規(guī)則進(jìn)行了分析,認(rèn)為規(guī)則在一定程度上能夠反映市場的狀態(tài)變化,也對(duì)其中的誤差進(jìn)行了分析。今后,針對(duì)導(dǎo)致規(guī)則誤差的原因,應(yīng)該在調(diào)整市場狀態(tài)周期的長短、細(xì)化市場狀態(tài)的類別,考慮事件的疊加效應(yīng)等方面深入研究。
參考文獻(xiàn)
[1]胡美春,田大鋼.基于修正參數(shù)簡化標(biāo)準(zhǔn)的ID3改進(jìn)算法[J].計(jì)算機(jī)與數(shù)字工程,2015(7):1182-1186.
[2]喻金平,黃細(xì)妹,李康順.基于一種新的屬性選擇標(biāo)準(zhǔn)的ID3改進(jìn)算法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2895-2898.
[3]黎子良,邢海鵬.金融市場中的統(tǒng)計(jì)模型和方法[M].北京:高等教育出版社,2009.