余任+車文剛+周志元+權(quán)鵬宇
引言
時間序列是按照時間順序排列的一組數(shù)據(jù),它反映了某一事物或現(xiàn)象的狀態(tài)隨時間變化的規(guī)律,其廣泛存在于生物、醫(yī)學(xué)、工程和經(jīng)濟等各個領(lǐng)域。股票時間序列是一種與數(shù)據(jù)點有關(guān)的序列,其中包括股票的價格(開盤價、收盤價、最高價、最低價)以及成交量等信息。眾所周知,在股票時間序列序列中包含了大量的數(shù)據(jù)信息以及股價的走勢規(guī)律,怎樣在時間序列中挖掘出有用的信息引起了國內(nèi)外專家學(xué)者的廣泛關(guān)注。
早在上世紀八十年代,異常數(shù)據(jù)的檢測在統(tǒng)計學(xué)中得到了廣泛的研究,并取得了顯著成果,在此背景下,研究者將其應(yīng)用到股票時間序列中。在對時間序列進行分析時,往往會發(fā)現(xiàn)一些偏離常規(guī)的數(shù)值或者片段,一般將其稱之為奇異點或者異常點,這些非常規(guī)的數(shù)值或片段,通常蘊含著更為重要的價值和信息,因此,奇異點的檢測成為股票時間序列研究中的重要組成部分。在時間序列的異常點檢測中,常用的方法有基于排列熵、距離、d-近鄰聚類以及密度等方法,在之前,我們也提出了一些方法來確定奇異點,文獻中提出了一種基于小波變換的時間序列奇異點檢測方法,文獻中利用局部異常因子來檢測時間序列奇異點。在實際的股票市場中,投資者一般是通過蠟燭圖對股票的趨勢進行分析的,它的一個優(yōu)勢在于能夠在形式多樣的證券市場上顯示出巨大的威力,在2003年,引入了時間序列模體概念,異常檢測吸引了研究人員和金融市場越來越多的關(guān)注。所以,如果能夠檢測到那些具有奇異形態(tài)的蠟燭圖片段,則在一定程度上能夠預(yù)測股票價格的當(dāng)前趨勢。
在股票交易中,成交量可以說是股價的動量,是股票時間序列分析中不可或缺的一部分,具有重要的輔助性參考價值?!摆厔荨痹谝欢ǔ潭壬洗砹恕皟r”,趨勢的向上顯示著價格的不斷攀升,價量配合也是技術(shù)分析里常用詞。成交量形態(tài)的改變將是趨勢反轉(zhuǎn)的前兆。
本文定義了躍空形態(tài)的奇異圖案片段以及對該形態(tài)的檢測方法,結(jié)合該形態(tài)下股票的連續(xù)成交量,將對股票價格的趨勢的分析變得更加準確和更具實用性。
1相關(guān)定義
在股票市場中,通過對反映市場狀況的基本數(shù)據(jù)(開盤價、收盤價、最高價、最低價、成交量等)進行分析,判斷整個股市或個別股價未來的變化趨勢,以探討股市里投資行為的可能軌跡,就叫做技術(shù)分析。技術(shù)分析里面最重要的就是圖形分析,它通過繪制股市基本數(shù)據(jù)的某種演化圖,能夠直觀的反映出股市的變化趨勢,日本的蠟燭圖分析是其中最有效的方法之一。為了研究股票時間序列,在某個時間段的交易中,人們總是能發(fā)現(xiàn)一些非同尋常的形態(tài),我們將它定義為奇異形態(tài)。
定義1:股票時間序列:給定股票時間序集合x通過x(ti,of,ci,hi,li)來表示與股票時間序列有關(guān)的價格,其中Oi,Ci,hi,li分別被用來表示在ti交易日與股票時間序列有關(guān)的開盤價,收盤價,最高價以及最低價。
定義2:在股票時間序列集合x(ti,oi,ci,hi,li)中,當(dāng)0f>cf并且oi-1>ci-1時,如果在[ti-1,ti]區(qū)間內(nèi)滿足oi>hi-1,則時間序列x在[ti-1,ti]區(qū)間內(nèi)為向上躍空形態(tài);如果lt>hi-1則時間序列x在[ti-1,靠1區(qū)間內(nèi)為絕對向上躍空形態(tài)。當(dāng)ot 定義3:給定股票時間序集合x,通過x來表示與股票時間序列有關(guān)的成交量,其中vi表示在交易日ti的成交量。 2躍空形態(tài)的算法與檢測 股票市場的數(shù)據(jù)是海量的,如何在其中挖掘出有意義的數(shù)據(jù)是研究者需要考慮的問題,本文提出了一種算法結(jié)合編程軟件能夠有效的檢測到具有躍空形態(tài)的片段,通過定義2可得如下方法。 算法1:向上躍空形態(tài)片段檢測算法 選取某一個交易日得到的股票時間序列x(ti,Oi,ci,hi,ti),把第i天的開盤價與第i-1天最高價hi-1進行比較,如果ot>hu-1則找到向上躍空片段。 算法2:絕對向上躍空形態(tài)片段檢測算法 選取某一個交易日得到的股票時間序列把第i天的最低ti與第i-1天最高價ht-1進行比較,如果ti>hu-1則檢測到絕對向上躍空片段。 算法3:向下躍空形態(tài)片段檢測算法 選取某一個交易日得到的股票時間序列把第i天的開盤價Df與第i.1天最低價h-1進行比較,如果ot 算法4:絕對向下躍空形態(tài)片段檢測算法 選取某一個交易日得到的股票時間序列把第i天的最高價hu與第i-1天最低價lt-1進行比較,如果hu 成交量是反應(yīng)股票趨勢的一個重要因素,在本文所提出的算法檢測出躍空形態(tài)的前提下,為了更好的判斷成交量是否增加或者減少,我們設(shè)定如下公式作為判斷成交量趨勢變化的依據(jù),其表達形式為: 其中w表示第ti天的成交量;如果0 以深證股票為例,我們隨機選取了幾只股票,通過對股票歷史數(shù)據(jù)的處理,結(jié)合Matlab及仿真軟件,利用上述算法,找到了相應(yīng)的躍空形態(tài)的片段,如圖1,圖2所示。 3實證分析 本文選取上證A股50支股票在2014年1月至2015年12月連續(xù)兩年的數(shù)據(jù)作為實驗數(shù)據(jù),檢測得到了1152個躍空形態(tài)片段,其中向上躍空形態(tài)603個,向下躍空形態(tài)549個。以每個季度為時間段對其進行分類,總共分為8個時間段,其數(shù)據(jù)表如表1所示。 由數(shù)據(jù)表分析可知:在2014年4月到9月之間,躍空出現(xiàn)的頻率相對較少,且向上和向下躍空次數(shù)相差不大,股價處于一個平穩(wěn)的時期;在2014年和2015年的10月到12月期間,向上躍空次數(shù)明多于向下躍空次數(shù),股價呈現(xiàn)出上揚的趨勢。 為了進一步證實該方法的有效性,本實驗提取并了躍空形態(tài)片段下所對應(yīng)的成交量,由公式(1)的計算結(jié)果表明:向上躍空形態(tài)所對應(yīng)的成交量中,成交量上升的次數(shù)遠大于下降的次數(shù);而在向下躍空形態(tài)所對應(yīng)的成交量中,成交量上升的次數(shù)則相對較少。數(shù)據(jù)統(tǒng)計表如表2,表3,表4所示(其中表2和表3分別為向上躍空形態(tài)和向下躍空形態(tài)每個季度成交量的變化趨勢,表4為成交量總體趨勢的比率)。 通過對表4數(shù)據(jù)進行分析可得:在向上躍空形態(tài)中,成交量上升比率達到了86.9%,其中近30%比前一日的成交量高出一倍以上;在向下躍空形態(tài)中,成交量減少的比率為59.6%,且發(fā)生顯著變化的僅為5.6%。股票價格變動有一種“勢頭”,股價一旦沿著一定方向移動時,股價運動的這種勢頭往往就沿著同一方向繼續(xù)運動。當(dāng)躍空形態(tài)出現(xiàn)后,股票的價格趨勢一般會朝著該方向延續(xù),成交量保持在一定的水平之上。所以,在某種程度上,成交量隨著股票價格的波動而變化,而成交量的變化,也影響著股價的走勢。 4結(jié)論 本文提出了一種檢測股票市場奇異形態(tài)片段的方法,通過對上證A股歷史數(shù)據(jù)的檢測和分析,結(jié)果表明,該方法對當(dāng)前股票價格的運動趨勢的分析能夠取得較好的效果。最后對奇異形態(tài)片段所對應(yīng)的成交量的分析,進一步證實了本文所提出方法的有效性。當(dāng)然,股票市場是一個復(fù)雜的系統(tǒng),其中還包含了一些人為操作以及政策因素的影響,這就使得對股票趨勢的分析變得更加艱難。