李昊,梁州,黃迅
中國證券市場的股票異動:界定及預測
李昊,梁州,黃迅
本文以中國中小企業(yè)板和創(chuàng)業(yè)板上市公司為研究對象,從股價或股票交易量角度構建適合中國證券市場股票異動的界定方法,并引入最優(yōu)參數(shù)下的支持向量機(SVM)模型對股票異動開展預測研究,進而對各分類模型的預測精度進行比較,最終就最優(yōu)參數(shù)下SVM模型的穩(wěn)健性進行討論。結(jié)果表明,基于SVM的股票異動預測模型,在中小企業(yè)板和創(chuàng)業(yè)板中最優(yōu)參數(shù)選擇相似,且都具有接近的樣本判錯率、第1類錯誤率和第2類錯誤率;基于企業(yè)SVM的股票異動預測模型不僅具有良好的穩(wěn)健性,且比其他分類模型具有更優(yōu)秀的預測性能。
市場異動;SVM模型;股價;股票交易量
李昊(1994-),安徽肥東人,成都理工大學商學院,碩士研究生,研究方向為金融理論與風險管理;梁州(1992-),陜西寶雞人,成都理工大學商學院,碩士研究生,研究方向為金融理論與風險管理。(四川成都610059);黃訊,西南財經(jīng)大學中國金融研究中心,研究方向為金融理論與風險管理。(四川成都611130)
近年來,爆發(fā)的金融危機、歐債危機等全球性危機災難事件,不斷告誡我們:只有準確地預測風險發(fā)生,才能有效應對與防范中國證券市場的風險,進而維護金融市場安全,促進經(jīng)濟社會穩(wěn)定發(fā)展。然而,由于中國證券市場成立時間較短,監(jiān)管制度不完善、投機氛圍濃厚等因素影響,導致證券市場頻繁發(fā)生股價或股票交易量異常波動的現(xiàn)象(陳收,2008)。這不僅可能擾亂股票市場秩序,給投資者帶來損失,甚至還可能引發(fā)金融風險,對經(jīng)濟社會的穩(wěn)定發(fā)展造成嚴重影響。因此,開展股票異動的預測研究,對于監(jiān)管當局與投資者防范和化解危機事件具有重要的意義。
長期以來,學術界已開發(fā)出邏輯(Logit)回歸、概率比(Probit)回歸、橫截面回歸(STV)、時間序列(Time Series)等一系列模型對股票異動進行了廣泛而深入的研究(Caggiano等,2014;Nyberg等,2011;Kim等,2016;Mironiuc等,2013)。雖然均取得了較好的效果,但都存在所需條件過于苛刻、欠學習等問題(林宇等,2016)。然而令人欣喜的是,近年來新興的人工智能模型恰好為處理上述問題提供了良好的解決思路。這是因為,以支持向量機(support vector machine,SVM)、人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)為代表的人工智能模型能夠通過自適應學習方法對樣本進行良好的擬合,從而可以有針對性地解決上述模型存在的弊端。也正是由于人工智能模型具有如此顯著的優(yōu)勢,因而其一經(jīng)提出,就受到廣大學者的青睞,被廣泛運用于預測研究并取得優(yōu)異成效(G??ken等,2016;Qiu等,2015;秦學志等,2016)。但美中不足的是,ANN仍然存在過度學習與局部最優(yōu)解等問題,而SVM(Vapnik,1995)卻正好擁有解決這些問題的突出優(yōu)勢,使得SVM具有更為優(yōu)異的推廣性,因而也更為受到研究學者的關注,并被廣泛運用于金融研究領域(張貴生等,2016)。因此,本文將引入SVM對中國證券市場股票異動進行預測研究,從而為金融市場的風險防范提供可操作的實踐工具。
盡管股票異動預測研究的重點在于構建預測模型,但構建預測模型的關鍵又在于如何對狀態(tài)指標變量進行選擇,即:如何界定股票異動。雖然基于股價所構建的股票異動的界定方法在一定程度上得到了當前學術界的認可(吳文峰等,2000;陸建軍等,2003),但事實上,股價并非是唯一能夠界定股票異動和刻畫市場風險狀態(tài)的指標。在多數(shù)情況下,股票異動所引發(fā)的市場風險還往往通過承載大量交易信息的股票交易量進行展現(xiàn)(李茁,2015)。顯然,只有將股票交易量指標也納入界定股票異動方法的研究探討中,才能使所構建的股票異動的界定方法更為準確,進而使中國證券市場股票異動的預測研究更為合理。值得一提的是,滬深交易所每日提供的“交易公開信息”即:龍虎榜,充分披露了股價或股票交易量的異動信息(馮旭南,2016),而這恰好與本文所探討的從股價或股票交易量出發(fā)界定股票異動的思路不謀而合,也正為中國證券市場股票異動的界定研究提供了充分的依據(jù)?;谝陨戏治雠c認識,本文將基于“龍虎榜”所披露的股價或股票交易量的異動信息,對中國證券市場的股票異動進行界定,從而為預測模型的構建奠定堅實的基礎。
此外眾所周知,中小企業(yè)板和創(chuàng)業(yè)板并非只是為了鼓勵自主創(chuàng)新,而專門向高科技、高成長企業(yè)所提供的新興融資途徑,它們的創(chuàng)立更是使得中國金融市場的結(jié)構越發(fā)完整(逯東等,2015;劉飛等,2014)。但相對主板而言,其所屬公司市值偏小,從而股票受到人為操作的行為更為頻繁,進而導致股價或股票交易量極易發(fā)生異動,這也使得中國證券市場的風險暴露明顯(張鐵鑄等,2011)。因此,將中小企業(yè)板和創(chuàng)業(yè)板納入本文的研究框架,便更加具有理論與實際意義。
基于以上分析與認識,本文以中小企業(yè)板和創(chuàng)業(yè)板作為研究對象,在基于“龍虎榜”構建股票異動的界定方法后,將SVM與之相結(jié)合對中國證券市場的股票異動進行預測研究,進而以樣本判錯率、第1類錯誤率和第2類錯誤率作為評判指標,綜合對比了SVM模型與其他分類模型的預測精度,并最終將10折交叉驗證法(cross validation,CV)運用于基于SVM的股票異動預測模型的穩(wěn)健性研究中。
迄今為止,就所掌握的文獻而言,已有學者將SVM運用于股市中,如Ni等(2011)以上海證券交易所指數(shù)為研究對象,建立了將SVM與分形特征選擇相結(jié)合的股指走勢預測模型;Thenmozhi等(2016)以全球各大板塊指數(shù)為研究對象,利用根均方誤差(RSME)和命中率為評判標準,構建了SVM股指回報率預測模型。盡管上述研究效果良好,但是均沒有將SVM運用于股票異動的預測研究中。而在圍繞股票異動的研究的過程中,盡管吳文峰等(2000)從漲跌幅角度和收益率分布定義股票異動,并闡述股票異常波動對資產(chǎn)定價檢驗模型的影響;陸建軍等(2003)以上交所60支股票為研究對象,通過個股價格與股票市場價格指數(shù)的回歸殘差來檢驗股票價格異常波動;李國平等(2007)以“廈工股份”為研究對象,從股票價格出發(fā)利用“綜合集成研討廳”體系(HWSME)和模糊綜合評判方法對股票價格異常波動進行研究。但是,上述文獻不僅忽略了股票交易量對于股票異動的影響且沒有開展行之有效的預測。而本文不僅基于股價或股票交易量構建出適合中國證券市場股票異動的界定方法,而且也引入SVM對中小企業(yè)板和創(chuàng)業(yè)板的股票異動進行預測,并與其他分類模型進行性能對比。由此可見,與已有的研究成果相比本文的創(chuàng)新性是顯而易見的。
(一)基于SVM的股票異動預測方法
對于上市公司i,在t時刻存在著股票異動與未發(fā)生股票異動的兩種狀態(tài)。用狀態(tài)指標變量yti={+ 1,-1}表示:
其中,D表示第i家上市公司的股票在t時刻下沒有發(fā)生異動,D表示第i家上市公司的股票在t時刻下出現(xiàn)異動。
用m維的特征指標變量,即:影響股票異動的因素。刻畫上市公司i在t時刻的特征(,,…,其中d表示特征指標變量的維度,d=1,2,…m。因為本文通過運用當期的特征指標變量來預測下一期的狀態(tài)指標變量,所以各研究樣本可以構造為(),表示運用t時刻的特征指標變量來預測t+1時刻的狀態(tài)指標變量。
為了得到預測模型以及評價預測模型的可行性,本文將一部分樣本點)劃分為訓練樣本,k=1,2,…,h。另一部分樣本點(y)劃分為測試樣本,u=h+1,…,n。通過訓練樣本集,運用SVM訓練,即可得到股票異動的預測模型,再通過測試樣本來考察所得到SVM預測模型的精確度。對SVM訓練需要求解的最優(yōu)問題如下:
其中,w表示可調(diào)權值向量;b表示偏置向量;ξk表示非負的松弛變量,作用是適當“軟化”約束條件,允許錯分樣本的情況發(fā)生,即允許將發(fā)生異動的股票錯誤的判定為未發(fā)生異動的股票,或者將未發(fā)生異動的股票錯誤的判定為發(fā)生異動的股票;c表示懲罰參數(shù),作用在于使分類間隔2/‖‖w盡可能大而錯化程度b*盡可能小。
為了求解上述問題,進而通過引入拉格朗日乘子,并將原問題轉(zhuǎn)化為對偶問題,進一步求解得到的SVM預測模型如下:
到此為止,針對股票異動的SVM預測模型已經(jīng)構建完成。
(二)股票異動的界定方法
股票異動預測模型構建的一個關鍵在于如何界定股票是否發(fā)生異動,因為只有準確界定股票異動與否,才能合理劃分股票異動預測模型的狀態(tài)指標變量。一旦股票異動的界定方法不符合實際需求,預測模型的構建也很可能會以失敗而告終,于證券市場的風險管理極為不利。眾所周知,對于中國證券市場而言“龍虎榜”披露了股價或股票交易量異動的信息,這恰好全面準確地描述了股票異動現(xiàn)象,從而合理地刻畫了中國證券市場的風險狀態(tài)。因此,本文借鑒“龍虎榜”的設立規(guī)則構建出了以單日收盤價漲跌幅偏離值達到、單日價格振幅達到和單日換手率達到20%的中國證券市場股票異動的界定方法。
進而樣本一旦達到上述三條門檻值之一,則被界定為股票異動樣本,反之,則被界定為非股票異動樣本。
(一)樣本的選擇
由于界定ST類與非ST類股票是否異動的方法不同且新股上市不納入異動界定范圍①。
因此,在排除了ST類公司以及2015年前后新上市的公司后,本文以中小企業(yè)板714家上市公司和創(chuàng)業(yè)板塊399家上市公司作為研究樣本。同時,為了能夠體現(xiàn)預測模型反映股市暴漲暴跌的優(yōu)越性,從而使預測結(jié)果更具有說服力,本文將研究區(qū)間設定在2015年1月5日至2015年8月16日,數(shù)據(jù)來源于Wind數(shù)據(jù)庫,使用Matlab2016a進行編程。
(二)特征指標變量的選擇
盡管界定狀態(tài)指標是構建預測模型的重中之重,但同樣不可忽視對引發(fā)股票異動的特征指標進行準確提取,因為如果特征指標選擇過多,會造成“維數(shù)災難”而降低模型的運行效率,反之如果特征指標過少則無法有力挖掘反映股票異動的信息,從而使得預測結(jié)果與實際情況相比相差甚大。因而在綜合股票的一系列基本指標、相關文獻的選擇標準后,本文選擇如下10項指標作為特征指標(李茁;2015;徐國祥等,2011),如表1所示。
表1 股票異動預測模型的特征指標
(三)SVM股票異動預測模型最優(yōu)參數(shù)的選擇
就基于SVM的中國證券市場股票異動預測模型來說,選擇的參數(shù)一旦并非最優(yōu),則會直接降低模型對股票異動的預測能力。進而只有在經(jīng)過反復模擬參數(shù)的過程后選擇適當?shù)膮?shù)c、g,模型才能對于中小企業(yè)板與創(chuàng)業(yè)板的股票異動與否進行更有價值的預測研究。因此,借鑒楊毓(2006)、張亮(2015)的研究成果,本文將中小企業(yè)板86903個樣本數(shù)據(jù),創(chuàng)業(yè)板48975個樣本數(shù)據(jù),分別劃分75%的樣本為訓練集,25%的樣本為測試集,其中,中小企業(yè)板股票的測試集中發(fā)生異動的樣本個數(shù)為2337,未發(fā)生異動的樣本個數(shù)為19389,創(chuàng)業(yè)板股票的測試集中發(fā)生異動的樣本個數(shù)為1672,未發(fā)生異動的樣本個數(shù)為10572。實驗結(jié)果如圖1和圖2所示,進而為了直觀體現(xiàn)圖形的展示效果,從而將第2類錯誤率圖形進行了旋轉(zhuǎn)。其中,本文中第1類錯誤表示非股票異動樣本被預測為股票異動,第2類錯誤表示股票異動樣本被預測為非股票異動。
圖1 在中小企業(yè)板中基于SVM的股票異動預測模型的參數(shù)對比
由圖1可以看出,在參數(shù)g保持不變的情況下,隨著參數(shù)c的增加,樣本判錯率和第1類錯誤率降低,第2類錯誤率升高。而在參數(shù)c保持不變的情況下,隨著參數(shù)g的增加,情況亦是如此,且通過不斷的訓練和模擬的效果看,在參數(shù)c、g取0.4左右的區(qū)間段下,模型預測的結(jié)果更加平穩(wěn)。此外又因為把發(fā)生異動的股票判定為未發(fā)生異動的股票這一事件的危害程度遠大于把未發(fā)生異動的股票判定為發(fā)生異動的股票,從而使得第2類錯誤率顯得更為重要,又由于當參數(shù)c、g選擇在0.3、0.4時第2類錯誤率更低。因此,在綜合考慮模型的計算復雜程度、綜合性能以及第2類錯誤率的情況下,本文將基于SVM的中小企業(yè)板股票異動預測模型的參數(shù)c、g最終確定為0.3、0.4,此時模型整體準確率為76.36%。
而從圖2可以看出,基于SVM的股票異動預測模型在創(chuàng)業(yè)板最優(yōu)參數(shù)的選擇上,當參數(shù)c、g均取0.4、0.3時,模型在樣本判錯率、第1類錯誤率和第2類錯誤率上達到效果最優(yōu)。因此,本文在創(chuàng)業(yè)板中將基于SVM的股票異動預測模型的參數(shù)c、g分別設為0.4、0.3,此時預測模型的準確率為73.6%。另外,還可以看出無論是在中小企業(yè)板還是在創(chuàng)業(yè)板中基于SVM的股票異動預測模型的樣本判錯率、第1類錯誤率、第2類錯誤率在趨勢上驚人地相似,究其原因可能是,雖然中小企業(yè)板和創(chuàng)業(yè)板的進入門檻不同,但均是為鼓勵創(chuàng)新而提供給小市值企業(yè)的融資渠道,且樣本中股票異動和非股票異動在判定比例上存在一定接近,樣本的相似程度較高,從而參數(shù)在圖形反映上趨勢比較相似。
進而,綜合圖1和圖2的結(jié)果,本文整合出了在中小企業(yè)板和創(chuàng)業(yè)板中模型在最優(yōu)參數(shù)c、g下具體的樣本判錯率、第1類錯誤率和第2類錯誤率,實驗結(jié)果如表2所示。
表2 基于SVM的股票異動預測模型在最優(yōu)參數(shù)下的具體值
(四)股票異動預測模型的預測精度對比
對于股票異動研究方法來說,雖然可以采用的研究方法較多,但如何確定為最優(yōu)的研究方法則需深入討論。因此,本文在中小企業(yè)板和創(chuàng)業(yè)板中將SVM模型的核函數(shù)設定為RBF核函數(shù)以及參數(shù)c、g設定為0.3、0.4和0.4、0.3后,以樣本判錯率、第1類錯誤率和第2類錯誤率為評價標準,將其與BP神經(jīng)網(wǎng)絡模型、距離判別法、K近鄰法、貝葉斯分類模型、決策樹、Logit模型和Probit模型的性能進行對比,從而對各模型的實證結(jié)果進行討論分析,實驗結(jié)果如表3和表4所示。
表3 在中小板中SVM模型與其他預測模型對比
表4 在創(chuàng)業(yè)板中SVM模型與其他預測模型對比
由表3和表4可以很明顯的看出,基于SVM的股票異動預測模型無論是對中小企業(yè)板還是對創(chuàng)業(yè)板而言,不僅在樣本判錯率和第1類錯誤率上顯著優(yōu)于除決策樹以外的絕大部分預測模型,而且更為關鍵的是,其第2類錯誤率為所有模型中的最小值。因而,本文將SVM運用于中國證券市場的股票異動預測具有顯著優(yōu)勢。
(五)基于SVM的股票異動預測模型的穩(wěn)健性
雖然通過以上實驗得出了在中小企業(yè)板和創(chuàng)業(yè)板中,可以利用SVM構建出優(yōu)異的股票異動預測模型,但是評價預測模型的優(yōu)良性。還要看其與其他模型比較及在不同樣本劃分比例下是否穩(wěn)健。從而接下來本文將對基于SVM的股票異動預測模型的穩(wěn)健性進行研究,而10折交叉驗證法是將樣本整體劃分為10等份,每次抽出1等份為測試樣本并進行10次模擬的實驗方法,這恰好可以更為科學且更為客觀對模型的穩(wěn)健性進行研究?;谝陨戏治雠c認識,在選擇較多參數(shù)c、g后,本文將10折交叉驗證法運用于基于SVM的股票異動預測模型的穩(wěn)健性研究中,以判斷每一折上最優(yōu)參數(shù)c、g及其樣本判錯率、第1類錯誤率和第2類錯誤率與已得到模型的差異程度,從而確定模型是否穩(wěn)健,實驗結(jié)果如表5和表6所示。
表5 在中小板中基于SVM的股票異動預測模型的穩(wěn)健性研究
表6 在創(chuàng)業(yè)板中基于SVM的股票異動預測模型的穩(wěn)健性研究
從表5和表6中均可以看出無論是對中小企業(yè)板還是對于創(chuàng)業(yè)板的股票來說,基于SVM的股票異動預測模型在利用10折交叉驗證法下每一折的最優(yōu)參數(shù)選擇上,均在之前人為將研究樣本中75%劃分為訓練集、25%劃分為測試集的最優(yōu)參數(shù)附近,且其中1類錯誤與2類錯誤也相近。從而由以上分析可知,這不僅表明本文所得到的在中小板和創(chuàng)業(yè)板中基于SVM的股票異動預測模型具有較好的泛化能力,而且在合理防范股票異動上為投資者與監(jiān)管當局提供了可操作性的工具。
本文將剔除了新股上市與ST類剩余后中小企業(yè)板和創(chuàng)業(yè)板的股票作為研究樣本,運用“龍虎榜”披露的股價或股票交易量的異動信息,構建股票異動的界定方法,從而確定了股票異動與非股票異動樣本,進而在SVM模型參數(shù)c、g討論后將最優(yōu)參數(shù)下的SVM模型運用于中國證券市場股票異動預測研究中,然后再運用樣本判錯、第1類錯誤、第2類錯誤對SVM模型與各預測模型的預測精度進行對比,并最終利用10折交叉驗證法對本文得到的最優(yōu)模型進行穩(wěn)健性檢驗。實證結(jié)果表明:不管在中小板還是在創(chuàng)業(yè)板,本文所選取的SVM模型,不僅在精度上顯著優(yōu)于其他預測模型,而且十分穩(wěn)健不會因為樣本有所差異而導致模型的預測精度產(chǎn)生較大變動。
基于以上實證研究結(jié)果,本文的研究對監(jiān)管當局來說,基于SVM的股票異動預測模型能夠較好地預測出中小板和創(chuàng)業(yè)板的股票是否發(fā)生異動,對中國證券市場有效地鑒定與防范風險具有一定的輔助作用。對投資者而言,可以運用基于SVM的股票異動預測模型對中小板和創(chuàng)業(yè)板的股票是否發(fā)生異動進行預測,從而對自身的投資組合進行優(yōu)化,保證資產(chǎn)的保值與升值。
[1]林宇,黃迅,淳偉德,黃登仕.基于ODRADASYN-SVM的極端金融風險預警研究[J].管理科學學報,2016,(5):87~101.
[2]秦學志,李靜一.基于大數(shù)據(jù)樣本的銀行異常賬戶監(jiān)測方法[J].系統(tǒng)管理學報,2016,(4):677~682.
[3]張貴生,張信東.基于近鄰互信息的SVMGARCH股票價格預測模型研究[J].中國管理科學,2016,(9):11~20.
[4]馮旭南.注意力影響股票投資者的股票交易行為嗎?——來自“股票交易龍虎榜”的證據(jù)[J].經(jīng)濟學(季刊),2016,(1):255~274.
[5]逯東,萬麗梅,楊丹.創(chuàng)業(yè)板公司上市后為何業(yè)績變臉?[J].經(jīng)濟研究,2015,(2):132~144.
[6]劉飛,王開科.我國中小板上市公司是投資不足還是投資過度[J].經(jīng)濟評論,2014,(4):122~160.
[7]張亮,張玲玲,陳懿冰,騰偉麗.基于信息融合的數(shù)據(jù)挖掘方法在公司財務預警中的應用[J].中國管理科學,2015,(10):170~176.
F832.5
A
1006-169X(2017)08-0051-06
國家自然科學基金項目(71771032);國家社會科學基金一般項目(17BJY188);教育部人文社會科學青年基金項目(17YJC790168);四川省科技計劃項目(2016ZR0137、2017JY0158);成都理工大學“金融與投資”優(yōu)秀創(chuàng)新團隊計劃項目(KYTD201303)。
①深圳證券交易所披露網(wǎng)址:http://www.szse.cn/.