姚金海
(中共江西省委黨校 經(jīng)濟學教研部,江西 南昌 330108)
投資者基于股票價格波動的正確把握所帶來的價差收益,是除股息分紅之外的另一重要收益來源。對于二級市場投資者而言,基于合理假設準確預測股票價格未來波動趨勢事關(guān)收益高低甚至投資成敗。但在充滿不確定性的股票市場中,投資者行為會受到個體心理特征、風險偏好、學識素養(yǎng)等內(nèi)部因素和宏觀經(jīng)濟、行業(yè)發(fā)展、公司質(zhì)量等外部因素的綜合影響。因此,投資者基于價格預測進行證券投資的過程本身就是一場風險之旅。
最早由Markowitz發(fā)展起來的均值—方差模型為靜態(tài)資產(chǎn)組合選擇問題提供了一個理論分析框架,但該模型以資產(chǎn)的歷史收益代表預期收益,以歷史資產(chǎn)收益的協(xié)方差代表資產(chǎn)風險和相關(guān)性,在風險資產(chǎn)價格寬幅波動的情況下,必然導致建模所需的未來實際協(xié)方差矩陣與作為假設參數(shù)的歷史協(xié)方差矩陣之間產(chǎn)生較大偏差。股票資產(chǎn)就是這樣一種具有波動性、混沌性和復雜性特征的風險資產(chǎn)。行為金融學相關(guān)研究表明,在股票市場上升行情和下跌行情中,基于回報率衡量的資產(chǎn)相關(guān)性有明顯差別,且這種非對稱相關(guān)效應在不同市場、不同行業(yè)、不同資產(chǎn)類別間均顯著存在[1]。
基于科學方法和技術(shù)對股票價格進行合理預測,并在重構(gòu)預期資產(chǎn)收益率協(xié)方差矩陣的基礎上,動態(tài)調(diào)整投資組合中各類資產(chǎn)的配置權(quán)重,對于投資組合績效具有決定性作用。隨著數(shù)據(jù)挖掘、智能算法等技術(shù)的迅猛發(fā)展,投資者對股價進行合理預測,并據(jù)此對投資組合實施積極管理具有一定可行性。本文基于ARIMA與信息?;疭VR組合預測技術(shù),構(gòu)建時間序列組合預測模型,對股價指數(shù)進行預測,力求捕捉股價指數(shù)的變化趨勢與波動區(qū)間,從而為養(yǎng)老基金等機構(gòu)投資者實施積極投資和動態(tài)管理提供支持。
股票價格或者股價指數(shù)是否可預測?據(jù)此進行擇時交易是否可能?20世紀80年代行為金融理論興起之前以有效市場假說為代表的正統(tǒng)金融理論通常認為,市場價格會完全反映時效信息,根本不可能存在產(chǎn)生超額收益的資產(chǎn)價格預測模式[2],擇時交易獲取超額收益幾乎是不可能實現(xiàn)的目標[3]。有效市場理論學派所立基的三道防線“理性投資者、非理性投資者的隨機交易會使得錯誤相互抵消和完美套利”[4]一直飽受詬病并不斷受到實證檢驗的挑戰(zhàn)?,F(xiàn)實中,非財富最大化預期、啟發(fā)式偏見和定式心理誤會等因素導致的投資者行為偏差具有普遍性和系統(tǒng)性。投資者經(jīng)常而不是偶然以同樣的方式偏離理性,他們的錯誤不但不會相互抵消反而會循環(huán)放大。這使得有效市場理論“非理性投資者的隨機交易會使得錯誤相互抵消”的假設條件難以成立。對于有效市場理論基于一價定律的無風險套利的實證檢驗表明,因為投資者成熟度、信息透明度、套利風險及套利成本等局限性因素的存在,套利往往是有限的,并不能在短期內(nèi)糾正非理性投資者造成的價格偏差[5]。然而,正統(tǒng)觀點一旦形成往往會變得根深蒂固,甚至逐漸固化為學術(shù)教條而難以被沖破。過去幾十年間,來自外部尤其是行為金融學的挑戰(zhàn)雖然有力地沖擊了有效市場假說的三道防線,但是對于現(xiàn)代金融學理論將有效市場界定為“不可預測、不可戰(zhàn)勝的市場”這一假設和檢驗邏輯的實證批判卻很乏力。這種有效市場的界定和檢驗邏輯成為以Fama為代表的現(xiàn)代金融理論學派捍衛(wèi)有效市場理論的強大武器,從CAPM到Fama-French三因子模型,再到Carhart四因子模型,以及后來發(fā)展的五因子模型都以這種實證檢驗為手段,通過證明市場“不可預測、不可戰(zhàn)勝”,進而認定市場是有效的[6]。然而,股價不可預測、市場難以戰(zhàn)勝并不必然意味著市場是完全有效的。有學者對“不可預測、不可戰(zhàn)勝”與完全有效市場之間的關(guān)聯(lián)性和一致性提出了質(zhì)疑。日歷異象、賭徒謬誤、反應過度等諸多無法被有效市場理論和檢驗所解釋的市場“異象”的出現(xiàn),成為行為金融學質(zhì)疑和批判有效市場理論正確性及其檢驗合理性的有力武器[7]。從Barberis和Thaler提出“可預測性之謎”以來,關(guān)于股票收益可預測性的研究一直是過去30多年間金融經(jīng)濟學研究的焦點,并產(chǎn)生了大量的研究成果。雖然早期有效市場理論學派的實證研究沒有發(fā)現(xiàn)機構(gòu)投資者存在顯著的擇時能力,但是許多變量能預測股票收益率這一有效市場理論所難以解釋的市場異象越來越多地得到行為金融學派的實證檢驗支持[8]。現(xiàn)實中,巴菲特、索羅斯和西蒙斯等優(yōu)秀的投資者在數(shù)十年的較長時期內(nèi)獲得了較大的超額收益,表現(xiàn)出較強的擇時能力也已是不爭的事實。隨著計算機技術(shù)和大數(shù)據(jù)、人工智能的發(fā)展,數(shù)據(jù)挖掘在量化投資中的應用日益廣泛而深入,市場擇時也逐漸具備技術(shù)基礎。
通過合適的技術(shù)方法來預測股票價格或者股價指數(shù)的波動,始終是理論界和實務界關(guān)注的焦點問題。為了實現(xiàn)基于股市價格波動預測的擇時交易并進而獲取超額收益的目標,經(jīng)典的統(tǒng)計回歸模型、現(xiàn)代的人工神經(jīng)網(wǎng)絡、支持向量機(SVM)及其他多種智能數(shù)據(jù)挖掘算法均被國內(nèi)外學術(shù)界廣泛采用,并在不斷豐富發(fā)展的過程中取得了較為豐碩的成果[9]。Dufour和Stevanovic[10]運用VARMA模型對股票價格走勢進行了預測。董子靜等[11]運用SVM方法對股指期貨與股指現(xiàn)貨之間的關(guān)系開展了研究,并對股指趨勢進行了預測。為克服單一預測方法的局限性,也有很多學者開始嘗試運用組合方法進行股指預測。黃宏運等[12]利用具有良好非線性尋優(yōu)能力的遺傳算法對傳統(tǒng)BP神經(jīng)網(wǎng)絡模型加以優(yōu)化,并運用它對上證指數(shù)進行預測,結(jié)果表明能有效提升收斂速度和預測精度。武大碩等[13]基于遺傳算法改進LSTM神經(jīng)網(wǎng)絡模型對納斯達克數(shù)據(jù)進行預測后發(fā)現(xiàn),組合模型較單一模型而言能顯著提升預測效度。
股指預測尤其是基于組合方法的股指預測方法與技術(shù)研究已成為智能信息處理的熱點和前沿領(lǐng)域。學術(shù)界已取得不少頗具價值的理論成果,但仍有很多問題亟待解答。股票等風險資產(chǎn)市場價格波動的實踐表明,其價格和收益率序列經(jīng)常表現(xiàn)出非線性、混沌性和復雜性特征,背后的動因既可能是宏觀經(jīng)濟波動性外溢,也可能是行業(yè)生命周期變化的沖擊,甚至也可能是投資者情緒波動所致。這使得任何單一預測模型都可能失效。因而,基于數(shù)據(jù)挖掘和機器學習發(fā)展起來的智能組合算法可能成為某種替代性選擇。本文基于ARIMA與信息?;疭VR組合預測技術(shù)模型,構(gòu)建時間序列組合預測模型,對股票市場指數(shù)價格和收益變化進行趨勢預測,以期得出股價指數(shù)較為可靠的變化趨勢與波動區(qū)間,從而為投資者的決策優(yōu)化提供有效的理論支撐和實踐指導。
自回歸積分滑動平均模型(ARIMA)由自回歸模型(AR)與滑動平均模型(MA)組合而成,是在ARMA模型上通過進一步優(yōu)化實現(xiàn)的,適合于預測非平穩(wěn)時間序列,廣泛應用于物理科學、經(jīng)濟學、生物學等領(lǐng)域隨機現(xiàn)象的預測[14]。該預測模型主要通過觀察相關(guān)函數(shù)截尾和拖尾特征自回歸階數(shù)(P)、差分次數(shù)(d)和移動平均階數(shù)(q)等參數(shù),進而對非平穩(wěn)時間序列使用差分法進行平穩(wěn)化處理,并在此基礎上進行預測分析。模型表達式如下:
(1)
2.2.1 信息粒化建模
L.A.Zadeh教授1979年提出的信息?;谴嬖谟谥T多領(lǐng)域中的現(xiàn)象,它能夠把大量復雜信息按各自的特征和性能將其劃分成若干較簡單的塊,而每個如此劃分出來的塊被看成一個粒,有利于我們將一個信息體劃分為多個部分進行分類細化研究[15]。信息?;念愋蛣澐种饕谢谀:碚摗⒋植诩碚摵挽乜臻g理論等三種方法,本文采用基于模糊集理論的模糊信息?;椒?。模糊信息?;饕譃閯澐执翱诤湍:瘍蓚€步驟,信息粒則可以表示為:P?(xisG)isλ,其中,P是基于X而構(gòu)建的模糊信息粒子,x是論域U中取值的變量,G是U的凸模糊子集,由隸屬函數(shù)μG來刻畫,λ是單位區(qū)間的模糊子集,表示可能性概率,一般假設U為實數(shù)集R(Rn)。本文采用三角形模糊粒子,隸屬函數(shù)的表達式為:
(2)
公式(2)中,輸入的時間序列由x表示;a,m,b均為參數(shù)。對于單個模糊粒子而言,原始數(shù)據(jù)變化的最小值、原始數(shù)據(jù)變化的平均水平和原始數(shù)據(jù)變化的最大值分別由參數(shù)a,m,b表示。
2.2.2 構(gòu)造SVR最優(yōu)決策函數(shù)
支持向量回歸機(SVR)是在SVM分類的基礎上引入不敏感損失函數(shù)提升、改善回歸擬合性能和效果的一種智能預測算法[16]。SVR模型算法的復雜度能有效處理樣本多維度問題,避免了神經(jīng)網(wǎng)絡預測模型存在的局部極值問題,能夠保證解的唯一性和全局最優(yōu)性。SVR模型算法實現(xiàn)過程如下:
設xi∈Rn為輸入數(shù)據(jù),yi∈R為對應于xi的預測值,則可以得到訓練樣本集{(x1,y1),…,(xn,yn)),4},于是在高維特征空間中構(gòu)造的最優(yōu)決策函數(shù)為:
f(x)=ω·φ(xi)+b
(3)
其中,ω為權(quán)重矢量,b為偏差。
2.2.3 尋求最優(yōu)回歸超平面[17]
(4)
并通過拉格朗日方程轉(zhuǎn)換后得到上式的對偶形式:
(5)
2.2.4 構(gòu)造SVR回歸函數(shù)
在徑向基核函數(shù)K(xi,xj)=e-(‖x-xi‖2/2g2)基礎上構(gòu)造支持向量機,得到SVR回歸函數(shù):
(6)
第三步,對上證指數(shù)時間序列數(shù)據(jù)進行歸一化處理,利用模糊粒化處理后的數(shù)據(jù)對SVM 進行訓練,確定SVR最優(yōu)懲罰參數(shù)C和徑向基核最優(yōu)參數(shù)g,在此基礎上構(gòu)建模糊信息?;疭VM預測模型,對窗口化殘差值進行預測。
本文選取上證指數(shù)1990年12月20日到2017年5月5日期間內(nèi)上證指數(shù)時間周期分別為周和月的開盤價作為樣本數(shù)據(jù),以樣本交易日數(shù)據(jù)為訓練集分別預測接下來的4周和4個月的時間周期內(nèi),上證指數(shù)開盤價的變化情況。樣本數(shù)據(jù)來源于東方財富Choice金融終端。
根據(jù)信息量最小的判定標準,本文選取最優(yōu)ARIMA模型進行預測,得到樣本觀測值與ARIMA模型預測值曲線圖(圖1)。
圖1 上證指數(shù)觀測值與ARIMA模型預測值結(jié)果
對殘差序列進行模糊信息?;?,我們針對每個窗口均可得到三個模糊粒子,分別以Low、R、Up表示,與之對應的是公式(2)中的aa,m,b。對于單個模糊粒而言,Low、R、Up分別代表輸入數(shù)據(jù)變化的最小范圍、平均范圍和最大范圍。在對數(shù)據(jù)進行預處理的基礎上,將模糊信息?;瘮?shù)據(jù)進行歸一化,并利用網(wǎng)格尋優(yōu)算法對備選模型參數(shù)進行甄別。經(jīng)過大范圍內(nèi)粗略的參數(shù)尋優(yōu)和較小范圍內(nèi)精細的參數(shù)尋優(yōu)兩個階段之后,我們可以得出對Low、R和Up進行參數(shù)選擇的結(jié)果。因為三個變量的預測過程類似,此處僅對R變量進行參數(shù)選擇的結(jié)果加以展示(圖2)。
利用最佳參數(shù)確定的模型對訓練集進行訓練,并利用公式(2)中的三角模糊隸屬函數(shù)將訓練集數(shù)據(jù)進行模糊信息粒化,結(jié)果如圖3所示。
圖2 對R變量進行參數(shù)選擇的結(jié)果
圖3 模糊信息?;梢暬Y(jié)果
最后,我們對窗口化ARIMA模型預測值與窗口化殘差預測值進行合并,分別可以得到上證指數(shù)預測結(jié)果與真實值的對比圖(圖4)以及誤差變化圖(圖5)。
圖4 基于ARIMA與信息粒化SVR組合預測的結(jié)果
圖5 基于ARIMA與信息?;疭VR組合預測的誤差變化圖
作為上證指數(shù)時間序列組合模型的預測結(jié)果,下面的表1和表2分別展示了基于ARIMA與信息?;疭VR組合預測上證指數(shù)周數(shù)據(jù)和月度數(shù)據(jù)的結(jié)果。
表1 基于ARIMA與信息?;疭VR組合預測上證指數(shù)周數(shù)據(jù)的結(jié)果
表2 基于ARIMA與信息?;疭VR組合預測上證指數(shù)月數(shù)據(jù)的結(jié)果
本文基于ARIMA與信息?;疭VR組合方法構(gòu)建了股指時間序列預測模型,并對上證指數(shù)變化的空間和趨勢進行了預測。實證研究表明:(1)在以周和月為周期的時間窗口范圍內(nèi),上證指數(shù)的變化空間預測結(jié)果與其實際變化趨勢基本一致;(2)該組合預測技術(shù)能有效提高預測精度和效度,能在一定時間周期內(nèi)對股票等風險資產(chǎn)價格波動區(qū)間進行較為可信的預測,有助于投資者基于價格預測的投資組合優(yōu)化;(3)該組合預測技術(shù)還只能大致確定時間序列的波動范圍而不能精確地預測具體指數(shù)點位?;贏RIMA與信息?;疭VR組合預測的回歸預測方法具有一定的預測效果,有助于我們實現(xiàn)中長期股指走勢的預判與把握。但該預測技術(shù)建立在時間序列平穩(wěn)性、隨機性等系列假設之上,預測效果受到模糊粒子類型、核函數(shù)以及參數(shù)范圍選擇等因素的影響,未來仍需通過進一步優(yōu)化以提升組合預測模型的應用效果。