黎 紅,王宏勇
(南京財(cái)經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,江蘇 南京 210023)
分形理論的創(chuàng)始人B B Mandelbrot[1]在研究股票價(jià)格時(shí)間序列的波動(dòng)規(guī)律時(shí)發(fā)現(xiàn),股票價(jià)格序列呈現(xiàn)尖峰胖尾的統(tǒng)計(jì)特征,不服從正態(tài)分布,因此提出用分形分布來(lái)描述股票收益序列.研究[2-5]表明,金融市場(chǎng)的波動(dòng)具有明顯的非線性分形特征.將分形的理論和方法與某些統(tǒng)計(jì)分析模型或者數(shù)據(jù)挖掘技術(shù)相結(jié)合,成為研究現(xiàn)代金融市場(chǎng)的非線性范式.[6-9]在分形分析方法中,基于迭代函數(shù)系理論發(fā)展起來(lái)的分形插值技術(shù)是擬合數(shù)據(jù)的新方法[10],它尤其適合應(yīng)用于研究非平穩(wěn)數(shù)據(jù)和非光滑曲線的逼近、擬合及趨勢(shì)預(yù)測(cè)[11-12].在利用分形插值方法對(duì)數(shù)據(jù)進(jìn)行擬合和預(yù)測(cè)時(shí),分形插值迭代函數(shù)系的一組自由參數(shù)——縱向尺度因子,對(duì)于擬合效果具有決定性的影響.翟明岳[13]令所有的縱向尺度因子都相等,再利用數(shù)據(jù)序列的分形維數(shù)或者Hurst指數(shù)求出這些相等的縱向尺度因子.當(dāng)然,也有其他求縱向尺度因子的方法[14],但是計(jì)算非常復(fù)雜.此外,利用分形插值進(jìn)行預(yù)測(cè)時(shí),對(duì)于最后一個(gè)預(yù)測(cè)值常常需要先給出期望值,然后利用外推法來(lái)確定其他預(yù)測(cè)點(diǎn)的值.因受到預(yù)先給定的期望值的影響,這些預(yù)測(cè)值的精確性難以保證.近年來(lái),支持向量機(jī)(Support Vector Machine,SVM)越來(lái)越多地被應(yīng)用于金融時(shí)間序列的預(yù)測(cè)[7,15-18].SVM是一種基于統(tǒng)計(jì)理論發(fā)展起來(lái)的數(shù)據(jù)挖掘方法,在求解小樣本、非線性和高維模式識(shí)別問(wèn)題時(shí)有優(yōu)勢(shì);但是在多目標(biāo)預(yù)測(cè)和實(shí)時(shí)控制方面能力欠缺,每次僅能預(yù)測(cè)1個(gè)值.針對(duì)在選取縱向尺度因子時(shí)遇到的這些問(wèn)題,筆者提出一種確定縱向尺度因子的新方法,并在此基礎(chǔ)上建立一個(gè)改進(jìn)的分形插值模型,將該模型與SVM模型相結(jié)合,形成混合預(yù)測(cè)模型.
SVM預(yù)測(cè)模型的基本思想是,通過(guò)非線性映射φ將樣本數(shù)據(jù)xi映射到高維特征空間,并在該空間進(jìn)行線性回歸.設(shè)訓(xùn)練樣本集為{(xi,yi),i=1,2,…,l},則回歸模型為f(x)=(ω·φ(x))+b,對(duì)應(yīng)的優(yōu)化問(wèn)題為:
在構(gòu)建SVM預(yù)測(cè)模型時(shí)需選取懲罰參數(shù)和核函數(shù),這2個(gè)參數(shù)的選取直接影響模型預(yù)測(cè)的精度.本研究取徑向基核函數(shù)K(xi,x)=exp(-γ‖xi-x‖2),在LIBSVM仿真平臺(tái)上實(shí)現(xiàn)SVM算法.
對(duì)于區(qū)間I=[a,b],給定劃分Δ={x0,x1,…,xN},滿足a=x0 (1) 滿足端點(diǎn)條件 (2) 由(1),(2)式可得: (3) (4) 由上述可知,當(dāng)插值點(diǎn){(xi,yi):i=0,1,…,N}給定且縱向尺度因子di(i=1,2,…,N)確定時(shí),可由(3)式求得相應(yīng)的系數(shù)ai,ci,ei,fi(i=1,2,…,N),迭代函數(shù)系也就確定了.因此,如何確定自由參數(shù)di是確定迭代函數(shù)系的關(guān)鍵.以往一種簡(jiǎn)單的做法是令所有的di都相等,先求出Hurst指數(shù),再利用(4)式來(lái)計(jì)算di.但通過(guò)這種方法確定的di和由此得到的分形插值曲線,在實(shí)際應(yīng)用中擬合效果不佳.為了提高分形插值的擬合精度,筆者根據(jù)數(shù)據(jù)的自身信息提出一種確定di的新方法. 對(duì)于數(shù)據(jù)集{(Xi,Yi),i=0,1,…,m},從中等距或非等距地選取插值點(diǎn){(Pj,Qj),j=0,1,…,k},k {(Pj-1,Qj-1),(Xl,Yl),(Xl+1,Yl+1),…,(Xl+n,Yl+n),(Pj,Qj)}, 則這些數(shù)據(jù)點(diǎn)之間的高度差 dj0=Yl-Qj-1,dj1=Yl+1-Yl,…,dj,n+1=Qj-Yl+n. 記 djmax=max(Qj-1,Yl,Yl+1,…,Yl+n,Qj),djmin=min(Qj-1,Yl,Yl+1,…,Yl+n,Qj). 令 (5) 按照(5)式確定的di,能夠?qū)⑾噜彶逯禂?shù)據(jù)之間的局部變化趨勢(shì)和整體變化幅度考慮在內(nèi),且滿足條件|di|<1,這使得所構(gòu)造的分形插值函數(shù)在局部更逼近原始數(shù)據(jù). 接下來(lái)建立基于改進(jìn)的分形插值與SVM的混合預(yù)測(cè)模型.對(duì)于已知數(shù)據(jù){(Xi,Yi),i=0,1,…,m},假設(shè)已選取插值點(diǎn)為{(Pj,Qj),j=0,1,…,k},并由(5)式求得dj(j=1,2,…,k),現(xiàn)需要預(yù)測(cè)未來(lái)數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+r}.由于有r個(gè)未知預(yù)測(cè)點(diǎn),因此在利用分形插值進(jìn)行預(yù)測(cè)時(shí)需要先確定下一個(gè)插值點(diǎn)(Pk+1,Qk+1)和縱向尺度因子dk+1.(Pk+1,Qk+1)可利用SVM算法求出,dk+1可根據(jù)(5)式求出.利用(Pk+1,Qk+1)和dk+1,再構(gòu)建一個(gè)新的迭代函數(shù)系進(jìn)行分形插值,得到相鄰插值點(diǎn)(Pk,Qk)與(Pk+1,Qk+1)之間的所有數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+l},且(Pk+1,Qk+1)=(Xm+l,Ym+l),l≤r.按此步驟繼續(xù)下去,直至得到全部的預(yù)測(cè)數(shù)據(jù){(Xi,Yi),i=m+1,m+2,…,m+r}. 選取上海證券綜合指數(shù)(簡(jiǎn)稱(chēng)上證綜指)2006年1月4日至2017年3月13日共2 718個(gè)日收盤(pán)數(shù)據(jù)作為R/S分析對(duì)象,以確認(rèn)上證綜指序列的分形特征和可預(yù)測(cè)性. 圖1 上證綜指的R/S分析結(jié)果Fig. 1 R/S Analysis Result of Shanghai Composite Index 圖1是上證綜指的R/S分析結(jié)果.由R/S分析可得H=0.680 4,從而可知上證綜指的日收盤(pán)數(shù)據(jù)時(shí)間序列具有長(zhǎng)程相關(guān)性,可用分形方法進(jìn)行預(yù)測(cè). 下面將上證綜指2016年1月4日至2017年1月3日共245個(gè)日收盤(pán)數(shù)據(jù)作為分形插值研究對(duì)象,這些原始數(shù)據(jù)如圖2所示.通過(guò)間隔為4的等距分割選取插值點(diǎn),再利用(5)式計(jì)算縱向尺度因子,建立分形插值模型,對(duì)這245個(gè)日收盤(pán)數(shù)據(jù)進(jìn)行插值擬合.圖3給出了分形插值擬合的結(jié)果.從圖3可以看出,采用縱向尺度因子的新計(jì)算方法所建立的分形插值模型對(duì)上證綜指日收盤(pán)數(shù)據(jù)進(jìn)行擬合,精度較高,表明該模型能很好地描述上證綜指日收盤(pán)數(shù)據(jù)的走勢(shì). 圖2 上證綜指2016年1月4日至2017年1月3日的日收盤(pán)數(shù)據(jù)Fig. 2 Daily Closing Data of Shanghai Composite Index from 2016-1-4 to 2017-1-3 圖3 上證綜指2016年1月4日至2017年1月3日的分形插值擬合Fig. 3 Fractal Interpolation Fitting of Shanghai Composite Index from 2016-1-4 to 2017-1-3 接下來(lái)預(yù)測(cè)最后4天(2016年12月28—30日和2017年1月3日)的日收盤(pán)數(shù)據(jù).根據(jù)分形插值法,要預(yù)測(cè)未來(lái)4天的數(shù)據(jù),就需要知道下一個(gè)插值點(diǎn)(2017年1月3日)的日收盤(pán)數(shù)據(jù)和相應(yīng)的縱向尺度因子.下面利用SVM算法來(lái)進(jìn)行計(jì)算. 圖4 SVM參數(shù)尋優(yōu)結(jié)果Fig.4 Result of SVM Parameter Optimization 由于SVM模型預(yù)測(cè)的都是相鄰的下一個(gè)點(diǎn)的值,因此需適當(dāng)增加樣本規(guī)模以提高預(yù)測(cè)精度.對(duì)1990年12月21日至2017年1月3日的上證綜指日收盤(pán)數(shù)據(jù)每隔4天選取1個(gè)數(shù)據(jù),就得到1 592個(gè)數(shù)據(jù),以最后一個(gè)(2017年1月3日的收盤(pán)數(shù)據(jù))作為預(yù)測(cè)數(shù)據(jù).利用Matlab和LIBSVM進(jìn)行參數(shù)尋優(yōu)與建模,懲罰參數(shù)和核函數(shù)的取值范圍均為[2-4,24].圖4示出了SVM參數(shù)優(yōu)化的結(jié)果. 通過(guò)SVM模型預(yù)測(cè)得到2017年1月3日的收盤(pán)數(shù)據(jù)為3 139.8元,再根據(jù)已知的di計(jì)算出插值區(qū)間2016年12月27日至2017年1月3日的參數(shù)d,這樣就可以利用分形插值預(yù)測(cè)出2016年12月28—30日和2017年1月3日的日收盤(pán)數(shù)據(jù).表1列出了原始數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的比較結(jié)果. 表1 原始數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的比較 圖5 3種預(yù)測(cè)方法的比較Fig. 5 Comparison of Three Prediction Methods 提出了一種確定分形插值迭代函數(shù)系縱向尺度因子的新方法,并由此建立了一個(gè)改進(jìn)的分形插值模型.將該模型與SVM模型相結(jié)合,構(gòu)造了可以預(yù)測(cè)時(shí)間序列變化趨勢(shì)的混合預(yù)測(cè)模型.將混合預(yù)測(cè)模型應(yīng)用于上證綜指日收盤(pán)數(shù)據(jù)的分析和預(yù)測(cè):通過(guò)R/S分析得到上證綜指日收盤(pán)數(shù)據(jù)的Hurst指數(shù)為0.680 4,說(shuō)明上證綜指的日收盤(pán)數(shù)據(jù)具有長(zhǎng)程相關(guān)性,是可預(yù)測(cè)的;利用改進(jìn)的分形插值模型對(duì)上證綜指2016年1月4日至2017年1月3日的日收盤(pán)數(shù)據(jù)進(jìn)行分形插值擬合,獲得了很好的擬合效果;利用混合預(yù)測(cè)模型對(duì)上證綜指2016年12月28—30日和2017年1月3日的日收盤(pán)數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)效果較另外2種方法更好.筆者相信,基于改進(jìn)的分形插值與SVM的混合預(yù)測(cè)模型在對(duì)時(shí)間序列的分析和預(yù)測(cè)中將有廣泛的應(yīng)用. 參考文獻(xiàn): [1] MANDELBROT BENOIT B.New Methods in Statistical Economics[J].Journal of Political Economy,1963,71(5):421-440. [2] PETERS EDGAR E.Fractal Market Analysis:Applying Chaos Theory to Investment and Economics[M].New York,Chichester,Brisbane,Toronto,Singapore:John Wiley & Son,Inc.,1994. [3] 王明濤.基于R/S法分析中國(guó)股票市場(chǎng)的非線性特征[J].預(yù)測(cè),2002,21(3):42-45. [4] YUAN Ying,ZHUANG Xintian,JIN Xiu.Measuring Multifractality of Stock Price Fluctuation Using Multifractal Detrended Fluctuation Analysis[J].Physica A:Statistical Mechanics and Its Applications,2009,388(11):2 189-2 197. [5] 王宏勇,郭麗娜.國(guó)際黃金期價(jià)與美元指數(shù)交互關(guān)系的多重分形分析[J].數(shù)理統(tǒng)計(jì)與管理,2015,34(5):878-889. [6] RICHARDS GORDON R.A Fractal Forecasting Model for Financial Time Series[J].Journal of Forecasting,2004,23(8):586-601. [7] NI Liping,NI Zhiwei,GAO Yazhuo.Stock Trend Prediction Based on Fractal Feature Selection and Support Vector Machine[J].Expert Systems with Applications:An International Journal,2011,38(5):5 569-5 576. [8] MOGHADDAM AMIN HEDAYATI,MOGHADDAM MOEIN HEDAYATI,ESFANDYARI MORTEZA.Stock Market Index Prediction Using Artificial Neural Network[J].Journal of Economics,Finance and Administrative Science,2016,21(41):89-93. [9] OZTEKIN ASIL,KIZILASLAN RECEP,FREUND STEVEN,et al.A Data Analytic Approach to Forecasting Daily Stock Returns in an Emerging Market[J].European Journal of Operational Research,2016,253(3):697-710. [10] BARNSLEY MICHAEL F.Fractal Functions and Interpolation[J].Constructive Approximation,1986,2(1):303-329. [11] WANG Hongyong,YU Jiashan.Fractal Interpolation Function with Variable Parameters and Their Analytical Properties[J].Journal of Approximation Theory,2013,175(4):1-18. [12] 王宏勇,馬 麗.基于分形插值模型的股價(jià)時(shí)間序列分析及預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2009(16):29-30. [13] ZHAI Mingyue.A New Method for Short-Term Load Forecasting Based on Fractal Interpretation and Wavelet Analysis[J].Electrical Power & Energy Systems,2015,69(1):241-245. [14] MAZEL DAVID S,HAYES MONSON H.Using Iterated Function Systems to Model Discrete Sequences[J].IEEE Transactions on Signal Processing,1992,40(7):1 724-1 734. [15] 梁 循.支持向量機(jī)算法及其金融應(yīng)用[M].北京:知識(shí)產(chǎn)權(quán)出版社,2012:1-15. [16] TAY FRANCIS E H,CAO L J.Modified Support Vector Machines in Financial Time Series Forecasting[J].Neurocomputing,2002,48(1-4):847-861. [17] WANG Shuai,SHANG Wei.Forecasting Direction of China Security Index 300 Movement with Least Squares Support Vector Machine[J].Procedia Computer Science,2014,31:869-874. [18] WANG Jianzhou,HOU Ru,WANG Chen,et al.Improvedv-Support Vector Regression Model Based on Variable Selection and Brain Storm Optimization for Stock Price Forecasting[J].Applied Soft Computing,2016,49:164-178.3 上海證券綜合指數(shù)序列的分析與預(yù)測(cè)
4 結(jié)語(yǔ)