鄭愛宇,孫德山
基于HP濾波的股票長(zhǎng)期價(jià)格神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)
鄭愛宇,孫德山
(遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連 116029)
將上證指數(shù)和深證成指股票數(shù)據(jù)作為研究對(duì)象,對(duì)股票長(zhǎng)期價(jià)格進(jìn)行預(yù)測(cè).選取長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、HP濾波長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)混合模型和HP濾波循環(huán)神經(jīng)網(wǎng)絡(luò)混合模型進(jìn)行比較分析.經(jīng)過模型間的對(duì)比分析,發(fā)現(xiàn)HP濾波對(duì)長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的優(yōu)化效果要優(yōu)于循環(huán)神經(jīng)網(wǎng)絡(luò).
長(zhǎng)短期神經(jīng)網(wǎng)絡(luò);循環(huán)神經(jīng)網(wǎng)絡(luò);股票預(yù)測(cè);HP濾波
隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展和金融市場(chǎng)的強(qiáng)烈需求,如今股票市場(chǎng)不僅成為人們生活水平的體現(xiàn),也是市場(chǎng)經(jīng)濟(jì)的晴雨表.股票市場(chǎng)中對(duì)于股票價(jià)格的預(yù)測(cè)一直以來為學(xué)術(shù)界所關(guān)注,但是股票市場(chǎng)受到政策、新聞?shì)浾摵屯顿Y意向等眾多因素影響,總是在不斷地波動(dòng)變化,具有高噪聲和非線性等特點(diǎn),所以對(duì)于股票價(jià)格難以準(zhǔn)確預(yù)測(cè).
現(xiàn)如今人工智能快速發(fā)展,基于深度神經(jīng)網(wǎng)絡(luò)對(duì)股票市場(chǎng)進(jìn)行預(yù)測(cè)研究成為了該領(lǐng)域的熱點(diǎn).雒佳文[1]用HP濾波和指數(shù)平滑法預(yù)測(cè)上證指數(shù)收盤價(jià),分離出趨勢(shì)線,排除了一些和趨勢(shì)線相反的指數(shù)平滑類別,規(guī)避了波動(dòng)成分的影響;王理同[2]等利用上證50股指及其成分股,在單因子循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層采用了長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),相比傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò),單因子模型對(duì)股票預(yù)測(cè)精度更高;楊青[3]等以全球30多種股票指數(shù)作為研究對(duì)象,用長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)進(jìn)行股票收盤價(jià)的預(yù)測(cè),發(fā)現(xiàn)在預(yù)測(cè)精度上要優(yōu)于支持向量機(jī)和時(shí)間序列模型.
由于股票數(shù)據(jù)具有非平穩(wěn)性和時(shí)序性,導(dǎo)致循環(huán)神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)存在過擬合和梯度消失等問題.本文使用HP濾波法對(duì)非平穩(wěn)的股票數(shù)據(jù)進(jìn)行分解,分解成長(zhǎng)期趨勢(shì)序列和短期波動(dòng)序列,再對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析.實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),經(jīng)過HP濾波處理過后的數(shù)據(jù),由長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)的效果要優(yōu)于循環(huán)神經(jīng)網(wǎng)絡(luò).
Hodrick-Prescott(HP)過濾器是宏觀經(jīng)濟(jì)學(xué)中常用的工具,是由經(jīng)濟(jì)學(xué)家Robert Hodrick和Edward Prescott提出的研究經(jīng)濟(jì)運(yùn)行的一種濾波方法,它把經(jīng)濟(jì)運(yùn)行看作是增長(zhǎng)趨勢(shì)和短期波動(dòng)的結(jié)合,將實(shí)際產(chǎn)出分解為趨勢(shì)和周期性2種成分[4-5].該方法采用對(duì)稱的數(shù)據(jù)移動(dòng)平均方法原理,將時(shí)間序列數(shù)據(jù)分為趨勢(shì)要素?cái)?shù)據(jù)和周期性波動(dòng)數(shù)據(jù)2部分.
的解,式中:為正數(shù),用以調(diào)節(jié)比重,是用來控制平滑程度的懲罰因子,稱為平滑參數(shù);為時(shí)間序列的樣本數(shù).值越大,趨勢(shì)序列中的變化總數(shù)相對(duì)于原序列中的變化越小,即越大,趨勢(shì)序列越平滑;當(dāng)值趨向于無窮時(shí),,此時(shí),HP濾波退化為最小二乘法.
循環(huán)神經(jīng)網(wǎng)絡(luò)是一類具有短期記憶的神經(jīng)網(wǎng)絡(luò),如果將每一時(shí)刻的狀態(tài)看成前饋神經(jīng)網(wǎng)絡(luò)的一層,那么可以將循環(huán)神經(jīng)網(wǎng)絡(luò)看作是在時(shí)間維度上權(quán)值共享的神經(jīng)網(wǎng)絡(luò)[6].
循環(huán)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)見圖1,通過在隱藏層上的回路連接,前一時(shí)刻的網(wǎng)絡(luò)狀態(tài)能夠傳遞給當(dāng)前時(shí)刻,而當(dāng)前時(shí)刻的狀態(tài)也能夠傳遞給下一時(shí)刻.
隱藏層的表達(dá)式為
輸出層的表達(dá)式為
由于循環(huán)神經(jīng)網(wǎng)絡(luò)用的是反向傳播算法,會(huì)碰到梯度消失的狀況,因此循環(huán)神經(jīng)網(wǎng)絡(luò)不適合處理比較長(zhǎng)的時(shí)間序列.長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)作為循環(huán)神經(jīng)網(wǎng)絡(luò)的一種變體,在循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)基礎(chǔ)上進(jìn)行了改進(jìn),引入“門”的概念.
對(duì)比循環(huán)神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)在于解決了在訓(xùn)練過程中出現(xiàn)的梯度爆炸和梯度消失的問題,使模型能夠?qū)崿F(xiàn)更長(zhǎng)時(shí)間的記憶,非常適合解決和時(shí)間序列相關(guān)性較高的問題,如本文所研究的股票預(yù)測(cè)問題[7-8].
相比標(biāo)準(zhǔn)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)中增加了遺忘門、輸入門和輸出門3個(gè)門控單元,具體體系結(jié)構(gòu)見圖2[9-10].
圖2 長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)
金融時(shí)間序列由于受到政治、經(jīng)濟(jì)以及市場(chǎng)技術(shù)等多方面的因素影響,具有不確定性、高噪聲和非線性等特征.為了在提高模型精度的同時(shí)不增加模型的復(fù)雜程度,本文提出了HP-LSTM模型.
首先用HP 濾波將上證指數(shù)的收盤價(jià)、開盤價(jià)、最高價(jià)、最低價(jià)和交易量5個(gè)指標(biāo)的時(shí)間序列分解為長(zhǎng)期趨勢(shì)序列和短期波動(dòng)序列,之后用長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)分別對(duì)分解出的2個(gè)序列進(jìn)行靜態(tài)預(yù)測(cè).具體的建模步驟為:
Step1先用HP濾波將數(shù)據(jù)分解為長(zhǎng)期趨勢(shì)序列和短期波動(dòng)序列(在HP濾波將數(shù)據(jù)分解前對(duì)原始數(shù)據(jù)進(jìn)行了歸一化處理,以便提高HP濾波的運(yùn)行速度).
Step2為了能夠消除不同量綱對(duì)最終預(yù)測(cè)結(jié)果的影響,同時(shí)提高模型的運(yùn)行速度,對(duì)Step1得到的長(zhǎng)期趨勢(shì)序列和短期波動(dòng)序列分別進(jìn)行歸一化.
Step3將生成的數(shù)據(jù)集劃分為測(cè)試集和預(yù)測(cè)集,在訓(xùn)練集中訓(xùn)練模型,將用于預(yù)測(cè)長(zhǎng)期趨勢(shì)序列的長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型稱為L(zhǎng)STM-L模型,將用于預(yù)測(cè)短期波動(dòng)序列的長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型稱為 LSTM-S模型.
Step4將測(cè)試集分別輸入Step3的 LSTM-L模型和 LSTM-S模型中進(jìn)行靜態(tài)預(yù)測(cè),得到2個(gè)序列的預(yù)測(cè)結(jié)果,將得到的2個(gè)預(yù)測(cè)結(jié)果分別進(jìn)行反歸一化.
Step5將反歸一化的結(jié)果疊加,得到最終的預(yù)測(cè)結(jié)果.
使用數(shù)據(jù)為上證指數(shù)和深證成指,皆來自網(wǎng)易財(cái)經(jīng).上證指數(shù)的時(shí)間跨度為1990-12-20—2022-10-17,深證成指的時(shí)間跨度為1991-04-04—2022-10-14.選取每日開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)和交易量5個(gè)特征作為模型的輸入,次日的收盤價(jià)為模型的輸出.上證指數(shù)擁有7 773條數(shù)據(jù),深證成指擁有7 682條數(shù)據(jù),2個(gè)數(shù)據(jù)樣本都選取前5 500個(gè)數(shù)據(jù)進(jìn)行模型的建立,其余數(shù)據(jù)進(jìn)行模型測(cè)試.實(shí)驗(yàn)是在Windows10x64 操作系統(tǒng)下進(jìn)行,使用的R軟件是4.1.2版本.
為對(duì)預(yù)測(cè)效果進(jìn)行評(píng)估,采用百分比誤差絕對(duì)值的平均值和均方根誤差作為衡量指標(biāo),百分比誤差絕對(duì)值的平均值和均方根誤差的值越小代表預(yù)測(cè)精度越高.百分比誤差絕對(duì)值的平均值和均方根誤差的計(jì)算公式分別為
長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)由輸入層、LSTM層、全連接層和輸出層組成.LSTM層batchsize的值設(shè)置為20,使用的目標(biāo)優(yōu)化函數(shù)為均方誤差(MSE),使用的優(yōu)化器為亞當(dāng)優(yōu)化器(Adam).通過網(wǎng)格搜索法,神經(jīng)元個(gè)數(shù)在1~100之間,間隔為2地遞增,在模型的訓(xùn)練過程中不斷調(diào)整參數(shù)值,直到模型預(yù)測(cè)效果最佳,得到的LSTM-L模型和LSTM-S模型的設(shè)置參數(shù)見表1.
循環(huán)神經(jīng)網(wǎng)絡(luò)模型由輸入層、隱藏層和輸出層組成,本文中將用于預(yù)測(cè)長(zhǎng)期趨勢(shì)序列和預(yù)測(cè)短期波動(dòng)序列的循環(huán)神經(jīng)網(wǎng)絡(luò)分別稱為RNN-L模型和RNN-S模型.結(jié)合網(wǎng)格搜索法和處理時(shí)間序列的經(jīng)驗(yàn),得到RNN-L模型和RNN-S模型的設(shè)置參數(shù)(見表2).
表1 長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型參數(shù)
表2 循環(huán)神經(jīng)網(wǎng)絡(luò)模型參數(shù)
將長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)型、循環(huán)神經(jīng)網(wǎng)絡(luò)、HP濾波長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)混合模型(HP-LSTM混合模型)和HP濾波循環(huán)神經(jīng)網(wǎng)絡(luò)混合模型(HP-RNN混合模型)進(jìn)行比較分析,結(jié)果見表3.
表3 模型預(yù)測(cè)結(jié)果比較
由表3可以看出,數(shù)據(jù)經(jīng)過HP濾波處理之后,HP-LSTM混合模型相比單一長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型,上證指數(shù)數(shù)據(jù)的均方根誤差縮減了36.22%,百分比誤差絕對(duì)值的平均值縮減了10.45%;深證成指數(shù)據(jù)的均方根誤差縮減了53.15%,百分比誤差絕對(duì)值的平均值縮減了99.88%,可以認(rèn)為HP濾波對(duì)數(shù)據(jù)提前進(jìn)行預(yù)處理在長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型的股票預(yù)測(cè)精度提高上是有明顯正面效果的.而HP-RNN混合模型相比單一循環(huán)神經(jīng)網(wǎng)絡(luò)模型,上證指數(shù)數(shù)據(jù)的均方根誤差僅縮減了4.33%,百分比誤差絕對(duì)值的平均值還增長(zhǎng)了0.34%,深證成指的均方根誤差和百分比誤差絕對(duì)值的平均值分別增長(zhǎng)了104.72%,86.91%.因此,HP 濾波對(duì)長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度的提升要優(yōu)于循環(huán)神經(jīng)網(wǎng)絡(luò)模型.
同時(shí)還可以比較2個(gè)HP濾波的混合模型,在模型運(yùn)行過程中,循環(huán)神經(jīng)網(wǎng)絡(luò)模型運(yùn)行速度要比長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型慢得多(循環(huán)神經(jīng)網(wǎng)絡(luò)模型用時(shí)約5 h,長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型用時(shí)約1 min),且混合模型HP-RNN要對(duì)長(zhǎng)期趨勢(shì)序列和短期波動(dòng)序列都進(jìn)行循環(huán)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè),較比HP-LSTM 混合模型用時(shí)更長(zhǎng);而比較均方根誤差和百分比誤差絕對(duì)值的平均值來看,HP-RNN預(yù)測(cè)精度要比HP-LSTM預(yù)測(cè)精度要低,所以綜合來說,用HP-LSTM混合模型對(duì)股票進(jìn)行預(yù)測(cè)是要優(yōu)于HP-RNN混合模型的.
研究中選取上證指數(shù)和深證成指,使用長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、HP濾波長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)混合模型和HP濾波循環(huán)神經(jīng)網(wǎng)絡(luò)混合模型對(duì)股票數(shù)據(jù)進(jìn)行預(yù)測(cè).研究表明,通過先用HP濾波處理數(shù)據(jù),相比循環(huán)神經(jīng)網(wǎng)絡(luò)模型能更好提高長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果,提高了長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型的精確度.另外,本研究雖然比較了加入HP濾波之后的長(zhǎng)短期人工神經(jīng)網(wǎng)絡(luò)模型和循環(huán)神經(jīng)網(wǎng)絡(luò)模型,但是沒有比較其他的神經(jīng)網(wǎng)絡(luò)模型,且本研究的研究數(shù)據(jù)是長(zhǎng)時(shí)間跨度,以后可以在此基礎(chǔ)上對(duì)不同時(shí)間跨度的股票數(shù)據(jù)進(jìn)行進(jìn)一步的研究.
[1]雒佳文.基于HP濾波和指數(shù)平滑法預(yù)測(cè)上證指數(shù)收盤價(jià)[J].時(shí)代金融,2016(21):159-160.
[2]王理同,薛騰騰,王惠敏,等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)的股指價(jià)格預(yù)測(cè)研究[J].浙江工業(yè)大學(xué)學(xué)報(bào),2019,47(2):186-191.
[3]楊青,王晨蔚.基于深度學(xué)習(xí)LSTM神經(jīng)網(wǎng)絡(luò)的全球股票指數(shù)預(yù)測(cè)研究[J].統(tǒng)計(jì)研究,2019,36(3):65-77.
[4]彭兆祺,孫超.基于HP濾波分析方法的我國(guó)經(jīng)濟(jì)增長(zhǎng)研究[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2011,33(增刊1):15-17.
[5]魏媛.基于HP濾波和Garch模型的股票價(jià)格波動(dòng)研究[J].商,2016(27):211.
[6]楊麗,吳雨茜,王俊麗,等.循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)應(yīng)用,2018,38(增刊2):1-6,26.
[7]丁文絹.基于股票預(yù)測(cè)的ARIMA模型、LSTM模型比較[J].工業(yè)控制計(jì)算機(jī),2021,34(7):109-112,116.
[8]劉翀,杜軍平.一種基于深度LSTM和注意力機(jī)制的金融數(shù)據(jù)預(yù)測(cè)方法[J].計(jì)算機(jī)科學(xué),2020(12):125-130.
[9]李麗萍,曾麗芳,江紹萍,等.基于LSTM神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)[J].云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2022(12):1-10.
[10]姚遠(yuǎn),張朝陽.基于HP-LSTM模型的股指價(jià)格預(yù)測(cè)方法[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(24):296-304.
Neural network model prediction of long-term stock prices based on HP filter
ZHENG Aiyu,SUN Deshan
(School of Mathematics,Liaoning Normal University,Dalian 116029,China)
Using the Shanghai composite index and Shenzhen composite index stock data as research objects,the long-term stock prices is predicted.Long and short term neural network,recurrent neural network,HP filtered long and short term neural network hybrid models and HP filtered recurrent neural network hybrid models are selected for comparative analysis.Through comparative analysis between models,it is found that HP filtering has better optimization effects on the long and short term neural network models than recurrent neural network models.
long and short term neural network model;recurrent neural network model;stock preparation;HP filter
1007-9831(2023)10-0036-05
TP391
A
10.3969/j.issn.1007-9831.2023.10.007
2023-02-10
遼寧省教育廳項(xiàng)目資助(LJKMZ20221424)
鄭愛宇(1998-),女,遼寧丹東人,在讀碩士研究生,從事統(tǒng)計(jì)機(jī)器學(xué)習(xí)研究.E-mail:1105125887@qq.com