徐幼恩,羅 揚(yáng)
(南華大學(xué) 計(jì)算機(jī)學(xué)院,湖南 衡陽 421001)
隨著互聯(lián)網(wǎng)在金融行業(yè)中的不斷發(fā)展,股票市場產(chǎn)生了海量的網(wǎng)絡(luò)數(shù)據(jù),且由于股市容易受到多種因素的影響,人們很難從這些存儲(chǔ)的海量數(shù)據(jù)中得出準(zhǔn)確而有效的結(jié)論[1]。對股票市場進(jìn)行科學(xué)有效的“智能”預(yù)測,對于交易監(jiān)管機(jī)構(gòu)來說,能為他們對金融市場的把控提供更多基本信息,對于投資者來說,能為他們進(jìn)行長線投資和規(guī)避股市風(fēng)險(xiǎn)提供重要依據(jù)[2]。
在已有的股票預(yù)測研究中,多數(shù)研究者只采用一個(gè)固定的模型進(jìn)行預(yù)測分析。但對于非線性且存在復(fù)雜噪聲的股票價(jià)格數(shù)據(jù),一個(gè)固定模型只能捕捉到其中某一方面的信息,而忽略了其他關(guān)鍵信息,致使單一模型無法取得較好的預(yù)測結(jié)果[3]。組合預(yù)測模型是近年逐漸開始應(yīng)用到股票預(yù)測中的,學(xué)者們運(yùn)用各種組合模型預(yù)測方法,發(fā)現(xiàn)組合預(yù)測模型可以充分利用數(shù)據(jù)樣本的特征信息,與單一模型相比能夠更加綜合、準(zhǔn)確地反映股市運(yùn)行規(guī)律[4]。因此,匯總分類這些組合預(yù)測方法對進(jìn)一步的研究具有積極意義。
在實(shí)際的股票預(yù)測研究中少不了對歷史數(shù)據(jù)的分析。為了提高分析的準(zhǔn)確性,人們利用固定的數(shù)學(xué)公式設(shè)計(jì)了許多創(chuàng)造性的輔助走勢指標(biāo)。技術(shù)指標(biāo)就是指通過不同的數(shù)學(xué)公式對原始交易數(shù)據(jù)(開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)、成交量、成交額等)進(jìn)行計(jì)算后的集合。將這些指標(biāo)的計(jì)算結(jié)果制成圖表可以直觀地反映股票市場不同方面的內(nèi)在信息,從而有利于判斷和預(yù)測股市的行情與趨勢。常用的一些技術(shù)指標(biāo)有平滑異同移動(dòng)平均線MACD、相對強(qiáng)弱數(shù)指標(biāo)RSI、能量潮指標(biāo)OBV、騰落指標(biāo)ADL、移動(dòng)平均線MA、趨向指標(biāo)DMI、隨機(jī)指標(biāo)KDJ、買賣氣勢強(qiáng)弱指標(biāo)OBOS、威廉指標(biāo)分析WR等。
現(xiàn)有大多數(shù)股價(jià)預(yù)測研究[5-7]在模型輸入指標(biāo)選擇及模型預(yù)測效果檢驗(yàn)方面均采用的是技術(shù)分析指標(biāo),而未考慮影響股價(jià)波動(dòng)因素還來自基本面分析指標(biāo)。研究影響股票價(jià)格的核心基本面指標(biāo)需要將企業(yè)外部和內(nèi)部環(huán)境相結(jié)合。通過閱讀發(fā)現(xiàn),基本面指標(biāo)主要分為宏觀因素分析指標(biāo)、行業(yè)因素分析指標(biāo)和公司因素分析指標(biāo)[8]。
宏觀因素分析指標(biāo)要求從宏觀角度考察企業(yè)面臨的外部環(huán)境,包括公司所處行業(yè)的經(jīng)濟(jì)政策、法律制度、發(fā)展?fàn)顩r等。行業(yè)因素一般包括上市公司所處行業(yè)在國民經(jīng)濟(jì)中的地位、上市公司本身在行業(yè)中所處的地位以及行業(yè)市盈率等。對上市公司自身因素的分析主要是指公司的財(cái)務(wù)分析。財(cái)務(wù)指標(biāo)是反映公司基本情況的常規(guī)指標(biāo),應(yīng)用最為廣泛,包括現(xiàn)金資產(chǎn)比率、營運(yùn)資產(chǎn)對凈資產(chǎn)比率、固定資產(chǎn)比率等在內(nèi)的46項(xiàng)指標(biāo)。
隨著社交媒體的逐漸興盛,許多投資者開始在網(wǎng)絡(luò)平臺(tái)發(fā)表和分享評論來交流個(gè)人經(jīng)驗(yàn),表達(dá)他們對股票市場的看法和見解。而近些年行為金融學(xué)的相關(guān)研究表明,這些海量的投資者評論里所代表的投資者情緒會(huì)干擾投資者的決策,從而推動(dòng)股市的波動(dòng)和價(jià)值變化[9]。眾多研究者認(rèn)為,基于機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)算法等挖掘出的情感分類結(jié)果對股票市場的影響在一定時(shí)間內(nèi)具有可靠性和穩(wěn)定性,可以作為股票預(yù)測時(shí)的參考指標(biāo)[10]。
目前,人們已經(jīng)研究了許多股價(jià)預(yù)測方法,在這些方法中,單一預(yù)測方法主要包括兩大類[11]:一類是傳統(tǒng)的統(tǒng)計(jì)學(xué)方法,這類方法主要基于成熟的數(shù)學(xué)模型對數(shù)據(jù)進(jìn)行預(yù)測研究,如自回歸積分移動(dòng)平均(ARIMA)模型、廣義自回歸條件異方差(GARCH)預(yù)測模型和馬爾可夫(Markov)模型。另一類是根據(jù)現(xiàn)代數(shù)學(xué)、生物學(xué)等學(xué)科發(fā)展而來的創(chuàng)新類預(yù)測模型,如灰色預(yù)測算法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等。每種方法都各有優(yōu)缺點(diǎn),下面將逐一進(jìn)行闡述。
2.1.1 ARIMA模型
ARIMA模型是對自回歸移動(dòng)平均模型(ARMA)的擴(kuò)展[12]。ARMA主要是應(yīng)用于平穩(wěn)的時(shí)序數(shù)據(jù),而金融領(lǐng)域的價(jià)格數(shù)據(jù)具有不平穩(wěn)性,因而提出了ARIMA模型。雖然使用ARIMA對股票數(shù)據(jù)進(jìn)行預(yù)測取得了良好的效果,但對于長期的預(yù)測并不理想,且此類方法無法很好地處理波動(dòng)性較大的股票數(shù)據(jù)。
2.1.2 GARCH模型
1982年,Engle[13]提出自回歸條件異方差(ARCH)模型用于解決某些序列的異方差性。1986年,Baillie等[14]在ARCH模型的基礎(chǔ)上加入了無窮期誤差項(xiàng),得到了使用條件更為寬松的GARCH模型。在解決持續(xù)性方差和數(shù)據(jù)拖尾的問題中應(yīng)用較多,但是由于該模型存在較大的滯后階數(shù),待測參數(shù)較多,導(dǎo)致最終的模型擬合效果不佳,同時(shí)也存在較大的預(yù)測誤差。
2.1.3 Markov模型
Markov模型是根據(jù)數(shù)據(jù)對象當(dāng)前時(shí)刻的狀態(tài)去預(yù)測該對象未來可能所處的某個(gè)狀態(tài)的一種預(yù)測方法。目前,Markov模型主要應(yīng)用于對股票價(jià)格和股市行情的預(yù)測。Markov模型在預(yù)測時(shí)不需要大量的歷史數(shù)據(jù),不用考慮數(shù)據(jù)之間的相互影響,只需要考慮數(shù)據(jù)當(dāng)前時(shí)刻的影響。隱馬爾可夫模型(HMM)是離散馬爾可夫模型的衍生模型[15],其模型的訓(xùn)練方法有易于陷入局部極值的缺點(diǎn),但HMM在金融行業(yè)的應(yīng)用過程中,模型也在不斷地改進(jìn)和完善。
傳統(tǒng)的預(yù)測方法通常都是通過線性模型來擬合股票價(jià)格的發(fā)展變化規(guī)律,但由于影響股票價(jià)格走勢的因素眾多,影響機(jī)理也很復(fù)雜,這使得傳統(tǒng)的預(yù)測方法在實(shí)際應(yīng)用中有很大的局限性。特別是在樣本數(shù)較少且分布不規(guī)則時(shí),預(yù)測偏差會(huì)增大,預(yù)測能力也會(huì)下降。
股票市場是一個(gè)復(fù)雜多變的非線性系統(tǒng),其運(yùn)行趨勢有較強(qiáng)的不確定性。此外,它也會(huì)受到市場環(huán)境、企業(yè)運(yùn)營情況以及市場心理等諸多因素的影響。盡管這些因素給股票預(yù)測帶來了巨大的困難,但同時(shí)也激勵(lì)了一批學(xué)者在股票預(yù)測工作中做出了開創(chuàng)性的研究成果。受各種新型領(lǐng)域的啟發(fā),不少學(xué)者將隨機(jī)森林、支持向量機(jī)、灰色理論、神經(jīng)網(wǎng)絡(luò)等模型應(yīng)用于股票預(yù)測。
2.2.1 隨機(jī)森林
Breiman[16]在2001年提出了隨機(jī)森林(RF),又稱隨機(jī)決策森林,是可用于建立分類和回歸問題的預(yù)測模型。該模型采用抽樣后又放回的策略,使用有限的樣本重復(fù)抽樣,創(chuàng)建一個(gè)由n棵隨機(jī)不相關(guān)的決策樹組成的森林。RF不僅繼承了決策樹簡單、易于實(shí)現(xiàn)、運(yùn)算速度快、內(nèi)部原理清晰等優(yōu)點(diǎn),同時(shí)能夠較好地克服數(shù)據(jù)噪聲的影響且在處理規(guī)模較大的數(shù)據(jù)時(shí)可以解決過度擬合問題,但RF的缺點(diǎn)在于對部分特征不敏感。
2.2.2 支持向量機(jī)
支持向量機(jī)(SVM)是由Cortes和Vapnik[17]于1995年提出的一種新型的學(xué)習(xí)模型。利用SVM進(jìn)行股價(jià)預(yù)測的基本思想是將低維特征空間的非線性回歸問題轉(zhuǎn)化為高維特征空間線性回歸問題來解決。SVM也是一個(gè)分類器,可用于預(yù)測股價(jià)漲跌。將所要訓(xùn)練的樣例都標(biāo)記為上漲和下跌兩個(gè)類別,通過SVM模型來預(yù)測新樣例所屬類別。SVM能夠很好地解決小樣本、非線性和高維數(shù)問題,具有較好的泛化能力,但SVM模型的預(yù)測結(jié)果對核函數(shù)非常敏感。
2.2.3 灰色預(yù)測
灰色系統(tǒng)理論于1982年被提出,經(jīng)過多年的研究與發(fā)展,已逐步應(yīng)用于各個(gè)領(lǐng)域。其中灰色模型(GM)是通過對原始隨機(jī)序列進(jìn)行處理來削弱其隨機(jī)性,從而降低建模難度,再利用指數(shù)方程對新序列進(jìn)行預(yù)測。其最大的優(yōu)點(diǎn)是只需要少量的樣本數(shù)據(jù),但它更適合于預(yù)測具有一定特征的數(shù)據(jù)。對于股票價(jià)格這種具有極大的波動(dòng)性和隨機(jī)性的數(shù)據(jù),利用灰色模型不能實(shí)現(xiàn)理想的預(yù)測效果。而且,模型本身也有需要改善的地方。
2.2.4 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)(ANN)是對人腦神經(jīng)元網(wǎng)絡(luò)的抽象設(shè)計(jì),由大量的神經(jīng)元節(jié)點(diǎn)相互連接構(gòu)成,不同的連接方式組成了不同的網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是一種比傳統(tǒng)線性模型表達(dá)能力更強(qiáng)的非線性處理模型,具備強(qiáng)大的非線性泛化能力和學(xué)習(xí)能力,同時(shí)還具有良好的自適應(yīng)性和容錯(cuò)性,從而被眾多研究者們成功運(yùn)用到股票預(yù)測之中。
2.2.4.1 反向傳播神經(jīng)網(wǎng)絡(luò)
在股市的應(yīng)用中,反向傳播(BP)神經(jīng)網(wǎng)絡(luò)常被用于股票價(jià)格預(yù)測。BP神經(jīng)網(wǎng)絡(luò)由輸入層、輸出層和隱藏層3部分構(gòu)成。BP網(wǎng)絡(luò)的學(xué)習(xí)和訓(xùn)練過程是在輸入結(jié)點(diǎn)前向傳播和誤差反向傳播兩個(gè)過程中不斷循環(huán),直到誤差或者學(xué)習(xí)次數(shù)達(dá)到要求為止。有研究表明,采用BP算法的神經(jīng)網(wǎng)絡(luò)可以在較少的迭代次數(shù)下提高精度[18],但BP神經(jīng)網(wǎng)絡(luò)極易陷入局部極小值,導(dǎo)致模型的預(yù)測效果變差。另外,BP神經(jīng)網(wǎng)絡(luò)算法還存在收斂速度慢、訓(xùn)練時(shí)間長的缺點(diǎn)。
2.2.4.2 卷積神經(jīng)網(wǎng)絡(luò)
近年來,卷積神經(jīng)網(wǎng)絡(luò)(CNN)開始被應(yīng)用于金融領(lǐng)域的預(yù)測研究之中。CNN一般包含卷積層和池化層,其稀疏的網(wǎng)絡(luò)連接方式降低了反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性。也是這種特殊的神經(jīng)元連接方式使得CNN在輸入相同的學(xué)習(xí)過程中只需要存儲(chǔ)少量的關(guān)鍵性參數(shù),就可以提取到關(guān)鍵特征,不僅降低了模型的復(fù)雜度還減少了過擬合問題的出現(xiàn)。
2.2.4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的預(yù)測原理與BP神經(jīng)網(wǎng)絡(luò)相同,正向傳播輸出預(yù)測結(jié)果,反向傳播優(yōu)化參數(shù)。RNN每一時(shí)刻的輸出都與歷史的輸入相關(guān)聯(lián),所以在時(shí)序數(shù)據(jù)預(yù)測中,RNN能夠發(fā)揮其短期記憶的優(yōu)勢對數(shù)據(jù)未來變化作出預(yù)測。然而,RNN在訓(xùn)練過程中容易出現(xiàn)梯度消失的問題,隨著時(shí)間的發(fā)展會(huì)丟失之前的狀態(tài)信息,在處理長期時(shí)序問題時(shí)往往效果不佳。
2.2.4.4 長短期記憶神經(jīng)網(wǎng)絡(luò)
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)實(shí)際是RNN模型的一種變體,由輸入門、遺忘門、輸出門和記憶細(xì)胞構(gòu)成。這種特殊的門結(jié)構(gòu)和記憶單元可以保存輸入網(wǎng)絡(luò)之前的狀態(tài)信息,使LSTM學(xué)習(xí)到長期的有效信息,解決梯度消失和梯度爆炸問題。LSTM也不需要人工去挑選特征,如技術(shù)指標(biāo)。LSTM雖然在處理時(shí)序數(shù)據(jù)中表現(xiàn)突出,但在股票預(yù)測中還存在一些缺陷,比如容易陷入局部最優(yōu)解,可能存在數(shù)據(jù)冗余問題以及預(yù)測存在滯后性等
20世紀(jì)60年代末,Bates和Granger系統(tǒng)地研究了單一預(yù)測模型的不同組合,這也是首次有了組合預(yù)測的新思想新思路。組合預(yù)測方法的核心原理是先用不同的單一模型對研究對象進(jìn)行預(yù)測,然后通過合適的方式對各個(gè)單一模型進(jìn)行恰當(dāng)?shù)慕M合,綜合利用各種預(yù)測模型所提供的信息,最后再采用組合模型預(yù)測最終結(jié)果,盡可能地提高預(yù)測精度[19]。一般的組合形式是將線性模型和非線性模型進(jìn)行組合,但也有不少研究者選擇線性模型之間的組合形式和非線性模型之間的組合形式。大量的實(shí)證分析表明,只要選擇合適的組合模型,所得到的預(yù)測結(jié)果都要優(yōu)于單一模型。
由于線性模型在處理非線性時(shí)序數(shù)據(jù)時(shí)的局限性,目前,單純采用統(tǒng)計(jì)模型進(jìn)行股票數(shù)據(jù)分析的研究越來越少。隨著組合預(yù)測方法的發(fā)展,研究者們嘗試將不同的線性模型的優(yōu)勢結(jié)合起來建立組合模型,來彌補(bǔ)單一模型的不足。許多研究結(jié)果證實(shí),組合線性模型在實(shí)際應(yīng)用中的預(yù)測誤差更低,結(jié)果更優(yōu),能夠?yàn)橥顿Y者提供更好的參考。
閆冬[20]先利用ARMA模型對經(jīng)過處理的平穩(wěn)的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測,再利用GARCH模型處理ARMA模型的自回歸條件異方差,得到兩者優(yōu)勢組合的模型,研究表明,ARMA-GARCH組合模型的預(yù)測精度更高,能夠?qū)ι献C指數(shù)作出有效的短期預(yù)測。楊琦等[21]將ARMA模型和GARCH模型的參數(shù)進(jìn)行聯(lián)合估計(jì),構(gòu)建了ARMA-GARCH組合模型來預(yù)測大眾公用股票的未來價(jià)格,最后實(shí)證分析結(jié)果表明組合模型的預(yù)測更符合實(shí)際。李雄英等[22]分別建立ARMA模型、GARCH模型以及ARMA-GARCH組合模型來預(yù)測四大銀行的股票收益率,與兩個(gè)單一模型相比,ARMA-GARCH模型擬合效果更理想,預(yù)測能力更強(qiáng)。于雅凝等[23]先擬合ARMA模型來估計(jì)ARIMA模型的參數(shù),再進(jìn)行異方差模型擬合來構(gòu)建ARIMA-GARCH模型,最后通過模型預(yù)測圖證明了組合模型對數(shù)據(jù)進(jìn)行短期預(yù)測的準(zhǔn)確性。許舒雅等[24]通過實(shí)證研究,證明了ARIMA-GARCH組合模型能更好地?cái)M合和預(yù)測股價(jià),可以應(yīng)用于股票價(jià)格預(yù)測。
在預(yù)測股票數(shù)據(jù)問題的過程中,非線性模型往往能更好地發(fā)揮作用。隨著對組合預(yù)測模型的深入研究,學(xué)者們?yōu)榱丝朔我荒P蛯τ趶?fù)雜數(shù)據(jù)擬合能力的不足,開始不懈地探求利用組合的方式綜合各個(gè)非線性單一模型的不同信息和長處來建立一個(gè)更穩(wěn)定更快的模型。
3.2.1 基于神經(jīng)網(wǎng)絡(luò)模型之間的組合應(yīng)用
孫存浩等[25]利用BP神經(jīng)網(wǎng)絡(luò)將輸入數(shù)據(jù)進(jìn)行特征重組輸出到LSTM神經(jīng)網(wǎng)絡(luò),研究結(jié)果表明,BP-LSTM組合模型對股票指數(shù)漲跌情況的預(yù)測準(zhǔn)確率比傳統(tǒng)機(jī)器學(xué)習(xí)模型、單一LSTM模型都要高。Lu等[26]利用CNN能夠從數(shù)據(jù)中提取到有效特征和LSTM能夠?qū)W習(xí)到長期依賴的優(yōu)點(diǎn),提出了基于CNN-LSTM的組合預(yù)測模型,用于股票次日收盤價(jià)的預(yù)測。且該研究表明,與多層感知器(MLP)、CNN、RNN、LSTM和CNN-RNN相比,CNN-LSTM的預(yù)測精度最高,性能最好。耿晶晶等[27]選取上證50、上證180、滬深300指數(shù)的股票價(jià)格數(shù)據(jù)作為研究對象,驗(yàn)證了CNN-LSTM模型在股票指數(shù)預(yù)測中的有效性和普適性。
3.2.2 基于灰色模型與神經(jīng)網(wǎng)絡(luò)模型的組合應(yīng)用
楊德志[28]考慮到中國股票的非線性和灰色性,將灰色模型和神經(jīng)網(wǎng)絡(luò)的優(yōu)勢相結(jié)合來構(gòu)建組合模型,在很大程度上提高了股票預(yù)測的穩(wěn)定性和可靠性。張秋明等[29]先采用灰色GM(1,1)預(yù)測模型動(dòng)態(tài)預(yù)測股價(jià)變化總趨勢,再利用神經(jīng)網(wǎng)絡(luò)對灰色預(yù)測模型的殘差進(jìn)行修正。最后證明了組合預(yù)測模型能夠更好地反映出股價(jià)的變化規(guī)律,從而提高了對股價(jià)的預(yù)測精度。周琴等[30]將灰色模型預(yù)測值輸入神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,建立灰色神經(jīng)網(wǎng)絡(luò)模型,通過對比實(shí)驗(yàn)證明,灰色神經(jīng)網(wǎng)絡(luò)的預(yù)測精度明顯高于單一的BP神經(jīng)網(wǎng)絡(luò)和灰色模型。曹雷欣等[31]利用多變量的灰色GM模型實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)對股票收益率的預(yù)測效果的優(yōu)化,取得了較好的成果,并驗(yàn)證了灰色神經(jīng)網(wǎng)絡(luò)組合模型的各項(xiàng)預(yù)測指標(biāo)都要優(yōu)于灰色GM模型。
3.2.3 基于機(jī)器學(xué)習(xí)模型之間的組合應(yīng)用
胡銳[32]分別構(gòu)建支持向量機(jī)模型、人工神經(jīng)網(wǎng)絡(luò)模型、隨機(jī)森林模型以及三者的組合模型,預(yù)測中國A股股票未來3天漲跌的方向,結(jié)果顯示基于SVM-ANN-RF組合模型的表現(xiàn)優(yōu)于任何一個(gè)單一模型,體現(xiàn)了組合模型的優(yōu)勢。Cao等[33]利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測金融市場的未來發(fā)展趨勢,建立了CNN-SVM組合模型,有效地改進(jìn)了單一算法的局限性,在處理連續(xù)和分類預(yù)測變量時(shí)獲得了良好的預(yù)測結(jié)果。Song 等[34]提出了一種結(jié)合LSTM和無監(jiān)督學(xué)習(xí)算法的模式驅(qū)動(dòng)混合模型,用于股票價(jià)格的精確預(yù)測。然后利用韓國股指數(shù)據(jù)對混合模型的性能進(jìn)行了評估。其結(jié)果表明,該模型優(yōu)于傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和LSTM模型。李輝等[35]提出了RF-LSTM組合模型來預(yù)測股票的收盤價(jià)格,先利用隨機(jī)森林選擇最優(yōu)的技術(shù)指標(biāo)集合,再將提取的最優(yōu)特征集輸入LSTM對股票價(jià)格的總體趨勢進(jìn)行預(yù)測。結(jié)果表明,RF-LSTM模型可提高單一LSTM模型在股票價(jià)格預(yù)測上的準(zhǔn)確性。
股票價(jià)格數(shù)據(jù)既具有線性特征,又具有一定的非線性特征,采用單一的線性模型或非線性模型,都只能解釋股票價(jià)格中的部分變化規(guī)律。為進(jìn)一步提高預(yù)測的精度,降低風(fēng)險(xiǎn),建立一個(gè)綜合考慮股票價(jià)格包含線性與非線性模型的組合預(yù)測模型,能夠盡可能地挖掘數(shù)據(jù)的有效信息,從而盡量避免數(shù)據(jù)的損失和降低誤差。
3.3.1 基于支持向量機(jī)與傳統(tǒng)統(tǒng)計(jì)模型的組合應(yīng)用
Pai等[36]利用ARIMA模型和SVM模型在股票價(jià)格預(yù)測問題中的獨(dú)特優(yōu)勢,提出了ARIMA-SVM組合模型,并使用股票價(jià)格的真實(shí)數(shù)據(jù)集驗(yàn)證了該組合模型大大提高了單一的ARIMA模型和SVM模型在股價(jià)預(yù)測應(yīng)用中的預(yù)測性能。鄧軍[37]將股票基本面指標(biāo)、GARCH模型結(jié)果,以及投資者情緒指標(biāo)與SVM相結(jié)合分三步預(yù)測股價(jià)波動(dòng)。仿真結(jié)果顯示,與僅利用基本面指標(biāo)的SVM比較,GARCH模型和時(shí)間序列分析的加入使SVM更適合對股價(jià)漲跌進(jìn)行預(yù)測。張璇[38]使用HMM模型對滬深300指數(shù)的預(yù)測因子進(jìn)行重要性排序,再利用重要預(yù)測因子進(jìn)行支持向量機(jī)回歸預(yù)測,最終兩模型結(jié)合得到的結(jié)果要優(yōu)于直接使用開盤價(jià)、最高價(jià)、最低價(jià)進(jìn)行預(yù)測的結(jié)果。尤睿凡[39]首先利用ARIMA模型提取數(shù)據(jù)線性部分,再用改進(jìn)的SVM回歸算法處理非線性部分,并將其預(yù)測效果與單一的ARIMA模型、改進(jìn)的SVM回歸模型以及現(xiàn)有的ARMA-GARCH模型進(jìn)行比較,實(shí)證結(jié)果顯示ARIMA-SVM組合模型的預(yù)測精度高于兩種單一的模型,也略高于ARMA-GARCH組合模型。
3.3.2 基于神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)統(tǒng)計(jì)模型的組合應(yīng)用
Hassan等[40-41]將HMM、ANN和遺傳算法(GA)相結(jié)合,提出并實(shí)現(xiàn)了一個(gè)預(yù)測金融市場行為的組合模型。其結(jié)果表明,組合模型的預(yù)測性能優(yōu)于單一HMM模型,且該組合模型可以直接使用數(shù)據(jù)集而無需在預(yù)測之前分析數(shù)據(jù)集。史書真[42]利用ARMA模型在處理線性問題上具有優(yōu)勢和BP神經(jīng)網(wǎng)絡(luò)在非線性序列的預(yù)測問題上具有優(yōu)勢,構(gòu)建了ARMA-BP組合模型,又利用Markov模型對組合模型的預(yù)測結(jié)果進(jìn)行改進(jìn),提出了ARMA-BP-Markov組合模型,并通過實(shí)證分析得出,ARMA-BP-Markov組合模型的預(yù)測精度比單一的ARMA模型、BP神經(jīng)網(wǎng)絡(luò)以及ARMA-BP組合模型都要高。王衍茹[43]選取中國人壽的股票日收盤價(jià)作為研究對象,構(gòu)建了ARIMA、GARCH和BP神經(jīng)網(wǎng)絡(luò)的組合模型,且對3種單一模型進(jìn)行擬合與預(yù)測,最后得出組合模型的擬合預(yù)測效果比單一模型要稍好一些的結(jié)論。
3.3.3 基于灰色模型與傳統(tǒng)統(tǒng)計(jì)模型的組合應(yīng)用
吳朝陽[44]在GM-ARMA簡單組合模型的基礎(chǔ)上,改進(jìn)了GM(1,1)模型不是最優(yōu)以及兩模型的結(jié)合點(diǎn)不是最優(yōu)這兩個(gè)缺點(diǎn),提出了Revised GM-ARMA(RGA-ARMA)模型,并通過實(shí)例證明新模型誤差更小,結(jié)果更優(yōu)。胡岸[45]采用灰色模型來彌補(bǔ)馬爾可夫模型預(yù)測的局限,提出了灰色馬爾可夫鏈組合預(yù)測模型,實(shí)驗(yàn)結(jié)果證明組合模型無論從精度還是準(zhǔn)確度上都更好。曹曉等[46]以上證000001平安銀行股票價(jià)格數(shù)據(jù)為研究對象,利用BP神經(jīng)網(wǎng)絡(luò)改進(jìn)灰色GARCH模型的預(yù)測結(jié)果,并將灰色GARCH-BP組合模型與灰色GARCH模型以及3個(gè)單一模型的預(yù)測結(jié)果進(jìn)行比較得出,組合模型明顯提高了股價(jià)預(yù)測精度,能為研究者和投資者進(jìn)行股票價(jià)格預(yù)測提供新的參考。李曉彤[47]將基于小波分析的改進(jìn)灰色模型與ARMA-GARCH模型進(jìn)行組合,對具有不同波動(dòng)特征的兩組序列的股價(jià)進(jìn)行預(yù)測分析。結(jié)果表明,無論是對于波動(dòng)大還是波動(dòng)小的序列,該組合模型都比單一模型具有更好的預(yù)測精度,在預(yù)測股價(jià)時(shí)都是有效且可行的。
由于股票市場價(jià)格受諸多因素共同影響,呈現(xiàn)出不規(guī)則的變化趨勢。幾乎沒有一個(gè)模型能全面考慮到股票市場的所有影響因子,也不可能將所有影響因子都展現(xiàn)在模型中,單一的預(yù)測模型更是難以達(dá)到股票預(yù)測的要求。一般來說,組合模型相比于單一模型可以更加系統(tǒng)和全面地整合來自樣本數(shù)據(jù)的信息,從而改善模型的擬合優(yōu)度,同時(shí)減小隨機(jī)因子的影響?;谶@一優(yōu)勢,在任意一種預(yù)測情形下,采用組合的預(yù)測形式都是值得去嘗試的。單一模型擬合方法的改進(jìn)越來越多,組合預(yù)測這種新的預(yù)測方法也會(huì)隨之不斷完善,在實(shí)際運(yùn)用中也將會(huì)帶來不可估量的優(yōu)越性與有效性。