朱文強
摘要:技術創(chuàng)新在金融行業(yè)扮演著越來越重要的地位,尤其是機器學習算法與深度學習算法的創(chuàng)新,相較于傳統(tǒng)計量經濟模型對于金融市場風險、收益波動的預測效果,憑借互聯(lián)網(wǎng)大數(shù)據(jù),更多機構或個人通過機器學習來擬合金融市場,加強投資策略。這種具備大數(shù)據(jù)、互聯(lián)網(wǎng)以及量化投資特征的研究將會成為金融行業(yè)的一大研究熱點,而本文則依據(jù)國內外學者對金融領域與深度學習的交叉研究開展綜述。
關鍵詞:深度學習;量化投資;文獻綜述
1. 深度學習的發(fā)展前景
隨著科技發(fā)展,智能算法逐漸成為各個研究領域較為火熱的研究方法,尤其是針對于深度學習技術的優(yōu)勢,其在計算機視覺領域和自然語言處理領域的飛速發(fā)展。深度學習是在基于神經網(wǎng)絡基礎上更加強大的一種智能算法,神經網(wǎng)絡是一種非常強大的非參數(shù)化工具,被廣泛應用于信號處理、模式識別等諸多領域,可以有效處理模型參數(shù)之間的非線性關系。與其他計量經濟學方法相比,它不需定義模型的方程形式,也無需假設變量之間的函數(shù)關系。因此,與傳統(tǒng)的諸如ARIMA、GARCH、OLS、VAR模型等參數(shù)計量經濟模型相比,其具有(1)對非線性數(shù)據(jù)的擬合能力強于線性擬合;(2)由于沒有標準的函數(shù)方程約束,其更加適應動態(tài)變化的金融市場,即對于金融時間序列數(shù)據(jù)的預測也存在顯著效果;(3)其是一種以數(shù)據(jù)驅動的而非參數(shù)驅動的弱計量模型,從而相對于傳統(tǒng)的計量經濟模型來說,更容易避免模型設定產生的誤差??偟膩碚f,以神經網(wǎng)絡為基礎的模型在理論上依然產生了處理金融時間序列數(shù)據(jù)方面更加強大的優(yōu)勢。而在實際應用方面,Hill et al.(1996)探究了神經網(wǎng)絡與Box-Jenkins ARIMA模型、季節(jié)性指數(shù)平滑等六種統(tǒng)計模型對時間序列數(shù)據(jù)的預測效果,實證結果發(fā)現(xiàn)神經網(wǎng)絡的預測效果優(yōu)于傳統(tǒng)的統(tǒng)計模型,且證實神經網(wǎng)絡特別適用于不連續(xù)時間序列數(shù)據(jù)的預測。繼而在兩年之后,Zhang和Hu(1998)也獲得了相同的結論。
而深度學習作為以神經網(wǎng)絡為基礎的一種更加強大的智能算法,相對于神經網(wǎng)絡這樣淺層的機器學習算法,其具有能夠處理復雜高維數(shù)據(jù)的能力,從而避免了維度災難和大數(shù)據(jù)等問題。深度學習實際上是多層神經網(wǎng)絡所構成的高層次神經網(wǎng)絡模型,通過疊加多個神經網(wǎng)絡,將輸入數(shù)據(jù)通過每一個神經層的抽象表達,產生相應的“學習”機能來學習輸入數(shù)據(jù)內部隱含的特征,借此提取有效信息來提高數(shù)據(jù)預測能力。因此深度學習就是通過高特征提取和高表征輸出兩大優(yōu)勢,提高了樣本內數(shù)據(jù)預測精度以及緩和過擬合問題,從而相對其他模型擁有更加強大的泛化能力。深度學習因其在金融時間序列過程中具有優(yōu)良的表現(xiàn)而得到越來越多學者的重視。在廣大研究者使用的多種研究方法中,深度學習具有完全圖靈測試機理,縝密的思維推導過程,其由數(shù)據(jù)驅動并且不基于任何假設的特點,因此被認為非常適合于處理這類數(shù)據(jù)。
2. 深度學習的發(fā)展及其應用研究
深度學習主要包含了循環(huán)神經網(wǎng)絡(RNN)、長短記憶神經網(wǎng)絡(LSTM)、卷積神經網(wǎng)絡(CNN)等。其中RNN是一種納入了序列相關性的神經網(wǎng)絡從而能夠處理金融時間序列數(shù)據(jù)。Rather et al.(2015)通過RNN與GARCH、AMRIA模型對比股票收益率的預測效果分析,實證結果表明RNN的預測效果更優(yōu)。然而,RNN結構因為存在梯度消失和梯度爆炸這兩個問題,從而對于處理具有長期關系的序列數(shù)據(jù)則相形見絀。而LSTM則在一定程度上緩和了序列數(shù)據(jù)的長期依賴關系,LSTM最成功的應用領域就是機器翻譯。文本翻譯與金融數(shù)據(jù)除了結構上的不同,實際上都是時間序列數(shù)據(jù),因此有許多學者將LSTM應用到股票價格波動率預測預測上來,進而相似地得出了LSTM的預測能力和穩(wěn)定性要明顯強于其他模型的結論。盡管LSTM在一定程度上能夠處理時序相關問題,但是其并不能完全消除梯度爆炸和梯度消失問題。而為了更好提取時序數(shù)據(jù)特征,避免長期信息丟失問題,許多學者做了在LSTM上做了一些改進?;贕oogle Deep Mind 團隊在2014年提出將注意力機制用在圖像分類任務中,驗證了注意力機制(Attention)在圖像處理領域的有效性,同時也使結合注意力機制的神經網(wǎng)絡成為研究的熱點。隨后,Bahdanau et al.(2014)將注意力機制和RNN結合解決機器翻譯任務,使注意力機制成功融入自然語言處理領域??紤]到Attention機制能夠更好地捕捉圖像、文本數(shù)據(jù)中的有效信息,則將其與LSTM相結合構建了A-LSTM來處理金融時序數(shù)據(jù)將是一個十分明顯的創(chuàng)新。此外,時間序列數(shù)據(jù)可以通過RNN、LSTM等方式捕捉有效時序信息,但是其空間局部相關性則被忽視,而CNN則可以通過限制隱藏單元的局部感知來提取局部特征。CNN結構廣泛被用于人臉識別技術,圖像處理領域。而近年來,CNN結構也在金融鄰域大放光彩。例如,趙紅蕊和薛雷(2020)在股票價格預測研究中將Attention機制引入LSTM和CNN模型中,驗證了在LSTM與CNN結合的網(wǎng)絡模型中加入Attention模塊的預測有效性和可行性。明顯可以看出,CNN結構的優(yōu)越性激發(fā)了許多學者在其鄰域的運用,例如熱電聯(lián)產供熱和貸款逾期等。
3.結束語
綜上所述,深度學習在各行業(yè)鄰域都有所滲透,尤其對于考慮到序列數(shù)據(jù)的要求,金融領域也就成了深度學習最理想的應用場所。RNN、LSTM、CNN等深度學習算法在各個方面都有其優(yōu)勢,甚至相互融合能夠產生更加卓越的效果。然而如何將基準算法相互混合能夠在金融市場產生更加優(yōu)異的效果以及如何創(chuàng)新地提出更加優(yōu)異的深度學習算法來更好地擬合金融數(shù)據(jù)的需求,即基于不同深度學習方法對金融市場進行擇時選股分析。
參考文獻:
[1]Hill T.,O'Connor M.,& Remus W. Neural network models for time series forecasts[J]. Management science,1996,42(7):1082-1092.
[2]Zhang G. & Hu M. Y. Neural network forecasting of the British pound/US dollar exchange rate[J]. Omega,1998,26(4):495-506.
[3]Rather A. M.,Agarwal A. & Sastry V. N. Recurrent neural network and a hybrid model for prediction of stock returns[J]. Expert Systems with Applications,2015,42(6):3234-3241.
[4]Bahdanau D,Cho K,Bengio Y. Neural machine translation by jointly learning to align and translate[J]. arXiv preprint arXiv:1409.0473,2014.
[5]趙紅蕊,薛雷.基于LSTM-CNN-CBAM模型的股票預測研究[J].計算機工程與應用,2021,57(03):203-207.