• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學(xué)習(xí)的配對(duì)交易策略

      2017-06-19 03:25葉映彤蔡熙騰李雅妮蔡向高
      關(guān)鍵詞:深度學(xué)習(xí)

      葉映彤+蔡熙騰+李雅妮+蔡向高

      摘 要:隨著我國(guó)金融創(chuàng)新的推進(jìn),量化交易逐漸在我國(guó)證券市場(chǎng)中發(fā)芽成長(zhǎng)。量化交易領(lǐng)域中傳統(tǒng)的配對(duì)交易策略,都假設(shè)股價(jià)之間滿足某種特定的關(guān)系,因而存在著局限性。運(yùn)用深度學(xué)習(xí)技術(shù),可以避免在配對(duì)交易中引入前提額外假設(shè),而是將挖掘規(guī)律的任務(wù)交給計(jì)算機(jī)來(lái)完成。使用棧式自動(dòng)編碼器代替?zhèn)鹘y(tǒng)方法,挖掘股票價(jià)格相關(guān)性中蘊(yùn)含的套利機(jī)會(huì),能形成一套新的、有著獨(dú)立邏輯的交易策略。實(shí)驗(yàn)表明,該策略在我國(guó)A股市場(chǎng)表現(xiàn)出穩(wěn)定的盈利能力,在根據(jù)近兩年A股市場(chǎng)數(shù)據(jù)的模擬測(cè)試中,日勝率為62.9%,信息比率為0.378。

      關(guān)鍵詞:量化交易 配對(duì)交易 深度學(xué)習(xí) 棧式自動(dòng)編碼器 A股市場(chǎng)

      中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)02(c)-0247-06

      Abstract:Quantitative trading strategy has emerged in recent years as quantitative trading gains more and more attention in China. Traditional trading strategies such as Pairs Trading Strategy always simplify the relation among assets price due to the difficulties inmodeling non-linear properties. This paper aims to seek an artificial intelligence approach based on Deep Learning technique for designing trading strategies. The widely used Auto-Encoder is a Multi-layer Neural Network which has shown its capability in modeling non-linear properties of complex data. In this paper, we propose an Auto-Encoder based approach for Pairs Trading Strategy. Experiment results demonstrate that the proposed strategy shows excellent performance in Chinese A-share stock market with Win-Rate which is 62.9% and Information Ratio which is 0.378.

      Key Words:Quantitative Trading;Pairs Trading;Deep Learning;AutoEncoder;A-share Market

      配對(duì)交易策略就是一種經(jīng)典的量化交易策略,其基本思想來(lái)源于20世紀(jì)20年代華爾街傳奇交易員Jesse Livermore的姐妹股票對(duì)(Sister stocks)交易策略。其關(guān)鍵點(diǎn)在于找到高度相關(guān)的股票對(duì)以及股票對(duì)的股價(jià)之間存在著的數(shù)量關(guān)系[1],這也是配對(duì)交易的難點(diǎn)所在。目前該領(lǐng)域主要有四種傳統(tǒng)方法,包括相關(guān)系數(shù)法、Vidyamurthy在2004年提出的協(xié)整法[2]、Elliott等在2005年提出的隨機(jī)價(jià)差法[3]、以及Gatev等在2006年提出的最小距離法[4]。但是這些方法都有一個(gè)共同的局限性,它們都寄希望于所有股票對(duì)的價(jià)差都滿足假定的模式。而事實(shí)上股票對(duì)之間的價(jià)格關(guān)系可能千變?nèi)f化,不能一概而論。這些方法尋找到的股票對(duì)很可能只是其中一個(gè)很小的子集。而且傳統(tǒng)方法常常只能用于尋找兩只股票之間的線性關(guān)系,對(duì)于多只股票之間的非線性關(guān)系往往無(wú)能為力。

      深度學(xué)習(xí)是一類新興的多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,因其緩解了傳統(tǒng)訓(xùn)練算法的局部最小性,引起機(jī)器學(xué)習(xí)領(lǐng)域的廣泛關(guān)注[5]。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示(屬性、類別或特征),以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示,實(shí)現(xiàn)對(duì)復(fù)雜的高維非線性函數(shù)的逼近。用深度學(xué)習(xí)技術(shù)替換配對(duì)交易策略中的傳統(tǒng)方法,來(lái)尋找高度相關(guān)的股票對(duì),以及股票對(duì)的股價(jià)之間存在著的數(shù)量關(guān)系,有利于挖掘更多復(fù)雜的、更隱蔽的非線性盈利機(jī)會(huì),也可以很容易地?cái)U(kuò)展到在大量的證券中尋找套利機(jī)會(huì)。

      該文擬用深度學(xué)習(xí)中的棧式自動(dòng)編碼器作為基本模型,參考配對(duì)交易策略中的基本思想,設(shè)計(jì)一種能夠自動(dòng)從股票相關(guān)性中挖掘套利機(jī)會(huì),并通過(guò)買(mǎi)入或賣(mài)的基本思想,設(shè)計(jì)一種能夠自動(dòng)從股票相關(guān)性中挖掘套利機(jī)會(huì),并通過(guò)買(mǎi)入或賣(mài)出股票實(shí)現(xiàn)盈利的量化交易策略。此外,該文還使用了基于歷史數(shù)據(jù)的測(cè)試來(lái)驗(yàn)證這種策略在實(shí)戰(zhàn)中的價(jià)值。

      1 基于深度學(xué)習(xí)的配對(duì)交易策略

      1.1 基本思想

      不同股票的價(jià)格直接具有很高的相關(guān)性,常常表現(xiàn)為同漲同跌。一般來(lái)說(shuō),可以將股票價(jià)格的變動(dòng)分為兩大部分,包括大盤(pán)趨勢(shì)帶來(lái)的變動(dòng)和個(gè)股自身的變動(dòng)。配對(duì)交易策略就是關(guān)注兩種相關(guān)性極高的股票,猜測(cè)兩只股票價(jià)格存在一定的數(shù)量關(guān)系,在兩只股票價(jià)格偏離該數(shù)量關(guān)系的時(shí)候,預(yù)期價(jià)格會(huì)恢復(fù)正常,所以選擇買(mǎi)入價(jià)格偏低的股票,賣(mài)出價(jià)格偏高的股票;如果之后兩只股票的價(jià)格確實(shí)恢復(fù)了原來(lái)的數(shù)量關(guān)系,那么就能實(shí)現(xiàn)盈利。

      基于深度學(xué)習(xí)的配對(duì)交易策略具體是指,選擇一只目標(biāo)股票,假設(shè)其股價(jià)序列為Y,而除了目標(biāo)股票以外的股票的股價(jià)序列為(X1,X2…Xn),如果找到一個(gè)函數(shù)h使得h(X1,X2…Xn)≈Y,那么可以將h(X1,X2…Xn)視作一只與目標(biāo)股票相關(guān)性極高(接近于1)的虛擬股票,或者說(shuō)找到了一個(gè)虛擬股票與目標(biāo)股票組成一個(gè)股票對(duì),他們之間存在h(X1,X2…Xn)≈Y的數(shù)量關(guān)系。套用配對(duì)交易策略就可以利用該股票對(duì)進(jìn)行套利。在這里,將通過(guò)深度學(xué)習(xí)用來(lái)學(xué)習(xí)合適的函數(shù)h,從而實(shí)現(xiàn)(X1,X2…Xn)與Y之后的映射關(guān)系。

      1.2 數(shù)據(jù)處理

      該文選取了在2004年11月1日前在中國(guó)大陸主板市場(chǎng)上市,并截至到2016年2月5日尚未退市的1 356只股票作為股票池,整理得到這些股票自2004年11月1日—2016年2月5日每個(gè)交易日的收盤(pán)價(jià)。其中2004年11月1日—2014年4月13日的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2014年4月14日—2016年2月5日的數(shù)據(jù)作為測(cè)試數(shù)據(jù)。

      該文將每100個(gè)交易日的數(shù)據(jù)作為一批,對(duì)每批數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,使得在同一批數(shù)據(jù)中,每只股票的價(jià)格均值為0,方差為1,并在模型的輸出端需要做一個(gè)反向處理。最后,從處理好的數(shù)據(jù)中抽出屬于目標(biāo)股票的數(shù)據(jù),作為Y,其余數(shù)據(jù)作為(X1,X2…Xn)。其中(X1,X2…Xn)是模型的輸入(Input),而Y是模型訓(xùn)練的目標(biāo)(Target)。

      1.3 模型建立與訓(xùn)練

      該文使用深度學(xué)習(xí)中的棧式自動(dòng)編碼器作為基本模型,使用了四層自動(dòng)編碼器進(jìn)行特征提取,然后用單層的神經(jīng)網(wǎng)絡(luò)作為最頂層的輸出端。

      對(duì)于第一層自動(dòng)編碼器,輸入為數(shù)據(jù)處理階段中代表(X1,X2…Xn)的數(shù)據(jù),通過(guò)向上的權(quán)重得到特征,通過(guò)向下的權(quán)重重新生成數(shù)據(jù)。其中輸入的節(jié)點(diǎn)數(shù)為1 355,對(duì)應(yīng)除目標(biāo)股票之外的1 355只股票;隱藏層的節(jié)點(diǎn)數(shù)為400,對(duì)應(yīng)特征的維度。

      對(duì)于第二到第四層的自動(dòng)編碼器,輸入為上一層編碼器學(xué)習(xí)到特征,并通過(guò)向上的權(quán)重得到更高層的特征,作為下一層編碼器的輸入。每一層輸入的節(jié)點(diǎn)數(shù)分別為400、120、35,而對(duì)應(yīng)的隱藏層節(jié)點(diǎn)數(shù)分別為120、35、10。

      對(duì)于每一層的編碼器,使用的激活函數(shù)都是tan?函數(shù)。如果向上的權(quán)重分別用W(1)、b(1)表示,向下的權(quán)重分別用W(2)、b(2)表示,原數(shù)據(jù)用X表示,新數(shù)據(jù)用X′表示,隱藏層用a表示,編碼的過(guò)程可以表示為:

      解碼過(guò)程可以表示為:

      整個(gè)自動(dòng)編碼器的訓(xùn)練目標(biāo)就是讓新數(shù)據(jù)與原數(shù)據(jù)差異盡可能小,使用的代價(jià)函數(shù)為:

      對(duì)于最頂層的單層神經(jīng)網(wǎng)絡(luò),輸入為第四編碼器學(xué)習(xí)到的特征,輸入節(jié)點(diǎn)數(shù)為10,輸出為Y′,即對(duì)于目標(biāo)股票價(jià)格Y的預(yù)測(cè),使用的激活函數(shù)依然是tan?函數(shù)。如果該層的權(quán)重分別用W、b表示,輸入用X表示,目標(biāo)股票的價(jià)格用Y表示,那么該層的輸入可以表示為:

      類似的,該層的代價(jià)函數(shù)為

      模型建立后需要進(jìn)行以下訓(xùn)練:使用梯度下降法自下而上逐層訓(xùn)練自動(dòng)編碼器;然后對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行微調(diào)(Fine-tuning),即將第一步得到的權(quán)重作為整個(gè)網(wǎng)絡(luò)的初始化權(quán)重,然后用反向傳播算法訓(xùn)練整個(gè)網(wǎng)絡(luò)。

      1.4 交易策略

      通過(guò)上文模型的建立和訓(xùn)練,我們得到了一個(gè)關(guān)于目標(biāo)股票Y的預(yù)測(cè)Y′。

      從傳統(tǒng)的配對(duì)交易中,一般會(huì)選擇賣(mài)出股票對(duì)中估值相對(duì)較高的,買(mǎi)入估值相對(duì)較低的,從而相對(duì)價(jià)值回歸均值的時(shí)候?qū)崿F(xiàn)盈利。但是該文的策略中存在一個(gè)問(wèn)題,由于自動(dòng)編碼器是非線性的,所以不存在一種方法可以從已有的其他股票中構(gòu)建出Y′,更無(wú)法買(mǎi)入或賣(mài)出Y′。因此這里需要采取折中的方法進(jìn)行交易。方法有很多,以下列舉其中三種。

      (1)當(dāng)Y與Y′的價(jià)格出現(xiàn)偏差的時(shí)候,若Y>Y′,則賣(mài)出目標(biāo)股票;反之則買(mǎi)入目標(biāo)股票。如果未來(lái)Y變動(dòng)直至Y=Y′,那么將會(huì)盈利,但如果Y′變動(dòng)更大,那么可能不能盈利,甚至虧損。由于不能賣(mài)出Y′從而鎖定利潤(rùn),事實(shí)上這種方法存在不小的風(fēng)險(xiǎn)。

      (2)當(dāng)Y′價(jià)格上漲的時(shí)候買(mǎi)入目標(biāo)股票,反之則賣(mài)出目標(biāo)股票。如果Y與Y′呈同方向的變動(dòng),未來(lái)可能就能獲得利潤(rùn)。

      (3)比較Y與Y′的漲幅變化,如果Y′的漲幅大于Y的漲幅,那么買(mǎi)入目標(biāo)股票;否則賣(mài)出目標(biāo)股票。由于每次只考慮漲幅的變化,如果模型存在累計(jì)的誤差,那么該方法可以避免之前累計(jì)的誤差會(huì)持續(xù)影響之后的交易。

      此外,前文提到的都是針對(duì)一只目標(biāo)股票的策略。執(zhí)行針對(duì)一只股票的交易策略時(shí),在買(mǎi)入之后需要等待股票價(jià)格恢復(fù)到原來(lái)的關(guān)系。在等待的過(guò)程中可能會(huì)有暫時(shí)性的虧損。在實(shí)際操作中,需要針對(duì)每一只股票構(gòu)建棧式自動(dòng)編碼器,并獨(dú)立地執(zhí)行交易策略。由于不同股票價(jià)格恢復(fù)的周期不一致,可能部分股票處于盈利狀態(tài),少量股票處于虧損狀態(tài),互相抵消之后,能使得加總的收益更加穩(wěn)定。

      2 實(shí)證研究

      在該文的測(cè)試過(guò)程中,所有測(cè)試都是針對(duì)前文數(shù)據(jù)處理后的測(cè)試數(shù)據(jù),并使用日勝率(Win-Rate)、信息比率(Information Ratio)等指標(biāo)來(lái)評(píng)價(jià)策略的表現(xiàn)。

      2.1 預(yù)測(cè)能力

      策略有效的第一個(gè)關(guān)鍵點(diǎn)在于Y與預(yù)測(cè)得到的Y′是否呈現(xiàn)類似的變動(dòng)趨勢(shì),是否存在比較穩(wěn)定的數(shù)量關(guān)系。這里抽取了浦發(fā)銀行(600000)、寶鋼股份(600019)、深康佳A(000016)、深圳機(jī)場(chǎng)(000089)四只股票的預(yù)測(cè)結(jié)果,繪制成圖像(見(jiàn)圖1~圖4)。其中虛線均代表預(yù)測(cè)得到的Y′,而實(shí)線均代表原始的Y。

      可以看出,浦發(fā)銀行、寶鋼股份預(yù)測(cè)的結(jié)果是非常好的。深圳機(jī)場(chǎng)的預(yù)測(cè)結(jié)果雖然中間一段時(shí)間出現(xiàn)比較大的偏離,但最終還是恢復(fù)一致了。但深康佳A的預(yù)測(cè)結(jié)果在后半段兩條曲線的偏離非常大,這一定程度是由于深康佳A在中間一段出現(xiàn)了停牌,而停牌過(guò)后又遭受極端的下跌,在這種情況下應(yīng)該謹(jǐn)慎使用該模型。

      總體而言,模型在絕大部分的情況下表現(xiàn)出了很高的預(yù)測(cè)能力,預(yù)測(cè)得到的Y′和原始的Y有著很高的相關(guān)性。表1是前面提及的四只股票P(pán)earson相關(guān)性檢驗(yàn)的結(jié)果。雖然深康佳A相對(duì)而言相關(guān)系數(shù)明顯要低一些,不過(guò)所有股票的檢驗(yàn)都通過(guò)了相關(guān)性檢驗(yàn),而且相關(guān)系數(shù)都比較接近于1,符合策略的要求。

      2.2 單個(gè)策略收益

      前文提到有3種可以考慮的交易策略,下面逐一用其對(duì)浦發(fā)銀行、寶鋼股份深康佳行、寶鋼股份深康佳行、寶鋼股份深康佳A、深圳機(jī)場(chǎng)四只股票進(jìn)行測(cè)試,并計(jì)算它們各自的信息比率。見(jiàn)表2。

      顯然,對(duì)于這4種股票,方法2是最優(yōu)的。事實(shí)上,從對(duì)大部分股票的效果來(lái)看,方法2依然是最優(yōu)的,而且比其他兩個(gè)方法的表現(xiàn)好很多。

      為了直觀地了解策略收益的情況,下面分別繪制了這四只股票使用策略2進(jìn)行交易的累計(jì)超額收益。(如不作特別說(shuō)明,下文提及的收益均指累計(jì)超額收益。)

      從圖5~圖8四個(gè)圖可以看出,該策略對(duì)于不同的股票進(jìn)行交易都能夠獲得顯著的收益,這說(shuō)明了策略的盈利能力和適應(yīng)能力。但是策略對(duì)于不同股票的表現(xiàn)并不一致,比如對(duì)深康佳A和深圳機(jī)場(chǎng)的策略收益明顯會(huì)更高。另外,對(duì)于不同股票,收益的波動(dòng)性也有所不同。正如之前的假設(shè),少量股票可以在某段時(shí)間走勢(shì)異于大盤(pán),但是大部分股票的走勢(shì)都是跟隨大盤(pán)的,少量股票特殊階段的虧損,可以被其他股票的盈利所抵消。

      2.3 組合策略收益

      前文提到,對(duì)單個(gè)股票進(jìn)行交易的時(shí)候,在某個(gè)階段可能出現(xiàn)一定回撤。這是部分股票在特殊時(shí)期的異常所導(dǎo)致的。根據(jù)現(xiàn)代資產(chǎn)組合理論,將收益相關(guān)性低的資產(chǎn)進(jìn)行組合,實(shí)現(xiàn)分散個(gè)別風(fēng)險(xiǎn),提高資產(chǎn)組合收益風(fēng)險(xiǎn)比,這是通過(guò)策略的組合實(shí)現(xiàn)更高的信息比率的基礎(chǔ)。

      由于計(jì)算量巨大,該文只選擇了包括上文所提及四只股票在內(nèi)的200只股票進(jìn)行測(cè)試,并為它們?cè)O(shè)置相同的資金權(quán)重,依照類似于上文的方法進(jìn)行測(cè)試,得到了高達(dá)0.378的信息比率,遠(yuǎn)高于前文的任何一個(gè)結(jié)果,策略的收益曲線見(jiàn)圖9。

      組合策略的收益比單個(gè)策略有了不小地提高,在2014年4月14日—2016年2月5日這接近2年的時(shí)間內(nèi),策略收益超過(guò)400%,平均到每日的收益為0.823%(未扣除交易成本)。更重要的是,相對(duì)于單個(gè)策略,組合策略收益的波動(dòng)性極大的降低了,出現(xiàn)虧損的幾率很低,策略的單日勝率(即跑贏大盤(pán)的概率)高達(dá)62.9%,回撤的幅度也很小,這代表著這種組合策略有著極穩(wěn)定的盈利能力,具有投入實(shí)戰(zhàn)價(jià)值。

      3 結(jié)語(yǔ)

      該文從量化交易領(lǐng)域中傳統(tǒng)的配對(duì)交易策略入手,結(jié)合前沿的深度學(xué)習(xí)技術(shù),運(yùn)用棧式自動(dòng)編碼器構(gòu)建一個(gè)能夠根據(jù)股票價(jià)格相關(guān)性預(yù)測(cè)股票價(jià)格的模型,并生成一個(gè)完整的量化交易策略。這種策略無(wú)需預(yù)先假設(shè)股票價(jià)格之間關(guān)系的形式,而是使用深度神經(jīng)網(wǎng)絡(luò)自動(dòng)地學(xué)習(xí)這種相關(guān)性的特征,從而克服了傳統(tǒng)方法的局限性。該文又提出在這種方法的基礎(chǔ)上,通過(guò)同時(shí)對(duì)大量的股票獨(dú)立地執(zhí)行該策略,構(gòu)成一個(gè)組合策略,從而實(shí)現(xiàn)策略收益和穩(wěn)定性的提高。實(shí)驗(yàn)證明,最終的組合策略在我國(guó)A股市場(chǎng)中有持續(xù)穩(wěn)定盈利的能力,在根據(jù)近兩年A股市場(chǎng)數(shù)據(jù)的模擬測(cè)試中,日勝率為62.9%,信息比率為0.378,具備投入實(shí)戰(zhàn)的價(jià)值。

      參考文獻(xiàn)

      [1] 陳豪.配對(duì)交易的改進(jìn)設(shè)計(jì)[D].廣州:華南理工大學(xué),2014:1-21.

      [2] Vidyamurthy, G. Pairs Trading: Quantitative Methods and Analysis[M].Chichester:John Wiley&Sons,2004.

      [3] Elliott Robert J.Pairs trading[J].Quantitative Finance,2005,5(3):138-139.

      [4] Gatev E.Pairs Trading:Performance of a Relative-Value Arbitrage Rule[J].Review of Financial Studies,2006,19(3):156-159.

      [5] 孫志軍.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012(8):2806-2810.

      猜你喜歡
      深度學(xué)習(xí)
      從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
      搭建深度學(xué)習(xí)的三級(jí)階梯
      有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
      利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
      MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
      構(gòu)建“單元整合、主題牽引”詩(shī)歌鑒賞“深度學(xué)習(xí)”課堂的策略
      景洪市| 赞皇县| 花莲县| 商洛市| 遵化市| 临邑县| 荣昌县| 怀来县| 宜黄县| 科技| 绥棱县| 精河县| 垫江县| 五原县| 缙云县| 万盛区| 巴青县| 石泉县| 镇坪县| 怀仁县| 临颍县| 富民县| 尉氏县| 游戏| 满洲里市| 江门市| 新津县| 梁山县| 康保县| 玉溪市| 垫江县| 喜德县| 甘谷县| 郧西县| 安福县| 保亭| 清远市| 洮南市| 伊春市| 读书| 宣恩县|