• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于多策略融合的市場模式預(yù)測模型

      2019-07-11 00:58王旭
      時代金融 2019年14期
      關(guān)鍵詞:模式識別

      王旭

      摘要:本文創(chuàng)新地提出了“市場信息熵”的概念通過分析行業(yè)間波動方向的有序性來判斷市場總體的狀態(tài),然后與不同參數(shù)周期的趨勢跟蹤策略和趨勢反轉(zhuǎn)策略相結(jié)合,進(jìn)而將這些策略信號指令作為輸入,市場模式狀態(tài)作為輸出建立Logistic回歸模型,即構(gòu)造出一種創(chuàng)新的、具有高穩(wěn)定性的多策略融合投資模型。該模型在2010年至2017年底進(jìn)行模擬交易回測,結(jié)果表明通過模式識別算法融合多策略后策略的年化收益跑贏基準(zhǔn)指數(shù),夏普比率有明顯提高,最大回撤也大大降低,為量化擇時提供新思路。

      關(guān)鍵詞:量化擇時 模式識別 市場信息熵 多策略融合

      一、 引言

      量化交易是一種近年來在國際間興起的投資方式,它使用非常嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)和統(tǒng)計(jì)學(xué)手段,用理性的視角設(shè)計(jì)較低風(fēng)險(xiǎn)和較高收益的投資模型策略。量化投資方法[1]在資本市場上已經(jīng)發(fā)展的十分成熟,得到了廣泛肯定,成為了市場上新型的先進(jìn)投資產(chǎn)品。很多成熟的國外證券市場具有較高的有效性,即投資者很難通過對股票價(jià)格歷史數(shù)據(jù)進(jìn)行研究分析而預(yù)測未來價(jià)格走勢,但是我國證券市場發(fā)展時間較短,投資者風(fēng)險(xiǎn)意識較低,很多市場體制和交易手段策略跟國外有著很大差別。長期以來很多投資者可以利用技術(shù)分析、基本面分析等量化手段對股票市場走勢進(jìn)行預(yù)測判斷,從而獲取超額收益。然而隨著這些量化技術(shù)的大量普及和中國股票市場監(jiān)管制度的完善,一些技術(shù)手段漸漸失去了有效性。本文將一些常見的擇時指標(biāo)和策略融合起來,然后挖掘市場特征,進(jìn)而引入模式識別算法來克服股票市場本身具有的非線性[2]和復(fù)雜性特點(diǎn),構(gòu)造一種具有高創(chuàng)新、高適應(yīng)性、高預(yù)測準(zhǔn)確率的多策略融合模型來預(yù)測市場的未來趨勢。

      二、多維度提取市場特征

      隨著中國證券市場的快速發(fā)展,越來越多的公司在上海、深圳證券交易所上市,股票市場迎來空前的繁榮期。與此同時,股票市場中每日都會產(chǎn)生海量的交易數(shù)據(jù),比如股票的開盤價(jià)、收盤價(jià)、交易量、漲幅等;所有上市公司的基本面信息也會不斷更新,比如市盈率、市凈率、凈利潤、營業(yè)收入等。這些龐大的財(cái)務(wù)指標(biāo)以及股票量價(jià)數(shù)據(jù)為那些希望進(jìn)行主動投資的投資者們提供了進(jìn)行投資分析的數(shù)據(jù)基礎(chǔ),投資者可以將估值指標(biāo)信息單獨(dú)或者通過復(fù)雜的數(shù)學(xué)計(jì)算轉(zhuǎn)化成因子,也可稱為股票特征,進(jìn)而將其作為輔助工具進(jìn)行投資決策;也可以引入均線系統(tǒng)等擇時策略分析預(yù)測股票的未來價(jià)格走勢[3]。但是,股票市場本身具有非線性和復(fù)雜性特點(diǎn),依據(jù)單個特征或策略很難長期保持較高的預(yù)測準(zhǔn)確率和正收益。本文將引入若干創(chuàng)新的市場指標(biāo)以及一些傳統(tǒng)的策略分析模型,提取它們各自對市場狀態(tài)的分析判斷結(jié)果作為市場特征用于后面模式識別算法的輸入變量。

      在篩選策略和指標(biāo)的過程中,我們通過對策略組合進(jìn)行回測發(fā)現(xiàn)策略之間的相關(guān)性越低,組合收益風(fēng)險(xiǎn)比的提升就會越顯著,即策略設(shè)計(jì)的核心邏輯要有較大的區(qū)分度。這是因?yàn)椴煌牟呗栽诿鎸ν瑫r期的市場狀態(tài)時可能會有不同的決策方案,當(dāng)市場發(fā)生突然反轉(zhuǎn)時,多策略模型可能會相比單策略較早的做出反應(yīng),這樣可以大大提高策略組合的抗風(fēng)險(xiǎn)能力,提高策略的夏普比率。同時,我們可以關(guān)注同一種策略不同周期的組合也會產(chǎn)生類似的效果。

      (一)LLT策略

      均線策略是量化擇時策略中最基本的策略之一,它的核心邏輯思想是通過移動平均歷史收盤價(jià)跟蹤市場趨勢。因?yàn)榫€策略對于市場趨勢轉(zhuǎn)變的反應(yīng)延遲比較高,容易造成大幅度虧損。本文將介紹這個基于基礎(chǔ)的均線系統(tǒng)的改進(jìn)策略——LLT策略[4]作為融合模型的基礎(chǔ)策略。

      (二)市場“信息熵”

      “熵”的概念來自熱力學(xué),它是用來表達(dá)分子狀態(tài)雜亂程度的一個物理量。香農(nóng)借用該指標(biāo)提出了“信息熵”的概念來描述信息源的不確定性,解決了對信息的量化度量問題,而信息量的多少可以衡量一個系統(tǒng)的有序程度。在金融市場中,一些專業(yè)機(jī)構(gòu)將市場中的股票按主營業(yè)務(wù)或者其他信息分類劃分成若干具有較鮮明特征的行業(yè)板塊,如申萬一級行業(yè)劃分等。據(jù)已有市場經(jīng)驗(yàn)判斷,當(dāng)大多數(shù)行業(yè)的波動方向一致時,整個股票市場容易形成大趨勢,而信息熵作為衡量變量不確定性程度的指標(biāo)很適合可以用來刻畫不同行業(yè)板塊狀態(tài)的差異性。

      根據(jù)Boltzmanns H-theorm,香農(nóng)將隨機(jī)變量X的熵值H(X)定義如下:

      (1)

      其中X表示隨機(jī)變量,隨機(jī)變量的取值為,表示事件xi發(fā)生的概率,且。

      本文借鑒信息熵的思想來構(gòu)造一個指標(biāo)確定市場的趨勢強(qiáng)弱:若行業(yè)間信息熵越小,說明行業(yè)間的不確定度量越小,即行業(yè)間出現(xiàn)某種共性,市場的趨勢比較明顯;反之信息熵越大,市場出現(xiàn)分歧,不同行業(yè)的表現(xiàn)和走勢有較大區(qū)別,市場越容易處于混沌狀態(tài),即震蕩市,未來走勢方向不明確。

      本文定義“市場信息熵”的計(jì)算方法如下:

      (1)按照申銀萬國一級行業(yè)劃分標(biāo)準(zhǔn),將股票分成28組。

      (2)每個行業(yè)內(nèi)根據(jù)股票的當(dāng)日漲幅對股票進(jìn)行打分,得分規(guī)則如表1所示。整個行業(yè)的得分可表示為,其中n表示行業(yè)內(nèi)股票i的個數(shù),Si為股票的得分。將行業(yè)遍歷一遍后,將各個行業(yè)的得分歸一化后可得到最終行業(yè)得分。

      (3)將各行業(yè)得分代入信息熵計(jì)算公式中可得本文定義的市場信息熵。

      計(jì)算每日的“市場信息熵值”后,可以構(gòu)造一種交易策略:用移動平均方法對其進(jìn)行平滑處理,當(dāng)短周期均線從長周期均線的下方,向上穿越時看多市場;當(dāng)短周期均線從長周期均線的上方,向下穿越長周期均線時看空市場。

      (三)改進(jìn)TD策略

      上文介紹的LLT策略本質(zhì)上屬于趨勢跟蹤策略,而本文希望作為基礎(chǔ)信號輸入的策略具有多樣性,故引入主要尋找反轉(zhuǎn)信號的TD策略[5]。

      TD指標(biāo)是Thomas DeMark于上世紀(jì)80年代為了尋找股票的走勢欲反轉(zhuǎn)區(qū)域而設(shè)計(jì)的,因?yàn)槠溥壿嫼唵吻翌A(yù)測精度相對較高,該策略在近幾十年間在世界范圍內(nèi)得到了廣泛的應(yīng)用和推廣。TD組合策略主要包含啟動階段和計(jì)數(shù)階段,而每個階段又分為買入和賣出分別統(tǒng)計(jì)。啟動階段的作用是通過指定一系列條件識別股價(jià)的漲勢或者跌勢是否達(dá)到閾值,在確認(rèn)趨勢之后開始進(jìn)入計(jì)數(shù)階段,統(tǒng)計(jì)上漲或下跌的天數(shù),并且當(dāng)計(jì)數(shù)達(dá)到設(shè)定閾值之后模型即認(rèn)為趨勢鄰近終結(jié),反轉(zhuǎn)即將發(fā)生,所以發(fā)出相應(yīng)的買入或賣出指令。

      有很多研究機(jī)構(gòu)對TD指標(biāo)針對中國股票市場作出改進(jìn),尋找較適合中國股市特征的指標(biāo)參數(shù)和條件,修改了其中的一些閾值條件,使其可以在中國證券市場中使用并且盈利。廣發(fā)證券金融工程團(tuán)隊(duì)就對TD進(jìn)行了一系列研究和改進(jìn),本文借鑒其改進(jìn)的GFTD策略,設(shè)定了長周期和短周期兩組參數(shù),將其產(chǎn)生的信號作為下文模式識別模型的輸入。

      三、特征處理及模式識別

      從多個策略中分別提取對市場狀態(tài)的判別信號后,本文將多維策略信號作為輸入變量,市場真實(shí)的漲跌情況作為輸出變量建立了基于邏輯斯特回歸(Logistic Regression)的模式識別模型[6]。邏輯斯特回歸模型又可稱為“對數(shù)幾率回歸”,本質(zhì)上是用線性回歸模型的預(yù)測結(jié)果逼近真實(shí)標(biāo)記的對數(shù)幾率,在分類問題中被廣泛應(yīng)用。

      邏輯回歸模型有很多優(yōu)點(diǎn),首先它不受數(shù)據(jù)分布的影響,避免了當(dāng)假設(shè)分布不準(zhǔn)確時實(shí)驗(yàn)結(jié)果不準(zhǔn)確的問題;而且該模型不僅可以預(yù)測樣本集的分類結(jié)果,還可以輸出其對應(yīng)事件發(fā)生的近似概率。這兩個優(yōu)點(diǎn)尤其適用于解決本文所提出的問題,一般來說證券市場中的數(shù)據(jù)分布并不規(guī)則,而且具有多變性,很難用一種概率分布假設(shè)及估計(jì)參數(shù)來長時間近似。其次,投資者想預(yù)測市場的趨勢是上漲還是下跌同樣也可以看作是一種二分類問題,邏輯回歸模型可以在有效地解決該分類問題的同時還可以給出市場上漲下跌的概率。因此,本文選擇logistic回歸作為模式識別模型進(jìn)行樣本訓(xùn)練學(xué)習(xí)并用于對市場狀態(tài)進(jìn)行預(yù)測。

      四、多策略融合模型

      多策略融合模型是通過篩選多個策略信號作為模式識別的輸入變量,市場歷史真實(shí)狀態(tài)作為輸出標(biāo)簽進(jìn)行訓(xùn)練,然后將訓(xùn)練好的模型對實(shí)時股票市場狀態(tài)進(jìn)行判斷和投資以獲得收益。

      本文所要建立的多策略融合模型內(nèi)容及結(jié)構(gòu)如下圖所示:

      圖1 多策略融合模型流程圖

      本文共選取了5個基礎(chǔ)策略信號作為機(jī)器學(xué)習(xí)模型的輸入,其中LLT策略和TD策略分別有兩組參數(shù)對應(yīng)著抓取不同周期長度信號。LLT策略與TD策略分別屬于趨勢跟蹤策略和趨勢反轉(zhuǎn)策略,從底層邏輯機(jī)理上有著本質(zhì)區(qū)分,而市場信息熵策略是本文創(chuàng)新提出的從市場內(nèi)部行業(yè)間的波動入手分析指數(shù)的走勢而不是依賴于表面指數(shù)價(jià)格數(shù)據(jù)。這種策略組合搭配保證了策略信號特征的多樣性和區(qū)分度,有利于提高邏輯斯特回歸模型的預(yù)測精度。

      在邏輯斯特回歸模型的訓(xùn)練過程中,本文用過去4年的基礎(chǔ)策略信號和對應(yīng)的基準(zhǔn)日漲幅數(shù)據(jù)訓(xùn)練邏輯斯特回歸模型的參數(shù),使用1年后更新訓(xùn)練數(shù)據(jù)集重新訓(xùn)練模型參數(shù),以此延續(xù)。

      五、實(shí)證檢驗(yàn)

      為證明多策略融合模型的有效性,本文選取滬深300指數(shù)作為投資標(biāo)的,測試過程中設(shè)定滬深300指數(shù)可做空(沒有加杠桿),截取2010年1月1日至2017年12月31日的每日收盤價(jià)數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn)。

      從圖3可以看出,本文選用的基礎(chǔ)策略絕大部分還是實(shí)證有效的,其中表現(xiàn)較差的TD長周期策略雖然在2016年后表現(xiàn)一直很低迷,但其仍然可以為總體的融合模型提供輔助信息。其次,本文創(chuàng)新提出的市場信息熵的概念也被證明可以長期有效的在中國股市中發(fā)揮作用,對指數(shù)的走勢有很高的預(yù)測能力。

      本文提出的多策略融合模型核心思想是利用多種多類策略信號相互補(bǔ)充信息,使得融合后產(chǎn)生的信號更加穩(wěn)健和準(zhǔn)確,從表2提供的回測指標(biāo)中可以看出,該模型在損失較小收益的情況下大大降低了最大回撤至14.5%,提高了整體的夏普比率至1.1。尤其是在2016年牛市反轉(zhuǎn)為熊市時,在經(jīng)

      歷一段較少的虧損之后,及時識別出市場風(fēng)格的轉(zhuǎn)變,避免了更大的回撤。此結(jié)果說明多策略融合模型是比較成功的。

      六、結(jié)論與討論

      本文將屬于趨勢跟蹤和趨勢反轉(zhuǎn)的策略分別采用不同的參數(shù)組合在一起,然后又創(chuàng)新地提出了市場信息熵的概念來判斷市場總體的狀態(tài),進(jìn)而將這些離散獨(dú)立的策略信號通過引入模式識別算法邏輯斯特模型來克服股票市場的非線性特點(diǎn),來構(gòu)造一種創(chuàng)新的、具有較高投資穩(wěn)健性的多策略融合模型來預(yù)測市場的模式,對于投資者進(jìn)行投資決策有很高的指導(dǎo)意義。

      本文提出的策略模型更大的意義在于為投資者提供了新的量化思維,一個獨(dú)立的策略一般只能在某個固定市場形態(tài)下盈利,除此之外會陷入漫長的虧損期,但這并不意味著要廢棄該策略,因?yàn)槭袌鍪嵌嘧兊?,該策略隨時可能恢復(fù)有效性。投資者們可以嘗試將各個獨(dú)立的策略通過一些機(jī)器學(xué)習(xí)方法將其作出的判斷作為一種輸入信號,從而在保證不損失過多收益的前提下大大提高模型的穩(wěn)健性和準(zhǔn)確性。

      參考文獻(xiàn)

      [1]祈海.解讀量化投資-西蒙斯用公式打敗市場的故事[M].北京:機(jī)械工業(yè)出版社,2009.

      [2]徐緒松,陳彥斌.深滬股票市場非線性實(shí)證研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2001,18(3):110-113.

      [3]吳桂雯.量化交易中股票擇時的策略研究[D].

      [4]廣發(fā)證券,低延遲趨勢線與交易性擇時[R].2013.

      [5]廣發(fā)證券,基于修正TD指標(biāo)的指數(shù)擇時研究[R].2010.

      [6]趙謙,孟德宇,徐宗本 . L1/2正則化Logistic回歸[J].模式識別與人工智能,2012,25(5):721-728.

      [7]周志華.機(jī)器學(xué)習(xí)[M].清華大學(xué)出版社,2016.

      猜你喜歡
      模式識別
      紫地榆HPLC指紋圖譜建立及模式識別
      2019 IEEE計(jì)算機(jī)視覺與模式識別會議
      UPLC-MS/MS法結(jié)合模式識別同時測定芪參益氣滴丸中11種成分
      淺談模式識別在圖像識別中的應(yīng)用
      第四屆亞洲模式識別會議
      基于可拓模式識別的孤島檢測研究
      可拓模式識別算法中經(jīng)典域的確定方法
      第3屆亞洲模式識別會議
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
      電氣設(shè)備的故障診斷與模式識別
      如东县| 和田县| 乌兰察布市| 沂南县| 岳阳县| 城步| 石林| 彭水| 汉阴县| 法库县| 壶关县| 驻马店市| 肇庆市| 卢氏县| 黄浦区| 逊克县| 无极县| 灵宝市| 安泽县| 平南县| 丰镇市| 五大连池市| 南丰县| 昌乐县| 久治县| 河北区| 桂平市| 尉氏县| 上林县| 和静县| 图木舒克市| 榆社县| 额敏县| 余姚市| 克什克腾旗| 五华县| 吐鲁番市| 桃园县| 容城县| 连平县| 枣强县|