• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)時代下 對沖基金的數(shù)據(jù)挖掘技術(shù)探析

      2016-11-09 18:12王彥博楊璇劉曦子
      銀行家 2016年9期
      關(guān)鍵詞:對沖神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘

      王彥博 楊璇 劉曦子

      2015年全球?qū)_基金表現(xiàn)

      2015年,全球范圍內(nèi)對沖基金經(jīng)歷了2008年以來的第二次業(yè)績寒冬。根據(jù)對沖基金研究機(jī)構(gòu)HFR(Hedge Fund Research Inc.)公布的資料顯示,2015年四季度全球新成立對沖基金183家,較第三季度的269家下降32%,是2009年以來新增數(shù)量最少的季度。2015年全年累計新成立對沖基金968家,較上一年度下降7%。此外,諸多對沖基金在慘淡的業(yè)績面前紛紛清盤。數(shù)據(jù)顯示,2015年累計979家對沖基金清盤,較2014年864家的數(shù)據(jù)上漲13.3%,是自2009年1023家對沖基金清盤以來的又一波高峰。這波浪潮中,諸多國際大型對沖基金也未能幸免:全球20大對沖基金之一貝萊德宣布關(guān)閉旗下一個10億美元規(guī)模的宏觀對沖基金;文藝復(fù)興科技投資公司宣布清盤旗下一只量化對沖策略基金 ——復(fù)興機(jī)構(gòu)期貨基金(RIFF)。

      然而,對沖基金數(shù)量的減少并沒有影響其總體規(guī)模沖上新高。根據(jù)HFR統(tǒng)計數(shù)據(jù)顯示,截至2015年底,全球?qū)_基金管理資產(chǎn)規(guī)模達(dá)2.9萬億美元,較2014年增長約1千億美元。

      機(jī)構(gòu)數(shù)量的減少和資產(chǎn)管理規(guī)模的增長再次印證了全球?qū)_基金行業(yè)“強(qiáng)者恒強(qiáng)”的現(xiàn)狀。雖然近年投資者逐漸增加了對中小型對沖基金的投入,但行業(yè)集中度居高不下的局面并未得到改善。2015年研究機(jī)構(gòu)Preqin在其發(fā)布的報告中將7617家對沖基金公司中管理資產(chǎn)規(guī)模在10億美元以上的統(tǒng)一劃入“10億美元俱樂部”。報告顯示,盡管“10億美元俱樂部”包含570只對沖基金,卻管理了對沖基金中92%的資產(chǎn)規(guī)模。而其余大部分的對沖基金合計管理規(guī)模只占8%。這意味著對沖基金行業(yè)中大多數(shù)資金集中在少數(shù)公司手中。

      從投資策略來看,復(fù)合策略、股票多空策略、宏觀策略是2015年業(yè)績表現(xiàn)最好的三個策略,全年累計收益分別為3.62%、3.57%、2.27%。2014年表現(xiàn)“一枝獨秀”的CTA受累于大宗商品的暴跌,2015年累計收益僅1.28%,遠(yuǎn)低于去年同期的16.42%??赊D(zhuǎn)換套利和股票市場中性策略收益高于2014年,分別取得全年累計收益1.6%和0.09%,其余子策略的收益表現(xiàn)均低于2014年。

      回顧2015年,造成全球?qū)_基金業(yè)績欠佳的主要原因包括以下幾點,第一,市場因素:黃金、石油等大宗商品的暴跌拖累投資大宗商品的對沖基金和投資能源行業(yè)的對沖基金;希臘債務(wù)危機(jī)陰云不散,投資歐洲市場的對沖基金業(yè)績受到波及;中國股災(zāi)影響包括歐美股市、新興市場股市等在內(nèi)的全球股市。第二,客戶因素:HFR主席Kenneth Heinz指出,隨著客戶風(fēng)險厭惡傾向不斷加強(qiáng),客戶對其資產(chǎn)波動性的容忍程度也相應(yīng)下降,業(yè)績表現(xiàn)不佳的對沖基金面臨著強(qiáng)大的客戶贖回壓力。

      基于數(shù)據(jù)挖掘的量化投資技術(shù)

      作為對沖基金的重要手段,量化投資技術(shù)一直被大量應(yīng)用并不斷深化。1971年,電子工程師約翰·麥奎恩利用美國富國銀行的信托投資平臺建立起全球第一個定量投資系統(tǒng)。隨后,量化投資界的傳奇人物詹姆斯·西蒙斯創(chuàng)立了文藝復(fù)興科技公司,并運用量化模型在公司成立后的20多年中為基金賺取了平均每年35.6%的收益率。然而,隨著計算機(jī)科學(xué)的進(jìn)步和大數(shù)據(jù)時代的到來,全球數(shù)據(jù)量呈現(xiàn)指數(shù)級增長,傳統(tǒng)的公司財務(wù)數(shù)據(jù)和市場行情數(shù)據(jù)已難以全面描繪市場狀況;同時,數(shù)據(jù)庫存儲的數(shù)字、符號信息等結(jié)構(gòu)化數(shù)據(jù)形式逐漸向文本、圖像、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)形式轉(zhuǎn)變。因此,市場亟需更先進(jìn)的模型和算法來滿足對更大量級、更多類型的數(shù)據(jù)進(jìn)行處理,基于大數(shù)據(jù)量化策略的研究已然成為量化投資新的研究方向和熱門研究領(lǐng)域。

      文本挖掘在量化投資中的應(yīng)用

      主題投資作為股票市場上一種重要的投資策略,反映了投資者對市場上發(fā)生的熱點事件的解讀,也反映了不同市場參與者的心理博弈過程。傳統(tǒng)的量化分析對主題的把握主要依賴個股的財務(wù)數(shù)據(jù)(如EPS、PE、收盤價、開盤價、成交量等)和行業(yè)數(shù)據(jù)(如行業(yè)指數(shù)漲跌幅等)。然而,這些結(jié)構(gòu)化數(shù)據(jù)中所隱含的投資信息大部分已被挖掘,投資者亟需從更廣闊的非結(jié)構(gòu)化數(shù)據(jù)中探求市場規(guī)律。

      文本挖掘是指從文本數(shù)據(jù)中抽取有價值的信息和知識的計算機(jī)處理技術(shù),是數(shù)據(jù)挖掘的一個分支。將文本挖掘應(yīng)用于量化投資的核心邏輯在于:第一,文本數(shù)據(jù)研究與相對成熟的數(shù)值型數(shù)據(jù)研究相比,更容易在新數(shù)據(jù)源中獲得超額收益;第二,財經(jīng)相關(guān)的網(wǎng)絡(luò)文本信息某種程度上反映了投資者的情緒和投資意向;第三,爆發(fā)式增長的網(wǎng)絡(luò)文本數(shù)據(jù)在數(shù)量和時間維度上足夠構(gòu)建較為成熟的量化模型;第四,一個主題的異動往往會帶來關(guān)于該主題大量持續(xù)的報道,甚至在該主題還未在市場上有所表現(xiàn)的時候,就已經(jīng)有大量的新聞報道產(chǎn)生,從而使與該熱點相關(guān)的新聞數(shù)量在某一時間段達(dá)到一個突發(fā)的高峰。通過對相關(guān)文本信息進(jìn)行分析挖掘,可以有效預(yù)測市場熱點和動向,發(fā)掘主題投資機(jī)會。

      互聯(lián)網(wǎng)財經(jīng)選股策略是基于文本挖掘技術(shù)的量化選股方式之一。通過爬取主流財經(jīng)媒體報道文章的文本信息,利用文本挖掘技術(shù)對熱點事件進(jìn)行深度挖掘,進(jìn)而完成對投資主題的預(yù)測?;ヂ?lián)網(wǎng)財經(jīng)選股策略總體框架分為“數(shù)據(jù)獲取”、“數(shù)據(jù)處理”以及“策略構(gòu)建”三部分:

      數(shù)據(jù)獲取。引入“網(wǎng)絡(luò)爬蟲技術(shù)”,首先分析待批量爬取的主流財經(jīng)媒體網(wǎng)頁結(jié)構(gòu),主要關(guān)注網(wǎng)頁中需要特定爬取的相關(guān)結(jié)構(gòu)和內(nèi)容;其次,發(fā)現(xiàn)財經(jīng)媒體網(wǎng)站上待爬取信息的網(wǎng)頁URL相關(guān)規(guī)律,通過網(wǎng)絡(luò)爬蟲程序遍歷并提取所有待爬取財經(jīng)網(wǎng)頁中的薦股欄目信息,獲得各網(wǎng)站薦股數(shù)據(jù)。在大數(shù)據(jù)時代,單機(jī)爬取的速度往往難以滿足大規(guī)模數(shù)據(jù)爬取需求,可以考慮引入Hadoop平臺技術(shù),實現(xiàn)分布式存儲與并行信息爬取策略。

      數(shù)據(jù)處理。包括數(shù)據(jù)清洗和數(shù)據(jù)挖掘兩部分。數(shù)據(jù)清洗是篩選出所有網(wǎng)頁訪問正常且內(nèi)容完整有效的數(shù)據(jù)信息;數(shù)據(jù)挖掘是指針對處理后的文本信息,通過分析各網(wǎng)站的文本結(jié)構(gòu),并利用文本分詞、文本分類、文本聚類等技術(shù)進(jìn)行主題關(guān)鍵詞的挖掘和分析。

      策略構(gòu)建。分析數(shù)據(jù)挖掘得到的規(guī)律,并制定相應(yīng)的交易策略。單個財經(jīng)頻道選股策略為:在每個交易日,根據(jù)文本挖掘的薦股信息,在推薦后的第一個交易日以開盤價買進(jìn)該個股;如果該股停牌,則不買入;持有期到期后以收盤價賣出該個股,如果個股在持有期末停牌則延遲賣出,直至可以賣出。多財經(jīng)頻道智能選股策略是在單財經(jīng)頻道的基礎(chǔ)上拓展了數(shù)據(jù)范圍,考慮了各個網(wǎng)站在過去一段時間內(nèi)單個策略下的表現(xiàn),優(yōu)先選取過去一段時間內(nèi)收益率超過某設(shè)定標(biāo)準(zhǔn)(如對比上證指數(shù))的前若干個網(wǎng)站,結(jié)合當(dāng)前交易日推薦個股構(gòu)成超配組合。

      神經(jīng)網(wǎng)絡(luò)算法在量化投資中的應(yīng)用

      神經(jīng)網(wǎng)絡(luò)算法是數(shù)據(jù)挖掘中的重要模型,它的產(chǎn)生得益于生理學(xué)和醫(yī)學(xué)對人腦的探索成果。科學(xué)證實:腦神經(jīng)系統(tǒng)具有豐富的層次結(jié)構(gòu),“神經(jīng)-中樞-大腦”的工作過程是一個不斷迭代、不斷抽象的過程。人工神經(jīng)網(wǎng)絡(luò)正是一種應(yīng)用類似于大腦神經(jīng)突觸連接結(jié)構(gòu)進(jìn)行信息處理的數(shù)據(jù)挖掘模型。

      神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(或稱神經(jīng)元)相互連接構(gòu)成,每個節(jié)點代表一種特定輸出函數(shù),也稱為激勵函數(shù),每兩個節(jié)點間的連接代表一個對于通過該連接信號的加權(quán)值,即權(quán)重。神經(jīng)網(wǎng)絡(luò)的輸出則根據(jù)網(wǎng)絡(luò)的連接方式、權(quán)重值和激勵函數(shù)的不同而有所差異。常見的神經(jīng)網(wǎng)絡(luò)模型通常將節(jié)點分成三個層次:輸入層,輸出層和隱含層。輸入層即給定的模型輸入,輸出層即神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果,隱含層是神經(jīng)網(wǎng)絡(luò)內(nèi)部自動運算過程。

      將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于量化投資分析的基本假設(shè)在于:市場存在著人類無法直接判斷但是計算機(jī)可以挖掘產(chǎn)生的規(guī)律和邏輯。與基于傳統(tǒng)統(tǒng)計學(xué)假設(shè)檢驗的方法論不同,神經(jīng)網(wǎng)絡(luò)作為一種數(shù)據(jù)挖掘模型技術(shù),并不需要投資者事先對邏輯進(jìn)行完整的預(yù)判,而是依賴于計算機(jī)通過輸入?yún)?shù)對輸出結(jié)果進(jìn)行學(xué)習(xí)。因此可以有機(jī)會打破人類固有的思維局限,從更高量級的數(shù)據(jù)中發(fā)掘隱藏規(guī)律。結(jié)合西蒙斯的“壁虎式”投資理論可知,投資時在短線內(nèi)是可以進(jìn)行方向性預(yù)測并捕捉到短期套利機(jī)會的。因此,基于神經(jīng)網(wǎng)絡(luò)的交易策略正是借助于該原理對大量的歷史交易數(shù)據(jù)進(jìn)行學(xué)習(xí),建立預(yù)測模型,從而在實際交易中捕捉到短期的交易機(jī)會。

      以基于神經(jīng)網(wǎng)絡(luò)的高頻股價預(yù)測模型為例,其核心邏輯在于:市場上買賣雙方的交易行為決定了股票價格的形成和波動,通過基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)預(yù)測模型對高頻市場行情數(shù)據(jù)進(jìn)行分析和挖掘,對短期內(nèi)股指期貨的漲跌進(jìn)行預(yù)測,然后根據(jù)預(yù)測結(jié)果確定股指期貨的買賣信號。預(yù)測模型的輸入是短期內(nèi)的股票價格數(shù)據(jù)、價格的變化范圍信息、買賣盤價格和委賣委買量數(shù)據(jù)等,預(yù)測模型的輸出是未來短期內(nèi)的漲跌方向。從實證結(jié)果來看,該模型將大量期貨歷史交易數(shù)據(jù)作為學(xué)習(xí)集,通過大量訓(xùn)練,對一秒鐘高頻下的股指期貨漲跌進(jìn)行預(yù)測,并能在預(yù)測模型樣本外的測試數(shù)據(jù)樣本中達(dá)到73%的準(zhǔn)確率。據(jù)廣發(fā)證券應(yīng)用該模型后披露的數(shù)據(jù)顯示,自2013年初至2014年7月,累計收益率達(dá)到99.6%,年化收益率為77.6%,最大回撤為-5.86%。

      值得一提的是,近年“深度學(xué)習(xí)”在人工智能上所取得的技術(shù)突破迅速引起金融行業(yè)的極大關(guān)注。目前已經(jīng)有行業(yè)研究者開始嘗試將深度學(xué)習(xí)應(yīng)用于量化投資以獲取超越傳統(tǒng)神經(jīng)網(wǎng)絡(luò)量化模型的收益。深度學(xué)習(xí)并不特指某一個算法,而是Sparse Coding、RBM、深信度網(wǎng)絡(luò)等技術(shù)方法的總稱。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型2~3層隱含層不同,深度學(xué)習(xí)模型的隱含層數(shù)可達(dá)8~9層,甚至更高。因此當(dāng)該思想被提出之初,海量的訓(xùn)練數(shù)據(jù)和很高的計算復(fù)雜度超出了當(dāng)時硬件的承受能力,但由于近年計算機(jī)硬件性能的提升,深度學(xué)習(xí)算法在準(zhǔn)確率方面的優(yōu)勢迅速凸顯,這也使得深度學(xué)習(xí)在量化投資領(lǐng)域的應(yīng)用前景越來越廣闊。

      對沖基金資產(chǎn)配置建議

      2015年,全球?qū)_基金行業(yè)陷入業(yè)績低谷,盡管管理資產(chǎn)規(guī)模仍呈上升趨勢,但行業(yè)整體業(yè)績慘淡,諸多對沖基金面臨清盤。除了2015年大宗商品表現(xiàn)不佳、希臘債務(wù)危機(jī)反復(fù)、中國股災(zāi)波及全球等市場因素外,投資者風(fēng)險厭惡傾向上升,對沖基金還面臨著巨大的贖回壓力。這些都給對沖基金的發(fā)展提出了嚴(yán)峻的挑戰(zhàn)。

      然而,隨著量化技術(shù)的不斷發(fā)展,特別是大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)的迅猛發(fā)展,使得對沖基金用以研究、跟蹤市場的工具愈發(fā)強(qiáng)大。數(shù)據(jù)挖掘攜手對沖基金,將在大數(shù)據(jù)時代為量化投資帶來不斷創(chuàng)新能力。

      對銀行投資顧問而言,建議在深化對市場把握的過程中,更多關(guān)注基金模型的底層基本原理,特別是數(shù)據(jù)挖掘的基本邏輯,更好地為客戶提供專業(yè)意見。從銀行資產(chǎn)配置工作實際來看,目前市場上已經(jīng)出現(xiàn)了多支公募基金與互聯(lián)網(wǎng)公司合作的大數(shù)據(jù)基金產(chǎn)品,如:廣發(fā)基金與百度合作的“中證百度百發(fā)策略100指數(shù)型基金”、南方基金與新浪合作的“大數(shù)據(jù)100指數(shù)型基金”等。該類產(chǎn)品類型涵蓋了指數(shù)型、股票型和混合型基金以及集合資產(chǎn)管理計劃。銀行應(yīng)進(jìn)一步拓寬視野,加強(qiáng)對國內(nèi)各大基金與互聯(lián)網(wǎng)公司合作推出的“大數(shù)據(jù)基金產(chǎn)品”予以關(guān)注,并考慮引進(jìn)其中優(yōu)秀產(chǎn)品,以期為客戶提供更為優(yōu)質(zhì)的資產(chǎn)配置服務(wù)。

      (作者單位:中國民生銀行,對外經(jīng)貿(mào)大學(xué)信息學(xué)院)

      猜你喜歡
      對沖神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘
      基于人工智能LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績預(yù)測
      基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識別
      基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)穩(wěn)定性預(yù)測
      三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測
      數(shù)據(jù)挖掘綜述
      軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
      基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
      一本面向中高級讀者的數(shù)據(jù)挖掘好書
      景东| 宝山区| 沛县| 宜宾市| 呼和浩特市| 九龙城区| 正定县| 陇西县| 白朗县| 昆山市| 游戏| 铁岭县| 德惠市| 二连浩特市| 阳原县| 安塞县| 黑山县| 宁都县| 扶沟县| 宁明县| 金阳县| 德钦县| 高台县| 乌鲁木齐市| 林西县| 绥棱县| 交城县| 沈阳市| 霍林郭勒市| 寿阳县| 内丘县| 台中县| 新宾| 泽库县| 通城县| 绥中县| 银川市| 师宗县| 凤阳县| 岱山县| 宝清县|