• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于市場情緒挖掘的PSM_Black_Litterman資產(chǎn)配置模型

      2016-09-10 19:40:24朱碧穎趙爽
      時代金融 2016年18期
      關(guān)鍵詞:資產(chǎn)配置網(wǎng)絡(luò)爬蟲文本挖掘

      朱碧穎 趙爽

      【摘要】投資中自上而下的分析方式是被廣泛認可的,資產(chǎn)在行業(yè)間的配置問題,對整體投資效果的影響舉足輕重。Black_Litterman模型改進于傳統(tǒng)的Markowitz模型,自提出后逐漸為人們所接受,并得到推廣。本文結(jié)合計算機技術(shù),提出一種基于文本挖掘算法,使用網(wǎng)絡(luò)爬蟲抓取互聯(lián)網(wǎng)中行業(yè)熱點情緒,形成Black_Litterman模型的投資者觀點矩陣、以及觀點置信度,進而確定行業(yè)資產(chǎn)配置權(quán)重的PSM_Black_Litterman(public sentiment mining Black_Litterman)模型。進行實證分析,以申萬行業(yè)作為行業(yè)分類標準,進行資產(chǎn)行業(yè)間配置,與流通市值行業(yè)配置、傳統(tǒng)Markowitz模型資產(chǎn)配置進行比較。實證結(jié)果表明,本文所提模型可有效提高資產(chǎn)配置的平均收益率與幾何收益率,并減小方差。

      【關(guān)鍵詞】資產(chǎn)配置 Black_Litterman模型 文本挖掘 市場情緒 網(wǎng)絡(luò)爬蟲

      在選擇金融產(chǎn)品進行投資時,普遍采用自上而下(Top-to- Down)的研究方式。在選股方面,首先確定資產(chǎn)在行業(yè)間的配置比例,再在各行業(yè)中進行個股選擇是常用的方式。本文旨在Markowita模型、Black_Litterman模型的基礎(chǔ)上,提出一種利用文本挖掘方法挖掘輿論熱點,得到市場情緒作為觀點矩陣,繼而得到資產(chǎn)在行業(yè)間的配置方案的方法??朔薆lack_Litterman模型存在的對分析師主觀態(tài)度難于量化表示的缺點。

      一、Markowitz與Black_Litterman資產(chǎn)配置模型

      (一)Markowitz資產(chǎn)配置模型

      Markowitz在1952年發(fā)表論文《PORTFOLIO SELECTION》,在論文中提出了均值-方差模型,這篇論文標志著現(xiàn)代投資組合理論的開端。Markowitz理論的思想基礎(chǔ)是:把資產(chǎn)投資收益率看做隨機變量,研究其期望與方差。Markowitz資產(chǎn)配置模型基于五條假設(shè):證券市場具有有效性;投資者是風險厭惡的;投資者進行資產(chǎn)配置選擇的依據(jù)是投資收益率的概率分布,而這個概率分布是可知的;用期望收益率衡量未來的收益水平,用方差衡量收益的不確定性,即收益的風險;市場是無摩擦的。

      設(shè)市場存在n種風險資產(chǎn),將第i種風險資產(chǎn)的的收益率記為ri,r=(r1,r2,…,rn)’,期望收益率記為μ=Er,資產(chǎn)間的協(xié)方差矩陣記為Σ,Σ=Var(r),無風險收益率記為rf,n種風險資產(chǎn)的投資比例為ω=(ω1,ω2,…,ωn)’。那么資產(chǎn)組合的期望收益率為μω=ω’μ,資產(chǎn)組合的風險為σ2ω=ω’Σω。

      那么,當資產(chǎn)組合中僅存在風險資產(chǎn)時,均值-方差模型記為:

      當資產(chǎn)組合中可以存在無風險資產(chǎn)時,均值-方差模型記為:

      使用拉格朗日乘數(shù)法則,可直接求得上述均值-方差模型的最優(yōu)解。投資者可以依據(jù)個人偏好的無差異曲線找到對應(yīng)的最優(yōu)組合。此模型同時表明,最優(yōu)組合的選擇往往并非單獨取決于單個資產(chǎn)的數(shù)字特征,同時也取決于資產(chǎn)間的相關(guān)性。

      Markowitz資產(chǎn)配置模型是在一系列嚴格的假定條件下推導出來的。因此,模型從面世之日起,眾多學者便提出由于模型的假定條件與實際金融環(huán)境存在差異,導致構(gòu)建的投資組合存在難以理解、對輸入的參數(shù)過于敏感、以及估計誤差被放大等問題。

      (二)Black_Litterman資產(chǎn)配置模型

      在高盛銀行任職的Fischer Black和Robert Litterman于1990年提出了Black_Litterman模型,于1992年又在《金融分析》期刊上對Black-Litterman模型作了詳細說明。他們將Markowitz的均值-方差模型最優(yōu)化理論和bayesian估計相結(jié)合,并且基于資本資產(chǎn)定價模型(Capital Asset Pricing Model,CAPM)以及夏普提出的逆最優(yōu)化理論建立了Black_Litterman資產(chǎn)配置模型。在國外理論界,Bevan和Winkelmann,He、Litterman,Satchell和Scowcroft、Drobetz都對Black-Litterman模型做了進一步的完善,并對國際資產(chǎn)配置做了實證分析。在實際投資運作中,很多大型投資機構(gòu)將Black-Litterman模型運用在全球資產(chǎn)配置中,并已取得了豐厚收益。

      Markowitz的均值-方差模型模型的主要投入要素為預期報酬率及方差。投資者必須利用長期的歷史資料,提出對投資組合所有的預期報酬率的看法,而這些看法皆為100%的信心水準,Black和Littermam認為投資者的看法在實際情況下,很難達到完全預測正確。在Black-Litterman資產(chǎn)配置模型中,投資者可以將自己的觀點和對這種觀點的信心程度量化并輸入模型中。

      Black-Litterman資產(chǎn)配置模型的另一大優(yōu)點在于它的輸入是非常具有彈性的。投資者可以輸入對某些資產(chǎn)預期收益的一種觀點或者幾種觀點,也可以不輸入任何觀點。這樣就減少了投資人觀點設(shè)定的隨意性。需要指出的是,因為模型加入了主觀觀念,使模型的估計變得相對復雜。這也成為現(xiàn)階段該模型研究的主要方向。

      以市場均衡為先驗知識,使用bayesian框架將先驗知識與主觀觀點矩陣融合起來,得到后驗分布,其中:

      其中,τ表示的是資本資產(chǎn)模型的不確定性度量,當τ趨近于0時,Black-Litterman計算出的權(quán)重將趨近于市場均衡權(quán)重;Σ代表各資產(chǎn)超額收益的協(xié)方差矩陣;Π表示隱含均衡收益向量,Π=δΣωeq,δ為風險規(guī)避系數(shù),ωeq為市場基準配置權(quán)重向量。P是一個K×N維矩陣,每一行代表投資者的一個觀點對應(yīng)的相關(guān)資產(chǎn)的權(quán)重,相對觀點的權(quán)重和為0,絕對觀點的權(quán)重和為1;Q是一個K×1維向量,分別對應(yīng)于P矩陣中的每個觀點的期望收益;Ω是一個K×K維對角矩陣,表示投資者對每個觀點的信心程度。

      舉一個簡單的例子,一個投資者對三個資產(chǎn)的主觀觀點是:資產(chǎn)1的收益率被高估了2%,資產(chǎn)2的收益率會比資產(chǎn)3的收益率低3%,他對自己這兩個觀點的信心程度分別是w11和w22。那么,對應(yīng)的P、Q、Ω分別為:

      運用Black-Litterman資產(chǎn)配置模型,投資者可以輸入關(guān)于任何投資類別的任意數(shù)量的觀點,并與市場均衡狀態(tài)相結(jié)合,輸出最優(yōu)投資組合權(quán)重和預期收益。

      本文致力于尋求一種更具普適性的,更易于量化的得到投資人觀點矩陣(即得到P、Q、Ω)的方法,即基于網(wǎng)絡(luò)文本挖掘的市場情緒度量方法。

      二、基于網(wǎng)絡(luò)爬蟲的文本挖掘算法

      本章闡述基于網(wǎng)絡(luò)爬蟲技術(shù)得到傳統(tǒng)Black_Litterman資產(chǎn)配置模型觀點矩陣以及置信度矩陣的方法。

      (一)數(shù)據(jù)源的選擇

      本文旨在使用網(wǎng)絡(luò)上的市場情緒作為分析依據(jù),得到Black_ Litterman模型觀點矩陣以及置信度矩陣。那么必然對要分析的新聞文本具有一定要求,需要慎重選擇文本來源。文本來源選擇的是否適當,將直接關(guān)系到black_litterman模型的輸入,進而左右模型整體效果。數(shù)據(jù)源的選擇既要符合文本挖掘技術(shù)數(shù)據(jù)源的一般性要求,也要符合金融新聞類市場情緒文本的特殊性要求。筆者認為,至少需要具有全面行、權(quán)威行、和實效性。全面性保證得到的市場情緒可以代表多數(shù)人的觀點,減小偏差;權(quán)威性保證觀點來源于金融專業(yè)知識相對完備、經(jīng)驗相對豐富的分析師,而且他們的觀點將會通過多種途徑傳播,進而影響大眾觀點,成為大眾情緒;實效性保證情緒文本的及時性,減少滯后偏差。

      鑒于此,本文選擇“搜狐證券—研究報告—行業(yè)研究”(網(wǎng)址:http://stock.sohu.com/hyyj/) 中的新聞標題短文本作為研究對象。它來源于各知名券商研究報告或者權(quán)威報刊,根據(jù)行業(yè)分類進行過整理,新聞標題短文本后給出了新聞發(fā)布時間,符合全面行、權(quán)威行、和實效性準則。

      (二)網(wǎng)絡(luò)爬蟲獲取文本

      已經(jīng)選定數(shù)據(jù)源,接下來使用網(wǎng)絡(luò)爬蟲技術(shù)抓取網(wǎng)頁上的新聞標題短文本。網(wǎng)絡(luò)爬蟲(Network Spider),是一種按照預先給定的規(guī)則,在運行中自動地抓取萬維網(wǎng)信息的程序或者腳本。它將一個網(wǎng)頁URL作為起始,讀取此頁面內(nèi)容,并通過此頁面上的超級鏈接作為線索找到另一個或多個與之有關(guān)聯(lián)的網(wǎng)頁。重復此操作,遍歷網(wǎng)絡(luò)頁面,依次將其文本和URL存入到網(wǎng)頁數(shù)據(jù)庫中。

      爬蟲基本工作流程如下:

      Step1.選取種子URL;

      Step2.將這些URL放入待抓取URL隊列;

      Step3.將URL隊列中對應(yīng)的網(wǎng)頁內(nèi)容抓取下來,存儲到已抓取網(wǎng)頁庫中,并將這些URL放到已抓取URL隊列中;

      Step4.對已經(jīng)抓取到的URL隊列中的URL進行分析,試圖從中分析出待抽取的新URL,將這些URL放入待抓取的URL隊列,從而進入下一次循環(huán)。

      使用網(wǎng)絡(luò)爬蟲技術(shù),以網(wǎng)址:http://stock.sohu.com/hyyj/ 作為起始URL,抓取此URL對應(yīng)頁面的HTML文本,存入文本文件中。其中除所需新聞短文本標題外,還包含了大量的HTML標記,以及非新聞標題短文本以外的文字類信息,需要將其過濾掉。使用XPath與正則表達式技術(shù),通過分析DOM結(jié)構(gòu),使用正則表達式定位到具體位置。

      (三)中文分詞

      通過網(wǎng)絡(luò)爬蟲抓取得到待處理文本之后,需要對其進行中文分詞。中文分詞包括三類算法:基于字符串匹配的分詞;基于理解的分詞;基于統(tǒng)計的分詞。將一個中文句子進行拆分,從一個句子中解析出名詞、動詞、形容詞、副詞等。這樣做的目的是:拆分出的名詞部分,可作為本條文本的對象詞,匹配數(shù)據(jù)庫中的申萬行業(yè)類別表,從而得到這條文本是描述的哪個行業(yè)的市場情緒的;拆分出的形容詞(副詞)部分,可作為本條文本的情緒詞,匹配數(shù)據(jù)庫中的通過調(diào)研得到的情感極性詞極性表,從而得到這條文本是正面情緒還是負面情緒,以及情緒的強弱程度。

      本文使用中科天璣的ICTCLAS詞法分析系統(tǒng),由張華平博士歷經(jīng)多年開發(fā)研制,開源,并提供了多種開發(fā)語言接口,包括C/C++/C#、Java、Python、Hadoop等,可以用于對需要進行分析處理的文本做初始分詞。具體算法分為三個步驟,即原子切分;找出所有可能的原子間組詞方案;N-最短路徑選擇算法。各步驟的具體算法在ICTCLAS詞法分析系統(tǒng)主頁http://ictclas.nlpir.org/ docs可以得到。

      例如,將“房地產(chǎn)業(yè):房產(chǎn)稅謠言四起,樓市溫和上行”進行分詞,效果如圖1所示。

      將結(jié)果匹配數(shù)據(jù)庫中的申萬行業(yè)表和情感極性表。以“房地產(chǎn)業(yè):房產(chǎn)稅謠言四起,樓市溫和上行”為例:得到這條文本是表述“房地產(chǎn)”行業(yè)市場情緒的;“謠言”是負極性詞,極性強度是-1,“上”是正極性詞,情感極性是+2,故而這條文本的綜合情感是正極性的,綜合情感極性是+1。

      由于中文反義句多以“反義詞+形容詞(副詞)”的形式出現(xiàn),需設(shè)計否定詞處理模塊,當遇到否定詞(如“不”,“沒”,“別”,“非”,“無”,“未”,“反”等)時,這個否定詞的作用對象取它后面最鄰近的一個情感極性詞,將其極性取反處理。

      (四)構(gòu)建觀點矩陣及觀點置信度矩陣

      以上是為了得到Black-Litterman資產(chǎn)配置模型中的P、Q、Ω,其中P代表了觀點與觀點對應(yīng)資產(chǎn)的匹配關(guān)系,分為絕對收益和相對收益兩種、Q代表了對應(yīng)于P矩陣中的每個觀點的期望收益、Ω代表了對每個觀點的信心程度。

      至此,得到了Black-Litterman資產(chǎn)配置模型的輸入矩陣P、Q、Ω。

      三、實證研究

      在國內(nèi)A股申萬一級行業(yè)間使用本文所提PSM_Black_Litterman模型進行實證分析。設(shè)兩組對照,以市值為權(quán)重進行資產(chǎn)配置;使用傳統(tǒng)Markowitz資產(chǎn)配置模型得到的權(quán)重進行資產(chǎn)配置。

      (一)數(shù)據(jù)

      從申萬一級行業(yè)28個分類中,選擇相關(guān)系數(shù)較小的13個行業(yè);選擇自2010年2月至2015年1月61個月的行業(yè)指數(shù)數(shù)據(jù),以及各行業(yè)類別中所含流通股市值,數(shù)據(jù)來源東方財富Choice數(shù)據(jù)。這樣共13*61個樣本內(nèi)數(shù)據(jù)。樣本外取自2015年2月至2015年12月進行實證分析。

      (二)市場情緒P、Q、Ω

      在本文應(yīng)用背景下的P為N×N單位矩陣,可不再做計算;Q為N×1維向量,設(shè)第i種行業(yè)類別對應(yīng)的分量為Qi,Ω為N×N維對角矩陣,設(shè)第i種行業(yè)類別對應(yīng)的分量為Ωii。當月數(shù)據(jù)由上月數(shù)據(jù)計算得到,見表1。

      (三)PSM_Black_Litterman模型效果分析

      使用上一小節(jié)得到的P、Q、Ω矩陣數(shù)據(jù),計算各行業(yè)類別的最優(yōu)資本權(quán)重,即由PSM_Black_Litterman模型得到的資本權(quán)重,記為WA;另外,由流通市值計算而得的權(quán)重記為WB;由Markowitz資產(chǎn)配置模型計算而得的權(quán)重記為WC。并計算當按照這樣的權(quán)重進行投資時的組合月度收益率。當月權(quán)重由上月數(shù)據(jù)計算得到。增加不許做空限制。見表2。

      根據(jù)三種方式得到的行業(yè)配置權(quán)重WA、WB、WC,計算2015年2月至2015年12月,共計11個月各自收益情況如下表所示。見表3和表4。

      可見,使用由Markowitz資產(chǎn)配置模型計算得到的權(quán)重WC為依據(jù)進行行業(yè)配置,在收益率均值、幾何收益率角度,優(yōu)于由流通市值計算而得的權(quán)重WB為依據(jù)進行的資產(chǎn)配置;但方差效果卻劣于它。而使用本文所提PSM_Black_Litterman模型,利用由網(wǎng)絡(luò)熱點新聞作為權(quán)重調(diào)節(jié)方式得到的權(quán)重WA進行資產(chǎn)配置,其收益率均值、方差、幾何收益率均優(yōu)于傳統(tǒng)Markowitz模型,同時優(yōu)于由流通市值計算而得的權(quán)重WB為依據(jù)進行的資產(chǎn)配置。

      四、結(jié)論

      Black_Litterman模型的關(guān)鍵問題之一是需要輸入分析師觀點,本文通過網(wǎng)絡(luò)爬蟲技術(shù),抓取門戶網(wǎng)站內(nèi)的相關(guān)行業(yè)情緒,使用文本挖掘技術(shù),提出一種將市場情緒量化為Black_Litterman模型所需P、Q、Ω矩陣的方法,由此提出一種PSM_Black_Litterman(public sentiment mining Black_Litterman)模型。通過實證分析,該模型可有效提高資產(chǎn)配置的平均收益率與幾何收益率,并減小方差。在后續(xù)的研究中,筆者希望通過過濾無效新聞、擴充情感詞庫等方法,致力于進一步提高模型效果。

      參考文獻

      [1]H.Markowitz.1952.PORTFOLIO SELECTION[J].JOURNAL OF FINANCE,7(1):77-91.

      [2]溫琪.金融市場資產(chǎn)選擇與配置策略研究[D].中國科學技術(shù)大學,2011.

      [3]南方基金管理有限公司 柯曉.Black-Litterman模型的初步介紹及應(yīng)用[N].上海證券報,2008-12-10007.

      [4]E.C.B.Bekaert G,Harvey C R,et.1998.al.Distributional characteristics of emerging market returns and asset allocation[J].Journal Portfolio Management,24(2):102-116.

      [5]S.S.S.A.2000.demystification of the Black-Litterman model:managing quantitative and traditional construction[J].Journal of Asset management,1(2):138-150.

      [6]D.W.2001.How to avoid pitfalls in portfolio optimization?putting the Black-Litterman approach at work[J].Financial Markets Portfolio Managemen,15(1):59-75.

      [7]韓正宇.現(xiàn)代投資組合理論述評[J].經(jīng)濟研究參考,2013,60:53-61.

      [8]孫立偉,何國輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲技術(shù)的研究[J].電腦知識與技術(shù),2010,15:4112-4115.

      [9]王強,武港山.對XPath模式定位能力的擴充[J].計算機研究與發(fā)展,2001,06:674-678.

      [10]周程遠.中文自動分詞系統(tǒng)的研究與實現(xiàn)[D].華東師范大學,2010.

      [11]張華平,劉群.基于N-最短路徑方法的中文詞語粗分模型[J].中文信息學報,2002,05:1-7.

      [12]李存青.中文意見挖掘中的特征詞提取以及情感傾向分析[D].重慶大學,2010.

      作者簡介:朱碧穎(1990-),女,漢,北京,碩士研究生,研究方向:文本挖掘,資產(chǎn)配置;趙爽(1990-),男,漢,北京,碩士研究生,主要研究方向:宏觀經(jīng)濟、計量經(jīng)濟。

      猜你喜歡
      資產(chǎn)配置網(wǎng)絡(luò)爬蟲文本挖掘
      數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
      軟件導刊(2016年12期)2017-01-21 15:55:21
      煉鐵廠鐵量網(wǎng)頁數(shù)據(jù)獲取系統(tǒng)的設(shè)計與實現(xiàn)
      基于LDA模型的95598熱點業(yè)務(wù)工單挖掘分析
      1000萬可支配資產(chǎn)的配置方案探討
      中國市場(2016年32期)2016-12-06 11:47:42
      個人高凈值客戶跨境投資業(yè)務(wù)背景與需求分析
      商情(2016年40期)2016-11-28 10:17:12
      從《遠程教育》35年載文看遠程教育研究趨勢
      基于社會網(wǎng)絡(luò)分析的權(quán)威網(wǎng)頁挖掘研究
      主題搜索引擎中網(wǎng)絡(luò)爬蟲的實現(xiàn)研究
      淺析如何應(yīng)對網(wǎng)絡(luò)爬蟲流量
      中國市場(2016年23期)2016-07-05 04:35:08
      慧眼識璞玉,妙手煉渾金
      比如县| 宁津县| 伊宁县| 武安市| 林周县| 拉孜县| 陈巴尔虎旗| 手游| 文昌市| 正镶白旗| 兴安县| 宁乡县| 桦南县| 昌图县| 眉山市| 调兵山市| 郧西县| 托克托县| 衡山县| 阜新市| 昂仁县| 广元市| 前郭尔| 峨山| 甘谷县| 阿拉善盟| 荔波县| 赣州市| 武隆县| 高州市| 揭西县| 武隆县| 屏东市| 河北省| 彰武县| 神池县| 道真| 安岳县| 上饶市| 东乌珠穆沁旗| 龙口市|