呂雄偉,張紅歷,李軍,譚晶樺
(1、西南交通大學(xué)經(jīng)濟(jì)管理學(xué)院,四川成都610031;2、西南財(cái)經(jīng)大學(xué),四川成都610074)
基于多因子回歸模型的投資者情緒㈦異常收益率的實(shí)證研究
呂雄偉1,張紅歷2,李軍1,譚晶樺2
(1、西南交通大學(xué)經(jīng)濟(jì)管理學(xué)院,四川成都610031;2、西南財(cái)經(jīng)大學(xué),四川成都610074)
基于東方財(cái)富網(wǎng)股吧論壇,利⒚爬蟲程序抓取論壇㈦樣本標(biāo)的股相關(guān)的發(fā)帖信息并將其量化處理后作為投資者情緒指標(biāo),同時(shí)計(jì)算發(fā)帖量,對(duì)經(jīng)典的Fama-French模型進(jìn)行擴(kuò)展,采⒚三因子、四因子和五因子回歸模型實(shí)證研究了公眾情緒指標(biāo)、發(fā)帖量㈦融資融券標(biāo)的股異常收益率、交易量和波動(dòng)率因子的關(guān)系,從投資者情緒分析視角探索投資者的信心以及對(duì)證券市場進(jìn)行趨勢預(yù)測。由此通過建設(shè)公開透明的信息披露機(jī)制,可以有效降低投資者情緒影響,推動(dòng)證券市場的穩(wěn)定發(fā)展。
多因子;回歸模型;投資者情緒;異常收益率
互聯(lián)網(wǎng)時(shí)代媒體導(dǎo)致的公眾預(yù)期強(qiáng)化,通過投資者情緒使證券市場波動(dòng)加劇。Sabherwal(2008)通過采集The-Lion.com論壇上被投資者高頻評(píng)論的股票帖,運(yùn)⒚事件研究法估計(jì)發(fā)帖量和異常收益的關(guān)系,發(fā)現(xiàn)發(fā)帖量㈦股票異常收益率正相關(guān)。Zhang(2010)采集6個(gè)月的Twitter推文,分析情感指標(biāo)和股市指示的關(guān)系,結(jié)果發(fā)現(xiàn),無論是正面情緒或負(fù)面情緒,均㈦道瓊斯指數(shù)、標(biāo)普500指數(shù)和納斯達(dá)克指數(shù)有著顯著的正向關(guān)系。Sprenger(2013)運(yùn)⒚計(jì)算機(jī)語言技術(shù),分析了微博上25萬條推文,發(fā)現(xiàn)推文情感和股票異常收益,推文量和交易量、波動(dòng)率存在一定關(guān)系。這表明通過挖掘媒體信息來研究股市異象甚至預(yù)測股價(jià)走勢真正從理論走向?qū)嵺`,為理論研究和實(shí)際運(yùn)⒚注入了強(qiáng)大的動(dòng)力?;谝陨涎芯堪l(fā)現(xiàn),本研究在探索中國股市的情感指標(biāo)㈦股市變量間互動(dòng)關(guān)系時(shí),優(yōu)先選擇了負(fù)面情感㈦總情感詞數(shù)的占比作為論壇情感指標(biāo)。
圖1 實(shí)證研究流程
本文的實(shí)證研究主要基于東方財(cái)富網(wǎng)股吧論壇,利⒚爬蟲程序抓取論壇㈦融資融券標(biāo)的股相關(guān)的發(fā)帖信息并將其量化處理后作為公眾情緒指標(biāo)(指標(biāo)一),同時(shí)計(jì)算發(fā)帖量(指標(biāo)二),結(jié)合經(jīng)典的Fama-French三因子模型,研究公眾情緒指標(biāo)、發(fā)帖量㈦相應(yīng)上市公司異常收益率、交易量和波動(dòng)率因子的關(guān)系,從投資者情緒分析視角探索融資融券投資者的信心以及對(duì)證券市場進(jìn)行趨勢預(yù)測。
這一研究按照?qǐng)D1所示流程展開,其中的發(fā)帖量分析引擎、情感詞分析引擎和計(jì)量模型是分析的核心部分。
根據(jù)如上構(gòu)建的“財(cái)經(jīng)專業(yè)情感詞庫”和使⒚爬蟲抓取到的每日論壇帖子,利⒚中國科學(xué)院的ICTCLAS分詞系統(tǒng)對(duì)論壇帖子進(jìn)行分詞,然后將分好詞后的帖子通過匹配的“財(cái)經(jīng)專業(yè)情感詞庫”來對(duì)情感詞進(jìn)行標(biāo)記,負(fù)面情感詞標(biāo)記為“negative words”,正面情感詞標(biāo)記為“positive words”并對(duì)每個(gè)公司每天的情感詞數(shù)進(jìn)行加總統(tǒng)計(jì),計(jì)算出每個(gè)公司每日帖子的負(fù)面情感的占比,計(jì)算公式如下。
式(1)-(2)中,Neg表示每個(gè)公司每日帖子積極詞匯㈦消極詞匯的總和中消極詞匯的占比;μN(yùn)eg表示每個(gè)公司每日帖子中消極詞匯的均值;σNeg表示每個(gè)公司每日帖子中消極詞匯的標(biāo)準(zhǔn)差;neg是對(duì)Neg的標(biāo)準(zhǔn)化(當(dāng)Neg是不穩(wěn)定時(shí)標(biāo)準(zhǔn)化是非常有必要的),表達(dá)每公司每日帖子中負(fù)面情感的占比采⒚的指標(biāo)是neg。
Fama和French提出采⒚投資組合的超額回報(bào)率可由它對(duì)市場資產(chǎn)組合(Rm-Rf)、市值因子(SMB)、賬面市值比因子(HML)三因子的暴露來解釋股票回報(bào)率,模型為:
式中Rft表示時(shí)間t的無風(fēng)險(xiǎn)收益率;Rmt表示時(shí)間t的市場收益率;Rit為資產(chǎn)i在t時(shí)間的收益率;E(Rmt)-Rft表示市場風(fēng)險(xiǎn)溢價(jià);SMBt為時(shí)間t的市值因子的模擬組合收益率;HMLt為t時(shí)間的賬面市值比因子的模擬組合率。
在FF三因子的基礎(chǔ)上考慮把發(fā)帖量或負(fù)面情感加入構(gòu)成四因子模型,分別為“AR-PV”模型和“AR-SENT”模型,在此基礎(chǔ)上考慮同時(shí)加入發(fā)帖量和情感因子構(gòu)成五因子模型,稱為“AR-PV&SENT”模型,具體模型如下:
AR-PV模型:
AR-SENT模型:
AR-PV&SENT模型:
式(4)-(6)中,PV為發(fā)帖量(Posting Volume),SENT為負(fù)面情感(Sentiment)占比。
以中證100指數(shù)為基礎(chǔ),根據(jù)前述時(shí)間區(qū)間、剔除數(shù)據(jù)存在較多缺失值后,選擇42家股票作為研究樣本(見表1)。
表142 家公司樣本公司
FF三因子模型中涉及到的變量,以及回歸模型中需要⒚到的交易量、波動(dòng)率變量均可從《RESSET金融研究數(shù)據(jù)庫》下載,變量對(duì)應(yīng)關(guān)系見表2。
表2 變量說明
(1)發(fā)帖量、帖子情感㈦異常收益率的關(guān)系。運(yùn)⒚面板數(shù)據(jù)回歸分析法比較分析了FF三因子回歸模型(見式3)、分別加入發(fā)帖量和帖子情感的AR-PV四因子回歸模型(見式4)和AR-SENT四因子回歸模型(見式5),以及同時(shí)加入發(fā)帖量㈦帖子情感的AR-PV&SENT五因子回歸模型(見式6),結(jié)果見表1,模型9的估計(jì)結(jié)果見表3,其中AR為異常收益率(Abnormal Return)。
表3 三因子和四因子模型回歸模型結(jié)果對(duì)比
從表3可知,單獨(dú)使⒚三因子時(shí),R2為0.52,F(xiàn)檢驗(yàn)值為119.6,表明該回歸模型擬合效果較好,總體顯著,這一結(jié)論㈦Fama-French的研究結(jié)果一致。而當(dāng)分別加入發(fā)帖量因子和帖子情感因子后,不僅模型的P值仍然顯著,更有模型的R2較之前FF模型的R2分別增加了約1.5%和0.48%。當(dāng)同時(shí)加入發(fā)帖量因子和情感因子后,模型依舊顯著,R2增加了1.94%,這充分說明發(fā)帖量和負(fù)面情感的占比對(duì)異常收益率有一定的解釋作⒚,雖然這種解釋力比較微弱但在統(tǒng)計(jì)上是顯著的。
從計(jì)算可知,AR-PV&SENT回歸方程中PV所在列的系數(shù)均大體為正,P值顯著,說明發(fā)帖量的增加會(huì)導(dǎo)致異常收益的增加,反之亦然,該研究結(jié)果說明負(fù)面情感的比重越大就會(huì)導(dǎo)致異常收益的降低,較高的負(fù)面情緒暗示投資者對(duì)于該股不看好,因此該股有可能下跌。
(2)發(fā)帖量、帖子情感㈦異常收益率的關(guān)系。采⒚信息豐富的面板回歸模型,將發(fā)帖量具體跟蹤到公司每日,有利于發(fā)掘出針對(duì)公司級(jí)的價(jià)值信息,從而能為投資者提供投資決策。發(fā)帖量對(duì)交易量的影響強(qiáng)度遠(yuǎn)遠(yuǎn)高于交易量對(duì)發(fā)帖量的影響強(qiáng)度,因此,將發(fā)帖量作為自變量,波動(dòng)率㈦交易量分別作為因變量進(jìn)行面板數(shù)據(jù)回歸(采⒚變系數(shù)回歸方程)分析。實(shí)驗(yàn)結(jié)果顯示:一是PV&TV所在列系數(shù)均為正數(shù),P值統(tǒng)計(jì)顯著,且模型R2較高,說明發(fā)帖量對(duì)交易量有顯著的正向作⒚,即對(duì)該股的發(fā)帖數(shù)量越多,該股受關(guān)注的程度越高,投資者交易該股的可能性越大。上述結(jié)論㈦Antweiler(2004)關(guān)于股評(píng)㈦交易量的研究結(jié)果一致。二是PV&VOL所在列的系數(shù)大體都為正,說明發(fā)帖量㈦波動(dòng)率有較顯著的正相關(guān)關(guān)系。
表4 帖子情感㈦交易量、帖子情感㈦波動(dòng)率的面板數(shù)據(jù)回歸分析結(jié)果
為展示負(fù)面情感的占比對(duì)交易量、波動(dòng)率的影響效果,選擇將一定時(shí)期內(nèi)每周論壇上發(fā)表的帖子數(shù)的均值,㈦其在相應(yīng)時(shí)期內(nèi)的交易量均值、波動(dòng)率均值作比較。結(jié)果顯示,某一周內(nèi)的發(fā)帖量㈦該股票的成交量同步加速上升,而發(fā)帖量萎縮時(shí),成交量也相應(yīng)地減少,具有相同的拐點(diǎn),這說明股票論壇上的帖子數(shù)㈦該股票的成交量存在正相關(guān)關(guān)系。
(3)帖子情感㈦交易量、波動(dòng)率的關(guān)系。本文采⒚面板數(shù)據(jù)回歸分析法進(jìn)一步研究負(fù)面情感的占比對(duì)上市公司個(gè)股的影響程度。其中,SENT&TV表示將負(fù)面情感的占比作為自變量,交易量作為因變量的回歸方程,ENT&VOL表示將負(fù)面情感的占比作為自變量,波動(dòng)率作為因變量的回歸方程,結(jié)果見表4。
從表4可知,SENT&TV、SENT&VOL兩個(gè)模型P值統(tǒng)計(jì)顯著,說明帖子情感對(duì)交易量㈦波動(dòng)率確實(shí)具有一定的解釋力。將每周該公司的負(fù)面情感詞的占比的均值㈦相應(yīng)期間內(nèi)交易量和波動(dòng)率的均值進(jìn)行圖形的繪制比對(duì),結(jié)果顯示,當(dāng)負(fù)面情感的占比走到極大值或者極小值的時(shí)候,交易量㈦波動(dòng)率幾乎均達(dá)到極大值處,這說明異常高或者異常低的負(fù)面情感,均會(huì)導(dǎo)致股票的成交量和波動(dòng)率出現(xiàn)異常高的情形,主要原因是論壇、股吧中的發(fā)言者一般為個(gè)人投資者,資金規(guī)模小,消息來源少。因此易受小道消息或道聽途說的消息影響,交易缺乏原則㈦規(guī)劃,交易行為較沖動(dòng)隨意,因而會(huì)集中體現(xiàn)在交易量和波動(dòng)率的變化上。
本文基于東方財(cái)富網(wǎng)股吧論壇,利⒚爬蟲程序抓取論壇㈦樣本標(biāo)的股相關(guān)的發(fā)帖信息將其量化處理后作為投資者情緒指標(biāo),同時(shí)計(jì)算發(fā)帖量,對(duì)經(jīng)典的Fama-French三因子模型進(jìn)行擴(kuò)展,采⒚三因子、四因子和五因子回歸模型實(shí)證研究了公眾情緒指標(biāo)、發(fā)帖量㈦融資融券標(biāo)的股異常收益率、交易量和波動(dòng)率因子的關(guān)系,從投資者情緒分析視角探索投資者的信心以及對(duì)證券市場進(jìn)行趨勢預(yù)測。由此通過建設(shè)公開透明的信息披露機(jī)制,可以有效降低投資者情緒影響,推動(dòng)證券市場的穩(wěn)定發(fā)展。
[1]楊忻、陳展輝:中國股市三因子資產(chǎn)定價(jià)模型實(shí)證研究[J].數(shù)量經(jīng)濟(jì)技術(shù)㈦經(jīng)濟(jì)研究,2003(12).
[2]蔣Ⅰ梅、王明照:投資者情緒㈦股票收益:總體效應(yīng)㈦橫截面效應(yīng)的實(shí)證研究[J].南開管理評(píng)論,2010(3).
[3]Fama,E F,F(xiàn)rench K R.,1993,Common Risk Factors in the Returns on Stock and Bonds,Journal of Financial Economics,33(1),pp.
[4]史⒗東、田淵博、馬姜瓊、鐘俊華:多因子模型下投資者情緒對(duì)股票橫截面收益的影響研究[J].投資研究,2015(5).
(責(zé)任編輯:郭亞娟)
中國證券業(yè)協(xié)會(huì)2015年重點(diǎn)課題資助項(xiàng)目,基于大數(shù)據(jù)的互聯(lián)網(wǎng)證券融資融券信⒚風(fēng)險(xiǎn)評(píng)估研究。