• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Bi-LSTM模型挖掘的股吧投資者情緒對股價泡沫的影響

      2023-01-03 06:38:24尹海員楊慶松
      管理學(xué)報 2022年12期
      關(guān)鍵詞:股價泡沫投資者

      尹海員 楊慶松

      (陜西師范大學(xué)國際商學(xué)院)

      1 研究背景

      我國證券市場發(fā)展速度快,但存在歷史短、投資者成熟度低、個人投資者占據(jù)主體、市場機制不健全等問題。股票市場充斥著非理性行為,股票價格暴漲暴跌。研究發(fā)現(xiàn),2000~2017年間我國股票市場出現(xiàn)了多次泡沫,其中最長泡沫周期長達17個月,隱藏著巨大的市場風(fēng)險[1]。

      股價泡沫是股價脫離實際價值的暴漲暴跌。有效市場理論認為,如果金融市場是有效的,股票價格將及時反映所有基本面信息,非理性投資者造成的股價偏離會被套利者及時糾正。噪聲交易者理論則認為,噪音交易者的預(yù)期往往受到無意義的市場信號和情緒的影響,從而造成股票價格的偏差?,F(xiàn)有文獻也表明,投資者的非理性行為會降低股價的信息含量和市場定價效率[2]。噪音交易者理論成立的前提是:情緒波動在噪音交易者之間具有系統(tǒng)相關(guān)性,這往往被理性主義者所駁斥。如果此前提理論上成立,那么投資者群體的過度樂觀和悲觀在套利限制存在的市場上,都會體現(xiàn)在股價的形成中。情緒通過羊群效應(yīng)和正反饋效應(yīng)最終促成股價泡沫的形成。投資者情緒在噪音交易者之間是否具有系統(tǒng)相關(guān)性,是否及如何對股價泡沫產(chǎn)生影響?這是本研究需要探討的主要問題。

      本研究以滬深300指數(shù)成分股為研究對象,抓取東方財富股吧上的個股評論文本,通過搭建雙向長短時記憶(Bi-LSTM)模型對文本進行情感分類,構(gòu)建日度投資者情緒指標;同時,使用PHILLIPS等[3]提出的GSADF法檢驗樣本股價泡沫,利用BSADF法獲得個股泡沫持續(xù)期及泡沫強度;并在此基礎(chǔ)上建立面板數(shù)據(jù)模型,分析投資者情緒與股價泡沫之間的內(nèi)在關(guān)系。

      2 文獻綜述

      2.1 投資者情緒挖掘技術(shù)

      金融領(lǐng)域中,傳統(tǒng)的文本情感分析法(如情感詞典匹配法和有監(jiān)督的機器學(xué)習(xí)法)往往泛化性較弱且會忽視上下文的語義關(guān)系[4,5]。近年來,深度學(xué)習(xí)模型(如卷積神經(jīng)網(wǎng)絡(luò)CNN和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN等)在文本情感分析領(lǐng)域被廣泛應(yīng)用。其優(yōu)點在于,模型可以考慮到詞語位置并善于處理不規(guī)范和大規(guī)模文本[6]。

      CNN的特點在于,可以提取文本的細粒度局部特征,其準確率和召回率等指標往往優(yōu)于傳統(tǒng)的機器學(xué)習(xí)模型,現(xiàn)已被廣泛用于網(wǎng)絡(luò)大數(shù)據(jù)分析中[7]。RNN模型的特征識別兼顧當期輸入和歷史信息,有利于具有時間依賴關(guān)系的文本序列的情感分類任務(wù)[8]。RNN模型在訓(xùn)練過程中常出現(xiàn)梯度消失和梯度爆炸問題。學(xué)界基于RNN模型進行改進,出現(xiàn)了長短時記憶(LSTM)模型、門控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)模型等。這些模型克服了RNN模型的缺點,同時保留了其可以結(jié)合上下文語義提取文本特征的優(yōu)勢。LSTM模型目前已被用于金融領(lǐng)域執(zhí)行文本情感分析任務(wù)[9]。Bi-LSTM模型可結(jié)合前后兩個方向的文本特征進行文本情感分類,其分類效果常優(yōu)于LSTM模型[10]。

      2.2 股價泡沫的檢驗

      國內(nèi)外學(xué)者檢測股價泡沫的方法可分為3類:代理變量法、線性檢驗?zāi)P秃头蔷€性檢驗?zāi)P?。代理變量法是指使用與股價泡沫高度相關(guān)的其他金融變量來量化股價泡沫,該方法具有間接性,衡量的精準度存在問題。線性檢驗?zāi)P褪腔趥鹘y(tǒng)的單位根和協(xié)整檢驗的泡沫檢驗方法[11]。該類模型不能檢測出坍塌性泡沫。非線性檢驗?zāi)P椭?,基于馬爾可夫區(qū)制轉(zhuǎn)換的檢驗方法可檢測坍塌性泡沫但會過度接受泡沫存在的假設(shè)[12],而右尾遞歸單位根(SADF)檢驗法不適用于多重和異方差泡沫的檢驗[13]。

      2015年,PHILLIPS等[3]提出了GSADF檢驗法以及對應(yīng)的BSADF泡沫持續(xù)期標記法。2017年,CASPI[14]在EViews軟件中發(fā)布了GSADF檢驗的標準執(zhí)行程序。MONSCHANG等[15]對比了GSADF檢驗法與兩種異方差調(diào)整的GSADF檢驗法,發(fā)現(xiàn)BSADF檢驗在標記泡沫持續(xù)期時,對數(shù)據(jù)頻率的敏感度更低且檢驗精度更高。目前,GSADF檢驗被廣泛應(yīng)用于期貨[16]、股票[17]和房地產(chǎn)[18]等各類資產(chǎn)的泡沫檢驗中。

      2.3 投資者情緒與股價泡沫

      股價泡沫的影響因素可分為宏觀和微觀兩個視角。宏觀因素主要包括制度因素[19]、信用違約互換利差和波動率[20]等。微觀因素主要包括投資者過度自信及投資者情緒[21]等。

      投資者情緒與股市泡沫關(guān)系的研究大多著眼于市場整體泡沫。如羅衎等[22]以中證800指數(shù)為研究對象,發(fā)現(xiàn)社會互動會加劇投資者情緒傳染進而加劇市場泡沫。YAO等[23]用主成分分析法構(gòu)建投資者情緒指數(shù),用剩余收益模型提取了股市泡沫,發(fā)現(xiàn)投資者情緒與股市泡沫成正相關(guān)關(guān)系。PAN[24]以標準普爾500指數(shù)為研究對象,發(fā)現(xiàn)投資者情緒對股市泡沫的產(chǎn)生概率及泡沫大小有顯著影響??傊?,股市泡沫的研究目前以市場整體泡沫的檢驗和成因為主,缺乏從個股視角剖析投資者情緒對泡沫影響機理的探討。

      3 研究設(shè)計

      3.1 數(shù)據(jù)來源

      本研究以滬深300指數(shù)成分股為研究對象,研究期為2018年4月3日~2021年5月31日,觀測頻率為日度數(shù)據(jù)。為保證數(shù)據(jù)的有效性和連續(xù)性,本研究按照以下標準對樣本進行篩選:①剔除金融類上市公司;②剔除在研究期間調(diào)入或調(diào)出滬深300指數(shù)的樣本,以保證研究時段的連續(xù)性;③剔除在個股股吧上平均日度發(fā)貼數(shù)量少于10條的樣本,以保證文本挖掘有足夠的容量;④剔除研究期間出現(xiàn)停牌超過一個月的樣本。最終獲得142只樣本股作為研究對象。

      本研究所使用的投資者發(fā)帖文本來自東方財富股吧。股吧上的投資者多為散戶投資者。來源于股吧的投資者情緒更能直接地反映散戶投資者情緒。研究中,散戶投資者由于缺乏有效的市場信息和信息處理能力往往被當作噪音交易者。研究噪音交易者的情緒是否對股價泡沫產(chǎn)生系統(tǒng)影響具有重要意義。相較于國內(nèi)其他股票交流論壇,東方財富網(wǎng)股吧論壇提供了股票行情、公司財務(wù)數(shù)據(jù)、交易明細等多維度資料,具有高發(fā)帖頻率和高內(nèi)容質(zhì)量等優(yōu)勢。本研究使用網(wǎng)絡(luò)爬蟲,抓取了東方財富股吧上滬深300指數(shù)成分股在研究期內(nèi)的日度發(fā)帖文本、閱讀量和發(fā)帖時間等內(nèi)容。在剔除“問董秘”、投票以及重復(fù)發(fā)帖等無效發(fā)帖后,共得到8 259 295條文本。其中,樣本個股日均發(fā)帖量76條,個股最高日均發(fā)帖量343條,個股最低日平均發(fā)帖量15條。其余市場變量數(shù)據(jù)來自于Wind數(shù)據(jù)庫和RESSET數(shù)據(jù)庫。為了保證數(shù)據(jù)的準確性,使用兩個數(shù)據(jù)庫對變量數(shù)據(jù)進行了交叉驗證。同時,為了緩解極端異常值的影響,對樣本期間所有連續(xù)變量在1%上下端進行Winsorize處理。

      3.2 投資者情緒的度量

      3.2.1Bi-LSTM模型

      神經(jīng)網(wǎng)絡(luò)模型進行文本情感分類的基本步驟如下:①文本預(yù)處理:使用正則表達式及jieba分詞工具,對文本進行噪音字符的過濾和分詞。②詞典構(gòu)建及詞向量的獲?。簩⑺形谋窘?jīng)文本預(yù)處理后獲得詞語庫;根據(jù)詞庫中每個詞語出現(xiàn)的頻率對其進行編號,構(gòu)建詞典;接著利用構(gòu)建好的詞典,將文本轉(zhuǎn)化為數(shù)字序列;再調(diào)用embedding層,將數(shù)字序列化后的文本轉(zhuǎn)化為詞向量矩陣。③數(shù)據(jù)輸入和特征提?。簩⒃~向量矩陣輸入Bi-LSTM模型,根據(jù)訓(xùn)練后的模型參數(shù)提取文本特征。④結(jié)果輸出:將Bi-LSTM模型的輸出結(jié)果輸入到logsoftmax層。softmax函數(shù)的表達式見式(1),其中y代表Bi-LSTM模型輸出結(jié)果。softmax函數(shù)的計算結(jié)果為該文本屬于積極或消極某一類別的概率值。logsoftmax函數(shù)是對softmax函數(shù)計算結(jié)果的對數(shù)化處理,可以解決softmax函數(shù)固有的數(shù)值計算問題。根據(jù)logsoftmax輸出值的大小可判斷該文本的具體類別。

      softmax(y)=exp(y)/∑exp(y)。

      (1)

      LSTM模型神經(jīng)元的內(nèi)部結(jié)構(gòu)見圖1。

      圖1 LSTM模型神經(jīng)元內(nèi)部結(jié)構(gòu)

      一個神經(jīng)元的信息傳播過程見式(2)~式(8):

      ft=logistic(Wfxt+Ufht-1+bf);

      (2)

      it=logistic(Wixt+Uiht-1+bi);

      (3)

      (4)

      (5)

      ot=logistic(Woxt+Uoht-1+bo);

      (6)

      ht=ot×tanh(Ct);

      (7)

      (8)

      3.2.2Bi-LSTM模型訓(xùn)練、測試與投資者情緒量化

      本研究使用分層抽樣法,在各樣本股的發(fā)帖中隨機抽取了8 000條文本作為模型訓(xùn)練集、2 000條文本作為模型測試集。邀請了10位金融學(xué)碩士分別對這10 000條訓(xùn)練集和測試集文本做人工標注,將每條文本分為“樂觀”或“悲觀”兩類。針對標注結(jié)果不一致的文本,10位標注者進行了集中討論,最終給出一致意見,形成最終訓(xùn)練(測試)集。接著,利用訓(xùn)練集進行模型訓(xùn)練,利用測試集進行模型測試。為提升模型訓(xùn)練速度,在支持GPU的主機上進行模型訓(xùn)練和測試,主機型號為NVIDIA GeForce RTX 3090。訓(xùn)練和測試結(jié)果表明,模型樣本外準確率為73%,可以滿足研究精度要求。最后,使用訓(xùn)練后的模型,將8 259 295條文本進行情感分類,共得到悲觀發(fā)帖量5 210 227條,樂觀發(fā)帖量3 049 068條。

      利用式(9)對樣本進行投資者情緒(Se)量化:

      Se=ln((1+Mpos)/(1+Mneg)) ,

      (9)

      式中,Mpos表示某股票在某日的加權(quán)積極情緒帖子總數(shù);Mneg表示某股票在某日的加權(quán)消極情緒帖子總數(shù),權(quán)重為該帖子的閱讀總量。統(tǒng)計區(qū)間為第t-1日15∶00到第t日15∶00。之所以以閱讀量為權(quán)重,是因為帖子本身只能代表發(fā)帖人的個人情緒,難以反映股吧上投資者的整體情緒。此外,股吧上存在大量網(wǎng)絡(luò)水軍,他們的發(fā)帖并不能代表其真正情緒和決策。然而,股吧上的發(fā)帖人所表達的情緒具有傳染性,瀏覽帖子的投資者易受到這些情緒的影響,進而在市場上形成強勢的意見環(huán)境。加權(quán)之后的投資者情緒可以更全面科學(xué)地反映股吧投資者的整體情緒。投資者情緒變量Se會隨著積極情緒帖子的數(shù)量和閱讀量的增加而提高,反之則降低。當Mpos等于Mneg時,該指數(shù)為0。經(jīng)統(tǒng)計,變量Se的均值為-0.145,標準差為0.397,極小值為-5.227,極大值為5.264,偏度-1.764,峰度為42.921。說明研究期間內(nèi)投資者情緒偏向悲觀,投資者情緒指數(shù)具有一定的左偏和尖峰性質(zhì)。

      3.3 股價泡沫的度量

      考慮到市盈率比股票價格更能反映公司的內(nèi)在價值,本研究選擇個股市盈率日度數(shù)據(jù),檢驗了樣本股的泡沫存在性,并利用BSADF檢驗得到泡沫持續(xù)期。SADF、GSADF以及BSADF檢驗三者均是以右尾單位根檢驗法為基礎(chǔ),并做進一步拓展的檢驗方法。一般性右尾單位根檢驗的拒絕域在臨界值的左邊,當檢驗統(tǒng)計量落入拒絕域,則拒絕序列是平穩(wěn)或單位根過程的原假設(shè),接受序列變量存在泡沫特征的備擇假設(shè)。SADF、GSADF及BSADF檢驗則是在右尾單位根檢驗基礎(chǔ)上引入了遞歸思想,具體遞歸過程如下:

      (10)

      式(10)是SADF檢驗統(tǒng)計量的定義式,其中r0、r1和r2均代表全樣本的部分比例;r0表示最小有效樣本窗口;具體檢驗中r1恒等于0并作為樣本窗口起點;r2為窗口終點,取值范圍為[r0,1]。r2從r0的位置向前遞歸,每次遞歸增加一個樣本并進行一次右尾單位根檢驗,直到r2取值為1。SADF檢驗統(tǒng)計量等于所有右尾單位根檢驗統(tǒng)計值的上界值。

      (11)

      式(11)是GSADF檢驗統(tǒng)計量的定義式。與SADF檢驗不同的是,GSADF檢驗起點r1不再恒等于0。r1的取值范圍為[0,r2-r0]。GSADF統(tǒng)計量被定義為r1和r2所有可行范圍內(nèi)右尾單位根檢驗統(tǒng)計值的最大值。其中,GSADF統(tǒng)計量的極限分布為

      (12)

      式中,W表示標準維納過程;rw=(r2-r1),當r1=0,r2=1時,該式為ADF統(tǒng)計量的極限分布;當r1=0,r2從[r0,1]之間取值時,該式為SADF統(tǒng)計量的極限分布。顯然,SADF檢驗是GSADF檢驗的一種特殊情況,用GSADF法檢驗全樣本的泡沫存在性問題會更準確。BSADF檢驗統(tǒng)計量的定義式為

      (13)

      簡而言之,BSADF檢驗是針對特定r2進行的后向SADF檢驗。與正常SADF檢驗的區(qū)別在于,BSADF檢驗的r2固定,而r1在區(qū)間[0,r2-r1]之間取值。GSADF統(tǒng)計量與BSADF統(tǒng)計量的聯(lián)系為

      (14)

      綜上,SADF檢驗本質(zhì)上是起點固定,終點向前遞歸的并不斷擴充樣本容量的一系列右尾單位根檢驗。SADF統(tǒng)計量則是一系列右尾單位根檢驗統(tǒng)計值的最大值,可以判斷全樣本泡沫的存在性。GSADF檢驗是起點和終點均向前遞歸的一系列單位根檢驗,GSADF統(tǒng)計量可以對全樣本進行泡沫存在性的檢驗。BSADF檢驗是終點固定而起點向后遞歸的檢驗,BSADF統(tǒng)計量針對的是部分樣本泡沫存在性的檢驗統(tǒng)計量。因此,針對每個可行范圍的r2進行BSADF檢驗,得到BSADF的統(tǒng)計值序列,該序列與臨界值序列進行比較,大于臨界值的位置就是處于泡沫持續(xù)期。

      表1 部分樣本GSADF檢驗結(jié)果

      圖2 部分樣本與滬深300指數(shù)的BSADF檢驗結(jié)果

      基于上述基礎(chǔ)研究,本研究設(shè)定了劃分泡沫階段的虛擬變量Be,若某股票在某一日處于泡沫持續(xù)期,則Be=1,否則為0。此外,更大的BSADF統(tǒng)計值意味著更高的泡沫強度,因此本研究設(shè)定衡量泡沫強度指標Bs,其值等于某股票在某一日的BSADF檢驗統(tǒng)計值。

      3.4 控制變量

      參考趙汝為等[25]的研究,本研究選取以下變量作為控制變量:①市凈率、市銷率及公司規(guī)模等來控制公司價值因素;②凈資產(chǎn)收益率和資產(chǎn)負債率變化量等來控制公司財務(wù)特征因素;③流通股比例變化、股權(quán)集中度變化以及機構(gòu)持股比例變化等來控制股權(quán)特征因素;④為了排除市場層面和宏觀經(jīng)濟周期的影響,選取市場泡沫整體強度及國內(nèi)生產(chǎn)總值增長率(G)作為控制變量;⑤為區(qū)分投資者情緒與投資者關(guān)注度的不同,以某股票在某一日所有發(fā)帖的閱讀量之和作為投資者關(guān)注度控制變量;⑥引入解釋變量滯后一期和滯后二期,以考察投資者情緒對股價泡沫影響的延續(xù)性。

      本研究主要變量的釋義見表2。

      3.5 基礎(chǔ)回歸模型

      本研究的被解釋變量包括泡沫存在性(Be)和泡沫強度(Bs),分別建立面板Logit回歸模型和面板回歸模型進行主回歸檢驗。經(jīng)過初步檢驗,兩模型中均具有顯著的個體效應(yīng),拒絕使用混合回歸模型的原假設(shè)。進一步經(jīng)過Hausman檢驗后發(fā)現(xiàn),兩模型均拒絕了隨機效應(yīng)模型的原假設(shè)。最終構(gòu)建兩個個體固定效應(yīng)基礎(chǔ)回歸模型,即泡沫存在性的面板Logit模型和泡沫強度的面板回歸模型:

      (15)

      Bs=α0+β1Se+∑βkC+γ。

      (16)

      式中,Be=1則代表泡沫存在;α0為截距項;β1、βk為系數(shù);C為系列控制變量;γ為擾動項。

      4 實證分析

      4.1 描述性統(tǒng)計與相關(guān)性分析

      主要變量的描述性統(tǒng)計結(jié)果見表3。表3中,變量PB和PS因個別股票停牌存在少量數(shù)據(jù)缺失;變量Dc、Di、Do、Dr和Dl因經(jīng)過差分處理,樣本總量均減少142。本研究后續(xù)所有回歸模型中,因各控制變量樣本量存在差異、各回歸模型自身要求以及分組回歸要求等原因,樣本量各有不同。由表3可知:①因變量Be的均值為0.051。結(jié)合前文GSADF檢驗結(jié)果:142只樣本股中的61.7%顯著存在泡沫,綜合說明在橫截面方向個股泡沫出現(xiàn)的頻率較高,但是在時間序列上個股泡沫出現(xiàn)的頻率并不高,與現(xiàn)實情況較為吻合。經(jīng)統(tǒng)計,所有泡沫的平均持續(xù)天數(shù)為5.21天;②因變量Bs整體上呈現(xiàn)右偏、尖峰分布且其正向極端值較大;③第9列展示了所有變量的平穩(wěn)性檢驗結(jié)果,可以發(fā)現(xiàn)所有變量均為平穩(wěn)序列;④第10列是按照某股票在某一日是否存在泡沫將樣本觀測值分為兩組后,針對其余變量所做的均值T檢驗,結(jié)果顯示解釋變量Se以及大部分控制變量在兩組之間均顯著存在差異。通過變量之間的相關(guān)性檢驗結(jié)果(1)限于篇幅,變量之間的相關(guān)系數(shù)矩陣表格未展示,留存?zhèn)渌?。發(fā)現(xiàn),因變量Be、Bs與當期投資者情緒Se顯著正相關(guān),與其余控制變量也顯著相關(guān)。

      4.2 投資者情緒對泡沫存在性的影響

      投資者情緒對泡沫存在性和泡沫強度的影響見表4。表4 中列(2)和列(3)分別為依次加入自變量滯后一期、滯后二期與其余控制變量的回歸結(jié)果??梢钥闯觯谒谢貧w結(jié)果中,投資者情緒Se均在1%的水平上顯著正向影響泡沫存在性Be??刂谱兞糠矫?,滯后一期和滯后二期投資者情緒Se-1和Se-2系數(shù)均小于當期投資者情緒系數(shù);投資者情緒對泡沫存在概率的正向影響具有一定的延續(xù)性;投資者關(guān)注度A對泡沫存在的概率也具有顯著正向影響,但其系數(shù)小于Se、Se-1和Se-2的系數(shù);市凈率PB、市銷率PS和公司規(guī)模Si均顯著正向影響股價泡沫的存在概率。列(3)中,Dr和Dl對泡沫存在概率的影響不顯著,說明泡沫存在概率對公司收益和公司債務(wù)的變化并不敏感;Di、Do和Dc對泡沫存在概率的影響不顯著;G和Bm顯著正向影響泡沫的存在概率,即個股泡沫存在概率隨國內(nèi)宏觀經(jīng)濟水平和市場泡沫強度的提高而提高。

      4.3 投資者情緒對泡沫強度的影響

      由表4的列(4)~列(6)可知,在所有回歸結(jié)果中,投資者情緒至少在10%的水平上對泡沫強度具有顯著正向影響。控制變量方面,Se-1和Se-2對泡沫強度的影響在加入所有控制變量后不再顯著,投資者情緒對泡沫強度的正向影響延續(xù)性不強;投資者關(guān)注度A對泡沫強度具有顯著正向影響,但其系數(shù)小于Se的系數(shù);市凈率PB和市銷率PS顯著正向影響股價泡沫強度;公司規(guī)模Si對泡沫強度的影響不顯著;Dr和Dl對股價泡沫強度的影響不顯著,說明股價泡沫強度對公司收益和公司債務(wù)變化的敏感度不高。同理,股價泡沫強度對機構(gòu)持股比例變化Di、流通股比例變化Do和股權(quán)集中度變化Dc也不敏感。最后,市場泡沫強度Bm顯著正向影響個股泡沫強度,而G對個股泡沫強度的影響不顯著。

      表4 投資者情緒對泡沫存在性和泡沫強度的影響

      5 進一步研究:異質(zhì)性和中介路徑

      5.1 投資者情緒對股價泡沫影響的異質(zhì)性分析

      根據(jù)已有研究[26],投資者情緒對股票收益率的影響受股權(quán)集中度和產(chǎn)權(quán)性質(zhì)等因素的影響顯著。投資者情緒對股價泡沫的影響是否因公司規(guī)模、股權(quán)集中度等截面特征的不同而存在異質(zhì)性,需進一步討論。基于公司規(guī)模的子樣本異質(zhì)性分析結(jié)果見表5。本研究按照公司市值是否小于中位數(shù)的標準,將全部樣本分為小規(guī)模和大規(guī)模兩組子樣本。由表5可知,無論因變量是Be還是Bs,無論是否加入Se-1和Se-2,小規(guī)模樣本組Se的系數(shù)絕對值均大于大規(guī)模樣本組Se的系數(shù)絕對值,顯著性水平也是如此,說明當期投資者情緒對股價泡沫存在概率以及泡沫強度的影響,隨公司規(guī)模的擴大而減弱?;诠蓹?quán)集中度差異和產(chǎn)權(quán)性質(zhì)的分組回歸結(jié)果(2)限于篇幅,基于股權(quán)集中度差異和產(chǎn)權(quán)性質(zhì)的分組回歸結(jié)果未展示,留存?zhèn)渌鳌?芍?,無論是否加入Se-1和Se-2,Se對Be和Bs的正向影響隨股權(quán)集中度的提高而降低??赡艿脑蛟谟?,股權(quán)集中度是衡量公司股權(quán)分布狀態(tài)和公司穩(wěn)定性的指標,股權(quán)集中度越高,公司決策效率以及穩(wěn)定性也越高,應(yīng)對突發(fā)事件的能力也越強,泡沫出現(xiàn)的概率和強度也越低。此外,非國有企業(yè)當期投資者情緒對泡沫存在概率以及泡沫強度的正向影響相比國有企業(yè)更強,國有企業(yè)的股價相對更穩(wěn)定。

      表5 基于公司規(guī)模的異質(zhì)性分析回歸結(jié)果

      5.2 中介效應(yīng)檢驗

      已有研究發(fā)現(xiàn),投資者情緒通過影響市場交易量進而影響股票收益率[27]。趙宣凱等[28]也發(fā)現(xiàn),市場情緒越高,盈余公告前的股票交易量越大,投資者的投機行為也越瘋狂。王高義[29]的研究也表明,超額交易量與未來股價泡沫破滅概率顯著正相關(guān)。理論上,投資者情緒直接影響的是投資者決策行為,具有積極情緒的投資者傾向于買入股票;反之,傾向于賣出股票。隨著市場上積極情緒的積累,看漲買入股票的投資者逐漸增多,交易量增大,股價提高,加之股市羊群效應(yīng)、正反饋效應(yīng)以及套利限制的存在,股價泡沫快速出現(xiàn);隨著市場上消極情緒的醞釀,看跌賣出股票的投資者增多,交易量同樣增大,而股價下跌,泡沫破裂。泡沫的產(chǎn)生和破滅過程雖然均伴隨交易量的激增,但由于股價的表現(xiàn)不同,最終體現(xiàn)為總交易金額的不同。因此可以認為,投資者情緒以個股交易金額為中介對股價泡沫產(chǎn)生影響。為了驗證上述猜想,本研究使用個股日度交易金額作為中介變量,進行中介效應(yīng)檢驗,符號表示為Vo。參考溫忠麟等[30]的做法,建立如下面板數(shù)據(jù)中介效應(yīng)模型:

      D=α0+β1Se+∑βkC+γ;

      (17)

      M=α0+β1Se+∑βkC+γ;

      (18)

      D=α0+β1Se+β2M+∑βkC+γ,

      (19)

      式中,D代表因變量Be或Bs;M代表中介變量Vo;β2為M的系數(shù)。

      中介效應(yīng)的檢驗結(jié)果見表6。由表6可知,當期投資者情緒Se顯著正向影響個股日度交易總金額Vo;在沒有加入中介變量之前,Se顯著正向影響B(tài)e和Bs;在加入中介變量之后,Vo在1%的水平上顯著正向影響B(tài)e和Bs;Se對泡沫存在概率、泡沫強度的影響系數(shù)和顯著性水平相對加入中介變量前有所下降。上述結(jié)果表明,投資者情緒以個股當期交易總金額為中介,正向影響泡沫出現(xiàn)的概率及泡沫強度。該結(jié)論由Sobel檢驗也可得到證實:Sobel、good1及good2統(tǒng)計值均顯著拒絕不存在中介效應(yīng)的原假設(shè)。此外,Sobel檢驗結(jié)果表明,投資者情緒通過個股當期交易總金額對泡沫存在概率具有22.2%的中介效應(yīng),對泡沫強度具有56.4%的中介效應(yīng)。

      6 內(nèi)生性討論與穩(wěn)健性檢驗

      6.1 內(nèi)生性討論:工具變量檢驗

      為盡量消除內(nèi)生性問題,在實證中使用固定效應(yīng)模型,并盡可能多地選擇了可能影響股價泡沫的控制變量,但仍存在由雙向因果造成的內(nèi)生性問題。本研究選擇同行業(yè)同期的其他公司投資者情緒均值(符號表示為Seo)作為工具變量進行檢驗。檢驗結(jié)果見表7。表7中列(1)的F值為16.456,大于10,不存在弱工具變量問題。由列(2)和列(3)的工具變量回歸結(jié)果可知,當期投資者情緒仍至少在10%的水平上顯著正向影響股價泡沫強度和泡沫存在概率,這證明了前文實證結(jié)果的可靠性。

      表6 交易金額的中介效應(yīng)檢驗

      表7 工具變量及DID模型檢驗

      6.2 內(nèi)生性討論:DID檢驗

      變量遺漏問題可能是造成本研究內(nèi)生性問題的來源之一。雙重差分模型(DID)可以通過組內(nèi)差分和組間差分,將隨時間變化和不變的擾動項剔除掉,進而更有效地排除潛在的內(nèi)生性問題。DID模型需要將樣本在橫截面維度和時間序列維度各分為兩類。橫截面維度上,本研究將樣本股票分為國有和非國有兩類,設(shè)置虛擬變量OW,OW=1代表上市公司為國有企業(yè);否則為非國有企業(yè)。時間序列維度上,本研究的研究期橫跨國內(nèi)新冠疫情爆發(fā)時間點 2019年12月8日,因此以新冠疫情爆發(fā)時間為節(jié)點劃分研究期,設(shè)置虛擬變量CV,CV=1代表時間處于2019年12月8日之后,新冠疫情爆發(fā);否則處于2019年12月8日之前。設(shè)置變量Did代表OW和CV的交乘項,建立DID模型,觀察DID模型下內(nèi)生性問題是否存在,并進一步觀察疫情爆發(fā)對不同產(chǎn)權(quán)性質(zhì)樣本股價泡沫的影響是否存在顯著差異。

      本研究截取了2019年12月8日前后各兩個月時間的數(shù)據(jù)做平衡趨勢檢驗,結(jié)果見圖3。圖3(a)被解釋變量為Be,圖3(b)被解釋變量為Bs。由圖3可知,疫情爆發(fā)前,國有企業(yè)的平均泡沫存在概率和平均泡沫強度均低于非國有企業(yè),但二者趨勢類似;平衡趨勢檢驗通過疫情爆發(fā)后,二者趨勢出現(xiàn)明顯不同。

      圖3 平衡趨勢檢驗結(jié)果

      圖4 安慰劑檢驗結(jié)果

      表7的列(4)~列(7)為DID模型的檢驗結(jié)果。首先,無論是否加入Se-1和Se-2,Se對Be及Bs的正向影響依然顯著,本研究主要結(jié)論依然成立;其次,變量CV對Be具有顯著負向影響,對Bs的負向影響不顯著,說明新冠疫情的爆發(fā)對非國有企業(yè)股價泡沫存在概率的抑制作用顯著,而對泡沫強度的抑制作用不明顯;同時,變量Did對Be具有顯著正向影響,對Bs的正向影響不顯著,說明國有企業(yè)與非國有企業(yè)之間泡沫存在概率的差因疫情爆發(fā)出現(xiàn)顯著變化。結(jié)合圖3可以看出,這種變化呈縮小的趨勢。其原因可能在于,疫情爆發(fā)后,投資者為了規(guī)避市場風(fēng)險更多地選擇國有企業(yè)股票投資,使得國有企業(yè)股價泡沫出現(xiàn)的概率提高。

      6.3 內(nèi)生性討論:PSM檢驗

      為排除樣本選擇問題帶來的內(nèi)生性問題,繼續(xù)利用傾向評分匹配法(PSM)檢驗。按照投資者情緒Se高低,將大于80%分位數(shù)的樣本作為實驗組,將小于40%分位數(shù)的樣本作為對照組,利用除Se以外的所有控制變量作為計算傾向匹配得分的特征變量,進行一對一最近鄰匹配,結(jié)果見表8。由表8可知,高投資者情緒組對泡沫存在概率及泡沫強度的平均處理效應(yīng)(ATT)均在10%的水平上顯著為正,說明投資者情緒越高,泡沫存在的概率和泡沫強度越大,這與前文結(jié)論一致。

      表8 PSM檢驗結(jié)果

      6.4 穩(wěn)健性檢驗:安慰劑檢驗

      為排除偶然因素的影響,進行如下安慰劑檢驗:①將所有投資者情緒隨機打亂,生成虛擬投資者情緒;②利用虛擬投資者情緒、原被解釋變量及原控制變量重新回歸;③提取回歸結(jié)果中當期虛擬投資者情緒系數(shù)以及對應(yīng)顯著性水平。重復(fù)上述步驟500次,所得系數(shù)及對應(yīng)顯著性水平的p值結(jié)果見圖4。由圖4可知,無論被解釋變量是Be還是Bs,500次模擬所得虛擬投資者情緒的估計系數(shù)絕對值均遠小于對應(yīng)基準回歸結(jié)果的系數(shù),并以0為中心呈對稱分布;大部分虛擬情緒所得系數(shù)的對應(yīng)p值大于0.1,即不顯著,可以認為基準回歸結(jié)果并非偶然因素引起。

      6.5 穩(wěn)健性檢驗:變量替換

      參考陳浪南等[17]的方法,本研究利用Hp濾波法剔除收盤價中的趨勢性成分,并定義價格偏離趨勢性成分的部分為泡沫強度,用Hps表示用該指標替換原泡沫強度Bs作為因變量,驗證結(jié)果的穩(wěn)健性,檢驗結(jié)果見表9。由表9可知,首先,列(1)和列(3)中投資者情緒對泡沫強度的影響均在至少10%的水平上顯著為正;其次,逐步回歸和Sobel檢驗證明,投資者情緒確以日度交易金額為中介對泡沫強度產(chǎn)生正向影響。檢驗結(jié)果再次證明了本研究結(jié)論的穩(wěn)健性。

      表9 投資者情緒影響個股泡沫強度的穩(wěn)健性檢驗

      7 結(jié)語

      本研究在抓取東方財富股吧個股日內(nèi)實時發(fā)帖的基礎(chǔ)上,利用Bi-LSTM模型進行文本情感分類,并構(gòu)建了投資者情緒指標;同時,基于GSADF法檢驗了個股泡沫情況,并利用BSADF檢驗法得到個股泡沫持續(xù)期和泡沫強度。進一步地,通過構(gòu)建面板數(shù)據(jù)模型,分析了投資者情緒與股價泡沫的內(nèi)在關(guān)系。實證結(jié)果表明:①投資者情緒對個股泡沫存在概率以及泡沫強度的影響顯著。投資者情緒越高,股價泡沫存在概率和泡沫強度也越大。②本研究從股權(quán)集中度、公司規(guī)模和產(chǎn)權(quán)性質(zhì)3個方面進行了異質(zhì)性分析,發(fā)現(xiàn)投資者情緒對股價泡沫的影響存在截面異質(zhì)性。在小規(guī)模、低股權(quán)集中度和非國有屬性公司中,投資者情緒對股價泡沫的正向影響更強。③中介效應(yīng)檢驗結(jié)果發(fā)現(xiàn),投資者情緒以當期交易總金額為中介對股價泡沫產(chǎn)生正向影響。利用工具變量回歸、DID模型和PSM法探討內(nèi)生性問題,并通過安慰劑檢驗和變量替換等方法進行了穩(wěn)健性檢驗,發(fā)現(xiàn)上述研究結(jié)論依然成立。

      本研究理論上豐富了關(guān)于股價泡沫成因的相關(guān)文獻。實踐上,本研究結(jié)論表明:在移動互聯(lián)時代,來自社交媒體的投資者情緒在一定程度上可以有效預(yù)測股價泡沫。這給監(jiān)管者、投資者和上市公司均提供了一定的建議:①監(jiān)管者一方面要靈活運用互聯(lián)網(wǎng)信息進行風(fēng)險預(yù)警,注意利用互聯(lián)網(wǎng)投資者情緒識別股價泡沫過程中因公司規(guī)模等因素產(chǎn)生的異質(zhì)性問題;另一方面又要加強網(wǎng)絡(luò)信息的監(jiān)管力度,擴大監(jiān)管范圍,杜絕網(wǎng)絡(luò)謠言快速傳播造成的泡沫現(xiàn)象。②對于投資者來說,既要善于甄別網(wǎng)絡(luò)謠言,避免盲目跟風(fēng)、追漲殺跌;又要善于運用投資者情緒和交易金額等常見指標識別股價泡沫,提高自身的專業(yè)素養(yǎng)和決策能力。③上市公司要及時關(guān)注投資者情緒,及時披露高質(zhì)量信息、澄清市場謠言,在提升公司自身盈利能力和內(nèi)在價值等硬實力的基礎(chǔ)上,防止由于社交網(wǎng)絡(luò)媒體情緒偏離導(dǎo)致的股票價格泡沫。

      本研究還存在一定不足,由于股吧上投資者的發(fā)帖往往不具有規(guī)范性,Bi-LSTM模型的文本情感分類效果雖然可以滿足研究需求,但分類精度仍然有限,未來需要繼續(xù)完善模型,提高文本分類的準確率。

      猜你喜歡
      股價泡沫投資者
      ?十不該(股市)
      理財周刊(2023年11期)2023-11-08 00:37:19
      毒泡沫
      投資者
      廢棄的泡沫盒
      聊聊“普通投資者”與“專業(yè)投資者”
      “搞死”國家的泡沫
      盤中股價升跌引起持股者情緒變化
      新興市場對投資者的吸引力不斷增強
      中國外匯(2019年7期)2019-07-13 05:45:04
      股價創(chuàng)股災(zāi)以來新低的股票
      好泡沫與壞泡沫
      大庆市| 洮南市| 额济纳旗| 四平市| 浑源县| 洪雅县| 敖汉旗| 岫岩| 长葛市| 巴林右旗| 苏尼特左旗| 天津市| 马公市| 陵川县| 永和县| 伊川县| 农安县| 公安县| 那坡县| 稷山县| 称多县| 庆元县| 澎湖县| 辽源市| 乐清市| 香格里拉县| 蒙城县| 漳浦县| 大方县| 嘉峪关市| 双江| 清水河县| 奎屯市| 涞水县| 黑龙江省| 东台市| 启东市| 东方市| 芒康县| 沙田区| 保定市|