凌志明,王景樂
(對外經濟貿易大學 統(tǒng)計學院,北京 100029)
作為投資心理的投資者情緒正被越來越多的學者所關注。投資者情緒的定義主要從主觀預期(偏好)與客觀投資環(huán)境的偏差而產生,是對投資認知行為的一種反應過程。本文將投資者情緒定義為:投資者在投資過程中由于對外界客觀環(huán)境與自身主觀風險偏好的偏差,在投資過程中不斷認知進而不斷產生對當下或者未來投資環(huán)境及投資意向的一種判斷,并影響投資行為。中外學者對投資者情緒的研究,主要集中在投資者情緒與證券收益的關系及投資者情緒與投資行為的研究。而對于投資者情緒的傳染分析研究較少[1-4]。本文利用2010年后的數據,對中美兩國投資者情緒的傳染進行研究。由于目前的投資者情緒指標頻度最多到周,月度數據比較普遍,因此本文設計的日度投資者情緒會更加精準地刻畫投資者情緒的每日變化。本文利用變點檢測方法結合Copula尾部相依系數,考察投資者情緒傳染有無發(fā)生,并給出傳染時間、大小及次數。同時運用非參數方法選擇Copula模型,使模型的選擇更加穩(wěn)健。
Copula模型種類繁多。本文采用李霞(2014)[5]所介紹的非參數解析法選擇Copula的模型。以常用單參數二元阿基米德Copula為例進行具體說明,其分布函數可由其組成的生成元表示:
其中,K(t)是C(u,v)的分布函數,是C(u,v)的生成元。阿基米德Copula函數作為備選模型進行具體的介紹:
(1)首先由原始數據產生相應的經驗分布函數,通過散點圖特征判斷變量間的大致相依關系,以選出幾個待評估的模型。
(2)設 (x1,y1),…,(xn,yn)是總體 (X,Y)中的一組樣本,總體的聯(lián)合分布函數記為H(x,y),對應的Copula為C(u,v),(x,y)的樣本Kendall’sτ秩的相關系數表示如下:
同時,趙麗琴等(2009)[6]表示總體Kendall’sτ秩相關系數可由生成元φ(t)表示成從而總體秩相關系數可由樣本秩相關系數來估計,也就是^τ=τ,由此可以計算出Copula函數中的參數。
本文基于阿基米德Copula中的參數進行變點檢測,參數可通過樣本Kendall’sτ秩相關系數與生成元之間的關系估計。本文依據葉五一等(2009)[7]介紹的方法進行變點檢測。
設θ是Copula函數的參數,假定θ只存在一個變點,可以建立相關原假設H0及備擇假設H1:
其中,k*為變點時刻。
構造如下對數似然比檢驗統(tǒng)計量:
其中,是利用整體觀測數據估計的參數,、分別為變點前或后的觀測數據估計的參數,F(xiàn)(x)、F(y)是(x,y)的邊緣分布函數。對于每一點k有1≤k≤n,利用如下檢驗量檢驗k是否為變點:
當該檢驗量很大時就可以拒絕原假設,即該Copula模型存在變點。Dias等(2002)[8]給出了上述檢驗問題的拒絕域的臨界值。若只存在一個變點,變點k*的估計為:
當存在多個變點時,本文擬采用Vostrikova(1981)[9]介紹的利用二分序列數據的方法進行多變點的檢測。首先,檢測出第一個變點,將數據在變點時刻分為兩段序列,數據量分別為n1、n2,然后分別對這兩組數據進行之前的單變點檢測分析。如某段數據存在變點則繼續(xù)將相應數據段在其變點時刻分為兩段,繼續(xù)對這兩段數據進行單變點檢測,直到數據段不能檢測出變點為止。
變點檢測方法給出了兩變量結構發(fā)生改變的時刻,但是對于投資者情緒傳染的研究,僅檢測變點并不能說明有傳染以及傳染的大小,本文用Copula尾部相依系數刻畫變量之間的相依關系。尾部相依系數的定義如下:
設X,Y是邊緣分布分別為F(x),G(y)的兩個隨機變量,其聯(lián)合分布函數為C(u,v),上下尾部相依系數分別定義為λU、λL,且λU,λL∈[0 ,1],具體公式表示如下:
本文將變點前后相依系數的變化作為傳染大小的度量,用 Δ 表示,令(或者其中λ0、λ1分別表示變點前后的尾部相依系數大小。具體解釋為:如果變點前后尾部相依系數明顯變化,若Δ>0,則兩者之間存在傳染,且傳染增強;若Δ<0則兩者雖存在傳染,但是傳染減弱。如果在變點時刻的前后尾部相依系數沒有明顯變化,則兩者之間不存在傳染。
本文根據研究主題、指標頻度、可供對比及數據來源等標準設計如下幾個投資者情緒代理指標:
(1)中美證券市場指數點位(IP)。中美分別選取滬深300指數以及標普500指數。
(2)中美指數漲跌幅(CIP)。本文采用的是日數據,這里指數的漲跌幅是指當日收盤價與前一日收盤價的差額較前一日指數點的百分比。
(3)中美指數成交量漲跌幅(CITV)。
(4)中美基準利率變化幅度(CBIR)?;谕顿Y者關注度、市場認可度以及數據來源角度,選取了上海同業(yè)拆借利率(Shibor)以及美國聯(lián)邦基準利率。
(5)中美指數連漲連跌(SRF)的天數。記選取的樣本數據段第一天該指標為1,日后若代表性指數漲則該指標在前一天基礎上加1,若出現(xiàn)跌則減1,用整數的大小變化來描述市場漲跌變化。
(6)中美指數漲跌幅區(qū)間效應(PIE)。將指數漲跌幅處于上75%分位數和下25%分位數的數據分別記為暴漲、暴跌情況;刺激性漲跌幅度分別設置為上60%分位數至上75%分位數及下40%分位數到下25%分位數;而理性漲跌幅設置上60%至下40%分位數之間。本文將這五個區(qū)間依次稱為暴跌恐慌、刺激性跌、理性漲跌、刺激性漲和暴漲恐慌,同時為處在這五個區(qū)間的漲跌幅所對應漲跌幅區(qū)間效應賦予數值,用(a,b,c,d,e)來表示,a—e分別為各自對應區(qū)間的平均值。
以上這些備選指標需要通過Baker等(2009)[3]的主成分方法進行篩選(本文稱兩階段主成分方法)。具體步驟:將投資者情緒指標記為sent,對指標sent進行主成分分析,取貢獻率達到85%以上的主成分構造一階段投資者情緒指標sent1。然后將得到的投資者情緒指標與各備選情緒代理變量進行相關性分析,選取相關性較高的幾個代理變量進行二階段主成分分析,從而得到二階段投資者情緒指標sent2,作為最終所要使用的投資者情緒指標。
本文選取中美兩國從2010年首個交易日至2016年1月13日止的所有交易日的相關數據,其中除去了由于交易日不同的樣本,保證了數據交易日的對應,共計1370期,全部數據來源于Wind金融終端。中美兩國上述六個代理指標的描述性統(tǒng)計分析及相關性分析見下頁表1和表2。
從表1和表2可以看出,各情緒代理指標之間的關系有正有負。除因構造方式引起的IP與CIP和SRF之間相關系數較高之外,大多數情緒代理變量之間相關性較弱??傮w上,這些備選的代理變量能獨立有效地代理投資者情緒進行綜合投資者情緒指標的構建。
基于金融數據的“領先-滯后”現(xiàn)象,本文參考Baker等(2009)[3]的做法再引入各指標的滯后一期進行一階段主成分分析(中美前六主成分貢獻率分別是86.22%和91.92%),經加權平均后合成為一階段投資者情緒指標。各代理指標及其滯后項之間的相關性結果如下頁表3所示。
中美兩國代理指標及其滯后項存在一致的結果:
sent1與 IPt、SRFt、IPt-1、CIPt-1、SRFt-1以及 PIEt-1相關系數高,故選擇這六項指標進行二階段的主成分分析,其余備選代理指標及其滯后項被剔除,金融市場基準利率及其滯后項都未被入選,原因可能是其他代理變量解釋力度已經足夠。二階段主成分分析,提取前三個主成分(貢獻率中美分別為98.69%及99.21%)加權平均后的二階段投資者情緒指標的表達式為:
表1 中國情緒代理指標描述性統(tǒng)計分析及相關性分析
表2 美國情緒代理指標描述性統(tǒng)計分析及相關性分析
表3 一階段投資者情緒指標與代理變量及其滯后項相關性
根據以上兩階段主成分分析后,得到最終所要研究的中美投資者情緒指標如圖1所示(深色:中國)。從圖1中可以看出中國投資者情緒趨勢較復雜,具體來說,中國投資者情緒從樣本數據段開始,經過一段時間上下波動后波動上升,然后驟降,后在2015年第二季度飆升后又驟降,之后又保持了上下波動狀態(tài),市場投資者情緒波動較大。美國投資者情緒指標近幾年來大致呈現(xiàn)一種波動上升的趨勢,特別是2010年到2012年末,波動幅度前期較后期大,2013年開始穩(wěn)步上升后在2015年第二季度開始出現(xiàn)震蕩下行態(tài)勢。綜合來看,兩個市場在2014年上半年之前趨勢較為一致,2014年下半年開始,兩市場投資者情緒發(fā)展出現(xiàn)分歧,投資者情緒發(fā)展相對背離。
圖1 中美投資者情緒指標
對于傳染路徑的判斷,本文采用格蘭杰因果檢驗的方法。假設兩個不同的市場各自的投資者情緒指標分別表示為sentA,sentB。判別模型及原假設如下:
原假設:H0:δ1=…δn=0
對上述方程的格蘭杰因果檢驗,拒絕原假設則說明:sentB是引起sentA變動的格蘭杰原因。類似地,可以檢驗sentA是否是sentB的格蘭杰原因。
根據上文求得的中美投資者情緒指標,將中美兩個市場投資者情緒指標記為sentCh及sentAm。格蘭杰因果檢驗結果如表4所示。
表4 中美兩個市場投資者情緒指標格蘭杰因果檢驗
表4結果顯示sentCh不是sentAm的格蘭杰原因,而sentAm是sentCh的格蘭杰原因,也就是說美國投資者情緒的變動引起了中國投資者情緒的變動,而中國投資者情緒的變動對美國投資者沒有影響,只存在單向的關系。
基于上文的傳染路徑判別結果:中美兩個市場之間的投資者情緒只存在美國市場對中國市場的單向傳導基礎上,本文進行下一步的Copula模型選擇研究。選擇具有尾部相依性的Gumbel Copula、Clayton Copula及Frank Copula作為備選Copula模型。
表5 三種備選Copula的估計參數
通過對比不同Copula所對應的t-K(t)與t-(t)圖形,本文發(fā)現(xiàn)Clayton Copula是擬合最佳的Copula函數。同時,利用樣本數據對這三個Copula函數進行擬合優(yōu)度Kolmogorov-Smirnov檢驗,檢驗結果如表6所示,表中的K-S值表明Clayton Copula是最合適的Copula函數。
表6 備選copula函數擬合K-S值
基于上文選擇的最佳Clayton Copula函數為模型,進行變點檢測,通過對投資者情緒指標計算后,得到了統(tǒng)計量ψn的值為717.0346,大于95%置信度時的臨界值,得出第一個變點的時刻為2011年5月12日。將原始數據數據在2011年5月12日分為兩段,兩段數據量為對兩部分數據分別進行變點檢測,得到的統(tǒng)計量表示成ψn1和ψn2,統(tǒng)計量大小分別為70.1581和221.7392,后半段存在變點,變點時刻分別為2012年8月28日。繼續(xù)對后半段在該變點時刻分為前后兩部分,得到統(tǒng)計量值為56.7834和612.2582,同樣后半段存在變點,變點時刻為2014年11月28日,并且繼續(xù)檢驗該后半段的數據對應的統(tǒng)計量之后,他們的值都小于對應的臨界值,幾個變點檢測相應數據段統(tǒng)計量-2logΛk圖形如圖2所示。因此本文認為已經不存在變點,故而進行接下來的尾部相關系數計算。
圖2 變點前后數據統(tǒng)計量-2logΛk時間序列圖
基于上文所計算出的三個變點,將原始數據在變點處分成前后兩個部分,得到了三個前后區(qū)間的數據,分別是:(1)2010年1月4日到2011年5月12日,2011年5月13日到2016年1月16日;(2)2011年5月13日到2012年8月28日,2012年8月29日到2016年1月16日;(3)2012年8月29日到2014年11月28日,2014年11月29日到2016年1月16日。得到對應變點前后兩部分的參數估計結果及對應的Clayton Copula下尾部相依系數,如表7所示。
最佳解釋效果的Clayton Copula變點檢測與尾部相關系數結果顯示有三個變點,分別記為按照變點檢測出現(xiàn)的順序分別是:2011年5月12日、2012年8月28日、2014年11月28日。傳染判別顯示三個變點時刻都發(fā)生了傳染,CP1及CP3對應的投資者情緒傳染大小Δ為負數,說明這兩個變點對應的前后兩部分數據的傳染大小減弱,而CP2對應的投資者情緒傳染大小Δ是正數,傳染大小增強。
第一個變點CP1(2011年5月12日)。中美投資者情緒相依系數從0.14下降到0.0286,降幅達到將近80%,可見美國投資者情緒在變點CP1之后對中國投資者情緒的影響呈現(xiàn)減弱態(tài)勢。第三個變點CP3(2014年11月28日),中美投資者情緒相依系數從0.4553下降到0.0778,降幅達到將近82.47%,這一變點區(qū)間段前后數據傳染性也減小。第二個變點CP2(2012年8月28日),中美投資者情緒相依系數從0.0638增加到0.1749,增幅達到174%,前后區(qū)段傳染增強。
表7 變點前后Clayton Copula參數估計θ^及下尾部相依系數
本文通過6個投資者情緒代理指標,考察了中美兩國市場投資者情緒傳染的途徑,并分析了情緒傳染的時間和強弱。得出如下結論:第一,存在美國投資者情緒對中國的單方面?zhèn)魅?,而不存在中國對美國的傳染;第二,在本文采用的樣本區(qū)間內,共發(fā)生了3次情緒傳染。通過傳染前后的分析可以看出,隨著中國市場的不斷發(fā)展,中國投資者變得更加理性,美國投資者的情緒對中國的傳染在進一步的減弱。
參考文獻:
[1]Tay N S P.Social Network Characteristics and the Evolution of Inves?tor Sentiment[M].Japan:Springer,2009.
[2]Hudson Y,Green C J.Born in the USA?Contagious Investor Senti?ment and UK Equity Returns[J].Discussion Paper,2013.
[3]許祥云,廖佳,吳松洋.金融危機前后的中國股債關系分析——基于市場情緒變化的解釋視角[J].經濟評論,2014,(1).
[4]文鳳華,楊鑫,龔旭等.金融危機背景下中美投資者情緒的傳染性分析[J].系統(tǒng)工程理論與實踐,2015,(3).
[5]李霞.Copula方法及其應用[M].北京:經濟管理出版社,2014.
[6]趙麗琴,籍艷麗.Copula函數的非參數核密度估計[J].統(tǒng)計與決策,2009,(9).
[7]葉五一,繆柏其.基于Copula變點檢測的美國次級債金融危機傳染分析[J].中國管理科學,2009,(3).
[8]Dias A,Embrechts P.Change-Point Analysis for Dependence Struc?tures in Finance and Insurance[J].Social Science Electronic Publish?ing,2002.
[9]Vostrikova L Y,Vostrikova L Y.Detecting“Disorder”in Multidimen?sional Random Processes[J].Soviet MathmaticsDoklady,1981,24(1).