劉鶴飛,張波
(1.曲靖師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院,云南曲靖655011;2.云南大學(xué)研究生工作部,云南昆明650031)
外圍股指與上證綜指多元回歸模型及其統(tǒng)計(jì)診斷
劉鶴飛1,張波2
(1.曲靖師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院,云南曲靖655011;2.云南大學(xué)研究生工作部,云南昆明650031)
從理論上給出了一種多元線性回歸模型統(tǒng)計(jì)診斷的方法,并以外圍股指對(duì)上證綜指多元回歸模型為例,檢驗(yàn)了該方法的診斷效果.
統(tǒng)計(jì)診斷;數(shù)據(jù)刪除;線性回歸模型
隨著全球經(jīng)濟(jì)一體化的加劇,一個(gè)國(guó)家的經(jīng)濟(jì)正越來越受到外部經(jīng)濟(jì)環(huán)境的影響,作為一國(guó)經(jīng)濟(jì)的晴雨表的股市更是首當(dāng)其沖[1].2008年發(fā)生在美國(guó)的次貸危機(jī)就席卷全球,波及全世界的股票市場(chǎng).目前,正愈演愈烈的歐債危機(jī),也考驗(yàn)著全球股市.從1990年上海證券交易所成立以來,我國(guó)的資本市場(chǎng)也已經(jīng)有23個(gè)年頭了,正日益走向成熟.作為上交所的代表指數(shù),上證綜指已經(jīng)成為眾多專家、學(xué)者和股民研究中國(guó)股市波動(dòng)的一個(gè)重要參考依據(jù).本文選取了許多外國(guó)股票指數(shù),建立了外圍股指對(duì)上證綜指的多元線性回歸模型,并對(duì)模型進(jìn)行了統(tǒng)計(jì)診斷[2].
1.1 數(shù)據(jù)選取及來源
選取了全球比較有影響的11種股票指數(shù)2011年全年每個(gè)交易日的收盤價(jià)作為研究數(shù)據(jù).包括美國(guó)納斯達(dá)克指數(shù)(N)、標(biāo)準(zhǔn)普爾指數(shù)(B)、道瓊斯指數(shù)(D)、英國(guó)富時(shí)指數(shù)(F)、法國(guó)巴黎CAC指數(shù)(C)、加拿大股票指數(shù)(J)、澳大利亞悉尼股票指數(shù)(X)、韓國(guó)首爾綜合指數(shù)(Z)、日本日經(jīng)指數(shù)(R)、香港恒生指數(shù)(H)、臺(tái)灣加權(quán)指數(shù)(T)、以及上海證券交易所綜合指數(shù)(S).所有數(shù)據(jù)均來自騰訊股票頻道的環(huán)球股指欄目.
1.2 外圍股指與上證綜指的相關(guān)性分析
對(duì)11種股票指數(shù)進(jìn)行缺失數(shù)據(jù)處理之后,得到11種股票指數(shù)2011年248個(gè)交易日的數(shù)據(jù).利用SPSS[3]對(duì)其進(jìn)行相關(guān)性分析,結(jié)果見表1.
表1列出了上證綜指與11種外圍股指的Pearson相關(guān)系數(shù),我們選取相關(guān)程度比較高的7個(gè)變量,美國(guó)納斯達(dá)克指數(shù)(N)、英國(guó)富時(shí)指數(shù)(F)、法國(guó)巴黎CAC指數(shù)(C)、加拿大股票指數(shù)(J)、澳大利亞悉尼股票指數(shù)(X)、韓國(guó)首爾綜合指數(shù)(Z)、香港恒生指數(shù)(H),建立這7個(gè)變量與上證綜指的多元線性回歸模型.
表1 上證綜指與11種外圍股指的相關(guān)系數(shù)
1.3 建立多元線性回歸模型
利用SPSS對(duì)選取的7個(gè)變量進(jìn)行回歸分析,結(jié)果見表2.
表2 多元回歸分析結(jié)果Coefficientsa
則外圍股指對(duì)上證綜指線性回歸模型為:
2.1 模型原理
在本文的多元線性回歸模型S=96.588+0.216N-0.460F+0.028C+0.198J+0.144X+0.199Z+ 0.042H中,為了評(píng)價(jià)第i個(gè)數(shù)據(jù)點(diǎn)Zi(x1i,x2i,x3i,x4i,x5i,x6i,yi)在該回歸模型中的作用與影響,我們通過比較這第個(gè)i點(diǎn)刪除前后模型統(tǒng)計(jì)推斷結(jié)果的變化來檢測(cè)這個(gè)點(diǎn)是否為異常點(diǎn)或強(qiáng)影響點(diǎn)[4].刪除第i個(gè)數(shù)據(jù)點(diǎn)后的模型稱為數(shù)據(jù)刪除模型.
為了度量第i個(gè)數(shù)據(jù)點(diǎn)刪除前后回歸系數(shù)估計(jì)量之間的差異,我們引入W-K統(tǒng)計(jì)量,用W-K統(tǒng)計(jì)量來表示刪除第i個(gè)數(shù)據(jù)點(diǎn)前后擬合值的差異,即)與之間的差異.其定義為
對(duì)于本文的線性模型,W-K統(tǒng)計(jì)量可以表示為
從上式可以看出,W-K統(tǒng)計(jì)量是一種廣義距離,它反映了刪除第i個(gè)數(shù)據(jù)點(diǎn)前后回歸系數(shù)之間的差異,式中ti通常稱為學(xué)生化殘差,其服從t(n-p-1)分布,因此|ti|充分大的點(diǎn)為異常點(diǎn),故WK2i充分大的點(diǎn)為異常點(diǎn)[5].
2.2 實(shí)證分析
經(jīng)計(jì)算,2011年248個(gè)交易日的WK2i中,大于0.3的有1個(gè),0.2至0.3之間的有4個(gè),0.1至0.2之間的有13個(gè),其余的都小于0.1.
WK2i大于0.2的5個(gè)交易日分別是:2011年1月20日WK2i為0.356;2011年1月25日WK2i為0.232; 2011年9月6日WK2i為0.218;2011年3月10日WK2i為0.211;2011年9月23日WK2i為0.207.因此認(rèn)為這5個(gè)交易日是該回歸模型的強(qiáng)影響點(diǎn).
2011年1月20日國(guó)務(wù)院常務(wù)會(huì)議審議并原則通過了國(guó)有土地上房屋征收與補(bǔ)償條例草案.上海市國(guó)土局發(fā)布通知,上海國(guó)土部門在約定土地使用權(quán)期滿之后,將會(huì)無償收回.這一消息可能是2010年1月20日上證綜指大跌的原因,也是WK2i偏大的原因.
2.3 強(qiáng)影響點(diǎn)刪除之后的線性回歸模型
我們將5個(gè)WK2i偏大的強(qiáng)影響點(diǎn)刪除之后,得到新的回歸模型為:
把幾種相關(guān)外圍股指數(shù)據(jù)分別代入強(qiáng)影響點(diǎn)刪除前后的線性回歸模型中,得出2012年1月前3個(gè)交易日上證綜指的預(yù)測(cè)值(見表3).
表3 2012年1月前3個(gè)交易日上證綜指預(yù)測(cè)值
從表中的預(yù)測(cè)結(jié)果可以計(jì)算出,強(qiáng)影響點(diǎn)刪除前預(yù)測(cè)的偏差平方和s21=505.22,強(qiáng)影響點(diǎn)刪除后的偏差平方和s22=150.15.
本文介紹了利用W-K統(tǒng)計(jì)量的數(shù)據(jù)刪除模型對(duì)線性回歸模型進(jìn)行統(tǒng)計(jì)診斷的方法,并用外圍股指對(duì)上證綜指回歸模型進(jìn)行了實(shí)證分析,比較了強(qiáng)影響點(diǎn)刪除前后線性回歸模型的預(yù)測(cè)值與真實(shí)值的偏差平方和.
[1]陳潔,張定勝.國(guó)際股市對(duì)上證綜指的影響[J].北京理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012(1):32-37.
[2]韋博成,林金官,解鋒昌.統(tǒng)計(jì)診斷[M].北京:高等教育出版社,2009.
[3]郝黎仁,樊元,郝哲歐,等.SPSS實(shí)用統(tǒng)計(jì)分析[M].北京:中國(guó)水利水電出版社,2007.
[4]王懷亮.回歸診斷在統(tǒng)計(jì)數(shù)據(jù)異常值探測(cè)中的應(yīng)用[J].黑龍江對(duì)外經(jīng)貿(mào),2011(2):118-119.
[5]楊虎,邵華.線性回歸診斷中的高杠桿點(diǎn)度量[J].工程數(shù)學(xué)學(xué)報(bào),2009(1):123-132.
(責(zé)任編輯萬志瓊)
Multivariate Regression Model of Outside Stock Index Acting upon Shanghai Composite Index and Its Statistical Diagnosis
LIU He-fei1,ZHANG Bo2
(1.School of Mathematics and Information Science,Qujing Normal University,Qujing 655011,China; 2.Graduate School,Yunnan University,Kunming 650031,China)
This paper gives a method of statistical diagnosis for the multivariate regression model and applies it to the analysis of the outside stock index acting upon Shanghai composite index.
statistical diagnosis;data delete;linear regress model
O 212.1
A
1672-8513(2012)04-0270-03
10.3969/j.issn.1672-8513.2012.04.010
2011-09-16.
劉鶴飛(1985-),男,碩士.主要研究方向:應(yīng)用統(tǒng)計(jì).
張波(1963-),男,碩士,副教授,碩士生導(dǎo)師.主要研究方向:應(yīng)用統(tǒng)計(jì).