石巖濤
為了實現(xiàn)用SPSS軟件進行單總體均值向量的檢驗的目的,文[1]巧妙地運用了SPSS軟件,成功地實現(xiàn)了對單總體均值向量的假設(shè)檢驗。在檢驗中,文[1]用到了SPSS運行后的一個結(jié)果,該結(jié)果是被稱作F統(tǒng)計量的F值,再通過兩總體均值的比較與單總體均值向量的假設(shè)檢驗間的Hotelling T2統(tǒng)計量T2、T1的關(guān)系轉(zhuǎn)換求得T1的值,再利用T2分布的性質(zhì)實現(xiàn)了均值向量的檢驗。文[1]的方法彌補了不能用SPSS軟件直接做多元均值檢驗的缺憾。然而,均值向量的檢驗是可以通過F-檢驗法來實現(xiàn)的。如果在做均值向量的檢驗時,有一種方法能夠更便捷地利用文[1]中得到的F值,那么,這種方法也更容易得到推廣。
由文[2]、[3]可知,正態(tài)總體的多元均值檢驗,是對假設(shè)
做檢驗。
即
且:
而在兩總體均值比較的假設(shè)檢驗中,若假設(shè)兩總體的協(xié)方差陣相等,則統(tǒng)計量:
其中,樣本 X、Y皆來自p維正態(tài)總體,即X~N(μ1,Σ )、Y~N(μ2,Σ ) ;n1,n2是樣本容量;協(xié)方差陣Σ的估計值:
其中,SX、SY為兩樣本的協(xié)方差陣;LX、LY是兩樣本離差陣。
當(dāng)n1=n,?n2=1時,隨機樣本Y就退化成一組觀測,此時,兩總體均值比較的假設(shè)檢驗就可視作單總體均值向量的檢驗,即:
而樣本離差陣:
將(5)式代入(4)式有:
將(6)式代入(3)式得:
即:
比較(1)、(7)兩式,可得:
由于在兩總體均值的比較的假設(shè)檢驗中,有:
由(8)、(9)兩式及 n1=n,?n2=1的假設(shè)前提,有:
將(10)代入(8)式得:
將(11)式代入(2)式得:
由于F2的值是可以把對均值向量的檢驗視作兩總體均值比較的問題時而通過運行SPSS得到,進而通過(12)式求得F1,于是,均值向量的假設(shè)檢驗問題便可迎刃而解了。
[例]【4】人的出汗多少與人體內(nèi)鈉和鉀的含量有一定的關(guān)系,今測了20名健康成年女性的出汗多少(x1)、鈉的含量(x2)和鉀的含量(x3),其數(shù)據(jù)列于表1,假定x=(x1,x2,x3)'服從三元正態(tài)分布。試在顯著性水平α=0.05下,檢驗 H0:μ=μ0=(4 ,50,10)',H1:μ≠μ0
表1 成年女性出汗成分數(shù)據(jù)
解:將表1的觀測數(shù)據(jù)看作是兩總體均值比較檢驗的樣本X,即設(shè)n1=20,對應(yīng)的群組變量值設(shè)為1;設(shè)全國平均值 μ0=(1 7.5,?27.5,?5,?35)'為樣本 Y ,即 n2=1 ,且對應(yīng)的群組變量值設(shè)為2。然后,如文[1]那樣,在SPSS17.0中點擊“ Analyze→General Linear Model→Multivariate”,將x1、x2、x3選入“Dependent variebles”,將group選入“fixed factor(s)”中,點擊OK即可得到輸出結(jié)果(表2)。
表2 兩總體均值比較檢驗表
在輸出結(jié)果中“Multivariate Tests”框中“Hotelling’s Trace”的F統(tǒng)計量的值為0.138,也即F2=0.138,將此F2值代入(12)式,得:
查F分布表知 F0.05(3,?17)=3.20
因為 F1=2.9<3.20=F0.05(3,?17)
所以,在顯著性水平α=0.05情況下,接受原假設(shè)H 0。
通過本例可知,新方法對于運用SPSS軟件進行均值向量的檢驗是比較理想的。
[1]程瑩,陳希鎮(zhèn).巧用SPSS進行均值的假設(shè)檢驗[J].統(tǒng)計與決策,2008,(18).
[2]何曉群.多元統(tǒng)計分析(第二版)[M].北京:中國人民大學(xué)出版社,2008.
[3]方開泰.實用多元統(tǒng)計分析[M].上海:華東師范大學(xué)出版社,1989.
[4]王學(xué)民.應(yīng)用多元分析(第三版)[M].上海:上海財經(jīng)大學(xué)出版社,2009.