常桂松 孫艷蕊 王洪曾
【摘要】? 兩總體均值差的檢驗(yàn)是假設(shè)檢驗(yàn)中的一個(gè)重要問(wèn)題,常用在比較兩個(gè)處理方法的差異的分析中,當(dāng)兩組樣本不是獨(dú)立時(shí),不能利用獨(dú)立樣本的T檢驗(yàn)。主要討論兩配對(duì)樣本的均值差的T檢驗(yàn),介紹了兩配對(duì)樣本的均值差的T檢驗(yàn)的統(tǒng)計(jì)理論,并結(jié)合R語(yǔ)言介紹了其在實(shí)踐中的具體應(yīng)用。
【關(guān)鍵詞】? R語(yǔ)言 T檢驗(yàn) 配對(duì)樣本
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一個(gè)基本問(wèn)題,實(shí)際生活工作中的很多問(wèn)題利用統(tǒng)計(jì)方法分析,得到統(tǒng)計(jì)結(jié)論,進(jìn)而有效地指導(dǎo)決策。利用兩總體均值差的假設(shè)檢驗(yàn),比較兩種處理方法的差異。當(dāng)兩樣本X1,X2,L,Xn與Y1,Y2,L,Ym相互獨(dú)立時(shí),可以利用獨(dú)立樣本的均值差的T檢驗(yàn)。當(dāng)樣本中測(cè)量到的兩組數(shù)據(jù)是同一對(duì)象在不同條件下測(cè)試的結(jié)果時(shí),不能視為兩獨(dú)立的樣本,往往要對(duì)樣本進(jìn)行配對(duì)處理,再利用單樣本均值差是否為零的T檢驗(yàn)。如比較兩種安眠藥的安眠效果是否有差異,若試驗(yàn)是在分為對(duì)照組和實(shí)驗(yàn)組時(shí)進(jìn)行的,此時(shí)兩組樣本是相互獨(dú)立的。若試驗(yàn)是對(duì)一組試驗(yàn)對(duì)象在不同時(shí)間下進(jìn)行的,此時(shí)兩組樣本就不是相互獨(dú)立的,就不能利用獨(dú)立樣本的均值檢驗(yàn)。再如要討論高三學(xué)生最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)有無(wú)顯著差異?是否最后一次模擬考試的數(shù)學(xué)成績(jī)高于高考真實(shí)的數(shù)學(xué)成績(jī)?抽樣得到的兩組數(shù)據(jù)就不能視為兩個(gè)獨(dú)立樣本,需要對(duì)樣本數(shù)據(jù)進(jìn)行配對(duì)后才能應(yīng)用假設(shè)檢驗(yàn)的理論進(jìn)行分析。
一、理論及應(yīng)用
1.檢驗(yàn)的理論
由于配對(duì)樣本的各觀測(cè)具有對(duì)應(yīng)關(guān)系,因此可將兩個(gè)樣本以觀測(cè)為依據(jù)對(duì)應(yīng)做差(得到的樣本稱為差值樣本)。利用單樣本T檢驗(yàn)法檢驗(yàn)差值樣本的均值與零是否有顯著差異,進(jìn)而得到兩總體均值是否有差異。
2. 檢驗(yàn)的實(shí)例
R語(yǔ)言是目前應(yīng)用最廣泛的統(tǒng)計(jì)軟件,由于R語(yǔ)言的開(kāi)源性及其與一些軟件具有良好的兼容性,越來(lái)越多的數(shù)據(jù)分析工作首選R語(yǔ)言作為分析數(shù)據(jù)的工具。另外,在這個(gè)被很多專(zhuān)家和學(xué)者命名的大數(shù)據(jù)時(shí)代,許多科技工者每天置身于數(shù)據(jù)的汪洋大海和崇山峻嶺之中,高效利用R語(yǔ)言開(kāi)展數(shù)據(jù)分析工作,毫無(wú)疑問(wèn)會(huì)為科學(xué)研究做出高效的貢獻(xiàn),并為工作奠定良好的基礎(chǔ)。目前,我國(guó)處于改革開(kāi)放的轉(zhuǎn)型時(shí)期,面臨國(guó)際化的各個(gè)方面的激烈競(jìng)爭(zhēng),以高效的數(shù)據(jù)分析作為科學(xué)研究的手段,是促進(jìn)國(guó)家科學(xué)發(fā)展,是國(guó)家在復(fù)雜多變的國(guó)際環(huán)境競(jìng)爭(zhēng)中處于有利位置的重要戰(zhàn)略決策。利用R語(yǔ)言分析數(shù)據(jù)除了調(diào)用軟件內(nèi)置的一些統(tǒng)計(jì)函數(shù)之外,用戶還可以自定義函數(shù)實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)分析。
可以從R的官方網(wǎng)站www.r-project.org免費(fèi)下載并安裝R軟件,R主頁(yè)列出了R有關(guān)的各類(lèi)信息,用戶下載R時(shí),需要首先用鼠標(biāo)點(diǎn)擊CRAN鏈接,選擇一個(gè)鏡像鏈接地址即可完成下載。成功下載R軟件后,即可按照Windows軟件的一般安裝方式進(jìn)行安裝。
啟動(dòng)R軟件后,用戶可以在R工作空間創(chuàng)建和管理R對(duì)像,調(diào)用R軟件中已加載包中的任何函數(shù)。在R語(yǔ)言中,兩配對(duì)樣本的均值差的檢驗(yàn)對(duì)應(yīng)的統(tǒng)計(jì)函數(shù)為t.test,格式為t.test(數(shù)值型向量名1,數(shù)值型向量名2,paired=TRUE,alternative=檢驗(yàn)方向)
在統(tǒng)計(jì)函數(shù)t.test的參數(shù)調(diào)用中,數(shù)值型向量名1和數(shù)值型向量名2分別表示配對(duì)樣本觀測(cè)值的向量對(duì)應(yīng)的名稱;參數(shù)paired=TRUE,表明觀測(cè)樣本為配對(duì)樣本,若paired=FALSE,則表示不對(duì)兩觀測(cè)樣本時(shí)行配對(duì);參數(shù)alternative表明對(duì)立假設(shè)的檢驗(yàn)方向,雙側(cè)檢驗(yàn)時(shí),對(duì)應(yīng)的alternative=“two.side”,單側(cè)檢驗(yàn)時(shí),根據(jù)實(shí)際問(wèn)題的背景,對(duì)應(yīng)的對(duì)立假設(shè)的檢驗(yàn)方向alternative=“l(fā)ess”或alternative=“greater”。
高考的數(shù)學(xué)成績(jī)對(duì)每一位考生非常重要,通過(guò)分析最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)的數(shù)據(jù),對(duì)學(xué)生的高考真實(shí)成績(jī)做出合理地指導(dǎo)。
假設(shè)討論某中學(xué)的學(xué)生最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)的問(wèn)題中,隨機(jī)抽取一部分學(xué)生最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)。如下表所示。
檢驗(yàn)最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)是否有差異?
調(diào)用R語(yǔ)言的函數(shù)t.test(a,b,paired=TRUE,alternative=“two.sided”),這里a表示學(xué)生最后一次模擬模擬考試的數(shù)學(xué)成績(jī)對(duì)應(yīng)的數(shù)值型向量,b表示學(xué)生高考中真實(shí)的數(shù)學(xué)成績(jī)對(duì)應(yīng)的數(shù)值型向量,輸出結(jié)果如圖所示
由輸出結(jié)果中可以看出,差值樣本對(duì)應(yīng)總體的均值的置信水平為95%的置信區(qū)間是(-3.18977,4.5897),這個(gè)區(qū)間包含0.另外,檢驗(yàn)的p-值是0.6934,比較 大,所以認(rèn)為樣本沒(méi)有提供不利于原假設(shè)成立的顯著性證據(jù),因而不能拒絕原假設(shè),即認(rèn)為最后一次模擬考試的數(shù)學(xué)成績(jī)與高考真實(shí)的數(shù)學(xué)成績(jī)無(wú)顯著差異。
二、總結(jié)
在比較兩總體均值是否有差異的檢驗(yàn)中,一定要確定兩樣本是否獨(dú)立,不同情形對(duì)應(yīng)著不同的統(tǒng)計(jì)方法,大多數(shù)數(shù)據(jù)分析工作者,很難區(qū)分兩樣本是否獨(dú)立。當(dāng)兩組樣本是在不同的試驗(yàn)對(duì)象中觀測(cè)得到的,可認(rèn)為兩樣本是獨(dú)立的,可利用獨(dú)立樣本的均值差的T檢驗(yàn)。當(dāng)兩組樣本不獨(dú)立時(shí),樣本值是同一組試驗(yàn)對(duì)象在不同方法下的觀測(cè)值,常作配對(duì)處理,利用兩配對(duì)樣本的T檢驗(yàn),檢驗(yàn)差值樣本對(duì)應(yīng)的總體均值與零是否有差異。
本文研究了R語(yǔ)言在兩配對(duì)樣本的均值差的T檢驗(yàn)中的應(yīng)用。首先,簡(jiǎn)要介紹了配對(duì)樣本,接著介紹了配對(duì)樣本的檢驗(yàn)理論,最后接著介紹了R語(yǔ)言中配對(duì)板本的均值差的T檢驗(yàn)的調(diào)用函數(shù),并以具體實(shí)例討論R語(yǔ)言在實(shí)際問(wèn)題中的應(yīng)用。
參考文獻(xiàn):
[1] 鄭明,陳子毅,汪嘉岡.數(shù)理統(tǒng)計(jì)講義[M].復(fù)旦大學(xué)出版社,2005.
[2]湯銀才.R語(yǔ)言與統(tǒng)計(jì)分析[M].高等教育出版社,2008.
[3]薛毅,陳麗萍.統(tǒng)計(jì)建模與R軟件[M].清華大學(xué)出版社,2007.