秦國友,趙耐青
(復(fù)旦大學(xué)公共衛(wèi)生學(xué)院,上海 200032)
?
以t檢驗(yàn)為例說明影響假設(shè)檢驗(yàn)功效和P值的因素
秦國友,趙耐青
(復(fù)旦大學(xué)公共衛(wèi)生學(xué)院,上海 200032)
摘要:以單樣本t檢驗(yàn)為例,對(duì)醫(yī)學(xué)統(tǒng)計(jì)教學(xué)重點(diǎn)和難點(diǎn)“假設(shè)檢驗(yàn)中的重要概念功效和P值的影響因素”進(jìn)行討論,為進(jìn)行假設(shè)檢驗(yàn)的課堂教學(xué)提供參考。
關(guān)鍵詞:假設(shè)檢驗(yàn);t檢驗(yàn);功效;P值
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一個(gè)重要內(nèi)容,也是醫(yī)學(xué)統(tǒng)計(jì)課堂教學(xué)的重點(diǎn)和難點(diǎn)之一,其中涉及統(tǒng)計(jì)的重要思想和眾多概念。在講授這部分內(nèi)容時(shí),很多學(xué)生即使是對(duì)相關(guān)的知識(shí)點(diǎn)有很好的記憶,但是在理解和實(shí)際應(yīng)用上也可能會(huì)出現(xiàn)較多問題和偏差。對(duì)于假設(shè)檢驗(yàn)問題,有很多文獻(xiàn)從不同的角度進(jìn)行了討論[1-9]。本文將從基本的t檢驗(yàn)入手,借助t分布統(tǒng)計(jì)量和t檢驗(yàn)統(tǒng)計(jì)量之間的聯(lián)系對(duì)影響假設(shè)檢驗(yàn)功效(Power)和P值大小的因素進(jìn)行討論,這有助于對(duì)功效和P值的含義做出清晰的解釋。
假設(shè)檢驗(yàn)是用來判斷樣本與總體或樣本與樣本間的差異是由抽樣誤差引起還是由總體差別所造成的統(tǒng)計(jì)推斷方法。假設(shè)檢驗(yàn)中有兩個(gè)非常重要的概念——功效與P值。功效的定義是在備擇假設(shè)H1成立的條件下拒絕原假設(shè)H0的概率,而P值的含義為在原假設(shè)成立的總體中抽樣出現(xiàn)比當(dāng)前樣本還要極端情況的概率[1-4]。一個(gè)檢驗(yàn)方法功效的高低說明該方法區(qū)分原假設(shè)與備擇假設(shè)能力的強(qiáng)弱。通常我們通過P值來做出拒絕還是不拒絕原假設(shè)的結(jié)論。在第一類錯(cuò)誤給定0.05時(shí),P<0.05,則拒絕;否則,不拒絕。當(dāng)拒絕原假設(shè)時(shí),我們通常說差異有統(tǒng)計(jì)學(xué)意義。但是學(xué)生在學(xué)習(xí)這些概念后,包括很多科研工作者在實(shí)際使用中,對(duì)功效和P值的理解還存在一些誤區(qū)。比如:認(rèn)為P值越小總體間差別越大,這個(gè)理解一般是不正確的。如何清晰地說明這些問題并且讓學(xué)生能夠理解對(duì)于假設(shè)檢驗(yàn)的教學(xué)和實(shí)際中的應(yīng)用都是非常重要的。在本文中我們將結(jié)合課堂教學(xué)經(jīng)驗(yàn),以單樣本的t檢驗(yàn)為例,結(jié)合t分布統(tǒng)計(jì)量和t檢驗(yàn)統(tǒng)計(jì)量來闡述這些問題。
假設(shè)檢驗(yàn)的基本步驟在很多教科書和文獻(xiàn)中都有論述,在這里就不再闡述了。我們直接以單樣本的單側(cè)t檢驗(yàn)為例來說明我們?cè)谡n堂教學(xué)中如何簡(jiǎn)單闡明功效和P值的影響因素。對(duì)影響因素的分析將有助于更加清晰地理解這兩個(gè)概念。單樣本的單側(cè)t檢驗(yàn)是用來檢驗(yàn)?zāi)硞€(gè)樣本來自一個(gè)未知總體的總體均數(shù)μ是否等于一個(gè)給定已知總體的總體均數(shù)μ0。研究問題是樣本所在的總體均數(shù)是否大于一個(gè)已知總體的總體均數(shù)。我們可以基于研究問題歸結(jié)為下列檢驗(yàn)假設(shè):建立原假設(shè)H0∶μ=μ0,備擇假設(shè)H2∶μ≥μ0。
對(duì)于上述一個(gè)單樣本均數(shù)比較問題,在滿足樣本來自正態(tài)總體的前提下,可以采用單樣本的t檢驗(yàn)來分析。檢驗(yàn)統(tǒng)計(jì)量為其中x表示樣本均數(shù),s表示樣本標(biāo)準(zhǔn)差,n表示樣本量。我們可以把檢驗(yàn)統(tǒng)計(jì)量進(jìn)一步寫成
圖1 統(tǒng)計(jì)量t在μ=μ0和μ>μ0時(shí)的分布情況
首先,我們通過圖1說明影響假設(shè)檢驗(yàn)功效的因素,然后可以討論出影響P值的因素。顯然,圖1中所有陰影部分的面積表示對(duì)應(yīng)備擇假設(shè)下檢驗(yàn)的功效。
當(dāng)原假設(shè)成立時(shí),即μ=μ0,則上式中的第二項(xiàng)為0,檢驗(yàn)統(tǒng)計(jì)量T自然服從自由度為n-1的t分布。
當(dāng)備擇假設(shè)成立時(shí),即μ>μ0,顯然檢驗(yàn)統(tǒng)計(jì)量不再服從t分布。我們分3種情況來討論對(duì)檢驗(yàn)功效的影響。
(1)由于標(biāo)準(zhǔn)差s是總體σ的點(diǎn)估計(jì),與總體均數(shù)μ取值無關(guān),因此在同樣的樣本量n和同樣的樣本標(biāo)準(zhǔn)差s的情況下,μ偏離μ0越遠(yuǎn),則備擇假設(shè)成立下檢驗(yàn)統(tǒng)計(jì)量分布的中心偏離零點(diǎn)越遠(yuǎn),于是圖1中所有陰影部分的面積增加,即檢驗(yàn)功效越大。
(2)在樣本量n和樣本所來自的總體均數(shù)μ不變的條件下,樣本標(biāo)準(zhǔn)差s與σ的差異是隨機(jī)抽樣誤差,總體標(biāo)準(zhǔn)差越小,樣本標(biāo)準(zhǔn)差s可能越小,則偏離零點(diǎn)的距離可能越遠(yuǎn),同樣造成檢驗(yàn)功效越大。
(3)在樣本所來自的總體均數(shù)μ和總體標(biāo)準(zhǔn)差σ不變的條件下,樣本標(biāo)準(zhǔn)差s與σ的差異是隨機(jī)抽樣誤差,因此可以認(rèn)為s應(yīng)該變化不大,當(dāng)樣本量n越大,則偏離零點(diǎn)越遠(yuǎn)的可能性越大,也會(huì)造成檢驗(yàn)功效越大。
根據(jù)上述討論,通過對(duì)T檢驗(yàn)統(tǒng)計(jì)量做一個(gè)簡(jiǎn)單的分解,我們可以清晰地分析出造成總體均數(shù)假設(shè)檢驗(yàn)問題功效變化的3個(gè)原因分別是樣本所來自總體的均數(shù)、標(biāo)準(zhǔn)差以及樣本量。注意到圖1中深色陰影部分面積為假設(shè)檢驗(yàn)的P值。通過分析,我們可以發(fā)現(xiàn)這3個(gè)因素也是影響總體均數(shù)比較的假設(shè)檢驗(yàn)問題中P值變化的3個(gè)原因,假設(shè)檢驗(yàn)的P值越小,說明差異之間越有可能存在統(tǒng)計(jì)學(xué)意義,但是無法說明是差異之間的絕對(duì)大小,因?yàn)檫@只是造成P值小的原因之一。樣本數(shù)據(jù)的波動(dòng)性和樣本量同樣會(huì)影響P值大小。如果我們想確切地了解差異的大小,區(qū)間估計(jì)是一個(gè)有效的方法。
假設(shè)檢驗(yàn)中的相關(guān)概念,特別是檢驗(yàn)功效和P值一直是醫(yī)學(xué)統(tǒng)計(jì)教學(xué)中的重點(diǎn)和難點(diǎn)。本文以單樣本t檢驗(yàn)為例,把t檢驗(yàn)統(tǒng)計(jì)量分解為一個(gè)t分布統(tǒng)計(jì)量與之和的形式,通過對(duì)的分析,清晰地說明了影響檢驗(yàn)功效和P值大小的因素,從而可以避免對(duì)檢驗(yàn)功效與P值理解和認(rèn)識(shí)上的偏差,科學(xué)合理地利用P值對(duì)實(shí)際問題進(jìn)行解釋。在衛(wèi)生統(tǒng)計(jì)學(xué)的課堂教學(xué)上,我們廣泛采用這種方式講授,取得了良好的教學(xué)效果。學(xué)生普遍反映,通過這種方式更加容易理解和掌握相關(guān)的知識(shí)點(diǎn)。
參考文獻(xiàn):
[1]顏虹.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].2版.北京:人民衛(wèi)生出版社,2010.
[2]趙耐青,陳峰.衛(wèi)生統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2008.
[3]李康,賀佳,楊土保.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].6版.北京:人民衛(wèi)生出版社,2013.
[4]方積乾,徐勇勇,陳峰.衛(wèi)生統(tǒng)計(jì)學(xué)[M].7版.北京:人民衛(wèi)生出版社,2013.
[5]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2004.
[6]鄭捷.如何在假設(shè)檢驗(yàn)中設(shè)立原假設(shè)[J].統(tǒng)計(jì)教育,2005(12):30-31.
[7]吳啟富,張玉春.統(tǒng)計(jì)假設(shè)檢驗(yàn)中小概率原理的辨析[J].統(tǒng)計(jì)與決策,2012(17):70-71.
[8]陳秀虎,楊敏,白厚義.單尾假設(shè)檢驗(yàn)假設(shè)設(shè)置的探討[J].統(tǒng)計(jì)教育,2007(2):8-9.
[9]李福民.論衛(wèi)生統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)[J].衛(wèi)生職業(yè)教育,2003,21(3):48.■
中圖分類號(hào):G420
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-1246(2016)12-0153-02