呂 朵 段重陽 陳平雁
樣本量估計是研究設(shè)計中的一個極為重要環(huán)節(jié),如何正確估計樣本量即使對于統(tǒng)計專業(yè)人員都是較難把握的技能。目前,無論是統(tǒng)計專業(yè)人員還是非專業(yè)人員在實施樣本量估計時大多面臨以下三個問題:其一,目前國內(nèi)尚缺乏系統(tǒng)地介紹樣本量估計方法的文獻(xiàn),從而導(dǎo)致在實驗設(shè)計階段進(jìn)行樣本量估計時手段受限,尤其涉及到臨床試驗中應(yīng)用較多的非劣性檢驗和等效性檢驗,以及一般研究中非參數(shù)檢驗、多元回歸和相關(guān)分析的樣本量估計方法。其二,由于國內(nèi)的教科書、專著和一些相關(guān)的期刊論著在介紹樣本量估計方法時缺乏源頭文獻(xiàn)的引用,加之某些設(shè)計的樣本量估計方法不止一種,我們采用的方法是否準(zhǔn)確和權(quán)威?我們應(yīng)用的究竟是誰提出的方法?其三,樣本量估計的應(yīng)用軟件并不普及,如果依靠研究人員自己編程會有相當(dāng)難度。
鑒于上述原因,我們以樣本量估計專業(yè)軟件nQuery Advisor 7.0〔1〕為依據(jù)(因為該軟件目前被國際上公認(rèn)為樣本量估計的權(quán)威軟件之一,同時得到美國FDA的認(rèn)可),系統(tǒng)介紹樣本量估計方法,給出計算公式及其權(quán)威出處,通過實例加以說明,并附有nQuery Advisor 7.0的操作主界面和樣本量估計中參數(shù)設(shè)置的界面,以及SAS 9.2軟件實現(xiàn)的程序,便于廣大讀者應(yīng)用。為了驗證nQuery Advisor 7.0計算結(jié)果的準(zhǔn)確性,同時用SAS 9.2軟件及R語言由雙人乃至三人獨立編程進(jìn)行驗證,以確保無誤。由于篇幅所限,本系列文章將側(cè)重基于差異性檢驗與等效性檢驗的樣本量估計方法,基本不涉及基于可信區(qū)間的樣本量估計方法。有關(guān)R語言實現(xiàn)的程序?qū)⒂辛砦慕榻B。
全部內(nèi)容按統(tǒng)計分析方法分為五個部分,分別為均數(shù)比較、率的比較、生存分析、相關(guān)分析、回歸分析的樣本量估計,詳細(xì)目錄見表1。所涉及的參考文獻(xiàn)均列在每個部分的結(jié)尾處。
因本文涉及的樣本量計算公式較多,凡公式中出現(xiàn)的相同符號統(tǒng)一定義如下:
α:檢驗水準(zhǔn);
1-β:檢驗效能;
s:取1代表單側(cè)檢驗,取2代表雙側(cè)檢驗;
MSE:均方差;
CV:變異系數(shù);
各類參數(shù):如μ(總體均數(shù))、σ(總體標(biāo)準(zhǔn)差)等,這些參數(shù)一般未知,通常根據(jù)優(yōu)先順序 — 預(yù)試驗結(jié)果、他人研究結(jié)果、假設(shè)等三種方式進(jìn)行估計。
若個別公式中的符號與上述定義不符,或另有含義,將以個別公式的定義為準(zhǔn)。
1 均數(shù)比較
1.1 單樣本均數(shù)的比較
1.1.1 差異性檢驗
1.1.1.1 單樣本t檢驗
方法:O'Brien和Muller(1993)〔2〕給出的單樣本t檢驗的樣本量估計是建立在自由度為n-1,非中心參數(shù)為的非中心t分布基礎(chǔ)上。其檢驗效能的計算公式為:
表1 樣本量估計方法目錄
式中,μ1為預(yù)期總體均數(shù);μ0為已知總體均數(shù);σ為預(yù)期的總體標(biāo)準(zhǔn)差。
在計算樣本量時,一般先設(shè)定樣本量初始值,然后迭代樣本量直到所得的檢驗效能滿足條件為止。此時的樣本量,即研究所需的樣本量。
【例1-1】某研究欲驗證從事鉛作業(yè)男性工人的血紅蛋白含量是否與正常成年男性平均值(140 μg/L)有差異。預(yù)試驗測得從事鉛作業(yè)男性工人的血紅蛋白含量均值130.83 μg/L,標(biāo)準(zhǔn)差 25.74 μg/L。如果設(shè)定α為5%水平,檢驗效能為85%,雙側(cè)檢驗,統(tǒng)計分析采用單樣本t檢驗,試估計樣本量。
nQuery Advisor 7.0實現(xiàn):設(shè)定檢驗水準(zhǔn) α=0.05;雙側(cè)檢驗,即s=2;檢驗效能取1-β=85%。依據(jù)上述基礎(chǔ)數(shù)據(jù)可知,μ1=130.83,μ0=140,σ =25.74。在nQuery Advisor 7.0主菜單選擇:
Goal:Make Conclusion Using:⊙Means
Number of Groups:⊙One
Analysis Method:⊙Test
方法框中選擇:One group t-test for difference in means
在彈出的樣本量計算窗口將各參數(shù)鍵入,如圖1-1所示,結(jié)果為n=73。即本試驗的最少樣本量為73例。
圖1 -1 nQuery Advisor7.0關(guān)于例1-1樣本量估計的參數(shù)設(shè)置與計算結(jié)果
圖1 -2 SAS 9.2關(guān)于例1樣本量估計的參數(shù)設(shè)置與計算結(jié)果
1.1.1.2 基于差值均數(shù)的配對t檢驗
方法:與單樣本t檢驗相同,見式(1-1),只需將μ1定義為預(yù)期差值的總體均數(shù)μd=μ1-μ2;已知總體均數(shù)μ0定義為0;σ為預(yù)期差值的總體標(biāo)準(zhǔn)差。
【例1-2】在一項將要開展的減肥新藥臨床試驗中,采用自身前后對照的配對設(shè)計。由預(yù)試驗得到的初步結(jié)果顯示,未服藥前的體重指數(shù)(BMI)均數(shù)為28.5,服藥治療后的BMI均數(shù)為26.0,服藥前后差值的標(biāo)準(zhǔn)差為4.5。如果設(shè)定α為5%水平,檢驗效能為85%,雙側(cè)檢驗,統(tǒng)計分析采用配對t檢驗,試估計樣本量。
nQuery Advisor 7.0實現(xiàn):設(shè)定檢驗水準(zhǔn) α=0.05;雙側(cè)檢驗,即s=2;檢驗效能取1-β=85%。依據(jù)上述基礎(chǔ)數(shù)據(jù)可知,μ1=28.5,μ2=26.0,σ =4.5。在nQuery Advisor7.0主菜單選擇:
Goal:Make Conclusion Using:⊙Means
Number of Groups:⊙One
Analysis Method:⊙Test
方法框中選擇:Paired t-test for difference in means
在彈出的樣本量計算窗口將各參數(shù)鍵入,如圖1-3所示,結(jié)果為n=32。即本試驗的最少樣本量為32例。
SAS 9.2軟件實現(xiàn):
圖1 -3 nQuery Advisor7.0關(guān)于例1-2樣本量估計的參數(shù)設(shè)置與計算結(jié)果
圖1 -4 SAS 9.2關(guān)于例2樣本量估計的參數(shù)設(shè)置與計算結(jié)果
1.1.1.3 單個重復(fù)測量因素方差分析
方法:Dixon和 Massey(1983)〔3〕給出的單個重復(fù)測量因素方差分析的樣本量估計是建立在自由度為M-1和(M-1)(n-1),非中心參數(shù)為 nM(V/σ2·(1-ρ))的非中心F分布上。其檢驗效能的計算公式為:
式中,M為重復(fù)水平數(shù);V為各個水平均數(shù)的方差;ρ為水平間的相關(guān)系數(shù);σ為每一水平的總體標(biāo)準(zhǔn)差。
在計算樣本量時,一般先設(shè)定樣本量初始值,然后迭代樣本量直到所得的檢驗效能滿足條件為止。此時的樣本量,即研究所需的樣本量。
【例1-3】一項旨在提高兒童自尊心的心理干預(yù)試驗中,用一個滿分為100的兒童自尊心量表分別在干預(yù)前、干預(yù)后1個月、2個月,3個月對受試兒童進(jìn)行測量,以評估干預(yù)效果。通過預(yù)試驗獲得干預(yù)前得分為55,第一次測量和一月后第二次測量之間的相關(guān)系數(shù)為0.7,兩次測量的合并標(biāo)準(zhǔn)差為10。研究者預(yù)期經(jīng)過三個月的干預(yù)后得分上升到59.5。試估計本研究在檢驗效能為90%的情況下所需樣本量。
nQuery Advisor7.0實現(xiàn):設(shè)定檢驗水準(zhǔn)α=0.05;檢驗效能取1-β=90% 。依據(jù)上述基礎(chǔ)數(shù)據(jù)可知,ρ=0.7,σ =10,M=4。在nQuery Advisor7.0 主菜單選擇:
Goal:Make Conclusion Using:⊙Means
Number of Groups:⊙One
Analysis Method:⊙Test
方法框中選擇:Univariate one-way repeated measures analysis of variance。
注意,這里首先應(yīng)根據(jù)不同時間觀察結(jié)果對V進(jìn)行估計,假設(shè)測量得分逐步均勻升高。在菜單欄中選擇:
Assistants:⊙Compute Effect Size
在彈出的計算窗口將各參數(shù)鍵入,如圖1-5所示,結(jié)果為V=2.813。
圖1 -5 nQuery Advisor7.0關(guān)于例1-3樣本量估計的參數(shù)計算結(jié)果
圖1 -6 nQuery Advisor7.0關(guān)于例1-3樣本量估計的參數(shù)設(shè)置與計算結(jié)果
在圖5界面點擊Transfer按鈕,計算結(jié)果V值顯示于主對話框(圖1-6),在主對話框再鍵入其他參數(shù),結(jié)果為n=40。
圖1 -7 SAS 9.2關(guān)于例1-3樣本量估計的參數(shù)設(shè)置與計算結(jié)果