孫亞清曹穎姝陳平雁
?
樣本量估計及其在nQuery + nTerim和SAS軟件上的實現(xiàn)群隨機試驗(一)
孫亞清1曹穎姝2陳平雁△
1.南方醫(yī)科大學公共衛(wèi)生與熱帶醫(yī)學學院生物統(tǒng)計學系2013級碩士
2.南方醫(yī)科大學公共衛(wèi)生與熱帶醫(yī)學學院生物統(tǒng)計學系2014級碩士
群隨機試驗(cluster randomized trial)又稱群隨機對照試驗(cluster randomized controlled trial),是將研究對象以群為抽樣單位進行抽樣,并以群為單位將研究對象隨機分配到不同處理組進行干預的一種試驗設(shè)計方法。
7.1 兩個均數(shù)的比較(差異性檢驗)
7.1.1 完全群隨機設(shè)計下兩個均數(shù)的比較
式中,ICC為群內(nèi)相關(guān)系數(shù);m為每組群的個數(shù),簡稱群數(shù);n為每個群的樣本量,簡稱群樣本量;|μ1-μ2|為兩個均數(shù)之差,σ為標準差。這里假定兩組群內(nèi)相關(guān)系數(shù)、群數(shù)和群樣本量都相等。以上公式基于雙側(cè)檢驗,當采用單側(cè)檢驗時,只需將α/2替換為α。
在計算群數(shù)(群樣本量)時,需給定群樣本量(群數(shù)),首先設(shè)定群數(shù)(群樣本量)的初始值,然后迭代群數(shù)(群樣本量)直到滿足設(shè)定的檢驗效能為止。此時的群數(shù)(群樣本量),即研究所需的最小群數(shù)(群樣本量)。完全群隨機部分同時給出計算群數(shù)和群樣本量的實例,配對群隨機部分只給出計算群對子數(shù)的實例,計算群樣本量的實例可參照完全群隨機部分。
[例7-1]某試驗欲評價某種健康教育對2型糖尿病患者的有效性。采用完全群隨機設(shè)計,將社區(qū)作為群,試驗組在社區(qū)接受6小時健康教育,對照組采用常規(guī)護理。研究的主要療效指標是糖化血紅蛋白HbA1c的變化。假設(shè)兩組HbA1c差值為1%,標準差為2%,群內(nèi)相關(guān)系數(shù)為0.05,每個社區(qū)可招募18名患者,試估計當檢驗效能為90%時所需的社區(qū)個數(shù)及總樣本量[2]。
nQuery + nTerim 4.0實現(xiàn):
設(shè)定檢驗水準α=0.05,采用雙側(cè)檢驗,檢驗效能取1-β=90%。
在nQuery + nTerim 4.0主菜單選擇:
Goal:⊙Cluster Randomized
Number of Groups:⊙Two
Analysis Method:⊙Test
方法框中選擇:CRT Two Means Completely Randomized
在彈出的樣本量估計窗口計算框中選擇:Calculate required number of clusters given power,將各參數(shù)值鍵入,結(jié)果如圖7-1所示,即每組需要10個社區(qū),每個社區(qū)隨機抽取18名2型糖尿病患者,本研究總的樣本量為360人。
圖7-1 nQuery + nTerim 4.0關(guān)于例7-1樣本量估計的參數(shù)設(shè)置與計算結(jié)果
SAS 9.4軟件實現(xiàn):
圖7-2 SAS 9.4關(guān)于例7-1樣本量估計的參數(shù)設(shè)置與計算結(jié)果
[例7-2]研究背景同例7-1。假設(shè)每組納入社區(qū)20個,其余參數(shù)設(shè)置相同,試估計當檢驗效能為90%時每個社區(qū)所需的參與人數(shù)及總樣本量。
nQuery + nTerim 4.0實現(xiàn):
設(shè)定檢驗水準α=0.05,采用雙側(cè)檢驗,檢驗效能取1-β=90%。
主菜單和方法框的選擇同例7-1。
在彈出的樣本量估計窗口計算框中選擇:Calculate required sample size for given power,將各參數(shù)值鍵入,結(jié)果如圖7-3所示,即每個社區(qū)需隨機抽取6名2型糖尿病患者,每組需要20個社區(qū),本研究總的樣本量為240人。
圖7-3 nQuery + nTerim 4.0關(guān)于例7-2樣本量估計的參數(shù)設(shè)置與計算結(jié)果
SAS 9.4軟件實現(xiàn):
圖7-4 SAS 9.4關(guān)于例7-2樣本量估計的參數(shù)設(shè)置與計算結(jié)果
SAS程序:
proc IML;
start CMCR(a,index,x,ICC,mdiff,sita,side,power);/ *index為指示變量,index =1表示求群數(shù),此時x需輸入群樣本量;index =2表示求群樣本量,此時x需輸入群數(shù)*/
error =0;if(a>1|a<0)|(index^=1 & index^=2)|(x <=0)|(ICC<=0|ICC>=1)|(sita<=0)
|(side^=1&side^=2)|(power>100|power<1)then error =1;
if error =1 then stop;if(side =1)then a_t =a;if(side =2)then a_t =a/2;y =1;
do until(pw>=power);y =y + 1;if(index =1)then do;N =x;m =y;end;
if(index =2)then do;m =x;N =y;end;df =2#(m-1);nc =(abs(mdiff)/ sita)/ sqrt((2#(1 + ICC#(N-1)))/ (m#N));
pw =100#(1-probt(tinv((1-a_t),df),df,nc)+ probt (-tinv((1-a_t),df),df,nc));
end;pw =round(pw,0.001);
print a[label =“a”]side[label =“1 or 2 sided test”]mdiff[label =“|μ1-μ2|”]sita[label =“σ”]
ICC[label =“ICC”]m[label =“m”]N[label =“N”]pw[label =“Power(%)”];
finish CMCR;
run CMCR(0.05,1,18,0.05,0.01,0.02,2,90);/ * 例7-1*/
run CMCR(0.05,2,20,0.05,0.01,0.02,2,90);/ * 例7-2*/ quit;
7.1.2 配對群隨機設(shè)計下兩個均數(shù)的比較
方法:Donner和Klar(2000)[3]提出的配對群隨機設(shè)計下兩個均數(shù)差異性檢驗的樣本量估計方法建立在大樣本正態(tài)近似理論基礎(chǔ)上,其檢驗效能的計算公式為:
式中,k為配對的群對子數(shù),簡稱群對子數(shù);n為每個群的樣本量,簡稱群樣本量;|μ1-μ2|為兩個均數(shù)之差,σw為群內(nèi)標準差,σB為群間標準差。以上公式基于雙側(cè)檢驗,當采用單側(cè)檢驗時,只需將α/2替換為α。
在計算群對子數(shù)(群樣本量)時,需給定群樣本量(群對子數(shù)),首先設(shè)定群對子數(shù)(群樣本量)的初始值,然后迭代群對子數(shù)(群樣本量)直到滿足設(shè)定的檢驗效能為止。此時的群對子數(shù)(群樣本量),即研究所需的最小群對子數(shù)(群樣本量)。
[例7-3]某試驗欲評價富含微量元素的飲品對中小學生心理健康發(fā)展的有效性。采用配對群隨機設(shè)計,將班級作為群,以年齡作為配對因素對班級進行配對。采用安慰劑對照,將配對好的兩個班級隨機分到試驗組和對照組,試驗組的飲品中富含微量元素,對照組的飲品沒有添加微量元素。研究的主要療效指標是中小學生體重的變化。假設(shè)兩組體重的差值為0.9kg,群間標準差為0.31kg,群內(nèi)標準差為3.883kg,每個班級有38名學生,試估計當檢驗效能為80%時所需的群對子數(shù)及總樣本量[4]。
nQuery + nTerim 4.0實現(xiàn):
設(shè)定檢驗水準α=0.05,采用雙側(cè)檢驗,檢驗效能取1-β=80%。
在nQuery + nTerim 4.0主菜單選擇:
Goal:⊙Cluster Randomized
Number of Groups:⊙Two
Analysis Method:⊙Test
方法框中選擇:CRT Two Means Matched Pairs
在彈出的樣本量估計窗口計算框中選擇:Calculate required number of matched pairs of clusters for given power and sample size,將各參數(shù)值鍵入,結(jié)果如圖7-5所示,即需要匹配8對班級,每個班級需要38名學生,本研究總的樣本量為608人。
圖7-5 nQuery + nTerim 4.0關(guān)于例7-3樣本量估計的參數(shù)設(shè)置與計算結(jié)果
SAS 9.4軟件實現(xiàn):
圖7-6 SAS 9.4關(guān)于例7-3樣本量估計的參數(shù)設(shè)置與計算結(jié)果
SAS程序:
proc IML;
start CMMP(a,index,x,mdiff,sitaw,sitab,side,power);
/ *index為指示變量,index =1時表示求群對子數(shù)量,此時x需輸入群樣本量;index =2時表示求群樣本量,此時x需輸入群對子數(shù)*/
error =0;if(a>1|a<0)|(index^=1 & index^=2)|(x <=0)|(sitaw<=0)|(sitab<=0)|(side^=1 & side^=2)|(power>100 |power<1)then error =1;if error =1 then stop;
if(side =1)then a_t =a;if(side =2)then a_t =a/2;y =1;do until(pw>=power);y =y +1;
if(index =1)then do;N =x;k =y;vd =sqrt(2#(sitaw/ N + sitab));end;
if(index =2)then do;k =x;N =y;vd =sqrt(2#(sitaw/ N + sitab));end;
pw =100#CDF('NORMAL′,(abs(mdiff)#sqrt(k))/ vd-probit(1-a_t));end;pw =round(pw,0.001);
print a[label =“a”]side[label =“1 or 2 sided test”]mdiff[label =“|μ1-μ2|”]sitaw[label =“σ2w”]
sitab[label =“σ2b”]k[label =“k”]N[label =“N”]pw[label =“Power(%)”];
finish CMMP;
run CMMP(0.05,1,38,0.9,3.883,0.31,2,80);/ * 例7-3*/ quit;
(責任編輯:鄧 妍)
·方法介紹·
通信作者:△陳平雁