樣本量估計及其在nQuery+nTerim和SAS軟件上的實現(xiàn)
——均數(shù)比較(八)*

2017-03-09 08:35:07南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系詹志穎曹穎姝段重陽陳平雁

中國衛(wèi)生統(tǒng)計 2017年1期

關(guān)鍵詞：衛(wèi)生統(tǒng)計均數(shù)樣本量

南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系詹志穎曹穎姝段重陽陳平雁

南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)系詹志穎曹穎姝段重陽陳平雁△

1.2.1.9 兩組泊松分布均數(shù)比較

1.非限制性最大似然估計(MLE，簡記W1)

(1-34)

2.限制性最大似然估計(CMLE，簡記W2)

(1-35)

3.對數(shù)轉(zhuǎn)換的非限制性最大似然估計(ln(MLE)，簡記W3)

(1-36)

4.對數(shù)轉(zhuǎn)換的限制性最大似然估計(ln(CMLE)，簡記W4)

(1-37)

5.方差穩(wěn)健估計(VS，簡記W5)

(1-38)

式中，n1與n2、γ1與γ2以及t1與t2分別為試驗組與對照組的樣本量、單位時間內(nèi)事件發(fā)生率以及個體平均觀察時間；c=R0/R1，其中R0和R1分別為零假設(shè)和備擇假設(shè)下兩組發(fā)生率的比值；ρ=R0t2n2/t1n1。

在計算樣本量時，一般先設(shè)定樣本量初始值，然后迭代樣本量直到所得的檢驗效能滿足條件。此時的樣本量，即研究所需的最小樣本量。

【例1-25】某研究欲探索使用荷爾蒙人群(試驗組)與未使用荷爾蒙人群(對照組)單位時間內(nèi)冠心病發(fā)病率是否相同。要求試驗組與對照組樣本量比例為2：1，觀察時間為2年。根據(jù)以往研究，試驗組冠心病發(fā)病率為0.0005，對照組發(fā)病率是試驗組的4倍。設(shè)定檢驗水準(zhǔn)為0.05，試估計當(dāng)檢驗效能為90%時所需的樣本量[8]。

nQuery+nTerim 4.0實現(xiàn)：設(shè)定檢驗水準(zhǔn)α=0.05，檢驗效能1-β=90%。原假設(shè)為試驗組與對照組發(fā)病率相同，即總體R0=1；備擇假設(shè)為對照組發(fā)病率是試驗組的4倍，即總體R1=4。

在nQuery+nTerim 4.0主菜單選擇：

Goal：⊙Means

Number of Groups：⊙Two

Analysis Method：⊙Test

方法框中選擇：Two Poisson Means

在彈出的樣本量估計窗口，將各參數(shù)值鍵入，選擇統(tǒng)計量，結(jié)果如圖1-61所示，即W1(MLE):試驗組需要8564人，對照組需要4282人，總樣本量為12846人；W2(CMLE):試驗組需要6889人，對照組需要3445人，總樣本量為10334人；W3(ln(MLE))和W4(ln(CMLE)):試驗組需要6685人，對照組需要3343人，總樣本量為10028人；W5(VS)):試驗組需要8590人，對照組需要4295人，總樣本量為12885人。W1與W5方法估計的樣本量偏大，其余三種方法相對來說較接近且偏少。

SAS程序：

OPTIONS LINESIZE=MAX;proc IML;

start PSMS(a,R0,R1,stat,t1,t2,rate1,nr,power);

/*a 檢驗水準(zhǔn);R0、R1分別為H0、H1下兩組發(fā)生率比值;stat檢驗統(tǒng)計量(1:W1,2:W2,3:W3,4:W4,5:W5);t1、t2分別為試驗組、對照組個體平均觀察時間;rate1試驗組發(fā)生率;nr=n2/n1;power檢驗效能*/

error=0;if(a>1|a<0)|(R0<0)|(R1<0)|(stat^=1 & stat^=2 & stat^=3 & stat^=4 & stat^=5)|

(t1<0)|(t2<0)|(rate1<0)|(nr<0)|(power>100|power< 1) then error=1;

圖1-61 nQuery+nTerim 4.0關(guān)于例1-25樣本量估計的參數(shù)設(shè)置與計算結(jié)果

if(error=1) then stop;if(error=0) then do;n1=1;rou=R0*t2*nr/t1;c=R0/R1;

do until(pwer>=power/100);n1=n1+1;n2=ceil(n1*nr);if(stat=1) then do;ts=“W1”;

pwer=probnorm((sqrt(n1*rate1*t1)*abs(1-c))/sqrt(c/rou+c**2)-probit(1-a));end;

else if(stat=2) then do;ts=“W2”;pwer=probnorm((sqrt(n1*rate1*t1)*abs(1-c))/sqrt(c/rou+c**2)-probit(1-a)*sqrt((c+rou)/(1+c*rou)));end;else if(stat=3) then do;ts=“W3”;pwer=probnorm(sqrt(n1*rate1*t1)*abs(log(c))/sqrt(c/rou+1)-probit(1-a));end;

else if(stat=4) then do;ts=“W4”;pwer=probnorm(sqrt(n1*rate1*t1)*abs(log(c))/sqrt(c/rou+1)-probit(1-a)*(sqrt(c*(rou**2+2*rou+1))/(c+rou)));end;else do;ts=“W5”;pwer=probnorm((2*abs(1-sqrt(c))*sqrt(n1*rate1*t1+3/8)-probit(1-a)*sqrt(c/rou+c))/sqrt(c/rou+1));end;end;pwer=round(pwer*100,0.000000000001);print a R0 R1 ts t1 t2 rate1 n1 n2 nr pwer[label=“power(%)”];end;finish PSMS;

run PSMS(0.05,1,4,1,2,2,0.0005,0.5,90);

run PSMS(0.05,1,4,2,2,2,0.0005,0.5,90);

run PSMS(0.05,1,4,3,2,2,0.0005,0.5,90);

run PSMS(0.05,1,4,4,2,2,0.0005,0.5,90);

run PSMS(0.05,1,4,5,2,2,0.0005,0.5,90);quit;

SAS運行結(jié)果見圖1-62。

圖1-62 SAS 9.4關(guān)于例1-25樣本量估計的參數(shù)設(shè)置與計算結(jié)果

1.2.1.10 兩組負二項分布均數(shù)比較

方法：Zhu和Lakkis(2014)[9]提出的兩組負二項分布均數(shù)差異性檢驗的樣本量估計方法是建立在均值為ln(r1/r2)，方差為σ2=(1/n2)[(1/μt)[1/r2+1/(θr1)]+(1+θ)k/θ]的正態(tài)分布基礎(chǔ)上，其檢驗效能的計算公式為：

(1-39)

(1)Reference Rate(RR):

V0(RR)=(1+θ)/(θμtr2)+(1+θ)k/θ

(1-40)

(2)True Rates(TR):

V0(TR)=(1/μt)[1/r2+1/(θr1)]+(1+θ)k/θ

(1-41)

(3)Maximum Likelihood(ML)

V0(ML)=(1+θ)2/[θμt(r2+θr1)]+(1+θ)k/θ

(1-42)

在計算樣本量時，一般先設(shè)定樣本量初始值，然后迭代樣本量直到所得的檢驗效能滿足條件。此時的樣本量，即研究所需的最小樣本量。

【例1-26】慢性阻塞性肺病的惡化事件研究中，對照組事件率為0.8人年，試驗組較對照組有15%的減少(r1/r2=0.85)，平均暴露時間為0.75年，離散參數(shù)為0.7，且為均衡設(shè)計(θ=1)。設(shè)定檢驗水準(zhǔn)為0.05，試估計當(dāng)檢驗效能為80%時研究所需樣本量[9]。

nQuery+nTerim 4.0實現(xiàn)：

設(shè)定檢驗水準(zhǔn)α=0.05，檢驗效能1-β=80%。原假設(shè)為試驗人群與對照人群的事件率相同，即總體r1=r2；備擇假設(shè)為對照人群事件率與試驗人群不同，即總體r1≠r2。

在nQuery+nTerim 4.0主菜單選擇：

Goal：⊙Means

Number of Groups：⊙Two

Analysis Method：⊙Test

方法框中選擇：Two Negative Binomial Rates

在彈出的樣本量估計窗口，將各參數(shù)值鍵入，結(jié)果如圖3-63所示，即Reference Rate方法，兩組各需1433人，總樣本量為2866人；True Rates方法，兩組各需1494人，總樣本量為2988人；Maximum Likelihood方法，兩組各需1490人，總樣本量為2980人。

圖1-63 nQuery+nTerim 4.0關(guān)于例1-26樣本量估計的參數(shù)設(shè)置與計算結(jié)果

SAS程序：

OPTIONS LINESIZE=MAX;proc IML;

start NBR(a,r2,rr,miut,k,rv,nr,power);

/*a 檢驗水準(zhǔn)； r2 對照組平均事件率；rr=r1/r2；miut個體平均暴露時間；k 離散參數(shù)；rv方差(V0)的計算方法；1：RR；2：TR；3：ML；nr=n1/n2，n1與n2分別為試驗組與對照組的樣本量；power 檢驗效能*/

error=0;if(a>1|a<0)|(r2<0)|(rr<0)|(miut<0)|(k<0)|(rv^=1 &rv^=2 &rv^=3)|(nr<0)|(power>100|power< 1) then error=1;if(error=1) then stop;if(error=0) then do;n2=2;r1=r2*rr;

v1=(1/r2+1/(nr*r1))/miut+(1+nr)*k/nr;if(rv=1) then do;rvlbl=“RR”;

v0=(1+nr)/(nr*miut*r2)+(1+nr)*k/nr;end;else if(rv=2) then do;rvlbl=“TR”;

v0=(1/r2+1/(nr*r1))/miut+(1+nr)*k/nr ;end;else do;rvlbl=“ML”;

v0=(1+nr)**2/(nr*miut*(r2+nr*r1))+(1+nr)*k/nr ;end;do until(pwer>=power);n2=n2+1;pwer=100*probnorm((sqrt(n2)*abs(log(rr))-probit(1-a/2)*sqrt(v0))/sqrt(v1));end;n1=nr*n2;pwer=round(pwer,0.0000001);print a r2 rr miut k rvlbl[lable=“rv”] n1 n2 nr pwer[label=“power(%)”];end;finish NBR;

run NBR(0.05,0.8,0.85,0.75,0.7,1,1,80);

run NBR(0.05,0.8,0.85,0.75,0.7,2,1,80);

run NBR(0.05,0.8,0.85,0.75,0.7,3,1,80);

quit;

SAS運行結(jié)果：

圖1-64 SAS 9.4關(guān)于例1-26樣本量估計的參數(shù)設(shè)置與計算結(jié)果

[1]呂朵，段重陽，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(一)，中國衛(wèi)生統(tǒng)計，2012，29(1)：127-131.

[2]鄧居敏，呂朵，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(二)，中國衛(wèi)生統(tǒng)計，2012，29(1)：132-134.

[3]段重陽，呂朵，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(三)，中國衛(wèi)生統(tǒng)計，2012，29(2)：275-278.

[4]段重陽，呂朵，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(四)，中國衛(wèi)生統(tǒng)計，2012，29(2)：279-283.

[5]呂朵，段重陽，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(五)，中國衛(wèi)生統(tǒng)計，2012，29(3)：451-455.

[6]段重陽，呂朵，陳平雁.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(六)，中國衛(wèi)生統(tǒng)計，2012，29(3)：456-459.

[7]張斌，呂朵，陳平雁等.樣本量估計及其在nQuery和SAS軟件上的實現(xiàn)—均數(shù)比較(七)，中國衛(wèi)生統(tǒng)計，2012，29(4)：598-602.

[8]Gu K,Ng HKT,Tang ML,et al.Testing the ratio of two poisson rates.Biometrical Journal,2008,50(2):283-298.

[9]Zhu H,Lakkis H.Sample size calculation for comparing two negative binomial rates.Statistics in medicine,2014,33(3):376-387.

(責(zé)任編輯：郭海強)

*本研究得到國家自然科學(xué)基金資助(編號：81673270)

編者按：本文為南方醫(yī)科大學(xué)陳平雁教授團隊2012年發(fā)表于本刊的《樣本量估計及其在nQuery+nTerim和SAS軟件上的實現(xiàn)—均數(shù)比較》系列文章[1-7]的后續(xù)部分。前期主要考慮了連續(xù)變量和等級變量的情形，本文將介紹離散變量，即兩組泊松分布及負二項分布均數(shù)比較的樣本量估計方法。文中的公式和實例序號均依照前期的系列文章順序編排，以保持原有結(jié)構(gòu)。

△通信作者：陳平雁

樣本量估計及其在nQuery+nTerim和SAS軟件上的實現(xiàn)——均數(shù)比較(八)*

樣本量估計及其在nQuery+nTerim和SAS軟件上的實現(xiàn)
——均數(shù)比較(八)*