王瑞平
(上海市皮膚病醫(yī)院臨床研究與創(chuàng)新轉(zhuǎn)化中心 上海 200443)
樣本量估算是隨機(jī)對(duì)照臨床試驗(yàn)(randomized controlled trial, RCT)研究設(shè)計(jì)的重要內(nèi)容。樣本量過小不能保證得出可靠的研究結(jié)論。而樣本量過大則會(huì)造成不必要的人力、物力和財(cái)力的浪費(fèi),同時(shí)也會(huì)增加研究的難度。因此,如何根據(jù)不同的RCT類型,估算出合理的樣本量是臨床研究工作者應(yīng)掌握的一項(xiàng)重要技能。本文從影響樣本量大小的因素著手,以舉例形式重點(diǎn)闡述RCT研究設(shè)計(jì)的樣本量估算方法。
在樣本量估算時(shí),應(yīng)明確幾個(gè)參數(shù):①Ⅰ類錯(cuò)誤概率α,一般取0.01或0.05,α越小樣本量越大。②把握度β,一般取0.1或0.2,β越小樣本量越大。③允許誤差δ,δ越小樣本量越大。④干預(yù)的有效率(p1和p0)或療效評(píng)價(jià)結(jié)果均值差值(D)和標(biāo)準(zhǔn)差(SD),p1和p0的差異越大,樣本量越?。籗D與D的比值越大,樣本量越大。研究者可以根據(jù)自己的實(shí)際情況,通過調(diào)整參數(shù)的選擇確定合適的樣本量[1]。
此外,RCT的樣本量估算與研究的設(shè)計(jì)類型有關(guān)。常用的臨床研究設(shè)計(jì)包括差異性研究設(shè)計(jì)、優(yōu)效性設(shè)計(jì)、非劣性設(shè)計(jì)和等效性設(shè)計(jì)。在樣本量估算時(shí)還須明確依據(jù)的參數(shù),無論是以上哪種臨床研究設(shè)計(jì),樣本量均應(yīng)依據(jù)該臨床試驗(yàn)的主要療效指標(biāo)來估算樣本量。RCT中常用的主要療效指標(biāo)包括兩大類,第一類為“定量變量”指標(biāo),如手術(shù)中出血量、中醫(yī)證候評(píng)分、疼痛視覺模擬評(píng)分(visual analogue scale, VAS)等;第二類為“定性變量”指標(biāo),如治療有效率,痊愈率、銀屑病皮損面積和嚴(yán)重程度指數(shù)(psoriasis area and severity index, PASI)75達(dá)成率等。研究者須根據(jù)具體情況選擇合適的指標(biāo)進(jìn)行樣本量估算。此外,須指出的是,主要療效指標(biāo)的來源有2個(gè),第一個(gè)是研究者自己課題的預(yù)試驗(yàn),這個(gè)是普遍比較推薦的,樣本量估算的準(zhǔn)確度高;第二個(gè)是來自文獻(xiàn),須注意,試驗(yàn)組和對(duì)照組的參考數(shù)據(jù)指標(biāo)應(yīng)來源于同一篇參考文獻(xiàn),而不能是來源于2篇文獻(xiàn)或多篇文獻(xiàn)。
1)當(dāng)研究為兩組均等平行1∶1設(shè)計(jì)時(shí)的樣本量估算 例如,擬開展電針治療失眠的平行對(duì)照臨床試驗(yàn)研究。預(yù)實(shí)驗(yàn)結(jié)果顯示,電針治療組的有效率為90%,假電針治療組的有效率為50%,假設(shè)該研究的Ⅰ類錯(cuò)誤概率α=0.05,把握度(1-β)=90%,試估算該研究所需要的樣本量。根據(jù)該臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要23例,考慮10%脫落率,每組應(yīng)招募26例,兩組共計(jì)52例。
2)當(dāng)研究為3組及以上均等平行設(shè)計(jì)時(shí)的樣本量估算 例如,預(yù)開展針灸配合心理療法治療失眠的臨床試驗(yàn),采用差異性均等(1∶m)設(shè)計(jì)方案,分為針灸治療組、針灸聯(lián)合心理療法組、心理療法組等3組。預(yù)實(shí)驗(yàn)中,針灸聯(lián)合心理療法的有效率為94%,單純針灸療法的有效率為85%,單獨(dú)心理療法組有效率為80%,設(shè)α=0.05(雙側(cè)),把握度(1-β)=90%,β=0.10,由此估計(jì)樣本量n。根據(jù)該臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算,因?yàn)樵撗芯吭O(shè)置了3個(gè)平行組,預(yù)實(shí)驗(yàn)p1=94%、p2=85%、p3=80%,而樣本量計(jì)算公式中僅有p1和p2這2個(gè)數(shù)據(jù)可以帶入,這時(shí)應(yīng)選擇2個(gè)差異最小的率帶入公式,其計(jì)算出的樣本量最大,結(jié)果也最為保守。由此,選擇p1=85和p2=80%代入公式。此外,因?yàn)槭?組設(shè)計(jì),后續(xù)牽涉到兩兩比較,所以應(yīng)調(diào)整檢驗(yàn)水準(zhǔn)α,由α=0.05調(diào)整為a=0.05/3=0.017代入公式計(jì)算:
根據(jù)上述計(jì)算結(jié)果,每組需要1 557例,考慮10%脫落率,則每組應(yīng)招募1 713例,三組共計(jì)5 139例。
1)當(dāng)研究為兩組均等平行1∶1設(shè)計(jì)時(shí)的樣本量估算 例如,預(yù)研究一種新型鎮(zhèn)痛泵對(duì)外科術(shù)后的止痛效果,以術(shù)后24 h VAS為主要療效指標(biāo),采用平行對(duì)照設(shè)計(jì),分為常規(guī)藥物鎮(zhèn)痛組和鎮(zhèn)痛泵干預(yù)組。查閱類似設(shè)計(jì)的文獻(xiàn)結(jié)果顯示,常規(guī)藥物鎮(zhèn)痛組的VAS評(píng)分平均值μ1=4分,鎮(zhèn)痛泵干預(yù)組VAS評(píng)分平均值μ2=1分,標(biāo)準(zhǔn)差s=3分,考慮10%脫落率,假設(shè)本研究的Ⅰ類錯(cuò)誤概率α=0.05,把握度(1-β)=80%,試估算本研究所需要的樣本量。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要16例,考慮10%脫落率,每組應(yīng)招募18例,兩組共計(jì)36例。
2)當(dāng)研究為兩組不均等設(shè)計(jì)(k=1∶2)時(shí)的樣本量估算 例如,同樣是研究新型鎮(zhèn)痛泵對(duì)外科術(shù)后的止痛效果,以術(shù)后24 h VAS為主要療效指標(biāo),但采用差異性不均等設(shè)計(jì)(k=1∶2),分為常規(guī)藥物鎮(zhèn)痛組和鎮(zhèn)痛泵干預(yù)組。查閱類似設(shè)計(jì)的文獻(xiàn)結(jié)果顯示,常規(guī)藥物鎮(zhèn)痛組的VAS評(píng)分平均值μ1=4分,鎮(zhèn)痛泵干預(yù)組VAS評(píng)分平均值μ2=1分,標(biāo)準(zhǔn)差s=3分,假設(shè)本研究的Ⅰ類錯(cuò)誤概率α=0.05,把握度(1-β)=80%,考慮脫落率為10%,試估算本研究所需要的樣本量n。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,鎮(zhèn)痛泵干預(yù)組需要24例,常規(guī)藥物鎮(zhèn)痛組需要12例,考慮10%脫落率,鎮(zhèn)痛泵干預(yù)組需要28例,常規(guī)藥物鎮(zhèn)痛組需要14例,兩組共計(jì)42例。
3)當(dāng)研究為多組均等設(shè)計(jì)時(shí)的樣本量估算 例如,仍然預(yù)研究新型鎮(zhèn)痛泵對(duì)外科術(shù)后的止痛效果,以術(shù)后24 h VAS為主要療效指標(biāo),但采用差異性均等(1∶m)設(shè)計(jì)方案,分為鎮(zhèn)痛泵干預(yù)組(n1)、常規(guī)藥物鎮(zhèn)痛組(n2)和安慰劑組(n3)。假定鎮(zhèn)痛泵干預(yù)組VAS評(píng)分平均值μ1=1分,常規(guī)藥物鎮(zhèn)痛組VAS評(píng)分平均值μ2=4分,安慰劑組VAS評(píng)分平均值μ3=7分,標(biāo)準(zhǔn)差s=3分,設(shè)α=0.05(雙側(cè)),β=0.10,考慮10%脫落率,由此估計(jì)樣本量n。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
λ為自由度為k-1的卡方分布非中心參數(shù),k為組數(shù),可查表1獲得。
表1 λ界值表
根據(jù)上述計(jì)算,每組需要7例,考慮10%脫落率,每組需要8例,3組共計(jì)24例。
優(yōu)效性設(shè)計(jì):檢驗(yàn)一種藥物或治療方法是否優(yōu)于另一種藥物或治療方法的試驗(yàn),稱為優(yōu)效性試驗(yàn)。一般對(duì)于以安慰劑作為對(duì)照或加載試驗(yàn)的臨床試驗(yàn)應(yīng)設(shè)計(jì)為優(yōu)效性臨床試驗(yàn)。
Δ為一具有臨床意義的數(shù)值。拒絕H0可得出試驗(yàn)藥比對(duì)照藥優(yōu)效。
定性變量為主要療效指標(biāo)樣本量公式:
定量變量為主要療效指標(biāo)樣本量公式:
1)以定性變量為主要療效結(jié)局指標(biāo)的臨床試驗(yàn)研究,兩組均等平行1∶1設(shè)計(jì)。例如,假定某對(duì)照藥的治愈率為60%,估計(jì)新藥的治愈率可能達(dá)到80%,且根據(jù)理論新藥不可能比對(duì)照藥差。研究者認(rèn)為新藥療效至少要優(yōu)于對(duì)照藥5%才有臨床意義。采用均等(1∶1)優(yōu)效性設(shè)計(jì)方案,設(shè)α=0.025(單側(cè)),β=0.20(單側(cè)),Δ=5%,估計(jì)樣本量n。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要140例,考慮20%脫落率,每組需招募168例,兩組共計(jì)336例。
2)以定量變量為主要療效結(jié)局指標(biāo)的臨床試驗(yàn)研究,兩組均等平行1∶1設(shè)計(jì)。例如,新型鎮(zhèn)痛泵對(duì)外科術(shù)后的止痛效果,以術(shù)后24 h VAS為主要療效指標(biāo),采用均等(1∶1)優(yōu)效性設(shè)計(jì)方案,分為鎮(zhèn)痛泵干預(yù)組和常規(guī)藥物鎮(zhèn)痛組。預(yù)實(shí)驗(yàn)顯示,鎮(zhèn)痛泵干預(yù)組VAS評(píng)分平均值μt=1分,常規(guī)藥物鎮(zhèn)痛組VAS評(píng)分平均值μc=4分,標(biāo)準(zhǔn)差s=3分,假設(shè)本研究的Ⅰ類錯(cuò)誤單側(cè)概率α=0.025,把握度(1-β)=90%,研究者認(rèn)為鎮(zhèn)痛泵干預(yù)組相比于常規(guī)藥物鎮(zhèn)痛組VAS評(píng)分至少降低2分(Δ=-2分)才有臨床意義。在考慮20%脫落率的情況下,試估算本研究所需要的樣本量。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要189例,考慮20%脫落率,則每組需要227例,兩組共計(jì)454例。
非劣效性設(shè)計(jì):檢驗(yàn)一種藥物/治療方法是否不劣于另一種藥物/治療方法的臨床試驗(yàn),稱為非劣效性試驗(yàn)。非劣效性設(shè)計(jì)要求陽性對(duì)照藥應(yīng)具有穩(wěn)定的優(yōu)效性,一般用于由客觀療效指標(biāo)的臨床研究中(例如2型糖尿病降糖治療中的糖化血紅蛋白)。
Δ為一具有臨床意義的數(shù)值。拒絕H0可得出試驗(yàn)藥比對(duì)照藥優(yōu)效。
定性變量為主要療效指標(biāo)樣本量公式:
定量變量為主要療效指標(biāo)樣本量公式:
1)以定性變量為主要療效結(jié)局指標(biāo)的臨床試驗(yàn)研究,兩組均等平行1∶1設(shè)計(jì)。例如,估計(jì)某對(duì)照藥的治愈率為85%,試驗(yàn)藥的治愈率為80%,在一項(xiàng)RCT中,如果試驗(yàn)藥比對(duì)照藥最多差10%則可以被接受。采用均等(1∶1)非劣效性設(shè)計(jì)方案,設(shè)α=0.025(單側(cè)),β=0.20(單側(cè)),Δ=10%,估計(jì)樣本量n。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要902例??紤]10%脫落率,則每組最終需要992例,兩組共計(jì)1 984例。
2)以定量變量為主要療效結(jié)局指標(biāo)的臨床試驗(yàn)研究,兩組均等平行1∶1設(shè)計(jì)。例如,試驗(yàn)藥某量表評(píng)分平均值μt=15,陽性對(duì)照組藥μc=16,標(biāo)準(zhǔn)差s=2.0。假設(shè)本研究的Ⅰ類錯(cuò)誤單側(cè)概率α=0.025,把握度(1-β)=90%,研究者認(rèn)為兩者療效之差不超過1.8分(Δ=1.8)即有臨床意義。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要99例。考慮10%脫落率,則每組需要109例,兩組共計(jì)218例。
等效性設(shè)計(jì):檢驗(yàn)一種藥物/治療方法是否與另一種藥物/治療方法的療效“相等”的試驗(yàn),稱為等效性試驗(yàn),常用于評(píng)價(jià)仿制藥的臨床藥效,Δ為等效性界值。
Δ為一具有臨床意義的數(shù)值。拒絕H01和H02即可得出試驗(yàn)藥等效于對(duì)照藥。
定性變量為主要療效指標(biāo)樣本量公式:
定量變量為主要療效指標(biāo)樣本量公式:
以定性變量為主要療效結(jié)局指標(biāo)的臨床試驗(yàn)研究,兩組均等平行1∶1設(shè)計(jì)。例如,估計(jì)某對(duì)照藥與試驗(yàn)藥的治愈率均為70%,兩藥治愈率之差不超過10%即認(rèn)為等效。采用均等(1∶1)等效性設(shè)計(jì)方案,設(shè)α=0.05(雙側(cè)),β=0.20(雙側(cè)),Δ=10%,由此估計(jì)樣本量n。根據(jù)本臨床試驗(yàn)研究的設(shè)計(jì),結(jié)合主要療效結(jié)局指標(biāo),采用如下公式進(jìn)行樣本量估算:
根據(jù)上述計(jì)算,每組需要440例。考慮10%脫落率,每組則需要488例,兩組共計(jì)976例。