李黎 ,唐雨欣 ,何偉 ,張韜 ,李吉杰
1.四川大學(xué)華西第二醫(yī)院病案管理科,四川成都 610041;2.四川大學(xué)華西公共衛(wèi)生學(xué)院,四川成都 610041
近年來,我國新藥上市評(píng)審機(jī)制日益規(guī)范,對(duì)藥物臨床試驗(yàn)生物統(tǒng)計(jì)工作的指導(dǎo)和規(guī)范也更加嚴(yán)格。2016年6月3日起正式執(zhí)行的新版 《藥物臨床試驗(yàn)的生物統(tǒng)計(jì)學(xué)指導(dǎo)原則》[1],是在上一版的基礎(chǔ)上,根據(jù)當(dāng)前國際公認(rèn)原則和共識(shí)理念,并適當(dāng)體現(xiàn)近年來生物統(tǒng)計(jì)學(xué)的發(fā)展趨勢(shì)而制定的。但該文件過于凝練,部分內(nèi)容缺少細(xì)節(jié)描述,容易造成臨床醫(yī)生理解不到位,使得該文件的指導(dǎo)和規(guī)范意義降低[2]。并且很多臨床醫(yī)生對(duì)于樣本量估計(jì)的公式選擇或者軟件應(yīng)用存在一定困惑,導(dǎo)致估算的樣本量不夠準(zhǔn)確[3]。該文對(duì)臨床試驗(yàn)中常用類型的樣本量估計(jì)方法進(jìn)行系統(tǒng)研究,包括各類樣本量估計(jì)的適用條件、所需參數(shù)、公式計(jì)算等,旨在對(duì)研究者在研究設(shè)計(jì)時(shí)提供適宜方法估計(jì)樣本量,提高研究質(zhì)量。常用臨床試驗(yàn)樣本量估計(jì)分類[4]:臨床試驗(yàn)的比較類型分為以0為參照的差異性檢驗(yàn)和以Δ為參照的檢驗(yàn),以Δ為參照的檢驗(yàn)又分為優(yōu)效性檢驗(yàn)、等效性檢驗(yàn)、非劣效性檢驗(yàn)。按資料類型可分為計(jì)量資料和計(jì)數(shù)資料,按參數(shù)檢驗(yàn)方法可分為均數(shù)比較或非參數(shù)檢驗(yàn)、率的比較等,按試驗(yàn)組數(shù)可分為單組、兩組或多組;該文將從以上幾個(gè)方面進(jìn)行對(duì)常用臨床試驗(yàn)的樣本含量估計(jì)方法進(jìn)行闡述。
單組均數(shù)的差異性檢驗(yàn)常用單樣本的t檢驗(yàn)或基于差值均數(shù)的配對(duì)t檢驗(yàn)和單因素重復(fù)測(cè)量方差分析等。另外還有等效性配對(duì)t檢驗(yàn)。樣本含量計(jì)算公式如下:
此公式適用雙側(cè)檢驗(yàn),其中Zα/2為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)臨界值;若為單側(cè)檢驗(yàn),可改成單側(cè)臨界值;無論是雙側(cè)還是單側(cè)檢驗(yàn),Zβ均取單側(cè)臨界值[5]。若為配對(duì)比較,σ可取σd,若用S估計(jì)則可取Sd[6]。上述公式也可用于交叉設(shè)計(jì)的樣本含量估計(jì)[7]。
例如:為了解某藥對(duì)心率的影響,隨機(jī)抽取10名受試者做預(yù)試,測(cè)得標(biāo)準(zhǔn)差S=6.2次/分。若受試者心率高于普通人群3.0次/分認(rèn)為有專業(yè)意義,α=0.05,β=0.10,需要多大樣本含量?
本例 S=6.2 次/分,δ=3.0 次/分。 現(xiàn) α=0.05,β=0.10,均取單側(cè),查 Ζ 臨界值表得 Ζα=Ζ0.05=1.645,Ζβ=Ζ0.10=1.282,代入上式得N≈37。故需37位受試者,才有90%的概率發(fā)現(xiàn)該藥對(duì)心率的影響。
兩組均數(shù)比較常用兩樣本的t檢驗(yàn)或秩和檢驗(yàn)和兩組重復(fù)測(cè)量方差分析、交叉設(shè)計(jì)的方差分析。樣本含量估計(jì)方法可分為非劣效性檢驗(yàn)、等效性檢驗(yàn)和優(yōu)效性檢驗(yàn)[8]。
①非劣效性檢驗(yàn)兩樣本均數(shù)比較的樣本量估計(jì)公式如下[9]:
式中 δ=μ1-μ2,為兩總體均數(shù)的差值,μ1和 μ2分別為試驗(yàn)組和對(duì)照組的總體均數(shù)。Δ為非劣效性界值。σ為兩總體合并標(biāo)準(zhǔn)差。Zα,Zβ為標(biāo)準(zhǔn)正態(tài)分布的單側(cè)臨界值;Q1和 Q2為樣本比例,Q1=n1/N,Q2=n2/N[7]。
②等效性檢驗(yàn)兩樣本均數(shù)比較的樣本量估計(jì)公式如下[10]:
③優(yōu)效性檢驗(yàn)兩樣本均數(shù)比較的樣本量估計(jì)公式如下[11]:
式中 δ=μ1-μ2,為兩總體均數(shù)的差值,μ1和 μ2分別為試驗(yàn)組和對(duì)照組的總體均數(shù)。Δ為優(yōu)效性界值。σ為兩總體合并標(biāo)準(zhǔn)差。其他符號(hào)同前。
多組均數(shù)比較的差異性檢驗(yàn)常用方差分析。樣本含量估計(jì)公式如下[12]:
例如:某研究欲比較3種方案治療嬰幼兒貧血患者(血紅蛋白<100 g/L)后,血紅蛋白變化有無差異,3組各需觀察多少例。預(yù)試驗(yàn):將隨機(jī)抽取嬰幼兒貧血患者(血紅蛋白<100 g/L)均分為3組,分別采用3種方案治療后血紅蛋白增加的均數(shù)Xi分別為18.5 g/L、13.2 g/L、10.4 g/L, 標(biāo)準(zhǔn)差 Si為 11.8 g/L、13.4 g/L、9.3 g/L。參數(shù):
①α:為檢驗(yàn)水平,本例取α=0.05
②β:為檢驗(yàn)效能,本例取β=0.10
③K:為組數(shù),本例K=3。
④Ψ:該例K=3,自由度V1=K-1=2;自由度V2=N-1,N 未知,可取最大 ∞,查 α=0.05,β=0.10 時(shí)的 Ψ值表得:Ψ(α,β,K-1,∞)=2.52。
⑤:分別為第i組的均數(shù)(X1=18.5、X2=…)和標(biāo)準(zhǔn)差(S1=11.8,S2=…)的估計(jì)值,由預(yù)試驗(yàn)或文獻(xiàn)來估計(jì)。
⑥X均的確定:X均=(X1+X2+X3)/K=(18.5+13.2+10.4)/3=14.0
代入計(jì)算出樣本例數(shù):n≈51。
單組率的比較常用單樣本或配對(duì)設(shè)計(jì)的χ2檢驗(yàn)和或確切概率檢驗(yàn),樣本含量估計(jì)公式如下:
適用于大樣本情形,Zα/2和 Zβ同前其中π0為已知的總體概率,π1為預(yù)期實(shí)驗(yàn)結(jié)果的總體概率[13]。
例如:用常規(guī)方法治療過敏性鼻炎的有效率為85%,現(xiàn)試驗(yàn)新藥預(yù)計(jì)有效率為95%。若α=0.05(單側(cè)),β=0.10,問需多少病例?
兩組率的比較常用兩樣本的χ2檢驗(yàn)、構(gòu)成比檢驗(yàn)或CMH檢驗(yàn),可分為非劣效性檢驗(yàn)、等效性檢驗(yàn)和優(yōu)效性檢驗(yàn)。
①非劣效性檢驗(yàn)兩樣本率比較的樣本量估算公式如下[14]:
式中Zα,Zβ為標(biāo)準(zhǔn)正態(tài)分布的單側(cè)臨界值。π1和π2分別為試驗(yàn)組和對(duì)照組的陽性概率。πc為兩總體合計(jì)概率,πC=Q1π1+Q2π2。 Q1和 Q2為樣本比例,Q1=n1/N,Q2=n2/N。 δ=π1-π2。 Δ 為非劣效性界值。
例如:為研究某藥物治療手足廯的療效,擬采用陽性藥物做對(duì)照的非劣效性試驗(yàn)。主要指標(biāo)為臨床治愈率,已知對(duì)照藥的治愈率為85%,試驗(yàn)藥的治愈率為80%,在一項(xiàng)隨機(jī)對(duì)照試驗(yàn)中如果試驗(yàn)藥比對(duì)照藥最多差10%則可被接受。設(shè)α=0.025(單側(cè)),β=0.20,Q1=Q2=0.5,則需要的例數(shù)為:
即每組需要n1=n2=Q1N=0.50×1181≈906例。
②等效性檢驗(yàn)兩樣本率比較的樣本量估計(jì)公式如下[15]:
式中Zα/2和Zβ/2為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)臨界值。為等效性界值。其他符號(hào)同前。
③優(yōu)效性檢驗(yàn)兩樣本率比較的樣本量估計(jì)[16]:
說明:與非劣效性試驗(yàn)的公式相仿,只是分母由δ+Δ變成了δ-Δ,且Δ由非劣效性界值換成了優(yōu)效性界值(當(dāng)Δ=0時(shí),樣本量估計(jì)公式與通常的差異性檢驗(yàn)的意義相同)[14]。其他符號(hào)同前。
多組率的比較的差異性檢驗(yàn)常用列聯(lián)表的χ2檢驗(yàn)、線性趨勢(shì)檢驗(yàn)和構(gòu)成比的比較等。樣本含量估計(jì)公式如下[17]:
注意,該公式中出現(xiàn)反正弦函數(shù),以對(duì)樣本率進(jìn)行以弧度為單位的反正弦被換,從而解決該類資料的率向兩側(cè)偏離的偏態(tài)現(xiàn)象[15]。其中,λ根據(jù)檢驗(yàn)水平α,檢驗(yàn)效能 β,和設(shè)計(jì)的組數(shù)查值表可得,即 λα,β,K-1;Pmax、Pmin:分別為最大率和最小率,根據(jù)預(yù)試驗(yàn)或查文獻(xiàn)來估計(jì)。
例如:比較矯治近視的3種方法的效果有無差異,問需觀察多少例?預(yù)試驗(yàn):采用3種方法矯治近視,結(jié)果A方法有效率為37.78%,B方法為18.75%,C方法為27.78%。
參數(shù):
①α:檢驗(yàn)水平,本例取α=0.05;
②β:檢驗(yàn)效能,本例取β=0.10;
③K:設(shè)計(jì)的組數(shù),本例K=3;
④λ:查 α=0.05 時(shí)的 λ 值表得,λ(α,β,K-1)=12.65;
⑤SIN-1:反正弦函數(shù),若用Excel函數(shù)計(jì)算0.5的反正弦值:=ASIN(0.5)
⑥Pmax、Pmin:分別為最大率和最小率,根據(jù)預(yù)試驗(yàn)或查文獻(xiàn)來估計(jì)。該例Pmax=0.3778,Pmin=0.1875。代入計(jì)算得樣本例數(shù)n≈138。
樣本含量對(duì)于臨床研究的作用應(yīng)受到足夠的重視,若樣本含量被高估,可能導(dǎo)致醫(yī)藥研發(fā)投入更多的人力、物力和財(cái)力以及研究時(shí)間。若樣本含量被低估,抽樣誤差大,觀察指標(biāo)穩(wěn)定性低,檢驗(yàn)效能低;得到陰性結(jié)論時(shí)難以判斷是檢驗(yàn)效能過低導(dǎo)致未能檢測(cè)出總體實(shí)際存在的差異還是差異確實(shí)沒有統(tǒng)計(jì)學(xué)意義[18]。
綜上所述,各種不同類型的臨床試驗(yàn)需要考慮不同的樣本含量計(jì)算方法以估算合適的樣本量。