南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 吳海燕 劉偉杰 傅利強(qiáng) 譚旭輝
【提 要】 目的 使用內(nèi)部預(yù)試驗(yàn)解決成組序貫設(shè)計(jì)中方差未知時(shí)樣本量估計(jì)的問題,同時(shí)得出內(nèi)部預(yù)試驗(yàn)適宜的樣本量。方法 以兩樣本均數(shù)比較的優(yōu)效性檢驗(yàn)為分析目的,利用損耗函數(shù)法在拒絕型成組序貫設(shè)計(jì)下,通過設(shè)定不同的內(nèi)部預(yù)試驗(yàn)樣本量、方差真實(shí)值和方差估計(jì)值,計(jì)算方差重估法的Ι類錯(cuò)誤、功效Power和平均樣本量。結(jié)果 方差估計(jì)正確時(shí),方差重估法能控制Ι類錯(cuò)誤,功效和平均樣本量隨著內(nèi)部預(yù)試驗(yàn)樣本量n0的增加而增加,當(dāng)n0≥20時(shí)能獲得較好的功效和適宜的平均樣本量;方差估計(jì)錯(cuò)誤時(shí),方差重估法同樣能控制Ι類錯(cuò)誤且不會(huì)出現(xiàn)傳統(tǒng)成組序貫設(shè)計(jì)中功效過高或過低的情況,當(dāng)標(biāo)準(zhǔn)差估計(jì)值s為10,標(biāo)準(zhǔn)差真實(shí)值σ分別為6、8、12和14時(shí),該方法的功效分別為0.895、0.886、0.887和0.887。結(jié)論 方差重估法能有效解決成組序貫設(shè)計(jì)中方差未知的問題,避免了方差錯(cuò)誤估計(jì)時(shí)導(dǎo)致的功效異常。
在臨床試驗(yàn)中,成組序貫設(shè)計(jì)(group sequential design)由于能夠有效降低試驗(yàn)所需樣本量和提前結(jié)束試驗(yàn)而成為了較好的設(shè)計(jì)選擇[1]。損耗函數(shù)法(error spending function method)[2]是成組序貫設(shè)計(jì)中一種常用的方法。為了使試驗(yàn)?zāi)軌蛞砸欢ǖ墓πОl(fā)現(xiàn)處理組間的差異,試驗(yàn)設(shè)計(jì)階段必須合理估計(jì)所需的樣本量,但在試驗(yàn)設(shè)計(jì)之初用于估計(jì)樣本量的方差往往是未知的,其估計(jì)值通常來源于以往的經(jīng)驗(yàn)和文獻(xiàn)回顧。如果設(shè)計(jì)方差估計(jì)過大,會(huì)造成資源的浪費(fèi);反之,會(huì)導(dǎo)致功效不足。Wittes&Brittain[3]針對這一問題提出利用內(nèi)部預(yù)試驗(yàn)(internal pilot studies,IPS)來重新估計(jì)方差。其中,重新估計(jì)方差可在盲態(tài)和揭盲狀態(tài)下進(jìn)行,為保證試驗(yàn)的完整性,一般在盲態(tài)下進(jìn)行。故本文在大樣本成組序貫設(shè)計(jì)的條件下,利用內(nèi)部預(yù)試驗(yàn)在盲態(tài)條件下對設(shè)計(jì)方差進(jìn)行重估,比較基于內(nèi)部預(yù)試驗(yàn)的方差重估法和傳統(tǒng)成組序貫設(shè)計(jì)的優(yōu)劣,為該方法在成組序貫設(shè)計(jì)中的應(yīng)用提供理論參考。
1.成組序貫設(shè)計(jì)
成組序貫設(shè)計(jì)能在試驗(yàn)過程中對已經(jīng)累積的數(shù)據(jù)進(jìn)行多次期中分析。由于期中分析[4]為試驗(yàn)提供了提前終止的可能,成組序貫設(shè)計(jì)可以顯著減少試驗(yàn)樣本量,縮短試驗(yàn)周期。從設(shè)計(jì)角度來看,成組序貫設(shè)計(jì)將試驗(yàn)劃分成K個(gè)連續(xù)的階段,每個(gè)階段內(nèi)都有新的受試者加入。當(dāng)?shù)趉個(gè)階段(k=1,2,…,K)結(jié)束后,把之前所有階段的試驗(yàn)結(jié)果累積起來進(jìn)行一次統(tǒng)計(jì)分析。對于拒絕型的成組序貫設(shè)計(jì),如果拒絕H0則試驗(yàn)結(jié)束,否則繼續(xù)下一階段試驗(yàn)。在最后的試驗(yàn)階段,其結(jié)果只能是接受H0或拒絕H0[5]。
損耗函數(shù)法是成組序貫設(shè)計(jì)臨界值計(jì)算的一種方法,每階段損耗的I類錯(cuò)誤為αk,總I類錯(cuò)誤α=α1+…+αK,具體損耗過程如下[6]:
α1=f(I1/IK)
(1)
αk=f(Ik/IK)-f(Ik-1/IK),k=2,…,K
(2)
每階段分析的臨界值ck滿足以下條件:
Pr{Z1≥c1}=α1
(3)
Pr{Z1 (4) 其中Ik為第k階段累積信息量,f(t)=min(αt3,α)為選定的損耗函數(shù),Zk為第k次期中分析的檢驗(yàn)統(tǒng)計(jì)量。 2.基于內(nèi)部預(yù)試驗(yàn)的成組序貫設(shè)計(jì) 在功效一定的情況下估計(jì)樣本量,往往需要知道一些未知參數(shù)的估計(jì)值,例如方差或事件率,而這些參數(shù)在試驗(yàn)設(shè)計(jì)階段通常是無法準(zhǔn)確獲得的。解決這類問題的常用辦法是在主要試驗(yàn)開始之前進(jìn)行初步的預(yù)試驗(yàn)研究[6]。Wittes&Brittain[3]在其研究中利用內(nèi)部預(yù)試驗(yàn)估計(jì)方差并重新估計(jì)試驗(yàn)所需的樣本量。該方法允許利用首批進(jìn)入試驗(yàn)的部分受試者信息對相關(guān)未知參數(shù)進(jìn)行估計(jì)。相關(guān)研究表明,該方法可以解決試驗(yàn)設(shè)計(jì)中方差估計(jì)不準(zhǔn)所導(dǎo)致的樣本量偏差[7-10]。 現(xiàn)以兩均數(shù)比較的優(yōu)效性成組序貫設(shè)計(jì)為例,利用內(nèi)部預(yù)試驗(yàn)對方差進(jìn)行重新估計(jì)。在研究設(shè)計(jì)開始時(shí),方差σ2的估計(jì)值大多數(shù)源于以往的經(jīng)驗(yàn)或文獻(xiàn),假定其估計(jì)值為s2,在單側(cè)檢驗(yàn)水準(zhǔn)為α、兩均數(shù)之差為δ和總階段數(shù)為K的情況下,為使功效達(dá)到1-β,試驗(yàn)所需總樣本量由公式(5)算出。 n=R(K,α,β)nf(α,β,δ,s2) (5) (6) 其中,nf(α,β,δ,s2)={Φ-1(1-α)+Φ-1(1-β)}22s2/δ2 τ={Φ-1(1-α)+Φ-1(1-β)}22R(K,α,β)/δ2,R(K,α,β)是根據(jù)K,α,β確定的常數(shù),其取值要滿足檢驗(yàn)所需的功效。 (7) (8) (9) 在大樣本條件下,本文通過隨機(jī)模擬研究,對拒絕型損耗函數(shù)法成組序貫設(shè)計(jì)條件下方差重估法的實(shí)際效果進(jìn)行評估,并對內(nèi)部預(yù)試驗(yàn)的樣本量進(jìn)行探討。在此基礎(chǔ)上,對方差重估法和傳統(tǒng)成組序貫設(shè)計(jì)的優(yōu)劣性進(jìn)行比較。 本文以兩樣本均數(shù)比較的成組序貫為設(shè)計(jì)框架,采用SAS 9.4隨機(jī)產(chǎn)生模擬研究的數(shù)據(jù)。本模擬過程分為兩個(gè)部分,設(shè)計(jì)框架均為優(yōu)效性假設(shè)檢驗(yàn)H0:θ≤0,H1:θ>0(δ=2),單側(cè)α=0.05,β=0.1(即Power=0.9),成組序貫設(shè)計(jì)方法為損耗函數(shù)法,其中損耗函數(shù)為f(t)=min(αt3,α),階段數(shù)K=5,模擬次數(shù)為2000次;δ為效應(yīng)差值,試驗(yàn)組均值Mt=5或7,對照組均值Mc=5,σ為標(biāo)準(zhǔn)差真實(shí)值,s為標(biāo)準(zhǔn)差估計(jì)值,每階段每組樣本量m=30、50或100,內(nèi)部預(yù)試驗(yàn)樣本量n0設(shè)定為20或根據(jù)內(nèi)部預(yù)試驗(yàn)樣本比例ρ計(jì)算,其中ρ=0.25,0.5,0.75。對于非劣效性假設(shè)檢驗(yàn)H0:θ≤-Δ,H1:θ>-Δ(Δ為非劣效界值),當(dāng)非劣效界值為0時(shí),本文所設(shè)定的統(tǒng)計(jì)優(yōu)效性假設(shè)檢驗(yàn)實(shí)際上等價(jià)于非劣效性假設(shè)檢驗(yàn)。 1.模擬比較一 在方差估計(jì)正確的條件下(即σ=s,其中σ為標(biāo)準(zhǔn)差真實(shí)值,s為標(biāo)準(zhǔn)差估計(jì)值),用不同的標(biāo)準(zhǔn)差σ、內(nèi)部預(yù)試驗(yàn)樣本量n0計(jì)算方差重估法的I類錯(cuò)誤、功效(power)和平均樣本量(average sample number,ASN)等指標(biāo),得出適宜的內(nèi)部預(yù)試驗(yàn)樣本量n0。具體參數(shù)設(shè)置如表1所示: 表1 參數(shù)設(shè)定(模擬一) 2.模擬比較二 在方差估計(jì)錯(cuò)誤的情況下(即σ≠s),使用傳統(tǒng)的成組序貫設(shè)計(jì)能控制住總體Ι類錯(cuò)誤,但功效不能保持。當(dāng)設(shè)計(jì)方差(即總體方差估計(jì)值)偏離總體方差真實(shí)值時(shí),功效通常會(huì)出現(xiàn)低估或高估的情況。因此本研究采用方差重估法解決這一難點(diǎn)問題。根據(jù)模擬比較一的結(jié)果,我們在內(nèi)部預(yù)試驗(yàn)樣本量n0=20的情況下計(jì)算方差重估法的總體Ι類錯(cuò)誤、功效和平均樣本量等指標(biāo),評價(jià)該方法的優(yōu)劣。具體參數(shù)設(shè)置如表2所示: 表2 參數(shù)設(shè)定(模擬二) 1.模擬比較一 在方差估計(jì)正確的情況下,按照表1的參數(shù)設(shè)置進(jìn)行模擬研究,方差重估法的Ι類錯(cuò)誤、功效(power)和平均樣本量(ASN)如表3所示。由表3的模擬結(jié)果可以看出,方差重估法可以較好地將Ι類錯(cuò)誤控制在0.05左右。在大樣本條件下,總樣本量和內(nèi)部預(yù)試驗(yàn)樣本量的變化對Ι類錯(cuò)誤影響不大。陰性研究的平均樣本量隨著內(nèi)部預(yù)試驗(yàn)樣本量的增加輕微增加。 在陽性研究條件下,功效受內(nèi)部預(yù)試驗(yàn)樣本量的影響較大,內(nèi)部預(yù)試驗(yàn)的樣本量越大,功效越高。當(dāng)σ=5.8且n0=8和σ=7.5且n0=13時(shí),功效分別為0.875和0.878。由此可見,當(dāng)內(nèi)部預(yù)試驗(yàn)樣本量較小時(shí),功效偏低。陽性研究的平均樣本量也隨內(nèi)部預(yù)試驗(yàn)樣本量的增加而略微增加。在大樣本成組序貫設(shè)計(jì)條件下,內(nèi)部預(yù)試驗(yàn)樣本量在20以上時(shí),功效均能較好的維持在0.9左右。 2.模擬比較二 在方差估計(jì)錯(cuò)誤的情況下,按照表2的參數(shù)設(shè)置進(jìn)行模擬研究,方差重估法的Ι類錯(cuò)誤、功效(power)和平均樣本量(ASN)如表4所示。由表4的模擬結(jié)果可以看出,當(dāng)內(nèi)部預(yù)試驗(yàn)樣本量為20時(shí),在方差估錯(cuò)的情況下,方差重估法與傳統(tǒng)的成組序貫設(shè)計(jì)一樣能較好地控制Ι類錯(cuò)誤在0.05左右。 表3 方差估對時(shí)Ι類錯(cuò)誤、功效(power)和平均樣本量(ASN) 就功效和平均樣本量來看,方差重估法能較好地維持住功效和獲得適宜的平均樣本量。當(dāng)方差真實(shí)值小于方差估計(jì)值時(shí),傳統(tǒng)成組序貫設(shè)計(jì)的功效均明顯高于設(shè)定功效0.9,而方差重估法的功效均能控制在0.9左右,其平均樣本量明顯低于傳統(tǒng)成組序貫設(shè)計(jì);當(dāng)方差真實(shí)值大于方差估計(jì)值時(shí),傳統(tǒng)成組序貫設(shè)計(jì)的功效明顯低于設(shè)定功效0.9,而方差重估法的功效依舊能較好維持功效在0.9左右,其平均樣本量相較于傳統(tǒng)成組序貫設(shè)計(jì)有明顯的提高。 表4 方差估錯(cuò)時(shí)Ι類錯(cuò)誤、功效(power)和平均樣本量(ASN) 當(dāng)方差估計(jì)錯(cuò)誤時(shí)使用傳統(tǒng)的成組序貫設(shè)計(jì)會(huì)導(dǎo)致功效得不到保證,當(dāng)方差真實(shí)值小于方差估計(jì)值時(shí)會(huì)導(dǎo)致功效過高,造成樣本量不必要的浪費(fèi);當(dāng)方差真實(shí)值大于方差估計(jì)值時(shí)會(huì)導(dǎo)致功效過低,說明試驗(yàn)的樣本量不足。通過模擬研究二我們發(fā)現(xiàn)方差重估法能較好的解決這個(gè)問題。從實(shí)際效果來看,當(dāng)方差真實(shí)值小于方差估計(jì)值時(shí),方差重估法能降低過高的功效,避免樣本量的浪費(fèi)。在使用內(nèi)部預(yù)試驗(yàn)重估樣本量的過程中,會(huì)存在重估樣本量低于設(shè)計(jì)樣本量的情況。而在實(shí)際臨床試驗(yàn)的過程中,減少試驗(yàn)樣本量有時(shí)是很難被人接受的。按照Wittes[3]和Birkett[9]的觀點(diǎn),當(dāng)出現(xiàn)重估樣本量低于設(shè)計(jì)樣本量的時(shí)候,應(yīng)繼續(xù)使用原來設(shè)計(jì)時(shí)樣本量,從而使得樣本量在試驗(yàn)過程中只增不減。如果在方差重估法中使用這種樣本量“只增不減”的策略,此時(shí)基于內(nèi)部預(yù)試驗(yàn)的方差重估法必然也會(huì)導(dǎo)致功效過高和樣本量增加的情形。因此,在試驗(yàn)過程中如要降低樣本量并維持住功效,那么基于內(nèi)部預(yù)試驗(yàn)所得的方差估計(jì)值必須足夠精確和可信。這就需要內(nèi)部預(yù)試驗(yàn)的樣本比例ρ不能太低,我們認(rèn)為內(nèi)部預(yù)試驗(yàn)樣本比例ρ在75%以上時(shí),基于內(nèi)部預(yù)試驗(yàn)的方差估計(jì)值是可信的。當(dāng)方差真實(shí)值大于方差估計(jì)值時(shí),該方法能提高功效,避免功效過低。在此過程中,方法重估法一般情況下并不會(huì)出現(xiàn)重估樣本量低于設(shè)計(jì)樣本量,即減少樣本量的情況。 在臨床試驗(yàn)中可能會(huì)存在早期試驗(yàn)數(shù)據(jù)不穩(wěn)定的情況,這種不穩(wěn)定會(huì)導(dǎo)致方差重估法估計(jì)方差時(shí)出現(xiàn)偏差,從而對樣本量的重估計(jì)產(chǎn)生較大的影響。因此,針對早期數(shù)據(jù)不穩(wěn)定的情形,可通過適當(dāng)?shù)脑黾觾?nèi)部預(yù)試驗(yàn)的樣本量來減少估計(jì)偏差(例如ρ增大到75%)。另外,在每次期中分析后,利用已有的數(shù)據(jù)進(jìn)行方差重估,并重新計(jì)算下一階段的樣本量,也可有效解決早期數(shù)據(jù)不穩(wěn)定導(dǎo)致的樣本量錯(cuò)估問題。由于此方法屬于適應(yīng)性設(shè)計(jì),不屬于經(jīng)典成組序貫設(shè)計(jì)范疇,故本文不做討論。 綜上所述,在大樣本成組序貫試驗(yàn)中,當(dāng)設(shè)計(jì)方差大于真實(shí)方差時(shí),對于重估樣本量小于設(shè)計(jì)樣本量的情況需慎重處理,尤其是要考慮內(nèi)部預(yù)試驗(yàn)樣本量和早期不穩(wěn)定的試驗(yàn)數(shù)據(jù)對方差估計(jì)值的影響。當(dāng)設(shè)計(jì)方差低于真實(shí)方差且早期試驗(yàn)數(shù)據(jù)較穩(wěn)定時(shí),可采用基于內(nèi)部預(yù)試驗(yàn)的方差重估法對樣本量進(jìn)行重估計(jì),從而避免因?yàn)樵O(shè)計(jì)方差的錯(cuò)誤估計(jì)導(dǎo)致試驗(yàn)設(shè)計(jì)功效的異常。模擬比較
結(jié) 果
討 論