南京醫(yī)科大學(xué)流行病與衛(wèi)生統(tǒng)計教研室(210029) 王冠融 邵 方 劉麗亞 陳 峰 柏建嶺 于 浩
II/III期無縫設(shè)計二分類變量效應(yīng)的估計*
南京醫(yī)科大學(xué)流行病與衛(wèi)生統(tǒng)計教研室(210029) 王冠融 邵 方 劉麗亞 陳 峰 柏建嶺 于 浩△
目的針對二分類結(jié)果變量,探索II/III期無縫設(shè)計的效應(yīng)估計。方法期中分析選擇療效最優(yōu)的一個試驗組進入二階段,考慮早期無效終止,研究試驗進入二階段條件下的療效無偏估計。本文基于二分類資料推導(dǎo)出療效的一致最小方差無偏估計法,并比較該法與極大似然估計法及二階段估計法的偏性和均方誤差。結(jié)果就偏性而言,二階段估計法最小,極大似然估計法最大,一致最小方差無偏估計法稍高于二階段估計法;就均方誤差而言,極大似然估計法最小,二階段估計法最大,一致最小方差無偏估計法稍高于極大似然估計法。結(jié)論針對二分類資料,一致最小方差無偏估計法的偏性及均方誤差相對較小,在可接受范圍內(nèi),故推薦該法作為二分類資料無縫設(shè)計的效應(yīng)估計方法。
II/III期無縫設(shè)計 二分類資料 效應(yīng)估計 一致最小方差無偏估計法
近幾年,由于II/III期無縫設(shè)計可以節(jié)約研發(fā)時間和成本而被大家廣泛關(guān)注[1-2]。無縫設(shè)計根據(jù)一階段的結(jié)果指導(dǎo)期中分析決策,判定試驗是否進入下一個階段,若試驗可以繼續(xù),則篩選出最有前途的試驗組(或劑量組),與對照組一起進入二階段,試驗完成后進行最后分析[3]。II/III期無縫設(shè)計在確證性分析時也利用了探索階段的數(shù)據(jù),因此它是一種高效率的設(shè)計,但同時也給統(tǒng)計推斷帶來許多挑戰(zhàn)[4]。目前,人們關(guān)注較多的是如何進行有效的組別篩選,并控制好整個試驗的I類錯誤,對點估計這一統(tǒng)計學(xué)性質(zhì)關(guān)注較少。本研究關(guān)注于如何綜合兩階段的數(shù)據(jù)對藥物療效進行無偏估計。
由于期中分析一般選擇估計療效最好的處理組進入下一階段研究,因此無縫設(shè)計的效應(yīng)估計結(jié)果往往會超過實際的效應(yīng)值。目前,Cohen等[5]對無縫設(shè)計效應(yīng)估計進行研究,并提出一致最小方差條件無偏估計方法。Peter等[2]與Bowden等[6]學(xué)者對上述方法針對定量結(jié)果變量進行了更深層次的研究。本文針對二分類資料,推導(dǎo)出一致最小方差無偏估計的公式,并與其他方法進行比較。
根據(jù)觀察到的兩個階段的數(shù)據(jù)估計藥物療效。假定期中分析時選擇療效最優(yōu)組進入下一階段研究,考慮早期無效終止的情形。以有效率為終點指標(biāo),本文考慮一階段試驗組數(shù)為k(≥2)個,對照組數(shù)為1個,并假設(shè)同一階段每組樣本量相同,第一階段樣本量記為nI,第二階段樣本量記為nII。假定第i(i=0,1,…,k)組有效人數(shù)服從B(ni,πi),i=0表示對照組。一階段樣本有效率記為pIi。將選擇出的試驗組記為S(S∈{1,…,k}),S與對照組同時進入二階段,二階段各組有效人數(shù)服從B(nII,πi)。根據(jù)二階段樣本得到的有效率記為pIIi。提前終止試驗標(biāo)準(zhǔn)為:一階段結(jié)束時若pIS-pI0≤b0,則試驗無效終止,這里b0稱作無效界值。本研究的目的是試驗結(jié)束后對兩組真實有效率差Δs=πs-π0進行估計。
1.極大似然估計法(maximum likelihood,MLE)
我們將nI/(nI+nII)記作期中分析信息時間t,試驗完成后根據(jù)樣本得到對照組的有效率為p0,MLE=tpI0+(1-t)pII0,篩選組有效率為ps,MLE=tpIS+(1-t)pIIS,此時利用篩選組與對照組的極大似然估計,可以得到兩組的率差估計公式如下:
由于選擇療效估計最大的試驗組進入下一階段研究,故這種估計方法往往會高估療效。
2.二階段估計法(stage 2 estimator)
若療效估計以試驗繼續(xù)進入二階段為條件,那么pII0和pIIS就是π0和πS的無偏估計,此時兩組率差為
公式(2)是Δs的無偏估計,稱作二階段估計方法。此法雖然無偏,但是只利用了二階段的數(shù)據(jù),因此不夠穩(wěn)定。
3.一致最小方差無偏估計法(uniform ly minimum variance unbiased estimation,UMVUE)
本文基于Rao-Blackwell定理,推導(dǎo)出基于二分類資料的一致最小方差無偏估計(UMVUE)方法。Rao-Blackwell定理是以一個無偏估計為起點,尋找其最小方差無偏估計量。無論真實參數(shù)值是多少,最小方差無偏估計都比其他無偏估計有更小或至多相等的方差。由上述可知,pIIS是πS的無偏估計,根據(jù)Rao-Blackwell定理,pIIS的條件期望就是πS的最小方差無偏估計。同理,pII0的條件期望就是π0的無偏估計。一階段結(jié)束后對各試驗組療效排序,記為pI(1)>pI(2)>…>pI(k),其中pIS=pII(1)。對于篩選組,用pS,MVE表示療效的一致最小方差無偏估計,根據(jù)推導(dǎo),得到的公式如下:
用p0,MVE表示對照組的療效一致最小方差無偏估計,根據(jù)推導(dǎo),得到的公式如下:
其中,z1=nIpIS+nIIpIIS,z0=nIpI0+nIIpII0,B=b0+pI0。由于pS,MVE,p0,MVE分別是πS和π0的無偏估計,那么ΔS的無偏估計為
根據(jù)Stallard和Todd[7]的研究,極大似然估計法的偏性取決于處理組數(shù)k,期中分析時間點t,無效界值b0,篩選組與對照組的真實率差ΔS。故本文考察以下幾種參數(shù)設(shè)置對偏性(bias)和均方誤差(rootmean square error,RMSE)的影響。具體參數(shù)設(shè)置見表1、2。
表1 模擬試驗參數(shù)含義
表2 模擬試驗設(shè)置的基本情況
在上述參數(shù)設(shè)置下,每一次模擬中,根據(jù)公式(1)、(2)、(5)計算分別得到極大似然估計法、二階段估計法、一致最小方差無偏估計法療效差別的效應(yīng)估計。若將估計值統(tǒng)一用dS,est表示,則偏性為Bias=(dS,est-Δs),對10000次模擬求平均即得到平均偏性;均方誤差為
1.模擬A
此種模擬情境設(shè)定試驗中有兩個試驗組和一個對照組,兩個試驗組的效應(yīng)相同且都為0.2,即Δ1=Δ2=0.1。模擬結(jié)果見圖1、2。
圖1 四種無效界值下3種估計方法的偏性,k=2,Δ1=Δ2=0.1
從圖1中可以看出,極大似然估計法是偏性的,且隨著期中分析信息時間t后移而增加,也隨著無效界值b0的增加而增加;二階段估計法一直都是無偏的,不隨t和b0的增加而改變;UMVUE法的偏性在b0較小時控制的很好,幾乎可以忽略不計。隨著b0增大,UMVUE法的偏性增加,但仍遠(yuǎn)遠(yuǎn)低于極大似然法的偏性。從圖2前三幅圖中可以發(fā)現(xiàn),極大似然估計法的RMSE最小;二階段估計法的RMSE最大;UMVUE法的RMSE稍高于極大似然法。但當(dāng)b0=0.15時,極大似然估計法的RMSE明顯增加,二階段估計法的RMSE依然很大,此時UMVUE法的RMSE最小。這說明極大似然估計法的RMSE容易受無效界值b0的影響,而UMVUE法相對穩(wěn)定很多。
圖2 四種無效界值下3種估計方法的RMSE,k=2,Δ1=Δ2=0.1
我們在保持上述四個無效界值b0下,改變Δ1=Δ2=0.2,Δ1=Δ2=0.3,Δ1=Δ2=0.6,結(jié)論同前,此處不再列出圖形。同時我們發(fā)現(xiàn),極大似然估計的偏性隨著Δ的增加而減少,并且當(dāng)Δ1=Δ2=0.6,四種b0取值下極大似然估計的偏性幾乎完全相同。這主要是由于每一次模擬處理組效應(yīng)都超過了無效界值,偏性主要由組別篩選產(chǎn)生,因此極大似然估計的偏性是相同的。
模擬B的結(jié)果與模擬A結(jié)果幾乎相同,p0由0.1增加至0.5時,極大似然估計法的偏性和均方誤差都輕微增加(1%以內(nèi)),p0由0.5增加至0.9時,極大似然估計法的偏性和均方誤差都逐漸減小,即p0=0.5,偏性和均方誤差最大。UMVUE法和二階段估計法的偏性和均方誤差幾乎不受p0的影響。
2.模擬C
此種模擬情境表示試驗中有兩個試驗組和一個對照組,設(shè)定兩個試驗組的效應(yīng)不同Δ1=0,Δ2=0.1。模擬結(jié)果見圖3、4。
由圖3、圖4可知,模擬C的結(jié)論與模擬A相似,這里不再贅述。唯一的區(qū)別是,當(dāng)b0取值較小時,偏性不隨著期中分析信息時間t的后移而增加,這是由于當(dāng)兩組差別不等時,隨著t的增加,選錯組別的機會減少,因此偏性減少。
圖3 四種無效界值下3種估計方法的偏性,k=2,Δ1=0,Δ2=0.1
3.模擬D
我們模擬了k取3,4,5的情形,一般結(jié)果同上,這里不再列出。圖5顯示了k對各方法的偏性和均方誤差的影響。
由圖5可見,隨著k的增加,極大似然估計法的偏性和均方誤差都輕微增加,而二階段估計法和UMVUE估計法基本不受k的影響。
實例為一項關(guān)于艾迪康唑乳膏治療足癬的多中心、隨機、雙盲、陽性藥物平行對照的臨床試驗。其研究目的是探索最佳給藥濃度,主要效應(yīng)指標(biāo)為停藥2周后真菌清除率。其中,一階段樣本量為72,二階段樣本量為120,因此期中分析信息時間t=0.375。我們只利用部分的研究數(shù)據(jù)(見表3),介紹如何使用3種效應(yīng)估計方法。
圖5 3種估計方法的偏性和均方誤差與組數(shù)k的關(guān)系,Δ1=Δ2=0.2,b0=0.2
表3 各組足癬病人停藥后2周真菌清除率
我們設(shè)定當(dāng)一階段篩選組與對照組療效差別大于0時,則試驗繼續(xù)進入二階段,即無效界值b0=0。根據(jù)表3中的數(shù)據(jù),計算得到p0,MLE=0.8056×0.375+0.8235×0.625=81.68%,pS,MLE=0.9028×0.375+0.8914×0.625=89.57%,此時用極大似然估計效應(yīng)差別為7.89%;直接用二階段估計法得到效應(yīng)差別為6.79%;B=0+0.8056=0.8056,
因此用一致最小方差無偏估計法估計的效應(yīng)差別為7.67%。
在藥物研發(fā)過程中,縮短研發(fā)時間和降低研發(fā)成本的需求促使了適應(yīng)性無縫設(shè)計的出現(xiàn)。適應(yīng)性無縫設(shè)計將一個臨床試驗分為幾個階段逐步實施,與傳統(tǒng)方法相比,統(tǒng)計學(xué)面臨了許多新的挑戰(zhàn)。Cohen和Sackrow itz[5]、Shen[8]針對定量資料研究了試驗總是進入二階段條件下效應(yīng)的無偏估計,Stallard和Todd[7]在2005年也提出一種針對上述條件的無偏估計法,Peter K等人[2]對上述方法進行擴展,使其可用于早期無效終止的情形。本文針對二分類資料,以II/III期無縫設(shè)計為例,在期中分析時選取療效最優(yōu)的組別與對照組同時進入第二階段,其中考慮早期無效終止,研究試驗進入二階段條件下的效應(yīng)估計。
本文針對有效率為終點指標(biāo)的情形,推導(dǎo)出試驗效應(yīng)的一致最小方差無偏估計,并評價其偏性和均方誤差。該法基于Arthur Cohen和Harold B[4]給出的聯(lián)合密度函數(shù),根據(jù)Rao-Blackwell定理推導(dǎo)而得。模擬試驗結(jié)果表明,極大似然估計法的偏性最大,二階段估計法在任何條件下都是無偏的,一致最小方差無偏估計法的偏性稍高于二階段估計法;二階段估計法的均方誤差最大,極大似然估計法的均方誤差在無效界值較小時均方誤差最小,當(dāng)無效界值較大時極大似然估計法的均方誤差明顯增加,一致最小方差無偏估計法的均方誤差稍高于極大似然估計法,且當(dāng)無效界值較大時,一致最小方差無偏估計的均方誤差最小。Arthur Cohen和Harold B[4]給出的聯(lián)合密度函數(shù)針對定量資料(正態(tài)分布),定性資料(二項分布)在陽性數(shù)足夠大時近似正態(tài),在此方法的基礎(chǔ)上擴展應(yīng)用時具有一定的偏性,與模擬試驗結(jié)果契合。
監(jiān)管機構(gòu)要求在對療效進行點估計和區(qū)間估計時必須控制好I類錯誤[9],并強調(diào)需要控制點估計的偏性[10],綜合上述三種方法,一致最小方差無偏估計法的偏性和均方誤差均較小,在可接受范圍內(nèi),故推薦使用該法作為二分類資料無縫設(shè)計的效應(yīng)估計方法??尚艆^(qū)間提供效應(yīng)估計的同時也提供了假設(shè)檢驗方面的信息,Shen在2001年提出針對二分類數(shù)據(jù)構(gòu)造II/III期無縫設(shè)計可信區(qū)間的方法[8]。而基于本研究介紹的效應(yīng)點估計原理構(gòu)建各試驗組的可信區(qū)間是一個待研究的問題。
[1]吳瑩,侯艷,李康.適應(yīng)性無縫設(shè)計在臨床試驗中的應(yīng)用及研究進展.中國衛(wèi)生統(tǒng)計,2013,30(1):140-142.
[2]Peter K,Kimani,Susan Todd,etal.Conditionally unbiased estimation in phase II/III clinical trials with early stopping for futility.Statistics in Medicine,2013,32:2893-2910.
[3]Frank B,Heinz S,F(xiàn)ranz K,et al.Confirmatory seam less phase II/III clinical trials with hypotheses selection at interim:general concepts.Biometrical Journal,2006,48(4):623-634.
[4]Shein Chung Chow,Ralph Corey.Benefits,challenges and obstacles of adaptive clinical trial designs.Orphanet Journal of Rare Diseases,2011,6:79.
[5]Arthur Cohen,Sackrow itz HB.Two stage conditionally unbiased estimators of the selected mean.Statistics&Probability Letters,1989,8:273-278.
[6]Jack Bowden,Ekkehard Glimm.Unbiased Estimation of selected treatmentmeans in two-stage trials.Biometrical Journal,2008,4:515-527.
[7]Stallard N,Todd S.Point estimates and confidence regions for sequential trials involving selection.Journal of Statistical Planning and Inference,2005,135:402-419.
[8]Shen L.Estimation follow ing selection of the largestof two normal means.Statistics in Medicine,2001,20:1913-1929.
[9]Food and Drug Adm inistration.Guidance for industry:adaptive design clinical trials for drugs and biologics@ONLINE,11 February 2013.(Available from:http://www.fda.gov/downloads/Drugs/Guidance-ComplianceRegulatory Information/Guidances/UCM 201790.pdf)
[10]Chmp,Emea.Reflection paper onmethodological issues in confirmatory clinical trials planned with an adaptive design@ONLINE,11 February 2013.(Available from:http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2009/09/WC500003616.pdf)10
(責(zé)任編輯:郭海強)
Point Estimator in Seam less Phase II/IIIClinical Trials for Binary Data
Wang Guanrong,Shao Fang,Liu Liya,etal.(DepartmentofEpidemiology&Biostatistics,NanjingMedicalUniversity(210029),Nanjing)
ObjectiveTo explore unbiased estimation of effects in seam less phase II/IIIdesign particularly for qualitative data.MethodsWe consider pointestimation of the treatmenteffect in which stage 1 is used to select themosteffective experimental group and to decide whether the trial should stop at stage 1 futility by comparing with the control group.We have developed a new estimator for the treatment difference,and compared it with other estimators by simulations.ResultsOn the whole,for biases,stage 2 estimator is an unbiased method;themaximum likelihood estimator always over-estimates;and the bias of the UMVUE is slightly higher than the stage 2 estimator.For MSE,the stage 2 estimator performsworst,while themaximum likelihood estimator performs best,and the UMVUE performs slightly better than themaximum likelihood estimator.ConclusionBased on binary data,the bias and MSE of the UMVUE are relatively small,within the acceptable range.Therefore,we recommend it as the point estimator of the treatment effect in seam less phase II/III clinical trials.
Seam less phase II/III clinical trials;Binary data;Estimation;UMVUE
*:國家自然科學(xué)基金(81273184);國家自然科學(xué)青年基金(81302512)
△通信作者:于浩,E-mail:haoyu@njmu.edu.cn