中國藥科大學生物統(tǒng)計與計算藥學研究中心(210009) 于 莉 蔣麗蕓 尹竹琳 言方榮
【提 要】 目的 基于Bayesian框架,討論由優(yōu)效性向非劣效性試驗轉(zhuǎn)換,或由非劣效性向優(yōu)效性試驗轉(zhuǎn)換時,試驗的Ⅰ類錯誤率能否控制在可接受范圍內(nèi)。方法 通過不同場景下模擬得到的全局Ⅰ類錯誤率予以驗證,并對設(shè)計中的重要參數(shù)進行敏感性分析。結(jié)果 模擬結(jié)果表明,在一般條件下,全局Ⅰ類錯誤率都能很好的控制在0.1以內(nèi),而在稍加嚴格的條件下,全局Ⅰ類錯誤率可控制在0.05以內(nèi)。結(jié)論 由優(yōu)效性向非劣效性試驗轉(zhuǎn)換,或由非劣效性向優(yōu)效性試驗轉(zhuǎn)換時,整個試驗的Ⅰ類錯誤率能得到有效的控制。
Ⅱ期臨床試驗主要用來檢驗新藥的有效性,應(yīng)用安慰劑或已上市藥物作為對照藥對新藥的療效進行評估,而進行隨機臨床試驗(randomized clinical trial,RCT)是比較不同藥物療效的最佳方法。根據(jù)不同的試驗?zāi)康?,可以將RCT分為優(yōu)效性試驗、非劣效性試驗及等效性試驗。優(yōu)效性試驗旨在驗證新藥的療效是否優(yōu)于標準藥物或安慰劑;非劣效性試驗旨在驗證新藥的療效是否不比標準藥物差;等效性試驗旨在驗證新藥的療效是否與標準藥物的療效相當[1-2]。傳統(tǒng)的RCT設(shè)計中,根據(jù)不同的目的選擇相應(yīng)的試驗類型,受試者完全入組后對所得的受試者數(shù)據(jù)進行檢驗,一旦檢驗結(jié)果不能達到預(yù)期目標,則試驗失敗,前期的投入也將付之東流。為了盡可能減少企業(yè)的損失、提高新藥申報的成功率,一個解決方法是:如果原先進行的是優(yōu)效性試驗,則可以選擇下調(diào)試驗?zāi)繕?,再進行一次非劣效性檢驗,若二次檢驗得出該新藥滿足非劣效性,則試驗成功,可以繼續(xù)進入Ⅲ期臨床試驗[3]。而對于檢驗結(jié)果已達到預(yù)期且有望達到更高目標時,同樣可以上調(diào)試驗?zāi)繕耍瑢?yīng)的過程即由非劣效性試驗“升級”為優(yōu)效性試驗。
歐盟藥品局(European Medicines Agency,EMA)曾出臺指導原則[4]專門探討了這種上調(diào)或下調(diào)試驗?zāi)繕说姆椒ǎ杭串攦?yōu)效性檢驗的結(jié)果不顯著時,若能接受非劣效性的結(jié)果且存在預(yù)設(shè)的非劣效邊界,則可以下調(diào)試驗?zāi)繕?,進行非劣效性檢驗;當非劣效性檢驗的結(jié)果有可能超出預(yù)期達到優(yōu)效性時,則可以進行一次優(yōu)效性檢驗加以驗證。然而,一個核心的問題是如何在進行兩次檢驗時控制Ⅰ類錯誤。通常,對于單個的假設(shè)檢驗,需要將Ⅰ類錯誤率控制在0.1或0.05以內(nèi);而上述優(yōu)效性試驗轉(zhuǎn)換為非劣效性試驗或非劣效性試驗轉(zhuǎn)換為優(yōu)效性試驗的過程中,由于改變了試驗?zāi)康模枰M行兩次假設(shè)檢驗,若每次檢驗的Ⅰ類錯誤率都控制在0.05以內(nèi),那么進行兩次檢驗自然就遇到全局Ⅰ類錯誤率是否會膨脹的問題,然而,EMA的指導原則中并未做出詳細說明。綜上,本文基于貝葉斯框架對優(yōu)效非劣效試驗相互轉(zhuǎn)換問題進行了研究,并通過多種場景下的模擬,探討了在這種轉(zhuǎn)換試驗?zāi)繕说那闆r下其Ⅰ類錯誤率的控制問題。
1.優(yōu)效性試驗及非劣效性試驗的假設(shè)檢驗原理
優(yōu)效性試驗是為了證明新藥的療效優(yōu)于已存在的藥或安慰劑,其原假設(shè)(H01)為新藥的反應(yīng)率(pT)不高于標準藥的反應(yīng)率(pC),備擇假設(shè)(H11)為新藥的反應(yīng)率(pT)高于標準藥的反應(yīng)率(pC),即
H01:pT≤pCH11:pT>pC+δ
其中δ為優(yōu)效邊界。
非劣效性試驗[5]是為了證明新藥的療效不比已存在的藥差,其原假設(shè)(H02)為新藥的反應(yīng)率(pT)低于標準藥的反應(yīng)率(pC)且超出了臨床可接受范圍,備擇假設(shè)(H12)則為新藥的反應(yīng)率(pT)不比標準藥的反應(yīng)率(pC)差,即
H02:pT 其中w為非劣效邊界[6-7]。 本文采用雙臂試驗,且選用陽性對照。假定實驗組和對照組分別入組N個受試者,各組有療效反應(yīng)的人數(shù)分別為y1,y2,假定新藥和標準對照藥的有效反應(yīng)率服從先驗分布beta(a,b),由共軛性可知,后驗分布分別為pT|Dn~beta(a+y1,b+m-y1),pC|Dn~beta(a+y2,b+m-y2)。 2.優(yōu)效性試驗轉(zhuǎn)為非劣效性試驗 優(yōu)效性轉(zhuǎn)非劣效性試驗流程如圖1a所示: (1)首先進行優(yōu)效性檢驗。入組預(yù)定數(shù)目的受試者,根據(jù)所得的受試者數(shù)據(jù)判斷新藥比標準藥物有效的后驗概率值Pr(pT>pC+δ|Dn)是否滿足Pr(pT>pC+δ|Dn)≥C1(C1為優(yōu)效性閾值,一般在(0.9,1)內(nèi)取值),若滿足,則拒絕H01,認為新藥的療效優(yōu)于標準藥;否則,接受H01,說明新藥的療效不理想,則進一步接受條件更為寬松的檢驗,即非劣效性檢驗。 (2)進行非劣效性檢驗。根據(jù)已獲得的受試者信息判斷新藥不比標準藥差的后驗概率值Pr(pT≥pC-w|Dn)是否滿足Pr(pT≥pC-w|Dn)≥C2(C2為非劣效性閾值,一般在(0.9,1)內(nèi)取值),若滿足,則拒絕H02,認為新藥的療效不劣于標準對照藥;否則,接受H02,認為新藥比標準藥差,且超出了臨床可接受范圍。 圖1 流程圖,a為優(yōu)效性轉(zhuǎn)非劣效性試驗流程,b為非劣效性轉(zhuǎn)優(yōu)效性試驗流程 3.非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗 非劣效性轉(zhuǎn)優(yōu)效性試驗流程與上述相反,如圖1b所示: (1)首先進行非劣效性檢驗。入組預(yù)定數(shù)目的受試者,根據(jù)所得的受試者數(shù)據(jù)判斷新藥療效不比標準藥差的后驗概率值Pr(pT≥pC-w|Dn)是否滿足Pr(pT≥pC-w|Dn)≥C2(C2為非劣效性閾值,一般在(0.9,1)內(nèi)取值),若不滿足,則接受H02,認為新藥與標準藥相比療效太差,不能接受;否則,拒絕H02,說明新藥療效可觀,則接受進一步的條件更為嚴格的檢驗,即優(yōu)效性檢驗。 (2)進行優(yōu)效性檢驗。根據(jù)已獲得的受試者信息判斷新藥比標準藥物有效的后驗概率值Pr(pT>pC+δ|Dn)是否滿足Pr(pT≥pC-w|Dn)≥C1(C1為優(yōu)效性閾值,一般在(0.9,1)內(nèi)取值),若滿足,則拒絕H01,認為新藥的療效與標準藥相比更優(yōu);否則,接受H01,認為新藥的療效并不優(yōu)于標準藥,但也不過差于標準藥,即為非劣效的。 4.全局Ⅰ類錯誤 第Ⅰ類錯誤,也稱為“棄真”錯誤,是指在統(tǒng)計檢驗時,在原假設(shè)H0為真的情況下,作出了拒絕原假設(shè),即“棄真”的一種錯誤推斷,Ⅰ類錯誤可記為Pr(H1|H0)。在本文中,以上述非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗為例,其步驟為先進行非劣效性檢驗,若拒絕原假設(shè)H02則進行優(yōu)效性檢驗,當試驗最終得到非劣效結(jié)果(接受H01)為“真”時,卻做出優(yōu)效或劣效的推斷(拒絕H01),則犯了Ⅰ類錯誤。由于優(yōu)效性檢驗是在H02不成立的條件下進行的,所以該Ⅰ類錯誤(拒絕H01)其實是綜合考慮了本設(shè)計中的兩個假設(shè)檢驗,故稱為全局Ⅰ類錯誤。 根據(jù)封閉檢驗原理[8],即當需要檢驗多個假設(shè)且整體Ⅰ類錯誤率為α時,如果在局部水平α上拒絕了涉及H0i的所有可能的交叉假設(shè),則可以在α水平上拒絕H0i。同樣地,對于上例中存在兩個假設(shè)檢驗的情況,若在α水平上拒絕了H01∩H02,則可以在α水平上拒絕H01。由對兩個檢驗的原假設(shè)的定義可知H01∩H02=H02,因此,換句話說,在非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗的情況下,若非劣效性檢驗的Ⅰ類錯誤率(拒絕H02)能控制在α水平上,則全局Ⅰ類錯誤率理論上可以控制在α水平上。同理,在優(yōu)效性試驗轉(zhuǎn)為非劣效性試驗的情況下,若在α水平上拒絕了H01∩H02,則可以在α水平上拒絕H02,由于H01∩H02=H02,所以同上,全局Ⅰ類錯誤率仍然可控制在水平α上。 綜上可知,當優(yōu)效非劣效性試驗相互轉(zhuǎn)換時,其全局Ⅰ類錯誤率能夠得到有效的控制,且由非劣效性檢驗的Ⅰ類錯誤率決定。 1.模擬試驗設(shè)置及結(jié)果 設(shè)計中涉及到的參數(shù):(p0,δ,w,C1,C2,N),p0為標準藥的初始有效反應(yīng)率,δ為優(yōu)效邊界,w為非劣效邊界,C1為優(yōu)效性閾值,C2為非劣效性閾值,N為最大樣本量。假定一組取值:p0=(0.3,0.5,0.7),δ=(0,0.1,0.15,0.2,0.25),w=0.5*p0,C1=C2=0.95,N=50,并采用無信息先驗beta(0.6,1.4)作為pT、pC的先驗分布進行模擬。 表1、2分別為優(yōu)效性試驗轉(zhuǎn)為非劣效性試驗以及非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗的10000次模擬結(jié)果,從數(shù)據(jù)可以直觀地看出,在p0與δ的不同取值下Ⅰ類錯誤率都能控制在0.1以內(nèi)。 通過以上模擬,進一步驗證了存在多個假設(shè)檢驗的情況下,全局Ⅰ類錯誤率能夠控制在合理的范圍內(nèi),即不會出現(xiàn)全局Ⅰ類錯誤率膨脹的情況。 表1 優(yōu)效性試驗轉(zhuǎn)為非劣效性試驗的10000次模擬結(jié)果 表2 非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗的10000次模擬結(jié)果 2.敏感性分析 由表1、2可以看出,標準藥的初始有效反應(yīng)率p0對試驗的Ⅰ類錯誤率有較大影響,且隨著p0的增大呈下降趨勢;而優(yōu)效邊界δ的變化對試驗的Ⅰ類錯誤率幾乎無影響。 進一步考慮樣本量N、非劣效邊界w及閾值C1、C2的變動對全局Ⅰ類錯誤率的影響。其余變量值固定為:p0=0.3,δ=0.1。以優(yōu)效性試驗轉(zhuǎn)為非劣效性試驗為例,模擬結(jié)果見表3、4(非劣效性試驗轉(zhuǎn)為優(yōu)效性試驗結(jié)果類似),其中第一行為閾值的幾種取值情況,第一列表示樣本量,對于每個樣本量值,有3種非劣效邊界的取值。 由表3、4可以看出,全局Ⅰ類錯誤率基本可以控制在0.1以內(nèi)。不同樣本量N之間的全局Ⅰ類錯誤率有所差異,但總體來看差異并不明顯;不同的非劣效邊界w對試驗的Ⅰ類錯誤率有一定的影響;優(yōu)效性閾值C1的變動對全局Ⅰ類錯誤率幾乎無影響,而對于不同的非劣效性閾值C2,試驗的Ⅰ類錯誤率波動很大。當C2=0.9時,Ⅰ類錯誤率較大在0.1左右,當C2=0.96時,Ⅰ類錯誤率均小于0.05,總的來說,試驗的Ⅰ類錯誤率隨著C2的增加呈下降趨勢。 表3 優(yōu)效轉(zhuǎn)非劣效試驗中樣本量N、非劣效邊界w及優(yōu)效性閾值的變動對全局Ⅰ類錯誤率的影響 *:此時C2固定為0.95。 表4 優(yōu)效轉(zhuǎn)非劣效試驗中樣本量N、非劣效邊界w及非劣效性閾值的變動對全局Ⅰ類錯誤率的影響 *:此時C1固定為0.95。 模擬研究結(jié)果表明,無論是優(yōu)效性試驗轉(zhuǎn)換為非劣效性試驗還是非劣效性試驗轉(zhuǎn)換為優(yōu)效性試驗,一般條件下,其Ⅰ類錯誤率都能控制在0.1以內(nèi),而在稍加嚴格的條件下,如增大非劣效性閾值,則全局Ⅰ類錯誤率可控制在0.05以內(nèi)。 通過敏感性分析可知,非劣效性閾值對試驗的Ⅰ類錯誤率的影響很大,甚至會影響到定性判斷,這是因為非劣效性閾值的大小直接影響到了非劣效性檢驗的Ⅰ類錯誤率從而導致全局Ⅰ類錯誤率的較大變化。由以上數(shù)據(jù)可直觀地看出,當非劣效性閾值的取值大于0.91時是比較安全的,即能確保Ⅰ類錯誤率小于0.1。推薦非劣效性閾值取為0.95,此時的Ⅰ類錯誤率幾乎在0.05左右;若考慮進一步削減試驗的Ⅰ類錯誤率,則可以選擇稍大一點的非劣效性閾值,如0.96,此時的全局Ⅰ類錯誤率均控制在0.05以內(nèi)。而不同的標準藥初始有效反應(yīng)率p0對試驗的Ⅰ類錯誤率也有較大影響,p0越大,試驗的Ⅰ類錯誤率則越小。p0的取值一般根據(jù)標準藥的歷史試驗給出。 對于其他參數(shù)的取值,其中優(yōu)效性閾值一般取為0.95,由于該閾值對全局Ⅰ類錯誤率的影響甚微,因此也可以在其附近取值。而非劣效邊界值一般情況下可以取0.5*p0(p0為標準對照藥的初始有效反應(yīng)率),但最優(yōu)的非劣效邊界值并非是固定的,需視不同藥物的情況而定。 本文基于貝葉斯框架就優(yōu)效性試驗與非劣效性試驗轉(zhuǎn)換時Ⅰ類錯誤率的控制問題進行了模擬研究分析,驗證了其全局Ⅰ類錯誤率能得到有效的控制,證明了優(yōu)效性試驗與非劣效性試驗相互轉(zhuǎn)換的可行性,在實際臨床中可加以應(yīng)用。模 擬
討 論