南京醫(yī)科大學流行病與衛(wèi)生統(tǒng)計學系(211100)
曹金金 劉麗亞 趙 楊 陳 峰 于 浩△
Ⅱ/Ⅲ期無縫臨床試驗中合并檢驗法與改良法的比較*
南京醫(yī)科大學流行病與衛(wèi)生統(tǒng)計學系(211100)
曹金金 劉麗亞 趙 楊 陳 峰 于 浩△
目的 研究Ⅱ/Ⅲ期無縫設計中最常用的合并檢驗法與最新提出的改良法的統(tǒng)計學特性,推薦選擇較優(yōu)的分析方法。方法 系統(tǒng)地回顧無縫設計的基本設計思路和統(tǒng)計分析方法,采用計算機模擬技術,分別研究兩種統(tǒng)計分析方法的總I類錯誤和檢驗效能。結(jié)果 合并檢驗法和改良法相比,兩者在控制總I類錯誤方面無明顯差異,但在檢驗效能方面,合并檢驗法始終優(yōu)于改良法。結(jié)論 建議優(yōu)先選擇合并檢驗法進行Ⅱ/Ⅲ期無縫臨床試驗的統(tǒng)計分析。
Ⅱ/Ⅲ期無縫設計 早期結(jié)局指標 主要結(jié)局指標 合并檢驗法 改良法
傳統(tǒng)的臨床試驗設計思路清晰,目的明確,但存在試驗周期長、較多受試者可能長時間暴露于療效差的試驗組等缺陷。Bauer和Kieser于1999年首次提出將Ⅱ期和Ⅲ期臨床試驗聯(lián)合設計并實施的思想[1],后經(jīng)Gallo等人推廣應用。臨床試驗的Ⅱ/Ⅲ期無縫設計(seamless phase Ⅱ/Ⅲ trial design)是指將原本在Ⅱb期和Ⅲ期臨床試驗中獨立的幾個研究整合在一個完整的試驗中。良好的Ⅱ/Ⅲ期無縫設計可以合理控制I類錯誤,充分利用手頭信息,減少受試者人數(shù)和暴露于低效組的時間,縮短研發(fā)周期,使真正有效的藥物盡快上市[2]。
目前為止已有很多學者發(fā)表了關于無縫設計統(tǒng)計分析方法的論著,這些方法包括Stallard和Todd提出的成組序貫法[3]、Bauer和Keiser提出的合并檢驗法[1]、 Koenig等人提出的適應性Dunnett法[4]以及Wu Yujun等人提出的改良法[5]。本文采用Monte Carlo模擬分析探討最常用的合并檢驗法與最新提出的改良法的統(tǒng)計學特性,推薦選擇較優(yōu)的分析方法。
Ⅱ/Ⅲ期無縫設計分兩個階段,即探索階段和確證階段。探索階段一般有多個治療組,例如多個劑量組,或多個用藥方案組,外加一個或多個對照組。探索階段結(jié)束時進行期中分析,選擇療效好、安全性佳的治療組,連同對照組一起進入確證階段繼續(xù)研究,而療效差、安全性差的治療組則終止。確證階段結(jié)束時合并兩階段的信息進行統(tǒng)計分析。流程見圖1。
1.改良法
Pr(Z1,n (1) 由于只有第一試驗組進入第2階段研究,只需針對該試驗組進行假設檢驗,原假設表示為H10∶θ1=0。此時,拒絕全局假設H0等價于拒絕H10。若只有第二試驗組進入確證階段研究,分析思路與情形A1類似。 2.合并檢驗法 Bauer和Kieser于1999年提出通過合并檢驗的方法進行數(shù)據(jù)的統(tǒng)計分析[1],主要是先分別求得各階段獨立數(shù)據(jù)的P值,最后分析時將各階段P值進行合并,并做出統(tǒng)計推斷。合并P值的方法有很多,本文采用加權(quán)逆正態(tài)法[6]: C(P1,P2)=1-Φ[w1Φ-1(1-P1)+w2Φ-1(1-P2)] (2) 期中分析時將每個試驗組與對照組比較,選擇統(tǒng)計量最大的試驗組進入確證階段研究。 合并檢驗法和改良法的主要區(qū)別可以概括為: (1) 期中分析時,合并檢驗法基于療效指標數(shù)據(jù)進行假設檢驗,根據(jù)統(tǒng)計量的大小篩選優(yōu)效試驗組。改良法不進行假設檢驗,根據(jù)每組樣本的療效均值大小篩選優(yōu)效試驗組。 (2) 最終統(tǒng)計分析時,合并檢驗法將根據(jù)各階段獨立數(shù)據(jù)計算的P值合并,從而做出統(tǒng)計推斷。改良法是在獲得調(diào)整的統(tǒng)計量的條件分布基礎上進行統(tǒng)計分析。 1.模擬試驗A 試驗的第一階段設有2個試驗組和1個對照組,各組間樣本比為1∶1∶1,期中分析時根據(jù)早期結(jié)局指標選擇最優(yōu)試驗組進入第2階段研究,不考慮早期終止。模擬試驗中,計劃第1階段每組樣本量為200,第2階段每組樣本量也為200。由于本文不討論樣本量的影響,所以給予一個較大的樣本量以保證在特定的參數(shù)組合下樣本量滿足分析要求。 (1)試驗目的 考察兩指標相關系數(shù)、早期結(jié)局指標表示的療效均值差對兩種方法總I類錯誤的影響。 (2)參數(shù)設置(見表1) (3)試驗步驟 流程見圖2。 (4)試驗結(jié)果 表2的結(jié)果表明,合并檢驗法和改良法估計的總I類錯誤率都控制在0.025范圍內(nèi)。隨著相關系數(shù)ρ的降低,總I類錯誤率也隨之降低,結(jié)果越來越保守。這種保守性源自于期中分析時是基于早期結(jié)局指標數(shù)據(jù)進行組別篩選的,目的是選出主要結(jié)局指標估計的最優(yōu)組進入第二階段研究。當ρ=0時,兩指標相互獨立。當ρ>0時,兩指標正相關,基于早期結(jié)局指標數(shù)據(jù)進行組別篩選的結(jié)果一定程度上與基于主要結(jié)局指標數(shù)據(jù)進行組別篩選的結(jié)果相一致,從而降低了保守性。隨著相關系數(shù)增大,保守性逐漸降低。類似地,當ρ<0時,兩結(jié)果是背離的,保守性會增大。ρ取不同值時,合并檢驗法和改良法相比,總I類錯誤無明顯差異。 總I類錯誤雖未出現(xiàn)膨脹,但相較于理論值還是偏小的,說明試驗犯第二類錯誤的風險增大。針對這個問題,我們進行了模擬試驗B的研究。 2.模擬試驗B (1)試驗目的 考察兩指標相關系數(shù)、主要結(jié)局指標表示的療效均值差對兩種方法檢驗效能的影響。 (2) 參數(shù)設置 (3) 試驗步驟 (4) 試驗結(jié)果 綜上,合并檢驗法和改良法相比,兩者在控制總I類錯誤方面無明顯差異,但在檢驗效能方面,合并檢驗法始終優(yōu)于改良法。因此,建議采用合并檢驗法進行Ⅱ/Ⅲ期無縫臨床試驗的統(tǒng)計分析。 Ⅱ/Ⅲ期無縫設計由于其靈活、科學且符合倫理的特點,受到臨床研究者和制藥企業(yè)的重視,也有了一些成功的應用,如Barnes等人探討了茚達特羅(indacaterol)治療慢性阻塞性肺病(COPD)[11];Friede等人將這種方法應用于多發(fā)性硬化癥的研究[12];Lu等人用于對前列腺癌的研究[13]。目前為止,無縫設計尚未得到廣泛應用。其主要原因在于,這種方法在研究設計與統(tǒng)計分析方面仍然存在一些尚未解決的問題,而且尚未被相關管理部門正式認可[14]。 本文對Ⅱ/Ⅲ期無縫設計中最常用的合并檢驗法與最新提出的改良法的統(tǒng)計學特性進行了研究。模擬設計時,沒有考慮樣本量的影響。樣本量越大,期中分析時篩選出有療效組別的概率越高,最終統(tǒng)計分析時的檢驗效能越大。兩種統(tǒng)計方法在樣本量取不同值時的性能比較,還有待進一步研究。閉合檢驗原則和多重比較校正方法的應用使得總I類錯誤控制在原先設定的檢驗水準范圍內(nèi)。利用早期結(jié)局指標作為替代指標進行期中分析的組別篩選,兩指標間的相關性越大,控制總I類錯誤的結(jié)果越理想;當試驗藥有療效時,早期結(jié)局指標表示的療效均值差越大,該試驗組被選擇的概率越高,檢驗效能也越高。改良法與合并檢驗法相比,在控制總I類錯誤方面無明顯差異,但檢驗效能始終低于合并檢驗法。兩種方法在期中分析組別篩選和最終統(tǒng)計分析的原理不同,改良法未能達到“改良”的目的,優(yōu)先推薦選擇合并檢驗法進行Ⅱ/Ⅲ期無縫臨床試驗的統(tǒng)計分析。 臨床試驗研究除了想獲得試驗結(jié)束時計算的確證的P值,還需找到療效的點估計及可信區(qū)間。目前在研究療效的點估計和可信區(qū)間的方法方面已取得一些成果[15-16],但仍存在偏性較大的問題,還有待改進。 本研究的模擬試驗,雖然已經(jīng)盡可能地考慮了其代表性,但是也難以包含所有的復雜情況,有待進一步研究。如期中分析時,綜合考慮療效和安全性因素,選擇多個試驗組連同對照組進入確證階段研究;其他類型的資料(如定性資料、生存資料)分析結(jié)果如何;實際工作中可能遇到的問題(如入組率、失訪率、隨訪時間長短)對上述方法統(tǒng)計學性質(zhì)的影響等。 [1]Bauer P,Kieser M.Combining different phases in the development of medical treatments within a single trial.Stat Med,1999,18(14):1833-1848. [2]Bretz F,Schmidli H,K?nig F,et al.Confirmatory seamless phase Ⅱ/Ⅲ clinical trials with hypotheses selection at interim:general concepts.Biom J,2006,48(4):623-634. [3]Stallard N,Todd S.Sequential designs for phase Ⅲ clinical trials incorporating treatment selection.Stat Med,2003,22(5):689-703. [4]Koenig F,Brannath W,Bretz F,et al.Adaptive Dunnett tests for treatment selection.Stat Med,2008,27(10):1612-1625. [5]Wu Y,Zhao PL.Interim treatment selection with a flexible selection margin in clinical trials.Stat Med,2013,32(15):2529-2543. [6]Mosteller F,Bush RR,Green BF.Selected quantitative techniques.London:Addison-Wesley,1970. [7]Marcus R,Peritz E,Gabriel KR.On closed testing procedures with special reference to ordered analysis of variance.Biometrika,1976,63(3):655-660. [8]Dunnett CW.A multiple comparison procedure for comparing several treatments with a control.J Am Atat Assoc,1955,50:1096-1121. [9]Friede T,Stallard N.A comparison of methods for adaptive treatment selection.Biom J,2008,50(5):767-781. [10]Todd S,Stallard N.A new clinical trial design combining phases Ⅱ and Ⅲ:Sequential designs with treatment selection and a change of endpoint.Drug Inf J,2005,39:109-118. [11]Barnes PJ,Pocock SJ,Magnussen H,et al.Integrating indacaterol dose selection in a clinical study in COPD using an adaptive seamless design.Pulm Pharmacol Ther,2010,23(3):165-171. [12]Friede T,Parsons N,Stallard N,et al.Designing a seamless phase Ⅱ/Ⅲ clinical trial using early outcomes for treatment selection:an application in multiple sclerosis.Stat Med,2011,30(13):1528-1540. [13]Lu M,Freytag SO,Stricker H,et al.Adaptive seamless design for an efficacy trial of replication-competent adenovirus-mediated suicide gene therapy and radiation in newly-diagnosed prostate cancer(ReCAP Trial).Contemp Clin Trials,2011,32(3):453-460. [14]Stallard N.A confirmatory seamless phase Ⅱ/Ⅲ clinical trial design incorporating short-term endpoint information.Stat Med,2010,29(9):959-971. [15]Bebu l,Luta G,Dragalin V.Likelihood inference for a two-stage design with treatment selection.Biom J,2010,52(6):811-822. [16]Stallard N,Todd S.Point estimates and confidence regions for sequential trials involving selection.Journal of Statistical Planning and Inference,2005,135(2):402-419. (責任編輯:郭海強) The Comparison of Combination Test Approach and Modified Test Approach in Seamless Phase Ⅱ/Ⅲ Trial Cao Jinjin,Liu Liya,Zhao Yang,et al. (Department of Epidemiology and Biostatistics,School of Public Health,Nanjing Medical University(211100),Nanjing) Objective To compare the combination test approach,the most commonly used method and the recently proposed modified test approach in the analysis of seamless phase Ⅱ/Ⅲ clinical trials.Methods The basic principle of seamless design and two statistical methods were reviewed.Simulation studies were then used to understand the power and the family-wise type I error rate in different scenarios.Results There is no significant difference between combination test approach and modified test approach in terms of controlling family-wise type I error rate.However,combination test approach always shows higher power.Conclusion When conducting statistical analysis of a seamless phase Ⅱ/Ⅲ trial design,combination test approach has the priority. Seamless phase Ⅱ/Ⅲ design; Early endpoint; Primary endpoint; Combination test approach; Modified test approach 國家自然科學基金(81273184) △通信作者:于浩,E-mail:njyuhao@vip.sina.com模擬評價
討 論