張秀萍 趙耐青
(復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)教研室 上海 200032)
單臂臨床試驗(yàn)生存分析的樣本量估計(jì)
張秀萍 趙耐青△
(復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)教研室 上海 200032)
目的 提出并驗(yàn)證單臂臨床試驗(yàn)進(jìn)行生存分析時(shí)的樣本量估計(jì)方法。方法 通過理論公式的推導(dǎo),得到單臂臨床試驗(yàn)進(jìn)行生存分析時(shí)樣本量估計(jì)的計(jì)算公式,并采用STATA軟件進(jìn)行蒙特卡洛隨機(jī)模擬,估計(jì)實(shí)際的檢驗(yàn)效能,從而驗(yàn)證公式的準(zhǔn)確性。結(jié)果 隨機(jī)模擬結(jié)果表明在α=0.025和α=0.01的情況下,用本文提出的公式計(jì)算得到的樣本量模擬得到的檢驗(yàn)效能與預(yù)設(shè)的檢驗(yàn)效能基本一致。結(jié)論 在單臂臨床試驗(yàn)中利用本文的公式計(jì)算得到的樣本含量能夠達(dá)到預(yù)定的檢驗(yàn)效能。本研究的成果為抗腫瘤藥物的早期臨床研究的樣本量估計(jì)提供了可靠的依據(jù)。
單臂臨床試驗(yàn); 樣本量估計(jì); 生存分析
單臂臨床試驗(yàn)是指在進(jìn)行臨床試驗(yàn)時(shí),只設(shè)立一個(gè)試驗(yàn)組,而不設(shè)立平行對(duì)照組。這種試驗(yàn)設(shè)計(jì)方法常用于藥物研發(fā)的早期階段(如Ⅰb/Ⅱa期)。在抗腫瘤藥物的臨床研究中,需要初步探索藥物的有效性與安全性時(shí),一般采用單臂臨床試驗(yàn)[1]。以腫瘤藥物臨床試驗(yàn)為例,單臂臨床試驗(yàn)需要設(shè)定中位生存期的目標(biāo)值,如果研究人群的中位生存期超過中位生存期的目標(biāo)值,則可以認(rèn)為該研究藥物的療效優(yōu)于目標(biāo)值。
盡管隨機(jī)對(duì)照臨床試驗(yàn)是臨床試驗(yàn)設(shè)計(jì)的金標(biāo)準(zhǔn),但不是所有的臨床試驗(yàn)都可以做到這一點(diǎn),如果所研究的患病人群很小,或該藥物的研發(fā)是一項(xiàng)突破性的進(jìn)展,或所研究的藥物需求度很高,則可以選擇進(jìn)行單臂臨床試驗(yàn)。FDA的研究數(shù)據(jù)顯示,1992年12月1日至2010年7月1日期間,美國FDA對(duì)35種抗腫瘤藥物的47個(gè)新適應(yīng)證進(jìn)行了加速審批,其中28個(gè)是基于單臂臨床試驗(yàn)設(shè)計(jì)[2]。2005年之后,FDA批準(zhǔn)的申請(qǐng)中,隨機(jī)對(duì)照試驗(yàn)與單臂臨床試驗(yàn)的比例為1∶1[3]。我國也有依據(jù)單臂臨床試驗(yàn)結(jié)果批準(zhǔn)注冊(cè)的案例,如克唑替尼、依維莫司等[1]。
在臨床試驗(yàn)設(shè)計(jì)階段,可靠地估算所需的樣本量是一個(gè)至關(guān)重要的問題。目前文獻(xiàn)中只提出了隨機(jī)對(duì)照臨床試驗(yàn)樣本量的估算方法[4],還沒有關(guān)于單臂臨床試驗(yàn)進(jìn)行生存分析的樣本量計(jì)算公式。因此,本文主要闡述單臂臨床試驗(yàn)設(shè)計(jì)下進(jìn)行生存分析所需樣本量的估計(jì)方法,并給出假設(shè)檢驗(yàn)的模擬結(jié)果。
指數(shù)分布在生存分析中占據(jù)著重要的地位,它是歷史上第一個(gè)生存時(shí)間分布模型,也是最簡單、最重要的分布。指數(shù)分布是一種純隨機(jī)失效模型,指研究對(duì)象在任何時(shí)間上的風(fēng)險(xiǎn)函數(shù)為一常數(shù),即風(fēng)險(xiǎn)函數(shù)的大小不受生存時(shí)間長短的影響,是一種“無記憶的分布”[5]。
(1)
假定病例收集時(shí)間為[0,T],病例隨訪時(shí)間截止到T+τ,任何一個(gè)符合研究條件的患者進(jìn)入該單臂臨床試驗(yàn)的時(shí)間為隨機(jī)變量x,假設(shè)x在[0,T]內(nèi)服從均勻分布,則受試者在[x,T+τ]期間死亡的概率為:
(2)
則受試者在研究期間[0,T+τ]上的死亡概率為:
(3)
將(3)代入公式(1),可以得出:
(4)
進(jìn)而推導(dǎo)出樣本量的計(jì)算公式為:
(5)
其中,Zα、Zβ為標(biāo)準(zhǔn)正態(tài)分布下的分位數(shù)。
λ0:基于生存時(shí)間服從指數(shù)分布,且中位生存時(shí)間為目標(biāo)值所對(duì)應(yīng)的風(fēng)險(xiǎn)率;
λ1:基于生存時(shí)間服從指數(shù)分布的研究人群的實(shí)際風(fēng)險(xiǎn)率;
T:收集受試者的時(shí)間段為[0,T];
τ:停止收集受試者后隨訪的時(shí)間長度;
TM0:研究目標(biāo)值的中位生存時(shí)間;
TM1:研究人群的中位生存時(shí)間;
α:犯第一類錯(cuò)誤的概率;
β:犯第二類錯(cuò)誤的概率。
對(duì)于估算的樣本量,進(jìn)行隨機(jī)模擬檢驗(yàn)其檢驗(yàn)效能 我們運(yùn)用蒙特卡洛方法進(jìn)行隨機(jī)模擬,首先利用計(jì)算機(jī)的隨機(jī)函數(shù),在[0,T]產(chǎn)生服從均勻分布的偽隨機(jī)數(shù)x1,x2,…,xn(用x1,x2,…,xn模擬n個(gè)受試者進(jìn)入單臂臨床試驗(yàn)的時(shí)間點(diǎn))。同理,在[0,1]上產(chǎn)生均勻分布的偽隨機(jī)數(shù),然后用對(duì)數(shù)函數(shù)將其轉(zhuǎn)化為服從指數(shù)分布的偽隨機(jī)數(shù)t1,t2,…,tn(用t1,t2,…,tn模擬n個(gè)受試者的生存時(shí)間),設(shè)隨訪時(shí)間為[T,T+τ],則整個(gè)研究期間為[0,T+τ]。若xi+ti≤T+τ,表示第i個(gè)受試者在研究期間死亡,則其生存結(jié)局d=1;反之,表示第i個(gè)受試者在研究結(jié)束時(shí)仍然存活,為截尾數(shù)據(jù)。假設(shè)研究目標(biāo)值的中位生存期為TM0,研究人群的中位生存時(shí)間為TM1,收集病例的時(shí)間為T,隨訪時(shí)間為τ,用計(jì)算機(jī)模擬產(chǎn)生數(shù)據(jù),再用STATA軟件作生存分析的指數(shù)回歸模型擬合,并進(jìn)行假設(shè)檢驗(yàn)。用無效假設(shè)H0被拒絕的比例作為檢驗(yàn)效能的估計(jì)值。
我們分別隨機(jī)模擬了在顯著性水平α=0.025和α=0.01的情況下不同預(yù)定檢驗(yàn)效能1-β所對(duì)應(yīng)的單側(cè)拒絕率,即在兩種不同的研究背景下,用計(jì)算機(jī)分別產(chǎn)生1 000個(gè)相同樣本含量的模擬數(shù)據(jù)樣本且每個(gè)樣本均符合設(shè)定條件,再計(jì)算這1 000個(gè)樣本所對(duì)應(yīng)的1 000個(gè)生存分析指數(shù)回歸模型擬合的參數(shù)檢驗(yàn)中,無效假設(shè)H0被拒絕的比例,并用這個(gè)比例作為該檢驗(yàn)效能的估計(jì)。
研究背景及參數(shù)設(shè)置 研究背景1:研究目標(biāo)值的中位生存時(shí)間TM0為10個(gè)月,研究人群的中位生存時(shí)間TM1為13個(gè)月,收集病例的時(shí)間T為12個(gè)月,停止收集病例后的隨訪時(shí)間τ為24個(gè)月。
研究背景2:研究假設(shè)的中位生存時(shí)間TM0為9個(gè)月,研究人群的中位生存時(shí)間TM1為12個(gè)月,收集病例的時(shí)間T為18個(gè)月,停止收集病例后的隨訪時(shí)間τ為24個(gè)月。
模擬結(jié)果 表1分別給出了研究背景1、2在顯著性水平α=0.025的情況下不同預(yù)定檢驗(yàn)效能1-β所對(duì)應(yīng)的單側(cè)拒絕率模擬結(jié)果;表2分別給出了研究背景1、2在顯著性水平α=0.01的情況下不同預(yù)定檢驗(yàn)效能1-β所對(duì)應(yīng)的單側(cè)拒絕率模擬結(jié)果。
由表1、2的隨機(jī)模擬結(jié)果可以看出,在顯著性水平α保持不變的情況下,預(yù)期的檢驗(yàn)效能1-β越高,根據(jù)公式估計(jì)得到的樣本含量越大;同理,當(dāng)其他參數(shù)都固定不變的前提下,顯著性水平α越低,根據(jù)公式估計(jì)得到的樣本含量也越大。通過計(jì)算機(jī)模擬產(chǎn)生樣本,對(duì)病例的中位生存時(shí)間進(jìn)行假設(shè)檢驗(yàn),得到各組單側(cè)拒絕率的估計(jì)值與預(yù)定的檢驗(yàn)效能都比較接近。
樣本量的估計(jì)是臨床試驗(yàn)設(shè)計(jì)中極為重要的一個(gè)環(huán)節(jié),只有達(dá)到充足的樣本量,才能夠保證有足夠的把握度來發(fā)現(xiàn)實(shí)際存在的差異。本文經(jīng)隨機(jī)模擬,表明在α=0.025和α=0.01的情況下,各預(yù)定的檢驗(yàn)效能1-β與單側(cè)拒絕率估計(jì)值比較接近,因此該樣本量估算的公式是有效和可靠的。
表1 α=0.025時(shí)不同預(yù)設(shè)1-β情況下的樣本量與檢驗(yàn)效能估計(jì)
表2 α=0.01時(shí)不同預(yù)設(shè)1-β情況下的樣本量與檢驗(yàn)效能估計(jì)
由于生存時(shí)間往往是偏態(tài)的,不適用基于正態(tài)分布理論的統(tǒng)計(jì)學(xué)方法,而指數(shù)分布是生存分析中最簡單與最重要的分布,所以我們?cè)跀M合生存資料的數(shù)據(jù)時(shí),是基于生存時(shí)間服從指數(shù)分布進(jìn)行推導(dǎo)的。同時(shí),本文所推導(dǎo)的單臂臨床試驗(yàn)生存分析的樣本量估計(jì)公式采用的是正態(tài)近似法,所以當(dāng)研究假設(shè)的中位生存時(shí)間與研究人群的中位生存時(shí)間相差過大時(shí),該公式計(jì)算得到的樣本量就會(huì)變小,則正態(tài)近似的方差就會(huì)變大,導(dǎo)致檢驗(yàn)效能的下降。
單臂臨床試驗(yàn)有其特定的優(yōu)點(diǎn),即所有的受試者都接受同一種試驗(yàn)藥物,試驗(yàn)設(shè)計(jì)、實(shí)施趨于簡單、易行,且研究周期較III期臨床試驗(yàn)短[6];但其缺點(diǎn)也顯而易見,由于使用試驗(yàn)藥物的受試者與歷史對(duì)照數(shù)據(jù)在基線特征、診斷標(biāo)準(zhǔn)等方面可能存在一定的差異,可比性差,所以要謹(jǐn)慎選擇歷史對(duì)照數(shù)據(jù),對(duì)其可靠性進(jìn)行充分評(píng)價(jià)[1]。但該試驗(yàn)設(shè)計(jì)在新藥研發(fā)中有其特定的地位,若所研究的疾病為非常嚴(yán)重的或罕見的疾病,目前尚無適合的治療藥物,同時(shí)根據(jù)研究藥物的作用機(jī)制、動(dòng)物試驗(yàn)、以及早期的經(jīng)驗(yàn),可以推薦所研究的新藥時(shí),在探索性階段可以使用單臂臨床試驗(yàn)。
隨著創(chuàng)新藥物研發(fā)的不斷活躍,新的藥物和治療手段不斷產(chǎn)生,無論是國內(nèi)還是國外,采用單臂研究設(shè)計(jì)開展注冊(cè)研究的越來越多[1],但目前尚沒有單臂臨床試驗(yàn)設(shè)計(jì)下進(jìn)行生存分析的樣本量估算公式。本文給出了該類研究的樣本量估算的推導(dǎo)過程及公式,可使研究者在設(shè)計(jì)此類試驗(yàn)時(shí)計(jì)算樣本量更加方便和準(zhǔn)確,在實(shí)際的臨床試驗(yàn)中有一定的推廣意義。
[1] 張虹,高晨燕,陳曉媛,等.關(guān)于采用單臂臨床試驗(yàn)數(shù)據(jù)用于支持進(jìn)口藥品注冊(cè)的考慮[J].中國新藥雜志,2013,22(18):2126-2129.
[2] JOHNSON JR,NING YM,FARRELL A,etal.Accelerated approval of oncology products:the food and drug administration experience[J].JNatlCancerI,2011,103(8):636-644.
[3] ELLENBERG SS.Accelerated approval of oncology drugs:can we do better?[J].JNatlCancerI,2011,103(8):616-617.
[4] 李嬋娟,蔣志偉,王銳,等.隨機(jī)對(duì)照藥物臨床試驗(yàn)樣本量估計(jì)[J].中國臨床藥理學(xué)與治療學(xué),2011,16(10):1132-1136.
[5] LEE ET.生存數(shù)據(jù)分析的統(tǒng)計(jì)方法.2版[M].北京:中國統(tǒng)計(jì)出版社,1998:156-161.
[6] JUNG SH.Statistical issues for design and analysis of single-arm multi-stage phase II cancer clinical trials[J].ContempClinTrials,2015,42:9-17.
Sample size estimation for survival analysis in single-arm trials
ZHANG Xiu-ping, ZHAO Nai-qing△
(DepartmentofBiostatistics,SchoolofPublicHealth,FudanUniversity,Shanghai200032,China)
Objective To propose a method to calculate sample size for survival analysis in single-arm trials. Methods Through theoretical formula derivation,we provided sample size estimation method for survival analysis in single-arm trials.Monte-Carlo simulations using STATA software were conducted to obtain the empirical power,so as to verify the accuracy of the estimated sample size.Results Simulation results showed that,whenα=0.025 andα=0.01,the power of the sample size calculated by the formula is in accordance with the predetermined power. Conclusions The formula of sample size estimation we proposed could achieve the predetermined power for survival analysis in single-arm trials.Findings of this study provide reliable basis for sample size estimation of early stage antineoplastic drug clinical studies.
single-arm trials; sample size estimation; survival analysis
國家自然科學(xué)基金(81273187)
R195.1
A
10.3969/j.issn.1672-8467.2017.04.022
2017-02-14;編輯:張秀峰)
△Corresponding author E-mail:nqzhao@126.com
*This work was supported by the National Natural Science Foundation of China (81273187).
復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版)2017年4期