楊嘉瑩 王詩遠(yuǎn) 李貴凡 劉 沛△
1.東南大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)系(210009) 2.北京民海生物科技有限公司
對于具有多個(gè)主要終點(diǎn)(multiple primary endpoints)的臨床試驗(yàn),當(dāng)規(guī)定任一個(gè)終點(diǎn)成功整個(gè)研究即為成功時(shí),可稱為并交(union-intersection)試驗(yàn)[1],此類研究常常會(huì)帶來多重性問題。與之相反,針對多個(gè)共同終點(diǎn)(multiple co-primary endpoints)的臨床研究稱為交并(intersection-union)試驗(yàn)[2-3],一般規(guī)定多個(gè)終點(diǎn)同時(shí)具有統(tǒng)計(jì)學(xué)意義時(shí)整個(gè)試驗(yàn)才記為成功。這種設(shè)計(jì)避免了多重檢驗(yàn)所帶來的Ⅰ類錯(cuò)誤膨脹,但需要對Ⅱ類錯(cuò)誤進(jìn)行調(diào)整,為臨床試驗(yàn)樣本量計(jì)算帶來了新挑戰(zhàn)[4-6]。當(dāng)試驗(yàn)結(jié)局為連續(xù)型終點(diǎn)時(shí),已有文獻(xiàn)對樣本量估計(jì)方法進(jìn)行探討[7],而當(dāng)試驗(yàn)結(jié)局為二分類終點(diǎn)時(shí),相關(guān)研究較少且存在一些不足。在實(shí)際工作中,由于缺少方法學(xué)支持,一些研究者將各終點(diǎn)計(jì)算所得的最大樣本量作為整個(gè)研究的樣本量,該方法在各終點(diǎn)獨(dú)立時(shí)會(huì)成倍損耗全局功效[8]。另一種較常用的方法是使用Bonferroni調(diào)整法對Ⅱ類錯(cuò)誤進(jìn)行調(diào)整,但該方法過于保守,可能過多的估計(jì)樣本量[9]。Song等人[10]提出了終點(diǎn)為率差時(shí)非劣效試驗(yàn)樣本量計(jì)算方法,但未探討通過各終點(diǎn)率差之間的相關(guān)性估計(jì)結(jié)局統(tǒng)計(jì)量之間相關(guān)性存在的限制。此外,基于檢驗(yàn)統(tǒng)計(jì)量的聯(lián)合概率模型[11]推導(dǎo)的樣本量計(jì)算公式要求使用者具備一定的數(shù)學(xué)和計(jì)算機(jī)編程知識(shí),這也限制了其使用。
近年來,可同時(shí)預(yù)防多種細(xì)菌或病毒亞型的多價(jià)疫苗日漸增多,如北京民海生物科技有限公司研制的多價(jià)肺炎疫苗,其研究終點(diǎn)可多達(dá)23個(gè),且各終點(diǎn)間存在正相關(guān),這對樣本量估計(jì)提出了新的挑戰(zhàn)。對于連續(xù)型終點(diǎn)研究,一種基于“膨脹因子”的方法[9]已在多共同終點(diǎn)臨床試驗(yàn)中得到較好應(yīng)用。雖然該方法僅適用于7個(gè)及以下終點(diǎn)的臨床研究,但其原理可推廣至二分類終點(diǎn)問題。本研究將針對多價(jià)疫苗發(fā)展的實(shí)際,運(yùn)用隨機(jī)模擬方法探討基于Ⅱ類錯(cuò)誤調(diào)整的“膨脹因子”方法用于二分類終點(diǎn)樣本含量估計(jì)的合理性,并通過反推法將該方法擴(kuò)展至20個(gè)終點(diǎn)的多價(jià)疫苗臨床試驗(yàn)中。
1.單個(gè)終點(diǎn)樣本量計(jì)算
考慮一項(xiàng)以率為結(jié)局的兩組平行對照設(shè)計(jì)非劣效試驗(yàn),可采用下述公式[12]進(jìn)行樣本量估計(jì)。
(1)
其中下標(biāo)T代表試驗(yàn)組,C代表對照組;Z1-α和Z1-β分別對應(yīng)一類錯(cuò)誤率α,二類錯(cuò)誤率β的正態(tài)分布分位數(shù);π代表相應(yīng)組別的率;d代表非劣效界值。
2.名義錯(cuò)誤水平調(diào)整
交并試驗(yàn)存在Ⅱ類錯(cuò)誤膨脹問題,在并交試驗(yàn)中也存在Ⅰ類錯(cuò)誤膨脹所帶來的多重性問題。一些研究者針對多重性問題提出了名義Ⅰ類錯(cuò)誤水平調(diào)整方法,這些方法的思想同樣適用于名義Ⅱ類錯(cuò)誤水平調(diào)整。
對于具有K(≥2)個(gè)相關(guān)終點(diǎn)的臨床試驗(yàn),Tukey 等人[13]建議調(diào)整第k個(gè)假設(shè)檢驗(yàn)的名義Ⅰ類錯(cuò)誤水平為:
(2)
αk=1-(1-α)1/mk
(3)
其中,mk=K1-rk,若令rjk是第j個(gè)和第k個(gè)終點(diǎn)的相關(guān)系數(shù),則
(4)
當(dāng)各終點(diǎn)相互獨(dú)立時(shí),該調(diào)整方法相當(dāng)于Bonferroni檢驗(yàn),當(dāng)各終點(diǎn)間相關(guān)系數(shù)均為1時(shí),該方法計(jì)算的P值相當(dāng)于未調(diào)整前的P值。當(dāng)各終點(diǎn)間平均相關(guān)系數(shù)為0.5時(shí),該方法相當(dāng)于公式(2)。盡管存在上述優(yōu)點(diǎn),Sankoh的研究發(fā)現(xiàn)該方法對α的保護(hù)水平隨著終點(diǎn)數(shù)量的增加而下降,并提出對名義Ⅰ類錯(cuò)誤水平增加因子c以改進(jìn)整體效果,即在公式(3)中使用α’=cα替換原公式中的α。改進(jìn)后的公式為:
αk=1-(1-cα)1/mk
(5)
Sankoh提供了在不同終點(diǎn)數(shù)和終點(diǎn)間相關(guān)性的情景下因子c的參考取值[16]。此類調(diào)整方法可以考慮終點(diǎn)之間的相關(guān)信息且無需任何分布假設(shè)。
3.改進(jìn)的膨脹因子法
考慮一項(xiàng)具有K個(gè)終點(diǎn)的交并試驗(yàn),當(dāng)試驗(yàn)組和對照組間效應(yīng)量相等時(shí),各終點(diǎn)所需的樣本量相同。以該樣本量作為整個(gè)研究的樣本量必然帶來Ⅱ類錯(cuò)誤的膨脹。為了達(dá)到預(yù)期的全局功效,單個(gè)研究的名義Ⅱ類錯(cuò)誤水平應(yīng)向下調(diào)整。又由于各終點(diǎn)間相關(guān)性差異較小,可假設(shè)各終點(diǎn)間具有相等且恒定的相關(guān)性,進(jìn)而對計(jì)算公式簡化。在公式(4)的基礎(chǔ)上,Julious將其擴(kuò)展并應(yīng)用于名義Ⅱ類錯(cuò)誤水平的調(diào)整:
(6)
其中,t=K1-ρ,K是共同終點(diǎn)數(shù),ρ是各終點(diǎn)間的相關(guān)系數(shù),β是名義II型錯(cuò)誤水平。將公式(6)計(jì)算得到的βK代入公式(1),可得調(diào)整后的樣本含量。膨脹因子(inflation factor,IF)則為調(diào)整后的樣本含量與未調(diào)整樣本含量的比值,即:
(7)
公式(6)中不同相關(guān)性和終點(diǎn)數(shù)目時(shí)因子c的取值詳見Sankoh及Julious文獻(xiàn)[9,16]。由已給出因子c的值可知,在相同終點(diǎn)個(gè)數(shù)下,該參數(shù)取值可近似于隨相關(guān)系數(shù)增加而減少的直線,因此可采取插值法,參照10個(gè)終點(diǎn)下相關(guān)性為0.5和0.7水平下的結(jié)果補(bǔ)齊相關(guān)性為0.6時(shí)的因子c取值。
4.通過膨脹因子反推因子c
通過模擬試驗(yàn),我們可以得到各情景下為了達(dá)到80%全局功效所需樣本量。該樣本量與通過公式(1)計(jì)算所得樣本量的比值即為IF。通過公式(7),我們可知Z1-βK的計(jì)算公式為:
(8)
(9)
其中F(1-βK)為1-βK在標(biāo)準(zhǔn)正態(tài)分布下的累積分布函數(shù)。通過公式(8)及公式(9),我們可以計(jì)算得到βK的結(jié)果,結(jié)合公式(6)即得:
(10)
通過對因子c的反推,我們可以利用模擬方法獲取20個(gè)共同終點(diǎn)情景下的膨脹因子,進(jìn)一步補(bǔ)充因子c的取值,從而滿足多價(jià)疫苗臨床試驗(yàn)樣本量計(jì)算的需求。
以一項(xiàng)具有K(≥2)個(gè)終點(diǎn)的非劣效疫苗臨床試驗(yàn)為例,結(jié)局指標(biāo)為抗體陽轉(zhuǎn)率。試驗(yàn)組和對照組的樣本量相同,分別用nT和nC表示;第i(i=1…K)個(gè)終點(diǎn)各組的陽轉(zhuǎn)率分別用πTi和πCi表示;假設(shè)K個(gè)終點(diǎn)間的相關(guān)性相同,各組終點(diǎn)間平均相關(guān)性分別用ρT和ρC表示。受試者各個(gè)終點(diǎn)陽轉(zhuǎn)率的綜合反應(yīng)向量,Yj=(Yj1,…YjK)T(j=1…n)服從E[Y]=πT,var[Y]=πT(1-πT)的K變量伯努利分布。由于該研究的主要目的是探討在各終點(diǎn)間具有相關(guān)性的情況下,膨脹因子法用于多個(gè)終點(diǎn)交并試驗(yàn)樣本量計(jì)算的效果,當(dāng)試驗(yàn)組和對照組的組間效應(yīng)存在差別時(shí),該差別會(huì)主導(dǎo)樣本量計(jì)算,削弱相關(guān)性的影響,因此本研究僅考慮πTi=πCi,ρT=ρC的情況,模擬試驗(yàn)通過SAS 9.4實(shí)現(xiàn)。
結(jié)論:總的來說,在日常使用pH計(jì)的過程中,一定要注重細(xì)節(jié),規(guī)范程序,區(qū)分不同類型,注意pH計(jì)相關(guān)的校準(zhǔn)和溫度補(bǔ)償?shù)拳h(huán)節(jié)。
1.模擬方法
基于以上假設(shè),該研究根據(jù)不同參數(shù)情景對各樣本量對應(yīng)的全局功效進(jìn)行蒙特卡洛模擬。初始樣本量通過公式(1)計(jì)算所得單個(gè)終點(diǎn)所需樣本量,終止樣本量采用Bonferroni調(diào)整的樣本量(βK=β/K)。具體步驟如下:
(1)根據(jù)均值πTi,πCi和終點(diǎn)間相關(guān)系數(shù)ρT,ρC分別為試驗(yàn)組和對照組的n例受試者產(chǎn)生K對服從伯努利分布的原始數(shù)據(jù)。
(2)組間陽轉(zhuǎn)率采用95%CI法進(jìn)行非劣效性檢驗(yàn),分別計(jì)算試驗(yàn)組與對照組組率差的95%置信區(qū)間下限并與非劣效界值比較。
(3)若K個(gè)共同終點(diǎn)同時(shí)滿足非劣效要求,則將該試驗(yàn)計(jì)為“成功”,否則計(jì)為“失敗”。
(4)重復(fù)1-3步驟1000次,統(tǒng)計(jì)“成功”次數(shù)計(jì)為m,則在該樣本量下試驗(yàn)的全局功效為m/1000。
(5)增加樣本量,并重復(fù)步驟1-4,直至達(dá)到終止樣本量。
2.參數(shù)設(shè)計(jì)
模擬試驗(yàn)中各參數(shù)取值見表1。結(jié)合疫苗臨床試驗(yàn)的實(shí)際數(shù)據(jù),終點(diǎn)個(gè)數(shù)考慮了四種情景,陽轉(zhuǎn)率考慮了五種情景,相關(guān)系數(shù)考慮了四種情景,合計(jì)80種組合情景。分別模擬各情景下全局功效隨樣本量增加的變化,并以模擬結(jié)果作為參考,評價(jià)“膨脹因子”法用于各情景下二分類共同終點(diǎn)研究樣本量計(jì)算的效果。擬采取的評價(jià)標(biāo)準(zhǔn)如下:
標(biāo)準(zhǔn)1:“膨脹因子”計(jì)算的樣本量不小于模擬結(jié)果。
標(biāo)準(zhǔn)2:“膨脹因子”計(jì)算的樣本量與模擬結(jié)果差異在模擬結(jié)果的5%以內(nèi)。
標(biāo)準(zhǔn)3:“膨脹因子”計(jì)算的樣本量與模擬結(jié)果差異在模擬結(jié)果的10%以內(nèi)。
表1 模擬試驗(yàn)參數(shù)及取值
同時(shí)滿足標(biāo)準(zhǔn)1和標(biāo)準(zhǔn)2,則認(rèn)為該情景下“膨脹因子”法效果較好,滿足標(biāo)準(zhǔn)3為效果適中,否則為效果較差。
1.全局功效變化
以樣本量為橫軸,全局功效為縱軸,2、5、10和20個(gè)終點(diǎn)下不同陽轉(zhuǎn)率及相關(guān)性組合的全局功效變化曲線見圖1。
圖1 多個(gè)共同終點(diǎn)在不同相關(guān)性,陽轉(zhuǎn)率下全局功效隨樣本量增加的變化
圖1的模擬結(jié)果顯示:
(1)為達(dá)到預(yù)訂的全局功效水平,共同終點(diǎn)的數(shù)目越多,所需樣本量越大。如ρ=0,π=0.5時(shí),為達(dá)到80%的全局功效,2、5、10及20個(gè)共同終點(diǎn)分別需要515、663,784及903例受試者。
(2)同一陽轉(zhuǎn)率水平下,為達(dá)到預(yù)計(jì)全局功效水平,各終點(diǎn)間相互獨(dú)立時(shí)不同終點(diǎn)間所需樣本量差距最大。隨著相關(guān)性的增加不同終點(diǎn)的全局功效曲線趨近,即不同終點(diǎn)所需樣本量的差距縮小。如為達(dá)到80%的全局功效,π=0.5,ρ=0時(shí)20個(gè)終點(diǎn)比2個(gè)終點(diǎn)所需樣本量多388例,而π=0.5,ρ=0.9時(shí),20個(gè)終點(diǎn)比2個(gè)終點(diǎn)所需樣本量僅多100例。
(3)同一相關(guān)性水平下,不同陽轉(zhuǎn)率水平的全局功效曲線相似。如ρ=0時(shí),2、5、10及20個(gè)終點(diǎn)的全局功效變化趨勢相似。
2.“膨脹因子”法效果評價(jià)
Julious提供了7個(gè)及以下終點(diǎn)時(shí)因子c的取值[9],Sankoh文獻(xiàn)中提及10個(gè)終點(diǎn)時(shí)部分情景下因子c的值[16],我們通過插值法補(bǔ)齊因子c的取值,并計(jì)算在本次模擬情景中2個(gè)、5個(gè)或10個(gè)共同終點(diǎn)時(shí)“膨脹因子”法得到的樣本量,與模擬結(jié)果比較并根據(jù)上文提到的3條標(biāo)準(zhǔn)進(jìn)行評價(jià)。
由表2可知,在2個(gè)終點(diǎn)時(shí),除π= 0.9且ρ= 0.9情景外,“膨脹因子”法計(jì)算結(jié)果與模擬結(jié)果差異均不超過±5%;特別的,當(dāng)ρ= 0.6時(shí)“膨脹因子”法效果較好;在5個(gè)終點(diǎn)時(shí),除ρ= 0.9的情景外“膨脹因子”法效果適中,特別的,當(dāng)ρ= 0或ρ= 0.3時(shí),絕大多數(shù)情景下“膨脹因子”法效果較好;在存在10個(gè)共同終點(diǎn)的研究中,除ρ= 0.9的情景外“膨脹因子”法效果適中。
3.不同情景下的膨脹因子及參數(shù)c取值
由上可知,在ρ= 0.9時(shí),“膨脹因子”法用于樣本量計(jì)算的效果并不理想。為了改善該方法的效果,我們利用模擬得到的膨脹因子反推因子c的取值,并進(jìn)一步擴(kuò)展到20個(gè)共同終點(diǎn)的情景中。結(jié)果見表3。
表2 膨脹因子”法樣本量計(jì)算結(jié)果與模擬結(jié)果比較
*:差異=(計(jì)算結(jié)果-模擬結(jié)果)/模擬結(jié)果;加粗?jǐn)?shù)據(jù)表示結(jié)果較好;黑框數(shù)據(jù)表示結(jié)果較差。
表3 各情景下膨脹因子及因子c取值
由表3可知不同終點(diǎn)數(shù)及終點(diǎn)間相關(guān)性組合下使用“膨脹因子”法計(jì)算樣本含量時(shí)因子c的取值。其中加粗?jǐn)?shù)值由Sankoh及Julious文獻(xiàn)提供,其他結(jié)果通過公式(8)計(jì)算。由表3中提供膨脹因子可知,各終點(diǎn)間相關(guān)性越高,為達(dá)到預(yù)先設(shè)計(jì)的全局功效,所需樣本量膨脹因子越小。特別的,當(dāng)各終點(diǎn)相互獨(dú)立(ρ= 0)時(shí),因子c取值為1,公式(6)可進(jìn)一步簡化為:
(11)
公式(11)即為Sidak調(diào)整公式[17]。
存在多個(gè)共同終點(diǎn)臨床試驗(yàn)的樣本量計(jì)算問題已經(jīng)引起國內(nèi)外研究者的注意,但傳統(tǒng)計(jì)算方法仍存在較多問題。各終點(diǎn)分別計(jì)算樣本量并取其最大值的方法在各終點(diǎn)間效應(yīng)量相似時(shí)會(huì)明顯低估樣本量,造成整個(gè)研究的全局功效達(dá)不到預(yù)期;而通過Bonferroni調(diào)整的方法又過于保守,往往高估樣本量,造成人力物力的浪費(fèi)。Sankoh提出的對名義錯(cuò)誤水平調(diào)整的程序相對寬松,而由Julious改進(jìn)后的“膨脹因子”方法寬松程度介于Sankoh方法與Bonferroni調(diào)整方法之間。此外,“膨脹因子”法不依賴于特定的研究假設(shè)和檢驗(yàn)方法,為多終點(diǎn)問題提供了通用的樣本量計(jì)算方法。
總的來說,“膨脹因子”法可以均衡相關(guān)性對多個(gè)共同終點(diǎn)臨床研究樣本量計(jì)算的影響。存在2個(gè)共同終點(diǎn)研究中,“膨脹因子”法效果較好;存在5~10個(gè)共同終點(diǎn)的研究中,當(dāng)終點(diǎn)間相關(guān)性小于等于0.6時(shí),“膨脹因子”法效果適中。實(shí)際臨床數(shù)據(jù)各終點(diǎn)間往往存在一定的正相關(guān),相關(guān)性可低至0.2高至0.8。對于多終點(diǎn)臨床研究,終點(diǎn)間相關(guān)性的存在可以節(jié)約樣本量,忽略這種相關(guān)性則會(huì)造成樣本量的高估。而在另一些情況中,臨床試驗(yàn)中各終點(diǎn)是相互獨(dú)立的,“膨脹因子”法近似于Bonferroni調(diào)整法。
本文提供了存在2、5、10、20個(gè)二分類共同終點(diǎn)時(shí)樣本量的膨脹系數(shù),出于保守性的考慮,介于上述終點(diǎn)數(shù)之間的研究可向右選擇相近終點(diǎn)數(shù)對應(yīng)的膨脹因子。超過20個(gè)終點(diǎn)的研究樣本量建議通過模擬推算。此外,本研究關(guān)注試驗(yàn)組與對照組二分類指標(biāo)水平相同的情況,在試驗(yàn)組與對照組的效應(yīng)量不同的情況下“膨脹因子”法可能無法滿足樣本量計(jì)算需求,一些根據(jù)各組效應(yīng)量差別為各終點(diǎn)分配不同研究功效從而達(dá)到全局功效的樣本量計(jì)算方法為類似情況提供了解決辦法[18]。
綜上,本文通過蒙特卡洛模擬研究了“膨脹因子”法用于多個(gè)二分類共同終點(diǎn)臨床試驗(yàn)樣本量計(jì)算的合理性,修改了相關(guān)性較高時(shí)因子c的取值,并進(jìn)一步擴(kuò)展至20個(gè)共同終點(diǎn)的情況。