劉 曼 許敏怡 劉玉秀,4△ 陳文松 鞏浩雯 熊殷
【提 要】 目的 探討隨機(jī)對(duì)照試驗(yàn)(randomized controlled trial,RCT)中應(yīng)用限制性隨機(jī)化方法的選擇偏倚對(duì)統(tǒng)計(jì)檢驗(yàn)決策的影響。方法 采用Monte-Carlo模擬比較4種常用的限制性隨機(jī)化方法在不同的參數(shù)設(shè)置和猜測(cè)策略下進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí)的一類錯(cuò)誤率表現(xiàn)。結(jié)果 4種限制性隨機(jī)化方法均會(huì)導(dǎo)致一類錯(cuò)誤率超過(guò)預(yù)設(shè)的顯著性水平(如5%),區(qū)組長(zhǎng)度越小、選擇效應(yīng)越大,一類錯(cuò)誤率膨脹越嚴(yán)重,在同等條件下,PBD的一類錯(cuò)誤率膨脹最大,其次是BCDWIT、BUD、BSD。結(jié)論 臨床試驗(yàn)中應(yīng)用限制性隨機(jī)化方法存在的潛在選擇偏倚會(huì)導(dǎo)致一類錯(cuò)誤率膨脹,應(yīng)注意優(yōu)選隨機(jī)化方法并加強(qiáng)實(shí)施過(guò)程管理。
隨機(jī)對(duì)照試驗(yàn)(randomized controlled trial,RCT)是評(píng)估醫(yī)療干預(yù)措施效果的金標(biāo)準(zhǔn)。隨機(jī)化被認(rèn)為是RCT中創(chuàng)建可比治療組和減少偏倚的關(guān)鍵部分。限制性隨機(jī)化是一類為了控制組間均衡性而設(shè)置一些限制條件的隨機(jī)化方法,受到普遍歡迎[1]。然而,在開放或非盲態(tài)試驗(yàn)中,由于限制性隨機(jī)化方法的“限制”特點(diǎn),若選擇和操作實(shí)施過(guò)程不當(dāng)則容易產(chǎn)生可預(yù)測(cè)性并選擇性分配受試者,進(jìn)而導(dǎo)致選擇偏倚[2]。本文通過(guò)分析該類選擇偏倚對(duì)一類錯(cuò)誤率的影響,研究其在不同隨機(jī)化方法下對(duì)檢驗(yàn)決策的影響,為隨機(jī)化方法選擇和偏倚防范提供參考。
研究表明,在RCT中,若采用限制性隨機(jī)化設(shè)計(jì)方法,當(dāng)研究者知曉已經(jīng)入組受試者的分配信息時(shí),即使在實(shí)行了分配隱蔽并不能直接獲得下一例分配組別的情況下,也往往會(huì)猜測(cè)下一例的分配,其猜測(cè)分配的行為模式一般符合Blackwell-Hodges收斂策略(BH策略)[2-3],即猜測(cè)下一例分配到當(dāng)前例數(shù)較少的一組。對(duì)于兩組試驗(yàn),記試驗(yàn)組為E,對(duì)照組為C,總樣本量為N,入組受試者的序號(hào)為i。假設(shè)研究者在整個(gè)試驗(yàn)的過(guò)程中對(duì)每一例分配都猜測(cè),且期望試驗(yàn)組具有更好的效果,令gi為第i個(gè)分配的猜測(cè)分組,則
(1)
其中,di-1為前i-1名受試者中試驗(yàn)組和對(duì)照組的樣本量之差,即di-1=NE(i-1)-NC(i-1),R服從于伯努利分布,即R~Ber(0.5),1代表試驗(yàn)組E,0代表對(duì)照組C。若gi=1,研究者將有意識(shí)或潛意識(shí)地選擇具有有利于E組試驗(yàn)成功的特征變量的受試者;若gi=0,研究者將傾向選擇具有不利于C組試驗(yàn)成功的特征變量的受試者;若gi=R,研究者沒(méi)有猜測(cè)的依據(jù),則以相同的概率隨機(jī)選擇第i個(gè)受試者分到E組或C組。在這種猜測(cè)策略下,研究者可以使期望的正確猜測(cè)次數(shù)最大化。
文獻(xiàn)報(bào)道的另一種猜測(cè)策略是僅在特定情況下進(jìn)行猜測(cè)[4],該策略假設(shè)研究者已知組大小及當(dāng)前組內(nèi)的先前分配,可得出當(dāng)前受試者分配給試驗(yàn)組E的條件分配概率P{E},則可根據(jù)P{E}猜測(cè)下一例的分配,若P{E}超過(guò)固定的臨界值q,猜測(cè)第i個(gè)受試者分配到E組。反之若P{E}小于固定的臨界值1-q,猜測(cè)第i個(gè)受試者分配到C組。其中,q是人為設(shè)定的,通?!?/2。顯然該猜測(cè)策略較為復(fù)雜,似乎不夠符合臨床試驗(yàn)中研究者的猜測(cè)行為模式。因此,本研究?jī)H采用BH猜測(cè)策略。
在選擇偏倚的影響下,臨床試驗(yàn)中的治療差異檢驗(yàn)可能會(huì)出現(xiàn)一類錯(cuò)誤率膨脹,例如,即使沒(méi)有實(shí)際的治療效果,組間的異質(zhì)性也會(huì)導(dǎo)致組間療效差異顯著。Proschan[5]率先提出了收斂策略對(duì)療效假設(shè)檢驗(yàn)的一類錯(cuò)誤率的影響,并基于BH策略提出如下模型。假設(shè)試驗(yàn)研究者偏向于試驗(yàn)組,并且有足夠的候選受試者。即當(dāng)研究者猜測(cè)下一個(gè)患者將被分配到試驗(yàn)組時(shí),他會(huì)招募一名具有某些特征變量、預(yù)期結(jié)果更好的受試者;在猜測(cè)下一個(gè)受試者將被分配到對(duì)照組時(shí),則招募一名預(yù)期結(jié)果較差的受試者;在隨機(jī)猜測(cè)下一個(gè)治療時(shí),將會(huì)招募一名結(jié)果中等的受試者。研究者能夠區(qū)分結(jié)果較好、較差或中性的受試者的程度由參數(shù)η表示, 稱為選擇效應(yīng)。
(2)
xi~N(μ1,σ2),i∈{1,…,n}
(3)
yi~N(μ2,σ2),i∈{1,…,n}
采用雙側(cè)獨(dú)立兩樣本t檢驗(yàn)來(lái)檢驗(yàn)以下假設(shè)[6]:
H0:μ1=μ2?H1:μ1≠μ2
(4)
在沒(méi)有治療效果的原假設(shè)下,我們假設(shè)研究者偏愛試驗(yàn)組,希望通過(guò)選擇偏倚提高一類錯(cuò)誤率,達(dá)到證明試驗(yàn)組優(yōu)于對(duì)照組的目的。
對(duì)于二分類的響應(yīng)變量,假定兩組的響應(yīng)結(jié)果均服從二項(xiàng)分布,即
xi~Binomial(n1,π1),i∈{1,…,n}
(5)
yi~Binomial(n2,π2),i∈{1,…,n}
采用Pearsonχ2檢驗(yàn)來(lái)檢驗(yàn)兩組率是否相等。
所有Monte-Carlo模擬在SAS 9.4系統(tǒng)環(huán)境下實(shí)現(xiàn)。對(duì)于連續(xù)(二分類)的響應(yīng)變量,設(shè)置兩處理組,每組各100例;兩組的均數(shù)(成功率)均設(shè)置為0.4,選擇效應(yīng)(η)相應(yīng)設(shè)為0.2、0.1、0.05;隨機(jī)化方法選擇區(qū)組隨機(jī)設(shè)計(jì)(permuted block design,PBD)、大棒設(shè)計(jì)(big stick design,BSD)、帶不平衡限制的偏幣設(shè)計(jì)(biased coin design with imbalance tolerance,BCDWIT)、區(qū)組甕設(shè)計(jì)(block urn design,BUD)方法;模擬研究的區(qū)組選擇較小區(qū)組長(zhǎng)度(4,8,10)和較大的區(qū)組長(zhǎng)度(20,50,200),相應(yīng)的最大容許不平衡數(shù)(maximal tolerated imbalance,MTI)取值為2、4、5、10、25;具體參數(shù)設(shè)置見表1。
表1 4種限制性隨機(jī)化方法一類錯(cuò)誤率模擬的參數(shù)設(shè)置(檢驗(yàn)水準(zhǔn)α=0.05)
基于各種隨機(jī)化設(shè)計(jì)生成隨機(jī)列表。根據(jù)生成的隨機(jī)列表和研究者的選擇偏好,模擬受試者進(jìn)入E組或C組的分配。研究者可以根據(jù)BH猜測(cè)策略選擇強(qiáng)、中、弱特征的受試者[6]。
對(duì)于相關(guān)參數(shù)的每個(gè)組合,重復(fù)數(shù)據(jù)生成整個(gè)過(guò)程1萬(wàn)次。設(shè)定檢驗(yàn)水準(zhǔn)α=0.05,使用t檢驗(yàn)或χ2檢驗(yàn)對(duì)每個(gè)生成的數(shù)據(jù)集進(jìn)行分析,以檢驗(yàn)E和C兩組之間的差異,使用一類錯(cuò)誤率評(píng)估檢驗(yàn)決策的性能。一類錯(cuò)誤率是指P值小于0.05的模擬數(shù)據(jù)集的比例。一類錯(cuò)誤率偏離0.05表示存在偏倚。
為了在更現(xiàn)實(shí)的環(huán)境中檢驗(yàn)選擇偏倚對(duì)一類錯(cuò)誤率的影響,我們重復(fù)進(jìn)行了模擬,但改變了研究者在每種情況下都能選擇具有偏好特征受試者的理想情況。即并沒(méi)有足夠的受試者供研究者選擇,具體來(lái)說(shuō),當(dāng)研究者嘗試招募一名強(qiáng)特征受試者時(shí),他只有50%的機(jī)會(huì)這樣做。同樣,研究者每次嘗試招募弱特征受試者時(shí),也只有50%的機(jī)會(huì)。若招募不到合適的受試者則招募中等強(qiáng)度的受試者。
由圖1可得,當(dāng)研究者有100%的概率選擇合適的受試者時(shí),在區(qū)組隨機(jī)化方法下,隨著區(qū)組長(zhǎng)度的增大,一類錯(cuò)誤率逐漸減小,當(dāng)選擇效應(yīng)為總效應(yīng)的1/2時(shí),除了區(qū)組長(zhǎng)度為200的其余區(qū)組長(zhǎng)度的一類錯(cuò)誤率均較大,區(qū)組長(zhǎng)度為4時(shí),一類錯(cuò)誤率膨脹至22%;同時(shí),隨著選擇效應(yīng)的減小,一類錯(cuò)誤率也逐漸降低,但仍高于名義水平。而當(dāng)研究者只有50%的概率選到合適的受試者時(shí),其一類錯(cuò)誤率膨脹明顯減小,但在區(qū)組長(zhǎng)度為4時(shí),一類錯(cuò)誤率也膨脹至10%??梢?在BH收斂策略下,無(wú)論選擇效應(yīng)有多小,只要有選擇,就會(huì)導(dǎo)致一類錯(cuò)誤率增大,且區(qū)組長(zhǎng)度越小,一類錯(cuò)誤率膨脹越大。
*:對(duì)應(yīng)不同的研究者猜測(cè)情況,guess=50%表示研究者有50%的概率選到心儀的受試者,guess=100%表示研究者有100%的概率選到合適的受試者
各類情況下的BUD的一類錯(cuò)誤率的變化趨勢(shì)與PBD大致相同,即隨著區(qū)組長(zhǎng)度的增加而減小(圖1),但該趨勢(shì)僅在區(qū)組長(zhǎng)度較小(小于10)時(shí)較為明顯。在100%選擇的理想情況下,區(qū)組長(zhǎng)度為4時(shí),一類錯(cuò)誤率最大為12%。當(dāng)受試者人數(shù)有限無(wú)法供研究者任意選擇時(shí),各區(qū)組長(zhǎng)度下的一類錯(cuò)誤率大致相同,一類錯(cuò)誤率在區(qū)組長(zhǎng)度為4時(shí)較大(8%)。
BSD的一類錯(cuò)誤率隨著MTI的增加而降低(圖2),當(dāng)受試者足夠供研究者選擇時(shí),MTI為2,選擇效應(yīng)為0.2下的一類錯(cuò)誤率為11%,當(dāng)MTI大于4時(shí),一類錯(cuò)誤率明顯降低。而當(dāng)受試者人數(shù)有限無(wú)法供研究者隨意選擇時(shí),一類錯(cuò)誤率的情況有所好轉(zhuǎn),選擇效應(yīng)較大、MTI較小時(shí),一類錯(cuò)誤率較大。
注:對(duì)應(yīng)不同的研究者猜測(cè)情況,guess=50%表示研究者有50%的概率選到心儀的受試者,guess=100%表示研究者有100%的概率選到合適的受試者
BCDWIT是BSD和偏幣設(shè)計(jì)的綜合(圖2),當(dāng)選擇效應(yīng)較大時(shí),一類錯(cuò)誤率隨著MTI的增加而減小,選擇效應(yīng)為0.2、MTI為2時(shí),一類錯(cuò)誤率膨脹至15%;當(dāng)選擇效應(yīng)較小(0.05)時(shí),一類錯(cuò)誤率降低到名義水平;而當(dāng)受試者人數(shù)有限無(wú)法供研究者任意選擇時(shí)(guess=50%),一類錯(cuò)誤率明顯降低,其趨勢(shì)與100%猜測(cè)的情況大致相同。
在二分類響應(yīng)變量情況下,一類錯(cuò)誤率隨區(qū)組長(zhǎng)度和選擇效應(yīng)的變化趨勢(shì)與連續(xù)變量大致相同,但其值均明顯增大,在100%猜測(cè)的區(qū)組設(shè)計(jì)下,區(qū)組長(zhǎng)度為4,選擇效應(yīng)為總效應(yīng)的1/2時(shí),一類錯(cuò)誤率竟膨脹至0.68,50%猜測(cè)的情況下,也膨脹至0.22,BUD、BSD的一類錯(cuò)誤率雖較PBD小,但也膨脹至30%。
為了方便比較4種隨機(jī)化設(shè)計(jì)的一類錯(cuò)誤率膨脹,我們列舉了區(qū)組長(zhǎng)度為4或MTI為2的參數(shù)設(shè)置下對(duì)應(yīng)的一類錯(cuò)誤率模擬結(jié)果(表2)。綜合來(lái)看,PBD在各種選擇效應(yīng)和研究者猜測(cè)情況下,都有一類錯(cuò)誤率膨脹,且大都高于其他幾種方法,其次是BCDWIT,BCDWIT的一類錯(cuò)誤率膨脹雖較前者小,但仍高于名義水平,一類錯(cuò)誤率膨脹最小的是BSD,在選擇效應(yīng)為0.2時(shí),一類錯(cuò)誤率為0.1092;因此,在同一參數(shù)設(shè)置下,各隨機(jī)化設(shè)計(jì)的一類錯(cuò)誤率膨脹順序?yàn)镻BD>BCDWIT>BUD>BSD。
表2 MTI為2(區(qū)組長(zhǎng)度為4)時(shí)幾種限制性隨機(jī)化方法的一類錯(cuò)誤率
本文分析了限制性隨機(jī)化方法下因選擇受試者導(dǎo)致的選擇偏倚,并通過(guò)Monte-Carlo模擬比較了4種限制性隨機(jī)化方法在不同的參數(shù)設(shè)置和猜測(cè)策略下的一類錯(cuò)誤率表現(xiàn)。模擬研究發(fā)現(xiàn),該種選擇偏倚會(huì)導(dǎo)致一類錯(cuò)誤率超過(guò)預(yù)定的顯著性水平,在同一MTI下,PBD的一類錯(cuò)誤率膨脹最大,其次是BCDWIT、BUD、BSD。當(dāng)然,若當(dāng)受試者人數(shù)有限無(wú)法供研究者任意選擇時(shí),一類錯(cuò)誤率膨脹會(huì)減輕。這一結(jié)果從另一角度也印證了前人對(duì)上述4種限制性隨機(jī)化方法性能研究的結(jié)論[5,7]。
其實(shí),有關(guān)選擇偏倚對(duì)臨床試驗(yàn)一類錯(cuò)誤率膨脹的影響早有研究,對(duì)于平行組設(shè)計(jì)中的正態(tài)分布結(jié)果數(shù)據(jù),Proschan[5]使用Z檢驗(yàn)進(jìn)行分析,并推導(dǎo)了隨機(jī)分配規(guī)則(RAR)下的一類錯(cuò)誤率膨脹公式。Kennes等人[6]繼續(xù)這項(xiàng)工作,模擬了PBD的一類錯(cuò)誤率膨脹情況,并進(jìn)一步擴(kuò)展到多中心試驗(yàn)[8]。但以往的研究多考慮正態(tài)分布變量,隨機(jī)化方法也僅限于PBD,本研究在此基礎(chǔ)上探討了多種限制性隨機(jī)化方法的一類錯(cuò)誤率膨脹行為,并考慮了二分類結(jié)果變量的情形。結(jié)果發(fā)現(xiàn)二分類結(jié)果變量更易受到這種選擇偏倚的影響,其一類錯(cuò)誤率膨脹更大。
盡管我們的模擬也表明在4種限制性隨機(jī)化方法中,PBD最易導(dǎo)致一類錯(cuò)誤率膨脹,但該方法因操作上的簡(jiǎn)便性仍廣為應(yīng)用。2015年Lin等報(bào)道,在NEJM、Lancet、JAMA期刊上發(fā)表的RCT文獻(xiàn)中有82%采用了區(qū)組隨機(jī)化方法[9]。我們對(duì)2018年發(fā)表在NEJM上全年的RCT論著進(jìn)行了分析發(fā)現(xiàn),分層區(qū)組隨機(jī)化(72.65%)最多,其次為區(qū)組隨機(jī)化(11.11%)、最小化(9.40%)、簡(jiǎn)單隨機(jī)化(4.27%)[1]。但區(qū)組設(shè)計(jì)方法隨機(jī)性能低下已有明確研究結(jié)論,2006年,Berger甚至強(qiáng)烈建議不使用區(qū)組設(shè)計(jì)[10]。毋庸置疑,人們?cè)诂F(xiàn)實(shí)臨床試驗(yàn)中偏愛選擇PBD方法的現(xiàn)狀亟待關(guān)注和改善。近年有些學(xué)者對(duì)限制性隨機(jī)化方法下選擇偏倚的檢測(cè)和校正進(jìn)行了探討[11-12],但遠(yuǎn)未解決實(shí)際應(yīng)用問(wèn)題,應(yīng)需今后進(jìn)一步加強(qiáng)方法學(xué)研究及應(yīng)用。
中國(guó)衛(wèi)生統(tǒng)計(jì)2023年5期