楊孟淵,胡良平,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心,北京 100850;2.世界中醫(yī)藥聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com)
?
科研方法專題
精神衛(wèi)生科研如何嚴(yán)格遵守試驗(yàn)設(shè)計(jì)四原則之隨機(jī)原則
楊孟淵1,胡良平1,2*
(1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心,北京100850;2.世界中醫(yī)藥聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京100029*通信作者:胡良平,E-mail:lphu812@sina.com)
明確闡釋在進(jìn)行精神衛(wèi)生臨床試驗(yàn)設(shè)計(jì)時,應(yīng)正確把握“隨機(jī)原則”的意義和要領(lǐng)。從基本常識出發(fā),并基于精神衛(wèi)生科研的特點(diǎn),尋找和發(fā)現(xiàn)在此研究領(lǐng)域中,怎樣做才能被稱為嚴(yán)格遵守了“隨機(jī)原則”。通過結(jié)合本專業(yè)的特點(diǎn),并結(jié)合實(shí)例,獲得如下的結(jié)果,即在進(jìn)行精神衛(wèi)生臨床試驗(yàn)設(shè)計(jì)時,必須把握好以下三個方面:①正確選定隨機(jī)化的種類;②正確方便地實(shí)現(xiàn)隨機(jī)化;③必須盡可能避免違背隨機(jī)化的做法。在如何嚴(yán)格遵守隨機(jī)原則問題上,正確把握好前述提及的三個方面,就是抓住了問題的本質(zhì),是提高臨床試驗(yàn)研究質(zhì)量的一個重要環(huán)節(jié)。
精神衛(wèi)生;臨床試驗(yàn)設(shè)計(jì);隨機(jī)原則;分層隨機(jī)化;動態(tài)隨機(jī)化
1.1試驗(yàn)設(shè)計(jì)三要素與四原則在試驗(yàn)研究中的角色
科研設(shè)計(jì)[1-2]的內(nèi)容非常寬泛,而其中試驗(yàn)設(shè)計(jì)[3]的內(nèi)容所涉及的范圍就要窄很多。盡管如此,統(tǒng)計(jì)學(xué)在試驗(yàn)設(shè)計(jì)中的地位始終是舉足輕重的,因?yàn)楦鞣N科研設(shè)計(jì)的精華都包含在試驗(yàn)設(shè)計(jì)中。如果說試驗(yàn)設(shè)計(jì)三要素(受試對象、影響因素和試驗(yàn)效應(yīng))為試驗(yàn)研究提供了必要的“物質(zhì)基礎(chǔ)”[4-6],那么試驗(yàn)設(shè)計(jì)四原則(隨機(jī)、對照、重復(fù)和均衡原則)就為試驗(yàn)研究的具體實(shí)施制訂了“規(guī)則”。事實(shí)上,若把一個“試驗(yàn)研究項(xiàng)目”比作一只正在海上航行的“大船”,由試驗(yàn)設(shè)計(jì)四原則所形成的這種“規(guī)則”以多視角、多方位、多途徑為其“導(dǎo)航”和“護(hù)航”,使其順利并成功地到達(dá)目的地(對試驗(yàn)研究項(xiàng)目而言,就是不僅實(shí)現(xiàn)了事先擬定的研究目的,而且,得到的結(jié)果和結(jié)論經(jīng)得起時間和實(shí)踐的檢驗(yàn))。因篇幅所限,本文只討論與“隨機(jī)原則”有關(guān)的內(nèi)容。
1.2隨機(jī)與隨機(jī)原則的概念
何為隨機(jī)?就是在從總體中選取樣品(或個體,下同)時,應(yīng)確??傮w中任何一個樣品都有同等的機(jī)會被抽取進(jìn)入樣本;在對樣本中的樣品進(jìn)行分配時,應(yīng)確保樣本中任何一個樣品都有同等的機(jī)會被分入任何一個組(即一個特定的試驗(yàn)條件,通常為某影響因素的一個特定水平或若干個影響因素水平的一種特定組合)中。
何為隨機(jī)原則?就是研究者或?qū)嵤┱咴谶x取樣品或分配樣品時,必須按前述的要求去做,不應(yīng)采取任何修正或曲解的做法。
1.3隨機(jī)原則的作用
隨機(jī)原則的作用是什么?就是在相當(dāng)大的程度上消除操作者或受試者(假如樣品或個體是“人”而不是“物”)人為或心理因素對抽樣或分配的結(jié)果所造成的系統(tǒng)性影響,從而實(shí)現(xiàn)如下兩個目的:其一,使樣本對于總體而言具有極好的代表性(注意:“代表性好壞”還與“樣本含量大小”和“對重要非試驗(yàn)因素的控制程度”等有關(guān));其二,使各對比組中的受試對象在非試驗(yàn)因素方面具有極好的均衡性,提高試驗(yàn)資料(包括原因變量、結(jié)果變量以及它們的取值)在對比組之間的可比性。
2.1需要使用隨機(jī)化的環(huán)節(jié)
2.1.1從特定的總體中抽取樣本——抽樣隨機(jī)
研究者首先需要根據(jù)研究目的確定具有同質(zhì)性的受試對象的全體,他們被稱為“總體”。在這個特定總體中的每一個受試對象能夠被抽取參加試驗(yàn)的機(jī)會應(yīng)相等,即總體中每個個體都有相同的機(jī)會被抽取進(jìn)入樣本之中。
2.1.2將已獲得的樣本進(jìn)行分組——分組隨機(jī)
當(dāng)研究者已獲得了符合要求的全部受試對象(常被稱為樣本,即被抽取的全部樣品或個體)且需要將他們按某種規(guī)則或比例分配到不同的對比組中時,必須使每個受試對象被分配到不同組(通常為對照組、不同處理組)中的機(jī)會相同。
值得一提的是,在實(shí)踐中,“抽樣隨機(jī)”多應(yīng)用在“調(diào)查研究(如回顧性研究,橫斷面研究)”中,而“分組隨機(jī)”多應(yīng)用在“臨床試驗(yàn)研究(或前瞻性研究)”中。若在以“動物或樣品”為受試對象的試驗(yàn)研究中,最好在“抽樣隨機(jī)”的基礎(chǔ)上,再進(jìn)行“分組隨機(jī)”。因?yàn)橥ǔG闆r下,在臨床試驗(yàn)研究中,研究者很難獲得足夠多的符合納入標(biāo)準(zhǔn)且不符合排除標(biāo)準(zhǔn)的“被選患者”,也就是說,“被選患者的總體”僅僅是在理論上存在的,而實(shí)際操作時,研究者是無法將其完全確定的;然而,對于動物試驗(yàn)而言,“被選動物的總體”在客觀上也是無法確定的,但若提供試驗(yàn)動物的部門有極其大量的符合條件的動物,可將其視為一個“總體”,再從中進(jìn)行“隨機(jī)抽樣”是可行的。一旦獲得了符合樣本含量要求的全部動物,再對它們實(shí)施“隨機(jī)分組”,也就是水到渠成的事了。
2.1.3決定試驗(yàn)條件與受試對象接受試驗(yàn)的順序——試驗(yàn)隨機(jī)
絕大多數(shù)試驗(yàn)研究,一般都不可能僅在一個受試對象身上僅做一次試驗(yàn)。通常都有較多的試驗(yàn)條件(其數(shù)目往往是多個因素水平的全面組合數(shù)),而每個試驗(yàn)條件下又會有多個受試對象。研究者具體實(shí)施試驗(yàn)時,就存在一個問題:究竟如何確定做試驗(yàn)的順序?這里,顯然有兩個“順序”需要確定下來,才能具體去做試驗(yàn)。其一,如何給試驗(yàn)條件排出一個做試驗(yàn)的順序;其二,在一個特定的試驗(yàn)條件下,如何給多個受試對象排出一個做試驗(yàn)的順序。從統(tǒng)計(jì)學(xué)角度考量,在上述的兩種“順序”上,都應(yīng)采取隨機(jī)化方法確定先后順序。此時的隨機(jī)化,被稱為“試驗(yàn)隨機(jī)”,即對試驗(yàn)的先后順序進(jìn)行隨機(jī)化。
2.2實(shí)現(xiàn)隨機(jī)化的常用方法
實(shí)現(xiàn)隨機(jī)化的方法有多種,可以采用“抽簽”法、查“隨機(jī)數(shù)字表”、查“隨機(jī)排列表”法,或者直接由計(jì)算機(jī)程序來實(shí)現(xiàn)隨機(jī)化。在計(jì)算機(jī)軟件通用的今天,人們幾乎只采用計(jì)算機(jī)程序來直接實(shí)現(xiàn)隨機(jī)化。
3.1常用隨機(jī)抽樣與隨機(jī)分組方法概述
常用隨機(jī)抽樣方法包括單純隨機(jī)抽樣、系統(tǒng)隨機(jī)抽樣、分層隨機(jī)抽樣、整群隨機(jī)抽樣以及多階段隨機(jī)抽樣。常用隨機(jī)分組方法包括完全隨機(jī)、分層隨機(jī)、區(qū)組隨機(jī)、分層區(qū)組隨機(jī)、動態(tài)隨機(jī),它們一般與盲法合用,有助于避免因處理分配的可預(yù)測性,在受試對象的選擇和分組時可能導(dǎo)致的偏倚。
3.2常用隨機(jī)抽樣方法簡介
3.2.1單純隨機(jī)抽樣
又稱簡單隨機(jī)抽樣,它是利用隨機(jī)的方法從總體中抽取部分抽樣單位作為樣本,總體中每個抽樣單位被抽中的概率相等。
單純隨機(jī)抽樣的優(yōu)點(diǎn)是簡便易行,缺點(diǎn)是不適合樣本量很大的研究。樣本量很大時,給每個觀察對象編號的工作量大,有時很難做到;也不適用于那些個體差異很大的研究對象的抽樣,因?yàn)樵谶@種情況下,需要抽取很大的樣本量,樣本對于總體才具有較好的代表性。
3.2.2系統(tǒng)隨機(jī)抽樣
也稱等距抽樣或機(jī)械抽樣,它是按照一定的順序?qū)傮w中各抽樣單位進(jìn)行排序,根據(jù)樣本大小確定抽樣間隔,然后隨機(jī)確定起點(diǎn),按照抽樣間隔抽取每一個單位。它也是在隨機(jī)抽樣的基礎(chǔ)上進(jìn)行的,即要求每次抽樣的起點(diǎn)均必須是隨機(jī)的。
該方法操作方便,若對研究總體排序標(biāo)志有所了解時,可利用某些規(guī)律達(dá)到較好的抽樣效果,故抽樣誤差通常小于單純隨機(jī)抽樣。缺點(diǎn)是當(dāng)總體的觀察單位按順序有周期變化趨勢或單調(diào)遞增(減)趨勢時,容易產(chǎn)生系統(tǒng)誤差,所以該法適用于觀察單位分布較均勻的總體。
3.2.3分層隨機(jī)抽樣
分層隨機(jī)抽樣是先按對觀測指標(biāo)影響較大的某種特征(在試驗(yàn)研究中,被稱為重要非試驗(yàn)因素)將總體分為若干層,再從每一層內(nèi)隨機(jī)抽取一定數(shù)量的抽樣單位組成樣本。分層原則是使層內(nèi)差異盡可能小,層間的差異盡可能大,從而提高調(diào)查的精度。分層抽樣按照各層之間的抽樣比是否相同,可分為等比例抽樣與非等比例抽樣。
分層隨機(jī)抽樣的優(yōu)點(diǎn)是:①調(diào)查的精度比較高,因?yàn)楹侠淼姆謱犹岣吡藢觾?nèi)同質(zhì)性,減少了層內(nèi)的抽樣誤差;②可以對不同的層采用不同的抽樣方法,抽樣方法比較靈活;③還可以對各層進(jìn)行獨(dú)立分析。缺點(diǎn)是:①有時很難找全找準(zhǔn)分層因素;②當(dāng)分層因素很多時,層數(shù)(即全部分層因素水平數(shù)之乘積)就特別多,增加了實(shí)際抽樣時的操作難度。并且過多的分層因素可能會背離隨機(jī)化的初衷和目的。
3.2.4整群隨機(jī)抽樣
又稱集團(tuán)抽樣,它是先將總體分成G個群(組),從中隨機(jī)抽取k個群,然后把抽取的群中的所有觀察單位組成樣本。在實(shí)際調(diào)查中,經(jīng)常用到自然群,如省市、村鎮(zhèn)、企業(yè)、學(xué)校等,要求群間的變異愈小愈好。
整群隨機(jī)抽樣的優(yōu)點(diǎn)是便于組織實(shí)施,由于調(diào)查的觀測單位比較集中,可以大大減少調(diào)查成本,容易控制調(diào)查質(zhì)量。缺點(diǎn)是抽樣誤差一般大于單純隨機(jī)抽樣,為了降低抽樣誤差,應(yīng)該盡量縮小群間的差異,增加總體的群數(shù),同時增加被抽取的群數(shù)以擴(kuò)大樣本量。
【例1】在文獻(xiàn)[7]中,選取受試對象時,有如下的描述:以班級為單位,采用整群取樣的方式選取河南省鄭州市工讀學(xué)校、洛陽市工讀學(xué)校學(xué)生90名為研究組,均為男生,年齡12~16歲,平均年齡(14.12±0.98)歲。按與研究組性別、年齡相對應(yīng)的原則,選取新鄉(xiāng)市第一中學(xué)初中學(xué)生90名為對照組,均為男生,年齡12~16歲,平均年齡(14.27±0.74)歲。
【解說】在上面的“整群隨機(jī)抽樣”實(shí)例中,原文作者似乎未明確交代抽樣的總體是什么。這里應(yīng)有兩個抽樣總體,即“工讀學(xué)校的總體”和“普通中學(xué)的總體”;兩組樣本含量的確定似乎也缺少專業(yè)和統(tǒng)計(jì)學(xué)依據(jù)。
3.2.5多階段隨機(jī)抽樣
又稱多級隨機(jī)抽樣,它是指抽樣過程分為多個階段來進(jìn)行,每個階段可以采取不同的抽樣方法。多階段隨機(jī)抽樣先從總體中抽取一級抽樣單元,再從中抽取范圍較小的二級抽樣單元,然后依次抽取更次級的抽樣單元,直到獲得所需要的樣本含量時抽樣才結(jié)束。
多階段隨機(jī)抽樣的優(yōu)點(diǎn)是組織實(shí)施起來比較方便,尤其是不需要對每一級抽樣單位編制完全的抽樣框(即包含全部抽樣單元的目錄性清單)。缺點(diǎn)是抽樣誤差的估算比較復(fù)雜。
3.3常用隨機(jī)分組方法簡介
3.3.1完全隨機(jī)分組
它是指直接對受試對象進(jìn)行隨機(jī)化分組,在事先或者實(shí)施過程中不作任何限制、干預(yù)或調(diào)整。正因如此,通常情況下,完全隨機(jī)化分組后,各組受試對象的例數(shù)不一定相等。
【例2】在文獻(xiàn)[8]中,選取受試對象時,有如下描述:選自2014年4月-2015年4月于天津市安定醫(yī)院住院治療的老年抑郁癥患者。(此處省略了入組標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn))符合入組排除標(biāo)準(zhǔn)的共88例,其中女性42例,男性46例,平均年齡(64.25±4.21)歲。采用隨機(jī)數(shù)字表法將患者分為研究組(阿戈美拉汀合并認(rèn)知治療)和對照組(單用阿戈美拉汀)。研究組45例,女性22例,男性23例,平均年齡(64.13±4.61)歲,平均病程(2.17±0.85)月;對照組43例,男性22例,女性21例,平均年齡(64.42±4.47)歲,平均病程(2.22±0.73)月。
【解說】在上面的實(shí)例中,原文作者采用“完全隨機(jī)分組”方法將88例受試對象隨機(jī)地分入研究組與對照組。分組的結(jié)果令人十分欣慰:兩組之間在男女人數(shù)構(gòu)成、平均年齡、平均病程三個重要的非試驗(yàn)因素方面分別基本相同。然而,由基本常識和統(tǒng)計(jì)學(xué)知識可知,在如此小樣本含量的情況下,僅采取完全隨機(jī)分組方法獲得如此“齊同”的分組結(jié)果的概率可能不大。值得一提的是,在例2中,“符合入組排除標(biāo)準(zhǔn)”的表述不夠妥當(dāng),貼切的表述應(yīng)為:“符合入組標(biāo)準(zhǔn)且不符合排除標(biāo)準(zhǔn)”。
3.3.2分層隨機(jī)分組
它是指在隨機(jī)化過程中,首先依據(jù)可能影響試驗(yàn)過程和結(jié)果的重要非試驗(yàn)因素(如年齡、性別、病情、疾病分期等)對受試對象進(jìn)行分層,然后在每一層內(nèi)進(jìn)行完全隨機(jī)化分組,即把每一層中的受試對象完全隨機(jī)地均分入試驗(yàn)組和對照組中。分層的目的是使某些對結(jié)果影響較大的非試驗(yàn)因素在各組(對照組與試驗(yàn)組)中的影響盡可能相等。分層因素的選擇要根據(jù)不同疾病、從專業(yè)的角度加以確定。分層時需要注意,分層因素的數(shù)量和分級不宜太多,否則組合數(shù)太多,收集患者有一定困難。
3.3.3區(qū)組隨機(jī)分組
它也被稱為均衡隨機(jī)化或限制性隨機(jī)化分組,它是根據(jù)研究對象進(jìn)入試驗(yàn)的時間順序,將全部受試對象分為例數(shù)相同的若干區(qū)組,每一區(qū)組內(nèi)的受試對象被隨機(jī)分配到各對比組。這種隨機(jī)化方法比較適合臨床科研中入選患者分散就診的特點(diǎn),可以確保整個試驗(yàn)期間各階段的受試對象進(jìn)入每一組的對象數(shù)基本相等,同一區(qū)組中各組患者數(shù)相等,區(qū)組大小(長度)是處理數(shù)的倍數(shù),通常為2~3倍。
說明:上述提及的“區(qū)組”在本質(zhì)上就是“時間段”。例如,若某臨床試驗(yàn)擬在某年1月-6月開展,假如以每個月為一個時間段,區(qū)組隨機(jī)分組就意味著從1月-6月,應(yīng)將每個月份入組的受試對象隨機(jī)均分入試驗(yàn)組與對照組中。然而,這在實(shí)踐中是很困難的,因?yàn)檠芯空呤孪炔⒉荒軠?zhǔn)確知道每個月會入組多少例受試對象。最簡單且具有可操作性的做法是:將相鄰時間段上入組的受試對象每4例或6例或8例形成一個“區(qū)組”,再將每個區(qū)組中的全部受試對象隨機(jī)均分入對比組中。前面提及的“4例或6例或8例”被稱為“區(qū)組長度”。顯然,若對比組為3,則區(qū)組長度一般應(yīng)設(shè)為“6例或9例或12例”。
3.3.4分層區(qū)組隨機(jī)分組
它是按照事先確定的分層因素即重要的非試驗(yàn)因素劃分形成層,在層內(nèi)設(shè)置區(qū)組,隨后根據(jù)受試對象的分層因素將其分入?yún)^(qū)組,在區(qū)組內(nèi)隨機(jī)分配,保證每個對比組的受試對象數(shù)相同且入組受試對象的分層因素特征盡可能相近。在多中心臨床試驗(yàn)研究中,目前普遍推薦使用該方法,以臨床試驗(yàn)中心為分層因素,以時間段為區(qū)組因素。
3.3.5動態(tài)隨機(jī)分組
在臨床上,有一種簡便易行的隨機(jī)分組方法叫“按不平衡指數(shù)最小的分配原則”分組。根據(jù)專業(yè)知識選取幾個必須加以控制的重要非試驗(yàn)因素,假定一個是患者的“性別(分為男性、女性)”,另一個是患者的“病情(分為輕度、中度、重度)”。將先來的兩位患者在試驗(yàn)組與對照組各放一人,記錄他們的性別和病情,記分的方法是每個因素的每個水平出現(xiàn)一次記1分,計(jì)算兩組各因素對應(yīng)水平得分之差的絕對值,最后求出絕對值之總和,稱此“和”為兩組患者在兩個重要非試驗(yàn)因素上的不平衡指數(shù)。若再來第三位患者,分別依次將此患者放入試驗(yàn)組、對照組各一次,每次都根據(jù)他(或她)的性別、病情累加到原有患者的得分基礎(chǔ)之上,可以得到兩個不平衡指數(shù),取不平衡指數(shù)最小的那種分組方法,這樣第三位患者的分組就定下來了。用同樣的方法去分配以后來的該病患者,直到兩組達(dá)到事先規(guī)定的樣本含量時就停止。
【例3】在文獻(xiàn)[9]中,選取受試對象時,有如下的描述:對象為2013年7月-2015年2月在成都市第四人民醫(yī)院住院的精神分裂癥患者。(此處省略了入組標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn))共入組19例,其中服用阿立哌唑單藥治療者9例,服用利培酮單藥治療者10例,兩組年齡、性別、受教育年限、病程、PANSS評分在最大程度上進(jìn)行了匹配。
【解說】以上的描述給讀者的感覺是:原文作者似乎采用了“動態(tài)隨機(jī)分組”方法,控制的重要非試驗(yàn)因素有“年齡、性別、受教育年限、病程、PANSS評分”。然而,從上述的簡單描述中,很難使讀者相信原文作者究竟是怎樣實(shí)施隨機(jī)化的。另外,兩組樣本含量明顯不足,并且樣本含量的確定也缺乏依據(jù)。
說明:因篇幅所限,以上所講的各種隨機(jī)化方法的實(shí)現(xiàn),將在后續(xù)的專題中專門介紹,此處從略。
4.1按“先來后到”的順序進(jìn)行“偽隨機(jī)”
在臨床試驗(yàn)研究中,人們常習(xí)慣將患者分為試驗(yàn)組與對照組。有些研究者是這樣分組的:將先來就診的若干例患者分入試驗(yàn)組,后來就診的若干例患者分入對照組。顯然,這種“偽隨機(jī)”的做法是不正確的。因?yàn)榛颊邅磲t(yī)院就診,在患病嚴(yán)重程度、患病時間等重要的非試驗(yàn)因素方面不一定是均衡的,可能帶有某種程度上的“聚集性”,即某一段時間來的患者多數(shù)為重病患者,另一段時間來的多數(shù)為輕病患者。
若規(guī)定第一個來就診者分入試驗(yàn)組,第二個來就診者分入對照組,以此類推,這樣交叉進(jìn)行分組,其隨機(jī)化的效果是否一定很好?在通常情況下,隨機(jī)化效果不會太差,但萬一由于某種特殊的原因,導(dǎo)致患者在某些重要非試驗(yàn)因素的取值上正好是按相同的“間隔”取接近相同的數(shù)值,此時,進(jìn)入兩組的受試對象可能在重要非試驗(yàn)因素方面就差別很大了。這種交叉分組的方法,也屬于“偽隨機(jī)”方法,不可取。
4.2采用“隨便”取代“隨機(jī)”
【例4】某研究者閉著眼睛從裝有很多小鼠的籠子里隨意地抓小鼠。將先抓到的10只小鼠分到安慰劑組,將第二批抓到的10只小鼠分到甲藥組,將最后抓到的10只小鼠分到乙藥組,這樣做科學(xué)嗎?
【解說】嚴(yán)格地說是不科學(xué)的!這實(shí)際上是誤認(rèn)為“隨便”就是“隨機(jī)”。事實(shí)上,即使閉著眼睛盲目地抓小鼠,相對來說,先被抓到的小鼠活動能力和健康等狀況較差,而后被抓到的小鼠狀況可能相反。這樣一來,3個組之間除了藥物不同以外,受試對象的個體差異仍相差懸殊,若試驗(yàn)結(jié)果間有差別,就沒有充分的理由認(rèn)為是因?yàn)樗鼈兎昧瞬煌乃幬锼鸬?。這就是說,在進(jìn)行試驗(yàn)分組時必須采取“隨機(jī)化”措施,以消除“重要的非試驗(yàn)因素”對觀察結(jié)果的干擾和影響。
4.3過分迷信完全隨機(jī)化的效果
有人認(rèn)為:完全隨機(jī)化分組,效果總是最好的。事實(shí)上,這樣的認(rèn)識有時是不正確的。完全隨機(jī)化分組的效果好壞,關(guān)鍵取決于樣本含量的大小。若樣本含量很大,完全隨機(jī)化的效果應(yīng)當(dāng)是比較理想的;若被隨機(jī)化的樣本含量比較小,則完全隨機(jī)化產(chǎn)生的各組受試對象之間在很多重要的非試驗(yàn)因素方面可能參差不齊。此時,采取分層隨機(jī)化法效果會更好一些。即先按某些重要的非試驗(yàn)因素(取決于他們是否對觀測指標(biāo)有較大影響)將受試對象分組,然后對每個小組(在所考慮的重要非試驗(yàn)因素上條件一致)中的受試對象進(jìn)行完全隨機(jī)化,使他們被均分到各對比組中,這樣才能確保各對比組中的受試對象之間在所考慮的重要非試驗(yàn)因素方面保持均衡一致。
【例5】假定有48例某病患者,其中32例為女性,16例為男性。若采用完全隨機(jī)化方式將他們均分成兩組,則有可能某一組中的24例全是女性患者,另一組中有8例女性和16例男性患者。如果真出現(xiàn)這樣的分組結(jié)果,當(dāng)患者性別對觀測結(jié)果又有較大影響時,“性別”這個重要的非試驗(yàn)因素就嚴(yán)重地影響了試驗(yàn)因素兩個水平(處理組與對照組)對觀測結(jié)果效應(yīng)大小的正確評價(jià),甚至易得出歪曲事實(shí)的結(jié)論。
【解說】此時,宜采用“分層隨機(jī)化”。就本例而言,先用完全隨機(jī)化法將32例女性患者隨機(jī)均分成兩組,試驗(yàn)組和對照組各16例女性患者;再用完全隨機(jī)化法將16例男性患者隨機(jī)均分成兩組,試驗(yàn)組和對照組各8例男性患者。這樣,試驗(yàn)組和對照組都各有24例患者,其中女性與男性患者分別為16例與8例,即“性別”這個重要的非試驗(yàn)因素在試驗(yàn)組和對照組中所施加的影響是均衡的,即兩組中女性與男性患者例數(shù)的比例都是2:1。
4.4違背隨機(jī)原則導(dǎo)致對比組之間在重要非試驗(yàn)因素方面不均衡的其他案例
【例6】某醫(yī)生將兩種解救方案用于治療急性淋巴細(xì)胞白血病患兒,一種方案為總劑量3g/m2大劑量甲氨蝶呤(HDMTX)在12 h靜脈滴注完畢,施藥36 h后進(jìn)行四氫葉酸鈣(CF)解救(簡稱方案Ⅰ);另一種方案為在24 h靜滴完畢,施藥36 h后進(jìn)行CF解救(簡稱方案Ⅱ)。比較血液及腦脊液中的藥物濃度。選擇的研究對象是1998年5月-1999年2月住院的急性淋巴細(xì)胞白血病患兒17例,平均7.4歲,男生11例,女生6例。在17例患兒中,13例患兒第一療程接受方案Ⅰ,以后再在連續(xù)進(jìn)行的兩個療程中均接受方案Ⅱ,計(jì)26例次,另4例患兒只接受方案Ⅱ1次。進(jìn)行數(shù)據(jù)分析時,將所有接受方案Ⅰ的患兒(n=13)的藥物濃度與所有接受方案Ⅱ(n=26+4)的患兒的藥物濃度進(jìn)行比較。
【解說】從上面可以看出,原作者在進(jìn)行試驗(yàn)分組時具有很大的隨意性,13例患兒既接受了方案Ⅰ的治療,又接受了兩個療程的方案Ⅱ的治療,沒有考慮經(jīng)過兩個不同方案治療對觀察指標(biāo)可能帶來的影響,且13例患兒兩個療程方案Ⅱ所測得的26個數(shù)據(jù)被錯誤地看成取自26個獨(dú)立的個體,又與其他只參加方案Ⅱ治療的4例患兒的數(shù)據(jù)組成一組進(jìn)行計(jì)算。接受方案Ⅰ治療的患兒的數(shù)據(jù)來自第一療程,而接受方案Ⅱ治療的患兒的數(shù)據(jù)大部分來自第二療程[即有(13+4)例次]和第三療程(即有13例次),可比性較差。重復(fù)測自13個患兒的26個試驗(yàn)數(shù)據(jù)被看成測自26個患兒的獨(dú)立數(shù)據(jù),顯然不妥。
針對此項(xiàng)臨床試驗(yàn)研究,可考慮采用交叉設(shè)計(jì),一個試驗(yàn)因素是治療方案,另外兩個重要的非試驗(yàn)因素分別是受試對象和測定順序。每人在兩個療程中各用不同的方案一次,條件最接近的每兩人配成一對,用隨機(jī)的方法確定每對中之一接受方案Ⅰ、Ⅱ的順序(可通過統(tǒng)計(jì)程序產(chǎn)生),另一人的順序相反。這樣可以盡可能消除人為因素的影響,精確地控制誤差,分析出各因素的效應(yīng),得到較為可信的結(jié)果。
【例7】某醫(yī)院2001年1月-2005年12月在關(guān)節(jié)鏡引導(dǎo)下應(yīng)用GSH釘治療股骨遠(yuǎn)端骨折49例,與同期切開復(fù)位GSH釘固定的32例比較,取得滿意療效。該81例股骨遠(yuǎn)端骨折患者根據(jù)入院順序分組,分別采用切開復(fù)位GSH釘固定和關(guān)節(jié)鏡引導(dǎo)下GSH釘治療。
【解說】資料中按照入院順序進(jìn)行分組,不能保證分組的效果,因?yàn)榛颊邅磲t(yī)院就診時在患病嚴(yán)重程度、患病時間等重要的非試驗(yàn)因素方面不一定是均衡的,可能帶有某種程度上的“聚集性”,即某一段時間來的患者多數(shù)為重病患者,另一段時間來的多數(shù)為輕病患者;若規(guī)定第一個就診者分入試驗(yàn)組,第二個就診者分入對照組,這樣交叉進(jìn)行分組,最后也可能兩組患者在某些重要非試驗(yàn)因素方面相差懸殊,組間缺乏均衡性。正確的方法是用“按不平衡指數(shù)最小的分配原則”進(jìn)行分組。
[1]胡良平.科研設(shè)計(jì)與統(tǒng)計(jì)分析[M].北京: 軍事醫(yī)學(xué)科學(xué)出版社,2012:129-276.
[2]胡良平. 精神衛(wèi)生科研設(shè)計(jì)之要義(述評)[J].四川精神衛(wèi)生,2016,29(3): 193-196.
[3]胡良平.課題試驗(yàn)設(shè)計(jì)與數(shù)據(jù)分析——關(guān)鍵技術(shù)與標(biāo)準(zhǔn)模板[M]. 北京: 軍事醫(yī)學(xué)科學(xué)出版社,2014:1-136.
[4]郭春雪,胡良平. 正確把握精神衛(wèi)生臨床試驗(yàn)設(shè)計(jì)三要素的要領(lǐng)(I)——受試對象[J].四川精神衛(wèi)生,2016,29(3):197-201.
[5]胡完,胡良平. 正確把握精神衛(wèi)生臨床試驗(yàn)設(shè)計(jì)三要素的要領(lǐng)(II)——影響因素[J].四川精神衛(wèi)生,2016,29(3):202-206.
[6]谷恒明,胡良平. 正確把握精神衛(wèi)生臨床試驗(yàn)設(shè)計(jì)三要素的要領(lǐng)(III)——觀測指標(biāo)[J].四川精神衛(wèi)生,2016,29(3):207-210.
[7]李青青,王赟,羅艷艷,等. 工讀男生與普通男生攻擊性行為的對照研究[J]. 四川精神衛(wèi)生,2015,28(2):103-105.
[8]安旭光,左津淮. 阿戈美拉汀合并認(rèn)知治療對老年抑郁癥患者的效果[J]. 四川精神衛(wèi)生,2016, 29(2): 137-139.
[9]常鑫,羅程,侯昌月,等.阿立哌唑和利培酮對精神分裂癥患者自發(fā)腦活動的不同影響[J]. 四川精神衛(wèi)生,2015,28(6):492-495.
[10] 胡良平,李子建. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)基礎(chǔ)與典型錯誤辨析[M].北京: 軍事醫(yī)學(xué)科學(xué)出版社,2003:242-259.
[11] 胡良平,王素珍,郭晉.內(nèi)科科研統(tǒng)計(jì)設(shè)計(jì)與數(shù)據(jù)分析[M].北京: 電子工業(yè)出版社,2015:87-162.
(本文編輯:吳俊林)
How to strictly abide by four principles of an experimental design in the discipline of mental health study:the “random principle”
YANGMeng-yuan1,HULiang-ping1,2*
(1.ConsultingCentreofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HULiang-ping,E-mail:lphu812@sina.com)
To interpret how to catch the significance and key points accurately in clinical trial design of mental health. Based on the characteristics of research in mental health, we try to start from the basic common sense and seek the right method to strictly abide by the random principle. We can obtain the following results through specific analysis in combination with the features and examples. First, choose appropriate methods of randomization. Second, implement randomization correctly and conveniently. Finally, avoid the practice which violates randomization. Facing the problem how to abide by the random principle, an important link to improve the quality of clinical trial study is to follow the above three aspects. Through this method we can hold the essential of the problem.
Mental health; Clinical trial design; Randomization principle; Stratified randomization; Dynamic randomization
R195.1
A
10.11886/j.issn.1007-3256.2016.04.001
2016-07-26)