劉 丹,周吉銀
(陸軍軍醫(yī)大學(xué)第二附屬醫(yī)院國(guó)家藥物臨床試驗(yàn)機(jī)構(gòu),重慶 400037,fairyfair@126.com)
樣本量估算是指為滿(mǎn)足統(tǒng)計(jì)的準(zhǔn)確性和可靠性(I類(lèi)錯(cuò)誤的控制和檢驗(yàn)效能的保證)計(jì)算出所需的樣本量[1]。在設(shè)計(jì)臨床科研項(xiàng)目時(shí),研究者最關(guān)注也最困難的就是樣本量的估算。樣本量估算是臨床研究設(shè)計(jì)中一個(gè)極為重要的環(huán)節(jié),直接關(guān)系到研究結(jié)論的可靠性、可重復(fù)性及研究效率的高低,對(duì)整個(gè)研究的科學(xué)性、倫理性和研究投入都帶來(lái)重大影響。
人用藥品注冊(cè)技術(shù)要求國(guó)際協(xié)調(diào)會(huì)(International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)E9(1998)指出,臨床研究的樣本量必須足夠大,以可靠地回答研究假設(shè)所提出的相關(guān)問(wèn)題;同時(shí)又不至于太大而造成浪費(fèi)[1]。理論上講,樣本量越小,所需經(jīng)費(fèi)越少,實(shí)際操作也越簡(jiǎn)單;但樣本量太小,研究結(jié)果的可重復(fù)性和代表性較差,檢驗(yàn)效能低下,導(dǎo)致不能發(fā)現(xiàn)原本存在的真實(shí)差異,容易得出假陰性或假陽(yáng)性的結(jié)論。樣本量越大,則所需經(jīng)費(fèi)和資源越多,受試者入組時(shí)間越長(zhǎng),研究實(shí)施的難度就越大。樣本量過(guò)大雖說(shuō)可壓縮可信區(qū)間,但不利于研究的質(zhì)量控制。因此,樣本量的大小和研究成本之間存在不可調(diào)和的矛盾。樣本量大小的確定至關(guān)重要,既保證了有足夠的研究樣本驗(yàn)證研究目的,也避免了使過(guò)多的受試者在非必要的情況下暴露于研究風(fēng)險(xiǎn),從而使研究設(shè)計(jì)更符合科學(xué)性和倫理學(xué)原則[2]?,F(xiàn)代循證醫(yī)學(xué)和臨床科學(xué)研究基于有代表性的病例抽樣和合適的樣本量才能得以有效實(shí)施,由樣本信息推斷總體特征。所以,合理正確地估算樣本量,既可減少人力、物力、財(cái)力和時(shí)間的浪費(fèi),也可減少對(duì)受試者造成的潛在傷害,確保研究結(jié)果真實(shí)可靠[3]。但無(wú)論通過(guò)哪種方法估算樣本量,所得到的計(jì)算結(jié)果都只是一個(gè)近似值。
在臨床研究中,樣本量的估算要根據(jù)研究目的、設(shè)計(jì)方法、假設(shè)檢驗(yàn)類(lèi)型、主要評(píng)價(jià)指標(biāo)等選擇合理的統(tǒng)計(jì)學(xué)公式進(jìn)行計(jì)算。除此之外,還應(yīng)考慮結(jié)局指標(biāo)是屬于計(jì)量指標(biāo)還是計(jì)數(shù)指標(biāo),因?yàn)檫@也會(huì)影響樣本量的估算[4]。統(tǒng)計(jì)方法的適用條件能否滿(mǎn)足,很多情況下和樣本量大小相關(guān)。小樣本時(shí),需要仔細(xì)考慮數(shù)據(jù)的分布;大樣本時(shí),通??梢圆捎谜龖B(tài)近似的方法。
統(tǒng)計(jì)學(xué)的樣本量估算是基于針對(duì)相關(guān)變量的前期信息計(jì)算完成的,它不是憑空產(chǎn)生,而是以針對(duì)分析變量的信息積累為基礎(chǔ)完成的。研究者往往可通過(guò)預(yù)試驗(yàn)研究、文獻(xiàn)回顧并結(jié)合專(zhuān)業(yè)知識(shí)對(duì)分析變量做出判斷和預(yù)設(shè)[5]。對(duì)于確證性研究,由于已具備了充分的臨床基礎(chǔ),需要基于前期研究結(jié)果完成嚴(yán)謹(jǐn)?shù)臉颖玖抗浪?。?duì)于預(yù)試驗(yàn)研究和探索性研究,因缺少臨床信息,研究者對(duì)分析變量的特征知之不多,則無(wú)法通過(guò)統(tǒng)計(jì)學(xué)方法確定樣本量,這種情況可以不做樣本量估計(jì),但需要說(shuō)明理由。此類(lèi)研究通常以小規(guī)模研究開(kāi)始臨床效能探索,以避免將受試者過(guò)度暴露于研究風(fēng)險(xiǎn)之中[2],也為更大規(guī)模的臨床研究提供科學(xué)依據(jù)。
在臨床研究方案中,需要對(duì)樣本量估計(jì)進(jìn)行清晰和完整的闡述,應(yīng)至少包含以下內(nèi)容:研究假設(shè)、對(duì)照類(lèi)型、比較類(lèi)型、設(shè)計(jì)模型、主要指標(biāo)、統(tǒng)計(jì)分析方法、參數(shù)來(lái)源及依據(jù)、樣本量估計(jì)方法及其出處、所用軟件及其版本、樣本量調(diào)整及其依據(jù)、各組以及各中心的樣本量分配,若競(jìng)爭(zhēng)入組需特別說(shuō)明[1]。需要注意的是,并非每一項(xiàng)對(duì)照研究都要對(duì)所有擬納入的受試者進(jìn)行干預(yù),只要兩種方法對(duì)主要結(jié)局指標(biāo)造成的差異達(dá)到了預(yù)先確定的檢驗(yàn)水準(zhǔn)(通常P<0.05),就可提前結(jié)束研究,避免不必要的浪費(fèi)[6]。
根據(jù)統(tǒng)計(jì)學(xué)方法估計(jì)出的樣本量是在給定條件下滿(mǎn)足臨床研究所需的最小樣本量。實(shí)際研究過(guò)程中,由于受試者依從性差、失訪等原因?qū)е虏±拿撀浜吞蕹?,?huì)導(dǎo)致可評(píng)價(jià)例數(shù)的減少。因此,需要在樣本量估計(jì)基礎(chǔ)上適度擴(kuò)大樣本量,以保證最終的有效樣本量可以滿(mǎn)足最小樣本量的要求。從分析角度而言,需保證最終的可評(píng)價(jià)樣本量應(yīng)大于經(jīng)樣本量估計(jì)方法求得的樣本量。樣本量調(diào)整通常會(huì)考慮不大于20%的脫落率,具體的脫落率如何確定,將根據(jù)不同研究項(xiàng)目而定,確定的依據(jù)主要來(lái)自專(zhuān)業(yè)方面的判斷,或著重參考以往研究數(shù)據(jù)的Meta分析結(jié)果[1]。
一方面,臨床研究中采用的設(shè)計(jì)方案種類(lèi)較多,而每一種方案中樣本量估算幾乎都有各自的計(jì)算方法。同時(shí),樣本量估算均要依據(jù)一定的計(jì)算公式以及滿(mǎn)足公式的一定條件,計(jì)算起來(lái)較為復(fù)雜。對(duì)于大部分研究者而言,樣本量估算是一個(gè)難題;另一方面,由于每項(xiàng)科研項(xiàng)目的經(jīng)費(fèi)來(lái)源不同,在樣本量估算方面的投入也不一樣。一般國(guó)家級(jí)、省部級(jí)和市級(jí)的臨床科研項(xiàng)目,會(huì)邀請(qǐng)專(zhuān)業(yè)的統(tǒng)計(jì)學(xué)專(zhuān)家參與臨床研究的設(shè)計(jì),和研究者一起對(duì)樣本量進(jìn)行準(zhǔn)確合理的估算。由研究者發(fā)起的大多數(shù)自選臨床科研項(xiàng)目,由于沒(méi)有足夠的人力、物力和財(cái)力支持,研究者僅憑個(gè)人經(jīng)驗(yàn)和主觀感受估算樣本量。甚至直接使用參考文獻(xiàn)的公式和數(shù)據(jù),并非根據(jù)公式獲得樣本量,必將嚴(yán)重影響研究結(jié)果的真實(shí)可靠性,違背了臨床研究的科學(xué)性和倫理性。一項(xiàng)調(diào)查結(jié)果顯示[7],目前國(guó)內(nèi)臨床研究論文的方法部分存在問(wèn)題最多的就是樣本量估算的隨意性。絕大部分論文直接陳述觀察組和對(duì)照組的病例數(shù),病例確定過(guò)程、樣本量估算依據(jù)普遍缺失,也缺乏文獻(xiàn)支撐和預(yù)試驗(yàn)探索?!读~刀》《美國(guó)醫(yī)學(xué)學(xué)會(huì)雜志》《新英格蘭醫(yī)學(xué)雜志》等國(guó)際頂級(jí)醫(yī)學(xué)期刊,除了個(gè)別病例報(bào)道未對(duì)樣本量估算進(jìn)行描述,其他無(wú)論是前瞻性還是回顧性臨床研究論文,均有對(duì)樣本量估算過(guò)程的描述。
樣本量估算應(yīng)該在臨床研究設(shè)計(jì)時(shí)或預(yù)試驗(yàn)結(jié)束時(shí)就已經(jīng)完成,并作為研究方案不可或缺的一部分。一些初次接觸臨床科研項(xiàng)目的研究者統(tǒng)計(jì)學(xué)基礎(chǔ)較差,缺乏統(tǒng)計(jì)學(xué)相關(guān)的背景知識(shí),對(duì)樣本量估算的實(shí)際意義了解不深入,也沒(méi)有意識(shí)到樣本量估算的重要性,不理解為什么要進(jìn)行樣本量的估算、依據(jù)哪些條件進(jìn)行樣本量的估算、估算時(shí)有哪些注意事項(xiàng)、如何選擇相應(yīng)的統(tǒng)計(jì)公式及如何進(jìn)行較為復(fù)雜的計(jì)算[8]。在臨床研究目的明確之后也未邀請(qǐng)統(tǒng)計(jì)學(xué)專(zhuān)家參與臨床研究的設(shè)計(jì),因此,在其遞交給倫理委員會(huì)的臨床研究方案設(shè)計(jì)中常存在樣本量來(lái)源不明確,內(nèi)容闡述簡(jiǎn)單又粗糙,沒(méi)有詳細(xì)的樣本量估算過(guò)程,參考其他文獻(xiàn)直接給出一個(gè)樣本量的具體數(shù)值,甚至不考慮研究目的隨意制定樣本量[9]。不少研究者對(duì)樣本量估算的認(rèn)識(shí)存在一個(gè)誤區(qū),認(rèn)為可直接套用公式計(jì)算。但樣本量的估算需要有統(tǒng)計(jì)學(xué)和臨床流行病學(xué)的基礎(chǔ)知識(shí)作為前期的鋪墊,同時(shí)還要考慮諸多實(shí)際因素的影響。即先得出一個(gè)理論值,再根據(jù)實(shí)際情況確定最終納入研究的樣本量。
為提高臨床科研項(xiàng)目倫理審查質(zhì)量,可從以下幾方面解決樣本量不合理的難題:第一,醫(yī)學(xué)院校、臨床研究機(jī)構(gòu)等應(yīng)加強(qiáng)對(duì)研究者科研能力的培養(yǎng),定期開(kāi)展臨床研究方案設(shè)計(jì)的培訓(xùn),包括樣本量估算的培訓(xùn),著重介紹流行病學(xué)研究的樣本量計(jì)算、統(tǒng)計(jì)學(xué)計(jì)算公式、應(yīng)用軟件、線上計(jì)算工具、公眾號(hào)等,以便研究者培訓(xùn)后使用。第二,研究者應(yīng)不斷學(xué)習(xí)、積累和掌握相關(guān)統(tǒng)計(jì)知識(shí),增強(qiáng)對(duì)樣本量估算重要性的意識(shí),也應(yīng)該養(yǎng)成自主學(xué)習(xí)的習(xí)慣,提高獨(dú)立科研的素質(zhì),將統(tǒng)計(jì)學(xué)知識(shí)融入臨床研究,從而提高臨床研究方案的設(shè)計(jì)和臨床研究質(zhì)量。第三,醫(yī)學(xué)倫理委員會(huì)辦公室人員在對(duì)倫理資料形式審查時(shí),提醒研究者樣本量估算常存在的問(wèn)題,對(duì)于無(wú)樣本量估算公式而直接給出樣本量的,建議研究者向統(tǒng)計(jì)學(xué)專(zhuān)家咨詢(xún),并采用正確公式計(jì)算樣本量。同時(shí),應(yīng)將樣本量估算作為主審委員工作表的一個(gè)審查要素。第四,應(yīng)培訓(xùn)醫(yī)學(xué)倫理委員會(huì)委員審查臨床科研項(xiàng)目時(shí),也要審查研究方案中的樣本量計(jì)算以及知情同意書(shū)應(yīng)涉及的樣本量告知內(nèi)容[10]。第五,建議醫(yī)學(xué)倫理委員會(huì)將統(tǒng)計(jì)學(xué)專(zhuān)家納為委員或獨(dú)立顧問(wèn),切實(shí)審查臨床科研項(xiàng)目的樣本量估算問(wèn)題。循證醫(yī)學(xué)的快速發(fā)展證明了以科學(xué)、嚴(yán)謹(jǐn)、規(guī)范的科研設(shè)計(jì)為基礎(chǔ)并正確運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)才是高質(zhì)量論文產(chǎn)出的有效保證[5]。
臨床科研項(xiàng)目的樣本量估算至關(guān)重要,但沒(méi)有固定正確的答案和方法,最關(guān)鍵的不在于如何計(jì)算,而是要確定采用哪一種公式來(lái)計(jì)算,這需要研究者和/或統(tǒng)計(jì)學(xué)專(zhuān)家通過(guò)判斷實(shí)際情況,結(jié)合研究目的、研究類(lèi)型、假設(shè)檢驗(yàn)等綜合考慮。選擇適合研究項(xiàng)目的樣本量估算方法,能保證足夠的檢驗(yàn)效能,減少受試者暴露于潛在的風(fēng)險(xiǎn)和盡可能減少資源浪費(fèi)。應(yīng)將樣本量估算作為主審委員工作表的一個(gè)審查要素,并通過(guò)倫理辦公室工作人員提醒研究者樣本量估算存在的常見(jiàn)問(wèn)題,同時(shí)建議將統(tǒng)計(jì)學(xué)專(zhuān)家納為委員或獨(dú)立顧問(wèn),更好地審查臨床研究項(xiàng)目涉及的樣本量問(wèn)題。