臨床科研項(xiàng)目樣本量的要求*

2019-01-16 11:42:39周吉銀

中國(guó)醫(yī)學(xué)倫理學(xué) 2019年6期

劉丹，周吉銀

(陸軍軍醫(yī)大學(xué)第二附屬醫(yī)院國(guó)家藥物臨床試驗(yàn)機(jī)構(gòu)，重慶 400037，fairyfair@126.com)

樣本量估算是指為滿(mǎn)足統(tǒng)計(jì)的準(zhǔn)確性和可靠性(I類(lèi)錯(cuò)誤的控制和檢驗(yàn)效能的保證)計(jì)算出所需的樣本量[1]。在設(shè)計(jì)臨床科研項(xiàng)目時(shí)，研究者最關(guān)注也最困難的就是樣本量的估算。樣本量估算是臨床研究設(shè)計(jì)中一個(gè)極為重要的環(huán)節(jié)，直接關(guān)系到研究結(jié)論的可靠性、可重復(fù)性及研究效率的高低，對(duì)整個(gè)研究的科學(xué)性、倫理性和研究投入都帶來(lái)重大影響。

人用藥品注冊(cè)技術(shù)要求國(guó)際協(xié)調(diào)會(huì)(International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use,ICH)E9(1998)指出，臨床研究的樣本量必須足夠大，以可靠地回答研究假設(shè)所提出的相關(guān)問(wèn)題；同時(shí)又不至于太大而造成浪費(fèi)[1]。理論上講，樣本量越小，所需經(jīng)費(fèi)越少，實(shí)際操作也越簡(jiǎn)單；但樣本量太小，研究結(jié)果的可重復(fù)性和代表性較差，檢驗(yàn)效能低下，導(dǎo)致不能發(fā)現(xiàn)原本存在的真實(shí)差異，容易得出假陰性或假陽(yáng)性的結(jié)論。樣本量越大，則所需經(jīng)費(fèi)和資源越多，受試者入組時(shí)間越長(zhǎng)，研究實(shí)施的難度就越大。樣本量過(guò)大雖說(shuō)可壓縮可信區(qū)間，但不利于研究的質(zhì)量控制。因此，樣本量的大小和研究成本之間存在不可調(diào)和的矛盾。樣本量大小的確定至關(guān)重要，既保證了有足夠的研究樣本驗(yàn)證研究目的，也避免了使過(guò)多的受試者在非必要的情況下暴露于研究風(fēng)險(xiǎn)，從而使研究設(shè)計(jì)更符合科學(xué)性和倫理學(xué)原則[2]?，F(xiàn)代循證醫(yī)學(xué)和臨床科學(xué)研究基于有代表性的病例抽樣和合適的樣本量才能得以有效實(shí)施，由樣本信息推斷總體特征。所以，合理正確地估算樣本量，既可減少人力、物力、財(cái)力和時(shí)間的浪費(fèi)，也可減少對(duì)受試者造成的潛在傷害，確保研究結(jié)果真實(shí)可靠[3]。但無(wú)論通過(guò)哪種方法估算樣本量，所得到的計(jì)算結(jié)果都只是一個(gè)近似值。

1 樣本量的估算

1.1 使用正確的估算方法

在臨床研究中，樣本量的估算要根據(jù)研究目的、設(shè)計(jì)方法、假設(shè)檢驗(yàn)類(lèi)型、主要評(píng)價(jià)指標(biāo)等選擇合理的統(tǒng)計(jì)學(xué)公式進(jìn)行計(jì)算。除此之外，還應(yīng)考慮結(jié)局指標(biāo)是屬于計(jì)量指標(biāo)還是計(jì)數(shù)指標(biāo)，因?yàn)檫@也會(huì)影響樣本量的估算[4]。統(tǒng)計(jì)方法的適用條件能否滿(mǎn)足，很多情況下和樣本量大小相關(guān)。小樣本時(shí)，需要仔細(xì)考慮數(shù)據(jù)的分布；大樣本時(shí)，通?？梢圆捎谜龖B(tài)近似的方法。

統(tǒng)計(jì)學(xué)的樣本量估算是基于針對(duì)相關(guān)變量的前期信息計(jì)算完成的，它不是憑空產(chǎn)生，而是以針對(duì)分析變量的信息積累為基礎(chǔ)完成的。研究者往往可通過(guò)預(yù)試驗(yàn)研究、文獻(xiàn)回顧并結(jié)合專(zhuān)業(yè)知識(shí)對(duì)分析變量做出判斷和預(yù)設(shè)[5]。對(duì)于確證性研究，由于已具備了充分的臨床基礎(chǔ)，需要基于前期研究結(jié)果完成嚴(yán)謹(jǐn)?shù)臉颖玖抗浪?。?duì)于預(yù)試驗(yàn)研究和探索性研究，因缺少臨床信息，研究者對(duì)分析變量的特征知之不多，則無(wú)法通過(guò)統(tǒng)計(jì)學(xué)方法確定樣本量，這種情況可以不做樣本量估計(jì)，但需要說(shuō)明理由。此類(lèi)研究通常以小規(guī)模研究開(kāi)始臨床效能探索，以避免將受試者過(guò)度暴露于研究風(fēng)險(xiǎn)之中[2]，也為更大規(guī)模的臨床研究提供科學(xué)依據(jù)。

1.2 詳細(xì)闡述估算依據(jù)

在臨床研究方案中，需要對(duì)樣本量估計(jì)進(jìn)行清晰和完整的闡述，應(yīng)至少包含以下內(nèi)容：研究假設(shè)、對(duì)照類(lèi)型、比較類(lèi)型、設(shè)計(jì)模型、主要指標(biāo)、統(tǒng)計(jì)分析方法、參數(shù)來(lái)源及依據(jù)、樣本量估計(jì)方法及其出處、所用軟件及其版本、樣本量調(diào)整及其依據(jù)、各組以及各中心的樣本量分配，若競(jìng)爭(zhēng)入組需特別說(shuō)明[1]。需要注意的是，并非每一項(xiàng)對(duì)照研究都要對(duì)所有擬納入的受試者進(jìn)行干預(yù)，只要兩種方法對(duì)主要結(jié)局指標(biāo)造成的差異達(dá)到了預(yù)先確定的檢驗(yàn)水準(zhǔn)(通常P<0.05)，就可提前結(jié)束研究，避免不必要的浪費(fèi)[6]。

1.3 應(yīng)考慮脫落率

根據(jù)統(tǒng)計(jì)學(xué)方法估計(jì)出的樣本量是在給定條件下滿(mǎn)足臨床研究所需的最小樣本量。實(shí)際研究過(guò)程中，由于受試者依從性差、失訪等原因?qū)е虏±拿撀浜吞蕹?，?huì)導(dǎo)致可評(píng)價(jià)例數(shù)的減少。因此，需要在樣本量估計(jì)基礎(chǔ)上適度擴(kuò)大樣本量，以保證最終的有效樣本量可以滿(mǎn)足最小樣本量的要求。從分析角度而言，需保證最終的可評(píng)價(jià)樣本量應(yīng)大于經(jīng)樣本量估計(jì)方法求得的樣本量。樣本量調(diào)整通常會(huì)考慮不大于20%的脫落率，具體的脫落率如何確定，將根據(jù)不同研究項(xiàng)目而定，確定的依據(jù)主要來(lái)自專(zhuān)業(yè)方面的判斷，或著重參考以往研究數(shù)據(jù)的Meta分析結(jié)果[1]。

2 臨床科研項(xiàng)目存在的樣本量問(wèn)題

2.1 缺乏估算依據(jù)

一方面，臨床研究中采用的設(shè)計(jì)方案種類(lèi)較多，而每一種方案中樣本量估算幾乎都有各自的計(jì)算方法。同時(shí)，樣本量估算均要依據(jù)一定的計(jì)算公式以及滿(mǎn)足公式的一定條件，計(jì)算起來(lái)較為復(fù)雜。對(duì)于大部分研究者而言，樣本量估算是一個(gè)難題；另一方面，由于每項(xiàng)科研項(xiàng)目的經(jīng)費(fèi)來(lái)源不同，在樣本量估算方面的投入也不一樣。一般國(guó)家級(jí)、省部級(jí)和市級(jí)的臨床科研項(xiàng)目，會(huì)邀請(qǐng)專(zhuān)業(yè)的統(tǒng)計(jì)學(xué)專(zhuān)家參與臨床研究的設(shè)計(jì)，和研究者一起對(duì)樣本量進(jìn)行準(zhǔn)確合理的估算。由研究者發(fā)起的大多數(shù)自選臨床科研項(xiàng)目，由于沒(méi)有足夠的人力、物力和財(cái)力支持，研究者僅憑個(gè)人經(jīng)驗(yàn)和主觀感受估算樣本量。甚至直接使用參考文獻(xiàn)的公式和數(shù)據(jù)，并非根據(jù)公式獲得樣本量，必將嚴(yán)重影響研究結(jié)果的真實(shí)可靠性，違背了臨床研究的科學(xué)性和倫理性。一項(xiàng)調(diào)查結(jié)果顯示[7]，目前國(guó)內(nèi)臨床研究論文的方法部分存在問(wèn)題最多的就是樣本量估算的隨意性。絕大部分論文直接陳述觀察組和對(duì)照組的病例數(shù)，病例確定過(guò)程、樣本量估算依據(jù)普遍缺失，也缺乏文獻(xiàn)支撐和預(yù)試驗(yàn)探索?！读~刀》《美國(guó)醫(yī)學(xué)學(xué)會(huì)雜志》《新英格蘭醫(yī)學(xué)雜志》等國(guó)際頂級(jí)醫(yī)學(xué)期刊，除了個(gè)別病例報(bào)道未對(duì)樣本量估算進(jìn)行描述，其他無(wú)論是前瞻性還是回顧性臨床研究論文，均有對(duì)樣本量估算過(guò)程的描述。

2.2 樣本量估算闡述不明

樣本量估算應(yīng)該在臨床研究設(shè)計(jì)時(shí)或預(yù)試驗(yàn)結(jié)束時(shí)就已經(jīng)完成，并作為研究方案不可或缺的一部分。一些初次接觸臨床科研項(xiàng)目的研究者統(tǒng)計(jì)學(xué)基礎(chǔ)較差，缺乏統(tǒng)計(jì)學(xué)相關(guān)的背景知識(shí)，對(duì)樣本量估算的實(shí)際意義了解不深入，也沒(méi)有意識(shí)到樣本量估算的重要性，不理解為什么要進(jìn)行樣本量的估算、依據(jù)哪些條件進(jìn)行樣本量的估算、估算時(shí)有哪些注意事項(xiàng)、如何選擇相應(yīng)的統(tǒng)計(jì)公式及如何進(jìn)行較為復(fù)雜的計(jì)算[8]。在臨床研究目的明確之后也未邀請(qǐng)統(tǒng)計(jì)學(xué)專(zhuān)家參與臨床研究的設(shè)計(jì)，因此，在其遞交給倫理委員會(huì)的臨床研究方案設(shè)計(jì)中常存在樣本量來(lái)源不明確，內(nèi)容闡述簡(jiǎn)單又粗糙，沒(méi)有詳細(xì)的樣本量估算過(guò)程，參考其他文獻(xiàn)直接給出一個(gè)樣本量的具體數(shù)值，甚至不考慮研究目的隨意制定樣本量[9]。不少研究者對(duì)樣本量估算的認(rèn)識(shí)存在一個(gè)誤區(qū)，認(rèn)為可直接套用公式計(jì)算。但樣本量的估算需要有統(tǒng)計(jì)學(xué)和臨床流行病學(xué)的基礎(chǔ)知識(shí)作為前期的鋪墊，同時(shí)還要考慮諸多實(shí)際因素的影響。即先得出一個(gè)理論值，再根據(jù)實(shí)際情況確定最終納入研究的樣本量。

3 解決樣本量不合理的對(duì)策

為提高臨床科研項(xiàng)目倫理審查質(zhì)量，可從以下幾方面解決樣本量不合理的難題：第一，醫(yī)學(xué)院校、臨床研究機(jī)構(gòu)等應(yīng)加強(qiáng)對(duì)研究者科研能力的培養(yǎng)，定期開(kāi)展臨床研究方案設(shè)計(jì)的培訓(xùn)，包括樣本量估算的培訓(xùn)，著重介紹流行病學(xué)研究的樣本量計(jì)算、統(tǒng)計(jì)學(xué)計(jì)算公式、應(yīng)用軟件、線上計(jì)算工具、公眾號(hào)等，以便研究者培訓(xùn)后使用。第二，研究者應(yīng)不斷學(xué)習(xí)、積累和掌握相關(guān)統(tǒng)計(jì)知識(shí)，增強(qiáng)對(duì)樣本量估算重要性的意識(shí)，也應(yīng)該養(yǎng)成自主學(xué)習(xí)的習(xí)慣，提高獨(dú)立科研的素質(zhì)，將統(tǒng)計(jì)學(xué)知識(shí)融入臨床研究，從而提高臨床研究方案的設(shè)計(jì)和臨床研究質(zhì)量。第三，醫(yī)學(xué)倫理委員會(huì)辦公室人員在對(duì)倫理資料形式審查時(shí)，提醒研究者樣本量估算常存在的問(wèn)題，對(duì)于無(wú)樣本量估算公式而直接給出樣本量的，建議研究者向統(tǒng)計(jì)學(xué)專(zhuān)家咨詢(xún)，并采用正確公式計(jì)算樣本量。同時(shí)，應(yīng)將樣本量估算作為主審委員工作表的一個(gè)審查要素。第四，應(yīng)培訓(xùn)醫(yī)學(xué)倫理委員會(huì)委員審查臨床科研項(xiàng)目時(shí)，也要審查研究方案中的樣本量計(jì)算以及知情同意書(shū)應(yīng)涉及的樣本量告知內(nèi)容[10]。第五，建議醫(yī)學(xué)倫理委員會(huì)將統(tǒng)計(jì)學(xué)專(zhuān)家納為委員或獨(dú)立顧問(wèn)，切實(shí)審查臨床科研項(xiàng)目的樣本量估算問(wèn)題。循證醫(yī)學(xué)的快速發(fā)展證明了以科學(xué)、嚴(yán)謹(jǐn)、規(guī)范的科研設(shè)計(jì)為基礎(chǔ)并正確運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)才是高質(zhì)量論文產(chǎn)出的有效保證[5]。

4 小結(jié)

臨床科研項(xiàng)目的樣本量估算至關(guān)重要，但沒(méi)有固定正確的答案和方法，最關(guān)鍵的不在于如何計(jì)算，而是要確定采用哪一種公式來(lái)計(jì)算，這需要研究者和/或統(tǒng)計(jì)學(xué)專(zhuān)家通過(guò)判斷實(shí)際情況，結(jié)合研究目的、研究類(lèi)型、假設(shè)檢驗(yàn)等綜合考慮。選擇適合研究項(xiàng)目的樣本量估算方法，能保證足夠的檢驗(yàn)效能，減少受試者暴露于潛在的風(fēng)險(xiǎn)和盡可能減少資源浪費(fèi)。應(yīng)將樣本量估算作為主審委員工作表的一個(gè)審查要素，并通過(guò)倫理辦公室工作人員提醒研究者樣本量估算存在的常見(jiàn)問(wèn)題，同時(shí)建議將統(tǒng)計(jì)學(xué)專(zhuān)家納為委員或獨(dú)立顧問(wèn)，更好地審查臨床研究項(xiàng)目涉及的樣本量問(wèn)題。