○ 文/司效東
在醫(yī)學(xué)研究中常常會遇到選擇樣本量的問題。醫(yī)學(xué)研究者一般都缺乏概率論和數(shù)理統(tǒng)計方面的背景知識,所以在研究中對這個問題重視不夠,選擇研究的樣本量具有很大的隨機性,因此代表性和準確性較差。特別是動物實驗。其實這個問題在科學(xué)研究中非常重要,它影響到研究過程的嚴謹性及研究結(jié)論的可靠性??蒲姓n題的建立其實就是一個醫(yī)學(xué)科研設(shè)計的過程,在這個過程中涉及很多問題,其中很重要的問題就是樣本量大小的確定,正確選擇樣本量,直接影響最終科研結(jié)論的可靠性。本文就樣本量選擇的意義及一些簡單的方法進行闡述。
樣本量是指總體中抽取的樣本元素的總個數(shù),應(yīng)用于統(tǒng)計學(xué)、數(shù)學(xué)、物理學(xué)等學(xué)科。樣本量大小是選擇檢驗統(tǒng)計量的一個要素。由抽樣分布理論可知,在大樣本條件下,如果總體為正態(tài)分布,樣本統(tǒng)計量服從正態(tài)分布;如果總體為非正態(tài)分布,樣本統(tǒng)計量漸近服從正態(tài)分布。
合理確定樣本量的意義:
第一,樣本量過大,會增加調(diào)查工作量,造成人力、物力、財力、時間的浪費;
第二,樣本量過小,則樣本對總體缺乏足夠的代表性,從而難以保證推算結(jié)果的精確度和可靠性;
第三,樣本量確定的科學(xué)合理。一方面,可以在既定的調(diào)查費用下,使抽樣誤差盡可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調(diào)查費用盡可能少,保證抽樣推斷的效果最好。
樣本量的估計是臨床研究科學(xué)設(shè)計的重要內(nèi)容。任何科學(xué)研究都要具有可重復(fù)性原則,其目的是要排除偶然因素的影響,得出科學(xué)的、真實的、規(guī)律性的結(jié)論。在臨床研究中,樣本量越小,抽樣誤差越大;若樣本量不足,可重復(fù)性差,檢驗效能低,不能排除偶然因素的影響,其結(jié)論就缺乏科學(xué)性及真實性;若樣本量過大,實驗條件難以控制,容易造成人力、物力和時間上的浪費。估計樣本量的目的就是在保證某個臨床試驗或臨床研究的結(jié)論具有科學(xué)性、真實性、可靠性的前提下,同時考慮到醫(yī)學(xué)研究所限定的條件,確定某研究所需要的最小觀察例數(shù)。
樣本量越大,越能反應(yīng)總體特征。當給定置信水平時,樣本量越大,誤差區(qū)間越小,然而這個關(guān)系并不是線性的,樣本量增大兩倍,并不一定能將誤差區(qū)間減少一半。同時,樣本量也不能低于某一個數(shù)量下限。
可以根據(jù)設(shè)計方案、資料類型及可能涉及的統(tǒng)計學(xué)方法來選擇樣本量的計算方法,也可以利用統(tǒng)計軟件來完成樣本量的計算。由于估算的樣本量是最少需要量,考慮受試者可能有不合作者、中途失訪、意外死亡等情況,而減少有效觀察的例數(shù),因此應(yīng)該在估算的樣本量基礎(chǔ)上增加若干樣本例數(shù)。
目前,醫(yī)學(xué)研究樣本量的選擇主要遵循對照、隨機與重復(fù)三個原則,在結(jié)合統(tǒng)計學(xué)的基礎(chǔ)上,通過公式計算或查表獲得。國內(nèi)有關(guān)書籍提供的樣本量計算公式,主要適用于臨床試驗,并不適用動物實驗。動物實驗的樣本量可以參考臨床試驗的樣本量,并在此基礎(chǔ)上適當減少其樣本例數(shù)。理論上,研究者可以保證除干預(yù)以外的其他因素在不同組間完全均衡,也就是完全可以保證所有的實驗動物如實驗鼠的基因型、體重等完全一致,即在實驗干預(yù)之前所有的實驗動物之間不存在變異,所以對樣本量不做特別要求。研究者只需考慮在研究過程中動物死亡的損耗率,適當增加樣本例數(shù)即可。
確定樣本量方法有以下兩種:第一,根據(jù)允許的抽樣誤差范圍確定樣本量。如在excel里設(shè)置α、p和△的值;計算累積機率值;選擇“NORMINV”函數(shù);計算Z值,計算樣本量。第二,根據(jù)特定目的確定樣本量。 1.若將一個樣本分成不同的組,要保證每組的樣本量都不能低于100;2.當每組樣本還需按不同的特性或配額劃分成更小的組時,要保證每個小組的樣本量至少在20-50之間;確定樣本量要考慮樣本結(jié)構(gòu)、精度要求、調(diào)研經(jīng)費以及總體特征易變性等因素。如果總體易變性強,或者個體之間的差異性大的時候,則需要適當增加樣本量。
在醫(yī)學(xué)研究中樣本量的準確確定是一個難點。
必須考慮到,醫(yī)學(xué)研究的成組設(shè)計。應(yīng)盡可能采用樣本量相等的設(shè)計,尤其是多組設(shè)計時,一般要求各組的樣本量相等,只有在某些特殊情況下才考慮各組的樣本含量不相等。
必須考慮到,在足夠樣本的前提下,滿足樣本選擇的隨機性所需要的最小樣本量,以提高樣本的均衡性,不能把隨便、隨意當作隨機,使研究結(jié)果不可信。
必須考慮到,不同醫(yī)學(xué)條件下的樣本量選擇。由于醫(yī)學(xué)研究樣本的特殊性,按照不同條件增加最低樣本量;樣本量過少要適當?shù)脑黾訕颖玖浚菇Y(jié)果具有可靠性。