劉一松,郭春雪,胡 完,呂辰龍,胡良平
在生理學(xué)研究中如何正確估計(jì)樣本含量*
劉一松,郭春雪,胡 完,呂辰龍,胡良平△
(軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)學(xué)咨詢中心 ,北京100850)
目的:引起生理學(xué)研究人員對樣本含量估計(jì)重要性的認(rèn)識。方法:論述樣本含量估計(jì)的意義及存在的問題,介紹常用的樣本含量估計(jì)方法以及獲取其他樣本含量估計(jì)方法的途徑。結(jié)果:清楚地表述了估計(jì)樣本含量必需明白的基本概念、前提條件,并通過實(shí)例給出了兩種場合下所需樣本含量的估計(jì)過程和結(jié)果。結(jié)論:在估計(jì)樣本含量時(shí),必須明確資料將選用何種統(tǒng)計(jì)分析方法處理 ,并且應(yīng)滿足有關(guān)的前提條件 ,才能得到正確的估計(jì)結(jié)果。
生理學(xué); 樣本含量估計(jì); 成組設(shè)計(jì); 兩兩比較
【DOI】10.13459/j.cnki.cjap.2016.03.026
生理學(xué)研究中究竟使用多少樣本量才算合適,一直是困擾科研工作者的一道難題。樣本含量過大或過小都存在一定弊端。若樣本量過小,獲得的觀測指標(biāo)平均值或某種率則不穩(wěn)定,意味著抽樣誤差大或結(jié)果的重現(xiàn)性差,推論總體的精密度和準(zhǔn)確度都會比較差,造成檢驗(yàn)效能(power,即發(fā)現(xiàn)客觀存在的差別的能力)的不足,從而導(dǎo)致不能發(fā)現(xiàn)總體間實(shí)際存在的差異;若樣本量過大,不僅浪費(fèi)人力、物力、財(cái)力和時(shí)間,還會增加實(shí)際工作的困難,可能引入更多的混雜因素,從而對研究結(jié)果造成不良影響[1]。樣本含量估計(jì)的意義在于有助于研究者用最合理的資源去發(fā)現(xiàn)在專業(yè)上可能有意義的差異。
隨著全球醫(yī)療衛(wèi)生事業(yè)的發(fā)展和相關(guān)法規(guī)的健全,樣本含量的估計(jì)在臨床研究領(lǐng)域已經(jīng)引起足夠的重視,成為臨床試驗(yàn)研究(也包括調(diào)查研究)設(shè)計(jì)階段不可或缺的重要環(huán)節(jié)[2-5]。但在以動物和樣品為受試對象的基礎(chǔ)醫(yī)學(xué)研究領(lǐng)域內(nèi),卻常直接給出不合理的樣本量或沒有提及科學(xué)的樣本含量估計(jì)方法。比如在2015年3月本刊發(fā)表的《百草枯對活性氧類物質(zhì)的產(chǎn)生和中性粒細(xì)胞凋亡的影響》[6]一文中,原文作者研究PQ對中性粒細(xì)胞凋亡的影響,設(shè)計(jì)了陰性對照組和三種不同濃度的PQ組,從原文作者的分組情況看,該實(shí)驗(yàn)設(shè)計(jì)類型應(yīng)該為單因素4水平設(shè)計(jì),正確的做法是按照原文作者想要達(dá)到的研究目的結(jié)合所需的前提條件來估計(jì)每組所需的樣本含量(參見后面的例子)。原文中給出每組樣本含量僅僅只有4例,在重復(fù)試驗(yàn)如此少的情況下,樣本的個(gè)體差異性和隨機(jī)誤差導(dǎo)致的偏倚會對結(jié)果造成十分嚴(yán)重的影響。每組過少的例數(shù)也使一般正態(tài)性檢驗(yàn)方法得出的結(jié)論不可靠,研究者很難正確判斷資料的分布類型;又如在《蝎源活性肽對帕金森病大鼠凋亡因子改變的影響》[7]、《運(yùn)動結(jié)合單不飽和脂肪酸攝入對大鼠胰島素抵抗的影響》[8]、《鈣敏感受體對大鼠糖尿病性心肌病的影響》[9]等文獻(xiàn)中,都是直接給出了實(shí)驗(yàn)的樣本含量,而未提及得出該樣本含量的任何依據(jù)。
正確估計(jì)樣本含量應(yīng)該是在保證研究結(jié)論具有一定可靠性的前提下,用統(tǒng)計(jì)學(xué)方法確定最少的研究對象(或觀察單位)數(shù)。為什么在實(shí)際科研工作中,很多研究人員往往不重視甚至忽略了這個(gè)問題呢?重要的原因可能是由于研究者思想上尚未引起足夠的重視,再加上醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識的局限,于是常習(xí)慣地隨意設(shè)定一個(gè)樣本量。其實(shí),在很多的陰性結(jié)果(P>0.05)中,一個(gè)很重要的原因就是樣本量太少,使實(shí)際上存在的差別沒有顯現(xiàn)出來,難以獲得正確的研究結(jié)果。
那是否所有的陰性結(jié)果都是由于樣本含量不足導(dǎo)致的呢?顯然這種想法是不正確的。當(dāng)假設(shè)檢驗(yàn)未能拒絕原假設(shè)時(shí),研究者首先想到的往往是樣本含量可能不足,于是擴(kuò)大例數(shù)再實(shí)驗(yàn),其結(jié)果可能有兩種:(1)指標(biāo)取值大致保持原水平,因n增大而P值降低,最終達(dá)到P≤α而獲得預(yù)期結(jié)論;(2)組間的差異增大,于是n雖增加而P值未變或反而升高。第一種結(jié)果通常表示設(shè)計(jì)正確,預(yù)期目的達(dá)到。第二種則提示研究者:問題不在樣本含量而可能在未找準(zhǔn)找全且未有效控制對評價(jià)指標(biāo)有影響的重要非實(shí)驗(yàn)因素方面,此時(shí)再擴(kuò)大例數(shù)也是徒勞的或事倍功半的。
事實(shí)上,估計(jì)樣本含量是一項(xiàng)比較繁瑣的事情。因?yàn)樾枰峁┮幌盗星疤釛l件且能找到相應(yīng)的統(tǒng)計(jì)學(xué)方法之后,才有可能去實(shí)際估計(jì)。在實(shí)驗(yàn)設(shè)計(jì)中,擬對定量指標(biāo)的平均值或定性指標(biāo)的率進(jìn)行假設(shè)檢驗(yàn)時(shí),常需提供的前提條件有如下幾條:(1)與結(jié)果精確度有關(guān)的前提條件:①定出檢驗(yàn)水準(zhǔn):即事先規(guī)定本次實(shí)驗(yàn)允許犯Ⅰ型(或假陽性)錯(cuò)誤的概率α,通常規(guī)定α=0.05,同時(shí)還應(yīng)明確是單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),α定得越小,所需的樣本含量越大。②提出所期望的檢驗(yàn)效能或稱把握度1-β[這里,β為犯Ⅱ型(或假陰性)錯(cuò)誤的概率],即在特定的α水準(zhǔn)下,若總體對比的參數(shù)之間確實(shí)存在著差別,此時(shí)該次實(shí)驗(yàn)?zāi)馨l(fā)現(xiàn)此差別的概率。要求的檢驗(yàn)效能越大,所需的樣本含量就越大。在科研設(shè)計(jì)時(shí),檢驗(yàn)效能不宜低于0.75,一般取0.8比較適宜。③需要對實(shí)驗(yàn)過程中的樣本損耗作一個(gè)估計(jì)。假設(shè)研究者估計(jì)本次實(shí)驗(yàn)過程中將有10%的動物死亡或者損耗而無法完成實(shí)驗(yàn),則應(yīng)將通過計(jì)算得到的樣本量除以0.9,此時(shí)得到的結(jié)果才能作為實(shí)驗(yàn)最終需要的樣本量。(2)與評價(jià)指標(biāo)有關(guān)的前提條件:必須知道由樣本推斷總體的一些信息。比較兩總體均數(shù)或概率之間的差別是否具有統(tǒng)計(jì)學(xué)意義時(shí),應(yīng)當(dāng)知道總體參數(shù)間的差值δ的信息。如兩總體均數(shù)間的差值δ=μ1-μ2的信息(或有關(guān)于μ1和μ2的估計(jì)值),兩總體概率間的差值δ=π1-π2的信息(或有關(guān)于和的估計(jì)值)。此外,確定兩均數(shù)比較的樣本含量時(shí),還需要有關(guān)總體標(biāo)準(zhǔn)差σ的信息(或有關(guān)于總體標(biāo)準(zhǔn)差σ的估計(jì)值)。若希望進(jìn)行非劣效性檢驗(yàn)、等效性檢驗(yàn)或優(yōu)效性檢驗(yàn)時(shí),需要提供在臨床上有意義的界值δ(此界值一般應(yīng)由多位臨床專家共同討論來商定)。這些信息可以通過查閱資料、借鑒前人的經(jīng)驗(yàn)或進(jìn)行預(yù)試驗(yàn)尋找參考值[10]。(3)與設(shè)計(jì)類型和比較類型有關(guān)的前提條件:前面提到“兩總體”,其真實(shí)含義是指所采用的是“單因素兩水平設(shè)計(jì)(常簡稱為成組設(shè)計(jì))”。換句話說,擬采用什么實(shí)驗(yàn)設(shè)計(jì)類型(因?yàn)槌藛我蛩貎伤皆O(shè)計(jì)之外,還有單組設(shè)計(jì)、配對設(shè)計(jì)、單因素多水平設(shè)計(jì)、某種特定的多因素設(shè)計(jì))是估計(jì)樣本含量的重要前提條件之一;而擬采用的比較類型(包括差異性檢驗(yàn)、非劣效性檢驗(yàn)、等效性檢驗(yàn)或優(yōu)效性檢驗(yàn))也是估計(jì)樣本含量的重要前提條件之一。
運(yùn)用專業(yè)的統(tǒng)計(jì)軟件來計(jì)算樣本含量是科學(xué)、嚴(yán)謹(jǐn)以及簡便的方法,也是實(shí)驗(yàn)研究和臨床試驗(yàn)研究中普遍采用的方法。目前能實(shí)現(xiàn)樣本含量計(jì)算的軟件有SAS、PASS、STATA、nQuery等,本文中實(shí)例運(yùn)行將采用PASS軟件來完成。
因篇幅所限,本文僅介紹兩種設(shè)計(jì)類型且評價(jià)指標(biāo)為定量指標(biāo)的情形,即成組設(shè)計(jì)一元定量資料均值檢驗(yàn)與單因素多水平設(shè)計(jì)一元定量資料均值檢驗(yàn)時(shí)的樣本含量估計(jì)。希望借此引起廣大實(shí)際科研工作者對制訂科學(xué)完善科研設(shè)計(jì)方案、特別是有根據(jù)地估計(jì)合理的樣本含量的高度重視,從而起到一個(gè)拋磚引玉的作用。其他各種情形下如何估計(jì)樣本含量,后面將給出可供參考的文獻(xiàn),以便讀者查閱。
例1成組設(shè)計(jì)一元定量資料均值檢驗(yàn)時(shí)樣本含量估計(jì):在動物鎮(zhèn)咳試驗(yàn)中,比較中藥復(fù)方Ⅰ與復(fù)方Ⅱ使小鼠推遲發(fā)生咳嗽的時(shí)間,復(fù)方Ⅰ與復(fù)方Ⅱ的平均數(shù)分別為31.67s和44.00s(即δ=44.00-31.67 =12.33 s)。設(shè)兩組標(biāo)準(zhǔn)差相等,且為25 s,α=0.05(雙側(cè)),β=0.10,要得出兩組之間的差別有統(tǒng)計(jì)學(xué)意義的結(jié)論,問需要用多少只小鼠[11]?(不考慮實(shí)驗(yàn)中耗損且兩組樣本量相等)
解答:已知的前提條件:
軟件用法:打開NCSS-PASS軟件后,選擇相應(yīng)的MEANS→Two IndependentMeans→Test(Inequality)→Tests for Two Means(Two-Sample T-Test)[Differences]界面,按要求填入?yún)?shù),點(diǎn)擊運(yùn)行后即可得到運(yùn)行結(jié)果:N1=N2=87,即每組87只,總共需要174只小鼠來進(jìn)行實(shí)驗(yàn)才能達(dá)到所要求的檢驗(yàn)效能。在實(shí)際科研中,由于實(shí)驗(yàn)條件和經(jīng)費(fèi)的限制,研究者往往需要通過多次調(diào)整估計(jì)樣本量的參數(shù)來探索性計(jì)算樣本含量,然后對條件和結(jié)果進(jìn)行綜合考慮,選取適合開展研究又具有科學(xué)依據(jù)的樣本量作為最終的結(jié)果。通過PASS軟件的操作,我們就可以輕松完成這項(xiàng)工作,比如輸入power(1-β)這一欄時(shí),我們同時(shí)輸入0.70、0.75、0.80、0.85、0.90這五個(gè)值,檢驗(yàn)水準(zhǔn)α則同時(shí)輸入0.05和0.10兩種情況,在不同水準(zhǔn)下分別來觀察樣本量與檢驗(yàn)效能之間的關(guān)系,點(diǎn)擊運(yùn)行后結(jié)果見下面的表1。
Tab.1 The resultof sample size calculation in animal antitussive test
從表1中可以看出,當(dāng)鎖定檢驗(yàn)水準(zhǔn)且保持其他參數(shù)不變,只改變初始檢驗(yàn)效能initial power時(shí),每組的樣本含量隨著initial power的降低而減少,說明了樣本含量的減少將降低實(shí)驗(yàn)發(fā)現(xiàn)兩總體之間差別的能力。表格中第一行N1、N2的結(jié)果即為例1問題的答案,設(shè)定了檢驗(yàn)水準(zhǔn)為0.05、initial power= 0.90,軟件通過內(nèi)部迭代后計(jì)算所得的結(jié)果為每組87例。此時(shí)再用已經(jīng)算得的樣本量反推power,得到實(shí)際的檢驗(yàn)效能actual power為0.90198。軟件計(jì)算可以方便地給出多種條件下運(yùn)算的結(jié)果,供研究者結(jié)合實(shí)驗(yàn)自身?xiàng)l件選擇最合適的樣本量和檢驗(yàn)效能組合來開展實(shí)驗(yàn)。
圖1中位于上方的曲線α為0.05,下方的曲線α為0.1,其他估計(jì)參數(shù)則完全相同。直觀地反映了相同條件下,檢驗(yàn)水準(zhǔn)取值越小,實(shí)驗(yàn)所需樣本含量越多。當(dāng)確定好檢驗(yàn)水準(zhǔn)時(shí),隨著檢驗(yàn)效能逐漸接近于1,所需樣本量增加的速度越來越快[12]。
例2、單因素多水平設(shè)計(jì)一元定量資料均值檢驗(yàn)時(shí)的樣本含量估計(jì)。
在定量資料單因素多水平設(shè)計(jì)中,常會見到以下分組情況:對照組(0劑量)、低劑量組、中劑量組、高劑量組。研究者擬采取的統(tǒng)計(jì)分析方法也不僅僅是用單因素多水平設(shè)計(jì)一元定量資料方差分析來比較四個(gè)總體平均值之間差異是否有統(tǒng)計(jì)學(xué)意義,而是想研究所有分組之間、對照組與三種不同劑量組之間、效應(yīng)值最高的組與其他三組之間分別進(jìn)行兩兩比較的結(jié)果,來達(dá)到多方位考察不同劑量藥物對研究指標(biāo)的影響的目的。這三種兩兩比較的方法對應(yīng)的名稱分別是:Tukey-Kramer法(所有水平之間兩兩比較)、Hsu法(效應(yīng)值最高的組與其他組分別兩兩比較)、Dunnett法(對照組與三種不同劑量組之間分別兩兩比較)。
Fig.1 The relationship between N and Power in animal antitussive test
假設(shè)某項(xiàng)研究想用這三種兩兩比較的方法考察四個(gè)總體均值之間的差異。設(shè)定檢驗(yàn)水準(zhǔn)α= 0.05,預(yù)實(shí)驗(yàn)顯示標(biāo)準(zhǔn)差為6.3,且可認(rèn)為各組標(biāo)準(zhǔn)差相等(即滿足所謂的方差齊性要求)。正常情況下,研究指標(biāo)的均值為63.4,研究者認(rèn)為該值上升25%可認(rèn)為是實(shí)驗(yàn)有意義的表現(xiàn),所以δ=0.25× 63.4=15.85即為該實(shí)驗(yàn)最小可捕捉的差異值。當(dāng)取檢驗(yàn)效能為0.7、0.8、0.9時(shí),分別計(jì)算三種兩兩比較方法下,差別有統(tǒng)計(jì)學(xué)意義時(shí),所需樣本含量(每組樣本量相等),結(jié)果見表2。
解答:已知的前提條件:
α=0.05(雙側(cè)),β=0.10;四組均值都是63.4;四組的標(biāo)準(zhǔn)差都是6.3;有實(shí)際意義的差值為15. 85;還需要指定擬采用的兩兩比較方法,例如,Tukey-Kramer法。
軟件用法:打開NCSS-PASS軟件后,選擇相應(yīng)的MEANS→ANOVA→Multiple Comparisons界面,按要求填入?yún)?shù)后,就得到所需要的總樣本含量為52例,每組13例。
當(dāng)輸入power(1-β)這一欄時(shí),若我們同時(shí)輸入0.70、0.80、0.90這三個(gè)值,由于PASS軟件只能通過點(diǎn)擊界面窗口進(jìn)行操作,當(dāng)選擇“Type of Multiple Comparison”時(shí),需要分別選擇Tukey-Kramer法、Hsu法、Dunnett法進(jìn)行三次重復(fù)操作才能完成。運(yùn)行后結(jié)果整理如下,見表2。
Tab.2 The resultof sample size calculation in threemultiple comparisonsmethods
從表2中可以看出,三種兩兩比較方法中,Tukey-Kramer法由于要求所有的水平組合兩兩比較都有意義,所需樣本含量最多;而Hus法只要滿足效應(yīng)最高的組與其他組兩兩比較有意義,比較容易得出有差異的結(jié)論,因此所需樣本含量最少。研究人員可根據(jù)自身實(shí)驗(yàn)的要求,選擇對應(yīng)的樣本含量估計(jì)方法,來得到最合理的結(jié)果。
本文直接指出了生理學(xué)研究中實(shí)驗(yàn)設(shè)計(jì)階段樣本量估計(jì)方面存在的問題,介紹了單因素兩種設(shè)計(jì)類型一元定量資料均值假設(shè)檢驗(yàn)時(shí)估計(jì)所需要樣本含量的具體方法。估計(jì)樣本含量不是隨意找一個(gè)計(jì)算公式就可計(jì)算出結(jié)果的工作,需要給定諸如擬采用的統(tǒng)計(jì)分析方法是什么和擬選定的實(shí)驗(yàn)設(shè)計(jì)類型是什么等多個(gè)前提條件下,再利用具有樣本含量估計(jì)功能的軟件來計(jì)算才有可能得到正確的估算結(jié)果。因篇幅所限,還有幾十種不同應(yīng)用場合下如何估計(jì)樣本含量的方法以及多種實(shí)現(xiàn)樣本含量估計(jì)的統(tǒng)計(jì)軟件的使用方法,請讀者參見電子工業(yè)出版社出版的《SAS統(tǒng)計(jì)分析教程》[13]樣本含量與檢驗(yàn)效能估計(jì)的相關(guān)章節(jié),以及人民衛(wèi)生出版社出版的《臨床研究樣本含量估計(jì)》[14]。
還需指出的是,在進(jìn)行科研課題的實(shí)驗(yàn)前,一定要制訂出科學(xué)完善的科研設(shè)計(jì)方案,在課題實(shí)施過程中應(yīng)有實(shí)時(shí)嚴(yán)格的質(zhì)量控制。資料將選用何種統(tǒng)計(jì)分析方法進(jìn)行處理在設(shè)計(jì)中要有明確規(guī)定,這樣,在完全按照原設(shè)計(jì)進(jìn)行實(shí)驗(yàn)時(shí),所估計(jì)的樣本含量才有效。
樣本含量的估計(jì)常常涉及到不同估計(jì)方法的取舍和復(fù)雜的公式及運(yùn)算實(shí)現(xiàn),既要考慮與統(tǒng)計(jì)學(xué)有關(guān)的條件,又要考慮其它的某些條件(如資料質(zhì)量、依從性、分配比例等)[15]。如果存在后者的干擾,按估計(jì)的樣本量進(jìn)行實(shí)驗(yàn),可能達(dá)不到預(yù)期的目標(biāo)??蒲腥藛T遇到此類困難時(shí)可以求助有經(jīng)驗(yàn)的統(tǒng)計(jì)學(xué)從業(yè)人員,從實(shí)際專業(yè)角度和統(tǒng)計(jì)學(xué)角度共同確定樣本量的計(jì)算方法,這也是制訂出科學(xué)完善的科研設(shè)計(jì)方案中的一個(gè)極其重要環(huán)節(jié)。
[1]陶麗新.臨床試驗(yàn)中成組設(shè)計(jì)四種類似統(tǒng)計(jì)問題的比較研究[D].北京:中國人民解放軍軍事醫(yī)學(xué)科學(xué)院,2011.
[2]Young D,Lamb SE,Shah S,et al.High-Frequency Oscillation for Acute Respiratory Distress Syndrome[J].N Engl J Med,2013,368(9),806-813.
[3]Vain NE,Satragno DS,Gorenstein AN,et al.Effect of gravity on volume of placental transfusion:a multicentre,randomised,non-inferiority trial[J].Lancet,2014,384: 235-40.
[4]Harley Goldberg,William Firtch,Mark Tyburski,et al.Oral Steroids for Acute Radiculopathy Due to a Herniated Lumbar Disk?A Randomized Clinical Trial[J].JAMA,2015,313 (19):1915-1923.
[5]Kieboom JK,Verkade HJ,Burgerhof JG,etal.Outcome after resuscitation beyond 30minutes in drowned children with cardiac arrest and hypothermia:Dutch nationwide retrospective cohort study[J].BMJ,2015,350:h418.
[6]秦開秀,李醇文,方 艷,等.百草枯對活性氧類物質(zhì)的產(chǎn)生和中性粒細(xì)胞凋亡的影響[J].中國應(yīng)用生理學(xué)雜志,2015,31(2):111-114.
[7]徐 紅,安 冬,殷盛明,等.蝎源活性肽對帕金森病大鼠凋亡因子改變的影響[J].中國應(yīng)用生理學(xué)雜志,2015,31(3):225-229.
[8]魏珊珊,梁丹丹,嚴(yán)曉波,等.運(yùn)動結(jié)合單不飽和脂肪酸攝入對大鼠胰島素抵抗的影響[J].中國應(yīng)用生理學(xué)雜志,2015,31(3):269-271.
[9]賈 振,孫 建,李鴻珠,等.鈣敏感受體對大鼠糖尿病性心肌病的影響[J].中國應(yīng)用生理學(xué)雜志,2015,31(1):35-37.
[10]胡良平,鮑曉蕾,周詩國,等.樣本量估計(jì)與檢驗(yàn)效能分析(一)[J].中西醫(yī)結(jié)合學(xué)報(bào) ,2011,9(10):1070-1074.
[11]胡良平.統(tǒng)計(jì)學(xué)三型理論在實(shí)驗(yàn)設(shè)計(jì)中的應(yīng)用[M].北京:人民軍醫(yī)出版社,2006:220-221.
[12]趙 健 ,龔婷婷 ,范肖肖,等.科研設(shè)計(jì)中樣本含量估計(jì)所需條件不足時(shí)的幾種處理措施[J].現(xiàn)代預(yù)防醫(yī)學(xué),2013,40(8):1418-1420.
[13]胡良平.SAS統(tǒng)計(jì)分析教程[M].北京:電子工業(yè)出版社,2010:690-706.
[14]吳圣賢.臨床研究樣本含量估算[M].北京:人民衛(wèi)生出版社,2008:3-85.
[15]李嬋娟 ,蔣志偉,王 銳,等.隨機(jī)對照藥物臨床試驗(yàn)樣本量估計(jì)[J].中國臨床藥理學(xué)與治療學(xué),2011,16(10):1132-1136.
How to scientifically estimate sample size in physiological research
LIU Yi-song,GUOChunue,HUWan,LV Chen-long,HU Liang-ping△
(Consulting Center of Biomedical Statistics,Academy of Military Medical Sciences,Beijing 100850,China)
【ABSTRACT】Objective:To bring aboutphysiological researchers'attention of the importanceof sample size estimation.Methods:The significance aswellas the currentproblemsof sample size estimationwere illustrated and the commonly-used sample size estimationmethodswere introduced.Results:The basic concepts and necessary premises of sample size estimation were stated.The estimation processes and results under two different circumstanceswereelaborated in detailvia examples.Conclusion:To attain the properestimated sample sizes,the computationmust satisfy the necessary premiseswhich included the appropriate statistical analysismethods to be used.
physiological research; sample size estimation; two-sample parallel design; multiple comparisons
R181
A
1000-6834(2016)03-284-05
2015-06-15
2015-10-12
Tel:010-66932127;E-mail:lphu812@sina.com