• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      單樣本率比較(單組目標(biāo)值法)的樣本量計(jì)算及其簡便實(shí)現(xiàn)

      2018-07-16 06:08:22曾治宇張明東PeterLam
      中國衛(wèi)生統(tǒng)計(jì) 2018年2期
      關(guān)鍵詞:二項(xiàng)分布正態(tài)目標(biāo)值

      曾治宇 林 娜 張明東 Peter Lam

      樣本量計(jì)算是臨床研究設(shè)計(jì)階段的主要工作之一,其重要性在國內(nèi)日漸受到重視,為此在2015年還發(fā)表了一個(gè)《臨床試驗(yàn)中樣本量確定的統(tǒng)計(jì)學(xué)考慮》的專家共識(shí)[1]。

      目前臨床研究中,特別是醫(yī)療器械的臨床研究中,單組目標(biāo)值法(performance goal,PG)的應(yīng)用越來越多。事先確定一個(gè)目標(biāo)值(目標(biāo)值的確定必須謹(jǐn)慎,依據(jù)充分,但這個(gè)不在本文的討論范圍內(nèi)),將研究預(yù)計(jì)能夠達(dá)到的值與之進(jìn)行比較。例如美國FDA對(duì)于射頻消融導(dǎo)管的建議為急性成功率、慢性成功率及主要并發(fā)癥的目標(biāo)值分別為85%,80%及7%,而預(yù)計(jì)值分別為95%,90%及2.5%。國內(nèi)CFDA也開始將這一方法寫入一些醫(yī)療器械臨床試驗(yàn)的指導(dǎo)原則中。

      對(duì)于計(jì)數(shù)資料的單組目標(biāo)值法,從統(tǒng)計(jì)學(xué)角度來看其實(shí)就是單樣本率的比較。如果進(jìn)行確切計(jì)算將涉及到二項(xiàng)分布,手工計(jì)算困難,常需借助特殊軟件。本文擬結(jié)合文獻(xiàn)發(fā)表的實(shí)例,介紹常規(guī)軟件excel及免費(fèi)軟件G*Power進(jìn)行單樣本率比較的樣本量計(jì)算。

      計(jì)算方法

      單樣本率比較的樣本量計(jì)算常見的方法為正態(tài)近似法(公式1[2]),適合目標(biāo)事件發(fā)生率不太極端且樣本量足夠大時(shí),否則應(yīng)進(jìn)行平方根反正弦變化(公式2[3])。我們將這兩個(gè)公式分別輸入excel表中,其中的參數(shù)可替換為實(shí)際的單元格引用,便于重復(fù)使用。

      (1)

      (2)

      根據(jù)二項(xiàng)分布進(jìn)行確切計(jì)算時(shí)使用G*Power免費(fèi)軟件,上文提到的專家共識(shí)[1]也有此推薦。G* Power是由德國杜塞爾多夫大學(xué)開發(fā)的軟件,包括的樣本量計(jì)算系列有Exact、Ftest、ttest、χ2test及ztest等,本文使用的版本為3.1.9.2。

      實(shí)例分析

      某臨床試驗(yàn)欲驗(yàn)證一款彩色多普勒超聲系統(tǒng)的臨床有效性,采用標(biāo)準(zhǔn)對(duì)照設(shè)計(jì),用圖像優(yōu)良率為主要評(píng)價(jià)指標(biāo),臨床有效的標(biāo)準(zhǔn)為圖像優(yōu)良率不低于85%。預(yù)期試驗(yàn)機(jī)器的圖像優(yōu)良率為95%,以0.05為檢驗(yàn)水準(zhǔn),采用雙側(cè)檢驗(yàn),設(shè)定檢驗(yàn)效能為80%,試估計(jì)樣本量[2]。該文獻(xiàn)利用nQuery計(jì)算的結(jié)果為79,SAS計(jì)算結(jié)果也是79,我們根據(jù)公式(1)利用excel正態(tài)計(jì)算的結(jié)果為78.017,如果向上取整,也是79。該例中預(yù)期的率達(dá)到95%,已經(jīng)不太適合正態(tài)近似法了,但該文并未給出利用二項(xiàng)分布確切計(jì)算的結(jié)果。在另一篇文獻(xiàn)[4]對(duì)于同一實(shí)例利用SAS逐步尋值法編程得到的樣本量為75,我們利用G*Power直接計(jì)算的結(jié)果也是75,但利用post hoc根據(jù)檢驗(yàn)功效決定的樣本量為84。我們?cè)谙乱粋€(gè)例子中對(duì)G*Power軟件的計(jì)算作些具體的說明。注意如果用公式(2)利用excel反正弦計(jì)算的結(jié)果是67,差異較大,我們?cè)谙挛臅?huì)有討論。

      為驗(yàn)證某一治療肝癌的組合治療方案是否有效,擬進(jìn)行臨床試驗(yàn)設(shè)計(jì)。根據(jù)以往研究數(shù)據(jù)獲知,肝癌的5年生存率為50%,研究者預(yù)期新的組合治療方案能使肝癌的5年生存率提高至60%,試按照檢驗(yàn)效能為80%、檢驗(yàn)水準(zhǔn)為0.05的雙側(cè)檢驗(yàn)估計(jì)本試驗(yàn)所需樣本量[2]。文獻(xiàn)對(duì)此進(jìn)行了確切概率檢驗(yàn),利用nQuery軟件時(shí),在相應(yīng)的窗口內(nèi)樣本量一行反復(fù)嘗試填入不同數(shù)據(jù),直至獲得檢驗(yàn)效能達(dá)到或超過80%,得到樣本量為208。SAS編程運(yùn)算的結(jié)果也是208。我們根據(jù)公式(1)利用excel正態(tài)計(jì)算的結(jié)果為194,根據(jù)公式(2)利用excel反正弦計(jì)算的結(jié)果也是194。使用G*Power直接計(jì)算的結(jié)果為199,此時(shí)的檢驗(yàn)功效為0.804,但α僅為0.047;使用G*Power post hoc計(jì)算樣本量為194時(shí)的檢驗(yàn)功效為0.764,但α僅為0.037。這個(gè)例子中的率不極端,樣本量也較大,因此正態(tài)法、反正弦法及G×Power軟件直接計(jì)算的結(jié)果較為一致。

      G*Power還可方便地給出在指定的α水平下(如α≤0.05),設(shè)定一定范圍內(nèi)不同樣本量(例如此例設(shè)定樣本量的范圍為180~220)時(shí)的檢驗(yàn)功效(圖1)。圖1中可以清晰地看到,橫坐標(biāo)樣本量194對(duì)應(yīng)的縱坐標(biāo)檢驗(yàn)功效只有0.764,雖然樣本量199時(shí)的檢驗(yàn)功效為0.804(此時(shí)的α=0.047),但樣本量增加至200時(shí)的檢驗(yàn)功效反而降至0.787(注意此時(shí)的α=0.040)。只有樣本量達(dá)到210時(shí),檢驗(yàn)效能才穩(wěn)定地居于0.8之上,因此根據(jù)post hoc的結(jié)果這個(gè)例子的樣本量計(jì)算結(jié)果為210,與上面nQuery與SAS的結(jié)果基本一致。

      圖1 G*Power軟件post hoc給出特定樣本量下的檢驗(yàn)效能

      本文寫作之際,國家食品藥品監(jiān)管總局于2017年1月4日發(fā)布了《人工耳蝸植入系統(tǒng)臨床試驗(yàn)指導(dǎo)原則》,關(guān)于樣本量的描述如下:根據(jù)臨床經(jīng)驗(yàn),開機(jī)12個(gè)月后,產(chǎn)品的總體有效率需至少達(dá)到70%(目標(biāo)值為70%)方可被臨床接受。假設(shè)被試驗(yàn)產(chǎn)品的總體有效率可以達(dá)到85%,則在雙側(cè)顯著性水平0.05、把握度80%的情況下,至少需要64例患者,考慮10%的脫落率,共需要70例患者[5]。

      該文件未說明具體的計(jì)算方法及應(yīng)用的軟件,我們利用excel根據(jù)公式(1)正態(tài)近似法計(jì)算的結(jié)果正好是64例,而根據(jù)公式(2)平方根反正弦變化計(jì)算的結(jié)果為60例。而利用G*Power軟件精確計(jì)算的結(jié)果為70例。

      討  論

      在率不是過大或過小的情況下,單樣本率比較樣本量計(jì)算的正態(tài)近似法基本可行,excel輸入公式后計(jì)算簡潔明快。確切計(jì)算時(shí),免費(fèi)的G*Power軟件能方便地給出不同樣本下檢驗(yàn)功效值,圖形顯示直觀清晰,甚至優(yōu)于nQuery與SAS的表達(dá),也比既往文獻(xiàn)[4,6]推薦的方法簡潔得多。

      值得注意的是,由圖1可見,確切計(jì)算樣本量時(shí),隨著樣本量的增加,檢驗(yàn)功效不是單調(diào)增加的。大家熟知的正態(tài)分布函數(shù)是連續(xù)的,在給定α水平時(shí),隨著樣本量的增加,檢驗(yàn)功效隨著增加。而基于二項(xiàng)分布的計(jì)算是非連續(xù)的,也就是說在不同的樣本量下,α值和β值是跳躍變化的。為了保證滿足α≤0.05的要求,樣本量增加時(shí),α值可能會(huì)變小,這時(shí)1-β(即檢驗(yàn)功效)也可能跌至既定的值如0.8以下。檢驗(yàn)功效和樣本量的關(guān)系盡管總的趨勢(shì)仍然是遞增的,但表現(xiàn)為鋸齒狀遞增,不是純粹的單調(diào)遞增關(guān)系。例如例2在樣本量199時(shí)的α值為0.047,檢驗(yàn)功效為0.804;在樣本量增至200時(shí),α值降至0.040,檢驗(yàn)功效下降至0.787,低于0.8。這也提示在利用類似二項(xiàng)分布這種非連續(xù)分布模型進(jìn)行樣本量計(jì)算時(shí),要考慮到樣本量變化與檢驗(yàn)功效變化的這種關(guān)系,在局部情況下,樣本量增加,檢驗(yàn)功效反而是下降的。因此,對(duì)于實(shí)例1,文獻(xiàn)利用SAS編程得到樣本量75是值得商榷的。臨床研究設(shè)計(jì)時(shí),特別是在樣本量較小的確證性臨床研究中,務(wù)必反復(fù)權(quán)衡,避免設(shè)計(jì)失誤。

      猜你喜歡
      二項(xiàng)分布正態(tài)目標(biāo)值
      二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系
      深度剖析超幾何分布和二項(xiàng)分布
      概率與統(tǒng)計(jì)(1)——二項(xiàng)分布與超幾何分布
      ML的迭代學(xué)習(xí)過程
      二項(xiàng)分布參數(shù)的E-Bayes估計(jì)及其應(yīng)用
      雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
      基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
      半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
      基于正態(tài)變換的貸款組合定價(jià)模型構(gòu)建及實(shí)證
      不同危險(xiǎn)程度患者的降脂目標(biāo)值——?dú)W洲《血脂異常防治指南》
      济源市| 甘谷县| 涿鹿县| 伊川县| 大宁县| 赣州市| 康定县| 鄂伦春自治旗| 永靖县| 秭归县| 金塔县| 那坡县| 洛隆县| 绥棱县| 林周县| 大余县| 西和县| 宁波市| 肇庆市| 新津县| 阿坝| 嵊泗县| 山东省| 富宁县| 阿巴嘎旗| 桐城市| 西充县| 疏勒县| 兴和县| 互助| 岳西县| 普兰店市| 广宁县| 汉沽区| 昂仁县| 公安县| 洪雅县| 平度市| 三河市| 尚志市| 裕民县|