• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于條件把握度法和EM算法相結合的樣本量再估計*

      2018-03-05 08:58:57程建成柏建嶺黃麗紅
      中國衛(wèi)生統(tǒng)計 2018年1期
      關鍵詞:估計值樣本量標準差

      程建成 柏建嶺,2△ 黃麗紅 趙 楊,2 于 浩,2 陳 峰,2△

      臨床試驗的樣本量估計通常取決于I類錯誤α、Ⅱ類錯誤β、臨床有意義的組間差別δ以及共同標準差σ等因素。在試驗設計階段,除Ⅰ類錯誤α、Ⅱ類錯誤β可以指定以外,組間差別δ以及標準差σ一般是未知的。未知參數(shù)的設置常基于已發(fā)表文獻或預試驗,往往與實際情況存在一定偏差,從而導致試驗設計階段的樣本量估算并不十分準確。樣本量高估會增加研究成本,增加試驗組受試者數(shù)量以及延長研究周期;樣本量低估則會導致樣本量達不到預期的檢驗效能,以至于整個試驗失敗。因而,期中分析時樣本量再估計常常得到應用。已報道的樣本量再估計方法,按照是否需要揭盲可分為兩類,即盲態(tài)估計和揭盲估計[1]。

      盲態(tài)估計可以更大程度保持試驗的完整性,但是無法對組間真實差異進行估計,也不能替代嚴謹?shù)脑囼炘O計,會造成假陰性的增加;揭盲估計能較準確地進行樣本量再估計,但是其會在一定程度上損害試驗的完整性。兩種估計各有利弊。

      因此,本文針對正態(tài)分布資料,對揭盲狀態(tài)的條件把握度(conditional power,CP)法及盲態(tài)下的EM(expectation maximization,EM)算法進行研究和比較,進而探索將兩者相結合,組成更為嚴謹可行的樣本量再估計策略,應用于臨床試驗期中分析中,為實際應用提供建議。

      原理與方法

      1.信息時間

      設原定總樣本量為N,截止至期中分析時,每組完成了n例受試者的治療,則目前的信息時間為:

      (1)

      其中,0≤τ≤1,τ=0和1分別代表試驗開始及試驗結束,1-τ稱為剩余信息時間。

      2.條件把握度

      條件把握度,是基于當前已經收集到的觀察數(shù)據(jù),預測試驗結束后組間存在真實差別的概率,由Lan和Zucker (1993)[2]及Lan和Wittes (1988)[3]等基于布朗運動的特性提出的一種方法,其基本思想是:通過z統(tǒng)計量的函數(shù)構造服從布朗運動的統(tǒng)計量B,并根據(jù)z統(tǒng)計量的分布特性及兩者關系,推導出B值的分布,最后根據(jù)B分布和終止界值計算條件把握度。

      (1)條件把握度的計算

      條件把握度法應用較多,本文僅其主要過程,感興趣的讀者可以參考陳建平(2010)[4],獲取詳細的數(shù)學推理過程。

      (2)

      期中分析時θ估計值為:

      (3)

      (2)樣本量再估計

      根據(jù)公式(2)及公式(3)的表達式,可得:

      (4)

      當條件把握度等于期望值時,N即為調整后的每組樣本量。

      3.EM算法

      盲態(tài)下樣本量的再估計是指在第一階段受試者信息已獲取但是處理分配情況未知,即尚未揭盲時所進行的樣本量再估計。EM算法是 Dempster,Laind,Rubin[5]于 1977 年提出的求參數(shù)極大似然估計的一種迭代算法。1992年Gould & Shih[6]提出使用EM算法進行正態(tài)終點指標的盲態(tài)下樣本量再估計。

      (1)方差的再估計

      假定兩組樣本量分配比例為1:1,原定總樣本量為2n1,在n1人完成試驗時進行樣本量再估計。n1名受試者的觀察值:Z1,Z2,…,Zn1。假設Ii=1表示受試者i屬于x組,Ii=0表示受試者i屬于y組。根據(jù)Gould & Shih[6]的研究,受試者i屬于x組的概率:

      P(Ii=1|Zi)=

      (5)

      EM算法大體過程如下:

      首先用預先根據(jù)n1個受試者的數(shù)據(jù)計算出來的初始估計值σ0,μx,0,μy,0帶入E步計算Ii的估計值。

      E步:

      (6)

      M步:對數(shù)似然函數(shù)如下:

      x組和y組均數(shù)的極大似然估計值如下:

      (7)

      (8)

      方差的估計值如下:

      (9)

      重復E步和M步直至估計值趨于穩(wěn)定。隨后,使用穩(wěn)定的方差估計值進行樣本量再估計。

      (2)σ0,μx,0,μy,0初始值的設定

      初始值的設置是EM算法的重要步驟,將影響到EM算法是否能正常收斂。假定初始樣本量是2n1,在n1人完成試驗時進行樣本量再估計。n1受試者觀察值為Z1,Z2,…,Zn1(按從小到大順序排列)。假設pi=(i-0.5)/n1(i=1,2,…,n1)。假設qi=φ-1(pi)(i=1,2,…,n1)是標準正態(tài)分布的逆函數(shù)。應用最小二乘法對{(qi,Zi),i=1,2,…,n1}擬合一個簡單的線性回歸,假設b是回歸線的斜率,a是截距。

      (10)

      σ0,μx,0,μy,0初始估計值如下:

      σ0=b,μx,0=a-b/c,μy,0=a+b/c

      (11)

      根據(jù)Gould & Shih[6]的研究,c=5.71。

      (3)樣本量再估計

      假定原設計時初始樣本量是2n1,標準差是σ0,在n1個人完成試驗時進行樣本量再估計。再估計后算出的樣本量是N,標準差是σ1。

      根據(jù)Gould & Shih[7]的研究,

      N=2n1*(σ1/σ0)2

      (12)

      4.樣本量調整策略

      通常情況下,需要事先定義一個常數(shù)λ,如果再估計樣本量/初始樣本量>λ,則認為此時的估計值與試驗之初的估計值相差較大,需要重新計算樣本量。如果再估計樣本量/初始樣本量<λ,就可能不值得增加額外的人力物力財力來招募更多的受試者并獲得更多的數(shù)據(jù),這樣也會造成試驗期延長。

      Gould[7]建議,如果λ<1.33,那么繼續(xù)選擇初始樣本量;如果λ>1.33,那么選擇再估計樣本量;如果λ≥2,那么用初始樣本量的2倍作為新的樣本量;如果λ>>2,就終止試驗。

      模擬試驗設計

      1.模擬試驗一

      (1)目的

      針對相同的數(shù)據(jù)分別使用揭盲狀態(tài)的條件把握度法以及盲態(tài)的EM算法進行樣本量再估計,比較兩種方法的再估計效能。

      (2)試驗設計

      假設有一個雙盲隨機對照臨床試驗,設置兩組均數(shù)分別為9.5,10,總體標準差是1.78,試驗組與對照組樣本分配比例為1:1 ,按α=0.05和β=0.2估算得到初始樣本量N0為400,每組200。設計1次中期分析,在200例受試者完成試驗時分別采用條件把握度和EM算法進行樣本量再估計。假定200例受試者完成試驗時的數(shù)據(jù)分別是:Z1,Z2,…,Z200。實際的組間差別δ1,標準差σ1,

      樣本量再估計最小是400(初始樣本量),最大是1200(再估計樣本量的上限,本研究設為初始樣本量的3倍),少于400將被設置為400,大于1200時認為可以直接終止試驗并設為缺失值。

      擬采用兩種標準評價樣本量再估計方法效果:

      標準1: 1000次模擬中再估計樣本量與實際需要樣本量誤差不超過20%或者都超過1200的次數(shù),即0.8≤再估計樣本量/初始樣本量≤1.2或者再估計樣本量和際樣本量都超過1200的次數(shù);

      標準2: 1000次模擬中再估計樣本量與實際需要樣本量誤差不超過30%或者都超過1200的次數(shù),即0.7≤再估計樣本量/初始樣本量≤1.3或者再估計樣本量和實際樣本量都超過1200的次數(shù)。

      (3)參數(shù)設置

      表1 模擬試驗一參數(shù)及取值

      2.模擬試驗二

      (1)目的

      在模擬試驗一結果的基礎上,探索兩種方法相結合的樣本量再估計策略。模擬試驗采用SAS 9.4編程完成。

      (2)試驗設計

      基于模擬試驗一的假設,我們進一步探索當實際總體均數(shù)差值大于原假設并且實際標準差大于原假設標準差時將兩種方法相結合的設計,提高再估計的效能。如果樣本量超過初始樣本量一定程度時再采用條件把握度的方法進行非盲的樣本量再估計。試驗設計如下:

      設計1:當EMsize/400>1.4 時用CPsize代替EMsize,獲得合并設計的再估計效能。

      設計2:當EMsize/400>1.5 時用CPsize代替EMsize,獲得合并設計的再估計效能。

      設計3:當EMsize/400>1.6 時用CPsize代替EMsize,獲得合并設計的再估計效能。

      設計4:當EMsize/400>1.75 時用CPsize代替EMsize,獲得合并設計的再估計效能。

      設計5:當EMsize/400>2.0 時用CPsize代替EMsize,獲得合并設計的再估計效能。

      (3)參數(shù)設置

      基于模擬試驗一的結果,我們調整了總體組間差異以及標準差的取值(表2),其他參數(shù)和模擬試驗一相同。

      表2 模擬試驗二參數(shù)及取值

      模擬試驗均在SAS9.4下進行。

      結 果

      1.CP法及EM算法再估計的效能

      (1)使用20%以及30%兩種標準獲得的再估計效能差異不大,考慮到試驗設計修改增加的成本因素,建議后續(xù)模擬試驗采用30%。

      (2)使用條件把握度的方法在大多數(shù)情況下可以獲得較高的再估計效能。

      (3)實際總體均數(shù)(9.5,10)與原假設一致的情況下,使用EM算法進行樣本量再估計可以獲得超過90%的再估計效能。

      (4)由于模擬試驗設計的影響,當實際樣本量接近400或者1200時,可能會出現(xiàn)異常結果。通過調整再估計效能標準,已經驗證了這個情況。當總體樣本量為502時,由于400×120%<502<400×130%,標準1的再估計效能很低,標準2的再估計效能正常。

      (5)模擬試驗一結果顯示,當實際總體均數(shù)差值大于原假設并且實際標準差大于原假設標準差時,使用條件把握度的方法獲得的再估計效能高于使用EM算法獲得的再估計效能(表3)。

      表3 CP法及EM算法再估計的效能

      2.CP法及EM算法結合的樣本量再估計策略

      模擬試驗二結果顯示(表4):

      (1)均數(shù)差異大于初始值時越早使用條件把握度的方法,再估計效能越高。

      (2)當標準差一定時,組間差異越大,合并設計的再估計效能越大。實際總體標準差為2時接近初始標準差1.78,受EM方法的再估計效能較大影響,會有一點異常趨勢。

      表4 CP法及EM算法相結合的樣本量再估計

      討 論

      EM算法可以更大程度的保持試驗的完整性,但是無法對組間真實差異進行估計,也不能替代嚴謹?shù)脑囼炘O計,會造成假陰性的增加;條件把握度法能較準確地進行樣本量再估計,但是其會在一定程度上損害試驗的完整性。兩種方法各有利弊。因此,本研究提出一個新的設計,揚長補短,同時包含盲態(tài)下EM算法和非盲態(tài)下條件把握度法兩種樣本量再估計方法。適用于初始樣本量較大、費用較高、參考數(shù)據(jù)不完整或者不可靠的臨床研究。綜合表4的數(shù)據(jù)來看,考慮到要獲得較高的再估計效能盡量減少對試驗完整性的破壞,按照模擬試驗二設計2的標準,即大于初始樣本量1.5倍采用條件把握度的方法進行樣本量再估計,再估計效能均超過50%,絕大部分超過60%,在獲得較高的再估計效能的同時,可以避免隨意使用非盲態(tài)的方法,造成對試驗完整性的破壞,也能減少一部分假陰性的發(fā)生以及社會資源的浪費。在適應性設計計劃的期中分析中,保持申辦者和研究者的盲態(tài)非常重要,通常需要一個獨立的數(shù)據(jù)監(jiān)查委員會(Independent Data Monitoring Committee,IDMC)來通知申辦者是否按照事先擬定的方案修改進一步進行試驗。

      科學合理的設計是獲得客觀真實研究結果及試驗成功的前提。對于一個新的臨床試驗,都會有不少未知因素,科學合理的樣本量是試驗實施成功與否的最重要因素之一。過大的樣本量造成成本的增加和研究期限的延長,而過小的樣本量可能因試驗的檢驗效能過低而導致試驗失敗,使好的藥物不能及時上市,無論對申辦方還是對患者,都是很大的損失。樣本量再估計方法是自適應設計中的一種,就是在期中分析時根據(jù)正在進行的臨床試驗數(shù)據(jù),來調整試驗的樣本量,以使得該試驗擁有最合適的樣本量,得出應有的結論。

      EM算法在期中分析時不需要對累積數(shù)據(jù)進行揭盲的情況下,對數(shù)據(jù)的方差等進行在評估并重新估算樣本量,以保證試驗具有足夠的把握度;更大程度的保證試驗的完整性,同時無法對組間真實差異進行估計,受到美國FDA的青睞[8]。Gould & Shih[6]的研究顯示對于I類錯誤的影響微乎其微,甚至可以忽略不計。這也就意味著這種調整能夠以對α很小的犧牲為代價,換得試驗可進行調整樣本量以達到比較理想的檢驗效能。這也契合ICH E9須保持盲法以及控制I類錯誤的要求[9]。目前CFDA新版《藥物臨床試驗的生物統(tǒng)計學指導原則》已經描述了盲態(tài)下樣本量再估計的方法并建議可由IDMC[10-11]來執(zhí)行。同時也需要注意,EM算法估計獲得的樣本量顯著大于初始樣本量的時候就需要終止試驗。這樣做忽略了實際組間差異與初始組間差異的變異,會增加假陰性的概率。

      條件把握度的方法顯著的優(yōu)點就是可以及時監(jiān)測、及時調整,保證臨床試驗按預期順利完成。按照期中分析結果預測試驗結束時檢出真實差異的把握度或者概率,并且可以根據(jù)期望把握度,調整樣本含量,既保證試驗的檢驗效能,又可以避免不必要的資源浪費。同時也要注意到,本方法需要試驗中期揭盲,可能破壞試驗的完整性,引起Ⅰ類錯誤增大,必須在試驗數(shù)據(jù)揭盲之前在試驗方案中進行明確嚴謹?shù)谋硎?,避免揭盲對試驗的Ⅰ類錯誤及科學完整性的影響。

      本研究只關注了一次期中分析,沒有考慮I類錯誤的調整。如果研究計劃進行多次期中分析,需要與成組序貫試驗結合應用,I類錯誤率會隨著多重比較的次數(shù)增多而增長,因此必須嚴格控制α水準。常用的有Bonferroni法,Pocock法[12],O’Brien-Fleming法[13]和Lan and DeMets法[14]等。

      實際應用時還應該考慮到,盲態(tài)下能夠看出總體療效高于對照組預計療效或者一定的療效趨勢,并且由獨立數(shù)據(jù)監(jiān)察委員會(IDMC)[10-11]來判定是否進行非盲的樣本量再估計。不能僅僅根據(jù)數(shù)字大小下結論,破壞試驗的完整性,這就要求初始樣本量設計應該盡量科學合理,即使試驗中可以進行樣本量再估計。

      [1] 于莉莉,薛富波,王素珍,等.臨床試驗中自適應設計的樣本量再估計方法.中國衛(wèi)生統(tǒng)計,2008,25(6):657-659

      [2] Lan KK,Zucker DM. Sequential monitoring of clinical trials: The role of information and Brownian motion. Stat Med,1993,12:753-765.

      [3] Lan KK,Wittes J. The B-value: A tool for monitoring data. Biometrics,1988,44(2):579-85.

      [4] 陳建平,魏永越,陳峰,等.期中分析的條件把握度及樣本含量再估計.中國衛(wèi)生統(tǒng)計,2010,27(4):361-363

      [5] Dempster AP,Laird NM,Rubin DB. Maximum likelihood from incomplete data via the EM algorithm (with discussion). Journal of the Royal Statistical Society,1997,B39:1-38.

      [6] Gould AL,Shih WJ,Sample size re-estimation without unblinding for normally distributed outcomes with unknownvariance,Commun. Stat. Theory 2,1992:2833-2853.

      [7] Gould AL. Planning and revising the sample-size for a trial. Stat Med,1995,14:1039-1051.

      [8] FDA:Adaptive Design Clinical Trials for Drugs and Biologics(Draft Guidance) 2010.

      [9] ICH E9:Statistical Principles for Clinical Trials 1998.

      [10]CFDA:藥物臨床試驗的生物統(tǒng)計學指導原則2016.

      [11]FDA:Establishment and Operation ofClinical Trial Data MonitoringCommittees 2006.

      [12]Pocock SJ. Group Sequential Methods in the Design and Analysis of Clinical Trials. Biometrika,1977,64(2):191-199

      [13]O’Brien PC,Fleming TR. A Multiple Testing Procedure for Clinical Trials. Biometrics,1979,35(3):549-556.

      [14]DeMets DL,Lan KK. Interim Analysis: The Alpha Spending Function Approach. Stat Med,1994,15-30;13(13-14):1341-1352; discussion 1353-1356.

      猜你喜歡
      估計值樣本量標準差
      醫(yī)學研究中樣本量的選擇
      用Pro-Kin Line平衡反饋訓練儀對早期帕金森病患者進行治療對其動態(tài)平衡功能的影響
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
      航空裝備測試性試驗樣本量確定方法
      測控技術(2018年4期)2018-11-25 09:46:52
      統(tǒng)計信息
      2018年4月世界粗鋼產量表(續(xù))萬噸
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      對于平均差與標準差的數(shù)學關系和應用價值比較研究
      2014年5月世界粗鋼產量表萬噸
      醫(yī)學科技論文中有效數(shù)字的確定
      开江县| 土默特左旗| 汶川县| 凤山市| 乌鲁木齐县| 枞阳县| 浠水县| 江西省| 乐昌市| 萨嘎县| 江口县| 金阳县| 蒲江县| 稻城县| 贺州市| 孝感市| 南昌市| 治多县| 广安市| 隆安县| 东乡县| 什邡市| 新安县| 交口县| 留坝县| 耒阳市| 江源县| 三江| 德庆县| 方山县| 宁德市| 富川| 江津市| 襄垣县| 宜宾市| 乌兰察布市| 鄂托克旗| 昌吉市| 青冈县| 三台县| 枣强县|