• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于指數(shù)分布的生存資料盲態(tài)下樣本量再估計方法*

      2018-07-16 06:14:16李嬋娟蔣志偉王治東吳克堅夏結(jié)來
      中國衛(wèi)生統(tǒng)計 2018年2期
      關(guān)鍵詞:指數(shù)分布估計值樣本量

      朱 典 王 陵 李嬋娟 蔣志偉 張 威 王治東 吳克堅 李 晨 夏結(jié)來△

      【提 要】 目的 針對生存分析樣本量再估計的適應性設計臨床試驗,本文基于指數(shù)分布,提出盲態(tài)下生存資料的樣本量再估計方法。方法 采用蒙特卡洛模擬方法,預設4個期中分析時間點,以參數(shù)初始估計值M10為均數(shù)暫定搜索范圍為M10±0.5M10,在該搜索范圍內(nèi)產(chǎn)生指數(shù)分布隨機數(shù)對期中分析時的截尾生存數(shù)據(jù)進行填補,對填補后的數(shù)據(jù)進行極大似然估計,得到試驗參數(shù)的再估計值若落在搜索范圍外,則需更改搜索范圍以包含并重新進行搜索直至落在搜索范圍內(nèi),此時的即為試驗參數(shù)的再估計值,在此參數(shù)的基礎(chǔ)上重新估計樣本量,并比較4個期中分析點的樣本量再估計結(jié)果,確定1個最合適的期中分析時間點。 結(jié)果 經(jīng)過期中分析調(diào)整后的樣本量接近真實值,且期中分析時間點越向后移,樣本量估計結(jié)果越接近真實值,變異越小。 結(jié)論 建議在入組結(jié)束并完成1/4最短隨訪時間時進行一次期中分析重新估計樣本量,根據(jù)估計結(jié)果考慮是否增加樣本量。

      傳統(tǒng)的臨床試驗在試驗開展前,研究者根據(jù)前期研究結(jié)果并結(jié)合相關(guān)文獻設定試驗關(guān)鍵參數(shù),對樣本量進行估計,以期望達到設定的檢驗效能。但是,試驗開始前對參數(shù)的設定可能存在較大偏差,以此為基礎(chǔ)估計的樣本量有可能不足以達到預設的檢驗效能。而在適應性設計中允許在試驗開始之后根據(jù)已得到的部分試驗數(shù)據(jù)進行期中分析,重新估計樣本量,以使試驗達到預設的檢驗效能[1]。

      對于不同類型的數(shù)據(jù),需采用不同的樣本量再估計方法。對于正態(tài)資料,Gould[2]等人提出一種基于EM算法的盲態(tài)下樣本量再估計方法,在期中分析時對試驗數(shù)據(jù)的方差進行重新估計。對于二分類變量,Shih[3]等人提出一種基于分層理念的盲態(tài)下樣本量再估計方法,在期中分析時對兩組的事件發(fā)生率重新估計;Friede[4]等人提出一種基于負二項分布的盲態(tài)下樣本量再估計方法,在期中分析時以負二項分布為基礎(chǔ)建模,對總體率進行重新估計。對于生存資料,Togo[5]等人提出一種基于偏似然估計的樣本量再估計方法,在期中分析時對數(shù)據(jù)揭盲,并根據(jù)構(gòu)建的模型對兩組之間的風險比(HR)進行重新估計;Todd[6]等人提出一種基于外推法的盲態(tài)下生存數(shù)據(jù)樣本量再估計方法,假設兩組之間的風險比(HR)不變,試驗進展過程中在多個預設時間點上進行多次期中分析,并根據(jù)多次期中分析結(jié)果求效應的平均差別,推斷試驗結(jié)束時的生存率。

      期中分析時對試驗揭盲會導致Ⅰ型錯誤的膨脹,從而影響試驗的完整性。而在盲態(tài)下進行期中分析,對Ⅰ型錯誤的影響可以忽略,無需對檢驗水準進行校正[1]。本研究提出的生存資料樣本量再估計方法是在盲態(tài)下只進行一次期中分析,該方法以極大似然估計為基礎(chǔ),結(jié)合Todd[6]等人的研究方法,假定生存數(shù)據(jù)服從指數(shù)分布,兩組之間的風險比(HR)不變,在期中分析時對其他試驗參數(shù)進行重新估計,提出生存資料樣本量再估計的新方法。

      原理與方法

      對于服從指數(shù)分布的生存資料,期中分析在盲態(tài)下進行,其分組未知,相當于求解混合指數(shù)分布的參數(shù)問題。EM算法是Dempster[7]等人提出一種對于不完全數(shù)據(jù)進行參數(shù)估計的方法,以極大似然估計為基礎(chǔ)進行迭代,最終得到一個局部最優(yōu)參數(shù)估計的迭代算法。朱利平[8]等人將EM算法應用到電子元件的壽命試驗中。研究表明,樣本的截尾比例越大,EM算法參數(shù)估計的效率越差,且估計結(jié)果往往依賴于初始值和收斂標準的設定[8-9]。在對生存資料進行期中分析時,往往產(chǎn)生大量的截尾數(shù)據(jù)。因此,本研究提出填補數(shù)據(jù)的方法,在期中分析時,用參數(shù)的初始估計值產(chǎn)生模擬數(shù)據(jù),并用模擬數(shù)據(jù)中大于期中分析時間點的數(shù)據(jù)填補截尾數(shù)據(jù),經(jīng)過填補后的數(shù)據(jù)包含一定比例的真實參數(shù)信息和一定比例的填補參數(shù)信息。本研究結(jié)合EM算法的思想,但考慮到其參數(shù)估計結(jié)果依賴于初始值的設定,因此,提出在期中分析時以初始估計值為均值確定搜索范圍(hunting zone,HZ)對實際數(shù)據(jù)進行填補,然后,對填補后的數(shù)據(jù)進行極大似然估計。若初始估計值非常接近參數(shù)真實值,則此時參數(shù)的初始估計值與極大似然估計值也非常接近,則在搜索范圍內(nèi)篩選出參數(shù)的極大似然估計值與初始估計值之差最小的參數(shù)極大似然估計值作為期中分析時的參數(shù)估計值。

      極大似然法是混合分布參數(shù)估計的常用方法,期中分析時對服從混合指數(shù)分布的生存數(shù)據(jù)應用極大似然法,重新估計混合指數(shù)分布的參數(shù)進行樣本量再估計。期中分析時的數(shù)據(jù)是含有缺失數(shù)據(jù)的觀測數(shù)據(jù),若用K表示分組(未知),X表示觀測數(shù)據(jù),則包含分組的完整數(shù)據(jù)用Y表示:Y=(X,K)。λ是指數(shù)分布的參數(shù),f(K|X,λ)是給定觀測數(shù)據(jù)X=Xi,λ=λi的條件下缺失數(shù)據(jù)K的條件密度。通過對觀測數(shù)據(jù)X的對數(shù)似然函數(shù)lnL(λ|X)求極大值得到λ的極大似然估計值。期中分析時的生存時間為觀測數(shù)據(jù),用X表示,xi表示每個受試者的生存時間。受試者的分組情況用K表示,Ki=1表示受試者接受對照組治療,Ki=0表示受試者接受試驗組治療,因?qū)φ战M與試驗組的樣本量比例為1:1,所以Ki服從二項分布,π(Ki=1)=π(Ki=0)=0.5,但是,期中分析是在盲態(tài)下進行,因此Ki是不能被觀測到的隨機變量。用λc表示對照組的風險率,λt表示試驗組的風險率,則對照組受試者的生存時間服從指數(shù)分布f1i,其概率密度函數(shù)為:

      f1i=λce-λcxi(λc>0),

      試驗組受試者的生存時間服從指數(shù)分布f2i,其概率密度為:

      f2i=λte-λtxi(λt>0),

      則xi服從混合指數(shù)分布fi,其概率密度函數(shù)為:

      fi=0.5f1i+0.5f2i.

      在混合指數(shù)分布fi中,記θ=(λc,λt),則xi和Ki的聯(lián)合分布為:

      g(xi,Ki,θ)=(0.5f1i)Ki(0.5f2i)1-Ki,

      因此,Ki在xi給定時的條件分布為:

      xi給定時θ的似然函數(shù)為:

      對數(shù)似然函數(shù)為:

      給定參數(shù)初始估計值θ0(λc0,λt0)時,該對數(shù)似然函數(shù)的期望為:

      通過極大化Q(θ,θ0)函數(shù)可得到參數(shù)θ(λc,λt)的極大似然估計值[8]。

      在以事件為終點的隨機對照臨床試驗中,研究者根據(jù)以往數(shù)據(jù)估計受試者的生存時間,進而轉(zhuǎn)換為風險率λ進行樣本量計算。指數(shù)分布下風險率λ與中位生存時間M的轉(zhuǎn)換公式為:

      本研究中定義隨訪時間為最后一個受試者入組開始至研究結(jié)束所經(jīng)歷的時間。由于入組時間不同,因此最后一個入組受試者的隨訪時間決定了總研究時長,且所有受試者均隨訪至研究結(jié)束時間點,此時樣本量計算公式為(1)~(3)所示[10]:

      (1)

      (2)

      (3)

      公式(1)~(3)中,λc和λt分別是對照組和試驗組的風險率,T0是入組時間,T是總研究時長,k是試驗組和對照組的樣本含量比例,nc是對照組樣本量。

      采用Monte Carlo模擬構(gòu)建基于指數(shù)分布的生存資料模型,對模擬產(chǎn)生的生存資料進行l(wèi)og-rank檢驗,探討本研究方法對生存資料樣本量再估計的準確性和穩(wěn)定性。本研究所有數(shù)據(jù)均由模擬產(chǎn)生,采用SAS 9.1.3統(tǒng)計分析軟件編寫程序,并進行數(shù)據(jù)分析。

      1.參數(shù)設置

      對于一個基于log-rank檢驗的雙臂臨床試驗,對照組與試驗組樣本比例為1:1,生存時間服從指數(shù)分布。試驗的真實參數(shù)如下,對照組的中位生存時間為M1=1年,對照組與試驗組的風險比HR為0.65和0.75,試驗入組時間為T0=0.5年,受試者在入組期內(nèi)均勻入組,最短隨訪時間為t=2年,總研究時長為T=T0+t=2.5年,檢驗水準α為雙側(cè)0.05,檢驗效能1-β為0.8,則對照組的風險率λc為ln2/M1,試驗組的中位生存時間為M2=M1/HR,風險率λt為ln2/M2,試驗所需樣本量為N。

      在進行期中分析的臨床試驗中,一般進行1~2次期中分析,本模擬研究考慮最大可能性,設定4個期中分析時間點(interim,I),并比較4個期中分析時間點的樣本量再估計結(jié)果,最終選定一個合理的期中分析時間點。4個期中分析時間點分別為I1-I4,I1是入組結(jié)束時(T0),I2是完成1/4隨訪時間時(T0+0.25t),I3是完成1/2隨訪時間時(T0+0.5t),I4是完成3/4隨訪時間時(T0+0.75t)。

      2.模擬步驟

      (1)根據(jù)預先設定的參數(shù),運用SAS隨機函數(shù)ranexp(seed)先產(chǎn)生參數(shù)為M1、M2的指數(shù)分布數(shù)據(jù)x,受試者均勻入組,入組間隔為tn=T0/N0,入組順序即為隨機數(shù)的序號ob。令int=I-T0,令y=x-(N0-ob)×tn,將其中y>int者設定為y=int。

      (2)重復步驟(1)產(chǎn)生參數(shù)為HM10、HM20的指數(shù)分布數(shù)據(jù)x,用其中y>int者填補參數(shù)為M1,M2數(shù)據(jù)中y=int的截尾數(shù)據(jù),即為期中分析的數(shù)據(jù)。每個搜索范圍內(nèi)有多個HM10,以HZ1(0.25~0.75)為例,搜索間隔為0.1年,則有0.25、0.35、0.45、0.55、0.65、0.75共6種填補參數(shù),根據(jù)HR求得HM20,并以HM10、HM20為參數(shù)產(chǎn)生6組混合指數(shù)分布隨機數(shù),用該6組隨機數(shù)中y>int的數(shù)據(jù)分別填補一次截尾數(shù)據(jù),產(chǎn)生6組期中分析數(shù)據(jù)。

      模擬結(jié)果

      表1 不同HR時4個期中分析點不同HZ的樣本量再估計結(jié)果

      表2 不同HR時4個期中分析點HZ11的樣本量再估計結(jié)果

      圖1 不同HR時再估計樣本量與期中分析時間點、HZ之間的關(guān)系

      圖2 不同HR時再估計樣本量與期中分析時間點、HZ(包含參數(shù)真實值)之間的關(guān)系

      圖3 各期中分析時間點上HZ11-HZ5再估計樣本量的α(a)和power(b)

      模擬示例

      討  論

      藥物臨床試驗的投入巨大,而樣本量是否充足直接關(guān)系到試驗的成敗。若在試驗設計階段對試驗參數(shù)的估計存在較大的不確定性,建議采用適應性設計,預設期中分析點對樣本量進行再估計,根據(jù)估計結(jié)果考慮是否增加樣本量。一般期中分析時只考慮是否增加樣本量以維持把握度,而不考慮降低樣本量[1]。Todd[6]等人提出的盲態(tài)下樣本量再估計方法,需要設定多個期中分析時間點進行多次期中分析,具體實施有一定的難度。本研究提出的盲態(tài)下生存資料樣本量再估計方法,只需要進行一次期中分析。本研究假設對照組與試驗組的樣本量之比為1:1,風險比為HR,α為0.05,power為0.8,并假設5個不同的M10,并以M10為均值暫定搜索范圍為M10±0.5M10,比較4個期中分析點上不同搜索范圍下樣本量再估計結(jié)果。模擬研究表明,在期中分析點I2~I4,當搜索范圍包含參數(shù)真實值時,經(jīng)過期中分析調(diào)整后的樣本量接近真實值,且樣本量估計結(jié)果變異較小。在I1時間點時經(jīng)填補的期中分析數(shù)據(jù)包含真實參數(shù)信息較少,搜索結(jié)果與填補參數(shù)相關(guān)性較大,因此樣本量再估計結(jié)果呈現(xiàn)出與搜索范圍值大小相關(guān)的現(xiàn)象,但在I2~ I4時間點時未出現(xiàn)該現(xiàn)象。

      綜上所述,并考慮到實際應用中,若樣本量再估計結(jié)果大于初始樣本量,需要繼續(xù)追加樣本量,并完成相同的隨訪時間t,此時期中分析時間點越晚,則研究時間就越長,研究成本也隨之增加。因此,相似背景下建議在I2(完成1/4隨訪時間)時進行期中分析,根據(jù)參數(shù)估計結(jié)果重新確定搜索范圍,以獲得更加準確的樣本量。若是其他差異較大的背景時,1/4隨訪時間作為期中分析時間點劃分的參考依據(jù),可進行適當?shù)恼{(diào)整。若樣本量再估計結(jié)果比試驗設計之初的樣本量少,則維持原定樣本量不變;反之,則根據(jù)樣本量再估計結(jié)果考慮增加樣本量以維持把握度。本研究的不足之處是在HR恒定不變的假設下進行模擬研究,后續(xù)研究將會考慮HR改變時的情況。

      猜你喜歡
      指數(shù)分布估計值樣本量
      醫(yī)學研究中樣本量的選擇
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問題
      航空裝備測試性試驗樣本量確定方法
      統(tǒng)計信息
      2018年4月世界粗鋼產(chǎn)量表(續(xù))萬噸
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      指數(shù)分布抽樣基本定理及在指數(shù)分布參數(shù)統(tǒng)計推斷中的應用
      二元Weinman型指數(shù)分布隨機變量之和、差、積、商及比率的分布
      2014年5月世界粗鋼產(chǎn)量表萬噸
      自適應樣本量調(diào)整中Fisher合并P值法和傳統(tǒng)檢驗法的模擬比較
      丹寨县| 西平县| 常德市| 忻城县| 开鲁县| 柳江县| 西充县| 盐津县| 宣武区| 岱山县| 南华县| 随州市| 东安县| 横峰县| 东莞市| 汶川县| 阿拉善左旗| 邵武市| 丰顺县| 湖南省| 文水县| 余江县| 鄂州市| 大石桥市| 金川县| 永嘉县| 临沧市| 道真| 赣州市| 隆安县| 斗六市| 永宁县| 电白县| 留坝县| 攀枝花市| 仙居县| 财经| 罗江县| 贞丰县| 安丘市| 洛宁县|