• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      慢性病發(fā)病率置信區(qū)間的構造

      2016-11-16 02:39:46白永昕田茂再蘭州財經大學統(tǒng)計學院甘肅蘭州730020中國人民大學應用統(tǒng)計科學研究中心中國人民大學統(tǒng)計學院北京00972
      高校應用數學學報A輯 2016年2期
      關鍵詞:樞軸置信水平克羅恩

      白永昕,田茂再,2(.蘭州財經大學統(tǒng)計學院,甘肅蘭州730020;2.中國人民大學應用統(tǒng)計科學研究中心中國人民大學統(tǒng)計學院,北京00972)

      慢性病發(fā)病率置信區(qū)間的構造

      白永昕1,田茂再1,2
      (1.蘭州財經大學統(tǒng)計學院,甘肅蘭州730020;2.中國人民大學應用統(tǒng)計科學研究中心中國人民大學統(tǒng)計學院,北京100972)

      在流行病研究中,發(fā)病率是一個重要指標,該指標反映的是特定人群中某種疾病的發(fā)病程度.因此,對它的置信區(qū)間的構造在判別疾病發(fā)病程度上具有重要的醫(yī)學意義.對于一些慢性疾(如癌癥或心血管等),由于其發(fā)病周期長,發(fā)病率低,Poisson抽樣下要比二項抽樣,逆項抽樣更符合事實.利用四種方法研究了泊松分布下慢性病發(fā)病率的置信區(qū)間構造,并通過Monte Carlo模擬對四種方法的表現性能進行比較.模擬結果表明:當發(fā)病率較高時,樞軸量方法無論在區(qū)間長度還是覆蓋率上都表現最佳;當發(fā)病率相對較低時,樞軸量方法在區(qū)間長度上略次于Wald統(tǒng)計量方法和得分方法,但是在覆蓋率上表現最佳.因此,樞軸量方法整體上表現的很好.

      發(fā)病率;Poisson抽樣;區(qū)間估計;Monte Carlo模擬

      1 引言

      Poisson分布是統(tǒng)計學中是一種常見的離散分布,用于描述單位時間內時間事件發(fā)生特定次數的概率.Poisson分布有如下的特點:(1)時間間隔很小的時,事件發(fā)生的次數很可能是0或者是1.(2)每個事件發(fā)生與否是相互獨立的.(3)事件發(fā)生的概率大小與時間間隔成正比.事實上,如果潛在疾病是罕見的或者發(fā)生是隨機的,則發(fā)病數在固定的一個時間間隔中服從Poisson過程.在流行病領域,一些慢性疾病(如癌癥或心血管等)的發(fā)病率低,發(fā)病周期長.因此,Poisson分布被廣泛使用(見[1-5]).

      在流病學中,對發(fā)病率,相對風險,風險差等參數置信區(qū)間估計的研究很多.Casella& Berger[3]基于二項,負二項,F分布之間的關系提出了逆抽樣下單比例置信區(qū)間的精確估計. Lui[4]通過Wald統(tǒng)計量,一致最小二乘無偏估計和似然比檢驗三種漸近方法構造了逆抽樣下風險差的置信區(qū)間.但是,在小樣本的情況下,漸近方法在區(qū)間覆蓋率和區(qū)間長度上存在一定的偏差.在此之下,Tang&Tian[5]提出了置信區(qū)間構造的鞍點逼近方法,并通過蒙特卡羅模擬證實:在小樣本的情況下,鞍點逼近方法表現最優(yōu).2008年,田和吳[6]發(fā)表了逆抽樣下發(fā)病率的漸近置信區(qū)間和逼近置信區(qū)間.隨后,Tang等人對逆抽樣下風險差的置信區(qū)間構造進行研究,相繼發(fā)表了逆抽樣下風險差的漸近置信區(qū)間和逆抽樣下風險差的逼近置信區(qū)間(分別見Tang& T ian[7]和Tang&T ian[8]).期間,吳等人[9]又提出了對逆抽樣下相對差置信區(qū)間構造W ald統(tǒng)計量估計方法和對數Wald統(tǒng)計量估計方法.

      同樣,在二項抽樣下相關參數置信區(qū)間的相關文獻也很多.在Chen[10]提出了在二項抽樣下風險差置信區(qū)間的兩種精確估計方法.Koopman[11]和M iettinen&Nurm inen[12]先后發(fā)表了相對風險置信區(qū)間的似然比檢驗估計方法.之后,Gart[13]推導了得分檢驗估計方法,并且該方法在多數情況下表現非常好.在前人研究的基礎上,錢等人[14]發(fā)表了二項抽樣下相對風險置信區(qū)間估計的鞍點逼近方法.

      大多數相關參數置信區(qū)間構造的研究都是基于二項抽樣和逆抽樣,Poisson抽樣下的有關文獻很少.Lui[15]中提出了Poisson抽樣下發(fā)病率置信區(qū)間的Wald估計方法和基于Fisher定理的改進方法.因此,基于前人的研究,本文在Poisson抽樣下分別通過Wald方法,基于Fisher定理的改進方法,樞軸量方法,得分方法,和似然比檢驗方法四種方法對發(fā)病率的置信區(qū)間進行估計,進而通過Monte Carlo模擬對此四種方法進行比較,以便今后進一步利用應用此結果.

      本文在§2介紹了置信區(qū)間四種估計方法的原理.§3通過M onte Carlo模擬對四種方法進行比較;§4運用實例加以驗證Monte Carlo的模擬結果;§5對模擬的結果進行評價.

      2 置信區(qū)間

      當潛在疾病是罕見時,通常假設發(fā)病人數在固定的一個時間間隔中服從Poisson過程.但是由于慢性病的發(fā)病期長,發(fā)病率低,在規(guī)定的時間間隔中觀察到的發(fā)病人數很有可能為0,因此,在疾病跟進期進行n次獨立重復試驗.那么在整個跟進期總的發(fā)病人數X服從如下Poisson分布:

      其概率密度函數為:

      其中,λ表示潛在的發(fā)病率,n?表示總的試驗次數.

      由矩估計方法n?λ=X,可以得到λ和方差λ的估計值為

      下面介紹關于發(fā)病率λ置信區(qū)間估計的四種方法.

      1 Wald方法

      考慮如下假設H0:λ=λ0對H1:λ/=λ0,Wald統(tǒng)計量為:

      在樣本量和大的情況下,Wald統(tǒng)計量近似的服從標準正態(tài)分布.即

      因此,可以得到λ的一個置信水平為100(1-α)%的置信區(qū)間如下

      其中,Zα/2是N(0,1)分布的1-α/2分位點.

      2樞軸量累積分布

      引理1(見文[3]中定理9.2.14)假設T是累積分布函數為FT(t|θ)=P(T≤t|θ)的一個離散統(tǒng)計量,α1+α2=α(0<α<1)是一個固定的值.對于每個t∈Γ,θL(t)和θU(t)定義如下:

      a如果對于每個t,FT(t|θ)是θ的遞減函數,有

      b如果對于每個t,FT(t|θ)是θ的遞增函數,有

      則隨機區(qū)間[θL(T),θU(T)]是θ的一個置信水平為1-α的置信區(qū)間.

      對于X~Poisson(n?λ),假定α1=α2=,X=x0是觀察值,由以上定理可得

      根據Γ分x布,Poisson分布以及χ分Z布 之間的特殊關系(見文[3]中例3.3.1),進一步得到

      其中,χ22(x0+1),α/2是自由度為2(x0+1)的卡方分布的α/2分位點.

      因此,求解方程(3)可以得到

      同樣,求解方程(4)可以得到

      則得到λ的一個置信水平為100(1-α)%的置信區(qū)間如下

      3得分檢驗

      考慮如下假設H0:λ=λ0對H1:λ/=λ0,有

      對于所有的λ都有ES(λ)=0,其方差為

      表1 Piossion分布,發(fā)病率λ=0.1,置信水平α=0.05

      從而有

      進一步轉化成求解關于λ的二次方程Aλ2+Bλ+C=0,其中

      從而得到λ的一h個置信水p平 為100(1-α)%的置信區(qū)間p為 i

      4似然比檢驗

      似然比檢驗是一種構造參數檢驗的方法,考慮假設H0:λ∈Λ0對H1:λ∈Λ/Λ0,似然比統(tǒng)計量為:

      其分子分母分別是似然函數在零假設和備擇假設上的最大值.

      對于發(fā)病率指標,考慮如下假設檢驗:H0:λ=λ0對H1:λ/=λ0.根據W ilks定理,在樣本量很大的時候滿足

      因此,可以從W的分布情況得到λ的一個置信水平為100(1-α)%的置信區(qū)間如下

      3 Monte Carlo模擬

      對于給出的四種置信區(qū)間,本文運用蒙特卡羅模擬從置信區(qū)間長度和覆蓋率兩個方面來進行比較.其中,通過參數恰好位于此區(qū)間的概率來衡量,即覆蓋率越接近置信水平越好.覆蓋率置信區(qū)間長度通過平均區(qū)間長度來衡量,即區(qū)間長度越短越好.

      進行模擬之前,考慮如下指標:置信水平α=0.05;每次試驗發(fā)病率為λ=0.001,0.01,0.1;跟進期間平均發(fā)病人數為n?λ=5,50,100.表1,表2,表3分別是發(fā)病率λ=0.001,λ=0.01和λ= 0.1,置信水平α=0.05下不同的平均發(fā)病人數得到的模擬結果(上邊的數表示覆蓋率,下面的數表示置信區(qū)間長度).

      從模擬的結果來看:在發(fā)病率很低(λ=0.001)的情況下,不論平均發(fā)病人數的多少,樞軸量方法的覆蓋率表現最好,其他方法均無差異.當平均發(fā)病人數很小(n?λ=5)時,W ald統(tǒng)計量方法在區(qū)間長度上都表現最好,樞軸量方法較差;當平均發(fā)病人數較大(n?λ=100)時,得分方法在0區(qū)間長度表現最好,樞軸量僅次于得分方法和Wald統(tǒng)計量方法.因此,在發(fā)病率很小的情況下,樞軸量方法表現出很好的優(yōu)勢,尤其在覆蓋率上.在發(fā)病率很高(λ=0.1)的情況下,樞軸量方法無論在區(qū)間長度還是在覆蓋率上都表現最好.其中,在覆蓋率上除樞軸量方法的其他方法均無差異.在區(qū)間長度上,樞軸量表現最好,得分方法和Wald統(tǒng)計量方法次之,似然比檢驗方法較差.因此,樞軸量方法整體上表現良好.

      表2 Piossion分布,發(fā)病率λ=0.01,置信水平α=0.05

      表3 P iossion分布,發(fā)病率λ=0.001,置信水平α=0.05

      4 實例分析

      例1患霍奇金淋巴瘤對甲狀腺癌發(fā)病率的影響

      霍奇金淋巴瘤(HL)是一種高度可治愈的疾病,在發(fā)病早期治愈率非常高,但在晚期會引起包括甲狀腺疾病在內的各種并發(fā)癥,隨之引發(fā)甲狀腺癌的風險也比正常人大了5-15倍.因此,文[15]對霍奇金淋巴瘤(HL)患者后來患甲狀腺癌的的風險和發(fā)病特點進行研究.實驗的對象是1969年到2008年之間接受治療的1981名霍奇金淋巴瘤患者,隨訪時間為14.3年,期間觀測到共有28個病人患甲狀腺惡性腫瘤.由此可知:n?λ=28,λ=0.014(數據來源見文[15]).

      通過上述四種方法構造的λ的95%置信區(qū)間比較見表4.

      表4的結果可以看出:極大似然方法估計的區(qū)間長度明顯偏大,得分方法估計的區(qū)間明顯右移.相比之下,Wald方法估計的區(qū)間長度最短,樞軸量方法僅次之Wald統(tǒng)計量方法.

      例2克羅恩病對直腸癌發(fā)病率的影響

      表4 患霍奇金淋巴瘤下甲狀腺癌發(fā)病率的95%置信區(qū)間

      表5 感染克羅恩病的直腸癌發(fā)病率的95%置信區(qū)間

      克羅恩病(CD)是一種發(fā)生在整個胃腸道的炎癥,因病因不明,很難有效治療.時間長的情況下,很可能發(fā)展成癌癥.在西方國家,克羅恩患者患結直腸癌(CRC)的風險一直被認為是很高的.而在日本,關于患有克羅恩病后,腸道癌和其他所有非腸道癌的標準化發(fā)病率比(SIR)的調查卻很少.文[6]研究了克羅恩疾病患者得癌癥的風險.從一所專門從事炎癥性腸病的醫(yī)院中找出770名克羅恩疾病患者.經觀察,在770個人中發(fā)現9例直腸癌(CRC).由此可知:n?λ=9,λ=0.0117(數據來源見文[6]).

      通過上述四種方法構造的λ的95%置信區(qū)間比較見表5.

      表5的結果表明:樞軸量方法在區(qū)間長度表現最好,Wald方法次之;得分方法估計的區(qū)間整體右移且區(qū)間長度偏大;似然比方法估計的置信區(qū)間最差.

      5 結論

      本文通過蒙特卡羅模擬對Poisson抽樣下發(fā)病率置信區(qū)間的四種估計方法進行比較,并對各種估計的性能進行評價.比較結果表明:當發(fā)病率相對較高時,樞軸量方法無論是在覆蓋率還是在區(qū)間長度上都表現的非常好.當發(fā)病率較低時,樞軸量方法在區(qū)覆蓋率上表現突出,在區(qū)間長度上的表現較差.因此,樞軸量方法在覆蓋率和區(qū)間長度上整體表現良好.

      [1]Yano Y,Matsui T,Hirai F,et al.Cancer risk in Japanese Crohn’s disease patients:investigation of the standardized incidence ratio[J].Journal of Gastroenterology and Hepatology,2013,28:1300-1305.

      [2]A liP A,W ilson J,Edge V L,et al.Community-level risk factors for notifiablegastrointestinal illness in the northwest territories,Canada,1991-2008[J].Bm c Public Health,2013,28:1471-2458.

      [3]Casella G,Berger R L.Statistical In ference[M].California:Duxbury,2001.

      [4]Kung-Jong Lui.Interval estimation on sim p le difference under independent negative binom ial sam pling[J].Biometrics,1999,41:83-92.

      [5]Tian Maozai,Tang M an-Lai,Ng H K T,et al.Con fidence intervals for the risk ratio under inverse sam p ling[J].Statistics in M ed icine,2008,27:3301-3324.

      [6]田茂再,吳喜之,李遠,等.逆抽樣下流行病發(fā)病率的逼近與漸近置信區(qū)間[J].系統(tǒng)科學與數學,2008,26(5):513-523.

      [7]Tang M an-Lai,T ian M aozai,Ng H K T,et al.Asym p totic confidence interval construction for risk difference under inverse sam p ling[J].Com putational Statistics and Data Analysis,2009,53:621-631.

      [8]Tang M an-Lai,Tian Maozai.App roximate con fidence interval construction for risk difference under inverse sam p ling[J].Statistics&Com puting,2010,20:87-98.

      [9]吳武琴,左艷芳,李會瓊,等.逆抽樣條件下相對差的估計[J].昆明理工大學學報,2009,34(5): 108-124.

      [10]Xun Chen.A quasi-exact method for the con fidence intervals of the difference of two independent binom ial p roportions in sm all sam p le cases[J].Statistics in M edicine,2002,21: 943-956.

      [11]Koopm an P A R.Con fidence lim its for the ratio of two binom ial p roportions[J].B iom etrics,1984,40:513-517.

      [12]Chan,Ivan S F,Zhang Z X.Com parative analysis of two rates[J].Statistics in Medicine,1985,4:213-226.

      [13]Gart J J.App roximate test and interval estimation of the common relative risk in the combination of 2×2 tab les[J].Biometrika,1985,72:673-677.

      [14]錢政超,張晨陽,孟令賓,等.二項抽樣下基于鞍點逼近方法的流行病相對風險置信區(qū)間構造[J].數學的實踐與認識,2014,44(21):513-523.

      [15]Kung-Jong Lui.Statistical Estim ation of Epidem iological Risk[M].New York:John W iley &Sons,2004.

      [16]M ichaelson E M,Chen Yuhui,Silver B,et al.Thyroid malignancies in survivors of hodgkin lym phom a[J].In ternational Journal of Radiation Oncology Biology Physics,2014,88(3): 637-640.

      M R Sub ject C lassification:62H 12

      Con fidence in terval construction for the incidence of ch ron ic d iseases

      BAIYong-xin1,TIAN Mao-zai1,2
      (1.School of Statistics,Lanzhou University of Finance and Econom ics.,Lanzhou 730020,China;2.Center for App lied Statistics,School of Statistics,Renm in University of China,Beijing 100872,China)

      In epidem iological studies,incidence of a disease is an im portant index which reflects the degree of the onset of a certain disease in the particu lar crowd.As a resu lt,the structure of the confidence interval of it has im portantmedical significance in judging disease extent.For some chronic diseases(such as cancer or cardiovascu lar,etc.),due to their long onset period and low incidence,Poisson sam p ling is in accord w ith the factsmore than binom ial sam p ling and inverse sam p ling.Four m ethodsw ere used to study the construction of con fidence interval for the incidence of chronic d iseases under poisson distribution,and the performance p ropertiesof the fourmethodswere com pared through m onte carlo simu lation.Simu lation results show that w hen higher incidence,p ivot m ethod did very well in both coverage and the interval length.W hen rates are relatively lower,pivotmethod is slightly in ferior to W ald statistic m ethod and them ethod of scoring on the interval length,but it d id the best on the coverage.As a resu lt,the overall performance of pivotmethod is very good.

      incidence of a d iseases;Poisson sam p ling;the estim ation of confidence intervals;Monte Carlo simu lation

      O212.4

      A

      1000-4424(2016)02-0136-07

      2015-09-03

      2016-05-03

      教育部哲學社會科學研究重大課題攻關項目(15JZD015);國家自然科學基金(11271368);北京市社會科學基金重大項目(15ZDA 17);教育部高等學校博士學科點專項科研基金(20130004110007);國家社會科學基金重點項目(13AZD 064);教育部人文社會科學重點研究基地重大項目(15JJD 910001);中國人民大學科學研究基金(中央高?;究蒲袠I(yè)務費專項資金資助)項目成果(15XNL008);蘭州財經大學“飛天學者特聘計劃

      猜你喜歡
      樞軸置信水平克羅恩
      WK-35 電鏟中央樞軸液氮冷裝工藝研究
      面向神經機器翻譯的樞軸方法研究綜述
      探討參數區(qū)間估計中樞軸量的選取——以單個正態(tài)總體均值為例
      產品控制與市場風險之間的相互作用研究
      克羅恩病早期診斷的研究進展
      克羅恩病與腸系膜脂肪
      移植糞便治療克羅恩病
      單因子方差分析法在卷煙均勻性檢驗中的研究與應用
      用VaR方法分析中國A股市場的風險
      大經貿(2017年1期)2017-03-17 00:24:32
      抽水蓄能電站球閥樞軸軸套故障分析及改造
      衡南县| 文成县| 平果县| 根河市| 肥东县| 阳春市| 瑞丽市| 马公市| 女性| 巩义市| 晋州市| 凤冈县| 呼和浩特市| 平塘县| 托克托县| 车致| 新竹市| 乌恰县| 门源| 南部县| 吴忠市| 大悟县| 库伦旗| 杂多县| 济宁市| 慈利县| 东乌珠穆沁旗| 南部县| 禄丰县| 利川市| 枣强县| 布尔津县| 林芝县| 镇江市| 开江县| 徐汇区| 富阳市| 桓台县| 定安县| 育儿| 青州市|