劉振,吳群英,葉彩園
(桂林理工大學(xué)理學(xué)院,廣西 桂林 541004)
令X1,X2,…和Y1,Y2,…是兩個(gè)隨機(jī)變量序列,假定X1,X2,…為生存時(shí)間,有一個(gè)共同的未知的分布函數(shù)F(x)和密度函數(shù)f(x),Y1,Y2,…為刪失時(shí)間,也有一個(gè)共同的分布函數(shù)G(·),令生存時(shí)間Xi是刪失時(shí)間Yi的右刪失數(shù)據(jù),我們可以觀察到Zi=min(Xi,Yi)和δi=I(Xi≤Yi),這里I(·)為示性函數(shù),生存時(shí)間{Xi}和刪失時(shí)間{Yi}是相互獨(dú)立的,由于生存分析經(jīng)常應(yīng)用到壽命、醫(yī)學(xué)實(shí)驗(yàn)等實(shí)際領(lǐng)域,假定Xi和Yi均為非負(fù).與非刪失數(shù)據(jù)統(tǒng)計(jì)分析相比,我們觀察到的數(shù)據(jù)均是成對(duì)的數(shù)據(jù){Z1,δ1},{Z2,δ2},…,{Zn,δn},基于這些成對(duì)的數(shù)據(jù)Kaplan和Meier[1]提出了分布函數(shù)F和G的估計(jì)量分別定義如下:
這里Z(i)是Zi的次序統(tǒng)計(jì)量,Z(1)≤Z(2)≤…≤Z(n),δ(i)是與Z(i)的i相對(duì)應(yīng)的δi.以上估計(jì)簡(jiǎn)稱K-M估計(jì).
(1)
其中,窗寬0 (1)式定義的核密度估計(jì)的窗寬是固定的,要使對(duì)f的擬合效果更好,涉及最優(yōu)窗寬的選擇問(wèn)題;同時(shí)當(dāng)樣本容量n增加時(shí),需要重新計(jì)算估計(jì)量,這樣需要的計(jì)算量會(huì)很大.然而我們知道遞歸核密度估計(jì)量中窗寬不是固定的,因此對(duì)(1)式進(jìn)行改進(jìn),給出K-M估計(jì)下的f的遞歸核密度估計(jì)量fn: (2) (3) 這樣可以利用計(jì)算機(jī)編程進(jìn)行遞歸,當(dāng)樣本容量n增加時(shí),不用重新計(jì)算估計(jì)量. 本文中在刪失數(shù)據(jù)α混合序列條件下進(jìn)行討論,下面給出α混合的定義: α(m)(A∩B)-P(A)P(B)|}, 如果當(dāng)m→∞時(shí)α(m)→0,則稱{ξk,k≥1}是α混合的. 本文中假設(shè)如下: (1)設(shè){Xi:i≥1}是一個(gè)平穩(wěn)的α混合系數(shù)為α(m)的隨機(jī)變量序列,具有共同的概率密度函數(shù)f(x),{Yi:i≥1}是獨(dú)立具有相同分布函數(shù)G的隨機(jī)變量序列,且Xi和Yi相互獨(dú)立;假設(shè)α(m)=O(m-v),v>3. (2)核函數(shù)K(x)是R1上的概率密度函數(shù),有界并且可導(dǎo),其導(dǎo)數(shù)也有界. (3)設(shè)概率密度函數(shù)f(x)可導(dǎo)且導(dǎo)數(shù)有界. (4)窗寬滿足0 (4) (5) 則 (6) 推論若定理1的條件成立,則 (7) 若定理2的條件成立,則 (8) 引理1[6]設(shè)K(·)及g(·)均為R1的Borel可測(cè)函數(shù),滿足下述條件: 其中,c(g)為g的連續(xù)點(diǎn)集. (9) 其中,‖Xi‖2+δ(E|Xi|2+δ)1/(2=δ). (10) (11) 其中,an=n-1/2(loglogn)1/2. (12) 其中,an=n1/2(loglogn)1/2. 引理6[5]設(shè){Xi:i≥1}是α混合隨機(jī)變量序列,混合系數(shù)為α(n);{Yi:i≥1}是獨(dú)立同分布的隨機(jī)變量序列,若Xi和Yi獨(dú)立,則{(Xi,Yi)}也是α混合的,且混合系數(shù)為4α(n).特別地,{min(Xi,Yi);i≥1}是α混合的,混合系數(shù)為4α(n). (13) (14) (15) 類似于An1的處理方法,同理可得: (16) 根據(jù)K有界,結(jié)合(12)式及hn的遞減性, (17) 綜合(14)~(17)式,從而 An→0,a.s. (18) 又因?yàn)? (19) 觀察知 (20) 由Xi和Yi獨(dú)立性知: (21) 又根據(jù)f和K均為概率密度函數(shù)且都有界,用引理1得: (22) Wnk,,,根據(jù)Toeplitz引理得:→ 從而 (23) (24) (25) 由于: (26) 根據(jù)K和f有界,hn遞減且Xi和Yi獨(dú)立,結(jié)合(22)式,由Cr不等式得: (27) (28) (29) (30) 又由01則: (31) 根據(jù)定理1的證明得: An1=An3=Bn1=O(n-r),a.s.An2=O(na-1/2(loglogn)1/2),a.s.Bn4=O(δn)=O(n-2a-r) (32) (33) (34) (35) (36) 結(jié)合(34)~(36)式得: 根據(jù)Borel-Cantelli引理知 (37) 結(jié)合(32)~(33)式和(37)式得:An+Bn=O(n-a+na-1/2(loglogn)1/2),a.s. 由(13)式知定理2得證. 推論的證明由引理4得: (38) 根據(jù)定理1和引理4得 Ln1→0,a.s.,Ln2=O(an)=O(n-1/2(loglogn)1/2)→0,a.s. (39) 根據(jù)定理2和引理4得 Ln1=O(n-a+na-1/2(loglogn)1/2),a.s.,Ln2=O(an)=O(n-1/2(loglogn)1/2),a.s., 故推論得證. [1] Kaplan E L, Meier P. Nonparametric estimation from incomplete obserivations[J]. Amer Statist Assoc,1958,282(53):457-481. [2] Liang Hanying, Jacobo de Ua-lvarez. A Berry-Esseen type bound in kernel density estimation for strong mixing censored samples[J]. Journal of Multivariate Analysis,2009,100:1219-1231. [3] 劉志軍,金春.一類遞歸密度估計(jì)的強(qiáng)收斂[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),1984,14(3):443-448. [4] 李永明,楊善朝.NA列遞歸密度核估計(jì)的相合性[J].應(yīng)用數(shù)學(xué),2003,16(1):59-64. [5] Cai Z. Asymptotic properties of Kaplan-Meier estimator for censored dependent data[J]. Statist Probab Lett,1998,37:381-389. [6] 陳希孺,方兆本,李國(guó)英,等.非參數(shù)統(tǒng)計(jì)[M].上海:上??茖W(xué)技術(shù)出版社,1989:263. [7] Yang S C. Moment bounds for strong mixing sequences and their application[J]. Journal of Mathmatical Research and Ex position,2000,20(3):349-359. [8] 趙翌,楊善朝.α混合序列下的核密度估計(jì)量的相合性[J].應(yīng)用數(shù)學(xué),2009,22(4):807-814. [9] Cai Z W. Estimating a distribution function for censored time series data[J]. Multivariate Anal,2001,78:299-318.1 結(jié)論
2 幾個(gè)引理
3 定理的證明