宇世航,堵秀鳳,張水勝
(齊齊哈爾大學(xué) 理學(xué)院,黑龍江 齊齊哈爾 161006)
關(guān)于正態(tài)總體參數(shù)的估計(jì),在利用準(zhǔn)確數(shù)據(jù)樣本下的統(tǒng)計(jì)推斷,是非常經(jīng)典也非常完善的。然而,在許多實(shí)際問(wèn)題中,準(zhǔn)確測(cè)得我們感興趣的變量Xi是很困難的,或所需成本很高,或需要花費(fèi)大量時(shí)間。因此通常的辦法是,用可觀測(cè)的替代變量來(lái)代替,這些替代變量可由一些相對(duì)簡(jiǎn)單的方法獲得。在一般情況下與Xi之間具有很復(fù)雜的關(guān)系,例如=φ(Xi,ei),這里ei是測(cè)量誤差且與Xi獨(dú)立,φ是一個(gè)任意已知的函數(shù)。在這種情況下要對(duì)未知參數(shù)進(jìn)行有效的統(tǒng)計(jì)推斷是相當(dāng)困難的。一種解決辦法是使用一小部分核實(shí)數(shù)據(jù)撲捉變量與替代變量的關(guān)系,基于替代數(shù)據(jù)和核實(shí)樣本的推斷已經(jīng)引起國(guó)內(nèi)外學(xué)者的重視.例如。Sepanski和Lee[1]研究了基核實(shí)數(shù)據(jù)的非線性EV模型;Qihua Wang[2-5]、薛留根[6]等考慮基于替代與核實(shí)數(shù)據(jù)樣本應(yīng)用到線性和部分線性回歸模型中。本文,考慮替代與核實(shí)數(shù)據(jù)的樣本觀測(cè)下,構(gòu)造正態(tài)總體參數(shù)估計(jì)問(wèn)題。
考慮總體X~N(μ,σ2),帶有測(cè)量誤差的樣本數(shù)據(jù)是獨(dú)立同分布樣本,且與小部分核實(shí)樣本相互獨(dú)立,V為小部分核實(shí)數(shù)據(jù)的下標(biāo)集,再令
眾所周知,正態(tài)總體均值μ和方差σ2的極大似然估計(jì)為:
顯然在替代樣本數(shù)據(jù)下,此估計(jì)可能會(huì)存在很大的誤差,下面我們利用小部分核實(shí)數(shù)據(jù)重新修改這兩個(gè)參數(shù)的估計(jì)。這里用條件數(shù)學(xué)期望作為X的估計(jì),則:
利用核實(shí)數(shù)據(jù),
定理1
Appendix A
(A?W):W(?)有有界支撐的非負(fù)有界核函數(shù),且 ∫W(u)du=1。
(A?EX2):EX2<∞。
有:
定理37]在滿(mǎn)足Appendix A條件下,有:
在大樣本情況下,由定理3知μ的1-α置信度的置信區(qū)間為:
設(shè)X~N(1, 1),X=1.5X+δε,其中ε~N(0, 1),取bn=n-1/4,W(?)為Un(-1,1)的密度函數(shù)。核實(shí)數(shù)據(jù)與主要樣本的大小分別取 (n,N)=(10,30),(30,90),(60,180),(10,50),(30,150),(60,300),并在δ=0.35 和δ=0.75 下分別做了5000次重復(fù)運(yùn)算,計(jì)算結(jié)果見(jiàn)表1和表2。
表1 δ=0.35時(shí)均值μ的置信度為95%的置信區(qū)間
表2 δ=0.75時(shí)均值μ的置信度為95%的置信區(qū)間
從表中數(shù)據(jù)可見(jiàn),每個(gè)置信區(qū)間均覆蓋了總體μ的真實(shí)值,λ值越大,區(qū)間長(zhǎng)度越小,并且δ越小,區(qū)間長(zhǎng)度越小。這種借助核實(shí)數(shù)據(jù)的置信區(qū)間,增大了其覆蓋概率和置信精度。
[1] Sepanski.J.H,Lee L.F.Semiparametric Estimation of Monlinear Error-in-variables Models with Validation[J].Nonparametric Statist,1995,(4).
[2] Q.H.wang.Estimation of Partial Linear Error-in-variables Model with Validation Data[J].J.Multivaiate Anal,1999,(69).
[3] Wang Q.H.Estimation of Linear Error-in-covariable Models with Validation Data under Random Censorship[J].J Multivariate Anal.,2000,(74).
[4] Wang Q.H.,Rao J.N.K.Empirical Likelihood-based Inference in Linear Error-itovariables Models with Validation Data[J].Bioraetrika,2002,(89).
[5] 王啟華.核實(shí)數(shù)據(jù)幫助下誤差在反映線性模型經(jīng)驗(yàn)似然降維推斷[J].中國(guó)科學(xué)A輯,2004,(5).
[6] 薛留根.核實(shí)數(shù)據(jù)下非線性半?yún)?shù)EV模型的經(jīng)驗(yàn)似然推斷[J].數(shù)學(xué)學(xué)報(bào),2006,(1).
[7] 宇世航.核實(shí)數(shù)據(jù)下均值的估計(jì)[J].應(yīng)用概率統(tǒng)計(jì),2010,(10).