鄭成秋,王 迪,祁 鶴,徐 寶
均勻分布是一種常用的連續(xù)型分布,在理論上,它為證明隨機變量存在定理做出重大貢獻,在貝葉斯統(tǒng)計中,它還被用于某些參數(shù)的先驗分布[1],而且任何隨機變量經(jīng)由它的分布函數(shù)形成的隨機變量的分布都是均勻分布族中的特殊一員U(0, 1)[2],從而它與任何分布都能建立起聯(lián)系.應(yīng)用上,它廣泛存在于流行病學(xué),遺傳學(xué),交通流理論等許多概率模型中.因此關(guān)于均勻分布相關(guān)的統(tǒng)計推斷成為許多學(xué)者一直研究的內(nèi)容.Rossman A.I.,Short T.H.,Parks M.T.在 1998 研究了均勻分布參數(shù)的貝葉斯估計[3];許多學(xué)者研究了均勻分布參數(shù)的矩估計、極大似然估計及其性質(zhì)[4-8],討論了一類特殊均勻分布參數(shù)的抗耐性估計和分布區(qū)間中心的點估計量[9-10].均勻分布有著各種不同的類型,即不同的定義區(qū)間,本文在上述研究的基礎(chǔ)上,研究一類非對稱均勻分布參數(shù)的估計及其性質(zhì).耐抗性是提供對于數(shù)據(jù)的局部不良行為的非敏感性[11-12],故本文在已有文獻的基礎(chǔ)上,利用樣本的四分位矩這樣具有耐抗性質(zhì)的統(tǒng)計量,得到了一類非對稱均勻分布U(θ, 0)的參數(shù)θ的估計量θ?n,并討論了它的優(yōu)良性.
定義1[1]若隨機變量X的密度函數(shù)為θ,則稱該分布為區(qū)間(, 0)上的均勻分布,記作X~U(θ, 0).其分布函數(shù)為
定義2[1]設(shè)X1,X2,…,Xn為抽自某個已知總體的一組簡單隨機樣本,X(1),X(2),…,X(n)為相應(yīng)樣本的次序統(tǒng)計量,稱為樣本X1,X2,…,Xn的中位數(shù).
在上述定義的基礎(chǔ)上,我們給出如下樣本深度、四分位矩等概念.
定義3設(shè)X1,X2,…,Xn為抽自某個已知總體的一組簡單隨機樣本,X(1),X(2),…,X(n)為相應(yīng)樣本的次序統(tǒng)計量,稱為樣本的 深 度.稱樣 本X1,X2,…,Xn四分位數(shù)的深度,其中表達式[x]表示取整函數(shù),即不大于x的最大整數(shù).
定義4設(shè)X1,X2,…,Xn為抽自某個已知總體的一組簡單隨機樣本,X(1),X(2),…,X(n)為相應(yīng)樣本的次序統(tǒng)計量,稱為X1,X2,…,Xn的下四分位數(shù),稱FU=為樣本X1,X2,…,Xn的上四分位數(shù),稱dF=FU-FL為樣本X1,X2,…,Xn的四分位矩.
無偏性是估計量應(yīng)滿足的一個基本要求,無偏估計以及漸進無偏估計的定義如下.
定義5[1]設(shè)X1,X2,…,Xn為抽自某個已知總體的一組簡單隨機樣本,統(tǒng)計量是該總體參數(shù)θ的一個估計量,若?θ∈ Θ ,有,則稱為θ的一個無偏估計,否則稱θ?n為θ的有偏估計.若當樣本量n→ ∞ 時,則稱為θ的漸進無偏估計.
下述定理基于樣本X1,X2,…,Xn的四分位矩dF給出了參數(shù)θ的估計量.
定理1設(shè)X1,X2,…,Xn為抽自均勻分布X~U(θ, 0) (θ<0) 的一組 簡單隨機樣本 ,X(1),X(2),…,X(n)為相應(yīng)的次序統(tǒng)計量,dF為由次序統(tǒng)計量生成的樣本的四分位矩,若用樣本的四分位矩作為總體四分位矩的估計,則可以得到參數(shù)θ的一個估計量θ?n=-2dF.
證明 首先,計算均勻總體U(θ, 0) (θ<0)的四分位矩.根據(jù)四分位矩的定義,由解得,同理由解得
其次,計算樣本X1,X2,…,Xn的四分位矩,將分別在n=4m,n=4m+1,n=4m+2,n=4m+3四種情況下加以討論.
當n=4m時,中位數(shù)的深度相應(yīng)的四分位數(shù)的深度為k=,上四分位數(shù)和下四分位數(shù)分別為和因此,四分位矩為dF=FU-FL=
若用樣本的四分位矩作為總體的四分位矩的估計,則可以得到參數(shù)θ的如下形式的估計量
同理可得,當n=4m+1時,參數(shù)θ的估計量為時,參數(shù)θ的估計量為θ?n=-2dF=2[X(m+1)-X(n-m)].當n=4m+3時,參數(shù)θ的估計量為
由四分位矩這樣具有耐抗性質(zhì)的統(tǒng)計量得出的參數(shù)的估計量,同樣具有很好的耐抗性質(zhì),能夠體現(xiàn)出對于數(shù)據(jù)的局部不良行為的非敏感性.下述定理證明了均勻分布X~U(θ, 0) (θ<0)的參數(shù)θ的四分位矩估計量θ?n=-2dF還是θ的漸進無偏估計.
定理2設(shè)X1,X2,…,Xn為抽自均勻分布X~U(θ, 0) (θ<0)的一組簡單隨機樣本,X(1),X(2),…,X(n)為相應(yīng)的次序統(tǒng)計量,dF為由次序統(tǒng)計量生成的樣本的四分位矩,參數(shù)θ的一個估計量是漸進無偏估計.
證明 估計量θ?n是參數(shù)θ的漸近無偏估計,即
由于
從而當n=4m時,有當
同理可證,當n=4m+1時,有時,有
綜上所述,當n=4m,n=4m+1,n=4m+2及n=4m+3時,均有,因此估計量θ?n是參數(shù)θ的漸近無偏估計.一個好的估計量應(yīng)該等于被估計參數(shù),即一個隨機變量,它所取的值應(yīng)集中在未知參數(shù)的真值或均值附近.由四分位矩得出的估計量是參數(shù)的漸近無偏估計,即當樣本容量n無限增大時,近似無偏的估計量.
均勻分布是一種常見的連續(xù)型分布,由于其定義區(qū)間有諸多不同的形式,因此關(guān)于區(qū)間端點參數(shù)的估計形式也有很多,本文關(guān)注定義區(qū)間在坐標原點左側(cè)的均勻分布U(θ, 0) (θ<0)左端點參數(shù)q的估計問題,基于四分位數(shù)得到了端點參數(shù)的四分位估計,并且還證明了這一估計具有漸進無偏估計,在一定程度上豐富了均勻分布參數(shù)估計的形式與內(nèi)容,并能對均勻分布族進一步的理論和應(yīng)用研究方面起到一定的參考作用.