吳志超,程義斌,孫 波,郭寶才
(1. 浙江工商大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,浙江 杭州 310018; 2. 中國(guó)疾病預(yù)防控制中心環(huán)境與健康相關(guān)產(chǎn)品安全所,北京100021)
總體參數(shù)的區(qū)間估計(jì)是統(tǒng)計(jì)推斷的一個(gè)重要內(nèi)容,已廣泛應(yīng)用于經(jīng)濟(jì)與生產(chǎn)實(shí)踐.衡量置信區(qū)間的優(yōu)良性有兩個(gè)標(biāo)準(zhǔn):置信水平和區(qū)間長(zhǎng)度.給定置信水平,區(qū)間長(zhǎng)度越短,參數(shù)估計(jì)精度就越高.傳統(tǒng)的區(qū)間估計(jì)是按概率對(duì)稱(chēng)方法來(lái)選取的,即等尾置信區(qū)間.但對(duì)于偏態(tài)總體或偏態(tài)抽樣分布而言,等尾置信區(qū)間長(zhǎng)度顯然不是最短的.有許多學(xué)者針對(duì)最短置信區(qū)間問(wèn)題進(jìn)行了相關(guān)研究.如文獻(xiàn)[1-3]對(duì)正態(tài)總體方差的最短置信區(qū)間進(jìn)行了比較詳細(xì)的討論.王秀麗[4]介紹了均勻分布區(qū)間長(zhǎng)度的最短置信區(qū)間.徐美萍等[5]對(duì)Weibull分布中尺度參數(shù)的最短置信區(qū)間問(wèn)題進(jìn)行了研究.李廣正[6]討論了兩正態(tài)總體方差比的最短置信區(qū)間問(wèn)題.李云飛等[7]利用樣本分位數(shù)來(lái)構(gòu)造樞軸量,給出了雙參數(shù)指數(shù)分布的等尾置信區(qū)間.
Maxwell分布是可靠性統(tǒng)計(jì)和實(shí)踐中常見(jiàn)的壽命分布之一,制造行業(yè)、立式鏜床的使用壽命等均遵循該偏態(tài)分布,在統(tǒng)計(jì)動(dòng)力學(xué)中也有諸多應(yīng)用.國(guó)內(nèi)學(xué)者對(duì)這一問(wèn)題的研究比較少.桂春燕[8]給出了Maxwell分布的一些特性,但沒(méi)有討論參數(shù)估計(jì)的問(wèn)題.王曉紅等[9]在文獻(xiàn)[8]的基礎(chǔ)上給出了Maxwell分布參數(shù)的極大似然估計(jì)和Bayes估計(jì).文獻(xiàn)[10-13]構(gòu)建了統(tǒng)計(jì)質(zhì)量控制圖監(jiān)控Maxwell分布尺度參數(shù)的變化.
就筆者所知,還沒(méi)有文獻(xiàn)討論Maxwell分布參數(shù)的最短置信區(qū)間問(wèn)題.本文將構(gòu)建樞軸量來(lái)計(jì)算Maxwell分布尺度參數(shù)的最短置信區(qū)間,并與傳統(tǒng)的等尾置信區(qū)間進(jìn)行比較.最后用一個(gè)實(shí)例進(jìn)行分析和說(shuō)明.
若隨機(jī)變量X的概率密度函數(shù)為
則稱(chēng)X服從參數(shù)為σ的Maxwell分布,記作X~Maxwell(σ).
引理1設(shè)X1,X2,…,Xn為來(lái)自總體X的簡(jiǎn)單隨機(jī)樣本,那么σ2的極大似然估計(jì)為
(1)
引理2設(shè)總體X~Maxwell(σ),那么X2/2σ2服從形狀參數(shù)為3/2、尺度參數(shù)為1的伽馬分布,即X2/2σ2~Gamma(3/2,1).
(2)
即T的概率密度函數(shù)為
(3)
本文將T用作樞軸量來(lái)求解σ2的置信區(qū)間.
設(shè)X1,X2,…,Xn為來(lái)自總體X~Maxwell(σ)的樣本,若統(tǒng)計(jì)量L(X1,X2,…,Xn)和U(X1,X2,…,Xn)滿足
P(L<σ2
(4)
則稱(chēng)(L,U)為σ2的置信水平為1-α的置信區(qū)間.因?yàn)?/p>
所以式(4)等價(jià)于
(5)
(6)
由于樞軸量T的分布并不對(duì)稱(chēng),因此σ2的等尾置信區(qū)間長(zhǎng)度不是最短的,從而精度也不是最高的.圖1表示在不同的n下樞軸量T的圖像.
圖1 不同樣本容量下樞軸量T的概率密度曲線Fig.1 Probability density curves of T under different values of n
(7)
定理1設(shè)總體X服從Maxwell(σ),X1,X2,…,Xn為來(lái)自該總體的樣本,條件極值問(wèn)題(7)中的a,b應(yīng)滿足下列方程:
(8)
證明利用拉格朗日數(shù)乘法,令
H(a,b,λ)=1/a-1/b+λ[FT(b)-FT(a)-1+α],
對(duì)a,b分別求偏導(dǎo)數(shù)并令其為0,有
于是
a2fT(a)=b2fT(b)=-1/λ.
(9)
將樞軸量T的概率密度函數(shù)fT(t)代入式(9),化簡(jiǎn)得a1+3n/2e-a=b1+3n/2e-b,因此結(jié)論成立.
定理2Maxwell分布參數(shù)的最短置信區(qū)間存在.
令g′(w)=0,則有
其中w0=1+3n/2.即g(w)為單峰函數(shù),當(dāng)0
因?yàn)?/p>
由中值定理知:必存在a=a*(0w0),則(a*,b*)必為方程組(7)的最優(yōu)解.證畢.
定理3Maxwell分布參數(shù)的最短置信區(qū)間是唯一的.
因?yàn)?/p>
a*2fT(a*)=b*2fT(b*)=-1/λ*>0,a*<3n/2+1
所以
同理,
由于式(8)的復(fù)雜性,方程組沒(méi)有分析解.本文利用MATLAB來(lái)求方程組的數(shù)值解,樣本容量為n∈{2,3,…,20},結(jié)果如表1所示.
表1 σ2最短置信區(qū)間的精度分析Tab.1 The accuracy analysis of the shortest confidence interval for σ2
由表1可觀察到,在同一置信水平下,最短置信區(qū)間的精度一致優(yōu)于傳統(tǒng)的等尾置信區(qū)間,特別是在小樣本情況下,提升效果更顯著.隨著樣本容量的增大,兩者的差異性越來(lái)越小.
采用的實(shí)際數(shù)據(jù)來(lái)源于文獻(xiàn)[13].選取32個(gè)垂直鉆孔機(jī)數(shù)據(jù),立式鏜床的故障時(shí)間(h)如下:2 802,2 937,2 136,4 359,4 020,1 781,2 816,2 655,3 886,2 296,3 158,3 695,4 155,3 811,2 380,376,2 172,3 705,2 848,4 339,2 076,2 672,3 632,1 976,1 700,1 596,1 701,3 575,3 802,4 351,4 291,808.
文獻(xiàn)[13]已證明Maxwell分布最適合此數(shù)據(jù).
兩者的絕對(duì)誤差為44 441.3,相對(duì)誤差為2.45%.最短置信區(qū)間明顯小于等尾置信區(qū)間,說(shuō)明最短置信區(qū)間的精度更高.