劉 芹,周菊玲
(新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,新疆 烏魯木齊 830017)
在可靠性分析與壽命分析等領(lǐng)域中,常會出現(xiàn)數(shù)據(jù)缺失的情形,而雙邊定數(shù)截尾數(shù)據(jù)是一種特殊的缺失數(shù)據(jù),其模型為:在可靠性實(shí)驗(yàn)中假定選取n個產(chǎn)品投入實(shí)驗(yàn),直到r個產(chǎn)品失效時(shí)終止實(shí)驗(yàn),設(shè)觀察到的次序失效數(shù)據(jù)為x1≤x2≤…≤xr。在實(shí)際問題中,由于實(shí)驗(yàn)手段等其他因素的影響,導(dǎo)致有些數(shù)據(jù)未被觀察到。假設(shè)前s-1個數(shù)據(jù)丟失,則剩下的次序數(shù)據(jù)xs≤xs+1≤…≤xr,1≤s≤r≤n,此數(shù)據(jù)即為雙邊定數(shù)截尾樣本。對于此類樣本,有不少學(xué)者對其展開了研究,李艷玲[1]研究了雙參數(shù)指數(shù)分布在雙邊定數(shù)截尾下的貝葉斯預(yù)測問題,郭紅瑩等[2]、鄧嚴(yán)林[3]在雙邊定數(shù)截尾下分別研究了Burr分布、Topp-Leone分布參數(shù)的Bayes估計(jì),田霆[4]在雙邊定數(shù)截尾下討論了Weibull分布兩參數(shù)的聯(lián)合置信區(qū)間。
Pareto分布是一種重要的壽命分布,具有遞減的失效函數(shù),因此常被應(yīng)用于個人收入、股票價(jià)格的波動、保險(xiǎn)風(fēng)險(xiǎn)等模型。該分布的概率密度函數(shù)及分布函數(shù)為:
(1)
式中:a>0,θ>0,a為尺度參數(shù),θ為形狀參數(shù)。近年來關(guān)于Pareto分布的研究有很多,例如,李如兵等[5]在移動極值排序集抽樣下,針對共軛先驗(yàn)和杰弗萊先驗(yàn),研究了Pareto分布形狀參數(shù)的Bayes估計(jì);周巧娟等[6]基于定數(shù)截尾數(shù)據(jù),在復(fù)合Mlinex損失下,研究了Pareto分布參數(shù)的穩(wěn)健Bayes估計(jì);劉璐等[7]在定數(shù)截尾試驗(yàn)時(shí),給出了Pareto分布參數(shù)的最優(yōu)置信區(qū)間,使得估計(jì)更加精確;Han等[8]在不同損失函數(shù)下研究了Pareto分布形狀參數(shù)的E-Bayes估計(jì)及其均方誤差。本文在前面學(xué)者研究的基礎(chǔ)上,基于雙邊定數(shù)截尾樣本研究Pareto分布在LINEX損失函數(shù)和復(fù)合LINEX函數(shù)下參數(shù)的Bayes估計(jì)問題。
在Bayes統(tǒng)計(jì)決策中,無信息先驗(yàn)分布和共軛先驗(yàn)分布是兩種常用的先驗(yàn)分布,Pareto分布參數(shù)的這兩類先驗(yàn)分布有如下形式:
(2)
(3)
對于雙邊定數(shù)截尾樣本,當(dāng)產(chǎn)品服從Pareto分布時(shí),記x=(xs,xs+1,…,xr),則由文獻(xiàn)[2]知樣本(xs,xs+1,…,xr)的聯(lián)合分布密度函數(shù)為:
(4)
將(1)式帶入式(4)得到
(5)
取LINEX損失函數(shù)
Lc(θ,δ)=ec(θ-δ)-c(θ-δ)-1,c≠0
(6)
這里討論c>0的情況。
引理1 在LINEX損失函數(shù)下,對于任意先驗(yàn)分布π(θ),θ的Bayes估計(jì)為
(7)
且若此估計(jì)的Bayes風(fēng)險(xiǎn)有限,則它是唯一的Bayes估計(jì)。
定理1 設(shè)X=(X1,X2,…,Xn)是服從Pareto分布的簡單隨機(jī)樣本,在LINEX損失函數(shù)下,有以下兩種情況
(8)
(9)
證(i)由(2)和(5)式,根據(jù)Bayes公式可得θ在無信息先驗(yàn)分布下的后驗(yàn)分布
(10)
式(10)的分母可化為
由引理1可知,在無信息先驗(yàn)分布下參數(shù)的Bayes估計(jì)為
(ii)由(3)和(5)式,根據(jù)Bayes公式可得參數(shù)θ在共軛先驗(yàn)分布下的后驗(yàn)分布為
(11)
由引理1可知在共軛先驗(yàn)分布下參數(shù)的Bayes估計(jì)為
復(fù)合LINEX損失函數(shù)的表達(dá)式為
L(θ,δ)=L-c(θ,δ)+Lc(θ,δ)=e-c(θ-δ)+ec(θ-δ)-2,c>0
引理2 在復(fù)合LINEX損失函數(shù)下,對任意先驗(yàn)分布π(θ),θ的Bayes估計(jì)為
(12)
定理2 設(shè)X=(X1,X2,…,Xn)是服從Pareto分布的簡單隨機(jī)樣本,在復(fù)合LINEX損失函數(shù)下,有以下兩種情況
(13)
(14)
由引理2,類似定理1 的證明過程即可證得。
表1 模擬結(jié)果
由表1可知,在同一個損失函數(shù)下,對比兩先驗(yàn)先分布下參數(shù)估計(jì)的均方誤差,發(fā)現(xiàn)共軛先驗(yàn)分布下參數(shù)估計(jì)的均方誤差較小,因此參數(shù)θ取共軛先驗(yàn)分布時(shí),參數(shù)的Bayes估計(jì)更接近真值;在同一個先驗(yàn)分布下,LINEX損失函數(shù)下參數(shù)的Bayes估計(jì)的均方誤差較小,同時(shí)在LINEX損失下,參數(shù)θ取共軛先驗(yàn)分布時(shí),參數(shù)的Bayes估計(jì)模擬效果更好。
Arnold在其著作中給出了一組服從Pareto分布的數(shù)據(jù)。 50名高爾夫球手收入超過70 000美元,他們到1980年為止的收入為3581、1690、1433、1184、1066、1005、883、841、778、753、2474、1684、1410、1171、1056、1001、878、825、778、746、2202、1627、1374、1109、1051、965、871、820、771、729、1858、1537、1338、1095、1031、944、849、816、769、712、1829、1519、1208、1092、1016、912、844、814、759、708美元,且這些數(shù)據(jù)服從尺度參數(shù)a≈703,形狀參數(shù)θ≈2.23的Pareto分布。
首先將上述數(shù)據(jù)按照由小到大的順序排列,然后利用R軟件根據(jù)這組數(shù)據(jù)選取其中符合要求的部分進(jìn)行參數(shù)估計(jì)。這里僅考慮在不同損失函數(shù)下先驗(yàn)分布選Γ分布的參數(shù)估計(jì),設(shè)c=10,α=100,β=100。結(jié)果如表2所示。
表2 形狀參數(shù)的Bayes估計(jì)
由表2可知,當(dāng)樣本量一定并且先驗(yàn)分布選Γ分布時(shí),參數(shù)在LINEX損失下估計(jì)的偏差最小,此時(shí)的參數(shù)估計(jì)效果較好,且與數(shù)值模擬的結(jié)果一致。
雙邊定數(shù)截尾是一種在可靠性試驗(yàn)中會遇到的特殊截尾數(shù)據(jù)。本文在雙邊定數(shù)截尾場合下,基于LINEX損失函數(shù)和復(fù)合LINEX損失函數(shù),采用Bayes估計(jì)的方法對Pareto分布中的形狀參數(shù)進(jìn)行估計(jì)。在無信息先驗(yàn)分布和Γ先驗(yàn)分布下,將不同損失函數(shù)下參數(shù)的Bayes估計(jì)與其真值進(jìn)行比較分析,結(jié)果表明,在LINEX損失下,選用Γ先驗(yàn)分布時(shí),參數(shù)估計(jì)更接近真值,并且通過實(shí)例也驗(yàn)證了此結(jié)論。