張良勇,董曉芳
(河北經(jīng)貿(mào)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,河北 石家莊 050061)
排序集抽樣(ranked set sampling,RSS)方法是在估計澳大利亞農(nóng)場牧草產(chǎn)量時首次被提出的,已被廣泛應(yīng)用到系統(tǒng)可靠性、質(zhì)量管理、臨床醫(yī)學(xué)、生態(tài)環(huán)境等領(lǐng)域[1-6].排序集樣本不僅包含了樣本信息,還包含了次序信息.在實際中只要感興趣的樣本不易具體測量,但較容易直觀排序時,RSS方法比簡單隨機抽樣(simple random sampling,SRS)方法更加有效.例如,Awais等[5]將RSS方法應(yīng)用到產(chǎn)品質(zhì)量控制圖方面,并證實了其抽樣效率明顯高于SRS方法.Risch等[6]采用極值RSS方法對配對親屬進行遺傳相關(guān)性試驗,論證了試驗效率能得到顯著地提高.
隨著RSS方法的廣泛應(yīng)用,基于RSS的統(tǒng)計問題被研究,并獲得許多重要的成果.以下只列舉RSS下總體均值的非參數(shù)估計代表性研究成果.Dell等[7]利用排序集樣本均值估計總體均值,并證明了此估計量具有無偏性和適應(yīng)任意分布性.Ozturk[8]研究了總體均值的RSS極大似然估計.Bocci等[9]通過對意大利第5次農(nóng)業(yè)調(diào)查的實例分析,驗證了RSS方法在估計總體均值上的高效率.Balci等[10]給出了RSS下總體均值的修正極大似然估計量.Wang等[11]研究了臨床醫(yī)學(xué)中聚類隨機設(shè)計總體均值的RSS估計問題.李濤等[12]研究了無重疊k-序?qū)SS下總體均值的估計問題.
文獻[7-12]均通過估計效率的比較,證明了RSS方法的抽樣效率高于SRS方法.但是,這些文獻研究的RSS測量值都是完全數(shù)據(jù).然而在許多壽命試驗中,由于種種條件的限制只能得到隨機截尾數(shù)據(jù),其統(tǒng)計分析在可靠性工程、醫(yī)藥衛(wèi)生、環(huán)境科學(xué)等領(lǐng)域都有廣泛的應(yīng)用[13-14],因而研究RSS下隨機截尾數(shù)據(jù)的統(tǒng)計推斷就變得非常重要.平均壽命是刻畫產(chǎn)品壽命的重要度量指標(biāo),它在壽命分析中的地位相當(dāng)于完全觀測下的總體均值.為了提高估計效率,本文利用RSS下隨機截尾數(shù)據(jù),采用平均秩思想,構(gòu)建總體平均壽命的非參數(shù)估計量,分析新估計量的性質(zhì),并與SRS下相應(yīng)估計量進行估計效率的比較.
RSS方法的具體抽樣過程:第1步,從總體中隨機抽取m2個個體,隨機分為m組,每組m個;第2步,利用主觀經(jīng)驗判斷、專家觀點等易于獲得的直觀感知信息對每組進行由小到大的排序; 第3步,在第i個小組中抽出次序為i的個體,i=1,2,…,m.
以上過程稱為一次循環(huán),為了增大樣本量,循環(huán)重復(fù)k次.若令T(i)j表示在第j次循環(huán)中從第i組中抽出次序為i的樣本單元,則排序集樣本表示為
最終只對這n=mk個樣本單元進行實際測量.排序集樣本的顯著特點有:1)排序集樣本單元之間相互獨立;2)每一行的樣本單元之間獨立同分布;3)每一列都包含了各個秩次的信息.為簡便,排序集樣本一般記為T(i)j,i=1,2,…,m;j=1,2,…,k.
令非負隨機變量T表示產(chǎn)品的壽命,R(t)=P(T>t)表示T的可靠度函數(shù).當(dāng)T的分布未知時,想要估計T的平均壽命μ,定義為
(1)
令T(i)j,i=1,2,…,m;j=1,2,…,k為抽自T的排序集樣本;Cij(i=1,2,…,m;j=1,2,…,k)表示截尾的隨機變量,非負獨立同分布,具有分布函數(shù)G.在隨機截尾模型下,只能觀察到
Y(i)j=min(T(i)j,Cij),δ(i)j=I(T(i)j≤Cij),i=1,2,…,m;j=1,2,…,k.
對于任意的i(1≤i≤m)和j(1≤j≤k),Y(i)j的分布與j無關(guān),其分布函數(shù)為
H(i)(t)=P(Y(i)j≤t)=1-P(Y(i)j>t)=1-P(T(i)j>t,Cij>t)=1-R(i)(t)[1-G(t)],
其中,R(i)(t)為樣本量為m的SRS第i次序統(tǒng)計量的可靠度函數(shù).
從排序集抽樣過程可知,Y(i)1,Y(i)2,…,Y(i)k可以看作可靠度函數(shù)為R(i)(t)和平均壽命為μ(i)的隨機截尾模型下SRS樣本,其中μ(i)為樣本量為m的SRS第i次序統(tǒng)計量的平均壽命.這樣,可以利用Gill[15]的研究方法來構(gòu)建μ(i)的非參數(shù)估計量.
令Y(i:1:k)≤Y(i:2:k)≤…≤Y(i:k:k)是Y(i)1,Y(i)2,…,Y(i)k的次序值,μ(i)的非參數(shù)估計量定義為
(2)
其中,δ(i:r:k)是Y(i:r:k)的δ值.
根據(jù)式(2),采用平均秩思想,總體平均壽命μ的RSS非參數(shù)估計量定義為
(3)
下面證明一個重要的定理.
證明: 由文獻[16]知,對于任意給定的m,
于是
定理得證.
定理2若R和G連續(xù),且滿足
其中
證明:由式(3)、定理1和n=mk,得
其中
令T1、T2、…、Tn為抽自總體T的簡單隨機樣本,C1、C2、…、Cn表示截尾的隨機變量,非負獨立同分布,具有分布函數(shù)G.在隨機截尾模型下,只能觀察到Y(jié)i=min(Xi,Ci),δi=I(Ti≤Ci),i=1,2,…,n.設(shè)Y(1)≤Y(2)≤…≤Y(n)是Y1,Y2,…,Yn的次序值,δ(i)是對應(yīng)于Y(i)的δ值.Gill[15]定義了μ的SRS非參數(shù)估計量
(4)
表1 平均壽命估計量與的相對效率
表2 鋁條壽命中與的均方誤差
本文利用RSS下隨機截尾數(shù)據(jù),建立了總體平均壽命的非參數(shù)估計量,證明了新估計量的漸近正態(tài)性,給出了新估計量的漸近方差,模擬比較了新估計量與SRS下相應(yīng)估計量的估計效率,并進行了實際應(yīng)用分析,研究結(jié)果表明:RSS方法的抽樣效率高于SRS方法.