張建軍, 喬松珊
(1.河南農(nóng)業(yè)大學(xué) 信息與管理科學(xué)學(xué)院, 鄭州 450002; 2.中原工學(xué)院 信息商務(wù)學(xué)院, 鄭州 450007)
?
張建軍1*, 喬松珊2
(1.河南農(nóng)業(yè)大學(xué) 信息與管理科學(xué)學(xué)院, 鄭州 450002; 2.中原工學(xué)院 信息商務(wù)學(xué)院, 鄭州 450007)
基于分層排序集樣本提出了總體均值的改進(jìn)比率估計(jì)方法,討論了改進(jìn)比率估計(jì)量的均方誤差和偏差估計(jì)式,證明了改進(jìn)的比率估計(jì)比原來(lái)的聯(lián)合比率估計(jì)更加有效.最后,利用一組幼兒黃疸病膽紅素含量的數(shù)據(jù)進(jìn)行實(shí)例分析,結(jié)果表明,基于分層排序集樣本的改進(jìn)比率估計(jì)可以有效提高估計(jì)精度.
輔助變量; 分層抽樣; 排序集抽樣; 改進(jìn)比率估計(jì)
排序集抽樣是另一種利用輔助信息提高抽樣效率的方法,具體過(guò)程為,從總體1次抽取r2個(gè)樣本,隨機(jī)地劃分為r組,對(duì)每組樣本進(jìn)行排序,從第i組抽取秩為i的樣本單元并具體測(cè)量,i=1,2,…,r.類似過(guò)程重復(fù)m次,得到樣本量為mr的排序集樣本,記為X(i)j,i=1,2,…,r;j=1,2,…,m.排序集抽樣下的比率估計(jì)已有一些研究結(jié)果,文獻(xiàn)[3]利用排序集樣本討論了總體均值的比率估計(jì),并證明該方法有效提高了估計(jì)精度;文獻(xiàn)[4]與文獻(xiàn)[5]采用不同的方式對(duì)排序集抽樣下的比率估計(jì)形式進(jìn)行改進(jìn).
研究發(fā)現(xiàn),總體參數(shù)的估計(jì)精度很大程度上依賴于對(duì)輔助信息的利用程度,鑒于此,文獻(xiàn)[6]探討了輔以排序集樣本的分層抽樣方法,分析了總體均值的簡(jiǎn)單估計(jì)量及性質(zhì),文獻(xiàn)[7]利用排序集抽樣代替隨機(jī)抽樣,基于分層排序集抽樣構(gòu)造比率估計(jì)量.為了進(jìn)一步在估計(jì)量設(shè)計(jì)階段提高分層比率估計(jì)的精度,文中基于分層排序集樣本討論了一種新改進(jìn)的比率估計(jì)方法.第1部分介紹分層排序集抽樣下改進(jìn)比率估計(jì)的構(gòu)造方法;第2部分討論了新改進(jìn)比率估計(jì)的均方誤差和估計(jì)量偏移;第3部分研究了估計(jì)量中參數(shù)的優(yōu)化方法;第4部分證明了改進(jìn)比率估計(jì)可以有效提高估計(jì)精度;最后,通過(guò)實(shí)際例子進(jìn)一步分析,并給出結(jié)論.
(Xh(1)k,Yh[1]k),(Xh(2)k,Yh[2]k),…,(Xh(rh)k,Yh[rh]k),k=1,2,…,m;h=1,2,…,L,
其中,Xh(i)k為變量X在第h層秩為i的次序統(tǒng)計(jì)量,Yh[i]k為伴隨變量,i=1,2,…,rh.
若μX已知,則總體均值μY的聯(lián)合比率估計(jì)量為:
(1)
簡(jiǎn)單隨機(jī)抽樣下,Prasad(1989)曾經(jīng)提出如下的比率估計(jì)量[8]
(2)
(3)
為了比較改進(jìn)的估計(jì)量是否比原來(lái)的估計(jì)量更加有效,下面來(lái)分析估計(jì)量的偏差與近似方差.
其中,TXh(i)=μXh(i)-μXh,TYh[i]=μYh[i]-μYh,μYh[i]=E(Yh[i]),μXh(i)=E(Xh(i)),TXhYh(i)=TXh(i)·TYh[i],ρXhYh為變量X,Y在第h層的相關(guān)系數(shù).
(4)
TXhYh(i)=TXh(i)·TYh[i],TXh(i)=μXh(i)-μXh,
TYh[i]=μYh[i]-μYh,
μYh[i]=E(Yh[i]),μXh(i)=E(Xh(i)),
從而
(5)
由文獻(xiàn)[3]可知
其中,TXh(i)=μXh(i)-μXh,μXh(i)=E(Xh(i)),代入(5)中得到
(6)
故
由引理1,得到
由于TXhYh(i)=TXh(i)·TYh[i],從而
(7)
(8)
引理3[7]分層排序抽樣下總體的比率估計(jì)量為近似無(wú)偏估計(jì),并且
(9)
下面,利用上述引理給出改進(jìn)比率估計(jì)量的方差和偏差估計(jì)式.
證明利用引理3結(jié)論,可以得到
(10)
將引理2的結(jié)論代入(10),得到
從而
(11)
根據(jù)引理1的結(jié)論,可知
下面,考慮如何利用輔助信息確定待定系數(shù)k,計(jì)算待定系數(shù)的原則是估計(jì)量的均方誤差最小,故將均方誤差表達(dá)式視為系數(shù)k的函數(shù), 具體過(guò)程如下:
解方程得到最優(yōu)參數(shù)值,
(12)
由引理2容易看出0 注意,在實(shí)際計(jì)算系數(shù)k*時(shí),可以用樣本均值代替μY,各層的方差也可以用相應(yīng)的樣本方差代替,估計(jì)量方差的計(jì)算類似. (13) 事實(shí)上,根據(jù)(12),即 通過(guò)計(jì)算,得到分層排序集抽樣下各層樣本方差sx1=0.5850,sx2=0.2587,sy1=41.304,sy2=18.298,樣本均值μx1=2.911,μx2=2.631,μy1=12.878,μy2=10.838,以及相關(guān)系數(shù)ρx1y1=0.259,ρx2y2=-0.318.用各層的樣本方差代替各層總體方差,利用公式(12),得到分層排序抽樣下改進(jìn)比率估計(jì)的待定系數(shù)k=0.992.由公式(7)、(8)、(10)可分別求出總體均值在不同比率估計(jì)形式下的方差,并計(jì)算出相應(yīng)的估計(jì)值,結(jié)果見(jiàn)表2. 表1 基于SSRS與SRSS的抽樣結(jié)果 表2 總體均值的不同比率估計(jì)結(jié)果 容易計(jì)算估計(jì)的相對(duì)效率為eff(ySRSS,ySSRS)=0.819,eff(ykSRSS,ySSRS)=0.984.計(jì)算結(jié)果表明,分層排序集抽樣下均值的比率估計(jì)精度比分層隨機(jī)抽樣下的估計(jì)精度明顯提高,基于分層排序集樣本的改進(jìn)比率估計(jì)比原有估計(jì)量的估計(jì)精度也有所提高,與前者相比估計(jì)效率的提高不是十分明顯,分析原因主要是由于所選取例子中兩變量的相關(guān)性不高造成的,對(duì)于輔助變量與研究變量相關(guān)性較強(qiáng)的情形,讀者可做進(jìn)一步研究. 分層排序集抽樣方法充分利用了輔助信息,是一種新的獲取樣本的手段,文中基于分層排序集樣本構(gòu)造了總體均值的改進(jìn)比率估計(jì)量,研究了改進(jìn)比率估計(jì)的性質(zhì),并給出了改進(jìn)比率估計(jì)量的偏差和均方誤差的近似估計(jì)式.最后,利用實(shí)際例子作進(jìn)一步分析,結(jié)果表明,改進(jìn)比率估計(jì)的均方誤差最小,特別是與分層隨機(jī)抽樣方法相比,有效地提高了估計(jì)量的精度. [1] KADILAR C, CINGI H. Ratio estimators in stratified random sampling[J].Biometrical Journal, 2003, 45(2):218-225. [2] KADILAR C, CINGI H. A new ratio estimators in stratified random sampling[J].Comm Statist Theor Meth, 2005, 34:597-602. [3] SAMAWI H M. Estimation of ratio using rank set sampling[J].Biometrical Journal, 1996, 38(6):753-764. [4] KADILAR C, UNYAZICI Y, CINGI H. Ratio estimation for the population mean using ranked set sampling[J]. Stat Papers, 2009, 50(2):301-309. [5] JOZANI M J, MAJIDI S. Unbiased and almost unbiased ratio estimators of the population mean in ranked set sampling[J].Stat Papers, 2012, 53(3):719-737. [6] 張建軍, 喬松珊. 輔以排序集樣本的分層抽樣方法研究[J].統(tǒng)計(jì)與信息論壇, 2012, 27(5):14-18. [7] SAMAWI H M, SIAM M I. Ratio estimation using stratified ranked set sample[J]. Metron International Journal of Statistics, 2003(1):75-79. [8] PRASAD B. Some improved ratio type estimators of population mean and ratio in finite population sample surveys[J].Commun Statist Theor Meth, 1989, 18(1):379-392. [9] 杜子芳. 抽樣技術(shù)及其應(yīng)用[M].北京:清華大學(xué)出版社,2005:134-138. A new ratio estimation in stratified ranked set sample ZHANG Jianjun1, QIAO Songshan2 (1.Collage of Information and Management Science, Henan Agricultural University, Zhengzhou 450002;2.College of Information and Business, Zhongyuan Institute of Technology, Zhengzhou 450007) A new ratio estimation of the population mean based on stratified ranked set sample is established in this paper, with its mean square error and deviation discussed. It is proved that the new estimator is more efficient than the existing combined ratio estimation in all conditions. Finally, a practical application on bilirubin level in jaundiced babies is analyzed. The results show that the new ratio estimator using stratified ranked set sampling improve the precision of estimation effectively. auxiliary variable; stratified sample; ranked set sample; new ratio estimation 2015-05-22. 河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(13B110057);河南省高等學(xué)校青年骨干教師計(jì)劃項(xiàng)目(2014GGJS-158). 1000-1190(2015)06-0816-06 O212.2 A *E-mail: zhangjianjunbox@163.com.4 改進(jìn)比率估計(jì)的有效性
5 實(shí)例分析
6 結(jié)論