許學(xué)艷
(廣西師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院 桂林 541004)
隨著我國經(jīng)濟(jì)的穩(wěn)步增長,統(tǒng)計工作正在逐步向著與國際接軌的方向發(fā)展,抽樣調(diào)查方法將在今后的統(tǒng)計工作中發(fā)揮越來越重要的作用,并將得到更為廣泛的應(yīng)用。目前在國內(nèi),盡管抽樣調(diào)查方法已被廣泛使用,但在采用隨機(jī)抽樣的過程中往往只注重于得到具體的抽樣估計值,而不夠重視如何給出抽樣調(diào)查的精確度。
抽樣調(diào)查中,當(dāng)某個總體由若干個有著自然界限和區(qū)分的子群(或類別、層次)所組成,同時,不同子群之間差別不大,而每個子群內(nèi)部的異質(zhì)性比較大時,則特別適合采用整群抽樣的方法。整群抽樣是將總體劃分為若干個群,然后以群為抽取單元,從總體中隨機(jī)抽取一部分群,對入選群內(nèi)所有單元進(jìn)行調(diào)查的一種抽樣方法。國內(nèi)外專家學(xué)者對于簡單隨機(jī)抽樣的簡單估計和比估計以及整群抽樣的估計精度做了許多具體的研究。本文基于整群隨機(jī)抽樣,研究如何用一個整群樣本來對同樣樣本量下簡單隨機(jī)抽樣作簡單估計和比估計,從而降低成本、提高效率和精度。
簡單隨機(jī)抽樣又稱單純隨機(jī)抽樣,指的是從總體個單元中,逐個不放回地抽取單元,每次抽到尚未入樣的任何一個單元的概率都相等,直到抽足個單元為止。
在抽樣調(diào)查中會用到比率估計量的情況有兩類,一類是所需估計的目標(biāo)值是兩個指標(biāo)總數(shù)(或均值)的比值,另一類則是所需估計的目標(biāo)值是某指標(biāo)的總數(shù)(或均值),但有另一個與密切相關(guān)的指標(biāo)可作為輔助變量。利用輔助變量的信息可改進(jìn)估計的精度。輔助變量的特點(diǎn)可歸納為以下幾條:必須與主要變量高度相關(guān);與主要變量之間的相關(guān)關(guān)系整體上相當(dāng)穩(wěn)定;輔助變量的總體總值必須是已知的,或是容易獲得的;輔助變量的信息質(zhì)量更好,或信息更容易取得即調(diào)查成本更低。實(shí)際問題中,X常是Y的前期資料。
總體均值ˉ和總值Y的比估計量定義為
比估計是有偏估計,但樣本量增大時,偏倚趨于零。此時均方誤差與方差近似相等。
當(dāng)較大時,對于簡單隨機(jī)抽樣有
當(dāng)足夠大時:
而對于簡單估計ˉ,有
為了提高樣本效率,減少樣本量,實(shí)際工作中檢查先對總體進(jìn)行分群,再進(jìn)行等概率的整群抽樣。整群抽樣的特點(diǎn)為:抽樣框編制得以簡化,實(shí)施調(diào)查便利、節(jié)省費(fèi)用。
采用整群抽樣,若群的抽取是簡單隨機(jī)的,且群規(guī)模相等,皆等于,則對總體均值?的估計為
如果該總體被等分為N個規(guī)模均為M的群,定義ρ為群內(nèi)相關(guān)系數(shù),描述同一群內(nèi)成對個體單元之間的相關(guān)程度,表達(dá)式為
這說明,相同樣本容量下整群抽樣方差約為簡單隨機(jī)抽樣方差的1+(-1)ρ倍。也就是說,為了得到相同的估計精度,整群抽樣的樣本容量是簡單隨機(jī)抽樣樣本容量的1+(-1)ρ倍。
式中,
在實(shí)際的社會調(diào)查中,群規(guī)模不等的情況更為常見。從個群中等概率抽取個群的整群樣本,如果各群規(guī)模M不等,那么運(yùn)用群規(guī)模相等時的估計方法的估計量是有偏的,尤其是當(dāng)各群規(guī)模M差異很大,且-y與M存在較高相關(guān)時,估計量的偏差會很大。
上述估計量的方差為
它的無偏估計為
我們通常預(yù)期y與M是相關(guān)的,以M為輔助變量,總體均值的比率估計量為
當(dāng)樣本群數(shù)很大時,總體總值的比率估計量為
為調(diào)查某地區(qū)農(nóng)作物的總產(chǎn)量,以該地區(qū)的村莊數(shù)、種植面積為輔助變量,利用無偏估計量和比率估計量進(jìn)行估計。
盡管此種方法可獲得無偏估計量,但其估計方差與y之間的差異有關(guān),它適用于y之間幾乎沒有差異的整群抽樣。
本文給出了一種基于整群隨機(jī)樣本,同樣樣本量的簡單隨機(jī)抽樣精度的評估公式,并通過具體實(shí)例與簡單隨機(jī)抽樣的簡單估計,以不同的群規(guī)模為輔助變量的比率估計在精度上做了比較。結(jié)果表明基于不等整群抽樣的比率估計量的精度更高。