• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      抽樣調(diào)查中樣本量的科學(xué)確定*1

      2010-01-25 07:33:10時(shí)
      關(guān)鍵詞:估計(jì)量估計(jì)值樣本量

      時(shí) 濤

      (泰山醫(yī)學(xué)院統(tǒng)計(jì)學(xué)教研室,山東 泰安 271016)

      美國(guó)從1790年開(kāi)始就每十年普查一次,但是科技日新月異,全國(guó)性普查很有可能找到替代品。丹麥沒(méi)有普查,法國(guó)也準(zhǔn)備取消普查。美國(guó)社區(qū)調(diào)查已經(jīng)開(kāi)始,而且繁式調(diào)查問(wèn)卷在2000年之后就已經(jīng)逐漸取消了[1]。從時(shí)間和金錢(qián)角度來(lái)考慮,抽樣調(diào)查來(lái)得更快捷和節(jié)約。而抽樣調(diào)查的一個(gè)關(guān)鍵問(wèn)題就是樣本量的科學(xué)確定,即多大的樣本量才能更好的估計(jì)總體信息。

      樣本量就是樣本中所包含的單位的個(gè)數(shù),即抽樣個(gè)體數(shù)。樣本量直接影響抽樣誤差、調(diào)查的費(fèi)用、調(diào)查所需的時(shí)間、調(diào)查訪員的數(shù)量以及其他一些重要的現(xiàn)場(chǎng)操作的限制條件。樣本量過(guò)大,會(huì)造成人力、物力和財(cái)力的浪費(fèi);樣本量過(guò)小,會(huì)造成抽樣誤差增大,影響抽樣推斷的可靠程度。需要多大的樣本量,這是調(diào)查管理人員必須明確的問(wèn)題。

      1 科學(xué)確定樣本量的影響因素

      1.1要考慮的因素

      影響樣本量的因素首先是估計(jì)值要求達(dá)到的精度。估計(jì)量的抽樣誤差越小,則估計(jì)值越精確。因此,隨著抽樣方差的不斷減小,估計(jì)值的精度就會(huì)逐漸提高,所需的樣本量相應(yīng)也就越大??傮w指標(biāo)的變異程度、總體大小、樣本設(shè)計(jì)和所使用的估計(jì)量、回答率都會(huì)影響精度,從而影響樣本量。在計(jì)算樣本量的公式中,具體涉及如下幾個(gè)因素。

      (1)抽樣推斷的可靠程度。要求推斷的可靠程度越高,概率度的數(shù)值越大,抽樣單位數(shù)也就要求多些;反之,則可少抽一些。

      (2)總體標(biāo)志變異程度。方差大,需要多抽一些;方差小,可少抽一些。

      (3)極限誤差的大小。極限誤差大可以少抽些,極限誤差小則應(yīng)多抽些。

      (4)抽樣方法與組織方式。在相同條件下,重復(fù)抽樣需要多抽一些,不重復(fù)抽樣可少抽一些。

      (5)實(shí)際調(diào)查運(yùn)作的限制(人力、物力和財(cái)力的可能條件)。客戶提供的經(jīng)費(fèi)能支持多大的樣本?調(diào)查持續(xù)的時(shí)間有多長(zhǎng)?需要多少訪員?能招聘到的訪員有多少?在確定調(diào)查最終所需的樣本量時(shí),還必須考慮樣本量計(jì)算公式?jīng)]有涉及到的這些限制。

      1.2精度及其影響因素

      調(diào)查估計(jì)值的精度與樣本量是緊密相關(guān)的:隨著樣本量的增加,調(diào)查估計(jì)值的精度也會(huì)不斷提高,換句話說(shuō),對(duì)應(yīng)估計(jì)量的抽樣方差就會(huì)不斷減少。所以,樣本量取決于調(diào)查估計(jì)值所要求的精度,而精度又受以下因素影響。

      1.2.1總體的變異程度

      在調(diào)查總體中,我們所研究的變量或指標(biāo)隨著個(gè)人、住戶、企業(yè)或農(nóng)場(chǎng)等的不同而不同。雖然我們不能控制這種變異性,但它的大小卻影響給定精度水平下對(duì)研究指標(biāo)估計(jì)所必需的樣本量。若總體指標(biāo)變異性很大,或具有所研究特征的單元數(shù)量很少,要求精確估計(jì)是很困難的,需要較大的樣本量。因此,為確定調(diào)查所需的樣本量,需要得到目標(biāo)總體的研究指標(biāo)變異程度的估計(jì)值。因?yàn)橥ǔG闆r下變異的真值是未知的,所以需要從過(guò)去相關(guān)主題的調(diào)查或從試調(diào)查中得到它的估計(jì)。

      一旦實(shí)施調(diào)查,統(tǒng)計(jì)調(diào)查機(jī)構(gòu)就會(huì)認(rèn)識(shí)到,如果所研究指標(biāo)的實(shí)際變異程度大于確定樣本量時(shí)估計(jì)的變異程度,那么調(diào)查估計(jì)值的實(shí)際精度就會(huì)低于期望的精度。相反,如果所研究指標(biāo)的實(shí)際變異程度比所估計(jì)的變異程度小,調(diào)查所得到的估計(jì)值會(huì)比預(yù)計(jì)的更精確。

      為確保達(dá)到調(diào)查要求的精度,在計(jì)算樣本量時(shí),一般對(duì)某一指標(biāo)的總體變異程度采用較為保守的估計(jì)。即在實(shí)際中如果事先不知道調(diào)查中要測(cè)量指標(biāo)變異程度的數(shù)據(jù),那么就假定研究指標(biāo)具有最大的變異程度。例如,對(duì)于二元變量(如成數(shù)估計(jì)),一般假定總體中該變量的變異程度為最大,即假定P=0.5。

      抽樣調(diào)查時(shí),調(diào)查指標(biāo)通常不止一個(gè),指標(biāo)的變異程度一般不相同。對(duì)某一指標(biāo)來(lái)說(shuō)足夠大的樣本,對(duì)變異程度更大的另一個(gè)指標(biāo)來(lái)說(shuō)可能就偏小。因此,為確保樣本量對(duì)所有的研究指標(biāo)都足夠大,應(yīng)該根據(jù)最大變異程度或被認(rèn)為最重要的指標(biāo),來(lái)確定樣本量。

      1.2.2總體大小

      在樣本量確定過(guò)程中,總體所起的作用因它的大小而有所差異。對(duì)于小規(guī)??傮w,它起著重要作用,而大總體對(duì)樣本量影響的作用很小。

      表1 總體大小與所需樣本量(P=0.5)

      表1是要求在置信度為95%下,誤差限為0.05,用簡(jiǎn)單隨機(jī)抽樣估計(jì)P,對(duì)應(yīng)總體大小所需的樣本量(取P=0.5計(jì)算)。由表1可知,為達(dá)到要求的精度水平,隨著總體大小的增加,樣本量增加的比率逐漸減小到零。對(duì)于單位數(shù)為50的調(diào)查總體,需要44個(gè)有效單位的樣本,而對(duì)兩倍于此的調(diào)查總體,并不需要將樣本量翻倍。對(duì)于N=5000或更多的調(diào)查總體,所需的樣本量快速地逼近n=400。因此對(duì)于簡(jiǎn)單隨機(jī)抽樣,在真實(shí)總體比例是P=0.5的情況下,400份有效問(wèn)卷對(duì)于大于5000的總體,已足以滿足給定的精度要求。

      對(duì)于很小規(guī)模的總體,通常必須調(diào)查較大比例的樣本,以取得所期望的精度。因此在實(shí)際操作中,對(duì)小規(guī)??傮w經(jīng)常采用普查。

      1.2.3樣本設(shè)計(jì)和估計(jì)量

      計(jì)算樣本量時(shí),通常假定采用的抽樣為簡(jiǎn)單隨機(jī)抽樣。對(duì)于同樣大小的樣本及同一估計(jì)量,當(dāng)使用復(fù)雜的樣本設(shè)計(jì)時(shí),估計(jì)量可能比簡(jiǎn)單隨機(jī)抽樣精確,也可能沒(méi)有簡(jiǎn)單隨機(jī)抽樣精確。當(dāng)估計(jì)值更精確時(shí),所采用的樣本設(shè)計(jì)更為有效。如果在確定樣本量時(shí)是按簡(jiǎn)單隨機(jī)抽樣公式計(jì)算的,那么應(yīng)考慮實(shí)際使用抽樣設(shè)計(jì)的效率,需要對(duì)它進(jìn)行調(diào)整。

      在分層抽樣中,一方面當(dāng)分層的變量與調(diào)查指標(biāo)相關(guān)時(shí),所得的估計(jì)通常比相同樣本量的簡(jiǎn)單隨機(jī)抽樣更精確,或者至少一樣精確。另一方面,因?yàn)槿簝?nèi)相鄰單元通常比較相似,所以整群抽樣估計(jì)的精度通常低于使用同一估計(jì)量進(jìn)行估計(jì)時(shí)簡(jiǎn)單隨機(jī)抽樣的估計(jì)值的精度。一般來(lái)說(shuō),當(dāng)樣本量采用簡(jiǎn)單隨機(jī)抽樣的計(jì)算公式,而實(shí)際使用的是更復(fù)雜的抽樣方式時(shí),為達(dá)到給定精度所需的樣本量,應(yīng)該在此基礎(chǔ)上乘以一個(gè)設(shè)計(jì)效應(yīng)因子。設(shè)計(jì)效應(yīng)是對(duì)于相等的樣本量,給定樣本設(shè)計(jì)估計(jì)量的抽樣方差對(duì)簡(jiǎn)單隨機(jī)抽樣估計(jì)量的抽樣方差的比率。對(duì)于簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)等于1;對(duì)于分層抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)一般小于1;對(duì)于整群抽樣設(shè)計(jì),設(shè)計(jì)效應(yīng)一般大于1。若過(guò)去相同或相似主題的調(diào)查所用的抽樣設(shè)計(jì)與我們計(jì)劃實(shí)施的抽樣設(shè)計(jì)相同或相似,就能得到當(dāng)前調(diào)查主要變量設(shè)計(jì)效應(yīng)的估計(jì)值,也可以從試調(diào)查中得到設(shè)計(jì)效應(yīng)的估計(jì)值。

      1.2.4調(diào)查的回答率

      調(diào)查回答率是用回收到的有效問(wèn)卷數(shù)與計(jì)劃樣本量的比來(lái)表示的。產(chǎn)生無(wú)效調(diào)查問(wèn)卷的原因主要有:樣本單元超出調(diào)查范圍;在住戶調(diào)查中,住宅是可居住的卻無(wú)人居住(是空的);樣本單元沒(méi)有回答。為了達(dá)到估計(jì)要求的精度,調(diào)查機(jī)構(gòu)需要根據(jù)預(yù)計(jì)的回答率調(diào)整樣本量的大小,根據(jù)預(yù)計(jì)的回答率確定一個(gè)較大的樣本才可能達(dá)到精度要求。預(yù)計(jì)的回答率是依據(jù)對(duì)同一總體的小范圍的試點(diǎn)調(diào)查或者過(guò)去類(lèi)似的調(diào)查得到的。例如,如果根據(jù)計(jì)算,初始樣本量是400,預(yù)計(jì)回答率為60%,那么樣本量就應(yīng)該定為:n=400/0.60=667。

      調(diào)查機(jī)構(gòu)一旦與客戶確定了某一回答率,就必須盡最大努力保證達(dá)到這個(gè)回答率。如果不能達(dá)到所預(yù)期的回答率,就會(huì)影響調(diào)查結(jié)果的精度。實(shí)際回答率偏低會(huì)導(dǎo)致有效樣本單位數(shù)小于精度所需要的樣本單位數(shù)。

      為了妥善處理無(wú)回答,并不能只簡(jiǎn)單地增加樣本量。因?yàn)樵谡{(diào)查中,如果拒絕回答者與回答者在所研究指標(biāo)上存在顯著的差異,就會(huì)產(chǎn)生估計(jì)的偏誤。1936年美國(guó)雜志《文學(xué)文摘》在進(jìn)行關(guān)于美國(guó)總統(tǒng)選舉的調(diào)查時(shí),就出現(xiàn)了這方面的問(wèn)題。

      2 樣本量的計(jì)算

      假設(shè)回答率是100%,在簡(jiǎn)單隨機(jī)抽樣下,通常使用誤差限和估計(jì)量的標(biāo)準(zhǔn)差來(lái)確定所需的樣本量。例如,在調(diào)查中常用的不放回簡(jiǎn)單隨機(jī)抽樣情況下,總體均值估計(jì)量的標(biāo)準(zhǔn)差(即抽樣平均誤差)的表達(dá)式為:

      極限誤差為:

      對(duì)于簡(jiǎn)單隨機(jī)抽樣,給定成數(shù)估計(jì)p的精度,將方差p(1-p)代入公式即可。若在以往調(diào)查中可得總體成數(shù)的一個(gè)較好估計(jì)p,那么直接將它代入公式就可以得到所需的樣本量;否則可以用p=0.5,因?yàn)檫@時(shí)總體的方差最大。

      如果抽樣不是簡(jiǎn)單隨機(jī)的,那么在計(jì)算樣本量時(shí),還需要對(duì)抽樣設(shè)計(jì)的設(shè)計(jì)效應(yīng)B的估計(jì)值,若回答率小于100%,還需要一個(gè)回答率的估計(jì)值r。

      如果調(diào)查涉及到許多研究域,并要對(duì)每一子總體確定精度要求,則可能會(huì)使總樣本量顯著增大,并可能導(dǎo)致樣本量超出客戶的預(yù)算和現(xiàn)有資源的承受能力。一般來(lái)說(shuō),要求估計(jì)的域越多,需要的樣本量就越大。因此需要在精度與費(fèi)用之間進(jìn)行折衷,以保證估計(jì)的誤差在可接受的范圍之內(nèi)。通過(guò)增大每一層估計(jì)值的允許誤差,或合并其中某些域,使精度和費(fèi)用達(dá)成平衡。

      總之,樣本量的確定基本原則就是:精度一定條件下費(fèi)用最??;費(fèi)用一定條件下精度最高。

      [1] 戴維S穆?tīng)枺y(tǒng)計(jì)學(xué)的世界[M].北京:中信出版社,2003:96.

      [2] 馮士雍.抽樣調(diào)查理論與方法[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999:24.

      猜你喜歡
      估計(jì)量估計(jì)值樣本量
      醫(yī)學(xué)研究中樣本量的選擇
      一道樣本的數(shù)字特征與頻率分布直方圖的交匯問(wèn)題
      航空裝備測(cè)試性試驗(yàn)樣本量確定方法
      統(tǒng)計(jì)信息
      2018年4月世界粗鋼產(chǎn)量表(續(xù))萬(wàn)噸
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
      基于配網(wǎng)先驗(yàn)信息的諧波狀態(tài)估計(jì)量測(cè)點(diǎn)最優(yōu)配置
      負(fù)極值指標(biāo)估計(jì)量的漸近性質(zhì)
      2014年5月世界粗鋼產(chǎn)量表萬(wàn)噸
      治县。| 凌海市| 任丘市| 德清县| 怀安县| 晋州市| 秀山| 历史| 孝义市| 延寿县| 大同县| 盐边县| 盘山县| 泽普县| 荆州市| 张家港市| 科技| 昌都县| 苏尼特左旗| 民勤县| 台山市| 怀仁县| 车险| 若羌县| 隆德县| 平安县| 酒泉市| 乌什县| 石渠县| 延津县| 滁州市| 房山区| 南阳市| 五寨县| 壤塘县| 柘荣县| 乌拉特后旗| 万山特区| 大关县| 龙游县| 纳雍县|