盧玉桂 盧月莉
摘 要:本文以2012年我國31個省市自治區(qū)的規(guī)模以上建筑業(yè)企業(yè)單位數為基礎,運用PPS抽樣的代碼法對總體各個單元進行編碼,并在此基礎上用等距抽樣方法抽取了10個樣本地區(qū),以此估計2012年我國建筑業(yè)總值,并給出95%置信度下的置信區(qū)間,實證分析表明:該抽樣方法得到估計值與真實值較為接近,真實值落也在置信區(qū)間內。
關鍵詞:不等概抽樣;PPS抽樣;等距抽樣;建筑業(yè)總值
建筑業(yè)是我國經濟發(fā)展的支柱產業(yè)之一,它的健康發(fā)展對我國經濟的快速發(fā)展有著舉足輕重的作用。為了解我國建筑業(yè)的總體發(fā)展情況,可采用抽樣調查的方法對我國31個省市自治區(qū)建筑業(yè)總值進行研究。最簡單的抽樣方法是簡單隨機抽樣方法(simple random sampling),該方法具有總體中每個單元進入樣本的概率嚴格相等的優(yōu)點,是一種等概率抽樣方法。但是,在總體單元之間差異非常大時,簡單隨機抽樣效果并不是很好。而我國各個地區(qū)建筑業(yè)企業(yè)單位數存在較大差異,所以,本文運用PPS抽樣方法對我國建筑業(yè)總值進行抽樣研究。
1.抽樣方法簡介
不等概率抽樣(sampling with unequal probabilities),是指在抽樣中每個單元都具有一定的入樣概率,但不是嚴格相等。它分為放回與不放回兩種情況。最常用的放回不等概抽樣是PPS抽樣(probability proportional to size),它是一種與規(guī)模大小成比例的抽樣方法,包括代碼法和拉稀里(Lahiri)法兩種實施辦法。在PPS抽樣中,一般把Mi作為總體中第i個單元的大小或者規(guī)模的度量,M0為總體各單元規(guī)模的累積和,即總體的規(guī)模大小,若在每次抽樣中第i個單元被抽中的概率用Zi表示,則有以下式子成立:Zi=MiM0。
一般情況下,放回抽樣比不放回抽樣的效率低,因為在放回抽樣的實施過程中,某個單元有可能被抽中的多次,而從直觀上看,在抽樣調查過程中,沒有必要對同一個單元調查多次。
等距抽樣是一種先將總體按某種順序進行排序,并確定抽樣間距k,并在1~k范圍內產生一個隨機起點r,然后按照固定間隔k依次選取其他單元的編號,直到抽滿n個為止,這樣最終入樣本編號為:r+(j-1)k,j=1,2,…,n,具有簡單易行和使得樣本在總體中分布更均勻的優(yōu)點。一般情況下,等距抽樣方法是一種不放回的抽樣方法。因此,本文考慮在PPS抽樣的基礎上,采用等距抽樣方法進行抽樣研究。這種方法抽取樣本比較容易,并且每個單元的被抽中概率與Mi的大小成比例,具有等距抽樣的優(yōu)點。
2.抽樣實施方法
假設總體單元數目為N,總體中第i個單元規(guī)模大小的為Mi,欲抽取n個樣本,則具體的實施步驟為:先用PPS抽樣中的代碼法,賦予每個單元與Mi相等的代碼數,將代碼數進行累積,直至M0=∑Ni=1Mi;其次,確定等距抽樣的間隔k=M0n;再次,在1~k之間產生一個隨機起點,假設為r,則r所在的單元代碼區(qū)間相應的單元為被抽中的單元;最后,找出r+(j-1)k,j=1,2,…,n所在的代碼區(qū)間,則相應單元為被抽中的單元。這種抽樣方法的特點是當所有單元的度量Mi
3.漢森—赫維茨估計量
漢森—赫維茨(Hansen-Hurwitz)估計量指是采用有放回不等概抽樣抽取樣本容量n時,總體總值的估計量為樣本所有yiZi的平均,即HH=1n∑ni=1yizi,它是總體總值的無偏估計量。
如果采用的PPS抽樣,即Zi=MiM0,則
HH=1n∑ni=1yizi=M0n∑ni=1yiMi(1)
總體總值估計量方差為:
VHH=1n∑ni=1ZiYiZi-Y2.
總體總值估計量方差的無偏估計量為:
vHH=1n1n-1∑ni=1yizi-HH2.(2)
4.樣本的抽取
為了估計2012年我國建筑業(yè)生產總值這一參數,本文以2012年我國31個省、市、自治區(qū)的規(guī)模以上建筑業(yè)企業(yè)單位數作為衡量各個地區(qū)規(guī)模大小的標準,運用PPS抽樣和等距抽樣方法,抽取10個樣本地區(qū),以此估計2012年我國建筑業(yè)生產總值,具體抽樣步驟如下:
(1)以2012年我國31個省、市、自治區(qū)的規(guī)模以上建筑業(yè)企業(yè)單位數作為規(guī)模Mi,并進行累計,具體如表1所示。
(2)由于M0=∑Ni=1Mi=75280,因而得出抽樣間隔
k=M0n=7528010=7528.
(3)在1~k范圍內產生一個隨機起點r,假設為r=4875,處于河北代碼范圍內,故河北進入樣本。
(4)根據等距抽樣的入樣代碼:4875+(j-1)7528,j=1,2,…,10,確定進入樣本的10個地區(qū)。帶入數值得,10個入樣代碼依次為4875,12385,19913,27441,34969,
42497,50025,57553,65081,72609。由表1給出的代碼范圍可知,進入樣本的10個地區(qū)依次為河北,遼寧,上海,江蘇,浙江,江西,河南,廣東,重慶,甘肅。該入樣地區(qū)2012年建筑業(yè)總值(億元)依次為1491.97,1625.42,757.01,3213.48,
1978.30,1114.39,1654.64,1890.90,994.17,529.85。
表1 以2012年我國各地區(qū)企業(yè)單位數為規(guī)模的代碼法
地區(qū)2012年企業(yè)單位數(Mi)∑Mi代碼范圍地區(qū)2012年企業(yè)單位數(Mi)∑Mi代碼范圍
北京317831781~3178湖北27745559852825~55598
天津153547133179~4713湖南19065750455599~57504
河北234770604714~7060廣東41446164857505~61648
山西201690767061~9076廣西10536270161649~62701
內蒙古82899049077~9904海南1206282162702~62821
遼寧5547154519905~15451重慶23346515562822~65155
吉林16531710415452~17104四川31936834865156~68348
黑龍江20381914217105~19142貴州5586890668349~68906
上海29632210519143~22105云南20807098668907~70986
江蘇87433084822106~30848西藏1757116170987~71161
浙江55503639830849~36398陜西12497241071162~72410
安徽25393893736399~38937甘肅11087351872411~73518
福建23874132438938~41324青海3677388573519~73885
江西15074283141325~42831寧夏5087439373886~74393
山東56614849242832~48492新疆8877528074394~75280
河南43325282448493~52824
5.建筑業(yè)總值參數的估計
由入樣概率Zi=MiM0,得出10個樣本地區(qū)的入樣概率分別為:河北0.03118,遼寧0.07368,上海0.03936,江蘇0.11614,浙江0.07372,江西0.02002,
河南0.05755,廣東0.05505,重慶0.03100,甘肅0.01472。以這10個樣本地區(qū)的建筑業(yè)總值為樣本數據,運用漢森—赫維茨估計量,對2012年的我國建筑業(yè)總值參數進行估計,由公式(1)得:
HH=1n∑ni=1yizi=110(1491.970.03118+1625.420.07368+…+529.850.01472)=33048.64.
由公式(2)得,總值方差估計量的估計為:
vHH=1n1n-1∑ni=1yizi-HH2=110×9(1491.970.03118-33048.64)2+(1625.420.07368-33048.64)2+…+(529.850.01472-33048.64)2=12665212.
在置信度為95%時,z0.025=1.96,置信區(qū)間為
HH±zα2VHH=33048.64±1.9612665212=[26073.35,40023.94].由于2012年我國31個省市自治區(qū)建筑業(yè)總值為35694.94萬元,位于該置信區(qū)間內,這說明,該抽樣方法可以運用于我國建筑業(yè)總值參數的估計,抽樣效果較好。
5.結論
本文通過PPS抽樣方法和等距抽樣方法對2012年我國31個省市自治區(qū)建筑業(yè)總值的不等概率抽樣,抽取了10個樣本地區(qū),并以此樣本數據為基礎運用漢森—赫維茨估計量得出2012年我國建筑業(yè)總值的估計值為
330486.4億元,置信度為95%的置信區(qū)間為[26073.35,40023.94],而2012年我國建筑業(yè)總值真實值為35694.94萬元,位于置信區(qū)間內。這表明,這種PPS抽樣和等距抽樣相結合的抽樣方法,可以應用于我國建筑業(yè)總值參數的估計中,該抽樣方法即保證了總體中規(guī)模大的樣本被抽中的概率大,規(guī)模小的樣本被抽中的概率大,提高了抽樣樣本地區(qū)的代表性,又保留了等距抽樣的優(yōu)點。(作者單位:河池學院數學與統(tǒng)計學院)
基金項目:河池學院統(tǒng)計學重點學科建設項目(2013[3])
參考文獻:
[1] 金勇進,杜子芳,蔣妍.抽樣技術(第三版)[M].中國人民大學出版社,2012.
[2] 李睆玲,雷恒,陳偉偉.PPS抽樣方法在我國農村居民生活消費支出估計中的應用[J].長春金融高等專科學校學報,2009(03):49-51.
[3] 李雪波.基于PPS抽樣方法的我國建筑業(yè)利潤總額實證研究[J].經濟視角(下),2009(12):31-32.
[4] 張玉.PPS抽樣方法在我國出口貿易預測中的應用[J].經濟研究導刊,2011(02):156-157.
[5] 王鵬.PPS抽樣在我國工業(yè)總產值估計中的應用——抽樣效果的比較[J].現(xiàn)代商貿工業(yè),2013(24):22-25.
[6] 沈亞娟.PPS抽樣在存貨審計中的應用[J].財經界(學術版),2014(03):241-242.