• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人口普查凈覆蓋誤差估計

      2022-02-28 05:11:06葉寶紅胡桂華
      關鍵詞:雙系統(tǒng)估計量人口數(shù)

      葉寶紅,胡桂華

      人口普查凈覆蓋誤差估計

      *葉寶紅,胡桂華

      (重慶工商大學數(shù)學與統(tǒng)計學院,重慶 400067)

      針對我國和其它許多國家的政府統(tǒng)計部門在應用雙系統(tǒng)估計量時,忽視對總體人口等概率分層、未考慮人口移動,以及未采取科學有效的方法計算雙系統(tǒng)估計量抽樣方差的問題,提出建立基于捕獲-再捕獲模型的雙系統(tǒng)估計量及分層刀切抽樣方差估計量的研究目標。為實現(xiàn)目標,采取現(xiàn)場調(diào)查、抽樣估計及文獻解讀相結(jié)合的方法研究全面登記和抽樣登記的雙系統(tǒng)估計量及其方差估計。研究發(fā)現(xiàn),雙系統(tǒng)估計量須在等概率人口層建立及使用,否則產(chǎn)生異質(zhì)性偏差,低估總體實際人口數(shù)及凈覆蓋誤差。研究創(chuàng)新在于,在對美國人口移動處理方法深入研究的基礎上,構造出適合于在我國應用的人口移動的、抽樣登記的雙系統(tǒng)估計量。研究價值在于,所建立的雙系統(tǒng)估計量有望應用于我國2030年人口普查凈覆蓋誤差估計。

      事后計數(shù)調(diào)查;捕獲-再捕獲模型;分層刀切抽樣方差估計量

      0 引言

      在每次人口普查中,有些人漏報,有些人多報。漏報人口數(shù)可能多于或小于多報人口數(shù)。如果漏報人口數(shù)多于多報人口數(shù),就是凈漏報;反之就是凈多報。凈多報或凈漏報,統(tǒng)稱為凈普查覆蓋誤差。凈漏報或凈多報既可以表現(xiàn)為普查漏報與多報人口數(shù)之差,也可以表現(xiàn)為總體實際人口數(shù)與總體普查登記人口數(shù)之差。除加拿大等少數(shù)國家外,包括我國和美國在內(nèi)的許多國家通過估計總體實際人口數(shù),再將其減去普查登記人口數(shù),得到人口普查凈覆蓋誤差[1]。人口統(tǒng)計分析模型和雙系統(tǒng)估計量是估計總體實際人口數(shù)的主流方法。人口行政記錄健全的發(fā)達國家同時采用這兩種方法估計凈覆蓋誤差。發(fā)展中國家大多采用雙系統(tǒng)估計量估計凈覆蓋誤差。本研究采用雙系統(tǒng)估計量估計凈覆蓋誤差[2]。雙系統(tǒng)估計量依據(jù)同一樣本普查小區(qū)的事后計數(shù)調(diào)查人口名單和普查人口名單構造,其理論基礎是最初估計野生動物總體規(guī)模的捕獲-再捕獲模型。事后計數(shù)調(diào)查在人口普查登記工作結(jié)束后實施,屬于抽樣調(diào)查,抽樣單位通常是較小范圍的地理區(qū)域,如我國的普查小區(qū),平均含250人。

      雙系統(tǒng)估計量經(jīng)歷了四個研究階段。經(jīng)歷了這四個研究階段,才研發(fā)了用于人口總體規(guī)模估計的雙系統(tǒng)估計量。

      第一個階段是其起源,即捕獲-再捕獲模型[3]。該模型等于對同一總體兩次捕獲的動物數(shù)目的乘積除以同時在兩次捕獲中同時捕獲到的動物數(shù)目。丹麥的Petersen(1896)和美國的Lincoln(1930)是捕獲-再捕獲模型的創(chuàng)始人[4-5]。正是由于他們兩人的研究,才產(chǎn)生了捕獲-再捕獲模型,稱之為Lincoln-Petersen估計量。

      第二階段是將捕獲-再捕獲模型移植到人類總體構造全面登記的雙系統(tǒng)估計量[6]。捕獲-再捕獲模型要求兩次捕獲均是對同一總體的全面捕獲。然而,在事后計數(shù)調(diào)查中,我們無法得到總體的全面信息。這就需要首先假設事后計數(shù)調(diào)查是對總體的全面登記。另外,還需要對總體人口按照人口統(tǒng)計特征變量和地理位置變量交叉分層,形成若干等概率人口層[7],在每個等概率人口層建立雙系統(tǒng)估計量。如果直接在總體中構造雙系統(tǒng)估計量,會產(chǎn)生異質(zhì)性偏差,即由于總體人口在普查中登記概率不同而增大雙系統(tǒng)估計量的分母,從而造成雙系統(tǒng)估計量低估總體實際人口數(shù)。

      第三階段是構造人口移動的全面登記的雙系統(tǒng)估計量[8-12]。在事后計數(shù)調(diào)查期間不可避免地會有人口移動。移動的人口共分為三種,即無移動人口(non-movers,縮寫為)、向外移動人口(out-movers,縮寫為)和向內(nèi)移動人口(in-movers,縮寫為)。向外移動人口是指人們從普查時居住的小區(qū)搬到了另外的普查小區(qū)。向內(nèi)移動人口指的是人們事后計數(shù)調(diào)查時從原來的普查小區(qū)搬到了現(xiàn)在的普查小區(qū)居住。美國普查局提出了三種處理人口移動的方法,即A方法、B方法和C方法。其中C方法使用最為普遍。美國在2000年普查試點調(diào)查中測試了方法C,并且應用于2000年事后計數(shù)調(diào)查。方法C是指,使用向內(nèi)移動者數(shù)目作為移動者數(shù)目,這是可靠的數(shù)據(jù),因為它來自向內(nèi)移動者本身。使用向外移動者匹配率估計移動者匹配率,以避免比對向內(nèi)移動者出現(xiàn)的困難。

      第四階段是構造人口移動的抽樣登記的雙系統(tǒng)估計量[13-16]。在考慮人口移動情況下,雙系統(tǒng)估計量公式中含有下列7個指標:人口普查登記人數(shù)、人口普查正確登記人數(shù)、無移動人數(shù)、向內(nèi)移動人數(shù)、向外移動人數(shù)、無移動者中匹配人數(shù)、向外移動者中匹配人數(shù),這里說的這7個指標都是總體值。在對人口有限總體實施概率抽樣的條件下,須依據(jù)所用的抽樣方法構造7個指標的估計量,用以代替公式中的7個指標,這樣就是雙系統(tǒng)估計量的估計量。

      本研究創(chuàng)新體現(xiàn)在三個方面。一方面,從捕獲-再捕獲模型推導出雙系統(tǒng)估計量,解析了它們之間內(nèi)在的邏輯關系。另一方面,深入解讀了美國普查局提出的處理人口移動的A方法、B方法和C方法。最后一方面,通過實際案例,全面演示了雙系統(tǒng)估計量及其抽樣方差估計量的詳細計算過程,從而有助于雙系統(tǒng)估計量在我國的推廣應用。

      1 捕獲-再捕獲模型

      如果一次全面捕獲無法得到滿意的總體動物數(shù)目時,需要采取全面捕獲-再捕獲模型估計總體中的動物數(shù)目。全面捕獲-再捕獲模型的基本思想是,對總體進行第一次全面捕獲,對捕獲的動物做上記號,放回總體。等待幾天,讓做上記號的動物和在第一次全面捕獲中沒有捕獲到的動物混合均勻。再次捕獲同一總體的動物。如果這兩次捕獲相互獨立,那么在第一次捕獲中做上記號的動物數(shù)目比例就等于第二次捕獲做上記號的動物比例。解這個方程,即可以得到總體動物數(shù)目的估計值。

      表1 全面捕獲-再捕獲模型

      Table 1 Full capture-recapture model

      捕獲情況在第二次捕獲不在第二次捕獲 在第一次捕獲 不在第一次捕獲

      由表1得到:

      在上述的假設(尤其是獨立性假設)下,如果一個個體在第一次全面捕獲中捕獲,則該個體在第二次全面捕獲中捕獲的概率為:

      以及在第一次全面捕獲中沒有捕獲而在第二次全面捕獲中捕獲的概率為:

      式(2)和式(3)相同,故

      由式(4)可以得到:

      2 雙系統(tǒng)估計量及其方差估計

      2.1 雙系統(tǒng)估計量

      依據(jù)式(6)可得:

      鑒于中國在歷次人口普查質(zhì)量評估中一直采取B處理方法,且找到向外移動者難度較大,以及向內(nèi)移動者在本樣本普查小區(qū)和了解向內(nèi)移動者普查時點的登記地和登記情況不會遇到太大困難,于是采取B處理方法。此時事后計數(shù)調(diào)查人口由無移動人口和向內(nèi)移動人口構成。相應地,事后計數(shù)調(diào)查匹配人口由無移動人口的匹配人口和向內(nèi)移動人口的匹配人口構成。匹配人口指同時登記在普查名單與事后計數(shù)調(diào)查名單的人口。在事后計數(shù)調(diào)查比對實踐中發(fā)現(xiàn),有些人只登記在事后計數(shù)調(diào)查名單或普查名單。對事后計數(shù)調(diào)查的無移動人口,其普查名單和事后計數(shù)調(diào)查名單均在本樣本普查小區(qū),比對工作在同一樣本小區(qū)內(nèi)進行。向內(nèi)移動人口,其普查名單在其他小區(qū),事后計數(shù)調(diào)查在本樣本小區(qū)。通過函證可以獲悉向內(nèi)移動者在普查中的登記情況。如果在本樣本小區(qū)登記,在其他小區(qū)又進行了普查登記,那么向內(nèi)移動者就是本樣本小區(qū)的匹配人口。據(jù)此分析,式(8)變?yōu)槭剑?):

      如果采取A構成法,那么式(8)變?yōu)槭剑?0):

      在事后計數(shù)調(diào)查日,向外移動者已經(jīng)不在本樣本普查小區(qū),找到其本人難度不小,由其鄰居提供其信息有誤差。因此本文采取式(9)構造的雙系統(tǒng)估計量。

      分層二重抽樣適合于包括美國和中國在內(nèi)的許多國家的人口普查質(zhì)量評估的現(xiàn)實情況[17-20]。美國采用的抽樣單位是街區(qū)群,中國采用的是普查小區(qū)。美國街區(qū)群規(guī)模差異大,在第一重抽樣中需要按照街區(qū)群規(guī)模分層,在各個抽樣層抽取第一重樣本。在第二重抽樣中,美國對第一重樣本按照街區(qū)群地址誤差率進一步分層,在各個新層抽取第二重樣本。中國雖然普查小區(qū)規(guī)模差異小,但城鄉(xiāng)普查小區(qū)存在較大差異,在抽取第一重樣本前,需要對全國或?。ㄗ灾螀^(qū)、直轄市)的普查小區(qū)按照城鄉(xiāng)分層,在城市層和鄉(xiāng)村層分別抽取第一重樣本。對從城市層和鄉(xiāng)村層抽取的第一重樣本,按照調(diào)查難度再分層,在每個新層抽取第二重樣本。

      需要說明的是,本文采用的分層二重抽樣與國內(nèi)外出版的抽樣調(diào)查專著有本質(zhì)區(qū)別。區(qū)別在于,前者無論在第一重抽樣,還是在第二重抽樣之前,均對抽樣對象進行了分層,并且兩次分層采用的分層變量不同。

      式(11)中的每一個估計量采取式(12)統(tǒng)一表示為:

      將式(12)代入式(11),即可以得到抽樣登記的雙系統(tǒng)估計量。

      2.2 雙系統(tǒng)估計量的抽樣方差估計量

      在構造雙系統(tǒng)估計量后,還要構造其抽樣方差估計量。從式(11)可以看出,雙系統(tǒng)估計量是一個很復雜的估計量。對于復雜估計量,無法精確計算其抽樣方差,只能近似估計。刀切法是近似計算復雜估計量方差的重要方法之一。刀切法是復制方法之一,復制方差估計在復雜抽樣調(diào)查中十分受歡迎[21]。復制方法不需要計算泰勒展開式的偏導數(shù),用戶可以較為輕易得到方差估計值,而無需知道用于收集數(shù)據(jù)的抽樣設計方案。提供復制權數(shù)后,用戶分析數(shù)據(jù)結(jié)構不需要諸如層標識符之類的設計信息。

      (21)

      在式(23)中,

      3 凈覆蓋誤差估計

      4 實證分析

      4.1 資料來源及樣本數(shù)據(jù)

      實證對象是廣西南寧市西鄉(xiāng)塘區(qū)一個城鄉(xiāng)交匯處,實證資料是第六次人口普查標準時點(2010年11月1日零時)上的普查人口名單及其事后計數(shù)調(diào)查人口名單。實證目標是估計這個城鄉(xiāng)交匯處該時點的實際人口數(shù)及其凈覆蓋誤差。獲取資料的辦法,是在與當?shù)赜嘘P機構簽訂數(shù)據(jù)使用保密協(xié)議的情況,通過該機構調(diào)查取得數(shù)據(jù)。

      表2 - 表9中的數(shù)據(jù)是樣本微觀個人數(shù)據(jù),是計算總體雙系統(tǒng)估計值及其抽樣方差估計值、協(xié)方差估計值、凈覆蓋誤差估計值,以及小區(qū)域凈覆蓋誤差估計值的基礎。

      表2 抽樣層及樣本量

      Table 2 Sampling layer and sample size

      層h層h小區(qū)總數(shù)層h樣本小區(qū)總數(shù)層g層hg小區(qū)總數(shù)層hg樣本小區(qū)總數(shù)

      表3 樣本普查小區(qū)抽樣權數(shù)

      Table 3 Sampling weights of the sample census

      60071,1421,1,1√171 60071,1421,1,2√171 60071,1421,1,3171 60071,1421,1,4171 60071,2321,2,5√129 60071,2321,2,6√129 60071,2321,2,7129 40062,1322,1,8√100 40062,1322,1,9√100 40062,1322,1,10100 40062,2322,2,11√100 40062,2322,2,12√100 40062,2322,2,13100

      注意:√表示第一重樣本普查小區(qū)進入第二重樣本,即1、2、5、6、8、9、11、12為第二重樣本普查小區(qū)。

      表4 等概率人口層“男、0-14歲”未加權樣本人口數(shù)

      Table 4 Unweighted sample population of “male, 0-14 years old” in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 12922314243 22721293222 53023346253 62723315253 82819325213 93124333263 112822304233 123022356254

      表5 等概率人口層“男、15-59歲”未加權樣本人口數(shù)

      Table 5 Unweighted sample population of "male, 15-59 years old" in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 18369898747 27866858687 58771937745 67765815684 88170844723 98873936775 118067868716 1285699310738

      表6 等概率人口層“男、60歲及以上”未加權樣本人口數(shù)

      Table 6 Unweighted sample population of "male, 60 years old and above" in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 11513173142 21411152122 51713215154 61412164133 81512184133 91611205144 111510205124 121614194152

      表7 等概率人口層“女、0-14歲”未加權樣本人口數(shù)

      Table 7 Unweighted sample population of “female, 0-14 years old” in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 12421274233 22320253223 52623305243 62218266194 82419296215 92622326255 112320275213 122621305234

      表8 等概率人口層“女、15-59歲”未加權樣本人口數(shù)

      Table 8 Unweighted sample population of “female, 15-59 years old” in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 17768838706 27266799697 58170845724 67158755614 87563797666 98271899757 117461796656 127969869737

      表9 概率人口層“女、60歲及以上”未加權樣本人口數(shù)

      Table 9 Unweighted sample population of "female, 60 years old and above" in equal probability population strata

      樣本小區(qū)普查登記人口數(shù)目標總體普查人口數(shù)無移動者人口數(shù)向內(nèi)移動者人口數(shù)無移動匹配者人口數(shù)向內(nèi)移動者匹配人口數(shù) 11715193162 21613182142 51816203152 61511173132 81613172141 91815214173 111614183152 121715182161

      4.2 計算等概率人口層的實際人口數(shù)及凈覆蓋誤差

      首先依據(jù)式(12),以及表2 - 表9數(shù)據(jù)計算各個等概率人口層每個單元的加權人口數(shù),見表10;然后獲得各個等概率人口層的普查數(shù)據(jù)定義人口數(shù),見表11;最后使用式(11)、式(22)、式(25)和表10數(shù)據(jù),計算等概率人口層及總體的雙系統(tǒng)估計值、凈覆蓋誤差估計值,見表12。

      表10 各個等概率人口層雙系統(tǒng)估計量單元的加權人口數(shù)

      Table 10 Weighted population of the dual system estimator units of each equal probability population strata

      等概率層加權普查登記人口數(shù)加權目標總體普查人數(shù)加權無移動者人口數(shù)加權向內(nèi)移動者人口數(shù)加權無移動匹配者人口數(shù)加權向內(nèi)移動者匹配人口數(shù) v=12862921987316454416238162929 v=28208768529878007084719005755 v=31515812029179453816134582887 v=42412920500279164816222423629 v=57608765826815137297688265855 v=61660013971185002729149421900

      從表10可以看出,各等概率人口層的雙系統(tǒng)估計量單元包括普查登記人數(shù)、目標總體普查人數(shù)、無移動人數(shù)、向內(nèi)移動人數(shù)、無移動者匹配人數(shù)和向內(nèi)移動者匹配人數(shù)。各單元人口數(shù)乘以相應層抽樣權數(shù)可得各個等概率人口層雙系統(tǒng)估計量單元的加權人口數(shù)。在表10中,以層=2為例,加權普查登記人口數(shù)為82087,加權目標總體普查人數(shù)為68529,加權無移動者人口數(shù)87800,加權向內(nèi)移動者人口數(shù)7084,加權無移動匹配者人口數(shù)71900,加權向內(nèi)移動者匹配人口數(shù)5755。

      表11 各個等概率人口層的普查數(shù)據(jù)定義人口數(shù)()

      表11列示了各個等概率人口層的普查數(shù)據(jù)定義人口數(shù)。這些數(shù)據(jù)是已知數(shù),是估計普查目標總體普查登記人口數(shù)的基礎數(shù)據(jù)。須知,不能使用普查登記人口數(shù)作為估計普查目標總體普查登記人口數(shù)的基礎數(shù)據(jù)。

      表12 實際人口數(shù)、凈覆蓋誤差估計值

      Table 12 Actual population and estimated net coverage error

      等概率人口層普查登記人口數(shù)實際人口數(shù)凈覆蓋誤差 絕對數(shù)相對數(shù)(%) 男、0 - 14歲28973293854121.40 男、15 - 59歲800548164815941.95 男、60歲及以上1768917732430.24 女、0 - 14歲2699927026270.09 女、15 - 59歲79898801352370.29 女、60歲及以上1756417609450.26 總體25117725353523580.93

      從表12可以看出:總體凈覆蓋誤差為2358人,表明剔除普查多報人口數(shù)后在普查登記中凈漏報2358人,凈漏報率為0.93%。從各個等概率人口層的凈覆蓋誤差率來看,“男、15 - 59歲”的凈覆蓋誤差率最大,為1.95%,而凈覆蓋誤差率最小的是“0 - 14歲”,為0.09%。這表明,前者在普查中的漏報嚴重,普查登記質(zhì)量差;而后者的漏報情況最低,普查登記質(zhì)量好。

      4.3 計算等概率人口層及總體的抽樣方差與協(xié)方差

      雙系統(tǒng)估計量復雜,抽樣方差采取分層刀切抽樣方差估計量近似計算。先使用式(16)和表3數(shù)據(jù)來計算復制權數(shù),尤其是進入第二重樣本的樣本普查小區(qū)的復制權數(shù),見表13。然后依據(jù)復制權數(shù),使用式(18)、(19)、(21)和表4-表9數(shù)據(jù)計算等概率人口層的抽樣方差和協(xié)方差,見表14。

      表13 第二重樣本普查小區(qū)的復制權數(shù)

      Table 13 The replication weights of the second sample census

      剔除小區(qū)1256891112 10300200200171171171171 23000200200171171171171 3150150200200171171171171 4150150200200171171171171 51501500200129129129129 61501502000129129129129 7150150100100129129129129 81001001001000160120120 91001001001001600120120 101001001001008080120120 111001001001001201200160 121001001001001201201600 131001001001001201208080

      表14 等概率人口層及總體的抽樣方差及協(xié)方差

      Table 14 Sampling variance and covariance of equal probability population strata and population

      等概率層男、0-14歲男、15-59歲男、60歲以上女、0-14歲女、15-59歲女、60歲以上總體 男、0-14歲247993 220090 86950 41093 -205035 -2133 388958 男、15-59歲220090 499853 -85491 -187728 89271 19455 555450 男、60歲上86950 -85491 355883 125904 -244963 -4299 233984 女、0-14歲41093-187728 125904 552817 -798298 106502 -159710 女、15-59歲-205035 89271 -244963 -798298 144156 -22092 -1036961 女、60歲上-2133 19455 -4299 106502-22092 240456 337889 總體388958555450233984-159710-1036961337889319610

      表14為六個等概率人口層的抽樣方差及協(xié)方差,該抽樣方差及協(xié)方差矩陣是以各等概率人口層抽樣方差為對稱軸的對稱矩陣。各個等概率人口層的抽樣方差及該層與其他各等概率人口層的協(xié)方差之和即為總體的抽樣方差及協(xié)方差。如表14中“女、0-14歲”層的抽樣方差為552817 ,其與“男、0-14歲”、“男、15-59歲”、“男、60歲以上”、“女、15-59歲”、“女、60歲以上”層的協(xié)方差分別為41093、-187728、125904、-798298、106502??傮w方差為319610。

      5 結(jié)論

      1)構造雙系統(tǒng)估計量須滿足的兩個重要條件是:人口普查與事后計數(shù)調(diào)查相互獨立;人口總體中的每一個人有同樣的概率在普查中登記或者在事后計數(shù)調(diào)查中登記。在實際工作中,通過對人口普查質(zhì)量評估工作進行一系列的制度規(guī)定來滿足第一個條件。至于第二個條件,則是通過對總體進行登記概率同質(zhì)性分層來滿足。具體來說,就是尋找適當?shù)娜丝诮y(tǒng)計特征變量和地理位置變量對總體人口分層。這些分層變量應當能夠做到,把人口普查登記概率大致相同人口放在同一個層,把登記概率不同的人口放在不同的層。對這些選定的分層變量可以有兩種使用方式。一種是用這些分層變量對總體分層(在實際操作中用抽樣后分層來實現(xiàn)),分別在各層構造雙系統(tǒng)估計量,然后將各層的估計量在整個總體(全國)進行合成;另一種是把選定的分層變量作為回歸自變量,分別構造以人口的普查正確登記概率的Logistic變換為因變量,以及事后計數(shù)調(diào)查登記與普查登記匹配概率的Logistic變換為因變量的兩個Logistic回歸模型,對普查登記全國名單中每個人的普查正確登記概率預測值除以事后計數(shù)調(diào)查登記與普查登記匹配概率預測值的商求和,將其作為全國人口數(shù)目的估計量。可以證明,如果這里使用的回歸自變量與前一種方式使用的分層變量相同,那么這里構造的估計量與前者的全國合成估計量相等。

      2)人口普查質(zhì)量評估中所使用的抽樣方法屬于復雜抽樣設計,所以雙系統(tǒng)估計量的估計量方差不能用數(shù)學解析式直接計算,而需要選擇適當?shù)慕品椒▉砉烙嫛J褂谩按笳鄣丁狈椒?。它是把第一步樣本中的各個抽樣單元(普查小區(qū))逐一重置輪換切掉,每刀切一個單元之后,用樣本中余下的其他抽樣單元,按雙系統(tǒng)估計量的估計量計算程序,計算切掉該單元的切斷后復制估計量。每個樣本單元的切斷后復制估計量,與無切斷估計量的差平方的平均值即為所需要的“大折刀”估計方差。在這里,各個切斷后復制估計量與無切斷估計量相比,除了丟失掉一個樣本單元之外,余下的各個抽樣單元的抽樣權數(shù),也會隨著它們各自與被切掉單元之間關系的不同情況,而發(fā)生不同的改變。

      [1] 馮乃林,李希如,武潔,等.人口普查的事后質(zhì)量抽查 [R]. 國家統(tǒng)計局人口和就業(yè)統(tǒng)計司, 2012.

      [2] 胡桂華.人口普查凈誤差估計綜述 [J]. 數(shù)理統(tǒng)計與管理, 2018, 37 (5): 796-814.

      [3] 楊貴軍,徐文哲,林意智. 關于捕獲-再捕獲抽樣的置信區(qū)間 [J]. 統(tǒng)計與信息論壇, 2013, 28 (7): 9-14.

      [4] Petersen C G. The yearly immigration of young plaice into the limfjord from the german sea [R].Danish Biological Station, 1896.

      [5] Lincoln F. Calculating Waterfowl Abundance on the Basis of Banding Returns [J].Circular of the Department of Agriculture,1930,118 (6): 1-4.

      [6] Sekar C C, Deming W E. On a method of estimating birth and death rates and extent of registration [J]. Journal of the American Statistical Association, 1949, 44 (5): 101-115.

      [7] 胡桂華.人口普查質(zhì)量評估中抽樣后分層變量的選擇 [J]. 數(shù)理統(tǒng)計與管理,2015, 34 (2): 254-263.

      [8] 遲璐婕,胡桂華. 人口數(shù)目估計的多來源方法 [J]. 徐州工程學院學報, 2021, 36 (2): 84-92.

      [9] 胡桂華,莫錦萍,涂火年. 基于捕獲-再捕獲模型的雙系統(tǒng)估計量模型式框架[J]. 徐州工程學院學報:自然科學版, 2012, 27(4):23-29.

      [10] 胡桂華,孫曉宇,康穎,等.人口抽樣調(diào)查方案設計研究[J].徐州工程學院學報, 2017, 32(4): 24-29.

      [11] 胡桂華,武潔. 人口普查質(zhì)量評估理論與實踐[M].北京: 中國社會科學出版社, 2016.

      [12] 胡桂華,丁宣浩,陳義安,等.人口普查覆蓋誤差估計量研究 [J]. 數(shù)理統(tǒng)計與管理, 2018, 37(1):1-12.

      [13] Statistics South Africa. Census 2011 Post-enumeration Survey: Results and Methodology [R]. Statistics South Africa, 2012.

      [14] U.S. Census Bureau. 2020 Census detailed operational plan for: Post-enumeration survey operation [M]. Washington: U.S. Census Bureau, 2020.

      [15] U.S. Bureau of the Census. Accuracy and coverage evaluation of census 2000: Design and methodology [R]. U.S. Census Bureau, 2004.

      [16] Patrick J. Cantwell. Dual-system estimation [M]. Springer:Springer Nature, 2015.

      [17] 金勇進.抽樣:理論與應用[M]. 2版.北京:高等教育出版社, 2016.

      [18] 胡桂華.人口普查凈誤差構成部分的估計[J].統(tǒng)計研究,2011, 28( 3): 90-100.

      [19] 胡桂華,武潔. 人口普查質(zhì)量評估中Logistic回歸模型的應用 [J]. 數(shù)量經(jīng)濟技術經(jīng)濟研究,2015(4):106-122.

      [20] 胡桂華,吳東晟. 人口普查質(zhì)量評估調(diào)查的抽樣設計[J]. 數(shù)量經(jīng)濟技術經(jīng)濟研究,2014(4):113-129.

      [21] 胡桂華,杜艾卿. 基于單系統(tǒng)估計量的人口普查內(nèi)容誤差估計 [J]. 數(shù)理統(tǒng)計與管理, 2018, 37(6): 951-963.

      ESTIMATION FOR NET CENSUS COVERAGE ERROR

      *YE Bao-hong, HU Gui-hua

      (School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing 400067, China)

      In view of the problems that the government statistical departments of our country and many other countries ignore the equal probability stratification of the overall population, do not consider population movement, and fail to adopt scientific and effective methods to calculate the sampling variance of dual-system estimator, when applying dual-system estimator, the research objective on constructing the dual-system estimator and the stratified Jack-Knife sampling variance estimator based on the capture-recapture model is proposed. In order to achieve the goal, a combination of field survey, sampling estimation and literature interpretation is adopted to study the dual-system estimator with complete enumerations and sampling enumerations and its variance estimation. The study finds that the dual-system estimator must be established and used in the equal-probability population stratum, otherwise a heterogeneous bias will occur, which will underestimate the overall actual population and net coverage error. The research innovation lies in the establishment of a dual-system estimator with population movement and sample enumerations, which is suitable for the application in our country based on the in-depth study of the US population movement processing methods. The value of the research is that the established dual-system estimator is expected to be applied to the net coverage error estimation of the 2030 census in our country.

      post-count survey; capture-recapture model; stratified Jack-knife sampling variance estimator

      1674-8085(2022)01-0008-12

      O212

      A

      10.3969/j.issn.1674-8085.2022.01.002

      2021-07-17;

      2021-09-25

      全國統(tǒng)計科學研究重點項目(2019LZ28);教育部人文社會科學研究規(guī)劃基金項目(20YJ910002)

      *葉寶紅(1996-),女,重慶璧山人,碩士生,主要從事人口普查質(zhì)量評估研究(E-mail:820462824@qq.com).

      猜你喜歡
      雙系統(tǒng)估計量人口數(shù)
      區(qū)域?qū)崟r雙系統(tǒng)精密衛(wèi)星鐘差估計及PPP精度分析
      確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
      人大研究(2022年3期)2022-04-13 00:47:04
      淺談估計量的優(yōu)良性標準
      基于配網(wǎng)先驗信息的諧波狀態(tài)估計量測點最優(yōu)配置
      電測與儀表(2015年6期)2015-04-09 12:00:50
      解決雙系統(tǒng)平板的常見問題
      電腦愛好者(2015年6期)2015-04-03 01:20:56
      好事成“雙” 直擊雙系統(tǒng)平板電腦
      電腦愛好者(2015年6期)2015-04-03 01:20:56
      負極值指標估計量的漸近性質(zhì)
      北斗/GPS雙系統(tǒng)單頻RTK模糊度解算性能分析
      灰色預測模型與LOGISTIC模型在深圳人口預測方面對比研究
      商·財會(2013年9期)2013-04-29 07:25:16
      使用變異系數(shù)和Kurtosis系數(shù)的雙輔助變量的比估計
      安塞县| 新兴县| 扶风县| 繁昌县| 天津市| 勃利县| 晴隆县| 茌平县| 高邮市| 依安县| 南岸区| 长海县| 长寿区| 丹寨县| 稻城县| 黄大仙区| 田阳县| 灵璧县| 淮滨县| 平湖市| 新丰县| 台南市| 松潘县| 滕州市| 开鲁县| 大余县| 铁力市| 西畴县| 正蓝旗| 稷山县| 射阳县| 齐齐哈尔市| 扬中市| 德州市| 施甸县| 恭城| 壶关县| 柳州市| 灵台县| 麻城市| 浦县|