• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中國(guó)戶籍登記系統(tǒng)覆蓋評(píng)估研究

      2018-07-24 00:56:42胡桂華
      統(tǒng)計(jì)與信息論壇 2018年7期
      關(guān)鍵詞:估計(jì)量人口數(shù)人口普查

      胡桂華,薛 婷

      (重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)

      一、引 言

      為了及時(shí)了解人口的動(dòng)態(tài)變化,美國(guó)、北歐等西方發(fā)達(dá)國(guó)家和部分非洲國(guó)家的政府行政機(jī)構(gòu)建立起類似于中國(guó)戶籍登記系統(tǒng)的民事登記系統(tǒng),如全國(guó)人口登記冊(cè)、就業(yè)登記冊(cè)、學(xué)歷學(xué)位登記冊(cè)、學(xué)生入學(xué)登記冊(cè)等[1]。這種系統(tǒng)通過登記人口的出生、死亡、遷移等人口事件獲得某個(gè)時(shí)點(diǎn)上的總體或其子總體的人口數(shù)。由于主客觀原因,民事登記系統(tǒng)可能多登、少登或滯后登記人口[2]。聯(lián)合國(guó)統(tǒng)計(jì)司要求各國(guó)政府統(tǒng)計(jì)部門使用雙系統(tǒng)估計(jì)量估計(jì)民事登記系統(tǒng)的凈誤差率,把通過凈誤差率調(diào)整后的民事登記系統(tǒng)作為人口統(tǒng)計(jì)數(shù)據(jù)來源[3]。凈誤差率定義為總體實(shí)際人數(shù)與民事登記系統(tǒng)人數(shù)之差除以前者的比值。可見,民事登記系統(tǒng)凈誤差率估計(jì)的關(guān)鍵是總體實(shí)際人數(shù)的估計(jì)。

      中國(guó)、朝鮮和貝寧未建立民事登記系統(tǒng),而是建立戶籍登記系統(tǒng)。戶籍登記系統(tǒng)的宗旨與民事登記系統(tǒng)不同,它是一種行政管理手段,目的是實(shí)現(xiàn)對(duì)人口的管理,而不是提供準(zhǔn)確的人口數(shù)。盡管中國(guó)戶籍登記制度規(guī)定,每個(gè)人都有資格申報(bào)戶口,每個(gè)出生者應(yīng)該在規(guī)定時(shí)間申報(bào)戶口且只能申報(bào)一個(gè)戶口,每個(gè)死亡者應(yīng)該及時(shí)注銷戶口,但在現(xiàn)實(shí)中并未得到嚴(yán)格執(zhí)行。中國(guó)“六普”前的戶籍整頓結(jié)果顯示,戶籍系統(tǒng)由于長(zhǎng)期計(jì)劃生育政策的實(shí)施或受其他因素的制約而存在一定比例的一人多戶、死亡未注銷戶口、超生嬰兒未入戶等現(xiàn)象。從短期內(nèi)來看,這些現(xiàn)象還難以消除。以上事實(shí)表明,雖然從戶籍系統(tǒng)能夠如民事登記系統(tǒng)一樣獲得某個(gè)時(shí)點(diǎn)的人口數(shù),但這個(gè)人口數(shù)是有偏差的[4]。為了確保基于這個(gè)人口數(shù)所做計(jì)劃或決策的科學(xué)性,對(duì)戶籍登記系統(tǒng)進(jìn)行質(zhì)量評(píng)估是必要的。根據(jù)評(píng)估得到的凈誤差率來判斷這種偏離的程度,從而決定是否使用及如何使用它提供的人口數(shù)。

      在民事登記系統(tǒng)覆蓋評(píng)估中,依據(jù)同一樣本普查小區(qū)相互獨(dú)立的民事登記系統(tǒng)和人口普查(或人口抽樣調(diào)查)資料構(gòu)造的基于兩次捕獲模型的雙系統(tǒng)估計(jì)量是目前估計(jì)民事登記系統(tǒng)實(shí)際人口數(shù)及其凈誤差率的主流方法[5]。然而,雙系統(tǒng)估計(jì)量有一個(gè)重要的限制條件,那就是它要求兩個(gè)資料系統(tǒng)必須獨(dú)立。如果不能滿足這個(gè)條件,就會(huì)產(chǎn)生交互作用偏差而導(dǎo)致估計(jì)量有偏[6]。在人口普查質(zhì)量評(píng)估工作中,用人口普查資料和人口普查質(zhì)量評(píng)估時(shí)的人口登記資料構(gòu)造雙系統(tǒng)估計(jì)量,由于很難保證這兩個(gè)資料系統(tǒng)獨(dú)立,所以用這個(gè)估計(jì)量來估計(jì)實(shí)際人口數(shù)是有偏的。正是由于這個(gè)問題,有學(xué)者曾撰文建議在人口普查質(zhì)量評(píng)估工作中估計(jì)實(shí)際人口數(shù)時(shí),舍棄雙系統(tǒng)估計(jì)量,而用三系統(tǒng)估計(jì)量來取代它[7]。現(xiàn)在情況有所不同。本文是用民事登記系統(tǒng)與人口普查登記資料來構(gòu)造雙系統(tǒng)估計(jì)量。從直觀上來分析,這兩個(gè)資料系統(tǒng)非獨(dú)立的風(fēng)險(xiǎn)似乎較前者要小些,用來估計(jì)實(shí)際人口數(shù)的雙系統(tǒng)估計(jì)量有偏的風(fēng)險(xiǎn)也會(huì)小些[8]。但是,我們還是建議用三系統(tǒng)估計(jì)量來取代它。這是因?yàn)殡p系統(tǒng)估計(jì)量只是利用了人口普查登記資料這一種輔助信息。抽樣調(diào)查理論中,在構(gòu)造估計(jì)量的時(shí)候,利用的輔助信息越多,估計(jì)量的精度也會(huì)越高。在上述兩個(gè)系統(tǒng)的基礎(chǔ)上,如果把人口普查質(zhì)量評(píng)估時(shí)所做的人口登記資料添加進(jìn)來,構(gòu)造基于三次捕獲模型的三系統(tǒng)估計(jì)量,就會(huì)比雙系統(tǒng)估計(jì)量更充分地利用了輔助信息,因而可進(jìn)一步提高總體實(shí)際人口數(shù)估計(jì)的精度[9-10]。

      雖然三系統(tǒng)估計(jì)量的理論基礎(chǔ)是三次捕獲模型,但它們之間有本質(zhì)區(qū)別。第一,三次捕獲模型利用三次全面捕獲資料估計(jì)動(dòng)物總體規(guī)模,而三系統(tǒng)估計(jì)量利用三次抽樣資料估計(jì)人類總體規(guī)模。換句話說,所構(gòu)造的三系統(tǒng)估計(jì)量,應(yīng)該是基于全面調(diào)查總體值的三系統(tǒng)估計(jì)量的估計(jì)量。第二,三次捕獲模型在靈敏性、生活習(xí)性、體型、年歲等諸多方面大致相同的動(dòng)物總體內(nèi)估計(jì)動(dòng)物數(shù)目。國(guó)外學(xué)者在使用三次捕獲模型時(shí),都未曾考慮過對(duì)總體中的動(dòng)物分層,在默認(rèn)動(dòng)物總體中的動(dòng)物具有同樣特性這種背景下研究和使用三次捕獲模型。在構(gòu)造三系統(tǒng)估計(jì)量時(shí)要求總體中的人口在人口普查及其質(zhì)量評(píng)估調(diào)查、戶籍登記系統(tǒng)中各自的登記概率相同。但事實(shí)上,在進(jìn)行上述每一種登記的時(shí)候,都會(huì)由于某些人口統(tǒng)計(jì)特征變量的影響,使得總體中的人口在進(jìn)行此種登記時(shí),登記的概率有所差別。于是就需要把影響每一種登記概率的特征變量找出來,用所有變量對(duì)總體中的人口交叉分層[11],使得分在同一交叉層中的人口進(jìn)行每一種登記時(shí)都具有相同的登記概率,在這樣的層中構(gòu)造三系統(tǒng)估計(jì)量,然后再將各層的估計(jì)量在整個(gè)總體合成。第三,三次捕獲模型未考慮各次捕獲之間動(dòng)物的移動(dòng),采用較為簡(jiǎn)單的無移動(dòng)模型估計(jì)動(dòng)物總體數(shù)目。三系統(tǒng)估計(jì)量則需要考慮各個(gè)系統(tǒng)之間在不同時(shí)間上人口的移動(dòng),構(gòu)造人口移動(dòng)的三系統(tǒng)估計(jì)量,從而完成總體實(shí)際人口數(shù)估計(jì)的任務(wù)。第四,計(jì)算三次捕獲模型與三系統(tǒng)估計(jì)量的抽樣方差公式不一樣,其中后者通常使用復(fù)制抽樣方差估計(jì)量近似計(jì)算所估計(jì)人口數(shù)的抽樣方差估計(jì)值。該抽樣方差估計(jì)量用來解決復(fù)雜估計(jì)量的抽樣方差計(jì)算,在西方抽樣領(lǐng)域應(yīng)用廣泛,但在中國(guó)應(yīng)用甚少。復(fù)制抽樣方差估計(jì)量要求每一層的第一重樣本不少于5個(gè)抽樣單位,否則高估總體參數(shù)估計(jì)量的抽樣方差。第五,根據(jù)三次捕獲之間的各種統(tǒng)計(jì)關(guān)系構(gòu)造與之相適應(yīng)的三次捕獲模型,將既定數(shù)據(jù)代入各種三次捕獲模型,使用皮爾遜卡方檢驗(yàn)統(tǒng)計(jì)量或?qū)?shù)似然比估計(jì)量完成最佳三次捕獲模型的選擇。但是三系統(tǒng)估計(jì)量中的三個(gè)系統(tǒng)(人口普查、人口普查的質(zhì)量評(píng)估調(diào)查和戶籍登記系統(tǒng))在現(xiàn)實(shí)中的統(tǒng)計(jì)關(guān)系是客觀固定的,能夠分析出哪一種統(tǒng)計(jì)關(guān)系最可能發(fā)生,并構(gòu)造與之相應(yīng)的三系統(tǒng)估計(jì)量,無需進(jìn)行各種統(tǒng)計(jì)關(guān)系下的三系統(tǒng)估計(jì)量選擇。

      從以上分析可以看出,使用三系統(tǒng)估計(jì)量需要具備如下條件或做好以下工作。首先,對(duì)總體使用反映人口在三個(gè)系統(tǒng)登記概率的變量對(duì)總體人口分層,在等概率人口層構(gòu)造三系統(tǒng)估計(jì)量。其次,先構(gòu)造三個(gè)系統(tǒng)對(duì)總體全面登記的三系統(tǒng)估計(jì)量,然后使用有限總體概率樣本構(gòu)造上述三系統(tǒng)估計(jì)量的每一個(gè)構(gòu)成部分的線性估計(jì)量,得到三個(gè)系統(tǒng)對(duì)總體抽樣登記的三系統(tǒng)估計(jì)量。然后,在人口普查、戶籍登記系統(tǒng)與質(zhì)量評(píng)估調(diào)查之間,總體人口會(huì)從一個(gè)普查小區(qū)移動(dòng)到另外一個(gè)普查小區(qū)。為了適應(yīng)這一情況,需要構(gòu)造人口移動(dòng)的三系統(tǒng)估計(jì)量。最后,獲取同一普查小區(qū)三個(gè)系統(tǒng)人口登記的微觀資料,這是一項(xiàng)十分困難的工作。

      國(guó)外學(xué)者在一些人群或地區(qū)做三系統(tǒng)估計(jì)量試點(diǎn)工作[12],取得了較為理想的估計(jì)結(jié)果,為在民事(戶籍)登記系統(tǒng)的覆蓋率評(píng)估中應(yīng)用三系統(tǒng)估計(jì)量奠定了基礎(chǔ)。國(guó)外學(xué)者在這些試點(diǎn)中使用的是三個(gè)系統(tǒng)對(duì)總體全面登記的三系統(tǒng)估計(jì)量。在民事(戶籍)登記質(zhì)量覆蓋評(píng)估中,三系統(tǒng)資料是經(jīng)過有限總體概率抽樣所抽出的各個(gè)普查小區(qū)的三種人口的登記名單。在中國(guó)戶籍登記系統(tǒng)覆蓋評(píng)估中想要借鑒外國(guó)學(xué)者在試點(diǎn)工作中構(gòu)造的三系統(tǒng)估計(jì)量的經(jīng)驗(yàn)時(shí),須對(duì)有關(guān)的研究成果做進(jìn)一步的拓展,使其適用于民事(戶籍)登記質(zhì)量覆蓋評(píng)估[13]。

      根據(jù)中國(guó)人口統(tǒng)計(jì)調(diào)查的實(shí)際情況,對(duì)戶籍登記系統(tǒng)的覆蓋評(píng)估可以在人口普查年或非人口普查年實(shí)施。如果安排在人口普查年,就構(gòu)造人口普查、人口普查的質(zhì)量評(píng)估調(diào)查及戶籍登記系統(tǒng)資料的三系統(tǒng)估計(jì)量估計(jì)總體實(shí)際人口數(shù)。如果安排在非人口普查年,就構(gòu)造人口抽樣調(diào)查、人口抽樣調(diào)查的質(zhì)量評(píng)估調(diào)查及戶籍登記系統(tǒng)的三系統(tǒng)估計(jì)量估計(jì)戶籍登記系統(tǒng)凈誤差率。本文只研究人口普查年戶籍登記系統(tǒng)的覆蓋評(píng)估。

      迄今,中國(guó)尚未開展戶籍登記系統(tǒng)覆蓋評(píng)估工作。《中國(guó)統(tǒng)計(jì)年鑒》每年提供存在一定誤差的戶籍人口數(shù)。我們應(yīng)該改變這一狀況,盡早開展戶籍登記系統(tǒng)覆蓋評(píng)估工作,為未來實(shí)施以戶籍登記系統(tǒng)為核心的行政記錄式人口普查創(chuàng)造條件。

      二、三系統(tǒng)估計(jì)量理論

      三系統(tǒng)估計(jì)量建立基礎(chǔ)為最初用來估計(jì)動(dòng)物總體規(guī)模的三次捕獲模型。沒有三次捕獲模型就沒有三系統(tǒng)估計(jì)量。在三次捕獲模型發(fā)展歷史上,國(guó)外學(xué)者做出了突出貢獻(xiàn)。他們通過對(duì)同一動(dòng)物總體的三次全面捕獲,以及三次捕獲之間的統(tǒng)計(jì)關(guān)系(獨(dú)立還是相關(guān)),使用對(duì)數(shù)線性模型和最大似然估計(jì)等方法構(gòu)造了各種統(tǒng)計(jì)關(guān)系的三次捕獲模型。將三次捕獲模型移植到人類總體構(gòu)造三系統(tǒng)估計(jì)量,我們需要了解和掌握三次捕獲模型[14]。

      (一)三次捕獲模型

      三次捕獲模型由兩次捕獲模型拓展而來。從兩次捕獲模型入手有助于三次捕獲模型的理解,解決三次捕獲模型構(gòu)建中的疑難問題。二維列聯(lián)表是分析和構(gòu)造兩次捕獲模型的重要工具。把每一次捕獲的動(dòng)物總體中的動(dòng)物數(shù)目及通過比對(duì)兩次捕獲的動(dòng)物名單得到的同時(shí)出現(xiàn)在兩次捕獲中的動(dòng)物數(shù)目填入二維列聯(lián)表,見表1。用{xij}表示每個(gè)單元(ij)的觀察值。第一,x11,x10,x1+分別表示同時(shí)在兩次捕獲中捕獲到的動(dòng)物數(shù)目,在第一次捕獲中捕獲到但未在第二次捕獲中捕獲到的動(dòng)物數(shù)目,在第一次捕獲中捕獲到的動(dòng)物數(shù)目(x1+=x11+x10);第二,x01,x00,x0+分別表示未在第一次捕獲中捕獲到但在第二次捕獲中捕獲到的動(dòng)物數(shù)目,兩次捕獲中均未捕獲到的動(dòng)物數(shù)目(未知,需要估計(jì)),未在第一次捕獲中捕獲到的動(dòng)物數(shù)目(x0+=x01+x00);第三,x+1,x+0,N分別表示在第二次捕獲中捕獲到的動(dòng)物數(shù)目(x+1=x11+x01),未在第二次捕獲中捕獲到的動(dòng)物數(shù)目(x+0=x10+x00),動(dòng)物總數(shù)目(未知,需要估計(jì))。N=n+x00,n=x11+x10+x01為在兩次捕獲中捕獲到的動(dòng)物數(shù)目,是已知的?,F(xiàn)在所要做的工作是,構(gòu)造N和x00的估計(jì)量。它們分別為:

      (1)

      (2)

      式(1)或式(2)成立的前提條件是兩次捕獲相互獨(dú)立。下面將要討論的三次捕獲模型則不受各次捕獲之間是否獨(dú)立的限制。討論三次捕獲模型的工具是三維列聯(lián)表,見表2。

      表2 三次捕獲的三維列聯(lián)表

      (3)

      (4)

      (二)三系統(tǒng)估計(jì)量

      前面探討的8種三次捕獲模型是針對(duì)三次捕獲之間可能發(fā)生的統(tǒng)計(jì)關(guān)系構(gòu)造的,而不是針對(duì)某個(gè)特定統(tǒng)計(jì)關(guān)系構(gòu)建的。在將三次捕獲模型移植到人類總體構(gòu)造三系統(tǒng)估計(jì)量時(shí),并不需要構(gòu)造8種三系統(tǒng)估計(jì)量,而是要根據(jù)研究的特定對(duì)象,選擇1種與研究對(duì)象有關(guān)的三次捕獲模型來構(gòu)造三系統(tǒng)估計(jì)量。

      本文討論的三系統(tǒng)估計(jì)量中的三個(gè)系統(tǒng)為普查年的人口普查、人口普查的質(zhì)量評(píng)估調(diào)查及戶籍登記系統(tǒng),也就是說,要討論人口普查年的戶籍登記系統(tǒng)覆蓋評(píng)估問題。

      在決定使用哪一種三次捕獲模型構(gòu)造三系統(tǒng)估計(jì)量時(shí),要分析這三個(gè)系統(tǒng)之間的統(tǒng)計(jì)關(guān)系,從中選擇最可能發(fā)生的統(tǒng)計(jì)關(guān)系,使用與這種統(tǒng)計(jì)關(guān)系相一致的三次捕獲模型構(gòu)造該種統(tǒng)計(jì)關(guān)系的三系統(tǒng)估計(jì)量。

      人口普查、人口普查的質(zhì)量評(píng)估調(diào)查及戶籍登記系統(tǒng)可能的統(tǒng)計(jì)關(guān)系有8種:第一,人口普查、質(zhì)量評(píng)估調(diào)查及戶籍登記系統(tǒng)相互獨(dú)立;第二,人口普查與質(zhì)量評(píng)估調(diào)查相關(guān),分別與戶籍登記系統(tǒng)獨(dú)立;第三,人口普查與戶籍登記系統(tǒng)相關(guān),分別與質(zhì)量評(píng)估調(diào)查獨(dú)立;第四,質(zhì)量評(píng)估調(diào)查與戶籍登記系統(tǒng)相關(guān),分別與人口普查獨(dú)立;第五,人口普查與質(zhì)量評(píng)估調(diào)查相關(guān),戶籍登記系統(tǒng)與質(zhì)量評(píng)估調(diào)查相關(guān),人口普查與戶籍登記系統(tǒng)獨(dú)立;第六,質(zhì)量評(píng)估調(diào)查與人口普查相關(guān),戶籍登記系統(tǒng)與人口普查相關(guān),質(zhì)量評(píng)估調(diào)查與戶籍登記系統(tǒng)獨(dú)立;第七,人口普查與戶籍登記系統(tǒng)相關(guān),質(zhì)量評(píng)估調(diào)查與戶籍登記系統(tǒng)相關(guān),人口普查與質(zhì)量評(píng)估調(diào)查獨(dú)立;第八,人口普查與質(zhì)量評(píng)估調(diào)查相關(guān),質(zhì)量評(píng)估調(diào)查與戶籍登記系統(tǒng)相關(guān),人口普查與戶籍登記系統(tǒng)相關(guān)。

      在上述8種關(guān)系中,現(xiàn)實(shí)中最可能發(fā)生的是第2種統(tǒng)計(jì)關(guān)系。包括美國(guó)和中國(guó)在內(nèi)的許多國(guó)家的人口普查及其質(zhì)量評(píng)估調(diào)查工作都是由各國(guó)的政府統(tǒng)計(jì)部門統(tǒng)一組織開展的,其工作目標(biāo)也都是為了獲得普查標(biāo)準(zhǔn)時(shí)點(diǎn)上的全國(guó)及各個(gè)地區(qū)的人口總數(shù)。另外,為了節(jié)約調(diào)查員的培訓(xùn)時(shí)間和調(diào)查經(jīng)費(fèi),在質(zhì)量評(píng)估調(diào)查中,往往使用本次的優(yōu)秀普查員,充其量只是將他們派往到不同于普查時(shí)的調(diào)查小區(qū)做質(zhì)量評(píng)估工作。這就決定了人口普查與質(zhì)量評(píng)估調(diào)查是統(tǒng)計(jì)相關(guān),而不是統(tǒng)計(jì)獨(dú)立。中國(guó)戶籍登記系統(tǒng)的登記機(jī)構(gòu)是公安局下屬的戶籍科,登記目標(biāo)是人口管理。這表明戶籍登記系統(tǒng)與人口普查或質(zhì)量評(píng)估調(diào)查是統(tǒng)計(jì)獨(dú)立,而不是統(tǒng)計(jì)相關(guān)。也就是說,這種統(tǒng)計(jì)關(guān)系在現(xiàn)實(shí)中成立的依據(jù)很充分,在構(gòu)造三系統(tǒng)估計(jì)量時(shí)應(yīng)該予以重點(diǎn)關(guān)注。有鑒于此,只討論這種統(tǒng)計(jì)關(guān)系的三系統(tǒng)估計(jì)量構(gòu)造方法。美國(guó)當(dāng)今三系統(tǒng)估計(jì)量研究著名學(xué)者Griffin也只是構(gòu)造這種統(tǒng)計(jì)關(guān)系的三系統(tǒng)估計(jì)量。相應(yīng)地,只需要構(gòu)造第2種統(tǒng)計(jì)關(guān)系下的三系統(tǒng)估計(jì)量。

      在將三次捕獲模型移植到人類總體構(gòu)造三系統(tǒng)估計(jì)量時(shí),還需要考慮的一個(gè)重要問題是,如何使得總體中的人口如同動(dòng)物總體中的動(dòng)物那樣具有同樣的捕獲概率??傮w中的人口由于這樣或那樣的原因,在人口普查或質(zhì)量評(píng)估調(diào)查或戶籍系統(tǒng)中的登記概率存在差異。這就需要選擇反映登記概率大小的變量對(duì)總體中的人口等概率分層,在等概率層(用l表示)構(gòu)造三系統(tǒng)估計(jì)量。

      在人口普查、質(zhì)量評(píng)估調(diào)查、戶籍系統(tǒng)對(duì)總體全面登記假定條件下,依據(jù)式(3)的三次捕獲模型構(gòu)造的等概率層l的未知單元{000}的三系統(tǒng)估計(jì)量為:

      (5)

      (6)

      其中,xl=x111,l+x101,l+x110,l+x100,l+x011,l+x001,l+x010,l。

      為區(qū)別于下面的三系統(tǒng)估計(jì)量,把式(5)或式(6)稱為三個(gè)系統(tǒng)對(duì)總體全面登記的、無人口移動(dòng)的三系統(tǒng)估計(jì)量。這樣的三系統(tǒng)估計(jì)量是三個(gè)系統(tǒng)對(duì)總體全面登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量及三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量的基礎(chǔ)。

      =[(x001n,l+x001o,l)(x110n,l+x110o,l+

      x100n,l+x100o,l+x010n,l+x010o,l)]/

      [x111n,l+x111o,l+x101n,l+x101o,l+

      x011n,l+x011o,l]

      (7)

      由于在普查標(biāo)準(zhǔn)時(shí)點(diǎn)和質(zhì)量評(píng)估調(diào)查時(shí)點(diǎn)之間遷出本小區(qū)的向外移動(dòng)者不可能登記在本小區(qū)的質(zhì)量評(píng)估調(diào)查人口名單中,即x111o,l=x011o,l=x110o,l=x010o,l=0。把這些數(shù)據(jù)代入式(7)得到式(8):

      (8)

      xn,o,l=x111n,l+x101n,l+x101o,l+x110n,l+x100n,l+

      x100o,l+x011n,l+x001n,l+x001o,l+x010n,l

      (9)

      (10)

      2.等概率人口層l的三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量。這樣的三系統(tǒng)估計(jì)量適合于人口普查年的戶籍登記系統(tǒng)覆蓋率估計(jì)。人口普查和戶籍登記系統(tǒng)是對(duì)全國(guó)所有調(diào)查小區(qū)的人口登記,而質(zhì)量評(píng)估調(diào)查是對(duì)全國(guó)樣本調(diào)查小區(qū)的人口登記。三次捕獲模型建立的前提條件是,三次捕獲都是對(duì)總體的全部動(dòng)物捕獲。人口普查與戶籍登記系統(tǒng)是對(duì)全國(guó)人口的全面登記,這一點(diǎn)無法改變。為了依據(jù)三次捕獲模型構(gòu)造三系統(tǒng)估計(jì)量,只能假設(shè)質(zhì)量評(píng)估調(diào)查是對(duì)全國(guó)人口的全面登記,并在這樣的假設(shè)條件下構(gòu)造基于三次捕獲模型的三系統(tǒng)估計(jì)量。這種假設(shè)是有科學(xué)依據(jù)的。首先,統(tǒng)計(jì)理論模型大多建立在一些假設(shè)條件基礎(chǔ)上。其次,質(zhì)量評(píng)估調(diào)查理論上可以對(duì)總體人口進(jìn)行全面登記,只是為了節(jié)約成本開支及時(shí)間才采取抽樣登記方式。再次,包括美國(guó)、瑞士在內(nèi)的許多國(guó)家在構(gòu)造雙系統(tǒng)估計(jì)量時(shí)也是假設(shè)質(zhì)量評(píng)估調(diào)查是對(duì)總體人口的全面登記,三系統(tǒng)估計(jì)量是雙系統(tǒng)估計(jì)量的自然延伸,對(duì)雙系統(tǒng)估計(jì)量所做假設(shè)自然適合于三系統(tǒng)估計(jì)量??紤]到質(zhì)量評(píng)估調(diào)查實(shí)際上是對(duì)總體人口的抽樣登記,因而需要用有限總體概率樣本表示三個(gè)系統(tǒng)對(duì)總體全面登記的三系統(tǒng)估計(jì)量的各個(gè)構(gòu)成元素,使其成為三個(gè)系統(tǒng)對(duì)總體抽樣登記的三系統(tǒng)估計(jì)量。包括美國(guó)普查局在內(nèi)的所有政府統(tǒng)計(jì)機(jī)構(gòu)和其他相關(guān)研究人員迄今尚未構(gòu)造出三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量,他們只是構(gòu)造了基于三次捕獲模型的三個(gè)系統(tǒng)對(duì)總體全面登記的三系統(tǒng)估計(jì)量。

      構(gòu)造三個(gè)系統(tǒng)對(duì)總體抽樣登記的三系統(tǒng)估計(jì)量,只需要將式(8)或式(9)中的每一個(gè)單元用估計(jì)量的形式表示即可,結(jié)果見式(11)或式(12):

      (11)

      (12)

      (13)

      為了構(gòu)造式(11)、式(12)等式右邊的每一個(gè)估計(jì)量,需要先了解質(zhì)量評(píng)估調(diào)查的抽樣方法。在大規(guī)模質(zhì)量評(píng)估抽樣調(diào)查中,通常使用二重抽樣法抽取樣本[15-18]。相比一重抽樣,二重抽樣的優(yōu)勢(shì)是,在同樣的成本下,總體參數(shù)估計(jì)量的抽樣方差較小。應(yīng)用二重抽樣的一個(gè)前提條件是,在對(duì)第一重樣本普查小區(qū)的現(xiàn)場(chǎng)觀察中發(fā)現(xiàn)了較多的住房單元地址登記誤差或者其他對(duì)第一重樣本進(jìn)一步分層的變量,以便抽取代表性更大的第二重樣本。另外一個(gè)條件是,發(fā)現(xiàn)第一重樣本的規(guī)模過大,為節(jié)省調(diào)查經(jīng)費(fèi)或減少調(diào)查誤差而壓縮其規(guī)模。二重抽樣在以美國(guó)為代表的發(fā)達(dá)國(guó)家政府統(tǒng)計(jì)部門應(yīng)用廣泛。迄今中國(guó)國(guó)家統(tǒng)計(jì)局尚未將二重抽樣應(yīng)用于人口統(tǒng)計(jì)調(diào)查。

      在抽取第一重樣本之前,為提高樣本對(duì)總體的代表性及便于編制抽樣框,按照規(guī)模對(duì)普查小區(qū)分層,分為兩層(H=2):80個(gè)及以上住房單元的普查小區(qū)層(h=1);80個(gè)以下住房單元的普查小區(qū)層(h=2)。每一層的普查小區(qū)總數(shù)用Nh表示。在每一層,以普查小區(qū)為抽樣單位,采取簡(jiǎn)單隨機(jī)不重復(fù)抽樣方式抽取普查小區(qū),抽取的普查小區(qū)數(shù)用nh表示。每一h層的第i普查小區(qū)的抽樣權(quán)數(shù)用whi表示。hi樣本普查小區(qū)人口分配到等概率人口層l的人口數(shù)用ylhi表示。對(duì)抽取的第一步樣本普查小區(qū),現(xiàn)場(chǎng)了解每一個(gè)樣本普查小區(qū)住房單元所在街道、建筑物類型、門牌號(hào)碼、家庭成員等輔助信息,并把它們作為第二重抽樣的輔助變量,對(duì)第一重抽樣每一層的樣本普查小區(qū)重新分層。按照戶籍人口占全部人口比例對(duì)普查小區(qū)分層,分為兩層(G=2):戶籍人口比例不足50%的普查小區(qū)層(g=1),戶籍人口比例超過50%的普查小區(qū)層(g=2)。每一新g層的普查小區(qū)總數(shù)用Mhg表示。從每一新層,以普查小區(qū)為抽樣單位,采取簡(jiǎn)單隨機(jī)不重復(fù)抽樣方式抽取第二重樣本普查小區(qū),抽取的普查小區(qū)數(shù)用mhg表示。層hg的hgi小區(qū)在層l的人口數(shù)用ylhgi表示。

      (14)

      式(14)中,如果hi普查小區(qū)屬于g層,xhgi=1,否則xhgi=0;如果hi普查小區(qū)進(jìn)入第二重樣本,Ihgi=1,否則Ihgi=0;αhgi是hi樣本調(diào)查小區(qū)經(jīng)過兩重抽樣的抽樣權(quán)數(shù),如果這兩重抽樣都是簡(jiǎn)單隨機(jī)抽樣,那么αhgi=(Nh/nh)(Mhg/mhg)。

      (15)

      (16)

      式(16)中:

      (17)

      (18)

      (19)

      根據(jù)上面的討論,寫出hgi普查小區(qū)復(fù)制權(quán)數(shù)的完整計(jì)算公式:

      (20)

      3.總體的三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量。在構(gòu)造了等概率人口層l的三系統(tǒng)估計(jì)量后,只需要進(jìn)行簡(jiǎn)單的合成操作,即可得到總體的三系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量[20]。

      (21)

      (22)

      (23)

      4.總體戶籍登記系統(tǒng)凈誤差率估計(jì)量。分別用TCR和THR表示總體戶籍登記系統(tǒng)凈誤差率及戶籍登記系統(tǒng)人口數(shù)。根據(jù)前面的凈誤差率定義,以及式(21)和式(22)寫出TCR估計(jì)量及其抽樣方差估計(jì)量。

      (24)

      (25)

      三、實(shí)證研究

      (一)調(diào)查范圍及資料來源

      實(shí)證調(diào)查的范圍為重慶市南岸區(qū)管轄下的銅元局街道、花園路街道、南坪街道、海棠溪街道、龍門浩街道、彈子石街道、南山街道和涂山鎮(zhèn)。為敘述便利,統(tǒng)一稱為重慶市南岸區(qū)部分街道,共有普查小區(qū)2 200個(gè),并估計(jì)其2017年6月1日戶籍登記系統(tǒng)的凈誤差率。

      實(shí)證研究的目標(biāo)是:發(fā)現(xiàn)理論與方法闡述中的紕漏,從而及時(shí)更正;驗(yàn)證理論和方法的合理性和實(shí)用性;幫助讀者更加直觀地了解三系統(tǒng)估計(jì)量的計(jì)算方法;向國(guó)家統(tǒng)計(jì)局提交2016年立項(xiàng)的重點(diǎn)課題《我國(guó)戶籍登記系統(tǒng)覆蓋評(píng)估研究》研究報(bào)告,作為制訂中國(guó)2020年及以后戶籍登記系統(tǒng)覆蓋評(píng)估方案的重要參考。

      迄今所有國(guó)家都未在戶籍登記系統(tǒng)覆蓋評(píng)估中使用三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量。因此,實(shí)證分析資料無法從各國(guó)政府統(tǒng)計(jì)部門獲得。即使各國(guó)政府統(tǒng)計(jì)部門在戶籍登記系統(tǒng)覆蓋評(píng)估中使用過三系統(tǒng)估計(jì)量,從他們那里獲得樣本普查小區(qū)的三個(gè)系統(tǒng)的住戶及個(gè)人微觀資料也很困難。

      在樓棟長(zhǎng)的幫助下,我們獲得了重慶市南岸區(qū)部分街道8個(gè)樣本普查小區(qū)的三份人口登記名單,依次稱為第一次調(diào)查人口登記名單、第二次調(diào)查人口登記名單,戶籍登記系統(tǒng)人口名單。其中,第一次調(diào)查人口登記名單相當(dāng)于人口普查中人口登記名單、第二次調(diào)查人口登記名單相當(dāng)于人口普查的質(zhì)量評(píng)估調(diào)查人口登記名單。

      獲取這些人口登記名單的具體步驟是:第一步,由我們所在單位開具介紹信,與所要獲取的樣本普查小區(qū)的樓棟長(zhǎng)取得聯(lián)系,詢問獲得人口登記名單的可能性,以及可能存在的問題,如部分家庭拒絕入戶。在初步取得他們的同意后,明確具體提出需要他們提供哪些信息,并告知支付數(shù)據(jù)采集費(fèi)。第二步,與樓棟長(zhǎng)簽訂數(shù)據(jù)采集及使用保密協(xié)議。協(xié)議中規(guī)定支付費(fèi)用的金額、時(shí)間及支付方式。我們只能在指定的地方及規(guī)定的時(shí)間內(nèi)使用這些家庭及個(gè)人微觀數(shù)據(jù)。具體來說,就是我們不能將這些涉及個(gè)人隱私的數(shù)據(jù)帶回家中,只能在樓棟長(zhǎng)的監(jiān)督下按照研究任務(wù)的需要比對(duì)和匯總這些原始數(shù)據(jù)。匯總數(shù)據(jù)可以帶回用于研究,原始數(shù)據(jù)樓棟長(zhǎng)收回。這確保了個(gè)人涉密數(shù)據(jù)不外泄,打消了樓棟長(zhǎng)及住戶或個(gè)人的后顧之憂。第三步,設(shè)計(jì)問卷。其中,第一次調(diào)查問卷的項(xiàng)目涉及姓名、性別、出生年月、戶籍所在地、目前所在地、婚姻關(guān)系、文化程度、與戶主關(guān)系、一年前居住地,等等。第二次調(diào)查問卷的調(diào)查項(xiàng)目有每個(gè)家庭的詳細(xì)地址、門牌號(hào)碼、人口數(shù)、每個(gè)人的姓名及其性別、年齡等人口統(tǒng)計(jì)特征,每個(gè)家庭成員普查日居住在本樣本普查小區(qū)還是其他普查小區(qū)。如果居住在其他普查小區(qū),確定居住的準(zhǔn)確地點(diǎn);普查日居住在本樣本普查小區(qū)某個(gè)住房單元的人的去向,等等。第四步,將設(shè)計(jì)好的問卷通過樓棟長(zhǎng)交給家庭戶主或其他家庭成員,由其填寫問卷中要求填寫的每一個(gè)項(xiàng)目。

      對(duì)獲得的三份人口登記名單,首先,剔除不屬于本小區(qū)的人口(死亡人口、遷出人口及重復(fù)登記人口),確保每份人口名單中的人口都屬于本小區(qū),滿足三系統(tǒng)估計(jì)量對(duì)每份名單允許有遺漏而不能錯(cuò)誤包括人口的要求;其次,為了確保三份人口登記名單均是對(duì)同一總體同一時(shí)點(diǎn)上的人口登記,考慮到戶籍系統(tǒng)往往滯后登記人口這一現(xiàn)實(shí)情況,將滯后登記的人口使用追索方法補(bǔ)充到戶籍人口名單(新出生人口和遷入人口);最后,對(duì)名單中人口統(tǒng)計(jì)特征或居住地點(diǎn)信息登記不完整者,通過后續(xù)調(diào)查或估算方法補(bǔ)充完整,以確保三份人口登記名單之間的人口比對(duì)工作順利進(jìn)行,提高比對(duì)效率和減少比對(duì)誤差。

      在準(zhǔn)備好三份人口登記名單后,緊接著是名單之間的人口比對(duì)。比對(duì)安排在人口普查質(zhì)量評(píng)估調(diào)查數(shù)據(jù)采集結(jié)束后。比對(duì)的目標(biāo)是查找三份名單之間的匹配者,即同時(shí)在兩份名單或三份名單中登記的人口。這需要對(duì)一份名單中的每個(gè)人,查找其是否也在另外一份或二份名單中,若在另外一份或二份名單中找到了這個(gè)人,則稱其為匹配者。欲確認(rèn)三份名單中的兩個(gè)登記或三個(gè)登記是否為同一個(gè)人,需要比對(duì)這兩個(gè)或三個(gè)登記所填寫的姓名、性別、年齡、與戶主關(guān)系、婚姻狀況、學(xué)歷學(xué)位、出生地、戶籍所在地、目前居住地點(diǎn)等項(xiàng)目。如果這兩個(gè)登記或三個(gè)登記所填寫的這些項(xiàng)目的內(nèi)容全都對(duì)應(yīng)相同,則可以斷定這兩個(gè)登記或三個(gè)登記為同一個(gè)人。除此之外,余下的有三種情況:第一,從兩個(gè)登記或三個(gè)登記的人口統(tǒng)計(jì)特征項(xiàng)目的信息中可以沒有疑問地?cái)喽ㄟ@兩個(gè)登記或三個(gè)登記不是同一個(gè)人;第二,兩個(gè)登記或三個(gè)登記的大部分人口統(tǒng)計(jì)特征項(xiàng)目對(duì)應(yīng)相同,只是有個(gè)別的項(xiàng)目不相對(duì)應(yīng),懷疑是否有登記錯(cuò)誤;第三,所做登記的人口統(tǒng)計(jì)特征項(xiàng)目填寫不全。對(duì)于第二、第三兩種情況,稱其為匹配狀態(tài)懸而未決者,需要收集新信息再次比對(duì)。經(jīng)過比對(duì)和再次比對(duì)后,同一樣本普查小區(qū)的人口分為8種,即在三份名單登記人口(1種)、在兩份名單登記人口(3種)、在一份名單登記人口(3種)、未在任何名單登記人口(1種)。

      為滿足三系統(tǒng)估計(jì)量在登記概率大致相等的人口層建立及使用的要求,將樣本普查小區(qū)人口在比對(duì)后劃分到登記概率大致相等的人口層中。為此,使用性別、年齡、房屋所有權(quán)、居住位置及地點(diǎn)、普查表回收率、種族、民族等變量對(duì)總體人口分層。每一個(gè)等概率人口層由上述變量交叉形成。一方面,增加一個(gè)分層變量,交叉層就相應(yīng)增加,分配到每一個(gè)交叉層的樣本量就少,使用三系統(tǒng)估計(jì)量估計(jì)的人口數(shù)抽樣誤差大;另一方面,研究目標(biāo)并不是分層變量的選擇及交叉層的構(gòu)造,而是讓讀者理解和掌握三系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量的計(jì)算過程。因此,只是選擇性別對(duì)總體人口分層:男性層及女性層,用l表示。

      需要特別說明的是,本文為何不以全國(guó)(或是重慶市整個(gè)區(qū)域)為實(shí)證研究對(duì)象?一方面收集全國(guó)(或是重慶市整個(gè)區(qū)域)三個(gè)系統(tǒng)的三份人口登記名單將是一項(xiàng)我們無法完成的任務(wù),就算是國(guó)家統(tǒng)計(jì)局或重慶市統(tǒng)計(jì)局做這項(xiàng)工作也需要周密的部署與安排,投入大量的人力、物力和財(cái)力;另一方面比對(duì)全國(guó)(或是重慶市整個(gè)區(qū)域)三份人口登記名單及對(duì)比對(duì)結(jié)果懸而未決的處理也是一項(xiàng)極其復(fù)雜、技術(shù)含量很高的工作,需要大量受過專門訓(xùn)練的計(jì)算機(jī)人員和比對(duì)人員參與,無論是國(guó)家統(tǒng)計(jì)局,還是重慶市統(tǒng)計(jì)局目前都沒有能力完成這項(xiàng)工作。然而,不可否認(rèn)的是,三系統(tǒng)估計(jì)量對(duì)研究區(qū)域有很好的適應(yīng)性,可在城市、鄉(xiāng)村,行政區(qū)(鎮(zhèn)、縣、省)或全國(guó)使用。當(dāng)然,為了積累經(jīng)驗(yàn),往往應(yīng)該先在地理區(qū)域較小的范圍使用三系統(tǒng)估計(jì)量,然后逐步擴(kuò)大其應(yīng)用范圍。美國(guó)普查局就是遵循這一思路。他們?cè)?jīng)在縣里的黑人居民區(qū)使用三個(gè)系統(tǒng)對(duì)總體全面登記的三系統(tǒng)估計(jì)量評(píng)估人口普查計(jì)數(shù)質(zhì)量。在2020年,美國(guó)普查局計(jì)劃在全國(guó)和各個(gè)州使用三系統(tǒng)估計(jì)量估計(jì)人口普查凈誤差率。我們所提出的適合于戶籍登記系統(tǒng)覆蓋評(píng)估的三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量完全可以移植到全國(guó)或重慶市的戶籍登記系統(tǒng)覆蓋評(píng)估中。

      (二)抽樣方法及等概率人口層的樣本人數(shù)

      采用前面敘述的二重抽樣方法,按照住房單元數(shù)目將重慶市南岸區(qū)部分街道的所有普查小區(qū)分為兩層,分別用符號(hào)h=1和h=2表示,每一層的普查小區(qū)數(shù)及樣本小區(qū)數(shù)分別用Nh和nh表示。對(duì)第一重樣本小區(qū)按照戶籍人口占全部人口比例進(jìn)一步分為兩個(gè)新層,分別用符號(hào)g=1和g=2表示,每一新層的小區(qū)總數(shù)及樣本數(shù)分別用Mhg和mhg表示。樣本形成過程如表3所示。

      表3 樣本形成表

      注:為便于計(jì)算,對(duì)抽樣權(quán)數(shù)四舍五入。

      在獲得三份人口登記名單、完成三份名單比對(duì)、對(duì)總體人口等概率分層(男性層、女性層,分別用l=m和l=w表示)、將比對(duì)結(jié)果劃分到等概率人口層后,8個(gè)樣本調(diào)查小區(qū)(分別用符號(hào)1~8表示)在男性層和女性層的樣本人口數(shù)xijk見表4和表5。

      表4 男性層(l=m)樣本人數(shù)表

      表5 女性層(l=w)樣本人數(shù)表

      (三)等概率人口層(男性層及女性層)人數(shù)的估計(jì)

      表6 等概率人口層的人數(shù)估計(jì)值表 單位:人

      從表6可以看出,重慶市南岸區(qū)部分街道的男性層的人口數(shù)估計(jì)值為297 242人,而女性層的人口數(shù)估計(jì)值為265 674人。

      (四)等概率人口層(男性層及女性層)人數(shù)估計(jì)值的抽樣方差及協(xié)方差計(jì)算

      使用式(20)計(jì)算在輪流刀切第一重樣本(共13個(gè)樣本普查小區(qū),共刀切13次)情況下,進(jìn)入第二重樣本(共8個(gè)樣本普查小區(qū))的每一個(gè)樣本普查小區(qū)的復(fù)制權(quán)數(shù),計(jì)算結(jié)果見表7。

      表7 樣本普查小區(qū)復(fù)制權(quán)數(shù)表

      利用表8和表9數(shù)據(jù),使用式(15)和式(23)計(jì)算重慶市南岸區(qū)部分街道的男性層及女性層人數(shù)估計(jì)值的抽樣方差,以及它們之間的協(xié)方差。具體計(jì)算過程及其結(jié)果見表10、表11和表12。

      表8 男性層(l=m)人口數(shù)復(fù)制值表

      表9 女性層(l=w)人口數(shù)復(fù)制值表

      表10 男性層(l=m)抽樣方差計(jì)算表

      表10表明,重慶市南岸區(qū)部分街道男性層的人口數(shù)的抽樣方差為18 515 639,標(biāo)準(zhǔn)誤差為4 302人。

      表11表明,重慶市南岸區(qū)部分街道女性層的人口數(shù)的抽樣方差為39 817 523,標(biāo)準(zhǔn)誤差為6 310人。

      表11 女性層(l=w)抽樣方差計(jì)算表

      表12 男性層(l=m)與女性層(l=w)協(xié)方差計(jì)算表

      從表12可以看出,重慶市南岸區(qū)部分街道的男性層與女性層之間的協(xié)方差為-23 504 964,表明這兩個(gè)等概率人口層負(fù)相關(guān)。

      (五)總體人口數(shù)估計(jì)及抽樣方差估計(jì)

      使用式(21)~式(23),利用表6、表10~表12數(shù)據(jù),得到重慶市南岸區(qū)部分街道的人口數(shù)及抽樣誤差分別為:

      =562 916(人)

      39 817 523-2×23 504 964=11 323 234

      (六)總體戶籍登記系統(tǒng)凈誤差率估計(jì)

      重慶市南岸區(qū)部分街道的戶籍人口數(shù)為556 161人。根據(jù)式(24)和式(25)得到其戶籍登記系統(tǒng)的凈誤差率及其抽樣標(biāo)準(zhǔn)誤差分別為:

      (七)小結(jié)

      從以上計(jì)算結(jié)果可以看出,2017年6月1日,重慶市南岸區(qū)部分街道的總?cè)藬?shù)為562 916人(抽樣標(biāo)準(zhǔn)誤差為3 365人),其中男性297 242人(抽樣標(biāo)準(zhǔn)誤差為4 302人)、女性265 674人(抽樣標(biāo)準(zhǔn)誤差為6 310人),戶籍登記系統(tǒng)凈誤差率為1.2%(抽樣標(biāo)準(zhǔn)誤差為0.0 059 778)。

      四、結(jié)論與建議

      本文從理論層面和實(shí)際操作層面詳細(xì)討論了用于戶籍登記系統(tǒng)覆蓋評(píng)估的三系統(tǒng)估計(jì)量及其基于分層刀切方差估計(jì)量的抽樣方差估計(jì)量。通過實(shí)際案例演示了樣本抽取、樣本數(shù)據(jù)采集與處理、樣本普查小區(qū)抽樣權(quán)數(shù)、復(fù)制權(quán)數(shù)、男女人口層、總體實(shí)際人口數(shù)計(jì)算等工作步驟,為中國(guó)未來戶籍登記系統(tǒng)評(píng)估提供了具體的估計(jì)方法。在此基礎(chǔ)上得到如下結(jié)論,并提出相應(yīng)對(duì)策建議。

      (一)結(jié)論

      戶籍登記系統(tǒng)作為中國(guó)最重要人口行政記錄,本身用于行政管理目的而不是用于統(tǒng)計(jì)目的。這決定了它的人口登記方法、登記時(shí)間和登記范圍與統(tǒng)計(jì)的要求不一致。這種不一致必然導(dǎo)致戶籍人口數(shù)偏離實(shí)際人口數(shù)。改變這一狀況的根本方法是事后對(duì)其完整性進(jìn)行評(píng)估。根據(jù)評(píng)估的結(jié)果將戶籍人口數(shù)調(diào)整為實(shí)際人口數(shù)。如果建立戶籍登記系統(tǒng)的公安部門引入三系統(tǒng)估計(jì)量評(píng)估方法,就能夠?yàn)閲?guó)家統(tǒng)計(jì)局提供高精度的人口行政記錄數(shù)據(jù)。這么做的前提是,國(guó)家統(tǒng)計(jì)局與公安部門建立密切的數(shù)據(jù)共享合作關(guān)系。

      為獲得真實(shí)可靠的戶籍登記系統(tǒng)凈誤差率估計(jì)值,總體人口數(shù)與戶籍登記系統(tǒng)人口數(shù)在口徑上必須一致。戶籍登記系統(tǒng)提供的是具有本地戶籍的人口數(shù),所估計(jì)的總體實(shí)際人口數(shù)也應(yīng)該是具有本地戶籍的總體人口數(shù)。為了做到這一點(diǎn),對(duì)每一個(gè)樣本普查小區(qū)的三份人口登記名單,要仔細(xì)審查其中的每份名單中的人口是否具有本地戶籍。對(duì)有本地戶籍者予以保留,對(duì)不具有本地戶籍者予以剔除。對(duì)沒有本地戶籍,在其他地區(qū)有戶籍的人口,作為其他地區(qū)人口數(shù)估計(jì)的范圍。

      三系統(tǒng)估計(jì)量是估計(jì)戶籍登記系統(tǒng)凈誤差率或覆蓋率的前沿方法。與作為目前民事登記系統(tǒng)覆蓋評(píng)估主流方法的獨(dú)立雙系統(tǒng)估計(jì)量相比,一方面,三系統(tǒng)估計(jì)量除了利用戶籍登記系統(tǒng)這一輔助信息外,還利用了與總體實(shí)際人口數(shù)密切相關(guān)的本次人口普查輔助信息,而且對(duì)這種輔助信息的使用是建立在具有科學(xué)依據(jù)的捕獲-再捕獲-再捕獲模型的基礎(chǔ)上,因此在估計(jì)精度上自然會(huì)有所提高。另一方面,小規(guī)模實(shí)證研究表明,即使不考慮同時(shí)未在三個(gè)系統(tǒng)登記的人口數(shù),三系統(tǒng)估計(jì)量比獨(dú)立雙系統(tǒng)估計(jì)量的估計(jì)結(jié)果還是要更加接近于實(shí)際一些。

      不能把用來估計(jì)動(dòng)物總體規(guī)模的三次捕獲模型等同于用來估計(jì)人口總體規(guī)模的三系統(tǒng)估計(jì)量。在應(yīng)用三次捕獲模型構(gòu)造三系統(tǒng)估計(jì)量時(shí),需要解決總體人口分層問題、人口移動(dòng)問題、有限總體概率抽樣及估計(jì)問題。只有解決了這些問題,才能構(gòu)造出適合于戶籍登記系統(tǒng)覆蓋評(píng)估的三個(gè)系統(tǒng)對(duì)總體抽樣登記的、人口移動(dòng)的三系統(tǒng)估計(jì)量。在構(gòu)造三系統(tǒng)估計(jì)量時(shí),還有一個(gè)特別需要注意的問題,那就是每個(gè)系統(tǒng)只允許遺漏人口,而不能錯(cuò)誤登記人口(即把不屬于總體的人口納入系統(tǒng)中)。

      (二)建議

      國(guó)家統(tǒng)計(jì)局應(yīng)盡快著手建立對(duì)中國(guó)戶籍登記系統(tǒng)覆蓋狀況的定期評(píng)估工作。一是以此為線索,查找戶籍登記工作中存在的漏洞,尤其是一人多戶和死亡者未注銷戶口問題;二是在使用戶籍登記系統(tǒng)提供的人口數(shù)字時(shí)要做適當(dāng)調(diào)整,不能直接使用,否則影響依據(jù)戶籍人口數(shù)所做決策或計(jì)劃的科學(xué)性。

      上述評(píng)估工作宜每年進(jìn)行一次。在人口普查年,隨同人口普查質(zhì)量評(píng)估工作一起進(jìn)行。把人口普查的標(biāo)準(zhǔn)時(shí)點(diǎn)定為戶籍登記系統(tǒng)覆蓋評(píng)估的標(biāo)準(zhǔn)時(shí)點(diǎn);用人口普查質(zhì)量評(píng)估樣本作為戶籍登記系統(tǒng)覆蓋評(píng)估的樣本。在非人口普查年,隨同人口抽樣調(diào)查質(zhì)量評(píng)估工作一起進(jìn)行。把人口抽樣調(diào)查的標(biāo)準(zhǔn)時(shí)點(diǎn)定為戶籍登記系統(tǒng)覆蓋評(píng)估的標(biāo)準(zhǔn)時(shí)點(diǎn);用人口抽樣調(diào)查質(zhì)量評(píng)估樣本作為戶籍登記系統(tǒng)覆蓋評(píng)估的樣本。

      國(guó)家統(tǒng)計(jì)局在制訂戶籍登記系統(tǒng)覆蓋評(píng)估方案時(shí),可嘗試使用三系統(tǒng)估計(jì)量這一前沿理論研究成果。如果等到前沿理論被完全掌握再使用它,那將總是落后于美國(guó)等其他國(guó)家。為了盡快掌握前沿理論,國(guó)家統(tǒng)計(jì)局可以組織培訓(xùn),聘請(qǐng)專家講授三系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量。

      猜你喜歡
      估計(jì)量人口數(shù)人口普查
      確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
      人大研究(2022年3期)2022-04-13 00:47:04
      無人機(jī)助力人口普查
      人口普查學(xué)問多
      基于BP神經(jīng)網(wǎng)絡(luò)的吉林省GDP預(yù)測(cè)研究
      淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
      人口普查由誰首創(chuàng)
      樂活老年(2016年10期)2016-02-28 09:30:39
      基于配網(wǎng)先驗(yàn)信息的諧波狀態(tài)估計(jì)量測(cè)點(diǎn)最優(yōu)配置
      負(fù)極值指標(biāo)估計(jì)量的漸近性質(zhì)
      歷次人口普查中低年齡組人口漏報(bào)研究
      使用變異系數(shù)和Kurtosis系數(shù)的雙輔助變量的比估計(jì)
      勃利县| 平湖市| 汾西县| 蒙自县| 平乡县| 兰坪| 正安县| 白朗县| 察雅县| 湖北省| 从江县| 济阳县| 凉山| 汉寿县| 乐业县| 盐山县| 额济纳旗| 克山县| 万州区| 高平市| 罗江县| 密云县| 鲁山县| 清水河县| 久治县| 广汉市| 吉首市| 仁怀市| 新乡市| 榆林市| 敦煌市| 苏尼特左旗| 青浦区| 方正县| 南城县| 曲阜市| 明光市| 鸡西市| 和硕县| 碌曲县| 东乌|