李若建
2012年7月6日國家統(tǒng)計局人口和就業(yè)統(tǒng)計司負責(zé)人就使用《中國2010年人口普查資料》作出說明,指出2010年人口普查有些指標(如出生人口、死亡人口和按分年齡婦女生育率計算的總和生育率)現(xiàn)場登記難度較大,漏登率要相對高一些(國家統(tǒng)計局網(wǎng)站)。這是國家統(tǒng)計局正視人口普查中存在的問題,也是比較實事求是的一種態(tài)度,也說明了歷次中國人口普查數(shù)據(jù)中確實存在一些值得注意的不足。本文并非全面評價人口普查數(shù)據(jù)質(zhì)量,而是根據(jù)歷次人口普查數(shù)據(jù)的回溯,指出在人口普查中,低年齡組(本文中指的是0—4歲)明顯存在漏報現(xiàn)象,并且漏報人口中,存在比較突出的性別偏好傾向。由于低年齡組的人口漏報,直接影響了總和生育率、出生人口性別比、人口老齡化程度等指標,影響了政府制訂人口政策和其他相關(guān)政策,因此本文也對人口統(tǒng)計數(shù)據(jù)質(zhì)量提出一些看法。
對于人口普查數(shù)據(jù)的漏報情況,已經(jīng)有一些人口學(xué)者關(guān)注過,并且發(fā)表了相關(guān)的研究文章。其中,比較有代表性的是北京大學(xué)的郭志剛教授(郭志剛,2004)和人民大學(xué)的翟振武教授(翟振武、陶濤,2010)。雖然兩位學(xué)者的觀點不盡一致,但是均承認人口普查數(shù)據(jù)有缺陷。本文并不涉及郭、翟兩位的觀點,只是想從更長的時間跨度,探索人口普查過程中是否存在人為的系統(tǒng)誤差。
在對人口普查中的漏報做分析之前,有必要澄清兩點:
理論上講,人口普查中存在漏報也存在重報,如果存在大量的人口重報,有可能出現(xiàn)漏報與重報互相抵消。不過筆者認為,在中國的人口普查中,至少在2000年之前,除了極個別的偶發(fā)事件之外,重報的概率非常低,大體上可以忽略不計。因為從調(diào)查方法上看,在1953—2000年的歷次人口普查中,以人口的居住地為普查登記地,并且每個普查人員負責(zé)一個指定的調(diào)查區(qū)域,在這種情況下,只可能產(chǎn)生極少數(shù)人被重復(fù)登記的情況,更多的人是被漏登記。如果嚴格按照普查的操作規(guī)程,可能出現(xiàn)漏報,卻基本上不會出現(xiàn)重報。
根據(jù)已知數(shù)據(jù),漏報最嚴重的是2000年人口普查。當(dāng)時人口普查快速匯總公報總?cè)丝?126583萬人(包含250萬現(xiàn)役軍人),最后匯總?cè)丝?124261萬人(不包含250萬現(xiàn)役軍人)。如果不考慮現(xiàn)役軍人的話,相差2072萬人(國務(wù)院人口普查辦公室,2002)。為何相差如此巨大,并沒有官方的說明。筆者傾向于認為,最初估計數(shù)是相對接近真實的,只是有超過千萬的人口沒有被調(diào)查。
由于2000年第五次人口普查的不足,2010年第六次人口普查,對于居住地與戶口所在地不一致的人口,采用在戶口所在地與居住地雙地都進行登記調(diào)查,后期再通過有關(guān)回答刪除重復(fù)調(diào)查案例,這種情況有可能導(dǎo)致重報。但是究竟重報與漏報的數(shù)量如何,均有待下一次,甚至下兩次的人口普查才能夠證實。
本文研究的對象是0—4歲的低年齡組人口,這一年齡組人口進入學(xué)齡后,上幼兒園、小學(xué)往往需要戶口。根據(jù)中華人民共和國居民身份證管理法規(guī),小孩年齡大一點后,可以向公安部門申請身份證,特別是年滿16周歲后,必須向公安部門申請身份證,沒有身份證很難在社會中正常生存。由此可見漏報的低年齡人口很難隱瞞超過15年,這些當(dāng)初漏報的人,在后來的人口普查中絕大多數(shù)會浮現(xiàn)。
上述兩個前提的成立,是本文的方法基礎(chǔ)。
當(dāng)代中國的統(tǒng)計數(shù)據(jù)質(zhì)量不高、飽受質(zhì)疑,應(yīng)該是現(xiàn)實,但是不同歷史時期的情況不盡相同,因此有必要對歷史作一回溯,找出其中的關(guān)聯(lián)。
1953年中國進行了第一次人口普查,不過這次普查的目的并非從人口學(xué)的角度出發(fā),主要是為了選舉,因此調(diào)查的指標很少,方法也相當(dāng)粗略。1953年人口普查的質(zhì)量缺陷,這與當(dāng)時的調(diào)查方法和調(diào)查時間有關(guān)。關(guān)于1953年的人口普查的質(zhì)量如何,普查是如何進行的,已經(jīng)很難見到記載。筆者見到北京市的兩則記載:一是北京市崇文區(qū)的情況,該區(qū)是1953年10月10日才成立人口調(diào)查登記辦公室的,從10月10日到10月19日10天時間內(nèi),在全區(qū)進行了人口普查登記工作。顯然這一調(diào)查與人口普查的統(tǒng)一時間點(1953年7月1日)有差距(北京市崇文區(qū)統(tǒng)計局,1992)。另外北京市昌平縣人口普查前的戶籍情況則是連戶口也沒有,更談不到戶籍管理了。搞得好的村,也只有一個登記表,注明每戶戶主姓名,一家有幾個人就完了,有的甚至幾男幾女也不清楚(王元祥,2007)。首都的情況如此,估計其他地方也好不到哪里。根據(jù)許多地方的記載,普查的辦法是依選舉區(qū)域設(shè)立登記站,由戶主到站登記,河北省是如此(河北省地方志編纂委員會,1994),廣西北海市也是如此。不過又說明,必要時由調(diào)查員逐戶訪查的辦法進行登記(北海市統(tǒng)計局,1993),這種辦法導(dǎo)致的誤差會比全部由調(diào)查員進行調(diào)查的作法誤差更大。四川省的人口普查在標準時間半年后進行,回顧時間長,對邊遠少數(shù)民族地區(qū)是采用間接調(diào)查的方法進行的,有的項目未登記上來(四川省統(tǒng)計局,1993)。由此可見,不能過高估計1953年人口普查的質(zhì)量。事實上,如果用分年齡數(shù)據(jù)比對,1953年的數(shù)字與1964年、1982年的誤差比較明顯,而1964與1982年普查數(shù)據(jù)的一致性比較好(李若建,2012)。
表1 1953年0—4歲人口數(shù)量在1953—1964年間的變動 單位:萬人
根據(jù)表1中的數(shù)據(jù),可以發(fā)現(xiàn)兩個現(xiàn)象:一是0歲人口的存活比重特別高,1953年的0歲人口到1964年時,96.61%的人存活下來。而其他年齡組就沒有這么幸運,整個0—4歲人口只有90.29%的人存活下來;二是男性人口的存活率明顯高于女性。由于1959—1961年中國發(fā)生了大饑荒,大量的非正常死亡使得正常的人口規(guī)律被破壞,無法簡單推算人口變動。不過根據(jù)上述情況,筆者認為,1953年人口普查時,0歲人口的漏報是客觀存在的事實。至于男性存活率高,可能是重男輕女的價值觀念影響,在饑荒中男孩得到更好的照顧。
根據(jù)歷次人口普查數(shù)據(jù)的回溯來評判低年齡組人口的漏報情況,應(yīng)該說1964年的第二次人口普查是質(zhì)量最好的一次。因為1964年中國社會還沒有把計劃生育作為一項重要政策,不存在瞞報的動機。同時,當(dāng)年基層政權(quán)的行政執(zhí)行能力比較強大,調(diào)查質(zhì)量相對有保證。還有一個更加重要的原因是,在當(dāng)年計劃經(jīng)濟的體制下,城市人口的絕大部分生活必須品是按人口供應(yīng),農(nóng)村的許多分配也是與人口掛鉤。同時無論城鄉(xiāng),棉布的供應(yīng)都是按人口分配的,因此隱瞞人口沒有什么必要。為了進一步驗證1964年人口普查數(shù)據(jù)的質(zhì)量,可以把當(dāng)年常規(guī)人口統(tǒng)計數(shù)字與普查數(shù)對比。
表2 1964年人口普查低年齡組人口與登記人口比較 單位:萬人
表2的數(shù)據(jù)顯示,在1963.7.1—1964.6.30年間的出生人口數(shù)上,普查與常規(guī)人口登記大體上比較吻合,只是在1962.7.1—1963.6.30這一期間出生的人口誤差比較大,普查數(shù)比登記數(shù)多300萬左右。其他年齡組的差距均可以得到合理的解釋,特別是1959.7.1—1962.6.30年間出生的嬰兒,到普查時減少的比較明顯,這說明饑荒對人口的影響。考慮到常規(guī)人口登記與人口普查均存在誤差,筆者認為,1964年的人口普查質(zhì)量還是比較好的。
表3 1964年0—4歲人口數(shù)量在1964—1982年間的變動 單位:萬人
表3是1964年0—4歲人口數(shù)量在1964—1990年間的變動,從中不難看出,在1964—1982年間,大體上吻合的比較好,不過分性別看就有問題。人口是不可能越活越多,而在1964年2歲和4歲人口中,1982年相應(yīng)年齡的人數(shù)是不減反增。當(dāng)然這有三種可能:一是1964年普查有誤差,二是1982年普查有誤差,三是兩次均有誤差。真實情況現(xiàn)在無法判斷,不過這提醒我們,1964年人口普查的低年齡組女性存在漏報的可能。從以后的分析中可以發(fā)現(xiàn),女性漏報的風(fēng)險高于男性,因此1964年的普查存在這種可能性還是比較大的。
20世紀70年代后期,政府加大計劃生育工作的推進力度。由于計劃生育政策的原因,有些民眾在人口普查時,有意隱瞞違反計劃生育政策出生的孩子,特別是女孩,這是造成人口普查中低年齡組漏報的最根本因素,這點在1982年人口普查中開始突出體現(xiàn)。
表3 1982年0—4歲人口數(shù)量在1982—2000年間的變動 單位:萬人
表4 1982年0—4歲人口在1982—2000年間的存活率
從表3中可以發(fā)現(xiàn),1982年人口普查時的低年齡人口到了1990年反而越來越多,1982年這一年齡組9470萬人,1990年9750萬人。更加不可思議的是,到了2000年這一年齡組的人口還是略有增加,達到9878萬人。這種違背常理的現(xiàn)象,只有一個解釋,就是1982年人口普查時,低年齡組已經(jīng)存在漏報。一般來說,出于計劃生育政策影響而隱瞞的人口,到了小孩上學(xué)時會重新出現(xiàn)登記,不過從表3中可以發(fā)現(xiàn),一些漏報人口要十余年后才會登記。
漏報人口存在明顯的性別選擇。1982年0—4歲人口的性別比是107.14,1990年為107.19,而2000年則為103.20。從這一組數(shù)據(jù)可以得出兩個假設(shè):一是女性漏報人口多于男性;二是男性漏報人口早于女性漏報出現(xiàn)。
根據(jù)表3的數(shù)據(jù),筆者估計1982年0—4歲人口大約漏報420萬人左右,其中男性漏報大約110萬人,女性漏報大約310萬人。
在此還要指出一點,從20世紀70年代后期起,常規(guī)人口統(tǒng)計中出生人口的漏報情況也日益突出,因此對1982年及以后的人口普查數(shù)據(jù),就沒有必要和常規(guī)人口統(tǒng)計的出生數(shù)比對。
1990年人口普查,0—4歲人口漏報情況愈演愈烈。根據(jù)筆者調(diào)整后的數(shù)據(jù)計算,1990年0—4歲人口到了2000年多出792萬人,到了2010年又變成多出1060萬人。如果這個數(shù)字可信的話,誤差是相當(dāng)驚人的??梢钥隙ǖ氖?,1990年人口普查時,低年齡組的漏報比較嚴重。
1964、1982年普查就存在的女性漏報問題同樣突出。與1982年普查非常類似的是,男性漏報人口更早出現(xiàn),女性則滯后。與1990年相比,0—4歲人口(1990年,下同)到2000年時,男性多384萬,女性多408萬,似乎女性漏報并不比男性明顯。但是,與1990年相比,0—4歲人口到2010年時,男性多289萬,女性多771萬,女性漏報是男性的2.67倍。
要指出的是,2000—2010年間,這一年齡組的男性減少1.48%。減少是正常的,但是減少幅度似乎略高一點。由于這超出本文研究范圍,因此只是指出,不作深入分析。
根據(jù)表4的數(shù)據(jù),筆者估計1990年0—4歲人口大約漏報1100萬人左右,其中男性漏報大約300萬人,女性漏報大約800萬人。
2000年人口普查中的低年齡組人口漏報依然突出,由于有16周歲必須領(lǐng)取身份證的制度,因此2000年人口普查的漏報情況,大體要到2015年1%人口抽查時才能大體上確定。因而對漏報嚴重程度的估計還有困難。不過根據(jù)2010年人口普查數(shù)據(jù),大體上還是能夠?qū)?000年人口普查數(shù)據(jù)作一點回溯。
表5 1990年0—4歲人口數(shù)量在1990—2010年間的變動 單位:萬人
表6 1990年0—4歲人口在1990—2010年間的存活率
表7 2000年0—4歲人口數(shù)量在2000—2010年間的變動 單位:萬人
從表7可知,2000年0—4歲人口到2010年增加了593萬,其中男性增加了262萬,女性增加了331萬。如果1982年、1990年的情況會重現(xiàn)在2000年人口普查的話,筆者估計2000年0—4歲人口漏報大約800—1000萬人,其中男性約300—400萬,女性約500—700萬。當(dāng)然,這些估計要等到2015年1%人口抽查和2020年的人口普查才能得到準確的驗證。
2010年人口普查已經(jīng)落下帷幕,雖然正式公布的調(diào)查誤差并不大,但是一些指標的可信度依然引起質(zhì)疑,其中最突出的就是總和生育率。按照人口普查結(jié)果,總和生育率不足1.2,果真如此的話,中國完全沒有實行計劃生育的必要??赡茉诙喾劫|(zhì)疑下,才有2012年7月6日國家統(tǒng)計局人口和就業(yè)統(tǒng)計司負責(zé)人就使用《中國2010年人口普查資料》的說明。不過根據(jù)筆者多年分析人口普查數(shù)據(jù)的經(jīng)驗,認為2010年人口普查同樣存在一定程度的低年齡組人口漏報,漏報多少則有待時間檢驗。
根據(jù)前面的分析可以確認,在低年齡組的數(shù)據(jù)質(zhì)量上,除了1964年人口普查的情況比較好之外,其余幾次普查均存在漏報問題。從發(fā)展的趨勢看,漏報有愈演愈烈的趨勢。1982年普查時的低年齡人口到1990年時增加了2.95%,1990年普查時的低年齡人口到2000年時增加了6.8%,2000年普查時的低年齡人口到2010年時增加了8.6%。
根據(jù)現(xiàn)有的資料,對1982年、1990年人口普查的漏報估計是可以相對準確,但是對2000年的準確估計還有困難,對2010年人口普查的估計就大體上是推測。不過,筆者還是試圖對幾次人口普查的漏報做出估計(見表8)。
表8 1982—2010年歷次人口普查低年齡組人口漏報情況估計 單位:萬人
這里要說明一下筆者對人口普查數(shù)據(jù)質(zhì)量的看法。長期以來,人們一直被一個不太正確的觀念所左右,就是不能容忍數(shù)據(jù)有誤差。其實絕大部分調(diào)查數(shù)據(jù)均存在誤差,只是誤差范圍大小不同而已。遺憾的是,長期以來大家習(xí)慣于文過飾非,片面夸大統(tǒng)計數(shù)據(jù)的質(zhì)量,缺乏對官方數(shù)據(jù)的公開質(zhì)疑和修訂,反而讓數(shù)據(jù)質(zhì)量問題愈演愈烈。通過前面的分析,筆者認為,盡管人口普查數(shù)據(jù)存在一些問題,但是大部分問題是能夠得到修正的,這種修正可以通過以后的調(diào)查進行回溯修正,如同本文所作的工作,也可以通過統(tǒng)計部門開放不包含個人隱私信息的資料,供學(xué)術(shù)部門獨立進行研究。對于統(tǒng)計誤差,大家應(yīng)該抱著“允許錯誤,但要修正錯誤”的態(tài)度,這樣才能讓統(tǒng)計數(shù)據(jù)在社會上樹立威信。
在歷史上,中國的人口統(tǒng)計數(shù)據(jù)質(zhì)量從來就不高,對此筆者曾經(jīng)有一些論文專門對一些問題作討論,有的數(shù)據(jù)甚至到荒唐的地步(李若建,1990;李若建,1994),1949年后,人口統(tǒng)計同樣問題眾多(李若建,2007;李若建,2012)。通過回顧歷次人口普查數(shù)據(jù)的質(zhì)量問題,我們期待今后有更加可信的人口數(shù)據(jù),為制訂社會經(jīng)濟發(fā)展政策和學(xué)術(shù)研究者使用。
北海市統(tǒng)計局.北海市統(tǒng)計志.1993,112.
北京市崇文區(qū)統(tǒng)計局.崇文區(qū)統(tǒng)計志.1992,412.
郭志剛.對“五普”和“四普”隊列人口一致性的再檢驗.中國人口科學(xué),2004(6).
國家統(tǒng)計局網(wǎng)站 http://www.stats.gov.cn/tjfx/fxbg/t 20120706_ 402816364.htm
國務(wù)院人口普查辦公室.編者說明.中國2000年人口普查資料.北京:中國統(tǒng)計出版社,2002,卷首
河北省地方志編纂委員會.河北省志統(tǒng)計志.石家莊:河北人民出版社,1994,192.
李若建.1829年福建人口考略.福建人口,1990(4).
李若建.20世紀50—60年代中國人口統(tǒng)計數(shù)據(jù)存在的問題探討.人口與發(fā)展,2012(2).
李若建.20世紀50—60年代中國人口統(tǒng)計數(shù)據(jù)存在的問題探討.人口與發(fā)展,2012(2).
李若建.概念的可操作化與資料評估:大躍進與困難時期人口研究的難點.南方人口,2007(4).
李若建.中國人口遷移統(tǒng)計失實原因.中山大學(xué)學(xué)報論叢.嶺南社會學(xué)文集(二),1994.
四川省統(tǒng)計局.四川省統(tǒng)計志.成都:西南財經(jīng)大學(xué)出版社,1993,149.
王元祥.回憶昌平的第一次人口普查.昌平文史資料(6),北京:中國文史出版社,2007.
翟振武、陶濤.低年齡人口數(shù)據(jù)質(zhì)量的分析與評價.中國人口科學(xué),2010(1).
中山大學(xué)學(xué)報(社會科學(xué)版)2013年2期