羅薇
摘 要: 通過對美國、加拿大和中國的勞動力調(diào)查方法在抽樣設計、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)產(chǎn)品和開發(fā)應用四方面進行比較分析發(fā)現(xiàn),中國勞動力調(diào)查在抽樣設計上雖然采用較大的樣本量,但在樣本代表性、樣本輪換模式上存在若干問題,不利于后期的估計;在數(shù)據(jù)收集上采用傳統(tǒng)入戶詢問的方式既不便于數(shù)據(jù)的錄入,又增加了基層調(diào)查員的負擔;在數(shù)據(jù)處理上,缺乏數(shù)據(jù)處理過程中對無回答的調(diào)整、覆蓋率的校準、季節(jié)調(diào)整,尤其忽視估計量的方差估計,導致調(diào)查估計結(jié)果不夠科學;缺乏對勞動力調(diào)查數(shù)據(jù)產(chǎn)品和開發(fā)應用。然后,從連續(xù)性調(diào)查的角度對中國勞動力調(diào)查方法進行了深入思考,提出六點建議:一是加強人口普查和勞動力調(diào)查的銜接,二是合理分配樣本量,三是構(gòu)建和維護勞動力調(diào)查多重抽樣框體系,四是改進輪換模式,五是建立基于連續(xù)性抽樣的估計體系,六是形成以勞動力調(diào)查為核心的人口住戶類調(diào)查體系。
關(guān)鍵詞: 勞動力調(diào)查; 調(diào)查方法; 連續(xù)性抽樣
中圖分類號:C811
文獻標識碼:A文章編號:1671-623X(2016)05-0087-07
隨著人力資本對社會發(fā)展和經(jīng)濟增長的貢獻日益增加,世界上大部分國家和地區(qū)都展開了勞動力調(diào)查,收集本國或地區(qū)勞動力特征的信息,如就業(yè)情況、失業(yè)情況、工種分布、工作時數(shù)、收入等。美國現(xiàn)時人口調(diào)查(The U.S. Current Population Survey,下文簡稱為CPS)是由美國普查局和勞工統(tǒng)計局聯(lián)合組織實施,在非普查時期為搜集美國按各種標志分組的16歲及以上的人口、就業(yè)與失業(yè)、勞動力等統(tǒng)計數(shù)據(jù)而每月進行的住戶調(diào)查。[1]加拿大勞動力調(diào)查 (the Labor Force Survey,以下簡稱LFS)由加拿大統(tǒng)計局勞動統(tǒng)計司組織實施,是為加拿大提供分行業(yè)和職業(yè)的勞動力和人口信息的月度住戶抽樣調(diào)查,是勞動力和人口發(fā)展趨勢等信息的主要數(shù)據(jù)來源。[2]6我國于2005年11月首次開展全國勞動力調(diào)查,現(xiàn)行的勞動力調(diào)查在每年四季度調(diào)查1次,省會城市和直轄市則組織月度勞動力調(diào)查,2016年正式實施全國月度勞動力調(diào)查,目前,勞動力調(diào)查數(shù)據(jù)還沒有正式對外發(fā)布,處在起步探索階段。本文通過比較分析中美加勞動力調(diào)查的實踐和理論研究,為中國勞動力調(diào)查的開展提供一定借鑒。
一、抽樣設計的比較
(一)樣本量和設計要求比較
CPS調(diào)查樣本由824個初級抽樣單元,大約60 000個住戶單元構(gòu)成。CPS采用以州為子總體的抽樣設計,各州的樣本相互獨立,樣本量要根據(jù)各州勞動力實際狀況和對變異系數(shù)的要求抽?。簩τ?%的失業(yè)率而言,全國失業(yè)率月度估計的相對誤差控制在1.9%以內(nèi),各州年度平均失業(yè)率的相對誤差控制在8%以內(nèi)。[1]
LFS每月的調(diào)查樣本大約是5.4萬戶,大約包括了10萬個勞動力人口的信息。LFS的樣本量分配既要滿足各級(全國、各個省、各個經(jīng)濟區(qū)等)精度要求,又要從整體上保證調(diào)查設計的效度:全國失業(yè)率月度估計的變異系數(shù)低于2%,各省失業(yè)率月度估計的相對誤差低于7%,各經(jīng)濟區(qū)三個月移動平均估計的相對誤差低于25%,各就業(yè)保險經(jīng)濟區(qū)三個月移動平均估計的相對誤差低于15%。[2]9-13
中國勞動力調(diào)查的樣本量約為15萬戶,人數(shù)為46萬人。樣本設計要求全省調(diào)查失業(yè)率的相對誤差控制在15%左右,省按省會、非省會分類的調(diào)查失業(yè)率相對誤差控制在20%左右。[3]
與中國勞動力調(diào)查相比,美國和加拿大勞動力調(diào)查設計的住戶樣本量較少,但是其全國及分行政區(qū)域相關(guān)目標估計量的精度要求都較高。
(二)抽樣方法比較
CPS采用多階、分層、概率比例的抽樣方法。第一階段抽樣設計是在根據(jù)2000年美國人口普查劃分的全美2 025個初級抽樣單元(primary sampling units)中抽取一系列具有代表性的初級抽樣單元,對州內(nèi)的初級抽樣單元進行分層,分層的原則是使各層在勞動力及其他與失業(yè)高度相關(guān)的社會經(jīng)濟因素上盡可能相似。樣本中包括全部“自我代表的(selfrepresenting)初級抽樣單位”,而對“非自我代表的(nonselfrepresenting)初級抽樣單位”進行分層后隨機抽取,每層只抽取一個初級抽樣單元,且其入樣概率應與2000年人口普查時的人口數(shù)成比例。第二階段抽樣是從樣本初級抽樣單元中一次性抽取滿足十年調(diào)查需要的住戶單元。第二階段抽取的單元實際由地理位置相鄰的四個住址構(gòu)成一個子群,稱為最終抽樣單元,每個住址對應著2000年人口普查時分類街區(qū)目錄上的一個住戶。2000年人口和住戶普查及建筑許可證調(diào)查信息為CPS創(chuàng)造出四個抽樣框:私人住宅抽樣框、區(qū)域抽樣框、公共住宅抽樣框和建筑許可證抽樣框。根據(jù)普查信息,對抽樣框中的住戶單元進行相關(guān)標志排序,將具有相似特征的住戶單元放在一起。樣本的抽取在各個初級抽樣單元及抽樣框中獨立操作,在私人住宅抽樣框和公共住宅抽樣框中,樣本的抽取是一次性抽取10年所需的樣本量,而來自區(qū)域抽樣框和建筑許可證抽樣框的樣本逐月抽取。為了滿足CPS的輪換系統(tǒng)和不斷更新的抽樣設計,抽取一個最終抽樣單元系統(tǒng)樣本后,其相鄰的20個最終抽樣單元樣本也可以確定,即共抽取21個輪換樣本。[1]
LFS采用二階分層抽樣,第一階段抽樣是從各行政區(qū)抽取初級抽樣單元。根據(jù)初級抽樣單元的定義和地址登記庫的相關(guān)信息,對人口普查街區(qū)進行組合或再細分為55 605個初級抽樣單元。[2]27為了節(jié)省調(diào)查成本和利用LFS數(shù)據(jù)分析特定人群,將一部分初級抽樣單元分成四種特殊類型的層級:一是包括人口密度極低的邊遠地區(qū)和采用三階段抽樣的偏遠城區(qū)層,二是原住民比重相對大的層,三是移民比重較大的層,四是高收入住戶比重較大的層。而對于普通初級抽樣單元,在每個人口普查大都市區(qū)內(nèi)分層,根據(jù)人口普查大都市區(qū)內(nèi)人口普查分區(qū)的規(guī)模,再適當劃分出城市和農(nóng)村,分層的依據(jù)是各層在勞動力及社會經(jīng)濟因素上盡可能相似,以減少LFS多目標估計的抽樣方差。為了銜接樣本輪換模式,將每層均勻地分成6個不同的輪換組,每個輪換組中的初級抽樣單元數(shù)相同,從每個輪換組抽取一個初級抽樣單元,其入樣概率應與2001年人口普查時期該初級抽樣單元內(nèi)的住戶數(shù)成比例。[2]22-23LFS第二階段抽樣是在樣本初級抽樣單元中采用系統(tǒng)抽樣抽取住戶。以地址登記庫的地址清單及初級抽樣單元區(qū)域清單作為抽樣框,根據(jù)2001年人口普查數(shù)據(jù)提供的初級抽樣單元內(nèi)住戶數(shù)和樣本量分配時決定的初級抽樣單元抽樣比,計算出抽樣間距, 從樣本初級抽樣單元中抽取住所。
中國勞動力調(diào)查的樣本,采用分層、二階段、概率比例抽樣的方法抽取調(diào)查樣本。第一階段在2010年人口普查提供的抽樣框中抽取各省、自治區(qū)、直轄市的社區(qū)居委會(村委會)簡稱(村級單位),利用2010年普查得到多項與就業(yè)失業(yè)水平相關(guān)的指標進行分層,分層按市、鎮(zhèn)、鄉(xiāng),市中心區(qū)、城鄉(xiāng)結(jié)合區(qū),鎮(zhèn)中心區(qū)、鎮(zhèn)鄉(xiāng)結(jié)合區(qū), 鄉(xiāng)中心區(qū)和村莊劃分,同時考慮村級單位的人口規(guī)模和集體戶人口比例。第二階段抽樣是從樣本村級單位抽取住戶組。各省負責在抽中的村級單位中,利用2010年人口普查時的普查區(qū)和普查小區(qū)圖的建筑物編號和相應的住戶清單抽取住戶組。[3]
中美加勞動力調(diào)查都采用多階、分層、概率比例的抽樣方法。為了保證樣本的覆蓋面,CPS和LFS采用多重抽樣框,利用區(qū)域抽樣框、建筑許可證抽樣框進行更新維護,而中國勞動力抽樣框第一階段的樣本在五年內(nèi)保持不變,筆者認為這樣存在覆蓋不足的隱患。為了保證樣本的代表性,CPS和LFS不僅僅按照行政區(qū)劃、城市和農(nóng)村進行分層,并在此基礎(chǔ)上根據(jù)一些社會經(jīng)濟特征進行更細層次的劃分;而在中國,隨著城鎮(zhèn)化進程的速度不斷加快,以中國的行政區(qū)劃為基礎(chǔ),以民政部門確認的居民委員會或村民委員會轄區(qū)為劃分對象的分層方法,將面臨越來越多的實際問題。[4]
(三)樣本輪換比較
CPS采用4—8—4樣本輪換設計,定期輪換樣本中的部分最終抽樣單元,偶爾也輪換一些初級抽樣單元。調(diào)查人員每月到住戶單元收集信息,一個住戶單元被連續(xù)訪問4個月,在接下來的8個月退出調(diào)查,之后又連續(xù)調(diào)查4個月,最后永久退出該項調(diào)查。同時,從同一輪換組中重新抽出一個新的輪換樣本替換永久退出的住戶單元,在下一期繼續(xù)接受調(diào)查。樣本有75%的月度重疊率,50%的年度重疊率。[1]這種輪換模式符合概率抽樣的原則,每月的樣本對目標總體有很好的代表性。
LFS將加拿大全國勞動力總體分成6個輪換組,每期調(diào)查樣本都是從6個輪換組中抽出的6個輪換樣本構(gòu)成,每個輪換樣本連續(xù)調(diào)查6個月,然后退出調(diào)查。這種輪換模式,操作較簡單,月度重疊率高于80%,非常適合抽樣估計階段采用的組合校準估計方法。[2]22-23
在中國,省會城市和直轄市按月度在村級單位內(nèi)進行樣本輪換。樣本輪換以住戶組為單位,即每個住戶組為一個輪換組。當住戶組進入一個完整的輪換周期后,每個住戶組每隔2個月調(diào)查一次,連續(xù)調(diào)查5次后退出調(diào)查。各省會城市每季度在每個村級單位調(diào)查15個住戶組,每個住戶組約為4戶,共60戶(15×4),分3個交叉子樣本,每個子樣本20戶,分5個住戶組,每月調(diào)查一個子樣本,每季度調(diào)查3個子樣本,合計調(diào)查60戶。[3]
CPS和LFS分別采用不完全單水平和完全單水平輪換模式,既節(jié)約調(diào)查成本,又能較好地估計總體特征變化情況,還能有效地提高調(diào)查的估計精度。[5]中國勞動力調(diào)查也采用了輪換樣本,在不同的勞動力調(diào)查項目中輪換模式并不相同,不同的輪換模式將帶來輪換偏差,而且這種偏差很難在連續(xù)性抽樣估計中精確地計算出來。
二、數(shù)據(jù)收集比較
對于初次調(diào)查的住戶,CPS要求調(diào)查員進行入戶訪問,接下來各個調(diào)查月一般進行電話調(diào)查。每月,位于馬里蘭州的黑格斯敦、印第安納州的杰斐遜維爾、亞利桑那州的圖森的三大電話中心的調(diào)查員,通過電子問卷對大約70%的樣本住戶進行電話調(diào)查,對10%的樣本住戶進行計算機輔助電話調(diào)查。在每月的調(diào)查中,15歲或以上的人口需要回答一系列調(diào)查周的前一周(參照周)有關(guān)勞動力市場活動的標準化問題。這些問題將樣本總體分成三個基本的經(jīng)濟組:就業(yè)、失業(yè)和非勞動力。原始數(shù)據(jù)最終傳輸至普查局位于華盛頓特區(qū)的數(shù)據(jù)中心。[1]
LFS 采用計算機輔助電話調(diào)查和計算機輔助入戶調(diào)查。對初次參加調(diào)查的住戶,調(diào)查前會給他們郵寄一封介紹信和宣傳小冊子。對初次參加調(diào)查的城鎮(zhèn)住戶還進行電話初步接觸,收集住戶中每個家庭成員的信息,并獲取15歲及以上、70歲以下家庭成員的勞動力信息。為了節(jié)省調(diào)查成本和減少無回答,第1個月調(diào)查過的資料在隨后5個月的調(diào)查中不再重新詢問;除非被調(diào)查住戶要求入戶調(diào)查,所有的調(diào)查都通過計算機輔助電話調(diào)查進行。[2] 40-41
中國勞動力調(diào)查的調(diào)查登記工作在調(diào)查時點之后的七天內(nèi)進行,入戶登記前,調(diào)查員對應調(diào)查的住戶樣本進行核實,對于第一次參與調(diào)查的住戶發(fā)放通知信,有條件的,可預先約定入戶登記的時間。登記采用調(diào)查員入戶詢問、現(xiàn)場填報的方式進行。[3]
就數(shù)據(jù)采集方式而言,CPS和LFS所采用的計算機輔助電話調(diào)查、計算機輔助入戶調(diào)查、電子問卷調(diào)查,方式靈活,能快速確認被調(diào)查者是否回答了問卷中所有的問題以及問題答案之間的一致性,便于現(xiàn)場解決調(diào)查過程中出現(xiàn)的問題,最大程度地保證問卷的一致性,減少人為誤差,是數(shù)據(jù)采集方式的發(fā)展趨勢。[6]
三、數(shù)據(jù)處理比較
CPS和LFS的原始數(shù)據(jù)經(jīng)過行業(yè)和職業(yè)編碼、一致性校訂、項目無回答插補、變量分類后,就可以進入加權(quán)調(diào)整、估計和季節(jié)調(diào)整的程序。
每個月,CPS把從調(diào)查住戶獲取的信息同時匯總,其抽樣估計不僅包括每月的勞動力估計,還提供按照年齡、性別、種族、是否西班牙裔分類的勞動力估計。此外,還為全美的非機構(gòu)人口提供相關(guān)的人口估計。CPS實際公布全國和各州的調(diào)查結(jié)果通過無偏估計、無回答調(diào)整、第一階段比率調(diào)整、全國及各州的覆蓋調(diào)整、第二階段比率調(diào)整五個加權(quán)調(diào)整步驟后,采用組合估計方法,對當月全部樣本數(shù)據(jù)得出的第二階段比率估計量和上月的組合估計量進行加權(quán)平均,加權(quán)平均后的估計量加上誤差調(diào)整項以減少方差和輪換引起的偏差。充分利用輪換模式中上期樣本的積累信息,CPS采用組合估計方法得到估計量,增加了估計量的穩(wěn)定性。季節(jié)調(diào)整主要根據(jù)歷史數(shù)據(jù),自2003年起,全國勞動力數(shù)據(jù)采用X12ARIMA(autoregressive integrated moving average model,自回歸求和移動平均模型)程序進行勞動力時間序列的季節(jié)調(diào)整。①它可以進行ARIMA時間序列建模和模型選擇,檢測和估計異常值和節(jié)日效應,調(diào)整后診斷及消除季節(jié)和趨勢影響。每年1—6月,采用上年的季節(jié)調(diào)整因素調(diào)整,每年7月,勞工統(tǒng)計局公布下半年采用的季節(jié)調(diào)整因素。自1995年以來,CPS采用逐差法估計方差。[1]
LFS實際公布的加拿大全國、各個省調(diào)查結(jié)果通過對樣本數(shù)據(jù)進行無偏估計、無回答加權(quán)調(diào)整后得出, 自2000年來,LFS采用組合校準估計量,旨在保證抽樣調(diào)查所得人口估計與人口普查得到的控制總量一致,改善覆蓋誤差,提高估計精度。LFS在省級層面的估計中,采用了25個與勞動力特征、就業(yè)與失業(yè)相關(guān)的上月信息作為組合輔助變量向量,通過最小距離函數(shù)得到組合校準權(quán)重。[2]53-57利用整合權(quán)重的方法,修正輔助變量向量及組合輔助變量向量得到最終權(quán)重。[7]LFS季節(jié)調(diào)整旨在調(diào)整季節(jié)變化所引起的主要指標的短期變化。這些指標大部分是以全國和各省的水平進行調(diào)整的,主要的勞動力狀況估計也會調(diào)整到普查都市區(qū)的水平,并且公布3個月的移動平均數(shù),以減少由相對小的樣本規(guī)模所引起的不規(guī)律變化。LFS采用X11ARIMA方法進行季節(jié)調(diào)整,例如,對就業(yè)和失業(yè)人口的季節(jié)調(diào)整通過對主要年齡/性別分組的調(diào)整估計求和得到,這一總體估計作為其余季節(jié)調(diào)整的基準。由于LFS采用復雜的抽樣設計和估計方法,所以很難從抽樣方法中直接估計出方差估計量,LFS使用隨機組方法,給出刀切法方差估計量。[2]55-57
在中國,經(jīng)過登記工作的準確性和邏輯性復查后,縣級統(tǒng)計機構(gòu)對原始數(shù)據(jù)進行行業(yè)和職業(yè)編碼,市級和省級統(tǒng)計機構(gòu)對編碼進行驗收后進行數(shù)據(jù)處理,主要有10個步驟,包括:制定計算機數(shù)據(jù)處理總體方案;制定計算機編輯規(guī)則和匯總表式;研制錄入、審核程序;研制匯總程序;調(diào)試程序;下發(fā)程序;數(shù)據(jù)錄入;向國家報送原始數(shù)據(jù);報送推算的主要數(shù)據(jù);報送基礎(chǔ)數(shù)據(jù);省、國家數(shù)據(jù)匯總。在省級單位子總體內(nèi),調(diào)查數(shù)據(jù)可以直接匯總,也可以按城鄉(xiāng)人口比例進行事后分層后匯總,全國數(shù)據(jù)按各省級單位所占全國人口的比重進行加權(quán)匯總。[3]
與CPS、LFS科學嚴謹?shù)臄?shù)據(jù)處理流程相比,中國勞動力調(diào)查估計雖然規(guī)定了數(shù)據(jù)處理的總體方案,但實際中仍是由各級統(tǒng)計機構(gòu)自行組織、匯總和估計,缺乏數(shù)據(jù)處理過程中對無回答的調(diào)整、覆蓋率的校準、季節(jié)調(diào)整,尤其忽視估計量的方差估計,導致調(diào)查估計結(jié)果不夠科學,也難以度量抽樣估計的精確程度。
四、數(shù)據(jù)產(chǎn)品和開發(fā)應用比較
CPS在調(diào)查結(jié)束2周后發(fā)布第一階段結(jié)果,包括就業(yè)和失業(yè)指數(shù)、工作人口的年齡與性別、在農(nóng)業(yè)和非農(nóng)業(yè)領(lǐng)域的雇員人數(shù)、工作時間、持續(xù)失業(yè)時間及和CPS緊密相關(guān)的其他信息。[1] CPS除了搜集勞動力和人口數(shù)據(jù)外,還附帶搜集一些其他數(shù)據(jù),以滿足聯(lián)邦、州、私人組織或其他組織的特殊需求,如住房空置調(diào)查、年度社會經(jīng)濟調(diào)查、時間利用調(diào)查等。這些調(diào)查利用CPS的豐富資源,如大樣本量、完善的抽樣框、通用的抽樣設計、訓練有素的調(diào)查員、標準化的調(diào)查和數(shù)據(jù)處理流程,大大降低了調(diào)查成本,提高了估計精度。
LFS在調(diào)查結(jié)束后的第13天發(fā)布第一階段結(jié)果,在加拿大統(tǒng)計局網(wǎng)上電子數(shù)據(jù)庫和日常發(fā)布期刊上,提供了勞動力調(diào)查的大量表格數(shù)據(jù)。[2]58主要數(shù)據(jù)產(chǎn)品包括勞工信息、勞工和收入觀察、勞動力歷史數(shù)據(jù)、西部加拿大原住民、加拿大移民的工作狀況分析、加拿大勞動力市場概況、加拿大勞動力調(diào)查方法、勞動力調(diào)查的產(chǎn)品和服務、勞動力調(diào)查的改進、勞動力調(diào)查指南。為了滿足特殊分析目的,公眾可以獲取微觀數(shù)據(jù)庫文件進行數(shù)據(jù)提取和分析,LFS還提供有償自定義制表服務。加拿大統(tǒng)計局的住戶調(diào)查計劃下的大量住戶調(diào)查都通過LFS的樣本、抽樣框進行,如利用LFS淘汰樣本的加拿大勞工和收入動態(tài)調(diào)查,利用LFS抽樣框重新抽取樣本的加拿大住戶支出調(diào)查。這些調(diào)查利用LFS的樣本和抽樣框,減少了被調(diào)查的回答負擔,節(jié)省了可觀的調(diào)查成本。
目前,中國統(tǒng)計部門沒有正式發(fā)布勞動力調(diào)查數(shù)據(jù)。與CPS和LFS所提供的豐富的勞動力市場數(shù)據(jù)和附帶調(diào)查產(chǎn)品相比較,中國勞動力調(diào)查并未為公眾及時了解經(jīng)濟社會發(fā)展態(tài)勢提供相關(guān)信息。
五、勞動力調(diào)查方法國際比較的啟示
伴隨著“勞動力狀況”在宏觀調(diào)控中重要性的日益凸顯,本部分借鑒已趨成熟的美國和加拿大勞動力調(diào)查方法,對中國勞動力調(diào)查提出六點思考和建議,以期改進和完善我國勞動力調(diào)查方法體系。
(一)加強人口普查和勞動力調(diào)查的銜接
人口普查能為勞動力調(diào)查抽樣框的建立和各階段調(diào)查單元的分層提供大量信息,但是現(xiàn)行的人口普查還未能與勞動力調(diào)查進行很好銜接。中國統(tǒng)計部門應該充分發(fā)揮普查的基礎(chǔ)作用,科學地設計普查表,將普查、各類調(diào)查和各種行政記錄的相關(guān)指標協(xié)調(diào)統(tǒng)一,使其能夠提供勞動力調(diào)查所需的基礎(chǔ)性資料。在勞動力抽樣設計中,利用普查資料編制名錄抽樣框和區(qū)域抽樣框;與勞動力調(diào)查相關(guān)的普查數(shù)據(jù)可以用于分析各行政區(qū)域的經(jīng)濟活動人口特征,利用一些綜合指標,如城鄉(xiāng)人口比重、非農(nóng)業(yè)人口比重、16歲以上人口比例、從事第二和第三產(chǎn)業(yè)人口比例、就業(yè)率、勞動力參與率和失業(yè)率等指標對各個行政區(qū)域進行分層;利用村級單位的人口規(guī)模,按PPS(sampling with probability proportional to size)方法進行第一階段抽樣,利用人口普查區(qū)圖和普查小區(qū)圖,輔以村級單位的人口總數(shù)、家庭收入、就業(yè)人口等輔助資料,可更好地利用系統(tǒng)抽樣等方法進行第二階段抽樣。在勞動力抽樣估計中,各類普查資料可以為項目無回答的插補、單位無回答調(diào)整和校準估計提供輔助信息。
(二)合理分配樣本量以滿足各級政府行政區(qū)域的需求
在各省人口規(guī)模差異較大的情況下,如果按各省人口規(guī)模分配樣本量,則各省的樣本量差異較大,造成部分人口規(guī)模較小的省份目標變量的估計精度不足;如果在各個省平均分配樣本量,則會造成全國目標變量的估計精度下降。為了滿足各級行政區(qū)域的精度要求,我國勞動力調(diào)查的樣本量分配應由國家層面統(tǒng)一測算,滿足全國、分省的抽樣精度目標要求的樣本量、統(tǒng)一抽取樣本村級單位、統(tǒng)一對各省的樣本村級單位進行評估,將有效提高樣本村級單位的代表性,確保調(diào)查精度。
(三)構(gòu)建和維護勞動力調(diào)查多重抽樣框體系
中國現(xiàn)行勞動力調(diào)查采用2010年人口普查提供的抽樣框,在2015年全國1%人口抽樣調(diào)查后,將根據(jù)全國1%人口抽樣調(diào)查資料,建立最新抽樣框,抽取新的樣本。[3]由于我國人口眾多,城鎮(zhèn)化進程較快,勞動力流動性較大,僅僅通過普查和定期調(diào)查來對抽樣框進行更新和維護并不夠,可以借鑒CPS和LFS采用的多重抽樣框體系。首先,在村級單位內(nèi)建立住戶名錄抽樣框和區(qū)域抽樣框相結(jié)合的多重抽樣框。周期性人口普查應提供住戶基礎(chǔ)性資料,并根據(jù)相關(guān)基礎(chǔ)標志,將其轉(zhuǎn)化成各個村級單位內(nèi)的住戶名錄框;而對沒有進入住戶名錄抽樣框的那些調(diào)查單位,通過收集其地理分布特征,以行政村為單位確定區(qū)域抽樣框的實際分塊(可以是普查區(qū)),構(gòu)建村級單位的區(qū)域抽樣框作為補充。實際調(diào)查中只需要編制樣本村級單位內(nèi)的住戶名錄框和區(qū)域框。其次,以普查資料為基礎(chǔ),結(jié)合相關(guān)抽樣調(diào)查資料和行政記錄對抽樣框進行更新和維護。結(jié)合人口普查、經(jīng)濟普查、1%人口抽樣調(diào)查、相關(guān)行政部門有關(guān)土地變更和人口流動的行政記錄,通過相關(guān)數(shù)據(jù)庫的鏈接,則可以連續(xù)利用上述信息來更新抽樣框。最后,建議加強政府綜合統(tǒng)計機構(gòu)和部門統(tǒng)計機構(gòu)的協(xié)作,逐步建立住戶抽樣框的數(shù)據(jù)庫系統(tǒng),設立專項更新和維護費用預算,并以法律的形式予以保障。
(四)改進輪換模式以提高各期數(shù)據(jù)的準確性
為了提高現(xiàn)行一年1次的全國勞動力調(diào)查的時效性和大城市月度勞動力調(diào)查的覆蓋面,國家統(tǒng)計局整合了這兩項調(diào)查,將月度勞動力調(diào)查從目前的65個城市擴大到全國所有地級城市。[8]建議進一步將這兩項調(diào)查合并成一體化的連續(xù)性季度勞動力調(diào)查。其輪換樣本設計如下。把每個調(diào)查村級單位內(nèi)抽取的樣本均勻地分成3個調(diào)查子樣本,當一個住戶組進入一個完整的輪換周期后,每個住戶組每個季度調(diào)查一次,連續(xù)調(diào)查5次后退出調(diào)查,即每月只調(diào)查一個子樣本,每季度調(diào)查全部3個子樣本。要求獲取月度勞動力調(diào)查數(shù)據(jù)的地級市,以三個月的全部調(diào)查數(shù)據(jù)參與分省季度數(shù)據(jù)的匯總。當樣本輪換步驟完全實施后,月度間無重復樣本,季度間有80%的樣本重復調(diào)查,年度間有20%的重復樣本,這種輪換模式在橫向和縱向都能實現(xiàn)季度的平衡。[5]且每個樣本住戶每季度調(diào)查一次,減少了回答者的負擔和頻繁調(diào)查的成本,而將一個季度要調(diào)查的樣本平均地分配到各月,將減輕調(diào)查組織者的管理工作和保證調(diào)查數(shù)據(jù)的準確性。
(五)建立基于連續(xù)性抽樣的估計體系
建立勞動力調(diào)查估計體系包括四方面的內(nèi)容。第一,做好數(shù)據(jù)的采集整理工作,采取調(diào)查員利用手持終端設備與住戶通過互聯(lián)網(wǎng)自主填報相結(jié)合的形式采集數(shù)據(jù),同步完成數(shù)據(jù)的錄入儲存工作,直接傳送至統(tǒng)一的數(shù)據(jù)處理平臺,實現(xiàn)各級統(tǒng)計機構(gòu)按照權(quán)限共享基礎(chǔ)數(shù)據(jù),以保證數(shù)據(jù)的準確性、及時性和安全性;直接用計算機程序?qū)φ{(diào)查問卷進行職業(yè)和行業(yè)編碼,以減少人工勞動,節(jié)省成本;并對項目無回答數(shù)據(jù)進行插補、校正。第二,利用人口普查資料,分析接受調(diào)查住戶和拒絕調(diào)查住戶的差別,對數(shù)據(jù)進行無回答調(diào)整,校準由于某些類別樣本住戶拒絕調(diào)查造成的偏差。同時,要利用社保、稅務等部門的宏觀資料,設計恰當?shù)目刂谱兞?,對全國勞動力調(diào)查樣本進行校準;配合樣本輪換方法,對省會城市和非省會城市的數(shù)據(jù)進行匯總調(diào)整;構(gòu)建組合估計量,并按人口校準值對估計量進行校正。第三,進行季節(jié)調(diào)整和趨勢估計,以更好地識別失業(yè)與就業(yè)趨勢及其拐點。根據(jù)我國國情,可借鑒美國普查局研制的X13ARIMASEATS(Signal Extraction in ARIMA Time Series,基于ARIMA模型的時間序列的信號提取)季節(jié)調(diào)整方法。第四,針對我國勞動力調(diào)查的復雜樣本,可以考慮采用隨機組方法,計算Jackknife方差估計量。
(六)形成以勞動力調(diào)查為核心的人口住戶類調(diào)查體系
從目前需求方面看,各級政府都迫切希望掌握統(tǒng)一準確的各類人口的收入、消費、就業(yè)、遷移等民生狀況,而中國人口、住戶類調(diào)查項目種類繁多,調(diào)查內(nèi)容時有重復,這既增加了基層調(diào)查人員的工作量,浪費調(diào)查經(jīng)費,又增大了保證數(shù)據(jù)完整性、及時性的難度。就業(yè)是民生之本,收入是民生之基,建立以勞動力調(diào)查為核心的人口住戶類調(diào)查體系既可行,又必要。建立人口住戶類調(diào)查體系,就是要整合人口住戶調(diào)查資源,建立指標、抽樣框、抽樣方法、調(diào)查流程、數(shù)據(jù)處理統(tǒng)一規(guī)范、調(diào)查手段高效便捷、數(shù)據(jù)質(zhì)量扎實可靠、產(chǎn)品發(fā)布公開透明的住戶調(diào)查新體系。勞動力調(diào)查作為全國最重要的抽樣調(diào)查之一,其豐富的資源如抽樣框、調(diào)查流程、調(diào)查人員、計算機設備等可以為其他住戶調(diào)查的開展提供便利,可以降低其調(diào)查成本,提高估計精度。例如,利用勞動力調(diào)查的抽樣框重新抽取新樣本,進行人口變動情況抽樣調(diào)查、住戶收支和生活狀況調(diào)查;利用勞動力調(diào)查的現(xiàn)行樣本,與勞動力調(diào)查同時進行住房空置率調(diào)查;利用勞動力調(diào)查的淘汰樣本進行職工收入調(diào)查。
注釋
①1954年,美國普查局的Shiskin首先開發(fā)了可以在計算機上運行的季節(jié)調(diào)整程序,稱為模型I,此后該程序的每一次改進都以X加上序號表示。直到1965年美國普查局推出了比較完整的季節(jié)調(diào)整程序X11,后來世界流行的X11ARIMA也是以X11程序為核心的,而X12ARIMA作為X11ARIMA的提高版,是目前較成熟的季節(jié)調(diào)整方法之一。
參考文獻
[1]U S DEPARTMENT OF LABOR, U S DEPARTMENT OF COMMERCE. The current population survey: design and methodology, technical paper 66[EB/OL].[2015-09-15]. http://www.census.gov/prod/2006pubs/tp-66.pdf.
[2]STATISTICS CANADA. Methodology of the canadian labour force survey [M]. Ottawa: Statistics Canada, 2008:1-67.
[3]國家統(tǒng)計局. 勞動力調(diào)查制度[EB/OL].[2015-09-15]. http://www.stats.gov.cn/tjsj/tjzd/gjtjzd/201501/t20150105_663428.html.
[4]孫玉環(huán).改進住戶調(diào)查數(shù)據(jù)質(zhì)量的多維視角[J] .中國統(tǒng)計,2011(4):12-13.
[5]陳光慧,劉建平. 基于平衡單水平輪換的連續(xù)性抽樣估計方法研究[J]. 統(tǒng)計研究,2008,25(10):81-85.
[6]楊盛菁.計算機輔助電話調(diào)查技術(shù)及其應用分析[J]. 統(tǒng)計科學與實踐,2012(2):49-51.
[7]LEMAITRE G,DUFOURUFOUR J. An integrated method for weighting persons and families [J]. Survey methodology, 1987(13): 199-207.
[8]國家統(tǒng)計局. 關(guān)于“在‘十三五期間啟用新的就業(yè)統(tǒng)計指標”建議的答復(摘要) [EB/OL].[2015-11-18].http://www.stats.gov.cn/tjfw/jytadf/rddbjy/201511/t20151118_1277657.html.