曾永明
(江西財經(jīng)大學(xué) 經(jīng)濟學(xué)院,江西 南昌 330013)
2020年中國流動人口達(dá)到3.76億,比2010年增長69.3%(1)數(shù)據(jù)來源:國務(wù)院第七次人口普查領(lǐng)導(dǎo)小組辦公室.2020年第七次全國人口普查主要數(shù)據(jù)[M].北京:中國統(tǒng)計出版社,2021:80-81。,引起廣泛關(guān)注。國家統(tǒng)計局局長寧吉喆在第七次全國人口普查發(fā)布會上表示,我國經(jīng)濟社會持續(xù)發(fā)展,為人口的遷移流動創(chuàng)造了條件,人口流動趨勢更加明顯,流動人口規(guī)模進(jìn)一步擴大。人口遷移作為人口學(xué)過程之一和人口轉(zhuǎn)變的重要部分[1-2],因其特殊的空間屬性,顯著區(qū)別于生育、死亡過程。不過,年齡結(jié)構(gòu)可以是人口學(xué)的中心概念(central concept),但空間結(jié)構(gòu)(比如人口遷移流)并不是[3]。事實上,人口遷移流動是規(guī)范人口學(xué)(formal demography)研究的基本組成部分,然而在中國生育制度的政策影響、人口老齡化及健康中國建設(shè)背景下,對于生育、死亡(健康)的研究比人口遷移的影響要更深遠(yuǎn)。不同于生育、死亡過程一般僅影響?yīng)毩⒌哪硡^(qū)域,人口遷移流發(fā)生在一個多區(qū)域系統(tǒng)內(nèi):每個區(qū)域遷出人口均遷往多個其他區(qū)域,形成一個交互的空間“流結(jié)構(gòu)”和系統(tǒng)[1],因此對于人口遷移流空間結(jié)構(gòu)的概念定義和測量依然比較模糊,模型化表達(dá)更是不足[3],對人口遷移流空間結(jié)構(gòu)的深化研究也從未停止。
雖然萊文斯坦(Ravenstien)、劉易斯(Lewis)等大批學(xué)者研究了人口遷移的基本規(guī)律、生成動因等[4-5],為人口遷移理論研究作出巨大貢獻(xiàn),但從量化的人口統(tǒng)計學(xué)角度來描述或測量、模型化表達(dá)和預(yù)測人口遷移流空間結(jié)構(gòu)的歷史并不長。事實上,對人口遷移流空間結(jié)構(gòu)研究的歷史梳理后發(fā)現(xiàn),對人口遷移流的描述、模型化表達(dá)和預(yù)測是人口遷移研究的三個階段,也是不應(yīng)該分割的三個系統(tǒng)過程或基本程式?!懊枋觥睉?yīng)該是最為基礎(chǔ)的階段,它是對人口遷移流空間結(jié)構(gòu)和遷移流的認(rèn)識過程。人口遷移流不同于人口規(guī)模、人口年齡等向量形式,其表現(xiàn)出矩陣形式和交互結(jié)構(gòu),對其描述過程也就變得復(fù)雜,統(tǒng)計學(xué)意義上的平均值、中位數(shù)、標(biāo)準(zhǔn)差等不再適用,這也限制了早期關(guān)于人口遷移流的深化認(rèn)識和研究,更阻礙了現(xiàn)實問題的發(fā)現(xiàn)與應(yīng)用。早期由于跨區(qū)域人口遷移流量數(shù)據(jù)統(tǒng)計的不完整,導(dǎo)致數(shù)據(jù)缺失問題,描述都難以實現(xiàn),也影響后續(xù)模型化和預(yù)測過程[6]。因此,早期關(guān)于人口遷移流空間結(jié)構(gòu)的研究主要是集中在如何定義、測量和補數(shù)據(jù)上[7]。夏洛克(Shryock)在描述人口遷移流空間結(jié)構(gòu)研究上做了早期的努力,定義和設(shè)置了移民區(qū)域偏好指數(shù)[8]??巳R頓(Clayton)比較早地定義了人口遷移流空間結(jié)構(gòu),認(rèn)為移民在來源地和目的地之間的交互流動產(chǎn)生的聯(lián)系即為遷移流空間結(jié)構(gòu),并將該定義應(yīng)用在美國跨州移民的識別研究中[9]。多位學(xué)者將移民效應(yīng)(migration efficiency)的概念廣泛應(yīng)用到人口遷移結(jié)構(gòu)描述中[10-11]。最近拉莫(Raymer)等在整合前人研究基礎(chǔ)上,采用乘法分量模型(Multiplicative Components Model)作為描述人口遷移結(jié)構(gòu)的一般分析框架[12-14],該模型簡單并易于理解,已用于多個地區(qū)或國家的研究,在描述人口遷移流空間結(jié)構(gòu)研究領(lǐng)域產(chǎn)生了較大影響。
在人口遷移流空間結(jié)構(gòu)的描述性研究中,移民數(shù)據(jù)不同于存量數(shù)據(jù),它以矩陣或?qū)ε夹问匠霈F(xiàn),數(shù)據(jù)要求更高,以致數(shù)據(jù)通常缺失而不完整,即便是在當(dāng)前時代,國際移民矩陣數(shù)據(jù)也不完善,也就是說,對國際間移民的數(shù)據(jù)都未能精準(zhǔn)掌握,而且估計出完整可行的移民矩陣并不容易。阿貝爾和山德爾(Abel &Sander)提出了一種在保持已知的凈移民規(guī)?;A(chǔ)上從移民存量數(shù)據(jù)著手的估計方式,估算了全球196個國家間1990—2010的移民流數(shù)據(jù),成果發(fā)表于Science雜志[15],可見補數(shù)據(jù)對于人口遷移研究的重要性。拉莫也對北歐國家之間的移民缺失數(shù)據(jù)進(jìn)行了彌補[6]。相比于國際移民數(shù)據(jù),國家內(nèi)部人口遷移流矩陣因人口普查或抽樣調(diào)查得到相對完整的數(shù)據(jù),因此對于國內(nèi)人口遷移流空間結(jié)構(gòu)的研究更多的是放在后兩個階段上:模型化表達(dá)和預(yù)測。
一個人口學(xué)概念如果能夠通過簡化通用的理論模型表達(dá)出來,對其接受認(rèn)可和實際應(yīng)用均是有益的。比如人們熟知的人口平衡方程、生命表或預(yù)期壽命、總和生育率測算等。人口遷移流空間結(jié)構(gòu)并沒有一個廣泛接受的數(shù)學(xué)表達(dá)形式或模型,不過其特殊性在于,人口遷移鏈接了遷出地和遷入地多個區(qū)域,因此空間交互模型被認(rèn)為是表達(dá)人口遷移流空間結(jié)構(gòu)的最理想方式[3]。但具體到實證分析中,重心模型、熵最大化模型或信息最小化模型、對數(shù)線性模型也是常見的,不過其實這三者本質(zhì)結(jié)構(gòu)是一致的。當(dāng)前多數(shù)學(xué)者采用對數(shù)線性模型來分析和解釋人口遷移流空間結(jié)構(gòu),因為人口遷移流量表可以看作一個遷出地—遷入地雙向列聯(lián)表,表中的每個單元格就是人口遷移量,而對數(shù)線性模型有一個良好的統(tǒng)計理論和方法論機制將列聯(lián)表分析和離散多變量分析框架完美地對接起來[16],而且對數(shù)線性模型可以納入廣義線性模型中,其相對機動的變量分布設(shè)置形式使其能更好匹配人口遷移流量數(shù)據(jù)特征,比如泊松分布、二項分布等[17-18]。基于對數(shù)線性模型或重心模型等對中國跨區(qū)域人口遷移流空間結(jié)構(gòu)的研究并不少[2,19],但相對于國外類似研究有兩點密切關(guān)聯(lián)的差異,一是對人口遷移流數(shù)據(jù)內(nèi)生規(guī)律和衍生形式利用和分析不足,即從人口統(tǒng)計學(xué)視角切入的基礎(chǔ)性研究不多,主要是對內(nèi)生數(shù)據(jù)之外的經(jīng)濟社會因素討論較多;二是局限于以遷入地、遷出地的區(qū)域效應(yīng)和物理距離為主,對區(qū)域交互效應(yīng)、年齡結(jié)構(gòu)效應(yīng)、性別效應(yīng)及區(qū)域—年齡等交互效應(yīng)拓展不足。
關(guān)于人口議題相關(guān)的預(yù)測大多是圍繞總量或趨勢視角,比如人口總量、城鎮(zhèn)化和老齡化等,也有個別特殊的視角,比如人口分布預(yù)測[20-21],但是關(guān)于人口遷移流的預(yù)測則不常見,因為它是“一張網(wǎng)”而不是“一個點”的預(yù)測,難度大幅提升。既有關(guān)于“流”的預(yù)測研究中,基于雙邊比例調(diào)整(bi-proportionally adjustment)方法的人口遷移流預(yù)測在國外有多位人口學(xué)者做了成功的嘗試[3,16,22]。雙邊比例調(diào)整方法的基本原理是尋找一個合適的矩陣使其滿足邊際約束條件并與基期矩陣的分布函數(shù)保持一致。雙邊比例調(diào)整方法在國際貿(mào)易方面的研究文獻(xiàn)較多,涉及基于區(qū)域間貿(mào)易流或投入產(chǎn)出表進(jìn)行替代效應(yīng)和制造效應(yīng)的調(diào)整[23-24]。根據(jù)國際貿(mào)易相關(guān)理論,徐國祥和陳海龍首次對我國省區(qū)間人口投入產(chǎn)出表做了編制[25],其中也應(yīng)用到雙邊比例調(diào)整方法,但僅是作為估計值的調(diào)整方法,未應(yīng)用到預(yù)測。汪子龍等基于多源數(shù)據(jù)并采用帶有時間序列的線性擬合模型對人口遷移流進(jìn)行了預(yù)測[26],但實證對象并非國內(nèi)而是歐盟國家之間的人口遷移流。可以說,國內(nèi)關(guān)于人口遷移預(yù)測實屬鮮見,雖然對于擁有龐大流動人口的中國進(jìn)行人口遷移流預(yù)測非常有必要。
梳理國外研究發(fā)現(xiàn),關(guān)于人口遷移流空間結(jié)構(gòu)的描述、模型表達(dá)與預(yù)測三個階段或三個系統(tǒng)過程的研究雖然比較零散,但基本形成了一般化的研究框架,在長期的探索過程中對各個子議題的研究有了比較有效的解決方式甚至是“標(biāo)準(zhǔn)程式”。遺憾的是國內(nèi)對于這一框架的梳理還不足,理論研究較為稀缺,實證也較為罕見,尤其是對人口遷移流空間結(jié)構(gòu)本身運行過程的分析還不足。顯然,從人口統(tǒng)計學(xué)的角度來研究人口遷移流動的內(nèi)生規(guī)律并基于人口遷移流矩陣自我數(shù)據(jù)生成過程的研究有很大價值。鑒于此,本文目的就在于將人口遷移流空間結(jié)構(gòu)的描述、模型化表達(dá)和預(yù)測整合到一起,并作為一個標(biāo)準(zhǔn)程式,基于人口遷移流矩陣自我數(shù)據(jù)生成過程來研究我國跨區(qū)域人口遷移,期望形成關(guān)于中國人口遷移流空間結(jié)構(gòu)研究的一個“基本程式”,也期待未來更多學(xué)者尤其國內(nèi)學(xué)者對中國人口遷移問題進(jìn)行研究,特別是從“流”數(shù)據(jù)內(nèi)生過程出發(fā),在“基本程式”上進(jìn)行發(fā)展創(chuàng)新,推進(jìn)國內(nèi)空間人口學(xué)、人口統(tǒng)計學(xué)等研究,拓展人口遷移流的應(yīng)用并對現(xiàn)實問題作出應(yīng)有響應(yīng)。本文具體研究內(nèi)容包括:基于2011—2017年中國流動人口動態(tài)監(jiān)測調(diào)查數(shù)據(jù)(China Migrants Dynamic Survey,CMDS)和最近三次的人口普查和抽樣調(diào)查數(shù)據(jù),并以長江經(jīng)濟帶11省份和中國東部、中部、西部和東北四大區(qū)域之間人口遷移流為例,采用乘法分量模型來描述國內(nèi)人口遷移流空間結(jié)構(gòu)特征,通過對數(shù)線性模型來表達(dá)國內(nèi)人口遷移流空間結(jié)構(gòu)特征,應(yīng)用雙邊比例調(diào)整法來預(yù)測國內(nèi)人口遷移流空間結(jié)構(gòu)特征,嘗試通過描述、模型化表達(dá)和預(yù)測來建立一個國內(nèi)人口遷移流空間結(jié)構(gòu)的研究程式。
中國流動人口動態(tài)監(jiān)測調(diào)查(CMDS)是由國家衛(wèi)生健康委員會(原國家衛(wèi)生和計劃生育委員會)組織的在流入地對流動人口進(jìn)行的連續(xù)斷面調(diào)查,自2009年起每年進(jìn)行監(jiān)測調(diào)查。該調(diào)查以在流入地居住一個月以上、非本市(縣、區(qū))戶籍的15—59 周歲流動人口為調(diào)查對象(2015年后不再設(shè)置年齡上限,即調(diào)查15周歲以上所有年齡段流動人口),采取分層、多階段、與規(guī)模成比例的PPS 方法進(jìn)行抽樣。調(diào)查區(qū)域涵蓋全國31個省(市、自治區(qū))和新疆生產(chǎn)建設(shè)兵團(不包含香港、澳門和臺灣地區(qū))。CMDS數(shù)據(jù)有比較詳細(xì)的關(guān)于個體來源地(戶籍地)和目的地(現(xiàn)居地)的空間屬性,是分析流動人口空間結(jié)構(gòu)的良好樣本,還能結(jié)合年齡、性別等進(jìn)行靈活分析。事實上,對CMDS的開發(fā)研究大多數(shù)限于個體經(jīng)濟、社會問題的應(yīng)用,而忽視該數(shù)據(jù)庫調(diào)查對象本身強烈的空間屬性。本文從人口遷移流空間結(jié)構(gòu)視角對這一數(shù)據(jù)庫進(jìn)行空間挖掘,充分挖掘其在人口空間統(tǒng)計上的應(yīng)用價值。
需要說明的是,盡管CMDS始于2009年,但2009和2010年的調(diào)查方案與之后的調(diào)查有所差異,2011年后開始啟用新的流動人口動態(tài)監(jiān)測調(diào)查方案,調(diào)查體系更成熟,樣本量更大,代表性也更好,因此本文起始年設(shè)為2011年。同時,因分析框架一致并限于篇幅,本文不分析所有年份,最終選擇2011、2014和2017年樣本進(jìn)行實證分析。為了全面分析全國人口遷移流的空間結(jié)構(gòu),本應(yīng)該選擇全國31個省(市、自治區(qū))為佳,但鑒于遷出地—遷入地OD結(jié)構(gòu)(Origin-Destination)列聯(lián)表過大和篇幅所限,文章以長江經(jīng)濟帶11個省級單元為例,既有代表性,也能在文中列表分析。另外,加入年齡后,遷出地—遷入地—年齡ODA結(jié)構(gòu)(Origin-Destination-Age)相關(guān)圖表和模型參數(shù)更加復(fù)雜,因此進(jìn)一步縮減到以中國東部、中部、西部和東北地區(qū)四個大區(qū)進(jìn)行分析。當(dāng)然,案例區(qū)域的選擇并不影響研究的基本程式、基本結(jié)論和意義所在,而且全國任何區(qū)域、省級或市級間的人口遷移流空間結(jié)構(gòu)分析完全同理。
具體實證分析中,本文實際上僅有一個變量或研究指標(biāo),即人口遷移流量,其他相關(guān)變量是通過人口遷移流量矩陣內(nèi)生化而來。本文以流動人口戶籍地作為遷出地(O)、以現(xiàn)居地作為遷入地(D)將樣本進(jìn)行匯總并建立起全國31個省份(剔除來源地為港澳臺及國外樣本,現(xiàn)居地不含港澳臺及國外樣本,無需處理)之間的人口遷移流量矩陣,并匯總為東部、中部、西部和東北四大區(qū)域之間的人口遷移流量矩陣。當(dāng)考慮年齡結(jié)構(gòu)時,則每個年齡段(比如每5歲一組)構(gòu)建一個人口遷移流量矩陣(性別或戶籍同理,限于篇幅本文實證中未作這類分析)。最終構(gòu)建了長江經(jīng)濟帶11省份2011年、2014年11×11×9的人口遷移流量矩陣和2017年11×11×14的人口遷移流量矩陣(9和14分別為每5歲一組的年齡組個數(shù),2015年前調(diào)查對象為15—59歲,2015年之后為15歲以上所有年齡段流動人口),以及中國四大區(qū)域2011年、2014年4×4×9的人口遷移流量矩陣和2017年4×4×14的人口遷移流量矩陣進(jìn)行實證分析。另外,本文在人口遷移流的預(yù)測研究中,也用到了2000、2010和2020年的三次人口普查數(shù)據(jù)。
人口遷移流量是一種計數(shù)(counts)數(shù)據(jù),它可以從屬性數(shù)據(jù)分析(categorical data analysis)視角中的列聯(lián)表切入[27],其中以雙向或二維列聯(lián)表最為基礎(chǔ)。人口遷移流的基本結(jié)構(gòu)是雙向列聯(lián)表,包括遷出地和遷入地(origin by destination,OD),多維列聯(lián)表還可以引入年齡、性別等人口學(xué)屬性。
(1)雙向列聯(lián)表與人口遷移流空間結(jié)構(gòu)基本描述。如表1所示,人口從來源地i遷移到目的地j,計兩地間的人口遷移量為nij,從某來源地流出的邊際總量(marginal totals)記為ni+,流入某目的地的邊際總量記為n+j,而遷移總量記為n++。需要指出的是,區(qū)域內(nèi)部的流動不計入測算,即當(dāng)i=j時,nij=0,因為該流量不屬于跨區(qū)域流動。人口遷移流列聯(lián)表可以分解為幾個獨立的分量,并構(gòu)成乘法分量模型[3]:
nij=(T)(Oi)(Dj)(ODij)
(1)
表1 人口遷移流的OD雙向列聯(lián)表結(jié)構(gòu)
其中,總分量T(相當(dāng)于表1中n++)表示總體遷移水平或總效應(yīng)(overall effects);遷出地分量Oi(ni+/n++)表示來源地的相對推力或遷出效應(yīng),遷入地分量Di(n+j/n++)表示目的地的相對拉力或遷入效應(yīng),Oi和Dj構(gòu)成主效應(yīng)(main effects);遷出地—遷入地交互分量ODij定義為nij/[(T)(Oi)(Dj)],表示觀測遷移量與期望遷移量的比率(ratio of observed migration to expected migration),也有學(xué)者將其解釋為遷出地與遷入地之間的物理或社會距離[13]或吸引系數(shù)[26],該值越大則兩地間的聯(lián)系越強。當(dāng)交互分量大于1時,表示觀測值多于期望值,反之當(dāng)交互分量小于1時,表示觀測值低于期望值。
(2)引入其他人口學(xué)特征的多維結(jié)構(gòu)描述。式(1)是最基本的人口遷移流描述方式,這類模型還可以引入出生地、年齡、性別[13-15]等,其中年齡在移民過程中影響較大,移民本身是一個年齡選擇(age-selective)過程[28],因此,為了清晰展示各參數(shù)估計過程且考慮篇幅問題,本文僅引入年齡進(jìn)行拓展分析(其他同理)。則模型表達(dá)形式為:
nijx=(T)(Oi)(Dj)(Ax)(ODij)(OAix)(DAjx)(ODAijx)
(2)
其中,A指年齡(age),x表示5歲的年齡分組,其他參數(shù)同上。顯然,式(2)相對于式(1)復(fù)雜很多,模型增加了年齡項,因此包含了三個二維交互項和一個三維交互項,總共有八個參數(shù),稱為飽和模型(簡記ODA模型)。盡管如此,模型參數(shù)的意義和解釋并未發(fā)生變化,依然相對簡單,總效應(yīng)T、主效應(yīng)Oi和Dj、遷出地—遷入地交互效應(yīng)ODij是一致的:
T=∑ijxnijx
(3)
Oi=∑jxnijx/T
(4)
Dj=∑ixnijx/T
(5)
ODij=∑xnijx/[(T)(Oi)(Dj)]
(6)
新增的相關(guān)年齡效應(yīng)參數(shù)為:
Ax=∑ijnijx/T
(7)
OAix=∑jnijx/[(T)(Oi)(Ax)]
(8)
DAjx=∑inijx/[(T)(Dj)(Ax)]
(9)
ODAijx=nijx/[(T)(Oi)(Dj)(Ax)(ODij)(OAix)(DAjx)]
(10)
Ax、OAix、DAjx、ODAijx分別定義為年齡主效應(yīng)、遷出地—年齡交互效應(yīng)、遷入地—年齡交互效應(yīng)和遷出地—遷入地—年齡交互效應(yīng)。以上所有參數(shù)都需要滿足相應(yīng)約束條件:
∑iOi=∑jDj=Ax=1
(11)
(12)
其中,m為區(qū)域個數(shù),k為年齡分組數(shù)。
(1)雙向列聯(lián)表:長江經(jīng)濟帶省際人口遷移流描述。為了解釋和描述各乘法分量,如表2和表3所示,基于2017年CMDS數(shù)據(jù),以長江經(jīng)濟帶11個省級單元之間的跨區(qū)域人口遷移流為例進(jìn)行分析。表2顯示,在調(diào)查的長江經(jīng)濟帶56913個樣本中跨省人口遷移流總量為23660人。從邊際總量來看,安徽遷出人口最多(6579人),浙江遷入人口最多(6869人),其中安徽遷往江蘇的流量最大(2118人)。表3是各乘法分量,為了解釋各乘法分量數(shù)據(jù)生成過程,以江蘇遷往上海的流量1216人為例,該流量值分解為四個乘法分量:
n21=(T)(O2)(D1)(OD21)=(23660)(0.072)(0.219)(3.25)=1216
或者:
OD21=n21/[(T)(O2)(D1)]=1216/[(23660)(0.072)(0.219)]=3.25
其中,下標(biāo)2表示第二行的江蘇,下標(biāo)1表示第一列的上海。這些分量的解釋比較簡單,總分量23660人即長江經(jīng)濟帶的跨省遷移人口總量,遷出地分量0.072表示7.2%的人口是從江蘇遷出的,遷入地分量0.219表示21.9%的人口遷往上海,最后比較重要的交互分量3.25表示區(qū)域間的聯(lián)系強度,數(shù)據(jù)意義為實際觀測值與期望值的比率,即相對每10個期望遷移流,大約有32個實際遷移流。顯然,交互分量3.25顯著大于1,顯示了兩者之間較強的聯(lián)系度。其具有強聯(lián)系度(交互分量大于2)的有16個,比如上?!不?、湖北—湖南、重慶—四川等,這些強聯(lián)系度區(qū)域的共同特點是屬于邊界省份,在物理空間上相連,這一結(jié)果也符合人口遷移的地理臨近規(guī)律[4]。從交互分量看,長江經(jīng)濟帶省際間人口遷移流具有明顯的空間選擇性,高強度的流量發(fā)生在少部分空間,多數(shù)省份之間遷移流并不大。
表2 長江經(jīng)濟帶人口遷移流列聯(lián)表:觀測流量 人
表3 長江經(jīng)濟帶人口遷移流列聯(lián)表:乘法分量 人
(2)多維列聯(lián)表:引入年齡的中國四大區(qū)域人口遷移流描述。加入年齡后,ODA結(jié)構(gòu)相關(guān)圖表和模型參數(shù)更加復(fù)雜,限于篇幅,文章以中國東部、中部、西部和東北地區(qū)四個大區(qū)進(jìn)行分析。趨勢上則以CMDS中2011、2014和2017年三期的數(shù)據(jù)進(jìn)行時間序列上的分析。依據(jù)前面提及的ODA飽和模型,包含八個參數(shù)。首先,總效應(yīng)分量即跨區(qū)域流動總?cè)丝诜謩e為42937、68009、55605,因為該分量是一個絕對數(shù)值,然而每年CMDS抽樣的樣本數(shù)不一致,因此趨勢性的比較意義不大,不過這并不影響后續(xù)其他分量的趨勢性分析(其他分量是相對數(shù)值,與樣本量規(guī)模的具體值無關(guān))。圖1顯示了區(qū)域主效應(yīng),其中遷出地主效應(yīng)以中部為主,超過55%的跨區(qū)域遷入人口來自中部,西部也達(dá)到26%;遷入地主效應(yīng)在東部具有絕對優(yōu)勢,占比達(dá)到70%;而西部和東北遷出地和遷入地主效應(yīng)基本相當(dāng)。綜合比較發(fā)現(xiàn),東部地區(qū)是中國主要遷入地,中部地區(qū)是主要遷出地。從時間趨勢來看,波動非常微小,一個較為明顯的趨勢是東部的遷入地效應(yīng)有所降低,而西部的遷入地效應(yīng)有所增加,這符合最近中國人口遷移的新特點:西部人口就近遷移的趨勢有所增加。人口回流和就近流遷表現(xiàn)出較強動力,從目前人口流動的范圍來看,長距離,特別是跨省流動人口所占的比重呈現(xiàn)下降趨勢,省內(nèi)流動人口的地位上升明顯[29],傳統(tǒng)的人口流動模式正被逐漸打破。
圖1 遷出地主效應(yīng)分量Oi和遷入地主效應(yīng)分量Dj演變趨勢
對于年齡主效應(yīng)Ax,需要說明的是,CMDS調(diào)查均設(shè)定為15周歲以上流動人口,因此本文無法分析15歲以下人口的遷移結(jié)構(gòu)。同時,在2015年以前,最高年齡設(shè)定為59周歲,即60歲以下,而2015年及之后不設(shè)上限,因此,本文分析的2011、2014年僅為15—59周歲,2017年為15周歲及以上,如圖2所示。從曲線結(jié)構(gòu)可以看出,中國人口遷移的年齡特征在2011—2017年基本一致,呈現(xiàn)明顯的倒“U”型特征,其中25—40歲是人口遷移的主要群體。萊文斯坦的經(jīng)典人口遷移法則中“年齡律”并未發(fā)生明顯改變,中青年依然是人口遷移的核心群體。
圖2 年齡主效應(yīng)分量Ax演變趨勢
從時間趨勢來看,年齡波峰從2011年的35—39歲年齡段轉(zhuǎn)到2014和2017年的25—29歲年齡段,說明這一時期中國人口遷移有從老一代向新生代轉(zhuǎn)移的歷史轉(zhuǎn)變特征,年齡結(jié)構(gòu)轉(zhuǎn)向年輕化;而且2011年25—29、30—34、35—39歲三個年齡段分布較為均衡,而后兩個時期有明顯的獨立波峰特征。25歲以下的群體跨區(qū)域遷移比例有明顯的下降趨勢,原因可能包括,一方面是中國整體人口結(jié)構(gòu)的變化,即生育下降的累計效應(yīng),另一方面是流動人口中的就近就業(yè)創(chuàng)業(yè)的比例在提升,跨區(qū)域流動則有所放緩[29]。45歲及以上群體遷移比例有明顯的上升趨勢,一方面可能是老齡化的宏觀背景所導(dǎo)致,另一方面可能是因為當(dāng)前家庭化遷移的比例在上升,更多比例的中老年群體隨子女遷移到流入地。
圖3 遷出地—遷入地交互分量ODij演變趨勢
以上三個主效應(yīng)的分析比較好理解,他們是基于獨立的比例測算,而在交互分量中,各交互分量是通過各主效應(yīng)的綜合比例測算得到,表示的是觀察值與期望值的偏離,一定程度上也可以理解為兩者之間的“聯(lián)系強度”。遷出地—遷入地交互分量ODij參數(shù)結(jié)果如圖3所示,各分量在時間趨勢上相對較為穩(wěn)定,但空間差異較大,前者東部—中部、東部—西部和東部—東北有最為明顯的強度,ODij均在2以上,尤其前者超過4,即實際觀察到從東部流入中部的人口是期望的4倍。而東北—中部、東北—西部和中部—東北O(jiān)Dij均低于1,即觀測遷移人口要低于期望遷移人口。剩下的幾個分量則基本趨近于1,即觀測遷移人口與期望遷移人口相當(dāng)。
遷出地—年齡交互分量OAix和遷入地—年齡交互分量DAjx參數(shù)結(jié)果如圖4所示,該分量在四大區(qū)域的基本特征有明顯的差異,均與圖2中的年齡主效應(yīng)分量的倒“U”型特征存在較大差異??傮w上2011—2017年的交互分量OAix三條曲線和交互分量DAjx在每個區(qū)域的基本波動趨勢是相似的,尤其是在15—59歲的年齡段,即說明該分量特征的穩(wěn)定,也說明抽樣保持了較為良好的連續(xù)性。60歲以后變化較大,可能是受樣本限制的影響,僅2017年有數(shù)據(jù),但這不影響基本特征分析。
在東部地區(qū),OAix的走勢基本是隨著年齡上升遷出規(guī)模上升,而DAjx走勢大致隨著年齡上升遷入規(guī)模下降。可能是由于東部對于年輕人口的吸引力更大,對于中老年群體表現(xiàn)出一定的排斥,而且年輕群體對于東部大城市的適應(yīng)力要強于中老年群體[30],因此中老年群體遷出比例大而遷入比例小,青年群體則相反。
在中部地區(qū),OAix與DAjx趨勢也大致相反,前者隨著年齡緩慢下降,后者隨著年齡緩慢上升。具體來說,中部作為全國主要流出群體來源地,在50歲以前各年齡段比例基本相當(dāng),外出的年齡選擇效應(yīng)較弱,到了50歲之后,同樣因老化導(dǎo)致的就業(yè)匹配下降使得外出比例下降,而遷入的比例上升。這里的“遷入”其實可能是“被迫回流”[31],中老年群體選擇就近遷移。
在西部地區(qū),OAix與DAjx趨勢同東部相似,但趨勢曲線幅度更大。事實上,同中部一樣,西部是全國主要流出群體另一來源地,外出各年齡群體比例相當(dāng),走勢比較穩(wěn)定。不過在15—19歲年齡段,其遷出比例明顯更高,可能的原因是西部該年齡段(大致是高中階段)就學(xué)率不高,遠(yuǎn)低于東部高中普及率[32],直接外出務(wù)工比例較大。DAjx陡峭的趨勢說明,對于西部中老年群體,遷入或回流表現(xiàn)出非常顯著的動力。
在東北地區(qū),OAix與DAjx均表現(xiàn)出隨著年齡增加而上升的趨勢,而且兩者在前期都比較穩(wěn)定地上升,但前者在中老年階段有非常顯著的提升,尤其是老年階段遷出東北的比例較大。這可能是“候鳥遷移”的表現(xiàn),老年群體冬季避寒遷出、夏季返回避暑成為東北的典型特征[33],因此東北中老年群體的遷移力表現(xiàn)出比其他年齡段更顯著的特征。
乘法分量模型的結(jié)構(gòu)是乘積形式,如果取對數(shù)則可以變換為對數(shù)線性模型(Log-linear model)表達(dá)形式,因此,實際上乘法分量模型和對數(shù)線性模型在本質(zhì)上是一致的。將式(2)取對數(shù)得到:
(13)
其中,參數(shù)λ上標(biāo)O和D分別指示遷出地i和遷入地j,顯然模型(2)和(13)是一致的,都為對數(shù)線性模型或其變形,前述以乘法分量模型開始分析是為了方便理解并引入對數(shù)線性模型。當(dāng)分解測算參數(shù)和描述空間結(jié)構(gòu)特征時用乘法形式較為合適,當(dāng)擬合模型參數(shù)并表達(dá)空間結(jié)構(gòu)時用對數(shù)線性模型形式較為妥當(dāng)。對數(shù)線性模型有一套完備的統(tǒng)計建??蚣?,可歸屬于廣義線性回歸類型[27]。對數(shù)線性模型的參數(shù)與前述乘法分量模型的各分量基本有一致的含義和解釋,不再贅述。
圖4 遷出地—年齡交互分量OAix、遷入地—年齡交互分量DAjx演變趨勢
模型(13)包含了全部八個參數(shù),稱為飽和模型,模型(13)的簡化形式稱為不飽和模型,比如不考慮最后三項(其他形式同理),可得到如下模型:
(14)
簡化形式的模型主要目的在于以更少的參數(shù)來擬合和表達(dá)區(qū)域人口遷移流,通過各種簡化形式的模型擬合與比較找出相對簡單的形式來表達(dá)人口流動的空間結(jié)構(gòu),同時也能找出最為關(guān)鍵的參數(shù)或分量。不過任何形式的簡化模型都是非飽和的,即參數(shù)有所縮減,因此,通常會增加一個補償量(偏移量,offset)到非飽和模型中,因此模型(14)通常為:
(15)
需要指出的是,人口遷移流量是非負(fù)的計數(shù)數(shù)據(jù),通常用泊松分布、二項分布等,它們比正態(tài)分布能更好擬合人口遷移流數(shù)據(jù),這在人口遷移的重心模型實證中有很多文獻(xiàn)做了充分的應(yīng)用[17-19],本文以泊松分布進(jìn)行實證擬合。同時模型(15)屬于廣義線性回歸模型范疇,最小二乘法估計存在偏差,一般用極大似然估計能得到無偏估計。本文將擬合飽和模型及各類組合的非飽和模型來識別主要參數(shù),找出既相對簡化又能最大限度擬合人口遷移流矩陣的模型及結(jié)構(gòu)。其中模型的擬合優(yōu)度可以通過極大似然比統(tǒng)計量來判定:
(16)
該統(tǒng)計量越小擬合越好。模型的擬合優(yōu)度還可以通過偽R2(pseudoR2)進(jìn)行判定,該值越大則擬合越好,本文同時給出兩種結(jié)果。
本文以最近的第七次全國人口普查省際之間的人口遷移流重新整理得到中國四大區(qū)域遷移流作為補償量進(jìn)行計算,并放棄人口遷移流正態(tài)分布的假定,采用泊松分布進(jìn)行擬合。由于各個分量的組合類型多達(dá)數(shù)十種,限于篇幅,選擇六個代表性的擬合模型進(jìn)行分析,結(jié)果如表4所示(2)限于篇幅,沒有報告每個模型擬合系數(shù)、標(biāo)準(zhǔn)差等參數(shù),有需要可聯(lián)系作者索取。。擬合模型(1)—(6)分別為[ODOD]、[A]、[ODA]、[ODAOA]、[ODODOADAODA]、[ODAODOADAODA]六個組合模型估計結(jié)果。從擬合系數(shù)來看,除了模型(5)的ODA分量不顯著外其他所有模型參數(shù)均顯著通過1%統(tǒng)計檢驗,應(yīng)該說通過數(shù)據(jù)自生過程得到的分量在擬合人口遷移流量時能得到比較好的效果。不過,從擬合優(yōu)度來看,六個模型的偽R2差距比較大,最差的為0.0752,最優(yōu)的為0.8189,通過比較,說明有影響擬合優(yōu)度的關(guān)鍵參數(shù)。為此,本文給出更多模型的擬合優(yōu)度偽R2,并與G2一起來分析影響擬合優(yōu)度的主要分量,結(jié)果報告于表4。
表4 人口遷移流量擬合的代表性模型
表5 多元分量組合模型的擬合優(yōu)度統(tǒng)計量
同樣,限于篇幅僅給出部分?jǐn)M合優(yōu)度結(jié)果,盡管未窮盡所有參數(shù)可能的組合模型,但是表5給出了14個主要的組合模型擬合優(yōu)度,不影響分析和基本結(jié)論。通過比較14個模型的極大似然比統(tǒng)計量G2和偽R2,發(fā)現(xiàn)年齡主效應(yīng)或者說人口遷移的年齡結(jié)構(gòu)是中國跨區(qū)域人口遷移流的最大影響因素(3)該結(jié)論是基于僅考慮遷出地、遷入地和年齡三個因素的情形下,如果進(jìn)一步考慮出生地、性別、戶籍等可能結(jié)論有所變化,前面已述,鑒于篇幅和描述的復(fù)雜性暫未考慮其他因素。,僅考慮年齡結(jié)構(gòu)主效應(yīng)時G2/df為77.2,偽R2為0.728。同時,其他模型中,當(dāng)加入年齡主效應(yīng)時G2/df越來越小,偽R2越來越大,當(dāng)不加入時則相反,因此年齡主效應(yīng)應(yīng)該是影響擬合優(yōu)度的最關(guān)鍵因素。比較時還發(fā)現(xiàn),OA也是一個較為重要的影響參數(shù),在保持A的情形下,疊加OA也對擬合優(yōu)度有較為明顯的影響。通過擬合優(yōu)度可知,表中[ODAODOADAODA]為最優(yōu)組合,但比較發(fā)現(xiàn),[ODA]、[ODAOA]、[ODADA]、[ODAOD]組合與最優(yōu)相差甚微,因此可用簡化的但擬合優(yōu)度高的模型來指征中國跨區(qū)域人口流動的空間特征,比如[ODAOA]四個參數(shù)基本可以刻畫中國人口遷移結(jié)構(gòu)。
前面已述,關(guān)于人口議題相關(guān)的預(yù)測大多是圍繞總量或趨勢視角,比如人口總量、城鎮(zhèn)化或老齡化等,而關(guān)于人口遷移流矩陣預(yù)測在國內(nèi)還比較罕見。既有研究中,基于雙邊比例調(diào)整方法的人口遷移流矩陣預(yù)測有較多的成功嘗試,也有國內(nèi)學(xué)者預(yù)測了國外人口遷移流。鑒于此,本文結(jié)合國內(nèi)外學(xué)者成果,以雙邊比例調(diào)整方法來預(yù)測我國跨區(qū)域人口遷移流矩陣,并以長江經(jīng)濟帶11省份進(jìn)行實證分析來說明該方法的應(yīng)用。
依據(jù)奈爾(Nair)的研究[22]人口遷移流的雙邊比例調(diào)整基本方程是:
N(t)=ri·N(t-1)·sj
(17)
其中,N(t)為預(yù)測期的人口遷移流矩陣,N(t-1)為基期的人口遷移流矩陣。設(shè)nij(t)是N(t)中的元素,表示從區(qū)域i到j(luò)的人口遷移量;nij(t-1)為基期N(t-1)矩陣中人口遷移量元素。ri和sj為行、列的平衡因子,因此該方法習(xí)慣稱為RAS法,其核心問題是尋找合適的ri和sj即可作出預(yù)測。根據(jù)乘法分量模型(1)相關(guān)邊際總量的定義可知:
∑inij(t)=n+j(t)=sj∑iri·nij(t-1)
(18)
∑jnij(t)=ni+(t)=ri∑jsj·nij(t-1)
(19)
變換即可得到:
sj=n+j(t)/∑iri·nij(t-1)
(20)
ri=ni+(t)/∑jsj·nij(t-1)
(21)
因此,如果能先期給定或預(yù)測邊際總量n+j(t)和ni+(t)的值,則通過迭代方法使上面兩式收斂即可解得ri和sj,也即能預(yù)測出nij(t)。因此,當(dāng)前問題已轉(zhuǎn)換為邊際總量的預(yù)測,而該預(yù)測可借鑒拉莫的處理[14],比如:
(22)
其中,n+j(t-2)、n+j(t-3)為前兩期、前三期的列邊際總量值,行邊際總量值預(yù)測同理。如果考慮年齡,只需對每個年齡段的遷移矩陣做預(yù)測,原理是一致的。依此基于RAS方法的人口遷移流矩陣預(yù)測即可實現(xiàn)。
本文以長江經(jīng)濟帶11省份進(jìn)行實證分析,其中2020年為基期,2010年為前兩期,2000年為前三期,要預(yù)測的是2030年長江經(jīng)濟帶11省份之間的人口遷移流矩陣。2020年人口遷移流量矩陣見表2和表3,限于篇幅2010和2000年人口遷移流量未給出。不過預(yù)測2030年數(shù)據(jù)之前,先給以上預(yù)測模型做檢驗,看是否能有效作出預(yù)測。這里以2010年的遷移流矩陣預(yù)測2020年遷移流矩陣作為檢驗,此時預(yù)測年(2020年)的觀測值及行、列邊際總量值是已知的,因此,可用RAS方法直接預(yù)測,并進(jìn)行觀測值與預(yù)測值的比較,結(jié)果報告于表6。表6中的Panel A部分是2020年長江經(jīng)濟帶跨省人口遷移流矩陣預(yù)測值,Panel B部分是實際值與預(yù)測值之比,比值趨近1則說明實際值與預(yù)測值較為吻合,即預(yù)測較為準(zhǔn)確。從該比值來看,大部分預(yù)測比較準(zhǔn)確,其中江蘇—上海、江蘇—四川、湖北—江蘇、四川—湖南等區(qū)域間遷移流量預(yù)測幾乎完全一致。當(dāng)然也有差距較大的預(yù)測值,比如重慶—湖南遷移流的實際值是預(yù)測值的1.37倍,上?!不者w移流的實際值是預(yù)測值的0.61倍,但這種情況并不多。
表6 長江經(jīng)濟帶2020年跨省人口遷移流矩陣預(yù)測檢驗及2030年預(yù)測矩陣
總體上看,RAS方法能較為準(zhǔn)確地預(yù)測區(qū)域間人口遷移流矩陣。因此,本文用中國人口普查2000、2010和2020年三期數(shù)據(jù)預(yù)測2030年人口遷移流矩陣,其中基期遷移流矩陣為2020年人口遷移流矩陣,得到長江經(jīng)濟帶2030年跨省遷移總規(guī)模約為4526.8萬人。通過總規(guī)模與預(yù)測得到的每個省份遷入比和遷出比測算即可得到11個省份的行、列邊際總量,然后基于RAS方法即可預(yù)測得到2030年長江經(jīng)濟帶跨省人口遷移流矩陣,結(jié)果報告于表6的Panel C部分。比如預(yù)計2030年江西到上海的人口遷移流量約為63.6萬人,而上海到江西的人口遷移流量約為1.8萬人。通過RAS預(yù)測,能夠預(yù)知未來區(qū)域間人口遷移流的交互情況,比起傳統(tǒng)的區(qū)域人口遷移總量預(yù)測有更加豐富的意義,深化了區(qū)域人口結(jié)構(gòu)變化、空間交互聯(lián)系研究的范疇。
人口遷移流動是規(guī)范人口學(xué)研究的重要組成部分,但在中國生育制度的政策影響、老齡化及健康中國建設(shè)背景下,對生育、死亡(健康)的研究比人口遷移的影響要更深遠(yuǎn)。不過在中國即將進(jìn)入人口負(fù)增長時期,人口遷移流動卻表現(xiàn)出更加劇烈的脈動。流動人口規(guī)模急劇增長、空間結(jié)構(gòu)日益復(fù)雜、跨區(qū)域交互流動劇增,已成為我國人口形勢中最引人注目的特點之一。不過,關(guān)于中國的人口遷移流動研究更多地是作為經(jīng)濟社會運行中的一個外生因素,對其本身運行過程的分析還不足,因此,拋開相關(guān)性或因果關(guān)系的視角,從人口統(tǒng)計學(xué)的角度來研究人口遷移流動的內(nèi)生規(guī)律依然有很大價值空間。
本文從人口統(tǒng)計學(xué)視角著手,基于人口遷移流量自我數(shù)據(jù)生成過程來研究我國跨區(qū)域人口遷移流的空間結(jié)構(gòu)議題,重點在于分解人口遷移矩陣的主要成分并進(jìn)行模型表達(dá),基于功能選擇性較強的廣義線性模型進(jìn)行模型擬合并尋找關(guān)鍵人口遷移的結(jié)構(gòu)要素,同時跳出人口總量預(yù)測等傳統(tǒng)視角,對我國人口遷移流矩陣或者說空間結(jié)構(gòu)進(jìn)行了預(yù)測。研究將人口遷移流空間結(jié)構(gòu)的描述、模型表達(dá)和擬合預(yù)測納入一個框架體系,通過整合三階段統(tǒng)一框架的全景式刻畫研究,形成了該議題分析的“基本程式”。應(yīng)該說,本文深化了中國人口遷移研究的范疇,在研究視角和人口統(tǒng)計應(yīng)用研究上有一定的創(chuàng)新性和拓展性?;趯嵶C研究內(nèi)容,得到的結(jié)論和討論主要有以下三方面。
首先,列聯(lián)表是人口遷移流空間結(jié)構(gòu)的良好描述方式,對乘法分量模型的解釋具有很好的作用,更重要的是能表達(dá)相關(guān)乘法分量的數(shù)據(jù)生成過程。乘法分量模型有很好的包容性,能將空間結(jié)構(gòu)(遷出地、遷入地,甚至出生地等)、年齡結(jié)構(gòu)、性別結(jié)構(gòu)等均納入分析框架,盡管增加分量類型會提升模型表達(dá)復(fù)雜程度,但其意義依然相對簡單而豐富,尤其是交互效應(yīng)分量對理解區(qū)域人口遷移流的內(nèi)在結(jié)構(gòu)非常有效。比如遷出地—遷入地交互效應(yīng)分量所表征的區(qū)域間聯(lián)系強度、遷出地—年齡交互效應(yīng)分量和遷入地—年齡交互效應(yīng)分量所反映的空間—年齡差異等,更加深化了對于實證中長江經(jīng)濟帶11省份和中國東部、中部、西部和東北四大區(qū)域的遷移流空間結(jié)構(gòu),也對于解釋現(xiàn)實問題提供了新的有效視角。
其次,對數(shù)線性模型與乘法分量模型本質(zhì)上是一致的,其中對數(shù)線性結(jié)構(gòu)能基于功能選擇性較強的廣義線性模型原理進(jìn)行模型擬合,對于尋找影響人口遷移流量的內(nèi)生關(guān)鍵分量具有重要意義。結(jié)合人口遷移流量數(shù)據(jù)更加符合泊松分布、二項分布等而非正態(tài)分布的事實,本文實證分析發(fā)現(xiàn)中國四大區(qū)域人口遷移流的關(guān)鍵分量是年齡主效應(yīng)A,其次遷出地年齡交互效應(yīng)OA的影響也較為明顯。綜合比較,可用[ODAOA]的簡化模型來指征中國跨區(qū)域人口流動的空間特征,這四個參數(shù)基本可以刻畫中國人口遷移結(jié)構(gòu),擬合程度達(dá)到82%。
最后,關(guān)于人口遷移流矩陣預(yù)測在國內(nèi)還比較罕見,本文基于國外較為成熟的雙邊比例調(diào)整法(又稱RAS法)首次應(yīng)用人口普查數(shù)據(jù)對我國長江經(jīng)濟帶11省份之間的跨區(qū)域人口遷移流進(jìn)行了預(yù)測檢驗,發(fā)現(xiàn)RAS法在人口遷移流矩陣預(yù)測上效果較好,并對2030年該區(qū)域內(nèi)人口遷移流矩陣進(jìn)行了預(yù)測。相比于傳統(tǒng)人口總量的預(yù)測,通過RAS預(yù)測,能夠預(yù)知未來區(qū)域間人口遷移流的交互情況,比起傳統(tǒng)總量預(yù)測有更加豐富的意義,深化了區(qū)域人口結(jié)構(gòu)變化、空間交互聯(lián)系研究的范疇。
綜合以上研究結(jié)論,人口遷移流的空間結(jié)構(gòu)描述、數(shù)據(jù)內(nèi)生過程和模型表達(dá)能豐富人口統(tǒng)計學(xué)理論,其基本原理能夠進(jìn)行延展分析,不局限于區(qū)域?qū)蛹壓腿丝趯W(xué)屬性特征,比如大區(qū)級、省級、地市級之間的人口遷移流,年齡、性別甚至婚姻、戶籍等也均可納入分析。本文的實證分析主要是案例解釋,相關(guān)研究過程完全可以移植、延展。本文研究也有一定的政策意義,比如人口遷移流矩陣預(yù)測對于流動人口的數(shù)量分析、區(qū)域治理、協(xié)調(diào)發(fā)展、資源配置和規(guī)劃提供一定參考??傊?,人口遷移流的深化研究還有廣闊空間,人口空間統(tǒng)計或空間人口學(xué)等理論、實證和政策研究還任重道遠(yuǎn)。