韓文龍 劉 璐
(西南財經(jīng)大學 經(jīng)濟學院,四川 成都 611130)
教育問題不僅僅關系著創(chuàng)新生產(chǎn)力的發(fā)展,也關乎社會的和諧穩(wěn)定。放眼未來,到2035年中國要基本實現(xiàn)社會主義現(xiàn)代化,中等收入群體比例明顯提高,城鄉(xiāng)區(qū)域發(fā)展差距和居民生活水平差距顯著縮小,到本世紀中葉實現(xiàn)全體人民共同富裕的宏偉目標,則教育應當發(fā)揮社會公平的穩(wěn)定器作用。教育是提高國民素質(zhì)、提高創(chuàng)新能力和發(fā)展生產(chǎn)力的基礎工程,教育對經(jīng)濟發(fā)展有兩方面作用,一是直接對個人收入的提高,二是間接改善社會經(jīng)濟環(huán)境,如教育有助于減少失業(yè)和犯罪[1]。其中教育對個人收入的提高又被稱為教育的回報率,這一指標是激勵個體接受更高教育、產(chǎn)生更多社會正外部性的關鍵因素。研究中國教育回報率尤其是不同教育階段的回報率變動趨勢,對于經(jīng)濟社會發(fā)展具有重要意義。
由于沒有長時段的微觀調(diào)查數(shù)據(jù),中國近幾十年來的教育回報率沒有形成一致的長期估算??紤]到教育成本數(shù)據(jù)難以獲取,本文采用明瑟收入函數(shù)法,使用CHNS①、CLDS②和CGSS③合并后的1991~2016年的數(shù)據(jù),分別對均質(zhì)的年教育回報率、地區(qū)和城鄉(xiāng)教育回報率以及異質(zhì)的不同教育階段回報率的變動趨勢和影響因素進行了分析。在研究方法上,本文在最小二乘法的基礎上,運用了不會損失樣本量的分位數(shù)回歸方法[2],這一方法不僅使回歸結果更為穩(wěn)健,還可以將傳統(tǒng)的個人教育回報率細分為高收入群體、中等收入群體和低收入群體的教育回報率,從而實現(xiàn)了對中國教育回報率影響因素和變動趨勢的結構性分析。
關于教育回報率估計的研究最早興起于國外。共有四大估計方法:(1)20世紀50年代后期的“詳細闡述法”,將回報率定義為在某一時刻上收益流等于成本流的折現(xiàn)率[3]。使用該方法需要事先獲得年齡收入曲線,經(jīng)常表現(xiàn)為對樣本數(shù)據(jù)的鋸齒狀敏感且本身難以獲取。為了克服這一困難,發(fā)展出平滑處理的方式,將相等教育水平的從業(yè)人員按年齡分組回歸,然后再利用該回歸結果建立年齡收入曲線。改良后的這種方法對數(shù)據(jù)量要求很大,且教育投資的內(nèi)部回報率對外設參數(shù)(教育對收入增加的影響程度)非常敏感。(2)20世紀70年代由經(jīng)濟學家雅各布·明瑟(Jacob Mincer)提出的明瑟收入函數(shù)方程,將教育作為一個重要變量,教育變量的系數(shù)就是個人收益率[4]。該函數(shù)中沒有涵蓋教育的個人成本,但是作為一個工資定價模型,它揭示了工作經(jīng)驗、教育年限等因素對工資報酬的影響,從而決定人力資本最佳教育投資水平。盡管這種方法不是數(shù)學意義上的收益率,但憑借其特有的勞動力市場經(jīng)濟含義和簡單易行的方法,成為研究教育回報率使用最廣泛的方法,為此,本文也擬運用這種方法。(3)“捷徑法”,該方法將個人收入用特定教育水平的勞動者的平均收入來代替,在個人收入數(shù)據(jù)難以獲取時有一定意義。(4)加里·貝克爾(Gary S Becker)提出的成本收益法,也被稱為凈現(xiàn)值法[5]。這里教育總成本既包括機會成本也包括直接成本,凈收益是教育潛在收益和教育總成本之差,該方法因難以計算且數(shù)據(jù)難以獲取而很少被用到。
國外學者也注意到不同教育階段對個人教育回報率有著異質(zhì)性的影響。喬治·薩卡羅普洛斯(George Psacharopoulos)運用不同國家數(shù)據(jù)得出,教育的社會回報率隨著教育階段的提高而減少,個人教育回報率除了發(fā)達國家外高等教育回報率不低于中等教育回報率[6]。值得注意的是,這一結論是教育回報率在部分國家的變化情況,并不意味著所有國家的教育回報率隨著教育階段變化的特點都是如此。有學者對尼日利亞的數(shù)據(jù)進行分析研究發(fā)現(xiàn),不管是被雇傭人員還是自我創(chuàng)業(yè)人員,教育回報率都隨著教育水平的提高而增加[7]。中國的教育回報率如何隨教育水平提高而變化以及是否呈現(xiàn)先低后高的規(guī)律值得我們進一步探究。
關于中國教育回報率的研究,早期學者更加關注中國教育回報率的測算及其變動趨勢,尤其是考察九年義務教育普及和大學生擴招政策對教育回報率變動趨勢的影響[8-10]。隨著中國教育回報率研究逐步向著模型精細化方向發(fā)展,學者們更加關注實證分析中的計量偏誤及處理方式[11-12],對于基礎的教育回報率變動趨勢研究成果相對較少,但是近年來出現(xiàn)的大學生就業(yè)難現(xiàn)象和教育無用論的甚囂塵上,中國教育回報率是否不再呈現(xiàn)過去的上升趨勢而出現(xiàn)新的下降趨勢、這種趨勢在不同的教育階段是否存在差異成為亟待解決的理論問題。
有關中國教育回報率的實證研究,最早影響力較大的是李實等估算出的1988年中國教育回報率為3.8%[13],該數(shù)據(jù)樣本來自于中國社會科學院經(jīng)濟研究所收入分配與改革課題組。此后賴德勝又利用該課題組在1995年的大規(guī)模調(diào)查,得到中國教育回報率為5.73%,教育回報率在1988~1995年總體呈現(xiàn)出增長趨勢[14]。后該課題組樣本數(shù)據(jù)發(fā)展成為CHIP數(shù)據(jù)④,李春玲利用該數(shù)據(jù)庫得到2002年中國教育回報率進一步提高到11.4%的結論[15]。有關20世紀末中國教育回報率的研究,也有學者使用國家統(tǒng)計局城鎮(zhèn)入戶調(diào)查數(shù)據(jù),得到教育回報率由1988年的4%上漲到2001年的10.2%[16]。進入21世紀,隨著國內(nèi)微觀調(diào)查數(shù)據(jù)的發(fā)展,對中國教育回報率的實證研究有了進一步的深入,所使用的模型也不僅限于普通最小二乘法(Ordinary Least Squares,簡稱OLS),而是越來越多地使用多層線性模型、工具變量等方法對原有模型進行修正。如范靜波利用CGSS數(shù)據(jù),基于OLS研究發(fā)現(xiàn),教育回報率2003年為9.9%,2005年增長到15.5%,2006年又下降到14.3%,2008年小幅上升為14.6%。值得注意的是,使用同樣的數(shù)據(jù),范靜波基于擴展后的OLS,得出的教育回報率遠低于基于OLS所得數(shù)據(jù)[17]。這也就是說,即使是同一個數(shù)據(jù)庫,使用不同時期的數(shù)據(jù),得到的教育回報率是不具有比較基礎的;同樣的數(shù)據(jù)使用不同計算方法得到的結果,也不能作為教育回報率變動趨勢的依據(jù)。因此,在一個較長的時間維度上,用統(tǒng)一的方法來測算教育回報率及其變動趨勢就顯得尤為重要。CHNS從1989~2011年共進行了十次調(diào)查抽樣,眾多學者利用CHNS數(shù)據(jù)對中國教育回報率進行了分析。鄧峰等利用層次分析法發(fā)現(xiàn),從全國范圍來看,教育收益率從1989~1993年間處于緩慢上升的趨勢,1993~2004年間上升勢頭更加快速,2004~2006年間處于平穩(wěn)狀態(tài),2006~2009年間則出現(xiàn)了回落現(xiàn)象[18]。鐘甫寧等也利用CHNS數(shù)據(jù),基于工具變量模型發(fā)現(xiàn),教育回報率在1988年為2.7%,到2003年增長為6.3%[19]。從以上研究中可以發(fā)現(xiàn),1988~2004年教育回報率呈總體上升趨勢已成為學界共識。對于這一期間教育回報率增長的原因,可以歸納為以下三個:①工資決定機制改革對教育回報率的直接激勵作用;②多種所有制結構改革的影響; ③改革開放后勞動力市場化逐步施行[20-22]。
現(xiàn)有的教育回報率估計模型,大多是以受教育年限作為解釋變量使用明瑟收入函數(shù)模型進行估計,這樣做有一個隱含的假設條件,即教育年限和個人收入被假設為是線性相關關系,個體所受的教育對收入的影響是相同的。但是,現(xiàn)實中不同等級的教育回報率是異質(zhì)的,比如高等教育階段的回報率遠高于義務教育階段。在勞動力市場中,用人單位也往往根據(jù)個人所接受的最高學歷教育而不是總體受教育時間來確定工資水平。學界也將其稱為羊皮紙效應或文憑效應,認為教育具有文憑篩選功能,高等級教育文憑獲得者比低等級教育文憑獲得者有更高的薪酬[23]。國內(nèi)對于各個教育階段的回報率都有研究,但更多的是關注于某個特定的教育階段。雖然也有部分學者對不同教育階段的回報率進行了分析,如婁世艷估算出2005年平均教育回報率為6.18%,小學教育回報率為6.67%,初中教育回報率為4.47%,高中教育回報率為3.86%,大專教育回報率為11.25%,本科教育回報率為13.75%,研究生教育回報率為5.37%[24],但是對不同教育階段教育回報率在長時間內(nèi)的變動趨勢進行對比分析的研究成果較少。
雖然對前期教育回報率的實證研究及其變動原因的研究文獻較多,但是限于微觀數(shù)據(jù)庫數(shù)據(jù)的時間跨度較小,有些研究的時間甚至還是10年前,沒有體現(xiàn)出最新的教育回報率變動趨勢。因此,對于近年來的教育回報率變動趨勢還需要新的數(shù)據(jù)進行驗證,同時,為了使各個年份的結果有比較基礎,選取較長時間跨度的數(shù)據(jù),用相同的方法來分析是十分必要的?;诖?,本文考慮到單個微觀數(shù)據(jù)庫難以達到較長時間的跨度,因而對多個數(shù)據(jù)庫進行了合并處理,使用CHNS、CLDS和CGSS合并后的1991~2016年的數(shù)據(jù),分別對均質(zhì)的年教育回報率、異質(zhì)的不同教育階段回報率、地區(qū)和城鄉(xiāng)教育回報率的變動趨勢和影響因素進行了分析,以期對我國教育回報率近年來的變動趨勢作出一些邊際貢獻。
1974年明瑟提出了著名的明瑟收入函數(shù)。該收入函數(shù)模型采用線性形式簡單有效地解釋了個人教育對個人收入的影響,在研究教育回報率時被廣泛使用。其基本的表達式如下:
ln(Income)=a+b×edu+c1×
(1)
基本的明瑟收入函數(shù)考慮的因素較少,在原有模型中加入其他控制變量,構成擴展的明瑟收入函數(shù)。擴展的模型為如下形式:
ln(Income)=a+b×edu+c1×
(2)
參考現(xiàn)有文獻,本文選取的控制變量Xj主要有性別、城鄉(xiāng)虛擬變量和地區(qū)類別變量。為了避免虛擬變量陷阱,選取女性、農(nóng)村作為基準類別變量,不計入模型的解釋變量中。此時,dj表示的是非基準的虛擬變量相對于基準虛擬變量來講的收入差別,符號為正表示比基準類別收入多,符號為負則說明收入比基準類別少。對于教育回報率這一核心主題來講,加入Xj控制了可能造成偏誤的其他因素,改變了擬合方程的截距項。
為了更符合實際地刻畫各個教育階段的教育回報率,解決非線性問題,本文在傳統(tǒng)年教育回報率的分析基礎上,將原有解釋變量教育年限edu替換為最高學歷diploma這一類別變量。反映各教育階段教育回報率的模型如下:
ln(Income)=a+b×diploma+c1×exp+
(3)
變化后,系數(shù)b含義與之前不同,變?yōu)樽罡呤芙逃A段相比較于基準教育階段而言,在其他條件不變的情況下收入將增加b×100%?;鶞式逃饺Q于diploma這一類別變量,后文將未受過教育作為基準變量,系數(shù)b則體現(xiàn)了獲得某階段教育者相比較于沒有接受正規(guī)教育者收入增加的百分比,盡管形式上仍是線性模型,但卻用類別變量的方式一定程度上解決了異質(zhì)性問題。其余系數(shù)解釋與傳統(tǒng)明瑟教育回報率一致。
回歸分析是在自變量信息確定的情況下,探求因變量的變動規(guī)律,模型對現(xiàn)實的解釋力越強越好,在樣本中表現(xiàn)為模型誤差的最小化。由于正負誤差會抵消,常用誤差取平方后再加總求和最小化(即OLS),或者誤差取絕對值后加總求和最小化(即最小絕對偏差估計量法,Least Absolute Deviation Estimator,簡稱LAD),分位數(shù)回歸屬于LAD方法范疇。
假設條件分布y|X的q分位數(shù)yq(Xi)是X的線性函數(shù),如下所示:
yq(Xi)=Xiβq
(4)
其中,βq就是分位數(shù)回歸偏系數(shù)向量,q是分位數(shù),βq會隨著q的變化而不同。q估計量可由(5)式求得:
(5)
根據(jù)式(4)和式(5)得yq,為ln(Income)q工資收入的對數(shù),Xi代表一系列自變量的向量。q的數(shù)值表示在回歸平面上的數(shù)據(jù)占全體數(shù)據(jù)的百分比,如當q=0.9,則1-q=0.1,表示模型得到的是90%的條件分位數(shù),90%的數(shù)據(jù)分布在回歸平面上,還有10%分布在回歸平面以下。OLS與分位數(shù)回歸的系數(shù)解釋意義有所不同,如在本文中的系數(shù)b,OLS估計式是教育年限或不同教育階段這一自變量對工資收入的平均邊際影響,分位數(shù)回歸估計式是教育年限或不同教育階段這一自變量對工資收入q分位數(shù)的邊際效果。OLS只能提供一個平均數(shù),分位數(shù)回歸卻能提供很多不同分位數(shù)的回歸結果。如果條件分布的形狀隨著解釋變量而變化,不同分位數(shù)回歸的系數(shù)也將不同,這有利于處理數(shù)據(jù)異質(zhì)性問題。此外,分位數(shù)回歸所求的是最小誤差絕對值,相比較于誤差平方和OLS而言,對于異常值的敏感度很低,因而更具有穩(wěn)健性。
本文使用分位數(shù)回歸方法,將傳統(tǒng)的個人教育回報率細分為高收入群體、中等收入群體和低收入群體來研究,正是對應著分位數(shù)回歸中因變量q的不同數(shù)值。值得注意的是,此時因變量是調(diào)查時期個體的收入,高中低收入群體代表的也是個體接受訪問(終點)時期的收入群體情況,而非個體初始時期的群體情況。
教育對社會群體的流動性的影響可以從兩個時點出發(fā)來衡量,一是站在個體的初始點,此時不同群體的個體通過教育可以改變收入從而實現(xiàn)社會階層的流動(例如當高收入群體教育回報率低于低收入群體時,最終的結果既可能是最初高收入群體在個體終點時變?yōu)榈褪杖肴后w;也可能是高收入群體仍為高收入,但相較低收入群體兩者的差距在縮小或擴大);二是站在個體的終點,此時高收入群體的教育回報率低于低收入群體,隱含著如果沒有教育,那么終點處的高收入群體與低收入群體的差距將進一步拉大。從這兩個時點出發(fā),都能說明教育對社會群體流動性的影響,第一種更符合一般的思維方式,但第二種方式在搜集數(shù)據(jù)和處理時更為簡潔,兩者最終都能較好地衡量教育對社會群體流動性的影響。本文采取的是第二種衡量方式。
本文使用了三個微觀調(diào)查數(shù)據(jù)庫共12年的混合截面數(shù)據(jù),分別是CHNS、CGSS和CLDS。由于微觀調(diào)查數(shù)據(jù)庫錄入的是個體的數(shù)據(jù),如能夠統(tǒng)一口徑,可以使不同的數(shù)據(jù)庫相互補充,最大化利用各方資源。關于人力資本方面的微觀數(shù)據(jù)庫合并文章雖然鮮見,但仍不乏成功先例,如李磊等[25]利用CHIP、CHNS、CGSS和CULS⑤最終形成了2000~2009年的混合截面數(shù)據(jù)來研究金融發(fā)展對企業(yè)家精神的影響。本文合并的數(shù)據(jù)庫中,使用年份最多的數(shù)據(jù)庫是CHNS,該調(diào)查分別于1989、1991、1993、1997、2000、2002、2004、2006、2009、2011年進行了十次抽樣調(diào)查。CGSS使用了2013年的數(shù)據(jù),CLDS使用了2012、2014、2016年的數(shù)據(jù)。在這三個數(shù)據(jù)庫中,個體的人口統(tǒng)計特征、就業(yè)狀況、工作收入以及教育狀況等數(shù)據(jù)信息都是可以獲取的。
在本文的模型中,還包括年齡、城鄉(xiāng)、性別、省份、受教育年限等變量。CGSS2013、CLDS2012、CLDS2014和CLDS2016都沒有直接的年齡變量,但是有出生年月信息,本文用調(diào)查時期的年份減去出生年份從而得出每個個體的年齡。CGSS2013、CLDS2012和CLDS2014沒有個體受教育年限這一變量,僅提供了個體接受過的最高教育水平。CHNS1989-1991年的數(shù)據(jù)既提供了教育年限變量,也提供了最高的受教育水平變量。但是CLDS、CGSS和CHNS調(diào)查數(shù)據(jù)中接受過的最高教育水平這一類別變量并不統(tǒng)一,本文以CHNS為標準,將CGSS2013中的受教育程度的13個等級和CLDS2012、CLDS2014和CLDS2016中的11個等級按照最相近原則劃歸為標準的7個等級,然后再通過受教育程度的最高等級生成個體的受教育年限,具體賦值方法如下:未曾受過教育為0年,小學畢業(yè)為6年,初中畢業(yè)為9年,技術學校畢業(yè)為11年,普通高中、中專畢業(yè)為12年,大學??飘厴I(yè)為15年,大學本科畢業(yè)為16年,研究生畢業(yè)為19年。在城鄉(xiāng)控制變量中,CHNS數(shù)據(jù)庫中分為城市和農(nóng)村這一虛擬變量,而CGSS2013的戶籍類型劃分較為細致,包括農(nóng)業(yè)戶口、非農(nóng)業(yè)戶口、藍印戶口、居民戶口、軍籍和沒有戶口七類,本文將農(nóng)業(yè)戶口之外的全部歸為城鎮(zhèn)人口,從而使城鄉(xiāng)控制變量一致。上面三個數(shù)據(jù)庫共涉及29個省(自治區(qū)、直轄市),本文在此基礎上生成了東部、中部、西部三個地區(qū)變量,劃分標準以國家統(tǒng)計局的劃分標準為主,值得注意的是,東北地區(qū)的遼寧被劃為東部地區(qū),吉林和黑龍江被劃分為中部地區(qū)。本文對合并后的樣本進行了如下篩選:①為了真實反映收入與教育的關系,剔除了未滿18歲和超過65歲的個體,這是因為這部分人群存在嚴重的生命周期偏誤,未滿18歲的個體大多還在接受教育,而65歲的人群大多數(shù)已經(jīng)退休,個人收入會比年輕時期有較大幅度的下降;②根據(jù)受訪者對于工作情況的回答對樣本進行了篩選,剔除了未回答的、目前沒有工作的個體樣本;③剔除了其他變量沒有觀察值的個體樣本。
最終,本文一共得到92 125個觀察值,樣本的分布狀況如表1所示。
表1 樣本分布狀況(樣本總量92 125個)
注:12個年份比例之和為1,東部、中部、西部三地區(qū)比例之和為1,地區(qū)類別變量東部、中部和西部由省(直轄市)類別變量產(chǎn)生:東部地區(qū)包括北京、天津、河北、遼寧、上海、江蘇、浙江、福建、山東、廣東10省(直轄市);中部地區(qū)包括黑龍江、吉林、山西、安徽、江西、河南、湖北、湖南8省;西部地區(qū)包括內(nèi)蒙古、廣西、重慶、四川、貴州、云南、陜西、甘肅、青海、寧夏和新疆11省(自治區(qū)、直轄市)。
由表1個體樣本的分布狀況可知,樣本的城鄉(xiāng)、性別比例大致相當,涉及東部、中部和西部共29個省(自治區(qū)、直轄市),時間跨度從1991~2016年長達26年(CHNS數(shù)據(jù)中1989年的數(shù)據(jù)只有周工資,而沒有本文研究的年工資、獎金和其他來自工作的收入這一指標,因而本文選取的數(shù)據(jù)是從1991年開始),數(shù)據(jù)的分布特征能夠較好地代表中國整體的教育回報率狀況。
在被解釋變量選擇上,CHNS數(shù)據(jù)對個人和家庭收入進行了詳細的調(diào)查,在個人收入方面有按件計價的工資、每月工資、農(nóng)林牧副漁等各項收入。在綜合考慮本文的研究內(nèi)容與CGSS2013、CLDS2012、CLDS2014、CLDS2016共有的收入指標,采用年工資、獎金和其他來自工作的收入總和指標作為因變量。與單純采取月工資收入或者是小時工資相比,所選指標能夠一定程度上探測出隱性收入,從而更為準確地衡量教育對個人收入的影響。在研究中國教育回報率的變動趨勢過程中,為避免價格效應對回歸結果造成偏誤影響,本文把1991年作為基準年對被解釋變量進行CPI指數(shù)平減。解釋變量使用了兩種數(shù)據(jù),一是個體回答的最高學歷的類別變量,二是通過個體回答的受教育年限或最高學歷推測出的個體受教育年限。其他變量方面需要注意的是:工作經(jīng)驗這一變量并不是調(diào)查問卷直接獲得的,而是用受訪者的年齡減去教育時間再減去6,使用這一方法來描述工作年限已被普遍使用[26-27]。由于工作經(jīng)驗對收入的影響往往是非線性的,在明瑟收入函數(shù)模型中也會將工作經(jīng)驗的二次項加進來。本文中所使用到的變量統(tǒng)計性描述如表2所示。
表2 變量的統(tǒng)計性描述
本部分在模型設定的基礎上,同時使用OLS和分位數(shù)回歸來分析均質(zhì)的年教育回報率和異質(zhì)的最高等級教育回報率,著重關注教育回報率的影響因素和變動趨勢,然后通過分組回歸進一步探究地區(qū)差異、城鄉(xiāng)差異在教育回報率及其變動趨勢上的不同。主要從兩個方面分析:一是不考慮教育異質(zhì)性的教育年回報率,二是考慮教育異質(zhì)性的不同教育階段的教育回報率。
教育年回報率是以受教育年限作為解釋變量,不考慮不同教育階段對教育回報率的非線性影響,而假設每一年的教育是均質(zhì)的。首先運用OLS估計擴展后的明瑟收入方程,來分析教育回報率的影響因素。然后通過0.15、0.5、0.85三個分位數(shù)回歸進行分析,回歸結果分別代表低收入群體、中等收入群體和高收入群體三類人群教育回報率的變動趨勢,基本回歸結果見表3。
表3 教育年回報率基本回歸結果
注:*、**、***分別代表在10%、 5%和1%的水平上顯著,括號內(nèi)均通過Bootstrap(重復100次)獲得標準誤。
從表3中可以發(fā)現(xiàn),使用中位數(shù)回歸得到的教育回報率與OLS的回歸結果相似,并且在分位數(shù)回歸中,0.85分位數(shù)回歸得到的教育回報率最低,0.15分位數(shù)上得到的教育回報率最高。這意味著,在所有年份的數(shù)據(jù)中低收入群體更能通過教育提高自身收入。基本模型回歸結果中工作經(jīng)驗的系數(shù)顯著為正,工作經(jīng)驗的二次項數(shù)為-0.001,在百分之一的水平上顯著,說明工作經(jīng)驗對于收入而言有正向效應,但其邊際效用是遞減的,這與我們的預期相符。在OLS的回歸分析中,性別虛擬變量的系數(shù)為0.350且在百分之一水平下顯著為正,也就是說,男性相比較于女性而言,在其他條件不變的情況下,工資收入高出35%,分位數(shù)回歸的結果與此差異不大。
以上分析是將所有年份作為混合截面數(shù)據(jù)從而得到了中國20世紀90年代到21世紀初這一時期教育回報率的籠統(tǒng)結果。為了進一步分析在這一期間中國教育回報率的變動趨勢,本文根據(jù)年份進行分組回歸來探究其變動趨勢,也嘗試用時間虛擬變量與受教育年限的交互項加入模型中來探究變動趨勢,交互項的系數(shù)即為相比較于基準年(1991年)教育回報率的增減變動百分比。引入交互項的好處在于不會損失樣本量,但它會使模型變得復雜,出現(xiàn)了嚴重的多重共線性問題,造成大量偏回歸系數(shù)不顯著。由此得到的教育回報率變動趨勢情況如圖1,從圖1中可以看出,教育回報率在2004年以前有顯著上升趨勢,而在2004年以后整體教育回報率不再保持原有的上升態(tài)勢,并且在2006~2011年和2013~2014年出現(xiàn)了下降的新趨勢,2016年又上升到2004年的教育回報率水平,這與鄧峰等[18]用CHNS數(shù)據(jù)估計出來的1989~2004年趨于上升、2006年開始下降的結論大體一致。教育年回報率前期的不斷上升,是因為改革開放后中國勞動力市場分割被打破、流動性不斷增強以及市場經(jīng)濟中產(chǎn)權得到界定和保護,促使受教育者得到更充分的激勵;教育年回報率在2006年后出現(xiàn)的增速放緩甚至下降趨勢,則是因為隨著改革開放的進一步深入,市場對教育的激勵作用增速減緩,加之義務教育階段的普及和高等教育擴招,造成勞動力市場供大于求局面,使得教育年回報率呈現(xiàn)下降趨勢。
在分位數(shù)回歸中,代表低收入群體的年教育回報率趨勢線始終高于代表中等收入群體的中位數(shù)回歸,代表高收入群體的教育年回報率有小幅上升。不過,2016年的回歸結果顯示中低收入群體的教育回報率依然呈增長趨勢,增長率還略高于高收入群體。由此可見,低收入群體更能通過勤奮學習來提高個人收入,教育無論是在改革開放初期還是近幾年都起到了提高社會群體流動性和保障社會穩(wěn)定的作用。
圖1 教育年回報率變動趨勢
我國各地區(qū)經(jīng)濟發(fā)展水平差異大,義務教育普及與高等教育擴招政策也是分地區(qū)、分批次推行的。圖2是使用所有年份數(shù)據(jù)求得的各地區(qū)在OLS和分位數(shù)回歸方法下的偏回歸系數(shù)教育回報率。在OLS回歸方法下,2011年之前中部的教育回報率最高,東部的教育回報率最低。但是2011年之后的教育回報率東部地區(qū)均高于中部地區(qū),而西部地區(qū)教育回報率在2011~2014年間總體呈現(xiàn)出不斷增長的趨勢。有關地區(qū)差異對教育回報率的影響沒有定論,2004年以前大多認為教育回報率西部地區(qū)至少不低于東部地區(qū)[8],但是此后楊穗[28]利用2005年1%人口抽樣數(shù)據(jù)得出,東部地區(qū)的教育回報率比中部地區(qū)高出1.07%,而西部地區(qū)最低。教育回報率的地區(qū)差異及其趨勢變動的原因,有以下幾種可能:①所采用的樣本在每個地區(qū)搜集的比例不一致,尤其是當各個年份在各地區(qū)的樣本采集數(shù)量不一致時,可能會造成結果不準確;②各個地區(qū)生產(chǎn)技術條件、對勞動力的要求不同而導致這種差異。東部地區(qū)的經(jīng)濟發(fā)展水平高于中西部地區(qū),但其教育回報率在2011年以前卻是最低的,這可能與對外開放初期東部地區(qū)發(fā)展以需要廉價勞動力的外貿(mào)型經(jīng)濟為主有關,在2011年以后,隨著東部地區(qū)制造業(yè)的升級,對高等教育人才需求增加,東部地區(qū)教育回報率也不斷上升。而隨著一帶一路倡議的實施,使得西部地區(qū)對高等教育人才的吸引力變大,因而西部地區(qū)教育回報率也在上升。與東部地區(qū)相比較而言,中部地區(qū)和西部地區(qū)教育水平較低,因而在早期教育回報率高于東部地區(qū),但是隨著中西部地區(qū)教育水平與東部地區(qū)差距逐漸縮小,中部地區(qū)的教育回報率也有所下降。
本文也對東部、中部和西部地區(qū)的教育回報率進行了分位數(shù)回歸,從圖2中可以發(fā)現(xiàn),中高收入群體的教育回報率回歸結果相比較于OLS回歸的地區(qū)之間的差異相對較小,而地區(qū)間的差異更多體現(xiàn)在低收入群體。中部地區(qū)低收入群體的教育回報率在2011年以后下降幅度遠超其他收入群體,這與中部地區(qū)人口眾多、經(jīng)濟發(fā)展水平相比東部地區(qū)較低、大量受過教育的個人難以找到報酬豐厚的工作崗位有關。東部地區(qū)高收入群體的教育回報率近年來增長態(tài)勢也要強于其他收入群體,同樣是存在眾多人口的東部地區(qū),卻因為經(jīng)濟發(fā)展水平高,擁有良好教育的勞動力能夠找到收入高的工作崗位,所以東部地區(qū)高收入群體的教育回報率近年來呈現(xiàn)更快的增長趨勢[29]。
圖2 東中西部地區(qū)教育回報率變動趨勢比較圖
早期城市教育回報率高于農(nóng)村教育回報率這一結論被普遍接受[30-31],為探究城鄉(xiāng)教育回報率近年來變動趨勢,本文在OLS的基礎上還進行了分位數(shù)回歸,圖3是城鄉(xiāng)教育回報率的趨勢對比分析圖,從圖3中可以發(fā)現(xiàn),無論是OLS回歸還是分位數(shù)回歸,城市的教育回報率均顯著高于農(nóng)村,這與學界共識一致。2006年之前城市和農(nóng)村的教育回報率都呈現(xiàn)出顯著增長趨勢,2006年以后增長趨勢放緩,個別年份出現(xiàn)下降趨勢,這與前文分析的整體變動趨勢也是一致的。但是到2012年以后,城鄉(xiāng)之間教育回報率的差異發(fā)生了逆轉,農(nóng)村教育回報率大幅提升,考慮到本文合并數(shù)據(jù)庫的特殊性,2011年以前使用的是CHNS數(shù)據(jù),2011年以后則使用了其他數(shù)據(jù)庫,但2012年、2014年和2016年均使用了CLDS數(shù)據(jù),僅僅是比較這三年的數(shù)據(jù),也可以發(fā)現(xiàn)農(nóng)村的教育回報率有了顯著提升,而城市的教育回報率穩(wěn)步不前,甚至略有下降。其中農(nóng)村低收入群體教育回報率增長幅度最大,農(nóng)村中等收入群體增長幅度次之,農(nóng)村高收入群體教育回報率增長幅度最小。造成這種趨勢的原因如下:①早期城市的教育回報率高于鄉(xiāng)村,主要是由于城鄉(xiāng)二元體制造成受過教育的農(nóng)村勞動力難以找到報酬豐厚的工作崗位[18];②2012年后,隨著城鄉(xiāng)戶籍制度改革,農(nóng)村勞動力人口更方便進入城市尋找工作以及中國人口數(shù)量紅利開始逐漸消失,擁有初級和中等教育水平的農(nóng)村低收入群體在城市中的勞動報酬不斷提升,其教育回報率大幅度上升。
圖3 城鄉(xiāng)教育回報率趨勢比較
不同性別個體的年教育回報率存在差異,其變動趨勢見圖4,從圖4中可以發(fā)現(xiàn),女性教育回報率普遍高于男性,在2006年以前兩者都呈現(xiàn)出波動上升的趨勢,而在2006年以后這種增長趨勢消失,與之前整體的、地區(qū)的、城鄉(xiāng)的教育回報率變動趨勢和情況相同。
圖4 教育回報率趨勢的性別差異比較
上文中對教育回報率變動趨勢和影響因素的研究沒有考慮到不同教育階段對收入的回報效應是非線性相關的,下面將把最高學歷這一類別變量作為解釋變量,探尋各個階段教育回報率的變動趨勢。
1.初等教育回報率
本文將小學階段和初中階段,統(tǒng)稱為初等教育階段。初等教育回報率的回歸結果如圖5,盡管大多數(shù)偏回歸系數(shù)均不顯著,但仍可以從1991年、2004年和2012年中的OLS偏回歸系數(shù)中發(fā)現(xiàn)初等教育回報率存在先升后降的趨勢,系數(shù)不顯著與下降的趨勢可能是由于1994年在全國普及義務教育導致的[32]。2004~2012年教育回報率有一個劇烈下降,結合我國九年義務教育的普及,就個人而言,8歲入學、18歲成人后進入勞動力市場,2004~2012年恰好處于第一批九年義務教育個體進入勞動力市場時期,因而受到供求關系的影響導致教育回報率下降。供求關系主要是指到2004年以后,初等教育學歷者供給大于需求;而相應的高等教育人才市場卻十分緊缺,在下文關于中、高等教育變動趨勢中可以發(fā)現(xiàn),2004年中、高等教育回報率呈現(xiàn)突增態(tài)勢。
圖5 初等教育回報率變動趨勢
2.中等教育回報率
中等教育回報率的回歸結果相比較于初等教育顯著性有大幅提高,圖6是中等教育回報率的變動趨勢圖,從圖6中可以發(fā)現(xiàn),從2009年之后教育回報率呈現(xiàn)明顯下降趨勢,一方面這與丁小浩等[33]發(fā)現(xiàn)中等教育回報率(高中)從2002年的13.89%下降到了2009年的13.21%的結論相佐證,另一方面回歸結果還證實中等教育回報率在2012~2014年進一步下降,盡管2016年相比2014年有小幅上升,但原有大幅增長態(tài)勢已經(jīng)消失。分位數(shù)回歸研究發(fā)現(xiàn),在1993~2000年間,低收入群體的教育回報率呈下降趨勢,而高收入群體的教育回報率卻呈現(xiàn)不斷上升趨勢,由此可知,這一時期是我國社會群體流動性變差、教育穩(wěn)定器作用減弱的一個時期。此外,2014年以后中等教育回報率在不同收入群體之間的差距大幅縮小這一新的趨勢出現(xiàn)。
圖6 中等教育回報率變動趨勢
3.高等教育回報率
高等教育回報率一直是社會關注的熱點問題,尤其是近年來大學生就業(yè)難與社會熱衷于上大學的現(xiàn)象并存。1999年開始的大學生擴招導致高等教育學歷人數(shù)不斷增加,高等教育回報率的變化為學界所關注。楊素紅等利用CHNS1991-2011的數(shù)據(jù)分析研究認為,高等教育溢價效應在2000年以后顯著下降[27];但方超采用CHIP1995和CHIP2013兩期截面數(shù)據(jù)分析研究得出,大學本科的教育回報率在1995~2013年增長了三個百分點,而同期研究生的教育回報率則有所下降[34]。對于這兩個相互矛盾的結論,有必要在更長的時間跨度上來考察高等教育回報率的變動趨勢。
高等教育回報率的年份分組回歸結果統(tǒng)計顯著性很好,使用OLS回歸和分位數(shù)回歸,得到高等教育變量的偏回歸系數(shù)即高等教育回報率,其變動趨勢如圖7所示。從圖7中可以發(fā)現(xiàn),2004年以前高等教育回報率呈顯著上升趨勢,但是在2004年以后增長趨勢消失甚至個別年份高等教育回報率在下降。如前所述,造成這一現(xiàn)象的原因可能是,高等教育實行擴招后的首批大學生、研究生進入勞動力市場,造成供大于求的局面,從而使得高等教育回報率下降。這與楊素紅等得出的高等教育回報率變動趨勢開始下降主要體現(xiàn)在2000年以后(相比本文研究得出的下降趨勢主要體現(xiàn)在2004年,開始下降的年份由于模型中選取的控制變量不同而稍有差異)但是后期不再上升的結論是一致的。
圖7 高等教育回報率變動趨勢圖
4.影響因素中考慮不同教育階段的異質(zhì)性
探討城鄉(xiāng)間不同等級的教育回報率情況,OLS回歸以及分位數(shù)回歸結果如表4所示。從表4中可以發(fā)現(xiàn),城市教育回報率遠高于農(nóng)村。其中,在義務教育階段,同樣取得初等教育水平的個體,城市個體的教育回報率是農(nóng)村個體的2.015倍;在中等教育階段,城市個體的教育回報率是農(nóng)村個體的1.826倍;在高等教育階段,城市個體的教育回報率是農(nóng)村個體的1.516倍。尤其值得注意的是,在高等教育回報率中,城市低收入群體教育回報率高于農(nóng)村低收入群體,但農(nóng)村高收入群體教育回報率卻高于城市高收入群體,這意味著城鄉(xiāng)因素對高等教育回報率的影響在高收入群體和中低收入群體中差異較大。
表4 城鄉(xiāng)各教育階段教育回報率對比
注:*、**、***分別代表在10%、 5%和1%的水平上顯著。
目前,學界普遍認為女性的教育回報率普遍高于男性[8],但現(xiàn)有對教育回報率性別差異的分析,大多是將受教育年限作為因變量,較少考慮教育的異質(zhì)性問題。表5是將所有年份的數(shù)據(jù)分為初、中、高等三個教育層次進行分析。OLS回歸中,各個教育階段下,男性的教育回報率均高于女性的教育回報率,該結果與現(xiàn)有女性教育回報率高于男性的結論不同。我們發(fā)現(xiàn),只有在低收入群體中,女性的教育回報率才在各個教育階段高于男性,這意味著社會應當更加關注那些低收入群體的女性教育問題。
表5 性別的各階段教育回報率對比
注:*、**、***分別代表在10%、5%和1%的水平上顯著。
在研究教育回報率變動趨勢時,最嚴重的內(nèi)生性問題便是遺漏能力變量和家庭背景變量。個體能力對個體收入和個體接受教育都有影響,一方面一個能力強、智商高的人讀書更輕松、更愿意選擇去獲取高學歷,另一方面憑借著天生的能力優(yōu)勢也會使其在工作中獲得更高的收入;個體擁有更好的家庭背景,一方面在物質(zhì)生活和家庭氛圍中更有利于其學習和追求更高的學歷,另一方面在找工作中也更容易找到高薪職業(yè)。從此可知,由能力遺漏變量和家庭背景遺漏變量引起的內(nèi)生性問題將會使得教育回報率被高估。分位數(shù)回歸相比較于OLS的均值回歸方法,可以對收入不同分位點的群體進行分別回歸討論,由于不同收入群體涵蓋了不同的能力和家庭背景變量,可以在一定程度上減輕內(nèi)生性問題。對此,考慮到數(shù)據(jù)的可獲得性,本文用CGSS2013的數(shù)據(jù)對OLS和分位數(shù)回歸下的內(nèi)生性問題進行檢驗。得到的回歸結果如表6所示,其中控制的遺漏變量有兩個,一個是用來代表個體能力智商的配偶受教育水平,這是基于人們總是和自己能力相近的人結合在一起即門當戶對的假設,二是用父親的社會地位來代表家庭背景這一遺漏變量。表6中的數(shù)值為該回歸結果下的教育回報率取值,括號內(nèi)的數(shù)字是系數(shù)的標準誤。從表6中可以清晰地看出,控制遺漏變量后,OLS回歸結果、代表低收入群體的0.15分位數(shù)回歸結果和代表高收入群體的0.85分位數(shù)回歸結果都下降了,關于內(nèi)生性問題的存在會高估教育回報率的猜想是正確的。同時我們注意到,代表中等收入群體的0.5分位數(shù)的回歸結果相比較于OLS的回歸結果而言,是否控制遺漏變量對系數(shù)影響不大,也就是說,相比較于傳統(tǒng)的OLS回歸,分位數(shù)回歸的結果在一定程度上可以緩解內(nèi)生性問題。控制遺漏變量的前后,低收入群體得到的教育回報率均高于高收入群體,也證明前文中關于不同收入群體教育回報率比較的分析結果是穩(wěn)健的。
表6 教育回報率穩(wěn)健性分析
注:*、**、***分別代表在10%、 5%和1%的水平上顯著,括號內(nèi)為標準誤。
現(xiàn)有對中國教育回報率變動趨勢的研究,在數(shù)據(jù)上采用時間跨度較短的微觀數(shù)據(jù)庫,不能較好地反映長期趨勢;在研究方法上多采用OLS回歸方法,具有一定的研究局限性。本文使用CHNS、CLDS和CGSS合并后的1991~2016年的數(shù)據(jù),使用分位數(shù)回歸方法分別對均質(zhì)的年教育回報率、地區(qū)和城鄉(xiāng)教育回報率以及異質(zhì)的不同教育階段回報率變動趨勢和影響因素進行了分析,在不損失樣本量的情況下緩解了部分因遺漏個人能力、家庭背景而造成的模型偏誤問題。同時分位數(shù)回歸代表的收入差異,也使得原有單一的個人教育回報率變動趨勢,被細化為高收入群體、中等收入群體、低收入群體的個人教育回報率變動趨勢,使分析結果更具有現(xiàn)實解釋力。
通過對1991~2016年數(shù)據(jù)的分析,可以發(fā)現(xiàn),中國年教育回報率的總體變動趨勢在2004年前教育回報率呈顯著上升趨勢,之后教育回報率增長趨勢放緩,甚至個別年份出現(xiàn)下降趨勢。分地區(qū)來看,東部地區(qū)的教育回報率在2011年前是最低的,2011年后其教育回報率不斷上升;分城鄉(xiāng)來看,城市教育回報率顯著高于農(nóng)村;分性別來看,中等收入群體和高收入群體下,男性的教育回報率均高于女性的教育回報率,只有在低收入群體中,女性的教育回報率在各教育水平階段均高于男性。
針對中國教育回報率變動的研究,我們認為要進一步提高教育的回報率和公平性,第一,在經(jīng)濟發(fā)展的同時,重視教育數(shù)量型資源和質(zhì)量型資源的投入,逐步提高全國勞動者的受教育年限;第二,解決教育資源的地區(qū)性和城鄉(xiāng)之間不均等問題,通過轉移支付和教育質(zhì)量提升使得地區(qū)之間和城鄉(xiāng)之間的教育資源更加均等化,使得中西部地區(qū)和農(nóng)村地區(qū)的勞動者通過提升人力資本獲得更合理的收入;第三,重視對女性的教育,尤其是要提高低收入群體的中西部地區(qū)和農(nóng)村地區(qū)女性的教育水平,使得更多的適齡女性能夠接受更好和時間更長的教育,提高教育中的性別平等度。
注釋:
①CHNS(China Health and Nutrition Survey),中國家庭健康營養(yǎng)調(diào)查。
②CLDS(China Labor-force Dynamics Survey),中國勞動力動態(tài)調(diào)查。
③CGSS(Chinese General Social Survey),中國綜合社會調(diào)查,始于2003年,是我國最早的全國性、綜合性、連續(xù)性學術調(diào)查項目。CGSS系統(tǒng)全面地收集社會、社區(qū)、家庭、個人多個層次的數(shù)據(jù),總結社會變遷的趨勢。
④CHIP(Chinese Household Income Project Survey),中國家庭收入調(diào)查。
⑤ CULS(China Urban Labor Survey),中國城市勞動力調(diào)查,是由中國社會科學院負責組織實施的一項大規(guī)模城市家庭抽樣調(diào)查項目,2001年啟動首輪調(diào)查,每五年開展一次。該調(diào)查旨在全面動態(tài)了解城市家庭生活、就業(yè)和社會保障狀況,通過嚴謹規(guī)范的科學研究為政府相關政策制定提供依據(jù)。