張巍巍,李雪松
(1.中國社會科學(xué)院 社會發(fā)展戰(zhàn)略研究院,北京 100045;2.中國社會科學(xué)院 數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所,北京 100732)
中國高等教育異質(zhì)性回報的變化:1992~2009
——基于MTE方法的實證研究
張巍巍1,李雪松2
(1.中國社會科學(xué)院 社會發(fā)展戰(zhàn)略研究院,北京 100045;2.中國社會科學(xué)院 數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所,北京 100732)
本文基于存在異質(zhì)性時經(jīng)濟(jì)政策微觀效應(yīng)評價的一般理論框架,運用半?yún)?shù)局部工具變量(LIV)估計方法,使用微觀調(diào)查數(shù)據(jù),實證研究了1992~2009年中國高等教育異質(zhì)性回報的變化趨勢。結(jié)果表明,1992年、2000年和2009年任意一個隨機(jī)的個體上大學(xué)的年化平均回報率(ATE)分別為5.5%、9.9%和11.4%,呈現(xiàn)上升趨勢,反映了中國勞動力市場化改革的積極效應(yīng)。
教育回報;教育改革;經(jīng)濟(jì)政策微觀效應(yīng)
教育回報估計是經(jīng)濟(jì)政策微觀效應(yīng)評價方法的熱點應(yīng)用問題。由于缺乏反事實狀態(tài),對教育回報的準(zhǔn)確估計需要克服樣本選擇偏差和個體教育回報異質(zhì)性等一系列問題,理論界和政策界對此進(jìn)行了大量探索。
假定具有個體特征X的個體上大學(xué)時的潛在收入為Y1,僅上高中時的潛在收入為Y0。如果可以同時觀測到這兩種潛在收入,則它們的差異E(Y1-Y0|X=x)即為教育回報。然而,通常情況下,只能觀測到其中一種收入,相應(yīng)的反事實狀態(tài)并不存在。這是各種政策評價方法所面臨的基本問題。
假定S=1表示上大學(xué),S=0表示僅上高中,經(jīng)典計量方法(如OLS)下教育回報為E(Y1|X=x,S=1)-E(Y0|X=x,S=0)。它暗含的假設(shè)是E(Y1|X=x,S=1)=E(Y1|X=x),E(Y0|X=x,S=0)=E(Y0|X=x),即假設(shè)在控制了個體的可觀測特征變量后,那些實際上大學(xué)的人的平均收入等于隨機(jī)選擇一個人如果其上大學(xué)時的收入,那些僅上高中的人的平均收入等于隨機(jī)選擇一個人如果僅上高中時的收入。也即(Y1,Y0)與S相互獨立,在控制了個體的可觀測特征后,個體不會因為對未來潛在收入的比較而做出是否上大學(xué)的選擇,S對Y是外生的。然而,赫克曼(Heckman)[1]等指出,個體會根據(jù)對未來收益的預(yù)期做出是否上大學(xué)的選擇,觀測到的數(shù)據(jù)一般存在著較為明顯的樣本自選擇,(Y1,Y0)與S并不獨立。因此,早期經(jīng)典的計量方法如OLS存在系統(tǒng)性偏差?,F(xiàn)代微觀經(jīng)濟(jì)計量方法,如隨機(jī)實驗、工具變量(IV)和傾向得分匹配(PSM)等,都是在某個方面處理這種由樣本選擇而產(chǎn)生的變量內(nèi)生性問題[2]。
近年來,隨機(jī)受控實驗方法在微觀政策評價領(lǐng)域得到了越來越多的應(yīng)用。它通過對社會實驗過程的設(shè)計和控制,使S的選擇獨立于(Y1,Y0),因此可以得到較為可信的結(jié)果。但是這種方法在實施過程中易于受到干擾,成本較高,經(jīng)濟(jì)學(xué)者在更多情況下只能基于觀測數(shù)據(jù)對教育收益率進(jìn)行估計[3]。
IV方法則是通過尋找準(zhǔn)自然實驗,找出僅影響教育選擇而不對未來潛在收入產(chǎn)生直接影響的變量作為S的工具變量,從而對教育回報進(jìn)行估計。吳要武[4]使用2005年中國人口1%抽樣調(diào)查數(shù)據(jù)樣本中的出生季度作為工具變量對教育回報率進(jìn)行了估計,結(jié)果表明教育回報率在15%左右,IV方法的結(jié)果顯著高于OLS的結(jié)果。
傾向得分匹配方法在國內(nèi)也得到越來越多的應(yīng)用。它假設(shè)給定了個人的傾向得分后,S獨立于(Y1,Y0)。趙西亮和朱喜[5]使用這種方法對全國綜合社會調(diào)查數(shù)據(jù)(CGSS2003)進(jìn)行匹配來估計中國城鎮(zhèn)居民大學(xué)教育收益率。
國內(nèi)在估計教育回報時應(yīng)用最多的是Heckman樣本選擇模型。標(biāo)準(zhǔn)樣本選擇模型通過引入選擇方程刻畫樣本的選擇行為,假設(shè)收入方程和選擇方程的不可觀測變量服從聯(lián)合正態(tài)分布,進(jìn)而引入逆Mills比來消除選擇偏差的影響來估計教育回報。這種方法為眾多應(yīng)用經(jīng)濟(jì)學(xué)者使用經(jīng)濟(jì)結(jié)構(gòu)模型插上了飛翔的翅膀[6]。然而,樣本選擇模型所要求的假設(shè)條件較強(qiáng),鮑威爾(Powell)[7]、市村(Ichimura)[8]等逐漸放松聯(lián)合正態(tài)分布假設(shè),提出用半?yún)?shù)和非參數(shù)方法來刻畫不可觀測因素的影響,得出了較好的結(jié)果。袁誠和張磊[9]則在反事實框架下用樣本選擇模型研究了家庭收入對子女上大學(xué)的收益率的影響。
以上方法都是假設(shè)樣本的教育回報同質(zhì),或是僅用一個參數(shù)(如平均處理效應(yīng)ATE)來度量教育回報。赫克曼和維特拉西爾(Heckman&Vytlacil)[10]、卡內(nèi)羅等(Carneiro et al.)[11]提出并驗證了個體會根據(jù)(外人)不可觀測的因素對未來潛在收益進(jìn)行比較從而做出是否接受教育的選擇。此時,個體教育回報是異質(zhì)的,OLS方法有偏,工具變量法失效,傾向得分匹配方法基于的前提假設(shè)條件①控制了一些特征變量后,是否參與項目的決策與潛在的收入是獨立的。不再成立。赫克曼(Heckman)等基于廣義羅爾(Roy)模型等經(jīng)濟(jì)結(jié)構(gòu)模型,結(jié)合統(tǒng)計學(xué)等領(lǐng)域的政策效應(yīng)評價方法,在比約克倫德和莫菲特(Bjorklund&Moffitt)[12]提出的邊際處理效應(yīng)(MTE)及因本斯和安格瑞斯特(Imbens&Angrist)[13]提出的局部平均處理效應(yīng)(LATE)等概念基礎(chǔ)上,構(gòu)建了以MTE為基石的新的反事實因果分析框架來進(jìn)行更廣義的政策效應(yīng)評價。王海港等[14]在這個框架下研究了珠江三角洲農(nóng)村的職業(yè)培訓(xùn),發(fā)現(xiàn)當(dāng)?shù)氐穆殬I(yè)培訓(xùn)并沒有達(dá)到預(yù)期的效果。許玲麗等[15]使用這種方法研究了中國高等教育擴(kuò)招的效應(yīng)。
本文基于赫克曼(Heckman)等構(gòu)建的處理異質(zhì)性經(jīng)濟(jì)政策微觀效應(yīng)的MTE方法,運用半?yún)?shù)局部工具變量估計方法對中國20世紀(jì)90年代以來三個不同年份(1992年、2000年和2009年)的異質(zhì)性教育回報進(jìn)行了估計,并給出了平均處理效應(yīng)(ATE)、參與者處理效應(yīng)(TT)和未參與者處理效應(yīng)(TUT)等具有較強(qiáng)政策涵義的政策評價參數(shù)的結(jié)果。結(jié)果表明,1992年、2000年和2009年任意一個隨機(jī)的個體上大學(xué)的年化回報率(ATE)分別為5.5%、9.9%和11.4%,呈現(xiàn)上升趨勢,但本世紀(jì)前10年的上升幅度明顯小于上個世紀(jì)90年代的上升幅度。
本文的貢獻(xiàn)之處在于:(1)引入一個以經(jīng)濟(jì)理論為基礎(chǔ)的反事實框架來刻畫樣本選擇問題,并對MTE與異質(zhì)性效應(yīng)的關(guān)系、MTE的參數(shù)和非參數(shù)方法等作了較為深入的闡述;(2)對中國近20年的高等教育回報趨勢進(jìn)行了較為穩(wěn)健的估計。本文余下的內(nèi)容安排如下:第二部分介紹存在異質(zhì)性時經(jīng)濟(jì)政策微觀效應(yīng)評價的廣義Roy模型,在此基礎(chǔ)上引入經(jīng)濟(jì)政策微觀效應(yīng)評價的基石性概念——邊際處理效應(yīng)(MTE);第三部分給出估計MTE的兩種計量方法,即參數(shù)方法與非參數(shù)方法;第四部分為樣本數(shù)據(jù)描述與傾向得分估計;第五部分為中國高等教育異質(zhì)性回報的變化趨勢及其穩(wěn)健性檢驗;第六部分為簡要的結(jié)論。
貝克爾[16]的人力資本理論將大學(xué)教育視為一種投資,大學(xué)教育提高了個人的人力資本(技能和生產(chǎn)率等),因此上大學(xué)的工人的工資水平會提高?;诖嗣魃獱枺?7]發(fā)展了一個經(jīng)典的經(jīng)驗分析方程:
其中Yi為個體i的對數(shù)收入,Si表示是否接受大學(xué)教育,Xi包含工作經(jīng)驗和工作經(jīng)驗平方以及其他一些控制變量。明瑟爾方程已成為估計教育回報的經(jīng)典方程,在經(jīng)驗分析中得到了廣泛的應(yīng)用。
對明瑟爾方程進(jìn)行最小二乘(OLS)估計并不能得到教育回報的無偏估計。甚至當(dāng)不可觀測變量異質(zhì)時,傳統(tǒng)的OLS和IV方法均是無效的,此時須要用基于MTE的方法來刻畫異質(zhì)性的教育回報。
下面簡要給出經(jīng)濟(jì)政策微觀效應(yīng)評價的理論分析框架,即赫克曼和維特拉西爾(Heckman&Vytlacil)[10]發(fā)展的廣義Roy模型。為了實證分析的方便,假設(shè)異質(zhì)性個體的對數(shù)收入模型具有可加性,其形式如下:
其中變量X表示收入方程可以觀測到的變量(解釋變量,如工作經(jīng)驗、性別等),U0和U1表示收入方程中不可觀測的變量,Y1為上大學(xué)時潛在收入的自然對數(shù),Y0為僅上高中時潛在收入的自然對數(shù)。式(2)與(3)是對總樣本而言的,對于上大學(xué)的個體,只能觀測到Y(jié)1,對于僅上高中的個體,只能觀測到Y(jié)0。
個體上大學(xué)時的成本模型為:C=μC(W)+UC。其中W為可觀測的變量,UC為不可觀測的變量。個體根據(jù)預(yù)期收益(IS=Y(jié)1-Y0-C)決定是否上大學(xué)。為表示方便,令Z=(X,W),V=-(U1-U0-UC),則它們可以表示為:
不失一般性,可以考慮μS(Z)>V?FV(μS(z))>FV(V),其中FV(V)是變量V的累積分布函數(shù)。因此,如果定義P(z)為個體特征為z時上大學(xué)的概率(也被稱為傾向得分Propensity Score),則有P(z)=Pr(S=1|Z=z)=FV(μS(Z));定義US=FV(V)(于是US~Unif(0,1)),則不同的US對應(yīng)于不同的不可觀測變量V。因此,便可基于US的均勻分布特征對不同P(Z)的個體的異質(zhì)性教育回報進(jìn)行刻畫。
對于具有特征US=uS,X=x的個體,可以定義邊際處理效應(yīng)(MTE:Marginal Treatment Effect)如下:
它表示具有個體特征和不可觀測因素us的個體,在選擇是否上大學(xué)時處于邊際狀態(tài)①即在選擇是否上大學(xué)時,上大學(xué)與否的效用無差異。的情況下(此時,P(Z)=us),如果上大學(xué)時的教育回報。邊際處理效應(yīng)(MTE)是存在異質(zhì)性時進(jìn)行經(jīng)濟(jì)政策微觀效應(yīng)評價的基石性概念,因為它把個體不可觀測的異質(zhì)性因素V通過累積分布函數(shù)映射到一個服從均勻分布的隨機(jī)變量上,這樣可以方便地刻畫所有個體的異質(zhì)性教育回報。同時,政策決策者感興趣的其它評價參數(shù),如ATE、TT和TUT等,都可以表示為MTE的加權(quán)平均值?;谶@些參數(shù)和OLS估計值,還可以得出分類收益和選擇偏差等參數(shù)[18]。
為了估計上述各種政策效應(yīng)評價的參數(shù),首先要估計邊際處理效應(yīng)(MTE)。對MTE的估計有兩種方法,一種是假定選擇方程和收入方程的隨機(jī)誤差項服從聯(lián)合正態(tài)分布的參數(shù)方法,另一種是半?yún)?shù)的局部工具變量(LIV)方法。
(一)MTE的參數(shù)估計方法
對收入模型(2)和(3),一般假設(shè)μ1(X)和μ0(X)具有線性形式,即:
而對選擇方程(4),可以用Probit、Logit或非參數(shù)方法估計,本文使用Probit模型對其進(jìn)行估計,可以得出P(Z)的估計值。
同理,對式(6)求期望,可得:
對處于臨界狀態(tài)的個體來說,
于是,邊際處理效應(yīng)可以表示為:
(二)MTE的非參數(shù)估計方法
參數(shù)估計方法比較直觀,但需要對隨機(jī)誤差項的分布進(jìn)行假設(shè)。赫克曼和維特拉西爾(Heckman&Vytlacil)[10]發(fā)展的局部工具變量(LIV)方法給出了在更一般的條件下MTE的識別方法。這種方法把不可觀測變量視為傾向得分P(Z)的一個未知函數(shù),通過把P(Z)作為局部工具變量來識別MTE。
赫克曼和維特拉西爾證明了
從上式可以看出,MTE的識別方法是在給定X=x和P(Z)=p的條件下求期望收益表達(dá)式對p的偏導(dǎo)數(shù)。
由式(7)和式(8),有
在給定X=x和P(Z)=p的條件下,對上式求期望,有
對上式求關(guān)于p的偏導(dǎo)數(shù),有
其中,K(p)=E(U0|P(Z)=p)+E(U1-U0|D=1,P(Z)=p)p
(一)樣本數(shù)據(jù)描述
本文使用1992年、2000年和2009年三個年份中國城鎮(zhèn)居民收入與支出調(diào)查數(shù)據(jù)(CUHIES)中6個省份(北京、遼寧、浙江、廣東、四川和陜西)的微觀調(diào)查數(shù)據(jù)(其中1992年為三個省份:遼寧、廣東和四川),對大學(xué)教育回報率進(jìn)行計量估計。三個年份的中國城鎮(zhèn)居民收入與支出調(diào)查樣本都是由國家統(tǒng)計局城鎮(zhèn)經(jīng)濟(jì)社會調(diào)查總隊從全國城鎮(zhèn)居民總體中隨機(jī)抽樣得出,能夠較為全面地反映當(dāng)時全國城鎮(zhèn)居民的經(jīng)濟(jì)情況。本文使用的數(shù)據(jù)既有東部經(jīng)濟(jì)發(fā)達(dá)省份的樣本,也有中西部省份的樣本,它們對全國的教育回報有一定的代表性。CUHIES數(shù)據(jù)包含了被調(diào)查者及其家庭成員的教育情況、收入、所在行業(yè),單位所有制屬性等大量信息。本文所使用三個年份的數(shù)據(jù)分別包含2700戶(1992年),4250戶(2000年)和7718戶(2009年)家庭及其成員的相關(guān)數(shù)據(jù)。本文選取具有高中或大學(xué)學(xué)歷(本科和大專)、正在工作且有母親教育和收入數(shù)據(jù)的個體作為分析樣本。
表1 主要變量描述性統(tǒng)計
表1列示了主要變量的統(tǒng)計指標(biāo)值。三個年份選取的樣本量分別為366、505和860,其中上大學(xué)樣本分別占32.8%、51.3%和80.1%(以下簡稱為大學(xué)組,僅上高中的樣本簡稱為高中組)。樣本的平均年齡分別為26.5歲、26.6歲和29.2歲。本文在匹配母親關(guān)系時,以入戶調(diào)查時戶籍上的關(guān)系來確定母子(女)關(guān)系。因此,有家庭背景數(shù)據(jù)的樣本中男性比例稍高,分別占53.8%、54.9%和58.1%;高中組中男性占比有所增加,三年分為53.7%、56.9%和73.1%,大學(xué)組中男性基本相同,約為54%。數(shù)據(jù)還顯示,不同組別的家庭背景有較大的差異,大學(xué)組中母親的收入和教育年限均高于高中組,且收入差距不斷擴(kuò)大。其中1992年、2000年和2009年大學(xué)組母親的收入分別高于高中組母親收入18個百分點、22個百分點和38個百分點;同時,大學(xué)組母親教育年限分別高于高中組母親教育年限2.07年、1.02年和1.58年。
樣本平均收入快速增長,三個年份分別為2866元、10426元和26656元,其中大學(xué)組分別比高中組的收入高7.00%、48.69%和38.48%①這與用表1中的自然對數(shù)平均收入得出的回報率略有差異。,以大學(xué)平均4年計,則三個年份高等教育的表面年化收益率分別為1.75%、12.17%和9.62%②用簡單算術(shù)平均法得出。。2000年相對于1992年收益率有較大程度的提高,但2009的數(shù)據(jù)則出現(xiàn)了一定程度的下降,這是高等教育回報率變化趨勢的初步經(jīng)驗證據(jù)。個體收入還受其他因素的影響,不同性別、家庭背景、省份、所有制性質(zhì)和行業(yè)的收入均有較顯著的差異。
(二)變量選擇與排除性限制
從表1的描述性統(tǒng)計可以看出,不同組的特征變量有顯著差別。樣本一般根據(jù)這些(可觀測的)變量及外人無法觀測的因素對其教育狀況進(jìn)行“選擇”③這里的“選擇”,既可指個體自己的選擇、父母(家庭)的選擇,也可指高校的選擇(即錄取與否)。。本文選取母親教育年限、母親收入④由于1992年樣本數(shù)據(jù)中母親的收入數(shù)據(jù)較為完整,為保持三個年份估計模型和結(jié)果的一致性,本文僅使用母親收入和教育水平反映家庭背景的影響,其中對母親收入取自然對數(shù)。、性別、出生年份和省份等變量來解釋樣本的教育選擇行為。
許多變量會對個體收入產(chǎn)生影響。參照李雪松和赫克曼[19]以及李實和丁賽[18]等變量的選取,在傳統(tǒng)的Mincer方程的基礎(chǔ)上,本文引入性別、省份、所在行業(yè)和所有制屬性等變量來控制它們對收入的影響。另外,許多不可觀測的因素(例如認(rèn)知能力與非認(rèn)知能力等)會對個體收入產(chǎn)生影響,因此需要盡可能控制這些因素的影響。眾多研究表明家庭背景與個人能力有密切的關(guān)系,本文參照李雪松和赫克曼[19],卡內(nèi)羅、赫克曼和維特拉西爾(Carneiro,Heckman,Vytlacil)[20]中實證模型的設(shè)置,根據(jù)CUHIES數(shù)據(jù)庫中數(shù)據(jù)的可得性,以當(dāng)期母親收入作為個人能力的代理變量,對此加以控制⑤一般來說,樣本處于教育期時其父母的收入對其能力的影響最大,它們之間的關(guān)系最密切,使用這一時期的數(shù)據(jù)可以更好反映父母的影響。限于調(diào)查數(shù)據(jù),本文只能使用當(dāng)期收入,同時為了保持足夠的樣本量,本文使用了母親的收入。。
用半?yún)?shù)方法對廣義Roy模型進(jìn)行估計時,需要進(jìn)行排除性限制,即保證至少有一個變量影響選擇過程,但不對潛在收入產(chǎn)生影響,它在選擇方程中但不在收入方程中⑥如果假設(shè)了不可觀測變量的聯(lián)合分布,從而用參數(shù)方法來估計模型,則不需要這一條件。。關(guān)于教育選擇的工具變量,前人曾用過出生季節(jié)、距離大學(xué)遠(yuǎn)近、大學(xué)學(xué)費、當(dāng)?shù)厥I(yè)率、當(dāng)?shù)仄骄べY等??紤]到樣本中的個體只區(qū)分了所屬省份,而沒有區(qū)分更為細(xì)致的所屬地級或縣級區(qū)域,因此本文無法準(zhǔn)確使用上述這些工具變量。根據(jù)數(shù)據(jù)的可得性,本文把母親教育水平作為個體教育選擇的工具變量。這是因為父母良好的教育水平往往可以使孩子得到較好的教育,從而使二者之間有密切的關(guān)系。
(三)傾向得分估計
本文運用Probit模型來估計個體上大學(xué)的概率,該模型很好地識別了樣本的教育選擇行為,估計結(jié)果列于表2中⑦2000年省份控制變量都不顯著,去掉這個控制變量對Probit模型和下文MTE的估計結(jié)果影響很小,為保持三個年份Probit模型的一致性,此處保留省份控制變量。,括號中的數(shù)值為估計的標(biāo)準(zhǔn)差。估計結(jié)果表明,母親的教育年限對接受大學(xué)教育有重要的影響。性別的估計系數(shù)為負(fù),其中2009年的系數(shù)最大且顯著。這表明女性上大學(xué)的概率要高于男性上大學(xué)的概率,這既與本文使用樣本中女性上大學(xué)樣本占比較高一致,也與全部樣本(未剔除父母數(shù)據(jù)缺失樣本)中女性上大學(xué)樣本占比較高一致。在省份的控制變量中,本文選擇北京為基變量,估計系數(shù)表明,其他條件相同的情況下,其他各省上大學(xué)的概率均低于北京的概率,2009年這種差異更為明顯。
表2 選擇模型估計結(jié)果
圖1分別為三個不同年份大學(xué)組和高中組樣本的傾向得分估計值的概率密度分布。非參數(shù)的LIV方法要在傾向得分匹配的區(qū)間(Relevant support)內(nèi)對MTE進(jìn)行估計,這樣得到的MTE估計值才是有效的。從圖中可以看出,三個年份大學(xué)組和高中組的匹配區(qū)間占了整個(0,1)分布區(qū)間的大部分,因此可以在MTE估計值的基礎(chǔ)上得出其他總體政策評價參數(shù),如TT、ATE和TUT等。
圖1 傾向得分的概率密度
(一)教育回報的估計結(jié)果與變化趨勢
本文分別用OLS方法、IV方法和由Heckman樣本選擇模型發(fā)展而來的半?yún)?shù)的局部工具變量法(LIV)對教育回報率進(jìn)行估計。參照赫克曼和維特拉西爾(Heckman&Vytlacil)[10]、李雪松和赫克曼[19]等,本文在使用IV方法估計教育回報率時選擇傾向得分作為上大學(xué)變量(S)的工具變量。OLS方法和IV估計結(jié)果列示于表3。
OLS估計結(jié)果表明,大學(xué)教育回報率不斷上升,但2009年的升幅較小,三個年份的年化回報率(假設(shè)大學(xué)平均教育年限為4年,由S的估計系數(shù)除以4得出)分別為3.8%、7.7%和8.9%。IV估計結(jié)果大于OLS的估計值。另外,三個年份的IV結(jié)果也表現(xiàn)出相似的趨勢,但2009年的回報率略小于2000年的估計值,三個年份的年化回報率分別為7.4%、17.3%和16.5%。
另外,從OLS估計結(jié)果中還可以得出如下結(jié)論:性別對收入的影響為正,其中2009年系數(shù)顯著,在其他條件相同的情況下,男性的收入比女性高約9.4%。工作經(jīng)驗的系數(shù)符合預(yù)期,工作經(jīng)驗與收入呈倒U型,其中2009年的系數(shù)值較大,且顯著。
LIV的估計結(jié)果表明,MTE向右下傾斜(見圖2),越傾向于上大學(xué)的人,其教育回報越高。樣本數(shù)據(jù)的教育回報表現(xiàn)出明顯的異質(zhì)性。根據(jù)王海港等的論文中介紹的權(quán)重公式對TT、TUT的權(quán)重分別進(jìn)行估計,結(jié)果如圖3所示。TT的權(quán)重曲線向右下傾斜,傾向得分越低的樣本其權(quán)重越大。TUT的權(quán)重曲線向右上傾斜,傾向得分越低的樣本其權(quán)重越小。使用此權(quán)重分別對MTE加權(quán)①本文假設(shè)匹配區(qū)間(Relevant support)的權(quán)重之和為1。因此,此處的ATE、TT和TUT近似等于真值。詳見卡內(nèi)羅、赫克曼和維特拉西爾(Carneiro,Heckman,Vytlacil)等論述。后,可得1992年、2000年和2009年一個隨機(jī)的人上大學(xué)的年化回報率(ATE)約為5.5%、9.9%和11.4%;實際上大學(xué)者的年化教育回報率(TT)為6.0%、11.1%和11.9%;實際僅上高中者如果上大學(xué),其年化教育回報率(TUT)約為5.1%、8.4%和10.2%。從教育回報率變化趨勢上來看,2000年大學(xué)教育回報率較1992年有大幅上升,而2009年的大學(xué)教育回報率較2000年僅有小幅上升,這應(yīng)與1999開始的高等教育大規(guī)模擴(kuò)招、高等教育的專業(yè)設(shè)置與社會及產(chǎn)業(yè)需求嚴(yán)重錯配等因素有關(guān)。
表3 OLS方法與IV估計結(jié)果
續(xù)表
表4為各種政策效應(yīng)參數(shù)的估計值。LIV方法得出的平均處理效應(yīng)均大于相應(yīng)的OLS估計結(jié)果,小于相應(yīng)的IV估計結(jié)果;三個年份估計出的偏差為負(fù),且偏差程度有所增大。OLS低估了大學(xué)教育回報,而IV方法則高估了大學(xué)教育回報。對三個年份均有TT>ATE>TUT,即:大學(xué)組的教育回報率高于高中組的人如果上大學(xué)時的教育回報率,分類收益為正,選擇偏差為負(fù),個體根據(jù)比較優(yōu)勢原理對教育水平做出選擇。
圖2 MTE的半?yún)?shù)局部線性估計(窗寬為0.3)
圖3 參數(shù)ATE、TT、TUT的權(quán)重
表4 各種政策效應(yīng)參數(shù)年化估計結(jié)果對比
續(xù)表
(二)穩(wěn)健性檢驗
本部分給出了是否引入個人能力代理變量、是否控制行業(yè)和所有制性質(zhì)的各種組合下MTE的估計結(jié)果。從圖4、圖5和圖6可以看出,如果不考慮收入方程中個人能力代理變量(母親的收入),MTE曲線會向上大幅移動,其中2000年MTE曲線變?yōu)橄蛴疑蟽A斜①這說明了代理變量對結(jié)果的影響較為嚴(yán)重,忽視代理變量將不能得到準(zhǔn)確的結(jié)果。。圖中“A”代表所有制,“B”代表行業(yè),“C”代表母親收入,“-”代表無控制變量。忽略個人能力代理變量將導(dǎo)致對MTE估計的上偏。從這些圖中還可以看出,如果不對樣本的行業(yè)或所有制性質(zhì)進(jìn)行控制,得出的教育回報結(jié)果也將會上偏。但與忽略個人能力代理變量相比,行業(yè)或所有制性質(zhì)對最終的政策效應(yīng)評價參數(shù)估計值影響較小,在各種情況下,MTE曲線僅是小幅上移。
圖4 1992年不同情景下的MTE估計
本文給出了是否引入個人能力代理變量、是否控制行業(yè)和所有制性質(zhì)等不同組合下各種政策參數(shù)的估計值,結(jié)果列示于表5、表6和表7中。從不同方法的估計結(jié)果對比來看,在各種情況下,OLS的結(jié)果均小于ATE的結(jié)果,同時,ATE的估計結(jié)果又小于IV的估計結(jié)果。從三種方法對不同模型設(shè)置的穩(wěn)健性來看,OLS結(jié)果在各種情況之間較為穩(wěn)健,它們的結(jié)果變化較小。但I(xiàn)V和本文所使用的LIV方法對是否控制個人能力代理變量較為敏感,忽略能力代理將會使結(jié)果產(chǎn)生較大的偏差。
總體來看,在各種情景下均有:(1)OLS<ATE<IV①由赫克曼和維特拉西爾(Heckman&Vytlacil)等,OLS和IV也可以表示為MTE的加權(quán)值。這樣ATE、OLS和IV之間的關(guān)系便可由異質(zhì)性的MTE和ATE、OLS和IV在MTE上的權(quán)重差異所解釋。;(2)MTE表現(xiàn)出明顯的異質(zhì)性;(3)教育回報率不斷上升(OLS1992<OLS2000<OLS2009,ATE1992<ATE2000<ATE2009)。同時,除了2000年忽略個人能力代理變量外,其他各個年份各種情景下MTE曲線均向右下傾斜,越傾向于上大學(xué)的人大學(xué)教育回報率越高。
圖5 2000年不同情景下的MTE估計
圖6 2009年不同情景下的MTE估計
表5 1992年不同情景下的年化估計結(jié)果對比
表6 2000年不同情景下的年化估計結(jié)果對比
表7 2009年不同情景下的年化估計結(jié)果對比
與其他文獻(xiàn)相比,本文1992年的高等教育回報的OLS估計結(jié)果為3.8%,稍高于李實和丁賽的1992年教育回報的估計結(jié)果2.9%。本文2000年的高等教育回報的OLS估計結(jié)果為7.4%,略低于李實和丁賽的1999年教育回報的估計結(jié)果8.1%,也略低于Li[21]等用2002年的雙胞胎數(shù)據(jù)和OLS估計方法得出的教育回報8.4%。本文OLS的估計結(jié)果低于LIV方法得出的估計結(jié)果,主要是由于OLS方法沒有考慮個體教育回報的異質(zhì)性造成的,而不同的估計量賦予MTE的權(quán)重不同。
本文使用1992年、2000年和2009年的CHUIES數(shù)據(jù)估計了中國大學(xué)教育回報率。結(jié)果表明,1992年、2000年和2009年一個隨機(jī)的個體上大學(xué)的年化平均回報率(ATE)分別為5.5%、9.9%和11.4%;實際上大學(xué)者的年化教育回報率(TT)分別為6.0%、11.1%和11.9%;僅上高中者如果上大學(xué),其年化教育回報率(TUT)分別為5.1%、8.4%和10.2%。從教育回報率變化趨勢上來看,2000年大學(xué)教育回報率較1992年有大幅上升,而2009年的大學(xué)教育回報率較2000年僅有小幅上升。
三個年份的MTE均隨向右下傾斜,越傾向于上大學(xué)的人,其教育回報越高;樣本數(shù)據(jù)表現(xiàn)出明顯的異質(zhì)性特征和選擇偏差。OLS低估了大學(xué)教育回報,而IV方法則高估了大學(xué)教育回報。三個年份均有TT>ATE>TUT,即上大學(xué)者的教育回報率高于僅上高中者如果上大學(xué)時的教育回報率,分類收益為正,選擇偏差為負(fù),個體根據(jù)比較優(yōu)勢原理對教育水平做出選擇。
本文的穩(wěn)健性檢驗結(jié)果表明,如果忽略個人能力代理變量(母親的收入)將導(dǎo)致各類政策效應(yīng)評價參數(shù)大幅上偏。忽略行業(yè)或所有制性質(zhì)也將導(dǎo)致各類政策效應(yīng)評價參數(shù)上偏,但上偏幅度很小。總體來看,本文的結(jié)論具有較強(qiáng)的穩(wěn)健性。
本文的估計結(jié)果表明,中國高等教育回報率仍然維持在一個較高的水平上。同時必須注意到,20世紀(jì)90年代以來的勞動力市場化改革極大地提高了大學(xué)的教育回報,但進(jìn)入新世紀(jì)以來,大學(xué)教育回報增長的幅度明顯減小。這與1999開始的高等教育大規(guī)模擴(kuò)招使得大學(xué)畢業(yè)生供給顯著增加、高等教育的專業(yè)設(shè)置與社會及產(chǎn)業(yè)需求錯配等因素密切相關(guān)。加快推動教育改革,解決高等教育供需專業(yè)錯配問題,提高高等教育質(zhì)量,大力發(fā)展職業(yè)技能教育,是當(dāng)前及今后一段時期十分重要和緊迫的任務(wù)。
[1]Heckman J J,Robb R.Alternative Methods for Evaluating the Impact of Interventions[M].New York:Cambridge Univ.Press,1985:10,156-245.
[2]Imbens G W,Wooldridge J M.Recent Developments in the Econometrics of Program Evaluation[J].Journal of Economic Literature,2009,1(47):5-86.
[3]Heckman J J,Vytlacil E J.Econometric Evaluation of Social Programs,Part II:Using the Marginal Treatment Effect to Organize Alternative Economic Estimators to Evaluate Social Programs and to Forecast Their Effects in New Environments[M].Elsevier,2007:6B,4875-5144.
[4]吳要武.尋找阿基米德的“杠桿”——“出生季度”是個弱工具變量嗎?[J].經(jīng)濟(jì)學(xué)(季刊),2010,(2):661-686.
[5]趙西亮,朱喜.城鎮(zhèn)居民的大學(xué)教育收益率估計:傾向指數(shù)匹配方法[J].南方經(jīng)濟(jì),2009,(11):45-56.
[6]Cosslett S R.Distribution-free Maximum Likelihood Estimator of the Binary Choice Model[J].Econometrica,1983,51(3).
[7]Powell J L,Stock J H,Stoker T M.Semiparametric Estimation of Index Ccoefficients[J].Econometrica,1989,57(6):1403-1430.
[8]Ichimura H.Semiparametric Least Squares(SLS)and Weighted SLS Estimation of Single-index Models[J].Journal of Econometrics,1993,58(1-2):71-120.
[9]袁誠,張磊.對低收入家庭子女大學(xué)收益的觀察[J].經(jīng)濟(jì)研究.2009(5):42-51.
[10]Heckman J J,Vytlacil E J.Structural Equations,Treatment Effects and Econometric Policy[J].Econometrica.2005,73(3):669-738.
[11]Carneiro P,Heckman J J,Vytlacil E.Estimating Marginal Returns to Education[J].American Economic Review,2011,101(6):2754-2781.
[12]Bjorklund A,Moffitt R.The Estimation of Wage Gains and Welfare Gains in Self Selection Models[J].The Review of Economics and Statistics,1987,(1).
[13]Imbens G W,Angrist J D.Identification and Estimation of Local Average Treatment Effects[J].Econometrica,1994,62(2):467-475.
[14]王海港,黃少安,李琴,等.職業(yè)技能培訓(xùn)對農(nóng)村居民非農(nóng)收入的影響[J].經(jīng)濟(jì)研究.2009,(9):128-139.
[15]許玲麗,李雪松,周亞虹.中國高等教育擴(kuò)招效應(yīng)的實證分析——基于邊際處理效應(yīng)(MTE)的研究[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2012(11):116-129.
[16]Becker G.Human Capital:a Theoretical and Empirical Analysis with Special Reference to Education[M].New York:Columbia University Press,1964.
[17]Mincer J.Schooling,Experience and Earnings[M].New York:National Bureau of Economic Research,1974.
[18]李實,丁賽.中國城鎮(zhèn)教育收益率的長期變動趨勢[J].中國社會科學(xué),2003,(6):58-72.
[19]李雪松,赫克曼.偏差、比較優(yōu)勢與教育的異質(zhì)性回報:基于中國微觀數(shù)據(jù)的實證研究[J]經(jīng)濟(jì)研究,2004,(4):91-99.
[20]Carneiro P,Heckman J.The Evidence on Credit Constraints in Post-Secondary Schooling The Evidence on Credit Constraints in Post-Secondary Schooling[J].Economic Journal,2002,112(482):705-734.
[21]Li H,Liu P W,Zhang J.Estimating Returns to Education Using Twins in Urban China[J].Journal of Development Economics,2011,(5).
Change of Heterogeneous Return to China’s Higher Education:1992~2009
ZHANG Wei-wei1,LI Xue-song2
(1.National Institute of Social Development of CASS,Beijing 100045,China;2.Institute of Quantitative&Technical Economics of CASS,Beijing 100732,China)
As of counterfactuals missing,problems such as sample selection bias and individual heterogeneity arise when evaluating schooling return.Based on a general micro-effect evaluation framework of economic policy considering heterogeneity,this paper gives an empirical analysis on the trend of china’s higher education return since 1990s using three cross-sectional datasets by semi-parametric estimation.The annualized schooling return rate is 5.5%,9.9%and 11.4%for year 1992,2000 and 2009 respectively,which shows an increasing trend of schooling return and proves the positive effects of China’s labor market reform,but the amplification in the second decade is smaller than that in the first decade.
schooling return;education reform;micro-effect evaluation of economic policy
F224
A
1008-2700(2014)03-0063-14.5
(責(zé)任編輯:姚望春)
2014-03-10
中國社會科學(xué)院哲學(xué)社會科學(xué)創(chuàng)新工程項目《經(jīng)濟(jì)預(yù)測與經(jīng)濟(jì)政策評價》;中國博士后科學(xué)基金面上項目(第55批)
張巍?。?986- ),男,中國社會科學(xué)院社會發(fā)展戰(zhàn)略研究院博士后,研究方向為高級計量經(jīng)濟(jì)學(xué)理論與應(yīng)用;李雪松(1970- ),男,中國社會科學(xué)院數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所研究員,博士,研究方向為經(jīng)濟(jì)預(yù)測與經(jīng)濟(jì)政策評價。