張建軍 孫成金 呂海燕
摘 要:因果推斷一直是經(jīng)濟(jì)學(xué)領(lǐng)域關(guān)注的重點(diǎn),由Fisher創(chuàng)立的對(duì)照試驗(yàn)法是進(jìn)行因果推斷的黃金標(biāo)準(zhǔn),然而,在許多領(lǐng)域,特別是社會(huì)科學(xué)研究中,公共政策很難實(shí)現(xiàn)隨機(jī)對(duì)照試驗(yàn),得到的往往是觀察性數(shù)據(jù)。因此,采用反事實(shí)測(cè)評(píng)技術(shù)獲得對(duì)照組,是解決社會(huì)科學(xué)研究領(lǐng)域因果效應(yīng)問(wèn)題的關(guān)鍵。筆者利用截面數(shù)據(jù)間存在的共同驅(qū)動(dòng)因素,采用逐步回歸方法研究了因果推斷的反事實(shí)測(cè)評(píng)技術(shù),并以河南省公共政策為例,計(jì)算得到了政策執(zhí)行后的凈效應(yīng),為評(píng)估公共政策效應(yīng)提供了量化評(píng)價(jià)方法。
關(guān)鍵詞:因果推斷;公共政策;反事實(shí);逐步回歸;測(cè)評(píng)
中圖分類號(hào):F224.9 ? ? 文獻(xiàn)標(biāo)志碼:A ? ? 文章編號(hào):1003-5168(2022)5-0145-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2022.05.033
The Counterfactual Evaluation Technology Based on Causal Inference
ZHANG Jianjun ? ?SUN Chengjin ? ?LYU Haiyan
(Collage of Information and Management Science of Henan Agricultural University, Zhengzhou 450002,China)
Abstract: Causal inference has always been the focus of attention in the field of economics, The control experiment founded by Fisher is the gold standard for causal inference. However, it is difficult for public policy to realize randomized controlled trials especially in social science research, and the results are often observational data. Therefore, the use of counterfactual evaluation technology to obtain the control group is the key to solve the problem of causal effect in the field of social science research. This paper studies the counterfactual evaluation technology of causal inference based on the common driving factors between cross-sectional data and stepwise regression method. The author calculates the net effect after the implementation of the policy taking the public policy of Henan Province as an example, to provide a quantitative evaluation method for evaluating the policy effect.
Keywords: causal inference;public policy; counterfactual; stepwise regression; evaluation
0 引言
因果效應(yīng)起源于對(duì)新藥治療效果的評(píng)價(jià),后來(lái)被用于評(píng)估公共政策實(shí)施后的效果。因果效應(yīng)的評(píng)估一般采用簡(jiǎn)單差分法,即通過(guò)比較受影響的群體和沒(méi)有受影響群體的差異來(lái)評(píng)估政策效果。然而,由于在對(duì)象選擇上的偏差,計(jì)算的結(jié)果往往與真實(shí)情況存在一定偏差。例如,考察農(nóng)村經(jīng)濟(jì)合作社產(chǎn)生的減貧效應(yīng),對(duì)單個(gè)農(nóng)戶而言,處理效應(yīng)就是參與合作社的收入減去假如沒(méi)有參與合作社的收入。事實(shí)上,參與和不參與只能選其一,所以無(wú)法得到單個(gè)個(gè)體的因果效應(yīng)。Rubin建立了一種潛在結(jié)果模型,即每個(gè)個(gè)體存在兩個(gè)潛在結(jié)果,不同個(gè)體潛在結(jié)果不同,所以可以將潛在結(jié)果視為來(lái)自二維總體的一次隨機(jī)抽樣,處理組總體均值減去對(duì)照組總體均值被定義為平均因果效應(yīng),這樣就從總體期望的角度定義了平均因果效應(yīng)[1]。針對(duì)社會(huì)科學(xué)研究中的因果效應(yīng)問(wèn)題,相關(guān)文獻(xiàn)主要圍繞兩個(gè)方面展開研究。一方面,通過(guò)傾向得分匹配(PSM)消除選擇性偏差,如張淑輝等采用山西省和甘肅省的調(diào)研數(shù)據(jù),基于傾向得分匹配和logit模型,對(duì)參與農(nóng)村新型合作組織的農(nóng)戶收入變化進(jìn)行分析[2];舒揚(yáng)等采用傾向得分方法研究了霧霾是否促進(jìn)旅游消費(fèi)問(wèn)題[3]。另一方面,利用雙重差分法(DID)消除時(shí)間增量影響。該方法借助處理組和對(duì)照組的觀察結(jié)果開展研究,不需要建立處理對(duì)象的反事實(shí)結(jié)果。具體過(guò)程是,先將處理組政策干預(yù)前后的目標(biāo)值差分,但是沒(méi)有消除由于時(shí)間變化而產(chǎn)生的增量影響,再將對(duì)照組也做差分處理,最后,將處理組的差分結(jié)果減去對(duì)照組的差分結(jié)果,這樣就剔除了政策干預(yù)效果中時(shí)間產(chǎn)生的增量。例如,鄧蓉蓉等運(yùn)用雙重差分方法實(shí)證研究了國(guó)家低碳試點(diǎn)對(duì)試點(diǎn)城市碳排放績(jī)效的影響效應(yīng)[4];范紅忠等采用雙重差分方法估計(jì)了高新區(qū)建設(shè)對(duì)城市技術(shù)進(jìn)步的影響[5]。
通過(guò)對(duì)文獻(xiàn)的梳理不難看出,因果推斷已經(jīng)被廣泛應(yīng)用于社會(huì)科學(xué)研究領(lǐng)域的各個(gè)領(lǐng)域,而且越來(lái)越受到政府部門和研究者的重視,但仍存在一些問(wèn)題,如公共政策評(píng)估有時(shí)候只關(guān)注一個(gè)地區(qū)、一個(gè)城市或國(guó)家的干預(yù)效果,此時(shí)其他任何控制個(gè)體都與干預(yù)個(gè)體存在較大差異,無(wú)法通過(guò)匹配的方法確立對(duì)照組。為了解決這一問(wèn)題,筆者通過(guò)合成控制法,借助多元逐步回歸建立了處理對(duì)象的反事實(shí)預(yù)測(cè)模型,并以河南省扶貧公共政策為例進(jìn)一步實(shí)證分析。本研究的先進(jìn)性體現(xiàn)在解決了社會(huì)科學(xué)研究領(lǐng)域因果效應(yīng)推斷中的關(guān)鍵技術(shù)問(wèn)題,建立了政策實(shí)踐效果量化評(píng)價(jià)模型與算法,研究成果將為政策實(shí)踐績(jī)效評(píng)價(jià)提供理論基礎(chǔ)。
1 反事實(shí)測(cè)評(píng)技術(shù)的理論分析
1.1 基本假定
對(duì)于面板數(shù)據(jù),所有橫截面單元之間存在一些共同的驅(qū)動(dòng)因素,盡管它們對(duì)每個(gè)橫截面單元的影響程度可能不同,卻讓同一截面的個(gè)體之間產(chǎn)生相關(guān)性,因此借助這些相關(guān)性,可以建立處理組對(duì)象的反事實(shí)測(cè)評(píng)模型[6]。
模型基本假定如下,設(shè)[y0it]表示沒(méi)有政策干預(yù)下,第i個(gè)單元在t時(shí)刻的結(jié)果,[y1it]表示接受政策干預(yù)的結(jié)果,假定這些潛在結(jié)果的生成過(guò)程為多元因子模型,用式(1)表示。
[y0it=bi′ft+αi+εit(i=1,2,...,N,t=1,2,...,T)] ?(1)
式中:[ft]表示橫截面單元個(gè)體之間隨時(shí)間變化的共同因素向量,[bi′]為不隨時(shí)間變化但可能隨個(gè)體變化的常數(shù),[αi]為個(gè)體固定效應(yīng),[εit]為隨機(jī)擾動(dòng)項(xiàng),滿足[E(εit)=0]。
將[t]時(shí)刻同一截面的[N]個(gè)單元數(shù)據(jù)寫成向量,令[y0t=(y01t,y02t,...,y0Nt)],[α=(α1,α2,...,αN)],[εt=(ε1t,ε2t,...,εNt)],共同因子系數(shù)矩陣[B=(b1,b2,...,bN)],得到方程矩陣形式(2)。
[y0t=Bft+α+εt] ? ? (2)
式(2)表明,個(gè)體結(jié)果由兩部分構(gòu)成:影響所有個(gè)體結(jié)果的事變共同因子[ft],個(gè)體固定效應(yīng)[α]以及個(gè)體擾動(dòng)項(xiàng)[εt]。模型存在一些假設(shè):一是個(gè)體特質(zhì)部分之間是不相關(guān)的,個(gè)體結(jié)果之間的相關(guān)性主要是由共同因子造成的,但是共同因子對(duì)個(gè)體的影響可以不同;二是截面?zhèn)€體數(shù)大于共同因子數(shù),并且除共同因子之外,個(gè)體之間沒(méi)有溢出效應(yīng)。
根據(jù)式(2)基本假定,第i個(gè)單元在t時(shí)刻的處理效應(yīng)定義為:[Δit=y1it-y0it],然而,不能同時(shí)觀察到兩個(gè)潛在結(jié)果[y0it]和[y1it],實(shí)際觀測(cè)結(jié)果[yit=ωity1it+(1-ωit)y0it]。
其中,變量[ωit=]0或1,[ωit=]1表示第i個(gè)單元在t時(shí)刻受到政策干預(yù),否則取0。假設(shè)時(shí)間[T1]之前沒(méi)有政策干預(yù),則容易看出[yit=y0it][(t=1,2,...,T1)],從時(shí)間[T1+1]開始,第[p]個(gè)單元受到政策干預(yù),則[ypt=y1pt][(t=T1+1,...,T)],并且假定其余[N-1]個(gè)單元沒(méi)有受到這一政策的干預(yù),即[yit=y0it][(i=1,...,p-1,p+1,...,N, t=1,...,T)]。
如果能識(shí)別出模型中的[bi、ft]、[αi ],則可以利用該模型預(yù)測(cè)政策干預(yù)后的反事實(shí)結(jié)果。然而,個(gè)體固定效應(yīng)和共同因子都是不可觀測(cè)的,無(wú)法直接估計(jì)干預(yù)組個(gè)體事后的政策效應(yīng)。由于所有個(gè)體受到時(shí)變共同因子的影響,事后共同因子的影響將體現(xiàn)在控制組的觀測(cè)結(jié)果中,故可以從事后控制組的觀測(cè)結(jié)果中反推出時(shí)變因子,并利用事前干預(yù)組觀測(cè)結(jié)果與控制組事前觀測(cè)結(jié)果之間受共同因子影響而造成的相關(guān)關(guān)系,估計(jì)出事后如果干預(yù)組個(gè)體沒(méi)有受到政策干預(yù)的反事實(shí)結(jié)果。政策實(shí)施后,由于潛在結(jié)果[y0pt][(t=T1+1,...,T)]的數(shù)據(jù)缺失,需要對(duì)這一時(shí)期政策沒(méi)有干預(yù)下的數(shù)據(jù)進(jìn)行預(yù)測(cè),利用同一個(gè)橫截面上的單元受到共同因素的驅(qū)動(dòng),基于[T1+1]到[T]時(shí)段沒(méi)有政策干預(yù)的數(shù)據(jù)[yit=y0it][(i≠p)],對(duì)目標(biāo)對(duì)象反事實(shí)結(jié)果進(jìn)行建模,如果模型擬合效果較好,則可以使用該擬合模型對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)測(cè)。
1.2 模型建立
建立最優(yōu)的回歸方程是實(shí)現(xiàn)回歸合成法的關(guān)鍵,這里的最優(yōu)通常指模型中包含所有對(duì)目標(biāo)變量影響顯著的解釋變量,剔除影響不顯著的變量,實(shí)現(xiàn)這一目標(biāo)通常有兩種方法,一種是全子集法;另一種是最優(yōu)子集的變量篩選法。2012年Hsiao提出了一種兩步法,首先,一次選擇[1,2,...,N]個(gè)控制組個(gè)體進(jìn)入模型,利用擬合優(yōu)度值來(lái)選擇模型;然后,利用模型選擇標(biāo)準(zhǔn),選擇最優(yōu)的模型,選擇標(biāo)準(zhǔn)定義為[AIC(p)=T0lne′0e0T0+2(p+2)],其中[p]為模型中包含的控制組個(gè)體數(shù),[e0]為回歸殘差向量。如果有[m]個(gè)控制組進(jìn)入模型時(shí),共需要估計(jì)[CmN]個(gè)模型。從計(jì)算過(guò)程可以看出,該方法屬于全子集法的一種,但是計(jì)算量很大,而且忽視了變量間的多重共線性[7]。
鑒于此,本研究與現(xiàn)有研究文獻(xiàn)不同,采用逐步回歸法代替全子集法,研究社會(huì)科學(xué)領(lǐng)域政策評(píng)估中的反事實(shí)測(cè)評(píng)技術(shù),并以河南省扶貧政策為例進(jìn)行了實(shí)證分析,從定量評(píng)價(jià)視角,為政策效應(yīng)的合理評(píng)估提供理論支撐。
2 反事實(shí)測(cè)評(píng)技術(shù)的應(yīng)用研究
2.1 建立逐步回歸方程
本研究以河南省扶貧政策效應(yīng)為例,基于反事實(shí)測(cè)評(píng)技術(shù)進(jìn)行因果效應(yīng)的實(shí)證分析。首先,選取遼寧省、山東省、廣東省、福建省、江蘇省、浙江省6個(gè)沒(méi)有貧困縣的省份為對(duì)照組控制組,并以河南省農(nóng)村居民純收入為被解釋變量,這六省農(nóng)村居民純收入為解釋變量,基于1978年到2003年時(shí)段數(shù)據(jù),建立數(shù)學(xué)模型,數(shù)據(jù)來(lái)源于河南省統(tǒng)計(jì)年鑒。然后,采用多元線性回歸進(jìn)行分析,結(jié)果發(fā)現(xiàn)解釋變量間存在多重共線性,回歸系數(shù)不滿足顯著性要求。為了解決這一問(wèn)題,本研究引入逐步回歸數(shù)學(xué)模型,逐步回歸是將解釋變量逐個(gè)引入模型,對(duì)入選的變量再進(jìn)行t檢驗(yàn),確保每次引入變量回歸方程中始終包含顯著性變量,最后得到最優(yōu)的解釋變量集。借助SPSS軟件,剔除不顯著變量,得到顯著性檢驗(yàn)結(jié)果,如表1所示。
根據(jù)表1中的檢驗(yàn)結(jié)果,容易得到擬合方程(3)。
[y=7.223+0.712x1-0.227x2+0.332x3] (3)
式中:[y]為河南省農(nóng)村居民人均純收入,[x1]、[x2]和[x3]分別表示山東、浙江和福建的農(nóng)村居民人均純收入。
2.2 政策的因果效應(yīng)
將1978—2003年解釋變量的數(shù)值代入模型,得到各年份河南省農(nóng)村居民人均純收入的擬合值(見(jiàn)圖1),計(jì)算得到平均相對(duì)誤差僅為0.023 53,模型擬合精度較高,因此,可以用該模型預(yù)測(cè)河南省2004—2018年農(nóng)村居民人均純收入的反事實(shí)數(shù)據(jù),并計(jì)算各年份因果效應(yīng),具體結(jié)果見(jiàn)表2。
圖2是2004年以來(lái)河南省農(nóng)村居民人均純收入減去合成河南省人均收入得到的政策效應(yīng),從變化曲線可以看出,河南省扶貧政策效應(yīng)整體呈現(xiàn)平穩(wěn)提升態(tài)勢(shì),并逐步放大,特別是2012到2014年,政策扶貧效應(yīng)變化率最大,出現(xiàn)加速上漲,原因是多方面的,2012年國(guó)務(wù)院發(fā)布了《關(guān)于大力實(shí)施促進(jìn)中部地區(qū)崛起戰(zhàn)略的若干意見(jiàn)》加大了對(duì)中原地區(qū)的政策支持,河南省的經(jīng)濟(jì)發(fā)展迎來(lái)了前所未有的戰(zhàn)略發(fā)展期。2016年河南省連續(xù)發(fā)布了《河南省電網(wǎng)脫貧專項(xiàng)方案》《河南省水利脫貧專項(xiàng)方案》以及《河南省困難殘疾人生活補(bǔ)貼和重度殘疾人護(hù)理補(bǔ)貼實(shí)施辦法》。隨著這些扶貧方案的實(shí)施,2016—2018年河南省的扶貧政策處理效應(yīng)繼續(xù)呈現(xiàn)加速上揚(yáng)。但是,這一政策效應(yīng)在統(tǒng)計(jì)上是否顯著呢?筆者將采用類似于隨機(jī)置換檢驗(yàn)方法,進(jìn)一步證明效應(yīng)評(píng)估在政策上的顯著性。
2.3 政策效應(yīng)的顯著性檢驗(yàn)
為了檢驗(yàn)估計(jì)的政策效應(yīng)是否顯著,參考Abadie等提出的類似于置換檢驗(yàn)的推斷方法[8],從控制組逐一選出作為偽干預(yù)對(duì)象,接著利用同樣的回歸合成控制法計(jì)算政策效應(yīng),可以得到類似于圖3的政策效應(yīng)路徑。對(duì)于控制組的6個(gè)省份,共得到6個(gè)政策效應(yīng)路徑。然后觀察河南省在圖中的分布位置,如果非常極端,說(shuō)明估計(jì)的政策效應(yīng)是顯著的。從圖3中可以看出,福建、山東、廣東和江蘇4個(gè)省份扶貧政策出現(xiàn)負(fù)效應(yīng),而河南省的政策效應(yīng)位于所有路徑分布的極端位置,特別是2014年以后,對(duì)照組中沒(méi)有一個(gè)省份的效應(yīng)路徑在河南省上方,因而,可以否定沒(méi)有政策效應(yīng)的原假設(shè),證明了河南省扶貧政策效應(yīng)是顯著的。
3 結(jié)語(yǔ)
因果效應(yīng)的評(píng)估廣泛應(yīng)用在社會(huì)、教育和健康項(xiàng)目實(shí)踐效果的評(píng)估問(wèn)題上,但是在這些領(lǐng)域很難實(shí)現(xiàn)隨機(jī)對(duì)照試驗(yàn)?;诖?,筆者利用橫截面單元個(gè)體之間隨時(shí)間變化的共同因素,研究了因果效應(yīng)評(píng)估的反事實(shí)測(cè)評(píng)技術(shù),建立了該領(lǐng)域問(wèn)題的量化評(píng)價(jià)模型與算法。并以河南省扶貧公共政策為例,進(jìn)行實(shí)證分析,驗(yàn)證了研究方法的有效性和可行性,研究成果將為政策實(shí)踐績(jī)效評(píng)價(jià)提供理論支撐。
參考文獻(xiàn):
[1] RUBIN D B. Estimating causal effects of treatments in randomized and nonrandomized studies[J]. Journal of Educational Psychology,1974,66(5):688-701.
[2] 張淑輝,沈宇丹,高雷虹.合作經(jīng)濟(jì)組織扶貧的農(nóng)戶收入效應(yīng):基于傾向得分匹配法的實(shí)證分析[J].華東經(jīng)濟(jì)管理,2018,32(9):165-172.
[3] 舒揚(yáng),伍津釗.霧霾污染促進(jìn)了城市旅游消費(fèi)嗎:基于澳門博彩旅游和PSM方法的證據(jù)[J].經(jīng)濟(jì)研究參考,2018(1):30-40.
[4] 鄧蓉蓉,詹晶.低碳試點(diǎn)促進(jìn)了試點(diǎn)城市的碳減排績(jī)效嗎:基于雙重差分方法的實(shí)證[J].系統(tǒng)工程,2017,35(11):68-73.
[5] 范紅忠,陳洲.高新區(qū)建設(shè)推動(dòng)了城市技術(shù)進(jìn)步嗎:基于雙重差分方法的驗(yàn)證[J].金融與經(jīng)濟(jì),2018(5):63-66.
[6] HSIAO C H, STEVE C, SHUI K W. A panel data approach for program evaluation: Measuing the benefits of political and economic integration of Hongkong with mainland China[J].Journal of Applied Econometrics,2012,27(5):705-740.
[7] ALBERTO A, ALEXIS D, JENS H. Synthetic control methods for comparative case studies estimating the effect of california’s tobacco control program[J].Journal of the American Statistical Association, 2010,105(490):493-505.