• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      從雙重差分法到事件研究法

      2022-07-13 20:59:50黃煒張子堯劉安然
      關(guān)鍵詞:雙重差分法事件研究法實(shí)證研究

      黃煒 張子堯 劉安然

      關(guān)鍵詞:因果推斷;雙重差分法;事件研究法;實(shí)證研究

      一、引言

      隨著計(jì)量經(jīng)濟(jì)學(xué)“可信性革命”(credibility revolution)席卷經(jīng)濟(jì)學(xué)的各個(gè)領(lǐng)域,基于潛在因果模型的因果效應(yīng)識(shí)別策略,如匹配法(matching)、工具變量法(instrumental variable)、雙重差分法(difference-in-differences)和斷點(diǎn)回歸設(shè)計(jì)(regression discontinuity design)等,逐漸成為了經(jīng)濟(jì)學(xué)等社會(huì)科學(xué)領(lǐng)域?qū)嵶C研究的通行研究范式。上述幾種方法的使用要求和適應(yīng)場(chǎng)景各不相同,雙重差分法由于其直觀清晰、易于理解,并且實(shí)際操作難度較低、上手簡(jiǎn)單等特點(diǎn)而廣為應(yīng)用。圖1展示了中文期刊經(jīng)濟(jì)管理類學(xué)術(shù)論文各類方法的使用數(shù)量變化,可以看到自2015 年后使用雙重差分法的國(guó)內(nèi)經(jīng)濟(jì)管理類研究數(shù)量急劇上升,在2019 年超越工具變量法成為了目前使用最為廣泛的計(jì)量方法,并且其上升趨勢(shì)仍有進(jìn)一步加強(qiáng)的傾向。由此或可推測(cè),在未來(lái)的一段時(shí)期內(nèi),雙重差分法仍然將是經(jīng)濟(jì)管理類實(shí)證研究的主流方法之一。

      雙重差分法在實(shí)證研究中主要用于評(píng)估政策效應(yīng)。與其他方法相比,雙重差分法的識(shí)別方法非常直觀:先觀察受政策影響的個(gè)體在政策前后的變化,再觀察未受政策影響的個(gè)體在政策前后的變化,兩個(gè)變化之間的差異就是政策干預(yù)對(duì)個(gè)體的影響。同時(shí),雙重差分法可以非常方便地使用最小二乘法來(lái)實(shí)現(xiàn)。直觀理解加上簡(jiǎn)單易行使得雙重差分法得到了廣泛應(yīng)用,學(xué)者們使用雙重差分法評(píng)估了許多重要的政策效應(yīng),例如,劉瑞明和趙仁杰(2015)發(fā)現(xiàn)國(guó)家高新區(qū)的建設(shè)顯著地促進(jìn)了地區(qū)經(jīng)濟(jì)增長(zhǎng);呂越等(2019)發(fā)現(xiàn)“一帶一路”倡議促進(jìn)了中國(guó)企業(yè)海外綠地投資;Liu 和Mao(2019)發(fā)現(xiàn)增值稅轉(zhuǎn)型改革顯著提高了企業(yè)投資并改善了生產(chǎn)率;宋弘等(2021)發(fā)現(xiàn)社保法定費(fèi)率下降使得企業(yè)社保繳費(fèi)參與率提高,但削弱了企業(yè)的勞動(dòng)力需求。以上文獻(xiàn)只是大量使用雙重差分法實(shí)證研究中的滄海一粟。

      然而,伴隨著雙重差分法的廣泛使用,一些對(duì)于雙重差分法的不精確理解甚至是錯(cuò)誤認(rèn)識(shí)也逐漸開(kāi)始出現(xiàn)。常見(jiàn)的一些問(wèn)題包括:雙重差分法的基本識(shí)別假設(shè)是什么?雙重差分法需要政策是完全隨機(jī)分配的嗎?平行趨勢(shì)假設(shè)是什么?通常所說(shuō)的平行趨勢(shì)檢驗(yàn)真的是在檢驗(yàn)平行趨勢(shì)假設(shè)嗎?控制變量應(yīng)該如何選?。渴裁礃拥淖兞勘仨毧刂?,什么樣的變量必須不能控制,什么樣的變量可以控制也可以不控制?當(dāng)政策干預(yù)時(shí)點(diǎn)不一致時(shí)雙重差分法應(yīng)該如何實(shí)現(xiàn)?這種實(shí)現(xiàn)方法有什么問(wèn)題,應(yīng)該如何改進(jìn)?等等。實(shí)證研究者在研究過(guò)程中或多或少都曾遇到或?qū)⒁龅缴鲜鰡?wèn)題,但是標(biāo)準(zhǔn)的計(jì)量經(jīng)濟(jì)學(xué)教材中很少直接回應(yīng)這些實(shí)踐方面的疑問(wèn),研究者不得不根據(jù)自身的理解來(lái)處理上述問(wèn)題,這是對(duì)雙重差分法產(chǎn)生不正確理解的原因之一?;诖?,本文結(jié)合國(guó)際上關(guān)于雙重差分法的最新研究,試圖對(duì)雙重差分法應(yīng)用中的一系列問(wèn)題進(jìn)行初步探討,希望能夠幫助廓清一些疑惑,為我國(guó)經(jīng)濟(jì)學(xué)界研究與國(guó)際前沿接軌提供些微貢獻(xiàn)。

      本文的結(jié)構(gòu)如下:第二部分描述雙重差分法的計(jì)量實(shí)現(xiàn),對(duì)研究中常用的幾種雙重差分法進(jìn)行歸納總結(jié),而后著重強(qiáng)調(diào)了雙重差分法的識(shí)別假設(shè)及其直觀含義。第三部分分析雙重差分法使用中的控制變量選取、平行趨勢(shì)檢驗(yàn)的實(shí)現(xiàn)和理解,以及組間線性時(shí)間趨勢(shì)是否控制三個(gè)常見(jiàn)易混淆的問(wèn)題。第四部分討論了近年來(lái)廣泛應(yīng)用的交錯(cuò)雙重差分法的實(shí)現(xiàn)和潛在問(wèn)題,以及如何嘗試使用動(dòng)態(tài)雙重差分法和事件研究法來(lái)克服交錯(cuò)雙重差分法的不足。第五部分討論了雙重差分法評(píng)估政策效應(yīng)時(shí)常見(jiàn)的幾個(gè)問(wèn)題,包括需要重視真實(shí)的制度背景、政策干預(yù)是否需要完全隨機(jī)、溢出效應(yīng)以及一般均衡視角下的成本收益分析。最后是總結(jié)性評(píng)論。

      二、雙重差分法的計(jì)量實(shí)現(xiàn)和識(shí)別假設(shè)

      (一)標(biāo)準(zhǔn)DiD(standard DiD)

      雙重差分是一種嘗試采用控制組實(shí)際未經(jīng)處理的結(jié)果變化作為處理組倘若未經(jīng)處理的結(jié)果變化的反事實(shí)來(lái)分析因果效應(yīng)的方法,通常包括沖擊事件、處理組、控制組和時(shí)期這四個(gè)要素,其經(jīng)典構(gòu)造可以表示為如下形式:

      雙重差分的核心是通過(guò)構(gòu)造交互項(xiàng)來(lái)識(shí)別政策沖擊對(duì)受影響個(gè)體(處理組)的平均處理效應(yīng)(average treatment effect on the Treated,ATT),①即基于一個(gè)反事實(shí)框架來(lái)評(píng)估政策沖擊發(fā)生與不發(fā)生這兩種情況下處理結(jié)果it Y 的變化。真實(shí)的因果效應(yīng)需要通過(guò)比較處理組接受處理與不接受處理的狀態(tài)得出,然而在現(xiàn)實(shí)生活中,當(dāng)沖擊發(fā)生后,我們僅能觀察到處理組受到?jīng)_擊后的情況,無(wú)法真正知曉其未受沖擊的情況。而在雙重差分方法中,控制組提供了一個(gè)可供研究的反事實(shí),即可將未受到處理的控制組在觀察時(shí)期內(nèi)的“變化”近似于處理組倘若未受到?jīng)_擊將發(fā)生的變化。從處理組前后時(shí)期的變化中減去控制組前后時(shí)期的變化,即可得到因果效應(yīng) 。上述分析的數(shù)學(xué)表達(dá)式如下式所示,第一個(gè)中括號(hào)內(nèi)為處理組前后時(shí)期的差分效應(yīng),第二個(gè)中括號(hào)內(nèi)為控制組前后時(shí)期的差分效應(yīng),兩個(gè)一次差分再相減后,得到雙重差分處理效應(yīng):

      (二)雙重差分法的其他形式拓展

      1. 交錯(cuò)雙重差分法(staggered DiD)。標(biāo)準(zhǔn)雙重差分法模型和雙向固定效應(yīng)雙重差分法模型涉及的政策實(shí)施時(shí)點(diǎn)或沖擊發(fā)生時(shí)點(diǎn)為同一時(shí)期。然而,現(xiàn)實(shí)生活中諸多政策實(shí)施未必發(fā)生在某一時(shí)點(diǎn),而是先有試點(diǎn)再逐步推廣,在漸進(jìn)的過(guò)程中推而行之,如增值稅轉(zhuǎn)型、土地確權(quán)、新農(nóng)保實(shí)施、高鐵修建等。交錯(cuò)雙重差分法為處理這類情形提供了方法。②當(dāng)個(gè)體接受政策沖擊的時(shí)間不同時(shí),政策分組虛擬變量i D 變?yōu)閕t D ,此時(shí)it D 即可用來(lái)表示個(gè)體i 在時(shí)間t 處是否受到政策沖擊,而無(wú)需再生成交互項(xiàng)。不過(guò)在實(shí)際應(yīng)用中,交錯(cuò)雙重差分法可能會(huì)遇到難以找到控制組、部分樣本始終為處理組、異質(zhì)性處理效應(yīng)等問(wèn)題。由于交錯(cuò)雙重差分法適用面較廣且使用時(shí)又有諸多需要注意的事項(xiàng),本文將在第四部分詳細(xì)討論這一方法的應(yīng)用與利弊。

      2. 廣義雙重差分法(generalized DiD)。當(dāng)所有研究對(duì)象均或多或少同時(shí)受到了政策干預(yù),即僅有處理組而無(wú)控制組時(shí),仍然能夠考慮應(yīng)用雙重差分法。對(duì)此,可以根據(jù)研究對(duì)象受到的具體沖擊情況來(lái)構(gòu)建處理強(qiáng)度(treatment intensity)指標(biāo)來(lái)進(jìn)行分析,此時(shí)個(gè)體維度并不是從0 到1 的改變,而是連續(xù)的變化。因此,可以將個(gè)體維度的政策分組虛擬變量替換為用以表示不同個(gè)體受政策影響程度的連續(xù)型變量,該種方法被稱為廣義雙重差分法。①Nunn 和Qian(2011)研究了一個(gè)經(jīng)典的例子,他們研究了土豆種植擴(kuò)散對(duì)歐洲人口增長(zhǎng)的影響。歐洲幾乎所有地區(qū)都種植了土豆,不存在未種植土豆的地區(qū),因此沒(méi)有標(biāo)準(zhǔn)意義上的控制組。他們的選擇是將地區(qū)間土豆種植適宜度作為處理強(qiáng)度,以1700 年前后為處理時(shí)點(diǎn),使用廣義雙重差分法估計(jì)了引入土豆對(duì)人口增長(zhǎng)的影響。

      3. 隊(duì)列雙重差分法(cohort DiD)。隊(duì)列雙重差分法也被稱為截面雙重差分法,即使用橫截面數(shù)據(jù)來(lái)評(píng)估某一歷史事件對(duì)個(gè)體的長(zhǎng)期影響。隊(duì)列雙重差分法同樣是比較兩個(gè)維度上的差異大?。阂粋€(gè)維度為地區(qū)間差異,標(biāo)識(shí)該地區(qū)是否受干預(yù)政策影響或干預(yù)強(qiáng)度;另一個(gè)維度為出生隊(duì)列間差異,標(biāo)識(shí)個(gè)體是否受到了干預(yù)政策的影響。隊(duì)列雙重差分法本質(zhì)上是使用未受政策干預(yù)的出生隊(duì)列作為受到政策干預(yù)的出生隊(duì)列的反事實(shí)結(jié)果。Duflo(2001)是早期應(yīng)用隊(duì)列雙重差分法的經(jīng)典研究,近年來(lái)使用這一方法的代表性文獻(xiàn)有Chen 等(2020)的研究文獻(xiàn)。

      4. 模糊雙重差分法(fuzzy DiD)。在標(biāo)準(zhǔn)雙重差分法等方法的應(yīng)用情境中,處理組和控制組之間通常涇渭分明,因此可以通過(guò)分組差分得到較為“干凈”的處理效應(yīng)。但是,有時(shí)沖擊并未帶來(lái)急?。╯harp)變化,所謂的“處理組”中雖然受沖擊率高于其他組別,但并沒(méi)有完全被干預(yù)或受政策沖擊,而所謂的“控制組”中也并非完全沒(méi)有受到?jīng)_擊,即處理組和控制組之間沒(méi)有明確的分野,不存在“干凈”的處理組與控制組。模糊雙重差分法為處理此類情形提供了可能,de Chaisemartin和d’Haultfoeuille(2018)在文章中詳細(xì)介紹了該種方法,并利用該方法重新評(píng)估了印度尼西亞的教育回報(bào)。

      5. 三重差分法(triple differences)。顧名思義,三重差分法引入了第三個(gè)維度“組別”(group),通過(guò)比較不同組別間的處理組和控制組在干預(yù)政策前后結(jié)果變量變化的差異來(lái)識(shí)別因果效應(yīng)。②三重差分法的應(yīng)用場(chǎng)景通常有兩個(gè):一是在平行趨勢(shì)假設(shè)不滿足時(shí)引入第三個(gè)維度的差分來(lái)幫助消除處理組和控制組間的時(shí)間趨勢(shì)差異;二是在平行趨勢(shì)滿足時(shí),用于識(shí)別干預(yù)政策在不同群體間的異質(zhì)性處理效應(yīng)。三重差分法是一個(gè)典型的實(shí)踐先于理論的方法,其使用最早可以追溯到Gruber(1994),近年來(lái)在頂級(jí)期刊使用越來(lái)越頻繁,不過(guò)直到Olden 和M?en(2020)才較為完整地討論了三重差分法的識(shí)別假設(shè)和使用條件。

      6. 其他雙重差分法??v觀上述各種類型的雙重差分法,其基本思路是尋找觀測(cè)樣本在兩個(gè)維度上的差異,其中一個(gè)維度用于控制不可觀測(cè)的時(shí)間趨勢(shì),另一個(gè)維度用于測(cè)度政策效應(yīng)的變化。

      如果從更加一般化的角度理解雙重差分法背后的直覺(jué)和思想,可以發(fā)現(xiàn)事實(shí)上幾乎任何兩個(gè)維度的差異之差異都可以從雙重差分的角度去理解。也就是說(shuō),幾乎所有的交互項(xiàng)模型都可以理解為一種雙重差分法。一個(gè)典型的例子是Mayzlin 等(2014)的研究,他們研究了造假成本對(duì)在線旅店預(yù)定網(wǎng)站的消費(fèi)者評(píng)論的影響。兩家在線酒店預(yù)訂網(wǎng)站中,Expedia 網(wǎng)站只有實(shí)際完成訂單的消費(fèi)者可以評(píng)價(jià)服務(wù)質(zhì)量,而TripAdvisor 網(wǎng)站則是任何人都可以評(píng)價(jià)服務(wù)質(zhì)量,所以兩個(gè)網(wǎng)站的造假成本是不同的。他們發(fā)現(xiàn),當(dāng)一家旅店周圍沒(méi)有其他旅店存在時(shí),該旅店在TripAdvisor 上的好評(píng)率顯著高于在Expedia 上的好評(píng)率,這是因?yàn)樵撀玫暝噲D操縱評(píng)論提高本店評(píng)分。當(dāng)一家旅店旁邊存在另一家鄰近的旅店時(shí),該旅店在TripAdvisor 上的差評(píng)率顯著高于Expedia 上的差評(píng)率,這是各旅店試圖打壓競(jìng)爭(zhēng)對(duì)手,為對(duì)手惡意評(píng)低分。他們的識(shí)別策略事實(shí)上和雙重差分法不謀而合:Expedia 和TripAdvisor 的造假成本構(gòu)成了一個(gè)維度差異,旅店鄰近范圍內(nèi)是否存在直接競(jìng)爭(zhēng)者構(gòu)成了另一個(gè)維度的差異,通過(guò)二者之差就能夠識(shí)別出造假成本對(duì)網(wǎng)站消費(fèi)者評(píng)論操縱的影響。①另一個(gè)例子是Rajan 和Zingales(1998)的研究,該研究試圖論證金融發(fā)展對(duì)經(jīng)濟(jì)增長(zhǎng)的影響。他們使用的一個(gè)識(shí)別策略是交互項(xiàng)模型:被解釋變量是k 國(guó)j 行業(yè)的增長(zhǎng)率,解釋變量是j 行業(yè)的外部融資依賴度和k 國(guó)的金融發(fā)展程度的交互項(xiàng)。其背后的直覺(jué)如下:若金融發(fā)展確實(shí)能夠促進(jìn)經(jīng)濟(jì)增長(zhǎng),那么j 行業(yè)的外部融資依賴度越高,金融發(fā)展對(duì)其經(jīng)濟(jì)增長(zhǎng)的激勵(lì)越強(qiáng)。因此,如果不同行業(yè)間的外部融資依賴程度差異(第一個(gè)維度)和金融發(fā)展水平的跨國(guó)差異(第二個(gè)維度)能夠解釋不同國(guó)家行業(yè)間的增長(zhǎng)率差異,就能夠論證金融發(fā)展對(duì)經(jīng)濟(jì)增長(zhǎng)的影響。②

      (三)雙重差分法的識(shí)別假設(shè)

      雙重差分法的應(yīng)用需要滿足一定的假設(shè)條件,倘若違背了這些前提假設(shè),估計(jì)結(jié)果可能會(huì)嚴(yán)重偏離真實(shí)的因果效應(yīng)。本部分對(duì)雙重差分法的識(shí)別假設(shè)內(nèi)容及可能違背假設(shè)的情景、后果進(jìn)行討論。

      1. 平行趨勢(shì)假設(shè)。雙重差分法最基本的假設(shè)是平行趨勢(shì)假設(shè)(parallel trend assumption),又稱共同趨勢(shì)假設(shè)(common trend assumption),是指倘若處理組個(gè)體未接受干預(yù)或沖擊,則其結(jié)果變動(dòng)趨勢(shì)與控制組個(gè)體結(jié)果變動(dòng)趨勢(shì)相同。該假設(shè)數(shù)學(xué)表達(dá)如下:

      由上述分析可知,雙重差分法要求在沒(méi)有干預(yù)或處理的情況下,處理組和控制組的平均結(jié)果隨時(shí)間變化的趨勢(shì)相同。該識(shí)別假設(shè)可以記為更簡(jiǎn)便的形式:雙重差分法背后隱含著“準(zhǔn)自然實(shí)驗(yàn)”的思想,并不嚴(yán)格要求處理組與控制組之間滿足隨機(jī)分組條件。實(shí)際上,雙重差分法所要求的“隨機(jī)分組”,是指結(jié)果變量的變動(dòng)趨勢(shì)獨(dú)立于政策沖擊,即關(guān)于Y 0滿足隨機(jī)分組條件。需要強(qiáng)調(diào)的是,這一識(shí)別假設(shè)和我們通常所說(shuō)的隨機(jī)分組是不同的,一般意義上的隨機(jī)分組要求處理狀態(tài)和潛在結(jié)果不相關(guān),即(Y0|D=1) (Y0|D=0),顯然,該識(shí)別假設(shè)和雙重差分法要求的潛在結(jié)果差分意義上的隨機(jī)分組有區(qū)別。假使處理組與控制組滿足隨機(jī)分組原則,那么便近似于隨機(jī)對(duì)照試驗(yàn)(randomized controlled trial,RCT),處理組與控制組的結(jié)果對(duì)比便是處理效應(yīng),無(wú)需再使用雙重差分法。

      這里需要說(shuō)明一個(gè)問(wèn)題:雙重差分法作為一種計(jì)量模型,其本身解決內(nèi)生性問(wèn)題嗎?答案應(yīng)該是否定的。事實(shí)上,雙重差分法是一個(gè)估計(jì)量,更是一種研究設(shè)計(jì)。作為估計(jì)量的雙重差分法,估計(jì)的是處理組和控制組的結(jié)果變量在干預(yù)前的組間均值差異和干預(yù)后的組間均值差異,即差異之差異。然而,這個(gè)估計(jì)量是否能夠正確識(shí)別我們關(guān)心的因果效應(yīng),取決于識(shí)別假設(shè)式(2)是否成立。更為嚴(yán)謹(jǐn)?shù)恼f(shuō)法是,在滿足識(shí)別假設(shè)的前提下雙重差分法能夠正確識(shí)別因果效應(yīng),而式(2)經(jīng)過(guò)簡(jiǎn)單的變形可以發(fā)現(xiàn),它實(shí)際上就是雙重差分環(huán)境下的外生性假設(shè)。所以,作為估計(jì)量的雙重差分本身并沒(méi)有解決內(nèi)生性問(wèn)題,而是“假設(shè)”不存在內(nèi)生性問(wèn)題。而作為一種研究設(shè)計(jì),雙重差分法可以追溯至19 世紀(jì)中期物理學(xué)家John Snow 對(duì)倫敦霍亂成因的研究(Snow,1855),①Card 和 Krueger(1994)關(guān)于最低工資的早期研究也采用類似的設(shè)計(jì)思想。②如果沒(méi)有研究設(shè)計(jì)的“雙重比對(duì)”的想法,是不會(huì)產(chǎn)生雙重差分法這一估計(jì)量的。事實(shí)上,是在有了雙重對(duì)比的研究設(shè)計(jì)后,我們使用雙重差分這一估計(jì)量來(lái)捕捉所關(guān)心的具體的因果效應(yīng)。然而,當(dāng)下一些使用雙重差分法的實(shí)證研究將估計(jì)量與研究設(shè)計(jì)二者等同起來(lái),似乎有了這個(gè)估計(jì)量,就自然而然有了對(duì)應(yīng)的研究設(shè)計(jì),就可以直接避開(kāi)內(nèi)生性問(wèn)題,這是不正確的。雙重差分法解決內(nèi)生性問(wèn)題,本質(zhì)上仍然依賴于干預(yù)或政策沖擊本身的外生性。

      從處理組前后兩期結(jié)果的變化中減去控制組的兩期結(jié)果的變化,其實(shí)質(zhì)是去除共同趨勢(shì)的影響,從而得到“干凈”的政策效果。需要注意的是,嚴(yán)格來(lái)說(shuō),共同趨勢(shì)假設(shè)是無(wú)法被完全檢驗(yàn)的。

      文章中的做法通常是檢驗(yàn)處理組和控制組的事前平行趨勢(shì),然而,沖擊發(fā)生前變化平行并不能保證今后依然平行。倘若政策沖擊并不隨機(jī),而是會(huì)被某因素X 所影響,那么X 在決定干預(yù)是否發(fā)生的同時(shí),也很有可能會(huì)影響共同趨勢(shì)的變化。因此,盡管雙重差分法不要求處理組與控制組在各方面相似,但如果一些與結(jié)果變量相關(guān)的預(yù)處理特征在處理組和控制組之間不平衡,那么研究對(duì)象很有可能不滿足共同趨勢(shì)假設(shè)。通常我們?nèi)匀幌M幚斫M和控制組之間較為相似,此時(shí)可以去檢驗(yàn)關(guān)鍵控制變量的差異,或者嘗試與匹配方法相結(jié)合等。其中,匹配方法可作為非參數(shù)估計(jì)手段,也可以作為一種數(shù)據(jù)預(yù)處理手段。雙重差分法本身近似于一種差分意義上的匹配方法。③倘若處理組和控制組之間存在明顯差異,那么通常要選取不同的控制組來(lái)進(jìn)行穩(wěn)健性檢驗(yàn)。此外,如果處理組和控制組在處理前后存在成分變化(compositional changes),這意味著政策可能具有很強(qiáng)的內(nèi)生性,通常難以滿足共同趨勢(shì)假設(shè),在該種情況下,要慎重使用雙重差分法。

      雙重差分法中除去政策、時(shí)間等兩個(gè)維度的變量外,還可以再加入其他變量進(jìn)行控制,即在模型中加入控制變量it W 。然而,在實(shí)際回歸操作中,具體應(yīng)當(dāng)加入什么控制變量、哪些變量不能被控制、是否要加入線性趨勢(shì)等問(wèn)題需要格外留意。本文將在第三部分對(duì)此展開(kāi)討論。

      2. 單位處理變量值穩(wěn)定假設(shè)(SUTVA)。單位處理變量值穩(wěn)定假設(shè)(stable unit treatment valuesassumption,SUTVA)是指不同個(gè)體是否受到政策沖擊是相互獨(dú)立的,某一個(gè)體受政策沖擊的情況(treatment status)不影響任何其他個(gè)體的結(jié)果。直觀理解,不滿足SUTVA 意味著控制組個(gè)體也受到了干預(yù)政策的影響,因而不再是事實(shí)上未受干預(yù)影響的“真實(shí)”控制組,也就無(wú)法使用控制組時(shí)間趨勢(shì)來(lái)構(gòu)建處理組時(shí)間趨勢(shì)的反事實(shí)。在理想情況下,處理組和控制組被嚴(yán)格區(qū)分開(kāi)來(lái),彼此互不干涉,然而,在現(xiàn)實(shí)生活中,相當(dāng)多的政策沖擊具有一定的外部性,例如加強(qiáng)上游省份水污染企業(yè)的環(huán)境督查也會(huì)有利于改善下游省份水質(zhì)。此外,個(gè)體的行為也往往具有一定的策略性和選擇性,如處理組地區(qū)得到了較好的政策幫扶,那么原本控制組地區(qū)的個(gè)體可能會(huì)自發(fā)從控制組地區(qū)遷移至處理組地區(qū),意味著宏觀上非政策目標(biāo)地區(qū)也受到了干預(yù)政策的影響,這就是通常所說(shuō)的一般均衡效應(yīng)(general equilibrium effect)或溢出效應(yīng)(spillover effect)。一般均衡效應(yīng)或溢出效應(yīng)會(huì)使得SUTVA 不再成立,進(jìn)而導(dǎo)致雙重差分法無(wú)法正確識(shí)別因果效應(yīng)。Butt(s 2021)在Callaway和Sant’Anna(2020)研究基礎(chǔ)上采用事件分析法對(duì)這類溢出情況進(jìn)行了處理。

      三、雙重差分方法中需要注意的具體問(wèn)題

      (一)控制變量

      在回歸方程中加入控制變量起到兩個(gè)作用。第一,保證條件獨(dú)立假設(shè)(conditional independenceassumption,CIA)成立。①條件獨(dú)立假設(shè)成立意味著給定控制變量時(shí)處理變量i D 與誤差項(xiàng)it 不相關(guān),從而保證了OLS 估計(jì)量b 是我們所關(guān)心的因果效應(yīng) 的一致估計(jì)。這是觀測(cè)性研究的因果推斷中控制變量所發(fā)揮的最核心作用。第二,減小誤差,提高估計(jì)精度。如果處理變量i D 與誤差項(xiàng)it 已經(jīng)不相關(guān),無(wú)論是否加入控制變量,b 都是因果效應(yīng) 的一致估計(jì)。此時(shí)加入合理的控制變量可以降低誤差從而提高估計(jì)精度。

      Cinelli 等(2021)將控制變量分為三類。第一類控制變量是為了保證CIA 成立而控制的變量(稱為好控制變量,good control),必須在回歸方程中加以控制。由于這類變量既影響it Y 又影響i D ,不控制這類變量會(huì)導(dǎo)致明顯的“遺漏變量”問(wèn)題,從而使得OLS 估計(jì)系數(shù)b 不是因果效應(yīng) 的一致估計(jì),這是觀測(cè)性實(shí)證研究面臨的最大挑戰(zhàn)。以常用的面板數(shù)據(jù)為例,首先,通常個(gè)體固定效應(yīng)和時(shí)間固定效應(yīng)必須加以控制,其次是既影響it Y 又影響i D 的可觀測(cè)變量it X 。不過(guò)這里需要強(qiáng)調(diào)的是,發(fā)生在處理時(shí)點(diǎn)之后( D t≥T )的 it X 作為事后變量,很有可能是一個(gè)“壞”控制變量(見(jiàn)下文),對(duì)其加以控制會(huì)導(dǎo)致估計(jì)系數(shù)b 不一致。為了避免這類問(wèn)題,一般的做法是控制事前某一后者可以控制更為靈活的時(shí)間趨勢(shì)形式,因而在實(shí)踐中更為常用。

      第二類控制變量是可能導(dǎo)致CIA 不成立的變量(稱為壞控制變量,bad control),必須排除在回歸方程之外。受到i D 影響的結(jié)果變量一般都是壞控制變量,加入回歸方程會(huì)使得估計(jì)系數(shù)b 不再具有因果解釋力。壞控制變量問(wèn)題可能對(duì)因果效應(yīng)的估計(jì)產(chǎn)生極大的影響,圖2 是一個(gè)模擬估計(jì)的例子:添加了合理控制變量的雙向固定效應(yīng)模型能夠很好地估計(jì)真實(shí)因果效應(yīng),然而一旦繼續(xù)加入壞控制變量,估計(jì)系數(shù)會(huì)產(chǎn)生極大的偏誤。判斷控制變量是否合理的一個(gè)經(jīng)驗(yàn)法則是考慮控制變量的決定時(shí)間:在處理時(shí)點(diǎn)之后產(chǎn)生變化的變量都可能受到i D 的影響,很可能是壞控制變量。①在過(guò)去相當(dāng)長(zhǎng)一段時(shí)期內(nèi)有一種看法認(rèn)為“凡是與it Y 和i D 相關(guān)的變量均應(yīng)該作為控制變量納入回歸方程”,這種看法忽略了壞控制變量的存在。對(duì)控制變量的選擇直接決定了實(shí)證研究的可信性,需要研究者更加謹(jǐn)慎地對(duì)待。②

      第三類控制變量是不影響CIA 是否成立的變量(稱為中性控制變量,neutral control),在回歸方程中可加可不加。從因果效應(yīng)識(shí)別的角度而言,這類變量是否加入回歸方程并不影響對(duì)因果效應(yīng)估計(jì)的一致性,控制或不控制均可。從統(tǒng)計(jì)推斷的角度來(lái)看,合理地控制這類變量有助于減小殘差從而提高估計(jì)精度,但是與壞控制變量問(wèn)題類似,選取不當(dāng)?shù)闹行钥刂谱兞糠炊鴷?huì)使得估計(jì)偏誤增加。判斷中性控制變量是否應(yīng)該控制的一個(gè)經(jīng)驗(yàn)法則是:影響被解釋變量it Y 的中性控制變量可以加入回歸方程中以減小誤差,提高估計(jì)精度;影響i D 的中性控制變量一般不控制,因?yàn)槿艨刂苿t會(huì)減小Di Tt的變動(dòng)性(variation),降低估計(jì)精度。

      (二)平行趨勢(shì)與事前趨勢(shì)檢驗(yàn)

      平行趨勢(shì)(parallel trend)又稱共同趨勢(shì)(common trend),指處理組個(gè)體的it Y 在沒(méi)有接受處理的狀態(tài)下?lián)碛泻涂刂平M個(gè)體it Y 相同的時(shí)間變動(dòng)趨勢(shì),它是雙重差分法能夠正確識(shí)別因果效應(yīng)的前提條件。由于處理組個(gè)體在處理時(shí)點(diǎn)后的反事實(shí)結(jié)果(處理組沒(méi)有接受處理的it Y )無(wú)法觀察到,平行趨勢(shì)假設(shè)本質(zhì)上是無(wú)法直接檢驗(yàn)的。因此,研究者通常退而求其次,通過(guò)檢驗(yàn)可觀察的處理組和控制組事前趨勢(shì)是否相同來(lái)間接地檢驗(yàn)平行趨勢(shì)假設(shè)。如果處理組和控制組的事前趨勢(shì)平行,那么研究者就有一定的信心認(rèn)為事后趨勢(shì)也是平行的。

      式(3)中的i D 是分組變量, st T 是第s期的時(shí)間虛擬變量, pres 和posts可以直觀地理解為在處理發(fā)生前和處理發(fā)生后的第s 期處理組和控制組被解釋變量it Y 的差異相對(duì)于基期(這里是處理發(fā)生前一期)處理組和控制組被解釋變量it Y 的差異。①②事前平行趨勢(shì)滿足意味著在處理時(shí)點(diǎn)D T 之前的各個(gè)時(shí)期組間差異沒(méi)有發(fā)生明顯變化,因此可以通過(guò)檢驗(yàn)pres 是否顯著異于0 來(lái)間接地檢驗(yàn)事前平行趨勢(shì)是否成立。圖3 是一個(gè)模擬的例子,可以看到在處理發(fā)生前各個(gè)時(shí)期的pres 均不顯著,聯(lián)合檢驗(yàn)結(jié)果也無(wú)法拒絕處理前系數(shù)都為0 的原假設(shè),因此可以認(rèn)為事前平行趨勢(shì)得到了滿足。

      式(3)不僅能夠檢驗(yàn)事前平行趨勢(shì),還能夠觀察到處理效應(yīng)的動(dòng)態(tài)變化。注意, ts pos 代表了處理時(shí)點(diǎn)D T 之后的各個(gè)時(shí)期組間差異相對(duì)于基期的差異,如果處理效應(yīng)確實(shí)存在,我們應(yīng)該期望得真實(shí)因果效應(yīng)1。因此式(3)實(shí)際上發(fā)揮著檢驗(yàn)事前平行趨勢(shì)與處理動(dòng)態(tài)效應(yīng)的雙重作用。

      需要強(qiáng)調(diào)的是,事前平行趨勢(shì)通過(guò)檢驗(yàn)并不意味著平行趨勢(shì)假設(shè)一定成立。正如前文強(qiáng)調(diào)的,平行趨勢(shì)假設(shè)本身不可檢驗(yàn),而事前平行趨勢(shì)只是整個(gè)平行趨勢(shì)假設(shè)的一部分,即使事前平行趨勢(shì)通過(guò)檢驗(yàn)也只是表明處理組和控制組在處理發(fā)生前保持相同時(shí)間趨勢(shì),并不能確保事后趨勢(shì)也一定平行,所以“事前平行趨勢(shì)檢驗(yàn)通過(guò),平行趨勢(shì)假設(shè)成立”說(shuō)法并不準(zhǔn)確。①

      (三)組別時(shí)間趨勢(shì)的進(jìn)一步分析

      使用雙重差分法評(píng)估政策效應(yīng)的可靠性依賴于平行趨勢(shì)假設(shè),因此,在實(shí)證研究中最為擔(dān)心的一點(diǎn)就是干預(yù)分配的過(guò)程可能使得平行趨勢(shì)假設(shè)不成立。例如研究貧困縣政策對(duì)經(jīng)濟(jì)發(fā)展的影響時(shí),由于貧困縣依據(jù)人均GDP 等經(jīng)濟(jì)指標(biāo)來(lái)認(rèn)定,被劃為貧困縣的地區(qū)經(jīng)濟(jì)發(fā)展速度很可能原本就比非貧困縣更慢,處理組(貧困縣)和控制組(非貧困縣)之間的經(jīng)濟(jì)發(fā)展?fàn)顩r很難滿足平行趨勢(shì)。

      一個(gè)可能的選擇是加入組間線性趨勢(shì)i t D Trend 以控制組間線性時(shí)間趨勢(shì)的差異,從而緩解這一問(wèn)題。②圖4a 給出了數(shù)值模擬的證據(jù),當(dāng)處理組和控制組存在明顯的時(shí)間趨勢(shì)差異時(shí),直接使用雙重差分法估計(jì)出的處理效應(yīng)存在明顯偏誤,但控制組間線性時(shí)間趨勢(shì)后就能準(zhǔn)確地估計(jì)處理效應(yīng)。事實(shí)上,根據(jù)上述的分析,在雙重差分法中額外地控制住組間線性趨勢(shì)可以作為一種穩(wěn)健性檢驗(yàn):若平行趨勢(shì)假設(shè)滿足,那么是否加入組間線性時(shí)間趨勢(shì)不會(huì)對(duì)估計(jì)結(jié)果產(chǎn)生明顯影響;反之,若估計(jì)結(jié)果發(fā)生了明顯改變,則預(yù)示著組間時(shí)間趨勢(shì)可能存在差異,平行趨勢(shì)假設(shè)可能并不滿足。

      然而,控制組間時(shí)間趨勢(shì)也是一把雙刃劍,可能會(huì)產(chǎn)生一些不合意的后果。第一,組間線性時(shí)間趨勢(shì)i t D Trend 和雙重差分的核心解釋變量 i t D ?Post 的構(gòu)造方式相似,因此二者存在比較明顯的共線性,控制組間線性時(shí)間趨勢(shì)會(huì)大大減少核心解釋變量的變動(dòng)程度從而降低估計(jì)效率、提高標(biāo)準(zhǔn)誤。從圖4a 中可以發(fā)現(xiàn)加入線性時(shí)間趨勢(shì)后的估計(jì)系數(shù)分布明顯更加分散,這表明估計(jì)量效率降低、標(biāo)準(zhǔn)誤變得更大了。第二,如果處理效應(yīng)不是一次性的,而是隨著時(shí)間推移逐步顯現(xiàn)出來(lái),那么組間線性時(shí)間趨勢(shì)會(huì)吸收一部分處理效應(yīng),導(dǎo)致雙重差分法會(huì)低估真實(shí)效應(yīng)。圖4b 的模擬結(jié)果說(shuō)明了這一點(diǎn):在處理效應(yīng)存在動(dòng)態(tài)變化時(shí),加入組間線性時(shí)間趨勢(shì)會(huì)大大低估真實(shí)的處理效應(yīng)。因此,是否控制組間時(shí)間趨勢(shì)需要研究者結(jié)合具體的研究情景仔細(xì)斟酌。

      從本質(zhì)上看,組間時(shí)間趨勢(shì)存在差異的根本原因是存在某些可觀測(cè)或不可觀測(cè)的前定變量在處理組和控制組之間存在差異或者是存在隨時(shí)間變化的混淆因素。比如前面提到的貧困縣的例子,貧困縣和非貧困縣的經(jīng)濟(jì)發(fā)展趨勢(shì)差異是由當(dāng)?shù)氐某跏冀?jīng)濟(jì)發(fā)展水平、地理?xiàng)l件、文化等一系列因素綜合造成的。對(duì)于可觀測(cè)的因素,可以通過(guò)添加控制變量的方法加以控制,但對(duì)于不可觀測(cè)的因素則一般很難直接處理,通過(guò)控制組間線性趨勢(shì)差異可以部分緩解這一問(wèn)題,然而當(dāng)組間時(shí)間趨勢(shì)差異和動(dòng)態(tài)處理效應(yīng)同時(shí)存在時(shí)也無(wú)法完全解決這一問(wèn)題。針對(duì)這種復(fù)雜情況,目前主要有兩種處理思路。一種思路是在雙重差分的框架下,通過(guò)使用未受處理的樣本來(lái)更為干凈地估計(jì)和剔除掉時(shí)間趨勢(shì)。①另一種思路可能需要超越雙重差分法,尋找工具變量或使用空間斷點(diǎn)回歸設(shè)計(jì)等方法,不過(guò)這些問(wèn)題超出了本文的范圍,這里不再加以討論。

      四、動(dòng)態(tài)雙重差分法和事件研究法

      (一)交錯(cuò)雙重差分法

      在標(biāo)準(zhǔn)的雙重差分法中處理組在同一個(gè)時(shí)間點(diǎn)受到干預(yù),然而現(xiàn)實(shí)中有相當(dāng)多的政策并非是一次性全面實(shí)施,而是先在某些地區(qū)試點(diǎn)后再分批逐步推廣,處理時(shí)點(diǎn)并不一致。一個(gè)典型的例子是增值稅轉(zhuǎn)型改革:2004 年7 月首先在東北地區(qū)開(kāi)始試點(diǎn),2007 年7 月擴(kuò)大至中部6 省,2008 年7 月推廣至內(nèi)蒙古以及汶川地震受災(zāi)地區(qū),2009 年1 月1 日起覆蓋全國(guó)。標(biāo)準(zhǔn)的雙重差分法并不適用于這樣的政策。一個(gè)常用的方法是交錯(cuò)雙重差分法(staggered DiD),“交錯(cuò)”一詞表明該方法適用于干預(yù)時(shí)點(diǎn)有前后差異的政策。交錯(cuò)雙重差分法的回歸方程設(shè)定為如下形式:

      (二)從動(dòng)態(tài)雙重差分法到事件研究法

      動(dòng)態(tài)雙重差分法可以被視作交錯(cuò)雙重差分法的動(dòng)態(tài)效應(yīng)檢驗(yàn)。與標(biāo)準(zhǔn)雙重差分法檢驗(yàn)動(dòng)態(tài)效應(yīng)的基本思路一致,也是通過(guò)檢驗(yàn)處理組和控制組在干預(yù)前和干預(yù)后的組間均值差異變化來(lái)識(shí)別政策的動(dòng)態(tài)效應(yīng)。與標(biāo)準(zhǔn)雙重差分法不同的是,在干預(yù)時(shí)點(diǎn)交錯(cuò)發(fā)生的情境下無(wú)法定義一個(gè)絕對(duì)的時(shí)間參照點(diǎn)作為處理前和處理后的分界線。因此,動(dòng)態(tài)雙重差分法不再以絕對(duì)時(shí)間為參照系,而是以干預(yù)發(fā)生時(shí)點(diǎn)作為相對(duì)時(shí)間參照系(圖6)。動(dòng)態(tài)雙重差分法的計(jì)量方程設(shè)定形式為:

      那么,一個(gè)自然延伸出的問(wèn)題是,既然可以使用當(dāng)期未受處理但在未來(lái)會(huì)受到處理的處理組個(gè)體作為控制組,那么是否可以在沒(méi)有從未接受處理的控制組樣本的情形下使用動(dòng)態(tài)雙重差分法?答案是可以,這種情形就是經(jīng)典的事件研究法(event study)。事實(shí)上事件研究法在公司金融、資產(chǎn)定價(jià)等領(lǐng)域的應(yīng)用要遠(yuǎn)早于雙重差分法,早期的代表性文獻(xiàn)有Fama 等(1969)的研究。事件研究法的計(jì)量模型設(shè)定為

      式(6)中的符號(hào)定義與式(5)相同。比較式(5)和式(6)可以發(fā)現(xiàn)二者本質(zhì)上是一致的:如果所有個(gè)體都會(huì)受到處理(但處理時(shí)點(diǎn)不同)、沒(méi)有從未受到處理的控制組,那么樣本中全部觀測(cè)值的i D 都等于1,式(5)就會(huì)變化為式(6)。因此,事件研究法本質(zhì)上可以近似為去除了控制組的動(dòng)態(tài)雙重差分法。圖7 使用了同一組模擬數(shù)據(jù)分別應(yīng)用動(dòng)態(tài)雙重差分法和事件研究法,可以看到兩種方法的系數(shù)估計(jì)結(jié)果幾乎完全一致,只不過(guò)由于事件研究法剔除了控制組樣本使得樣本量偏小、估計(jì)系數(shù)的標(biāo)準(zhǔn)誤更大。從計(jì)量方法的發(fā)展歷程看,事件研究法出現(xiàn)的時(shí)間要更早,動(dòng)態(tài)雙重差分法是事件研究法在樣本包含未接受干預(yù)的處理組情形下的自然拓展。

      使用動(dòng)態(tài)雙重差分法或事件研究法需要注意事件窗口的選擇,這里主要指窗口時(shí)間寬度的選擇。一般來(lái)說(shuō),干預(yù)交錯(cuò)發(fā)生的數(shù)據(jù)結(jié)構(gòu)涉及到的事件窗口寬度要更長(zhǎng)一些。比如若數(shù)據(jù)集包含10 期的觀測(cè)值,其中既有第1 期就接受干預(yù)的個(gè)體,也有到第10 期才接受干預(yù)的個(gè)體,那么該樣本涉及到的窗口寬度為干預(yù)前9 期、干預(yù)發(fā)生當(dāng)期以及干預(yù)發(fā)生后9 期,共19 期。①由于窗口寬度大于樣本時(shí)間跨度,觀測(cè)值在干預(yù)前后各期的分布是不平衡的,一般而言距離干預(yù)時(shí)點(diǎn)越遠(yuǎn)的樣本越少。不平衡樣本可能帶來(lái)樣本選擇偏誤(selection bias)和樣本消耗(attrition)問(wèn)題的困擾。選擇的事件窗口越寬,樣本不平衡現(xiàn)象越嚴(yán)重,會(huì)愈發(fā)加劇上述擔(dān)憂。此外,事件窗口越長(zhǎng),越有可能受到同時(shí)期發(fā)生的其他事件和混雜因素的干擾。如果從時(shí)間斷點(diǎn)(time cut-off)回歸設(shè)計(jì)的角度理解事件研究法,可以將時(shí)間視為驅(qū)動(dòng)變量(running variable),一般來(lái)說(shuō)窗寬選擇越寬則樣本規(guī)模越大、估計(jì)越有效(efficient),但可能會(huì)有更大的偏誤(bias)??傮w來(lái)看事件窗口的寬度不宜過(guò)長(zhǎng)。由于事件研究法的估計(jì)結(jié)果對(duì)事件窗口的選擇較為敏感,在實(shí)際研究中通常需要更換事件窗口寬度來(lái)做一些穩(wěn)健性檢驗(yàn)。目前,學(xué)界仍在不斷完善這一方法,Sun 和Abraham(2020)、Borusyak等(2021)的研究圍繞事件分析法中的異質(zhì)性處理等問(wèn)題進(jìn)一步進(jìn)行了拓展與討論。

      五、雙重差分法研究中的其他問(wèn)題

      (一)制度背景和政策實(shí)施真實(shí)情況

      雙重差分法應(yīng)用最多的場(chǎng)景是評(píng)估政策效應(yīng)。對(duì)于制度背景的清晰梳理和政策真實(shí)實(shí)施情況的正確觀察應(yīng)該是政策評(píng)估類實(shí)證研究的基石。一項(xiàng)政策可能發(fā)布了卻沒(méi)有很好地實(shí)施,也可能受政策影響的個(gè)體采取了“上有政策,下有對(duì)策”的策略式行動(dòng)影響了政策實(shí)施真實(shí)效果,如果研究者沒(méi)有很好地厘清這些制度背景和政策實(shí)施的真實(shí)情況,就不可能準(zhǔn)確地評(píng)估政策效應(yīng),甚至可能得到誤導(dǎo)性的研究結(jié)論。

      這里舉一個(gè)實(shí)例。相當(dāng)多的研究發(fā)現(xiàn)地方政府的財(cái)政補(bǔ)貼相當(dāng)?shù)托?,企業(yè)獲得了大量的財(cái)政補(bǔ)貼卻并沒(méi)有激勵(lì)企業(yè)的研發(fā)創(chuàng)新能力,甚至?xí)鹌髽I(yè)尋租(王紅建等,2014;張杰等,2015)。然而,范子英和王倩(2019)通過(guò)對(duì)地方政府稅收征管實(shí)務(wù)的觀察,發(fā)現(xiàn)財(cái)政補(bǔ)貼實(shí)施過(guò)程中存在相當(dāng)明顯的“列收列支”問(wèn)題:地方政府為了增加名義上的稅收收入,會(huì)先向企業(yè)多征收一部分稅款,再以財(cái)政補(bǔ)貼的名義返還回去。所以,相當(dāng)一部分名義上為財(cái)政補(bǔ)貼的資金實(shí)際上是企業(yè)自有資金,而這部分“虛假”的財(cái)政補(bǔ)貼自然不會(huì)對(duì)企業(yè)經(jīng)營(yíng)行為產(chǎn)生影響。因此,財(cái)政補(bǔ)貼的低效率很可能是由于對(duì)政策實(shí)施真實(shí)情況的把握不夠深入導(dǎo)致的錯(cuò)誤結(jié)果。總體而言,使用雙重差分法評(píng)估政策效應(yīng)要求對(duì)政策的具體實(shí)施情況有深入、清晰的了解:政策什么時(shí)候開(kāi)始真正實(shí)施?政策是否按照要求得到了準(zhǔn)確執(zhí)行?行為主體是否采取了一些應(yīng)對(duì)措施?等等。這一系列問(wèn)題與雙重差分法是否合理、可行程度密切相關(guān),也是進(jìn)一步深入分析政策機(jī)制效應(yīng)的良好開(kāi)端。因此,政策評(píng)估類的實(shí)證研究有必要高度重視制度背景和政策實(shí)施情況。

      (二)干預(yù)政策需要嚴(yán)格外生或隨機(jī)分配嗎?

      在第二部分雙重差分法的識(shí)別假設(shè)部分,我們強(qiáng)調(diào)了雙重差分法本身并沒(méi)有解決內(nèi)生性問(wèn)題,而是“假設(shè)”干預(yù)政策是外生,內(nèi)生性問(wèn)題的解決仍然依賴于干預(yù)政策本身的外生性。然而,這里的外生性是什么意義上的外生性?換言之,雙重差分法下需要干預(yù)政策和誰(shuí)之間是外生的?一種看法認(rèn)為干預(yù)政策必須是完全隨機(jī)(自然實(shí)驗(yàn))或者近似隨機(jī)分配(準(zhǔn)自然實(shí)驗(yàn)),即干預(yù)政策和模型未考慮的所有因素(擾動(dòng)項(xiàng))之間不相關(guān),只有在這種情況下才適用雙重差分法(陳林和伍海軍,2015)。但是,現(xiàn)實(shí)中的任何一項(xiàng)政策幾乎都有特定的政策目標(biāo)和政策對(duì)象,完全隨機(jī)分配的政策幾乎并不存在,那么這類政策是否完全不適用雙重差分法呢?本文認(rèn)為并非如此。第二部分對(duì)識(shí)別假設(shè)的討論清楚地表明,雙重差分法所需要的外生性是干預(yù)政策和擾動(dòng)項(xiàng)在差分意義上的外生性,這與水平意義上的外生性顯然并非是等價(jià)的。①

      我們以貧困縣政策的經(jīng)濟(jì)發(fā)展效應(yīng)評(píng)估為例。水平意義上的外生性要求貧困縣名額的分配過(guò)程要近似完全隨機(jī),無(wú)論是貧困地區(qū)還是富裕地區(qū)都有差不多的機(jī)會(huì)入選貧困縣,顯然這并不符合現(xiàn)實(shí)——貧困縣的選取標(biāo)準(zhǔn)主要是人均GDP、人均財(cái)政收入等指標(biāo),被選為貧困縣的地區(qū)都是經(jīng)濟(jì)發(fā)展十分落后的縣域,因此貧困縣政策并不滿足水平意義上的外生性。但是,差分意義上的外生性是有可能滿足的,即貧困縣可能和非貧困縣有相同的經(jīng)濟(jì)發(fā)展趨勢(shì)。如果研究設(shè)計(jì)能夠盡量滿足這一識(shí)別假設(shè),就可以使用雙重差分法。例如黃志平(2018)的做法是首先使用傾向得分匹配法(PSM)對(duì)數(shù)據(jù)預(yù)處理,在非貧困縣中盡量選取與貧困縣的各方面稟賦條件類似的控制組,從而盡可能地使得平行趨勢(shì)假設(shè)成立(等價(jià)于差分意義上的外生性),而后使用雙重差分法估計(jì)因果效應(yīng)。

      (三)溢出效應(yīng)

      雙重差分法的另一個(gè)核心識(shí)別假設(shè)是SUTVA,即干預(yù)不存在一般均衡效應(yīng)或溢出效應(yīng)。然而,現(xiàn)實(shí)中的各項(xiàng)政策幾乎或多或少都會(huì)存在一定的一般均衡效應(yīng),例如前文提到的上游省份加強(qiáng)水質(zhì)環(huán)境規(guī)制會(huì)影響下游省份水質(zhì)的例子。特別是在長(zhǎng)期中,當(dāng)處理組個(gè)體的決策發(fā)生變化時(shí),控制組個(gè)體一定會(huì)隨之調(diào)整自身的行為決策。因此,干預(yù)政策是否存在溢出效應(yīng)是任何一個(gè)使用雙重差分法的實(shí)證研究必須考慮的潛在威脅。

      不過(guò),檢驗(yàn)溢出效應(yīng)是否存在并非一項(xiàng)簡(jiǎn)單的工作,研究者需要根據(jù)制度背景仔細(xì)識(shí)別可能受到溢出效應(yīng)影響的控制組個(gè)體,而后檢驗(yàn)溢出效應(yīng)。Lu 等(2019)研究中國(guó)經(jīng)濟(jì)開(kāi)發(fā)區(qū)對(duì)當(dāng)?shù)亟?jīng)濟(jì)發(fā)展的影響,其對(duì)溢出效應(yīng)的討論和處理是一個(gè)較為成功的范例。他們采取了兩種識(shí)別策略檢驗(yàn)溢出效應(yīng),第一種是檢驗(yàn)與經(jīng)濟(jì)開(kāi)發(fā)區(qū)所屬村莊鄰近的同縣其他村莊經(jīng)濟(jì)發(fā)展是否也得到了提高,第二種是檢驗(yàn)經(jīng)濟(jì)開(kāi)發(fā)區(qū)對(duì)經(jīng)濟(jì)發(fā)展的激勵(lì)效應(yīng)是否隨著村莊離經(jīng)濟(jì)開(kāi)發(fā)區(qū)越來(lái)越遠(yuǎn)而減弱。第一種方法的結(jié)果表明同縣其他村莊的總產(chǎn)出、就業(yè)等僅有略微的提高且統(tǒng)計(jì)上不顯著,第二種方法的結(jié)果表明距離經(jīng)濟(jì)開(kāi)發(fā)區(qū)2 千米之外的村莊基本上不受經(jīng)濟(jì)開(kāi)發(fā)區(qū)的影響,兩種方法都提供了證據(jù)表明經(jīng)濟(jì)開(kāi)發(fā)區(qū)政策的溢出效應(yīng)并不顯著。

      還需要強(qiáng)調(diào)的一點(diǎn)是,如果研究重點(diǎn)本身就是政策的溢出效應(yīng)的話,那么是不適用雙重差分法的。例如一些研究試圖探討地區(qū)產(chǎn)業(yè)政策對(duì)企業(yè)選擇效應(yīng)和集聚效應(yīng)的影響:本地?fù)碛懈觾?yōu)惠的產(chǎn)業(yè)政策(如稅收優(yōu)惠)會(huì)吸引相鄰地區(qū)的企業(yè)遷移到本地區(qū),產(chǎn)生選擇效應(yīng)和集聚效應(yīng)。這里的選擇效應(yīng)和集聚效應(yīng)就是溢出效應(yīng)的一個(gè)典型表現(xiàn):本地區(qū)的政策對(duì)鄰近地區(qū)的企業(yè)產(chǎn)生了影響,因此該話題顯然不適合使用雙重差分法。研究者需要注意避免類似的問(wèn)題。

      (四)一般均衡視角下的成本收益分析

      雙重差分法廣泛應(yīng)用于各類公共政策的評(píng)估,如果估計(jì)得到了政策效應(yīng)符合預(yù)期,是否就意味著政策達(dá)到了初始目標(biāo)或是政策本身就是有效的呢?不是。一般而言,雙重差分法只能評(píng)估干預(yù)政策對(duì)研究者感興趣的結(jié)果變量的影響,但研究者并不清楚政策本身的機(jī)會(huì)成本有多大,也不清楚政策的凈收益到底是多少。評(píng)估政策效應(yīng)整體上是否符合預(yù)期或是政策是否有效率,并不能僅根據(jù)估計(jì)結(jié)果就判斷政策是否有效,而是需要從更廣泛的一般均衡角度,從整體上對(duì)政策進(jìn)行成本收益分析。

      Duflo(2001)是在政策效用評(píng)估類文獻(xiàn)中成功應(yīng)用成本收益分析的早期經(jīng)典代表,她研究了印度尼西亞修建學(xué)校對(duì)當(dāng)?shù)貎和拈L(zhǎng)期勞動(dòng)力市場(chǎng)的影響。根據(jù)雙重差分法的基準(zhǔn)結(jié)果,她估計(jì)了印度尼西亞政府投資學(xué)校建設(shè)的成本和對(duì)兒童未來(lái)的工資收益,發(fā)現(xiàn)投資學(xué)校建設(shè)的內(nèi)部回報(bào)率為8.8%-12%,遠(yuǎn)高于當(dāng)?shù)貙?shí)際利率,因此投資教育是一個(gè)非常高收益的投資項(xiàng)目。①Lu 等(2019)對(duì)中國(guó)經(jīng)濟(jì)開(kāi)發(fā)區(qū)的政策效應(yīng)同樣進(jìn)行了成本收益分析,他們根據(jù)雙重差分法的估計(jì)結(jié)果計(jì)算得到2006-2008 年間經(jīng)濟(jì)開(kāi)發(fā)區(qū)為當(dāng)?shù)鼐用窈推髽I(yè)提高的工資和利潤(rùn)總額約為1 807 億元,付出的稅收成本則為558 億元,凈收益高達(dá)1 249 億元。上述例子都體現(xiàn)了研究者在一般均衡的視角下,從機(jī)會(huì)成本和政策收益兩個(gè)角度對(duì)政策效果進(jìn)行完整的評(píng)估。研究者在完成雙重差分法的估計(jì)后,通常需要對(duì)政策進(jìn)行成本收益分析,在此基礎(chǔ)上才能更為完整地回答政策是否達(dá)到預(yù)期目標(biāo)、是否有效率等問(wèn)題,并提供合理、可行的政策建議。否則,若研究者過(guò)于關(guān)注政策的直接效果而忽略了潛在的政策成本,就可能對(duì)政策的整體效果產(chǎn)生錯(cuò)誤判斷,將整體上無(wú)效率的政策判定為有效政策,最終導(dǎo)致錯(cuò)誤的政策建議。

      六、總結(jié)性評(píng)論

      本文結(jié)合近年來(lái)國(guó)內(nèi)外關(guān)于雙重差分法的理論和實(shí)證研究文獻(xiàn),系統(tǒng)梳理了雙重差分法的基本計(jì)量設(shè)定、識(shí)別假設(shè)和雙重差分法的各個(gè)類型變體,著重分析了雙重差分法實(shí)際應(yīng)用中面臨的控制變量選擇、平行趨勢(shì)檢驗(yàn)和組間時(shí)間趨勢(shì)差異等容易混淆或理解不準(zhǔn)確的問(wèn)題。特別是近年來(lái)交錯(cuò)雙重差分法逐漸得到廣泛使用,但最新的一些理論計(jì)量研究成果表明交錯(cuò)雙重差分法在異質(zhì)性處理效應(yīng)下存在著一系列不合意之處,可能導(dǎo)致錯(cuò)誤的因果效應(yīng)估計(jì)結(jié)果,因此,本文建議研究者可以考慮使用動(dòng)態(tài)雙重差分法或事件研究法來(lái)替代交錯(cuò)雙重差分法作為基準(zhǔn)識(shí)別策略和實(shí)證結(jié)果展示方法。本文詳細(xì)介紹了動(dòng)態(tài)雙重差分法和事件研究法的計(jì)量實(shí)現(xiàn)以及兩者的區(qū)別和聯(lián)系,通過(guò)數(shù)值模擬方法揭示了二者本質(zhì)上的等價(jià)性。本文還強(qiáng)調(diào)了實(shí)踐中使用動(dòng)態(tài)雙重差分法和事件研究法時(shí)對(duì)窗寬選擇的重要性。最后,本文從政策評(píng)估實(shí)證研究的角度提出了研究者在使用雙重差分法進(jìn)行實(shí)證研究時(shí)需要注意的幾個(gè)重要問(wèn)題,包括重視制度背景和政策真實(shí)效應(yīng)的梳理和確認(rèn)、對(duì)于政策干預(yù)隨機(jī)性的準(zhǔn)確理解、重視對(duì)溢出效應(yīng)的處理和討論,以及從一般均衡視角對(duì)政策效應(yīng)的收益和成本進(jìn)行全面評(píng)估等。

      近年來(lái)使用雙重差分法進(jìn)行的實(shí)證研究呈現(xiàn)爆發(fā)式增長(zhǎng),近乎泛濫,但若深究其中,許多研究并沒(méi)有正確地理解雙重差分法基本識(shí)別假設(shè)和需要注意的問(wèn)題,產(chǎn)生了各式各樣的偏差與錯(cuò)誤。并且,許多學(xué)術(shù)期刊的匿名審稿人也出現(xiàn)了這些錯(cuò)誤和問(wèn)題,使得一些匿名審稿人提出沒(méi)有意義甚至是錯(cuò)誤的修改建議,而論文作者多數(shù)時(shí)候只能將錯(cuò)就錯(cuò)去迎合匿名審稿人,甚至將原本正確的做法被迫修改為錯(cuò)誤的做法,可謂是見(jiàn)笑于大方之家。長(zhǎng)期來(lái)看這種錯(cuò)誤會(huì)極大阻礙我國(guó)經(jīng)濟(jì)學(xué)研究與國(guó)際一流研究接軌的腳步,產(chǎn)生的傷害不可謂不嚴(yán)重。本文試圖對(duì)上述錯(cuò)誤和問(wèn)題在一定程度上進(jìn)行歸納、總結(jié)、厘清和解決,如果能對(duì)未來(lái)的研究者提供一些參考,為我國(guó)經(jīng)濟(jì)學(xué)研究進(jìn)步提供些微助力,本文的目的就完全達(dá)到了。

      當(dāng)然,本文的觀點(diǎn)均是由作者從自身的理解和實(shí)踐經(jīng)驗(yàn)中提取總結(jié)而來(lái),作為一家之言,必定有謬誤或不足之處,僅為拋磚引玉。期待后續(xù)學(xué)界同行的進(jìn)一步研究,促成我國(guó)經(jīng)濟(jì)學(xué)界的共同進(jìn)步。

      猜你喜歡
      雙重差分法事件研究法實(shí)證研究
      低碳城市試點(diǎn)效果實(shí)證分析
      長(zhǎng)株潭“兩型社會(huì)”建設(shè)試點(diǎn)的碳減排績(jī)效評(píng)價(jià)
      軟科學(xué)(2016年9期)2017-05-09 06:52:49
      西部大開(kāi)發(fā)戰(zhàn)略對(duì)重點(diǎn)縣經(jīng)濟(jì)發(fā)展的影響
      我國(guó)證券市場(chǎng)融資效率問(wèn)題
      事件研究法下財(cái)務(wù)披露管理有效性的實(shí)證分析
      上市公司海外并購(gòu)績(jī)效實(shí)證分析
      商(2016年34期)2016-11-24 13:58:14
      玉雕專業(yè)學(xué)生專業(yè)認(rèn)同的實(shí)證研究
      人間(2016年26期)2016-11-03 18:10:25
      溫州小微企業(yè)融資環(huán)境及能力分析
      認(rèn)知語(yǔ)言視角下英語(yǔ)詞匯多義習(xí)得的實(shí)證研究
      科技視界(2016年21期)2016-10-17 19:05:25
      實(shí)證分析會(huì)計(jì)信息對(duì)股價(jià)的影響
      商(2016年27期)2016-10-17 05:39:59
      蕉岭县| 栾城县| 新平| 乐东| 陇川县| 亚东县| 黄山市| 梅河口市| 汉寿县| 从化市| 上饶市| 宁南县| 定陶县| 满城县| 都江堰市| 房产| 当涂县| 谢通门县| 鄯善县| 兴安县| 武川县| 阳江市| 青铜峡市| 黔南| 泽州县| 固镇县| 萍乡市| 岱山县| 浦城县| 常熟市| 谢通门县| 桦南县| 八宿县| 水富县| 洛南县| 沁阳市| 博白县| 阿拉尔市| 古浪县| 宿松县| 什邡市|