馬忠貴,徐曉晗,劉雪兒
北京科技大學(xué)計(jì)算機(jī)與通信工程學(xué)院,北京 100083
為什么需要研究因果關(guān)系?因?yàn)橛腥滦枰诶迩逶虻那闆r下才能更好地做到,那就是:解釋、預(yù)測(cè)和干預(yù).合理的解釋可以為探索世界提供支撐,準(zhǔn)確的預(yù)測(cè)可以可靠地描述事件結(jié)果.有時(shí)我們可能需要用一些理由去解釋事件發(fā)生的原因,不僅想知道為什么發(fā)生,更希望可以利用其中某些信息來(lái)促進(jìn)或者避免某些結(jié)果的產(chǎn)生,也就是對(duì)原本的事件施加干預(yù)(可以是一項(xiàng)行動(dòng)、措施或政策)去得到特定的結(jié)果.
無(wú)論是哲學(xué)、自然科學(xué)還是社會(huì)科學(xué)領(lǐng)域,研究因果關(guān)系一直是人類(lèi)持之以恒探索的終極目標(biāo).從Sabine和Russell[1]對(duì)亞里士多德“四因說(shuō)”中因果概念的論述:事物的出現(xiàn)所必需的條件都被稱(chēng)為原因;到文獻(xiàn)[2]中所研究的關(guān)于確定現(xiàn)象因果聯(lián)系的“穆勒五法”,再到文獻(xiàn)[3]中論述了Hume提出的從“是”能否推出“應(yīng)該”,也即“事實(shí)”命題能否推導(dǎo)出“價(jià)值”命題.哲學(xué)領(lǐng)域?qū)σ蚬P(guān)系相關(guān)概念做出了透徹論述,因果關(guān)系的哲學(xué)思想發(fā)展史縱貫兩千余年,因果推斷的統(tǒng)計(jì)方法至今依然在社會(huì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、流行病學(xué)等諸多科學(xué)領(lǐng)域發(fā)揮余韻,并展現(xiàn)出了巨大的潛力.培根曾提出“真正的知識(shí)是根據(jù)因果關(guān)系得到的知識(shí)”,如何找到一種科學(xué)普適的方法探尋事物間的因果關(guān)系,隨著人類(lèi)認(rèn)知的發(fā)展不斷精深,依舊是一項(xiàng)不小的挑戰(zhàn).
目前因果推斷的方法主要可以分為基于實(shí)證的方法和基于數(shù)據(jù)觀察的方法.其中,實(shí)證方法是進(jìn)行因果關(guān)系推斷的黃金標(biāo)準(zhǔn),其干預(yù)決策是隨機(jī)的,公認(rèn)最有效的是隨機(jī)對(duì)照試驗(yàn)(Random controlled trials,RCT),也稱(chēng)為 A/B 測(cè)試(A/B Test).隨機(jī)對(duì)照試驗(yàn)將參與者隨機(jī)分配到對(duì)照組或?qū)嶒?yàn)組,并將在試驗(yàn)中對(duì)照組和實(shí)驗(yàn)組唯一的預(yù)期差異視為實(shí)驗(yàn)的結(jié)果.然而,隨機(jī)對(duì)照試驗(yàn)雖然是分析因果關(guān)系的絕佳環(huán)境,但其受到倫理限制、個(gè)體不依從等因素影響,往往具有不可操作性,其試驗(yàn)范圍也不可能遍及所有真實(shí)場(chǎng)景,因此在很大程度上限制了因果推斷的應(yīng)用.基于數(shù)據(jù)觀察的觀察性研究(Observational study)也是一種常用方法.研究人員在沒(méi)有任何干擾的情況下觀察受試者并得出數(shù)據(jù),從觀測(cè)數(shù)據(jù)中得到他們的行動(dòng)及其結(jié)果,但不能得到他們采取特定行動(dòng)的動(dòng)機(jī).基于數(shù)據(jù)觀察方法的核心問(wèn)題就是如何基于已有的觀測(cè)數(shù)據(jù)得到反事實(shí)結(jié)果,這是頗具挑戰(zhàn)性的一項(xiàng)工作,主要原因如下:(1)根據(jù)獲取到的觀測(cè)數(shù)據(jù)只能得到事實(shí)結(jié)果,無(wú)從得知其反事實(shí)結(jié)果;(2)在無(wú)干預(yù)的觀測(cè)環(huán)境中,試驗(yàn)往往不是隨機(jī)分配的,這可能會(huì)因觀察對(duì)象群體分布不同有較大偏差.為了合理地從數(shù)據(jù)中推斷因果關(guān)系,研究者們構(gòu)建出了基于潛在結(jié)果模型和結(jié)構(gòu)因果模型兩種主流方法的分析框架,我們將針對(duì)不同的分析框架分別進(jìn)行介紹.
本文先介紹因果關(guān)系和因果推斷過(guò)程中所涉及到的基本概念,以輔助對(duì)后文因果推斷的理解;然后我們將分別闡述現(xiàn)階段因果推斷中三種主流分析框架:反事實(shí)框架、潛在結(jié)果模型和結(jié)構(gòu)因果模型;再介紹因果推斷在各個(gè)學(xué)科領(lǐng)域的研究應(yīng)用;最后總結(jié)三種分析框架的主要特點(diǎn),并提出因果推斷未來(lái)的應(yīng)用前景及其巨大潛力.
事物間的因果關(guān)系常常是我們經(jīng)常要面對(duì)和分析的問(wèn)題,研究因果的意義在于:在許多領(lǐng)域,我們需要理解數(shù)據(jù)并據(jù)此做出進(jìn)一步的行動(dòng)和決策.比如對(duì)于我們而言,常常會(huì)想要知道“學(xué)歷越高就會(huì)找到越好的工作嗎?”政府可能想知道“增設(shè)離婚冷靜期會(huì)對(duì)離婚率有影響嗎?”醫(yī)生可能想知道“某種藥劑的使用會(huì)增加患者康復(fù)的幾率嗎?”這些問(wèn)題的核心就是因果效應(yīng),即:X的變化會(huì)對(duì)Y造成影響嗎?如果會(huì),Y受影響的程度要如何度量?在研究因果關(guān)系的基礎(chǔ)上,還要進(jìn)一步挖掘因果關(guān)系產(chǎn)生的原因及其造成的影響.
從時(shí)間序列的角度,經(jīng)濟(jì)學(xué)家Granger[4]給出了因果關(guān)系的文字描述:如果利用X可以更好地預(yù)測(cè)Y,那么就可以說(shuō)X是Y的原因.經(jīng)過(guò)后來(lái)的研究不難發(fā)現(xiàn),這段描述中存在著一些謬誤;嚴(yán)格來(lái)說(shuō),這句話(huà)描述的是相關(guān)關(guān)系,而非因果關(guān)系.那么相關(guān)關(guān)系和因果關(guān)系究竟有何不同?其實(shí),相關(guān)表示一種一般關(guān)系,即:當(dāng)兩個(gè)變量同時(shí)呈現(xiàn)出增加或減少的趨勢(shì)時(shí),它們就是相關(guān)的;而因果關(guān)系中原因會(huì)導(dǎo)致結(jié)果,結(jié)果部分取決于原因.兩個(gè)變量之間即便沒(méi)有相關(guān)關(guān)系也可能具有因果關(guān)系,反之有相關(guān)關(guān)系也可能沒(méi)有因果關(guān)系.例如,一項(xiàng)研究表明,通常吃早飯的人比不吃早飯的人體重輕,因此得出結(jié)論:不吃早飯有利于減肥.但事實(shí)上,不吃早飯和體重輕之間可能只是相關(guān),而并非因果關(guān)系.從事實(shí)的角度出發(fā)為這個(gè)現(xiàn)象尋求一種解釋?zhuān)赡苤皇且驗(yàn)槊刻斐栽顼埖娜肆?xí)慣于保持一種健康的生活方式,定期運(yùn)動(dòng)、睡眠規(guī)律、飲食健康,最終才擁有了更加理想的體重.在這類(lèi)情況中,擁有更健康的生活方式是吃早飯和輕體重的共同原因,因此也可以將其視為吃早飯和輕體重之間因果關(guān)系的混淆因素.
因此,相關(guān)不是因果.雖然相關(guān)關(guān)系在統(tǒng)計(jì)學(xué)中取得了一系列成果,但因果關(guān)系可以拓展傳統(tǒng)統(tǒng)計(jì)學(xué)解決新問(wèn)題所需的必要內(nèi)容,并可延伸到其他學(xué)科,因此更具研究?jī)r(jià)值.
在因果推斷中有一些基本概念,某種程度上在幾類(lèi)分析框架中是通用的,也是理解因果推斷的基礎(chǔ),以下將分別進(jìn)行介紹.
(1)同一個(gè)研究對(duì)象(Unit):即在施加干預(yù)以研究因果關(guān)系時(shí)選定的研究對(duì)象,可以是一個(gè)物理對(duì)象也可以是一個(gè)對(duì)象的集合;在潛在結(jié)果模型中,不同時(shí)間點(diǎn)下的研究樣本是不同的研究對(duì)象.(2)干預(yù)(Treatment):干預(yù)指對(duì)一個(gè)樣本采取的行為,用W∈{0,1,2,...,Nw}表示干預(yù),目前大多數(shù)因果推斷采用二元干預(yù),即采用了干預(yù)(W=1)的樣本劃為干預(yù)組;未進(jìn)行干預(yù)(W=0)劃為對(duì)照組.(3)潛在結(jié)果(Potential outcome)和事實(shí)結(jié)果(Observed outcome):在現(xiàn)實(shí)世界中,對(duì)于每一個(gè)研究對(duì)象,其在每一種干預(yù)下都存在一個(gè)可能的結(jié)果,即潛在結(jié)果;而在真實(shí)觀測(cè)數(shù)據(jù)中出現(xiàn)的結(jié)果稱(chēng)為事實(shí)結(jié)果.(4)效應(yīng)(Effect):效應(yīng)即評(píng)判干預(yù)與否所導(dǎo)致結(jié)果差別的指標(biāo),通過(guò)對(duì)各個(gè)研究對(duì)象干預(yù)與否的潛在結(jié)果的比較得出.(5)分配機(jī)制(Assignment mechanism):哪些結(jié)果可以被觀察到主要取決于干預(yù)的分配機(jī)制,即哪些研究對(duì)象對(duì)應(yīng)采取了哪些干預(yù).對(duì)于一個(gè)二值干預(yù),X=1代表干預(yù)組,X=0代表對(duì)照組,在接受干預(yù)分配X=x后結(jié)果變量表示為Yx,表示接受相應(yīng)干預(yù)后的潛在結(jié)果.
近幾十年來(lái),因果推斷一直是許多領(lǐng)域的關(guān)鍵性研究課題,在各個(gè)領(lǐng)域都涌現(xiàn)出了令人矚目的研究成果.2008年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者Heckman[5]提出了政策評(píng)價(jià)中出現(xiàn)的三個(gè)基于因果推斷且極具挑戰(zhàn)性的難題:
(1)評(píng)價(jià)歷史上出現(xiàn)的干預(yù)對(duì)結(jié)果的影響;
(2)預(yù)測(cè)在一個(gè)環(huán)境中曾經(jīng)經(jīng)歷過(guò)的干預(yù)在其他環(huán)境中的影響;
(3)預(yù)測(cè)歷史上從沒(méi)有經(jīng)歷過(guò)的干預(yù)在各種環(huán)境中的影響.
通常認(rèn)為,哲學(xué)和統(tǒng)計(jì)學(xué)得益于定量化數(shù)據(jù)記錄對(duì)各個(gè)學(xué)科的普適性以及統(tǒng)計(jì)學(xué)以數(shù)據(jù)為分析對(duì)象的特點(diǎn),先后提出了三種分析框架,即反事實(shí)框架、潛在結(jié)果模型和結(jié)構(gòu)因果模型.反事實(shí)框架介紹因果效應(yīng)的起源,潛在結(jié)果模型和結(jié)構(gòu)因果模型是在反事實(shí)理論的基礎(chǔ)上進(jìn)一步發(fā)展,并成為了發(fā)現(xiàn)因果關(guān)系和評(píng)價(jià)因果效應(yīng)時(shí)理論最成熟、應(yīng)用最廣泛的兩種因果推斷分析框架.隨著實(shí)證研究方法的不斷創(chuàng)新發(fā)展,對(duì)于如何界定因果關(guān)系以及推斷事物間的因果關(guān)系已經(jīng)有了比較成熟的理論,以下將詳細(xì)闡述.
在因果關(guān)系的研究中,對(duì)于因果關(guān)系的界定幾個(gè)世紀(jì)以來(lái)哲學(xué)家們都沒(méi)有給出一個(gè)明確的定義,這主要是因?yàn)橐蚬P(guān)系中原因和結(jié)果的定義在某種程度上都是以彼此為闡述條件,即需要結(jié)果來(lái)定義原因,也需要原因來(lái)判定結(jié)果,使得二者的關(guān)系紛繁復(fù)雜、撲朔迷離.
在很長(zhǎng)一段時(shí)間內(nèi),哲學(xué)中關(guān)于因果推理的主要范式是遵循“連續(xù)性或相關(guān)性的規(guī)律”,將因果推斷看成是一個(gè)挖掘事物規(guī)律的過(guò)程.無(wú)論是Cook等[6]提出的判定因果關(guān)系的三項(xiàng)原則,還是Lazarsfeld[7]提出的因果判定方法,都強(qiáng)調(diào)因果關(guān)系中“規(guī)律性”的影響;隨后,越來(lái)越多的學(xué)者認(rèn)識(shí)到通過(guò)連續(xù)性或相關(guān)性的規(guī)律并不一定能得出真正的因果關(guān)系,使得哲學(xué)中開(kāi)始出現(xiàn)通過(guò)反事實(shí)框架(Counterfactual framework)來(lái)探究因果關(guān)系的方法.Hume[8]于18世紀(jì)最早提出基于反事實(shí)框架討論因果關(guān)系并給出了反事實(shí)的文字化闡述,Lewis[9]在Hume的研究基礎(chǔ)上給出了反事實(shí)框架的符號(hào)化表達(dá),結(jié)合可能世界語(yǔ)義學(xué)和反事實(shí)來(lái)刻畫(huà)因果依賴(lài)性,并形成了“界定可比較相似性→用相似性來(lái)說(shuō)明反事實(shí)→用反事實(shí)來(lái)定義反事實(shí)依賴(lài)性→用反事實(shí)依賴(lài)性來(lái)闡述因果依賴(lài)性→用因果依賴(lài)性來(lái)解釋因果性”的邏輯鏈條.Lewis提出的因果依賴(lài)命題是對(duì)Hume因果關(guān)系的正式概括—“若事件A沒(méi)有發(fā)生,則事件B也不會(huì)發(fā)生”,一旦這一反事實(shí)命題成立,則可得出“若事件A發(fā)生,則事件B發(fā)生”的命題自然成立.至此,Lewis完成了從因果依賴(lài)性向因果性的跨越,他指出:“如果A和B是兩個(gè)現(xiàn)實(shí)事件且滿(mǎn)足若A不發(fā)生則B不發(fā)生,則可以確定事件A是事件B的原因”,這一結(jié)論給出了因果關(guān)系中對(duì)于原因和結(jié)果比較明晰的界定方法,為因果關(guān)系的理論思考提供了一種明確的道路.
在因果推斷的理論體系中,潛在結(jié)果模型(Potential outcomes framework)是其中最重要的理論模型之一.潛在結(jié)果模型由哈佛大學(xué)知名統(tǒng)計(jì)學(xué)者Rubin提出,因此該模型又稱(chēng)Rubin因果模型.潛在結(jié)果模型的核心是對(duì)同一個(gè)研究對(duì)象,比較其接受干預(yù)和不接受干預(yù)的效應(yīng).對(duì)于接受干預(yù)的研究對(duì)象而言,其不接受干預(yù)是一種“反事實(shí)”狀態(tài),而對(duì)于不接受干預(yù)的研究對(duì)象而言,其接受干預(yù)就是一種“反事實(shí)”狀態(tài).對(duì)于“反事實(shí)”框架的概念,Rubin卻并不認(rèn)同,他認(rèn)為對(duì)于一個(gè)研究對(duì)象,其結(jié)果出現(xiàn)與否主要取決于分配機(jī)制(Assignment mechanism),事實(shí)上我們只能看到一種結(jié)果,但并不意味著另一種結(jié)果不存在,這并不是一個(gè)非黑即白的概念,因此用潛在結(jié)果去描述事件是一種更加恰當(dāng)?shù)姆绞?
潛在結(jié)果模型跳脫出因果推理的正統(tǒng)思想,轉(zhuǎn)而著重哲學(xué)中反事實(shí)框架的影響,通過(guò)借鑒統(tǒng)計(jì)學(xué)中隨機(jī)對(duì)照試驗(yàn)和潛在結(jié)果的概念,構(gòu)建了因果推斷的新分析框架.潛在結(jié)果模型的核心假設(shè)是“沒(méi)有假設(shè)就沒(méi)有因果”,以下將分別介紹潛在結(jié)果模型中涉及到的一些必要概念,以更好地理解這種分析框架.
潛在結(jié)果框架分析中,通常說(shuō)因果將干預(yù)和研究對(duì)象聯(lián)系在一起,干預(yù)就是原因,干預(yù)所導(dǎo)致的結(jié)果就是效應(yīng).Imbens和Rubin在文獻(xiàn)[10]中提出潛在結(jié)果的含義,即:給定一個(gè)研究對(duì)象和一系列干預(yù),將每一對(duì)“干預(yù)-結(jié)果”界定為一個(gè)潛在結(jié)果.在潛在結(jié)果模型中,文獻(xiàn)[11]將因果效應(yīng)定義為同一個(gè)研究對(duì)象潛在結(jié)果之差,令Y表示研究對(duì)象i接受干預(yù)或?qū)φ盏慕Y(jié)果,則因果效應(yīng)(Individual causal effect,ICE)可定義為ICE(i)=Y1(i)?Y0(i).盡管Rubin等學(xué)者清楚地定義了一個(gè)研究對(duì)象的因果效應(yīng),但是通常對(duì)于同一個(gè)研究對(duì)象,不可能既接受干預(yù)又接受對(duì)照,自然也不能夠同時(shí)觀測(cè)到兩種結(jié)果.統(tǒng)計(jì)學(xué)中往往關(guān)注總體的統(tǒng)計(jì)特征,利用潛在結(jié)果還可以得到總體的平均因果效應(yīng)(Average causal effect,ACE).假設(shè)所有研究對(duì)象都接受干預(yù)X=1的平均結(jié)果為E(Y1),所有研究對(duì)象都接受對(duì)照X=0的平均結(jié)果為E(Y0),則可通過(guò)ACE(i)=E(ICE)=E(Y1?Y0)=E(Y1)?(Y0)來(lái)表示平均因果效應(yīng)的兩個(gè)平均結(jié)果之差.
統(tǒng)計(jì)學(xué)家Fisher給出了識(shí)別平均因果效應(yīng)的方法—隨機(jī)對(duì)照試驗(yàn),即將干預(yù)隨機(jī)分配給研究對(duì)象i.例如,通過(guò)拋硬幣決定研究對(duì)象i是否接受干預(yù),這個(gè)隨機(jī)決定的過(guò)程與潛在結(jié)果無(wú)關(guān),可以保證潛在結(jié)果(Y1,Y0)與干預(yù)分配機(jī)制完全獨(dú)立,進(jìn)而得到E(Yx)=E(Y|X=x),平均因果效應(yīng)可以通過(guò)在干預(yù)組與對(duì)照組中觀測(cè)到的結(jié)果變量期望之差A(yù)CE=E(Y|X=1)?E(Y|X=0)得到,計(jì)算式中不再含有潛在結(jié)果變量Y1和Y0,可以通過(guò)傳統(tǒng)的統(tǒng)計(jì)方法分別估計(jì)E(Y)=E(Y|X=1)和E(Y)=E(Y|X=0)來(lái)推斷平均因果效應(yīng).在實(shí)際研究中,隨機(jī)對(duì)照試驗(yàn)往往需要比較理想的試驗(yàn)條件.一旦隨機(jī)對(duì)照試驗(yàn)條件不成立,這種通過(guò)計(jì)算干預(yù)組與對(duì)照組之間差值來(lái)得到平均因果關(guān)系的方法就面臨著內(nèi)生選擇性偏差[12]、差別化干預(yù)效應(yīng)偏差等問(wèn)題的困擾.文獻(xiàn)[13]定義了觀察性研究的概念,其不再滿(mǎn)足隨機(jī)分配的條件,在此種情形下如果忽略協(xié)變量的作用,僅通過(guò)隨機(jī)對(duì)照試驗(yàn)方法估計(jì)因果效應(yīng)就會(huì)產(chǎn)生偏差,乃至造成統(tǒng)計(jì)學(xué)悖論.
在哲學(xué)和統(tǒng)計(jì)學(xué)領(lǐng)域,許多優(yōu)秀的學(xué)者為潛在結(jié)果模型的研究發(fā)展做出了卓越貢獻(xiàn),Hume[14]和Mill[15]作為哲學(xué)家的典型代表最早從反事實(shí)框架的視角討論因果關(guān)系;Fisher[16]及Neyman等[17]則各自從統(tǒng)計(jì)學(xué)家的立場(chǎng)出發(fā),分別提出從潛在結(jié)果和隨機(jī)的視角來(lái)討論因果關(guān)系.Fisher提出了“隨機(jī)對(duì)照試驗(yàn)”的概念,而Neyman提出了“潛在結(jié)果”并將其應(yīng)用于隨機(jī)對(duì)照試驗(yàn),Rubin在文獻(xiàn)[18]中進(jìn)一步結(jié)合了“潛在結(jié)果”和“隨機(jī)對(duì)照試驗(yàn)”這兩個(gè)概念,系統(tǒng)性地提出了潛在結(jié)果模型的理論假設(shè)、核心內(nèi)容和推理方法.Neyman利用數(shù)學(xué)語(yǔ)言描述了潛在結(jié)果框架下的因果效應(yīng),Rubin將這一數(shù)學(xué)定義推廣到觀察性研究中,潛在結(jié)果模型作為一種因果推斷的重要分析框架,其本身需要建立在一些基本假設(shè)和前提之上,如果現(xiàn)實(shí)情況不能滿(mǎn)足其基本假設(shè),潛在結(jié)果的結(jié)論就不成立,本節(jié)我們將重點(diǎn)討論潛在結(jié)果模型的三個(gè)基本假設(shè).
3.2.1 研究對(duì)象干預(yù)值穩(wěn)定性假設(shè)
研究對(duì)象干預(yù)值穩(wěn)定性假設(shè)(Stable unit treatment value assumption,SUTVA)是一個(gè)先驗(yàn)假設(shè),從廣義上看,研究對(duì)象干預(yù)值穩(wěn)定性假設(shè)強(qiáng)調(diào)兩個(gè)要點(diǎn):(1)研究對(duì)象之間不存在相互影響,互相獨(dú)立;(2)每種干預(yù)的單一性,即不同層次的干預(yù)在SUTVA下不能歸因?yàn)橥环N干預(yù)[19].
Rubin[20]在1986年指出無(wú)論分配干預(yù)X到研究對(duì)象i的分配機(jī)制是什么,也無(wú)所謂其他研究對(duì)象接受干預(yù)與否,研究對(duì)象i受到干預(yù)X影響而得到的結(jié)果總是不變的.這一假設(shè)中既明確了其他研究對(duì)象的決策對(duì)參考研究對(duì)象接受干預(yù)與否沒(méi)有影響,也包含了分配機(jī)制對(duì)潛在結(jié)果沒(méi)有影響的假設(shè).
STUVA假設(shè)意味著每個(gè)研究對(duì)象所做出的決策并不受其他研究對(duì)象影響,然而在現(xiàn)實(shí)中這往往是不現(xiàn)實(shí)的,因?yàn)槠涫轻槍?duì)潛在結(jié)果模型的不完全假設(shè),完全忽略了研究對(duì)象之間相互影響的間接效應(yīng).針對(duì)STUVA的局限性,Sinclair等[21]提出了部分干擾假設(shè)(Partial interference assumption),即對(duì)干預(yù)分配機(jī)制進(jìn)行兩階段隨機(jī)對(duì)照設(shè)計(jì),第一階段給研究對(duì)象隨機(jī)分層到不同干預(yù)分配策略,第二階段將同層級(jí)內(nèi)的研究對(duì)象進(jìn)行隨機(jī)干預(yù)或?qū)φ?實(shí)驗(yàn)表明,當(dāng)群體在空間、事件或社會(huì)性上充分分離的情況下,部分干擾假設(shè)可能是合理的.
3.2.2 可忽略性假設(shè)
觀察性研究?jī)H對(duì)觀測(cè)數(shù)據(jù)進(jìn)行觀察,以推斷變量間的因果效應(yīng),但這種方法不能由研究者決定是否針對(duì)某些研究對(duì)象采取干預(yù)或?qū)φ詹僮?,因此觀察性研究不再滿(mǎn)足隨機(jī)對(duì)照試驗(yàn)的條件.
在可忽略性假設(shè)(Ignorability of treatment assignment mechanism)中闡述了干預(yù)分配機(jī)制的可忽略性;即,在給定協(xié)變量V的條件下,干預(yù)X的分配獨(dú)立于潛在結(jié)果(Y1,Y0)獨(dú)立于X|V.可忽略性假設(shè)表明了兩點(diǎn):(1)如果給定兩個(gè)研究對(duì)象共同的協(xié)變量V,不管他們的分配機(jī)制如何,二者的潛在結(jié)果應(yīng)該是相同的;(2)如果給定兩個(gè)研究對(duì)象共同的協(xié)變量V,無(wú)論他們潛在結(jié)果的值是什么,它們的干預(yù)分配機(jī)制應(yīng)該是相同的.因此,可忽略性假設(shè)又被稱(chēng)為無(wú)混雜假設(shè),它意味著在具有相同協(xié)變量的研究對(duì)象之間,無(wú)論進(jìn)行干預(yù)還是進(jìn)行對(duì)照都不會(huì)影響潛在結(jié)果,也就是分配機(jī)制不會(huì)因?yàn)檠芯繉?duì)象接受干預(yù)或者不接受干預(yù)的結(jié)果產(chǎn)生任何影響.
3.2.3 正值假設(shè)
如果在給定某些協(xié)變量的情況下,其干預(yù)分配機(jī)制是固定不變的,那么在這些依據(jù)協(xié)變量所做的分層中,至少有一種潛在結(jié)果是無(wú)法觀察到的,在這種情況下,是無(wú)法通過(guò)潛在結(jié)果之間的差別來(lái)推斷因果關(guān)系的.例如,假設(shè)有兩種藥物A和B,想要評(píng)估藥物A對(duì)孕婦的影響,孕中期的孕婦總是被分配服用藥物A,那么在孕中期孕婦這個(gè)分組中研究藥物B對(duì)其影響是沒(méi)有意義的.正值假設(shè)可用數(shù)學(xué)符號(hào)表達(dá)為:0<p(X=1|V)<1,表明在基于協(xié)變量的分層中,每個(gè)研究對(duì)象接受干預(yù)或?qū)φ盏母怕识际钦?正值假設(shè)表明了分配機(jī)制的可變性,這對(duì)估計(jì)干預(yù)效果有著不可忽視的重要意義.
在文獻(xiàn)[10]中,可忽略性假設(shè)和正值假設(shè)一起被稱(chēng)為強(qiáng)可忽略性分配假設(shè)(Strongly ignorable treatment assignment).E(Y1?Y0)=E[E(Y1?Y0|V)]=E[E(Y|X=1,V)?E(Y|X=0,V)]即可表示總體可識(shí)別平均因果效應(yīng),由可忽略性假設(shè)和正值假設(shè)條件相合得到.可忽略性假設(shè)表明了隨機(jī)對(duì)照試驗(yàn)和觀察性研究的區(qū)別,當(dāng)協(xié)變量的分布在干預(yù)組和對(duì)照組不一致時(shí),就會(huì)產(chǎn)生一些偏差,我們將在下一部分進(jìn)行討論.
觀察性研究中如果忽略了協(xié)變量的作用,僅使用隨機(jī)對(duì)照試驗(yàn)進(jìn)行因果關(guān)系推斷就會(huì)產(chǎn)生偏差,我們就將這種影響因果關(guān)系估計(jì)的變量稱(chēng)為混雜因素.文獻(xiàn)[22]基于相關(guān)關(guān)系的度量定義混雜因素為:如果兩個(gè)變量之間相關(guān)關(guān)系的度量受到第三個(gè)變量的影響,那么稱(chēng)第三個(gè)變量為混雜因素.文獻(xiàn)[23]從潛在結(jié)果出發(fā)定義了混雜因素:p(Y1|X=1)=p(Y1|X=0)且p(Y0|X=1)=p(Y0|X=0),即如果干預(yù)總體的潛在結(jié)果Y0和Y1的分布與對(duì)照總體的潛在結(jié)果的分布相同,那么可以說(shuō)在干預(yù)組和對(duì)照組之間無(wú)因混在因素而產(chǎn)生的混雜偏差.
本節(jié)將在3.2節(jié)所介紹的潛在結(jié)果模型的三個(gè)基本假設(shè)基礎(chǔ)上,對(duì)潛在結(jié)果模型中現(xiàn)有的因果推理方法進(jìn)行延展,根據(jù)其控制混雜因素的方式,我們重點(diǎn)介紹其中三種:匹配法、逆概率加權(quán)和分層方法.
3.3.1 匹配法
在可忽略性假設(shè)中,協(xié)變量在干預(yù)組和對(duì)照組之間的差別往往對(duì)因果推斷的準(zhǔn)確性起著舉足輕重的作用,為了消除協(xié)變量分布在兩組研究對(duì)象之間的差異,匹配法(Matching methods)常用于觀察性研究中,其目的就是對(duì)每一個(gè)研究對(duì)象匹配一個(gè)具有相同或相近協(xié)變量取值的研究對(duì)象集合,使得通過(guò)匹配得到的數(shù)據(jù)在干預(yù)組和對(duì)照組之間有著相同的協(xié)變量分布,然后再根據(jù)匹配數(shù)據(jù)進(jìn)行因果推斷.Cochran和Rubin[24]在1973年提出用一個(gè)或多個(gè)協(xié)變量構(gòu)建協(xié)變量集合,但在一些因果關(guān)系中,所涉及到的協(xié)變量較多,難以判定根據(jù)哪些協(xié)變量構(gòu)造的集合做匹配才能得到最準(zhǔn)確的結(jié)果.因此,文獻(xiàn)[25]中提出了傾向值匹配(Propensity score matching),即將協(xié)變量的傾向值作為參考值來(lái)構(gòu)造匹配集合,并逐漸成為了觀察性研究中最常用的匹配方法;這種方法形式化定義傾向值為給定協(xié)變量時(shí)干預(yù)的條件概率,并提出如果在給定協(xié)變量的情況下可忽略性假設(shè)成立,那么在給定傾向值時(shí)可忽略性假設(shè)也成立,因此可以用傾向值替代協(xié)變量在因果推斷中進(jìn)行分層或匹配,從而避免了從眾多協(xié)變量中遴選最適組合的困難.文獻(xiàn)[26]中根據(jù)給定研究對(duì)象集合,提出根據(jù)研究對(duì)象匹配數(shù)構(gòu)造匹配集合的方法,并根據(jù)通用匹配估計(jì)平均因果效應(yīng).如果在實(shí)際運(yùn)算中無(wú)從得知真實(shí)的傾向值,那么可以首先根據(jù)觀察數(shù)據(jù)進(jìn)行預(yù)先估計(jì),然后再用估計(jì)所得的傾向值做匹配,常用的基于傾向值匹配的方法包括回歸[27]和決策樹(shù)[28]等.
3.3.2 逆概率加權(quán)
除匹配法之外,逆概率加權(quán)估計(jì)方法[29]也是一種基于傾向值的方法.由于混雜因素的存在,干預(yù)組和對(duì)照組的協(xié)變量分布不同,會(huì)導(dǎo)致內(nèi)生選擇性偏差,逆概率加權(quán)就是消除內(nèi)生選擇性偏差最有效的方法之一.通過(guò)給觀測(cè)數(shù)據(jù)中的每個(gè)研究對(duì)象分配適當(dāng)?shù)臋?quán)重,可以創(chuàng)建一個(gè)干預(yù)組與對(duì)照組具有相似分布的偽總體.樣本重加權(quán)方法涉及到的關(guān)鍵概念—均衡得分(Balancing score),經(jīng)均衡得分處理后的協(xié)變量與干預(yù)分配機(jī)制相獨(dú)立,傾向值就是均衡得分中的一種.
逆概率加權(quán)(Inverse propensity weighting, IPW)將權(quán)重w分配給每個(gè)研究對(duì)象:w=X/π(x)+(1?X)/(1?π(x)),其中,X表示 分配機(jī)制,π(x)表示傾向值.文獻(xiàn)[30]在重加權(quán)后,可以將∑平均因果效應(yīng)的逆概率加權(quán)估計(jì)為:文獻(xiàn)[31]表明,經(jīng)不同規(guī)模的研究表明傾向值機(jī)制足以消除因協(xié)變量而產(chǎn)生的偏差;然而在實(shí)際估計(jì)中,逆概率加權(quán)的正確性高度依賴(lài)傾向值的正確性,一旦傾向值計(jì)算出現(xiàn)偏差就會(huì)嚴(yán)重影響逆概率加權(quán)的準(zhǔn)確性.
3.3.3 分層方法
分層方法(Stratification)又被稱(chēng)為子分類(lèi),是調(diào)整混雜因素的代表性方法之一.這種方法通過(guò)將整個(gè)總體劃分為同質(zhì)的子分層(Block)來(lái)調(diào)整因干預(yù)組和對(duì)照組之間差別造成的偏差.理想狀況下每個(gè)子層中干預(yù)組和對(duì)照組在協(xié)變量前提下的特定觀測(cè)值是相似的,因此,同個(gè)子層中的研究對(duì)象可以看作遵循隨機(jī)對(duì)照試驗(yàn)的分配機(jī)制,也可以依據(jù)隨機(jī)對(duì)照試驗(yàn)中的計(jì)算方法計(jì)算各子層內(nèi)的平均因果效應(yīng).與直接計(jì)算干預(yù)組和對(duì)照組結(jié)果差值的估計(jì)方法相比,分層方法顯著降低了平均因果估計(jì)的偏差,但如何確定分層方式又是另一個(gè)研究要點(diǎn).
等概率(Equal-frequency)方法[25]通過(guò)傾向值對(duì)總體進(jìn)行分層,使得協(xié)變量在每一個(gè)子層中具有相等的傾向值,總體的平均因果效應(yīng)則通過(guò)每個(gè)子層中平均因果效應(yīng)的加權(quán)平均進(jìn)行估計(jì).然而這種方法會(huì)在某些權(quán)重過(guò)高或過(guò)低的子層中導(dǎo)致較大的方差,針對(duì)這類(lèi)問(wèn)題,文獻(xiàn)[32]提出了一種對(duì)傾向值分層得到的子層進(jìn)行逆概率加權(quán)的估計(jì)方法,降低了等概率方法中出現(xiàn)的高方差問(wèn)題.
除潛在結(jié)果模型外,因果推斷中使用最多的一類(lèi)模型就是結(jié)構(gòu)因果模型(Structure causal model,SCM),Pearl[33]闡述了這兩類(lèi)模型的等價(jià)性.相比之下,潛在結(jié)果模型更加精確,而結(jié)構(gòu)因果模型更加直觀.結(jié)構(gòu)因果模型可以描述多個(gè)變量之間的因果關(guān)系,Pearl基于貝葉斯網(wǎng)絡(luò)提出了外部干預(yù)的概念,并基于外部干預(yù)對(duì)因果關(guān)系形成了一種形式化表達(dá)方法,開(kāi)創(chuàng)了從數(shù)據(jù)中發(fā)掘因果關(guān)系和數(shù)據(jù)產(chǎn)生機(jī)制的方法.
圖論作為一種用途廣泛的數(shù)學(xué)語(yǔ)言,可以直觀地描述事物之間相互影響的關(guān)系,也能夠經(jīng)過(guò)簡(jiǎn)單運(yùn)算解決因果問(wèn)題.在數(shù)學(xué)中,有向圖[34]中節(jié)點(diǎn)X和Y之間的路徑是指從X開(kāi)始到Y(jié)結(jié)束的一系列由邊首尾相接的節(jié)點(diǎn),路徑上的第一個(gè)節(jié)點(diǎn)稱(chēng)為該路徑上所有節(jié)點(diǎn)的祖先節(jié)點(diǎn),其他節(jié)點(diǎn)俱為祖先節(jié)點(diǎn)的后代節(jié)點(diǎn)[35].如果兩個(gè)節(jié)點(diǎn)之間的路徑能夠沿著箭頭方向追蹤,那么這條路徑就稱(chēng)為有向路徑.當(dāng)圖中存在一個(gè)節(jié)點(diǎn)存在回到自身的有向路徑時(shí),這個(gè)圖稱(chēng)為有環(huán)圖,不存在環(huán)的有向圖就是有向無(wú)環(huán)圖(Directed acyclic graph,DAGs)[33].
從因果推斷經(jīng)典問(wèn)題辛普森悖論[36]可知,某些決策無(wú)法僅從數(shù)據(jù)本身獲得有效信息,而是要細(xì)究數(shù)據(jù)背后的原因.為了能夠嚴(yán)格地處理這些因果關(guān)系問(wèn)題,Pearl尋找出了一種能夠借助圖論這種數(shù)學(xué)工具形式化表述數(shù)據(jù)背后因果假設(shè)的方法,即結(jié)構(gòu)因果模型(Structural causal model,SCM).其可用于描述現(xiàn)實(shí)世界關(guān)聯(lián)特征及其相互作用,具體而言,結(jié)構(gòu)因果模型描述了如何為感興趣的變量賦值.
從形式上看,結(jié)構(gòu)因果模型由一組函數(shù):f={fx:Wx→X|X∈V},和兩個(gè)變量集U和V構(gòu)成,其中U中的變量稱(chēng)為外生變量,V中的變量稱(chēng)為內(nèi)生變量,模型中的每一個(gè)內(nèi)生變量都至少是一個(gè)外生變量的后代;外生變量在圖中表現(xiàn)為一個(gè)根節(jié)點(diǎn),它沒(méi)有祖先節(jié)點(diǎn),特別不能是內(nèi)生變量的后代.如果知道每個(gè)外生變量的值,那么利用函數(shù)fx就可以完全確定每個(gè)內(nèi)生變量的值.
我們主要討論基于有向無(wú)環(huán)圖的結(jié)構(gòu)因果模型[37],因此可以給出因果關(guān)系的圖形化定義:在圖模型中,如果變量X是變量Y的子節(jié)點(diǎn),那么Y是X的直接原因;如果變量X是變量Y的后代節(jié)點(diǎn),那么Y是X的潛在原因(非傳遞性的特殊情況此處不予討論).
在結(jié)構(gòu)因果模型的理論體系中,因果關(guān)系的推斷依托于有向無(wú)環(huán)圖的三種基本路徑結(jié)構(gòu),即鏈狀結(jié)構(gòu)、叉狀結(jié)構(gòu)和對(duì)撞結(jié)構(gòu),三種結(jié)構(gòu)具有不同的信息流轉(zhuǎn)方式,所有因果圖都可以拆解為這三類(lèi)結(jié)構(gòu)的組合,因此路徑結(jié)構(gòu)在結(jié)構(gòu)因果模型的學(xué)習(xí)中占據(jù)著舉足輕重的地位.鏈狀結(jié)構(gòu)(Chain)就像一條鏈子一樣,可以表示為:X→Y→Z,表示信息僅可單向流通;叉狀結(jié)構(gòu)(Forks)X←Y→Z表示信息可以從中間分發(fā)到兩端;對(duì)撞結(jié)構(gòu)(Collider)X→Y←Z表示中間同時(shí)接收兩端節(jié)點(diǎn)的信息.在結(jié)構(gòu)因果模型中不管多么復(fù)雜的結(jié)構(gòu)都可以拆分為以上三種結(jié)構(gòu)的組合,三種結(jié)構(gòu)也可能導(dǎo)致不同的偏差.鏈狀結(jié)構(gòu)會(huì)導(dǎo)致過(guò)度控制偏差,叉狀結(jié)構(gòu)會(huì)導(dǎo)致混淆偏差,對(duì)撞結(jié)構(gòu)會(huì)導(dǎo)致內(nèi)生選擇性偏差;在復(fù)雜因果模型的拆解分析中需要考慮全部因果路徑,才能推斷出準(zhǔn)確的因果關(guān)系.
因果關(guān)系已經(jīng)成為了現(xiàn)代社會(huì)最重要的認(rèn)知工具之一,基于人類(lèi)認(rèn)知的發(fā)展,Pearl[33]將因果關(guān)系劃分為三個(gè)層級(jí):第一個(gè)層級(jí)是關(guān)聯(lián)(Association),它涉及到由數(shù)據(jù)定義的統(tǒng)計(jì)相關(guān)性,觀察性研究也正是依托于這一層級(jí)而實(shí)現(xiàn)的統(tǒng)計(jì)學(xué)方法;第二個(gè)層級(jí)是干預(yù)(Intervention),它不僅表明了通過(guò)觀測(cè)數(shù)據(jù)能直觀地看到規(guī)律,更想知道如果對(duì)觀察對(duì)象做出干預(yù)行為會(huì)導(dǎo)致什么結(jié)果;第三個(gè)層級(jí)是反事實(shí)(Counterfactual),這一層級(jí)是對(duì)過(guò)去所發(fā)生的行為的溯因和思考,比如“如果某個(gè)研究對(duì)象沒(méi)有采取A操作,而是采取B操作,與現(xiàn)在得到的結(jié)果會(huì)有何不同?”人類(lèi)要想改變世界和創(chuàng)構(gòu)世界,就要邁上因果之梯的更高層級(jí).
4.2.1 關(guān)聯(lián)
圖模型不僅能提供對(duì)因果關(guān)系的直觀表述,還能有效表達(dá)聯(lián)合分布.利用結(jié)構(gòu)因果模型可以有效表示n個(gè)變量的聯(lián)合分布:通過(guò)確定表述變量之間關(guān)系的n個(gè)函數(shù),以及誤差項(xiàng)的概率分析,就可以得到聯(lián)合分布概率以及各個(gè)邊緣概率之間的關(guān)聯(lián).對(duì)于任何有向無(wú)環(huán)圖,模型中變量的聯(lián)合分布可以通過(guò)計(jì)算條件概率分布P(子節(jié)點(diǎn)|父節(jié)點(diǎn))的乘積得出,它不再需要?jiǎng)?chuàng)建一個(gè)概率表,在海量模型數(shù)據(jù)運(yùn)算中節(jié)約了大量的時(shí)間;因此,圖的深層意義就是將一個(gè)高維分布估計(jì)問(wèn)題降維成一個(gè)低維分布估計(jì)問(wèn)題.
但是當(dāng)我們無(wú)法得知變量之間具體的函數(shù)關(guān)系,或無(wú)法獲取誤差項(xiàng)的分布時(shí),就可以應(yīng)用下述d-分離法則解決以上問(wèn)題.實(shí)際應(yīng)用中基于圖模型的因果關(guān)系表達(dá)往往更加復(fù)雜,變量之間可能有多條路徑連接,且每個(gè)路徑耦合多個(gè)基礎(chǔ)路徑結(jié)構(gòu);因此,應(yīng)用貝葉斯網(wǎng)絡(luò)中的d-分離方法對(duì)一個(gè)復(fù)雜的因果圖模型做解構(gòu).d-分離的判斷方法是一對(duì)節(jié)點(diǎn)之間是否存在一條連通路徑,如果存在即為d-連通;如果不存在則為d-分離,也就是這兩個(gè)變量相互獨(dú)立.d-分離主要分為兩類(lèi):①不以特定節(jié)點(diǎn)為條件,只有對(duì)撞節(jié)點(diǎn)可以阻斷一條路徑;②以特定節(jié)點(diǎn)為條件,包含鏈狀和叉狀結(jié)構(gòu)的中間節(jié)點(diǎn)以及對(duì)撞結(jié)構(gòu)除對(duì)撞節(jié)點(diǎn)外的其他節(jié)點(diǎn).使用d-分離工具研究復(fù)雜圖模型的優(yōu)勢(shì)在于d-分離是非參數(shù)的,僅需要依托圖模型進(jìn)行運(yùn)算,而不需要參考變量之間的函數(shù)關(guān)系,并且d-分離僅能實(shí)施局部性的檢驗(yàn)?zāi)P?,而非進(jìn)行全局性的檢驗(yàn),這使得它可以識(shí)別假設(shè)模型中有缺陷的特定區(qū)域并對(duì)其進(jìn)行修復(fù)完善,從而得到一個(gè)全新的模型.
4.2.2 干預(yù)
關(guān)聯(lián)是以觀測(cè)數(shù)據(jù)為研究對(duì)象進(jìn)行統(tǒng)計(jì)分析,其并未改變數(shù)據(jù)的分布,而干預(yù)就是要改變現(xiàn)有的數(shù)據(jù)分布.在理想情況下,隨機(jī)對(duì)照試驗(yàn)輸出變量的變化必然是由于輸入變量而引起的.在隨機(jī)對(duì)照試驗(yàn)不可行的情況下,研究者們采用觀察性研究方法,但這種方法很難將因果關(guān)系從相關(guān)關(guān)系中識(shí)別出來(lái),因此,在實(shí)際應(yīng)用中研究通過(guò)干預(yù)方法預(yù)測(cè)干預(yù)措施的效果顯得尤為重要.對(duì)此,Pearl[38]提出用do運(yùn)算表達(dá)干預(yù).比如P(Y=y|X=x)表示在X=x的條件下Y=y的概率分布,它反映了在X取值都是x的個(gè)體上Y的總體分布.而P(Y=y|do(X=x))表示通過(guò)干預(yù)使X=x時(shí)Y=y的概率分布,它反映了將群體中所有個(gè)體的X取值都固定為x時(shí)Y=y的總體分布.
因果推斷中的識(shí)別性和傳統(tǒng)統(tǒng)計(jì)中的識(shí)別性定義是一致的.統(tǒng)計(jì)學(xué)中,如果兩個(gè)不同的模型參數(shù)對(duì)應(yīng)不同的觀測(cè)數(shù)據(jù)的分布,那么我們稱(chēng)模型的參數(shù)可以識(shí)別.這里,如果因果效應(yīng)可以用觀測(cè)數(shù)據(jù)的分布唯一地表示,那么我們稱(chēng)因果效應(yīng)是可以識(shí)別的,因果關(guān)系可以通過(guò)do表達(dá)式和圖模型從相關(guān)關(guān)系中識(shí)別出來(lái).在明確因果關(guān)系可識(shí)別后,就需要通過(guò)施加相應(yīng)的干預(yù)來(lái)研究其因果效應(yīng),結(jié)構(gòu)因果模型中對(duì)研究對(duì)象施加干預(yù)主要依托以下三種手段.
(1)校正公式:在因果估計(jì)中,通過(guò)計(jì)算平均因果效應(yīng)以估計(jì)接受干預(yù)do(X=1)和do(X=0)之間的差別,但是在沒(méi)有因果關(guān)聯(lián)的情況下,無(wú)從直接通過(guò)觀測(cè)數(shù)據(jù)本身估計(jì)因果效應(yīng).因此需要通過(guò)借助圖模型,以對(duì)圖進(jìn)行處理的方式模擬干預(yù),即對(duì)哪個(gè)變量進(jìn)行干預(yù)就把指向它的箭頭去掉.在校正公式中使用Pm表示修改后的圖模型的概率,因此也被稱(chēng)為操縱概率.
假設(shè)X是Y的原因,且Z是X,Y的共因,即因果圖中存在X→Y和X←Z→Y兩條路徑.如果想要通過(guò)干預(yù)知道P(Y=y|do(X=x))的值,也即是Pm(Y=y|X=x),則將Z指向X的箭頭移除.在經(jīng)過(guò)干預(yù)后,Z的邊緣分布是不變的,即Pm(Z=z)=P(Z=z),因?yàn)橐瞥赶騒的箭頭是不影響Z的概率分布的;同時(shí),經(jīng)過(guò)干預(yù)后,條件概率P(Y=y|Z=z,X=x)也是不變的,因?yàn)椴还躕是自發(fā)變化還是被干預(yù)變化,Y對(duì)X和Z的響應(yīng)函數(shù)不變.因模型修改后X與Z是d-分離的,即Pm(Z=z|X=x)=Pm(Z=z)=P(Z=z).
綜上可知:P(Y=y|do(X=x))=∑zPm(Y=y|X=x,Z=z)Pm(Z=z).最后利用不變性關(guān)系,得到一個(gè)將干預(yù)降維表示的概率公式P(Y=y|do(X=x))=∑zP(Y=y|X=x,Z=z)P(Z=z),這就是校正公式.校正公式對(duì)Z的每一個(gè)取值z(mì)計(jì)算了X和Y之間的關(guān)系,然后對(duì)這些值求平均,這個(gè)過(guò)程就被稱(chēng)為“對(duì)Z的校正”.
(2)后門(mén)準(zhǔn)則:根據(jù)校正公式的討論可以得知,為了確定一個(gè)變量對(duì)另一個(gè)變量的因果效應(yīng),需要對(duì)該變量的父節(jié)點(diǎn)變量進(jìn)行校正;但實(shí)際上變量往往會(huì)受到一些不可觀測(cè)的父節(jié)點(diǎn)影響,因此需要找到一個(gè)替代變量集合來(lái)用于校正.那么這個(gè)問(wèn)題就引發(fā)了另一個(gè)深層次的問(wèn)題:在什么條件下,因果圖足以描述給定數(shù)據(jù)集的因果效應(yīng)?這就涉及到了計(jì)算因果效應(yīng)的一個(gè)重要干預(yù)工具—后門(mén)準(zhǔn)則.
后門(mén)準(zhǔn)則[39]的標(biāo)準(zhǔn)定義為:給定一個(gè)有向無(wú)環(huán)圖G及其中一對(duì)有序變量(X,Y),如果變量集合Z中的節(jié)點(diǎn)都不是X的后代節(jié)點(diǎn),且以Z阻斷了X,Y之間的所有含有指向X的路徑(即后門(mén)路徑),那么Z滿(mǎn)足X,Y之間的后門(mén)準(zhǔn)則,X對(duì)Y的因果效應(yīng)可以通過(guò)校正公式進(jìn)行計(jì)算.后門(mén)準(zhǔn)則的變量集合Z要求:①可以阻斷任何含有指向X的后門(mén)路徑,避免使X,Y相關(guān)但不傳遞X產(chǎn)生的因果效應(yīng);②不以X的后代節(jié)點(diǎn)為條件,避免阻斷X,Y之間的因果路徑;③不以對(duì)撞節(jié)點(diǎn)為條件,避免在X,Y之間產(chǎn)生新路徑.
(3)前門(mén)準(zhǔn)則:在嘗試采取隨機(jī)對(duì)照試驗(yàn)以外的方法估計(jì)因果效應(yīng)時(shí),后門(mén)準(zhǔn)則提供了一種簡(jiǎn)便方法識(shí)別需要校正的變量集合,但當(dāng)變量X,Y之間存在不可觀測(cè)變量無(wú)法阻斷從X到Y(jié)的后門(mén)路徑時(shí),其因果效應(yīng)依然是不可識(shí)別的[40].為了處理這種特殊情況,Pearl提出了前門(mén)準(zhǔn)則:給定一個(gè)有向無(wú)環(huán)圖G及其中一對(duì)有序變量(X,Y),如果變量集合Z中的節(jié)點(diǎn)①切斷了所有X,Y之間的有向路徑;②X到Z之間沒(méi)有后門(mén)路徑;③所有Z到Y(jié)的后門(mén)路徑都被X阻斷;那么可以通過(guò)前門(mén)準(zhǔn)則進(jìn)行校正.
例如,圖模型G中存在兩條因果路徑:U→Y和U→X→Y→Z.假設(shè)U是不可觀測(cè)變量,且沒(méi)有變量能夠阻斷X←U→Y這條偽路徑,P(Y=y|do(X=x))只能通過(guò)兩次后門(mén)準(zhǔn)則來(lái)識(shí)別.首先,X到Z之間沒(méi)有后門(mén)路徑,因此其因果效應(yīng)可識(shí)別P(Z=z|do(X=x))=P(Z=z|X=x);其次,從Z到Y(jié)的后門(mén)路徑Z←X←U→Y以X為條件阻斷,再將兩部分因果效應(yīng)連接∑起來(lái)獲得的整體因果效應(yīng),P(Y=y|do(Z=z))=xP(Y=y|X=x,Z=z)P(X=x)去除do運(yùn)算得到前門(mén)公式,再將兩部分連接起來(lái)獲得X,Y的整體因果效應(yīng):P(Y=y|do(X=x))=∑zP(Y=y|do(Z=z))P(Z=z|do(X=x)),用以上兩個(gè)公∑式替換,去除do運(yùn)算得到:P(Y=y|do(Z=z))=xP(Y=y|X=x,Z=z)P(X=x),即前門(mén)公式.
基于校正公式的前門(mén)準(zhǔn)則和后門(mén)準(zhǔn)則在消除do運(yùn)算的情況下對(duì)因果圖進(jìn)行干預(yù),僅通過(guò)已知的觀測(cè)數(shù)據(jù)和變量分布就可以對(duì)變量間的因果關(guān)系進(jìn)行推斷.從理論上講,這兩種方法已經(jīng)基本涵蓋了因果推斷中的大部分可能性,但是實(shí)際上,我們無(wú)法通過(guò)觀測(cè)數(shù)據(jù)得到所有Z的可能取值,更無(wú)法對(duì)Z的全部值計(jì)算概率再求和,在干預(yù)方法導(dǎo)致算力受限時(shí),可以通過(guò)逆概率加權(quán)方法克服校正方法的實(shí)際困難.
4.2.3 反事實(shí)
基于結(jié)構(gòu)因果模型的反事實(shí)推理核心在于:雖然現(xiàn)實(shí)情況下X=1,但假如X=0時(shí),Y會(huì)發(fā)生怎樣的變化?從上一部分我們知道可以通過(guò)do運(yùn)算對(duì)因果圖進(jìn)行干預(yù)從而估計(jì)因果關(guān)系,但是在反事實(shí)中,do運(yùn)算太過(guò)籠統(tǒng),不能明確區(qū)分干預(yù)與反事實(shí),因此使用新的表達(dá)方式來(lái)標(biāo)記事實(shí)結(jié)果與反事實(shí)結(jié)果.
(1)反事實(shí)的定義與形式化表達(dá).
定義一個(gè)完全確定的模型M并用G表達(dá)M中的函數(shù)集,已知外生變量集U和內(nèi)生變量集V,其中U=u代表對(duì)某個(gè)外生變量的賦值.反事實(shí)語(yǔ)句“在U=u的情況下,若假設(shè)X取值x,則Y會(huì)取值y”記作Yx(u)=y,其中X,Y均為V中的任意兩個(gè)變量.假設(shè)一個(gè)結(jié)構(gòu)因果模型M,其中X=aU,Y=bX+U,那么計(jì)算反事實(shí)Yx(u),即在U=u情況下,假設(shè)X取值x,Y的取值情況;用X=x替換掉X=aU得到修改模型Mx,再代入U(xiǎn)=u得到Y(jié)x(u)=bx+U.將反事實(shí)概念推廣到任何結(jié)構(gòu)因果模型M,反事實(shí)Yx(u)可形式化定義為:Yx(u)=YMx(u),表示模型M中的反事實(shí)Yx(u)定義為修改后的子模型Mx中Y的解.反事實(shí)一般遵循如下一致性規(guī)則:如果X=x,則Yx=y.
反事實(shí)因果估計(jì)一般分為確定性模型和非確定性模型,針對(duì)這兩種因果模型的計(jì)算都可以分三步走.其中,針對(duì)確定性模型:①溯因(Abduction),用證據(jù)E=e確定外生變量U的值;②行動(dòng)(Action),修改模型M并用X=x替換掉原來(lái)模型中變量X的表達(dá)式;③預(yù)測(cè)(Prediction),使用修正后的模型Mx和U計(jì)算反事實(shí)結(jié)果Y值.從時(shí)間出發(fā)對(duì)上述計(jì)算步驟進(jìn)行解釋?zhuān)紫雀鶕?jù)當(dāng)前證據(jù)e解釋過(guò)去U,再通過(guò)最低限度的干預(yù)來(lái)符合假設(shè)的X=x,最后根據(jù)對(duì)過(guò)去的認(rèn)識(shí)和新增的條件來(lái)預(yù)測(cè)未來(lái).類(lèi)似的,針對(duì)非確定性的模型總結(jié)的計(jì)算步驟為:①溯因,通過(guò)證據(jù)更新P(U)獲得P(U|E=e);②行動(dòng),修改模型M并用X=x替換掉原來(lái)模型中變量X的表達(dá)式;③使用修正后的模型Mx和P(U|E=e)計(jì)算反事實(shí)結(jié)果Y值.
使用do運(yùn)算表達(dá)干預(yù)是一種很好的方法,那么能否在反事實(shí)中也沿用do運(yùn)算呢?首先,反事實(shí)表達(dá)與do運(yùn)算之間存在著巨大差異:do運(yùn)算刻畫(huà)了干預(yù)之下的總體行為,而Yx(u)描述了一個(gè)特定研究對(duì)象U=u在干預(yù)之下的行為,反映了計(jì)算總體水平與個(gè)體水平之間的差別.do運(yùn)算不能刻畫(huà)反事實(shí)問(wèn)題,即E(do(X=1),Z=1)≠E(YX=1|Z=1).因?yàn)榍罢邔=1看作干預(yù)后的條件在X=1和X=0兩個(gè)前提下所滿(mǎn)足的不同研究對(duì)象的集合,而后者是在當(dāng)前世界中定義Z=1的單獨(dú)研究對(duì)象集合,do運(yùn)算不能描述后者.因此,do運(yùn)算可以描述干預(yù)后的世界,而反事實(shí)既能描述單一世界又能刻畫(huà)跨世界的事件概率.
(2)反事實(shí)的圖形化表達(dá).
反事實(shí)作為結(jié)構(gòu)方程的衍生理論,也可以在與模型相關(guān)的因果圖中得到表達(dá).如果修改模型M得到子模型Mx,那么Mx中的結(jié)果變量Y就是原模型中的反事實(shí)Yx.模型修改要求移除所有指向修改變量X的箭頭,也就是說(shuō),只有在修改后的模型中,與變量Y相關(guān)聯(lián)的節(jié)點(diǎn)替換為與Yx相關(guān)聯(lián)才成立.
事實(shí)上,如果變量集Z滿(mǎn)足X→Y的后門(mén)條件,那么在給定Z的條件下,對(duì)于變量X的所有取值x,反事實(shí)結(jié)果Yx都與X獨(dú)立,即P(Yx|X,Z)=P(Yx|Z).根據(jù)以上∑定理結(jié)合一致性規(guī)則便可得到,P(Yx=y)=zP(Yx=y|X=x,Z=z)P(z),這就是熟悉的校正公式.
結(jié)構(gòu)因果模型主要解決的問(wèn)題是識(shí)別變量間的因果效應(yīng),其與潛在結(jié)果所解決的問(wèn)題具有一定的相似性,但可以比潛在結(jié)果模型更加精準(zhǔn)地判斷混雜因素[41].比如,當(dāng)一個(gè)變量與干預(yù)對(duì)象和結(jié)果變量相關(guān)時(shí),利用潛在結(jié)果方法無(wú)法判斷出其是否是混雜因素,但文獻(xiàn)[40]基于結(jié)構(gòu)因果模型方法提出了區(qū)分混雜因素和其他變量的方法文獻(xiàn)[39]提出了基于結(jié)構(gòu)因果模型的前門(mén)準(zhǔn)則識(shí)別方法.相較于潛在結(jié)果模型,結(jié)構(gòu)因果模型方法需要知曉現(xiàn)有因果模型,而潛在結(jié)果模型無(wú)需得知結(jié)構(gòu)模型,但是需要遵循三個(gè)基本假設(shè)[42].
SCM是對(duì)變量間因果關(guān)系的定性分析,將結(jié)構(gòu)因果模型進(jìn)行參數(shù)化,利用結(jié)構(gòu)方程模型(Structure equation model,SEM)定量描述.在SEM中結(jié)果變量Y可以用結(jié)構(gòu)方程表達(dá)為Y=f(X,a),其中X是研究對(duì)象集合,a是誤差項(xiàng)且獨(dú)立于X.文獻(xiàn)[43]提出了當(dāng)誤差項(xiàng)不滿(mǎn)足高斯分布或結(jié)構(gòu)方程為非線(xiàn)性時(shí),研究對(duì)象與誤差項(xiàng)之間的因果關(guān)系是可識(shí)別的;文獻(xiàn)[44]將潛在混雜因素納入因果推斷的考量范疇,并使用獨(dú)立成分分析技術(shù)(Independent component analysis,ICA)進(jìn)行推理模型選擇.針對(duì)似然函數(shù)存在的馬爾可夫等價(jià)類(lèi)問(wèn)題,文獻(xiàn)[45]將SEM引入似然函數(shù)計(jì)算框架實(shí)現(xiàn)了似然函數(shù)和SEM的結(jié)合算法;文獻(xiàn)[46]提出了一種采用分治策略的混合加誤差模型與條件獨(dú)立性檢測(cè)的因果方向推斷方法.針對(duì)存在隱含變量的因果關(guān)系推斷,文獻(xiàn)[47]利用探索性因子分析得到相對(duì)獨(dú)立的各個(gè)隱含變量,再使用路徑分析算法估計(jì)變量之間的因果關(guān)系.針對(duì)高斯稀疏圖模型,文獻(xiàn)[48]基于原有圖模型構(gòu)造了可逆的馬爾可夫鏈,在高維稀疏圖上進(jìn)行隨機(jī)抽樣;文獻(xiàn)[49]提出了一種基于互信息的高維數(shù)據(jù)因果推斷算法,將高維網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)問(wèn)題分解為每一個(gè)節(jié)點(diǎn)的因果推斷問(wèn)題.文獻(xiàn)[50]中比較了DAG、SEM、貝葉斯網(wǎng)絡(luò)和TAN貝葉斯網(wǎng)絡(luò)四種模型在數(shù)據(jù)因果推斷中的原理和應(yīng)用價(jià)值,并為因果推斷模型選型提供了有力的參考依據(jù).
研究因果關(guān)系、挖掘因果關(guān)系的科學(xué)方法對(duì)各個(gè)學(xué)科領(lǐng)域都具有一定的普適性,因果推斷在計(jì)量經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域中都得到了頗為豐碩的研究成果.
早期計(jì)量經(jīng)濟(jì)學(xué)的主要目標(biāo)是運(yùn)用概率統(tǒng)計(jì)方法對(duì)經(jīng)濟(jì)變量之間的因果關(guān)系進(jìn)行定量分析,更加偏重總結(jié)、估計(jì)和假設(shè)檢驗(yàn),并不十分關(guān)注預(yù)測(cè).機(jī)器學(xué)習(xí)則因其實(shí)操屬性更加片中預(yù)測(cè)而非因果推斷.進(jìn)入大數(shù)據(jù)時(shí)代后,二者的聯(lián)系開(kāi)始加強(qiáng),傳統(tǒng)計(jì)量方法在樣本量少且維度低的數(shù)據(jù)中應(yīng)用效果較好,但無(wú)法很好地處理大規(guī)模和高維異構(gòu)數(shù)據(jù).大數(shù)據(jù)時(shí)代的豐富數(shù)據(jù)為從概率論立場(chǎng)研究因果關(guān)系提供了新視角,海量樣本數(shù)據(jù)有助于從根本上克服由于抽樣偏頗所引起的內(nèi)生選擇性偏差,使得對(duì)因果關(guān)系的檢驗(yàn)比有限樣本的抽樣數(shù)據(jù)更為文件可靠.2015年,Bareinboim和Pearl[51]提到了因果推斷和數(shù)據(jù)融合問(wèn)題,提出將機(jī)器學(xué)習(xí)融合到高維數(shù)據(jù)因果推斷中的初步構(gòu)想.文獻(xiàn)[52]從機(jī)器學(xué)習(xí)與傳統(tǒng)因果推斷計(jì)量方法相結(jié)合入手,總結(jié)機(jī)器學(xué)習(xí)在策略評(píng)估和事后分析中的應(yīng)用.文獻(xiàn)[53]利用機(jī)器學(xué)習(xí)算法循環(huán)將各協(xié)變量劃分成多個(gè)子層,計(jì)算每個(gè)子層內(nèi)的平均因果效應(yīng)后,再加權(quán)得出總體平均因果效應(yīng),利用隨機(jī)森林估計(jì)傾向得分.文獻(xiàn)[54]則引入?yún)f(xié)變量平衡傾向得分,通過(guò)模型的干預(yù)分配來(lái)優(yōu)化協(xié)變量平衡,顯著改善了傾向得分匹配和加權(quán)方法的性能.目前大多數(shù)研究都利用機(jī)器學(xué)習(xí)“數(shù)據(jù)驅(qū)動(dòng)”的特點(diǎn),全面考慮各種模型以進(jìn)行反事實(shí)推斷,如文獻(xiàn)[55]中提出了一種雙重選擇方法,分別篩選與干預(yù)分配和結(jié)果變量都相關(guān)的協(xié)變量,并對(duì)兩組協(xié)變量進(jìn)行最小二乘回歸,相較于簡(jiǎn)單正則化回歸,該方法改善了平均因果效應(yīng)的估計(jì)效果.文獻(xiàn)[56]則分別使用決策樹(shù)、隨機(jī)森林、K近鄰和神經(jīng)網(wǎng)絡(luò)來(lái)揭示數(shù)據(jù)模式的流程,可以更好地闡明交互作用和非線(xiàn)性效果,作為傳統(tǒng)因果推斷的補(bǔ)充.文獻(xiàn)[57]提出了一種雙穩(wěn)健的交叉擬合估計(jì)器以估計(jì)平均因果關(guān)系,在大樣本場(chǎng)景下具有更好的統(tǒng)計(jì)特性.文獻(xiàn)[58]提出了一種新的基于機(jī)器學(xué)習(xí)的無(wú)監(jiān)督學(xué)習(xí)方法—基于視覺(jué)常識(shí)區(qū)域的卷積神經(jīng)網(wǎng)絡(luò),將學(xué)習(xí)目標(biāo)由常規(guī)的似然性轉(zhuǎn)換為基于因果干預(yù),僅使用特征連接來(lái)支持各種高級(jí)任務(wù).
因果推斷在計(jì)算機(jī)科學(xué)中也具有廣泛應(yīng)用,可與計(jì)算機(jī)視覺(jué)、推薦系統(tǒng)等方向結(jié)合.在計(jì)算機(jī)視覺(jué)中,現(xiàn)有的視覺(jué)問(wèn)答(Visual question answering, VQA)更多地傾向于依賴(lài)語(yǔ)言而未能充分了解視覺(jué)和語(yǔ)言的多模態(tài)知識(shí).文獻(xiàn)[59]以Pearl所構(gòu)建的概率圖模型為基礎(chǔ),綜述了現(xiàn)今主流多模態(tài)統(tǒng)計(jì)學(xué)習(xí)方法,利用大數(shù)據(jù)背景下多模態(tài)數(shù)據(jù)對(duì)同一對(duì)象的描述形式多源異構(gòu)、內(nèi)在語(yǔ)義一致的特點(diǎn)研究更為有效的跨模態(tài)匹配.文獻(xiàn)[60]根據(jù)因果關(guān)系提出基于反事實(shí)框架的VQA模型,能夠通過(guò)從總因果效應(yīng)中減去直接語(yǔ)言效應(yīng)來(lái)減少對(duì)答案的提問(wèn)和降低語(yǔ)言偏差的提問(wèn).文獻(xiàn)[61]通過(guò)建立因果推斷框架尋求輸入樣本造成的直接因果效應(yīng),降低了深度學(xué)習(xí)圖像分類(lèi)中因長(zhǎng)尾效應(yīng)的存在而導(dǎo)致的結(jié)果偏差,可以有效解除矛盾效應(yīng)并提高識(shí)別準(zhǔn)確率.文獻(xiàn)[62]在弱監(jiān)督的語(yǔ)義分割中基于圖像背景和階級(jí)標(biāo)簽之間的因果關(guān)系,提出上下文調(diào)整(CONTA)方法,以消除圖像級(jí)分類(lèi)中的混淆偏差,從而為后續(xù)分割模型提供更好的基礎(chǔ).在零次學(xué)習(xí)(ZSL)和開(kāi)放式識(shí)別(OSR)中,常見(jiàn)的挑戰(zhàn)是由已知類(lèi)別上進(jìn)行訓(xùn)練所的結(jié)果推廣到未知類(lèi)別,但已知和未知的類(lèi)別之間的識(shí)別率嚴(yán)重不平衡;文獻(xiàn)[63]為ZSL和OSR提出一個(gè)反事實(shí)框架,有效改善了已知和未知的分類(lèi)失衡問(wèn)題,模型在整體性能方面得到顯著提高.針對(duì)基于關(guān)注的視覺(jué)語(yǔ)言模型中的混淆效果難以消除的問(wèn)題,文獻(xiàn)[64]基于前門(mén)準(zhǔn)則提出新的因果機(jī)制,通過(guò)減輕混淆效果提高注意力機(jī)制的性能.針對(duì)推薦系統(tǒng)存在的選擇偏差,文獻(xiàn)[65]通過(guò)提出一種新的域自適應(yīng)算法,采用小型無(wú)偏的數(shù)據(jù)集來(lái)糾正選擇偏差.盡管推薦系統(tǒng)能夠產(chǎn)生高質(zhì)量的建議,但由于使用黑盒預(yù)測(cè)模型,通常不能提供直觀的解釋?zhuān)晃墨I(xiàn)[66]在維持推薦模型的預(yù)測(cè)準(zhǔn)確性的基礎(chǔ)上,將來(lái)自用戶(hù)交互歷史的因果規(guī)則作為黑盒順序推薦機(jī)制的解釋?zhuān)梅词聦?shí)方法提取推薦模型的個(gè)性化因果關(guān)系,為黑盒推薦模型的行為提供個(gè)性化和更有效的解釋.
通過(guò)對(duì)反事實(shí)框架、潛在結(jié)果模型和結(jié)構(gòu)因果模型的分別闡述,不難看出這三類(lèi)分析框架既有共同點(diǎn),也存在差異.反事實(shí)框架更多的是一種文字描述,所涉及到的符號(hào)表達(dá)比較有限,更多依賴(lài)文字表達(dá)因果關(guān)系理論,哲學(xué)中的反事實(shí)更多是對(duì)休謨思想的清晰化闡述;但反事實(shí)框架基本仍停留在哲學(xué)思想層面,即便部分學(xué)者使用反事實(shí)框架描述因果關(guān)系,但其依然是根據(jù)潛在結(jié)果模型或結(jié)構(gòu)因果模型來(lái)構(gòu)造.
潛在結(jié)果模型強(qiáng)調(diào)對(duì)同一研究對(duì)象施加干預(yù)或不施加干預(yù)的效應(yīng)進(jìn)行比較從而得出該干預(yù)所產(chǎn)生的因果效應(yīng),它的成立依賴(lài)于三個(gè)關(guān)鍵假設(shè):第一、研究對(duì)象干預(yù)值穩(wěn)定性假設(shè),即研究對(duì)象之間相互獨(dú)立彼此干預(yù)與否都不會(huì)影響其他研究對(duì)象;第二、可忽略性假設(shè),即給定協(xié)變量的前提下,干預(yù)分配機(jī)制不會(huì)對(duì)潛在結(jié)果產(chǎn)生影響;第三、正值假設(shè),即在基于協(xié)變量的分層中,研究對(duì)象接受干預(yù)或?qū)φ盏母怕识际钦?基于以上假設(shè),潛在結(jié)果模型又有匹配、逆概率加權(quán)和分層等因果推斷方法.潛在結(jié)果模型將觀察性研究和試驗(yàn)性研究統(tǒng)一在一個(gè)框架下進(jìn)行結(jié)合,在有限的條件下使觀察性研究貼近試驗(yàn)性研究,也是判斷因果關(guān)系的重要標(biāo)準(zhǔn),是因果理論體系中的重要構(gòu)成部分.
結(jié)構(gòu)因果模型基于圖論對(duì)多變量之間因果關(guān)系進(jìn)行圖形化表達(dá),其在觀察、干預(yù)、反事實(shí)三個(gè)層級(jí)對(duì)因果關(guān)系進(jìn)行分析研究,它是一種可以描述數(shù)據(jù)產(chǎn)生機(jī)制和外部干預(yù)的形式化語(yǔ)言,通過(guò)在貝葉斯網(wǎng)絡(luò)上引入外部干預(yù),來(lái)定義外部干預(yù)的因果效應(yīng)并描述多個(gè)變量之間的因果關(guān)系.與潛在結(jié)果模型相比,結(jié)構(gòu)因果模型不僅能定量評(píng)價(jià)變量之間的因果效應(yīng),還可以定性評(píng)價(jià)混雜變量,便于從數(shù)據(jù)中挖掘隱含的因果關(guān)系,在人工智能不確定性推理方面取得了突破性進(jìn)展.
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的收集和分析在越來(lái)越多的學(xué)科中都日益重要,因果推斷分析框架也在此情景中逐步健全并演化.因果推斷打破了對(duì)數(shù)據(jù)相關(guān)關(guān)系的盲目迷信,強(qiáng)調(diào)在數(shù)據(jù)挖掘的基礎(chǔ)上要建立因果模型以提升認(rèn)知.因果推斷在計(jì)量經(jīng)濟(jì)學(xué)、社會(huì)學(xué)和計(jì)算機(jī)科學(xué)等諸多學(xué)科領(lǐng)域展現(xiàn)出了蓬勃的發(fā)展態(tài)勢(shì).從理論研究角度來(lái)看,用數(shù)據(jù)學(xué)習(xí)因果推斷仍具有較大潛力,如研究在因果推斷中增加或放寬假設(shè)限制時(shí)如何進(jìn)行建模交互,并使不同因果推斷模型之間存在形式聯(lián)系;將機(jī)器學(xué)習(xí)和因果推斷進(jìn)一步融合,使用因果知識(shí)改進(jìn)機(jī)器學(xué)習(xí)算法,包括對(duì)黑盒深度學(xué)習(xí)算法進(jìn)行因果解釋?zhuān)皩W(xué)習(xí)更具魯棒性和公平性的因果感知模型.從應(yīng)用和評(píng)估角度來(lái)看,需要在更多領(lǐng)域應(yīng)用中明確對(duì)“干預(yù)”和“效果”的廣義解釋?zhuān)喜糠謱?shí)證研究和觀察性研究得到可解釋結(jié)果;利用多模態(tài)數(shù)據(jù)得到具備復(fù)用能力的可擴(kuò)展模型,并使用真實(shí)數(shù)據(jù)創(chuàng)建、明確評(píng)估指標(biāo)和目的基準(zhǔn).
2021年10月11日,Angrist和Imbens因“對(duì)因果關(guān)系分析的方法學(xué)貢獻(xiàn)”而獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng).Angrist和Imbens在上世紀(jì)90年代中期就論證了自然實(shí)驗(yàn)方法論對(duì)因果推斷的準(zhǔn)確性.傳統(tǒng)實(shí)證方法強(qiáng)調(diào)方法的正確使用,而不聚焦數(shù)據(jù)收集;Angrist和Imbens則強(qiáng)調(diào)在被動(dòng)收集數(shù)據(jù)之前是否可以利用自然實(shí)驗(yàn)得到對(duì)因果關(guān)系的直接判斷.實(shí)證研究和因果關(guān)系方法論之間密不可分,實(shí)證研究是因果關(guān)系方法論的試煉場(chǎng),并大力推動(dòng)著因果關(guān)系的發(fā)展,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)對(duì)因果關(guān)系方法論的關(guān)注也昭示著從挖掘數(shù)據(jù)到真正理解數(shù)據(jù),因果推斷必然會(huì)在各個(gè)研究領(lǐng)域大放異彩.