鄭秋紅 李婧華 吳燦
“格蘭杰因果檢驗”及其應(yīng)用
——基于文獻計量的分析
鄭秋紅 李婧華 吳燦
“格蘭杰因果檢驗”由2003年諾貝爾經(jīng)濟學(xué)獎得主克萊夫·格蘭杰(Clive W. J. Granger)在20世紀60年代末提出并經(jīng)過逐步完善。該方法的基本著眼點,是兩個自由變量呈高度相關(guān),并不能說明它們之間一定存在因果關(guān)系,可能有別的因素存在,使之顯示出協(xié)同變化趨勢,因此,須對相關(guān)變量進行因果關(guān)系檢驗?!案裉m杰因果檢驗”作為一種歸因分析的方法,實現(xiàn)了跨學(xué)科的推廣,特別是近年來,從社會經(jīng)濟學(xué)科被成功引入自然科學(xué),尤其難得。
簡單的因果關(guān)系檢驗認為:如果事件A的發(fā)生改變了事件B發(fā)生的概率P,即P(B|A)≠P(B),則可以認為事件A與事件B之間存在因果關(guān)系。但事實上,A可能并不是B的原因,可能有一個共同因素C影響著A和B,造成了A與B之間的聯(lián)系,也可能存在A除了直接影響B(tài),還通過影響C來間接影響B(tài)等更為復(fù)雜的聯(lián)系。
“格蘭杰因果檢驗”運用了信息集的概念,且強調(diào)事件發(fā)生的時間序列。要檢驗A和B之間的因果性,設(shè)Ωn為到時間n為止宇宙中有恒定時間間隔(t=1,2,…,n)的所有信息的集合(亦包含除A和B以外的信息),Bn為到時間n為止所有B的信息,Bn∈Ωn,則Ωn―Bn為到時間n為止B以外的所有信息。Bn和Ωn均為多元變量,且為隨機變量。假設(shè):(1)現(xiàn)在和過去可以影響未來,但未來不能影響過去;(2)Ωn不包含任何冗余信息,如果某變量Zn與其他一個或多個變量在功能上相關(guān),則需將其從Ωn中去除。如果有:P(An+1|Ωn)≠P (An+1|Ωn―Bn),則認為變量B是變量A的因,Bn包含一些獨有的信息影響接下來An+1的發(fā)生。
“格蘭杰因果檢驗”的思路與簡單因果關(guān)系檢驗類似,但它集信息集的概念,把需要考慮的因素拓展。要得出B是A的原因的結(jié)論,理論上必須全面考慮論域中所有的變量,但實際操作中,不可能獲得宇宙中所有的信息,而在有限的信息集中保證不遺漏重要的相關(guān)變量是非常關(guān)鍵的。目前很多采用“格蘭杰因果檢驗”的研究是在兩個變量之間進行檢驗,很容易出現(xiàn)遺漏重要信息的情況。例如,觀察到氣壓計變動(A),下雨(B)的概率就會增加,即P(B|A)>P(B),顯然氣壓計變動并不是下雨的真正原因,而氣壓計變動和下雨背后有一個共同的原因,即氣壓的降低,如果把氣壓降低(C)納入信息集,A就不再是B發(fā)生的原因了。
時間序列因果檢驗是該方法的核心,即如果B對A構(gòu)成格蘭杰因果性,則Bn會影響An+1的概率分布。傳統(tǒng)因果關(guān)系的一個缺點是沒有考慮事件發(fā)生的先后,導(dǎo)致有時從統(tǒng)計上無法區(qū)分原因和結(jié)果,從公式推導(dǎo)上,如果P(B|A)>P(B),則P (A|B)>P(A)一定成立,即:如果A是B的原因,則必然可以推導(dǎo)出B是A的原因。例如,如果P(關(guān)節(jié)痛|陰天)>P(關(guān)節(jié)痛),即陰天導(dǎo)致關(guān)節(jié)痛的概率增加,那么按照公式一定可以推出P(陰天|關(guān)節(jié)痛)>P (陰天),關(guān)節(jié)痛導(dǎo)致陰天的概率更大,這顯然是不合邏輯的?!案裉m杰因果檢驗”通過考慮時間發(fā)生的先后順序來解決類似問題。時間序列分析是格蘭杰對經(jīng)濟學(xué)界做出的偉大貢獻,諾貝爾獎評委會認為,格蘭杰的工作改變了經(jīng)濟學(xué)家處理時間序列數(shù)據(jù)的方法,對研究財富與消費、匯率與價格以及短期利率與長期利率之間的關(guān)系具有非常重要意義。
如果P(關(guān)節(jié)痛|陰天)>P(關(guān)節(jié)痛),即陰天導(dǎo)致關(guān)節(jié)痛的概率增加,那么按照公式一定可以推出P(陰天|關(guān)節(jié)痛)>P(陰天),關(guān)節(jié)痛導(dǎo)致陰天的概率更大,這顯然是不合邏輯的?!案裉m杰因果檢驗”通過考慮時間發(fā)生的先后順序來解決類似問題。
1. 數(shù)據(jù)來源及統(tǒng)計方法
of Science中,選擇SCI-E數(shù)據(jù)庫和SSCI數(shù)據(jù)庫,采用檢索式為:主題=(“Granger caus*”),年限選擇所有年,文獻類型限定研究論文和綜述,共檢索命中文獻2362篇,其中有中國作者署名的文獻310篇(包括臺灣) (檢索日期為2014年5月5日)。
2. 文獻年代分布
圖1給出了各數(shù)據(jù)庫“格蘭杰因果檢驗”主題文獻隨年代的分布,從圖中可以看出,該方法的發(fā)展應(yīng)用可分3個階段:1981—1989年,屬于起步階段,SCI-E和SSCI中文獻總量18篇,CAJD中0篇;1990—1999年,屬于發(fā)展階段,在文獻數(shù)量上比前一階段有了實質(zhì)性的增長,SCI-E和SSCI中文獻總量288篇,CAJD中14篇;2000年以后為跨越式發(fā)展階段,文獻數(shù)量直線增加,SCI-E和SSCI中文獻總量2056篇,年均140篇以上, CAJD中高達8000多篇。
檢索到中國最早引入“格蘭杰因果檢驗”方法進行研究的學(xué)者為西安交通大學(xué)管理學(xué)院的孫林巖,他于1996年在英文期刊Journal of Environmental Management發(fā)表題為Global warming and global dioxide emission: An empirical study的文章,通過格蘭杰因果檢驗證實,全球地表溫度與二氧化碳排放之間確實存在因果關(guān)系。同年,他在中文期刊《系統(tǒng)工程理論與實踐》發(fā)表題為《我國教育投資對國民收入的影響分析》一文,用格蘭杰因果檢驗法檢測證實,1950—1988年我國國民收入與國家對教育的投資之間存在著長期穩(wěn)定的關(guān)系,且教育投資與國民收入互為因果。此后直至2000年,SCI-E和SSCI中沒有檢索到中國學(xué)者的相關(guān)文獻,CAJD中也僅有10多篇。中國學(xué)者對該方法的大量應(yīng)用是在2004年以后。
3. “格蘭杰因果檢驗”由社會經(jīng)濟學(xué)科向自然和工程科學(xué)領(lǐng)域的引入
“格蘭杰因果檢驗”仍然以經(jīng)濟學(xué)及相關(guān)領(lǐng)域應(yīng)用為最多(表1)。在SCI-E和SSCI庫檢索到的文獻中,有一半以上論文屬于經(jīng)濟學(xué)相關(guān)領(lǐng)域。在CAJD檢索到的8000多篇文獻中,更有95%以上與經(jīng)濟學(xué)和管理學(xué)相關(guān)。隨著學(xué)科研究的發(fā)展,格蘭杰因果檢驗方法也在不斷的改進和創(chuàng)新。由于金融時間序列數(shù)據(jù)大多是非平穩(wěn)、非線性的,為適應(yīng)不同情況,格蘭杰因果檢驗?zāi)P鸵仓饾u從傳統(tǒng)的線性平穩(wěn)領(lǐng)域的分析逐漸發(fā)展到線性非平穩(wěn)領(lǐng)域和非線性平穩(wěn)領(lǐng)域,常用的檢驗方法包括針對線性平穩(wěn)的基于向量自回歸的WALD檢驗,針對線性非平穩(wěn)的協(xié)整檢驗和MWALD檢驗,以及針對非線性平穩(wěn)的修正的Baek Brock檢驗。針對線性非平穩(wěn)和非線性平穩(wěn)領(lǐng)域的檢驗方法的發(fā)展是格蘭杰因果分析在經(jīng)濟學(xué)領(lǐng)域應(yīng)用發(fā)展的重要里程碑。
國際上,經(jīng)濟學(xué)以外的領(lǐng)域廣泛引入“格蘭杰因果檢驗”發(fā)生在20世紀90年代以后。SCI-E(代表自然和工程科學(xué))和SSCI(代表社會科學(xué))中,1980—1989年的18篇論文均在社會科學(xué)領(lǐng)域,且僅有1篇屬非經(jīng)濟學(xué)領(lǐng)域,由美國學(xué)者Freeman于1983年將該方法用于政治關(guān)系的研究。1990—1999年,已經(jīng)有40個學(xué)科領(lǐng)域(根據(jù)SCI-E和SSCI類別,下同)引入該方法,但288篇論文中的95%以上仍然在社會科學(xué)范疇, SCI-E中僅檢索到41篇文獻,占比14%,且其中34篇屬于自然科學(xué)和社會科學(xué)交叉領(lǐng)域。此時期,經(jīng)濟學(xué)以外的其他領(lǐng)域開始逐步引入“格蘭杰因果檢驗”,如:1991年,美國學(xué)者Enders和Sandler將格蘭杰因果檢驗用于跨國恐怖主義與旅游的關(guān)系研究;加拿大學(xué)者Weersink和Tauer用該方法檢測了加拿大各州乳品農(nóng)場規(guī)模和生產(chǎn)率之間的因果關(guān)系;1992年,美國學(xué)者Wood以美國環(huán)保署和50個州實施《清潔空氣法案》為例,用該方法分析1977—1985年美國政府的政策執(zhí)行效力,結(jié)果表明,單獨區(qū)分聯(lián)邦執(zhí)行的效力是不容易被理解的,國家和地方層面的輸出是互相依存,交織在一起的。
2000—2009年,共檢索到來自98個領(lǐng)域的778篇文獻,SCI-E庫檢索到331篇,占比43%,其中117篇屬于自然和工程科學(xué)和社會科學(xué)的交叉領(lǐng)域,醫(yī)學(xué)、環(huán)境科學(xué)、數(shù)學(xué)、計算機、生物化學(xué)等成為應(yīng)用該方法進行研究的突出領(lǐng)域。2010年以后僅3年多的時間,SCI-E和SSCI中已能檢索到應(yīng)用和討論該方法的文獻1200多篇,其領(lǐng)域進一步延伸, SCI-E庫檢索到750多篇,占比50%,雖然其中仍然有300篇左右屬于自然和工程科學(xué)與社會科學(xué)的交叉領(lǐng)域,但可以看出自然科學(xué)領(lǐng)域?qū)υ摲椒ǖ膽?yīng)用正呈突飛猛進式增長。
當前,非經(jīng)濟學(xué)相關(guān)領(lǐng)域中,以醫(yī)學(xué)相關(guān)領(lǐng)域(包括神經(jīng)科學(xué)、醫(yī)學(xué)影像等)對該方法的應(yīng)用最多。截至檢索時間,SCI-E和SSCI庫“格蘭杰因果檢驗”主題引用頻次最高的前10篇論文中,有9篇都在醫(yī)學(xué)相關(guān)領(lǐng)域(詳見本期P3頁榜單)。但CAJD庫在“醫(yī)藥衛(wèi)生科
技”大類下僅檢索到11篇文獻。中國作者在醫(yī)學(xué)相關(guān)領(lǐng)域發(fā)表的論文大多是與國外專家或海外華人聯(lián)合發(fā)表在國際期刊上。
圖1 “格蘭杰因果檢驗”主題文獻的年代分布
CAJD中,其“基礎(chǔ)科學(xué)”類別下檢索到相關(guān)文獻2000多篇,其中大多是與經(jīng)濟學(xué)管理學(xué)的交叉領(lǐng)域,98%以上的文獻在數(shù)學(xué)類別下,其次是資源科學(xué),有14篇,海洋學(xué)有11篇。
表1 “格蘭杰因果檢驗”主題文獻產(chǎn)出較多的領(lǐng)域
4. “格蘭杰因果檢驗”在地學(xué)和大氣科學(xué)領(lǐng)域的應(yīng)用
“格蘭杰因果檢驗”在地學(xué)相關(guān)領(lǐng)域的應(yīng)用相對較少。在SCI-E和SSCI中,共檢索到地學(xué)相關(guān)領(lǐng)域應(yīng)用格蘭杰因果檢驗的文獻56篇,其中大多數(shù)在氣象學(xué)及氣候變化領(lǐng)域(47篇)。氣象學(xué)領(lǐng)域最早應(yīng)用格蘭杰因果檢驗方法的是 Triacca于2001年發(fā)表在Theoretical and Applied Climatology雜志上的“On the use of Granger causality to investigate the human influence on climate”一文 ,采用格蘭杰因果檢驗研究了人類活動對氣候的影響,指出人類活動對氣候的影響并不十分顯著。同年, Reichel等采用格蘭杰因果檢驗研究北半球平均地面氣溫與太陽活動周期的關(guān)系,檢驗通過99%的信度水平,指出二者之間存在因果關(guān)系。
氣象學(xué)領(lǐng)域被引頻次最高的是美國波士頓大學(xué)地理系的Wang Weile等2004年發(fā)表在Journal of Climate上的“The relation between the North Atlantic Oscillation and SSTs in the North Atlantic Basin”一文和英國學(xué)者Mosedale等2006年發(fā)表在Journal of Climate上的“Granger causality of coupled climate processes: Ocean feedback on the North Atlantic oscillation”一文,兩篇文章均被引用35次,都是在研究北大西洋濤動與海面溫度的關(guān)系中采用了格蘭杰因果檢驗。Wang Weile等通過研究指出格蘭杰因果檢驗比簡單的滯后相關(guān)性更為嚴格和可靠。Mosedale等則使用格蘭杰因果關(guān)系時間序列,在耦合大氣環(huán)流模式中定量診斷北大西洋濤動中每日海面溫度的反饋。從研究內(nèi)容看,當前研究主要集中在北大西洋濤動、厄爾尼諾、南方濤動的原因及影響、人類活動和自然因子引起的氣候變化等方面。
CAJD中共檢索到地學(xué)領(lǐng)域(自然地理學(xué)和測繪學(xué)+氣象學(xué)+海洋學(xué)+地質(zhì)學(xué)+地球物理學(xué)+資源科學(xué))應(yīng)用格蘭杰因果檢驗的論文36篇,其中氣象學(xué)領(lǐng)域8篇。地學(xué)領(lǐng)域應(yīng)用該方法最早的論文為傅開道于2006年發(fā)表于《科學(xué)通報》上的“瀾滄江干流水電開發(fā)的下游泥沙響應(yīng)”一文。氣象學(xué)領(lǐng)域最早的論文為曹鴻興等于2008年發(fā)表于《氣候變化研究進展》上的“氣候檢測與歸因的格蘭杰檢驗法”,該文對格蘭杰因果檢驗法進行了介紹,并通過格蘭杰檢驗解釋我國氣溫變化由滯后到同步于全球氣溫的現(xiàn)象。引用頻率最高的是孫慧宗和李久明2010年發(fā)表于《人口學(xué)刊》的“中國城市化與二氧化碳排放量的協(xié)整分析”一文,共被引26次。
地學(xué)氣象學(xué)領(lǐng)域的大多數(shù)研究都是直接利用格蘭杰因果檢驗研究不同變量因子之間的關(guān)系,而對該方法在地學(xué)氣象學(xué)領(lǐng)域的適用性研究很少。2005年,Triacca發(fā)表論文討論格蘭杰因果檢驗在檢測大氣二氧化碳濃度和全球溫度因果關(guān)系的適用性,認為應(yīng)用格蘭杰方法檢測二者之間的關(guān)系并不合適。因此,格蘭杰方法在地學(xué)及氣象學(xué)領(lǐng)域的適用性和方法論還有待進一步的研究。
5. 國家和機構(gòu)產(chǎn)出和影響力分析
SCI-E和SSCI庫中,“格蘭杰因果檢驗”主題文獻產(chǎn)出量最多的國家為美國,占總文獻量的33%,中國排在第2位。從他引總次數(shù)和h指數(shù)兩個影響力指標來看,美國仍然遠超其他國家,排在第1位。英格蘭雖然在文獻量上不及中國,但影響力比中國高。中國排在第3位。德國、澳大利亞、意大利、荷蘭等國雖然文獻總量不多,但影響力均相對較高(表2)。
表3給出了“格蘭杰因果檢驗”主題文獻產(chǎn)出較多的機構(gòu)。國際機構(gòu)中,以佛羅里達大學(xué)產(chǎn)出最高,中國科學(xué)院排在第7位。從表中可以看出,機構(gòu)的國別很分散,排在前10位的機構(gòu)中,只有2個機構(gòu)同屬于美國,其他機構(gòu)分別隸屬于不同的國家,還有一個國際機構(gòu)“東地中海大學(xué)”。巴基斯坦、馬來西亞等
雖然論文產(chǎn)出總量不高,但均有在該領(lǐng)域權(quán)威的機構(gòu),尤其是巴基斯坦的COMSATS信息技術(shù)學(xué)院,總排名位列第2。SCI-E和SSCI中國文獻的機構(gòu)以中國科學(xué)院產(chǎn)出最多,前11位的機構(gòu)中包括6個臺灣和香港機構(gòu)。CAJD庫發(fā)表該主題文獻較多的機構(gòu)集中在大學(xué)系統(tǒng),以中南財經(jīng)政法大學(xué)產(chǎn)出最多,東北財經(jīng)大學(xué)和中國人民大學(xué)分列第2和第3位。
表2 “格蘭杰因果檢驗”主題文獻產(chǎn)出較多的國家/地區(qū)及其影響力(SCI-E和SSCI)
表3 “格蘭杰因果檢驗”主題文獻產(chǎn)出較多的機構(gòu)
文獻計量結(jié)果表明,“格蘭杰因果檢驗”正被加速引入各領(lǐng)域的研究中,2000年以后國內(nèi)外該主題文獻的產(chǎn)出呈穩(wěn)步增長趨勢。該方法由經(jīng)濟學(xué)向社會科學(xué)其他領(lǐng)域,及由社會科學(xué)向自然和工程科學(xué)領(lǐng)域應(yīng)用經(jīng)歷了一定的歷程,呈現(xiàn)出由經(jīng)濟學(xué)為主(1980年代)→社會科學(xué)其他領(lǐng)域或社會科學(xué)與自然和工程科學(xué)交叉領(lǐng)域為主(1990年代)→自然和工程科學(xué)領(lǐng)域占相當比例(2000年以后)逐步引入,各領(lǐng)域共同增長的趨勢。
“格蘭杰因果檢驗”方法學(xué)及應(yīng)用發(fā)展最為成功的仍然是在經(jīng)濟學(xué)領(lǐng)域,國際和中國文獻數(shù)據(jù)庫中,分別有超過50%和超過95%的文獻都在經(jīng)濟學(xué)和管理學(xué)相關(guān)領(lǐng)域。國際上,經(jīng)濟學(xué)以外的領(lǐng)域應(yīng)用該方法最多的是醫(yī)學(xué)相關(guān)領(lǐng)域,但國內(nèi)在醫(yī)學(xué)領(lǐng)域的應(yīng)用還相對較少。
地學(xué)氣象學(xué)領(lǐng)域引入“格蘭杰因果檢驗”開展研究是在2000年以后,國際上的研究主要集中在氣象和氣候變化領(lǐng)域,“格蘭杰因果檢驗”為人們理解不同氣象和氣候因子之間的聯(lián)系提供了有用的線索。國內(nèi)該方法在地學(xué)氣象學(xué)領(lǐng)域的應(yīng)用還剛剛起步。目前研究中,大多都是直接利用該方法進行不同變量之間的因果關(guān)系檢驗,其在地學(xué)和氣象學(xué)領(lǐng)域的適用性和方法論還有待進一步發(fā)展。
近年來,我國雖然在該領(lǐng)域已發(fā)表了8000多篇中文論文,但國際表現(xiàn)力較弱,僅有310篇(其中大陸209篇)文獻發(fā)表在國際期刊上。我國相關(guān)領(lǐng)域研究地位與英國、德國相當,與美國相比還存在較大差距。我國在該領(lǐng)域的權(quán)威學(xué)者也較少,且主要集中在經(jīng)濟學(xué)、管理學(xué)領(lǐng)域,中文發(fā)文最多的作者也僅有14篇論文。
需要說明的是,文獻計量方法本身尚存在一些局限性。例如,雖然前述的孫林巖的文章是研究溫度與二氧化碳排放之間的關(guān)系,但由于作者本人從事的是管理學(xué)研究,且論文發(fā)表在管理類期刊上,數(shù)據(jù)庫沒有將其歸為氣象學(xué)類別。盡管如此,文獻計量法能夠幫助研究者從總體上把握學(xué)科發(fā)展現(xiàn)狀和動向,是信息研究中常用且可靠的方法之一。
(作者單位:中國氣象局氣象干部培訓(xùn)學(xué)院)
深入閱讀
Covey DB. 1992. Testing for granger’s full causality. The Review of Economics and Statistics, 74(1): 146-153.
Freeman JR. 1983. Granger causality and the times series analysis of political relationships. American Journal of Political Science, 27(2): 327-358.
Granger CWJ. 1969. Investigating Causal Relations by Econometric Models and Crossspectral Methods. Econometrica, 37(3): 424-438.
Granger CWJ. 1980. Testing for Causality:a personal view point. Journal of Economic Dynamics and Control, 2: 329-352.
Reichel R, Thejll P, Lassen K. 2001. The cause-and-effect relationship of solar cycle length and the Northern Hemisphere air surface temperature. Journal of Geophysical Research: Space Physics, 106(A8): 15635-15641.
Sun LY, Wang MH. 1996. Global warming and global dioxide emission: An empirical study. Journal of Environmental Management, 46(4): 327-343.
Triacca U. 2005. Is Granger causality analysis appropriate to investigate the relationship between atmospheric concentration of carbon dioxide and global surface air temperature? Theoretical and Applied Climatology, 81(3-4): 133-135.
Wood B D. 1992. Modeling federal-implementation as a system - the clean-air case. American Journal of Political Science, 36(1): 40-67.
曹鴻興, 鄭艷, 虞海燕, 等. 2008. 氣候檢測與歸因的格蘭杰檢驗法.氣候變化研究進展, 4(1):37-41.
曹永福. 2006. 格蘭杰因果性檢驗評述. 數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究, (1): 155-160.
知網(wǎng)學(xué)術(shù)期刊
總庫(CAJD)和ISI Web of Science平臺數(shù)據(jù)庫,檢索國內(nèi)外有關(guān)“格蘭杰因果檢驗”主題文獻。在CAJD中,采用檢索式為:SU='格蘭杰因果' OR SU='granger因果' OR SU='格蘭杰檢驗' OR SU='granger檢驗' OR SU='格蘭杰因果檢驗' OR SU='granger因果檢驗',精確匹配,時間不限定,學(xué)科不限定,共檢索命中文獻8337篇(檢索日期為2014年5月5日)。在ISI Web
Advances in Meteorological Science and Technology2014年3期