• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      經驗研究的過程:一個方法論角度的探討*

      2015-02-25 19:47:47趙泉吳要武
      學術研究 2015年11期
      關鍵詞:證據經驗研究

      趙泉 吳要武

      經驗研究的過程:一個方法論角度的探討*

      趙泉吳要武

      經驗研究是一個從提出問題到推導結論,再構建因果關系鏈條以證明研究結論成立的過程。它暗含著一個波普爾范式:假說—檢驗—證偽。以“科學上可識別”為選題原則,作者需要從現象精煉出特征化事實,在理論的指導下提出假說,尋找適用性數據,構建一個完整的因果關系鏈條,檢驗這個假說。最后,在一個規(guī)范的寫作框架下,將這個研究過程展示出來。

      經驗分析波普爾范式可信性革命

      2007年,Amy Finkelstein曾做過一個關于經驗研究方法的講座,開篇一句值得特別強調:“這些技巧,我希望當年也曾有人教過我”。①This is a semi-structured list of some tips Iwish someone had toldme….無論是Finkelstein的學術成就還是受教育經歷,都使人無法懷疑,她接受了當今世界最優(yōu)秀經濟學家群體提供的完備訓練。從MIT經濟系歷屆畢業(yè)生所取得的卓越成就,2009—2012年連續(xù)獲得四屆克拉克獎,可見其教授們在訓練研究生方面的強大實力。盡管如此,Finkelstein的語氣,暗示MIT的教授們忽略了對研究過程和方法技巧的指導。

      中國的研究生和青年學者,大多數沒有像MIT那樣的學習、研究和成長環(huán)境,也缺少訓練有素的教授們組成的導師組進行完備的知識技能訓練。如果連Finkelstein都認為給研究生講解經驗研究過程中的方法技巧是有價值的,那么,為了幫助中國的研究生和青年學者找到正確門徑,對這個過程作專門的探究就是必要的。

      探究經驗研究過程的另一個誘因是看到很多大學的經濟計量學教師,并不會做經驗研究。其中,不少人教育背景為數量經濟學、數學或統(tǒng)計學專業(yè),他們會解數學題和統(tǒng)計學題——甚至很難的題,但卻不知道解這些題有什么用。他們教學生做經驗研究,是“瞎子領瞎子”。因此,中國的經驗研究總體水平不高。即使在國內最優(yōu)秀的經濟學專業(yè)期刊上,對經濟計量學的錯誤運用,也比比皆是。

      如果沒有良師指點,少數聰明穎悟之士,或許也能學會做規(guī)范的經驗研究,但這個過程將是漫長的。因此,筆者想從經驗研究的過程入手,嘗試為研究生和青年學者尋找正確路徑。揭示經驗研究的過程,在一定意義上相當于“手把手地教人”做研究。寫一篇規(guī)范的論文,與工程師建造一座橋梁,裁縫制作一件服裝,具有類似性。本文會例示一些優(yōu)秀的論文,剖析經驗研究論文的產生過程,還要從方法論角度作探討,使我們對經驗研究過程的分析更具一般性。

      經驗研究不容易,因為它的研究對象是復雜的人類社會,“原因”常被各種混淆性因素所纏繞、遮蓋。欲揭示真正的原因,不僅需要理論洞見,還需要掌握眾多相關事實和專業(yè)方法。即使找到了事件真正的原因,還有各種復雜的技術難題要克服,很多不確定的因素要處理。有些問題可用數據來刻畫,另一些問題卻只能來自研究者的主觀判斷。當然,主觀證據也要建立在理論和事實的基礎上(DiNardo,Lee,2011)。[1]

      一、模仿:倒立的影像

      做經驗研究是從模仿開始的,幾乎沒有例外。有經驗的導師會選國際領先期刊上的論文,給研究生研讀,訓練他們掌握經驗分析的方法:讓研究生認真琢磨作者如何提出問題,如何分析研究對象面臨的環(huán)境和制約因素,如何利用理論和約束條件構建假說,如何介紹數據,如何設定經驗方程,如何處理內生性偏差,如何擴展模型和作穩(wěn)健性檢驗等等。鼓勵研究生比照這個思路與框架寫出自己的論文來。那篇優(yōu)秀論文作為模板,就立在那里。

      通過模仿掌握研究方法是個共識,但大多數研究生并未學會做規(guī)范的經驗研究。如果他們有鍥而不舍的精神,堅持上5—10年,甚至更長,或許會找到正確的路徑。但更可能的結果是,大多數人因挫折而放棄?!敖洕鷮W不是科學”,“我與經濟學無緣”,是一個輕松的借口。

      難在哪里?當我們希望模仿一篇規(guī)范的經驗研究論文時,除了要突破各種知識技能上的障礙,還有一個易被忽略的難點:那是一個“倒立的影像”——“原因—過程—結果”。文章本身并不顯示真實的研究和寫作過程,甚至誤導了讀者。真正的研究過程,卻是相反的:

      我提出了一個問題,接著,找到了答案,然后,還原事件發(fā)生的過程;再接著,我猜測事情發(fā)生的原因……。當我把一系列的因素都構建齊備后,通過寫作過程,把這個“頭下腳上”的影像翻轉,在一個“規(guī)范的框架”里報告出來。

      二、提出問題:科學上可識別

      科學研究都始于一個客觀事實。經濟學也不例外,選題通常來自社會生活中的問題或歷史事件。有經驗的導師,會鼓勵學生去現實生活中找問題(Davis,2001;Mankiw,2006)。[2][3]

      (一)選題原則:重要、新穎、科學上可識別

      重要,是指問題的社會關注度。通常是現實生活中的重要事情。研究的問題過小,缺少社會關注度,哪怕作者自認為有趣,別人也會認為不值得研究,畢竟,一顆葡萄是難以與人分享的(Stigler,1988)。[4]有學者曾指出:在轉型期的中國,“農民工的工作條件和收入”是一個比“臉蛋漂亮對工資的影響”更有價值的問題。

      新穎,包括選題新和研究問題的切入點選得好。新穎的選題,不僅讓作者感到有趣,也讓讀者感到有趣。但太陽下面無新事,對那些天天遇到的事情,大多數人會熟視無睹。一旦作者能從大家熟悉的事實,講一個別致的故事,就會讓人耳目一新。比如,女性地位是個老問題,無論發(fā)達國家還是發(fā)展中國家,都存在著爭論,而性別比失衡,則是發(fā)展中國家面臨的社會難題。錢楠筠將這兩個因素結合起來,用中國市場上的茶葉價格波動來探討女性收入和其社會地位的關系,并擴展到了性別比這個大問題上去(Qian,2008)。[5]就選題來說,是個成功的典范。

      科學上可識別,意味著對問題的解釋能夠用經驗證據檢驗。這個命題,你用某個大樣本抽樣數據可以檢驗它,別人使用其他的大樣本數據,也同樣能檢驗它,會得出一致或近似的結果。這體現了科學研究的可重復性,是客觀性的一種經驗表現。

      可識別的另一層意義是把一個不清晰、不準確的表述精煉化,使之成為一個可以檢驗的科學命題。這個能力經由訓練而獲得,每個青年研究人員都必須練就這個能力。

      (二)尋找答案

      第一,從理論出發(fā)去“猜答案”。經濟學之所以是科學,是因為他建立在“人性不變”這個準公理性假設的基礎上——從閱讀孔子、司馬遷、修昔底德和普魯塔克等人的著作,結合我們對自己的反思,對身邊人的觀察,可以相信,2500年以來,人性是穩(wěn)定的,古今中外皆然。人性的穩(wěn)定性,使人類社會有一種內在的和諧,因而是可以認識的。人是理性的,社會資源是有限的,尋求資源的有效配置,是任何國家和社群所關注的大事。以此為根基,經濟學發(fā)展出一套完備的知識體系,理論能夠給我們尋找正確的答案指出方向。

      第二,直接去數據中“偷看答案”。經濟學理論是我們解釋世界的工具,但它本身僅僅是一套(空洞的)邏輯體系。要想解決問題,必須與問題發(fā)生的環(huán)境結合起來。這就需要學者熟悉研究對象,了解問題的來龍去脈,只有這樣,才能重構事件發(fā)生的過程,找到事件發(fā)生的真正原因。學者應該在自己的研究對象上,成為真正的專家(List,2011)。[6]你運用理論推理時,可能忽視了環(huán)境的影響,但這個影響會體現在數據中。

      在經驗上,常常是先“猜出”或“偷看”了答案,才倒推出特征化事實(Stylized fact)。也可能會走相反的路徑:先找到了特征化事實,然后順推出事件的結果。因此,研究路徑有兩個:在理論的指導下,觀察一個或多個可信的大樣本數據;觀察事件發(fā)生的過程和結果。

      (三)特征化事實

      理論為尋找正確的答案提供了方向,但能否發(fā)現正確的答案,則不一定。比如,工資水平提高后,人們會增加閑暇時間還是增加工作時間?這取決于每個代理人的效用評價:收入效應和替代效應這兩個相反方向的力量誰占主導,是不能先驗地判定的。不同的環(huán)境,有著不同的特征化事實,“修改了”真實的事件結果。

      既然要對假說或推論的結果進行猜測,那么,可能猜對,也可能猜錯。猜對了,接著要構建連接問題與結論的橋梁;猜錯了,要重新思考為什么結果沒有如理論推斷那樣,里面一定有原因。這個時候,不要輕易放棄。猜對了,你在講一個合乎經濟學邏輯的故事;猜錯了,你可以講一個同樣合乎經濟學邏輯但更加新穎的故事。這時的關鍵是弄清環(huán)境中有什么特征化事實沒有被掌握,以至于你的模型里忽略了它。但一個可信的大樣本數據卻作證:它就在這里。

      由于研究對象的復雜性,馬歇爾告誡:經濟學家要掌握盡可能多的事實。這些事實幫你修正理論預測的錯誤。要提醒一點:任何“現象”都“屬于”事實,但只有用可信的大樣本數據能檢驗出來的事實,才能稱得上是特征化事實。需要借助抽象思維才能理解這個概念。

      三、數據:找到答案

      (一)數據產生過程(DGP)

      洪永淼(2007)認為,經驗分析有兩個公理性假定:[7](1)任何經濟系統(tǒng)都可以看作是服從一定概率分布的隨機過程;(2)任何經濟現象(經濟數據)都可以看作是這個隨機數據生成的過程的實現。

      以上論斷并不易懂。我們從“自然實驗”入手,更直觀地介紹數據產生過程。作個場景模擬:“大自然”在做實驗的時候,很少邀請你到現場觀摩,更不會慷慨地一邊向你演示一邊為你解釋:他做這個實驗的目的,經歷了怎樣的過程,得到了什么樣的結果。但實驗結果會被記錄在自然界或人類社會里。比如,人口控制政策的出臺,導致1972年以后(城鎮(zhèn))獨生子女的數量越來越多,在出生隊列中的比例持續(xù)提高。雖然你沒有親自參觀實驗過程,但你看到這個結果(數據或事實),通過理論訓練和分析事件發(fā)生時的社會經濟狀況,可以將事件發(fā)生過程重現在頭腦中。

      我們再回到洪永淼的論斷上來。既然是隨機的過程,那么,一個樣本里包含的信息,既有確定性,也有隨機性。沒有一個樣本能說,自己既“代表著客觀事實”又做到了“準確區(qū)分”,但一個樣本做不到的,用一組樣本卻可以做到:這組隨機產生的樣本,觀測值越多,代表真實總體的能力也就越大。大樣本代表“明天的太陽會升起”;觀測值則允許“今天的風隨意吹”。因此,在經驗研究中,數據處于關鍵地位,因為它一頭連接著形而上的理論——確定性,另一頭連接著形而下的經驗現象——隨機性。如果數據產生過程是隨機的,樣本越大,越接近(理論上的)真實。

      理論(假說)與數據之間是相互影響甚至是相互誘導的(Heckman,2015),[8]也就能理解數據的地位有多重要。作者在使用數據之前,要先對數據的適用性與可信性作評估。

      (二)數據的適用性和可信性

      當你從理論出發(fā),結合研究對象面臨的約束條件,刻畫出一個故事輪廓了,接著,你需要尋找適用的數據,構建證據鏈條來檢驗它。這個鏈條應該與理論邏輯(故事)的方向相平行,在理論邏輯的每個“節(jié)點”,都要有數據結果來“與之對應”。兩者之間當然可以調整,以相互適應,但最終能為同行接受的鏈條,應該是平行且有對應性的。

      在尋找數據時,作者面臨一個問題:本文的假說能用這套數據進行檢驗嗎?作者需要去研究這個數據的結構,有哪些變量,如何定義的,與待檢驗假說是否有關,樣本多大等等。

      數據結構決定了模型設定。同樣的命題,使用不同結構的數據都能得到檢驗,比如,研究工資變化的文獻,有使用個人層面微觀數據的,有使用城市(地區(qū))層面匯總數據的;有用截面數據或混合截面數據的,也有用面板數據的。數據結構不僅決定了經驗方程的設定,時間維度特征的有無,觀測對象異質性的不同來源等,還意味著不同的內生性特征和處理手段。最受研究者歡迎的是以個人、家庭或公司為觀測對象的微觀數據,因為它有堅實的理論根基:經濟學模型里必須有代理人。①參見哈佛經濟學系微觀經濟學講義,Econ 2010A,2013秋季學期,第一講,主講人:EdwadGlaeser。

      數據的可信性,也是證據的可信性。由于大多數數據來自抽樣調查,那么,樣本應該能夠代表總體。因此,要重視數據的產生過程。理論上的DGP是評估經驗方程中的誤差項是否符合高斯—馬爾科夫條件,但經驗上的DGP則是強調嚴格遵循科學抽樣與調查的過程,處理好調查過程中的關鍵性細節(jié),得到“最接近隨機”的高質量數據——良好地代表了總體。思考與評估數據產生過程在理論與經驗上的對應性,是研究者的一個重要技能。只有親自參與過數據采集過程的學者,才容易理解與把握這種對應性,才敢說對數據的使用“雙腳站在了磐石上”。②數據采集和整理是個苦活、累活,令人厭倦,卻是一個學者不可或缺的多維度訓練:養(yǎng)成細致準確的專業(yè)素養(yǎng),也練就堅韌頑強的性格。

      數據的可信性,可通過不同抽樣調查數據的收斂性來評估。面對同一個社會總體,有幾個學者都在做抽樣調查數據,如果都遵循了同樣的隨機抽樣過程,則不同數據的結果應該是一致的。不同來源的數據,起到了一個互證的作用。研究者應該“在數據上成為一個企業(yè)家”,經常搜集和關注不同來源、不同時期的數據結果,并且經常觀察社會事實。不斷比對,不斷修正,才能在頭腦中建立正確的影像——對社會狀況的判斷和認識。

      當數據不支持假說時??尚诺臄祿拍軝z驗正確的假說并為之作證。當兩者不一致時,作者就受到困擾:到底是假說錯了,還是數據錯了,還是兩者都錯了?假說錯了,可以重新構建,如果數據錯了,更可能絆倒作者。畢竟,假說來自頭腦,而數據卻是更嚴格的外在約束。

      數據的有限性。在現實中,沒有一個抽樣調查真正做到了“隨機性”,那么,每個數據都是有缺陷的,研究者應該清楚這個特征,揚長避短。比如,抽樣調查數據的匯總結果,常常會偏離真實的結果,③用加權的辦法能部分解決偏差,但加權的技術復雜且易被誤用,故要慎用。但將抽樣調查數據用于結構性分析,其偏差就會小得多。

      有經驗的調查者,通常會對數據做個評估,看自己的抽樣數據偏差有多大,朝哪個方向偏。比如,謝宇等(2014)在評估CFPS的質量時,先找一個可信的數據作為基準——第六次人口普查數據,然后,將自己做的抽樣調查數據與普查數據作比對,以判斷偏差的方向和大小。[9]不做數據評估的人,必被數據所絆倒。

      (三)數據的解讀

      數據自身并不會做因果分析。做因果分析的是研究者。他要把干預或事件發(fā)生的過程弄清楚,構建因果關系的鏈條和傳遞機制,展示給讀者。讀者會運用自己的理解力和判斷力,決定是否接受這樣的因果關系。在數據提供各種計算結果的同時,要輔以公認的經驗事實——數據結果的經驗內容。比如,歷次人口普查數據都能看到:1959—1961年出生隊列,有個急劇的下降。假如國外學者不了解中國當時發(fā)生“大饑荒”的事實,就可能作出其他的推測或解釋:戰(zhàn)爭,瘟疫,或者干脆是數據錯誤。

      數據結果和經驗事實必須聯系起來。你看到數據結果,要向有經驗的學者請教:“Z老師,人口普查數據里,發(fā)現一個現象,當時,中國發(fā)生了什么事情?”Z老師會告訴你,那段時間,中國正在推行“晚稀少”生育政策,人口出生率下降,并不是始自1980年的獨生子女政策,在1970年代初,就開始下降了。數據的背后是歷史和事實。

      (四)對大樣本數據的偏好

      “自變量要變”。在經濟計量學教科書里,這是個公理性的假設。在經驗上,它對應著“樣本規(guī)?!焙汀白儺惓潭取?。從遵循“數據產生過程的客觀性”原則看,小樣本難題是無解的。無論研究者怎樣創(chuàng)新估計方法,再抽樣,模擬,等等,方法越復雜,越遠離“客觀性原則”。因此,什么樣的估計方法都代替不了高質量的大樣本數據。反過來則可以斷言:時間序列方法在經驗研究中,不是一個有前途的方法——樣本小,內生性嚴重,很難得出可信的結論。

      (五)數據的拷打

      我們對“完美的證據”有著本能的渴望。然而,社會問題的復雜性,使我們很難找到“完美的證據”,或者說,根本就“沒有完美的證據”。因此,幾乎每個學者都有拷打數據的沖動:讓數據提供我們需要的結果。

      拷打數據的方式,形形色色,但都背離了研究的目標:創(chuàng)造(更接近真理的)新知識以增進我們對生活在其中的這個世界的理解(Stigler,1988)。[10]數據拷打的方法,常用的方法是加權。另一種拷打是模型誤設,放一些壞控制變量,以獲得主變量的統(tǒng)計顯著。

      不止一個學者遇到這樣的誘惑:把不同產生過程的抽樣調查數據混合到一塊使用。這固然增大了樣本,數據按照作者的需要“招供”,但這里的“樣本”背后,沒有“總體”。既沒有內部有效性,也沒有外部有效性。在科學法庭上,不接受拷打得來的證據,這是原則。

      四、編織故事:步驟與證據鏈條

      (一)編織故事的三個線索

      1.問題—結果—過程。

      現在,問題清楚了,也猜出了正確答案,如何報告研究結果呢?問題在認識之河的此岸,而答案卻在彼岸。必須構建一個“橋梁”,把兩個端點連接起來,讀者才能看得懂和接受你的論證。這個“橋梁”,就是證據鏈條。

      搭建證據鏈條要遵守規(guī)范的框架。需要數據和經驗事實來充當“建橋材料”,還要有一套完備的知識技能,以組織、運用和剪裁這些材料,依照特定的框架結構展示證據。這個“橋梁”有兩個鏈條:理論上的邏輯線條;經驗上的證據鏈條。

      從理論出發(fā),加上中國的特征化事實,可以推論應該出現什么結果,這是“假說”。它在形而上的世界里。在形而下的經驗層次上,假說會以什么方式表現出來?這是可以用經驗證據檢驗的“推論”。形而上與形而下兩個世界,在此有了對應性。這兩個鏈條必須是一致的、平行的。兩條線索就像“橋梁的鋼筋”,將一塊塊的“材料”聯結起來。經驗研究論文必須有兩條相互印證的線索,才有可信性。那一個個的橋墩(關鍵證據)如果不夠堅固,文章就有硬傷。

      2.問題—推論—結果。

      不是所有的研究在提出問題后,接著就找到了答案,“橋梁”建設也不總是“從兩頭開始,向中間靠攏”。這種情況是常見的,從問題出發(fā),不斷自我追問:知道了這個事實,又能怎樣呢?接著應該做什么呢?就像女孩子編辮子一般,不斷地朝一個方向拓展故事鏈條,直到講出一個完整的故事。

      不少學者有這樣的經歷:開始動手寫作了,但還不知道目的地在哪里。在一步步摸索前進中,找到了答案?!把芯俊伎肌獙懽鳌?,是個滾動前進的過程(McCloskey,2000)。[11]Goldin和Katz強調,至少重寫十遍是真正的寫作藝術。①參見Goldin and Katz(memo),“The Ten Most Important Rules ofWriting Your Job Market Paper”?!笆椤辈⒉粌H僅是打理文字,甄選材料,理順邏輯,調整布局,還常常是修正結果甚至是重講故事。文章寫出來了,和最初的設想相比,已變得面目全非。要準備作這樣的調整和修改。

      3.現象—事實—假說。

      我們觀察到的是“現象”,既混亂又不穩(wěn)定。要以經濟學理論作指導,對這些經驗材料進行梳理分析,運用奧卡姆剃刀,保留主干,砍掉枝節(jié),才能從“現象”精煉出“事實”。事實相當于約束條件,與理論相結合,才能推演出假說來。②在經驗研究中,是不能隨意作假定的。任何假定,都必須得到可信的論證。我們將這個思維前進過程概括為“現象—事實—假說”。

      假說的構建。就思維過程來說,是從復雜無序的經驗層面跳躍到簡潔優(yōu)美的形而上層面。這很像飛機在跑道上滑跑、加速,然后,突然躍起并升入空中。在長長的跑道上,可以視為“現象”,而起飛的臨界點,可以被視為“事實”。一般理論和特征化事實相結合產生“假說”那個瞬間,就相當于“躍起”。“假說”,則已經升入空中了。

      (二)構建完整的證據鏈

      1.證偽檢驗。

      你編了一個故事,怎么能證明你這個故事是創(chuàng)造了更接近真理的新知識,而不是一個自圓其說的邏輯戲法呢?一個辦法是做證偽檢驗,如果沒有你所說的那樣的原因或傳遞機制,就不會出現你所論證的結果。證偽檢驗的延伸,則是要證明其他競爭性假說不成立。

      經濟學說史上,最大的公案之一是人力資本學派和信號學派之爭:雙方的預測結果都朝著一個方向,然而,政策含義卻是不同的。經驗研究不接受“公說公有理,婆說婆有理”:條件一定,正確結果只有一個。如何把這個纏繞結給解開?Waldinger(2010)給出了一個精彩的檢驗:大學還是那所大學,學生還是最優(yōu)秀的學生,但大師離開了,畢業(yè)生的質量顯著下降了。[12]在一個自然實驗框架下作證,人力資本假說得到支持。

      2.剪裁與布局。

      為了論證提出的假說,還需要各種相關的事實,作為主觀的證據,只有把這些證據材料進行組織、整理、剪裁,納入到一個合理的框架內,放在設定的邏輯鏈條上,才能構建出人們能理解的“認知橋梁”來。我們準備的材料或證據,既產生自頭腦中的知識存量,也來自“研究—思考—寫作”過程中的資料搜集,大多數是用不上的。要舍棄它們,并不容易,因為我們投入了心血,灌注了情感。我們希望把這些證據或材料,都用到文章中去。尤其是一些令我們洋洋自得的內容或“金句”,與作品的整體邏輯(或基調)并不吻合。對讀者來說,那是閱讀進程中一個討厭的鉤子(hook),必須剪掉它。重寫,是最有效的剪裁手段,能讓作者拉遠距離,像個中立的旁觀者,從思維的偏執(zhí)中跳出來,客觀評價材料在文章中的作用,是否保留。

      3.數學工具。

      有人聲稱,自己在模型中推導了多少步,才得出了正確的結果。這是一個誤導。我們懷疑,沒有一個經濟學家真的會這樣從事創(chuàng)造性工作。直覺和演繹思維在經驗研究中起著重大作用,這才是找到正確答案的兩個途徑。

      當我們發(fā)現正確答案后,可以把答案以數學的方法來準確表達出來。但數學既不是我們探索的動力,也不為我們的探索指明正確方向??梢詳嘌?,如果用數學推導可以找到正確的答案,那么,就不需要科學家的探索和研究了,買幾臺功能強大的計算機,就把他們全替代了。幸好這不是事實,科學家會不斷地改進和利用工具,卻不會成為工具的奴隸。

      我們會從理論出發(fā)推論可能的結果。比如,通過把婚姻市場的結構變化與理性人假設結合起來,推演代理人選擇的變化,得出女研究生“寧可在婚姻市場上剩下”的結論(吳要武、劉倩,2014)。[13]但我們是先看到了“女研究生在婚姻市場上剩下”這個“結果”,然后,去倒推“剩下”的原因?;橐鍪袌鍪找婧蛣趧恿κ袌鍪找娴拇讼碎L(trade-off),從理論上能得到很好的解釋,在生活中也能觀察到這個經驗事實。高等教育擴招后,女性占主導地位,卻是一個新的特征化事實。美國和其他發(fā)達國家的高等教育群體中也有同樣的性別特征。這樣,就一步步找到了高等教育擴招為什么會導致“剩女”的原因。

      始終要牢記的是,經驗研究始于一個客觀事實,結束于一個一般化的認識——另一個事實,而不是一串數學符號。①科學研究的起點是客觀事實,一個理論的可信性也建立在“可以普遍推廣的事實”的基礎上。“從來沒有一個真正有用的和深刻的理論果真是靠單純的思辨去發(fā)現的”(參見“理論必須以經驗事實為依據——1918年8月28日給貝索的信”,載于《愛因斯坦文集》第一卷,第180頁,許良英等譯)。經濟學上的經驗研究,其研究對象的客觀性與物理學沒有差異。當研究者不僅找到了正確答案,也找到了傳遞路徑,甚至用形式邏輯將這個過程完整地刻畫出來以后,才將形式邏輯轉換成數理邏輯。孩子生出來了。那個名叫“數學”的阿姨,饋贈了一件華麗的外衣。數學本身是沒有生命的,它裝扮了生命。

      科學探索中的想象力(直覺與演繹)——建立在訓練的基礎上,才是我們探索未知世界的真正工具。想象力找到了正確答案。當然,也不可輕看數學訓練在經驗研究中的作用:數學訓練能讓學者更加準確地刻畫問題,幫助尖銳化思考,保持思維在邏輯上的一致性,減少出差錯的機會。數學工具是一種大家共同接受的論證語言。

      4.評估研究的可信性。

      可信性是經驗研究的靈魂。可信性不僅來自于科學的設計,還取決于關鍵性細節(jié)的處理。除了把因果關系的傳遞機制和路徑說清楚,還要做到數量關系的準確區(qū)分,處理好內生性問題。證偽檢驗,通常是提供一個反證:本文所證明的相關是因果關系,如果沒有本文所指出的這個傳遞機制,那么,兩個變量之間就不再有相關性。穩(wěn)健性檢驗:本文的因果關系不僅在邏輯上成立,在數量關系上還非常“結實”。敲上幾錘子,故事鏈條的接口處都砸不破。

      對估計偏差方向的判斷,是可信性評估的另一個內容。由于數據不完美,技術有瑕疵,從樣本中得到的結果到底有多可信?一個數據樣本不能為自己的結果作證,但如果能找出偏差的方向,無疑是個有價值的信息:現有的估計數值,是朝某個方向偏斜的。

      經濟計量方法不是一個黑箱,各種回歸分析也不是變戲法,因此,要避免欺詐的嫌疑(Leamer,1983)。[14]Stock(2010)曾經指出,今天的主流經濟計量學教材顯著不同于20年前,甚至不同于10年前。[15]可信性革命框架是今天經驗研究的主流(Angrist and Pischke,2009、2010),[16][17]要把因果關系的傳遞鏈條上的每一個重要環(huán)節(jié),都清晰地展示給讀者。

      五、經驗研究過程中的技法

      (一)波普爾范式

      一個規(guī)范的經驗研究,需要用一套規(guī)范的話語體系來表達,在這個話語體系背后,隱含著一個特殊的范式——波普爾體系??此坪唵蔚摹凹僬f—檢驗”,其實包含三個階段的論證。第一步,要論證A(原因)導致了B(結果),這是假說;第二步要論證,如果A(原因)沒有發(fā)生,則B(結果)就不會發(fā)生,這是證偽檢驗;第三步要排除競爭性假說或混淆性因素:其他非A因素(疑似原因),并不真是B的原因,必須排除。一個完整的論證過程才算完成。

      波普爾范式也提醒了經驗研究者,在檢驗假說時應抱持的正確態(tài)度:對結論留有余地,準備接受新的證據和檢驗。

      (二)面對證據的不完美

      由于人類社會的復雜性,經驗研究幾乎不可能獲得完美的證據。限制通常來自經驗層面,比如數據中缺少作者需要的變量、數據質量不高、找不到解決內生性的有效工具等。今天,隨機受控實驗方法受到研究者的青睞,但同樣受到質疑:即使解決了內部有效性,外部有效性又受到懷疑。但經濟學家通常相信,隨機受控實驗與自然實驗可以起到相互補充的作用。前者在內部有效性上有說服力,后者則在外部有效性上可信(DiNardo and Lee,2011)。[18]如果兩種方法得出的研究結果接近,則起到了互證作用,增強了可信性。這是一種最理想的狀態(tài)。

      即使國際領先期刊上那些最受人稱道的論文,也很少有完美的證據。費曼曾無意中為經濟學提供了一個有力的辯護:即使在物理學中,尚且缺少完美的證據,何況與人有關呢?如果證據過分完美,不可能是真實的。①參見《費曼手札:不休止的鼓聲》,長沙:湖南科學技術出版社,2005年。這個論斷是高度可信的。

      再說,我們需要完美的證據嗎?既然客觀世界不存在這樣完美的證據,無論我們主觀上多么努力,都不可能得到完美的證據,那么,就要在某個地方做切割:接受一個達到某種“精度”的證據(Friedman,1953)。[19]

      我們在估計教育回報率時,使用出生季度當工具變量,雖然這個工具的有效性是可信的,但結果本身卻是一個“局部干預效應”:只有16周歲附近的人才受到影響(吳要武,2010)。[20]不能把教育回報率推演到初中以下和高中以上群體。以設計為基礎的經驗研究及其尋找的因果關系,常常是局部的(Local)(Cartwright,2007)。[21]但是,“能解釋一部分總比不能解釋好”(Stigler,1982)。[22]

      沒有完美的證據,應成為每個作者心里不容突破的底限。要時時提醒這個底限的存在:寧可接受不完美的證據,也絕不接受拷打得到的證據。

      (三)再邁一步

      當我們提出的假說,用可信的數據,依照規(guī)范的方法,嚴格檢驗以后,是不是故事就講完了,可以對本文做總結和引申了呢?

      不要停步。應在現有的約束條件下,繼續(xù)努力,把自己的智識探索推進到盡頭。很多人喜歡Duflo(2001)并把這篇文章當作模仿的對象。[23]這篇文章體現出一種積極進取精神:在別人認為研究已經完成的情況下,她再邁出去一步對印尼施行擴大教育項目的成本收益做個評估。這個評估是粗糙的,可信性有限。但我們仍然很喜歡。在科學的意義上,這是一個頑強的姿態(tài):絕不向大自然冷酷的必然性屈服。

      再邁一步,體現了學者智識探索上的精彩,后人因此超越了前人。邁出這“一步”,要花多少時間精力?筆者判斷,大致相當于前面所有工作的總和。索爾仁尼琴借一個囚禁在古拉格群島的工程師之口,將其稱為“最后的一寸”:這不是為了完成,而是為了接近完美。①

      (四)匠氣

      根據筆者的經驗和對很多學者的觀察,在學術攀登的道路上,存在一個若隱若現的“平臺”:當我們經過很久的努力寫出一篇規(guī)范的研究論文后,再接著寫新的論文,會發(fā)現這些論文都在一個水平上,你想有新的突破,上升到更高的層次,但卻做不到。

      有經驗的學者會提醒你:當心陷入“匠氣”。觀察歐美名校教授們的論文——哪怕是發(fā)表在最領先學術期刊上,似乎也都有一個平臺——更高的平臺。正因為如此,我們雖然相信今天的經濟學家早就超越了亞當·斯密、馬歇爾等前輩,但卻想不起誰能有他們那樣巨人般的身量。就像牛頓和愛因斯坦仍然是科學史上的兩座高峰一般。

      匠氣是什么?我們猜想,作者喪失了自我追求和勤奮探究精神,不再因追求完美而削尖思維和深入挖掘,也就不再有創(chuàng)造性。對未知世界曾經充滿激情的探索,蛻變?yōu)橥瓿衫械墓禄虺绦颉?/p>

      如何才能爬出“匠氣”陷阱?我們不知道路徑。但可以推測,逃出這個陷阱,需要長期的努力和探索。對每個已經會做經驗研究的學者來說,攀升到更高的學術層次上,是你的決心、你的黑暗隧道、你的大馬士革之路。除了信念和堅持,無人同行。

      六、經驗研究過程外的技法

      (一)信念——在黑暗中獨行

      每個真正的學者,都有過這樣的經歷或正處于這樣的過程中:一個人摸索在黑暗的隧道里,沒有向導,沒有伙伴,唯有自己的信念和直覺提供了一絲亮光,支撐著自己沿著似乎永無盡頭的隧道走下去。不要驚奇,不要抱怨,因為這是探索者的工作狀態(tài)。求仁得仁,你自己選擇了這條最難走的路。

      根據觀察,中國學者會更多經歷這種“黑暗”。因為他們中的大多數缺少嚴格訓練,未曾掌握做經驗研究的完備知識體系。這是不幸的。相當于讓戰(zhàn)士沒有武器去戰(zhàn)斗,沒有鞋子去沖鋒。大多數熱愛科學研究的年輕人,因為看不到希望而最終選擇了放棄。

      也有很小一部分人,對真理有圣徒般的渴慕,把不幸轉化為動力,把黑暗變成了忍耐,從挫折中學會了頑強,鍛造出了堅韌,也終于掌握了做規(guī)范經驗研究的知識技能。從長期看,信念是心中的一點燭光。在黑暗隧道里穿行時,這點燭光的有無,最終決定了成敗。

      (二)認識論的背后

      探討經驗研究的過程,屬于認識論范疇。在自然科學領域,牛頓之后,“大自然中有規(guī)律,我們可以揭示它”,成為科學家的信條。愛因斯坦又為這個信條背書。但在對人類社會的研究中,經濟學家都無法回避這個問題:人類社會可以認識嗎?這決定于“人類社會是否存在自然界里那種神秘的和諧”。

      謝宇(2006)繼承其導師奧提斯·鄧肯的學術衣缽,不相信人類社會存在著物理學意義上的規(guī)律。[24]那么,他相信人類社會存在著不同于物理學但同樣客觀且可認識的規(guī)律嗎?②人的本性是好逸惡勞的,這是經濟學的基本假設。不可知論者,為拒絕“挑更重的擔子”找到了一個不錯的借口。從他的文章判斷,他不相信存在這樣的規(guī)律。既然沒有規(guī)律存在,為什么還要去苦苦探索呢?他后來的所有論文,都是描述性的。

      我們相信,人類社會也是有秩序的,它的運行同樣能被我們的理性所理解。經濟學家大都堅持斯蒂格勒和貝克爾所傳遞的信念:只有解釋性理論,才有價值。那些描述性的理論,沒有為我們認識世界提供什么有價值的工具。信念,就其本身來說,既不是個科學問題,也不是個哲學問題,而是個神學問題??芍撆c不可知論,那個著名的“分岔路口”——任何學者都會遇到,③參見Frost著名的詩篇:The Road Not Taken。就出現在這里。這是一個需要作出斷然抉擇,卻又不可論證的問題。

      (三)尖銳化思考

      達利有幅名畫,一只尖刀刺穿了瞳孔。注意:這只尖刀是從內向外刺的,呈現在讀者眼前的是露出的刀尖。像科學家一樣,藝術家也在觀察和解釋這個世界,兩者常常取得某種共識。我們對達利所表達意思的解讀為:要尖銳化思考,這是觀察復雜世界的有效方法。在看到這幅名畫以前,我們也在課堂上教學生怎樣做尖銳化:面對紛繁復雜的社會現象,從你的瞳仁里,探出一把手術刀來。

      無論是問題的提出,還是邏輯鏈條的推演,證據鏈條的編織,都需要尖銳化思考。這起源于大家所熟知的事實:將現象轉化為定義良好的事實和問題,必須不斷地“削尖它”,不許有模糊的地方存在,我們才有思考、討論和研究的起點。

      與尖銳化思考相伴隨的是不斷深化自己的探索。

      (四)好論文的標準

      一個好的經驗研究,不僅要滿足前文提到的選題原則,還要讓這個領域最領先的學者感到:這個研究創(chuàng)造了新知識,讓我看世界的眼光與昨天不同了,在智識上,我又上了一個新臺階(Davis D.,2001)。[25]從直覺上,一篇好論文,會讓讀者眼前一亮,甚至會感到激動人心。雖然這是一種主觀判斷,卻像陽光照在臉上,雨點滴在手上一般真實(McCloskey,2000)。[26]

      好論文的標準可以概括為:重要的選題;嚴謹的論證;新穎的故事。

      七、結語

      為什么要做經驗研究?為了創(chuàng)造更接近真理的新知識以增進我們對生活在其中的這個世界的理解。對中國青年學者來說,這個原則要強調一萬遍!熱愛真理和形而上的學問,并非中國經濟學界的傳統(tǒng),更不要說愛因斯坦所推崇的獻身科學探索的“宗教激情”。畏懼困難和貪戀功名利祿,是絕大多數人不學而能的。

      再回到Amy Finkelstein不無抱怨的話題上。我們推猜,MIT的教授們并未秘技自私,也不缺少導師應有的細致和體貼,其實,這些方法和技巧,在耳濡目染中,已經教會了學生。2012年,Amy Finkelstein獲得了克拉克獎,MIT的網頁上一片歡騰。她提出的這個問題,不知道她是否已有了答案。有一個事實需要指出:筆者一直關注她的研究,卻沒有見到她再次談方法論問題。

      研讀弗里德曼、斯蒂格勒和貝克爾等學者的文章可以看出,他們也很少觸及方法論話題,比起他們更擅長的理論創(chuàng)造,畢竟,這屬于另一個領域。這是我們善意的猜測。有一天,看恩斯特·馬赫(2005)談認識論:“自然科學家具有一種強烈的愿望,要徹底弄清楚他獲得知識和擴展知識的進程,但他決不想成為或者只是被稱為哲學家”。[27]像個冒失鬼,馬赫扯開了遮掩真相的帷幕:科學家有一種理論和智識上的自負,不屑于撰寫探討哲學問題的文章。

      筆者對方法論的思考與探索,持續(xù)了多年,此文寫出后又有了新的認識:探究經驗研究的過程并將其展示出來,對一個有創(chuàng)造力的學者來說,不僅是“為人作嫁”,且不為學術規(guī)則所鼓勵(Moretti E.,2012)。[28]我們曾耗費了20多年尋找正確門徑??吹揭慌鸁釔劭茖W探索的青年學子,眼里有神采,胸中有激情,最終卻破滅了希望,黯然離去。再也不愿意那些“尚未離去者”,如此長期地摸索在黑暗中。中國沒有MIT和芝加哥大學那樣智力密集的學術環(huán)境,訓練研究生和青年學者,必須另辟蹊徑。

      [1][18]DiNardo John,David S.Lee,“Program Evaluation and Research Designs”,Chapter 5,Handbook of Labor Economics,vol.4A,Edited by OrleyAshenfelter and David Card,North Holland,2011.

      [2][25]Davis Donald,“Ph.D.Thesis,Where Do IStart?”,http://www.columbia.edu/~drd28/Thesis%20Research.pdf,2001.

      [3]Mankiw Gregory,“Advice for Aspiring Economists”,Personal Blog,2006.

      [4][10]Stigler George,Memoirs of an Unregulated Economist,The University of Chicago Press,1988.

      [5]Qian Nancy,“MissingWomen and the Price of Tea in China:the Effect of Sex-Specific Earnings on Sex Imbalance”,The Quarterly Journal of Economics,vol.123,no.3,2008,pp.1251-1285.

      [6]List John,“Why Economists Should Conduct Field Experiments and 14 Tips for Pulling One Off”,The Journal of Economic Perspectives,vol.25,no.3,2011,pp.3-15.

      [7]洪永淼:《計量經濟學的地位、作用和局限》,《經濟研究》2007年第5期。

      [8]Heckman,J.,Gary Becker,“Model Economic Scientist”,IZA.Discussion Paper No.8827;Leamer,E.E.,“Let's Take the Con Outof Econometrics”,American Economic Review,vol.73,no.1,1983,pp.31-43.

      [9]謝宇、胡婧煒、張春泥:《中國家庭追蹤調查:理念與實踐》,《社會》2014年第2期。

      [11][26]McCloskey Deirdre,EconomicalWriting,Second Edition,Waveland Press,2000.

      [12]Waldinger Fabian,Quality Matters,“The Expulsion of Professors and the Consequences for PhD Student Outcomes in NaziGermany”,Journal of Political Economy,vol.118,no.4,2010,pp.787-831.

      [13]吳要武、劉倩:《高校擴招對婚姻市場的影響:剩女?剩男?》,《經濟學(季刊)》2014年第1期。

      [14]Leamer,Edward,“Let’s Take the Con out of Econometrics”,American Economic Review,vol.73,no.1,1983,pp.31-43.

      [15]Stock James,“The Other Transformation in Econometric Practice:Robust Tools for Inference”,The Journal of Economic Perspectives,vol.24,no.2,2010,pp.83-94.

      [16]Angristand Pischke,Mostly Harm less Econometrics,Princeton University press,2009.

      [17]Angrist and Pischke,“The Credibility Revolution in Empirical Economics:How Better Research Design is Taking the Con Outof Econometrics”,The Journal of Economic Perspectives,vol.24,no.2,2010,pp.3-30.

      [19]Friedman Milton,The Methodology of Positive Economics,in The Philosophy of Economics,Edited by DanielM.Hausman,The third edition,Cambridge press,1966.

      [20]吳要武:《尋找阿基米德的杠桿——出生季度是個弱工具變量嗎?》,《經濟學(季刊)》2010年第2期。

      [21]Cartwright Nancy,Hunting Causes and Using Them:Approaches in Philosophy and Economics,Cambridge University Press,2007.

      [22]Stigler George,Economistas a Preacher,and Other Essays,The University of Chicago Press,1982.

      [23]Duflo Esther,“Schooling and Labor Market Consequences of School Construction in Indonesia:Evidence from an Unusual Policy Experiment”,The American Economic Review,vol.91,no.4,2001,pp.795-813.

      [24]謝宇:《奧提斯·鄧肯的學術成就:社會科學中用于定量推理的人口學方法》,《社會》2006年第3期。

      [27]恩斯特·馬赫:《認識與謬誤》,北京:東方出版社,2005年。

      [28]Moretti Enrico,The New Geography of Jobs,Mariner Books Houghton Mifflin Harcourt,2012.

      責任編輯:張超

      F011

      A

      1000-7326(2015)11-0074-11

      *本文在南京財經大學召開的第二屆香樟經濟學會議(2015年5月15—17日)上得到參會者的建議與啟發(fā),朱玲教授、李亞楠和鄧菁博士提出了重要修改建議,在此一并感謝!

      趙泉,北京工商大學經濟學院副教授(北京,100048);吳要武,中國社會科學院人口與勞動經濟研究所研究員、博士生導師(北京,100028)。

      猜你喜歡
      證據經驗研究
      FMS與YBT相關性的實證研究
      2021年第20期“最值得推廣的經驗”評選
      黨課參考(2021年20期)2021-11-04 09:39:46
      遼代千人邑研究述論
      視錯覺在平面設計中的應用與研究
      科技傳播(2019年22期)2020-01-14 03:06:54
      EMA伺服控制系統(tǒng)研究
      經驗
      2018年第20期“最值得推廣的經驗”評選
      黨課參考(2018年20期)2018-11-09 08:52:36
      對于家庭暴力應當如何搜集證據
      紅土地(2016年3期)2017-01-15 13:45:22
      手上的證據
      “大禹治水”有了新證據
      桃江县| 灵川县| 湄潭县| 雷州市| 汕尾市| 育儿| 宜君县| 亚东县| 景德镇市| 江永县| 哈密市| 桃源县| 荥阳市| 塔城市| 怀安县| 郑州市| 化州市| 铁力市| 开封市| 长沙市| 依安县| 广灵县| 茌平县| 平度市| 旬阳县| 定襄县| 河曲县| 武胜县| 麻栗坡县| 富裕县| 柳州市| 赣州市| 贵溪市| 水富县| 金川县| 吉安市| 双桥区| 如东县| 庆阳市| 九龙坡区| 巴林右旗|