張萌萌 楊雪冬
20世紀(jì)30年代,西方社會出現(xiàn)了所謂的“社會指標(biāo)運動”,一系列指標(biāo)被開發(fā)出來,以測量社會發(fā)展程度和公共政策實施,目的逐漸明確,方法日益系統(tǒng)。①Clifford W.Cobb, Craig Rixford, Lessons Learned From The History Of Social Indicators, San Francisco: Redefining Progress, 1998.這種思路在1970年代擴散到國際領(lǐng)域。進(jìn)入21世紀(jì)后,出現(xiàn)了各類指標(biāo)與排名的繁榮,公私機構(gòu)紛紛投入其中,對全球社會生活的各個方面進(jìn)行評估,形成了蔚為大觀的“指標(biāo)產(chǎn)業(yè)”,吸引了大量資源,也推動了數(shù)據(jù)、方法和分析工具的迅速發(fā)展。政治類評估指數(shù)也位列其中,隨之發(fā)展?!奥?lián)合國發(fā)展計劃”的一份調(diào)查報告表明:當(dāng)前關(guān)于治理方面——如政治腐敗、公民自由、性別平等、人權(quán)、經(jīng)濟(jì)競爭力、新聞自由、政治穩(wěn)定、環(huán)境表現(xiàn)、人類發(fā)展——的指數(shù)共有165種之多。其中,83%的指數(shù)是在1991年到2006年間研發(fā)的,50%的指數(shù)是在2001年到2006年間研發(fā)的。②奧代德?勒文海姆著,朱劍編譯:《考核國家:國際“治理指數(shù)”的??率揭暯恰?,《探索》2016年第4期。
政治評估指數(shù)是指,通過確定現(xiàn)代政治系統(tǒng)整體或某個領(lǐng)域運行應(yīng)遵循的原則或者應(yīng)達(dá)到的標(biāo)準(zhǔn),對其進(jìn)行細(xì)分和可測量化,并運用到對全球范圍內(nèi)多個國家(或地區(qū))政治運行的測量和評估上,以打分或排名的形式發(fā)布評估結(jié)果的研究項目。評估內(nèi)容主要可分為政治制度分類、政治規(guī)范遵守以及政治系統(tǒng)運行績效。根據(jù)不完全統(tǒng)計,專注政治類指標(biāo)并獲得學(xué)界認(rèn)可的評估指數(shù)約有60套,①Princeton University library, “Political & Governance Indicators”, https://libguides.princeton.edu/politics/indicators, 2022-09-24.如果將安全、政治傳播、社會治理或人類發(fā)展等領(lǐng)域也納入廣義的政治體系,相關(guān)指數(shù)則達(dá)到上百套。
政治評估指數(shù)從需求、目標(biāo)到構(gòu)建的機制與影響,都迥異于經(jīng)濟(jì)、社會等其他類型的指標(biāo)。盡管政治類評估指標(biāo)被普遍認(rèn)為帶有明顯的價值判斷,有將西方體制理想化之嫌,但是依然有諸多機構(gòu)先后參與其中,少數(shù)指標(biāo)體系產(chǎn)生了全球性的影響,甚至成為測量各國乃至全球民主、法治、人權(quán)、治理等發(fā)展的標(biāo)尺。這一看似矛盾的現(xiàn)狀促使我們關(guān)注并深入探究政治類評估指數(shù)的發(fā)展、現(xiàn)狀、構(gòu)建的機制與產(chǎn)生的影響,進(jìn)而討論現(xiàn)有政治類指數(shù)存在的問題和政治發(fā)展評估遭遇的普遍困境。對這些指數(shù)的再評估,不僅有助于我們?nèi)嬲J(rèn)識各國政治發(fā)展道路的差異性,也有利于更深入地思考中國政治發(fā)展道路的全球意義。
本文分為四個部分。第一部分簡要概述政治發(fā)展評估指數(shù)的發(fā)展過程;第二部分從上百個指數(shù)中選擇了10個在世界上具有較大影響的評估指數(shù),對指數(shù)的構(gòu)建主體、理論框架、評估方法以及影響力進(jìn)行評析;第三部分著重討論這些評估指數(shù)在分析政治發(fā)展的復(fù)雜現(xiàn)實中,所做出的貢獻(xiàn)和存在的缺陷;第四部分是結(jié)論。
二戰(zhàn)結(jié)束后,隨著一大批前殖民地國家取得獨立,開始現(xiàn)代國家制度建設(shè),政治發(fā)展問題成為學(xué)術(shù)研究的重點。冷戰(zhàn)激發(fā)的制度間競爭,又使得何種政治發(fā)展道路道路更優(yōu)、哪些制度設(shè)計更好等問題,迫切需要獲得理論論證。以統(tǒng)計方法為代表的定量研究方法的不斷發(fā)展和改進(jìn),為將政治發(fā)展這個抽象而復(fù)雜的現(xiàn)象具象化提供了技術(shù)條件。因此,伴隨著各種類型經(jīng)濟(jì)發(fā)展評估指數(shù)的繁榮,政治類評估指數(shù)也開始在比較政治學(xué)等學(xué)科中出現(xiàn)了。目前仍被視為所謂三大“民主指數(shù)”(政體指數(shù)、自由指數(shù)和民主多樣性指數(shù))中的兩項始于20世紀(jì)60、70年代。
冷戰(zhàn)結(jié)束后,西方社會陷入了“歷史終結(jié)”的欣喜之中,政治發(fā)展似乎有了統(tǒng)一而“唯一”的衡量標(biāo)準(zhǔn),政治評估也隨之掀起了第一波浪潮。這個時期出現(xiàn)的評估指數(shù)致力于倡導(dǎo)自由民主模式,探索評價“不可評價”的社會與政治現(xiàn)象,②Simon Bell, Stephen Morse, Sustainability Indicators: Measuring the Immeasurable?, London: Earthscan, 2008.比如民主(政體指數(shù))、自由(自由指數(shù))或腐?。ǜ瘮「兄笖?shù))。學(xué)術(shù)界與實務(wù)界的“科學(xué)化”與“量化”熱潮,以及冷戰(zhàn)結(jié)束以后非政府組織,尤其是國際發(fā)展與援助機構(gòu)影響力的不斷提升,援助分配原則的可操作化改革,極大地推動了政治評價指數(shù)的發(fā)展。以民主規(guī)范為指導(dǎo)原則的國際組織和援助國家主體在很大程度上決定了指數(shù)的重點關(guān)注領(lǐng)域和評價標(biāo)準(zhǔn)。
21世紀(jì)的第一個十年是政治評價指數(shù)發(fā)展的第二波浪潮。政治評價指標(biāo)更加偏向于客觀評估方法,數(shù)據(jù)來源和評估維度也更加多樣化,并將關(guān)注的重點轉(zhuǎn)向“治理”需求。第二代指數(shù)致力于彌合評估與決策之間的鴻溝,與第一代指數(shù)相比,評估對象在政治上更加易于接受,客觀性和透明度方面也都有很大的改進(jìn)。 20世紀(jì)末主流發(fā)展理念的挫敗,發(fā)展中國家的政策反饋以及對第一代指數(shù)的批評都推動了這一階段變革的快速發(fā)展。各種私人和公共機構(gòu)加入指數(shù)評估的行列,不止覆蓋了政治制度,也包括更為廣義的治理以及社會發(fā)展的方方面面。在這一時期,一方面創(chuàng)建機構(gòu)更為多樣,測量對象更為多樣,另一方面對于評估對象也有了更有針對性的分類。一些指數(shù)集中關(guān)注特定類型的國家,比如失敗國家指數(shù)(后更名為脆弱國家指數(shù))。相較于早期指數(shù),這一時期的指數(shù)更具有針對性。二代指數(shù)的構(gòu)建目的和訴求不僅是做出極度簡化和抽象的排名,而更加致力于做出具體的診斷并提出解決的辦法。③Stephanie E.Trapnell, “Actionable Governance Indicators: Turning Measurement Into Reform”, Hague Journal on the Rule of Law,Vol.3, No.2, 2011, pp.317-48; Tero Erkkil?, “Global Governance Indices as Policy Instruments: Actionability, Transparency and Comparative Policy Analysis”, Journal of Comparative Policy Analysis: Research and Practice, Vol.18, No.4, 2016, pp.382-402.
21世紀(jì)的第二個十年迎來政治評估指數(shù)的第三波浪潮。這個時期出現(xiàn)的指數(shù)一般被稱為第三代指數(shù)?;趯Χ笖?shù)的全面評估與反思,評估界對第三代指數(shù)提出了更高的要求,但從結(jié)果來看,高質(zhì)量新指數(shù)的產(chǎn)出遠(yuǎn)不及預(yù)期,一代和二代指數(shù)仍然是政治評價指數(shù)的主導(dǎo)。在構(gòu)建方法上,由于政治發(fā)展理念的復(fù)雜化,量化技術(shù)的發(fā)展以及數(shù)據(jù)來源的進(jìn)一步豐富,出現(xiàn)了多個復(fù)合其他指數(shù)的集成指數(shù),其中最為引人注目的是世界銀行的全球治理指數(shù)(WGI)。該指數(shù)綜合大量與治理相關(guān)的指標(biāo)數(shù)據(jù),用以詮釋國家間的治理水平差異。指標(biāo)構(gòu)成和數(shù)據(jù)來源的多元化也造成了評價標(biāo)準(zhǔn)和理念和混雜,民主制度、政治原則、績效表現(xiàn)在一些指數(shù)中彼此重疊,這一特點在三代指數(shù)中尤其突出。同時,服務(wù)決策和發(fā)展實踐仍然是這一階段的首要任務(wù)。
這些評估方法和指標(biāo)體系,分布已經(jīng)超越了傳統(tǒng)政治學(xué)的研究范圍,橫跨了整個社會科學(xué)領(lǐng)域。這些發(fā)展主要得益于三方面原因:首先,在理論方面,20世紀(jì)90年代以來經(jīng)濟(jì)學(xué)的新制度理論轉(zhuǎn)向推動了制度研究的全面發(fā)展,測量制度與發(fā)展結(jié)果之間的關(guān)系成為學(xué)術(shù)熱點。其次,在技術(shù)方面,測量和評估程序更加成熟,基礎(chǔ)數(shù)據(jù)日益豐富可得;最后,在需求方面,各國政府、國際組織和商業(yè)機構(gòu)對指標(biāo)信息的需求不斷增長。
從目前的指數(shù)版圖來看,存在三大類評估框架:政治制度的類型、政治規(guī)范的遵守和制度運行的績效(見圖1)。按照數(shù)據(jù)最終呈現(xiàn)形式,現(xiàn)有指數(shù)也可以劃分為排名指數(shù)和面板指數(shù),①Hazel Feigenblatt, “Governance Indicators and the Broken Feedback Loop Leveraging Communications for Impact”, in Helmut K.Anheier, Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress, Promise, New York: Oxford University Press, 2018, pp.315-349.前者提供一個單一排名,而后者則對不同指標(biāo)進(jìn)行單獨打分,這一類指數(shù)往往也稱為數(shù)據(jù)集或數(shù)據(jù)庫,但仍被視為廣義評估指數(shù)。
圖1 三大類政治評估指數(shù)(來源:作者自制)
本文從現(xiàn)有的近百種評估指數(shù)中篩選了10種,包括屬于政治制度類的3種;屬于政治規(guī)范類的4種;以及屬于制度績效類的3種。選擇標(biāo)準(zhǔn)主要有四個:一是評估內(nèi)容,指數(shù)評估的具體內(nèi)容屬于定義中三種主要類型的一種。二是發(fā)布周期,指數(shù)在推出以后,必須周期性連續(xù)發(fā)布。三是覆蓋范圍,指數(shù)必須覆蓋多個國家,且以國家為評估的基本單位。四是影響力,指數(shù)在學(xué)術(shù)界、大眾媒體或政策實務(wù)界有較大的傳播效果或政策影響。
1.政體指數(shù)(Polity)
政體指數(shù)研究于20世紀(jì)60年代末由美國馬里蘭大學(xué)政治學(xué)學(xué)者發(fā)起,第一代數(shù)據(jù)發(fā)表于1975年,后續(xù)研究由“系統(tǒng)性和平中心”(Center for Systemic Peace)主持。項目由美國中央情報局旗下的政治不穩(wěn)定工作組(Political Instability Task Force)資助(資助于2020年2月終止)。最新的“政體第五代指數(shù)”(Polity 5)由第四代指數(shù)(Polity IV)改造發(fā)展而來,記錄和監(jiān)測1800年以來167個國家政權(quán)模式和政權(quán)的變化。①Center for Systemic Peace,“ The Polity Project: About Polity”, https://www.systemicpeace.org/polityproject.html, 2022-08-24.第五代指數(shù)目前仍在開發(fā)和改造過程中,政治學(xué)研究中廣泛使用的仍然是第四代指數(shù)。
政體指數(shù)的獨特之處在于它關(guān)注制度中民主與專制相伴而非相互排斥的形式。這一觀點設(shè)想了一個治理權(quán)威的譜系,從完全制度化的獨裁,到混合的或不完全的威權(quán)政權(quán),再到完全制度化的民主。政體指標(biāo)的測量方法是開創(chuàng)性的,但同時也受到大量的質(zhì)疑和批評:一是政體指數(shù)判定民主或?qū)V频母黜椫笜?biāo)主要集中在體制設(shè)定方面,不涉及制度績效和公民權(quán)利。二是對政治體制的評估也更為偏重行政系統(tǒng)。盡管指數(shù)設(shè)定中包含對選舉的考察,但對于選舉本身的測量是較為粗糙的。三是對美國歷史的美化,比如將1842年的美國列為全世界唯一的民主國家,事實上此時的美國仍是少數(shù)實行奴隸制的國家。四是評估指數(shù)對于西方國家的殖民主義歷史選擇了回避,比如1900年之前的非洲地區(qū)被簡單處理為“無數(shù)據(jù)”。②Adam Johnson, “Vox’s CIA-Backed ‘Democracy’ Standard Is OK With Slavery and Women Not Voting”, Fairness & Accuracy in Reporting, https://fair.org/home/voxs-cia-backed-democracy-standard-is-ok-with-slavery-and-women-not-voting/, 2022-08-24.
2.民主多樣性指數(shù)(Varieties of Democracy/V-Dem)
民主多樣性研究所創(chuàng)立于2014年,總部設(shè)在瑞典哥德堡大學(xué)政治學(xué)系。民主多樣性指數(shù)致力于在世界范圍內(nèi)測量和評估民主發(fā)展,資助機構(gòu)非常多元,包括歐盟委員會等多家政府機構(gòu)、世界銀行、多家非政府機構(gòu)以及高校、研究所等學(xué)術(shù)機構(gòu)。③V-Dem, “The V-Dem Project: About the Project and Methodology”, https://www.v-dem.net/project.html, 2022-08-24.
與其他主要政治評估指標(biāo)相比,民主多樣性指數(shù)的創(chuàng)建時間較晚,但這也使得該指數(shù)在創(chuàng)始之初就能夠利用最新的測評方法以及豐富的數(shù)據(jù)來源。其樣本規(guī)模、專家數(shù)量、數(shù)據(jù)多樣性和測量方法之復(fù)雜程度,都是早期政治評估指數(shù)難以企及的。指數(shù)由五個民主原則一級指標(biāo)構(gòu)成,包括選舉、自由、參與、協(xié)商和平等。再進(jìn)一步分解為82項二級指標(biāo)和400多項三級指標(biāo),其中約半數(shù)為來自官方文件的客觀事實指標(biāo),其余一半為專家主觀評估。④Staffan I.Lindberg, Jan Teorell, Michael Coppedge, John Gerring et al., “V-Dem: A new way to measure democracy”, Journal of Democracy, Vol.25, No.3, 2014, pp.159–169.
民主多樣性指數(shù)的創(chuàng)始目的是建立一個比較民主政治的數(shù)據(jù)庫,但在近年來逐漸向政策領(lǐng)域發(fā)展。民主多樣性指數(shù)中的多項指標(biāo)也成為其他重要治理指數(shù)的數(shù)據(jù)來源,比如世界銀行的全球治理指標(biāo)、“透明國際”的清廉指數(shù)和美國國際發(fā)展署的自力更生國家指數(shù)(Journey to Self-Reliance Country Roadmap)。⑤USAID, “FY 2021 USAID Journey to Self-Reliance Country Roadmap Methodology Guide”, https://roadmaps.usaid.gov/docs/FY_2021_USAID_Journey_to_Self-Reliance_Country_Roadmap_Methodology_Guide.pdf, 2022-08-24.但總體來說,民主多樣性指數(shù)的曝光率不及世界自由指數(shù)這樣的老牌政治評估指數(shù)。
3.民主指數(shù)(Democracy Index)
英國經(jīng)濟(jì)學(xué)人集團(tuán)旗下的經(jīng)濟(jì)學(xué)人智庫(EIU)從2006年開始發(fā)布民主指數(shù)。民主指數(shù)測量全球167個國家和地區(qū)的民主狀況,幾乎涵蓋了全世界的所有人口和世界上絕大多數(shù)國家(微型國家除外)。⑥EIU, “Democracy Index 2020: In Sickness and in Health?”, https://www.eiu.com/n/campaigns/democracy-index-2020/, 2022-08-24.民主指數(shù)包括5個一級指標(biāo)下的60個二級指標(biāo),測量選舉過程和多元化、政府職能、政治參與、政治文化和公民自由。
依托以《經(jīng)濟(jì)學(xué)人》周刊為旗幟的經(jīng)濟(jì)學(xué)人集團(tuán),民主指數(shù)在媒體曝光度和公眾關(guān)注程度上具有明顯的優(yōu)勢,但多年來也受到各種質(zhì)疑和批評。首先,該指數(shù)并沒有披露評估專家的身份,經(jīng)濟(jì)學(xué)人智庫沒有說明他們是智庫的工作人員還是外部專家,也沒有提供其數(shù)量、所在行業(yè)、職業(yè)或國籍的任何信息。其次,民主指數(shù)的評估與打分過程存在極大的模糊性、不確定性。為了獲得一致性得分,指數(shù)對于民主相關(guān)變量進(jìn)行了極簡化處理,這無疑會對指數(shù)的準(zhǔn)確性造成影響。①Peter Tasker, “The Flawed ‘Science’ behind Democracy Rankings”, Nikkei Asia, https://asia.nikkei.com/NAR/Articles/Peter-Tasker-The-flawed-science-behind-democracy-rankings, 2022-08-24.
1.世界自由指數(shù)(Freedom in the World)
世界自由指數(shù)由位于美國華盛頓特區(qū)的非營利組織“自由之家”(Freedom House)于1972年開始正式發(fā)布。盡管在官方網(wǎng)站上聲明“(世界自由)報告是在美國國家民主基金會、美林家族基金會、谷歌公司和禮來基金會的慷慨支持下完成的。《世界自由》不接受政府資助”,②Freedom House, “About the Report”, https://freedomhouse.org/report/freedom-world, 2022-08-20.但“自由之家”的歷年財務(wù)報告顯示來自聯(lián)邦政府的資助一直以來都是該組織最重要的財源,且數(shù)量和比例都在逐漸增加。 2020年資助規(guī)模達(dá)到近4600萬美元,超過全部資金來源的90%。③Freedom House, “Financial Statements”, https://freedomhouse.org/sites/default/files/2021-05/Freedom_House_FY2020_Audited_Financial_Statements.pdf, 2022-08-20.
世界自由指數(shù)是全球最具影響力的政治評估指數(shù)之一。無論從媒體曝光度、學(xué)術(shù)參考還是政治決策方面,自由指數(shù)都有相當(dāng)?shù)挠绊懥?。④Tim Büthe, “Beyond Supply and Demand: A Political-Economic Conceptual Model”, in Davis, Fisher, Kingsbury, Merry (eds.),Governance by Indicators: Global Power through Classification and Rankings, Oxford: Oxford University Press, 2012, p.50; Matthias Haber, Olga Kononykhina, “A Comparative Classification and Assessment of Governance Indices”, in Helmut K.Anheier, Matthias Haber, Mark A.Kayser(eds.), Governance Indicators: Approaches, Progress, Promise, pp.11-42.與許多政治評估指數(shù)發(fā)布機構(gòu)不同,“自由之家”在世界政治中非常活躍,從人員、資金到活動都與美國政府聯(lián)系緊密。在理論框架方面,有學(xué)者指出世界自由指數(shù)對民主的定義過于片面,過分強調(diào)民主較為正式的方面,而未能捕捉到非正式但真實的權(quán)力關(guān)系和影響途徑,并經(jīng)常導(dǎo)致事實上的民主偏離。因此,某個國家可以“在形式上看起來自由民主,但在實際運作中可能相當(dāng)不自由”。⑤Wouter P.Veenendaal, “Democracy in Microstates: Why Smallness Does Not Produce a Democratic Political System”,Democratization, Vol.22, No.1, 2015, pp.92–112.此外,在測量方法上,依賴觀察和主觀判斷的專家打分法也難以避免系統(tǒng)性偏見的產(chǎn)生。
2.法治指數(shù)(Rule of Law Index/RoLI)
世界正義項目(World Justice Project)從2008年開始發(fā)布法治指數(shù),該項目由美國律師協(xié)會發(fā)起,旨在評估各國在法制建設(shè)及遵守法律方面的情況。該項目最初由比爾和梅琳達(dá)蓋茨基金會通過美國律師協(xié)會資助,目前得到多個組織、公司和私人基金會的財務(wù)支持。
法治指數(shù)對于“法治”的定義包括四項基本原則:責(zé)任、公正法律、開放政府以及無障礙和公正的爭議解決。⑥The World Justice Project, “Rule of Law Index 2020”, https://worldjusticeproject.org/sites/default/files/documents/WJP-ROLI-2020-Online_0.pdf, 2022-06-21.值得強調(diào)的是,法治指數(shù)是少數(shù)幾個獨立收集公眾數(shù)據(jù)的指標(biāo)之一。對普通公眾的一般性調(diào)查降低了對專家的依賴以及可能產(chǎn)生的評估偏見。但該指數(shù)也有局限性,社會調(diào)查方法存在的一些固有問題在法治指數(shù)調(diào)查中同樣難以克服,專家調(diào)查由于隔年進(jìn)行一次,調(diào)查時間可能對調(diào)查結(jié)果產(chǎn)生一定影響。調(diào)查結(jié)果并不能體現(xiàn)變量之間的因果關(guān)系,也難以直接用于政策改革。
3.腐敗感知指數(shù)(Corruption Perceptions Index/CPI)
腐敗感知指數(shù)是由非政府組織“透明國際”建立的清廉指數(shù)排行榜,反映全球商人、學(xué)者及風(fēng)險分析人員對世界各地腐敗狀況的觀察和感受。“透明國際”總部設(shè)在德國柏林,由世界銀行負(fù)責(zé)非洲地區(qū)項目的前官員于1993年成立?!巴该鲊H”的主要資助來源包括多個國家和地區(qū)的政府機構(gòu)、多邊組織和基金會等。⑦Transparency International, “Who Support Us”, https://www.transparency.org/en/the-organisation/who-supports-us, 2022-06-22.從1995年開始,腐敗感知指數(shù)對各國“公共部門腐敗感知水平”進(jìn)行排名。⑧Transparency International, “Our Story”, https://www.transparency.org/en/our-story, 2022-06-22.腐敗感知指數(shù)將腐敗定義為“濫用委托權(quán)力以謀取私利”。由于腐敗行為的隱蔽性以及難以衡量腐敗的絕對程度,腐敗感知指數(shù)測量的是人們對腐敗的看法。
腐敗感知指數(shù)是世界范圍內(nèi)使用最廣泛的腐敗指數(shù),受到各類機構(gòu)和全球媒體的廣泛關(guān)注,也被國際發(fā)展和援助組織用來指導(dǎo)資源分配。對腐敗感知指數(shù)的批評主要集中于測量方法上。比如,有學(xué)者指出,腐敗是一個過于復(fù)雜的概念,不能用一個分?jǐn)?shù)來衡量。通過衡量人們對腐敗的看法,而不是腐敗本身,指數(shù)可能只是在強化現(xiàn)有的刻板印象;指數(shù)只衡量公共部門的腐敗程度,而忽略了私營部門。①Dan Hough, “Here’s this Year’s (Flawed) Corruption Perception Index.Those Flaws are Useful”, The Washington Post, 2016-01-27.此外,由于腐敗感知指數(shù)的數(shù)據(jù)收集并不面向普通公眾,因此被認(rèn)為存在嚴(yán)重的精英偏見,并由此引發(fā)不當(dāng)?shù)恼叻磻?yīng)。②Alex Cobham, “Corrupting Perceptions”, Foreign Policy, 2013-07-22.作為對腐敗感知指數(shù)的補充,“透明國際”推出了全球腐敗晴雨表,面向普通公眾進(jìn)行社會調(diào)查。但全球腐敗晴雨表的規(guī)模、曝光度和影響力都遠(yuǎn)遠(yuǎn)不及腐敗感知指數(shù)。
4.全球和平指數(shù)(Global Peace Index/GPI)
全球和平指數(shù)是一套測量國家或地區(qū)和平程度的指標(biāo),由經(jīng)濟(jì)與和平研究所(Institute for Economics & Peace,IEP)于2007年首次發(fā)布。指標(biāo)的部分?jǐn)?shù)據(jù)由英國經(jīng)濟(jì)學(xué)人智庫(EIU)的專家小組收集。研究所的創(chuàng)立者澳大利亞企業(yè)家兼慈善家史蒂夫?基利亞(Steve Killelea)曾兩次獲提名諾貝爾和平獎。目前,研究所受到包括澳大利亞政府、全球多個政府間組織和基金會的資助。③Institute for Economics & Peace, “About”, https://www.economicsandpeace.org/about/, 2022-01-31.
全球和平指數(shù)測量國家卷入當(dāng)前國內(nèi)和國際沖突的程度,評估一個國家內(nèi)部的和諧或不和諧程度。指標(biāo)分為三個關(guān)鍵的主題類別:尚未平息的國內(nèi)和國際沖突、國內(nèi)和諧或動亂程度以及軍事化水平。全球和平指數(shù)使用的數(shù)據(jù)以客觀數(shù)據(jù)為主,來源廣泛,包括國際戰(zhàn)略研究所、世界銀行、斯德哥爾摩國際和平研究所、聯(lián)合國毒品和犯罪問題辦公室等等。個別指標(biāo)由于缺乏數(shù)據(jù),會與經(jīng)濟(jì)學(xué)人智庫合作進(jìn)行定性評估。④Institue for Economics & Peace, “Global Peace Index 2021”, https://www.economicsandpeace.org/wp-content/uploads/2021/06/GPI-2021-web.pdf, 2022-01-31.
除了為學(xué)術(shù)研究提供數(shù)據(jù)和評估標(biāo)準(zhǔn),全球和平指數(shù)也為各國政府提供決策依據(jù),尤其在促進(jìn)旅游產(chǎn)業(yè)和建設(shè)國家品牌方面,并為非政府組織和私營部門提供項目活動信息,幫助它們選擇項目的重點領(lǐng)域,評估風(fēng)險。因此,全球和平指數(shù)自發(fā)布以來獲得新聞媒體、各國實務(wù)界和國際組織的普遍關(guān)注。也有批評指出全球和平指數(shù)結(jié)果的不合理性,這種情況主要源于定義和平以及分配指標(biāo)權(quán)重的困難性。⑤Jay Ulfelder, “The Trouble with Combining, or Why I’m Not Touting the Global Peace Index”, https://dartthrowingchimp.wordpress.com/2012/06/12/the-trouble-with-combining-or-why-im-not-touting-the-global-peace-index/, 2022-01-31.
1.國家政策和機構(gòu)評估(Country Policy and Institutional Assessment/CPIA)
以世界銀行為代表的國際金融機構(gòu)從20世紀(jì)70年代開始著手設(shè)計針對受援國家的國別政策和體制評估。國家政策和機構(gòu)評估始于1977年,在相當(dāng)長一段時期內(nèi),一直是一項內(nèi)部評估,指導(dǎo)世行國際開發(fā)協(xié)會(IDA)向發(fā)展中國家提供貸款和贈款。自2006年以來,國家政策和機構(gòu)評估的數(shù)據(jù)向公眾開放。⑥The World Bank, “The World Bank’s Country Policy and Institutional Assessment: An IEG Evaluation”, https://openknowledge.worldbank.org/handle/10986/13547, 2022-01-21.其每年評估借款國的經(jīng)濟(jì)管理、結(jié)構(gòu)政策和公共部門績效,評估結(jié)果用于指導(dǎo)資源分配,匯報國家援助戰(zhàn)略和世界銀行貸款活動,因此國家政策和機構(gòu)評估的國家總評分被稱為“世界銀行國際開發(fā)協(xié)會資源分配指標(biāo)”(IRAI)。
國家政策和機構(gòu)評估旨在從績效角度評估國家當(dāng)前投入的政策和制度的質(zhì)量,測量國家支持可持續(xù)增長和減貧的程度,從而有效吸收發(fā)展援助的能力。其中特別列出了脆弱國家這一分類,使其能夠從基于績效的援助分配中獲得豁免。⑦World Bank, “Information Note: The World Bank’s Harmonized List of Fragile Situations”, https://www.worldbank.org/content/dam/Worldbank/document/Fragilityandconflict/FragileSituations_Information%20Note.pdf, 2022-01-21.國家政策和機構(gòu)評估的評估標(biāo)準(zhǔn)和評估方法也一直受到質(zhì)疑,比如各項評估標(biāo)準(zhǔn)中存在一定的重疊,專家評估的主觀性問題。此外,國家政策和機構(gòu)評估是在董事會國家的要求下建立的診斷性工具,由世行內(nèi)部專家制定,因而反映的是所屬機構(gòu)對于善治的政策和機構(gòu)設(shè)置偏好。①The World Bank, “The World Bank’s Country Policy and Institutional Assessment: An IEG Evaluation”, https://openknowledge.worldbank.org/handle/10986/13547, 2022-02-21.
2.脆弱國家指數(shù)(Fragile States Index/FSI)
總部位于美國華盛頓特區(qū)的智庫和平基金會和美國《外交政策》雜志從2005年開始發(fā)布失敗國家指數(shù)(Failed States Index),對世界各國總體的社會穩(wěn)定性進(jìn)行排名。 2014年,該指數(shù)更名為脆弱國家指數(shù)(Fragile States Index),旨在建立一套預(yù)警機制,有效應(yīng)對國家脆弱性問題。和平基金會創(chuàng)立于20世紀(jì)50年代,當(dāng)時主要關(guān)注冷戰(zhàn)背景下的核不擴散問題。冷戰(zhàn)結(jié)束后,和平基金會將注意力轉(zhuǎn)向弱小國家,以及更為廣泛的暴力沖突、國家脆弱性、安全和人權(quán)等問題。目前,和平基金會的合作者和資助來源包括數(shù)十個教育機構(gòu)、政府組織、政府間組織、私營企業(yè)以及基金會。②FFP, “Who We are”, https://fundforpeace.org/who-we-are/, 2021-12-20.
脆弱國家指數(shù)的起源可以追溯到和平基金會的沖突評估系統(tǒng)工具(CAST)的創(chuàng)建,該工具開發(fā)于20世紀(jì)90年代,旨在為決策者和一線工作者提供理解和測量復(fù)雜環(huán)境中的沖突驅(qū)動因素和動態(tài)的框架。從2004年開始,和平基金會與《外交政策》合作,以此框架為基礎(chǔ),推出了失敗國家指數(shù),進(jìn)一步對國家進(jìn)行評估和排名。由于對理論、理念到評估方法的一系列調(diào)整,失敗國家指數(shù)在更名為脆弱國家指數(shù)后,評估的重心在一定程度上由安全轉(zhuǎn)向發(fā)展。
盡管脆弱國家指數(shù)自發(fā)布以來就受到廣泛關(guān)注,但各種批評也一直伴隨左右。“失敗國家”這一名稱多年來一直飽受爭議。批評者指出“失敗國家”暗示著無可挽救。這一爭議也是2014年指數(shù)更名的原因之一。③FFP, “From Failed to Fragile: Renaming the Index”, https://fundforpeace.org/2014/06/24/from-failed-to-fragile-renaming-theindex/, 2021-12-20.此外,批評者對于脆弱國家指數(shù)作為政策工具的有效性提出質(zhì)疑,認(rèn)為指數(shù)只關(guān)注癥狀,忽視造成現(xiàn)狀的原因或可能的治愈方法。④Lionel Beehner, Joseph Young, “Is Ranking Failed or Fragile States a Futile Business?”, The Washington Post, 2014-07-14,https://www.washingtonpost.com/news/monkey-cage/wp/2014/07/14/is-ranking-failed-or-fragile-states-a-futile-business/, 2011-12-21; Miles M.Evers, “The Fatally Flawed Fragile States Index”, The National Interest, https://nationalinterest.org/blog/thebuzz/the-fatally-flawed-fragile-states-index-10878, 2021-12-25.
3.世界治理指數(shù)(Worldwide Governance Indicators/WGI)
世界治理指數(shù)從2002年開始發(fā)布,該指數(shù)是衡量一國政府公共治理成效方面最為權(quán)威的指標(biāo)體系。與機構(gòu)內(nèi)的一些其他指標(biāo)數(shù)據(jù)不同,世界治理指數(shù)并不指導(dǎo)世界銀行的資源分配。⑤WGI, “Introduction”, https://info.worldbank.org/governance/wgi/Home/Documents#doc-intro, 2021-12-26.其評估內(nèi)容包括六個方面:言論和問責(zé)、政治穩(wěn)定和暴力削減、政府效能、監(jiān)管質(zhì)量、法治、腐敗控制。⑥World Bank, “Worldwide Governance Indicators”, https://info.worldbank.org/governance/wgi/, 2021-12-26.
世界治理指數(shù)強調(diào)評估、理論發(fā)展和政策之間的聯(lián)系,“讓治理問題的相關(guān)探討更加實證化”,⑦Kaufmann D., Kraay A., “Governance Indicators: Where Are We, Where Should We Be Going?”, World Bank Policy Research Working Papers, https://elibrary.worldbank.org/doi/abs/10.1596/1813-9450-4370, 2021-12-26.是當(dāng)前諸多治理定量研究中嚴(yán)謹(jǐn)度最高、影響力最大、使用面最廣的綜合指標(biāo)之一。治理指標(biāo)為蓬勃的治理實證研究提供數(shù)據(jù)支持,學(xué)術(shù)界使用世界治理指數(shù)來驗證治理與增長之間的關(guān)系,⑧Daniel Kaufmann, Aart Kraay, “Growth Without Governance”, World Bank Policy Research Working Papers, 2002, https://ssrn.com/abstract=316861, 2021-12-26; Daniel Kaufmann, Aart Kraay, Massimo Mastruzzi, “Governance Matters VI: Governance Indicators for 1996-2006”, World Bank Policy Research Working Paper, https://ssrn.com/abstract=999979, 2021-12-26; Marcus J.Kurtz, Andrew Schrank, “Growth and Governance: Models, Measures, and Mechanisms”, Journal of Politics, No.69, 2007, pp.538-554.為世界各地的決策者提供了政策改革和監(jiān)測的工具,國際發(fā)展實務(wù)界也可以用其作為政策討論尤其是對外援助方面的政策依據(jù),比如千禧挑戰(zhàn)公司(MCC)就使用世界治理指數(shù)的部分指標(biāo)來選擇援助國家。⑨MCC, “Who We Select: Control of Corruption Indicator”, https://www.mcc.gov/who-we-select/indicator/control-of-corruptionindicator, 2021-12-27.對于世界治理指數(shù)的分析和批評也始終存在。比如,有學(xué)者指出其對于治理的定義過于寬泛,難以真正對政府績效進(jìn)行評估。①Anna Persson, Bo Rothstein, Jan Teorell, “Why Anticorruption Reforms Fail-Systemic Corruption as a Collective Action Problem”,Governance, Vol.26, No.3, 2012, pp.449-471.六個一級指標(biāo)之間的邊界并不明確,對于何為“善治”,何為“惡治”并沒有明確的標(biāo)準(zhǔn)。②Laura Langbein, Stephen Knack, “The Worldwide Governance Indicators: Six, One, or None?”, Journal of Development Studies,Vol.46, No.2, 2010, pp.350-370.其復(fù)雜的指標(biāo)來源和變量也對數(shù)據(jù)使用者造成困擾。在一些情況下,同一指標(biāo)不同國家的數(shù)據(jù)可能來自多個不同的數(shù)據(jù)源,這也使得無論是時間上還是空間上的比較都存在問題。對于數(shù)據(jù)源的選擇依據(jù),指數(shù)也并沒有充分的說明。雖然數(shù)據(jù)來源中既包括面向普通公眾的社會調(diào)查,也包括專家評估和公司調(diào)查,但前者的權(quán)重偏低,專家偏見仍然沒有得到有效克服。此外,很難使用該指數(shù)來直接指導(dǎo)治理實踐,指數(shù)更多的是對現(xiàn)狀的描述,對于其成因和影響,以及如何應(yīng)對,并沒有給出指導(dǎo)意見。③M.A.Thomas, “What Do the Worldwide Governance Indicators Measure?”, European Journal of Development Research, Vol.22,No.1, 2009, pp.31-54.
1.構(gòu)建主體
對指數(shù)構(gòu)建主體及其資金來源的考察是探討指數(shù)構(gòu)建機制的開始,建構(gòu)主體與指標(biāo)的構(gòu)建方式和影響力密切相關(guān),但卻往往受到研究者的忽略。從以上指數(shù)的發(fā)布機構(gòu)來看,可以分為三大類。
第一類是政府間機構(gòu),尤其是作為“知識銀行”④世界銀行:《我們是誰》,https://www.shihang.org/zh/what-we-do,2022-01-03。的世界銀行發(fā)布了多項重要指數(shù),以指導(dǎo)和援助世界各國的發(fā)展。世界銀行自20世紀(jì)90年代中期重新定位為援助與發(fā)展的知識和數(shù)據(jù)銀行,⑤Don Cohen, Bruno Laporte, “The Evolution of the Knowledge Bank”, https://web.worldbank.org/archive/website01537/WEB/IMAGES/EVOLUTIO.PDF, 2022-01-03.各種量化指標(biāo)的輸出是出于資金分配科學(xué)化和透明度的需求,反映世界銀行早期作為傳統(tǒng)金融機構(gòu)的定位,更體現(xiàn)出向世界,尤其是發(fā)展中地區(qū)提供經(jīng)濟(jì)發(fā)展知識的新的定位。一方面,作為布雷頓森林機構(gòu)的重要組成部分,世界銀行的發(fā)展理念以及運行機制在實踐中發(fā)揮了重要重要,同時也體現(xiàn)在世行發(fā)布的各種數(shù)據(jù)與知識中。機構(gòu)對于市場、政府與治理的態(tài)度,影響甚至決定著數(shù)據(jù)的呈現(xiàn)方式和深層詮釋,因此,針對世界銀行發(fā)布的各項指標(biāo)體系,我們經(jīng)常能夠看到“過度反映機構(gòu)偏好”的批評。盡管多邊組織與屬地明確的其他機構(gòu)相比,更不容易受到少數(shù)主權(quán)國家的施壓,但來自自身定位、發(fā)展路徑甚至是股東國或核心成員的影響是難以避免的。另一方面,作為世界最大的發(fā)展援助機構(gòu),世界銀行的數(shù)據(jù)和知識源自發(fā)展實踐一線,也能夠進(jìn)一步推廣應(yīng)用于發(fā)展實踐,形成知識的良性循環(huán),并產(chǎn)生更為實在的政策影響力,這是其他類型的指標(biāo)構(gòu)建主體難以企及的。但從另一個角度來看,符合機構(gòu)發(fā)展理念的評估對象更加可能受到機構(gòu)資源的青睞,從而獲得更多的發(fā)展機會,體現(xiàn)出指標(biāo)知識背后的權(quán)力關(guān)系。
第二類組織是跨國非政府組織,比如“自由之家”和“透明國際”。這一類組織往往是某種國際規(guī)范的倡導(dǎo)者(Norm Entrepreneur),因此,指標(biāo)評估的內(nèi)容相對單一。指數(shù)傳播承載著機構(gòu)倡導(dǎo)的理念。作為非營利機構(gòu),這些組織受到持續(xù)的外部資助。盡管各家機構(gòu)都高度強調(diào)自身的獨立性,但從機構(gòu)建立的初衷到人員和機構(gòu)運行的財務(wù)支持,都能夠看到以美國為代表的西方大國的影子。一些機構(gòu)與媒體集團(tuán)合作,進(jìn)一步保證指標(biāo)的曝光度,形成對從學(xué)術(shù)界到普通公眾以及政策實務(wù)界的廣泛影響力。
第三類是學(xué)術(shù)研究機構(gòu),包括高校、研究所和智庫。指標(biāo)構(gòu)建的初衷往往是學(xué)術(shù)性的探索,比如尋找民主制度與其他發(fā)展變量之間的因果關(guān)系,或者為廣泛的學(xué)術(shù)研究提供基礎(chǔ)數(shù)據(jù)。以高校為依托的指標(biāo)發(fā)布主體相對具有更高的獨立性,但對面向公眾的大眾媒體和政策實務(wù)界的影響力要遠(yuǎn)遠(yuǎn)低于學(xué)術(shù)影響力。不管從指數(shù)的呈現(xiàn)方式、平臺用戶體驗還是傳播途徑的曝光程度來說,都往往存在多種不足。因此,有批評者擔(dān)心這樣的指數(shù)研究其實是“數(shù)據(jù)墳?zāi)埂薄?/p>
值得注意的是,三類構(gòu)建主體都集中于西方發(fā)達(dá)國家,也更多受到西方機構(gòu)的資助,但其影響力絕非只局限于西方世界,而是定義著整個世界,影響著各國公眾對于本國和其他國家的看法以及各種資源的流動。
2.構(gòu)建方法
根據(jù)測量方法,政治評估指數(shù)可以分為兩類:根據(jù)受訪專家感知來構(gòu)建,或使用量化數(shù)據(jù)和客觀事實來構(gòu)建。前者被稱為感知測量,后者被稱為客觀測量。一些指數(shù)也會將二者結(jié)合,使用復(fù)合測量方法。使用何種方法,受到多種因素的影響,包括評估內(nèi)容、評估目的、技術(shù)發(fā)展以及機構(gòu)可獲得的資源等?;诟兄臏y量方法主要優(yōu)勢在于靈活性,而客觀測量方法的最大特點就是嚴(yán)謹(jǐn)性。
如果評估內(nèi)容較為模糊,缺乏明確而廣受認(rèn)可的概念,且難以明確定義測量標(biāo)準(zhǔn),比如“腐敗”,那么基于專家感知的主觀打分法無疑是最佳選擇。如果測量內(nèi)容框架明確、標(biāo)準(zhǔn)清楚,以客觀數(shù)據(jù)為基礎(chǔ)的測量方法不但可操作,也更具有可信度。從評估目的來說,提供打分,尤其是優(yōu)劣排名的指數(shù)更傾向于使用專家感知方法,而數(shù)據(jù)庫或與之類似的面板指數(shù)則更多依賴客觀數(shù)據(jù)。從技術(shù)發(fā)展角度來看,早期指數(shù)多使用不太依賴信息技術(shù)和統(tǒng)計科學(xué)的專家感知打分方法,使用客觀數(shù)據(jù)的評估指數(shù)則出現(xiàn)相對較晚,一般為二代指數(shù)。
此外,大范圍收集第一手的跨國信息,對指數(shù)構(gòu)建機構(gòu)的財力資源和信息渠道都有很高的要求。盡管面向公眾的隨機抽樣問卷調(diào)查受到普遍認(rèn)可,但在評估指數(shù)中非常少見,在本文介紹的各大指數(shù)中,僅有法治指數(shù)使用問卷調(diào)查方法,且調(diào)查周期和樣本數(shù)量都不盡如人意。出于同樣的原因,集成第三方二手?jǐn)?shù)據(jù),直接越過邀請專家打分或收集統(tǒng)計數(shù)據(jù),無疑能夠節(jié)省大量資源,從而更大程度地拓展評估內(nèi)容和對象。比如全球治理指數(shù)覆蓋了與治理相關(guān)的各種指標(biāo),無論是時間跨度還是地理范圍都相當(dāng)可觀。
總體來看,專家感知仍然是政治評估指數(shù)中最為常用的測量方法。一方面,由于政治評估指數(shù)重在“評估”,運用專家的知識和理論針對社會現(xiàn)實進(jìn)行綜合分析更能彰顯“評估”的深度。另一方面,政治評估中很多內(nèi)容,在不同國家不同語境內(nèi)可能存在很大的事實差異,比如“腐敗”在美國的表現(xiàn)與印度非常不同,而客觀數(shù)據(jù)所要求的嚴(yán)謹(jǐn)?shù)目缭叫栽谶@樣的跨國評估難以實現(xiàn),也是沒有意義的。
3.影響范圍與強度
一項評估指數(shù)的影響范圍與強度,同樣與指數(shù)構(gòu)建的機構(gòu)、目的和評估的內(nèi)容密切相關(guān)。一般來說,學(xué)術(shù)機構(gòu)發(fā)布的指數(shù)往往局限于學(xué)術(shù)界,這些指數(shù)在建設(shè)伊始就致力于理論探索。比如美國馬里蘭大學(xué)的政體指數(shù)明確提出指數(shù)研究的目的就是“科學(xué)研究和量化分析”,①Center for Systemic Peace, “Our Mission”, http://www.systemicpeace.org/mission.html, 2022-01-04.而瑞典哥德堡大學(xué)的民主多樣性指數(shù)極為復(fù)雜的指標(biāo)體系和評估結(jié)果也使得大眾媒體和公眾望而卻步。與此形成鮮明對比的是非政府組織發(fā)布的評估指數(shù),這些指數(shù)本身就承載著倡導(dǎo)某種政治規(guī)范乃至意識形態(tài)的任務(wù),通過大眾媒體影響公眾輿論,進(jìn)而改變政策實踐是其根本的出發(fā)點。比如“自由之家”提出世界自由指數(shù)“對學(xué)者和實踐者要同樣有用”。②Freedom House, “About Freedom in the World”, https://freedomhouse.org/report-types/freedom-world, 2022-01-04.以世界銀行為代表的政府間組織所發(fā)布的指數(shù)由于與資源分配和發(fā)展實踐密切相關(guān),在政策實務(wù)界影響更為廣泛。
指數(shù)的影響力同樣也受到發(fā)布機構(gòu)的影響。學(xué)術(shù)機構(gòu)除了發(fā)布自己的指數(shù)外,廣泛參與各種指數(shù)研究的討論和批評,增加引用率,加入“隱性的學(xué)院”,③Diana Crane, Invisible Colleges, Chicago: University of Chicago Press, 1972.必然能夠提高指數(shù)在學(xué)術(shù)界的影響力。但要超越學(xué)術(shù)范圍,觸及非學(xué)術(shù)受眾,則更加困難。與之相比,受到大國支持和與媒體集團(tuán)合作的非政府組織往往能夠獲得大眾傳播的優(yōu)勢。同時,指數(shù)的呈現(xiàn)方式也在一定程度上決定了傳播的效果,與媒體產(chǎn)業(yè)掛鉤的指數(shù)往往比學(xué)術(shù)機構(gòu)更加關(guān)注用戶體驗,也會在公共關(guān)系和傳播方面投入更多資源,借助多種平臺宣傳研究成果。此外,一般性的傳播技巧,比如引人注目的標(biāo)題,以及明顯表達(dá)褒貶評價的排名都更容易受到大眾媒體的青睞。如何在科學(xué)性、嚴(yán)謹(jǐn)性和傳播力之間取得平衡,是所有公開發(fā)布的評估指數(shù)必須面對的挑戰(zhàn)。
最后,要獲得政策實務(wù)界的認(rèn)可,引導(dǎo)政策制定,引起改革和政治發(fā)展,更是多數(shù)政治評估指數(shù)可望而不可及的最終影響力。政府間組織與實務(wù)界的關(guān)系相對更加直接,而非政府組織和學(xué)術(shù)機構(gòu)要想影響政治實踐,路線無疑會非常曲折。一套指數(shù)要在形成廣泛傳播和認(rèn)可的前提下,形成巨大的壓力,借助國際社會或本國公眾的輿論,才有可能帶來真正的政策改變。除此之外,只有當(dāng)指數(shù)結(jié)果剛好與政治家的訴求相吻合時,才會被奉為改革的科學(xué)依據(jù)。①Rush Doshi, Judith G.Kelley, Beth A.Simmons, “The Power of Ranking: The Ease of Doing Business Indicator and Global Regulatory Behavior”, International Organization, Vol.73, No.3, 2019, pp.611-643.
表1 十種政治發(fā)展評估指數(shù)比較(來源:作者自制)
政治評估指數(shù)的需求與力量何在?為什么一國政府會關(guān)注某一個排名或打分?事實上,指數(shù)只是對現(xiàn)有信息的重新組合和詮釋,卻釋放出強大的規(guī)范力量。指數(shù)的魅力在很大程度上歸功于其通過打分和排名制定標(biāo)準(zhǔn),進(jìn)行比較,進(jìn)而構(gòu)建聲譽的能力,通過重新配置和詮釋比較性信息來激發(fā)人們對于國家能力和地位的關(guān)注,這種關(guān)注進(jìn)而轉(zhuǎn)化為壓力,影響和推動政策實踐。這一過程始于對某個問題的命名,提出一個概念,進(jìn)而設(shè)立評估標(biāo)準(zhǔn),以象征的力量②Pierre Bourdieu, “Social Space and Symbolic Power”, Sociological Theory, Vol.7, No.1, 1989, pp.14-25.通過影響話語最終影響決策。指數(shù)具有強大的議程設(shè)置功能,按照其自身偏好設(shè)定優(yōu)劣標(biāo)準(zhǔn),通過有效的政治傳播,形塑公眾、組織和決策者對于制度合法性的思考。
1.知識建構(gòu)
評估指數(shù)建構(gòu)了一套將各國復(fù)雜多樣的政治發(fā)展具象化、可視化、可比較的知識體系。指數(shù)所使用的數(shù)據(jù)不一定是第一手的,但在數(shù)據(jù)基礎(chǔ)上進(jìn)行的評估卻是全新的。政治發(fā)展領(lǐng)域的各種概念和標(biāo)準(zhǔn)往往缺乏普遍的共識。政治評估指數(shù)通過系統(tǒng)性的指標(biāo)框架,將政治現(xiàn)象的各種性質(zhì)、強度、數(shù)量進(jìn)行標(biāo)準(zhǔn)化定義。盡管這種定義往往引來爭議和批評,但討論本身對于知識的形成和積累就是有意義的。對于民主、發(fā)展、廉政、法治概念的爭論幾乎存在于所有相關(guān)指數(shù)的討論中,這種討論能夠進(jìn)一步推動知識的發(fā)展。收集新的數(shù)據(jù)固然是重要的,但找到一個框架、整理和檢驗各種信息,檢視各種詮釋數(shù)據(jù)的角度,討論可能的因果關(guān)系同樣重要。
一套指數(shù)的形成往往借助眾多專家的貢獻(xiàn)。指數(shù)構(gòu)建的過程也是相關(guān)領(lǐng)域的專家形成共識的過程,這種共識往往是更為廣泛的社會和政治共識的基礎(chǔ)。各國專家與決策者形成的網(wǎng)絡(luò)能夠進(jìn)一步跨越地理邊界,廣泛影響國際政治。
指數(shù)提供了對象國家國內(nèi)政治的豐富信息。公開發(fā)布意味著包括一般公眾、利益團(tuán)體、商業(yè)團(tuán)體、治理機構(gòu)等各種受眾都能夠利用指數(shù)提供的比較性信息,形成政策需求。指數(shù)特有的優(yōu)劣比較更容易對后進(jìn)者形成壓力。政治評估指數(shù)能夠形成系統(tǒng)性知識,為現(xiàn)實政治活動提供合法性和動員力,并最終引發(fā)政策變化。從這種意義上說,知識就是力量。①Kevin E.Davis, Sally Engle Merry, Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption, and the Rule of Law, Cambridge: Cambridge University Press, 2015.
2.價值倡導(dǎo)
在多元的世界中對一種政治價值形成共識,往往是一個緩慢而艱難的過程。政治評估指數(shù)的構(gòu)建主體,尤其是非政府組織,通過測量和發(fā)布指數(shù)來倡導(dǎo)相應(yīng)的政治規(guī)范。政府間組織同樣也是推動規(guī)范形成的有效平臺。民主、自由、廉政、法治等各種應(yīng)當(dāng)被普遍遵循、但在實踐中參差不齊的價值規(guī)范,通過各種指數(shù)得以測量和比較形成道德壓力。國家期望在國際社會獲得聲譽,因為積極的集體判斷代表著穩(wěn)定性和可預(yù)見性,能夠增加合作的可能。②Ian Johnstone, “The Power of Interpretive Communities”, in Michael Barnett, Raymond Duvall (eds.), Power in Global Governance,Cambridge: Cambridge University Press, 2005, p.187.而“點名”和“羞辱”則是改變和降低不良行為的主要工具。政治評估指數(shù)使得這一機制更加科學(xué)化,不但有理,而且有據(jù)。
由于政治評估指數(shù)的周期性特點,每年定時發(fā)布的各類指數(shù)可以形成一種“監(jiān)測”機制。指數(shù)發(fā)布者和其他主體的持續(xù)關(guān)注能夠影響評估對象,逐漸內(nèi)化評估標(biāo)準(zhǔn),調(diào)整行動,形成自我規(guī)范的霍恩索效應(yīng)。③John G.Adair, “The Hawthorne Effect: A Reconsideration of the Methodological Artifact”, Journal of Applied Psychology, Vol.69,No.2, 1984, pp.334-45.一國評估結(jié)果的上升或下降,尤其是下降,也能提供一定的預(yù)警作用,提醒或迫使相關(guān)主體采取措施。
3.實踐引導(dǎo)
政治評估指數(shù),尤其是績效表現(xiàn)指數(shù),具有對最佳實踐的推廣和示范功能。一方面,在國際發(fā)展領(lǐng)域,以世界銀行為代表的政府間機構(gòu)發(fā)布的評估指數(shù)與援助和貸款的分配直接掛鉤,以保證資金投入的有效性。指數(shù)成為重要的資源分配和援助政策的決策工具。在這種情況下,高度依賴國際援助的發(fā)展中國家尤為關(guān)注評估結(jié)果,在一定程度上將評估結(jié)果內(nèi)化為本國制度建設(shè)。另一方面,在國內(nèi)層面,測量政治系統(tǒng)運行的績效能夠明確制度安排是否能夠達(dá)到其預(yù)期的效果,發(fā)現(xiàn)影響政策實施的障礙,并進(jìn)一步通過從以往成功或失敗中吸取的教訓(xùn)提供對策。同時,績效測量結(jié)果也向公眾和其他國內(nèi)國際利益相關(guān)方提供了治理系統(tǒng)運行的信息,從而有助于獲得進(jìn)一步的認(rèn)可和支持。
21世紀(jì)以來,對政策導(dǎo)向指標(biāo)的呼吁不斷增加,為政策實踐提供有效依據(jù)已經(jīng)成為新指數(shù)的重要目標(biāo)。指標(biāo)產(chǎn)業(yè)的發(fā)展也從關(guān)注國家排名拓展到提供系統(tǒng)性績效表現(xiàn)評估。國際機構(gòu)、非政府組織、學(xué)術(shù)機構(gòu)與各種國家層面和地方或部門次級主體的合作推動了作為政策依據(jù)的指標(biāo)產(chǎn)業(yè),而有據(jù)可依的決策過程又可以進(jìn)一步推動善治??茖W(xué)化、系統(tǒng)性的證據(jù)對于缺乏數(shù)據(jù)采集和分析能力的發(fā)展中國家尤其寶貴。指數(shù)與國家政策部門的合作可以帶來雙贏,一方面指數(shù)可以獲得受到評估對象認(rèn)可的更為準(zhǔn)確的一手信息,另一方面政策部門也能夠得到量身定制的政策依據(jù)和決策建議。
1.創(chuàng)建主體的“中心主義”偏向
盡管政治評估指數(shù)的創(chuàng)建主體具有多樣性,涵蓋了從學(xué)術(shù)機構(gòu)、私人機構(gòu)、國際組織到非政府組織等多種形式,但一個無法忽視的問題是,這些指數(shù)創(chuàng)建機構(gòu)基本都位于發(fā)達(dá)國家,尤以美國和歐洲為主,來自發(fā)展中國家的價值和標(biāo)準(zhǔn)難以在主流政治評估指數(shù)中得以表達(dá)。
指數(shù)力量的一個重要來源是其創(chuàng)造者的公信力和權(quán)威。社會心理學(xué)研究指出合法權(quán)威的來源之一是信任,是對行為者公允、博學(xué)和能力的認(rèn)可。①Wendy Nelson Espeland, Michael Sauder, “Rankings and Reactivity: How Public Measures Recreate Social Worlds”, American Journal of Sociology, Vol.113, No.1, 2007, pp.1-40.要被視為權(quán)威,行為者自己也往往要被認(rèn)定為特定行為規(guī)范的典范,才能享有規(guī)范的權(quán)力。②Kathryn Sikkink, “Human Rights, Principled Issue-Networks, and Sovereignty in Latin America”, International Organization,Vol.47, No.3, 1993, pp.411-41.同時,權(quán)威也可以來源于能力,依據(jù)則是其現(xiàn)有的權(quán)力和財富。反映在指數(shù)實踐中,全球主要的政治評估指數(shù),乃至于整個指數(shù)行業(yè)都集中于西方發(fā)達(dá)國家。這些國家以權(quán)威的姿態(tài),用其設(shè)定的規(guī)范來評估他國。此外,網(wǎng)絡(luò)中心性也與權(quán)威密切相關(guān)。在社會和政治網(wǎng)絡(luò)中處于中心位置的行動者能夠更有力地設(shè)置議程。③R.Charli Carpenter, “Vetting the Advocacy Agenda: Network Centrality and the Paradox of Weapons Norms”, International Organization, Vol.65, No.1, 2011, pp.69-102.美國政府駐世界各地的組織機構(gòu)與美國各大非政府組織形成一個龐大的信息網(wǎng)絡(luò),能夠有效挖掘和傳遞各種信息,這無疑是美國評估指數(shù)發(fā)達(dá)的重要原因之一。此外,發(fā)達(dá)國家更為成熟的理論、方法和數(shù)據(jù)技術(shù),以及對于評估研究的資源投入優(yōu)勢都在一定程度上解釋了現(xiàn)有指數(shù)創(chuàng)建者的地理分布。
可以說,整個指數(shù)產(chǎn)業(yè)已經(jīng)形成了從生產(chǎn)到消費的路徑依賴。各類政治評估指數(shù)以西方政治理論為基礎(chǔ),以西方國家為理想模型,以西方專家團(tuán)隊為評估主體,服務(wù)于西方大國的外交與貿(mào)易戰(zhàn)略。廣大發(fā)展中國家在各種指數(shù)排名中只能擔(dān)任被評估的角色,既無法對評估結(jié)果提出意見,也無法貢獻(xiàn)具有本國特色的發(fā)展經(jīng)驗。以中國為代表的一些發(fā)展中國家,尤其是新興國家,近年來也在不斷嘗試構(gòu)建體現(xiàn)本國經(jīng)驗與價值的評估體系,但從效果來看,遠(yuǎn)遠(yuǎn)無法撼動主流評估指數(shù)的主導(dǎo)地位。
指數(shù)產(chǎn)業(yè)經(jīng)過20世紀(jì)90年代開始的爆發(fā)式發(fā)展,在21世紀(jì)的第一個十年引發(fā)了針對指數(shù)體系本身的一系列思考和批評。④Charles P.Oman, Christiane Arndt, Uses and Abuses of Governance Indicators, Paris: OECD, 2006; Romina Bandura, “A Survey of Composite Indices Measuring Country Performance: 2008 Update”, UNDP/ODS Working Paper, New York: UNDP, 2008; Robert I.Rotberg, On Governance: What It Is, What It Means and Its Policy Uses, Waterloo, ON: Centre for International Governance Innovation, 2015; Helmut K.Anheier, Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress Promise.這些討論針對評估指數(shù)的概念基礎(chǔ)、評估方法和影響力等諸多方面都進(jìn)行了反思,然而,與指標(biāo)生產(chǎn)者和資助者相關(guān)的政治經(jīng)濟(jì)學(xué)分析卻始終沒有引起重視。評估指標(biāo)由發(fā)達(dá)國家生產(chǎn)似乎成為一種無可爭議的事實,從學(xué)術(shù)界到政策界,從指標(biāo)的生產(chǎn)者到數(shù)據(jù)的使用者都默認(rèn)其合理。顯然,多數(shù)指標(biāo)務(wù)求覆蓋盡可能多的國家,無論發(fā)展中國家還是發(fā)達(dá)國家都是其評估的對象,甚至一些指標(biāo)尤為關(guān)注發(fā)展中國家,但評估者,也就是指標(biāo)的生產(chǎn)者卻集中在發(fā)達(dá)國家一側(cè),這樣明顯的失衡卻未能引起研究者的注意,可以說是一種怪現(xiàn)象。
一方面,西方國家的指數(shù)生產(chǎn)者既是裁判又是運動員,是行業(yè)的領(lǐng)導(dǎo)者、標(biāo)準(zhǔn)設(shè)定者也是市場的壟斷者;另一方面,對于指標(biāo)科學(xué)的評價和反思往往仍然是指標(biāo)生產(chǎn)者,也就是說,評估指標(biāo)從生產(chǎn)到評價再到批評,形成了一個閉環(huán)。因此,針對各大指數(shù)的分析和批評往往是技術(shù)性的,關(guān)注數(shù)據(jù)采集和評估方法,而指標(biāo)生產(chǎn)體系中的不平等和權(quán)力關(guān)系,并不是從業(yè)者關(guān)注的話題。
指數(shù)構(gòu)建機構(gòu)在分布上的失衡不僅僅是價值評價和聲譽問題。政治評估指數(shù),以及更為廣泛的治理相關(guān)指數(shù),與全球治理框架密切相關(guān),與之相關(guān)的話語權(quán)決定著全球治理的角色分配和權(quán)力關(guān)系。本國的政治體制、治理效果是否得到國際社會的認(rèn)可,與貿(mào)易、合作和發(fā)展機會密切相關(guān)??梢哉f,指數(shù)創(chuàng)建機構(gòu)的分布失衡是全球治理框架不平等的表現(xiàn)或延續(xù)。政治評估指標(biāo)要獲得可持續(xù)的健康發(fā)展,以開放的態(tài)度接納來自發(fā)展中國家的經(jīng)驗、價值和理念本身就是一種民主化的體現(xiàn)。
2.對政治發(fā)展衡量的“簡單化”傾向
政治發(fā)展是一個復(fù)雜的長期過程。無論指數(shù)的目的是傳播理念還是制定政策,解決何為政治發(fā)展的規(guī)范性問題都是一個不可避免的先決條件。只有在確定了政治發(fā)展目標(biāo)之后,才能設(shè)計指標(biāo)來評估現(xiàn)狀與目標(biāo)之間的距離,或者指導(dǎo)實現(xiàn)政治發(fā)展目標(biāo)的政策。如果政治發(fā)展的目標(biāo)是民主制度,那么對正式制度的測量就會成為評估的核心。而如果政治發(fā)展的目標(biāo)是制度高效運行,那么制度設(shè)計再完善,也不能保證其有效性,只有從制度的實際運行績效出發(fā),以績效結(jié)果為導(dǎo)向才能評估各國的政治發(fā)展水平。
發(fā)展可以被理解為一種結(jié)果,或者一個過程。①Alan Thomas, “Development as Practice in a Liberal Capitalist World”, Journal of International Development, Vol.12, No.6, 2000,pp.773-787.基于過程或程序設(shè)定的定義是最簡單的?;谥贫仍O(shè)定的政治發(fā)展不以其結(jié)果來評價政治發(fā)展。因此,在一個制度運行低效的社會,或者一個高度依靠非正式制度的社會,對制度設(shè)定的測量既無法準(zhǔn)確衡量其政治發(fā)展水平,也無法指導(dǎo)改革和政策制定。一個顯示完善選舉制度的民主指標(biāo)并不一定表明政治昌明。同樣,與西方主流民主制度迥異的政治體制,從治理結(jié)果上也可以被評估為高速發(fā)展。以中國為代表的新興國家不斷挑戰(zhàn)甚至顛覆著現(xiàn)有的各類政治評估體系的理論預(yù)設(shè)和指標(biāo)選取,以西方經(jīng)驗為基礎(chǔ)的評估體系難以解釋為什么中國依靠一套迥異于西方的制度體系,實現(xiàn)了經(jīng)濟(jì)的持續(xù)增長和社會的長期穩(wěn)定。
此外,現(xiàn)有政治評估指數(shù)的另一個問題是從抽象概念向具體指標(biāo)的轉(zhuǎn)化問題。這一問題在各類指數(shù)中普遍存在,但在政治類指數(shù)中尤為突出。開展一項評估包括兩個關(guān)鍵步驟。首先必須定義用于構(gòu)建政治評估的信息來源,這是對測量內(nèi)容的定義。其次再定義如何將各種信息聚合進(jìn)一個指數(shù)之中,由此完成從觀察到指數(shù)的投射。一套指數(shù)即使使用了受到一致認(rèn)可的概念框架,但如何準(zhǔn)確找到反映抽象概念的相關(guān)指標(biāo)仍然非常困難。舉例來說,本文介紹的幾大民主指數(shù),對于具體指標(biāo)的選取都各不相同。顯然,民主是一個復(fù)雜的概念,包括選舉、法治、協(xié)商等多種元素,但并不直接等同于這些元素。因此,對于具體指標(biāo)的選擇必然帶來質(zhì)疑和爭議。
同時,在指數(shù)的生產(chǎn)過程中,極易出現(xiàn)的一種情況是只選擇可以直接測量的指標(biāo),忽略難以測量但實際上非常關(guān)鍵的指標(biāo)。政治評估指標(biāo)往往涉及到?jīng)Q策過程或公眾心理,此種數(shù)據(jù)的獲得和測量顯然是非常困難的,數(shù)據(jù)的準(zhǔn)確性也往往受到質(zhì)疑。在一些情況下,指數(shù)只能選擇一些指標(biāo)來間接反映概念框架中的某些要素,例如以新聞自由來反映誠信進(jìn)而反映一個國家的清廉程度。一些概念雖然可以直接度量,但只能以較為粗略的方式加以度量,比如依靠專家的主觀印象。
最后,概念和指標(biāo)數(shù)據(jù)脫節(jié)的情況還可能出現(xiàn)在評估對象的單位上。政治評估指數(shù)普遍以國別為基本單位,無論是民主、和平或政府質(zhì)量,其背后的理論假設(shè)都是基于國家層面的,因而相應(yīng)的指標(biāo)數(shù)據(jù)也往往是匯總數(shù)據(jù)。而事實上,在治理實踐中,區(qū)域間、機構(gòu)間和部門間的差異性是巨大的,對低層級數(shù)據(jù)的加總聚合可能會掩蓋重要的因果關(guān)系和關(guān)鍵變化,造成數(shù)據(jù)偏差進(jìn)而與現(xiàn)實脫節(jié)。
3.構(gòu)建與測量方法的“偏頗化”傾向
專家主觀感知打分是現(xiàn)有政治評估指數(shù)最常見的測量方法。與客觀測量方法相比,這種方法能夠獲取更多的信息,但研究者相對難以把控信息的質(zhì)量,可靠性存疑??陀^指標(biāo)則正相反,數(shù)據(jù)可靠,但可用信息相對有限。用感知測量方法時,研究者能夠決定專家的選擇,提問的內(nèi)容和方式以及如何使用調(diào)查結(jié)果,但不能指定受訪專家用來構(gòu)建感知的信息來源,也無法控制專家的評估標(biāo)準(zhǔn)。感知測量的一個重要特點就是從研究者到受訪專家的權(quán)力轉(zhuǎn)移。其靈活性在很大程度上也來源于此。考慮到政治評估的許多內(nèi)容或是缺乏嚴(yán)謹(jǐn)?shù)南到y(tǒng)性信息(尤其是跨國比較信息),或是難以給出準(zhǔn)確的衡量標(biāo)準(zhǔn)(比如公正或腐?。?,這種靈活性無疑是一個巨大的優(yōu)點。此外,感知方法的靈活性一方面使得可測量的內(nèi)容范圍大大拓寬,另一方面也可以借助專家的知識,超越研究者的認(rèn)知局限,大規(guī)模拓展指數(shù)的信息范圍。
但同時,靈活性的代價也是不可忽視的。首要問題就是偏見。偏見的產(chǎn)生可能基于幾方面原因。首先是信息滲透,研究者無法控制專家的信息來源以及由此產(chǎn)生的認(rèn)知。對某一具體指標(biāo)的評估很可能受到一些外部信息的影響,比如對腐敗的評估可能受到新聞自由相關(guān)信息的影響。信息的互相滲透可能使得指標(biāo)設(shè)定失去意義,控制腐敗、法治、問責(zé)等等各種信息纏結(jié)在一起,專家只是基于一個總體的印象對不同內(nèi)容進(jìn)行評估。這種情況對于使用評估指數(shù)進(jìn)行理論驗證時尤為有害。比如指數(shù)使用者想要驗證民主與政府透明度之間的關(guān)系,但專家對于民主的打分正是基于政府透明度的,那么驗證結(jié)果必然是二者高度相關(guān)。不過,信息滲透對于指數(shù)排名來說并不是一個嚴(yán)重的問題,甚至可能有一定的助益。對一個國家政治經(jīng)濟(jì)信息的普遍了解可能使得專家的打分更加符合實際,提高評估的準(zhǔn)確性。此外,感知方法還存在透明度的問題。我們永遠(yuǎn)無法完全掌握專家是基于何種信息何種原則進(jìn)行的評估,無法對結(jié)果進(jìn)行復(fù)驗,或者在復(fù)驗時獲得截然不同的結(jié)果。透明度問題可以通過精確問題、附加錨定信息、增加受訪專家數(shù)量或使用測量模型得到緩解。
在使用客觀測量方法時,研究者能夠決定信息內(nèi)容以及賦值標(biāo)準(zhǔn)。這無疑確保了指數(shù)的透明度和可復(fù)驗性。從信息來源到評估標(biāo)準(zhǔn),客觀測量方法都是高度透明的。使用同樣尺度對同樣內(nèi)容的評估必然產(chǎn)生相同的結(jié)果。但同時,這也意味著客觀測量指數(shù)高度依賴研究者的理論和判斷,其使用的信息往往是比較有限的,測量對象也更加狹窄,受限于研究者的知識、經(jīng)驗和想象力。此外,高度的嚴(yán)謹(jǐn)性對比較信息(尤其是跨國信息)完整程度要求更高,這會進(jìn)一步縮小指數(shù)內(nèi)容的覆蓋范圍。
此外,從指數(shù)構(gòu)建方法來劃分,除了傳統(tǒng)的感知、客觀測量及其復(fù)合指數(shù),還有一類常見方法——集成指數(shù)。這一類指數(shù)的構(gòu)建者并不采集一手?jǐn)?shù)據(jù),而是根據(jù)一定的理論框架,將第三方指數(shù)或社會調(diào)查的數(shù)據(jù)納入自己的指標(biāo)系統(tǒng),經(jīng)過一定的標(biāo)準(zhǔn)化程序,最終形成一個新的指數(shù)。這一類指數(shù)節(jié)省了數(shù)據(jù)搜集階段的大量資源,相應(yīng)地能夠擴大指標(biāo)范圍和規(guī)模,因此往往覆蓋較長時間跨度內(nèi)多個領(lǐng)域的大量數(shù)據(jù),最為典型的就是世界銀行的全球治理指數(shù)(WGI)。但這樣的指數(shù)構(gòu)建方法同樣存在一定的問題。首先,由于指標(biāo)數(shù)據(jù)來自不同的信息源,要確保理論和概念的一致性是非常困難的,而在此基礎(chǔ)上進(jìn)行的比較難以克服跨越性問題。其次,在指標(biāo)集成的過程中,必然要對各種變量進(jìn)行標(biāo)準(zhǔn)化處理。如果指標(biāo)本身就來自第三方指數(shù),那么數(shù)據(jù)可能已經(jīng)經(jīng)歷了多輪標(biāo)準(zhǔn)化,這可能造成數(shù)據(jù)的變形。最后,如果集成指數(shù)使用的是數(shù)據(jù)源的部分?jǐn)?shù)據(jù)而非全部,就需考慮源數(shù)據(jù)的各個變量是否是獨立的,將數(shù)據(jù)從原本語境中抽離是否會造成失真??傊?,使用集成構(gòu)建方法,需要對數(shù)據(jù)源進(jìn)行非常謹(jǐn)慎的選擇和處理。
4.評估影響的“有限性”
政治評估指數(shù)產(chǎn)生影響力的原因之一在于其賦予評估對象聲譽和地位的能力。通過對信息的比較和詮釋,指數(shù)可以廣泛影響國際社會對于成功國家和有效制度的標(biāo)準(zhǔn),形成一種社會壓力,迫使評估對象接受并遵守評估結(jié)果以及其背后的價值標(biāo)準(zhǔn)。比較形成判斷,賦予被比較者地位和身份。在這個過程中,公約得以形成。不同的國家根據(jù)這個共同的尺度進(jìn)行比較,形成一種高度簡化的世界觀。
評估指數(shù)影響力可以分為傳播和行為改變兩種形式。在傳播層面,評估指數(shù)的影響力主要存在于兩個群體——學(xué)術(shù)界和包括政策制定者以及一般公眾的非學(xué)術(shù)界。盡管對于傳播效果的直接測量是十分困難的,但這兩個方向分別可以通過學(xué)術(shù)引用和媒體曝光率進(jìn)行間接的評估。從現(xiàn)有研究來看,①Matthias Haber, Olga Kononykhina, “A Comparative Classification and Assessment of Governance Indices”, in Helmut K.Anheier,Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress, Promise, 2018, pp.11-42.評估指數(shù)在學(xué)界的影響力遠(yuǎn)遠(yuǎn)高于非學(xué)術(shù)界。相較于經(jīng)濟(jì)或社會指數(shù),政治類指數(shù)的這一特點尤為突出。換句說話,一些活躍于科研項目和學(xué)術(shù)文獻(xiàn)中的指數(shù)研究在很大程度上并沒有轉(zhuǎn)化為政策依據(jù)和公眾關(guān)注,艱深的理論探討和復(fù)雜的測量方法可能永遠(yuǎn)不會影響非學(xué)術(shù)受眾。
當(dāng)然,一部分評估指數(shù)的主要構(gòu)建目的就在于理論驗證,本文中介紹的一些政治體制評估指數(shù)強調(diào)概念界定和制度規(guī)范,多由學(xué)術(shù)機構(gòu)創(chuàng)建,其參與者和受眾都主要集中在學(xué)術(shù)研究界,并不追求媒體曝光率,對政策實務(wù)界的影響即使存在,也往往是間接的。由于該類指標(biāo)的目標(biāo)受眾就是學(xué)術(shù)群體,傳播范圍的相對有限并不算是問題。但對于關(guān)注政治系統(tǒng)運行、與政策密切相關(guān)的指數(shù)來說,政策實務(wù)界的關(guān)注至關(guān)重要。而對于本文總結(jié)的第二類評估指數(shù),即以廉政、自由、法治等政治價值為測量對象的指數(shù),以推動制度革新和社會進(jìn)步為目的,尤其需要一般公眾和政策界的關(guān)注。如果不能進(jìn)行有效的傳播,那無疑是真正的數(shù)據(jù)墳?zāi)?。通過自上而下的排名系統(tǒng)吸引媒體曝光正是一種有效的傳播策略。
政治評估指數(shù)研究經(jīng)過二三十年的發(fā)展,從概念框架到測量方法都更加精深化、復(fù)雜化,但也造成了成果與公眾認(rèn)知之間的鴻溝。尤其是面板指數(shù),其結(jié)果往往無法用易于理解的語言簡單概括,普通公眾也難以將其與自身經(jīng)驗相聯(lián)系。如果研究者不能夠放下身段為公眾闡釋指標(biāo)的意義,引起公眾興趣,就很難獲得以受眾為導(dǎo)向的大眾媒體的青睞。而在互聯(lián)網(wǎng)時代,雖然傳播主體可以在一定程度上跨越傳統(tǒng)媒體渠道,但如果不能搭建用戶友好的數(shù)據(jù)平臺,制作面向公眾的傳播形式,在各種新興內(nèi)容的擠壓下,就會造成更為嚴(yán)重的傳播劣勢。
在傳播基礎(chǔ)上,更為有效的影響力表現(xiàn)在行為改變,對于評估指數(shù)來說,也就是其可以成為政策制定或改革的依據(jù)。尤其是在指數(shù)中排名落后的國家,指數(shù)通過媒體傳播形成民意壓力。利益團(tuán)體可以利用評估指數(shù)提供的信息要求制度變革。同時,通過長期對政策和機構(gòu)進(jìn)行監(jiān)測和評估,成功的指數(shù)可以在一定程度上使評估對象內(nèi)化其評價標(biāo)準(zhǔn),為避免評分降級而進(jìn)行自我規(guī)范。此外,評估指數(shù)通過比較形成跨國壓力,進(jìn)而影響國際合作、投資和援助。
要真正引導(dǎo)政策變化,形成壓力是必要條件,但不是充分條件。在壓力之下,評估對象還需要具體的政策指導(dǎo)才能最終完成政策變革。盡管近十年來的指數(shù)研究已經(jīng)注意到對政策實務(wù)的指導(dǎo)性,但現(xiàn)有指數(shù)仍然多是對現(xiàn)狀的測量和描述。既缺乏對因果關(guān)系的挖掘,也難以直接轉(zhuǎn)化為政策依據(jù)。高度抽象化的評估指標(biāo)也許可以描述何為“善治”,但無法告訴實踐者如何獲得“善果”。例如,脆弱國家指數(shù)通過貧困、沖突等指標(biāo)測量一國的脆弱程度,但這些指標(biāo)難以用來指導(dǎo)高度脆弱國家或其他相關(guān)主體通過何種舉措或干預(yù)來改善該國的脆弱性。盡管世界各國都認(rèn)識到與制度運行相關(guān)的政策依據(jù)對于決策和治理的重要性,并且隨著技術(shù)進(jìn)步,數(shù)據(jù)的數(shù)量和質(zhì)量也在不斷增加,但生成、收集、合成和使用指數(shù)為決策提供信息仍然存在困難。決策者要從大量復(fù)雜的信息中識別對政策有用的數(shù)據(jù),理解數(shù)據(jù)的意義,與自身政策環(huán)境相結(jié)合,無疑是非常困難的。
指數(shù)以數(shù)字反映現(xiàn)象,數(shù)字本身是中立的,但當(dāng)指標(biāo)被用于揭示問題、指導(dǎo)決策時,這些數(shù)字就具有了價值判斷和政治性,反映出指數(shù)生產(chǎn)者以及消費者的理念和目標(biāo)。政治評估指數(shù)尤其體現(xiàn)了數(shù)字的客觀性與指向的政治性之間的緊張關(guān)系。政治評估指數(shù)究竟揭示的是政治世界的真相和理想愿景,還是個別國家或組織規(guī)訓(xùn)他國的“科學(xué)化”工具?顯然,在現(xiàn)有的指數(shù)版圖中,兩種性質(zhì)同時存在,而其存在的合理性就在于二者微妙的平衡——以知識提供規(guī)范的權(quán)力。三十年間的迅速發(fā)展反映了世界對于政治評估指數(shù)旺盛的需求。同時,能夠獲得普遍認(rèn)可、有效回應(yīng)各種批評并指導(dǎo)政策實踐的新型政治評估指數(shù)仍在孕育之中。
21世紀(jì)已經(jīng)進(jìn)入第三個十年,全球治理框架在多種力量的共同作用下正在動態(tài)中逐漸形成。雖然傳統(tǒng)的權(quán)力主體仍然主導(dǎo)著國際政治,但無論學(xué)術(shù)界還是實務(wù)界,都已經(jīng)意識到多種隱形權(quán)力以微妙的方式影響著國家間的權(quán)力分配。政治評估指數(shù)正是以這樣一種形式影響甚至改變著全世界關(guān)于制度、規(guī)范、績效與發(fā)展的觀念,以非強制性卻有效的方式規(guī)范著全世界,引導(dǎo)決策者的政策行為和公眾輿論。這些指數(shù)不僅是對實踐或現(xiàn)象的測量和描述,更重要的是對評估目標(biāo)施加壓力,施加指數(shù)背后的意識形態(tài)和價值準(zhǔn)則。
本文介紹的三類政治評估指數(shù),其評估內(nèi)容、目的和影響范圍各有側(cè)重,發(fā)展方向也不盡相同。政治制度評估指數(shù)要拓展其影響范圍,獲得更為廣泛的認(rèn)可,應(yīng)超越舊有政治理論的窠臼,關(guān)照當(dāng)今世界的發(fā)展現(xiàn)實,以更加開放包容的標(biāo)準(zhǔn)評估全球多樣化的制度設(shè)定。政治規(guī)范評估指數(shù)要避免成為“抹黑”的工具,要有效倡導(dǎo)政治道德,其評估專家和標(biāo)準(zhǔn)都應(yīng)更加客觀中立?!包c名”和“批評”是政治規(guī)范指數(shù)發(fā)揮影響力的有效方法,但無論是“點名”還是“批評”,都需建立在客觀事實的基礎(chǔ)上,避免成為詆毀“他者”的托詞,才能受到評估對象的接受和認(rèn)可,真正將道德規(guī)范內(nèi)化進(jìn)制度的設(shè)定和運行中。最后,考察治理績效的評估指數(shù)應(yīng)發(fā)展更加有效的評估方法,提高數(shù)據(jù)的收集、加工和分析的技術(shù)水平,真正以高度精煉的數(shù)字準(zhǔn)確反映復(fù)雜的治理實踐。
總體來說,無論是現(xiàn)有指數(shù)的升級發(fā)展還是推陳出新構(gòu)建新一代指數(shù),增加包容性、客觀性和有效性的目的都是提高指數(shù)的影響力。在政治評估指數(shù)的主要受眾,即學(xué)術(shù)界、一般公眾和政策實務(wù)界中,后二者更難突破,又正是指數(shù)最重要的影響對象,可以說,指數(shù)所帶來的權(quán)力正是源于對這兩個群體的影響。要提高對一般公眾的影響力,在不損失科學(xué)性的前提下,應(yīng)注意提高指數(shù)的用戶親和性,增加對公共關(guān)系的投入,與傳統(tǒng)媒體合作或運營新媒體傳播,以多種形式提高公共曝光率。對于政策實務(wù)界,則應(yīng)增加合作互動,在收集第一手信息的同時也了解實務(wù)界的需求,讓數(shù)據(jù)能夠更加直接的指導(dǎo)實踐,彌合指數(shù)與政策實踐的鴻溝。
中國作為全球治理的積極倡導(dǎo)者和推動者,在構(gòu)建制度性話語權(quán)的過程中,應(yīng)該更積極地參與全球政治評估指數(shù)的建構(gòu),對中國成功的政治發(fā)展經(jīng)驗和制度建設(shè)做法進(jìn)行學(xué)理化、普遍化研究,以形成基于中國經(jīng)驗同時關(guān)照廣大發(fā)展中國家政治發(fā)展前景的評估指數(shù)體系,推動全球政治評估指數(shù)版圖的多樣化。客觀地說,目前,中國在全球政治評估體系中,仍然處于非常被動的狀態(tài)。盡管近年來,許多中國學(xué)者進(jìn)行了探索性研究,嘗試建立新的政治評估體系,但效果并不理想。這在一定程度上是由于我們對現(xiàn)有的全球政治評估指數(shù)仍然缺乏系統(tǒng)的理解和充分的分析,本文正是期望能夠于此做出微薄的貢獻(xiàn)。