測量抑或規(guī)訓(xùn)：對政治評估指數(shù)的評估

2022-12-12 10:25:06張萌萌楊雪冬

社會科學(xué) 2022年11期

張萌萌楊雪冬

引言

20世紀(jì)30年代，西方社會出現(xiàn)了所謂的“社會指標(biāo)運動”，一系列指標(biāo)被開發(fā)出來，以測量社會發(fā)展程度和公共政策實施，目的逐漸明確，方法日益系統(tǒng)。①Clifford W.Cobb, Craig Rixford, Lessons Learned From The History Of Social Indicators, San Francisco: Redefining Progress, 1998.這種思路在1970年代擴散到國際領(lǐng)域。進(jìn)入21世紀(jì)后，出現(xiàn)了各類指標(biāo)與排名的繁榮，公私機構(gòu)紛紛投入其中，對全球社會生活的各個方面進(jìn)行評估，形成了蔚為大觀的“指標(biāo)產(chǎn)業(yè)”，吸引了大量資源，也推動了數(shù)據(jù)、方法和分析工具的迅速發(fā)展。政治類評估指數(shù)也位列其中，隨之發(fā)展?！奥?lián)合國發(fā)展計劃”的一份調(diào)查報告表明:當(dāng)前關(guān)于治理方面——如政治腐敗、公民自由、性別平等、人權(quán)、經(jīng)濟(jì)競爭力、新聞自由、政治穩(wěn)定、環(huán)境表現(xiàn)、人類發(fā)展——的指數(shù)共有165種之多。其中，83%的指數(shù)是在1991年到2006年間研發(fā)的，50%的指數(shù)是在2001年到2006年間研發(fā)的。②奧代德?勒文海姆著，朱劍編譯：《考核國家：國際“治理指數(shù)”的?？率揭暯恰?，《探索》2016年第4期。

政治評估指數(shù)是指，通過確定現(xiàn)代政治系統(tǒng)整體或某個領(lǐng)域運行應(yīng)遵循的原則或者應(yīng)達(dá)到的標(biāo)準(zhǔn)，對其進(jìn)行細(xì)分和可測量化，并運用到對全球范圍內(nèi)多個國家（或地區(qū)）政治運行的測量和評估上，以打分或排名的形式發(fā)布評估結(jié)果的研究項目。評估內(nèi)容主要可分為政治制度分類、政治規(guī)范遵守以及政治系統(tǒng)運行績效。根據(jù)不完全統(tǒng)計，專注政治類指標(biāo)并獲得學(xué)界認(rèn)可的評估指數(shù)約有60套，①Princeton University library, “Political & Governance Indicators”, https://libguides.princeton.edu/politics/indicators, 2022-09-24.如果將安全、政治傳播、社會治理或人類發(fā)展等領(lǐng)域也納入廣義的政治體系，相關(guān)指數(shù)則達(dá)到上百套。

政治評估指數(shù)從需求、目標(biāo)到構(gòu)建的機制與影響，都迥異于經(jīng)濟(jì)、社會等其他類型的指標(biāo)。盡管政治類評估指標(biāo)被普遍認(rèn)為帶有明顯的價值判斷，有將西方體制理想化之嫌，但是依然有諸多機構(gòu)先后參與其中，少數(shù)指標(biāo)體系產(chǎn)生了全球性的影響，甚至成為測量各國乃至全球民主、法治、人權(quán)、治理等發(fā)展的標(biāo)尺。這一看似矛盾的現(xiàn)狀促使我們關(guān)注并深入探究政治類評估指數(shù)的發(fā)展、現(xiàn)狀、構(gòu)建的機制與產(chǎn)生的影響，進(jìn)而討論現(xiàn)有政治類指數(shù)存在的問題和政治發(fā)展評估遭遇的普遍困境。對這些指數(shù)的再評估，不僅有助于我們?nèi)嬲J(rèn)識各國政治發(fā)展道路的差異性，也有利于更深入地思考中國政治發(fā)展道路的全球意義。

本文分為四個部分。第一部分簡要概述政治發(fā)展評估指數(shù)的發(fā)展過程；第二部分從上百個指數(shù)中選擇了10個在世界上具有較大影響的評估指數(shù)，對指數(shù)的構(gòu)建主體、理論框架、評估方法以及影響力進(jìn)行評析；第三部分著重討論這些評估指數(shù)在分析政治發(fā)展的復(fù)雜現(xiàn)實中，所做出的貢獻(xiàn)和存在的缺陷；第四部分是結(jié)論。

一、政治評估指數(shù)發(fā)展的三波浪潮

二戰(zhàn)結(jié)束后，隨著一大批前殖民地國家取得獨立，開始現(xiàn)代國家制度建設(shè)，政治發(fā)展問題成為學(xué)術(shù)研究的重點。冷戰(zhàn)激發(fā)的制度間競爭，又使得何種政治發(fā)展道路道路更優(yōu)、哪些制度設(shè)計更好等問題，迫切需要獲得理論論證。以統(tǒng)計方法為代表的定量研究方法的不斷發(fā)展和改進(jìn)，為將政治發(fā)展這個抽象而復(fù)雜的現(xiàn)象具象化提供了技術(shù)條件。因此，伴隨著各種類型經(jīng)濟(jì)發(fā)展評估指數(shù)的繁榮，政治類評估指數(shù)也開始在比較政治學(xué)等學(xué)科中出現(xiàn)了。目前仍被視為所謂三大“民主指數(shù)”（政體指數(shù)、自由指數(shù)和民主多樣性指數(shù)）中的兩項始于20世紀(jì)60、70年代。

冷戰(zhàn)結(jié)束后，西方社會陷入了“歷史終結(jié)”的欣喜之中，政治發(fā)展似乎有了統(tǒng)一而“唯一”的衡量標(biāo)準(zhǔn)，政治評估也隨之掀起了第一波浪潮。這個時期出現(xiàn)的評估指數(shù)致力于倡導(dǎo)自由民主模式，探索評價“不可評價”的社會與政治現(xiàn)象，②Simon Bell, Stephen Morse, Sustainability Indicators: Measuring the Immeasurable?, London: Earthscan, 2008.比如民主（政體指數(shù)）、自由（自由指數(shù)）或腐?。ǜ瘮「兄笖?shù)）。學(xué)術(shù)界與實務(wù)界的“科學(xué)化”與“量化”熱潮，以及冷戰(zhàn)結(jié)束以后非政府組織，尤其是國際發(fā)展與援助機構(gòu)影響力的不斷提升，援助分配原則的可操作化改革，極大地推動了政治評價指數(shù)的發(fā)展。以民主規(guī)范為指導(dǎo)原則的國際組織和援助國家主體在很大程度上決定了指數(shù)的重點關(guān)注領(lǐng)域和評價標(biāo)準(zhǔn)。

21世紀(jì)的第一個十年是政治評價指數(shù)發(fā)展的第二波浪潮。政治評價指標(biāo)更加偏向于客觀評估方法，數(shù)據(jù)來源和評估維度也更加多樣化，并將關(guān)注的重點轉(zhuǎn)向“治理”需求。第二代指數(shù)致力于彌合評估與決策之間的鴻溝，與第一代指數(shù)相比，評估對象在政治上更加易于接受，客觀性和透明度方面也都有很大的改進(jìn)。 20世紀(jì)末主流發(fā)展理念的挫敗，發(fā)展中國家的政策反饋以及對第一代指數(shù)的批評都推動了這一階段變革的快速發(fā)展。各種私人和公共機構(gòu)加入指數(shù)評估的行列，不止覆蓋了政治制度，也包括更為廣義的治理以及社會發(fā)展的方方面面。在這一時期，一方面創(chuàng)建機構(gòu)更為多樣，測量對象更為多樣，另一方面對于評估對象也有了更有針對性的分類。一些指數(shù)集中關(guān)注特定類型的國家，比如失敗國家指數(shù)（后更名為脆弱國家指數(shù)）。相較于早期指數(shù)，這一時期的指數(shù)更具有針對性。二代指數(shù)的構(gòu)建目的和訴求不僅是做出極度簡化和抽象的排名，而更加致力于做出具體的診斷并提出解決的辦法。③Stephanie E.Trapnell, “Actionable Governance Indicators: Turning Measurement Into Reform”, Hague Journal on the Rule of Law,Vol.3, No.2, 2011, pp.317-48; Tero Erkkil?, “Global Governance Indices as Policy Instruments: Actionability, Transparency and Comparative Policy Analysis”, Journal of Comparative Policy Analysis: Research and Practice, Vol.18, No.4, 2016, pp.382-402.

21世紀(jì)的第二個十年迎來政治評估指數(shù)的第三波浪潮。這個時期出現(xiàn)的指數(shù)一般被稱為第三代指數(shù)?；趯Χ笖?shù)的全面評估與反思，評估界對第三代指數(shù)提出了更高的要求，但從結(jié)果來看，高質(zhì)量新指數(shù)的產(chǎn)出遠(yuǎn)不及預(yù)期，一代和二代指數(shù)仍然是政治評價指數(shù)的主導(dǎo)。在構(gòu)建方法上，由于政治發(fā)展理念的復(fù)雜化，量化技術(shù)的發(fā)展以及數(shù)據(jù)來源的進(jìn)一步豐富，出現(xiàn)了多個復(fù)合其他指數(shù)的集成指數(shù)，其中最為引人注目的是世界銀行的全球治理指數(shù)（WGI）。該指數(shù)綜合大量與治理相關(guān)的指標(biāo)數(shù)據(jù)，用以詮釋國家間的治理水平差異。指標(biāo)構(gòu)成和數(shù)據(jù)來源的多元化也造成了評價標(biāo)準(zhǔn)和理念和混雜，民主制度、政治原則、績效表現(xiàn)在一些指數(shù)中彼此重疊，這一特點在三代指數(shù)中尤其突出。同時，服務(wù)決策和發(fā)展實踐仍然是這一階段的首要任務(wù)。

這些評估方法和指標(biāo)體系，分布已經(jīng)超越了傳統(tǒng)政治學(xué)的研究范圍，橫跨了整個社會科學(xué)領(lǐng)域。這些發(fā)展主要得益于三方面原因：首先，在理論方面，20世紀(jì)90年代以來經(jīng)濟(jì)學(xué)的新制度理論轉(zhuǎn)向推動了制度研究的全面發(fā)展，測量制度與發(fā)展結(jié)果之間的關(guān)系成為學(xué)術(shù)熱點。其次，在技術(shù)方面，測量和評估程序更加成熟，基礎(chǔ)數(shù)據(jù)日益豐富可得；最后，在需求方面，各國政府、國際組織和商業(yè)機構(gòu)對指標(biāo)信息的需求不斷增長。

二、十種代表性指數(shù)及其比較分析

從目前的指數(shù)版圖來看，存在三大類評估框架：政治制度的類型、政治規(guī)范的遵守和制度運行的績效（見圖1）。按照數(shù)據(jù)最終呈現(xiàn)形式，現(xiàn)有指數(shù)也可以劃分為排名指數(shù)和面板指數(shù)，①Hazel Feigenblatt, “Governance Indicators and the Broken Feedback Loop Leveraging Communications for Impact”, in Helmut K.Anheier, Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress, Promise, New York: Oxford University Press, 2018, pp.315-349.前者提供一個單一排名，而后者則對不同指標(biāo)進(jìn)行單獨打分，這一類指數(shù)往往也稱為數(shù)據(jù)集或數(shù)據(jù)庫，但仍被視為廣義評估指數(shù)。

圖1 三大類政治評估指數(shù)（來源：作者自制）

本文從現(xiàn)有的近百種評估指數(shù)中篩選了10種，包括屬于政治制度類的3種；屬于政治規(guī)范類的4種；以及屬于制度績效類的3種。選擇標(biāo)準(zhǔn)主要有四個：一是評估內(nèi)容，指數(shù)評估的具體內(nèi)容屬于定義中三種主要類型的一種。二是發(fā)布周期，指數(shù)在推出以后，必須周期性連續(xù)發(fā)布。三是覆蓋范圍，指數(shù)必須覆蓋多個國家，且以國家為評估的基本單位。四是影響力，指數(shù)在學(xué)術(shù)界、大眾媒體或政策實務(wù)界有較大的傳播效果或政策影響。

（一）政治制度類型評估指數(shù)

1.政體指數(shù)（Polity）

政體指數(shù)研究于20世紀(jì)60年代末由美國馬里蘭大學(xué)政治學(xué)學(xué)者發(fā)起，第一代數(shù)據(jù)發(fā)表于1975年，后續(xù)研究由“系統(tǒng)性和平中心”（Center for Systemic Peace)主持。項目由美國中央情報局旗下的政治不穩(wěn)定工作組（Political Instability Task Force)資助（資助于2020年2月終止）。最新的“政體第五代指數(shù)”（Polity 5)由第四代指數(shù)（Polity IV）改造發(fā)展而來，記錄和監(jiān)測1800年以來167個國家政權(quán)模式和政權(quán)的變化。①Center for Systemic Peace,“ The Polity Project: About Polity”, https://www.systemicpeace.org/polityproject.html, 2022-08-24.第五代指數(shù)目前仍在開發(fā)和改造過程中，政治學(xué)研究中廣泛使用的仍然是第四代指數(shù)。

政體指數(shù)的獨特之處在于它關(guān)注制度中民主與專制相伴而非相互排斥的形式。這一觀點設(shè)想了一個治理權(quán)威的譜系，從完全制度化的獨裁，到混合的或不完全的威權(quán)政權(quán)，再到完全制度化的民主。政體指標(biāo)的測量方法是開創(chuàng)性的，但同時也受到大量的質(zhì)疑和批評：一是政體指數(shù)判定民主或?qū)Ｖ频母黜椫笜?biāo)主要集中在體制設(shè)定方面，不涉及制度績效和公民權(quán)利。二是對政治體制的評估也更為偏重行政系統(tǒng)。盡管指數(shù)設(shè)定中包含對選舉的考察，但對于選舉本身的測量是較為粗糙的。三是對美國歷史的美化，比如將1842年的美國列為全世界唯一的民主國家，事實上此時的美國仍是少數(shù)實行奴隸制的國家。四是評估指數(shù)對于西方國家的殖民主義歷史選擇了回避，比如1900年之前的非洲地區(qū)被簡單處理為“無數(shù)據(jù)”。②Adam Johnson, “Vox’s CIA-Backed ‘Democracy’ Standard Is OK With Slavery and Women Not Voting”, Fairness & Accuracy in Reporting, https://fair.org/home/voxs-cia-backed-democracy-standard-is-ok-with-slavery-and-women-not-voting/, 2022-08-24.

2.民主多樣性指數(shù)（Varieties of Democracy/V-Dem)

民主多樣性研究所創(chuàng)立于2014年，總部設(shè)在瑞典哥德堡大學(xué)政治學(xué)系。民主多樣性指數(shù)致力于在世界范圍內(nèi)測量和評估民主發(fā)展，資助機構(gòu)非常多元，包括歐盟委員會等多家政府機構(gòu)、世界銀行、多家非政府機構(gòu)以及高校、研究所等學(xué)術(shù)機構(gòu)。③V-Dem, “The V-Dem Project: About the Project and Methodology”, https://www.v-dem.net/project.html, 2022-08-24.

與其他主要政治評估指標(biāo)相比，民主多樣性指數(shù)的創(chuàng)建時間較晚，但這也使得該指數(shù)在創(chuàng)始之初就能夠利用最新的測評方法以及豐富的數(shù)據(jù)來源。其樣本規(guī)模、專家數(shù)量、數(shù)據(jù)多樣性和測量方法之復(fù)雜程度，都是早期政治評估指數(shù)難以企及的。指數(shù)由五個民主原則一級指標(biāo)構(gòu)成，包括選舉、自由、參與、協(xié)商和平等。再進(jìn)一步分解為82項二級指標(biāo)和400多項三級指標(biāo)，其中約半數(shù)為來自官方文件的客觀事實指標(biāo)，其余一半為專家主觀評估。④Staffan I.Lindberg, Jan Teorell, Michael Coppedge, John Gerring et al., “V-Dem: A new way to measure democracy”, Journal of Democracy, Vol.25, No.3, 2014, pp.159–169.

民主多樣性指數(shù)的創(chuàng)始目的是建立一個比較民主政治的數(shù)據(jù)庫，但在近年來逐漸向政策領(lǐng)域發(fā)展。民主多樣性指數(shù)中的多項指標(biāo)也成為其他重要治理指數(shù)的數(shù)據(jù)來源，比如世界銀行的全球治理指標(biāo)、“透明國際”的清廉指數(shù)和美國國際發(fā)展署的自力更生國家指數(shù)（Journey to Self-Reliance Country Roadmap）。⑤USAID, “FY 2021 USAID Journey to Self-Reliance Country Roadmap Methodology Guide”, https://roadmaps.usaid.gov/docs/FY_2021_USAID_Journey_to_Self-Reliance_Country_Roadmap_Methodology_Guide.pdf, 2022-08-24.但總體來說，民主多樣性指數(shù)的曝光率不及世界自由指數(shù)這樣的老牌政治評估指數(shù)。

3.民主指數(shù)（Democracy Index）

英國經(jīng)濟(jì)學(xué)人集團(tuán)旗下的經(jīng)濟(jì)學(xué)人智庫（EIU）從2006年開始發(fā)布民主指數(shù)。民主指數(shù)測量全球167個國家和地區(qū)的民主狀況，幾乎涵蓋了全世界的所有人口和世界上絕大多數(shù)國家（微型國家除外)。⑥EIU, “Democracy Index 2020: In Sickness and in Health?”, https://www.eiu.com/n/campaigns/democracy-index-2020/, 2022-08-24.民主指數(shù)包括5個一級指標(biāo)下的60個二級指標(biāo)，測量選舉過程和多元化、政府職能、政治參與、政治文化和公民自由。

依托以《經(jīng)濟(jì)學(xué)人》周刊為旗幟的經(jīng)濟(jì)學(xué)人集團(tuán)，民主指數(shù)在媒體曝光度和公眾關(guān)注程度上具有明顯的優(yōu)勢，但多年來也受到各種質(zhì)疑和批評。首先，該指數(shù)并沒有披露評估專家的身份，經(jīng)濟(jì)學(xué)人智庫沒有說明他們是智庫的工作人員還是外部專家，也沒有提供其數(shù)量、所在行業(yè)、職業(yè)或國籍的任何信息。其次，民主指數(shù)的評估與打分過程存在極大的模糊性、不確定性。為了獲得一致性得分，指數(shù)對于民主相關(guān)變量進(jìn)行了極簡化處理，這無疑會對指數(shù)的準(zhǔn)確性造成影響。①Peter Tasker, “The Flawed ‘Science’ behind Democracy Rankings”, Nikkei Asia, https://asia.nikkei.com/NAR/Articles/Peter-Tasker-The-flawed-science-behind-democracy-rankings, 2022-08-24.

（二）政治規(guī)范評估指數(shù)

1.世界自由指數(shù)（Freedom in the World）

世界自由指數(shù)由位于美國華盛頓特區(qū)的非營利組織“自由之家”（Freedom House)于1972年開始正式發(fā)布。盡管在官方網(wǎng)站上聲明“（世界自由）報告是在美國國家民主基金會、美林家族基金會、谷歌公司和禮來基金會的慷慨支持下完成的。《世界自由》不接受政府資助”，②Freedom House, “About the Report”, https://freedomhouse.org/report/freedom-world, 2022-08-20.但“自由之家”的歷年財務(wù)報告顯示來自聯(lián)邦政府的資助一直以來都是該組織最重要的財源，且數(shù)量和比例都在逐漸增加。 2020年資助規(guī)模達(dá)到近4600萬美元，超過全部資金來源的90%。③Freedom House, “Financial Statements”, https://freedomhouse.org/sites/default/files/2021-05/Freedom_House_FY2020_Audited_Financial_Statements.pdf, 2022-08-20.

世界自由指數(shù)是全球最具影響力的政治評估指數(shù)之一。無論從媒體曝光度、學(xué)術(shù)參考還是政治決策方面，自由指數(shù)都有相當(dāng)?shù)挠绊懥?。④Tim Büthe, “Beyond Supply and Demand: A Political-Economic Conceptual Model”, in Davis, Fisher, Kingsbury, Merry (eds.),Governance by Indicators: Global Power through Classification and Rankings, Oxford: Oxford University Press, 2012, p.50; Matthias Haber, Olga Kononykhina, “A Comparative Classification and Assessment of Governance Indices”, in Helmut K.Anheier, Matthias Haber, Mark A.Kayser(eds.), Governance Indicators: Approaches, Progress, Promise, pp.11-42.與許多政治評估指數(shù)發(fā)布機構(gòu)不同，“自由之家”在世界政治中非常活躍，從人員、資金到活動都與美國政府聯(lián)系緊密。在理論框架方面，有學(xué)者指出世界自由指數(shù)對民主的定義過于片面，過分強調(diào)民主較為正式的方面，而未能捕捉到非正式但真實的權(quán)力關(guān)系和影響途徑，并經(jīng)常導(dǎo)致事實上的民主偏離。因此，某個國家可以“在形式上看起來自由民主，但在實際運作中可能相當(dāng)不自由”。⑤Wouter P.Veenendaal, “Democracy in Microstates: Why Smallness Does Not Produce a Democratic Political System”,Democratization, Vol.22, No.1, 2015, pp.92–112.此外，在測量方法上，依賴觀察和主觀判斷的專家打分法也難以避免系統(tǒng)性偏見的產(chǎn)生。

2.法治指數(shù)（Rule of Law Index/RoLI）

世界正義項目（World Justice Project）從2008年開始發(fā)布法治指數(shù)，該項目由美國律師協(xié)會發(fā)起，旨在評估各國在法制建設(shè)及遵守法律方面的情況。該項目最初由比爾和梅琳達(dá)蓋茨基金會通過美國律師協(xié)會資助，目前得到多個組織、公司和私人基金會的財務(wù)支持。

法治指數(shù)對于“法治”的定義包括四項基本原則：責(zé)任、公正法律、開放政府以及無障礙和公正的爭議解決。⑥The World Justice Project, “Rule of Law Index 2020”, https://worldjusticeproject.org/sites/default/files/documents/WJP-ROLI-2020-Online_0.pdf, 2022-06-21.值得強調(diào)的是，法治指數(shù)是少數(shù)幾個獨立收集公眾數(shù)據(jù)的指標(biāo)之一。對普通公眾的一般性調(diào)查降低了對專家的依賴以及可能產(chǎn)生的評估偏見。但該指數(shù)也有局限性，社會調(diào)查方法存在的一些固有問題在法治指數(shù)調(diào)查中同樣難以克服，專家調(diào)查由于隔年進(jìn)行一次，調(diào)查時間可能對調(diào)查結(jié)果產(chǎn)生一定影響。調(diào)查結(jié)果并不能體現(xiàn)變量之間的因果關(guān)系，也難以直接用于政策改革。

3.腐敗感知指數(shù)（Corruption Perceptions Index/CPI）

腐敗感知指數(shù)是由非政府組織“透明國際”建立的清廉指數(shù)排行榜，反映全球商人、學(xué)者及風(fēng)險分析人員對世界各地腐敗狀況的觀察和感受。“透明國際”總部設(shè)在德國柏林，由世界銀行負(fù)責(zé)非洲地區(qū)項目的前官員于1993年成立?！巴该鲊H”的主要資助來源包括多個國家和地區(qū)的政府機構(gòu)、多邊組織和基金會等。⑦Transparency International, “Who Support Us”, https://www.transparency.org/en/the-organisation/who-supports-us, 2022-06-22.從1995年開始，腐敗感知指數(shù)對各國“公共部門腐敗感知水平”進(jìn)行排名。⑧Transparency International, “Our Story”, https://www.transparency.org/en/our-story, 2022-06-22.腐敗感知指數(shù)將腐敗定義為“濫用委托權(quán)力以謀取私利”。由于腐敗行為的隱蔽性以及難以衡量腐敗的絕對程度，腐敗感知指數(shù)測量的是人們對腐敗的看法。

腐敗感知指數(shù)是世界范圍內(nèi)使用最廣泛的腐敗指數(shù)，受到各類機構(gòu)和全球媒體的廣泛關(guān)注，也被國際發(fā)展和援助組織用來指導(dǎo)資源分配。對腐敗感知指數(shù)的批評主要集中于測量方法上。比如，有學(xué)者指出，腐敗是一個過于復(fù)雜的概念，不能用一個分?jǐn)?shù)來衡量。通過衡量人們對腐敗的看法，而不是腐敗本身，指數(shù)可能只是在強化現(xiàn)有的刻板印象；指數(shù)只衡量公共部門的腐敗程度，而忽略了私營部門。①Dan Hough, “Here’s this Year’s (Flawed) Corruption Perception Index.Those Flaws are Useful”, The Washington Post, 2016-01-27.此外，由于腐敗感知指數(shù)的數(shù)據(jù)收集并不面向普通公眾，因此被認(rèn)為存在嚴(yán)重的精英偏見，并由此引發(fā)不當(dāng)?shù)恼叻磻?yīng)。②Alex Cobham, “Corrupting Perceptions”, Foreign Policy, 2013-07-22.作為對腐敗感知指數(shù)的補充，“透明國際”推出了全球腐敗晴雨表，面向普通公眾進(jìn)行社會調(diào)查。但全球腐敗晴雨表的規(guī)模、曝光度和影響力都遠(yuǎn)遠(yuǎn)不及腐敗感知指數(shù)。

4.全球和平指數(shù)（Global Peace Index/GPI)

全球和平指數(shù)是一套測量國家或地區(qū)和平程度的指標(biāo)，由經(jīng)濟(jì)與和平研究所（Institute for Economics & Peace，IEP)于2007年首次發(fā)布。指標(biāo)的部分?jǐn)?shù)據(jù)由英國經(jīng)濟(jì)學(xué)人智庫（EIU）的專家小組收集。研究所的創(chuàng)立者澳大利亞企業(yè)家兼慈善家史蒂夫?基利亞（Steve Killelea）曾兩次獲提名諾貝爾和平獎。目前，研究所受到包括澳大利亞政府、全球多個政府間組織和基金會的資助。③Institute for Economics & Peace, “About”, https://www.economicsandpeace.org/about/, 2022-01-31.

全球和平指數(shù)測量國家卷入當(dāng)前國內(nèi)和國際沖突的程度，評估一個國家內(nèi)部的和諧或不和諧程度。指標(biāo)分為三個關(guān)鍵的主題類別：尚未平息的國內(nèi)和國際沖突、國內(nèi)和諧或動亂程度以及軍事化水平。全球和平指數(shù)使用的數(shù)據(jù)以客觀數(shù)據(jù)為主，來源廣泛，包括國際戰(zhàn)略研究所、世界銀行、斯德哥爾摩國際和平研究所、聯(lián)合國毒品和犯罪問題辦公室等等。個別指標(biāo)由于缺乏數(shù)據(jù)，會與經(jīng)濟(jì)學(xué)人智庫合作進(jìn)行定性評估。④Institue for Economics & Peace, “Global Peace Index 2021”, https://www.economicsandpeace.org/wp-content/uploads/2021/06/GPI-2021-web.pdf, 2022-01-31.

除了為學(xué)術(shù)研究提供數(shù)據(jù)和評估標(biāo)準(zhǔn)，全球和平指數(shù)也為各國政府提供決策依據(jù)，尤其在促進(jìn)旅游產(chǎn)業(yè)和建設(shè)國家品牌方面，并為非政府組織和私營部門提供項目活動信息，幫助它們選擇項目的重點領(lǐng)域，評估風(fēng)險。因此，全球和平指數(shù)自發(fā)布以來獲得新聞媒體、各國實務(wù)界和國際組織的普遍關(guān)注。也有批評指出全球和平指數(shù)結(jié)果的不合理性，這種情況主要源于定義和平以及分配指標(biāo)權(quán)重的困難性。⑤Jay Ulfelder, “The Trouble with Combining, or Why I’m Not Touting the Global Peace Index”, https://dartthrowingchimp.wordpress.com/2012/06/12/the-trouble-with-combining-or-why-im-not-touting-the-global-peace-index/, 2022-01-31.

（三）制度績效評估指數(shù)

1.國家政策和機構(gòu)評估（Country Policy and Institutional Assessment/CPIA）

以世界銀行為代表的國際金融機構(gòu)從20世紀(jì)70年代開始著手設(shè)計針對受援國家的國別政策和體制評估。國家政策和機構(gòu)評估始于1977年，在相當(dāng)長一段時期內(nèi)，一直是一項內(nèi)部評估，指導(dǎo)世行國際開發(fā)協(xié)會（IDA）向發(fā)展中國家提供貸款和贈款。自2006年以來，國家政策和機構(gòu)評估的數(shù)據(jù)向公眾開放。⑥The World Bank, “The World Bank’s Country Policy and Institutional Assessment: An IEG Evaluation”, https://openknowledge.worldbank.org/handle/10986/13547, 2022-01-21.其每年評估借款國的經(jīng)濟(jì)管理、結(jié)構(gòu)政策和公共部門績效，評估結(jié)果用于指導(dǎo)資源分配，匯報國家援助戰(zhàn)略和世界銀行貸款活動，因此國家政策和機構(gòu)評估的國家總評分被稱為“世界銀行國際開發(fā)協(xié)會資源分配指標(biāo)”（IRAI）。

國家政策和機構(gòu)評估旨在從績效角度評估國家當(dāng)前投入的政策和制度的質(zhì)量，測量國家支持可持續(xù)增長和減貧的程度，從而有效吸收發(fā)展援助的能力。其中特別列出了脆弱國家這一分類，使其能夠從基于績效的援助分配中獲得豁免。⑦World Bank, “Information Note: The World Bank’s Harmonized List of Fragile Situations”, https://www.worldbank.org/content/dam/Worldbank/document/Fragilityandconflict/FragileSituations_Information%20Note.pdf, 2022-01-21.國家政策和機構(gòu)評估的評估標(biāo)準(zhǔn)和評估方法也一直受到質(zhì)疑，比如各項評估標(biāo)準(zhǔn)中存在一定的重疊，專家評估的主觀性問題。此外，國家政策和機構(gòu)評估是在董事會國家的要求下建立的診斷性工具，由世行內(nèi)部專家制定，因而反映的是所屬機構(gòu)對于善治的政策和機構(gòu)設(shè)置偏好。①The World Bank, “The World Bank’s Country Policy and Institutional Assessment: An IEG Evaluation”, https://openknowledge.worldbank.org/handle/10986/13547, 2022-02-21.

2.脆弱國家指數(shù)（Fragile States Index/FSI）

總部位于美國華盛頓特區(qū)的智庫和平基金會和美國《外交政策》雜志從2005年開始發(fā)布失敗國家指數(shù)（Failed States Index），對世界各國總體的社會穩(wěn)定性進(jìn)行排名。 2014年，該指數(shù)更名為脆弱國家指數(shù)（Fragile States Index），旨在建立一套預(yù)警機制，有效應(yīng)對國家脆弱性問題。和平基金會創(chuàng)立于20世紀(jì)50年代，當(dāng)時主要關(guān)注冷戰(zhàn)背景下的核不擴散問題。冷戰(zhàn)結(jié)束后，和平基金會將注意力轉(zhuǎn)向弱小國家，以及更為廣泛的暴力沖突、國家脆弱性、安全和人權(quán)等問題。目前，和平基金會的合作者和資助來源包括數(shù)十個教育機構(gòu)、政府組織、政府間組織、私營企業(yè)以及基金會。②FFP, “Who We are”, https://fundforpeace.org/who-we-are/, 2021-12-20.

脆弱國家指數(shù)的起源可以追溯到和平基金會的沖突評估系統(tǒng)工具（CAST)的創(chuàng)建，該工具開發(fā)于20世紀(jì)90年代，旨在為決策者和一線工作者提供理解和測量復(fù)雜環(huán)境中的沖突驅(qū)動因素和動態(tài)的框架。從2004年開始，和平基金會與《外交政策》合作，以此框架為基礎(chǔ)，推出了失敗國家指數(shù)，進(jìn)一步對國家進(jìn)行評估和排名。由于對理論、理念到評估方法的一系列調(diào)整，失敗國家指數(shù)在更名為脆弱國家指數(shù)后，評估的重心在一定程度上由安全轉(zhuǎn)向發(fā)展。

盡管脆弱國家指數(shù)自發(fā)布以來就受到廣泛關(guān)注，但各種批評也一直伴隨左右。“失敗國家”這一名稱多年來一直飽受爭議。批評者指出“失敗國家”暗示著無可挽救。這一爭議也是2014年指數(shù)更名的原因之一。③FFP, “From Failed to Fragile: Renaming the Index”, https://fundforpeace.org/2014/06/24/from-failed-to-fragile-renaming-theindex/, 2021-12-20.此外，批評者對于脆弱國家指數(shù)作為政策工具的有效性提出質(zhì)疑，認(rèn)為指數(shù)只關(guān)注癥狀，忽視造成現(xiàn)狀的原因或可能的治愈方法。④Lionel Beehner, Joseph Young, “Is Ranking Failed or Fragile States a Futile Business?”, The Washington Post, 2014-07-14,https://www.washingtonpost.com/news/monkey-cage/wp/2014/07/14/is-ranking-failed-or-fragile-states-a-futile-business/, 2011-12-21; Miles M.Evers, “The Fatally Flawed Fragile States Index”, The National Interest, https://nationalinterest.org/blog/thebuzz/the-fatally-flawed-fragile-states-index-10878, 2021-12-25.

3.世界治理指數(shù)（Worldwide Governance Indicators/WGI）

世界治理指數(shù)從2002年開始發(fā)布，該指數(shù)是衡量一國政府公共治理成效方面最為權(quán)威的指標(biāo)體系。與機構(gòu)內(nèi)的一些其他指標(biāo)數(shù)據(jù)不同，世界治理指數(shù)并不指導(dǎo)世界銀行的資源分配。⑤WGI, “Introduction”, https://info.worldbank.org/governance/wgi/Home/Documents#doc-intro, 2021-12-26.其評估內(nèi)容包括六個方面：言論和問責(zé)、政治穩(wěn)定和暴力削減、政府效能、監(jiān)管質(zhì)量、法治、腐敗控制。⑥World Bank, “Worldwide Governance Indicators”, https://info.worldbank.org/governance/wgi/, 2021-12-26.

世界治理指數(shù)強調(diào)評估、理論發(fā)展和政策之間的聯(lián)系，“讓治理問題的相關(guān)探討更加實證化”，⑦Kaufmann D., Kraay A., “Governance Indicators: Where Are We, Where Should We Be Going?”, World Bank Policy Research Working Papers, https://elibrary.worldbank.org/doi/abs/10.1596/1813-9450-4370, 2021-12-26.是當(dāng)前諸多治理定量研究中嚴(yán)謹(jǐn)度最高、影響力最大、使用面最廣的綜合指標(biāo)之一。治理指標(biāo)為蓬勃的治理實證研究提供數(shù)據(jù)支持，學(xué)術(shù)界使用世界治理指數(shù)來驗證治理與增長之間的關(guān)系，⑧Daniel Kaufmann, Aart Kraay, “Growth Without Governance”, World Bank Policy Research Working Papers, 2002, https://ssrn.com/abstract=316861, 2021-12-26; Daniel Kaufmann, Aart Kraay, Massimo Mastruzzi, “Governance Matters VI: Governance Indicators for 1996-2006”, World Bank Policy Research Working Paper, https://ssrn.com/abstract=999979, 2021-12-26; Marcus J.Kurtz, Andrew Schrank, “Growth and Governance: Models, Measures, and Mechanisms”, Journal of Politics, No.69, 2007, pp.538-554.為世界各地的決策者提供了政策改革和監(jiān)測的工具，國際發(fā)展實務(wù)界也可以用其作為政策討論尤其是對外援助方面的政策依據(jù)，比如千禧挑戰(zhàn)公司（MCC）就使用世界治理指數(shù)的部分指標(biāo)來選擇援助國家。⑨MCC, “Who We Select: Control of Corruption Indicator”, https://www.mcc.gov/who-we-select/indicator/control-of-corruptionindicator, 2021-12-27.對于世界治理指數(shù)的分析和批評也始終存在。比如，有學(xué)者指出其對于治理的定義過于寬泛，難以真正對政府績效進(jìn)行評估。①Anna Persson, Bo Rothstein, Jan Teorell, “Why Anticorruption Reforms Fail-Systemic Corruption as a Collective Action Problem”,Governance, Vol.26, No.3, 2012, pp.449-471.六個一級指標(biāo)之間的邊界并不明確，對于何為“善治”，何為“惡治”并沒有明確的標(biāo)準(zhǔn)。②Laura Langbein, Stephen Knack, “The Worldwide Governance Indicators: Six, One, or None?”, Journal of Development Studies,Vol.46, No.2, 2010, pp.350-370.其復(fù)雜的指標(biāo)來源和變量也對數(shù)據(jù)使用者造成困擾。在一些情況下，同一指標(biāo)不同國家的數(shù)據(jù)可能來自多個不同的數(shù)據(jù)源，這也使得無論是時間上還是空間上的比較都存在問題。對于數(shù)據(jù)源的選擇依據(jù)，指數(shù)也并沒有充分的說明。雖然數(shù)據(jù)來源中既包括面向普通公眾的社會調(diào)查，也包括專家評估和公司調(diào)查，但前者的權(quán)重偏低，專家偏見仍然沒有得到有效克服。此外，很難使用該指數(shù)來直接指導(dǎo)治理實踐，指數(shù)更多的是對現(xiàn)狀的描述，對于其成因和影響，以及如何應(yīng)對，并沒有給出指導(dǎo)意見。③M.A.Thomas, “What Do the Worldwide Governance Indicators Measure?”, European Journal of Development Research, Vol.22,No.1, 2009, pp.31-54.

（四）比較分析

1.構(gòu)建主體

對指數(shù)構(gòu)建主體及其資金來源的考察是探討指數(shù)構(gòu)建機制的開始，建構(gòu)主體與指標(biāo)的構(gòu)建方式和影響力密切相關(guān)，但卻往往受到研究者的忽略。從以上指數(shù)的發(fā)布機構(gòu)來看，可以分為三大類。

第一類是政府間機構(gòu)，尤其是作為“知識銀行”④世界銀行：《我們是誰》，https://www.shihang.org/zh/what-we-do，2022-01-03。的世界銀行發(fā)布了多項重要指數(shù)，以指導(dǎo)和援助世界各國的發(fā)展。世界銀行自20世紀(jì)90年代中期重新定位為援助與發(fā)展的知識和數(shù)據(jù)銀行，⑤Don Cohen, Bruno Laporte, “The Evolution of the Knowledge Bank”, https://web.worldbank.org/archive/website01537/WEB/IMAGES/EVOLUTIO.PDF, 2022-01-03.各種量化指標(biāo)的輸出是出于資金分配科學(xué)化和透明度的需求，反映世界銀行早期作為傳統(tǒng)金融機構(gòu)的定位，更體現(xiàn)出向世界，尤其是發(fā)展中地區(qū)提供經(jīng)濟(jì)發(fā)展知識的新的定位。一方面，作為布雷頓森林機構(gòu)的重要組成部分，世界銀行的發(fā)展理念以及運行機制在實踐中發(fā)揮了重要重要，同時也體現(xiàn)在世行發(fā)布的各種數(shù)據(jù)與知識中。機構(gòu)對于市場、政府與治理的態(tài)度，影響甚至決定著數(shù)據(jù)的呈現(xiàn)方式和深層詮釋，因此，針對世界銀行發(fā)布的各項指標(biāo)體系，我們經(jīng)常能夠看到“過度反映機構(gòu)偏好”的批評。盡管多邊組織與屬地明確的其他機構(gòu)相比，更不容易受到少數(shù)主權(quán)國家的施壓，但來自自身定位、發(fā)展路徑甚至是股東國或核心成員的影響是難以避免的。另一方面，作為世界最大的發(fā)展援助機構(gòu)，世界銀行的數(shù)據(jù)和知識源自發(fā)展實踐一線，也能夠進(jìn)一步推廣應(yīng)用于發(fā)展實踐，形成知識的良性循環(huán)，并產(chǎn)生更為實在的政策影響力，這是其他類型的指標(biāo)構(gòu)建主體難以企及的。但從另一個角度來看，符合機構(gòu)發(fā)展理念的評估對象更加可能受到機構(gòu)資源的青睞，從而獲得更多的發(fā)展機會，體現(xiàn)出指標(biāo)知識背后的權(quán)力關(guān)系。

第二類組織是跨國非政府組織，比如“自由之家”和“透明國際”。這一類組織往往是某種國際規(guī)范的倡導(dǎo)者（Norm Entrepreneur），因此，指標(biāo)評估的內(nèi)容相對單一。指數(shù)傳播承載著機構(gòu)倡導(dǎo)的理念。作為非營利機構(gòu)，這些組織受到持續(xù)的外部資助。盡管各家機構(gòu)都高度強調(diào)自身的獨立性，但從機構(gòu)建立的初衷到人員和機構(gòu)運行的財務(wù)支持，都能夠看到以美國為代表的西方大國的影子。一些機構(gòu)與媒體集團(tuán)合作，進(jìn)一步保證指標(biāo)的曝光度，形成對從學(xué)術(shù)界到普通公眾以及政策實務(wù)界的廣泛影響力。

第三類是學(xué)術(shù)研究機構(gòu)，包括高校、研究所和智庫。指標(biāo)構(gòu)建的初衷往往是學(xué)術(shù)性的探索，比如尋找民主制度與其他發(fā)展變量之間的因果關(guān)系，或者為廣泛的學(xué)術(shù)研究提供基礎(chǔ)數(shù)據(jù)。以高校為依托的指標(biāo)發(fā)布主體相對具有更高的獨立性，但對面向公眾的大眾媒體和政策實務(wù)界的影響力要遠(yuǎn)遠(yuǎn)低于學(xué)術(shù)影響力。不管從指數(shù)的呈現(xiàn)方式、平臺用戶體驗還是傳播途徑的曝光程度來說，都往往存在多種不足。因此，有批評者擔(dān)心這樣的指數(shù)研究其實是“數(shù)據(jù)墳?zāi)埂薄?/p>

值得注意的是，三類構(gòu)建主體都集中于西方發(fā)達(dá)國家，也更多受到西方機構(gòu)的資助，但其影響力絕非只局限于西方世界，而是定義著整個世界，影響著各國公眾對于本國和其他國家的看法以及各種資源的流動。

2.構(gòu)建方法

根據(jù)測量方法，政治評估指數(shù)可以分為兩類：根據(jù)受訪專家感知來構(gòu)建，或使用量化數(shù)據(jù)和客觀事實來構(gòu)建。前者被稱為感知測量，后者被稱為客觀測量。一些指數(shù)也會將二者結(jié)合，使用復(fù)合測量方法。使用何種方法，受到多種因素的影響，包括評估內(nèi)容、評估目的、技術(shù)發(fā)展以及機構(gòu)可獲得的資源等?；诟兄臏y量方法主要優(yōu)勢在于靈活性，而客觀測量方法的最大特點就是嚴(yán)謹(jǐn)性。

如果評估內(nèi)容較為模糊，缺乏明確而廣受認(rèn)可的概念，且難以明確定義測量標(biāo)準(zhǔn)，比如“腐敗”，那么基于專家感知的主觀打分法無疑是最佳選擇。如果測量內(nèi)容框架明確、標(biāo)準(zhǔn)清楚，以客觀數(shù)據(jù)為基礎(chǔ)的測量方法不但可操作，也更具有可信度。從評估目的來說，提供打分，尤其是優(yōu)劣排名的指數(shù)更傾向于使用專家感知方法，而數(shù)據(jù)庫或與之類似的面板指數(shù)則更多依賴客觀數(shù)據(jù)。從技術(shù)發(fā)展角度來看，早期指數(shù)多使用不太依賴信息技術(shù)和統(tǒng)計科學(xué)的專家感知打分方法，使用客觀數(shù)據(jù)的評估指數(shù)則出現(xiàn)相對較晚，一般為二代指數(shù)。

此外，大范圍收集第一手的跨國信息，對指數(shù)構(gòu)建機構(gòu)的財力資源和信息渠道都有很高的要求。盡管面向公眾的隨機抽樣問卷調(diào)查受到普遍認(rèn)可，但在評估指數(shù)中非常少見，在本文介紹的各大指數(shù)中，僅有法治指數(shù)使用問卷調(diào)查方法，且調(diào)查周期和樣本數(shù)量都不盡如人意。出于同樣的原因，集成第三方二手?jǐn)?shù)據(jù)，直接越過邀請專家打分或收集統(tǒng)計數(shù)據(jù)，無疑能夠節(jié)省大量資源，從而更大程度地拓展評估內(nèi)容和對象。比如全球治理指數(shù)覆蓋了與治理相關(guān)的各種指標(biāo)，無論是時間跨度還是地理范圍都相當(dāng)可觀。

總體來看，專家感知仍然是政治評估指數(shù)中最為常用的測量方法。一方面，由于政治評估指數(shù)重在“評估”，運用專家的知識和理論針對社會現(xiàn)實進(jìn)行綜合分析更能彰顯“評估”的深度。另一方面，政治評估中很多內(nèi)容，在不同國家不同語境內(nèi)可能存在很大的事實差異，比如“腐敗”在美國的表現(xiàn)與印度非常不同，而客觀數(shù)據(jù)所要求的嚴(yán)謹(jǐn)?shù)目缭叫栽谶@樣的跨國評估難以實現(xiàn)，也是沒有意義的。

3.影響范圍與強度

一項評估指數(shù)的影響范圍與強度，同樣與指數(shù)構(gòu)建的機構(gòu)、目的和評估的內(nèi)容密切相關(guān)。一般來說，學(xué)術(shù)機構(gòu)發(fā)布的指數(shù)往往局限于學(xué)術(shù)界，這些指數(shù)在建設(shè)伊始就致力于理論探索。比如美國馬里蘭大學(xué)的政體指數(shù)明確提出指數(shù)研究的目的就是“科學(xué)研究和量化分析”，①Center for Systemic Peace, “Our Mission”, http://www.systemicpeace.org/mission.html, 2022-01-04.而瑞典哥德堡大學(xué)的民主多樣性指數(shù)極為復(fù)雜的指標(biāo)體系和評估結(jié)果也使得大眾媒體和公眾望而卻步。與此形成鮮明對比的是非政府組織發(fā)布的評估指數(shù)，這些指數(shù)本身就承載著倡導(dǎo)某種政治規(guī)范乃至意識形態(tài)的任務(wù)，通過大眾媒體影響公眾輿論，進(jìn)而改變政策實踐是其根本的出發(fā)點。比如“自由之家”提出世界自由指數(shù)“對學(xué)者和實踐者要同樣有用”。②Freedom House, “About Freedom in the World”, https://freedomhouse.org/report-types/freedom-world, 2022-01-04.以世界銀行為代表的政府間組織所發(fā)布的指數(shù)由于與資源分配和發(fā)展實踐密切相關(guān)，在政策實務(wù)界影響更為廣泛。

指數(shù)的影響力同樣也受到發(fā)布機構(gòu)的影響。學(xué)術(shù)機構(gòu)除了發(fā)布自己的指數(shù)外，廣泛參與各種指數(shù)研究的討論和批評，增加引用率，加入“隱性的學(xué)院”，③Diana Crane, Invisible Colleges, Chicago: University of Chicago Press, 1972.必然能夠提高指數(shù)在學(xué)術(shù)界的影響力。但要超越學(xué)術(shù)范圍，觸及非學(xué)術(shù)受眾，則更加困難。與之相比，受到大國支持和與媒體集團(tuán)合作的非政府組織往往能夠獲得大眾傳播的優(yōu)勢。同時，指數(shù)的呈現(xiàn)方式也在一定程度上決定了傳播的效果，與媒體產(chǎn)業(yè)掛鉤的指數(shù)往往比學(xué)術(shù)機構(gòu)更加關(guān)注用戶體驗，也會在公共關(guān)系和傳播方面投入更多資源，借助多種平臺宣傳研究成果。此外，一般性的傳播技巧，比如引人注目的標(biāo)題，以及明顯表達(dá)褒貶評價的排名都更容易受到大眾媒體的青睞。如何在科學(xué)性、嚴(yán)謹(jǐn)性和傳播力之間取得平衡，是所有公開發(fā)布的評估指數(shù)必須面對的挑戰(zhàn)。

最后，要獲得政策實務(wù)界的認(rèn)可，引導(dǎo)政策制定，引起改革和政治發(fā)展，更是多數(shù)政治評估指數(shù)可望而不可及的最終影響力。政府間組織與實務(wù)界的關(guān)系相對更加直接，而非政府組織和學(xué)術(shù)機構(gòu)要想影響政治實踐，路線無疑會非常曲折。一套指數(shù)要在形成廣泛傳播和認(rèn)可的前提下，形成巨大的壓力，借助國際社會或本國公眾的輿論，才有可能帶來真正的政策改變。除此之外，只有當(dāng)指數(shù)結(jié)果剛好與政治家的訴求相吻合時，才會被奉為改革的科學(xué)依據(jù)。①Rush Doshi, Judith G.Kelley, Beth A.Simmons, “The Power of Ranking: The Ease of Doing Business Indicator and Global Regulatory Behavior”, International Organization, Vol.73, No.3, 2019, pp.611-643.

表1 十種政治發(fā)展評估指數(shù)比較（來源：作者自制）

三、評估指數(shù)的貢獻(xiàn)與局限

政治評估指數(shù)的需求與力量何在？為什么一國政府會關(guān)注某一個排名或打分？事實上，指數(shù)只是對現(xiàn)有信息的重新組合和詮釋，卻釋放出強大的規(guī)范力量。指數(shù)的魅力在很大程度上歸功于其通過打分和排名制定標(biāo)準(zhǔn)，進(jìn)行比較，進(jìn)而構(gòu)建聲譽的能力，通過重新配置和詮釋比較性信息來激發(fā)人們對于國家能力和地位的關(guān)注，這種關(guān)注進(jìn)而轉(zhuǎn)化為壓力，影響和推動政策實踐。這一過程始于對某個問題的命名，提出一個概念，進(jìn)而設(shè)立評估標(biāo)準(zhǔn)，以象征的力量②Pierre Bourdieu, “Social Space and Symbolic Power”, Sociological Theory, Vol.7, No.1, 1989, pp.14-25.通過影響話語最終影響決策。指數(shù)具有強大的議程設(shè)置功能，按照其自身偏好設(shè)定優(yōu)劣標(biāo)準(zhǔn)，通過有效的政治傳播，形塑公眾、組織和決策者對于制度合法性的思考。

（一）政治評估指數(shù)的貢獻(xiàn)

1.知識建構(gòu)

評估指數(shù)建構(gòu)了一套將各國復(fù)雜多樣的政治發(fā)展具象化、可視化、可比較的知識體系。指數(shù)所使用的數(shù)據(jù)不一定是第一手的，但在數(shù)據(jù)基礎(chǔ)上進(jìn)行的評估卻是全新的。政治發(fā)展領(lǐng)域的各種概念和標(biāo)準(zhǔn)往往缺乏普遍的共識。政治評估指數(shù)通過系統(tǒng)性的指標(biāo)框架，將政治現(xiàn)象的各種性質(zhì)、強度、數(shù)量進(jìn)行標(biāo)準(zhǔn)化定義。盡管這種定義往往引來爭議和批評，但討論本身對于知識的形成和積累就是有意義的。對于民主、發(fā)展、廉政、法治概念的爭論幾乎存在于所有相關(guān)指數(shù)的討論中，這種討論能夠進(jìn)一步推動知識的發(fā)展。收集新的數(shù)據(jù)固然是重要的，但找到一個框架、整理和檢驗各種信息，檢視各種詮釋數(shù)據(jù)的角度，討論可能的因果關(guān)系同樣重要。

一套指數(shù)的形成往往借助眾多專家的貢獻(xiàn)。指數(shù)構(gòu)建的過程也是相關(guān)領(lǐng)域的專家形成共識的過程，這種共識往往是更為廣泛的社會和政治共識的基礎(chǔ)。各國專家與決策者形成的網(wǎng)絡(luò)能夠進(jìn)一步跨越地理邊界，廣泛影響國際政治。

指數(shù)提供了對象國家國內(nèi)政治的豐富信息。公開發(fā)布意味著包括一般公眾、利益團(tuán)體、商業(yè)團(tuán)體、治理機構(gòu)等各種受眾都能夠利用指數(shù)提供的比較性信息，形成政策需求。指數(shù)特有的優(yōu)劣比較更容易對后進(jìn)者形成壓力。政治評估指數(shù)能夠形成系統(tǒng)性知識，為現(xiàn)實政治活動提供合法性和動員力，并最終引發(fā)政策變化。從這種意義上說，知識就是力量。①Kevin E.Davis, Sally Engle Merry, Benedict Kingsbury, The Quiet Power of Indicators: Measuring Governance, Corruption, and the Rule of Law, Cambridge: Cambridge University Press, 2015.

2.價值倡導(dǎo)

在多元的世界中對一種政治價值形成共識，往往是一個緩慢而艱難的過程。政治評估指數(shù)的構(gòu)建主體，尤其是非政府組織，通過測量和發(fā)布指數(shù)來倡導(dǎo)相應(yīng)的政治規(guī)范。政府間組織同樣也是推動規(guī)范形成的有效平臺。民主、自由、廉政、法治等各種應(yīng)當(dāng)被普遍遵循、但在實踐中參差不齊的價值規(guī)范，通過各種指數(shù)得以測量和比較形成道德壓力。國家期望在國際社會獲得聲譽，因為積極的集體判斷代表著穩(wěn)定性和可預(yù)見性，能夠增加合作的可能。②Ian Johnstone, “The Power of Interpretive Communities”, in Michael Barnett, Raymond Duvall (eds.), Power in Global Governance,Cambridge: Cambridge University Press, 2005, p.187.而“點名”和“羞辱”則是改變和降低不良行為的主要工具。政治評估指數(shù)使得這一機制更加科學(xué)化，不但有理，而且有據(jù)。

由于政治評估指數(shù)的周期性特點，每年定時發(fā)布的各類指數(shù)可以形成一種“監(jiān)測”機制。指數(shù)發(fā)布者和其他主體的持續(xù)關(guān)注能夠影響評估對象，逐漸內(nèi)化評估標(biāo)準(zhǔn)，調(diào)整行動，形成自我規(guī)范的霍恩索效應(yīng)。③John G.Adair, “The Hawthorne Effect: A Reconsideration of the Methodological Artifact”, Journal of Applied Psychology, Vol.69,No.2, 1984, pp.334-45.一國評估結(jié)果的上升或下降，尤其是下降，也能提供一定的預(yù)警作用，提醒或迫使相關(guān)主體采取措施。

3.實踐引導(dǎo)

政治評估指數(shù)，尤其是績效表現(xiàn)指數(shù)，具有對最佳實踐的推廣和示范功能。一方面，在國際發(fā)展領(lǐng)域，以世界銀行為代表的政府間機構(gòu)發(fā)布的評估指數(shù)與援助和貸款的分配直接掛鉤，以保證資金投入的有效性。指數(shù)成為重要的資源分配和援助政策的決策工具。在這種情況下，高度依賴國際援助的發(fā)展中國家尤為關(guān)注評估結(jié)果，在一定程度上將評估結(jié)果內(nèi)化為本國制度建設(shè)。另一方面，在國內(nèi)層面，測量政治系統(tǒng)運行的績效能夠明確制度安排是否能夠達(dá)到其預(yù)期的效果，發(fā)現(xiàn)影響政策實施的障礙，并進(jìn)一步通過從以往成功或失敗中吸取的教訓(xùn)提供對策。同時，績效測量結(jié)果也向公眾和其他國內(nèi)國際利益相關(guān)方提供了治理系統(tǒng)運行的信息，從而有助于獲得進(jìn)一步的認(rèn)可和支持。

21世紀(jì)以來，對政策導(dǎo)向指標(biāo)的呼吁不斷增加，為政策實踐提供有效依據(jù)已經(jīng)成為新指數(shù)的重要目標(biāo)。指標(biāo)產(chǎn)業(yè)的發(fā)展也從關(guān)注國家排名拓展到提供系統(tǒng)性績效表現(xiàn)評估。國際機構(gòu)、非政府組織、學(xué)術(shù)機構(gòu)與各種國家層面和地方或部門次級主體的合作推動了作為政策依據(jù)的指標(biāo)產(chǎn)業(yè)，而有據(jù)可依的決策過程又可以進(jìn)一步推動善治?？茖W(xué)化、系統(tǒng)性的證據(jù)對于缺乏數(shù)據(jù)采集和分析能力的發(fā)展中國家尤其寶貴。指數(shù)與國家政策部門的合作可以帶來雙贏，一方面指數(shù)可以獲得受到評估對象認(rèn)可的更為準(zhǔn)確的一手信息，另一方面政策部門也能夠得到量身定制的政策依據(jù)和決策建議。

（二）政治評估指數(shù)的局限

1.創(chuàng)建主體的“中心主義”偏向

盡管政治評估指數(shù)的創(chuàng)建主體具有多樣性，涵蓋了從學(xué)術(shù)機構(gòu)、私人機構(gòu)、國際組織到非政府組織等多種形式，但一個無法忽視的問題是，這些指數(shù)創(chuàng)建機構(gòu)基本都位于發(fā)達(dá)國家，尤以美國和歐洲為主，來自發(fā)展中國家的價值和標(biāo)準(zhǔn)難以在主流政治評估指數(shù)中得以表達(dá)。

指數(shù)力量的一個重要來源是其創(chuàng)造者的公信力和權(quán)威。社會心理學(xué)研究指出合法權(quán)威的來源之一是信任，是對行為者公允、博學(xué)和能力的認(rèn)可。①Wendy Nelson Espeland, Michael Sauder, “Rankings and Reactivity: How Public Measures Recreate Social Worlds”, American Journal of Sociology, Vol.113, No.1, 2007, pp.1-40.要被視為權(quán)威，行為者自己也往往要被認(rèn)定為特定行為規(guī)范的典范，才能享有規(guī)范的權(quán)力。②Kathryn Sikkink, “Human Rights, Principled Issue-Networks, and Sovereignty in Latin America”, International Organization,Vol.47, No.3, 1993, pp.411-41.同時，權(quán)威也可以來源于能力，依據(jù)則是其現(xiàn)有的權(quán)力和財富。反映在指數(shù)實踐中，全球主要的政治評估指數(shù)，乃至于整個指數(shù)行業(yè)都集中于西方發(fā)達(dá)國家。這些國家以權(quán)威的姿態(tài)，用其設(shè)定的規(guī)范來評估他國。此外，網(wǎng)絡(luò)中心性也與權(quán)威密切相關(guān)。在社會和政治網(wǎng)絡(luò)中處于中心位置的行動者能夠更有力地設(shè)置議程。③R.Charli Carpenter, “Vetting the Advocacy Agenda: Network Centrality and the Paradox of Weapons Norms”, International Organization, Vol.65, No.1, 2011, pp.69-102.美國政府駐世界各地的組織機構(gòu)與美國各大非政府組織形成一個龐大的信息網(wǎng)絡(luò)，能夠有效挖掘和傳遞各種信息，這無疑是美國評估指數(shù)發(fā)達(dá)的重要原因之一。此外，發(fā)達(dá)國家更為成熟的理論、方法和數(shù)據(jù)技術(shù)，以及對于評估研究的資源投入優(yōu)勢都在一定程度上解釋了現(xiàn)有指數(shù)創(chuàng)建者的地理分布。

可以說，整個指數(shù)產(chǎn)業(yè)已經(jīng)形成了從生產(chǎn)到消費的路徑依賴。各類政治評估指數(shù)以西方政治理論為基礎(chǔ)，以西方國家為理想模型，以西方專家團(tuán)隊為評估主體，服務(wù)于西方大國的外交與貿(mào)易戰(zhàn)略。廣大發(fā)展中國家在各種指數(shù)排名中只能擔(dān)任被評估的角色，既無法對評估結(jié)果提出意見，也無法貢獻(xiàn)具有本國特色的發(fā)展經(jīng)驗。以中國為代表的一些發(fā)展中國家，尤其是新興國家，近年來也在不斷嘗試構(gòu)建體現(xiàn)本國經(jīng)驗與價值的評估體系，但從效果來看，遠(yuǎn)遠(yuǎn)無法撼動主流評估指數(shù)的主導(dǎo)地位。

指數(shù)產(chǎn)業(yè)經(jīng)過20世紀(jì)90年代開始的爆發(fā)式發(fā)展，在21世紀(jì)的第一個十年引發(fā)了針對指數(shù)體系本身的一系列思考和批評。④Charles P.Oman, Christiane Arndt, Uses and Abuses of Governance Indicators, Paris: OECD, 2006; Romina Bandura, “A Survey of Composite Indices Measuring Country Performance: 2008 Update”, UNDP/ODS Working Paper, New York: UNDP, 2008; Robert I.Rotberg, On Governance: What It Is, What It Means and Its Policy Uses, Waterloo, ON: Centre for International Governance Innovation, 2015; Helmut K.Anheier, Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress Promise.這些討論針對評估指數(shù)的概念基礎(chǔ)、評估方法和影響力等諸多方面都進(jìn)行了反思，然而，與指標(biāo)生產(chǎn)者和資助者相關(guān)的政治經(jīng)濟(jì)學(xué)分析卻始終沒有引起重視。評估指標(biāo)由發(fā)達(dá)國家生產(chǎn)似乎成為一種無可爭議的事實，從學(xué)術(shù)界到政策界，從指標(biāo)的生產(chǎn)者到數(shù)據(jù)的使用者都默認(rèn)其合理。顯然，多數(shù)指標(biāo)務(wù)求覆蓋盡可能多的國家，無論發(fā)展中國家還是發(fā)達(dá)國家都是其評估的對象，甚至一些指標(biāo)尤為關(guān)注發(fā)展中國家，但評估者，也就是指標(biāo)的生產(chǎn)者卻集中在發(fā)達(dá)國家一側(cè)，這樣明顯的失衡卻未能引起研究者的注意，可以說是一種怪現(xiàn)象。

一方面，西方國家的指數(shù)生產(chǎn)者既是裁判又是運動員，是行業(yè)的領(lǐng)導(dǎo)者、標(biāo)準(zhǔn)設(shè)定者也是市場的壟斷者；另一方面，對于指標(biāo)科學(xué)的評價和反思往往仍然是指標(biāo)生產(chǎn)者，也就是說，評估指標(biāo)從生產(chǎn)到評價再到批評，形成了一個閉環(huán)。因此，針對各大指數(shù)的分析和批評往往是技術(shù)性的，關(guān)注數(shù)據(jù)采集和評估方法，而指標(biāo)生產(chǎn)體系中的不平等和權(quán)力關(guān)系，并不是從業(yè)者關(guān)注的話題。

指數(shù)構(gòu)建機構(gòu)在分布上的失衡不僅僅是價值評價和聲譽問題。政治評估指數(shù)，以及更為廣泛的治理相關(guān)指數(shù)，與全球治理框架密切相關(guān)，與之相關(guān)的話語權(quán)決定著全球治理的角色分配和權(quán)力關(guān)系。本國的政治體制、治理效果是否得到國際社會的認(rèn)可，與貿(mào)易、合作和發(fā)展機會密切相關(guān)?？梢哉f，指數(shù)創(chuàng)建機構(gòu)的分布失衡是全球治理框架不平等的表現(xiàn)或延續(xù)。政治評估指標(biāo)要獲得可持續(xù)的健康發(fā)展，以開放的態(tài)度接納來自發(fā)展中國家的經(jīng)驗、價值和理念本身就是一種民主化的體現(xiàn)。

2.對政治發(fā)展衡量的“簡單化”傾向

政治發(fā)展是一個復(fù)雜的長期過程。無論指數(shù)的目的是傳播理念還是制定政策，解決何為政治發(fā)展的規(guī)范性問題都是一個不可避免的先決條件。只有在確定了政治發(fā)展目標(biāo)之后，才能設(shè)計指標(biāo)來評估現(xiàn)狀與目標(biāo)之間的距離，或者指導(dǎo)實現(xiàn)政治發(fā)展目標(biāo)的政策。如果政治發(fā)展的目標(biāo)是民主制度，那么對正式制度的測量就會成為評估的核心。而如果政治發(fā)展的目標(biāo)是制度高效運行，那么制度設(shè)計再完善，也不能保證其有效性，只有從制度的實際運行績效出發(fā)，以績效結(jié)果為導(dǎo)向才能評估各國的政治發(fā)展水平。

發(fā)展可以被理解為一種結(jié)果，或者一個過程。①Alan Thomas, “Development as Practice in a Liberal Capitalist World”, Journal of International Development, Vol.12, No.6, 2000,pp.773-787.基于過程或程序設(shè)定的定義是最簡單的?；谥贫仍O(shè)定的政治發(fā)展不以其結(jié)果來評價政治發(fā)展。因此，在一個制度運行低效的社會，或者一個高度依靠非正式制度的社會，對制度設(shè)定的測量既無法準(zhǔn)確衡量其政治發(fā)展水平，也無法指導(dǎo)改革和政策制定。一個顯示完善選舉制度的民主指標(biāo)并不一定表明政治昌明。同樣，與西方主流民主制度迥異的政治體制，從治理結(jié)果上也可以被評估為高速發(fā)展。以中國為代表的新興國家不斷挑戰(zhàn)甚至顛覆著現(xiàn)有的各類政治評估體系的理論預(yù)設(shè)和指標(biāo)選取，以西方經(jīng)驗為基礎(chǔ)的評估體系難以解釋為什么中國依靠一套迥異于西方的制度體系，實現(xiàn)了經(jīng)濟(jì)的持續(xù)增長和社會的長期穩(wěn)定。

此外，現(xiàn)有政治評估指數(shù)的另一個問題是從抽象概念向具體指標(biāo)的轉(zhuǎn)化問題。這一問題在各類指數(shù)中普遍存在，但在政治類指數(shù)中尤為突出。開展一項評估包括兩個關(guān)鍵步驟。首先必須定義用于構(gòu)建政治評估的信息來源，這是對測量內(nèi)容的定義。其次再定義如何將各種信息聚合進(jìn)一個指數(shù)之中，由此完成從觀察到指數(shù)的投射。一套指數(shù)即使使用了受到一致認(rèn)可的概念框架，但如何準(zhǔn)確找到反映抽象概念的相關(guān)指標(biāo)仍然非常困難。舉例來說，本文介紹的幾大民主指數(shù)，對于具體指標(biāo)的選取都各不相同。顯然，民主是一個復(fù)雜的概念，包括選舉、法治、協(xié)商等多種元素，但并不直接等同于這些元素。因此，對于具體指標(biāo)的選擇必然帶來質(zhì)疑和爭議。

同時，在指數(shù)的生產(chǎn)過程中，極易出現(xiàn)的一種情況是只選擇可以直接測量的指標(biāo)，忽略難以測量但實際上非常關(guān)鍵的指標(biāo)。政治評估指標(biāo)往往涉及到?jīng)Q策過程或公眾心理，此種數(shù)據(jù)的獲得和測量顯然是非常困難的，數(shù)據(jù)的準(zhǔn)確性也往往受到質(zhì)疑。在一些情況下，指數(shù)只能選擇一些指標(biāo)來間接反映概念框架中的某些要素，例如以新聞自由來反映誠信進(jìn)而反映一個國家的清廉程度。一些概念雖然可以直接度量，但只能以較為粗略的方式加以度量，比如依靠專家的主觀印象。

最后，概念和指標(biāo)數(shù)據(jù)脫節(jié)的情況還可能出現(xiàn)在評估對象的單位上。政治評估指數(shù)普遍以國別為基本單位，無論是民主、和平或政府質(zhì)量，其背后的理論假設(shè)都是基于國家層面的，因而相應(yīng)的指標(biāo)數(shù)據(jù)也往往是匯總數(shù)據(jù)。而事實上，在治理實踐中，區(qū)域間、機構(gòu)間和部門間的差異性是巨大的，對低層級數(shù)據(jù)的加總聚合可能會掩蓋重要的因果關(guān)系和關(guān)鍵變化，造成數(shù)據(jù)偏差進(jìn)而與現(xiàn)實脫節(jié)。

3.構(gòu)建與測量方法的“偏頗化”傾向

專家主觀感知打分是現(xiàn)有政治評估指數(shù)最常見的測量方法。與客觀測量方法相比，這種方法能夠獲取更多的信息，但研究者相對難以把控信息的質(zhì)量，可靠性存疑?？陀^指標(biāo)則正相反，數(shù)據(jù)可靠，但可用信息相對有限。用感知測量方法時，研究者能夠決定專家的選擇，提問的內(nèi)容和方式以及如何使用調(diào)查結(jié)果，但不能指定受訪專家用來構(gòu)建感知的信息來源，也無法控制專家的評估標(biāo)準(zhǔn)。感知測量的一個重要特點就是從研究者到受訪專家的權(quán)力轉(zhuǎn)移。其靈活性在很大程度上也來源于此。考慮到政治評估的許多內(nèi)容或是缺乏嚴(yán)謹(jǐn)?shù)南到y(tǒng)性信息（尤其是跨國比較信息），或是難以給出準(zhǔn)確的衡量標(biāo)準(zhǔn)（比如公正或腐?。?，這種靈活性無疑是一個巨大的優(yōu)點。此外，感知方法的靈活性一方面使得可測量的內(nèi)容范圍大大拓寬，另一方面也可以借助專家的知識，超越研究者的認(rèn)知局限，大規(guī)模拓展指數(shù)的信息范圍。

但同時，靈活性的代價也是不可忽視的。首要問題就是偏見。偏見的產(chǎn)生可能基于幾方面原因。首先是信息滲透，研究者無法控制專家的信息來源以及由此產(chǎn)生的認(rèn)知。對某一具體指標(biāo)的評估很可能受到一些外部信息的影響，比如對腐敗的評估可能受到新聞自由相關(guān)信息的影響。信息的互相滲透可能使得指標(biāo)設(shè)定失去意義，控制腐敗、法治、問責(zé)等等各種信息纏結(jié)在一起，專家只是基于一個總體的印象對不同內(nèi)容進(jìn)行評估。這種情況對于使用評估指數(shù)進(jìn)行理論驗證時尤為有害。比如指數(shù)使用者想要驗證民主與政府透明度之間的關(guān)系，但專家對于民主的打分正是基于政府透明度的，那么驗證結(jié)果必然是二者高度相關(guān)。不過，信息滲透對于指數(shù)排名來說并不是一個嚴(yán)重的問題，甚至可能有一定的助益。對一個國家政治經(jīng)濟(jì)信息的普遍了解可能使得專家的打分更加符合實際，提高評估的準(zhǔn)確性。此外，感知方法還存在透明度的問題。我們永遠(yuǎn)無法完全掌握專家是基于何種信息何種原則進(jìn)行的評估，無法對結(jié)果進(jìn)行復(fù)驗，或者在復(fù)驗時獲得截然不同的結(jié)果。透明度問題可以通過精確問題、附加錨定信息、增加受訪專家數(shù)量或使用測量模型得到緩解。

在使用客觀測量方法時，研究者能夠決定信息內(nèi)容以及賦值標(biāo)準(zhǔn)。這無疑確保了指數(shù)的透明度和可復(fù)驗性。從信息來源到評估標(biāo)準(zhǔn)，客觀測量方法都是高度透明的。使用同樣尺度對同樣內(nèi)容的評估必然產(chǎn)生相同的結(jié)果。但同時，這也意味著客觀測量指數(shù)高度依賴研究者的理論和判斷，其使用的信息往往是比較有限的，測量對象也更加狹窄，受限于研究者的知識、經(jīng)驗和想象力。此外，高度的嚴(yán)謹(jǐn)性對比較信息（尤其是跨國信息）完整程度要求更高，這會進(jìn)一步縮小指數(shù)內(nèi)容的覆蓋范圍。

此外，從指數(shù)構(gòu)建方法來劃分，除了傳統(tǒng)的感知、客觀測量及其復(fù)合指數(shù)，還有一類常見方法——集成指數(shù)。這一類指數(shù)的構(gòu)建者并不采集一手?jǐn)?shù)據(jù)，而是根據(jù)一定的理論框架，將第三方指數(shù)或社會調(diào)查的數(shù)據(jù)納入自己的指標(biāo)系統(tǒng)，經(jīng)過一定的標(biāo)準(zhǔn)化程序，最終形成一個新的指數(shù)。這一類指數(shù)節(jié)省了數(shù)據(jù)搜集階段的大量資源，相應(yīng)地能夠擴大指標(biāo)范圍和規(guī)模，因此往往覆蓋較長時間跨度內(nèi)多個領(lǐng)域的大量數(shù)據(jù)，最為典型的就是世界銀行的全球治理指數(shù)（WGI）。但這樣的指數(shù)構(gòu)建方法同樣存在一定的問題。首先，由于指標(biāo)數(shù)據(jù)來自不同的信息源，要確保理論和概念的一致性是非常困難的，而在此基礎(chǔ)上進(jìn)行的比較難以克服跨越性問題。其次，在指標(biāo)集成的過程中，必然要對各種變量進(jìn)行標(biāo)準(zhǔn)化處理。如果指標(biāo)本身就來自第三方指數(shù)，那么數(shù)據(jù)可能已經(jīng)經(jīng)歷了多輪標(biāo)準(zhǔn)化，這可能造成數(shù)據(jù)的變形。最后，如果集成指數(shù)使用的是數(shù)據(jù)源的部分?jǐn)?shù)據(jù)而非全部，就需考慮源數(shù)據(jù)的各個變量是否是獨立的，將數(shù)據(jù)從原本語境中抽離是否會造成失真?？傊?，使用集成構(gòu)建方法，需要對數(shù)據(jù)源進(jìn)行非常謹(jǐn)慎的選擇和處理。

4.評估影響的“有限性”

政治評估指數(shù)產(chǎn)生影響力的原因之一在于其賦予評估對象聲譽和地位的能力。通過對信息的比較和詮釋，指數(shù)可以廣泛影響國際社會對于成功國家和有效制度的標(biāo)準(zhǔn)，形成一種社會壓力，迫使評估對象接受并遵守評估結(jié)果以及其背后的價值標(biāo)準(zhǔn)。比較形成判斷，賦予被比較者地位和身份。在這個過程中，公約得以形成。不同的國家根據(jù)這個共同的尺度進(jìn)行比較，形成一種高度簡化的世界觀。

評估指數(shù)影響力可以分為傳播和行為改變兩種形式。在傳播層面，評估指數(shù)的影響力主要存在于兩個群體——學(xué)術(shù)界和包括政策制定者以及一般公眾的非學(xué)術(shù)界。盡管對于傳播效果的直接測量是十分困難的，但這兩個方向分別可以通過學(xué)術(shù)引用和媒體曝光率進(jìn)行間接的評估。從現(xiàn)有研究來看，①Matthias Haber, Olga Kononykhina, “A Comparative Classification and Assessment of Governance Indices”, in Helmut K.Anheier,Matthias Haber, Mark A.Kayser (eds.), Governance Indicators: Approaches, Progress, Promise, 2018, pp.11-42.評估指數(shù)在學(xué)界的影響力遠(yuǎn)遠(yuǎn)高于非學(xué)術(shù)界。相較于經(jīng)濟(jì)或社會指數(shù)，政治類指數(shù)的這一特點尤為突出。換句說話，一些活躍于科研項目和學(xué)術(shù)文獻(xiàn)中的指數(shù)研究在很大程度上并沒有轉(zhuǎn)化為政策依據(jù)和公眾關(guān)注，艱深的理論探討和復(fù)雜的測量方法可能永遠(yuǎn)不會影響非學(xué)術(shù)受眾。

當(dāng)然，一部分評估指數(shù)的主要構(gòu)建目的就在于理論驗證，本文中介紹的一些政治體制評估指數(shù)強調(diào)概念界定和制度規(guī)范，多由學(xué)術(shù)機構(gòu)創(chuàng)建，其參與者和受眾都主要集中在學(xué)術(shù)研究界，并不追求媒體曝光率，對政策實務(wù)界的影響即使存在，也往往是間接的。由于該類指標(biāo)的目標(biāo)受眾就是學(xué)術(shù)群體，傳播范圍的相對有限并不算是問題。但對于關(guān)注政治系統(tǒng)運行、與政策密切相關(guān)的指數(shù)來說，政策實務(wù)界的關(guān)注至關(guān)重要。而對于本文總結(jié)的第二類評估指數(shù)，即以廉政、自由、法治等政治價值為測量對象的指數(shù)，以推動制度革新和社會進(jìn)步為目的，尤其需要一般公眾和政策界的關(guān)注。如果不能進(jìn)行有效的傳播，那無疑是真正的數(shù)據(jù)墳?zāi)?。通過自上而下的排名系統(tǒng)吸引媒體曝光正是一種有效的傳播策略。

政治評估指數(shù)研究經(jīng)過二三十年的發(fā)展，從概念框架到測量方法都更加精深化、復(fù)雜化，但也造成了成果與公眾認(rèn)知之間的鴻溝。尤其是面板指數(shù)，其結(jié)果往往無法用易于理解的語言簡單概括，普通公眾也難以將其與自身經(jīng)驗相聯(lián)系。如果研究者不能夠放下身段為公眾闡釋指標(biāo)的意義，引起公眾興趣，就很難獲得以受眾為導(dǎo)向的大眾媒體的青睞。而在互聯(lián)網(wǎng)時代，雖然傳播主體可以在一定程度上跨越傳統(tǒng)媒體渠道，但如果不能搭建用戶友好的數(shù)據(jù)平臺，制作面向公眾的傳播形式，在各種新興內(nèi)容的擠壓下，就會造成更為嚴(yán)重的傳播劣勢。

在傳播基礎(chǔ)上，更為有效的影響力表現(xiàn)在行為改變，對于評估指數(shù)來說，也就是其可以成為政策制定或改革的依據(jù)。尤其是在指數(shù)中排名落后的國家，指數(shù)通過媒體傳播形成民意壓力。利益團(tuán)體可以利用評估指數(shù)提供的信息要求制度變革。同時，通過長期對政策和機構(gòu)進(jìn)行監(jiān)測和評估，成功的指數(shù)可以在一定程度上使評估對象內(nèi)化其評價標(biāo)準(zhǔn)，為避免評分降級而進(jìn)行自我規(guī)范。此外，評估指數(shù)通過比較形成跨國壓力，進(jìn)而影響國際合作、投資和援助。

要真正引導(dǎo)政策變化，形成壓力是必要條件，但不是充分條件。在壓力之下，評估對象還需要具體的政策指導(dǎo)才能最終完成政策變革。盡管近十年來的指數(shù)研究已經(jīng)注意到對政策實務(wù)的指導(dǎo)性，但現(xiàn)有指數(shù)仍然多是對現(xiàn)狀的測量和描述。既缺乏對因果關(guān)系的挖掘，也難以直接轉(zhuǎn)化為政策依據(jù)。高度抽象化的評估指標(biāo)也許可以描述何為“善治”，但無法告訴實踐者如何獲得“善果”。例如，脆弱國家指數(shù)通過貧困、沖突等指標(biāo)測量一國的脆弱程度，但這些指標(biāo)難以用來指導(dǎo)高度脆弱國家或其他相關(guān)主體通過何種舉措或干預(yù)來改善該國的脆弱性。盡管世界各國都認(rèn)識到與制度運行相關(guān)的政策依據(jù)對于決策和治理的重要性，并且隨著技術(shù)進(jìn)步，數(shù)據(jù)的數(shù)量和質(zhì)量也在不斷增加，但生成、收集、合成和使用指數(shù)為決策提供信息仍然存在困難。決策者要從大量復(fù)雜的信息中識別對政策有用的數(shù)據(jù)，理解數(shù)據(jù)的意義，與自身政策環(huán)境相結(jié)合，無疑是非常困難的。

結(jié)論：善治的引導(dǎo)抑或政治的規(guī)訓(xùn)

指數(shù)以數(shù)字反映現(xiàn)象，數(shù)字本身是中立的，但當(dāng)指標(biāo)被用于揭示問題、指導(dǎo)決策時，這些數(shù)字就具有了價值判斷和政治性，反映出指數(shù)生產(chǎn)者以及消費者的理念和目標(biāo)。政治評估指數(shù)尤其體現(xiàn)了數(shù)字的客觀性與指向的政治性之間的緊張關(guān)系。政治評估指數(shù)究竟揭示的是政治世界的真相和理想愿景，還是個別國家或組織規(guī)訓(xùn)他國的“科學(xué)化”工具？顯然，在現(xiàn)有的指數(shù)版圖中，兩種性質(zhì)同時存在，而其存在的合理性就在于二者微妙的平衡——以知識提供規(guī)范的權(quán)力。三十年間的迅速發(fā)展反映了世界對于政治評估指數(shù)旺盛的需求。同時，能夠獲得普遍認(rèn)可、有效回應(yīng)各種批評并指導(dǎo)政策實踐的新型政治評估指數(shù)仍在孕育之中。

21世紀(jì)已經(jīng)進(jìn)入第三個十年，全球治理框架在多種力量的共同作用下正在動態(tài)中逐漸形成。雖然傳統(tǒng)的權(quán)力主體仍然主導(dǎo)著國際政治，但無論學(xué)術(shù)界還是實務(wù)界，都已經(jīng)意識到多種隱形權(quán)力以微妙的方式影響著國家間的權(quán)力分配。政治評估指數(shù)正是以這樣一種形式影響甚至改變著全世界關(guān)于制度、規(guī)范、績效與發(fā)展的觀念，以非強制性卻有效的方式規(guī)范著全世界，引導(dǎo)決策者的政策行為和公眾輿論。這些指數(shù)不僅是對實踐或現(xiàn)象的測量和描述，更重要的是對評估目標(biāo)施加壓力，施加指數(shù)背后的意識形態(tài)和價值準(zhǔn)則。

本文介紹的三類政治評估指數(shù)，其評估內(nèi)容、目的和影響范圍各有側(cè)重，發(fā)展方向也不盡相同。政治制度評估指數(shù)要拓展其影響范圍，獲得更為廣泛的認(rèn)可，應(yīng)超越舊有政治理論的窠臼，關(guān)照當(dāng)今世界的發(fā)展現(xiàn)實，以更加開放包容的標(biāo)準(zhǔn)評估全球多樣化的制度設(shè)定。政治規(guī)范評估指數(shù)要避免成為“抹黑”的工具，要有效倡導(dǎo)政治道德，其評估專家和標(biāo)準(zhǔn)都應(yīng)更加客觀中立?！包c名”和“批評”是政治規(guī)范指數(shù)發(fā)揮影響力的有效方法，但無論是“點名”還是“批評”，都需建立在客觀事實的基礎(chǔ)上，避免成為詆毀“他者”的托詞，才能受到評估對象的接受和認(rèn)可，真正將道德規(guī)范內(nèi)化進(jìn)制度的設(shè)定和運行中。最后，考察治理績效的評估指數(shù)應(yīng)發(fā)展更加有效的評估方法，提高數(shù)據(jù)的收集、加工和分析的技術(shù)水平，真正以高度精煉的數(shù)字準(zhǔn)確反映復(fù)雜的治理實踐。

總體來說，無論是現(xiàn)有指數(shù)的升級發(fā)展還是推陳出新構(gòu)建新一代指數(shù)，增加包容性、客觀性和有效性的目的都是提高指數(shù)的影響力。在政治評估指數(shù)的主要受眾，即學(xué)術(shù)界、一般公眾和政策實務(wù)界中，后二者更難突破，又正是指數(shù)最重要的影響對象，可以說，指數(shù)所帶來的權(quán)力正是源于對這兩個群體的影響。要提高對一般公眾的影響力，在不損失科學(xué)性的前提下，應(yīng)注意提高指數(shù)的用戶親和性，增加對公共關(guān)系的投入，與傳統(tǒng)媒體合作或運營新媒體傳播，以多種形式提高公共曝光率。對于政策實務(wù)界，則應(yīng)增加合作互動，在收集第一手信息的同時也了解實務(wù)界的需求，讓數(shù)據(jù)能夠更加直接的指導(dǎo)實踐，彌合指數(shù)與政策實踐的鴻溝。

中國作為全球治理的積極倡導(dǎo)者和推動者，在構(gòu)建制度性話語權(quán)的過程中，應(yīng)該更積極地參與全球政治評估指數(shù)的建構(gòu)，對中國成功的政治發(fā)展經(jīng)驗和制度建設(shè)做法進(jìn)行學(xué)理化、普遍化研究，以形成基于中國經(jīng)驗同時關(guān)照廣大發(fā)展中國家政治發(fā)展前景的評估指數(shù)體系，推動全球政治評估指數(shù)版圖的多樣化。客觀地說，目前，中國在全球政治評估體系中，仍然處于非常被動的狀態(tài)。盡管近年來，許多中國學(xué)者進(jìn)行了探索性研究，嘗試建立新的政治評估體系，但效果并不理想。這在一定程度上是由于我們對現(xiàn)有的全球政治評估指數(shù)仍然缺乏系統(tǒng)的理解和充分的分析，本文正是期望能夠于此做出微薄的貢獻(xiàn)。