王學(xué)軍 王子琦
摘 要:近年來,循證決策在全球范圍內(nèi)掀起了一場政策“有效性”變革的浪潮,但也受到越來越多理論和實踐的挑戰(zhàn)。基于治理理論和善治理論的觀點,許多學(xué)者探討了“循證治理”相關(guān)的概念,以彌合“循證”思潮與主流公共管理理論的斷橋。文章從證據(jù)生產(chǎn)、評價、使用和價值取向四個方面闡釋了從循證決策到循證治理的轉(zhuǎn)變邏輯,類比循證醫(yī)學(xué)三要素提出了循證治理的三要素:證據(jù)、領(lǐng)導(dǎo)力和公共價值。文章以循證領(lǐng)域的主要研究方法——系統(tǒng)評價為分析對象,考察了循證醫(yī)學(xué)和公共管理領(lǐng)域系統(tǒng)評價研究的方法論異同,呈現(xiàn)了Campbell數(shù)據(jù)庫中一項公共管理領(lǐng)域系統(tǒng)評價研究,并討論了其方法論啟示。循證治理的未來研究問題包括中層理論構(gòu)建、知識轉(zhuǎn)化、方法論研究、本土化研究以及大數(shù)據(jù)與計算社會科學(xué)背景下的循證治理等。
關(guān)鍵詞:循證醫(yī)學(xué);循證決策;循證治理;系統(tǒng)評價;公共價值
中圖分類號:C3;R-3 文獻(xiàn)標(biāo)識碼:A DOI:10.11968/tsyqb.1003-6938.2018040
From Evidence-based Policy-making to Evidence-based Governance:Theoretical Framework and Methodological Analysis
Abstract In recent years, evidence-based policy-making has raised a wave of changes on policy "effectiveness" globally. At the same time, the concepts and frameworks of evidence-based policy-making are being challenged more and more both in theory and practice. Based on the theory of governance and good governance, many scholars have explored the concepts related to "evidence-based governance" to fill the gap between the trend of "evidence-based" thought and the mainstream public management theory. This article illustrates the logic of change from evidence-based policy-making to evidence-based governance from the perspectives of production, evaluation, utilization and the value propositions of evidence, and puts forward three elements of evidence-based management, including evidence, leadership, and public value comparing with the three elements of evidence-based medicine. The article examines the methodological similarities and differences between systematic review research,the main research method in the evidence-based field, in evidence-based medicine and in the field of public management and presents a systematic review case in public management field in Campbell database, and discusses its methodological implications. The future research questions of evidence-based governance include the construction of middle-level theory, knowledge transformation, methodology, indigenous research and the evidence-based governance under the background of big data and social computing.
Key words evidence-based medicine;evidence-based policy making;evidence-based governance;systematic review;public value
1 引言
循證決策(Evidence-based Policy Making)和新韋伯主義、公民參與、公共價值管理等一同被視為后新公共管理時期的重要理論思潮,近年來受到學(xué)界的廣泛關(guān)注[1]。從本質(zhì)而言,循證決策回應(yīng)了公共政策領(lǐng)域的一個根本問題:公共政策學(xué)者對政策的研究成果如何轉(zhuǎn)化為有效的決策?這一問題是實踐者追尋理性決策的必然考量,也構(gòu)成了公共政策研究的根本合法性基礎(chǔ)。從20世紀(jì)后期開始,循證決策的思想先后在英國、美國、澳大利亞、日本、加拿大等國擴散,我國的衛(wèi)生政策、科技政策等領(lǐng)域也能窺見循證決策的端倪,各國政府在政策文本中不斷強調(diào)使用最佳證據(jù)做出有效決策,學(xué)者也積極探索政策研究以及知識轉(zhuǎn)化的種種議題[2-7]。循證決策正在全球范圍內(nèi)掀起一場政策“有效性”(What Works)變革的浪潮。
隨著理論研究和政策實踐的深入推進,循證決策面臨的挑戰(zhàn)也逐漸顯現(xiàn):一是,循證決策延續(xù)了新公共管理理論以效率、效益和結(jié)果為中心的價值取向,不可避免地再次陷入了管理主義和工具理性取向的狹隘性。公共決策從來不是一個價值中立的技術(shù)議題,僅僅關(guān)注干預(yù)有效性的循證決策無法平衡多元的、甚至沖突的價值訴求[8]。從這個意義上講,循證決策無法應(yīng)對當(dāng)前全球公共行政實踐中普遍存在的具有高度復(fù)雜性和高度價值沖突雙重屬性的棘手問題[9];二是,在對布萊爾政府的循證決策實踐批判反思過程中,學(xué)者們質(zhì)疑循證決策事實上仍是政府選擇性的使用證據(jù)支持其政策取向的線性過程,即“基于政策的證據(jù)”而非“基于證據(jù)的政策”[4]。由于政策科學(xué)研究可能提供豐富的、甚至有時是相互矛盾的證據(jù),公共決策者在選擇證據(jù)時往往會根據(jù)自身決策意圖選擇性的篩選、解釋、使用證據(jù),循證決策追尋的客觀真實性因此不可避免地受到政治主觀性的影響和控制[10-11];三是,政治體制、價值觀、文化等要素都會顯著干擾證據(jù)的適用性,對證據(jù)的使用也存在種種可知的或不可知的偏誤,如未遵循“最佳”決策證據(jù)導(dǎo)致的“技術(shù)偏誤”和未遵循透明的決策程序并曲解社會價值的“議題偏誤”[12-14]等。
循證決策面臨的理論和實踐挑戰(zhàn)促使學(xué)界反思“循證”思潮在公共管理領(lǐng)域?qū)⒑稳ズ螐?。特別是循證決策因循的理論前提和方法論很大程度上仍是循證醫(yī)學(xué)的簡單移植嫁接。如何結(jié)合國家治國理政實踐,融入前沿公共行政理論,深度整合“循證”思潮和“治理”思潮,克服工具理性弊病,并最終改良理論分析框架和方法論將是“循證”思想貢獻(xiàn)于公共治理研究和實踐的必經(jīng)路徑。為此,本文梳理了從循證決策到循證治理的轉(zhuǎn)變邏輯,類比循證醫(yī)學(xué)三要素提出了循證治理的三要素——證據(jù)、領(lǐng)導(dǎo)力、公共價值,比較分析了系統(tǒng)評價方法在醫(yī)學(xué)和公共管理學(xué)應(yīng)用的方法論異同,并展示了Campbell數(shù)據(jù)庫中的一項公共管理領(lǐng)域系統(tǒng)評價研究,最后提出了循證治理的未來研究問題。
2 循證治理的轉(zhuǎn)變邏輯和分析框架
2.1 從循證決策到循證治理的轉(zhuǎn)變邏輯
許多學(xué)者曾質(zhì)疑“循證”的模式是一個線性的證據(jù)生產(chǎn)、使用過程[15-17]。因為在此模式下,遵循證據(jù)的決策變成了嵌套在層級官僚制中的單一主體活動,證據(jù)使用究竟是否改善了決策質(zhì)量?遵循證據(jù)決策的回應(yīng)性如何?當(dāng)證據(jù)無法滿足決策需要時政府如何行動?這些問題都在質(zhì)問:停留在管理主義和價值無涉追求的“循證決策”是否是“循證”思潮在公共部門的最佳實踐形式?隨著治理理論的興起,許多學(xué)者開始思考“循證+治理”的模式是否能推動循證思潮在公共部門中應(yīng)對挑戰(zhàn),煥發(fā)新的思想活力和實踐啟迪。如Parkhurst提出了“證據(jù)的善治”(Good Governance of Evidence)概念,從“善的證據(jù)”和“善的證據(jù)使用”兩方面提出了證據(jù)適當(dāng)性、證據(jù)質(zhì)量、系統(tǒng)和嚴(yán)密的證據(jù)、證據(jù)的可消化性、知證過程的公民協(xié)商、證據(jù)使用的透明性、決策權(quán)威的公民代表性、顧問系統(tǒng)設(shè)計的公共授權(quán)等8個要素[14];Mele等人[18]也提出了“經(jīng)由證據(jù)的治理”(Governing through Evidence),認(rèn)為經(jīng)由證據(jù)的治理應(yīng)該涵蓋三個步驟:選擇或結(jié)合一系列證據(jù)基礎(chǔ)、構(gòu)建多元主體間新的關(guān)系安排、將決策標(biāo)準(zhǔn)或流程規(guī)范化。在新公共治理范式下,循證決策向循證治理的轉(zhuǎn)變契合了網(wǎng)絡(luò)構(gòu)建與維護、價值多元主義等一系列治理理論的觀點。從循證決策到循證治理的轉(zhuǎn)變存在于證據(jù)生產(chǎn)、評價、使用、價值取向的各個環(huán)節(jié),其邏輯包括:
(1)從證據(jù)的線性生產(chǎn)到合作生產(chǎn)。證據(jù)的生產(chǎn)并非價值無涉的,在循證決策模式中,證據(jù)生產(chǎn)是一個政府和相關(guān)機構(gòu)間的“委托-代理”關(guān)系,相關(guān)機構(gòu)生產(chǎn)的證據(jù)不可避免地會受政府價值取向的影響。循證治理背景下的證據(jù)處于多元主體的“合作生產(chǎn)”模式之下,政府、公民、企業(yè)、研究機構(gòu)等多元利益相關(guān)者通過治理網(wǎng)絡(luò)完成證據(jù)生產(chǎn),實現(xiàn)價值的“合作創(chuàng)造”[19-20]。
(2)從證據(jù)評價到證據(jù)綜合治理。循證決策對證據(jù)的評價沿用了循證醫(yī)學(xué)中的“證據(jù)鏈”、質(zhì)量評價量表等工具,是講究管理主義和實用主義的方法體系。循證治理模式下的證據(jù)評價強調(diào),證據(jù)的評價標(biāo)準(zhǔn)除了客觀質(zhì)量和科學(xué)性,還應(yīng)該包括實踐中的適當(dāng)性和可用性,即考慮到證據(jù)使用的本土化情境和實踐者的知識背景。
(3)從證據(jù)的偶然使用到系統(tǒng)議程設(shè)置。循證決策中的證據(jù)使用具有偶然性:一方面,并非所有推行循證決策的組織都設(shè)置了篩選、研究證據(jù)的公共機構(gòu),未經(jīng)過研究的證據(jù)無法被決策部門充分理解(甚至無法被發(fā)現(xiàn))[21];另一方面,實踐部門的問題和熱點研究主題不一定一一對應(yīng),各類關(guān)系和社會網(wǎng)絡(luò)也會影響證據(jù)的使用[22]。循證治理中的證據(jù)使用是基于系統(tǒng)的議程設(shè)置的,實踐部門通過構(gòu)建議程與公民需求、研究專家進行充分對話,進而構(gòu)建證據(jù)使用的制度化議程系統(tǒng)。
(4)從有效性到有價值。循證決策的價值取向是有效性(What Works),是公共政策的工具主義取向。循證治理則更偏向有價值(What values)的取向,強調(diào)證據(jù)生產(chǎn)、評價、使用全過程中的公民授權(quán)、價值協(xié)調(diào)和社會層面的公共價值創(chuàng)造。
2.2 循證治理的一個理論分析框架:動態(tài)三角模型
循證醫(yī)學(xué)包含三個基本要素:即醫(yī)學(xué)研究獲得的不同層級的證據(jù)、臨床醫(yī)生自身具備的臨床經(jīng)驗、患者的價值觀及意愿,只有將三者充分平衡和結(jié)合在一起,才能形成最佳的治療決策[23]。本文認(rèn)為,循證治理的基本要素及要素間關(guān)系與循證醫(yī)學(xué)具有類似的邏輯:循證治理的核心仍然是“證據(jù)”,包括但不限于公共政策研究提供的科學(xué)治理依據(jù);臨床醫(yī)生自身具備的臨床經(jīng)驗則對應(yīng)公共管理者運用證據(jù)、應(yīng)對情景變化的能力,即領(lǐng)導(dǎo)力;患者的價值觀和意愿則對應(yīng)公共服務(wù)的直接利益相關(guān)對象,即公民的價值觀和意愿,反映大部分公民達(dá)成的價值共識——也即公共價值。循證治理的要素至少包括:政策研究及其他與議題相關(guān)研究形成的證據(jù)、公共部門的領(lǐng)導(dǎo)力、在社會公共領(lǐng)域中協(xié)調(diào)表達(dá)的公共價值(見圖1)。
在循證治理的動態(tài)三角模型中,證據(jù)要素指政策效應(yīng)研究、行為研究、成本收益分析等與公共部門決策相關(guān)的研究成果,根據(jù)證據(jù)可靠性高低可以將不同證據(jù)排列為“證據(jù)鏈”,證據(jù)鏈頂端為規(guī)范使用系統(tǒng)評價(Systematic Review或Systematic Literature Review)方法獲取的現(xiàn)存研究最佳證據(jù),包括定量研究形成的合并效應(yīng)值或定性系統(tǒng)評價研究形成的統(tǒng)合理論;次一級證據(jù)為嚴(yán)密隨機干預(yù)實驗證實的效應(yīng)值;再次一級證據(jù)為準(zhǔn)實驗、自然實驗等因果推斷研究推定的效應(yīng)值;再次一級證據(jù)為小樣本調(diào)查的相關(guān)性數(shù)據(jù)及專家的經(jīng)驗性判斷和觀點等[24-25]。領(lǐng)導(dǎo)力要素在公共部門中對公共權(quán)力和公共資源進行統(tǒng)籌和協(xié)調(diào),以提供高質(zhì)量的公共產(chǎn)品和服務(wù)。在公共決策中,領(lǐng)導(dǎo)力是識別情境變化、積極推動決策形成和實施的要素,主要作用是應(yīng)對變化并協(xié)同沖突。作為公民集體偏好的政治協(xié)調(diào)表達(dá),公共價值要素是決策相關(guān)議題激發(fā)下,多元利益相關(guān)者表達(dá)自身利益訴求和價值偏好,在公共領(lǐng)域中充分討論、溝通和整合,與政府建構(gòu)價值雙向互動后形成的重疊共識,反映作為整體的公民對公共決策的意愿期望和價值偏好[26]。
本文認(rèn)為,循證治理的最終目的是使證據(jù)、領(lǐng)導(dǎo)力、公共價值三要素達(dá)成動態(tài)平衡,治理嵌套于這組動態(tài)關(guān)系之中,是動態(tài)平衡實現(xiàn)的結(jié)果,“善治”是循證治理的最終目的。領(lǐng)導(dǎo)力、證據(jù)和公共價值的動態(tài)平衡不僅反映了循證治理的有效性(What Works)向度,回應(yīng)了“什么是有效的”這一問題,還反映了循證治理的價值向度(What Values),回應(yīng)了“什么是有價值的”這一問題。對兩兩要素間雙向關(guān)系的理解和治理構(gòu)成了循證治理的基礎(chǔ)。
(1)領(lǐng)導(dǎo)力和證據(jù)之間存在雙向動態(tài)關(guān)系,即基于證據(jù)的領(lǐng)導(dǎo)力和對證據(jù)的領(lǐng)導(dǎo)。一方面,政策研究生產(chǎn)的證據(jù)可以為公共部門領(lǐng)導(dǎo)力提供策略依據(jù)和決策支撐,幫助公共管理者評估決策、管理風(fēng)險并降低不確定性。證據(jù)使公共部門領(lǐng)導(dǎo)者更好、更有效地實現(xiàn)公共部門戰(zhàn)略目標(biāo)的邏輯不言而喻[27-28];另一方面,公共部門領(lǐng)導(dǎo)可以實現(xiàn)證據(jù)的“落地”。學(xué)者研究的問題出發(fā)點并不一定總是和實踐需求一致,學(xué)界生產(chǎn)的證據(jù)并不總能夠用于決策治理實踐之中,即使存在充分的研究,科學(xué)研究的結(jié)果也不一定總能夠達(dá)成共識。因此,有時政府也會根據(jù)實踐需要使用自行研究或者資助研究項目等方式引導(dǎo)證據(jù)的生產(chǎn)。如2009年美國大選之后,奧巴馬政府在全國大范圍推行循證決策,促使國會通過了一系列新的社會服務(wù)項目,其中有六個大項目結(jié)合了循證評估的方法,包含近一千個子項目,共計花費近五十五億美元;成立了“循證決策評議會”并積極推動檢驗政策效應(yīng)因果關(guān)系的數(shù)據(jù)分析研究;英國則在政府內(nèi)部設(shè)置了9個“有效性”(What Works)中心,推進在諸如保健、教育、老齡化、地方經(jīng)濟增長、早期干預(yù)和犯罪減少等領(lǐng)域內(nèi)的干預(yù)措施的有效性證據(jù)和成本效益的系統(tǒng)評價的產(chǎn)生和傳播[6,29]。
(2)公共價值和領(lǐng)導(dǎo)力之間同樣構(gòu)成雙向動態(tài)關(guān)系,即基于公共價值的領(lǐng)導(dǎo)力和公共價值領(lǐng)導(dǎo)。一方面,將公共價值加諸領(lǐng)導(dǎo)力中,強調(diào)公共部門領(lǐng)導(dǎo)活動對“公共性”的價值回歸,將公共價值創(chuàng)造而非管理效率作為公共領(lǐng)導(dǎo)的終極使命,可以提升公共領(lǐng)導(dǎo)應(yīng)對全球公共行政實踐中頻發(fā)的棘手問題的能力;另一方面,領(lǐng)導(dǎo)力同樣是公共價值實現(xiàn)的載體,作為社會建構(gòu)的公共部門領(lǐng)導(dǎo)力在公共價值建構(gòu)中發(fā)揮著不可替代的作用,在公共部門戰(zhàn)略中充分動員公共資源和權(quán)力,降低價值沖突,預(yù)防公共價值失敗,并促進公共價值共識形成[30]。
(3)對公共價值和證據(jù)的平衡也是循證治理中十分重要的一環(huán)。許多學(xué)者都曾經(jīng)論證過,制度背景、文化、價值觀等要素都會影響證據(jù)的產(chǎn)生過程,證據(jù)因此不可能是價值中立的,脫離價值探討“有效性”(What Works)沒有意義[12-13]。公共價值則可以彌補證據(jù)“價值中立”的失敗嘗試,在公共價值的促動下,證據(jù)的議題設(shè)置、生產(chǎn)、評估和使用都需要回應(yīng)“價值”(What Values)的問題。特別是,公共價值的兩個核心內(nèi)涵包含“什么是公民認(rèn)為有價值的”(What values to public)和“什么為公共領(lǐng)域增加了價值”(What add value to public sphere)[31]。從公共價值的視角反思證據(jù)的生產(chǎn)和使用,公共服務(wù)的相關(guān)證據(jù)并非僅僅是狹隘的“顧客”的價值偏好,這已經(jīng)在后新公共管理時期受到了廣泛的詬病,而是作為整體的公民在公共領(lǐng)域中充分討論形成的集體偏好[32]。同時,證據(jù)也會促進公共價值的建構(gòu)和重構(gòu)。一方面,研究證據(jù)會通過各類科普活動和新聞報道滲透到更廣義的社會公共領(lǐng)域之中,影響公民對某一問題的認(rèn)知、偏好和投入注意力,進而推動公共價值的漸進或非漸進演化;另一方面,對價值觀、政治情境、文化等議題的研究也構(gòu)成了循證治理因循的“證據(jù)”。證據(jù)并非僅僅局限在可顯示行為層面,更深層的價值偏好等問題的研究也同樣為公共管理者提供管理啟示。本質(zhì)上,證據(jù)是“科學(xué)的共識”,公共價值是“權(quán)利、義務(wù)和規(guī)范的共識”,對證據(jù)和公共價值的平衡旨在尋求兩個公共領(lǐng)域融合以實現(xiàn)更高層次的共識[33]。
3 循證治理的方法論
循證治理所因循的“證據(jù)”不同于數(shù)據(jù)或者信息,強調(diào)通過科學(xué)研究獲取決策依據(jù)[34]。循證決策中開展科學(xué)研究的方法路徑主要包括系統(tǒng)評價(Systematic Review)和隨機對照試驗(Randomised Controlled Trials,RCT)。這兩種方法都來源于循證醫(yī)學(xué),其中隨機對照試驗尤其適用于某領(lǐng)域的全新決策問題,此時由于缺乏相關(guān)證據(jù)經(jīng)驗,決策者可能傾向資助研究者就某一問題展開試驗研究,以控制政策的不確定性,但研究周期和成本的限制也使具有很強實用目的性的隨機對照試驗無法廣泛推行[35]。同時,受研究倫理和政治規(guī)范的影響,對某些問題也無法開展隨機對照試驗,事實上目前只有少數(shù)社會政策研究領(lǐng)域會使用隨機對照試驗開展研究。系統(tǒng)評價方法則沿用了臨床醫(yī)學(xué)的一個基本假設(shè):即現(xiàn)有研究中含有大量有價值、可轉(zhuǎn)化的經(jīng)驗。系統(tǒng)評價方法就是如何在現(xiàn)有研究中挖掘有效的決策證據(jù)并進行準(zhǔn)確全面的總結(jié)[36]。
從方法論而言,循證醫(yī)學(xué)的研究路徑和當(dāng)前公共管理學(xué)沿用的管理統(tǒng)計學(xué)和計量經(jīng)濟學(xué)路徑都有許多共通之處,但研究的術(shù)語規(guī)范和操作規(guī)范又相去甚遠(yuǎn)。如元分析或者薈萃分析(Meta-analysis,在循證醫(yī)學(xué)的一些術(shù)語規(guī)范中常被直接稱為“Meta分析”)本質(zhì)上是統(tǒng)計學(xué)中一種效應(yīng)值合并的方法,循證醫(yī)學(xué)將Meta分析作為定量系統(tǒng)評價的主要數(shù)據(jù)分析方法,管理學(xué)中也常常使用元分析的方法評估多項研究中自變量和因變量的合并效應(yīng)值,但是兩者的文獻(xiàn)納入標(biāo)準(zhǔn)、編碼流程、偏倚分析和結(jié)果的呈現(xiàn)形式都不盡相同。事實上,近年來公共管理主流期刊中都有“系統(tǒng)文獻(xiàn)綜述”(Systematic Literature Review)的提法,與循證醫(yī)學(xué)中的“系統(tǒng)評價”也是類似的概念[21,37]。因此,循證治理的研究絕非“循證醫(yī)學(xué)的方法”加“公共治理的問題”,循證治理的研究亟待從方法論上正本清源,探究循證醫(yī)學(xué)和公共治理方法論深度整合的可能。本文通過呈現(xiàn)循證醫(yī)學(xué)方法論的基本邏輯,探討公共管理研究和循證醫(yī)學(xué)方法論間的“斷橋”,并淺析可能的整合方向。
循證醫(yī)學(xué)的核心方法——系統(tǒng)評價是按照一定的納入標(biāo)準(zhǔn),廣泛收集關(guān)于某一方面問題的所有相關(guān)研究,對納入研究進行嚴(yán)格地偏倚分析和證據(jù)質(zhì)量評估,將各研究結(jié)果進行定量合并分析或定性客觀評價,以對該問題進行系統(tǒng)總結(jié)的一種證據(jù)綜合研究法[38]。無論是定量系統(tǒng)評價還是定性系統(tǒng)評價,都包含9個步驟:選題、文獻(xiàn)檢索、文獻(xiàn)篩選、納入研究偏倚風(fēng)險評價、信息提取、數(shù)據(jù)分析、異質(zhì)性分析、發(fā)表偏倚①、研究報告。
從選題而言,循證醫(yī)學(xué)的選題強調(diào)研究“干預(yù)有效性”的證據(jù),由于在醫(yī)學(xué)領(lǐng)域的循證研究常指向藥物、措施等的有效性,選題一般概念化程度較低,偏向于實踐者可以直接理解的問題,同時強調(diào)選題的重要性、科學(xué)性、創(chuàng)新性和可行性。然而,公共管理領(lǐng)域的許多主流研究選題都是概念化程度較高的術(shù)語或者高維概念,這些選題可能無法為決策實踐部門直接理解。從文獻(xiàn)檢索而言,循證醫(yī)學(xué)的系統(tǒng)評價要求無論學(xué)科、無論來源地獲取當(dāng)前所能獲得的所有相關(guān)信息,一項嚴(yán)格的循證醫(yī)學(xué)系統(tǒng)評價包括幾十個綜合數(shù)據(jù)庫、專題數(shù)據(jù)庫、國家或地區(qū)數(shù)據(jù)庫,也包括會議論文、學(xué)位論文等灰色文獻(xiàn)和紙質(zhì)文獻(xiàn)、在研研究等。而公共管理學(xué)科的二次文獻(xiàn)研究則常常“帶著公共行政的眼罩”,注重文獻(xiàn)檢索的準(zhǔn)確性而非敏感性[39]。從文獻(xiàn)篩選而言,循證醫(yī)學(xué)的研究遵循嚴(yán)格的納入排除標(biāo)準(zhǔn)篩選文獻(xiàn),包括定量的PICOS標(biāo)準(zhǔn)和定性的SPIDER標(biāo)準(zhǔn)。以定量系統(tǒng)評價的PICOS標(biāo)準(zhǔn)為例,該標(biāo)準(zhǔn)包括研究對象或問題(Population/Problem,P)、干預(yù)措施(Intervention,I)、對照措施(Comparison,C)、結(jié)局指標(biāo)(Outcome,O)、研究類型(Study Design,S),這些術(shù)語大多來自醫(yī)學(xué)的隨機干預(yù)實驗,并不常被公共管理研究使用,但在以調(diào)查研究和二手?jǐn)?shù)據(jù)研究為主流的公共管理定量實證研究中也存在相似的概念——被試、自變量、控制變量、因變量等,相應(yīng)的如何制定適用于循證治理研究文獻(xiàn)篩選的納入排除標(biāo)準(zhǔn)也無法簡單類比。從納入研究偏倚風(fēng)險評價而言,循證醫(yī)學(xué)的研究偏倚風(fēng)險評價主要包括方法學(xué)偏倚和報告偏倚,管理學(xué)元分析的研究偏倚風(fēng)險評價則常常只報告可能引起選擇性偏誤的發(fā)表偏倚,兩者的偏倚來源邏輯相當(dāng)不同:前者認(rèn)為具體研究采用的方法與理想狀態(tài)下最佳方法之間存在差距,研究者在進行報告時也會存在模糊或隱瞞;后者則將元分析當(dāng)作一種樣本合并的方法,傾向于評價樣本的選擇性偏誤和由此引起的內(nèi)生性問題。此外,循證醫(yī)學(xué)評估偏倚時強調(diào)使用科學(xué)工具——測量量表以降低評價主觀性,如針對隨機對照試驗的Cochrane ROB量表、針對非隨機試驗的ROBINS-Ⅰ量表以及針對質(zhì)性研究的CASP清單等[40]。從信息提取而言,循證醫(yī)學(xué)使用的信息提取方法類似于公共管理研究中的“結(jié)構(gòu)化編碼”,多采用兩個研究者雙盲編碼的方法保證研究信度,公共管理學(xué)的研究則較少報告該步驟。從數(shù)據(jù)分析而言,循證醫(yī)學(xué)中定量分析的Meta分析的數(shù)據(jù)處理原理和方法與管理學(xué)基本一致,但報告習(xí)慣不同;質(zhì)性分析使用的主題綜合法、Meta-民族志、批判解釋綜合(Critical Interpretive Synthesis,CIS)等方法較少出現(xiàn)在管理學(xué)研究中,公共管理學(xué)的質(zhì)性綜述獲取統(tǒng)和理論大多是基于思辨的、建構(gòu)主義或者解釋主義的方法論開展的。從異質(zhì)性分析而言,循證醫(yī)學(xué)和公共管理學(xué)的異質(zhì)性分析思路基本相同,都是基于“所有樣本都來自于同一個總體”的假設(shè),使用隨機效應(yīng)模型或固定效應(yīng)模型做卡方檢驗,判斷不同研究間的異質(zhì)性是否可以接受。從研究報告而言,循證醫(yī)學(xué)研究通常會在選題完成后在一些循證醫(yī)學(xué)協(xié)會上注冊并提交題目注冊表和研究方案,防止重復(fù)研究和減少偏倚;完成研究后進行報告時傾向于遵循發(fā)表平臺的特殊規(guī)范和綱要(如符合Cochrane協(xié)作網(wǎng)規(guī)范的系統(tǒng)研究被稱為“Cochrane系統(tǒng)評價”)。公共管理學(xué)的系統(tǒng)文獻(xiàn)綜述則隨意性更強,元分析的研究還常常需要從現(xiàn)存理論出發(fā)提出研究假設(shè)并對結(jié)果進行假設(shè)檢驗。報告規(guī)范的區(qū)別一定程度上映射了實證主義和后實證主義的方法論差異。
在循證治理的新理論模式下,方法論的發(fā)展是開展循證研究的主要制約因素。綜上可知,循證治理的方法論不是全盤照搬循證醫(yī)學(xué)的方法論,更不是維持公共管理學(xué)現(xiàn)行的文獻(xiàn)研究方法論并冠以“循證”之名,而是從兩種方法論的哲學(xué)基礎(chǔ)和統(tǒng)計學(xué)基礎(chǔ)出發(fā),在循證治理理論下彌合術(shù)語和規(guī)范差異,需要大量系統(tǒng)評價研究和方法論研究推動的演化融合過程。
4 公共管理領(lǐng)域系統(tǒng)評價研究實例
2000年2月在賓夕法尼亞大學(xué)成立的Campbell協(xié)作網(wǎng)是將循證醫(yī)學(xué)方法論向社會治理和公共政策領(lǐng)域擴散整合的有益嘗試。Campbell 協(xié)作網(wǎng)是一個針對社會項目、社會政策和社會實踐有效性的研究證據(jù),旨在編制和傳播高質(zhì)量系統(tǒng)評價的國際支持網(wǎng)絡(luò)[41]。Campbell協(xié)作網(wǎng)數(shù)據(jù)庫中發(fā)表的系統(tǒng)評價研究涵蓋司法犯罪、殘疾、教育、國際發(fā)展、知識轉(zhuǎn)化和實施、營養(yǎng)、方法和社會福利等8個與公共政策和公共治理相關(guān)的領(lǐng)域,為循證治理方法論的發(fā)展奠定了基礎(chǔ)。本文將展示Campbell數(shù)據(jù)庫中發(fā)表的一項針對公共管理領(lǐng)域研究問題的系統(tǒng)評價,為研究者和實踐者提供系統(tǒng)評價研究方法論借鑒的同時,啟發(fā)更多對方法論異同的反思。
該實例是Kluve等人2017年發(fā)表于Campbell數(shù)據(jù)庫的一項對青年勞動力市場干預(yù)政策的系統(tǒng)評價研究[42]。該研究一定程度將規(guī)范的、標(biāo)準(zhǔn)化的系統(tǒng)評價流程和公共管理研究實際進行了有機融合,也映射了循證治理方法論有待改進的方面。
4.1 研究背景
青年代表著包容性增長和發(fā)展的巨大潛力。青年如果有機會進行適當(dāng)?shù)募寄芘囵B(yǎng)并獲得就業(yè),一方面可以幫助各國加快“2030年可持續(xù)發(fā)展議程”的進展,另一方面也有利于他們自身從事對自己、家庭和整個社會有意義的工作。不幸的是,并不是所有的青年男女都能擁有體面的工作。今天的勞動力市場對年輕人來說是一個充滿挑戰(zhàn)的舞臺,全世界有超過七千三百萬的年輕人失業(yè),青年失業(yè)率遠(yuǎn)高于成年人的平均失業(yè)率,有些甚至超過三倍,越來越多的青年正面臨著就業(yè)困難的形勢。青年在勞動力市場上的悲觀現(xiàn)狀意味著青年潛力的大量浪費,同時也是對社會凝聚力的巨大威脅。故而,探究什么措施可以幫助青年就業(yè)并且有助于改善青年勞動力市場結(jié)果,這對所有國家和地區(qū)來說都至關(guān)重要,同時也是當(dāng)前政策制定者提出的最常見和最迫切的問題之一。
各國政策決策者正在尋求應(yīng)對青年就業(yè)挑戰(zhàn)的路徑,力求找到最有效的方法和實踐指南,以改善青年人的勞動力市場狀況。如創(chuàng)業(yè)促進、技能培訓(xùn)、就業(yè)服務(wù)、補貼就業(yè)等被認(rèn)為是改善青年勞動力市場結(jié)果的共同措施,這些措施屬于“積極的勞動力市場計劃”(Active labor Market Programs),旨在增加青年尋找有收益的就業(yè)機會或提高其收入能力。2012年,在國際勞工大會期間,各國政府和社會組織認(rèn)識到需要對“積極的勞動力市場計劃”的有效性進行更嚴(yán)格的評估,要求國際勞工組織加強有關(guān)“積極的勞動力市場計劃”的證據(jù)基礎(chǔ)。為了促進支持青年就業(yè)更多、更好的方案和政策證據(jù)的產(chǎn)生,該系統(tǒng)評價調(diào)查了“積極的勞動力市場計劃”對青年勞動力市場結(jié)果的影響。
4.2 研究目的
探討“積極的勞動力市場計劃”對青年勞動力市場結(jié)果的影響。著重調(diào)查創(chuàng)業(yè)促進、技能培訓(xùn)、就業(yè)服務(wù)和補貼就業(yè)四項措施對青年就業(yè)、青年收入、企業(yè)績效的影響。通過研究分析,該系統(tǒng)評價主要回答了以下兩個問題:
(1)“積極的勞動力市場計劃”對青年勞動力市場結(jié)果的影響是什么?創(chuàng)業(yè)促進、技能培訓(xùn)、就業(yè)服務(wù)和補貼就業(yè)等干預(yù)措施的影響結(jié)果如何?
(2)這些干預(yù)措施中哪一項最為有效?
4.3 檢索方法
干預(yù)措施以“retraining/training/skill/skills/entre-
preneur*/program*/intervention/measur*/scheme/project/
activation/subsidy/subsidies/subsidized/subsidized/upgr-
ade/assistance/internship/intern/interns/business/couns-
eling/counselling/mentor*/advisory/coaching/placement/insertion”為檢索詞,結(jié)果指標(biāo)以“Unemployment/unemployed/employed/employment/participation/labor/labour/earning*/job*/wage*/income*/salar*/profit/reven-
ue/work”為檢索詞,研究對象以“youth*/young/adolesc-
ent*/schoolleaver*/school leaver*/high school gradua-
te*”為檢索詞,影響指標(biāo)以“evaluación/évaluation/evaluat*/assess*/analy*/estimat*Impact/effect/evaluat-
ion/random”為檢索詞,系統(tǒng)檢索了包括ASSIA、RePEc、SSRN、SSCI、AHCI、RIDIE、RIEPS、J-PAL、ELDIS等70多個數(shù)據(jù)庫和網(wǎng)站在內(nèi)的所有相關(guān)文獻(xiàn),檢索過程于2015年1月完成。
4.4 納入標(biāo)準(zhǔn)
此處采用“PICOS”原則建立納入排除標(biāo)準(zhǔn)。P(Population/Problem):研究對象為“積極的勞動力市場計劃”對象:15-35歲年輕男女;I(Intervention/Exposure):干預(yù)措施包括下列“積極的勞動力市場計劃”:創(chuàng)業(yè)促進、技能培訓(xùn)、就業(yè)服務(wù)和補貼就業(yè);C(Comparison/Control):對照措施為沒有受到任何干預(yù)措施影響的空白組;O(Outcome):符合條件的研究至少測量了下列主要結(jié)局指標(biāo)的其中一個——青年就業(yè)、青年收入和企業(yè)績效;S(study design):研究類型主要為實驗研究和準(zhǔn)實驗研究,也包括隨機對照實驗(RCT)。
4.5 納入文獻(xiàn)質(zhì)量評價
該系統(tǒng)評價采用Duvendack等人所設(shè)計的評估框架,對納入文獻(xiàn)進行質(zhì)量評價[43]。納入的113篇文獻(xiàn)覆蓋了31個國家的107項干預(yù)措施,其中包括15項創(chuàng)業(yè)促進措施、55項技能培訓(xùn)措施、10項就業(yè)服務(wù)措施和21項補貼性就業(yè)措施,還有6項措施干預(yù)類別不明確。分析表明,納入的文獻(xiàn)大多采用科學(xué)的研究設(shè)計,其中,有48%的文獻(xiàn)提供了高質(zhì)量的證據(jù),42%的文獻(xiàn)提供了中高等質(zhì)量證據(jù),只有10%的文獻(xiàn)所提供的證據(jù)質(zhì)量不高。
4.6 數(shù)據(jù)收集與分析
評價小組使用編碼手冊和編碼工具提取納入文獻(xiàn)的相關(guān)信息,當(dāng)?shù)谝粋€評價員將滿足標(biāo)準(zhǔn)的文獻(xiàn)納入后,他們的選擇將由第二位評價員進行驗證。如果依舊存在爭議,兩位評價員將與第三者進一步討論論證,最終決定文獻(xiàn)是否納入。該系統(tǒng)評價運用Stata統(tǒng)計軟件對數(shù)據(jù)進行分析,包括描述性統(tǒng)計分析、單變量隨機效應(yīng)薈萃分析、調(diào)節(jié)分析、敏感性分析和發(fā)表偏倚分析等。
4.7 Meta分析結(jié)果
(1)總的來講,青年就業(yè)干預(yù)措施對青年就業(yè)有正向影響且具有統(tǒng)計學(xué)意義,在105項干預(yù)措施中總效應(yīng)值為0.04SMD(95%CI= 0.03,0.06),表明受干預(yù)措施影響的青年就業(yè)效果比未受到影響的控制組更好。進一步的干預(yù)類別的亞組分析表明,創(chuàng)業(yè)促進、技能培訓(xùn)改善了就業(yè)結(jié)果,而就業(yè)服務(wù)和補貼就業(yè)對青年就業(yè)的影響很小且無統(tǒng)計學(xué)意義。
(2)總的來講,青年就業(yè)干預(yù)措施對青年收入有正向影響且具有統(tǒng)計學(xué)意義,在92項干預(yù)措施中總效應(yīng)值為0.05 SMD(95%CI=0.03,0.06)。進一步的干預(yù)類別的亞組分析表明,創(chuàng)業(yè)促進和技能培訓(xùn)有利于提高青年的收入,而就業(yè)服務(wù)和補貼就業(yè)對青年收入的影響極小且無統(tǒng)計學(xué)意義。
(3)青年就業(yè)干預(yù)措施對企業(yè)績效影響的證據(jù)有限,在14項干預(yù)措施中總效應(yīng)值無統(tǒng)計學(xué)意(SMD=0.03;95%CI=-0.05,0.12;I2= 49%)①。當(dāng)單獨考慮創(chuàng)業(yè)促進干預(yù)措施時,其對企業(yè)績效的影響更大且顯著。
(4)結(jié)果表明,青年就業(yè)干預(yù)措施對中低收入國家的影響程度大于高收入國家。在中低收入國家,創(chuàng)業(yè)促進、技能培訓(xùn)和補貼就業(yè)有效地增加了青年就業(yè)就會,創(chuàng)業(yè)促進和技能培訓(xùn)對青年的收入增長也發(fā)揮了正向作用。在高收入國家,青年就業(yè)干預(yù)措施對青年就業(yè)和收入的影響很小,在干預(yù)類型的亞組分析中,結(jié)果表明只有技能培訓(xùn)對青年就業(yè)產(chǎn)生了很小的影響。
(5)在性別差異上,研究結(jié)果表明受干預(yù)措施影響的女性就業(yè)和收入情況略優(yōu)于男性。
4.8 研究結(jié)論
該系統(tǒng)評價確認(rèn)了“積極的勞動力市場計劃”能夠改善參與青年的就業(yè)和收入狀況,但效果較小。其中,創(chuàng)業(yè)促進和技能培訓(xùn)對青年就業(yè)和收入有顯著影響,就業(yè)服務(wù)和補貼就業(yè)并沒有顯著影響。從而為各國政策決策者改善青年勞動力市場結(jié)果提供了有效的、科學(xué)的、系統(tǒng)的、高質(zhì)量的證據(jù),進一步確定了各組織支持青年在勞動力市場上取得成功的關(guān)鍵因素。同時,強調(diào)了未來的研究有必要對相關(guān)措施進行更詳細(xì)、更全面、更規(guī)范的分析。
4.9 方法論啟示
該實例研究了勞動政策領(lǐng)域的重要問題——如何有效促進青年就業(yè)。作者遵循嚴(yán)格的系統(tǒng)評價步驟開展研究,同時一定程度上也兼顧了公共管理問題的特殊性:如在制定納入排除標(biāo)準(zhǔn)時,將青年就業(yè)、青年收入、企業(yè)績效等兼顧個體效應(yīng)和組織效應(yīng)的指標(biāo)設(shè)置為結(jié)果指標(biāo),將非隨機實驗和準(zhǔn)實驗研究作為主要納入研究類型,而非循證醫(yī)學(xué)研究常常選擇的隨機干預(yù)試驗。同時,這項研究也是在假定就業(yè)干預(yù)措施與就業(yè)、收入、企業(yè)績效存在關(guān)聯(lián)的基礎(chǔ)上開展的,將理論和系統(tǒng)評價進行了有效整合。但該實例并未討論系統(tǒng)評價價值取向的問題,此外,由于公共管理研究中實驗研究比例較低,一些設(shè)置(如PICOS標(biāo)準(zhǔn)中的控制要素)也并不利于系統(tǒng)評價研究的操作。
5 循證治理的未來研究問題
循證治理框架提供了一種平衡研究證據(jù)、實踐者領(lǐng)導(dǎo)力和公共價值的治理框架,突破了循證決策的工具理性局限,重新詮釋了證據(jù)在公共行政理論和實踐中的意義與價值。本文也闡釋了為何循證治理研究無法照搬循證醫(yī)學(xué)的方法論,并通過研究實例展示了公共管理領(lǐng)域循證研究的流程規(guī)范,以期啟發(fā)更多更深入的方法論反思。作為一項探索性研究,本文不可避免地具有一定局限性,循證治理的理論框架和方法發(fā)展需要大量的未來研究建構(gòu)完善。本文嘗試提出一些未來可能的研究問題,以拋磚引玉:
(1)循證治理的中層理論構(gòu)建問題。作為一個宏觀理論,循證治理的落地需要一系列中層理論以剖析更深層的機理,如循證治理中的價值沖突、社會網(wǎng)絡(luò)與循證治理的關(guān)系、證據(jù)使用和領(lǐng)導(dǎo)力類型的匹配等問題。
(2)循證治理研究的知識轉(zhuǎn)化問題?!把C”思潮對公共治理最大的啟示是彌合實踐和研究的斷橋,如何將循證治理研究成果轉(zhuǎn)化為可以被實踐部門理解的知識是這一背景下的核心問題。為此,需要系統(tǒng)研究知識轉(zhuǎn)化中的制度設(shè)計、動力機制、研究機構(gòu)和實踐部門關(guān)系等問題。
(3)循證治理研究的方法論問題。如前文所述,循證治理的方法論尚需大量研究完善,尤其是在系統(tǒng)評價研究中,如何將價值取向嵌入評價過程之中,如何構(gòu)建基于公共管理研究實踐的納入排除標(biāo)準(zhǔn)、質(zhì)量評價量表,更復(fù)雜的前沿數(shù)據(jù)合并方法如網(wǎng)狀Meta分析、系統(tǒng)評價再評價等如何遷移使用,都有待進一步研究。
(4)本土情境下的循證治理研究問題。我國政府文件中雖然很少有“證據(jù)”或者“循證”的提法,但智庫建設(shè)和決策科學(xué)性也是當(dāng)前我國行政實踐中的重要問題。在我國本土化情境下,可以通過案例研究、政策文本分析研究循證治理的思想發(fā)展,或是通過規(guī)范研究建構(gòu)具有本土解釋力的應(yīng)然理論。
(5)大數(shù)據(jù)與計算社會科學(xué)背景下的循證治理。隨著大數(shù)據(jù)和計算社會科學(xué)的興起,循證治理的研究實踐也面臨新的機遇,未來研究中可以探索運用機器學(xué)習(xí)模型探索系統(tǒng)評價的簡化步驟和自動化編碼,也可以探索循證治理實踐與智慧政府建設(shè)的有機結(jié)合。
參考文獻(xiàn):
[1] Overeem P,Twholen B. After Managerialism:Macintyres Lessons for the Study of Public Administration[J].Administration & Society,2011,43(7):722-748.
[2] Weiss C,Petrosino M,Gandhi A.The Fairy Godmother—and Her Warts Making the Dream of Evidence-Based Policy Come True[J].American Journal of Evaluation,2008,29(1):29-47.
[3] 馬小亮,樊春良.基于證據(jù)的政策:思想起源、發(fā)展和啟示[J].科學(xué)學(xué)研究,2015,33(3):353-362.
[4] 周志忍,李樂.循證決策:國際實踐、理論淵源與學(xué)術(shù)定位[J].中國行政管理,2013(12):23-27,43.
[5] Rudd K.Address to Heads of Agencies and Members of the Senior Executive Service[N].Great Hall,Parliament House,Canberra,2008-04-30.
[6] Ron H,Margolis G.Show Me the Evidence:Obama's Fight for Rigor and Results in Social Policy[M].Brookings Institution Press,2014.
[7] Tian Z,Shi J,Hafsi T,et al.How to Get Evidence?The Role of Government business Interaction in Evidence-based Policy-making for the Development of Internet of Things Industry in China[J].Policy Studies,2017,38(1):1-20.
[8] 道格拉斯·摩根.衡量政府績效的信任范式和效率范式——對地方政府領(lǐng)導(dǎo)和決策的啟示[J].公共管理學(xué)報,2013(2):117-125,143.
[9] Bao G,Wang X,Larsen G,et al.Beyond New Public Governance:A Value-Based Global Framework for Performance Management,Governance and Leadership[J].Administration and Society,2013,45(4):443-467.
[10] Sarewitz D.Frontiers of illusion:Science,Technology and the Politics of Progress[M].Philadelphia,PA:Temple Univ Press,1996.
[11] Head B W.Three Lenses of Evidence-based Policy[J].The Australian Journal of Public Administration,2008,67(1):1-11.
[12] Dobrow Mark J,Vivek Goel,Ross E.Evidence-based Health Policy:Context and Utilization[J].Social Science & Medicine,2004,58(1):207-217.
[13] Goldenberg Maya J.On Evidence and Evidence-based Medicine:Lessons from the Philosophy of Science[J].Social Science & Medicine,2011,65(12):2621-2632.
[14] Parkhurst J.The Politics of Evidence:From Evidence-Based Policy to the Good Governance of Evidence[M].New York:Routledge press,2016.
[15] Guston David.Principal-agent Theory and the Structure of Science Policy,Revisited:‘Science in Policy and the US Report on Carcinogens[J].Science & Public Policy,1996,30(5):347-357.
[16] Vifell ?魡sa C,Ebba Sj?觟gren.More Knowledge,Better Government?Consequences of knowledge-based Decision Making in Swedish Pharmaceutical Benefits[J].Governance,2011,24(1):85-110.
[17] Jasanoff Sheila.The fifth branch:Science Advisers and Policymakers[M].Cambridge,MA:Harvard Univ.Press,1990.
[18] Mele V,Compagni A,Cavazza M.Governing through Evidence:A Study of Technological Innovation in Health Care[J].Journal of Public Administration Research & Theory,2014,24(4):843-877.
[19] Osborne S P.From Public Service-dominant Logic to Public Service Logic:Are Public Service Organizations Capable of Co-production and Value Co-creation?[J].Public Management Review,2018,20(3):1-7.
[20] 包國憲,王學(xué)軍.以公共價值為基礎(chǔ)的政府績效治理——源起、架構(gòu)與研究問題[J].公共管理學(xué)報,2012,9(2):89-97.