• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      計算機建模協(xié)助公共政策的制定、執(zhí)行與評估

      2019-12-11 14:38:22
      江西社會科學 2019年1期
      關鍵詞:相關者建模政策

      賈 晗/譯

      越來越多的計算機模型被協(xié)助用于公共政策的制定、執(zhí)行與評估。研究表明,計算機模型之所以能夠在政策制定過程中發(fā)揮重要作用,是因為它允許政策制定者在虛擬世界中先行先試,這與隨機對照試驗(RCT)和政策試點相比無疑具有更大優(yōu)勢。在政策建模實踐中提煉出的一般性經驗包括:設計和使用模型的最大好處在于它提供了對政策的解讀而不僅僅在于它所生成的數字;模型是在一定的抽象條件下設計的;盡管有時會缺乏用于校驗的相關數據,但建模仍然是有價值的;建模的協(xié)作性要求使得模型被用于滿足建模涉及的利益相關者目的的可能性增大;需要注意建模者與利益相關者之間的有效溝通;需要仔細考量公共政策建模涉及的道德問題。作為公共政策制定過程的一個組成部分,政策建模的重要性日益凸顯,但如想將其潛能充分釋放,則需要將計算機建模與政策制定的內在文化相融合。

      一、導 論

      近30年來,計算機模型一直被用于協(xié)助公共政策的制定、執(zhí)行以及評估,但它的潛能仍有待充分發(fā)掘。[1][2][3]本文選取了在公共政策制定過程中應用計算機模型的部分樣本:(1)考察了政策制定過程中計算機模型所起的作用;(2)探討了作為試驗類型之一的政策制定與模型試驗之間的關系;(3)指出影響模型發(fā)揮效用的關鍵因素。此外,本文還強調了模型本身及其在未來應用中將會遇到的挑戰(zhàn)和機遇。

      筆者有理由相信計算機模型將會被越來越廣泛地應用于政府、商業(yè)、社會以及學界中[4],現有許多針對不同領域應用計算機模型的指南,如英國政府的“報告編制指南”[5],但是這些指南通常面向從業(yè)者及公眾,已經被高度程式化或經技術化處理,即通常將失敗的部分進行了刪略并很少就如何在公共政策領域更好地應用模型進行更深層次的反思。在這里,筆者旨在填補這些正式指南所遺留下的空白,選取一系列示例,利用可視化的方式探索問題,承認失敗并從中汲取經驗教訓,以期引起建模者的反思。雖然“公共政策計算機模型”是一個完整且準確的術語,也有很多人使用“計算機政策模型”這個提法,但簡便起見,筆者將在下文中使用“政策模型”指代。

      基于經驗,筆者給出的主要建議即在政策建模時必須要對模型所要應用的背景環(huán)境有充分的認知,并且要充分考慮到模型是否契合設計的初衷以及能否從中得出某種結論。此外,如果不與模型輸出用戶(即決策者)進行強有力且反復多次的博弈,那政策建模幾乎就價值不大或沒有價值了。建模者必須以一種深入的、有意義的、合乎道德的且反復多次的方式與用戶進行博弈。

      二、建模在政策制定中的作用

      政策制定的標準呈現周期性變化,盡管此觀點并不完全可信,例如Lindblom在1959年和1979年作出的重要論述。[6]政策問題可能與危機產生、媒體宣傳活動或對政治事件的回應相伴生并暴露出來。這是議程設置階段,接下來便是政策形成、募集支持、政策執(zhí)行、政策監(jiān)控以及評估政策是否有效,最后是政策的維持或終止。隨后再次因新的訴求或環(huán)境變化而導致對新政策的需求,周而復始。雖然政策生命周期具有將政策發(fā)展進行清晰且直接的概念化的優(yōu)點,但其仍因不切實際或將情況過度簡單化而受到詬病。有學者認為政策發(fā)展應該是高度復雜的,并取決于多種壓力及信源[7][8],甚至是自組織化的[9][10]。

      然而,政策生命周期這一概念仍然有助于明確政策設計與執(zhí)行的諸多組成部分。政策模型至少在兩個領域內發(fā)揮著明確且重要的作用:即在政策的設計評價與政策評估兩方面。政策評價[11],有時也稱其為事前評估,包括評估實現政策目標的政策備選方案的相對優(yōu)點,評估結果將作為決定政策設計的關鍵。政策評估要么采用總結性方法,檢查政策是否確實達到其預期目標(即事后評估),或采用程式化方法考察政策于何處、為了誰以及如何發(fā)揮作用。[12]在此種程式化視角下的關鍵目標是學會如何把握政策的未來迭代以及其他類似特征。

      (一)建模支持政策設計與評價

      運用政策模型進行事前評估可用于探索政策備選方案,以幫助人們明確并詳細了解政策設計的具體細節(jié)。[11]例如,最大的好處就是可通過干預或多重政策機制之間可能的協(xié)同或沖突作用對政策加以明確。政策模型還可用于評價其他政策備選方案,以確定在這些政策備選方案中哪一項能夠產生最佳或最穩(wěn)健的結果。在這種模式下,政策模型的本質其實是通過改變模型中的相關參數或規(guī)則再觀察其結果加以驗證干預系統(tǒng)的其他備選政策及假設。這是很有價值的,因為它節(jié)省了在現實政策領域中進行試驗或試點的時間與成本。

      我們通常的假設是人們建造計算機模型是為了預測。然而從某種意義上來說,預測某項措施在政策領域未來的價值通常是不現實的。社會與經濟現象錯綜復雜(就技術層面而言,詳見Sawyer[13]),這就意味著事物的發(fā)展具有隨機性,這是受既往歷史(即路徑依賴)及正負反饋循環(huán)影響的綜合結果。就像天氣難以預測一樣,不論模型有多精細,社會的未來發(fā)展在許多細節(jié)上仍然是不可知或不可預知的。其次,模型是對現實必要的抽象,由于它不可能與社會現實相脫離或不受其影響,因此可能會有在建模之中未考慮到但卻影響結果的意料之外的因素存在。

      基于以上原因,“點預測”即預測未來某一特定時間節(jié)點的具體數值幾乎是不可能的,更大概率做到的是預測某個事件是否會發(fā)生,或者是針對數值變化的類型或方向作定性描述。同時,了解可能產生的預測外結果的類型以及產生這些結果的本質也有助于政策設計,這樣當預測之外的結果出現時就可以對其作出有效回應,這一點特別適用于在環(huán)境不確定的條件下使用模型,探索一系列在可能的、差異的、潛在的未來環(huán)境下可能發(fā)生的事件,而不需要對這些事件最終是否發(fā)生作出任何承諾。更有價值的發(fā)現是模型表明在假設條件下某些結果是無法實現的,一個例證即使用一整套系統(tǒng)能源模型來設計達成歐盟設定的2050年碳減排目標方案。[14]

      與使用模型進行預測或生成場景不同,人們還可以使用模型對某些領域的工作過程進一步程式化和明確化。如果認真對待此事,那么模型作為一種培訓或交流工具將會很有價值,因為它展示了政策領域中的工作機制以及它們如何相互作用。

      (二)建模支持政策評估

      要想對政策進行事后評估,就需要對比政策執(zhí)行前后情況(“反事實”)。要想做到這一點,就需要在現實情況下得到的數據(通過政策評估)及政策未執(zhí)行(所謂的“一切照?!?情況下得到的數據。欲得到后者,可以使用隨機對照試驗(RCT)或準實驗[12],但這通常既困難又昂貴,有時甚至會因為設置對照組的受限而使數據獲取幾無可能。

      政策模型提供了一系列可能性。其一即開發(fā)出了一種可以模擬政策有無執(zhí)行的計算機模型,并使用定量研究方法將兩種模型條件下得到的數據結果作比較分析并與真實情況(政策執(zhí)行后)作對比。這樣就避免了需建立一個與現實情況完全相反的真實場景的問題。此外,政策模型可以用來代替實驗。

      另一種可能性即使用定性的系統(tǒng)映射方法研究(如模糊認知圖[15]),以構建具有不同結構與假設的定性模型(以展示有無干預下的情況),并再次考察模型分析得出的不同結果。

      最后,事后評估的另一用途即使用模型來完善和測試政策如何對關注的結果產生影響這一理論,即支持使用常見的基于理論研究方法,如變革理論[16]和邏輯映射[17]。

      對模型和模型結果的考量是可以量化的(即通過多樣性模擬、敏感性分析及假設檢驗),但也可以與利益相關者以定性和參與式的方式進行,由利益相關者參與實際分析(而不僅僅向其展示結果),選擇由建模目的與利益相關者訴求共同驅動做出。在事前和事后評估中,政策模型可視為一種強大的工具,即作為一種可用來吸引和告知利益相關者及公眾有關政策及其影響的途徑。[18]這可以通過在模型設計的過程、決策以及驗證中吸納利益相關者得以實現;或者也可在這一過程的后期,通過與利益相關者就模型結果進行討論,和/或使用“現場”模型去探索假設、場景與結果之間的關聯(lián)。[19]

      (三)使用模型的困難

      盡管原則上政策模型具有確定作用和潛在優(yōu)勢,但實踐表明要想實現這些預期結果很困難。[20][21]政策過程本身具有的某些特性決定了其要與建模共同發(fā)揮最大效用尚存在一定困難。

      1.對接受度及透明度的要求:決策者可能會依賴更傳統(tǒng)、更容易被廣泛接受的證據形式,特別是在相關決策風險很高的情況下。模型看起來可能更像是只有專家才能理解或駕馭的黑箱,它的結果高度依賴于假設,而假設通常又很難加以驗證。此外,由于政府的分析和研究人員通常沒有多少自主權,這就導致雖然他們也可能看到了政策模型的價值所在,但也很難將這一信息有效傳遞給決策者。

      2.變化及不確定性:政策執(zhí)行的環(huán)境存在著高度的不確定性,當信任、決策或其他因素發(fā)生改變時,會破壞模型最終的開發(fā)。

      3.時間短:幾乎每次允許作出決策的時間都很短,而且需求也難以預測。這就意味著給建模人員提供及時的支持很困難。

      4.采購流程:一些部門通常缺乏能力與足夠靈活的流程來采購復雜的模型。

      5.決策的政治性與實用性現實:個人價值觀與政治價值觀擁有巨大的影響力。即使是在面對與他們觀點相抵觸的經驗性證據(建模就更不用說)或面對政治上幾乎不可能的政策時也如此。

      6.利益相關者:在政策制定過程中會有各色利益相關者參與其中或施加影響。我們不可能將所有這些因素都納入政策建模過程的考慮范圍之內,而且決策者也可能對這些因素太過緊密地參與其中持審慎態(tài)度。

      以上特征對于實證研究或其他類型的研究分析可能也適用,我們并不是說這些特征本身是負面的;它們反而可能是政策制定過程中重要且合理的部分。作為建模者需要謹記的是,模型僅能且僅應為政策過程提供盡可能多的信息,而不應越俎代庖,成為決定政策是否應該執(zhí)行的最終決策。

      三、政策試驗和政策模型

      盡管人們對政策模型的角色及用途已有了一定程度的了解,但依筆者之見仍應在更多的領域應用建模。從目前來看,由于尚缺乏對政策模型的熟悉與信心,它的應用被限制了。潛在用戶可能會質疑在其領域中應用政策建模是否具備足夠的科學性與成熟的條件,以及是否真的可以安全有效地用于指導現實世界的政策。

      (一)政策試點

      一種觀點認為政策的實際執(zhí)行本身就是一種試驗干預,因此其具有與政策模型干預相同的特性。Boeschen等人[22]的觀點認為我們本身就生活在“社會試驗”中,執(zhí)行政策不過就是在進行“現實世界的試驗”?,F實世界試驗“或多或少是合法的、系統(tǒng)指導的或隨意地利用社會實踐來開始一些新的東西”[23](P344)。它們的結果立即反映出“設計過程的成敗”[23](P347)。

      進行現實世界試驗是解決政策設計難題的方式之一。它雖不能檢查其他可選解決方案或備選方案,但可喜之處是能夠進行實時監(jiān)控并給予響應。將政策執(zhí)行作為一項現實世界試驗是遠遠不夠理想的,并且也摒棄了實驗室可逆性的原則。在實驗室進行實驗,因其實驗系統(tǒng)與環(huán)境相隔離,所以可觀察到單個參數的影響。

      政策試點可以在現實世界與實驗室實驗的鴻溝之間架起一座橋梁。將政策試點[24][25][26]作為一種社會試驗是非常普遍的。在政策試點中,可以在反事實的有限條件下評估政策的變化,之后再進行一般意義上的政策推廣。通過這種方式(小范圍的)可以嘗試或評估不同的解決方案,并將獲得的經驗再反饋到政策設計過程中去。

      政策試點的最主要方式即隨機對照試驗(RCT)[24][27],因其在醫(yī)學研究領域的應用而廣為人知,通過對仔細挑選的處置組與在監(jiān)控下未進行處置的對照組進行比對而得出結論,因此,隨機對照試驗可以在理想的實驗室實驗與現實世界試驗之間實現一種折中。然而,關于隨機對照試驗是否能夠重現經嚴格測試的、反事實的實驗室條件尚存在爭議。[25](P19)爭議的焦點在于原則上其他各條件均一致的社會試驗是不可能的(即在社會系統(tǒng)中,不可能存在兩個其他條件都一致而只有一個可控參數不同的試驗);復雜的環(huán)境系統(tǒng)干預對于充分理解社會系統(tǒng)是必不可少的,但若要在隨機對照試驗中去重現卻是不可能的;同時,這種隨機分配在許多領域也都是不可能實現的,以至于無法建立一個“中立的”反事實;此外,如果給予了某些試點一些確定的利益,而對照組卻未享受到同等待遇,這可能就會是一種冒險的政治戰(zhàn)略甚至是不道德的。特別是如果該政策將試驗對象置于不利境地,那情況就更糟糕了。[25](P17)

      盡管試點可較好地用于收集單個案例證據,但它或許并不能成為適用于所有其他情況下案例的放之四海而皆準的模式。此外,它不能對政策為何/如何起作用/不起作用作出更詳細的說明,或將“什么起作用”這一問題分解為“在何處、為了誰、以什么代價、在什么條件下”起作用。與此同時,還有很多實際問題需要考慮,比如時間、人力資本和預算等。人們通常認為,一個好的政策試點成本高、耗時長、“繁文縟節(jié)”并需要訓練有素的管理人員。[25](P5)“人們對當前及過去曾進行的政策試點及評估方式感到悲觀和失望(設計不良的研究;不堪一擊的方法論;缺乏耐心的政治領導;時限壓力和不切實際的最后期限)?!保?8](P11)

      因此,政策試點不能滿足具有參數變化要求的實驗室實驗和Krohn提出的包含復雜環(huán)境系統(tǒng)實時干預的現實世界試驗之間的折中要求。這正是計算機政策建模的切入點。

      (二)關于政策試驗的政策模型

      與政策試點不同,計算機政策模型能夠處理在其他條件均不變的情況(ceteris paribus)。通過使用政策模型,我們只需在模型中嘗試著變化參數就可以探索其他替代性解決方案,并使用特定于上下文信息的模型以及短期、中期和長期視閾進行試驗。此外,政策模型的建立和運行都是符合道德并政治中立的,盡管在其結果的實際使用中可能并不如此。

      不同于現實世界和政策試點,政策模型允許用戶探視未來。與現實世界試驗一樣,模型試驗能夠通過利益相關者進行遞歸學習。利益相關者可與模型進行交互,學習如何在復雜情況下通過采取行動來獲得系統(tǒng)能力和實踐技能。模型不僅可以模擬所設想的現實世界試驗,而且可以通過廣泛的參數變化來測試多個可能的現實世界試驗場景。但這并不意味著有可能就復雜社會系統(tǒng)的未來狀態(tài)作出精準預測(見上文關于預測的討論)。

      考慮到極端情況下不受任何干預(如實驗室實驗)和充分干預(如現實世界試驗)到復雜環(huán)境系統(tǒng)的持續(xù)性干預,政策模型試驗確實處于折中區(qū)間。筆者認為,如果伴隨政策變化的成本或風險很高,而且環(huán)境復雜,那么進行政策建模就不僅僅是基于共識的,更是出于道德的。

      四、政策模型示例

      筆者將根據自身實際經驗來舉例說明政策模型的使用,這些示例涵蓋了多種模型類型和應用環(huán)境。本著失敗與成功同樣寶貴的實驗精神,我們不僅強調最終結果,還會強調建模過程中遇到的一些實際問題和挑戰(zhàn)。在下一章中,我們將從這些示例中提取一些一般性的經驗教訓。

      (一)TELL-ME模型

      歐洲資助的TELL-ME項目側重于與流感流行相關的健康傳播問題。它可以輸出一個基于代理的模型,這個模型旨在幫助健康傳播工作者了解在不同流感疫情下不同健康傳播方案的潛在影響。

      該模型的基本結構由其目的決定:通過比較不同健康傳播方案對個體保護性行為的潛在影響,從而比較對流感疫情擴散的影響。這需要兩個相關的模型:一個是行為模型,它模擬人們對健康傳播的反應方式,如人們決定是否接種疫苗或采取其他保護性行為;另外一個模型是模擬流感傳播的流行病模型。建模的關鍵點是:(1)消息,健康傳播的載體;(2)個體,每個個體會接收到健康傳播消息并決定是否采取保護性行為;(3)地區(qū),不同地區(qū)面對著不同的流行病狀況。健康傳播對流行病的影響首先是影響個體的態(tài)度和行為,進而影響流行病傳播和發(fā)病率。而流行病的發(fā)病率會影響人們感知到的風險強弱,從而影響個體行為并建立起反饋關系。[29]在Barbrook-Johnson等人的文章[3]中可以找到對模型的更全面的描述和對其用途的討論。Badham等人[29]提出一種基于TELL-ME的模型校準方法。

      基于利益相關者研討會的結果和模型本身的結果,建模團隊認為TELL-ME模型可被應用于以下情況:(1)作為教學工具;(2)檢測理論;(3)通知數據收集。[3]

      (二)HOPES模型

      實踐理論為計劃行為理論和理性行動理論提供了一種替代思路,以探索能源使用、氣候變化、糧食生產、水資源短缺等可持續(xù)性發(fā)展問題。這一理論的中心論點是如果我們的目標是改變高能源消耗和密集排放型的生活方式,那么人們具有一定自動化程度的日常活動(又稱實踐,如烹飪、飲食、旅游等)就應該成為研究和干預的重點。

      能源使用場景中的家庭和實踐(HOPES)是一個基于代理的模型[30],它能構建實踐理論中的關鍵特征,并使用該模型探索家庭能源使用的動態(tài)情況。HOPES模型構建的一個關鍵理論特征即實踐的表現形式,它是適當的意義(心理活動如理解、感知和渴望[31])、材料(物體、身體和心靈)和技能(能力)的結合體。例如,洗衣服這一實踐可以表現為通過使用洗衣機(材料)并且知道如何操作洗衣機(技能)來實現對干凈衣服的渴望(意義);進而,實踐活動的實施導致了能源的消耗。

      HOPES中有兩種代理類型:家庭和實踐。各個元素(意義,材料和技能)是模型中的實體。模型的概念是家庭依據其獨有的社會技術環(huán)境選擇不同的元素來執(zhí)行實踐活動。一些實踐導致能源消耗,而另一些實踐則沒有,例如使用加熱器來保暖會導致能源消耗,而使用跳繩或毯子則不會產生能源消耗。此外,跨空間和時間的重復實踐會使得關鍵元素進化(例如,一些元素比其他元素更常被使用),這隨后也會影響實踐的未來表現,從而影響能源消耗。一個基于從60個英國家庭收集的經驗數據開發(fā)的基于規(guī)則的系統(tǒng)納入了HOPES模型,它能使家庭選擇執(zhí)行實踐的要素?;谝?guī)則的系統(tǒng)能夠以結構化的方式組織從經驗中收集的復雜上下文信息和社會技術見解,以在面對不完整和/或沖突的決策時選擇最合適的行為。HOPES還包括可以計算實踐活動所帶來的能源消耗的子模型,例如一座房屋的溫控模塊可以通過考慮室外溫度、加熱器的類型和尺寸以及室內溫度設定點來估算每個家庭的取暖實踐活動的能源消耗。

      該模型用于測試不同的政策和情景,以探索不同實踐行為對能源消耗的影響??偟膩碚f,這里的建模動機是,通過深入了解不同情景下不可持續(xù)的能源消耗情況,來提出更多的消耗可持續(xù)能源的替代實踐。

      (三)SWAP模型

      SWAP模型[19][32]是一個基于代理的模型,即一個關于農民在其土地上實施水土保持方案的決策模型。該模型在NetLogo(一種基于代理的可編程建模環(huán)境[33])上開發(fā),其中主要的代理是農民,他們決定是否實施水土保持方案,次要的代理是鼓勵農民實施水土保持方案的政府和非政府人員。農民積極性的高低可能會受其周圍人群的影響。

      SWAP模型是:(1)一名“感興趣的業(yè)余愛好者”,即一個可用來提高政策利益相關者之間互動質量的討論工具;(2)對水土保持文獻中農民行為理論的探索。

      埃塞俄比亞的利益相關者探討了該模型作為“感興趣的業(yè)余愛好者”的用途。使用模型作為感興趣的業(yè)余愛好者是受Dennett[34]的啟發(fā)。Dennett認為專家可能會彼此誤會,基于對方的觀點而作出錯誤的假設,和/或擔心自己看起來很愚蠢而不敢提出簡單的問題。這些通常會導致專家犯下欠缺解釋的錯誤,進而導致無法在討論中達成共識或令人滿意的結果。對于哲學家Dennett而言,解決方案是讓本科生——感興趣的業(yè)余愛好者共同參與討論,提出簡單的問題,以逼迫專家進行充分解釋。SWAP模型作為感興趣的業(yè)余愛好者而被應用于埃塞俄比亞的專家、政策制定者和政府官員之間。這樣做是因為旨在提高水土保持利用率的政策由于對農民需求的定位不準確而往往都沒有成功。

      (四)INFSO-SKIN模型

      歐盟委員會預計在2014年至2020年期間花費約770億歐元在其“地平線2020”研發(fā)計劃上。它是此前規(guī)模較小的一個叫作“框架7”的計劃的延續(xù)和拓展。在設計地平線2020計劃時,歐盟委員會希望了解如何改進框架7計劃的相關規(guī)則以適應“地平線2020”,以及如何針對當前的政策目標進行優(yōu)化,例如增加中小型企業(yè)(SME)的參與。

      INFSO-SKIN是基于代理模型,它被用于評估可能的供資政策。該模型的建立是為了重現資助規(guī)則、資助組織及項目,以及由此產生的框架7計劃的網絡結構。這個模型在沒有任何政策變化的情況下推斷到了未來,然后被用作進一步試驗的基準。

      (五)Silent Spread and Exodis-FMD模型

      2001年口蹄疫(FMD)爆發(fā)后,英國環(huán)境、食品和農村事務部實施了為期20天的靜止期,即禁止在牲畜到岸后20天內進行任何轉移。這項為期20天的規(guī)定給當地農民帶來了巨大的難題。2002年7月,就此次疫情所做的經驗教訓調查報告建議,在靜止期制度的詳細成本效益分析(CBA,Cost-benefit analysis)出爐之前,為期20天的靜止期規(guī)定仍然有效。

      英國環(huán)境、食品和農村事務部于2002年9月委托進行成本效益分析,并要求在2003年初得到一份報告,以便在春季牲畜轉移季節(jié)之前知曉轉移方式的變化。由于時間短且可用數據有限,報告中所要求的成本風險效益建模頗具挑戰(zhàn)性。因此,他們提出了一種自上而下的模型,它僅捕獲決策的基本要素,將它們組合在要做出決定的影響圖表中。大量的專家參與了模型開發(fā),幫助調整模型的結構、參數、驗證及結果的解釋。在專家小組的指導下,敏捷開發(fā)也被添加到模型的一系列周期性開發(fā)中。

      由此產生的Silent Spread模型顯示,在確定疫情嚴重程度時,諸如疾病檢測時間等因素比靜止時間重要得多。[35]這一仿真結果對于政府決定將20天靜止期這一規(guī)定放寬而改為6天,起到了至關重要的作用。這種迭代的、參與式的發(fā)展過程為以前一直存在爭議的領域帶來了前所未有的改變。

      在此之后,英國環(huán)境、食品和農村事務部委托做了進一步建模,以便在口蹄疫疫情暴發(fā)時能夠為應急預案提供信息。對于此種應用,我們需要一個詳細的“自下而上”模型,該模型可以重現疾病傳播的相關機制,以及不同疾控策略對疾病傳播的影響。[36]該模型是建立在Exodis疾病建??蚣苌系囊粋€基于代理模型。該框架搭建了一個基于英國農場普查數據的異質地理數據庫,建立起不同口蹄疫疾病的傳播機制,并整合了不同疾控策略的效果和實施這些策略所需的資源。

      在成本效益分析工作之后,英國環(huán)境、食品和農村事務部保留了一個決策支持工具,該工具可作為一個培訓輔助工具,也可以在疫情實際爆發(fā)時為決策提供信息。該模型曾在2007年新一次口蹄疫疫情暴發(fā)期間被使用,并繼續(xù)用于疾控策略變更的仿真測試。

      (六)抽水公司行為模型

      英格蘭河流和含水層的取水量受20世紀60年代建立的許可制度控制。英國政府希望將該體系改革,以達到鼓勵抽水公司有效管理水資源并通過共同努力充分利用水資源的效果。抽水管理是一個典型的“棘手”問題,因為它對改革具有很強的抗拒性。在此之前進行的系統(tǒng)改革嘗試均以失敗而告終,這其中部分原因是未讓利益相關者參與到解決方案的需求表達和方案制定中。

      評估改革系統(tǒng)不同方式的成本、風險及收益是復雜的。它需要考慮到:復雜的自然環(huán)境與抽水公司(包括公共供水系統(tǒng)、電力系統(tǒng)、農民及工業(yè))之間的相互作用;經濟、社會和氣候條件將以我們無法預測的方式發(fā)生變化;并且各個抽水公司將長年累月地受到新措施的復雜影響。

      基于代理的建模非常適合于探索現在及將來改革的進展情況。在跨學科團隊與廣泛的專家和利益相關者的通力合作下,一個基于代理的混合模型被開發(fā)出來,它能夠把經濟行為與流域水文模型在時間序列上進行結合[37],包括所有有權從特定流域的河流和含水層取水的企業(yè)。模型利用河流、含水層的水文模型和土地利用情況對河流流域進行了分辨率為“1km×1km”的詳細建模。每個代理都會作出一系列的策略和運營決策,當對水的需求和可用性隨經濟和氣候條件變化而變化時,決策也在不斷變化。政策選擇使用不同的機制控制河流和含水層中的水位,并允許代理之間進行不同類型的水權交易。監(jiān)管代理人確保環(huán)評達標,他們在必要時可以采取行動進一步限制抽水許可的發(fā)放。

      五、政策建模者的主要經驗教訓

      根據上一章中描述的政策模型示例和筆者已經開展的其他工作中得出的經驗結論,我們列出以下建模人員在政策建模工作中應該注意的一些關鍵經驗教訓。

      (一)過程與結果一樣重要,甚至更重要

      許多政府在決策過程中需要定量數據,例如完成監(jiān)管影響評估模板。一組簡單的成本效益值能夠為支持決策或結論提供明確、有說服力的論據。然而,在復雜的、不斷變化的環(huán)境中,把答案縮小到有限的集合在很多時候既不可能也不可取——因為它們很難實現。當我們在復雜環(huán)境中建模時,充分理解問題和決策與最終得到的數字同樣重要。需要注意的是對最終結果的需求或渴望以及對不熟悉算法的陌生或懷疑不要將我們推向退而求其次的建模方法。

      在抽水改革工作中,盡管模型確實生成了數字,但這項工作的最大收獲是對政策設計的貢獻,這主要得益于模型中探索性的一面,包括:以模型可以表達的方式闡明改革需遵守的規(guī)范;通過多場景運行、敏感性分析和情景假設,了解系統(tǒng)的復雜性。

      在SWAP模型中,政策的價值完全在于模型咨詢,并將其作為討論、分享假設及建立共識的基礎。

      在TELL-ME模型中,我們找到了類似的信息。在這個例子中,詳細的微觀驗證,以及對結果影響的探索是利益相關者參與公共衛(wèi)生項目的主要益處之一。

      HOPES模型介紹了有關制定管理家庭能源需求的政策分析,它假設家庭能源的使用是基于價格考量的個體理性行為之上的實踐活動。事實上,HOPES模型可以社會實踐理論為基礎生成合理的輸出,這對利益相關者來說可能比它輸出的某一個具體值更為重要。

      (二)模型需要處于適當的抽象級別

      沒有模型可以完全反映現實世界:總要省略一些細節(jié),并且圍繞建模內容繪制出邊界。然而,最詳細的模型未必就是最好的。相反,過于詳細的模型所需要的數據量可能遠超實際可用的數據量;可能難以校驗;而且,最重要的是,可能很難理解。良好的建模應該是將模型置于兩個極端之間正確的位置。

      Silent Spread模型是一個在高度抽象層面上開發(fā)的簡單模型。該政策模型需要解決一個單一的決策問題,即是否可以減少或取消牲畜的轉移靜止期?當時英國環(huán)境、食品和農村事務部沒有經常性地收集有關動物轉移相關信息的基礎,建模的可用數據是有限的。因此,解決方案是用一個僅捕捉決策所必需要素的抽象模型。當擁有更充裕的時間和更豐富的數據后,就有可能為Exodis-FMD模型開發(fā)出更詳細的疾病傳播模塊。

      HOPES最初是一個抽象模型,它證明了超越有限傳統(tǒng)方法的可能,即在理性和個人決策層面分析能源需求,以模擬家庭能源消耗這一社會實踐。使HOPES模型更具體的一個動機是希望將其與英國能源供應系統(tǒng)的現有模型聯(lián)系起來。這些來自于電力發(fā)電站、風電場等以及互聯(lián)電網的模擬電力供應系統(tǒng)已被用于虛擬場景,以便為2050年實現整個能源系統(tǒng)的低碳目標做出最佳決策。然而,這些供應模型結合了基于相當簡單的家庭效用最大化假設的需求函數。HOPES模型已被用于改善供應模型的此方面問題,但并非沒有困難,這些困難源于模型的整體復雜性、不同方法的異質性以及不同的模擬時間尺度(供應模型使用時間步長為幾天或幾年,而HOPES的時間步長則為每小時)。這個例子很好地說明了一個事實,即需要仔細考量模型的適當抽象層次,不僅要考慮它們與利益相關者的相關性,還要將它們恰當地融入相關模型的整個生態(tài)中。

      (三)必須認識數據和驗證方面的種種挑戰(zhàn),但不應以此為借口不建?;虿皇褂媒Y果

      1.數據挑戰(zhàn)。數據永遠不會完美。缺乏數據或數據質量差都會導致模型的參數化和驗證受挫。但是,永遠不應該將缺乏數據作為不建模的借口,或者作為不對某個重要方面進行建模的借口。協(xié)同建模、專家先驗知識、不確定性的顯式建模和敏感性分析都可用于解決數據匱乏的問題。

      在TELL-ME示例中,盡管建模者和利益相關者最初認為數據是可用的,但很明顯并沒有數據將政策干預與行為變化及結果聯(lián)系起來。在此例中,不應將數據的缺乏視為不建模的理由。建模的動機仍然存在。相反,當前模型中數據的明顯缺乏反而能夠使得未來的數據收集變得更加有的放矢。

      2.驗證挑戰(zhàn)。數據的缺乏可能會給模型的正式驗證帶來特殊挑戰(zhàn),特別是在復雜的、不斷變化的環(huán)境中探索未來可能性的任務中。在TELL-ME的示例中,行為結果隨時間變化的數據要么不存在,要么傾向于較小幅度的改動。這意味著沒有足夠的縱向結果數據可與模型結果進行比較。

      缺乏全面的驗證數據集并不意味著該模型無法針對其特定目的進行驗證。在這種情況下,可以采用分層的驗證方法:即應從一開始就使用正式的質量保證流程,包括建模方法的選擇以及就驗證方式和驗證過程進行正式記錄。在正式驗證中專家應與模型輸出用戶和建模人員通力合作,并將此過程列為模型開發(fā)的一個正式組成部分。

      驗證必須確保模型:具有技術或科學意義;可以重現;契合其設計的用途。關于這些問題,Taylor[20]列出了一個有用的清單,此外,清單中還包含使用模型做決策會遇到的其他問題。

      Silent Spread示例中說明了如何通過對模型的所有開發(fā)過程和專家、建模人員、用戶等利益相關人員生成的結果進行詳細審查,實現在沒有太多“硬”數據的情況下進行模型開發(fā)和驗證。

      (四)模型開發(fā)和使用需要敏捷開發(fā)和協(xié)作

      敏捷的協(xié)作流程能確保模型始終圍繞政策需求,并提供更有效的同行評審和對建模過程的審查。這需要評審委員和建模人員從一開始就彼此建立起高度的信任。決策者、分析師、模型輸出用戶、利益相關者及同行評審員不僅要參與用戶需求階段的問題定義,還應始終參與建模以確保建模方法、模型結構和抽象層次、參數化、分析和結果解釋始終符合建模的初衷。

      在范圍界定階段,需要就最佳建模方法以及現有模型是否滿足需求進行誠懇的討論。在將模型用于新的場景時需要非常小心,以確保模型的基礎結構符合建模目的。一個循環(huán)迭代地為模型添加功能和細節(jié)的敏捷開發(fā)方法[38]可以有效地防止建模者和客戶均傾向于詳細程度過高的建模。

      最后,建模人員應參與幫助解釋決策結果,因為一份報告不可能完美地呈現出模型的每一個細節(jié)。Silent Spread模型采用了提高參與度的方法,從而大大提高了英國環(huán)境、食品和農村事務部與行業(yè)利益相關者之間的理解與合作。相比之下,INFO-SKIN模型是為響應招標邀請而開發(fā)的,也就導致了利益相關者,即政策制定者與建模者之間存在距離感。其中,歐盟委員會作為客戶只是在模型開發(fā)的初始、中間和結束時與建模者進行了溝通,并沒有參與模型構建。此外,歐盟委員會人員在模型開發(fā)過程中產生了變動,最終導致他們對模型的目的和能力了解甚少。另一個問題是歐盟委員會希望模型給出具體的政策建議,而建模人員則更傾向于由歐盟委員會先提出政策,再由他們對政策進行測試,因為他們認為由建模人員自己設計政策是不合適的。這些都是由于建模者與歐盟委員會之間缺乏適當的溝通所致。

      (五)建模的道德約束

      政策建模時需要仔細謹慎地考慮道德問題,尤其當政策模型有可能改變當前政策,進而直接影響人們生活的時候。除了我們剛剛提到的建模目的需要符合道德準則外,我們還需要確保使用的數據以及輸出結果的方式都同樣符合道德準則。

      在收集個人數據時,無論是顯性的通過問卷調查,還是隱晦地通過身份信息或者其他活動(例如使用社交媒體或移動電話),我們不僅需要遵守數據保護法,還需要獲得恰當的數據使用許可。

      一個重要的需要考量的因素是使用的數據能否代表“被建模”的人群。人工智能研究人員已經發(fā)現,如果數據集是有偏差的,那么基于此數據集形成的模型也很可能是有偏差的,而且這種偏差在事后還很難被檢測到。[39]對“大數據”來說,這是尤其重要的一個問題,因為當一個數據集非常龐大時,很容易讓人們覺得它肯定具有代表性,但實際上這個數據集可能并不包含數量上很小的少數群體。

      由模型得出的結果總是存在一定程度的不確定性。然而,這種不確定性以及對決策的影響通常會被建模者尤其是模型用戶淡化,這可能是有意的淡化(因為他們覺得這種不確定性“不受歡迎”),也可能是無意的淡化(專家的偏見)。用戶也可能對建模者施加壓力以淡化這種不確定性。建模者應該清楚,他們要自信地表達不確定性,但同時也要提供有用信息。用戶需要做的是了解不確定性在他們作出決策或進行溝通時意味著什么。如果模型很復雜并且像一個“黑箱”呈現給用戶,則會產生更多問題,因為用戶無法自行調查這些結果背后的邏輯和假設。鼓勵用戶和建模者之間協(xié)同合作的另一個原因是用戶可以跟進模型的開發(fā)進程,至少可以了解模型的工作方式和理論基礎;建模者可以更好地理解用戶需求和背景知識,確保模型以有用的形式輸出結果。

      在Silent Spread模型示例中,可用于建模的數據非常有限,而決策卻需要盡快作出。這就需要盡可能地使利益相關者、專家和政府工作人員廣泛地參與到模型的設計與測試過程中來。工作組在建模過程的每個階段都定期開會。一旦新的輸出結果出現,該小組就馬上開始著手分析和解釋結果,并提出了一系列改進建模的方法,以測試輸出結果所提出的新假設。模型使用了各種不同的方法來表示結果中的不確定性,特別是每個政策選項相關的風險水平都清楚地列出來了,讓決策者在做出決策時加以考慮。這就確保了其能夠達成讓大家都滿意的共識,該模型被一位專家描述為“集體的共同大腦”。

      (六)需要仔細規(guī)劃建模過程、結構和結果的有關溝通

      溝通可以清楚地解釋輸出結果及其局限性,確保輸出結果得到恰當使用,并建立起對建模過程和輸出結果的信心。由于模型輸出由數字和圖表組成,導致它們看起來比實際中更加明確和確定,但反之也意味著數據和假設之間的界限往往被忽略。以往的失敗經驗會導致對建模的不信任,積極的協(xié)作則可以建立起對工作的信心,但不可能讓每個人都參與其中。建模團隊和政策客戶中的人員變動也有可能導致新的問題出現。

      在Silent Spread模型示例中,建模者必須努力消除由2001年疫情暴發(fā)后預測模型作出的對牲畜連續(xù)撲殺這一結果所帶來的對政策建模的不信任。雖然起初很難讓持有不同意見的利益相關者坐下來開誠布公地討論,但這個模型給了他們一個相對中立的立場來分享不同的觀點并對這些觀點進行測試。

      在SWAP模型示例中,信任并不是一個問題。反而是模型的設計以及模型(和建模者)得出的結論更需要恰當的傳達給不熟悉計算機建模方法的利益相關者。

      (七)模型需要維護

      如果政策模型在初次使用之后可以繼續(xù)在政策監(jiān)督、開發(fā)和評估中發(fā)揮作用,那么它們就可以提供愈發(fā)準確的結果。但在政府采購流程和政府組織中,模型很難得到適當的維護。開源模型很有吸引力,因為開發(fā)者社區(qū)可以繼續(xù)維護和檢查它們,但政策模型有時候不能做到開源,因為政策模型必須在一段時間內準確地代表復雜的政策,并考慮到政策和政策環(huán)境的變化。在第四章描述的模型中,目前只有Exodis模型得到了定期維護。因此,確保模型能夠得到長期維護是迄今為止很少得到妥善解決的問題。

      六、結 論

      在建模這個復雜領域所需的技術支持已日臻完善,而且在使用上也越來越容易。然而,為了使政策建模充分發(fā)揮其潛在優(yōu)勢,則需要更多地關注模型開發(fā)和使用過程。在政策模型發(fā)揮積極效用及使用的過程中仍存在諸多缺陷,這在很大程度上是由經驗和錯誤中獲得的“技術知識”所造成的,這就是為什么本文描述了筆者在各自不同的經驗中得到的關鍵經驗教訓。然而,如果政策變化所需付出的成本或伴生而來的風險很高,而且環(huán)境復雜,那么進行政策建模就不僅是一種共識,而且是道德要求。

      筆者認為,成功的政策建模最重要的一點是鼓勵相關人員進行溝通與協(xié)作:即在建模者自身、客戶和利益相關者、數據提供者、模型輸出用戶等之間溝通與協(xié)作。學界仍然傾向于在象牙塔內工作,即只在用戶完全開發(fā)完成并將研究成果發(fā)表在研究文獻中之后,才向他們提供結果和模型。雖然這種方法可能適用于一些正式的模型,但幾乎可以肯定的是這無法向決策者提供可使其在實際中運用的行之有效的政策模型。相反,正如本文所強調的,政策建模需要協(xié)作、迭代和敏捷。這樣做有很多好處,首先,它提供了一種對模型的所有權,即鼓勵建模者向用戶承諾他們有可能看到屬于他們自己的模型,而不是別人強加給他們的黑箱。其次,協(xié)作有助于防止建模者在目標上作出太過天真的假設,因為如果一個人不是該領域的專家就很容易這樣。因此,通過協(xié)作,建模人員知曉了其試圖去呈現的世界的復雜性,與此同時,用戶也知曉了他們正在幫助開發(fā)的模型其功能的局限性。最后,利益相關者的積極參與可以幫助檢測模型的參數等,即使在“硬”數據匱乏的地方。數據的缺乏不應該成為放棄建模的借口,但是方法需要調整,如此,一種能夠識別數據需求以及訪問方式的迭代的、參與性的建模方法被開發(fā)出來。

      這種協(xié)作式的工作方式對許多政府機構來說可能是陌生的,甚至可能涉及機密、隱私和數據訪問方面的微妙談判。然而,越來越多地使用模擬、機器學習和人工智能來輔助政府和企業(yè)做決策似乎已成為勢不可擋的趨勢,因此(政府及企業(yè))文化可能不得不改變,以允許甚至鼓勵一種更加協(xié)作、敏捷的建模方法。當它實現時,政策建模將會趨于真正的成熟。

      注釋:

      ①本文譯自Nigel Gilbert,Petra Ahrweiler,Pete Barbrook-Johnsona,Kavin Preethi Narasimhan,Helen Wikinsonc合作的論文“Computational Modelling of Public Policy:Reflections on Practice”,原載于 “Journal of Artificial Societies and Social Simulation”(《人工社會與社會仿真雜志》,2018年1月31日刊發(fā)),中譯本已獲作者授權在《江西社會科學》刊發(fā),標題按中文習慣略作修改。

      ②奈杰爾·吉爾伯特(Nigel Gilbert)教授生于1950年3月21日,英國薩里大學社會仿真研究中心的創(chuàng)始人并擔任主任,著有多本關于計算機社會科學、社會仿真及社會研究方面的著作,是社會科學中使用基于代理模型(Agent-Based Mmodel)的先驅。20世紀90年代,吉爾伯特教授發(fā)表了關于社會仿真學的第一本教科書:《社會科學家的仿真》(Simulation for the social scientist,1999),且創(chuàng)辦了該領域領先的國際期刊《人工社會與社會仿真雜志》。

      ③因圖表分辨率及印刷的原因,原文相關模型的圖表均省略處理,請前往原文網絡版查看,http://jasss.soc.surrey.ac.uk/21/1/14.html。

      猜你喜歡
      相關者建模政策
      政策
      房地產導刊(2022年8期)2022-10-09 06:19:34
      政策
      房地產導刊(2022年6期)2022-06-16 01:28:40
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
      助企政策
      政策
      華人時刊(2019年21期)2019-11-17 08:25:07
      利益相關者視角的高??冃гu價
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      利益相關者邏輯下相互作用大學共同治理機制研究
      XBRL的傳播對利益相關者參與程度的影響研究
      台江县| 宝鸡市| 珠海市| 名山县| 广安市| 惠东县| 怀集县| 滦南县| 视频| 南雄市| 买车| 镇康县| 瑞安市| 荆州市| 英吉沙县| 易门县| 山西省| 镇沅| 福安市| 瓮安县| 盐池县| 鲜城| 高安市| 万州区| 出国| 永济市| 滁州市| 体育| 上思县| 浮山县| 武功县| 丰宁| 固镇县| 梧州市| 肥东县| 华容县| 靖边县| 普兰店市| 都匀市| 中阳县| 开封市|