韓自強(qiáng)
(廣東海洋大學(xué)法學(xué)院,廣東湛江524088)
如何讓囚徒走不出困境——三人博弈理論及其應(yīng)用
韓自強(qiáng)
(廣東海洋大學(xué)法學(xué)院,廣東湛江524088)
以囚徒困境為代表二人博弈模型在學(xué)術(shù)界已經(jīng)被廣泛研究并加以應(yīng)用。囚徒困境理論往往容易形成一種簡單化和兩極化的固定思維模式。囚徒困境的二人博弈模型實際上是三人博弈模型的簡化。而三人博弈模型在現(xiàn)實生活中比二人博弈模型更加貼近現(xiàn)實,更具有解釋力。分析三人博弈模型的結(jié)構(gòu)及其理論意義,并以刑事訴訟法為例對三人博弈模型的應(yīng)用進(jìn)行探討很有必要。
二人博弈;囚徒困境;三人博弈;刑事訴訟法
以囚徒困境為典型的簡單二人博弈模型已為我國法學(xué)界所熟知并成為不少學(xué)者分析和理解諸多社會問題的有用工具。然而在博弈論中,二人博弈只是博弈論的基本模型。三人博弈以及多人博弈模型博弈論誕生之初就受到了其創(chuàng)始人的關(guān)注[1],其理論應(yīng)用也十分廣泛,但在我國法學(xué)界卻鮮有人討論。而實際上從三人博弈的分析中卻能給我們提供很多二人博弈無法看到的東西。本文將從美國著名哲學(xué)家羅伯特·諾奇克(Robert Nozick)提出的三人博弈模型入手來展示三人博弈與二人博弈的不同之處以及這種理論可能給我們帶來的新的理論上的啟示。
諾奇克提出的三人博弈模型如下:假如現(xiàn)在有A,B,C三人要分10美元,他們中的任何人可以提出任何分配規(guī)則,只要這個規(guī)則在分配結(jié)束的時間到來之前得到了多數(shù)人,也就是兩個人或者所有人的同意就可以。分配將會怎樣進(jìn)行[2]?
這個問題初看起來很簡單。也許最簡單的分配方案就是三人均分,但是,作為理性的經(jīng)濟(jì)人,博弈者很快就會發(fā)現(xiàn):如果某兩個博弈者達(dá)成協(xié)議,他們的結(jié)盟就可以獨享這10美元的收益,而被排斥在結(jié)盟之外的博弈者將一無所得,這樣的分配方案收益大大高于三人均分的收益,更加符合任何兩個結(jié)盟者的利益。這樣,博弈者A和B或許就會達(dá)成同盟,提出AB各得5美元,C一無所有的分配方案。但是C很快發(fā)現(xiàn)自己的利益被A和B的同盟剝奪了,他會去破壞A和B的聯(lián)盟,他可以向B提出自己只要4美元,而給B 6美元的結(jié)盟方案,雖然C自己少拿了2美元,但他至少可以得到比一無所有好得多的結(jié)果。B發(fā)現(xiàn)在和C的同盟中自己可以得到更多,他將會放棄和A的同盟轉(zhuǎn)而和C結(jié)成同盟。為了對付C的破壞,A可以提出更高的價格,比如說自己只要3美元而給B 7美元,B發(fā)現(xiàn)這個報價更優(yōu)惠,可能又回心轉(zhuǎn)意,投回A的懷抱。為了不使自己一無所獲,C進(jìn)一步報價自己2美元,B 8美元,A報價自己1美元,B 9美元,……
當(dāng)A的報價低到自己只要1美分而給可能的同盟者B高達(dá)9.99美元時(或許更早),A發(fā)現(xiàn)或許B不是個很好的結(jié)盟伙伴,自己和B的結(jié)盟太吃虧了,他或許會轉(zhuǎn)而向C提出結(jié)盟的建議,由A和C組成同盟,每人分5美元,B一無所得。B發(fā)現(xiàn)A和C結(jié)成了同盟,自己很可能一無所有,他將會重復(fù)C的競價策略,開始破壞A和C的同盟,他轉(zhuǎn)而向A或C提出競價,A或者C發(fā)現(xiàn)自己可能分的更多,受到誘惑的其中之一又開始脫離聯(lián)盟,剩下的人只好又開始新一輪的競價……
這樣,在最后限定的時間到來之時,誰都沒法知道最后的分配結(jié)果是怎樣的。即使有兩方達(dá)成了協(xié)議,誰也沒法保證被排斥在結(jié)盟之外的一方會不會在最后一秒鐘喊出自己只要1美分,而把剩余的9.99美元給自己的結(jié)盟伙伴的超低價,更不能保證自己的結(jié)盟伙伴在如此高的收益面前不背叛自己。(結(jié)盟者當(dāng)然也可以喊出自己一分錢不要,所有錢全部給自己的結(jié)盟者的報價。但這個報價與沒有結(jié)盟時的結(jié)果沒有區(qū)別,結(jié)盟不結(jié)盟在這個報價下已經(jīng)失去了區(qū)別而變得無意義。)這樣,我們從這個游戲中可以推斷出以下結(jié)論:如果想要形成結(jié)盟,結(jié)盟者在該結(jié)盟中所獲得的收益不能高于與其結(jié)盟的盟友所獲得的收益[3],否則結(jié)盟者就會有背叛收益較低的結(jié)盟轉(zhuǎn)投收益較高的結(jié)盟的動力。但即使結(jié)盟收益相等,由于有競爭者,或者說“拆臺者”的存在,形成哪一個結(jié)盟是無法確定的。
那么,在這個博弈的過程中,有沒有可能達(dá)成三個人均分的可能性呢?毫無疑問,對于每一個博弈者來說,與一無所有的結(jié)局相比,得到約3.3的收益是一個好得多的結(jié)局。但是,首先,這會降低每一個博弈者可能的最大收益(由5降到約3.3),更重要的是和一個人結(jié)成同盟要考慮到一個結(jié)盟者背叛的可能性,和兩個對手結(jié)盟則要考慮兩個結(jié)盟者背叛的可能性。在沒有其他手段確保結(jié)盟者會信守承諾的情況下,約束兩個人比一個人更難,預(yù)期收益可能更低,更加不理智。因此,在沒有成本的情況下,博弈者只能一輪一輪地繼續(xù)著談判,只有讓這個討價還價的過程無限進(jìn)行下去自己潛在的虧損才不會變成實際的虧損。雖然我們知道存在著兩個人結(jié)盟的可能,但我們無法確認(rèn)會形成的是怎樣的同盟。正如諾依曼和摩根斯坦在《博弈論與經(jīng)濟(jì)行為》中所言:根本沒有聯(lián)盟形成的情況是不合理的,但具體哪一個聯(lián)盟形成則依賴其他條件[4]。
這樣,我們看到了一種不同于二人博弈的三人博弈過程。博弈中的每一個人不僅僅要和可能的同盟者博弈,還要和“拆臺者”進(jìn)行博弈。這是一個沒有那樣均衡那樣穩(wěn)定的博弈。雖然每一個人都知道每一個人獲得最大收益的可能來源于他和其他另外一個人的結(jié)盟,但和誰結(jié)盟卻是無法確定的。和所有競爭者均分收益固然是一個次優(yōu)的策略,但無法保證其他兩個競爭對手也會選擇同樣的次優(yōu)策略,自己的次優(yōu)策略很可能變成一個危險的劣策略。最后的結(jié)果是形成了一個誰也無法預(yù)測的結(jié)局。這也是另外一個社會兩難的例子——三人社會兩難[5]。
和二人囚徒困境博弈相比,三人博弈模型中的合作似乎更難出現(xiàn)。因為博弈者不僅僅要考慮結(jié)盟者背叛的可能,還要考慮拆臺者破壞的可能。拆臺者的出現(xiàn)抬高了自己出價的價碼。使自己處于腹背受敵的境地。雖然博弈者都知道任何兩個人或者多人聯(lián)盟都會使參與者獲得更多收益,但如何形成那個可能的聯(lián)盟?而這個不穩(wěn)定的聯(lián)盟又有什么意義?
博弈論的目的并不在于思想游戲,而在于從理性人的博弈中找到理解現(xiàn)實世界的方法,洞察人類行為背后的理性根源。經(jīng)典的囚徒困境博弈可以作為實際生活中許多現(xiàn)象的一個抽象概括。在囚徒困境作為博弈論的經(jīng)典例子被法律經(jīng)濟(jì)學(xué)家們引入法律的經(jīng)濟(jì)分析之后,許多學(xué)者已經(jīng)習(xí)慣于用囚徒困境的博弈分析來對現(xiàn)實生活中的法律現(xiàn)象進(jìn)行解讀。而沒有注意到三人博弈的不穩(wěn)定結(jié)構(gòu)同樣具有解讀這些法律現(xiàn)象背后的理性動機(jī)的能力。
應(yīng)用三人博弈模型的關(guān)鍵在于理解:三人博弈模型實際上是二人博弈模型的擴(kuò)展,或者說,二人博弈模型是三人博弈模型的簡化。我們早已習(xí)慣性地把囚徒困境當(dāng)作一個典型的二人博弈模型,但是,我們仔細(xì)想想就會明白,這是因為我們省略掉了另外一個參與博弈的主體——國家。而我們之所以省略掉這樣的主體是因為我們認(rèn)定國家是居于強(qiáng)大的優(yōu)勢地位的,不可收買的,并且不可能與兩個囚徒發(fā)生互動的第三方。但認(rèn)真一想我們就會發(fā)現(xiàn),在囚徒困境的特定語境中,囚徒們之所以都選擇坦白不正是考慮到另一個囚徒可能被第三人國家收買嗎?整個博弈的過程實際上是兩個囚徒和國家之間的三方博弈。但由于相對個人而言,我們習(xí)慣性的以為國家是如此之強(qiáng)大,以至于我們直接把國家當(dāng)成了外在于囚徒們的制度約束條件而忽略了囚徒和國家博弈的可能。
然而,國家雖然強(qiáng)大,但在局部的環(huán)境中卻由于信息的劣勢而處在被動之中。即使身在牢房之中,兩個小小的囚徒無法改變法律,但卻可以利用自己的局部信息優(yōu)勢使國家難以獲得必要的信息來逃脫國家的法律制裁。只要兩個囚徒能貫徹他們之間的攻守同盟,國家在本身的制度約束之下不一定能在兩個配合默契的囚徒面前占什么便宜。這樣,當(dāng)我們跳出囚徒困境的思想束縛再仔細(xì)審視這一困境,我們將會發(fā)現(xiàn),囚徒困境完全可以改寫成囚徒A,B和國家三人博弈的模型。而且這個三人博弈模型同樣可以給我們以理論——尤其是現(xiàn)實生活中的刑事理論上的啟示。
在這個三人模型的囚徒困境中,囚徒A,B和國家雖然在力量方面是極其不平等的,但在局部范圍內(nèi),在信息的掌握方面,囚徒A,B卻處在優(yōu)勢地位,只要囚徒A和B合作,那么他們就可以實現(xiàn)其利益最大化。反過來,國家的問題是怎樣打破A和B的結(jié)盟,實現(xiàn)自己的利益最大化。這樣,從國家的角度出發(fā)問題就轉(zhuǎn)變成了:怎樣讓囚徒們永遠(yuǎn)走不出囚徒困境?;蛘咧辽?,降低囚徒們走出困境的可能性。在現(xiàn)實中,這個問題也有它的現(xiàn)實意義,那就是對于有可能形成合作并走出囚徒困境的犯罪,比如團(tuán)伙進(jìn)行的盜竊、搶奪或者黑社會性質(zhì)犯罪、貪污賄賂犯罪,團(tuán)體犯罪等案件怎樣讓囚徒們無法形成同盟?對于作為維護(hù)國家秩序和解決社會爭議的社會機(jī)構(gòu)國家來說,這才是最符合國家和社會利益的根本問題,社會學(xué)家們要思考的是“怎樣走出囚徒困境”以形成社會合作的抽象理論問題,而刑事政策的專家們需要研究的則是“怎樣讓囚徒走不出困境”的現(xiàn)實問題。
囚徒困境合作難以出現(xiàn)原因就在于博弈是一次性的。在一次性博弈的情況下,由于不會再有合作的機(jī)會,因此博弈各方都會采用最大化自己利益的短期行為。所以,通過改變博弈條件,將一次博弈改為多次博弈,理性的博弈者就有可能選擇放棄短期行為而進(jìn)行合作[6]。這一結(jié)論不僅得到了理論上的證明,也得到了實驗和社會生活經(jīng)驗的證實[7]。通過對二人囚徒困境理論模型的分析[8],羅伯特·阿克塞爾羅德點出了促進(jìn)人類合作可以從三個方面入手,即:使得未來相對于現(xiàn)在更重要些;改變博弈者可能結(jié)果的收益值;以及教給對策者那些促進(jìn)合作的準(zhǔn)則、事實和技能[9]。
而對于承擔(dān)著打擊犯罪任務(wù)的國家來說,并不是每一種合作都值得鼓勵,國家所需要的合作是在市場上的個體間合法的合作。犯罪嫌疑人之間的合作則是應(yīng)該被打擊的對象。而為了不讓犯罪嫌疑人之間形成合作,國家所需要做的是反其道而行之破壞這種合作。而國家破壞囚徒們的同盟的最好辦法是制造一次性博弈的格局。在國家和囚徒們進(jìn)行一次性博弈的格局中,由于國家掌握了強(qiáng)大的報復(fù)的實力,并具有較高的信譽(其刑罰執(zhí)行的條件由法律確定,由相應(yīng)的社會機(jī)構(gòu)監(jiān)督具有很高的確定性等),還能夠提供其他博弈者無法提供的結(jié)盟補償(如減輕刑罰等),一般情況下,與國家結(jié)盟獲得的利益比和其他博弈者結(jié)盟所獲得的利益要大,與其結(jié)盟毫無疑問絕大多數(shù)情況下都是有利可圖的理性選擇,理性的囚徒們此時絕大多數(shù)情況下將會選擇與國家的合作。由于大部分的犯罪基本都形成了一次性博弈的格局(人的生命的有限性和刑罰的嚴(yán)厲性決定了犯罪嫌疑人很難有形成長期合作的機(jī)會),從而在整體上降低了囚徒之間合作的可能性。在這些巨大優(yōu)勢面前,由于囚徒們一般沒有獲得結(jié)盟回報或者報復(fù)背叛者的機(jī)會,而這種懲罰性的報復(fù)對于形成合作的信任的形成是至關(guān)重要的[10],因此任何囚徒間結(jié)盟的考慮都將面臨難以超越的障礙。國家因而得以在大多數(shù)現(xiàn)實生活中的“囚徒困境”中都會占得先機(jī)。對于大多數(shù)普通的真實刑事案件而言,巧妙的利用囚徒困境并適當(dāng)?shù)卣{(diào)整策略,利用國家所具有的信息優(yōu)勢和賞罰資源優(yōu)勢就足以形成有利于國家的同盟而降低囚徒們形成結(jié)盟走出困境的可能。
在現(xiàn)實生活中,我們可以看到真正進(jìn)行的與團(tuán)伙犯罪進(jìn)行的博弈更類似于三人博弈模型而不是二人博弈模型。面對團(tuán)伙犯罪,形成博弈格局是國家和不同的犯罪嫌疑人之間的兩兩博弈。真正的犯罪嫌疑人在面對國家時,不僅僅在和國家進(jìn)行博弈考慮是否進(jìn)行合作的問題,犯罪嫌疑人之間同樣也存在著是否背叛與合作的問題。這樣,如果能夠套用三人博弈模型,就可以把這個過程看得更加清晰。博弈論的解釋也就更加準(zhǔn)確到位。同時,我們可以發(fā)現(xiàn),三人博弈模型不僅僅局限于團(tuán)伙犯罪的問題。它同樣可以擴(kuò)展并適用于對普通刑事案件的解釋,對于大多數(shù)只有一個犯罪嫌疑人的案件,博弈的三方是國家,受害人和犯罪嫌疑人。三人博弈的模型也同樣可以拓展,而且其結(jié)論同樣有效。在簡單的刑事案件中,如果不出現(xiàn)特別的情況,就會出現(xiàn)一個自然的結(jié)盟:國家和受害人的結(jié)盟,受害人由于其受害者的身份可以被視為被犯罪嫌疑人背叛的結(jié)盟者,他有著最強(qiáng)烈的報復(fù)的愿望,而國家在大多數(shù)情況下則是有著強(qiáng)大力量和可信度的天然結(jié)盟對象,而國家為了實現(xiàn)社會秩序和維護(hù)自己的權(quán)威也需要和受害人的合作,現(xiàn)在的格局就成了國家和受害人結(jié)盟以對付犯罪嫌疑人。結(jié)盟的力量存在與否對于國家來說有時候是至關(guān)重要的。如果沒有受害人的幫助,國家甚至很難完成案件偵破工作。正是有了結(jié)盟者的幫助,國家的意志(也基本是受害者的意志,但兩者不一定完全一致,如下文的強(qiáng)奸案)得以順利實現(xiàn)。而從三人博弈的角度來說,所謂法律規(guī)避的問題實質(zhì)只不過是在三人博弈的較量過程中國家競價失敗被排除在結(jié)盟之外而已。
這樣,在引入三人博弈模型之后,整個博弈的過程就將沿著三人博弈的邏輯展開。
首先,在三人博弈模型中,國家的策略就是以最小的價格購買可能形成的犯罪嫌疑人中的一個(或一部分)的結(jié)盟。由于國家手中握有刑罰權(quán),并且一般情況下刑罰會導(dǎo)致犯罪嫌疑人受處罰后收益大大超過其與其他犯罪嫌疑人結(jié)盟的收益,國家一般會處于“出價較高者”的優(yōu)勢地位。而公安機(jī)關(guān)和檢察機(jī)關(guān)充分應(yīng)用自己在懲罰權(quán)上的優(yōu)勢對嫌疑人采取的分化瓦解的策略實際上就是結(jié)盟競價策略。我國的《刑事訴訟法》及其相關(guān)解釋是我國公安機(jī)關(guān)和檢察機(jī)關(guān)等部門在長期刑事司法實踐中的經(jīng)驗總結(jié)。這些法律條文并沒有使用經(jīng)濟(jì)學(xué)或者博弈論的術(shù)語,但這些機(jī)關(guān)部門在實踐中的經(jīng)驗告訴他們,要讓犯罪嫌疑人講真話,必須要讓犯罪嫌疑人知道講真話比講假話好,與國家合作比不和國家合作好。這個擺事實講道理的過程其實就是國家的出價過程,其目的在于形成收益不同的結(jié)盟,使被收買者在和國家形成的利益結(jié)盟中獲得(或者誤以為獲得)更大利益,從而破壞犯罪嫌疑原先形成的結(jié)盟。
而達(dá)到這個目的的輔助策略就在于首先讓嫌疑人無法形成有效的信息交流,防止拆臺者(其他疑犯)因情勢所迫瘋狂出價而破壞國家的結(jié)盟競價。這個時候嫌疑人想要形成有效結(jié)盟唯一能憑借的就只能是對以前的結(jié)盟的確信。而國家對嫌疑人進(jìn)行的嚴(yán)格的信息交流的限制實際上使國家處于壟斷競價信息的地位。這時候只有國家知道其他犯罪嫌疑人為了保證不讓國家獲得信息的出價。在國家的強(qiáng)大壓力下,犯罪嫌疑人無法判斷以前的結(jié)盟是否已經(jīng)瓦解,自己是否已經(jīng)被出賣從而處于劣勢。這樣,國家就在和囚徒的博弈中形成了信息優(yōu)勢,或者準(zhǔn)確地說成了唯一的現(xiàn)場競價者。在不能確認(rèn)犯罪嫌疑人之間以前的結(jié)盟是否還有效的情況下,與國家合作提供信息看起來成為了唯一的選擇。因此,從根本上來說,限制犯罪嫌疑人的自由實際上不僅僅為了防止社會危害,這一防范措施還具有摧毀對犯罪嫌疑人之間結(jié)盟關(guān)系確信的作用。
落實到具體的法律實踐中,為了形成信息優(yōu)勢,對于團(tuán)伙犯罪,法律相對于其他類型的犯罪而言規(guī)定了嚴(yán)格得多的信息交流限制。《最高人民法院、最高人民檢察院、公安部、國家安全部、司法部、全國人大法制工作委員會關(guān)于〈中華人民共和國刑事訴訟法〉實施中若干問題的規(guī)定》第十一條規(guī)定:律師提出會見犯罪嫌疑人的,應(yīng)當(dāng)在48小時內(nèi)安排會見,對于組織、領(lǐng)導(dǎo)、參加黑社會性質(zhì)組織罪、組織、領(lǐng)導(dǎo)、參加恐怖活動組織罪或者走私犯罪、毒品犯罪、貪污賄賂犯罪等重大復(fù)雜的兩人以上的共同犯罪案件,律師提出會見犯罪嫌疑人的,應(yīng)當(dāng)在五日內(nèi)安排會見。第十二條則規(guī)定:在偵查階段,律師會見在押的犯罪嫌疑人,偵查機(jī)關(guān)根據(jù)案件情況和需要可以派員在場。這些比普通犯罪嚴(yán)格得多的規(guī)定其主要目的就在于防止串供,最大限度地阻斷犯罪嫌疑人的結(jié)盟信息交流并進(jìn)而阻止其結(jié)盟。在司法實踐中,對于黑社會性質(zhì)的案件,貪污受賄等可能形成結(jié)盟的案件往往采取分開關(guān)押的辦法。而審訊嫌疑人時巧妙地“透露”其他犯罪嫌疑人已經(jīng)開始招供的信息以造成疑犯的心理壓力也是經(jīng)常使用的技巧。
其次,坦白從寬,抗拒從嚴(yán)的刑事政策以及自首、立功等法律規(guī)定可以看作是國家在與犯罪嫌疑人進(jìn)行結(jié)盟的競價,是國家以自己能出得起的最高價格破壞犯罪嫌疑人的同盟,而形成有利于自己的同盟。國家與犯罪嫌疑人進(jìn)行結(jié)盟以打擊犯罪這個說法聽起來有點奇怪,但在三人博弈的背景中就不難理解。
對自首和立功的規(guī)定我們可以把它理解為犯罪嫌疑人與國家合作而得到的收益。即如果犯罪嫌疑人與國家合作,犯罪嫌疑人得到獎勵(比如從輕或者減輕處罰),如果犯罪嫌疑人不合作,國家將會對其進(jìn)行報復(fù)(比如從重或者加重處罰)。同時,另外一個被排斥的犯罪嫌疑人知道一旦國家競價成功的話,國家將獲得更多信息,從而將形成不利于自己的結(jié)盟。這個被排斥的犯罪嫌疑人也有足夠的動力來破壞國家和這個可能與國家合作的犯罪嫌疑人同盟。他也會出足夠高的價格來爭取結(jié)盟,但很遺憾,國家隔斷了他們之間的信息傳遞并擁有信息壟斷地位,他的出價另一個犯罪嫌疑人無法知道。這時候我們通過三人博弈模型來理解這個過程就可以更明白地看清楚這是三方在競爭一個可能的合作者以實現(xiàn)自己利益的最大化。
然而,在這個過程中,國家不一定能成功地破壞囚徒們原來的同盟。雖然國家隔斷了囚徒們的信息交流,但國家無法防范囚徒們事先約定好的同盟的形成。其次,國家的競價不一定能和另一個囚徒的出價競爭。在長期形成了信任關(guān)系的情況下,如果另一個囚徒的出價具有同樣高的可信度,而國家的出價又小于另一個囚徒的出價,或者說,與國家合作的收益無法大于與另一個囚徒可能的結(jié)盟的收益,國家就很有可能競價失敗。事實上國家并不會在任何情況下都是具有最高可信度和能夠提供最大利益的結(jié)盟伙伴,由于個人偏好的不同,國家的懲罰威脅也不一定會成為有力的威脅。假如兩個囚徒是一對夫妻,在這種情況下,國家不一定能和夫妻間的相互信任抗衡。這時國家就很難應(yīng)用自己的優(yōu)勢打破這個同盟。而在某些情況下,國家甚至根本無法出價,我們可以以蘇力在《法治及其本土資源》一書中提到的那個發(fā)生在農(nóng)村的私了的強(qiáng)奸案為例[11]。案件是:一個農(nóng)村姑娘和村里的男青年約會時被男青年強(qiáng)奸,雙方家人經(jīng)協(xié)商后同意由男方給女方家賠償,兩人結(jié)婚。女方放棄告發(fā)。在這個案件中,博弈的三方是國家,受害人和犯罪嫌疑人。國家的競價是用刑法來懲罰犯罪嫌疑人來換取受害者提供信息(結(jié)盟),但這種補償卻無法滿足受害人的需求(強(qiáng)奸傷害的是女性在婚姻市場上的價值),而犯罪嫌疑人是唯一能滿足受害人要求的出價者(可與之結(jié)婚)。而受害人則憑借了國家可能的懲罰逼迫犯罪嫌疑人和自己結(jié)盟。而雙方結(jié)盟后由于利益的關(guān)聯(lián)并借助信息的優(yōu)勢排斥了國家的插手。在這個三人博弈者過程中,國家由于支付能力的不足而落敗。這是囚徒結(jié)盟反過來同樣可以擊敗國家權(quán)力的一個小小例子。當(dāng)然,這種情況的出現(xiàn)需要相應(yīng)的社會環(huán)境導(dǎo)致女方在婚姻市場上的價值受到損壞并無法補救。缺乏這個條件的話一般情況下仍然是國家會獲得信息從而與受害者進(jìn)行結(jié)盟。
另一方面,如果想要贏得結(jié)盟者,與國家競爭的另一個結(jié)盟者的競價必須同樣具有相當(dāng)?shù)拇_定性。雖然囚徒們無法繼續(xù)交流信息,但如果環(huán)境向囚徒傳遞了另一個比國家的出價更具有吸引力的確定信息,國家就很難破壞結(jié)盟者的同盟。在意大利黑手黨興盛的時期,警方雖然抓獲了一些犯罪嫌疑人,但很多時候卻無法獲得有用的信息。原因在于關(guān)押黑手黨的一所監(jiān)獄的墻上寫著“緘口活百年,開口入地獄”,這句話每天被看守擦掉,每天又神秘地被人寫上[12]。這句話的作用在于它向可能的背叛者傳達(dá)了一個極其有力的信息。黑手黨的懲罰和國家的懲罰一樣可信。在這種條件下,毫無疑問,相對于國家的出價而言,黑手黨的開價更高而且具有同樣的可信度。國家的結(jié)盟競價很可能被擊敗。假想一下,如果一個黑手黨黨徒與國家合作的收益僅僅是少判一兩年,而黑手黨的出價是背叛者必死。在確信黑手黨的威脅并不僅僅是口頭恐嚇之后,犯罪嫌疑人會如何選擇?這種情況下,小恩小惠恐怕就不足以對囚徒同盟形成有效的破壞,國家也必須要有足夠高的出價才能破壞如此堅固的同盟。從三人博弈模型的角度看來,自首,立功,減輕或者加重處罰,減刑,證人保護(hù),特赦,特別批準(zhǔn)的監(jiān)外執(zhí)行等等策略構(gòu)成了國家的支付集。雖然國家在多數(shù)情況下可以以自己的高信譽以較低的價格買到囚徒們的結(jié)盟(這是國家利用自己的信譽優(yōu)勢和其他人無法參與競價的信息優(yōu)勢“壓價”的結(jié)果)。但正如貨幣不是萬能的一樣,國家也不可能無限制地競價。因此,國家不可能阻止所有的囚徒走出困境。國家只能在不損害自己權(quán)威的前提下,盡量增加自己的支付儲備以應(yīng)付可能的競價需要。但是,根本沒有聯(lián)盟形成的情況是不合理的,但具體哪一個聯(lián)盟形成則依賴其他條件[13]。真實的社會現(xiàn)實背后有著理性的力量,國家并不必然會獲勝。
囚徒困境是法學(xué)界最常用的博弈論模型,但并不是唯一的模型。我國的法理學(xué)界也往往習(xí)慣于用一種二元對立的囚徒困境模式來觀察和思考我們的現(xiàn)實問題。在中國法理學(xué)的思考范式中存在著大量的國家與市民社會,民間法與國家法,社會秩序與法律秩序等二元對立劃分。這些分類的方法對于我們理解重要的理論爭議問題是很有幫助的,這種思維方式有助我們發(fā)現(xiàn)并確定問題的大致所在。但是抽象概念的存在是以抹殺概念所指實體間的諸多差異為代價的。當(dāng)我們大致地把一些事物歸入一類而把另外一些事物歸入另一類時,我們忽視了這些事物本身的許多特征。這種二分法在應(yīng)用到社會現(xiàn)實中時往往會把問題簡單化了。當(dāng)我們僅僅把訴訟視作國家權(quán)力和公民權(quán)利的博弈時,我們往往忽略了公民之中的分歧與沖突,忘記了可以利用或者借助這些博弈以更小的代價實現(xiàn)秩序的可能。當(dāng)我們把這些抹去的差異凸顯出來的時候,我們會發(fā)現(xiàn)他們之間如此錯綜復(fù)雜的關(guān)系。而這些看似復(fù)雜的關(guān)系構(gòu)成了一個脈絡(luò),其間蘊含著很多可以通向目的的道路。這些道路的存在提醒我們存在著其他的觀察問題和解決問題的可能性。而無論網(wǎng)絡(luò)被簡化成二元或者三元結(jié)構(gòu),在各種社會力量的博弈中,結(jié)盟和合作是永遠(yuǎn)不變的主題。我并不否認(rèn)二元博弈結(jié)構(gòu)在許多方面,例如公法理論構(gòu)建方面卓有成效的建樹,但并不是所有的問題都可以用公法視野下的國家/社會二元對立模式來解決,對于很多中觀或者微觀層次的問題,三元甚至多元博弈模型可能比二元的囚徒困境模型更貼近現(xiàn)實,更有解釋力。
三人博弈模型的最大啟示在于提示我們在一個多方博弈的格局中尋找可能的結(jié)盟力量以尋求利益的最大化并有可能走出囚徒困境。這一點對于一個國家的社會秩序建構(gòu)有著很大的啟發(fā)意義。它提醒我們存在著與更多社會主體協(xié)作以建立法治秩序的可能。20世紀(jì)90年代以來中國法學(xué)界對中國法治本土資源問題的反思只是以不同的方式不斷地表述了這個主題。如果說,囚徒困境是一個有助于發(fā)現(xiàn)問題的模型的話,三人博弈模型則指出了為了達(dá)到法治的可以加以利用的社會力量的問題。與二人博弈往往制造對立不同,三人博弈秩序的生成內(nèi)在地就蘊含著多元社會力量的合作與應(yīng)用的可能,三人博弈模型實際上是從邏輯上驗證了法律多元的可能性和現(xiàn)實性。其結(jié)論的拓展無疑對于我們走出法治思維的囚徒困境可以提供不少有用的幫助。
[1][3][4][13][美]馮·諾依曼,摩根斯坦.博弈論與經(jīng)濟(jì)行為(上)[M].北京:三聯(lián)出版社,2004.第五章,345,342,342.
[2][美]羅伯特·諾奇克.蘇格拉底的困惑[M].郭建玲,陳郁華譯.北京:新星出版社,2006.123.
[5][美]羅杰·A·麥凱恩.博弈論戰(zhàn)略分析入門[M].原毅軍,等譯.北京:機(jī)械工業(yè)出版社,2007.58.
[6][8][9][美]羅伯特·阿克塞爾羅德.合作的進(jìn)化[M].吳堅忠譯.上海:上海人民出版社,2005.1,190-253,89.
[7][美]羅伯特·埃里克森.無需法律的秩序:鄰人如何解決糾紛[M].蘇力譯.北京:中國政法大學(xué)出版社,2003.
[10]桑本謙.私人之間的監(jiān)控與懲罰——一個經(jīng)濟(jì)學(xué)的進(jìn)路[M].濟(jì)南:山東人民出版社2005.2.
[11]蘇力.法治及其本土資源[M].北京:中國政法大學(xué)出版社,1996.43.
[12]李文田.黑手黨[M].北京:三聯(lián)書店,1987.7-11.
Triad Game Theory of the Criminal Procedure Law
Han Ziqiang
(Guangdong Ocean University,Zhanjiang,Guangdong 524088)
Prisoner's Dilemma is the classic model in the Game Theory.But it is not the only Game model in the Game Theory.Three-person group model or triad model is another model which is a powerful tool to explain a lot of pheromone of real life.This article discusses the meanings and application of triad model to the criminal procedure law.
Prisoner's Dilemma;triad model;Criminal Procedure Law
D909
A
2095-3275(2015)02-0140-06
2014-12-31
韓自強(qiáng)(1967— ),男,湖北孝感人,廣東海洋大學(xué)法學(xué)院副教授,研究方向:經(jīng)濟(jì)法,法經(jīng)濟(jì)學(xué)。