略論博弈論中囚徒困境的人性因素

2004-04-29 12:41:21李立群

市場周刊 2004年8期

李立群

摘要：博弈論是西方經(jīng)濟學中的一種重要理論，對現(xiàn)代經(jīng)濟理論的發(fā)展作出了重要貢獻，囚徒困境是博弈論中的一個經(jīng)典案例，人們經(jīng)常運用囚徒困境理論來分析一些問題。本文主要從其人性角度談一些自己的想法。

關鍵詞：博弈論囚徒困境啟示

囚徒困境是博弈論中的一個經(jīng)典案例，也是目前學界注意力的焦點所在。不少人將囚徒困境理論用來解釋我們生活中的各種現(xiàn)象，例如出版界屢禁不絕的盜版現(xiàn)象、在高等教育考試中尤其是高考和四級考試中的誠信，以及國際時政問題的觀察和分析。確實，運用囚徒困境理論來分析一些問題時，在切入點、視角方面有令人耳目一新之感，但需要指出的是，目前我們對囚徒困境理論的理解至少還忽略了一點，那就是這一理論中所蘊含的人性因素――人性本惡基本價值判斷。

一、囚徒困境的基礎是人性本惡

所謂“囚徒困境”，實際上指是經(jīng)濟學上的一種原理。其內(nèi)容大同小異，大致是說有兩個人共同犯罪，被警方抓獲并分別關押，但警方并沒有掌握確鑿的證據(jù)。這時兩個囚徒就面臨著三種選擇：一、兩個人都拒不交代，將無罪釋放；二、都交代罪行，并揭發(fā)同伙，各判10年；三、一個人拒不交代，另一個人坦白并揭發(fā)同伙，坦白者判刑5年，拒不交代者判刑20年。

對其中一個囚徒甲來講，如果選擇拒不交代，要么被判無罪，這個結果的前提是同伙B也不交代；要么被判20年，前提是B坦白了；如果選擇了坦白，要么被判10年，前提是同伙B也坦白；要么被判5年，前提是B拒不交代。囚徒乙的選擇結果也一樣。這樣看來，囚徒的選擇事實上是一種賭博，賭同伙不交代風險太高，而自己交代則風險最低。因此一般來講，兩個囚徒都會選擇坦白，這也正是警方所要達到的目的。

純經(jīng)濟學家往往會指出，囚徒困境悖論是一個非零和游戲，囚徒甲、乙都是理性的，他們所關心的是自己會被判多少年，至于對方被判多少則不在自己的考慮范圍之內(nèi)，由此，理性的囚徒甲、乙所做出的選擇最后看來卻是不合理性的。所謂“純利已動機的個人，也會因追求哪怕是合理的自利而對整體造成危害” ，這正好與亞當·斯密的名言——“他(指經(jīng)濟人)自己的利益，往往使他能夠比在真正出于本意的情況下，更有效地促進社會的利益” ——恰恰相反。也就是說，囚徒困境理論反映了看起來很合理的個人行為與合作所得的利益間的矛盾，在一個個體看起來有利的策略卻可能帶來整體的不利，因為，在一個不知道其他的參賽者做什么的情況下，每一個個體參與者都期望獲得自身的最大利益，而不考慮別人的利益即是一個理性的“利己主義者”。

理性個體人的決定，結果卻導致了非理性的集體選擇。如果從人性的角度對這一現(xiàn)象加以剖析，就會發(fā)現(xiàn)人性本惡的傾向。

首先，我們先假設甲囚徒是善的，就會出現(xiàn)兩種結果：1、甲堅持不坦白，也不供出對方，乙也如是，這樣兩人都釋放，皆大歡喜。2、甲堅持不坦白，但乙坦白交代，這樣甲判20年乙判5年；這也沒什么，反正本來就有罪，應該坐牢的。

其次，再假設甲囚徒是惡的，也會出現(xiàn)兩種結果：1、甲坦白，供出對方，乙卻沒有坦白，這樣甲判5年、乙判20年。這里暫不考慮良心因素。2、甲坦白，供出對方，乙也坦白，供出對方，這樣雙方都判10年；反正有罪，坐牢就坐牢吧。

這里的不同之處在于，囚徒甲從善的角度出發(fā)，分別得到的兩種結果可以說是最好的（釋放）、最差的（判20年），而從惡的角度出發(fā)，分別得到的兩種結果則處于中間（分別是判5年、10年）。兩相比較，無論是囚徒甲還是乙，最不能接受的結果就是最差的那一種，即自己不坦白，對方卻交代。更為關鍵的是，如果甲選擇了善，乙或者釋放、或者判5年；如果甲選擇了惡，乙或者判20年、或者判10年，只要選善，對方的“下場”就會比自己超出一籌。顯然，只有選惡，對方才不會有比自己好的遭遇，在這種判斷下，甲、乙兩個囚徒都選擇惡式做法的可能性也就難免更大了。

二、對人性本惡的承認和限制

但事實上，把兩個囚徒選擇惡的做法看成是必然還不盡確切。因為上述囚徒困境理論實際上還有一個假設基礎，即囚徒甲、乙之間并不熟悉了解，只有在這種前提下，囚徒甲、乙才會做出讓警察滿意、即互相坦白的選擇來。而在現(xiàn)實生活，更多的情況則是兩個囚徒彼此有所了解，這時又會出現(xiàn)什么的結果呢？

可以肯定的認為，這時兩個熟悉的囚徒首先要考慮的是判斷對方的選擇，即囚徒甲首先要考慮囚徒乙選擇交代、坦白的可能性各為多少，然后才會根據(jù)這一判斷作出自己的判斷。如果囚徒甲很信任對方，知道乙的為人素來義氣為先，出了事自己扛，那么囚徒甲肯定會毫不猶豫地選擇A不交代；反之，如果囚徒甲知道乙肯定靠不住，他也會毫不猶豫選擇B坦白；只有第三種情況才是一種賭博，即囚徒甲不知道囚徒乙的為人，也就不知道囚徒乙會做出什么樣的選擇，當囚徒甲覺得這場賭博風險太大、不愿意進行這場賭博即選擇C時，就會趨向于選擇坦白。

也就是說，囚徒的選擇還要加上一個因素，即雙方是否互相信任的前提。

這樣看來，囚徒困境理論中必需要考慮的一個因素就是給對方的“誠信度”打多少分。也就是說，在兩個囚徒（范圍可以推而廣之）互為了解的前提下，選擇非A即B，只有互相不了解的情況下，才有可能出現(xiàn)選擇C，這種可能性很小，同樣是出于對另一方的不了解，選擇B是一條起碼的退路。因此，在一定程度甚至可以說，囚徒困境理論中的選擇C實際上僅僅是一個擺設，只是為了逼迫對方去走選擇C這條道路，在現(xiàn)實生活中出現(xiàn)的可能性是極小的。

這也是為什么繼囚徒困境理論后，一報還一報策略（TIT FOR TAT）最終取勝的原因所在。1984年，美國密西根大學一位叫做羅伯特·愛克斯羅德的教授組織了一場計算機競賽，任何參加者都扮演囚徒困境案例中一個囚犯的角色，然后他們的程序會被成雙成對地融入不同的組合。分好組以后，然后參與者就開始玩囚徒困境的游戲，重復多次地玩這個游戲，最后在這個游戲中，競賽的桂冠屬于其中最簡單的策略：多倫多大學心理學家阿納托·拉帕波特提交上來的一報還一報策略。

簡單來說，一報還一報的思路總是以合作開局，從此以后就采取以其人之道還治其人之身的策略，它永遠不先背叛對方，即永遠不先采取供出對方的選擇，但一旦對方在前一次合作中選擇了坦白，那么這個程序在接下來的游戲中肯定選擇供出對方。應該說，這一原則是胡蘿卜加大棒，融寬容和強硬于一體，同時這個程序所奉行的原則也是極為簡單明了的。正是這樣一樣策略，獲得了最終勝利。很顯然，一報還一報策略就建立在了解對方的基礎之上，在首次交手后即有了對方的“誠信”記錄，以后，或者以血還血、以牙報牙；或者投桃報李、互致善意，一報還一報策略的選擇就完全在人們的意料之中了。

由此可見，與其說囚徒困境理論證明了個體的理性導致集體的非理性這一現(xiàn)象，毋如說個體的缺乏溝通導致了集體的非理性來得更為確切。而一報還一報策略的高明之處則在于，表面上看并不限制對方選擇善或是惡的自由，但卻以一種明確的、以其人之道還治其人之身的方式告訴對方：不要選擇惡，否則自己將飲下自釀的惡之酒，從而在實質(zhì)上給對方上了一道緊箍咒。

三、囚徒困境理論的啟示

眾所周知，人性本惡是西方文化的基本判斷之一，這一點和中國傳統(tǒng)文化完全不同。例如按照基督教《圣經(jīng)》的說法，亞當與夏娃偷食了智慧之果，因而被上帝趕出了伊甸園，帶著罪惡來到了人世間，這就是原罪說，將其理解為人性本惡并無不妥之處。而中國自孟子開始，將人性本善的大旗高高舉起，“人性之善也，猶水之就下也，人無有不善，水無有不下” 。人性到底是善、是惡這涉及到哲學上的論爭，因超出本文討論范圍暫且不論。這里需要指出的是，一報還一報策略的立足點則是承認對方有選擇惡的權利，至少是承認了人性有本惡的一面，但同時確立了一報還一報的游戲規(guī)則，迫使人性朝著善的方向努力。也就是說，一報還一報策略的出發(fā)點是人性本惡，但最終歸宿、或者說努力方向卻是人性本善。

如此看來，囚徒困境案例背后隱藏的居然是關于人性的基本價值判斷。筆者以為，完整的囚徒困境理論應該將一報還一報策略也涵括在內(nèi)，這樣才形成一個整體，給人們的啟示也可以略作修改如下：

個體的理性行為確實可以導致集體的非理性結果，但這只是短時期的，從長遠看，只要輔以合適的制度——在囚徒困境理論中體現(xiàn)為一報還一報策略，那么個體的理性行為終導致集體的理性行為。其中，合理和有效的制度的設立和實施就成為了重中之重。

那么，什么樣的制度才是合理而有效的呢？首先應簡單而明確，要讓別人產(chǎn)生誤解的可能性被降低到了最小范圍。其次，制定新制度時應承認人性本惡，但努力的方向是人性本善，即承認一個人有選擇惡的可能和權利，但卻以巧妙地方式讓個性自覺地朝著善的方向靠攏。這又可以兩種方式表達出來：其一，規(guī)定選擇惡的后果是以血還血，這是以一種強硬的方式規(guī)范個性必需向著善的方向努力，也可以說是一根大棒；其二勾勒出一幅一旦選擇善后出現(xiàn)的彼此得利的圓滿局面（在囚徒困境中表現(xiàn)為雙方獲釋），這是以一種施惠的方式誘使個性心甘情愿地朝著善的方向努力，也可以說是一個胡蘿卜，這種方式也即所謂的胡蘿卜加大棒法。

四、結語

上面，筆者通過對囚徒困境案例和一報還一報策略作出了簡要分析，并著重指出了其中包含的人性本惡這一屬于西方傳統(tǒng)的價值判斷對決擇結果的影響。需要強調(diào)的是，我們在討論囚徒困境理論時，往往會自覺不自覺地忽略這一基本價值判斷，這不利于我們對囚徒困境理論討論的深入。此外，囚徒困境理論同樣也揭示了什么樣的制度才是一項合理有效的制度，這對于我們目前正處于當務之急的制度建設應該說也不無禆益。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

略論博弈論中囚徒困境的人性因素