戴菊貴
(1.溫州大學 商學院,浙江 溫州 325035;2.上海財經(jīng)大學 國際工商管理學院,上海 200433)
考慮公平與道德條件的博弈論理性決策
戴菊貴1,2
(1.溫州大學 商學院,浙江 溫州 325035;2.上海財經(jīng)大學 國際工商管理學院,上海 200433)
博弈論中一個基本假設是參與人是理性的,即在面臨即定的約束條件下最大化自己的效用。這種假設稱之為理性選擇理論(RCT),是一種僅考慮收益絕對值的理性。文章從收益絕對性和收益相對性兩個角度闡述了理性的含義;并在新的理性范疇內(nèi)重新解釋了RCT簡單地歸結(jié)為“非理性”或“高尚品德”的行為;最后討論了理性與公平、道德的聯(lián)系和其社會意義。
理性選擇理論;風險占優(yōu);道德博弈;帕累托最優(yōu)
博弈論中的一個關鍵假設是參與人是理性的,即在面臨即定的約束條件下最大化自己的偏好或效用。這種最大化個人效用的行為假設被稱為理性選擇理論(RCT)[1],否則就稱參與人的選擇是非理性的。但參與人的選擇真的是非理性的嗎?考慮一個簡單的分配博弈,規(guī)則如下:假設有一筆錢(如100元),甲首先提出分配比例,乙其次選擇接受還是拒絕。如果接受則按提議的比例分配,如果拒絕則甲乙兩人都什么也得不到。那么甲應該提出一個什么比例呢?按照標準博弈理論,只要甲的提議使乙的所得大于0,乙就會接受甲提議的分配方案。但根據(jù)不同國家所做實驗,甲提出的分配比例大致都在40~50%之間,而且低于一定比例則乙會選擇拒絕而使雙方什么也得不到[2]。理性選擇理論(RCT)既無法解釋為什么甲會提出40~50%的比例而不是略大于0,也無法解釋乙為什么會拒絕低于一定比例的分配而寧愿雙方的收益都為0。因為他們的行為都不符合理性選擇理論的假設。大部分經(jīng)濟學家對理性選擇理論的批判集中在 “有限理性”、“有限意志”、“有限自利”三個限制性條件上,從這三個條件上解釋這些所謂的 “非理性行為”,或則把甲的行為歸結(jié)為“高尚的道德”。但筆者認為,這些看似非理性的行為其實是參與人理性的選擇,因為理性選擇理論只是從參與人收益絕對值的角度考慮而認為這些行為是非理性的,但如果從收益相對值的角度分析則甲、乙的行為其實都是理性的。正如阿馬蒂亞.森(2002)所言“…但我們不能錯誤地認為這種博大的關懷并不包含在理性之中。理性中仍有許多空間來置放這些關懷,絕不可幼稚地將它們付給所謂的‘非理性’”[1]。
博弈論中常用重復占優(yōu)策略求解均衡。但是占優(yōu)策略均衡是最優(yōu)的嗎?Beard和Beil(1994)[3]通過一個二次重復占優(yōu)博弈實驗檢驗占優(yōu)策略均衡。其實驗如表1所示。
表1 Beard and Beil的重復剔除占優(yōu)博弈
博弈順序如下,參與者1先行動,參與者2其次行動。這個博弈實驗是檢驗參與者1是否相信參與者2服從占優(yōu)策略。從支付矩陣可以看出:r是參與者2的弱占優(yōu)策略,因為理性是共同知識,所以在參與者1選擇R后,參與者2只能選擇r,(R,r)就是占優(yōu)策略均衡,兩者的收益分別為10和5。但是如果參與者2在參與者1選擇R后選擇m而不是r,那么參與者1的收益為3,而參與者2的收益卻為4.75。如果參與者1選擇M,不管參與者2選擇m還是r,都可以得到9.75。參與者是否值得為了多得0.25(10-9.75)的收益,而承擔失去6.75(9.75-3)的風險呢?
在這個實驗中,66%的參與者1選擇了M,說明有34%的參與者1對參與者2的“理性”是懷疑的。如果參與者1選擇R,有83%的參與者2會選擇r回應。這看起來大部分參與者2的選擇似乎還是理性的。但如果參與者2選擇r的比例只有83%,那么參與者1的最優(yōu)策略是選擇M而不是R。為什么呢?假設參與者1是風險中性的,閾值P(r|R)為參與者1對選擇R與M的偏好程度相同的概率,我們可以求出閾值為0.97。在實驗中只有83%的參與者2在參與者1選擇R的情形下選擇r,低于97%,即參與者1選擇R的期望收益低于選擇M的期望收益,因此參與者1的理性選擇應該是M而不是R。按照Zelten的“顫抖手均衡”[4]概念,即使參與者2是理性的,參與者2也可能有犯錯誤的時候,如果他的手“一顫抖”,本來打算選r的時候卻不小心選擇了m,只要犯錯的概率超過3%,那么參與者就應該選擇M而不是R。所以M是參與者1的“風險占優(yōu)策略”(risk-dominance strategy),選擇R對參與者1來說是有較大風險的。
Beard和Beil通過變化支付函數(shù),檢驗影響子博弈完美均衡的各種因素,以及影響參與者1對于參與者2違反理性占優(yōu)可能性的信念的因素。表2總結(jié)了各種實驗的結(jié)果。
在方案5中,參與者1如果選擇R而使參與者2喪失了獲得收益6的機會,那么參與者2很可能會選擇m作為報復。意識到這一點,參與者1選擇M的比例最高,達到86%。參與者2通過這種“報復威脅”迫使參與者1選M而不選R。那么參與者2的威脅是可信的嗎?
表2 Beard and Beil各種支付方案及實驗結(jié)果
理性選擇理論是一個“絕對值”的概念,僅考慮使自己的收益最大化。但是這種“收益最大化”的理性選擇理論顯然無法解釋以上這些行為,更不能簡單地歸結(jié)為“非理性”。阿馬蒂亞.森(Amartya Sen)反對哪種只追求自己自私目標而不考慮其他人福利的理性假設,稱他們?yōu)椤袄硇缘纳底印盵5]。在方案5中如果參與者1選擇R,那他就是個“理性的傻子”。參與者在做選擇時不僅要考慮到自己的絕對收益,還要考慮自己與其他人之間的收益差距和 “收益位置”,因而理性不是一個“絕對值”的概念而是一個 “相對值”的概念。
參與者的選擇策略不僅取決于自己支付函數(shù)絕對值的大小,還取決于于自己的支付函數(shù)與其他參與者的支付函數(shù)比較的相對大小。一個人的效用不僅取決于自己的絕對收入,還取決于自己的相對收入和自己的收入在社會總體收入中的位置,以及收益分配的公平程度。我國居民現(xiàn)在的絕對收入水平都比以前高了許多,為什么大家的生活壓力反而比以前增加了呢?甚至社會上產(chǎn)生了“仇富”現(xiàn)象。原因即在于雖然絕對收入大家都增加了,但相對收入的差距拉大了,使人心理產(chǎn)生不平衡。在大家的收入都低的時候,收入與社會地位相差不大;在收入差距拉大后,人的社會地位也拉大了。人的效用在許多時候是取決于其在整個分配體系中的位置或者分配制度是否公平,而不是分配數(shù)額的多少。
在Beard和Beil的基準方案中,在參與者1選擇R的條件下,參與者2如果選擇r,那么他的收益就比參與者1少5個單位;而如果選擇m,則他的收益反而比參與者2多1.75個單位。對于參與者2來說,選擇策略r的絕對收益雖然比選擇策略m高(0.25),但他在這個分配體系中是“相對窮人”(-5),處于相對劣勢位置;選擇m的絕對收益雖然比選擇r少一點(0.25),但他在這個分配體系中卻是“相對富人”(+1.75),處于相對優(yōu)勢位置,也就是說他的“收益位置”在這兩個分配體系中剛好倒置了。所以對參與者2來說,在參與者1選R的條件下選擇m是理性的。意識到參與者2很可能由于“仇富”選擇m,參與者1的理性選擇是M而不是R。所以在方案5中,參與者2的威脅是可信的。從這個意義上來講,參與人的理性選擇包括兩個含義:一是收益的絕對性;二是收益的相對性。收益的相對性含有公平性的意思。參與者的效用函數(shù)不僅包括收益的大小,也包括收益的比較。從這里就不難理解為什么現(xiàn)在人們的收入雖然提高了,但壓力卻增加了,效用有可能反而降低了。
Rabin(1993)[6]建立了一個“公平博弈”模型,認為參與者會善待對自己友善的人,而敵視傷害過自己的人。Jolls,Sunstein和Thaler(1998)[7]認為人是有限自利的,不僅有利他主義行為,而且希望得到公平對待,并且如果他人都公平行事的話,那么其也必將公平對待他人。Fehr和 Schmidt(1999)[8]提出了避免不均等的一個 “嫉妒或內(nèi)疚”模型。在他們的模型中參與者不僅關心自己的收益而且關心自己的收益與其他參與者收益之間的差別。參與者i對社會分配X(x1,x2,….,xn)的效用函數(shù)如下:
其中,0≤βi≤1,βi≤αi從效用函數(shù)看到,參與者會本能地產(chǎn)生嫉妒和內(nèi)疚的感覺:他們不愿意獲得比別人低的分配(這時表現(xiàn)為嫉妒,用αi衡量),但也不愿獲得比別人高的分配(這時表現(xiàn)為內(nèi)疚,用βi衡量),內(nèi)疚的程度比嫉妒的程度稍輕(βi≤αi)。 Bolton 和 Ockenfels(2000)[9]提出了另一個解釋避免不均等的模型。在他們的模型中,參與者不僅關心自己的收益而且關心他的相對份額的比例。參與者i對社會分配X(x1,x2,….,xn)的效用函數(shù)如下:
參與者嚴格偏好一個等于平均值1/n的收益,意味著參與者的選擇使他們的相對收入達到均衡。這些模型背后的哲學原理都是羅爾斯的公平主義。只是Fehr和Schmidt模型假定參與者關心絕對差異,而Bolton和Ockenfels模型假定參與者關心的是其相對收益。
在實驗1到5中,如果參與者1選R而參與者2選m,參與者2的行為看上去是“損人不利己”的,在道德上似乎要受到譴責。但是在博弈論中,博弈的最后均衡結(jié)果是參與者最優(yōu)反應函數(shù)的解,是參與者之間相互作用的結(jié)果。一個參與者的收益需要另一個參與者的配合策略才能獲得。參與者在博弈中應該有“利他主義”的考慮,因此我們不能責怪后行動者不配合先行者。為什么先行者不能替后動者考慮一下呢?在分配博弈中,如果甲的提議是1%而乙拒絕使雙方收益都為零,那么是甲還是乙應該受到譴責?如果因為甲提出的比例太低而使乙拒絕這種情形發(fā)生的話,道德上受到譴責的是應該甲,他應該為自己的多得而感到“內(nèi)疚”(Fehr和Sohmidt)。正是因為有乙的拒絕威脅使甲提高分配比例,使兩人的分配比例比較均衡。在Beard和Beil的方案5中,有86%的參與者1選擇M。如果參與者1選擇了R而使參與者2失去了獲得6個單位收益的機會,那么參與者2在參與者1選擇R后會選擇m而不是選擇M,參與者1想得到收益10的愿望就會落空。參與者1“損人利己”在先,所以只指責參與者2顯然是有失公平的。
經(jīng)濟學的另一個評判標準是衡量均衡策略帶來的社會總福利的大小。在Beard和Beil的基準方案中,占優(yōu)均衡策略(R,r)的社會總收益為 15,而相對公平均衡(M,m)的社會總收益是12.75,比(R,r)的社會總收益少了2.25個單位。即由于參與者2的報復威脅而達成的公平均衡使社會總收益降低了。但社會總收益減少了就說明社會總福利下降了嗎?前面我們分析過,參與者的效用函數(shù)不僅取決于收益的絕對值大小,還取決于收益分配差距和公平程度,因此均衡(M,m)雖然比均衡(R,r)的社會總收益少了2.25個單位,但由于其分配更公平,其社會總福利很有可能更高。在方案5中,均衡(M,m)的社會總收益是 15.75,反比(R,r)多了 0.75單位的總收益。均衡(M,m)不僅比均衡(R,r)的社會總收益更高,而且分配更公平,收益的差距更小,因而其社會總福利肯定比(R,r)更高。因此參與者2的“報復威脅”行為不一定會減少社會總福利,其“損人不利己”的行為反而可能會增加社會總福利,達到帕累托最優(yōu)。
理性包含有收益的絕對值和相對值兩重涵義。參與者要避免做一個“理性的傻子”,在選擇策略時不是僅考慮自己的絕對收益,而且還要考慮對手的收益,同時兼顧收益的差距和收益的公平,這樣才能減少“仇富”現(xiàn)象,避免兩敗俱傷的局面發(fā)生。我國現(xiàn)在提倡建立“和諧社會”,就是要減少“自私的理性”而做到“公平的理性”,不僅要達到個人福利的最大化,而且要達到社會總福利的最大化。
[1]阿馬蒂亞.森.理性與自由[M].李風華譯.北京:中國人民大學出版社,2006.
[2]科林.凱默勒.行為博弈——對策略互動的實驗研究[M].賀京同等譯.北京:中國人民大學出版社,2006.
[3]Beard.T Randolph,Richard Beil.Do People Rely on the Selfinterested Maximization of Others?An Experimental Test[J].Management Science(S0025-1909),1994,40(2).
[4]Fudenberg,Drew, Jean Tirole.GameTheory[M].Cambridge:MIT Press,1991.
[5]肯.賓默爾.博弈論與社會契約——公平博弈(第1卷)[M].王小衛(wèi)等譯.上海:上海財經(jīng)大學出版社,2003.
[6]Rabin,Matthew.Incorporating Fairness into Game Theory and E-conomics[J].American Economic Review(S0002-8282),1993,83(5).
[7]Jolls Christine,Cass Sunstein,Richard Thaler.A Behavioral Approach to Law and Economics[J].Stanford Law Review(S0038-9765),1998,50(7).
[8]Bolton,GaryE,AxelOckenfels.ERC:A TheoryofEquity,Reciprocity,and Competition[J].American Economic Review(S0002-8282),90(1).
[9]Fehr,Ernst,Klaus M Schmidt.A Theory of Fairness,Competition and Cooperation[J].Quarterly Journal of Economics(S0033-5533),1999,114(4).
F224
A
1002-6487(2010)22-0045-03
戴菊貴(1976-),男,江西吉安人,博士研究生,講師,研究方向:產(chǎn)業(yè)組織理論、博弈論應用。
(責任編輯/亦 民)