黃梓佳 張豪
一、博弈論概述
最早開始了解到博弈論是從電影《美麗心靈》里,納什與他的四位同學(xué)在酒吧遇見了一位美麗的金發(fā)女郎,大家紛紛表示自己很有欲望和她談戀愛,可惜科學(xué)家似乎都有色心沒色膽,他們互相推諉,卻沒有人敢于實(shí)踐。如果所有的人都去追求金發(fā)美女,那么他們都會(huì)失敗,當(dāng)他們再轉(zhuǎn)而追求她的女伴們時(shí),就會(huì)慘遭拒絕,因?yàn)闆]有誰會(huì)愿意屈居第二;但如果他一開始就去追求她的女伴們,那么就會(huì)成功,而金發(fā)美女則會(huì)遭到冷落,納什便能乘虛而入,這樣所有人就都得到了和金發(fā)女郎談戀愛的機(jī)會(huì)。博弈論已成為當(dāng)今分析經(jīng)濟(jì)問題的兩種最有力的方法之一,必將使問題的分析以更加符合現(xiàn)實(shí)的方式揭示經(jīng)濟(jì)活動(dòng)的內(nèi)在規(guī)律。
什么是博弈論,博弈論的教材中的定義是“研究決策主體的行為在直接相互作用時(shí),人們?nèi)绾芜M(jìn)行決策,以及這種決策如何達(dá)到均衡的問題”。博弈論分析的關(guān)鍵步驟是找出在別人選擇既定策略的情況下找到自已的最優(yōu)反應(yīng)策略,也就是給自已帶來最大收益的策略。博弈論在當(dāng)今社會(huì)已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。
二、博弈論的劃分
博弈論的劃分可以從兩個(gè)角度進(jìn)行。第一個(gè)角度是參與人行動(dòng)的先后順序。從這個(gè)角度,博弈可以劃分為靜態(tài)博弈和動(dòng)態(tài)博弈。第二個(gè)角度是參與人對有關(guān)其他參與人的特征以及策略空間的認(rèn)識(shí)。從這個(gè)角度,博弈可以劃分為完全信息博弈和不完全信息博弈。將上述兩個(gè)角度的劃分結(jié)合起來,就可以將博弈論劃分為四種不同的類型:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。
三、完全信息靜態(tài)博弈
關(guān)于納什均衡最經(jīng)典的例子就是囚徒困境的例子。我們先通過分析囚徒困境從而對后面的五星級(jí)酒店在節(jié)假日如何定價(jià)等內(nèi)容做一些鋪墊。通過下圖我們可以看到,兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴,坦白的放出去,抵賴的判十年。于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,抵賴的話判十年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。結(jié)果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個(gè)結(jié)果好。囚徒困境所反映出的深刻問題是,人類的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性聰明的人類會(huì)因自己的聰明而作繭自縛,或者損害集體的利益。
從上面的內(nèi)容看出,首先,囚徒A和囚徒B都是具有完全信息的,每個(gè)囚徒對另外一個(gè)囚徒的特征(包括可選擇的策略、可能的結(jié)果)有完全的了解。其次,無論是囚徒A還是囚徒B,“坦白”總是最好的策略,即個(gè)人的占優(yōu)策略。最后,當(dāng)兩方都選擇了“坦白”策略時(shí),即為“均衡”。
但在重復(fù)的囚徒困境中,博弈被反復(fù)地進(jìn)行。因而每個(gè)參與者都有機(jī)會(huì)去“懲罰”另一個(gè)參與者前一回合的不合作行為。這時(shí),合作可能會(huì)作為平衡的結(jié)果出現(xiàn)。欺騙的動(dòng)機(jī)這時(shí)可能被懲罰的威脅所克服,從而可能導(dǎo)向一個(gè)較好的、合作的結(jié)果。反復(fù)的、接近無限的重復(fù)次數(shù)時(shí),納什均衡趨向于帕累托最優(yōu),從互相背叛趨向于互相忠誠,這在之后的現(xiàn)實(shí)應(yīng)用中也一樣會(huì)出現(xiàn)。
四、完全信息動(dòng)態(tài)博弈
上文的內(nèi)容主要介紹的是完全信息下的靜態(tài)博弈,但現(xiàn)實(shí)生活不僅僅只有這一種情況,如果再加入動(dòng)態(tài)博弈的話可能會(huì)更符合現(xiàn)實(shí)生活中的應(yīng)用。而兩者的區(qū)別之處在于,靜態(tài)博弈是所有參與人同時(shí)行動(dòng)(或許有先動(dòng),但沒有人在所有行動(dòng)之前能觀測到別人的行動(dòng))。而動(dòng)態(tài)博弈則是參與人的行動(dòng)有先后順序,且后行動(dòng)者在自己的行動(dòng)之前能觀測到先行動(dòng)者的行動(dòng)。
中國的很多節(jié)假日 (如十一國慶節(jié))是酒店(尤其是五星級(jí)酒店)生意最好的時(shí)候(而酒店工作日的生意比較冷清),在節(jié)假日之前就會(huì)開始預(yù)訂房間,此時(shí)假設(shè)在一個(gè)景點(diǎn)附近只有二家五星級(jí)酒店A和B(事實(shí)上一般不止二家),A與B這兩家酒店在節(jié)假日會(huì)出現(xiàn)二種不同的定價(jià)可能,即一種是提價(jià),但可能影響的客房量,另一種是少提價(jià)(提價(jià)比例不那么高),雖很可能滿房但賺到超的額利潤不多。我們從靜態(tài)博弈的視角來分析,產(chǎn)生了四種不同的組合。第一種情況是A和B兩家酒店都少提價(jià)(提價(jià)比例不那么高),所以兩家酒店賺超額利潤都較少,即兩家酒店超額利潤都是2。第二種情況是兩家酒店都提價(jià)了,即兩家酒店超額利潤都是8。還有二種情況都是一家酒店提價(jià)了而另一家酒店少提價(jià),結(jié)果是提價(jià)的酒店超額利潤是-10(可能游客不訂,但節(jié)假日酒店成本會(huì)更高些),而另一家酒店生意火爆,并賺到了超額利潤10。
假設(shè)A和B兩家酒店經(jīng)營者都是理性的,從表中可以看到,顯然選擇少提價(jià)的方案對自身更有利,即不論對方如何選擇,“不提價(jià)”總是最好的策略,即占優(yōu)策略。從上面的例子可以看出,兩家酒店都提價(jià)并不是納什均衡,因?yàn)橹灰硪患揖频赀x擇少提價(jià)就可以得到更多的超額利潤。所以,這個(gè)狀態(tài)不是一個(gè)納什均衡——因?yàn)橛幸环娇梢酝ㄟ^改進(jìn)策略多贏錢。最后雙方非合作博弈的納什均衡狀態(tài)一定是兩家酒店都無奈選擇了“少提價(jià)”的方案。
我們再從動(dòng)態(tài)博弈(即是參與人的行動(dòng)有先后順序,且后行動(dòng)者在自己的行動(dòng)之前能觀測到先行動(dòng)者的行支動(dòng))的視角來分析,上表中假設(shè)B酒店在第1次選擇了“提價(jià)”,而A酒店選擇“少提價(jià)”,那么A酒店的超額利潤應(yīng)該是10+2(T-1)(這里的T代表時(shí)期)。如果當(dāng)B酒店是非理性的(選擇“提價(jià)”),而A酒店也選擇“提價(jià)”,那么A酒店的超額利潤應(yīng)該是8T。還有另外一種可能就是,B酒店是理性的(選擇“少提價(jià)”),則此時(shí)A酒店正常情況下也會(huì)選擇“少提價(jià)”的方案,此時(shí)A和B酒店的超額利潤都是2T。
但在重復(fù)的每年的酒店節(jié)假日定價(jià)過程中,博弈被反復(fù)地進(jìn)行。盡管節(jié)假日酒店在選擇合作時(shí)都可能冒著被其他酒店搶生意的風(fēng)險(xiǎn),但如果他們不選擇合作,就會(huì)暴露了自己是非合作型,從而很有可能失去了長期合作收益的可能性。因?yàn)閲鴥?nèi)節(jié)假日酒店在定價(jià)上博弈幾乎一直在發(fā)生,即博弈次數(shù)足夠多,未來收益的損失就會(huì)遠(yuǎn)遠(yuǎn)超過短期的損失。因此,五星級(jí)酒店之間的節(jié)假日定價(jià)策略仍可能會(huì)出現(xiàn)合作博弈的結(jié)果。(作者單位為1 The University of Nottingham NG7 2RD;2 電子科技大學(xué))
第一作者:黃梓佳(1993.09--);女,湖北人,碩士,畢業(yè)于The University of Nottingham ;研究方向:會(huì)計(jì)與金融;