王巧
【摘 要】信息是博弈論研究中的一個(gè)基本概念,而參與人了解信息的程度則是分析古諾博弈模型需要考慮的一個(gè)重要問題。本文首先描述了經(jīng)典的完全信息下古諾產(chǎn)量博弈模型中的參與人完全理性假設(shè),然后討論了不完全信息下參與人的三種理性預(yù)期假設(shè)類型,包括幼稚期望、適應(yīng)性期望和有限理性期望。理論分析得出:不同信息條件下對(duì)古諾博弈模型中參與人的理性假設(shè)是不同的,進(jìn)而會(huì)影響著模型的建立以及博弈的最終結(jié)果。
【關(guān)鍵詞】古諾模型;博弈;信息;理性假設(shè)
Rationality Assumption in Cournot Game Model
WANG Qiao
(Faculty of Science, Jiangsu University, Zhenjiang Jiangsu 212013, China)
【Abstract】Information is an essential notion in game theory research. It needs to specially consider how much players know about the market information in analysis of Cournot game model. In this article, it first describes the assumption of complete rationality in Cournot output game based on complete information. It also shows three different expectations of players under incomplete information, including naive expectation, adaptive expectation and bounded rationality. It deduces that the assumption of players types differ under differnet information condition and then effect the model result of game.
【Key words】Cournot model;Game;Information;Rationality assumption
0 引言
在博弈理論的研究中,信息是一個(gè)基本的概念,指的是參與人在博弈過程中所能掌握的知識(shí),包括“自然”的選擇和其他參與人的特征等。比如,在新能源投資博弈問題中,市場(chǎng)的需求、政府的補(bǔ)貼政策、投資商A或B的投資與否、不同情況下的收益等都是知識(shí),而投資商A、B知道這些知識(shí)的本身也是一種信息。根據(jù)博弈的參與人對(duì)信息了解的程度,可將信息分為完全信息和不完全信息,其中完全信息表示每一個(gè)參與人對(duì)所有參與人的策略空間和收益函數(shù)等知識(shí)有著充分的了解,而只要有一個(gè)參與人不完全了解其他參與人的收益函數(shù)信息,那么信息就是不對(duì)稱的,也就是不完全信息?;诖?,本文將分別圍繞完全信息和不完全信息情境下對(duì)古諾博弈模型中的參與人理性假設(shè)問題進(jìn)行探討分析。
1 完全信息下古諾博弈模型的理性描述[1]
完全信息下古諾博弈模型對(duì)參與人的假設(shè)是完全理性的,可簡(jiǎn)要描述為:假設(shè)市場(chǎng)上有生產(chǎn)同質(zhì)產(chǎn)品的兩個(gè)寡頭企業(yè),分別記為企業(yè)1和企業(yè)2,他們了解市場(chǎng)的全部知識(shí),包括對(duì)手的特征和利潤(rùn)函數(shù),選擇的博弈策略均是生產(chǎn)的產(chǎn)量。設(shè)兩家企業(yè)在某時(shí)期生產(chǎn)產(chǎn)品的數(shù)量分別為q1和q2,總供給Q=q1+q2;產(chǎn)品的價(jià)格為p(Q),是市場(chǎng)總供給量的遞減函數(shù);不考慮固定成本,企業(yè)i的生產(chǎn)成本為Ci(qi),i=1,2。兩企業(yè)同時(shí)選擇產(chǎn)量策略,以實(shí)現(xiàn)利潤(rùn)的最大化。那么,企業(yè)i的利潤(rùn)函數(shù)為:
πi(q1,q2)=p(Q)qi-Ci(qi), i=1,2(1)
若策略組合(q■■,q■■)是納什均衡,則其應(yīng)滿足如下兩個(gè)企業(yè)利潤(rùn)函數(shù)的一階條件,
■(2)
解上述方程組即可得到每家企業(yè)為獲得最大收益的最優(yōu)產(chǎn)量??梢酝ㄟ^驗(yàn)證下列矩陣是負(fù)定的,從而確保所得的解為納什均衡。
■
2 不完全信息下古諾博弈模型中的理性假設(shè)
以上對(duì)經(jīng)典古諾產(chǎn)量博弈參與人的完全理性假設(shè),意味著參與人具有超強(qiáng)的信息捕捉能力,他們不僅了解對(duì)手、資源等市場(chǎng)情況同時(shí)能夠預(yù)測(cè)未來,具有在確定和不確定性環(huán)境中追求自身利益最大化的判斷和決策能力,并能夠在此基礎(chǔ)上準(zhǔn)確地作出最優(yōu)決策。這不僅要求參與人自身要具有完全理性,同時(shí)要求參與人互相信任對(duì)方的理性,有著理性的共同知識(shí)。然而隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,這種完全理性假設(shè)的弊端日漸明顯,現(xiàn)實(shí)生活中的行為參與人也不可能具有完全理性并熟知對(duì)手的決策行動(dòng)。
在對(duì)古諾產(chǎn)量博弈模型的深入研究過程中,考慮到現(xiàn)實(shí)環(huán)境的復(fù)雜性和人類認(rèn)知計(jì)算能力的局限性等,學(xué)者們逐步弱化對(duì)參與人具有完全理性的基本假設(shè),并提出了與不完全信息相符的理性預(yù)期假設(shè)。博弈主體根據(jù)假設(shè)的期望類型估計(jì)對(duì)手在未來的決策行為,并在此基礎(chǔ)上制定自己的最優(yōu)策略。顯然,不同形式的預(yù)期將會(huì)影響企業(yè)的微觀決策方式。
這里考慮古諾產(chǎn)量博弈中兩相鄰經(jīng)濟(jì)時(shí)期企業(yè)的產(chǎn)量決策過程,記企業(yè)i在t時(shí)期的產(chǎn)量為qi(t),則其在t+1時(shí)期的產(chǎn)量qi(t+1)是如下最優(yōu)化問題的解:
■(3)
其中,q■■(t+1)表示企業(yè)j對(duì)其競(jìng)爭(zhēng)對(duì)手i(i=1,2,i≠j)在t+1時(shí)期產(chǎn)量決策行動(dòng)的預(yù)期。若最優(yōu)化問題(3)有唯一解,將其記為:
■(4)
則函數(shù)f和g稱作最優(yōu)反應(yīng)函數(shù)。
首先,放棄參與企業(yè)對(duì)其競(jìng)爭(zhēng)對(duì)手產(chǎn)量決策行為了如指掌的嚴(yán)格限制,幼稚期望和適應(yīng)性期望相繼被用于參與人預(yù)期類型的假設(shè)。若參與人均具有幼稚期望[2],則企業(yè)j認(rèn)為對(duì)手i在下一時(shí)期的產(chǎn)量生產(chǎn)決策和當(dāng)期相同,即q■■(t+1)=q■(t),i=1,2。于是式(4)中的兩反應(yīng)函數(shù)所定義的離散動(dòng)力系統(tǒng)為:
■(5)
若參與人均具有適應(yīng)性期望[3],那么每個(gè)參與人預(yù)測(cè)競(jìng)爭(zhēng)對(duì)手在下一時(shí)期的決策行動(dòng)不再是簡(jiǎn)單地保持當(dāng)期的產(chǎn)量水平,而認(rèn)為是當(dāng)期對(duì)手的實(shí)際產(chǎn)量水平和前一時(shí)期對(duì)手產(chǎn)量水平預(yù)期的權(quán)重之和,也就是q■■(t+1)=q■■(t)+?淄(q■(t)-q■■(t)),i=1,2。從而式(4)中的兩反應(yīng)函數(shù)所表示的離散動(dòng)力學(xué)模型為
■(6)
不難看出,具有幼稚期望的參與人過于理想化,而幼稚期望是適應(yīng)性期望的一個(gè)特例。(下轉(zhuǎn)第23頁)
(上接第9頁)其次,學(xué)者提出參與人不具備完全的市場(chǎng)需求知識(shí),而是通過預(yù)估或計(jì)算得到產(chǎn)品的邊際利潤(rùn)信息來調(diào)整自己的產(chǎn)量生產(chǎn)決策,從而實(shí)現(xiàn)局部利潤(rùn)的最大化。當(dāng)參與人觀測(cè)到的邊際利潤(rùn)大于零時(shí),其會(huì)加大生產(chǎn)力度;相反地,若邊際利潤(rùn)為負(fù),則會(huì)減少產(chǎn)品的生產(chǎn)量。如上根據(jù)局部邊際利潤(rùn)調(diào)整產(chǎn)量策略的行為參與人被定義成是有限理性的或是具有有限理性預(yù)期的[4]。相應(yīng)的產(chǎn)量動(dòng)態(tài)調(diào)整方程為:
■(7)
式中的α■(q■(t)),i=1,2,指的是企業(yè)i對(duì)單位產(chǎn)品利潤(rùn)的反應(yīng)調(diào)整速度。
3 結(jié)束語
本文從信息視角,分別討論了完全信息和不完全信息條件下,古諾博弈模型中參與人的理性假設(shè)問題。在完全信息條件下,古諾產(chǎn)量博弈模型中的參與人具有完全理性;在不完全信息下,古諾博弈模型中的參與人具有三種理性預(yù)期,包括幼稚期望、適應(yīng)性期望和有限理性期望,博弈主體將根據(jù)假設(shè)的期望類型來估計(jì)對(duì)手的決策行為,并在此基礎(chǔ)上制定自己的最優(yōu)策略。
【參考文獻(xiàn)】
[1]肖條軍.博弈論及其應(yīng)用[M].上海:三聯(lián)書店,2004:58-59.
[2]Theocharis R D. On the stability of the Cournot solution on the oligopoly problem[J]. The review of economic studies, 1960,27(2):133-134.
[3]Okuguchi K. Adaptive expectations in an oligopoly model[J]. The Review of Economic Studies, 1970:233-237.
[4]Bischi G I, Naimzada A. Global analysis of a dynamic duopoly game with bounded rationality[M]. Advances in dynamic games and applications. Birkh?覿user Boston, 2000: 361-385.
[責(zé)任編輯:湯靜]
■(5)
若參與人均具有適應(yīng)性期望[3],那么每個(gè)參與人預(yù)測(cè)競(jìng)爭(zhēng)對(duì)手在下一時(shí)期的決策行動(dòng)不再是簡(jiǎn)單地保持當(dāng)期的產(chǎn)量水平,而認(rèn)為是當(dāng)期對(duì)手的實(shí)際產(chǎn)量水平和前一時(shí)期對(duì)手產(chǎn)量水平預(yù)期的權(quán)重之和,也就是q■■(t+1)=q■■(t)+?淄(q■(t)-q■■(t)),i=1,2。從而式(4)中的兩反應(yīng)函數(shù)所表示的離散動(dòng)力學(xué)模型為
■(6)
不難看出,具有幼稚期望的參與人過于理想化,而幼稚期望是適應(yīng)性期望的一個(gè)特例。(下轉(zhuǎn)第23頁)
(上接第9頁)其次,學(xué)者提出參與人不具備完全的市場(chǎng)需求知識(shí),而是通過預(yù)估或計(jì)算得到產(chǎn)品的邊際利潤(rùn)信息來調(diào)整自己的產(chǎn)量生產(chǎn)決策,從而實(shí)現(xiàn)局部利潤(rùn)的最大化。當(dāng)參與人觀測(cè)到的邊際利潤(rùn)大于零時(shí),其會(huì)加大生產(chǎn)力度;相反地,若邊際利潤(rùn)為負(fù),則會(huì)減少產(chǎn)品的生產(chǎn)量。如上根據(jù)局部邊際利潤(rùn)調(diào)整產(chǎn)量策略的行為參與人被定義成是有限理性的或是具有有限理性預(yù)期的[4]。相應(yīng)的產(chǎn)量動(dòng)態(tài)調(diào)整方程為:
■(7)
式中的α■(q■(t)),i=1,2,指的是企業(yè)i對(duì)單位產(chǎn)品利潤(rùn)的反應(yīng)調(diào)整速度。
3 結(jié)束語
本文從信息視角,分別討論了完全信息和不完全信息條件下,古諾博弈模型中參與人的理性假設(shè)問題。在完全信息條件下,古諾產(chǎn)量博弈模型中的參與人具有完全理性;在不完全信息下,古諾博弈模型中的參與人具有三種理性預(yù)期,包括幼稚期望、適應(yīng)性期望和有限理性期望,博弈主體將根據(jù)假設(shè)的期望類型來估計(jì)對(duì)手的決策行為,并在此基礎(chǔ)上制定自己的最優(yōu)策略。
【參考文獻(xiàn)】
[1]肖條軍.博弈論及其應(yīng)用[M].上海:三聯(lián)書店,2004:58-59.
[2]Theocharis R D. On the stability of the Cournot solution on the oligopoly problem[J]. The review of economic studies, 1960,27(2):133-134.
[3]Okuguchi K. Adaptive expectations in an oligopoly model[J]. The Review of Economic Studies, 1970:233-237.
[4]Bischi G I, Naimzada A. Global analysis of a dynamic duopoly game with bounded rationality[M]. Advances in dynamic games and applications. Birkh?覿user Boston, 2000: 361-385.
[責(zé)任編輯:湯靜]
■(5)
若參與人均具有適應(yīng)性期望[3],那么每個(gè)參與人預(yù)測(cè)競(jìng)爭(zhēng)對(duì)手在下一時(shí)期的決策行動(dòng)不再是簡(jiǎn)單地保持當(dāng)期的產(chǎn)量水平,而認(rèn)為是當(dāng)期對(duì)手的實(shí)際產(chǎn)量水平和前一時(shí)期對(duì)手產(chǎn)量水平預(yù)期的權(quán)重之和,也就是q■■(t+1)=q■■(t)+?淄(q■(t)-q■■(t)),i=1,2。從而式(4)中的兩反應(yīng)函數(shù)所表示的離散動(dòng)力學(xué)模型為
■(6)
不難看出,具有幼稚期望的參與人過于理想化,而幼稚期望是適應(yīng)性期望的一個(gè)特例。(下轉(zhuǎn)第23頁)
(上接第9頁)其次,學(xué)者提出參與人不具備完全的市場(chǎng)需求知識(shí),而是通過預(yù)估或計(jì)算得到產(chǎn)品的邊際利潤(rùn)信息來調(diào)整自己的產(chǎn)量生產(chǎn)決策,從而實(shí)現(xiàn)局部利潤(rùn)的最大化。當(dāng)參與人觀測(cè)到的邊際利潤(rùn)大于零時(shí),其會(huì)加大生產(chǎn)力度;相反地,若邊際利潤(rùn)為負(fù),則會(huì)減少產(chǎn)品的生產(chǎn)量。如上根據(jù)局部邊際利潤(rùn)調(diào)整產(chǎn)量策略的行為參與人被定義成是有限理性的或是具有有限理性預(yù)期的[4]。相應(yīng)的產(chǎn)量動(dòng)態(tài)調(diào)整方程為:
■(7)
式中的α■(q■(t)),i=1,2,指的是企業(yè)i對(duì)單位產(chǎn)品利潤(rùn)的反應(yīng)調(diào)整速度。
3 結(jié)束語
本文從信息視角,分別討論了完全信息和不完全信息條件下,古諾博弈模型中參與人的理性假設(shè)問題。在完全信息條件下,古諾產(chǎn)量博弈模型中的參與人具有完全理性;在不完全信息下,古諾博弈模型中的參與人具有三種理性預(yù)期,包括幼稚期望、適應(yīng)性期望和有限理性期望,博弈主體將根據(jù)假設(shè)的期望類型來估計(jì)對(duì)手的決策行為,并在此基礎(chǔ)上制定自己的最優(yōu)策略。
【參考文獻(xiàn)】
[1]肖條軍.博弈論及其應(yīng)用[M].上海:三聯(lián)書店,2004:58-59.
[2]Theocharis R D. On the stability of the Cournot solution on the oligopoly problem[J]. The review of economic studies, 1960,27(2):133-134.
[3]Okuguchi K. Adaptive expectations in an oligopoly model[J]. The Review of Economic Studies, 1970:233-237.
[4]Bischi G I, Naimzada A. Global analysis of a dynamic duopoly game with bounded rationality[M]. Advances in dynamic games and applications. Birkh?覿user Boston, 2000: 361-385.
[責(zé)任編輯:湯靜]