• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      2×2型博弈決策均衡的歸一化解法

      2018-03-21 10:37:16李停
      統(tǒng)計與決策 2018年2期
      關(guān)鍵詞:混合策略局中人納什

      李停

      (銅陵學(xué)院經(jīng)濟學(xué)院,安徽銅陵244000)

      0 引言

      現(xiàn)實中生活中的企業(yè)決策,無論是產(chǎn)量、價格、廣告、研發(fā)都不再是孤立無關(guān)的,而是彼此間存在策略依存和策略互動。尤其是對生產(chǎn)日趨集中的寡占市場,企業(yè)任何行動都必須考慮其競爭對手的反應(yīng),傳統(tǒng)決策理論和運籌學(xué)方法很難解決這類利益相互影響的決策均衡問題。博弈論正是研究在利益相互影響的局勢中,局中人如何選擇自己的策略才能使自身的收益最大化的均衡問題[1]。近半個世紀(jì)以來,博弈論的理論和方法激起管理學(xué)家的極大興趣,將決策理論的發(fā)展推向前所未有的新高峰。納什均衡是博弈論最核心的概念,由于戰(zhàn)略管理本質(zhì)上也是組織如何在相互影響的對局中尋求決策均衡的問題,所以本文不加區(qū)分地使用納什均衡和決策均衡的概念。

      Nash(1950)[2]應(yīng)用數(shù)學(xué)上的不動點定理,證明了“任何有限的策略型博弈至少存在一個混合納什均衡”。隨后,Debreu(1952)[3]給出了“在n個局中人的策略型博弈中,滿足局中人策略空間Si是歐式空間的非空有界閉集、支付函數(shù)Ui(s)連續(xù)且對Si是擬凹函數(shù),該博弈存在一個純策略納什均衡”。這是博弈論學(xué)科發(fā)展過程中的兩大理論基石,解決了均衡的存在性問題。國內(nèi)學(xué)者中,李正龍(2001)[4]、朱年磊等(2006)[5]對靜態(tài)博弈純策略納什均衡的存在性作了延伸性探討。但從實踐應(yīng)用角度看,如何尋求納什均衡同樣不容忽視?,F(xiàn)有文獻(xiàn)大致可梳理出博弈均衡的三種求解方法:相對優(yōu)勢劃線法、期望支付等值法和最優(yōu)反應(yīng)函數(shù)法。這些方法不同程度地存在適用范圍有限、過程繁瑣等弊端。如何尋求一種歸一化解法,將復(fù)雜的納什均衡求解過程“簡單化、程序化和規(guī)范化”,正是本文的寫作目的。本文將在理論上證明,局中人的支付矩陣在局部變換下不改變博弈的均衡特征,并以納什均衡不變性定理為基礎(chǔ),完成16種類型的2×2型博弈決策均衡的歸一化求解。

      1 2×2型博弈構(gòu)成要素及均衡表述

      1.1 2×2型博弈的構(gòu)成要素

      對于完全信息的靜態(tài)博弈,策略型博弈模型是較為適當(dāng)?shù)谋硎?,而局中人、策略和支付是?gòu)成策略型博弈的三個基本要素。本文分析的2×2型博弈是指包含2個局中人,每個局中人只有2個策略的有限博弈。2×2型博弈構(gòu)成要素雖然簡單,但卻是分析N個局中人復(fù)雜博弈的基礎(chǔ)。從純粹數(shù)學(xué)意義上講,這無非是2維向量空間向N維向量空間的形式化推廣。

      于是G=(2,S1,S2,u1,u2)為2×2型博弈的策略型表示,S1、S2分別是局中人1、2的策略空間。在2×2型博弈中,S1、S2都只含有2個元素,記

      令s1、s2是局中人1、2具體的某個策略,s1∈S1,s2∈S2。u1、u2代表局中人1、2在各種策略組合下的支付。由于局中人和策略都是有限集,2×2型博弈的策略組合也是有限集,策略組合空間可表示為

      由于分析的是完全信息靜態(tài)博弈,策略等同于行動。記局中人1的行動集為α={α1,α2},局中人2的行動集為β={β1,β2}。再記u1(αi,βj)=aij,u2(αi,βj)=bij,i=1,2,j=1,2。該2×2型博弈的支付矩陣如表1所示:為下文分析方便,記表示局中人1、2的支付矩陣。

      表1 2×2型博弈的支付矩陣

      1.2 2×2型博弈的均衡表述

      由于并非所有2×2型博弈都有純策略納什均衡,需引入混合納什均衡的概念。局中人1的混合策略X=[p,1-p]表示分別以概率p、1-p選擇行動α1、α2。局中人2的混合策略Y=[q,1-q]T表示分別以概率q、1-q選擇行動β1、β2。利用支付矩陣A和B,局中人1、2的期望支付的代數(shù)表示為E1(X,Y)=XAY、E2(X,Y)=XBY。這里X表示局中人1的混合策略行向量,Y表示局中人2的混合策略列向量?;旌喜呗?X*,Y*)為G的混合納什均衡,當(dāng)且僅當(dāng)X*AY*≥XAY*、X*BY*≥X*BY對任何X、Y同時成立。易知當(dāng)p=1或p=0時,局中人1的混合策略e1=(1,0)、e2=(0,1)退化成純策略α1、α2;同樣,當(dāng)q=1或q=0時,局中人2的混合策略e1=(1,0)、e2=(0,1)退化成純策略β1、β2。因而混合策略包含著純策略的含義,對二者的分析便可以統(tǒng)一起來。

      2 納什均衡的不變性

      2.1 納什均衡不變性定理

      定理1:設(shè)G=(2,S1,S2,u1,u2)為某2×2型博弈,則納什均衡對任一局中人的支付函數(shù)的正仿射變換下不變。即對i∈{1,2},令(s)=σiui(s)+εi,其中σi>0。正仿射變換下的新2×2型博弈與G有相同的納什均衡。

      定理2:納什均衡在支付函數(shù)的局部變換下不變。

      2.2 納什均衡不變性定理的實質(zhì)

      定理1和定理2使用嚴(yán)謹(jǐn)而又晦澀的數(shù)學(xué)語言詮釋納什均衡的不變性。事實上,借助局中人支付矩陣A和B對該定理簡化,有助于把握納什均衡不變性定理的實質(zhì)。

      對G的支付函數(shù)作正仿射變換,相當(dāng)于對局中人1、2的支付矩陣A、B的每個元素乘以一個正數(shù)再加上一個常數(shù)。即A′=σ1A+ε1,B′=σ2B+ε2,其中,σ1,σ2>0,εi是元素取值為常數(shù)的2階方陣。

      對G的支付函數(shù)作局部變換,相當(dāng)于對A的某一列加一個常數(shù),或者對B的某一行加一個常數(shù)。即或者

      3 2×2型博弈的決策均衡

      3.1 局中人支付矩陣的對角化

      既然對支付函數(shù)的局部變換實質(zhì)是對局中人支付矩陣的列或行加某個常數(shù),那么一個自然的想法是只要常數(shù)選取得當(dāng),很容易將局中人的支付矩陣對角化。這將使得納什均衡求解過程得到簡化,以此為基礎(chǔ)可探討2×2型博弈決策均衡的歸一化解法,同時納什均衡不變性定理保證了這種探討的有效性。

      對局中人1的支付矩陣A進(jìn)行列變換,將其變成對角陣A′,具體過程如式(3)所示;對局中人2支付矩陣B進(jìn)行行變換,將其變成對角陣B′,具體過程如式(4)所示:

      由于任一2×2型博弈都可通過局部變換成對角陣,下文對其決策均衡的討論只需對支付矩陣是的2×2型博弈進(jìn)行。

      3.2 局中人的最優(yōu)反應(yīng)函數(shù)

      3.2.1 局中人1的最優(yōu)反應(yīng)函數(shù)

      局中人1的混合策略為X=(p,1-p),局中人2的混合策略為Y=(q,1-q)T。局中人1的最優(yōu)反應(yīng)是對不同的Y,選擇X最大化期望支付E1(p,q)。

      (1)a1>0,a2<0。當(dāng)a1+a2>0時,恒有此時,對?q∈[0,1],p=1最大化期望支付E1;而當(dāng)a1+a2<0時,顯然成立,從而也得到綜合起來,局中人1的最優(yōu)反應(yīng)函數(shù):p(q)=1,?q∈[0,1]。

      (2)a1<0,a2>0。類似情形(1),可得到此時恒有,故局中人1的最優(yōu)反應(yīng)函數(shù):p(q)=0,?q∈[0,1]。

      (3)a1>0,a2>0。當(dāng)時,恒成立。?p∈[0,1],都能最大化期望支付E1;當(dāng)時,,局中人1的最優(yōu)反應(yīng)是p(q)=0;當(dāng)時,,局中人1的最優(yōu)反應(yīng)是p(q)=1。局中人1的反應(yīng)函數(shù)可用分段函數(shù)表示:

      (4)a1<0,a2<0。類似情形(3),可得局中人1的最優(yōu)反應(yīng)函數(shù):

      3.2.2 局中人2的最優(yōu)反應(yīng)函數(shù)

      局中人2的最優(yōu)反應(yīng)是對不同的X,選擇Y最大化期望支付E2(p,q)。

      (1)b1>0,b2<0。局中人2的最優(yōu)反應(yīng)函數(shù):q(p)=1,?p∈[0,1]。

      (2)b1<0,b2>0。局中人2的最優(yōu)反應(yīng)函數(shù):q(p)=0,?p∈[0,1]。

      (3)b1>0,b2>0。局中人2的最優(yōu)反應(yīng)函數(shù)可用分段函數(shù)式(9)表示:

      (4)b1<0,b2<0。局中人2的最優(yōu)反應(yīng)函數(shù)可用分段函數(shù)式(10)表示:

      表2 2×2型博弈的決策均衡

      3.3 決策均衡

      由于局中人1和2的反應(yīng)函數(shù)都有4種情形,交叉組合后共有4×4=16種情形。上頁表2列出2×2型博弈在每種情形下的反應(yīng)函數(shù)圖形和決策均衡。表2中(ei,ej)是純策略納什均衡,如(e1,e2)表示[(1,0),(0,1)],亦即純策略組合(α1,β2)。粗實線表示相應(yīng)的反應(yīng)函數(shù)曲線。

      4 算例分析及方法比較

      以企業(yè)管理中著名的“協(xié)調(diào)”博弈為例,闡述不同決策均衡求解過程并進(jìn)行方法比較。企業(yè)1和企業(yè)2是相關(guān)行業(yè)內(nèi)的兩個廠商,都具備生產(chǎn)產(chǎn)品甲和乙的技術(shù)條件。比較而言,廠商1在產(chǎn)品甲生產(chǎn)上有比較優(yōu)勢,廠商2在產(chǎn)品乙生產(chǎn)上有比較優(yōu)勢。但由于生產(chǎn)過程中的技術(shù)互補的原因,兩家企業(yè)生產(chǎn)同一種產(chǎn)品更容易獲得外部規(guī)模經(jīng)濟?,F(xiàn)在的問題是,兩家企業(yè)如何協(xié)調(diào),實現(xiàn)產(chǎn)品選擇決策均衡。表3列出各種策略組合下的支付。

      表3 產(chǎn)品選擇“協(xié)調(diào)”博弈

      4.1 相對優(yōu)勢劃線法

      相對優(yōu)勢劃線法的基本思想是:對每個局中人在對手各種確定的策略情形下尋求其最優(yōu)策略,并在該局中人相應(yīng)的支付下面劃一短線。等兩個局中人都分析完成后,每個局中人支付下面都有短線的策略組合就是納什均衡。

      對于企業(yè)1而言,給定企業(yè)2選擇產(chǎn)品甲,選擇產(chǎn)品甲支付是3,選擇乙支付是-1,于是在(3,2)中局中人1的支付3下面劃線。類似這樣的討論對所有局中人的全部策略,劃線結(jié)果也在表3中同時給出。通過相對優(yōu)勢劃線法,容易得到該產(chǎn)品選擇“協(xié)調(diào)”博弈的決策均衡是(產(chǎn)品甲,產(chǎn)品甲)、(產(chǎn)品乙,產(chǎn)品乙)。

      相對優(yōu)勢劃線法的優(yōu)點是簡單易行,但只適用于純策略納什均衡的求解。

      4.2 期望支付等值法

      期望支付相等是混合納什均衡的一個重要性質(zhì)。如果(X*,Y*)是博弈G的一個納什均衡,這里X=[p,1-p]表示局中人1以概率p、1-p選擇行動α1、α2,Y=[q,1-q]T表示分局中人2以概率q、1-q選擇行動β1、β2,那么E1(X*,Y*)=E1(X,Y*)、E2(X*,Y*)=E2(X*,Y)對任意X、Y都成立。給定某局中人選擇均衡策略,另一局中人無論選擇什么混合策略都不改變其支付。在混合納什均衡點上,局中人的期望支付與另一局中人的策略選擇無關(guān)。這當(dāng)然也包括兩種純策略,由此引入求解2×2型博弈混合納什均衡的一種簡便方法——期望支付等值法。

      仍以產(chǎn)品選擇“協(xié)調(diào)”博弈為例,說明期望支付等值法的求解過程。對于企業(yè)1而言,當(dāng)企業(yè)2選擇混合策略(q,1-q)時,其選擇純策略產(chǎn)品甲和產(chǎn)品乙的期望支付相等,即:

      4.3 歸一化解法

      相對優(yōu)勢劃線法和期望支付等值法分別在求解2×2型博弈的純策略納什均衡和混合策略納什均衡方面有各自優(yōu)勢,但缺陷是適用范圍有限,容易造成解得遺漏。一個自然的想法是如何將兩種方法歸一化,探求對2×2型博弈的一般性求解方法。

      歸一化解法基于最優(yōu)反應(yīng)函數(shù)法,能有效減輕該方法在使用過程中的計算量。由表3,產(chǎn)品選擇“協(xié)調(diào)”博弈中局中人1、2的支付矩陣是:經(jīng)局部變換后的對角陣分別是:于是a1=4、a2=1、b1=1、b2=4,。查閱表2知該2×2型博弈有三個納什均衡:,分別是純策略納什均衡(產(chǎn)品甲,產(chǎn)品甲)、(產(chǎn)品乙,產(chǎn)品乙)和混合納什均衡

      通過方法比較后不難發(fā)現(xiàn),2×2型博弈決策均衡的歸一化解法利用納什均衡不變性定理,可將復(fù)雜的求解過程“簡單化、程序化和規(guī)范化”,具有普適性特征,且很好地解決了其他方法解的遺漏問題。

      [1]王文舉.經(jīng)濟博弈論基礎(chǔ)[M].北京:高等教育出版社,2010.

      [2]Nash J.Equilibrium Points in n-person Games[J].Proceedings of the National Academy of Science,1950,(36).

      [3]Debreu D A.Social Equilibrium Existence Theorem[J].Proceedings of the National Academy of Science,1952,(38).

      [4]李正龍.雙人靜態(tài)博弈純戰(zhàn)略納什均衡存在性判別[J].應(yīng)用數(shù)學(xué)與計算機學(xué)學(xué)報,2001,15(1).

      [5]朱年磊,李榮生.靜態(tài)博弈純戰(zhàn)略均衡存在性判別法[J].曲阜師范大學(xué)學(xué)報,2006,32(1).

      猜你喜歡
      混合策略局中人納什
      THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
      THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
      張一山、潘粵明聯(lián)手 演繹《局中人》
      綜藝報(2019年6期)2019-04-02 03:10:40
      混合策略的漢維輔助翻譯系統(tǒng)的設(shè)計與實現(xiàn)
      注冊制背景下上市公司與投資者的博弈分析
      會計之友(2016年22期)2016-12-17 15:26:44
      超對策模型中多形式結(jié)局偏好認(rèn)知信息融合的0—1規(guī)劃方法
      具有失真認(rèn)知信息的兩層沖突環(huán)境建模與分析
      基于混合策略博弈的我國工業(yè)碳減排分析
      已有薪資激勵背景下股票期權(quán)的推行前景和條件
      集體行動的博弈分析:基于相對公平相容約束
      南开区| 体育| 鸡东县| 灌云县| 库车县| 淮南市| 沐川县| 云龙县| 当涂县| 延长县| 五大连池市| 集贤县| 黔江区| 城步| 铁力市| 宁远县| 富顺县| 浮山县| 佛冈县| 济源市| 福安市| 栾川县| 文登市| 海口市| 荔波县| 屯门区| 太保市| 新和县| 内江市| 策勒县| 塘沽区| 天柱县| 自治县| 青州市| 鹿泉市| 民勤县| 丰镇市| 滁州市| 隆回县| 肇源县| 县级市|