,, ,,
(南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211106)
自馮·諾依曼和摩根斯坦恩合作出版《博弈論和經(jīng)濟(jì)行為》以來,博弈理論得到不斷發(fā)展,已成為一門較為成熟、應(yīng)用廣泛的學(xué)科。學(xué)者們各自從不同的角度,例如完全信息、不完全信息、靜態(tài)、動(dòng)態(tài)等研究了博弈論,使其逐步完善。近年來,隨著不確定性理論研究的深入,學(xué)者們嘗試在博弈研究中考慮不確定性因素。概括來說,不確定博弈模型主要有以下幾個(gè)研究方向。灰色不確定性博弈:羅黨,吳順祥[1]提出了二人有限零和灰色博弈,建立了博弈平衡解優(yōu)序關(guān)系的確定方法。方志耕等[2]研究了基于純策略的灰矩陣二人有限零和最保守博弈決策問題,提出了該問題解的灰鞍點(diǎn)概念。倪健等[3]基于灰色思想和博弈理論分析高速公路入口沖突車輛受到的不確定性因素,提出沖突車輛選擇策略時(shí)受到區(qū)間灰數(shù)的約束,建立沖突車輛的零和灰色博弈模型。隨機(jī)不確性博弈:Hoppe[4]分析了不確定條件下采用新技術(shù)的期權(quán)博弈模型。黃學(xué)軍等[5]假定突發(fā)事件服從向下的泊松跳過程,建立了帶跳的幾何布朗運(yùn)動(dòng)的雙寡頭期權(quán)博弈模型。王皓[6]主要研究了倒向隨機(jī)微分方程解的存在性、唯一性,及其在混合零和微分-積分對策問題上的應(yīng)用。已知參數(shù)變化范圍的不確定性博弈。Capisani等[7]結(jié)合經(jīng)典Nash均衡及帕雷托有效解的概念,介紹了不確定性下非合作博弈的NS-均衡概念。Nikobin等[8]在Zhukovskii的基礎(chǔ)上定義了不確定環(huán)境下非合作博弈的ZS-均衡概念,并基于不動(dòng)點(diǎn)定理證明了其存在性。張會(huì)娟等[9]在已知不確定參數(shù)變化范圍的假設(shè)下,定義并研究了具有不確定參數(shù)的強(qiáng)Nash均衡的存在性問題。模糊不確定性博弈。認(rèn)知的不確定性,人們可能遇到收益值為模糊數(shù)的博弈結(jié)構(gòu)。針對此問題,吳詩輝等依據(jù)三角模糊數(shù)的運(yùn)算規(guī)則和比較規(guī)則,提出了三角模糊矩陣博弈問題的基于可能度的純策略解的判定規(guī)則[10]。岳立柱等[11]文獻(xiàn)利用結(jié)構(gòu)元相關(guān)定理,證明了m×n階模糊矩陣必存在與之有相同納什解的m×n階實(shí)數(shù)矩陣與其對應(yīng),并用結(jié)構(gòu)元方法簡化了模糊博弈矩陣的求解。
綜合來看,不確定性信息下的博弈問題研究已經(jīng)得到學(xué)術(shù)界的重視,取得一些有意義的研究成果。但是,仍有部分問題值得深入研究:(1)現(xiàn)有不確定性博弈多數(shù)考慮收益值為灰數(shù)、已知變化范圍的參數(shù)、模糊數(shù)等情況,未能考慮到參與人的收益值雖無法準(zhǔn)確獲知,卻往往與動(dòng)態(tài)環(huán)境因素有著密切關(guān)聯(lián)這種情況。(2)對于博弈中局中人的博弈策略或收益值是某些條件或變元(如時(shí)間、環(huán)境、空間、制度或相關(guān)其它變元)的映射的這一類博弈問題,目前暫沒有比較有效的模型描述。(3)以往多數(shù)研究只能給出一定程度上的靜態(tài)均衡解,事實(shí)上隨著博弈環(huán)境的不同,博弈均衡解會(huì)動(dòng)態(tài)變化。
在現(xiàn)實(shí)的社會(huì)生活中,在信息不確定條件下的博弈問題,局中人的博弈策略或收益值往往無法在事先準(zhǔn)確給定。分析基于不確定信息的泛函博弈問題,并描述其形式與框架,構(gòu)建相應(yīng)的博弈模型,可以準(zhǔn)確的表達(dá)現(xiàn)實(shí)世界中的博弈問題,可以展示不確定信息下博弈的特征、性質(zhì)、戰(zhàn)略表達(dá)形式等,為模型最優(yōu)策略探討及均衡解的研究打下堅(jiān)實(shí)的基礎(chǔ)。本文重點(diǎn)研究和描述基于不確定性的變元和收益值取決于博弈策略變元的泛函博弈的戰(zhàn)略式(標(biāo)準(zhǔn)表達(dá)形式),構(gòu)建的博弈模型將為更好地認(rèn)知、把握和解決現(xiàn)實(shí)博弈問題提供新的科學(xué)依據(jù)。
針對在現(xiàn)實(shí)的社會(huì)經(jīng)濟(jì)生活中,大量存在著基于不確定信息的問題,即在信息不確定條件下,我們所得到的信息可能是某些條件或變元(如時(shí)間、環(huán)境、空間、制度或相關(guān)其它變元)的映射,在標(biāo)準(zhǔn)區(qū)間數(shù)[15]的基礎(chǔ)上設(shè)計(jì)一種新的基于信息不確定性變元的泛函區(qū)間灰數(shù),為解決這些信息缺失環(huán)境下不確定性變元泛函區(qū)間灰數(shù)的運(yùn)算問題奠定基礎(chǔ)。
γi(t)=F[f1(t),f2(t),…fK(t)],γi(t)∈[0,1],i=1,2,…
(1)
盡管這些變元函數(shù)γi(t)∈[0,1];i=1,2,…映射的確切規(guī)律難以準(zhǔn)確把握,但是若在一定的條件,隨著時(shí)間的推移,利用相關(guān)的統(tǒng)計(jì)數(shù)據(jù)、知識(shí)和經(jīng)驗(yàn)等,能夠?qū)ζ湎嚓P(guān)的映射規(guī)律進(jìn)行更深入地分析(值得注意的是,變元函數(shù)γi(t)∈[0,1]中的t是一種廣義時(shí)間的表述方式,其所表達(dá)真正含義是隨著時(shí)間的推移,其不確定信息不斷變得更加清楚、準(zhǔn)確),所以可以將不確定信息的標(biāo)準(zhǔn)區(qū)間數(shù)轉(zhuǎn)化為一種依托于變元函數(shù)γi(t)∈[0,1];i=1,2,…的泛函區(qū)間灰數(shù)集,如式(2)的形式:
(2)
定義2 (泛函區(qū)間灰數(shù)的取值) 任給某泛函區(qū)間灰數(shù)Ai(t)=ai+ci·γi(t);i=1,2,…,若隨著時(shí)間的推移,利用相關(guān)的統(tǒng)計(jì)數(shù)據(jù)、知識(shí)和經(jīng)驗(yàn)等對其不確定性變元函數(shù)γi(t)∈[0,1]取定某一確定的值,即γi(t)=γi,(0γi1),那么Ai的值即可唯一確定,則稱γi1)為Ai的取數(shù)。
法則1 (泛函區(qū)間數(shù)的加法) 設(shè):
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的和記為:
Ai(t)+Aj(t)=[(ai+aj),(ci·γi(t)+cj·γj(t))],i,j=1,2,…
法則2 (泛函區(qū)間數(shù)的減法) 設(shè):
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的差記為:
Ai(t)-Aj(t)=[(ai-aj),(ci·γi(t)-cj·γj(t))],i,j=1,2,…
法則3 (泛函區(qū)間數(shù)的乘法) 設(shè):
Ai(t)=ai+ci·γi(t);γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t);γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的積記為:
Ai(t)·Aj(t)=[min{(ai·aj),(ai·cj·γj(t)),(ci·γi(t)·cj·γj(t)),(ci·γi(t)·aj)},max{(ai·aj),(ai·cj·γj(t)),(ci·γi(t)·cj·γj(t)),(ci·γi(t)·aj)}],i,j=1,2,…
法則4 (泛函區(qū)間數(shù)的除法) 設(shè):
Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…
則Ai(t)與Aj(t)的商記為:
Ai(t)/Aj(t)=[min{(ai/aj),(ai/[cj·γj(t)]),([ci·γi(t)]/[cj·γj(t)]),([ci·γi(t)]/aj)},max{(ai/aj),(ai/[cj·γj(t)]),([ci·γi(t)]/[cj·γj(t)]),([ci·γi(t)]/aj)}],i,j=1,2,…
定義3 (泛函區(qū)間灰數(shù)的數(shù)域) 設(shè)R(?)為一泛函區(qū)間灰數(shù)集合,若對任意的Ai(t),Aj(t)∈R(?),有Ai(t)+Aj(t),Ai(t)-Aj(t),Ai(t)·Aj(t),Ai(t)/Aj(t)均屬于R(?)(商運(yùn)算時(shí),要滿足aj+cj·γj(t)≠0,j=1,2,…),則稱R(?)為一泛函區(qū)間灰數(shù)域。
定義4 (泛函區(qū)間灰數(shù)的大小比較規(guī)則)任給兩個(gè)泛函區(qū)間灰數(shù)Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…
Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…若滿足:
(1)若Ai(t)-Aj(t)≥0,則Ai(t)≥Aj(t);
(2)若Ai(t)-Aj(t)<0,則Ai(t) 定理1 (Ai(t) 本定理的證明過程簡單,證明過程省略。 定理2 (Ai(t)=Aj(t)的判定) 任給兩個(gè)泛函區(qū)間灰數(shù)Ai(t)=ai+ci·γi(t),γi(t)∈[0,1],i=1,2,…和Aj(t)=aj+cj·γj(t),γj(t)∈[0,1],j=1,2,…;當(dāng)ai=aj,ci·γi(t)=cj·γj(t),則Ai(t)=Aj(t)。 本定理的證明過程簡單,證明過程省略。 在泛函博弈問題中,其不確定性變元主要體現(xiàn)在收益矩陣中,即在其收益值矩陣的相關(guān)元素中存在信息不確定性變元和策略不確定性變元。由于這些不確定變元的存在,使得運(yùn)用經(jīng)典的博弈求解方法求解泛函博弈問題變得十分困難。運(yùn)用優(yōu)化理論及其相關(guān)技術(shù)方法,設(shè)計(jì)基于不確定信息的泛函博弈模型及其把泛函博弈問題轉(zhuǎn)化為優(yōu)化問題的求解方法,即通過研究和構(gòu)造泛函博弈收益值的廣義滿秩擴(kuò)充方陣分析其最優(yōu)博弈策略和博弈收益值問題,不僅為現(xiàn)實(shí)生活中的不確定信息問題提供新的解題思路,更為實(shí)際問題的解決提供新的方法參考。 對于難以用準(zhǔn)確的白數(shù)來表示的局中人各策略的博弈值,可以用一個(gè)區(qū)間灰數(shù)來表示,我們把由這樣的區(qū)間灰數(shù)所構(gòu)成的博弈損益值矩陣稱為灰損益值矩陣A(?),如公式(3)所示: (3) 定義5 (灰博弈)局中人1的策略集為S1={α1,α2,…,αm},局中人 2 的策略集為S2={β1,β2,…,βn},局中人事先判斷的用區(qū)間灰數(shù)表征的灰損益值矩陣為A(?),稱由灰損益值矩陣所決定的博弈問題稱為灰博弈,記為G(?)={S1,S2,A(?)}。 在現(xiàn)實(shí)的社會(huì)經(jīng)濟(jì)生活中,選取信息不確定條件下的一些博弈問題(考慮在一個(gè)相對封閉的市場區(qū)域內(nèi)有2家彩電生產(chǎn)商進(jìn)行市場份額的競爭、戰(zhàn)斗機(jī)群的空中搏斗、無人機(jī)對敵機(jī)的跟蹤與偵察等),他們的博弈形式可以用進(jìn)行描述(見公式(4))。 (4) 其中:αi,i=1,2,…,m表示局中人甲的策略;βj,j=1,2,…,n表示局中人乙的策略;[aij,bij],i=1,2,…,m,j=1,2,…,n表示在信息不確定條件下局中人甲和乙分別采取策略αi,i=1,2,…,m和βj,j=1,2,…,n時(shí)的博弈收益值的區(qū)間灰數(shù);利用標(biāo)準(zhǔn)區(qū)間灰數(shù)的表征方法,可將其博弈收益值的區(qū)間灰數(shù)轉(zhuǎn)化為標(biāo)準(zhǔn)形式: [aij,bij)=aij+(bij-aij)·γij,γij∈[0,1],i=1,2,…,m;j=1,2,…,n (5) 更進(jìn)一步考慮,γij∈[0,1]是由于事先的信息的不確定性(如信息的不對稱性、有限知識(shí)、隨機(jī)振蕩等變元因素所造成的)所導(dǎo)致的,也就是說,該γij∈[0,1]應(yīng)是這些變元的一個(gè)映射,可表示為式(6)的形式,其中fk(t),k=1,2,…,K表示這K個(gè)影響變元是時(shí)間t的映射,K和f表示其相應(yīng)的映射關(guān)系。 γij(t)=F[f1(t),f2(t),…,fK(t)],γij(t)∈[0,1],i=1,2,…,m;j=1,2,…,n (6) (7) 考慮可能存在一種博弈其收益值矩陣中的某些元素值的大小取決于局中人采用該策略的頻率(或混合策略的值),如考慮博弈的局中人甲采用策略αi,i=1,2,…,m的頻率為xi∈[0,1],i=1,2,…,m;局中人乙采用策略βj,j=1,2,…,n頻率為yj∈[0,1],j=1,2,…,n而在其博弈收益值矩陣中存在某個(gè)(些)元素的值(如式(8)所示),其中:xi(t)∈[0,1],i=1,2,…,m和yj(t)∈[0,1],j=1,2,…,n分別表示其博弈策略xi(t)∈[0,1],i=1,2,…,m和yj(t)∈[0,1],j=1,2,…,n分別是變元t的函數(shù);cij(t),i=1,2,…,m;j=1,2,…,n是博弈收益值矩陣的元素,xi(t)∈[0,1] 和yj(t)∈[0,1]的映射,F(xiàn)ij(i=1,2,…,m;j=1,2,…,n)表示其映射關(guān)系。 cij(t)=Fij[xi(t),yj(t)];xi(t)∈[0,1],i=1,2,…,m;yj(t)∈[0,1],j=1,2,…,n (8) (9) 若在泛函區(qū)間灰數(shù)大小意義下存在純策略xi*(t),yj*(t),構(gòu)成局勢(xi*(t),yj*(t))使得式(10)成立: (10) cij*(t)ci*j*(t)ci*j(t) (11) 證明:先證明充分性,由于對任意的i,j均有cij*(t)ci*j*(t)ci*j(t),故: (12) 另一方面,對任給i,j,有: (13) 由(12)式和(13)式有: 現(xiàn)在來證明必要性。 設(shè)有i*,j*使得: 所以對任意i,j有: cij*(t)ci*j*(t) 證畢。 (14) 運(yùn)用提供的信息不確定性變元泛函區(qū)間灰數(shù)的表征與計(jì)算方法,并由題意知:a11=γ11(t),a12=2+γ12(t),a21=4,a22=2,盜版者選擇盜版、不盜版策略的泛函最優(yōu)純策略如式(15)和式(16)。 (15) (16) 圖1 盜版企業(yè)的最優(yōu)純策略仿真圖 盜版打擊部門者選擇不打擊、打擊策略的最優(yōu)灰混合策略如式(17)、式(18)。 (17) (18) 圖2 局中人2的最優(yōu)混合策略仿真圖 由圖1和圖2看出,隨著時(shí)間的推移,盜版打擊部門會(huì)傾向選擇打擊策略,但是盜版企業(yè)選擇盜版、不盜版的概率仍交替增減,這主要是收到灰信息變元的影響。 (19) 圖3 最優(yōu)灰博弈值仿真圖 泛函博弈問題的泛函區(qū)間灰數(shù)計(jì)算結(jié)果如表1所示,標(biāo)準(zhǔn)區(qū)間數(shù)計(jì)算方法的計(jì)算結(jié)果是一個(gè)區(qū)間的數(shù)值,盡管最終的取值范圍都是相同的,但是上述的基于灰信息變元的泛函博弈問題的計(jì)算結(jié)果是隨時(shí)間t不斷變化的,是時(shí)間t的映射,可以通過計(jì)算機(jī)仿真的方式確定在某時(shí)間范圍內(nèi)博弈的雙方都是采取什么策略,而不只是簡單的去計(jì)算雙方策略的范圍,給出相對靜態(tài)的結(jié)果。 表1 泛函區(qū)間灰數(shù)計(jì)算結(jié)果 本文著眼于在不確定條件下,現(xiàn)實(shí)的社會(huì)經(jīng)濟(jì)生活中局中人的博弈策略或收益值無法準(zhǔn)確實(shí)現(xiàn)給定的博弈問題,著重于不確定信息的泛函博弈模型的構(gòu)建與解析,運(yùn)用和創(chuàng)新經(jīng)典博弈理論研究方法,還需要深入研究基于不確定信息的泛函博弈的形式與框架、均衡解的求解方法以及泛函博弈模型穩(wěn)定性等一系列問題,尋求解決此類問題的科學(xué)理論和方法。借助于泛函原理構(gòu)建泛函博弈模型,創(chuàng)新和發(fā)展博弈論研究方法;從實(shí)踐領(lǐng)域來看,本文立足于現(xiàn)實(shí)社會(huì)經(jīng)濟(jì)生活中的相關(guān)實(shí)際問題為背景,選擇具有較好的代表性的泛函博弈的典型案例如“盜版與打擊盜版”問題通過計(jì)算機(jī)仿真對其博弈均衡結(jié)果進(jìn)行詳細(xì)的對比分析,說明了本文提出的基于信息不確定性變元的區(qū)間數(shù)的表征及其運(yùn)算法則的科學(xué)性和計(jì)算結(jié)果的精確性。此外還可以解決“追捕—格斗”、“航跡規(guī)劃” 等泛函博弈問題。 參考文獻(xiàn): [1] 羅黨,吳順祥.帶有灰色約束的二人有限零和博弈研究[J].廈門大學(xué)學(xué)報(bào)(自然科學(xué)版),2006,45(1):29-32. [2] 方志耕,劉思峰.基于純策略的灰矩陣二人有限零和博弈模型研究[J].南京航空航天大學(xué)學(xué)報(bào),2003,35(4):441-445. [3] 倪健,韓直,彭金栓.基于零和灰色博弈模型的高速公路入口車輛沖突研究[J].公路交通技術(shù),2008,8(4):121-124. [4] Hoppe H C.Second-mover advantages in the strategic adoption of new technology under uncertainty [J].International Journal of Industrial Organization, 2000,18(2):315-338. [5] 黃學(xué)軍,吳沖鋒.不確定環(huán)境下研發(fā)投資決策的期權(quán)博弈模型[J].中國管理科學(xué),2006,14(5): 33-37. [6] 王皓.反射倒向隨機(jī)微分方程解及其在混合零和微分對策可逆投資問題及偏微分方程中的應(yīng)用[D].濟(jì)南:山東大學(xué),2009. [7] Capisani L M,Ferrara A, Maqnani L.Design and experimental validation of a second-order sliding-mode motion controller for robot manipulators [J].International Journal of Control, 2009, 82(2): 365-377. [8] Nikoobin A, Haqhiqhi R.Lyapunov-based nonlinear disturbance observer for serialn-Link robot manipulators [J].Journal of Intelligent and Robotic Systems: Theory and Applications, 2009, 55(2/3): 135-153. [9] 張會(huì)娟, 張強(qiáng).不確定性下非合作博弈強(qiáng)Nash均衡的存在性[J].控制與決策,2010,25(8):1251-1254. [10] 吳詩輝,楊建軍, 郭乃林.三角模糊矩陣博弈的最優(yōu)策略研究[J].系統(tǒng)工程與電子技術(shù),2009,31(5):1231-1234. [11] 岳立柱,閆艷,仲維清.基于結(jié)構(gòu)元方法的模糊矩陣博弈求解[J].系統(tǒng)工程理論與實(shí)踐,2010,30(2):272-276. [12] 王才士,黃志遠(yuǎn).量子隨機(jī) Cable 方程的白噪聲分析方法[J].數(shù)學(xué)學(xué)報(bào),2002,45(5): 851-862. [13] 肖兆銀,周德云.遺傳算法的泛函極值求解與應(yīng)用[J].火力與指揮控制,2007,32(12):52-54. [14] 吳迪光.變分法[M].北京:高等教育出版社,1987. [15] 方志耕,劉思峰,陸芳,等.區(qū)間灰數(shù)表征與算法改進(jìn)及其GM(1,1)模型應(yīng)用研究[J].中國工程科學(xué), 2005,7(2):57-61.3 泛函博弈模型
4 案例研究——盜版與打擊盜版
4.1 泛函博弈問題的最優(yōu)解
4.2 泛函區(qū)間灰數(shù)與標(biāo)準(zhǔn)區(qū)間數(shù)區(qū)別和差異
5 結(jié)語