張小娟,向鋼華,胡喜珍,曹素平
(火箭軍指揮學(xué)院,武漢430012)
不完全信息下軍事威逼討價(jià)還價(jià)博弈分析*
張小娟,向鋼華,胡喜珍,曹素平
(火箭軍指揮學(xué)院,武漢430012)
在詳細(xì)分析威懾與威逼區(qū)別的基礎(chǔ)上,構(gòu)建了不完全信息下軍事威逼討價(jià)還價(jià)博弈模型。按照最大期望效用準(zhǔn)則,分析了不完全信息下軍事威逼走向討價(jià)還價(jià)階段的條件,研究表明:運(yùn)用魯賓斯坦經(jīng)典討價(jià)還價(jià)唯一完美均衡解,得出以下結(jié)論:爭奪目標(biāo)自身的效用越大,戰(zhàn)爭帶來的聲譽(yù)得益效用越大,軍事威逼走向討價(jià)還價(jià)階段的可能性越大;一旦進(jìn)入討價(jià)還價(jià)階段,威逼者會接受挑戰(zhàn)者提出的方案,沖突將不再發(fā)生。
軍事威逼,討價(jià)還價(jià)博弈,不完全信息
威懾理論研究中,威懾(deterence)和威逼(compellence)是兩個涵義相近而又容易混淆的學(xué)術(shù)概念。托馬斯·謝林(ThomasSchelling)最早對威懾和威逼兩個概念進(jìn)行了區(qū)分[1]。羅伯特·阿特(Robert Art)認(rèn)為,威逼與威懾的區(qū)別“就是主動與被動使用武力的區(qū)別”[2]??藙诘蠆W·喬菲-雷維利亞(ClaudioCioffi-Revilla)認(rèn)為:盡管兩者均以“實(shí)力”為手段,但威懾的目標(biāo)是維持現(xiàn)狀,消除對現(xiàn)狀挑戰(zhàn)的潛在威脅,而威逼旨在改變現(xiàn)狀,以取得新的平衡[2]。如下頁表1所示,威懾是在挑戰(zhàn)者發(fā)起挑戰(zhàn)之前,威懾者以武力威脅懾阻挑戰(zhàn)者打破現(xiàn)狀。威逼是在威懾者事先沒有察覺的情況下,挑戰(zhàn)者發(fā)起了挑戰(zhàn),造成某種既成事實(shí),而這種事實(shí)是威懾者不愿接受的結(jié)局,因此,威懾者會發(fā)出武力威脅,逼迫挑戰(zhàn)者撤回挑戰(zhàn),達(dá)到新的“現(xiàn)狀”。托馬斯·謝林認(rèn)為威逼比威懾更難成功,之所以如此,除了威逼涉及挑戰(zhàn)者已經(jīng)付出的實(shí)質(zhì)性代價(jià)及撤回挑戰(zhàn)承受的聲譽(yù)損失[3],還涉及威懾者與挑戰(zhàn)者對新“現(xiàn)狀”的構(gòu)建與達(dá)成一致,此過程是二者進(jìn)行討價(jià)還價(jià)的博弈過程。對威逼者與挑戰(zhàn)者的這一博弈過程進(jìn)行分析,得到反映威逼全過程的作用機(jī)理,有助于更加深刻地把握和理解當(dāng)今世界政治軍事領(lǐng)域的一些現(xiàn)象。
表1 威懾與威逼的區(qū)別
在威逼的博弈分析中,博弈方為威逼者(D)和挑戰(zhàn)者(C),而且雙方都是理性行為體。挑戰(zhàn)者在威逼者沒有察覺的情況下發(fā)起挑戰(zhàn),并造成某種既成事實(shí);威逼者不能接受這種結(jié)局,發(fā)出武力威脅,要求挑戰(zhàn)者撤回挑戰(zhàn);挑戰(zhàn)者礙于聲譽(yù)成本,將不會退回原有的現(xiàn)狀。爾后,雙方要么發(fā)生武力沖突,要么進(jìn)行談判(bargain)。此時(shí),挑戰(zhàn)者提出一個利益劃分方案,威逼者選擇接受或拒絕,如果接受,則達(dá)成新的“現(xiàn)狀”。如果拒絕,由威逼者提出新方案,如果挑戰(zhàn)者接受,博弈結(jié)束;如果拒絕,挑戰(zhàn)者繼續(xù)提出新方案。以此類推,直到達(dá)成新的現(xiàn)狀,威逼結(jié)束。
基于上述分析,軍事威逼討價(jià)還價(jià)博弈模型包括兩階段模型,即第1階段的軍事威逼模型和第2階段的討價(jià)還價(jià)模型分別如圖1、圖2所示。
圖1 第1階段軍事威逼模型
圖2 第2階段討價(jià)還價(jià)模型G1
軍事威逼過程中,雙方利益完全對立的完全沖突狀態(tài)是非常罕見的。在多數(shù)情況下雙方介于完全沖突與完全合作之間。博弈雙方不是完全誓不兩立的敵人,而是互存疑慮與分歧的伙伴,關(guān)注的問題不是沖突雙方的利弊得失,而是如何達(dá)到一個實(shí)現(xiàn)沖突雙方最大利益的結(jié)果[4]。
在軍事威逼兩階段博弈模型中,挑戰(zhàn)者與威逼者之間的策略互動結(jié)局有“挑戰(zhàn)者贏”CWIN、“威逼者贏”DWIN、“戰(zhàn)爭”WAR以及重新構(gòu)建的現(xiàn)狀SQi(i=1,2,…,n)。完全信息條件下,軍事威逼現(xiàn)象不會出現(xiàn)[5],不完全信息條件下,博弈雙方的策略選擇依賴于結(jié)局的期望效用。
面對挑戰(zhàn)者由于挑戰(zhàn)造成的既成事實(shí),威逼者有“默認(rèn)”和“逼迫”兩種策略可以選擇。當(dāng)他選擇“默認(rèn)”策略時(shí),結(jié)局為“挑戰(zhàn)者贏”CWIN,顧及由此帶來的聲譽(yù)成本,威逼者將不會選擇“默認(rèn)”策略,而會選擇“逼迫”策略。面對威逼者的“逼迫”,挑戰(zhàn)者有“后退”和“堅(jiān)持”兩種策略可以選擇。當(dāng)他選擇“后退”策略時(shí),結(jié)局為“威逼者贏”DWIN;當(dāng)他選擇“堅(jiān)持”策略時(shí),威逼者將以“武力”和“談判”兩種策略應(yīng)對,如果威逼者選擇“武力”策略,結(jié)局為“戰(zhàn)爭”WAR,如果威逼者選擇“談判”策略,雙方將進(jìn)入第2階段討價(jià)還價(jià)博弈階段。
由上述分析可以看出,面對挑戰(zhàn)者的挑戰(zhàn),威逼者顧及聲譽(yù)成本勢必會實(shí)施“逼迫”策略,迫使挑戰(zhàn)者撤回挑戰(zhàn),因此威逼者對于4種結(jié)局的兩種偏好順序分別為:
挑戰(zhàn)者考慮到聲譽(yù)成本與發(fā)起挑戰(zhàn)的經(jīng)濟(jì)成本,必然不會選擇“后退”策略,而會選擇“堅(jiān)持”策略,因此,挑戰(zhàn)者對于4種結(jié)局的兩種偏好順序分別為:
當(dāng)戰(zhàn)爭的期望效用遠(yuǎn)遠(yuǎn)低于討價(jià)還價(jià)的期望效用時(shí),威逼者和挑戰(zhàn)者將分別選擇式(1)和式(3),博弈進(jìn)入討價(jià)還價(jià)階段。比如核威懾條件下,由于核戰(zhàn)爭的期望效用遠(yuǎn)遠(yuǎn)低于討價(jià)還價(jià)的期望效用,“戰(zhàn)爭”將成為威逼者和挑戰(zhàn)者的劣勢策略,軍事威逼必然進(jìn)入討價(jià)還價(jià)階段。
2.1軍事威逼第1階段博弈
當(dāng)戰(zhàn)爭的期望效用不小于討價(jià)還價(jià)的期望效用時(shí),挑戰(zhàn)者就必須先根據(jù)威逼者行動來判斷其類型是強(qiáng)硬型(Tough)還是軟弱型(Weak),然后再選擇自己的策略。此時(shí),第1階段軍事威逼博弈就變成了不完全信息動態(tài)博弈,威逼者必須主動發(fā)出信號以反映自身的真實(shí)狀態(tài)(實(shí)力與決心),挑戰(zhàn)者也會采取試探行為,力求進(jìn)一步獲取威逼者類型的真實(shí)信息。根據(jù)斯賓塞(Spence)提出的信號博弈模型,建構(gòu)不完全信息動態(tài)博弈模型如下頁圖3所示。
圖3中圓圈內(nèi)的N、D、C分別表示虛擬參與人——自然(Nature)、威逼者、挑戰(zhàn)者的決策節(jié)點(diǎn),自然首先選擇威逼者的類型(假定類型由付出的成本決定),p和1-p分別表示威逼者為強(qiáng)硬(T)和軟弱(W)類型的先驗(yàn)概率,x和y分別表示威逼者發(fā)出高強(qiáng)度信號和低強(qiáng)度信號時(shí)挑戰(zhàn)者對威逼者為強(qiáng)硬類型的后驗(yàn)概率。設(shè)爭奪目標(biāo)對威逼者和挑戰(zhàn)者的效用分別為UD和UC;威逼者發(fā)出高強(qiáng)度信號和低強(qiáng)度信號付出的代價(jià)效用分別為和;在威逼者發(fā)出高強(qiáng)度信號和低強(qiáng)度信號時(shí),挑戰(zhàn)者敢于采取“武力”策略的聲譽(yù)得益效用分別為和,則其采取“談判”策略的效用為和-;威逼者和挑戰(zhàn)者的戰(zhàn)爭代價(jià)效用分別為和,贏得戰(zhàn)爭的概率分別為α和1-α。
圖3 不完全信息動態(tài)博弈
則威逼者發(fā)出高強(qiáng)度信號時(shí),其在WAR結(jié)局下的期望效用為:
挑戰(zhàn)者在WAR結(jié)局下的期望效用為:
因此,挑戰(zhàn)者選擇談判的期望效用為:
挑戰(zhàn)者選擇武力的期望效用為:
按照最大期望效用準(zhǔn)則,當(dāng)x<x*時(shí)挑戰(zhàn)者更傾向于選擇談判策略;當(dāng)x>x*時(shí),挑戰(zhàn)者更傾向于選擇武力策略。
同理,在威逼者發(fā)出低強(qiáng)度信號時(shí),轉(zhuǎn)折概率:
當(dāng)y<y*時(shí),挑戰(zhàn)者更傾向于選擇談判策略;當(dāng)y>y*時(shí),挑戰(zhàn)者更傾向于選擇武力策略。
2.2討價(jià)還價(jià)階段博弈分析
在討價(jià)還價(jià)階段,假設(shè)爭奪目標(biāo)自身的價(jià)值為1,博弈雙方進(jìn)行魯賓斯坦式討價(jià)還價(jià),挑戰(zhàn)者提出一個劃分方案(α,1-α)(該方案是魯賓斯坦式討價(jià)還價(jià)的唯一完美均衡解),威逼者選擇接受或拒絕,如果接受,則博弈結(jié)束,雙方得益分別為α和(1-α);如果拒絕,挑戰(zhàn)者將實(shí)施報(bào)復(fù),雙方得益分別為δCα和δD(1-α)。爾后,威逼者提出一個新的方案(1-β,β),如果挑戰(zhàn)者接受,博弈結(jié)束;如果拒絕,威逼者實(shí)施報(bào)復(fù),挑戰(zhàn)者隨后提出新的方案,直到達(dá)成新“現(xiàn)狀”。其中,0≤α,β,δC,δD≤1,δ是謝林提出的折扣因子,用來表示相互威懾的討價(jià)還價(jià)能力或?qū)Ψ降膫δ芰Γ磪f(xié)議無法達(dá)成時(shí)的受損失程度。
博弈雙方單邊信息不完全時(shí),沖突不會出現(xiàn)[6]。當(dāng)博弈雙方信息不完全時(shí),設(shè)挑戰(zhàn)者為高討價(jià)還價(jià)能力H類型和低討價(jià)還價(jià)能力L類型的先驗(yàn)概率分別為γ和1-γ,威逼者相應(yīng)的折扣因子分別為δDL和δDH。威逼者為高討價(jià)還價(jià)能力H類型和低討價(jià)還價(jià)能力L類型的先驗(yàn)概率分別為η和1-η,挑戰(zhàn)者相應(yīng)的折扣因子分別為δCL和δCH,根據(jù)博弈雙方的不同類型,挑戰(zhàn)者提出的方案有以下4種,見表2。
表2 挑戰(zhàn)者的4種方案
若挑戰(zhàn)者提出(σ,1-σ)方案,H類型威逼者接受時(shí)得益為(1-σ),拒絕時(shí)期望得益為:
由于
所以
此時(shí),H類型威逼者拒絕的期望得益小于接受時(shí)的得益,他將選擇接受(σ,1-σ)方案。
若挑戰(zhàn)者提出(υ,1-υ)方案,H類型威逼者接受時(shí)得益為(1-υ),由于υ>ω,挑戰(zhàn)者將不可能選擇(ω,1-ω)方案,所以威逼者拒絕(υ,1-υ)方案時(shí)期望得益為δDL(1-σ)γ2+δDH(1-φ)(1-γ2)
若δDL(1-σ)γ2*+δDH(1-φ)(1-γ2*)=(1-υ)
由于0≤γ2≤1,所以
此時(shí),H類型威逼者將接受(υ,1-υ)方案。
若挑戰(zhàn)者提出(φ,1-φ)方案,該方案是H類型威逼者偏愛的方案,此時(shí),他將選擇接受。
若挑戰(zhàn)者提出(ω,1-ω)方案,H類型威逼者接受時(shí)得益為(1-ω),拒絕時(shí)期望得益為:δDL(1-σ)γ4+δDH(1-φ)(1-γ4)
由式(5)可知:
此時(shí),H類型威逼者將接受(ω,1-ω)方案。
經(jīng)上述分析,進(jìn)入討價(jià)還價(jià)階段后,H類型的威逼者將接受挑戰(zhàn)者提出的任何方案,L類型的威逼者也將如此;由于υ>σ,υ>ω,所以(υ,1-υ)方案是挑戰(zhàn)者的優(yōu)勢策略,即無論威逼者是否L類型,挑戰(zhàn)者都將可以將自己視為H類型針對L類型的威逼者提出方案,此時(shí)威逼者都會選擇接受。
本文首先對威懾與威逼進(jìn)行分析,在此基礎(chǔ)上建構(gòu)了軍事威逼討價(jià)還價(jià)博弈兩階段模型。爾后根據(jù)最大期望效用準(zhǔn)則,得出不完全信息下軍事威逼走向討價(jià)還價(jià)階段的條件,并運(yùn)用魯賓斯坦經(jīng)典討價(jià)還價(jià)唯一完美均衡解,對比分析了挑戰(zhàn)者4種不同方案,得出以下結(jié)論:①爭奪目標(biāo)自身的效用與軍事威逼走向討價(jià)還價(jià)階段的可能性正相關(guān),目標(biāo)效用越大,走向討價(jià)還價(jià)階段的可能性越大;②戰(zhàn)爭帶來的聲譽(yù)得益效用越大與軍事威逼走向討價(jià)還價(jià)階段的可能性正相關(guān),聲譽(yù)得益效用越大,走向討價(jià)還價(jià)階段的可能性越大;③戰(zhàn)爭付出的代價(jià)與軍事威逼走向討價(jià)還價(jià)階段的可能性正相關(guān),代價(jià)越大,走向討價(jià)還價(jià)的可能越大;④軍事威逼一旦進(jìn)入討價(jià)還價(jià)階段,威逼者必然會接受挑戰(zhàn)者提出的方案,沖突將不再可能發(fā)生。
[1]THOMAS S.Arms and influence[M].New Haven Yale UniversityPress,1966.
[2]理查德·N.哈斯.新干涉主義[M].殷雄,譯.北京:新華出版社,2000:1-286.
[3]向鋼華,王永縣.偏好、信息與威懾博弈[J].國際政治科學(xué),2006,2(3):1-33.
[4]托馬斯·謝林.沖突的戰(zhàn)略[M].趙華,譯.北京:華夏出版社,2006:1-263.
[5]向鋼華,王永縣.軍事威逼博弈分析[J].運(yùn)籌與管理,2010,19(2):5-8.
[6]向鋼華,王永縣.一種不完全信息相互威懾討價(jià)還價(jià)模型[J].運(yùn)籌與管理,2008,17(17):15-19.
[7]RUBINSTEIN A.Perfect equilibrium in a bargaining model[J].Econometrica,1982,50(1):97-109.
Game Theoretical Analysis of Military Compellence Bargaining Process with Incomplete Information
ZHANG Xiao-juan,XIANG Gang-hua,HU Xi-zhen,CAOSu-ping
(The Rocket Army Command College,Wuhan 430012,China)
The meanings of deterrence and compellence are distinguished.And then a military compellence bargaining model with incomplete information is advanced.According to the expected utility maximization criterion the condition of military compellence to bargaining game is yielded.With Rubinstein bargaining equilibrium the following conclusions are obtained.The larger the target avail which is contested is,the larger the report avail which is obtained by the war is,the larger the probability that the players go into bargaining process is.Once the players go into bargaining process the conflict will not occur any more and the defender will accept the project that the challenger advanced.
militarycompellence,bargaininggame,incompleteinformation
E81
A
1002-0640(2016)10-0055-04
2015-08-26
2015-09-16
國家自然科學(xué)基金資助項(xiàng)目(51409258)
張小娟(1982-),女,山東肥城人,博士研究生,講師。研究方向:軍事運(yùn)籌、軍事威懾。