吳蔚 石玉鳳
摘 要:以辛亥革命時(shí)期南北議和過(guò)程中博弈局面的形成為基礎(chǔ),分別就革命黨和清廷的博弈思維與行為給出博弈機(jī)理分析,從各個(gè)角度檢視可供雙方選擇的所有行為策略及其可能后果;接下來(lái),構(gòu)建社會(huì)變革沖突在非暴力狀態(tài)下的革命黨與清廷貝葉斯博弈模型,得到模型的均衡解。模型結(jié)果顯示,局中人的行為策略符合合作博弈思維的理性選擇。
關(guān)鍵詞:辛亥革命;南北議和;合作博弈
一、引言
辛亥革命的意義不止于政權(quán)、政體的變更與社會(huì)變革。第一場(chǎng)武裝革命后,孫中山與清廷之間努力化解前嫌,推動(dòng)五族共和,促使各方力量從觀望逐漸走向合作。適當(dāng)妥協(xié)中所蘊(yùn)含的合作博弈思想體現(xiàn)了劃時(shí)代的意義。這種合作博弈思想對(duì)第一場(chǎng)武裝革命的和平處理,達(dá)成了“各利益相關(guān)方相對(duì)小的傷亡損失換取最大限度地國(guó)族共識(shí)”的目標(biāo),不僅結(jié)束了帝王時(shí)期“以弒君實(shí)現(xiàn)朝代政權(quán)更迭”的循環(huán),在世界近現(xiàn)代史上也是一次“以議代斗、減少?zèng)_突”的嘗試;可看作是中國(guó)近代“以理性選擇達(dá)到國(guó)家歷史目標(biāo)優(yōu)化”的典范。
胡適認(rèn)為武裝革命是特定條件下不得已的手段,而非目的,并希望建立一個(gè)戰(zhàn)亂相對(duì)少的共和體制。梁?jiǎn)⒊瑢?duì)革命態(tài)度轉(zhuǎn)變后認(rèn)可了辛亥革命帶來(lái)的政體改變,也主張“和袁”,化解原立憲派與袁世凱之間的矛盾。
鑒于此,本文就南北議和過(guò)程的利益沖突方博弈行為、思維、機(jī)理、進(jìn)程與結(jié)果進(jìn)行科學(xué)的規(guī)范研究,以為社會(huì)發(fā)展過(guò)程中(尤其社會(huì)變革時(shí)期)各方力量的相互制衡提供借鑒范例。
二、南北議和中的博弈機(jī)理分析
1.辛亥革命時(shí)期博弈局面的形成
武昌起義后的數(shù)月,多省相繼爆發(fā)革命黨對(duì)清政府的武裝軍事行動(dòng)。雖然雙方在軍事戰(zhàn)斗中“各有勝負(fù)”,但革命黨勢(shì)頭迅猛,清廷在意識(shí)到革命難以迅速鎮(zhèn)壓之際,啟用袁世凱,“剿”“撫”并用。之后,袁世凱與革命黨聯(lián)絡(luò),以利益相關(guān)方清廷和革命黨為主要局中人的博弈就此展開。促成當(dāng)時(shí)各方力量冷靜下來(lái),通過(guò)斡旋談判各自做出相應(yīng)妥協(xié)、最終達(dá)成議和的結(jié)局,避免更多流血沖突。最終,南北議和以袁世凱迫使“清帝”遜位并當(dāng)選“中華民國(guó)總統(tǒng)”為結(jié)局,暫時(shí)結(jié)束了暴力爭(zhēng)奪政權(quán)的局面。
考慮實(shí)際參與過(guò)程及社會(huì)力量的概括性和代表性,在此主要抽出革命黨與清廷這兩個(gè)明確且具代表性的勢(shì)力之間的博弈行為進(jìn)行具體分析。關(guān)于其他勢(shì)力參與博弈的細(xì)節(jié),本文不做擴(kuò)展,將另作研究。
2.革命黨博弈思維與行為
革命黨的初衷是結(jié)束君主集權(quán)統(tǒng)治建立共和國(guó),意在通過(guò)革命推翻朝廷獲得其所追求的“共和”利益;行為決策主要是對(duì)武裝革命成本與不必武裝革命到底而使清廷接受放棄皇權(quán)的補(bǔ)償之間進(jìn)行權(quán)衡。即選擇付出血腥代價(jià)革命到底直至徹底推翻清廷,或者補(bǔ)償與安置清皇室以減少革命的阻力,達(dá)到有效避免損失與代價(jià)的目的。其行為決策取決于獲得革命成功與清廷對(duì)其鎮(zhèn)壓成功的風(fēng)險(xiǎn)。
首先,革命有望獲得“利益”。這體現(xiàn)于結(jié)束皇權(quán)統(tǒng)治而建立共和體制的革命成果,這是進(jìn)行革命的基本保證。革命黨只有當(dāng)革命獲得利益大于革命付出的成本時(shí)才會(huì)做出革命到底的決策,革命黨總是希望盡可能地獲得更多利益,因此可能表現(xiàn)為,傾向于抵付出來(lái)對(duì)清皇室放棄皇位的補(bǔ)償進(jìn)行安置。
其次,革命黨的利益會(huì)受到來(lái)自清廷的不利決策的直接威脅。由于清廷可以選擇鎮(zhèn)壓革命,這種雙方?jīng)Q策上的相悖勢(shì)必導(dǎo)致社會(huì)變革不能順利進(jìn)行,其結(jié)果將是革命成本的驟增甚至是革命的終止。從可支配軍力的對(duì)比變化,也可以證明,若繼續(xù)武力解決,誰(shuí)都難有必勝把握。因此,革命黨需要也必會(huì)充分考慮清廷的決策。
無(wú)論是理論上還是實(shí)際中,都是革命行為發(fā)生在先,清廷的反饋隨后。以下分別以A和B作為革命黨和清廷的簡(jiǎn)單表示,則概括以上分析,當(dāng)時(shí)革命黨可選擇的策略,存在有以下可能情況:
A1:堅(jiān)持徹底推翻清廷并從形式上鏟除皇室成員。
不管清帝是否愿意退位,革命者執(zhí)意以徹底推翻清廷甚至弒君為目標(biāo),則結(jié)果是清廷與革命者之間只有其中一方勝出存留,另一方失敗出局,即有:
A11:經(jīng)過(guò)一番戰(zhàn)爭(zhēng)沖突,武裝革命推翻清廷,革命成功;
A12:遭到鎮(zhèn)壓,革命失敗。
這兩種情況跟歷史上的歷次農(nóng)民起義結(jié)果沒有本質(zhì)區(qū)別。
A2:以結(jié)束君主集權(quán)、建立共和體系為目標(biāo)。是有條件換取清廷妥協(xié),或是無(wú)奈仍以暴力推翻清廷,會(huì)得到兩種不同的結(jié)局:
A21:清廷愿意在保障皇室成員生命安全及顏面的前提下妥協(xié),清帝遜位;革命者建立共和政府,并支付清遜帝后半生體面的生活條件;
A22:清廷拒不妥協(xié),主張大清天下,武力鎮(zhèn)壓革命,則革命者需要以武裝暴力推翻清廷,又循環(huán)回到前述A1結(jié)果。
3.清廷博弈思維與行為
清廷的最基本目標(biāo)是維持其生存延續(xù),此基礎(chǔ)上再盡力在最大程度上保留自身的權(quán)力。由于革命者不會(huì)事先通知朝廷預(yù)報(bào)革命,顯然革命行為具有主動(dòng)性,清廷需要隨后做出反應(yīng)。
故清廷可考慮和預(yù)備的策略,以及相應(yīng)可能的結(jié)果如下:
B1:針對(duì)革命黨的A1目標(biāo)及其行為,采取武力鎮(zhèn)壓革命的方式,以維持清廷統(tǒng)治地位??赡艿玫降慕Y(jié)果為:
B11:鎮(zhèn)壓革命失敗,清廷被推翻,皇室人員被殺或被流放。完全對(duì)應(yīng)于A11的革命成功;
B12:成功鎮(zhèn)壓革命,清廷統(tǒng)治得以延續(xù)。完全對(duì)應(yīng)于A12的革命失敗。
顯然,這是“你死我活”式的“零和博弈”選擇。雙方均以徹底消滅對(duì)方為唯一目標(biāo),結(jié)果是其中一方勝出、另一方出局。但雙方在博弈過(guò)程中都會(huì)付出巨大的成本和慘重的代價(jià)。
B2:針對(duì)革命黨的A2目標(biāo)及其行為,也可能得到兩種結(jié)局:
B21:采取放棄皇權(quán)退位,以保全自身。這樣又可以分為程度不同的兩種情況:其一,幸運(yùn)一些,新的執(zhí)政者保證清帝生活優(yōu)越體面;其二,失去一切權(quán)力,但至少也能存活。此結(jié)局完全與前述A21相對(duì)應(yīng)。
B22:不響應(yīng)革命黨的非對(duì)抗信號(hào)。堅(jiān)持武力鎮(zhèn)壓勢(shì)不妥協(xié)態(tài)度,將迫使革命者重新采取武裝暴力的方式,結(jié)局完全與前述A22相對(duì)應(yīng),最終又會(huì)回到A1的循環(huán)結(jié)果。
上述A21及與其相對(duì)應(yīng)的B21顯示了革命黨與清廷皆選擇妥協(xié)策略的行為后果。此選項(xiàng)表明,妥協(xié)的雙方注定都不會(huì)“大贏”,也不會(huì)“大輸”,相對(duì)其他選項(xiàng)而言,可以認(rèn)為是風(fēng)險(xiǎn)最小的,且能夠有效地避開雙方直接沖突所必須付出的巨大代價(jià)。
三、社會(huì)變革沖突中的革命黨與清廷博弈模型
為了模型的構(gòu)建,可認(rèn)為當(dāng)時(shí)的博弈各方均為理性人,考慮自身的利益最大化。而且,參與各方遵循內(nèi)部行為一致性原則。
1.暴力沖突狀態(tài)下革命黨與清廷的博弈
簡(jiǎn)化博弈過(guò)程,革命黨大致可采取與清廷有限妥協(xié)和徹底革命兩種行為方案;而清廷也可選擇與革命黨有限妥協(xié)和與革命黨完全對(duì)抗兩種行為方案。由此得到雙方如下的初始基本策略集:
革命黨A的策略SA=(有限妥協(xié),徹底革命);清廷B的策略SB=(有限妥協(xié),完全鎮(zhèn)壓)。
(1)暴力沖突博弈的負(fù)值和屬性
暴力沖突博弈過(guò)程中,各局中人只考慮為獲得利益而采取爭(zhēng)奪方式,不惜付出更多代價(jià),故整體效率低下,社會(huì)總收益當(dāng)然更是受損嚴(yán)重,由此基本都會(huì)形成負(fù)定值和博弈。
社會(huì)總收益主要是社會(huì)制度的升級(jí)和人民生存生活狀態(tài)的改善,其本質(zhì)是社會(huì)利益進(jìn)行重新分配的過(guò)程。從初始狀態(tài),廣大民眾處于弱勢(shì)群體,代表其進(jìn)行博弈的革命黨具備先天性的正義感和道德制高點(diǎn);但由于資源占有的匱乏,同時(shí)具備經(jīng)濟(jì)力量不夠的先天性弱勢(shì),故其為了在博弈中爭(zhēng)取資源分配權(quán)和獲得更多的資源占有量,必將拼盡全力乃至生命。因此,這將大大增加了雙方的博弈成本以及清廷后續(xù)的生存成本。故而,社會(huì)總收益會(huì)隨著雙方爭(zhēng)奪度的增大而消耗。
(2)在所難免的“囚徒困境”
由于當(dāng)時(shí)有強(qiáng)大軍事力量的軍閥的存在,革命黨與清廷的博弈行為都會(huì)有所顧忌,從而可能會(huì)更加冷靜,擺脫暴力沖突思維傾向而采取合作博弈態(tài)度;但同時(shí),如果軍閥不參與博弈,雙方都表現(xiàn)出急功近利的心態(tài),陷入暴力沖突狀態(tài)下的“囚徒困境”也不無(wú)可能。這樣,會(huì)有四種情況,如表1所示。
事實(shí)上,暴力沖突情況排除了雙方“串謀”的可能,即雙方不會(huì)互相妥協(xié),也就不會(huì)得到均衡解(1,1);那么,當(dāng)一方選擇有限妥協(xié),另一方選擇徹底革命或完全對(duì)抗時(shí),得到非均衡解(-1,0)和(0,-1)。強(qiáng)勢(shì)的一方將搶占全部原有社會(huì)效益,可以認(rèn)為是歷次農(nóng)民起義的結(jié)果;當(dāng)雙方采取徹底革命和完全對(duì)抗時(shí),各方均產(chǎn)生巨大的成本消耗,更可能的情況是效益被全部抵消,得到均衡解(-1,-1)。此即革命黨與清廷的負(fù)值和“囚徒困境”博弈均衡結(jié)果。
2.非暴力狀態(tài)下的革命黨與清廷貝葉斯博弈
排除雙方不考慮風(fēng)險(xiǎn)后果而陷入暴力傾向、導(dǎo)致“囚徒困境”的可能性,革命黨與清廷之間的博弈可以運(yùn)用不完全對(duì)稱信息的貝葉斯博弈模型進(jìn)行模擬。為此,首先明確:
(1)由革命黨先行考慮:若清廷B可以妥協(xié),則對(duì)其以“撫恤”作為補(bǔ)償。較低的撫恤以L(low)表示,較高的撫恤表示為H(high)。
(2)清廷根據(jù)革命黨發(fā)出的信號(hào),選擇是否與革命黨達(dá)成有限妥協(xié),無(wú)論結(jié)果如何,博弈均就此結(jié)束。其中,Y和N分別代表清廷是否愿意舍棄皇權(quán),與革命黨達(dá)成有限妥協(xié)。
然后,就雙方合作博弈,設(shè)預(yù)期社會(huì)總收益為1,分配給博弈雙方收益為α、β, (α+β=1, 0<α<β<1),并給出具體的收益假定:
(1)樂(lè)觀情形。革命黨采取L策略時(shí),清廷如果選擇響應(yīng)Y,則雙方收益分別為β和α;革命黨采取H策略時(shí),清廷如果仍選擇響應(yīng)Y,則雙方收益分別為α和β;而無(wú)論革命黨采取L還是H策略時(shí),清廷選擇不響應(yīng)N,則雙方非合作,其收益均是分別為0和α,這可以理解為,清廷不作任何改變,茍延殘喘地享用延續(xù)的收益α,而革命黨也就得不到任何變革收益,即收益為0。
(2)悲觀情形。只要清廷選擇響應(yīng)Y,則結(jié)果與樂(lè)觀情形相同;但清廷選擇不響應(yīng)N,其當(dāng)然是爭(zhēng)取比α更大的收益β,而革命黨得不到任何變革收益,即收益為0。
此處樂(lè)觀與悲觀皆是就清廷對(duì)“放棄皇權(quán)向革命者有限妥協(xié)”這一選擇的感知思維與利益評(píng)價(jià)而言。作為博弈接受方的清廷,樂(lè)觀情況是指,其相信舍棄皇權(quán)后生活質(zhì)量不低于舍棄前的情況,故在(L,Y)處達(dá)成均衡。悲觀表現(xiàn)的清廷則顯然不容易妥協(xié),但在(H,Y)尚可達(dá)成均衡。可以看到,如果清廷對(duì)自身的勢(shì)力估計(jì)過(guò)高,而對(duì)革命黨給以的撫恤過(guò)于悲觀,則更難以達(dá)成均衡。由于對(duì)革命黨支付的撫恤額度,清廷難以知曉相對(duì)于革命黨來(lái)講是高還是低,因此,很大程度上,樂(lè)觀與悲觀取決于其自己的感知思維與利益評(píng)價(jià)。
分析至此,可以給出雙方收益樂(lè)觀與悲觀情況的貝葉斯博弈表述如上表2、3。
從模型中容易看到,當(dāng)革命黨發(fā)出有限妥協(xié)信號(hào),不管是L還是H,只要清廷選擇有限妥協(xié)Y,無(wú)論結(jié)果如何,都已經(jīng)達(dá)到均衡,博弈就此結(jié)束。在清廷樂(lè)觀情況下,博弈在(L,Y)達(dá)到均衡(β,α);而在清廷悲觀情況下,博弈可以在(H,Y)達(dá)成均衡(α,β)。顯然,在(L,Y)均衡下保有的社會(huì)總收益是最大的,是有共同利益的各沖突方博弈的最佳均衡狀態(tài)。
回到南北議和的現(xiàn)實(shí),可以認(rèn)為,議和后的一段時(shí)間內(nèi)雙方達(dá)到了博弈的均衡,而且就當(dāng)時(shí)情況,是對(duì)國(guó)族系統(tǒng)最為有利的(L,Y)均衡狀態(tài)。
四、結(jié)語(yǔ)
體現(xiàn)和運(yùn)用合作博弈理性思維作為辛亥革命的一項(xiàng)重要成就,本應(yīng)為當(dāng)時(shí)及隨后的社會(huì)變革提供寶貴的經(jīng)驗(yàn)及借鑒依據(jù)。但這項(xiàng)成就未能引起足夠重視,以至于后續(xù)的社會(huì)碰撞多陷入非合作的負(fù)值和博弈,造成本可減免的損失。
博弈的理性就在于避免因一意孤行的感性爭(zhēng)奪而招致風(fēng)險(xiǎn)損失的行為策略選擇。用博弈論模型對(duì)歷史事件進(jìn)行的檢驗(yàn)可應(yīng)用到涉及社會(huì)變革議題的史學(xué)研究中,也為后世人類社會(huì)面臨重大抉擇時(shí)各個(gè)群體各種勢(shì)力之間可能產(chǎn)生的沖突的解決提供具有實(shí)際意義的參考。
參考文獻(xiàn):
[1]李在全.民元孫中山北京之行與遜清皇室的應(yīng)對(duì)——以紹彝、紹英未刊函札為中心的考察.[J]《清華大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》,2020
[2]江智健.胡適與辛亥革命[J].長(zhǎng)江叢刊,2019
[3]鮑 捷.從梁?jiǎn)⒊膽B(tài)度變化來(lái)看辛亥革命的意義[J].漢字文化,2019
[4]賀覺非,馮天瑜.《辛亥武昌首義史》[M].武漢湖北人民出版社,1985
[5]Gibbons,Robert. A Primer in Game Theory[M].LondonPearson?Education,1992
(作者單位:1.臺(tái)灣政治大學(xué)歷史系 2.中國(guó)礦業(yè)大學(xué)北京)
作者簡(jiǎn)介:吳蔚(1987—),男,漢族,北京人,博士研究生,研究方向:中國(guó)近代思想史;石玉鳳(1963—),女,漢族,北京人,博士,副教授,研究方向:管理科學(xué)與工程。