謝能剛, 代亞運, 王 萌, 王 璐, 暴 偉
(1.安徽工業(yè)大學(xué) 管理科學(xué)與工程學(xué)院,安徽 馬鞍山 243002; 2.安徽工業(yè)大學(xué) 商學(xué)院,安徽 馬鞍山 243002)
合作共贏是“構(gòu)建人類命運共同體”的重要理念、意識和模式之一[1]。那么在由利己的相互競爭的個體所組成的社會中,合作行為是如何產(chǎn)生和演化的呢?被譽為“新時代達爾文”的Nowak教授提出[2]:合作的產(chǎn)生有親緣選擇、直接互惠、間接互惠、網(wǎng)絡(luò)互惠和種群選擇5種物理機制,并認(rèn)為自然合作與自然選擇、遺傳變異居于同等地位,是演化理論的第3條基本規(guī)則。
目前關(guān)于合作行為發(fā)生和進化機制的分析大都是建立在個體理性基礎(chǔ)上的,最近關(guān)于最后通牒博弈的社會學(xué)實驗表明[3],個體理性的假設(shè)很難解釋實驗結(jié)果,而基于腦功能活動的認(rèn)知神經(jīng)科學(xué)研究對該實驗結(jié)果的神經(jīng)生理機制做出了有益的探索,從中發(fā)現(xiàn)負(fù)性情感和情緒反應(yīng)是影響個體合作的重要因素。Nowak指出[4]:“盡管競爭是自然選擇的天然特性,但在直接和間接互惠的贏家策略中,以下的‘慈善’屬性卻是必不可少的:心存希望,慷慨大方,寬宏大量”。同時,Rao等[5]也率先提出“弱勢導(dǎo)致親社會行為”這一潛在機制來解釋合作行為的產(chǎn)生。因此,人類的理性從來就不是冷酷的、不帶情感的理性,從情感角度研究合作的演化機制,將豐富人們對社會困境中合作行為涌現(xiàn)的認(rèn)知,從而發(fā)現(xiàn)某些社會現(xiàn)象背后的“情”、“理”邏輯。
基于社會比較理論的觀點,個體之間競合行為的發(fā)生及結(jié)束可能源于個體對自身適應(yīng)度和他人適應(yīng)度的相對比較(將此稱為相對適應(yīng)度),并由此產(chǎn)生同情、漠然、欺凌、尊敬、畏懼及嫉妒的內(nèi)生情感和相應(yīng)行為。我們在文獻[6]中將情感類型分為四種,即對強者的尊敬與嫉妒和對弱者的同情與欺凌,基于遺傳算法的種群演化結(jié)果顯示:情感的多樣性能有效促進合作的產(chǎn)生,其中,同情和尊敬的情感更具進化優(yōu)勢。在隨后的研究中[7],進一步將情感類型拓展為六種,采用三策略囚徒困境博弈模型,基于格子網(wǎng)絡(luò)的演化博弈結(jié)果顯示:隨著背叛誘惑的增強,社會系統(tǒng)逐漸從“敬上愛下”的良性氛圍轉(zhuǎn)變?yōu)椤拔窂娏枞酢钡膼盒誀顟B(tài)。
由于個體之間的相互作用需依托網(wǎng)絡(luò)載體開展,因此空間網(wǎng)絡(luò)結(jié)構(gòu)影響演化博弈的進程與結(jié)果。據(jù)《美國科學(xué)院院報》(PNAS)報導(dǎo)[8],以及最近關(guān)于社會困境的行為實驗結(jié)果也表明[9],網(wǎng)絡(luò)群體能夠有效地促使處于劣勢的合作者聚集成團簇,從而維持穩(wěn)定的合作水平,使群體獲得較高的收益。
本文將基于考慮情感的三策略囚徒困境博弈模型,采用二維格子網(wǎng)絡(luò)、隨機網(wǎng)絡(luò)和無標(biāo)度網(wǎng)絡(luò)等三種網(wǎng)絡(luò)模型,通過演化博弈仿真分析,研究社會合作狀態(tài)、情感類型分布和網(wǎng)絡(luò)拓?fù)涮卣髦g的關(guān)系。
采用一種考慮自愿參與的囚徒困境博弈模型,其中博弈方的策略分為參與博弈狀態(tài)下的合作、背叛策略和不參與博弈的孤獨策略三種。表1為兩個博弈方的收益矩陣[10](博弈方1收益在前)。其中R為雙方合作的獎勵;P為相互背叛的懲罰;T為背叛成功的誘惑;S為合作失敗的代價;σ為不參與博弈的福利。
表1 博弈收益矩陣
人類的情感豐富多彩,本文將情感集限定為個體對相對適應(yīng)度的關(guān)注而產(chǎn)生的情感。我們假設(shè)面對“弱者”(即對手的收益小于或等于自己的收益)時,個體產(chǎn)生的情感集合為{同情、欺凌和漠然}。當(dāng)面對“強者”(即對手的收益大于自己的收益)時,個體產(chǎn)生的情感集合為{尊敬、嫉妒和畏懼}。
用四個參數(shù){W,α,V,β}對個體的情感特征進行表達。W表示對弱者的情感標(biāo)簽,取值為0或1,α∈(0,1)表示相應(yīng)的情感程度;V表示對強者的情感標(biāo)簽,取值為0或1,β∈(0,1)表示相應(yīng)的情感程度。(1)當(dāng)W=0時,α表示個體對弱者同情的程度,α越大表示對弱者的同情心越強,漠然感越弱。(2)當(dāng)W=1時,α表示個體對弱者欺凌的程度,α越大表示對弱者的欺凌心越強,漠然感越弱。(3)當(dāng)V=0時,β表示個體對強者尊敬的程度,β越大表示對強者的尊敬心越強,畏懼感越弱。(4)當(dāng)V=1時,β表示個體對強者嫉妒的程度,β越大表示對強者的嫉妒心越強,畏懼感越弱。
定義六種情感與三種策略之間的定性對應(yīng)關(guān)系為[10]:同情和尊重對應(yīng)合作策略;欺凌和嫉妒對應(yīng)背叛策略;漠然和畏懼對應(yīng)個體選擇不參與博弈的孤獨策略。假設(shè)Ui和Uj分別表示個體i和個體j在當(dāng)前輪次的收益,個體i的情感特征為{Wi,αi,Vi,βi}。當(dāng)個體i和個體j進行博弈時,個體i的情感和博弈策略之間的定量表達機制為(個體j同理):
(1)當(dāng)個體j相對于個體i是“弱者”(即Ui≥Uj)時,1)若Wi=0,即個體i對弱者的情感為同情或漠然;αi表示個體i對弱者同情的程度,代表了將和個體j合作的概率。如果p1≤αi(p1為[0,1]之間服從均勻分布的隨機數(shù)),則合作;否則個體i選擇不參與博弈的孤獨策略;2)若Wi=1,即個體i對弱者的情感為欺凌或漠然;αi表示個體i對弱者欺凌的程度,代表了將對個體j背叛的概率。如果p1≤αi,則背叛;否則個體i選擇不參與博弈的孤獨策略。
(2)當(dāng)個體j相對于個體i是“強者”(即Ui 網(wǎng)絡(luò)載體采用構(gòu)建的社會網(wǎng)絡(luò)(節(jié)點總數(shù)為N),采用蒙特卡洛(Monte Carlo)方法對三策略囚徒困境博弈模型進行演化仿真。 (1)初始階段,每個個體被隨機分配一個表征其情感特征的四個參數(shù)組合{W,α,V,β} 以及初始收益U0。W和V被隨機賦值為0或1;α和β被隨機賦值為(0,1)區(qū)間上的數(shù);U0被隨機賦值為區(qū)間[S,T]上的數(shù)。 (2)在每一個博弈輪次,從群體中隨機選擇一個個體i與其所有鄰居分別進行一次博弈,博弈中個體i及其鄰居采取的策略按照1.3節(jié)的方法確定,獲得其平均收益Ui(個體i和所有鄰居博弈后所獲收益的平均值),然后用該收益替換個體i之前的收益。 (3)個體i進行情感模仿更新,采用依賴收益差別的情感學(xué)習(xí)方法,即參與者模仿“收益更高”的鄰居情感特征。個體i從他的鄰居中隨機選擇一個鄰居(記為個體j)進行收益的比較,個體i以某個概率q(為i、j兩個體收益差的函數(shù))模仿個體j的情感特征,一般取為q={1+exp[(Ui-Uj)/κ]}-1,其中:κ為噪聲參數(shù),本文取0.1。具體學(xué)習(xí)模仿過程為:在[0,1]區(qū)間生成兩個隨機數(shù)γ1和γ2,如果γ1≤q和γ2>q,個體i只模仿個體j的情感特征{Wj,αj}并保持自身原有的情感特征{Vi,βi};如果γ1>q和γ2≤q,個體i只模仿個體j的情感特征{Vj,βj}并保持自身原有的情感特征{Wi,αi};如果γ1≤q和γ2≤q,個體i同時模仿個體j的情感特征{Wj,αj}和{Vj,βj};如果γ1>q和γ2>q,則個體i保持自身原有的情感特征{Wi,αi}和{Vi,βi}。 (4)重復(fù)上述博弈N輪,使每個個體在概率上平均有一次機會更新情感特征和收益。 (5)將以上過程作為一個蒙特卡洛步,重復(fù)基于蒙特卡洛步的迭代過程,直至系統(tǒng)演化達到穩(wěn)定狀態(tài)(一般以群體情感類型的分布達到穩(wěn)定)。 群體規(guī)模N取為40000,采用相應(yīng)的網(wǎng)絡(luò)構(gòu)造方法生成二維格子網(wǎng)絡(luò)、隨機網(wǎng)絡(luò)和BA無標(biāo)度網(wǎng)絡(luò),3種網(wǎng)絡(luò)的度分布如圖1所示。參數(shù)取值為:R=1,S=0,P=0,σ=0.3以及T=1.5。為對個體情感類型進行歸類,本文分別將α∈(0,1)和β∈(0,1)均分為10段,當(dāng)不同個體的W(以及V)相同且α(以及β)的數(shù)值落在同一個區(qū)間段時,則認(rèn)為屬于同一種情感類型,這樣群體中一共有2*2*10*10=400種情感類型。同時,根據(jù)W和V的取值將群體的情感類型分為4個區(qū)域,即:區(qū)域P1(W=1,V=1)、區(qū)域P2(W=0,V=1)、區(qū)域P3(W=1,V=0)和區(qū)域P4(W=0,V=0)。 圖1 網(wǎng)絡(luò)的度分布 2.2.1 格子網(wǎng)絡(luò) 圖2顯示了合作、背叛和孤獨3種策略的演化趨勢,同時也給出了群體平均收益的演化趨勢。從圖2可看出,系統(tǒng)中合作策略首先消亡,背叛和孤獨策略最終取得均衡,大約各占50%;最終系統(tǒng)的平均收益為0.33。 圖2 基于格子網(wǎng)絡(luò)的博弈系統(tǒng)中三種策略占比和平均收益的演化 圖3為4個情感區(qū)域內(nèi)個體數(shù)占群體比例的演化圖,圖4為400種情感類型的迭代演化,其中P(α,β)表示屬于某情感類型的個體數(shù)占群體的比例。從圖3和圖4可以看出,由于背叛誘惑T=1.5,大于合作的獎勵R=1,因此在演化初期,合作策略將受到背叛策略的剝削,使得具有較高概率采取合作策略的情感類型及個體(區(qū)域P4)迅速減少,而具有較高概率采取背叛策略的情感類型及個體(區(qū)域P1)迅速增加;隨著良性情感類型及個體(區(qū)域P4)的消亡,不良情感類型失去了剝削對象,尤其是對強者和弱者都具有較高概率采取背叛策略的情感類型{W=1,α∈[0.9,1.0),V=1,β∈[0.9,1.0)}及個體,在面對以較大概率采取孤獨策略的情感類型{W=1,α∈[0.9,1.0),V=0,β∈(0.0,0.1)}和個體時,失去了進化優(yōu)勢(因為前一種情感類型的兩個個體進行博弈的收益是背叛的懲罰P=0,而后一種情感類型的兩個個體進行博弈的收益是不參與博弈的福利σ=0.3),也開始逐漸減少;隨著演化的進行,情感類型{W=1,α∈[0.9,1.0),V=0,β∈(0.0,0.1)}取得了進化優(yōu)勢并占據(jù)種群。 圖3 基于格子網(wǎng)絡(luò)的四個情感區(qū)域內(nèi)個體占比的演化 圖4 基于格子網(wǎng)絡(luò)的群體中情感類型占比的迭代演化(圖a、b、c、d分別對應(yīng)迭代步為1、100、1000和7944即最終穩(wěn)態(tài)) 圖5顯示了群體情感特征空間分布情形的演化,本文定義兩個指標(biāo)(-1)Wα和(-1)Vβ,(-1)Wα的值從1變化至-1,表示對弱者的情感從同情→漠然→欺凌的變化,(-1)Vβ的值從1變化至-1,表示對強者的情感從尊敬→畏懼→嫉妒的變化。從圖5可看出,在背叛誘惑的激勵下,首先是個體對弱者的同情心失去進化優(yōu)勢,從同情轉(zhuǎn)化為欺凌,然后失去的是個體對強者的尊敬和嫉妒,取而代之的是對強者的畏懼和躲避博弈。 圖5 格子網(wǎng)絡(luò)中個體情感指標(biāo)(-1)Wα和(-1)Vβ的空間分布特征演化(圖a、b、c、d、e分別對應(yīng)迭代步為1、10、100、1000和7944即最終穩(wěn)態(tài)) 2.2.2 隨機網(wǎng)絡(luò) 圖6顯示了隨機網(wǎng)絡(luò)中合作、背叛和孤獨3種策略和群體平均收益的演化趨勢,從圖6可以看出,系統(tǒng)中合作策略首先消亡,背叛策略占比逐漸增長,然后在背叛策略和孤獨策略的對抗中,孤獨策略取得一定優(yōu)勢,最終狀態(tài)為孤獨策略和背叛策略共存,其中孤獨策略占比略高于0.5,背叛策略占比略低于0.5;最終系統(tǒng)的平均收益為0.30。 圖6 基于隨機網(wǎng)絡(luò)的博弈系統(tǒng)中三種策略占比和平均收益的演化 圖7為4個情感區(qū)域內(nèi)個體數(shù)占群體比例的演化圖,圖8為400種情感類型的迭代演化。從圖7和圖8可以看出,演化初期與格子網(wǎng)絡(luò)相似,但在后續(xù)的演化過程中出現(xiàn)與格子網(wǎng)絡(luò)的兩個不同點:(1)P3區(qū)域的個體占比持續(xù)減小,沒有像格子網(wǎng)絡(luò)那樣在演化中期出現(xiàn)增長并逐漸占據(jù)進化優(yōu)勢;(2)演化中期系統(tǒng)呈現(xiàn)P1和P2區(qū)域個體共存的局面,占比波動較小,演化中后期(104代左右),P1區(qū)域的個體占比突然上升和P2區(qū)域的個體占比突然下降,并最終表現(xiàn)為情感類型{W=1,α∈(0.0,0.1),V=1,β∈[0.9,1.0)}占據(jù)群體的主導(dǎo)地位。為了分析圖7中P1和P2區(qū)域的個體占比突然反轉(zhuǎn)的原因,根據(jù)節(jié)點的度,將群體分為3個子群體:度<4、4<=度<10和度>=10。圖9給出了P1和P2區(qū)域中三類子群體的占比演化情況,從中可以看出:度>=10的子群體在演化過程中的占比不穩(wěn)定,顯示出容易激發(fā)和大幅波動,因此可能是該反轉(zhuǎn)的驅(qū)動因素和先行者。 圖7 基于隨機網(wǎng)絡(luò)的四個情感區(qū)域內(nèi)個體占比的演化 圖8 基于隨機網(wǎng)絡(luò)的群體中情感類型占比的迭代演化(圖a、b、c、d分別對應(yīng)迭代步為1、100、1000和20000即最終穩(wěn)態(tài)) 圖9 三類子群體的占比演化(a.P1情感區(qū)域;b.P2情感區(qū)域) 2.2.3 BA無標(biāo)度網(wǎng)絡(luò) 圖10顯示了BA無標(biāo)度網(wǎng)絡(luò)中合作、背叛和孤獨3種策略和群體平均收益的演化趨勢,從圖10可以看出,系統(tǒng)中孤獨策略逐漸消亡,背叛和合作策略最終取得均衡,大約各占50%;最終系統(tǒng)的平均收益為0.52。 圖10 基于BA無標(biāo)度網(wǎng)絡(luò)的博弈系統(tǒng)中三種策略占比和平均收益的演化 圖11為4個情感區(qū)域內(nèi)個體數(shù)占群體比例的演化圖,圖12為400種情感類型的迭代演化。從圖11和圖12可以看出,演化初期與格子網(wǎng)絡(luò)和隨機網(wǎng)絡(luò)相似,但后續(xù)演化進程中不同的是,區(qū)域P3的個體占比一直呈上升趨勢,且主要表現(xiàn)為{W=1,α∈[0.9,1.0),V=0,β∈[0.9,1.0)}的情感類型(圖12b所示),由于該情感類型的個體面對弱者時大概率欺凌(背叛策略),面對強者時大概率尊敬(合作策略),強者和弱者在博弈對局中的收益體現(xiàn)了弱者向強者的朝貢模式,而無標(biāo)度網(wǎng)絡(luò)存在中心節(jié)點(擁有比較多的鄰居),使這種朝貢模式得到發(fā)展和繁榮,具體原因為:一旦中心節(jié)點為該情感類型,中心節(jié)點在與其鄰居中的弱者博弈時就會取得收益優(yōu)勢,這樣使得中心節(jié)點的情感類型被鄰居節(jié)點模仿的概率增大,同時由于中心節(jié)點的鄰居數(shù)目多,導(dǎo)致中心節(jié)點的情感類型可以快速和廣泛擴散。 圖11 基于BA無標(biāo)度網(wǎng)絡(luò)的四個情感區(qū)域內(nèi)個體占比的演化 圖12 基于BA無標(biāo)度網(wǎng)絡(luò)的群體中情感類型占比的迭代演化(圖a、b、c、d分別對應(yīng)迭代步為1、100、1000和20000即最終穩(wěn)態(tài)) 根據(jù)節(jié)點的度,將群體分為3個子群體:度<4、4<=度<10和度>=10。定義a3和b3分別為P3區(qū)域內(nèi)所有個體情感指標(biāo)(-1)Wα和(-1)Vβ的均值。圖13給出了P3區(qū)域內(nèi)三類子群體的情感指標(biāo)a3和b3的演化情況,圖14給出了P3情感區(qū)域中三類子群體的占比演化情況,從圖13和圖14可以看出:度>=10的子群體的情感指標(biāo)b3和占比均大于且先行于其他2個子群體,說明度>=10的子群體是整個網(wǎng)絡(luò)情感演化的發(fā)動機,也驗證了上面對中心節(jié)點的分析。 圖13 P3區(qū)域中三類子群體的情感指標(biāo)演化 圖14 P3區(qū)域中三類子群體的占比演化 本文基于個體對相對適應(yīng)度的關(guān)注,設(shè)定了強者和弱者之間的同情、欺凌、漠然、尊敬、嫉妒和畏懼等6種情感類型,建立了個體情感特征的定量表達方法。將情感引入到三策略囚徒困境博弈模型中,設(shè)計了6種情感類型與合作、背叛及孤獨3個博弈策略之間的對應(yīng)關(guān)系和定量表達機制。構(gòu)建了基于情感模仿規(guī)則的博弈動力學(xué)演化算法,采用二維格子網(wǎng)絡(luò)、隨機網(wǎng)絡(luò)和BA無標(biāo)度網(wǎng)絡(luò)等三種網(wǎng)絡(luò)模型進行演化博弈仿真分析,結(jié)果顯示了情感類型及社會合作狀態(tài)與網(wǎng)絡(luò)拓?fù)涮卣髦g的關(guān)系。 (1)較大的背叛誘惑促進了采取背叛策略的情感類型的演化繁榮,三種網(wǎng)絡(luò)的演化結(jié)果表明,系統(tǒng)的最終演化狀態(tài)都體現(xiàn)出程度不同的負(fù)性情感特征,其中無標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)能夠?qū)е戮哂幸欢夹蕴卣鞯那楦蓄愋脱莼€(wěn)定,并帶來較高的合作水平。1)基于格子網(wǎng)絡(luò)的最終穩(wěn)定狀態(tài)是情感類型{W=1,α∈[0.9,1.0),V=0,β∈(0.0,0.1)}占據(jù)整個群體,個體的行為方式體現(xiàn)出對弱者欺凌和對強者畏懼的“欺軟怕硬”特征,群體中采取背叛策略和孤獨策略的概率基本一致(0.5左右)。2)基于隨機網(wǎng)絡(luò)的最終演化狀態(tài)表現(xiàn)為情感類型{W=1,α∈(0.0,0.1),V=1,β∈[0.9,1.0)}占據(jù)群體的主導(dǎo)地位,個體的行為方式表現(xiàn)為對弱者漠然和對強者嫉妒的“憎人富貴嫌人窮”特征,群體中背叛策略和孤獨策略共存。3)基于BA無標(biāo)度網(wǎng)絡(luò)的最終演化狀態(tài)表現(xiàn)為情感類型{W=1,α∈[0.9,1.0),V=0,β∈[0.9,1.0)}占據(jù)群體的絕對主導(dǎo)地位,個體的行為方式體現(xiàn)出對弱者欺凌和對強者尊敬的“敬上欺下”特征,群體中采取背叛策略和合作策略的概率基本一致(0.5左右)。 (2)在二維格子網(wǎng)絡(luò)中,由于所有個體的環(huán)境資源相同,個體為維護其積極的自我概念,一般傾向于進行下行比較(同弱者相比)并產(chǎn)生對比效應(yīng),比較對象(弱者)的失敗將導(dǎo)致個體產(chǎn)生自豪和高興的正性情緒,從而達到增強自尊和主觀幸福感的目的,因此,這可能是格子網(wǎng)絡(luò)中對弱者欺凌和對強者畏懼的情感類型{W=1,α∈[0.9,1.0),V=0,β∈(0.0,0.1)}取得進化優(yōu)勢的原因。 (3)在隨機網(wǎng)絡(luò)中,大部分節(jié)點的鄰居數(shù)目大致相同,接近“平均數(shù)”,鄰居數(shù)高于或者低于平均數(shù)的節(jié)點都較少,這類似一種依靠朋友、熟人等強鏈接關(guān)系建立的網(wǎng)絡(luò)。在具有強鏈接的關(guān)系情境中,個體一般傾向于進行上行比較(同強者相比)并產(chǎn)生對比效應(yīng),朋友的成功將導(dǎo)致個體產(chǎn)生嫉妒、憎恨等負(fù)性情緒,馬克·吐溫就曾經(jīng)說過:“你的好友的成功有時會帶給你不快”,因此,這可能是隨機網(wǎng)絡(luò)中對弱者漠然和對強者嫉妒的情感類型{W=1,α∈(0.0,0.1),V=1,β∈[0.9,1.0)}在系統(tǒng)演化中取得主導(dǎo)地位的原因。 (4)在BA無標(biāo)度網(wǎng)絡(luò)中,由于具有較多鄰居數(shù)目的中心節(jié)點的存在,以及大量的節(jié)點只有很少的鄰居,使得個體在進行上行比較時(同強者相比,強者一般為中心節(jié)點),基于自我完善的動機產(chǎn)生同化效應(yīng),強者的成功會使個體產(chǎn)生敬仰并備受激勵;在進行下行比較時(同弱者相比,弱者一般不為中心節(jié)點),出于自我滿足的動機產(chǎn)生對比效應(yīng),弱者的失敗會使個體產(chǎn)生自信和提高自尊。因此,這可能是BA無標(biāo)度網(wǎng)絡(luò)中系統(tǒng)最終演化為對弱者欺凌和對強者尊敬的{W=1,α∈[0.9,1.0),V=0,β∈[0.9,1.0)}情感類型的原因。1.4 博弈動力學(xué)演化算法
2 演化分析
2.1 計算說明
2.2 計算結(jié)果及分析
3 結(jié)論