(北京工商大學(xué) 北京 102488)
協(xié)作學(xué)習(xí)是一種利用團(tuán)隊(duì)形式組織學(xué)生合作學(xué)習(xí),提高學(xué)習(xí)效率的學(xué)習(xí)方式,研究證明:“目前協(xié)作學(xué)習(xí)要比競爭學(xué)習(xí)、個(gè)人學(xué)習(xí)更能提高學(xué)業(yè)成績?!盵1]小組協(xié)作學(xué)習(xí)是一項(xiàng)團(tuán)隊(duì)活動,在團(tuán)隊(duì)成員之間會存在理念、觀點(diǎn)和原則等差異,若這些差異處理得當(dāng),團(tuán)隊(duì)的凝聚力就能夠得到加強(qiáng)。反之,則影響團(tuán)隊(duì)合作和目標(biāo)實(shí)現(xiàn)。[2]為了分析小組合作的具體情況,構(gòu)建相關(guān)博弈論矩陣,分析得到3種具體的協(xié)作情況:合作均衡(小組內(nèi)各成員均積極合作)、智豬博弈均衡(搭便車)以及囚徒困境(個(gè)人最優(yōu)導(dǎo)致集體非最優(yōu))。
在運(yùn)用中,智豬博弈均衡較為常見,由于不合理的獎(jiǎng)勵(lì)機(jī)制,使積極合作的人獲得的獎(jiǎng)勵(lì)與消極怠工的人差距不大,消極怠工的人可以坐享漁翁之利,導(dǎo)致能力強(qiáng)的人積極參與,能力弱的人消極怠工,智豬博弈均衡產(chǎn)生。同時(shí)為了獲得與勞動相匹配或更高的收益,參與者產(chǎn)生博弈心態(tài),若積極合作收益小于消極怠工收益,將不愿合作,小組協(xié)作陷入囚徒困境,即所有人都消極怠工。這無益于協(xié)作學(xué)習(xí)模式的發(fā)展和學(xué)生能力的提高。因此,本文利用構(gòu)建的協(xié)作學(xué)習(xí)博弈模型,探討智豬博弈均衡存在的條件、提出了防止其演變成囚徒困境的建議,這將促進(jìn)更有效率的合作均衡實(shí)現(xiàn)。
李京杰等運(yùn)用“智豬博弈”與“囚徒困境” 模型對協(xié)作學(xué)習(xí)中的合作與競爭問題進(jìn)行研究,發(fā)現(xiàn)協(xié)作學(xué)習(xí)中存在“搭便車”現(xiàn)象。[3]史忠翠等運(yùn)用“智豬博弈”模型,從“師生博弈”和“生生博弈”兩方面研究了小組合作學(xué)習(xí)。[4]在團(tuán)隊(duì)合作中,有時(shí)由于個(gè)人對團(tuán)體有依賴,產(chǎn)生惰性,降低了個(gè)體積極性,導(dǎo)致整體成效較低。[5]雖然這些研究分析了在組內(nèi)協(xié)作中組員間的“搭便車”現(xiàn)象,即智豬博弈情況,卻忽略了智豬博弈后的惡化反應(yīng),為了解決這一不足,本文將深入討論智豬博弈惡化(即囚徒困境均衡)的具體情況,并就此提出改進(jìn)方案。
為了簡化問題,設(shè)定參與人為A和B兩人,構(gòu)建一個(gè)簡單的小組協(xié)作學(xué)習(xí)博弈模型。博弈過程中存在兩種基本狀態(tài)——積極合作與消極怠工。博弈基本性質(zhì)為: ①組內(nèi)成員具有“理性”且“理性”為共同知識;②完全信息靜態(tài)博弈;③非零和博弈;
(1)符號說明與模型假設(shè)
為了便于模型分析,假設(shè)一些符號表示模型。A:能力強(qiáng)者;B:能力弱者;I:小組總投入;a:A的投入占比;b:B的投入占比;l:A的能力系數(shù);k:積極合作效應(yīng);k1:A的獨(dú)立效應(yīng);k2:B的獨(dú)立效應(yīng);p:A積極合作的概率;1- p:A消極怠工的概率;q:B積極合作的概率;1-q:B消極怠工的概率。
為了方便計(jì)算博弈收益情況,提出以下模型假設(shè)。
①假設(shè)成員能力不同,A為該組成績較優(yōu)者,B為成績較差者,設(shè)B的能力系數(shù)為1,A的能力系數(shù)l>1。
②合作效應(yīng)或獨(dú)立效應(yīng)指合作或獨(dú)立作業(yè)產(chǎn)生的其他可能影響成績的特殊效果,如由于合作或者獨(dú)立時(shí)的環(huán)境因素或心態(tài)因素而產(chǎn)生的效益或損失。沒有合作或獨(dú)立效應(yīng)時(shí),標(biāo)準(zhǔn)效應(yīng)為1,k>0,k1>0,k2>0。
③A、B合作完成小組作業(yè),每一次合作的總投入為I (包括精力、時(shí)間等要素的投入),A投入占比為a,B投入占比為b,a+b=1,0<a<1,0<b<1。
④小組總收益與總投入I和效應(yīng)k成正比。當(dāng)A、B積極合作時(shí),小組總收益與總投入I和合作效應(yīng)k正相關(guān),A積極合作而B消極怠工時(shí),其總評成績與k1、投入aI正相關(guān)。當(dāng)B積極合作而A消極怠工時(shí),總評成績與k2和投入bI正相關(guān)。但合作收益超過獨(dú)立作業(yè)的收益。同時(shí)A、B消極怠工時(shí),即無合作,無任何收益,值為0。
(2)小組協(xié)作學(xué)習(xí)模型的構(gòu)建
根據(jù)以上說明,構(gòu)造出A、B協(xié)作學(xué)習(xí)的支付矩陣,見表3。
表3 A、B協(xié)同作業(yè)支付矩陣
其中,
G1A=klaI-alI,G1B=kbI-bI
G2A=k1aI-alI,G2B=k1laI
G3A=k2bI-alI,G3B=k2bI-bI
G4A=0,G4B=0
雖然智豬博弈均衡是團(tuán)隊(duì)協(xié)作博弈之中的常見結(jié)果,但智豬博弈均衡存在也是有一定條件的,下面將具體分析合作均衡、智豬博弈均衡和囚徒困境形成的條件。
(1)小組協(xié)作博弈模型的均衡條件分析
從A的收益角度分析,此時(shí)A對自己的行為具有完全信息,對B有不完全信息。A選擇積極合作還是消極怠工取決于它選擇積極合作(p=1)時(shí)的期望支付與選擇消極怠工(P=0)時(shí)的期望支付之差△ G的大小。顯然,
ΔGA=∑piqiGiA(p=1)- ∑piqiGiA(p=0)≥0
其 中,p1=p,p2=p,p3=1-p,p4=1-p,q1=q,q2=1-q,q3=q,q4=1-q
代入收益矩陣得:
ΔGA=lI[q(ka-k1a-k2b)+k1a-a]
若ΔGA≥0,得A合作的條件:
q(ka-k1a-k2b)+k1a-a≥0
由a+b=1得:
q(k-k1-kb+k1b-k2b)+k1-k1b-1+b≥0
此不等式的分析,將分為以下兩種情況:
②當(dāng)q=0時(shí),原式可化為k1-k1b-1+b≥0,得k1≥1,當(dāng)A的獨(dú)立效用大于1時(shí),當(dāng)A會選擇合作時(shí),ΔGA≥0時(shí),取決于k1-1≥0這個(gè)不等式是否成立。即k1≥1時(shí),A也會選擇積極合作去保證自己的收益,即這種情況下,A會積極合作而B會消極怠工,出現(xiàn)“智豬博弈”。
從B的收益角度分析,此時(shí)B對自己的行為具有完全信息,而對A有不完全信息。B選擇積極合作還是消極怠工取決于它對選擇積極合作(q=1)時(shí)的期望支付與選擇消極怠工(q=0)時(shí)的期望支付之差△ G的大小。
ΔGB=piqiGiB(q=1)- ∑piqiGiB(q=0)≥0
其 中,p1=p,p2=p,p3=1-p,p4=1-p,q1=q,q2=1-q,q3=q,q4=1-q
代入收益矩陣得:
ΔGB=p(kb-k2b-k1la-b)-k2b
若ΔGB≥0,得B合作的條件:
p(kb-k2b-k1la-b)-k2b≥0
由a+b=1得:
p[k(1-a)-k2(1-a)-k1la-(1-a)]-k2(1-a)≥0
此不等式的分析,將分為以下兩種情況:
①當(dāng)p=1時(shí),原式可以化為k(1-a)-k2(1-a)-k1la-(1-a)-k2(1-a)≥0,所以當(dāng)B會選擇合作時(shí),k≥1。k1、k2、l、a越大則要求合作效應(yīng)k越大。ΔGA≥0,A積極合作,B也會積極合作,此時(shí)會出現(xiàn)合作均衡。
②當(dāng)p=0時(shí),原式可化為-k2(1-a)≥0,由于(1-a)≥0,k2≥0所以原式不成立,即當(dāng)A消極怠工,B也不會合作。這種情況下,A消極怠工,B也會消極怠工,形成囚徒困境。
當(dāng)ΔGA和ΔGB同時(shí)小于0時(shí),綜上條件即在k<1和k1<1時(shí),出現(xiàn)前“(消極怠工,消極怠工)”為納什均衡解,達(dá)成囚徒困境,即智豬博弈的惡化。
相較于合作均衡的收益,智豬博弈均衡并不是最優(yōu)利益的均衡狀態(tài) ,但在協(xié)作過程中,個(gè)體為了以最小成本獲取最大收益,往往容易陷入智豬博弈均衡。但相較于囚徒困境均衡,智豬博弈均衡是較優(yōu)選擇。因此,本文將從三個(gè)方面為改進(jìn)協(xié)作中智豬博弈均衡,促進(jìn)合作均衡,防止智豬博弈惡化進(jìn)行策略設(shè)計(jì)。
由于團(tuán)體績效的獎(jiǎng)勵(lì)機(jī)制不合理,小組協(xié)作會有“搭便車”現(xiàn)象。因此,在小組合作時(shí),首先,選擇具有較高能力的人為組長,提高整體合作意愿;其次,在小組內(nèi)部創(chuàng)造基于內(nèi)部目標(biāo)管理的競爭機(jī)制,即將小組任務(wù)做出明確的分工安排,細(xì)化為小組組員的個(gè)人任務(wù),并進(jìn)行集中控制,以此提高合作的效率。最后,設(shè)立有差別的評分標(biāo)準(zhǔn),進(jìn)行差異化打分,針對小組的工作效果進(jìn)行公平的內(nèi)部評價(jià)。
(1)營造良好合作環(huán)境,直接提高合作效應(yīng)
k代表合作效應(yīng)。首先,小組成員能力互補(bǔ)的程度以及是否有合適的機(jī)制實(shí)現(xiàn)優(yōu)勢互補(bǔ)對合作效應(yīng)的提高有重要影響,在組建小組時(shí)要選擇能力互補(bǔ)的各個(gè)成員,同時(shí)小組成員也可以積極培養(yǎng)自身的能力去提高合作效應(yīng)。其次,良好的環(huán)境氛圍也可以很好提高合作效應(yīng),所以小組在組建時(shí)可以選擇同學(xué)或朋友或性格友善的小組成員,打造既可以輕松又可以專注的環(huán)境氛圍。最后,盡量避免隨機(jī)分組,防止成員間的陌生感影響合作效應(yīng)。
(2)提高k1,k2值,間接增強(qiáng)合作效應(yīng)
k1,k2代表的A、B獨(dú)立效應(yīng),k1、k2與客觀環(huán)境以及主觀心態(tài)的因素相關(guān)。A、B的獨(dú)立性越強(qiáng)說明合作一方的獨(dú)立性越強(qiáng),越能容忍對方的“消極怠工”,越有意愿為整個(gè)小組付出更多。
(1)提高能力系數(shù)
能力系數(shù)越大合作收益會越大,兩者更可能選擇合作。能力系數(shù)可以提高智豬博弈均衡的上限,增強(qiáng)智豬博弈均衡的穩(wěn)定性。能力較弱的一方能力的上升將縮小智豬博弈均衡收益的差距。對于能力較弱的一方,教師可以考慮單獨(dú)輔導(dǎo)教學(xué),或者加強(qiáng)其鍛煉以提升其能力系數(shù)。如果雙方的能力持續(xù)上升,智豬博弈均衡會重新出現(xiàn)(以 k1不變?yōu)榍疤?)。雖然在此水平上的合作均衡收益仍大于智豬博弈均衡收益,但此時(shí)小組協(xié)作學(xué)習(xí)的總體能力已提升到新的高度,此時(shí)的智豬博弈均衡收益遠(yuǎn)高于之前的智豬博弈均衡收益。
(2)增加合作投入
a、b分別代表A、B的投入占比,a、b越大且趨于一致,則越能增加雙方收益。a、b越大說明雙方越愿意為小組協(xié)作投入較大精力,而趨于一致可以增加公平感,從而提高合作效應(yīng),增加雙方的合作收益。如加入基于協(xié)作貢獻(xiàn)度的小組互評分?jǐn)?shù),及時(shí)反饋各自分配的任務(wù)的完成情況并相互監(jiān)督,促使組員增加自己在小組合作的投入占比?;?qū)⑿〗M成員表現(xiàn)細(xì)化為幾個(gè)組成部分,依據(jù)時(shí)間投入、成效產(chǎn)出、小組凝聚效果、創(chuàng)新投入等多方面的組合評分方式計(jì)算得分,讓組員在各個(gè)方面的勞動付出都有具體成績,得到綜合評分。