• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      造假行為的傳播與遏制
      ——基于進化博弈模擬的研究

      2014-05-25 00:30:22吳怡萍蔡恒進
      關鍵詞:造假者懲罰收益

      吳怡萍 蔡恒進

      造假行為的傳播與遏制
      ——基于進化博弈模擬的研究

      吳怡萍 蔡恒進

      借鑒進化博弈的思想,一個新的模型建立起來用以模擬造假行為的傳播過程,以期找到其廣泛傳播的路徑,并尋找遏制的方法。模型賦予了個體學習的能力,結果顯示懲罰程度對造假行為的傳播沒有影響,但抽查概率卻是決定性的。為了提高查處的效率,“連帶檢查”機制被加入到模型中,即對造假者周圍鄰居進行檢查并施以同樣的懲罰。這種機制能夠在抽取概率為26%時達到消除造假者的目的,相比之下,沒有“連帶檢查”時必須把抽取概率提高到80%才能達到消除造假者的目的。

      進化博弈;造假行為;懲罰機制;連帶檢查

      在漫長的管理進化史中,對“人”的界定是在不斷發(fā)生變化的。自Adam Smith開始,經濟社會中的“人”被認為是“經濟人”,即以完全追求物質利益為目的而進行經濟活動的主體(雷恩·貝德安,2012:164-169)。建立在自利原則上的“經濟人”,擁有完全理性,希望以盡可能少的付出,獲得最大化的收獲,并可以為此不擇手段。之后Herbert Simon指出了完全理性決策只是一種理想模式,因為人們面對的是一個復雜的、不確定的世界,無法獲得完全的信息,同時人的計算能力和認知能力也是有限的,其所作的決策不可能不受到外界環(huán)境或是情緒的影響,因此無法做到完全理性,而應該是“有限理性”(Herbert Simon, 1997:35-37)。從最初的“機器的操作者”到“擁有智力和感情的機器”,從“完全理性人”到“有限理性人”。管理者對“人”的研究越來越多,管理學的重點也從如何管理機器、生產線以及生產的流程,轉變?yōu)槿绾喂芾砣?Harold Koontz,1980:175-187)。

      現實市場總是處于不完備的狀態(tài),因此交易者的機會主義行為會經常發(fā)生。當現有工商市場中制度存在缺陷時,交易主體發(fā)現選擇機會主義的失信行為有利可圖,一旦這種損人利己行為得不到現有制度的懲罰或懲罰不夠,就會發(fā)生劣幣驅逐良幣的效果,引發(fā)更多人不講信用,從而使道德進一步滑坡。我們希望借鑒進化博弈的思想來對造假行為的泛濫進行定量分析,用計算機模擬來研究其傳播途徑,并找到有效遏制方法。

      前人在對這些行為進行研究的時候,往往都是從人的心理、制度的不健全或者管理缺失的角度來進行分析(王林燕,2010:214-215)。他們關注的都是造假者與監(jiān)管機構之間的博弈,這固然可以為監(jiān)管部門提供一定的參考(劉偉兵、王先甲,2009:28-33)(王先甲、劉偉兵,2011:679-686),但是由于造假者都被看作為一個整體,他們的心理以及造假者行為對相互的影響則被忽視了。我們的模型研究的就是造假者之間的博弈,這是造假行為傳播的重要影響因素。

      一、模型的理論基礎

      (一)進化博弈理論

      進化博弈最早應用于生物領域,因其另辟蹊徑的思維模式而給生物進化指出了一條新的道路,也使得它的影響力逐漸擴大,衍生到各個行業(yè)中(Trivers R L,1971:35-57)。其中,進化博弈思想與社會科學,尤其是經濟與管理領域的合作,成為跨學科交叉成功的典范。這種將生態(tài)學與經濟學結合的創(chuàng)新的分析方法,結合了經典博弈理論和社會學理論,將有限理性的人作為觀察對象,利用動態(tài)分析方法,把影響人行為的各種因素納入模型之中,來考察群體行為的演化趨勢。

      進化博弈思想中比較重要的一條就是互惠理論,其實質就是以犧牲目前的利益為代價,換取以后長期的利益(Axelrod R,1984:25-28)。這也是生物學中對于物種間合作的解釋,它同樣可以被延伸到人的合作中來。前人已經對這種行為進行了深入研究,并通過數學和計算機工具為合作進化過程建模。20世紀80年代,Robert Axelrod完成的計算機錦標賽被認為是最早利用計算機模型完成的合作進化研究。在這個錦標賽中,Tit-for-Tat策略表現得格外優(yōu)異,成為互惠利他主義的范例(Nowak M A,Sigmund K, 1992:250-253)。這是一種針鋒相對的策略,即完全跟隨對方的策略,上回合對方合作即合作,上回合對方背叛即背叛。這種策略比較友善,因為初始采取的是合作的策略,而且不會主動背叛對方,但是當遭到背叛的時候也會以牙還牙地進行報復,而當對方停止背叛的時候會立即原來并繼續(xù)合作。然而這個策略的容錯性很差,突變對于系統(tǒng)的影響很大,因此Martin Nowak和Karl Sigmund提出了Generous Tit-for-Tat策略,之后又提出了Pavlov策略(Nowak M A,Sigmund K,1993:56-58),這種策略的基本行為機制是win stay,lose shift(Parkhe,Rosenthal,Chandran,1993:531-539)(Martin Nowak,2006:1560-1563),并通過引入多種概率性策略的不均勻集合,以及突變和選擇到進化模擬中來證明Pavlov策略的優(yōu)越性。Martin Nowak和Karl Sigmund證明了在自然環(huán)境下,合作行為可能會經常建立在win stay,lose shift的基礎上。

      (二)自我肯定需求理論

      關于假冒偽劣的博弈模擬,前人大多關注的是造假者與監(jiān)管機構之間的博弈。而我們認為,造假者之間也存在博弈。造假行為的模仿、造假行為在生產者之間的傳播,都是研究造假行為發(fā)生所需要關注的部分。因此,我們首先將模型中的個體設定為生產者。

      生物領域用合作進化的思想來解釋不同物種(Christian Hilbe,Martin A.Nowak,2012:1067),或者不同個體之間的合作現象(Grilo C,Correia L,2011:109-122)。我們在探尋造假行為發(fā)生原因的過程中,發(fā)現也可以用合作-背叛的模式來進行研究。每個誠信的個體,在面對周圍的造假行為時,是會選擇堅守誠信,還是同流合污?他們進行選擇的依據是什么?我們認為,人的需求來自于理性與自我肯定。我們依據人的參照依賴心理特征,排除掉隨機的和完全非理性的需求之后,將需求分為兩類——理性經濟需求和自我肯定需求(H.J.Cai,2012:1-6)。理性經濟需求是每個人在其已掌握信息的基礎上做出理性選擇后產生的需求。與之相對的是自我肯定需求,它是人在理性經濟需求之外的,建立在對自己的主觀判斷上的需求。我們認為,自我肯定需求源于比較,而這種比較一般有兩種:一種是將自己的現在與過去比,另一種是將自己與他人比(H.J.Cai,2011:445-449)。這兩種比較加上人對自己的肯定而產生了一種不同于理性經濟需求的自我肯定需求。因為人是傾向于肯定自我的,在面對選擇時,人更傾向于做出有利于自己的判斷,更傾向于認可自己,并期望獲得高出平均水平或超出過去水平的報酬或認可。

      將這種比較帶到博弈中,就是學習和模仿。個體不是孤立存在的,周圍個體的行為會對其產生影響。當其中一個個體選擇造假,例如用質量較差的原材料替換原有的材料,就能夠獲得較高的額外收益。排除掉法律和道德的因素,周圍的個體會學習并模仿,而使得這一行為逐漸向外傳導,影響的范圍逐漸擴大。不過當這一行為逐漸傳播開來,成為系統(tǒng)中大部分個體的選擇的時候,額外的收益逐漸減少直至不復存在。

      二、模型的設計

      (一)對經典Pavlov模型的改進

      R?hl et al.(2011)引入聲譽機制,應用進化博弈模型來研究合作中的欺騙行為.他們在模型中構建了三類人——辨別者、背叛者以及欺騙者,每種人再分為聲譽好的和聲譽差的兩種,通過模擬他們兩兩交互的重復博弈,證明了欺騙者的存在對系統(tǒng)產生有害作用,因為對聲譽造假可以促進基于間接互惠的合作行為(Torsten R?hl,Claudia R?hl,2007)。

      我們還原了Pavlov策略,用計算機模擬實現了Pavlov策略的多人多次博弈,結果發(fā)現這是一種引導合作的策略,不論初始背叛者的比例有多少,最終模型都以全部變?yōu)楹献髡哌_到穩(wěn)定狀態(tài)。顯然這種策略的模擬結果與現實情況不符,所以我們對其進行了改進:

      Pavlov策略以及之前的各種進化博弈策略使用的都是一對一的交易模式(W.H.Press,F.D.Dyson, 2012:109)(A.J.Stewart,J.B.Plotkin,2012:10134-10135),而我們的模型中對此做了修改,在交互時依然是一

      對一,但是決策選擇的時候會受到周圍個體的影響。人是社會性的動物,其所作的決策會受到周圍個體、環(huán)境的影響。因此我們的假設為,個體能夠獲得周圍個體的信息,但是并不能獲得整個市場的完全信息,而且個體在做決策的時候,會更多地參照自己周圍的個體。因此個體在做決策的時候,會將自己的收益與鄰居的收益進行比較,以此來選擇之后的決策。這樣每次交互中,每個個體所關注的信息是它周圍這個小的群體中所有個體的信息,并且會對這些信息進行分析和判斷,以此來決定自己下一周期的選擇。每一周期它會觀察自己周圍個體的決策和收益,然后學習其中獲得收益最高的人。現實生活中的信息和選擇,也是依靠這樣的方式,通過周期的演進而不斷傳遞出去的。這種心理正是來源于個體的自我肯定需求。其核心觀點就是個體的比較,即個體的滿足感取決于與周圍個體的比較。如果自身獲得的收益更高,就能獲得更高的滿足感;否則即便絕對值很高,也不會獲得滿足。

      在R?hl的模型中,個體決策的改變是通過一系列參數和方程計算出來的,包括被抽到的概率、每一周期付出的成本、可能獲得的收益、如果欺騙可能被發(fā)現的概率等等,然而我們認為真實的決策沒有這么復雜,個體想要改變策略只是因為他看到了更好的策略,而這種認知是通過學習和模仿得來的?;谖覀儗avlov策略的改動,個體認知的范圍擴大,其接觸的個體有多個,而且他做決策的時候會對這些個體的收益進行綜合比較,這就使得較好的決策能夠脫穎而出,而周圍的個體會對這個決策進行學習。好的決策通過這個過程,可以迅速地在系統(tǒng)中傳播出去。當然,不好的但是收益高的決策也是一樣,例如造假行為就是一個典型的例子。

      (二)具有學習能力的進化博弈模型

      我們的模擬是分兩步完成的,為了更清晰地探尋造假行為的傳播過程,我們首先在模型中不加入懲罰機制,只觀察造假行為是如何通過學習和模仿在周圍的個體中傳播開來的。第二步,再在這個模型的基礎之上,加入懲罰機制,并與第一步的結果進行對比,以此來觀察懲罰機制是如何發(fā)揮作用的。

      基于前面提到的修改,我們將這個新的模型建立在一個二維平面中,設定每個個體的認知范圍是一個3×3的方格,即他能夠獲取周圍8個個體的所有信息,并且對這8個個體采取的決策是一致的。具體到每次交互,個體的選擇只有不造假或造假。雙方都不造假時,收益為3;都造假時,收益為1;一方造假另一方不造假時,造假者收益為5而不造假者收益為0。決定其下一周期決策的因素不再是其自身單次收益的高低,而是綜合比較周圍8個個體的總收益,找出其中收益最高的個體,選擇它的決策,作為自己下一周期的決策。

      具體到模型中,在V*V的二維平面中存在V2個個體,每個個體i與其周圍的每個鄰居j進行交互。在i與j的交互過程中,i的收益取決于i和j單次博弈的結果。每個個體每一周期對周圍8個鄰居的決策是相同的。周期開始時,個體i對周圍8個鄰居的決策參照上一個周期中自己和8個鄰居中獲得最多收益的人j,如果j是因為對鄰居造假獲得的收益,那么i在這一個周期中對所有鄰居采取造假決策,反之,i對所有鄰居采取不造假決策。

      模型的基本還是囚徒困境。每個Agent有不造假和造假兩種選擇,如果他們都選擇不造假,則都獲得3的收益;若都選擇造假,則都獲得1的收益;若一人不造假一人造假,則不造假方獲得0的收益而造假方獲得5的收益。而Agent每周期的決策,則是采取上一個周期周圍獲得最多收益者的選擇。具體流程如圖1所示:

      個體i在周期t對周圍8個鄰居采取統(tǒng)一的決策為Si,t,在這個周期獲得的總收益為Pi,t。除了第一個周期,每個個體的決策是隨機選取以外,以后的每個周期t(t>=2),i采取上一個周期中自己和8

      圖1 具有學習能力的進化博弈算法流程圖

      個鄰居里獲得收益最大的個體j所采取的決策,即個體j在t周期的決策:

      其中i1,i2,…i8分別表示i的8個鄰居。當個體i和8個鄰居中獲得最大收益的人不止一個時,如果獲得最大收益的人中有采取不造假決策的,那么i這個周期選擇不造假決策;否則i采取造假決策。

      三、模型的結果

      (一)不加懲罰機制的模擬結果

      在前文模型的基礎上,我們取V=100來進行模擬實驗。當初始狀態(tài)下所有的個體都不造假的時候,模型不會有任何改變,最后還是都不造假。當加入一定數量的造假者之后,造假的行為開始以不同的程度在整個系統(tǒng)中傳播出去。在這個擁有10000個個體的系統(tǒng)中,設定初始造假者比例為0.2%,即初始有約20個個體造假時,隨著周期的演進造假行為逐漸擴散并形成網絡。從導出的造假者數量可以看出,到大約50周期時,雖然有個別的變化,但是整體來看已經趨于穩(wěn)定。而這時的整個系統(tǒng)中,可以看出造假者依然占少數,如圖2中(4)所顯示的,其中藍色代表的是不造假者,而綠色是造假者。這時藍色的占主導,而綠色則只是在其中割裂出一些細小的網絡。

      圖2 初始造假者比例為0.2%、1%及10%時的個體行為演化圖

      圖3 兩種模型不同初始造假比例下的最終造假者比例對比圖

      但是當我們提高這個初始比例的時候,造假者的數量開始急劇增加。當初始造假者的比例為1%時,雖然這個比例很小,但是造假行為的傳播卻很快。從圖(5)到圖(6),即從第2周期到第6周期,造假行為迅速擴散,一半的個體開始學習這一行為。因為在大部分人不造假的情況下,少量的造假行為能夠帶來最高的收益,這樣通過模仿傳導出去,使得不造假者紛紛轉而選擇造假。系統(tǒng)在第50周期的時候基本達到穩(wěn)定狀態(tài),如圖(8)所示,與圖(4)相比,綠色超越了藍色,數量更多;而當初始造假者的比例為10%時,最終造假的人數更多,如(12)所示,不造假者只能以一個個孤島的形式存在。

      接下來我們對不同初始造假比例下,最終剩余的不造假者進行了統(tǒng)計,并且將其與Pavlov策略的結果進行對比。如下圖所示,Pavlov策略下,初始比例從0到20%,最終的不造假者都是100%。而我們建立的新模型則與之完全不同,當初始造假者的比例為1%時,模型穩(wěn)定后不造假者只剩下33.77%,減少了三分之二;而當初始比例上升為2%時,最終不造假者剩下18.22%,又減少了一半左右;這個比例在初始造假者上升為5%時就已經很低了,為8.69%;直到初始造假者為20%時,基本上所有人轉化為造假者。

      與Pavlov策略相比,我們模型中的個體能夠獲得更多人的信息(其周圍8個個體的信息),這比Pavlov中每個個體只關注自己的交易對象更為合理;而且,在這個認知范圍擴大的進化博弈模型中,個體還能夠對自己獲得的信息進行比較和分析,將自己周圍8個個體的策略和收益進行對比,從中選擇收益最高的個人進行模仿,這也使得好的策略能夠在系統(tǒng)中傳播出去。當然,在這個模型中,不好的行為,例如能夠獲得短暫高額收益的造假行為,也能夠迅速擴散。但是,正是這樣的模擬,才更符合實際情況。

      由這些數據我們可以看出,在一個不造假者的群體中,只要出現造假者,即使數量很少,也會立即帶來巨大的影響,即引導大家走向造假。因為在不造假的環(huán)境中,最初的造假能夠獲得巨大的收益,這就使得其周圍的人對其進行學習。但是當造假者大量增加的時候,造假所帶來的收益也迅速減少。當系統(tǒng)中全部為不造假者時,即初始造假者比例為0時,所有個體一個周期的收益總和為2.4×105;而當這一比例為0.01時,總收益也降低為1.31×105。隨著初始造假者比例的上升,系統(tǒng)中的總收益在逐步降低,直到所有人變成造假者,這時的總收益是最低的。

      (二)加入懲罰機制的模擬結果

      我們在前面的模型中加入懲罰機制。在每個周期的交易結束后選取一定概率的生產者進行檢查,如果被檢查的生產者這一周期采取了造假的行為,那么會對該生產者進行懲罰,沒收其一定比例的財產。其中,抽取生產者的概率叫做監(jiān)管力度p,沒收的財產比例叫做懲罰力度q。

      我們使用的參照組模型為初始造假比例為10%的情況,之前的模擬結果顯示,穩(wěn)定后其剩余的不造假者數量只剩下3.99%。而加入懲罰機制后,如圖1所示,綠色代表造假者,藍色代表不造假者。當抽查概率p設定為10%時,與不加入懲罰機制相比,雖然模擬剛開始時差別不大,但是之后加入懲罰機制的模擬中藍色的方塊數量更多,說明該懲罰機制是有效果的。由于p取10%時模型演進到5000周期都沒有達到穩(wěn)定狀態(tài),而是在50周期之后,不造假者的數量以一個較低的速率持續(xù)增長著。所以我們取前500周期的數據取平均,作為其最終的不造假者數量,結果為6.7%,與不添加懲罰機制的模擬結果相比幾乎增加了一倍。

      為了進一步觀察這種懲罰機制的作用效果,我們用不同的p值做了多次試驗,結果顯示最終的不造假者數量隨著p的升高而逐漸升高,如圖2中藍色點所示。當p取20%時,懲罰機制作用更加明顯,這種概率下模型也沒有到達穩(wěn)定狀態(tài),用前500周期的平均值算得的不造假者比例為又翻了一倍,達到12.21%;當p取50%時,懲罰機制的效果已經非常明顯,在50周期之后基本達到穩(wěn)定,保持在50%左右。最后,當p取80%時,不造假者的數量最終回升到100%,即造假者不復存在。

      對于這個結果——需要抽查概率達到80%才能完全杜絕造假行為,我們依然感到不夠滿意。因為這個概率在現實生活中是難以達到的,所以我們對懲罰的規(guī)則做了一點修改,加入了“連帶檢查”的機制,即對于發(fā)現的造假者,同時對其周圍8個人中的造假者也施以同樣的懲罰。具體到模擬中,就是在查到造假者之后,同時檢查該造假者周圍的鄰居,如果鄰居在這一周期采取了造假的行為,那么也會對其沒收相同比例的財產。這是一種更嚴格的懲罰,而模擬的結果也顯示出其更有效果。如圖4所示,第三條代表的是加入了“連帶檢查”的模擬演化圖。同樣以抽查概率為10%,與前面兩種情況相比,第三條的藍色區(qū)域明顯增加,并且能夠形成較大的片狀連接在一起。這種情況下穩(wěn)定后的不造假者比例達到26.02%。

      通過以上兩種懲罰機制,以及原有對照組模型的周期演化圖,可以更明顯看出不同程度懲罰機制的作用。將每種比例下,不同機制的模擬結果放在一張圖中,如圖5所示,能夠更直觀的看出每種機制的作用效果。這里的每一個概率下,我們都運行了兩種情況,結果差別不大。

      圖4 不加懲罰、加入懲罰(p=10%)以及加入“連帶檢查”(p=10%)三種情況的模擬演化對比圖

      圖5 不同監(jiān)督機制下的最終不造假者數量散點圖

      圖6 “連帶檢查”機制中,不同參數下的最終不造假者數量散點圖

      從上圖中可以看出,加入“連帶檢查”的模型,在抽查概率為26%時即可以消滅所有的造假者,使最終不造假者比例達到100%。如圖2所示,相比藍色的點上漲的速度比較緩慢,紅色的點上漲得非常迅速。當p取15%,不造假者的數量即有52%;當p提升到20%時,這時不造假者已經占大多數,達到73%左右;而當p取25%時,幾乎全部轉化為不造假者,直至p取26%時,最終的比例達到100%。

      對于模型的其他參數——初始造假者的比例、懲罰的力度(q)對模型的影響我們也做了研究,結果顯示沒有明顯影響。如下圖6所示,藍色的點代表的是“連帶檢查”機制下,其他參數不變,將懲罰的比例q從50%改為40%的結果。而圖中黃色的點則代表的是,將初始的造假者比例從10%改為50%的情況。作者還嘗試了其他多種情況,結果均差異不大。所以可以得出結論,即其他因素對造假行為的影響很小。

      四、結論

      本文通過對經典的進化博弈模型進行修改,模擬了造假行為傳播的過程,并將有無懲罰機制的兩種情況進行了對比,找出了最有效果的懲罰機制,即“連帶懲罰”。我們在Pavlov模型的基礎上,賦予了個體學習的能力,具體表現為比較周圍鄰居的總收益,然后跟隨收益最高者的選擇。由于個體在選擇時會比較周圍鄰居的上周期收益,選擇其中收益最高者模仿其決策,因此當有個體選擇造假時,能夠獲得較高的額外收益,這一行為能夠通過這一博弈過程迅速向外傳導,使得他周圍的個體都對他進行模仿。結果顯示,由于具有學習能力,因此造假行為的傳播非常迅速。之后在這個模型之中,我們添加了懲罰機制,即在每個周期的交易結束后選取一定概率的生產者進行檢查,如果被檢查的生產者這一周期采取了造假的行為,那么會對該生產者進行懲罰,沒收其一定比例的財產。模擬的結果顯示,抽查的概率是決定性的,造假者的數量會隨著這個概率的增加而逐漸減少。

      從管理機制的角度,我們的模擬結果為現今的工商執(zhí)法部門提供了數據依據。要查處造假行為,只需要設定一定的懲罰額度,并盡可能地提高抽查的概率。在實際的打擊假冒偽劣的行為中,造假行為往往不是單獨發(fā)生的,造假者也經常處于聚集狀態(tài)。對于查到的造假者,如果能做到不僅僅對其實行懲罰,還利用其作為線索繼續(xù)追查,找出其周圍的造假者,不僅能夠提高懲罰的震懾作用,也大大降低了執(zhí)法的成本。

      參考文獻:

      [1] 雷恩·貝德安(2012).管理思想史.北京:中國人民大學出版社.

      [2] 劉偉兵、王先甲(2009).進化博弈中多代理人強化學習模型.系統(tǒng)工程理論與實踐,3.

      [3] 王林燕(2010).中國經濟社會誠信缺失現象的文化因素分析——從中國文化誠信觀與西方“經濟人”假設的角度.河南社會科學,1.

      [4] 王先甲、劉偉兵(2011).有限理性下的進化博弈與合作機制.上海理工大學學報,6.

      [5] Axelrod R(1984).The Evolution of Cooperation.New York:Basic Books.

      [6] A.J.Stewart,J.B.Plotkin(2012).Extortion and Cooperation in the Prisoner’s Dilemma.Proc.Nat.Acad.Sci.USA.

      [7] Christian Hilbe,Martin A.Nowak(2012).Karl Sigmund.The Evolution of Extortion in Iterated Prisoner’s Dilemma Games.ar Xiv preprint ar Xiv.

      [8] Grilo C,Correia L(2011).Effects ofasynchronism on evolutionary games.Journal of Theoretical Biology.

      [9] Harold Koontz(1980).The Management Theory Jungle Revisited.The Academy of Management Review,5.

      [10]Herbert Simon(1997).Administrative Behavior.New York:The Free Press.

      [11]H.J.Cai(2012).The Historical Context of the Rise of China and the Entry Point of the Transformation of the Development Pattern,Emergence and Transfer of Wealth,2.

      [12]H.J.Cai,Yiping Wu(2011).Self-Assertiveness Demands are the Ultimate Cause of Financial Crises,Applied Social Science.Information Engineering Research Institute.

      [13]Martin Nowak(2006).Five Rules for the Evolution of Cooperation.Science.

      [14]Nowak M A,Sigmund K(1992).Tit for tat in heterogeneous populations.Nature.

      [15]Nowak M A,Sigmund K(1993).A strategy of win-stay,lose-shift that out performs tit-for-tat in the Prisoners Dilemma game.Nature.

      [16]Parkhe,Rosenthal(1993).Chandran,Prisoner’s dilemma payoff structure in inter firm strategic alliances:an empirical test.OMEGA International Journal of Management Science,5.

      [17]Trivers R L(1971).The Evolution of Reciprocal Altruism.The Quarterly Review of Biology,1.

      [18]Torsten R?hl,Claudia R?hl(2007).Heinz Georg Schuster,and Arne Traulsen,Impact of fraud on the mean-field dynamics of cooperative social systems,Physical Review,76.

      [19]W.H.Press,F.D.Dyson(2012).Iterated Prisoner’s Dilemma contains strategies that dominate any evolutionary opponent.Proc.Nat.Acad.Sci.USA.

      ■責任編輯:劉金波

      Fraud Propagations and Containments——A Study Based on Evolutionary Game Simulation Model

      Wu Yiping(Doctoral Candidate,Wuhan University)
      Cai Hengjin(Professor,Wuhan University)

      An evolutionary game model is built up to simulate the fraud behaviors and find a way to better contain them. With modifications the classical Pavlov strategy is changed with learning ability.The simulations depict that the punishment degree doesn’t affect much,on the spread of frand behaviors but the checking frequency is a determining factor.To improve efficiency,the“collateral checking”mechanism is adopted to check and punish the frauds as well as the frauds in their neighborhood.The new mechanism shows better result since it can eliminate frauds at the checking percentage of 26%, while it has to be raised to 80%if without“collateral checking”.

      evolutionary game;fraud behavior;punishment method;collateral checking

      吳怡萍,武漢大學國際軟件學院博士生;湖北武漢430079。Email:wuyp1028@gmail.com。蔡恒進,武漢大學國際軟件學院教授,博導。

      國家重點基礎研究發(fā)展計劃項目(2011CB302306),武漢大學研究生自主科研項目(201121601020001)

      猜你喜歡
      造假者懲罰收益
      螃蟹爬上“網” 收益落進兜
      神的懲罰
      小讀者(2020年2期)2020-03-12 10:34:06
      “造假者”納瓦羅注定滑天下之大稽(環(huán)球銳評)
      Jokes笑話
      懲罰
      趣味(語文)(2018年1期)2018-05-25 03:09:58
      2015年理財“6宗最”誰能給你穩(wěn)穩(wěn)的收益
      金色年華(2016年1期)2016-02-28 01:38:19
      東芝驚爆會計丑聞 憑空捏造1518億日元收益
      IT時代周刊(2015年8期)2015-11-11 05:50:38
      真正的懲罰等
      如何解開設計院BIM應用的收益困惑?
      本期導讀
      新密市| 江口县| 沙坪坝区| 平凉市| 连江县| 孟村| 漠河县| 鄂尔多斯市| 运城市| 宁强县| 武平县| 水富县| 普格县| 中牟县| 德化县| 新余市| 周宁县| 多伦县| 桃园县| 商河县| 吴堡县| 蕉岭县| 嘉义县| 大关县| 巴楚县| 望奎县| 华池县| 剑河县| 右玉县| 静海县| 洪洞县| 汕尾市| 仪陇县| 锡林郭勒盟| 分宜县| 上栗县| 蓝山县| 金阳县| 乃东县| 东丽区| 巨鹿县|