吳克晴, 張世興
(江西理工大學(xué)理學(xué)院,江西贛州341000)
城管問(wèn)題的進(jìn)化博弈分析
吳克晴,張世興
(江西理工大學(xué)理學(xué)院,江西贛州341000)
針對(duì)近幾年來(lái)頻繁出現(xiàn)的城管沖突事件,基于博弈參與者有限理性的假設(shè),利用博弈理論,探討城市管理者與菜販問(wèn)題的解決方法.首先從靜態(tài)建立兩群體的博弈模型,分析其策略均衡,其次著重從進(jìn)化動(dòng)態(tài)角度進(jìn)行研究,得到博弈參與者的復(fù)制動(dòng)態(tài)系統(tǒng),利用動(dòng)力系統(tǒng)理論,分析進(jìn)化穩(wěn)定性條件,最后揭示了影響雙方進(jìn)化穩(wěn)定策略的因素.結(jié)果表明,文章的動(dòng)靜態(tài)博弈的分析對(duì)更好地規(guī)范市場(chǎng),塑造良好文明城市形象具有一定的指導(dǎo)意義.
進(jìn)化博弈理論;靜態(tài)博弈分析;復(fù)制動(dòng)態(tài)系統(tǒng);進(jìn)化穩(wěn)定策略;城市管理
隨著社會(huì)的快速發(fā)展和人口流動(dòng)的加速,作為維持城市秩序,防止攤販亂設(shè)攤位堵塞交通執(zhí)法的城管,遍布中國(guó)每一個(gè)城市.然而由于缺乏一部全國(guó)性的《城市管理法》或者行政法規(guī),不明確的職能使得這些年來(lái)時(shí)常聽(tīng)到城管和小販之間暴力沖突的新聞,不是城管傷小販,就是小販傷城管:2008年6月河北張家口發(fā)生的城管打人事件致使商販夫婦受傷;2009年5月沈陽(yáng)小販刺死城管事件;2010年9月四川瀘州發(fā)生的一起水果攤販刺傷城管事件;2013年7月湖南臨武縣發(fā)生的一起當(dāng)?shù)爻枪芘c瓜農(nóng)因肢體沖突,致使瓜農(nóng)倒地死亡事件等盡管近年來(lái)有不少學(xué)者如伍勁松[1]、陶紅茹[2]、韋正富[3]、吳文良[4]等對(duì)其研究分析過(guò),但他們大多都基于流動(dòng)商販管理存在的原因,提出了相應(yīng)的對(duì)策,并沒(méi)有從兩群體演變穩(wěn)定調(diào)整的過(guò)程分析.文獻(xiàn)[18]本文通過(guò)博弈論的基本原理首先對(duì)商販的三種處理方式:簡(jiǎn)單罰款、頒發(fā)許可證和幫扶商販進(jìn)行博弈模型分析,找出影響商販違規(guī)擺攤概率的因素,并對(duì)三種處理方式的效果進(jìn)行比較分析.文獻(xiàn)[19]是通過(guò)分析城管與商販合作前后的博弈模型,得出兩者合作能提高各自的效應(yīng).但上述文獻(xiàn)只是靜態(tài)的分析兩者之間的博弈,鑒于此,本文針對(duì)當(dāng)前菜販隨意設(shè)攤與城市管理執(zhí)法人員(以下簡(jiǎn)稱(chēng)城管)執(zhí)法之間的問(wèn)題,著重從進(jìn)化動(dòng)態(tài)角度進(jìn)行研究,得到博弈參與者的復(fù)制動(dòng)態(tài)系統(tǒng),利用動(dòng)力系統(tǒng)理論,分析進(jìn)化穩(wěn)定性條件,最后揭示了影響雙方進(jìn)化穩(wěn)定策略的因素.利用博弈理論的知識(shí),探討分析兩群體均衡策略的穩(wěn)定性條件.
20世紀(jì)50年代,Nash在文獻(xiàn)[5]中給出了均衡的定義及均衡存在性定理,為博弈論奠定了基礎(chǔ);60年代,Lewontin[6]就曾開(kāi)始用進(jìn)化博弈論解釋生態(tài)現(xiàn)象,首次將博弈論應(yīng)用到進(jìn)化生物中;之后,Maynard Smith和Price在傳統(tǒng)博弈理論的基礎(chǔ)上,結(jié)合達(dá)爾文的生物進(jìn)化理論,正式提出了更符合實(shí)際的進(jìn)化博弈論[7-8];這是一種把博弈論分析和動(dòng)態(tài)演化過(guò)程分析相結(jié)合起來(lái)的理論,視博弈方為有限理性[9-10],以群體為研究對(duì)象,采用動(dòng)力系統(tǒng)論的觀點(diǎn)看待群體的行為,其基本的概念是進(jìn)化穩(wěn)定策略[8](Evolution Stable Strategy.ESS)和復(fù)制動(dòng)態(tài)方程[11](Replicated Dynamic Equation.RDE).
ESS:表示一個(gè)種群抵抗突變個(gè)體進(jìn)入的一種穩(wěn)定狀態(tài),其定義[12]如下:假設(shè)整個(gè)群體采取策略q,若群體中存在占群體比例為ε∈(0,1)的變異者,而采取了另一變異策略p,對(duì)任意的策略p≠q,存在ε∈(0,1)有不等式J(q,εp+(1-ε)q)>J(q,εp+(1-ε)q),則策略q被稱(chēng)為ESS.
2.1博弈模型的基本假設(shè)及模型建立
博弈方:假設(shè)有兩個(gè)并非完全理性的局中人城管和菜販,考慮到兩者的風(fēng)險(xiǎn)偏好,默認(rèn)為風(fēng)險(xiǎn)中立.
策略:城管對(duì)隨意設(shè)攤販賣(mài)的市場(chǎng),有積極監(jiān)管和不積極監(jiān)管兩種策略選擇,菜販由于受利益和地理位置驅(qū)使,不遵守相關(guān)市場(chǎng)秩序,隨意擺設(shè)攤點(diǎn),對(duì)城管的監(jiān)督有積極配合和不積極配合,積極配合包括經(jīng)教導(dǎo)后能正常固定攤點(diǎn)買(mǎi)賣(mài)交易.假設(shè)在博弈開(kāi)始階段,城管選擇積極監(jiān)管的比例為x,選擇不積極監(jiān)管的比例為1-x,菜販選擇積極配合監(jiān)管的比例為y,選擇不積極配合監(jiān)管的比例為1-y.
各博弈方的收益:城管積極監(jiān)管是其本職工作,需要付出監(jiān)管成本a,帶來(lái)的績(jī)效收益為b,消極不監(jiān)管則無(wú)監(jiān)管成本,但對(duì)于菜販隨意設(shè)攤而沒(méi)監(jiān)管受到上級(jí)處罰為c,菜販的基本收益為d,固定攤位銷(xiāo)售,則需定期繳納租費(fèi)e,獲得額外收入為f,居無(wú)定所隨意設(shè)攤則可以減少租費(fèi),而且可以根據(jù)消費(fèi)者情況,自由買(mǎi)賣(mài)獲得額外收益為g,正因?yàn)樾杞蛔赓M(fèi),且特別當(dāng)g>f時(shí)(稱(chēng)g-f為相對(duì)額外收益),更多傾向于隨意設(shè)攤,造成市場(chǎng)沒(méi)有秩序,交通上也給帶來(lái)不便,被城管發(fā)現(xiàn)所造成的損失為h,其中罰款為q( 表1 城管與菜販之間的收益矩陣 2.2城管與菜販者間靜態(tài)博弈分析 靜態(tài)博弈指的是博弈過(guò)程中,參與人同時(shí)選擇或雖不是同時(shí)選擇但后選擇者并不知道先前選擇者采取了什么具體選擇的原則[14],從而城管與菜販者間構(gòu)成了完全信息下的靜態(tài)博弈. 根據(jù)表1知,城管的期望收益為: E(x)=x[y(-a+b)+(1-y)(-a+b+qp)]+(1-x)×[y× 0+(1-y)(-c)]=(cy-c)+x(-qpy-cy-a+b+qp+c)為追求利益最大化,令,得: 當(dāng)y<y*時(shí),,這說(shuō)明增加x能夠增加城管收益.即若菜販積極配合程度y<y*,城管最優(yōu)的策略反應(yīng)是增加x,當(dāng)x=1時(shí),期望收益最大;若菜販積極配合程度y>y*,城管最優(yōu)的策略反應(yīng)是減少x,當(dāng)時(shí)x=0,期望收益最大.顯然,x是y的函數(shù),其策略對(duì)應(yīng)如下: 其中[0,1]表示集合(下同). 同理,可求菜販的期望收益為: E(y)=(d+g-hpx)+y(w-e+f-g+hpx) 當(dāng)x>x*時(shí),,這說(shuō)明增加y能夠增加菜販?zhǔn)找?即若城管積極監(jiān)管程度x>x*,菜販最優(yōu)的策略反應(yīng)是增加y,當(dāng)y=1時(shí),期望收益最大;若城管積極監(jiān)管程度x<x*,菜販最優(yōu)的策略反應(yīng)是減少y,當(dāng)y=0時(shí),期望收益最大.x與y的策略對(duì)應(yīng)如下: 很明顯,城管與菜販間的策略是相互依存的.如果混合策略納什均衡為(x*,y*),必須同時(shí)滿(mǎn)足式(2)與式 (4),則滿(mǎn)足的條件應(yīng)該是x*∈[0,1],y*∈[0,1]故將x*及y*代入該范圍之內(nèi),即: 計(jì)算得到0<a-b<c+qp,g-f-ph<w-e<-f,當(dāng)滿(mǎn)足上述條件時(shí),即當(dāng)城管積極監(jiān)管付出的成本與所帶來(lái)的績(jī)效收益之差小于因沒(méi)有監(jiān)管菜販?zhǔn)艿缴霞?jí)處罰與積極監(jiān)管繳收的罰款之和,但積極監(jiān)管付出的成本大于所帶來(lái)的績(jī)效收益,同時(shí)當(dāng)菜販積極配合監(jiān)管所獲獎(jiǎng)助與所交租攤費(fèi)之差大于相對(duì)額外收益與隨意設(shè)攤被城管監(jiān)管所造成的損失之差,但小于相對(duì)額外收益時(shí),x*、y*為均衡策略. 進(jìn)一步,由式(1)與式(3)可知,x*與y*的關(guān)系為: 由式(5)可知: 所以當(dāng)x*增大時(shí),y*減小,即城管積極監(jiān)管,菜販配合積極性反而減低,這顯然有悖預(yù)期結(jié)果,究其主要原因在于政府給予正常經(jīng)營(yíng)菜販的獎(jiǎng)助w與所交固定租費(fèi)e落差較大,再加上隨意設(shè)攤帶來(lái)的相當(dāng)大的利益g誘惑.其實(shí)這是一個(gè)弱劣的納什均衡策略,根據(jù)文獻(xiàn)[15]知道博弈論中弱劣策略可以是納什均衡策略,弱劣策略絕對(duì)不是進(jìn)化穩(wěn)定策略,弱劣的納什均衡策略并不一定是進(jìn)化穩(wěn)定策略,即并不所有的納什均衡策略都是進(jìn)化穩(wěn)定策略. 2.3城管與菜販者間動(dòng)態(tài)博弈分析 很明顯,上述分析所得城管與菜販的均衡策略依舊是短暫的,究其原因博弈方策略選擇時(shí)不可能用“最優(yōu)反應(yīng)動(dòng)態(tài)[16]”這樣的機(jī)制進(jìn)行模擬,而是要利用生物學(xué)中生物進(jìn)化的“復(fù)制動(dòng)態(tài)”機(jī)制模擬,來(lái)探討其采用某種特定策略比例的變化趨勢(shì)和穩(wěn)定性.因?yàn)樽顑?yōu)反應(yīng)動(dòng)態(tài)機(jī)制一般在博弈人理性程度較高、具有快速學(xué)習(xí)能力時(shí).但文中的博弈人理性程度較低且涉及集體決策時(shí),用復(fù)制動(dòng)態(tài)機(jī)制能完全刻畫(huà)雙方的博弈學(xué)習(xí)過(guò)程,動(dòng)態(tài)的調(diào)整策略,選擇最優(yōu)的方法.這就是一個(gè)動(dòng)態(tài)博弈[14]問(wèn)題. 2.3.1博弈各方的復(fù)制動(dòng)態(tài)系統(tǒng)的建立 根據(jù)表1有城管采取積極監(jiān)管的期望收益為: E11=y(-a+b)+(1-y)(-a+b+q p) 城管采取不積極監(jiān)管的期望收益為: E12=y×0+(1-y)(-c) 城管的平均期望收益為: E1=xE11+(1-x)E12 因此,城管恪守職責(zé),依法積極管理下的復(fù)制動(dòng)態(tài)方程為: 同理,菜販積極配合監(jiān)管的復(fù)制動(dòng)態(tài)方程為: 由式(6)和式(7),即組成了城管與菜販者的復(fù)制動(dòng)態(tài)系統(tǒng): 對(duì)于系統(tǒng)(8)均衡點(diǎn)的穩(wěn)定性,根據(jù)文獻(xiàn)[17]提出的方法,可由式(8)的雅可比行列式的局部穩(wěn)定性分析判別.該雅可比矩陣為: 進(jìn)而可知J的行列式: det J=(1-2x)(1-2y)(w-e+f-g+phx)[-a+b+q p+ c-(q p+c)y]+ph(q p+c)(1-x)(1-y)xy J的跡: tr J=(1-2x)[-a+b+q p+c-(q p+c)y]+(1-2y)(we+f-g+phx) 2.3.2進(jìn)化策略的穩(wěn)定性分析 由于受不同參數(shù)的影響,城管是否積極性監(jiān)管,菜販?zhǔn)欠穹e極性配合有很大差異,并且x*及y*的范圍可以為小于0,大于1,屬于[0,1].所以對(duì)不同的x*及y*進(jìn)行組合,就可以得到五個(gè)命題中的九種情況,現(xiàn)將所有的分析情況列舉如下: 命題一:A1為兩者的進(jìn)化穩(wěn)定策略 當(dāng)a-b>c+q p且w-e 圖1 a-b>c+q p,w-e<g-f-ph時(shí)兩博弈群體的進(jìn)化博弈示意圖 圖2 a-b>c+q p,g-f-ph<w-e<g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 圖3 當(dāng)a-b>c+q p,w-e>g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 命題二:A2為兩者的進(jìn)化穩(wěn)定策略 當(dāng)w-e>g-f且a-b>c+q p時(shí),即當(dāng)菜販積極配合監(jiān)管所獲獎(jiǎng)助與所交租攤費(fèi)之差大于相對(duì)額外收益,同時(shí)城管積極監(jiān)管付出的成本與所帶來(lái)的績(jī)效收益之差大于因沒(méi)有監(jiān)管菜販?zhǔn)艿缴霞?jí)處罰與積極監(jiān)管繳收的罰款之和時(shí);當(dāng)w-e>g-f且0<ab<c+q p時(shí),即當(dāng)菜販積極配合監(jiān)管所獲獎(jiǎng)助與所交租攤費(fèi)之差大于相對(duì)額外收益,同時(shí)城管積極監(jiān)管付出的成本與所帶來(lái)的績(jī)效收益之差小于因沒(méi)有監(jiān)管菜販?zhǔn)艿缴霞?jí)處罰與積極監(jiān)管繳收的罰款之和,但積極監(jiān)管付出的成本大于所帶來(lái)的績(jī)效收益時(shí).這兩種情形下菜販能自覺(jué)安心蹲守?cái)偽唬刃蚓?,城管可以選擇不用監(jiān)管,則上述情況的兩博弈群體的進(jìn)化博弈示意圖分別如圖3和圖4所示. 命題三:A3為兩者的進(jìn)化穩(wěn)定策略 當(dāng)w-e 圖4 當(dāng)0<a-b<c+q p,w-e>g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 圖5 當(dāng)0<a-b<c+q p,w-e<g-f-ph時(shí)兩博弈群體的進(jìn)化博弈示意圖 圖6 當(dāng)a-b<0,w-e<g-f-ph時(shí)兩博弈群體的進(jìn)化博弈示意圖 命題四:A4為兩者的進(jìn)化穩(wěn)定策略 當(dāng)a-b<0且g-f-ph 圖7 當(dāng)a-b<0,g-f-ph<w-e<g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 圖8 當(dāng)a-b<0,w-e>g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 命題五:A5為兩者的進(jìn)化穩(wěn)定策略 當(dāng)0<a-b<c+qp且g-f-ph 圖9 當(dāng)0<a-b<c+q p,g-f-ph<w-e<g-f時(shí)兩博弈群體的進(jìn)化博弈示意圖 命題五實(shí)際表明,該博弈系統(tǒng)處于一個(gè)逆時(shí)針循環(huán)狀態(tài)(圖9所示).例如,當(dāng)城管監(jiān)管積極性提高時(shí),菜販則由不積極配合向積極配合過(guò)渡,現(xiàn)實(shí)中恰是如此情形.這主要取決于博弈初始階段參數(shù)的大小,從幾何的角度上,中心點(diǎn)A5即為以A1、A2、A4、A3為頂點(diǎn)組成四邊形中的內(nèi)點(diǎn),為使博弈系統(tǒng)進(jìn)入一個(gè)最佳狀態(tài),若使A3為最佳穩(wěn)定狀態(tài),也即A5由A5、的橫縱坐標(biāo)、A3為頂點(diǎn)組成的四邊形區(qū)域面積S增大.根據(jù)幾何圖形可知: 很明顯,從實(shí)際措施上說(shuō),降低固定攤位銷(xiāo)售需定期繳納租費(fèi)e,提高嚴(yán)格遵守?cái)偽坏牟素湹莫?jiǎng)助金額w,加大執(zhí)法監(jiān)管力度,即p增大,則S會(huì)增大,從而命題5的博弈狀態(tài)A5會(huì)進(jìn)化到狀態(tài)A3. 本文根據(jù)我國(guó)現(xiàn)階段城市管理執(zhí)法人員與菜販普遍出現(xiàn)的問(wèn)題,運(yùn)用博弈理論建立了兩群體間的穩(wěn)定策略分析模型,通過(guò)靜態(tài)和動(dòng)態(tài)博弈分析可以看出,城管是否愿意積極監(jiān)管,恪守職責(zé),與他們監(jiān)管時(shí)付出的成本、所帶來(lái)的績(jī)效收益及未監(jiān)管受到的處罰密切相關(guān),菜販?zhǔn)欠裨敢忏∈財(cái)偽?,保持市?chǎng)秩序,與他們所繳納的租費(fèi)、正常買(mǎi)賣(mài)時(shí)相關(guān)部門(mén)給予的獎(jiǎng)助及城管的積極監(jiān)管程度密切相關(guān),為構(gòu)建和諧城管,緩解雙方?jīng)_突,從靜態(tài)的博弈分析和動(dòng)態(tài)的博弈分析可以看出,應(yīng)提高國(guó)家給予城管積極監(jiān)管專(zhuān)項(xiàng)績(jī)效,加大失職的處罰力度,同時(shí)給予正常經(jīng)營(yíng)菜販們的獎(jiǎng)助,盡可能地降低租費(fèi),增大隨意設(shè)攤菜販的查處罰金.最后針對(duì)監(jiān)管中的“循環(huán)戰(zhàn)術(shù)”,給出了進(jìn)一步分析,加深說(shuō)明給予正常經(jīng)營(yíng)菜販的獎(jiǎng)助,盡可能降低租費(fèi),加大執(zhí)法力度是重要舉措. 同時(shí),本文的動(dòng)態(tài)分析結(jié)果很大程度上說(shuō)明,弱劣的納什均衡策略并不一定是進(jìn)化穩(wěn)定策略,個(gè)體的最優(yōu)策略不可能一開(kāi)始就能把握好,而是需要在重復(fù)博弈過(guò)程中不斷學(xué)習(xí)和調(diào)整,最終的策略才是較優(yōu)策略. 最后,由于本文僅限于城管與菜販間的博弈分析,所以可結(jié)合考慮有限理性博弈方消費(fèi)者參與的情形,這也將是筆者需進(jìn)一步研究分析的問(wèn)題,當(dāng)然其問(wèn)題相對(duì)較為復(fù)雜. [1]伍勁松,李小花,陳羽朋,等.從廣州大學(xué)城流動(dòng)商販管理看城管行政執(zhí)法[J].廣州大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2010,9(7):30-33. [2]陶紅茹,陶朝英.流動(dòng)商販管理的問(wèn)題及對(duì)策研究[J].商業(yè)視角,2011,637(4):60-61. [3]韋正富.探析我國(guó)城市管理中的流動(dòng)商販治理問(wèn)題[J].云南行政學(xué)院學(xué)報(bào),2011(5):146-148. [4]吳文良.淺析我國(guó)流動(dòng)商販管理面臨的困境及對(duì)策[J].城市管理與科技,2011(1):42-44. [5]Nash J.Non-cooperative Games[J].The Annals of Mathematics Department,1951,54(2):286-295. [6]Lewontin RC.Evolution and the theory ofgames[J].Journalof Theore ticalBiology,1960(1):382-403. [7]Maynard Smith J,Price G R.The logic of animal conflict[J]. Nature,1973,246:15-18. [8]Maynard Smith JM.Evolution and the theory of games[M].New York:Cambridge University Press,1982. [9]Simon H A.Invariants of human behavior[J].Annual Review Psychology,1990,41(1):1-19. [10]Newell A,Simon H A.Human problem solving[M].Eaglewood Cliffs,NJ:Prentice-Hall,1972. [11]Taylor PD,Jonker L B.Evolutionary stable strategies and game dynamics[J].Mathematical biosciences,1978,40(1):145-156. [12]王永欽.演化博弈論[M].上海:上海人民出版社,2006. [13]盧珊,趙黎明.基于協(xié)同理論的創(chuàng)業(yè)投資機(jī)構(gòu)與科技型中小企業(yè)演化博弈分析[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2011,32(7):120-123. [14]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,2003. [15]張良橋.進(jìn)化穩(wěn)定均衡與納什均衡-兼談進(jìn)化博弈理論的發(fā)展[J].經(jīng)濟(jì)科學(xué),2001(3):103-111. [16]劉偉兵,王先甲.進(jìn)化博弈決策機(jī)制設(shè)計(jì)綜述[J].運(yùn)籌與管理,2008,17(1):84-87. [17]Friedman D.Evolutionary game in economics[J].Econometric Society,1991,59(3):637-666. [18]賈曉燕,壽志敏.基于博弈論的城管與商販間矛盾問(wèn)題探析[J].金融經(jīng)濟(jì),2012,10(20):12-15. [19]向彥任,傅新紅.從博弈論的角度分析城管與小商販的關(guān)系[J].現(xiàn)代商業(yè),2011(3):70-71. Evolutionary game analysis of city management problems WU Keqing,ZHANG Shixing (Faculty of Science,Jiangxi University of Science and Technology,Ganzhou 341000,China) Considering the frequent violent conflicts about city management in recent years,this paper adopts the evolutionary game theory to study how to solve the conflicts between citymanagers and greengrocers based on the bounded rationality of the game participants.Firstly,the static game models of two groups are established and the strategic equilibriums are analyzed.Then,the replicated dynamic systems of game participants are established for the evolutionary dynamics and their evolutionary stability condition is analyzed by using the dynamic system theory.Finally,the factors influencing both evolutionary stable strategies are revealed.Therefore,the results obtained in this paper have important significance in regulating themarket and molding a good civilized city image. evolutionary game theory;static game analysis;replicated dynamic system;evolutionary stable strategy;citymanagement F224.32;O225 A 2095-3046(2015)05-0104-06 10.13265/j.cnki.jxlgdxxb.2015.05.018 2015-06-03 國(guó)家自然科學(xué)基金資助項(xiàng)目(61364015,F(xiàn)030201) 吳克晴(1972-),男,博士,副教授,主要從事運(yùn)籌學(xué)、泛函分析等方面的研究,E-mail:317595750@qq.com.3 進(jìn)一步分析
4 小結(jié)