宋作玲 史欣
[摘要]在制造商、零售商、回收商等企業(yè)聯(lián)合回收模式下,聯(lián)合回收聯(lián)盟根據(jù)政府的激勵(lì)獎(jiǎng)懲機(jī)制權(quán)衡自己的成本與績(jī)效。探討了政府進(jìn)行補(bǔ)貼和懲罰策略對(duì)于聯(lián)合回收行為的影響,運(yùn)用演化博弈的方法進(jìn)行數(shù)學(xué)建模和數(shù)值仿真。仿真結(jié)果表明:兩種情況下達(dá)到穩(wěn)定狀態(tài),一種是綠色回收收益多于傳統(tǒng)回收收益時(shí),另一種是懲罰監(jiān)管成本與補(bǔ)貼激勵(lì)成本之差小于被懲罰的損失時(shí)。其余情況下,聯(lián)合回收主體是否選擇綠色回收由政府采取何種激勵(lì)機(jī)制的概率決定。通過(guò)博弈分析可以為政府監(jiān)管機(jī)制選取以及聯(lián)合回收行為決策提供依據(jù)。
[關(guān)鍵詞]政府獎(jiǎng)懲機(jī)制;電子廢棄物;聯(lián)合回收;演化博弈
[中圖分類號(hào)]F252.19???? [文獻(xiàn)標(biāo)識(shí)碼]A???? [文章編號(hào)]1005-152X(2022)03-0058-05
Evolutionary Game Analysis of Government Reward and Punishment Mechanism in E-waste Joint Recycling
SONG Zuoling1,2, SHI Xin3
(1. College of Transportation, Shandong University of Science & Technology, Qingdao 266590;2. College of Economics & Management, Shandong University of Science & Technology, Qingdao 266590;3. College of Transportation Engineering, Dalian Maritime University, Dalian 116026, China)
Abstract: The paper pointed out that under the joint recycling setup involving the alliance made up of the manufacturer, retailer, and recycler, etc., the joint recycling alliance would weigh its own costs and performance according to the reward and punishment mechanism of the government. Then, it discussed how government subsidy or punishment would impact the joint recycling behavior, and used the evolutionary game method for mathematical modeling and numerical simulation. The simulation result indicated that equilibrium could be reached in two scenarios: one being when the green recovery return was more than the traditional recovery return; the other being when the difference between the punishment regulatory cost and the subsidy incentive cost was less than the loss from punishment. In other cases, whether thejoint recycling subjects chose green recovery was determined by the probability of the incentive or punitive measures taken by the government. The game analysis in this paper could provide reference for the selection of government supervision mechanism and the decision making onjoint recycling behaviors.
Keywords: government reward and punishment; e-waste;joint recycling; evolutionary game
0 引言
2020年,習(xí)近平主席在聯(lián)合國(guó)大會(huì)上宣布了中國(guó)的低碳目標(biāo),在2030年前實(shí)現(xiàn)碳達(dá)峰,2060年實(shí)現(xiàn)碳中和,充分顯示了中國(guó)政府參與環(huán)境治理的決心。作為工業(yè)門類最多的制造大國(guó),在制造業(yè)開展碳中和目標(biāo)對(duì)于整體目標(biāo)達(dá)成尤為重要。
政府環(huán)境戰(zhàn)略目標(biāo)、社會(huì)環(huán)境意識(shí)提高、環(huán)境和社會(huì)事故頻發(fā)等促使生產(chǎn)企業(yè)責(zé)任延伸的實(shí)踐,制造商作為焦點(diǎn)企業(yè)與供應(yīng)鏈上下游參與者以及利益相關(guān)方協(xié)同,以實(shí)現(xiàn)經(jīng)濟(jì)、環(huán)境、社會(huì)綜合績(jī)效提升。據(jù)《中國(guó)廢棄電子產(chǎn)品循環(huán)經(jīng)濟(jì)潛力報(bào)告》顯示,2030年我國(guó)電子廢棄量將超過(guò)2700萬(wàn)t,對(duì)環(huán)境破壞嚴(yán)重,因此,通過(guò)回收利用產(chǎn)生價(jià)值增值、節(jié)能降耗勢(shì)在必行。
使用關(guān)鍵詞或摘要“回收”“政府”“博弈”檢索核心期刊、EI、CSSCI共查詢出269篇,主要集中于閉環(huán)供應(yīng)鏈、逆向物流等領(lǐng)域,側(cè)重研究政府補(bǔ)貼、激勵(lì)機(jī)制對(duì)于電子廢棄物、廢舊家電、電池、共享單車的回收渠道、機(jī)制、定價(jià)策略等的影響。
已有研究從制造商和零售商、回收商視角或者政府監(jiān)管和制造商回收廢棄電子視角的博弈分析較多[1-3],少有文獻(xiàn)從政府獎(jiǎng)懲和聯(lián)合回收視角進(jìn)行博弈行為分析。聯(lián)合回收作為回收主體和渠道的一種有效方式,應(yīng)該作為博弈主體進(jìn)行分析,是對(duì)制造商和零售商、回收商聯(lián)盟模式的拓展分析,并且將政府環(huán)境規(guī)制引入供應(yīng)鏈可持續(xù)治理。同時(shí),考慮綠色回收產(chǎn)生的社會(huì)效益,進(jìn)而找到促進(jìn)回收逆向供應(yīng)鏈的驅(qū)動(dòng)機(jī)制。
回收聯(lián)盟采用技術(shù)創(chuàng)新、基礎(chǔ)設(shè)施布局、綠色研發(fā)、分類拆解等方式實(shí)現(xiàn)電子廢棄物的有效循環(huán)利用[4]。為了解決回收聯(lián)盟回收意愿低、綠色回收開發(fā)成本大、回收率低、回收利潤(rùn)低等問(wèn)題,政府可以對(duì)采取綠色回收的回收供應(yīng)鏈聯(lián)盟給予一定的補(bǔ)貼,同時(shí)政府對(duì)于沒有有效履行延伸責(zé)任的供應(yīng)鏈聯(lián)盟收取一定的環(huán)境污染處罰[5-6]。然而,政府監(jiān)管也存在一定難度和監(jiān)管成本。因此,權(quán)衡環(huán)境治理成本、監(jiān)管成本、環(huán)境治理效益也是政府參與供應(yīng)鏈治理的問(wèn)題之一。
綜上,本文構(gòu)建了包括回收聯(lián)盟和政府兩方的博弈模型,進(jìn)行模型仿真并得出結(jié)論和建議。
1 模型假設(shè)與參數(shù)設(shè)置
假設(shè)博弈雙方僅具有有限理性,則:
(1)策略集合。政府對(duì)于回收聯(lián)盟治理的策略集記為 S1=(補(bǔ)貼,罰款);回收聯(lián)盟是否實(shí)施綠色回收的策略集記為S2=(綠色回收,傳統(tǒng)回收)。
(2)局中人行為策略采取的比例。假設(shè)政府實(shí)施激勵(lì)機(jī)制的概率為X,則政府采取懲罰機(jī)制的概率為 1-X;聯(lián)合回收主體選擇綠色回收的概率為Y,則其選擇不分類回收的概率為1-Y。
(3)參數(shù)假設(shè)及含義。聯(lián)合回收商選擇“綠色回收”時(shí)的收益為Pg;聯(lián)合回收商采用“傳統(tǒng)回收”方式得到的收益為Pt;回收聯(lián)盟選擇“綠色回收”時(shí)的可持續(xù)收益為 Sg;聯(lián)合回收商實(shí)施“綠色回收”的成本為 Cg;聯(lián)合回收商采用傳統(tǒng)回收方式的成本為 Ct;若聯(lián)合回收商主動(dòng)選擇綠色回收,政府將給予一定的補(bǔ)貼,補(bǔ)貼系數(shù)為α,補(bǔ)貼程度為R;聯(lián)合回收商采用傳統(tǒng)回收方式受到政府懲罰的風(fēng)險(xiǎn)系數(shù)為β;聯(lián)合回收商采用傳統(tǒng)回收方式受到政府懲罰的損失為F。從政府層面,回收商選擇“綠色回收”時(shí)帶來(lái)的環(huán)境與社會(huì)效益為Eg;政府采取激勵(lì)或懲罰措施需要一定的人力物力,選擇激勵(lì)治理方式時(shí)監(jiān)管成本為Cr,不包括給予企業(yè)聯(lián)盟的補(bǔ)貼部分,選擇懲罰治理方式時(shí)監(jiān)管成本為Cf;回收商選擇沿用“傳統(tǒng)回收”進(jìn)行廢棄電子產(chǎn)品的回收處理工作時(shí),必將造成環(huán)境的破壞,由此政府進(jìn)行環(huán)境污染及社會(huì)治理費(fèi)用為Ce。政府和回收聯(lián)盟采取不同策略的收益見表1。
2 處理企業(yè)與回收中心之間的演化博弈模型構(gòu)建
假設(shè)政府選擇“補(bǔ)貼”策略的期望收益為 G1,選擇“罰款”策略的期望收益為G2,平均收益記為E(G);回收商選擇“綠色回收”的期望收益為R1,選擇“傳統(tǒng)回收”的期望收益為R2,平均收益記為E(R)。根據(jù)上述假設(shè)和收益矩陣表1,可知政府對(duì)回收商實(shí)施補(bǔ)貼激勵(lì)機(jī)制的期望收益為:
政府采取懲罰機(jī)制的期望收益為:
則政府采取混合策略,即采取補(bǔ)貼激勵(lì)策略與懲罰策略的平均期望收益為:
根據(jù)演化博弈原理,可得政府策略的復(fù)制動(dòng)態(tài)方程:
同理,聯(lián)合回收主體選擇綠色回收的期望收益為:
聯(lián)合回收主體選擇傳統(tǒng)回收的期望收益為:
則聯(lián)合回收主體采取混合策略的平均期望收益為:
求得聯(lián)合回收主體的復(fù)制動(dòng)態(tài)方程,進(jìn)而構(gòu)建出政府—聯(lián)合回收主體演化博弈的復(fù)制動(dòng)態(tài)方程組為:
在實(shí)際情況中,政府與聯(lián)合回收主體的最優(yōu)策略選擇不可能一次性完成,需要不斷進(jìn)行演化博弈來(lái)優(yōu)化方案。在雙方博弈過(guò)程中,若聯(lián)合回收主體自覺選擇綠色回收廢棄電子產(chǎn)品,則政府為了社會(huì)經(jīng)濟(jì)均衡發(fā)展會(huì)減弱對(duì)其的激勵(lì)與約束機(jī)制。反過(guò)來(lái),當(dāng)聯(lián)合回收主體沿用傳統(tǒng)回收方式時(shí),政府就會(huì)加大激勵(lì)與約束機(jī)制的實(shí)施力度。因此,為了使研究結(jié)果更適用于現(xiàn)實(shí)生活,要對(duì)局中人策略進(jìn)行穩(wěn)定性分析。利用 Friedman 提出的局部穩(wěn)定性分析法,通過(guò)構(gòu)建Jacobian矩陣來(lái)分析各均衡狀態(tài)的穩(wěn)定性。
令 FX=? ,F(xiàn)Y=? ,根據(jù)演化穩(wěn)定策略的性質(zhì)與微分方程穩(wěn)定性定理可知,當(dāng)時(shí),該點(diǎn)所對(duì)應(yīng)的策略集為穩(wěn)定策略。
對(duì)方程組求導(dǎo)得:
解得:
情形一:聯(lián)合回收主體采取策略的演化穩(wěn)定性分析。
(1)當(dāng)X=X0時(shí),等式F(Y)=0恒成立,則區(qū)間內(nèi)任意 Y 點(diǎn)均處于穩(wěn)定狀態(tài)。
(2)當(dāng)X>X0時(shí),有Y=0 >0 ,Y=1 <0 ,
因此Y=1是穩(wěn)定演化策略,聯(lián)合回收主體在此情況下選擇“綠色回收”。
(3)當(dāng)X<X0時(shí),有Y=0 <0 ,Y=1 >0 ,
因此Y=0是穩(wěn)定演化策略,聯(lián)合回收主體選擇“傳統(tǒng)回收”。
綜上,當(dāng)聯(lián)合回收主體選擇綠色回收廢棄電子產(chǎn)品付出的成本小于該方式下獲得的收益時(shí),無(wú)論政府是否實(shí)施激勵(lì)與約束機(jī)制,有限理性聯(lián)合回收主體都會(huì)選擇綠色回收;當(dāng)聯(lián)合回收主體選擇綠色回收廢棄電子產(chǎn)品付出的成本大于該方式下獲得的收益時(shí),則聯(lián)合回收主體對(duì)于回收方式的選擇依賴于政府實(shí)施激勵(lì)與約束機(jī)制給其帶來(lái)利益還是損失。
情形二:政府采取策略的演化穩(wěn)定性分析。
(1)當(dāng)Y=Y0時(shí),等式F(X)=0恒成立,則區(qū)間內(nèi)任意X點(diǎn)均處于穩(wěn)定狀態(tài)。
(2)當(dāng) Y>Y0時(shí),有X =0 <0 ,X =1 >0 ,
因此X=0是穩(wěn)定演化策略,政府在此情況下選擇“懲罰”。
(3)當(dāng) Y<Y0時(shí),有X =0 >0 ,X =1 <0 ,
因此X=1是穩(wěn)定演化策略,政府在此情況下選擇“補(bǔ)貼”。
綜上,當(dāng)政府實(shí)施懲罰機(jī)制的成本與采取補(bǔ)貼激勵(lì)措施的成本之和低于聯(lián)合回收主體被懲罰的損失時(shí),無(wú)論聯(lián)合回收主體是否選擇綠色回收廢棄電子產(chǎn)品,有限理性的政府都會(huì)選擇實(shí)施懲罰機(jī)制;當(dāng)政府實(shí)施懲罰機(jī)制的成本與采取補(bǔ)貼激勵(lì)措施的成本之和高于聯(lián)合回收主體被懲罰的損失時(shí),有限理性的政府策略的選擇取決于回收商對(duì)于回收手段的選擇。
情形三:雙方混合策略的演化穩(wěn)定性分析。
依據(jù)動(dòng)態(tài)系統(tǒng)復(fù)制方程式,可以得出當(dāng)0≤X0≤1,0≤Y0≤1時(shí),總共有五個(gè)復(fù)制動(dòng)態(tài)均衡點(diǎn),分別為(0,0)、(1,0)、(1,1)、(0,1)、(X0,Y0)。對(duì)于由微分方程描述的動(dòng)態(tài)演化,其均衡點(diǎn)的穩(wěn)定性一般通過(guò)雅克比矩陣分析,該系統(tǒng)的雅克比矩陣為:
將五個(gè)復(fù)制動(dòng)態(tài)均衡點(diǎn)帶入,同時(shí)滿足det(J)>0和 tr(J)<0的點(diǎn)是漸進(jìn)穩(wěn)定的,對(duì)應(yīng)著一個(gè)演化博弈。五個(gè)點(diǎn)的特征根見表2。
根據(jù)表2可知該復(fù)制動(dòng)態(tài)方程組有四個(gè)鞍點(diǎn)和一個(gè)中心點(diǎn),因此當(dāng)政府與聯(lián)合回收主體的策略集為(X0,Y0)時(shí),系統(tǒng)才能達(dá)到穩(wěn)定。
3 模型仿真
根據(jù)博弈情境進(jìn)行參數(shù)賦值,運(yùn)用Matlab軟件進(jìn)行模型仿真。
3.1 回收收益對(duì)于策略行為的影響
當(dāng)綠色回收收益大于傳統(tǒng)回收收益,即 Pg>Pt 時(shí),設(shè)置仿真1 數(shù)值為 Pg=5,Pt=4,Sg=1,Cg=2.5,Ct=1,α=0.5,β=0.5,F(xiàn)=1,R=4,Cf=2,Cr=1,Ce=1,則政府與聯(lián)合回收主體混合策略動(dòng)態(tài)演化如圖1所示。