魏 強,呂 靜
(1.河北大學 經濟學院,河北 保定 071002;2.河北大學 學術委員會,河北 保定 071002)
人與自然和諧共生是中國式現(xiàn)代化的重要特征,生態(tài)補償所蘊含的豐富的生態(tài)命運共同體思想為人與自然和諧共生的現(xiàn)代化探索提供了科學路徑[1]。中國的生態(tài)補償是在政府為主導、市場為主體、全社會共同參與原則下,以提供高質量生態(tài)系統(tǒng)服務、滿足人民日益增長的優(yōu)美生態(tài)環(huán)境需要為目標,以實現(xiàn)生態(tài)環(huán)境資源共享、環(huán)境治理區(qū)域聯(lián)動、環(huán)境經濟協(xié)調發(fā)展為導向,依據生態(tài)系統(tǒng)服務價值、生態(tài)保護成本和發(fā)展機會成本,明確補償主體、補償標準和補償方式,采用政府規(guī)劃和市場調控相結合的手段,推進生態(tài)系統(tǒng)服務受益的發(fā)達地區(qū)對提供生態(tài)系統(tǒng)服務的欠發(fā)達地區(qū)給予補償的一種制度安排[2-3]。以往許多學者針對生態(tài)補償責任主體間的博弈過程開展過研究。一些學者從二元主體的角度研究生態(tài)補償的博弈過程,認為生態(tài)補償機制的構建是地方政府之間博弈的結果,單純依靠地方政府的自主選擇無法達到生態(tài)補償的穩(wěn)定均衡狀態(tài),只有通過引入更高等級的政府監(jiān)管約束因子,才能實現(xiàn)行為選擇的最優(yōu)策略[4-7]。也有一些學者從三元主體的角度研究生態(tài)補償的博弈過程,如王曉莉等認為,地方政府在生態(tài)補償扶貧項目推廣中具有關鍵作用,在農村合作社和農戶愿意接受生態(tài)補償標準的情況下,地方政府就能夠直接推動實現(xiàn)策略選擇的穩(wěn)定均衡[8];劉加伶等研究了水資源開發(fā)生態(tài)補償過程中中央政府、當地政府和地方企業(yè)三方主體之間的博弈關系,認為中央政府提高補償水平、地方政府征收資源環(huán)境稅、企業(yè)減少排污構成了演化博弈的均衡策略[9]。
在中國生態(tài)補償機制建設過程中,由于生態(tài)產品投入較大、短期經濟收益不明顯、市場化程度較低,企業(yè)、公眾等社會力量參與生態(tài)補償的積極性不高,導致了支付渠道單一、補償資金缺口大、補償標準一刀切等突出問題,嚴重影響到生態(tài)補償在協(xié)調環(huán)境保護和社會經濟發(fā)展可持續(xù)性中的作用[10-12]??v觀以往學者們的研究,雖然系統(tǒng)揭示了生態(tài)補償責任主體之間的博弈過程,但在責任主體選擇上,大多數研究關注的是地方政府二元主體之間的博弈關系,在探討三方主體博弈關系研究中,責任主體未能很好地體現(xiàn)生態(tài)補償機制建設中應當遵循的“誰開發(fā)誰保護、誰受益誰補償”的基本原則,也未能有效銜接“建立市場化、多元化生態(tài)保護補償長效機制”的內在要求。為此,本研究在以往研究的基礎上,選擇政府、生態(tài)系統(tǒng)服務供給者和生態(tài)系統(tǒng)服務受益者三方責任主體,探討社會力量參與下的生態(tài)補償博弈過程及其實現(xiàn)穩(wěn)定均衡的一般規(guī)律,以期為中國建立市場化、多元化的生態(tài)補償機制提供理論參考和決策依據。
演化博弈論是在傳統(tǒng)博弈論基礎上,放寬完全理性和完全信息的假設,探討在有限理性和信息不對稱條件下,通過博弈者之間的學習、模仿、試錯和修正,不斷對行為策略進行動態(tài)調整,最終實現(xiàn)博弈均衡的過程[13]。有限理性與信息不對稱的假設說明博弈主體對于博弈結構和規(guī)則并非“全知全能”,掌握的程度有限,而且博弈主體之間也缺乏相互了解,因此動態(tài)博弈一般不會通過聲譽機制來影響對方的行動,再次博弈的發(fā)生概率較低[14]。在演化博弈過程中,當博弈主體積累了關于各種純策略被采用時的相對優(yōu)勢信息,并根據其既得利益不斷地在邊際上對策略進行調整以追求自身利益的改善時,將會選擇用“較滿足的事態(tài)來代替較不滿足的事態(tài)”,最終達到一種動態(tài)平衡狀態(tài)。在這種平衡狀態(tài)中,當博弈主體的任何一方都不再愿意單方面改變其策略時,就會在多重納什均衡的精煉中實現(xiàn)納什均衡[15]。
博弈主體對于其所采取的策略進行的動態(tài)調整一般都受到演化過程中規(guī)律性的選擇機制和隨機性的擾動因素的影響,在演化博弈模型中,前者通常被稱為選擇,指某一策略在得到群體的選擇后具有一定的慣性;后者通常被稱為突變,會使博弈過程中演化出的策略產生新的變異和特征。突變也是一種選擇,只有好的策略才能被保留[16]。這說明,演化是對不同策略在博弈環(huán)境中的生存和復制能力的檢驗。演化穩(wěn)定性策略不僅僅由策略本身的好壞決定,而且需要在與一組可選策略的相互比較中表現(xiàn)出相對優(yōu)勢,且其出現(xiàn)頻率高于其他策略時才會被采納。即使存在某一具有突變特征的策略,這一策略也不會取代群體策略,而是通過開展合作使博弈主體之間能夠互惠共生[17]。
生態(tài)補償機制建設涉及政府、生態(tài)系統(tǒng)服務供給者和生態(tài)系統(tǒng)服務受益者三方責任主體。政府在協(xié)調生態(tài)產品供給與需求關系中具有主導作用,主要發(fā)揮組織實施、轉移支付和動態(tài)監(jiān)管等功能,以提高生態(tài)補償運行效率和社會福祉效應最大化作為目標;生態(tài)系統(tǒng)服務供給者主要指因生態(tài)環(huán)境保護而喪失了發(fā)展經濟的機會,為社會提供生態(tài)產品的地區(qū)、企業(yè)、社會組織和個人,屬于生態(tài)補償中接受補償的主體;生態(tài)系統(tǒng)服務受益者主要指享受生態(tài)環(huán)境保護惠益或造成環(huán)境污染與破壞,消費生態(tài)系統(tǒng)服務的地區(qū)、企業(yè)、社會組織和個人,受益者因自然資源開發(fā)或污染物排放而實現(xiàn)經濟增長和自身發(fā)展,需要通過外部性內部化的方式解決由此產生的環(huán)境問題,因此是生態(tài)補償的補償主體[18-20]。生態(tài)補償機制的構建是上述三方責任主體相互博弈的結果,本研究通過演化博弈模型來分析三方主體之間的博弈關系,為尋求三方責任主體之間的均衡策略探索生態(tài)補償的有效途徑。為此,本研究提出以下幾方面假設。
政府、生態(tài)系統(tǒng)服務供給者和生態(tài)系統(tǒng)服務受益者是生態(tài)補償博弈的三大責任主體。三者在策略選擇上均為有限理性,政府實施生態(tài)補償以社會福利最大化為目標;供給者和受益者參與生態(tài)補償以自身福利最大化為目標。供給者自身福利最大化以生態(tài)補償能夠彌補損失的機會成本和保護成本為基本條件;受益者自身福利最大化需要對享受到的生態(tài)紅利進行成本支付。任何一方責任主體的行為策略選擇均受到其他責任主體行為策略選擇的影響[21]。
在生態(tài)補償組織實施過程中,假設政府存在高效組織實施和低效組織實施兩種參與模式。在高效組織實施模式下,受益者主動參與生態(tài)補償,支付的生態(tài)補償資金能夠滿足供給者的基本生活和生態(tài)保護成本支出需求,在此條件下供給者能夠積極主動地開展生態(tài)環(huán)境保護工作,不斷提升生態(tài)系統(tǒng)服務供給的數量和質量;在低效組織實施模式下,受益者被動參與生態(tài)補償,支付的生態(tài)補償資金不能彌補供給者因生態(tài)保護而造成的機會成本損失,在此條件下供給者將消極被動地開展生態(tài)環(huán)境保護工作,不利于生態(tài)環(huán)境質量和社會福祉效應的提升。
上述假設情景下的政府、供給者和受益者三方的期望收益、成本、獎勵、處罰、補償等費用,如表1所示。政府在高效組織實施生態(tài)補償時產生的社會總收益大于低效組織實施時產生的社會總收益,即W1>W2,但同時也需要支付較高的監(jiān)管成本,即G1>G2。政府只有在高效組織實施生態(tài)補償工作時才會對供給者和受益者采取相應的獎勵或懲罰措施。受益者在主動參與和被動參與生態(tài)補償工作時會獲得不同的收益,需要支付不同的生態(tài)補償金。主動參與時會得到政府給予的獎勵R1;被動參與時會對社會和供給者造成額外的損失D1和D2,同時會受到政府的處罰P1。供給者積極和消極進行生態(tài)環(huán)境保護時損失的機會成本分別為O1和O2,積極進行生態(tài)環(huán)境保護時會獲得政府給予的獎勵R2;消極進行生態(tài)環(huán)境保護時會對社會和受益者造成額外的損失L1和L2,同時會受到政府的處罰P2。 一般來講,生態(tài)補償以追求社會福利最大化為目標,政府高效監(jiān)管、供給者積極保護、受益者主動補償是期望的最優(yōu)策略;當供給者進行生態(tài)環(huán)境保護時獲得的生態(tài)補償能夠彌補其因環(huán)境保護損失的機會成本時,通常會采取積極的環(huán)境保護行動;而當獲得的生態(tài)補償無法彌補其損失的機會成本時,通常會采取消極的環(huán)境保護行動。
表1 演化博弈各主體成本收益指標及含義
假設政府高效組織實施生態(tài)補償的概率用x表示,低效組織實施生態(tài)補償的概率用1-x表示;受益者主動參與生態(tài)補償的概率用y表示,被動參與生態(tài)補償的概率用1-y表示;供給者積極進行生態(tài)環(huán)境保護的概率用z表示,消極進行生態(tài)環(huán)境保護的概率用1-z表示。
如表2所示,三方責任主體在給定概率下的支付矩陣和期望收益分別為:
表2 政府、供給者、受益者三方演化博弈支付矩陣
1.政府高效組織實施生態(tài)補償時的期望收益
政府低效組織實施生態(tài)補償時的期望收益
用表示政府在兩種策略選擇下得到的平均收益,則
2.受益者主動參與生態(tài)補償時的期望收益
受益者被動參與生態(tài)補償時的期望收益
用表示受益者在兩種策略選擇下得到的平均收益,則
3.供給者積極從事生態(tài)環(huán)境保護時獲得的期望收益
供給者消極從事生態(tài)環(huán)境保護時獲得的期望收益
用表示供給者在兩種策略選擇下得到的平均收益,則
根據Malthusian動態(tài)方程,可以得到政府、受益者和供給者之間的長期利益博弈行為和策略選擇隨時間演化的動力學方程[22]。
政府高效組織實施生態(tài)補償的復制動態(tài)方程
受益者主動參與生態(tài)補償的復制動態(tài)方程
供給者積極從事生態(tài)環(huán)境保護工作的復制動態(tài)方程
在非對稱博弈中,多群體演化博弈復制動態(tài)系統(tǒng)的漸進穩(wěn)定解是一種嚴格的納什均衡,即純策略均衡。由復制動態(tài)方程可知,對于生態(tài)補償三方責任主體之間的平衡關系,只需要討論演化博弈動態(tài)過程的均衡點Q1(0,0,0)、Q2(0,0,1)、Q3(0,1,0)、Q4(0,1,1)、Q5(1,0,0)、Q6(1,0,1)、Q7(1,1,0)、Q8(1,1,1)這8個純策略納什均衡點的漸近穩(wěn)定性即可。
均衡點的漸近穩(wěn)定性由李雅普諾夫判別法進行判定,即當雅可比矩陣的所有特征值λ<0時,該均衡點是漸近穩(wěn)定點,此時為匯;當雅可比矩陣中所有特征值λ>0時,該均衡點是不穩(wěn)定點,此時為源;當雅可比矩陣的特征值λ有正有負時,該均衡點是不穩(wěn)定點,此時為鞍點[23]。
對上述8個純策略均衡點的穩(wěn)定性分析結果,如表3所示。均衡點Q1(0,0,0)的特征值λ2和λ3均小于0,即(B1-C1)< (B2-C2)、(F1-O1)< (F2-O2)。原因在于,當政府處于低效組織管理狀態(tài)時,供給者和受益者均存在機會主義行為,受益者主動參與生態(tài)補償時的期望收益低于被動參與生態(tài)補償時的期望收益,供給者積極進行生態(tài)環(huán)境保護的期望收益低于消極從事生態(tài)環(huán)境保護的期望收益,因此在這種情況下,當λ1<0,即(W1+P1+P2-G1)<(W2-G2)時,此時的漸進穩(wěn)定點Q1(0,0,0)為唯一的演化穩(wěn)定點;而當λ1>0,即(W1+P1+P2-G1)>(W2-G2)時,Q1(0,0,0)為鞍點。這就意味著,當生態(tài)補償的社會福利收益相對較低時,政府將穩(wěn)定在低效組織管理的狀態(tài)下,而受益者和供給者則分別穩(wěn)定在被動參與生態(tài)補償和消極進行生態(tài)環(huán)境保護的狀態(tài)下,此時三方都沒有改變行動策略的動機,博弈系統(tǒng)處于較混亂的穩(wěn)定狀態(tài)。從中國實施生態(tài)補償的過程看,在開展生態(tài)補償初期,存在著生態(tài)補償范圍過窄、產權不清、融資渠道單一、補償標準“一刀切”、法律保障不足、監(jiān)管存在漏洞等一系列問題,這樣的狀態(tài)下,政府單方買單的支付方式與“保護者獲益,受益者付費”的原則極不協(xié)調。因而,導致了生態(tài)補償不能全面、準確地反映自然資源的稀缺性和社會經濟價值的情況,未能有效扭轉生態(tài)環(huán)境退化的趨勢。
表3 策略均衡點穩(wěn)定性結果
同理,均衡點Q1(1,1,1)的特征值λ2和λ3也均小于0,即(B2-C2-P1)<(B1-C1+R1)、(F2-O2-P2)<(F1-O1+R2),原因在于,當政府處于高效組織管理狀態(tài)時,通過對受益者和供給者的行為監(jiān)管,生態(tài)補償將產生較高的社會總收益。此時受益者在主動進行生態(tài)補償時相比于被動進行生態(tài)補償時能夠獲得更高的期望收益,因此會擁有較強的自律性以及維持積極參與生態(tài)補償的動機;供給者則通過積極的生態(tài)環(huán)境保護獲得高于消極進行生態(tài)環(huán)境保護時的期望收益,較高的經濟收入也能夠促使供給者持續(xù)從事生態(tài)環(huán)境保護工作。在這種情況下,當λ1<0,即(W2-G2)< (W1-G1-R1-R2)時,漸進穩(wěn)定點Q1(1,1,1)為唯一的演化穩(wěn)定點;而當λ1>0,即(W2-G2)>(W1-G1-R1-R2)時,Q1(1,1,1)為鞍點。Q1(1,1,1)情形下的生態(tài)補償演化過程穩(wěn)定在政府高效組織設施、受益者主動參與、供給者積極從事生態(tài)環(huán)境保護的策略組合狀態(tài)下,此時的生態(tài)補償處于較為理想的規(guī)范狀態(tài),既能夠有效解決突出的生態(tài)環(huán)境問題,也有利于使生態(tài)補償責任體之間的利益關系保持協(xié)調狀態(tài)。
基于上述分析結果可知,在生態(tài)補償實施過程中,不論政府采取高效組織實施方式還是低效組織實施方式,受益者和供給者的策略組合總是處于“被動補償和消極保護”與“主動補償和積極保護”長期共存的狀態(tài),只不過這種共存狀態(tài)下的演化穩(wěn)定收斂趨勢會受到政府、受益者和供給者三方所形成的演化博弈系統(tǒng)支付矩陣參數的影響,在不同狀態(tài)下收斂于不同的均衡點。演化穩(wěn)定性分析基于生態(tài)補償社會福利收益的高低、政府低效組織實施時受益者和供給者均存在機會主義、政府高效組織實施時對受益者和供給者均發(fā)揮監(jiān)管作用三個條件,當這三個條件發(fā)生變化時,三方的博弈演化穩(wěn)定策略也將發(fā)生相應的變化。
首先,當生態(tài)補償社會福利總收益不能滿足(W1+P1+P2-G1)< (W2-G2)或(W2-G2)<(W1-G1-R1-R2)的條件,即當(G1-G2-P1-P2)<(W1-W2) 其次,當受益者和供給者機會主義成本較低的條件不能滿足,即當(B1-C1)> (B2-C2)、(F1-O1)> (F2-O2)時,此時如果(W1+P1+P2-G1)<(W2-G2),漸進穩(wěn)定點Q4(0,1,1)是唯一的演化穩(wěn)定點;當(W1+P1+P2-G1)>(W2-G2)時,漸進穩(wěn)定點Q8(1,1,1)是唯一的演化穩(wěn)定點。這說明,當受益者和供給者的機會成本較高時,即使政府處于低效組織實施的狀態(tài),經過長期的博弈演化,受益者和供給者也將最終穩(wěn)定在主動補償和積極進行生態(tài)環(huán)境保護的狀態(tài)下。因此,在這樣的條件下,當政府低效組織實施的期望收益高于高效組織實施的期望收益時,低效組織、主動補償、積極保護成為唯一的演化穩(wěn)定策略;而當低效組織實施的期望收益低于高效組織實施的期望收益時,高效組織、主動補償、積極保護成為唯一的演化穩(wěn)定策略。 再次,當政府積極組織實施生態(tài)補償對受益者和供給者形成的約束條件不成立,即當(B2-C2-P1)> (B1-C1+R1)、(F2-O2-P2)>(F1-O1+R2)時,此時當(W1+P1+P2-G1)<(W2-G2)時,漸進穩(wěn)定點Q1(0,0,0)是唯一的演化穩(wěn)定點;當(W1+P1+P2-G1)> (W2-G2)時,漸進穩(wěn)定點Q5(1,0,0)是唯一的演化穩(wěn)定點。這說明,當政府對受益者和供給者形成的約束力不足時,經過長期的博弈演化,受益者將穩(wěn)定地選擇被動參與生態(tài)補償,而供給者將穩(wěn)定地選擇消極地進行生態(tài)環(huán)境保護。在這樣的條件下,當政府低效組織實施的期望收益高于高效組織實施的期望收益時,低效組織、被動參與、消極保護成為唯一的演化穩(wěn)定策略;而當低效組織實施的期望收益低于高效組織實施的期望收益時,高效組織、被動參與、消極保護成為唯一的演化穩(wěn)定策略。 本研究基于生態(tài)補償利益相關方構建了政府、生態(tài)系統(tǒng)服務供給者和生態(tài)系統(tǒng)服務受益者三方演化博弈模型,分析了生態(tài)補償機制構建過程中三方行為決策的演化過程。研究結果表明,若要實現(xiàn)生態(tài)補償社會福利最大化的目標,需要通過政府、供給者和受益者不斷調整自身的行為策略,最終實現(xiàn)政府高效監(jiān)管、供給者積極保護、受益者主動補償的穩(wěn)定均衡。降低成本、提高收益能夠有效加快生態(tài)補償三方責任主體實現(xiàn)穩(wěn)定均衡的過程,加速構建融資主體多元、融資渠道廣泛的市場化生態(tài)補償體系,優(yōu)化政府的有效監(jiān)管和評估路徑,能夠因地制宜地確定生態(tài)補償標準和補償方式,并根據社會、經濟、環(huán)境之間關系的演變情況不斷進行調整,從而促進生態(tài)補償體制建設彈性的不斷提高。為此,基于本研究結果,針對中國生態(tài)補償三方責任主體的演化博弈過程,提出建議。 1.政府作為生態(tài)補償監(jiān)管主體,要明確生態(tài)系統(tǒng)服務供給者與受益者定位,公正公開地開展生態(tài)補償監(jiān)督、審計和檢查工作,嚴把資金使用審批關口,防止資金的混同與錯位,實行單獨核算、??顚S?并對資金使用的有效性進行評估,提高生態(tài)補償資金的使用效率。在激勵約束機制建設方面,雖然增大處罰力度可以提高社會福祉整體效益,但同時也會增加監(jiān)管成本,降低社會力量參與的主觀能動性和積極性。為此,政府一方面要推進環(huán)境污染賠償,扣減生態(tài)環(huán)境保護考核不合格主體的補償資金額度,嚴懲重罰生態(tài)環(huán)境違法犯罪行為,加大懲治力度,提高違規(guī)違法成本,同時也要賦予自然資源合法開發(fā)利用、主動接受監(jiān)督以及積極參與生態(tài)補償主體發(fā)展經濟的權利,統(tǒng)籌社會經濟與環(huán)境保護效益;另一方面政府要強化激勵措施的正面導向作用,對生態(tài)保護成效顯著的主體提高補償額度并給予額外獎勵,同時對其開展的生態(tài)環(huán)境保護工作進行廣泛的社會宣傳,提升企業(yè)和個人形象,營造“鼓勵創(chuàng)新、寬容失敗”的環(huán)境保護工作氛圍,增強環(huán)境保護的價值認同,為全社會整體收益的不斷提高創(chuàng)造機會。 2.生態(tài)系統(tǒng)服務供給者,首先要切實增強生態(tài)環(huán)境保護意識,把握“綠色發(fā)展”“雙碳”目標下的政策導向,既要嚴格按照規(guī)定將生態(tài)補償轉移支付資金用于生態(tài)環(huán)境保護與修復,提升社會福祉效應;又要主動參與生態(tài)系統(tǒng)管理與保護相關工作,積極探尋經濟效益與環(huán)境效益雙贏的發(fā)展局面,不斷增強自身的造血能力。其次要持續(xù)深化生態(tài)系統(tǒng)服務供給側結構性改革,通過推動實施山水林田湖草沙一體化保護和修復來創(chuàng)造出更加多樣化的生態(tài)系統(tǒng)服務供給機會,不斷提高生態(tài)系統(tǒng)調節(jié)服務、文化服務和支持服務對社會經濟發(fā)展的福祉貢獻,拓展生態(tài)系統(tǒng)服務價值實現(xiàn)渠道,掌握生態(tài)補償過程中的主動權,提高生態(tài)補償資金的分配額度。再次要加快推行生產方式改革,加強人居環(huán)境整治,將生態(tài)系統(tǒng)服務價值的實現(xiàn)、增值納入生態(tài)系統(tǒng)管理績效評估與考核,大力發(fā)展生態(tài)農業(yè)、森林康養(yǎng)、林草碳匯等生態(tài)優(yōu)勢特色產業(yè),增加生態(tài)系統(tǒng)服務市場活力,不斷憑借豐富、高質和多元的生態(tài)系統(tǒng)服務獲得額外的生態(tài)補償獎勵資金,從而充分彌補因開展環(huán)境保護而增加的成本支出以及失去的機會成本。 3.生態(tài)系統(tǒng)服務受益者,首先要增強生態(tài)系統(tǒng)服務付費意識,對于因經濟生產或社會發(fā)展造成的環(huán)境污染和破壞行為,主動承擔環(huán)境修復和賠償責任,除了要及時、足額地向生態(tài)系統(tǒng)服務供給者支付生態(tài)補償資金,還要采取市場化的運作方式,通過產業(yè)扶持、技術援助、人才支持等多元化途徑給予供給者以補償,從而充分調動全社會參與生態(tài)環(huán)境保護的積極性。其次要大力優(yōu)化生產要素結構和產品結構,推動產業(yè)向低碳、綠色、智能和高端方向發(fā)展,不斷提高自然資源利用率和產出率,減少因生產行為導致的生態(tài)破壞和環(huán)境污染,以及被動參與生態(tài)補償等問題而帶來的額外成本。再次要通過生產綠色產品和提供綠色服務樹立良好的口碑和信譽,將生態(tài)補償納入發(fā)展戰(zhàn)略管理體系,依靠生態(tài)技術研發(fā)、提升綠色信用等級等方式爭取財政資金支持,通過與財政資金形成良性互動與優(yōu)勢互補來獲得可持續(xù)的長期回報。四、結論與建議