易 俊
暨南大學(xué)財務(wù)與國有資產(chǎn)管理處,廣州510632
一個完整的逆向供應(yīng)鏈?zhǔn)侵钙髽I(yè)為了從客戶手中回收使用過的產(chǎn)品所必需的一系列活動,其目的是對回收品進(jìn)行處置,或再利用.研究表明,有效的逆向供應(yīng)鏈能夠提升顧客滿意度,同時增加企業(yè)利潤[1].逆向供應(yīng)鏈一般包含:產(chǎn)品回收、逆向物流、回收產(chǎn)品的分揀、再加工及再銷售[2].近年來,學(xué)者對逆向物流和逆向供應(yīng)鏈進(jìn)行大量的理論研究,主要集中在逆向供應(yīng)鏈各個環(huán)節(jié)的定價方式和利益分配方式、回收產(chǎn)品的庫存控制、回收產(chǎn)品的分揀方法、回收產(chǎn)品的再銷售等方面.隨著信息技術(shù)、動態(tài)優(yōu)化技術(shù)和無線設(shè)備等相互作用和補充,促使逆向物流業(yè)務(wù)流程的重構(gòu)[3].從博弈角度分析,Savaskan等[4]將生產(chǎn)商作為斯塔克伯格(Stackelberg)博弈領(lǐng)導(dǎo)者,分析生產(chǎn)商、零售商和第3方等回收方式,三者中最接近消費者的將更適合承擔(dān)回收工作.顧巧論等[5]運用博弈論分析逆向供應(yīng)鏈的定價策略;黃祖慶和達(dá)慶利[6]提出基于逆向物流定期和定量處理的最優(yōu)庫存控制策略;魏潔等[7]在生產(chǎn)商延伸責(zé)任下研究逆向供應(yīng)鏈回收模式的選擇;申亮等[8]運用演化博弈理論分析開放型和保守型供應(yīng)商實施逆向供應(yīng)鏈的演化過程;劉德海等[9]運用信息甄別模型研究供應(yīng)鏈合作伙伴選擇問題.本課題組[10]建立中國逆向供應(yīng)鏈回收模式演化博弈模型,討論市場競爭過程最終形成的4種穩(wěn)定演化均衡結(jié)果.
目前,我國走街串巷的流動個體商販及其家庭作坊 (family workshop)構(gòu)成逆向供應(yīng)鏈最主要的回收模式.與發(fā)達(dá)國家相比,我國的勞動力比較廉價,通過人工分類收集,不僅可節(jié)省開支,還能解決一部分進(jìn)城務(wù)工的農(nóng)村剩余勞動力就業(yè)問題,“居民消費者—分散的廢品收購站點 (回收商)—制造商”構(gòu)成逆向供應(yīng)鏈網(wǎng)絡(luò)的各個組成部分.國內(nèi)外一些學(xué)者運用混合整數(shù)規(guī)劃、非線性規(guī)劃模型和優(yōu)化理論,研究逆向供應(yīng)鏈的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計與物流選址等問題,但對我國當(dāng)前分散的廢品收購點與制造商構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)治理機制卻較少研究.本研究探討我國走街串戶進(jìn)行廢品回收利用的個體商販及家庭作坊構(gòu)成的逆向供應(yīng)鏈 (廢棄物物流)機會主義問題.其中,上游制造商 (回收廠)既可以遵守按質(zhì)論價的口頭協(xié)議,也可利用處于信息優(yōu)勢、地域?qū)S眯蕴卣骱褪袌鲋鲗?dǎo)地位,采取壓低收購價格和質(zhì)量等機會主義行為;而下游分散的個體商販處于信息劣勢和有限理性特征,造成其收益受損.下游“幼稚”的個體商販群體處于信息分散化狀態(tài),面臨分揀、未加處理與摻雜3種回收策略,其與“老練”的上游制造商進(jìn)行回收價格的競爭.建立具有群體演化特征的逆向供應(yīng)鏈Stackelberg博弈模型;分析逆向供應(yīng)鏈網(wǎng)絡(luò)中制造商的機會主義行為,并基于NetLogo平臺進(jìn)行仿真分析.
目前,走街串巷流動的個體商販及其家庭作坊(記為F)構(gòu)成我國逆向物流的主要回收模式,“居民消費者—分散的廢品收購站點—制造商或回收廠”是一種適合我國國情的逆向供應(yīng)鏈回收模式.限于生產(chǎn)經(jīng)營的規(guī)模及運費因素,分散在城鄉(xiāng)各地的個體商販及其家庭作坊 (回收商)負(fù)責(zé)所在社區(qū)(街區(qū)或村莊等)的廢品回收,然后將廢舊品分揀、清洗和歸類,并集中銷售給制造商或回收廠進(jìn)行再加工.
本研究建立的個體商販與制造商組成逆向供應(yīng)鏈Stackelberg博弈[11]模型中,個體商販 F為率先行動的“幼稚”的群體參與者,制造商M為后行動的“老練”的個體參與者.雙方進(jìn)行逆向供應(yīng)鏈的價格競爭.博弈過程如下:
第1階段 分散化的F由于缺少廢品市場供求信息,其收購行為受市場行情支配,符合演化博弈群體參與者具有模仿和學(xué)習(xí)特征的有限理性假設(shè).F可采取對回收廢品進(jìn)行分揀、未處理和摻雜等回收策略,記為S={s1,s2,…,sn},在廢品回收策略空間S上形成各種回收策略的比例分布,記為θ= [θ(s1),θ(s2),…,θ(sn)].
根據(jù)復(fù)制動態(tài)方程,提供某種回收策略si(i=1,2,…,n)的個體商販群體比例增長率dθt(si)/dt是純策略效用ut(si)與群體平均期望效用ˉut差的嚴(yán)格增函數(shù)[12]:
第2階段 在該地區(qū)占據(jù)主導(dǎo)地位的、“老練”的制造商M根據(jù)F提供的回收策略分布,確定其最佳反應(yīng)函數(shù),即提供相應(yīng)的廢品回收價格tj(j=1,2,…,m).在M的純策略空間T={t1,t2,…,tm}中,根據(jù)F采取不同策略構(gòu)成的比例分布θt(si),確定其反應(yīng)函數(shù)為
為方便分析,將個體商販的廢品回收策略S分為:摻雜(N)、未處理(B)和分揀(S)三種類型,即S={sN,sB,sS}.在國內(nèi)廢品回收的逆向供應(yīng)鏈中,各環(huán)節(jié)的交易基本采取現(xiàn)金交易.但交易過程中往往遵守雙方約定俗成的非正式“口頭協(xié)議”:若F按照M的工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求,完成廢舊品的分揀、除雜和再加工等處理,則應(yīng)按照較高的品質(zhì)等級收購,該種回收策略記為P;若F沒有進(jìn)行這項預(yù)處理操作,M將壓低收購等級,該種回收策略記為D.M的策略空間簡化為T={tP,tD}.
在傳統(tǒng)Stackelberg博弈中,F(xiàn)處于信息不充分的“幼稚”的狀態(tài),其根據(jù)自身利潤最大化原則選擇最佳的摻雜策略;然后,M根據(jù)F的策略選擇摻雜策略,使自身利潤最大化,即提供收購價為壓低品質(zhì)等級的策略D.雙方陷入經(jīng)典的“囚徒困境”博弈結(jié)局中.
考慮到我國從事逆向供應(yīng)鏈回收工作的個體商販數(shù)目較大,通常集中在某一地域,缺少規(guī)模化、專業(yè)化的廢品回收公司,傳統(tǒng)的Stackelberg博弈模型適用于分析個體的學(xué)習(xí)行為,而并不適用分析個體商販內(nèi)部的群體學(xué)習(xí)行為.本研究運用式(1)演化博弈理論復(fù)制動態(tài)方程,模擬F的群體學(xué)習(xí)過程,證明其穩(wěn)定的均衡狀態(tài),探討“個體商販-制造商”構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)治理機制.
第1種情況 在多階段重復(fù)進(jìn)行的Stackelberg博弈中,若M追求長期利潤最大化,且“富有遠(yuǎn)見”,即滿足條件
其中,t*j為具有帕累托最優(yōu)的納什均衡策略.
第2種情況 若M是“機會主義”,在每期重復(fù)博弈中都根據(jù)如下原則采取風(fēng)險占優(yōu)策略tr,則
當(dāng)t→∞時,F(xiàn)的群體復(fù)制動態(tài)將趨于穩(wěn)定的納什均衡s*i,此時其策略si的比例分布為
M采取風(fēng)險占優(yōu)策略tr的反應(yīng)函數(shù)為
將上述反應(yīng)函數(shù)代入式(4),其風(fēng)險占優(yōu)策略滿足
由于式(6)中風(fēng)險占優(yōu)策略tr滿足嚴(yán)格均衡的定義,而嚴(yán)格均衡必定是純策略納什均衡,因此當(dāng)個體商販F的復(fù)制動態(tài)行為收斂到納什均衡s*i時,機會主義的M采取的風(fēng)險占優(yōu)策略也將收斂到純策略納什均衡.
結(jié)論1 在一定地域范圍內(nèi)由個體商販和制造商構(gòu)成的逆向供應(yīng)鏈中,由于分散化的個體商販的定價行為滿足有限理性假設(shè),采用復(fù)制動態(tài)方程(1)反映行為特征,則逆向供應(yīng)鏈的Stackelberg博弈模型穩(wěn)定狀態(tài)為納什均衡.
假設(shè)個體商販F以收購價c向周邊居民等消費者收購廢品,然后經(jīng)過分揀、再加工等工序,制造商M,根據(jù)廢品處理情況提供回收價格t,且t>c.M通過回收利用后加工成新的產(chǎn)品,市場收益率為f,且f>t.若F對廢舊品進(jìn)行嚴(yán)格分揀、除雜和再加工,需付出較多的時間和體力,且需剔除許多不符合回收要求的廢舊品,該項成本簡記為cF.由于目前我國的廢品回收行業(yè)大多采取勞動密集型的產(chǎn)業(yè)組織模式,通過分揀、除雜、清洗和包裝等預(yù)處理環(huán)節(jié)高度分解,因而F盡可能提高廢舊品的回收等級,即0.1t>cF.
M回收廢品時,一般根據(jù)材質(zhì)、銹蝕、油污等情況,從完全保留價值的十成新品,逐次減低質(zhì)量為九成、八成,直至基本報廢,沒有回收利用價值.當(dāng)F沒有按照M的工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求對廢舊品進(jìn)行分揀和再加工等工作時,盡管F節(jié)省了成本,但M將根據(jù)經(jīng)驗和檢測結(jié)果,會對該批次的廢舊鋼材壓低一個等級,即提供回收價格降為0.9t.類似的,對于F摻雜后的廢品,其數(shù)量將增加l倍,l>1.M將提供的回收價格至0.8t.為不失一般性,假設(shè)摻雜比例不能過高,即1.1>l>1.0.M屬于資本密集型產(chǎn)業(yè)部門,其單位產(chǎn)品所需投資較多,機械化、自動化程度和技術(shù)構(gòu)成較高.假設(shè)M從事附屬操作工人的工資水平,相對于主要由進(jìn)城的農(nóng)民和城市無業(yè)人員組成的個體商販?zhǔn)杖胨礁遦倍.當(dāng)F沒有對廢舊品進(jìn)行分揀、除雜、簡單再加工等工序時,M不得不抽調(diào)相關(guān)人員進(jìn)行相應(yīng)工序,其將付出較高的勞動力工資成本,即0.1t<kcF.因此,得到制造商和個體商販構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)重復(fù)博弈收益矩陣,如表1.
表1 逆向供應(yīng)鏈網(wǎng)絡(luò)的策略式博弈模型Table 1 Strategy game model of adverse supply chain network
廢品回收逆向供應(yīng)鏈中,常遵守M提出“按質(zhì)論價”的策略:若F按照M工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求,對廢舊品進(jìn)行了分揀、除雜和再加工等處理,則提供較高的回收價格;否則,將依次壓低廢品品質(zhì).
考慮單位廢品收購量,F(xiàn)各種回收策略的平均利潤為
將式 (7)代入式 (1),得F采取S的演化方程為
考慮約束條件:個體商販勞動力成本低廉,即0.1t>cF,且摻雜比例1.1>l>1.0,則
同理,F(xiàn)摻雜策略N的演化方程為
F采取未處理策略B的演化方程為
在式(11)中考慮約束條件,則F采取B的演化方向不確定.比較式(8)和式(11),得因此,F(xiàn)在回收策略空間S={sN,sB,sS}中,最終的演化穩(wěn)定均衡為分揀策略.
結(jié)論2 一定地域范圍內(nèi),由個體商販和制造商構(gòu)成的逆向供應(yīng)鏈中,當(dāng)制造商采取“按質(zhì)論價”策略,即若個體商販按工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求,對廢舊品進(jìn)行分揀、除雜和再加工等處理后,則提供較高的回收價格;否則,依次壓低廢品品質(zhì).個體商販在分揀、未加處理和摻雜回收策略空間中,演化穩(wěn)定均衡為分揀策略.
威廉姆森定義“機會主義行為”為“自我利益的狡詐追尋行為”[13].當(dāng) F面對“機會主義”M時,根據(jù)式 (5)對制造商采取機會主義行為類型的定義,即M在T時期重復(fù)博弈中的任意階段博弈,均采取風(fēng)險占優(yōu)策略tr,分析個體商販的策略空間演化過程.
第1階段 假設(shè)F的初始策略分布狀態(tài)為θFt=0={θ0N,θ0S,(1 - θ0N- θ0S)}.
第2階段 當(dāng)F的策略分布處于混合狀態(tài)時,M提供P的預(yù)期利潤為
M提供D的預(yù)期利潤為
當(dāng)F選擇S的分布狀態(tài)θS滿足條件
此時,M提供D為風(fēng)險占優(yōu)均衡.反之,M提供P為風(fēng)險占優(yōu)均衡.
第3階段 當(dāng)“機會主義”行為的M采取風(fēng)險占優(yōu)策略后,根據(jù)結(jié)論1,此時逆向供應(yīng)鏈的演化穩(wěn)定均衡結(jié)果仍將是納什均衡.
根據(jù)演化博弈均衡穩(wěn)定性分析單純形方法,得到F的群體模仿行為策略空間演化相圖,如圖1.F的群體行為策略空間S={sN,sB,sS}的動態(tài)演化過程,即為三種回收策略在群體中的比例分布變化過程.由于θN+θB+θS=1,將其表示為正三角形△ABD,其中,內(nèi)部任一狀態(tài)點向三條邊作高,分別為 x= θN,y= θB,z= θS.
第1種情況下,當(dāng)F分揀策略S的比例較低,機會主義的M將壓低回收價格,圖中分界線CE左上方的演化穩(wěn)定狀態(tài)為囚徒困境的純納什均衡策略組合 (N,D),x= θN=1,y= θB=0,z= θS=0,即為圖1的點A.
第2種情況下,當(dāng)F采取S的比例較高,機會主義的M將提供較高回收價格,圖中CE右下方區(qū)域的演化穩(wěn)定狀態(tài)為帕累托最優(yōu)的純策略組合 (S,P),x= θN=0,y= θB=0,z= θS=1,即圖1的點B.
圖1 面對“機會主義的”制造商時個體商販策略空間演化相圖Fig.1 Space evolutionary phase diagram of family workshop facing opportunist manufacturer
結(jié)論3 當(dāng)逆向供應(yīng)鏈中制造商為“機會主義”類型時,分散化的個體商販策略空間 {分揀,未處理,摻雜}的演化穩(wěn)定狀態(tài),取決于分揀策略所占比例大小:當(dāng)分揀策略所占比例為 θS<0.1t(θN+1)/(f-0.9t)時,演化穩(wěn)定狀態(tài)陷入囚徒困境 (N,D);當(dāng)分揀策略所占比例為 θS>0.1t(θN+1)/(f-0.9t)時,演化穩(wěn)定狀態(tài)為帕累托最優(yōu)的 (S,P).
假設(shè)廢品回收市場處于完全競爭狀態(tài),市場需求隨機產(chǎn)生,回收商和上游制造商等主體在系統(tǒng)運行期初設(shè)定初始值,根據(jù)自身的實力相互競爭演化.逆向供應(yīng)鏈包含150位個體回收商販 (其中摻雜和分揀兩種行為各占50%)、機會主義制造商或回收廠.
博弈收益矩陣值設(shè)定為:2011年6月23日廣東地區(qū)廢舊鋼材均價為3 780元/噸.據(jù)2004-03-20《廣州日報》“披著廢鋼外衣賣偽劣鋼”一文報道,經(jīng)銷商從地下鋼廠進(jìn)貨后,往往以約低于市場價1 000元售出,即t=2 780元/噸.設(shè)廢舊品回收利潤率為5%,即回收成本為回收價格差的95%.2009年我國進(jìn)城務(wù)工的農(nóng)民工工資和城鎮(zhèn)職工工資比例差距為1.9,k=1.9.將上述設(shè)定值代入收益矩陣中,具體博弈收益矩陣值如表2所示.為了簡化分析,忽略個體商販的未處理策略.
表2 逆向供應(yīng)鏈的博弈收益矩陣Table 2 Payoff matrix of adverse supply chain game model
當(dāng)該仿真模型運行約200余次后的動態(tài)演化結(jié)果如圖2.制造商或鋼鐵廠采取壓低品質(zhì)等級策略獲得更高收益,uM(D)=-3 070(圖中粗實線);策略P收益較低,uM(P)=-4 750(圖中細(xì)實線).
根據(jù)結(jié)論3,考慮到個體商販群體θS=1-θN,公式(15)演變?yōu)棣萐<0.2t/(f-0.8t).代入博弈收益矩陣,可得θS<0.2t/(f-0.8t)=0.61,初始條件設(shè)定為θS=0.5.因此,模擬仿真的結(jié)果與理論分析結(jié)果一致,當(dāng)個體商販群體中采取分揀策略的比例較低時,機會主義的制造商或回收廠將違背雙方口頭協(xié)議,采取壓低品質(zhì)等級策略以獲得更高的收益,逆向供應(yīng)鏈陷入“囚徒困境”.
圖2 基于NetLogo逆向供應(yīng)鏈的動態(tài)演化界面Fig.2 NetLogo interface of multi-agent simulation software of adverse supply chain
基于傳統(tǒng)博弈Stackelberg模型,建立具有群體演化特征的逆向供應(yīng)鏈Stackelberg博弈模型.其中,個體商販率先行動的“幼稚”的群體參與者,制造商為后行動的“老練”的個體參與者,雙方進(jìn)行逆向供應(yīng)鏈的價格競爭.研究結(jié)果表明,① 當(dāng)采用復(fù)制動態(tài)方程刻畫個體商販的行為特征時,逆向供應(yīng)鏈的Stackelberg博弈模型穩(wěn)定狀態(tài)為納什均衡;②若制造商設(shè)計“按質(zhì)論價”的策略,則演化穩(wěn)定均衡為帕累托最優(yōu)的 (分揀,按較高品質(zhì)的回收價格);③當(dāng)逆向供應(yīng)鏈中制造商為“機會主義”行為類型時,分散化的個體商販在廢品回收策略空間 {分揀,未處理,摻雜}的演化穩(wěn)定狀態(tài),取決于分揀策略所占比例.
本研究還存在以下問題有待深入研究.① 在少數(shù)沿海發(fā)達(dá)城市建立了專業(yè)化的廢品回收公司——廢舊家用電器回收利用示范項目,雇傭?qū)I(yè)化的人員從事廢品回收再利用的機器化生產(chǎn)流程.該種逆向供應(yīng)鏈有效治理結(jié)構(gòu)及其適應(yīng)性尚待進(jìn)一步研究;②本研究提出占據(jù)市場壟斷地位的制造商,可能違背回收價格口頭協(xié)議,而采取機會主義行為.該問題可以通過引入多家制造商進(jìn)行競爭和淘汰、在B2B等電子商務(wù)平臺上公開市場交易信息等途徑加以解決.后續(xù)研究中將進(jìn)一步闡述逆向供應(yīng)鏈機會主義行為的有效市場治理機制.
/References:
[1] Prahinski C,Kocabasoglu C.Empirical research opportunities in reverse supply chains [J].Omega,2006,34(6):519-532.
[2] Guide J V,Van Wassenhove L N.The reverse supply chain[J].Harvard Business Review,2002,80(2):25-26.
[3] Enslow B.Internet Fulfillment:The Next Supply Chain Frontier[EB/OL].http://enslow.ASCET.com,2002.
[4] Savaskan R C,Bhattacharya S,Van Wassenhove L N.Closed-loop supply chain models with product remanufacturing[J].Management Science,2004,50(2):239-252.
[5] Gu Qiaolun,Gao Tiegang,Shi Lianshuan.Price decision analysis for reverse supply chain based on game theory[J].Systems Engineering-theory & Practice,2005,25(3):20-25.(in Chinese)顧巧論,高鐵杠,石連栓.基于博弈論的逆向供應(yīng)鏈定價策略分析 [J].系統(tǒng)工程理論與實踐,2005,25(3):20-25.
[6] Huang Zuqing,Da Qingli.Optimal strategies of inventory control based on two recovery modes[J].Journal of Southeast University Natural Science Edition,2005,35(2):302-307.(in Chinese)黃祖慶,達(dá)慶利.基于逆向物流定期和定量處理的最優(yōu)庫存控制策略研究 [J].東南大學(xué)學(xué)報自然科學(xué)版,2005,35(2):302-307.
[7] Wei Jie,Li Jun.The choice of different take-back models in reverse logistics with the restriction of EPR [J].Chinese Journal of Management Science,2005,13(6):18-22.(in Chinese)魏 潔,李 軍.ERP下的逆向物流回收模式選擇研究 [J].中國管理科學(xué),2005,13(6):18-22.
[8] Shen Liang,Wang Yuyan.Research on evolutionary game of reverse supply chain [J].Management Review,2009,21(1):124-128.(in Chinese)申 亮,王玉燕.逆向供應(yīng)鏈的演化博弈研究 [J].管理評論,2009,21(1):124-128.
[9] Liu Dehai,Wang Weiguo,WangXun. Information screening model of choosing VMI cooperator in incomplete information[J].Operations Research and Management Science,2009,18(2):46-54.(in Chinese)劉德海,王維國,王 迅.不完全信息下選擇供應(yīng)鏈VMI合作伙伴的信息甄別模型 [J].運籌與管理,2009,18(2):46-54.
[10] Yi Jun,Wang Susheng.Evolutionary game model of multiple recycling modes of reverse supply chain [J].Journal of Shenzhen University Science and Engineering,2012,29(2):183-188.(in Chinese)易 俊,王蘇生.多樣化逆向供應(yīng)鏈回收模式演化博弈模型[J].深圳大學(xué)學(xué)報理工版,2012,29(2):183-188.
[11] Liu Dehai,Xu Yinfeng,Li Chunqing.An analysis of a game problem analyze between individual and group [J].Systems Engineering,2004,22(12):6-9.(in Chinese)劉德海,徐寅峰,李純青.個體與群體之間的一類博弈問題分析 [J].系統(tǒng)工程,2004,22(12):6-9.
[12] Maynard S J.Evolution and the Theory of Games[M].Cambridge(UK):Cambridge University Press,1982:25-34.
[13] Williamson O.The Economic Institutions of Capitalism[M].New York:The Free Press,1985:45-53.