逆向供應(yīng)鏈群體演化的Stackelberg博弈分析

2013-11-26 06:45:58易俊

深圳大學(xué)學(xué)報（理工版） 2013年1期

易俊

暨南大學(xué)財務(wù)與國有資產(chǎn)管理處，廣州510632

一個完整的逆向供應(yīng)鏈?zhǔn)侵钙髽I(yè)為了從客戶手中回收使用過的產(chǎn)品所必需的一系列活動，其目的是對回收品進(jìn)行處置，或再利用.研究表明，有效的逆向供應(yīng)鏈能夠提升顧客滿意度，同時增加企業(yè)利潤［1］.逆向供應(yīng)鏈一般包含:產(chǎn)品回收、逆向物流、回收產(chǎn)品的分揀、再加工及再銷售［2］.近年來，學(xué)者對逆向物流和逆向供應(yīng)鏈進(jìn)行大量的理論研究，主要集中在逆向供應(yīng)鏈各個環(huán)節(jié)的定價方式和利益分配方式、回收產(chǎn)品的庫存控制、回收產(chǎn)品的分揀方法、回收產(chǎn)品的再銷售等方面.隨著信息技術(shù)、動態(tài)優(yōu)化技術(shù)和無線設(shè)備等相互作用和補充，促使逆向物流業(yè)務(wù)流程的重構(gòu)［3］.從博弈角度分析，Savaskan等［4］將生產(chǎn)商作為斯塔克伯格(Stackelberg)博弈領(lǐng)導(dǎo)者，分析生產(chǎn)商、零售商和第3方等回收方式，三者中最接近消費者的將更適合承擔(dān)回收工作.顧巧論等［5］運用博弈論分析逆向供應(yīng)鏈的定價策略;黃祖慶和達(dá)慶利［6］提出基于逆向物流定期和定量處理的最優(yōu)庫存控制策略;魏潔等［7］在生產(chǎn)商延伸責(zé)任下研究逆向供應(yīng)鏈回收模式的選擇;申亮等［8］運用演化博弈理論分析開放型和保守型供應(yīng)商實施逆向供應(yīng)鏈的演化過程;劉德海等［9］運用信息甄別模型研究供應(yīng)鏈合作伙伴選擇問題.本課題組［10］建立中國逆向供應(yīng)鏈回收模式演化博弈模型，討論市場競爭過程最終形成的4種穩(wěn)定演化均衡結(jié)果.

目前，我國走街串巷的流動個體商販及其家庭作坊 (family workshop)構(gòu)成逆向供應(yīng)鏈最主要的回收模式.與發(fā)達(dá)國家相比，我國的勞動力比較廉價，通過人工分類收集，不僅可節(jié)省開支，還能解決一部分進(jìn)城務(wù)工的農(nóng)村剩余勞動力就業(yè)問題，“居民消費者—分散的廢品收購站點 (回收商)—制造商”構(gòu)成逆向供應(yīng)鏈網(wǎng)絡(luò)的各個組成部分.國內(nèi)外一些學(xué)者運用混合整數(shù)規(guī)劃、非線性規(guī)劃模型和優(yōu)化理論，研究逆向供應(yīng)鏈的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計與物流選址等問題，但對我國當(dāng)前分散的廢品收購點與制造商構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)治理機制卻較少研究.本研究探討我國走街串戶進(jìn)行廢品回收利用的個體商販及家庭作坊構(gòu)成的逆向供應(yīng)鏈 (廢棄物物流)機會主義問題.其中，上游制造商 (回收廠)既可以遵守按質(zhì)論價的口頭協(xié)議，也可利用處于信息優(yōu)勢、地域?qū)Ｓ眯蕴卣骱褪袌鲋鲗?dǎo)地位，采取壓低收購價格和質(zhì)量等機會主義行為;而下游分散的個體商販處于信息劣勢和有限理性特征，造成其收益受損.下游“幼稚”的個體商販群體處于信息分散化狀態(tài)，面臨分揀、未加處理與摻雜3種回收策略，其與“老練”的上游制造商進(jìn)行回收價格的競爭.建立具有群體演化特征的逆向供應(yīng)鏈Stackelberg博弈模型;分析逆向供應(yīng)鏈網(wǎng)絡(luò)中制造商的機會主義行為，并基于NetLogo平臺進(jìn)行仿真分析.

1 逆向供應(yīng)鏈網(wǎng)絡(luò)Stackelberg模型

1.1 個體商販與制造商的Stackelberg博弈

目前，走街串巷流動的個體商販及其家庭作坊(記為F)構(gòu)成我國逆向物流的主要回收模式，“居民消費者—分散的廢品收購站點—制造商或回收廠”是一種適合我國國情的逆向供應(yīng)鏈回收模式.限于生產(chǎn)經(jīng)營的規(guī)模及運費因素，分散在城鄉(xiāng)各地的個體商販及其家庭作坊 (回收商)負(fù)責(zé)所在社區(qū)(街區(qū)或村莊等)的廢品回收，然后將廢舊品分揀、清洗和歸類，并集中銷售給制造商或回收廠進(jìn)行再加工.

本研究建立的個體商販與制造商組成逆向供應(yīng)鏈Stackelberg博弈［11］模型中，個體商販 F為率先行動的“幼稚”的群體參與者，制造商M為后行動的“老練”的個體參與者.雙方進(jìn)行逆向供應(yīng)鏈的價格競爭.博弈過程如下:

第1階段分散化的F由于缺少廢品市場供求信息，其收購行為受市場行情支配，符合演化博弈群體參與者具有模仿和學(xué)習(xí)特征的有限理性假設(shè).F可采取對回收廢品進(jìn)行分揀、未處理和摻雜等回收策略，記為S={s1，s2，…，sn}，在廢品回收策略空間S上形成各種回收策略的比例分布，記為θ= ［θ(s1)，θ(s2)，…，θ(sn)］.

根據(jù)復(fù)制動態(tài)方程，提供某種回收策略si(i=1，2，…，n)的個體商販群體比例增長率dθt(si)/dt是純策略效用ut(si)與群體平均期望效用ˉut差的嚴(yán)格增函數(shù)［12］:

第2階段在該地區(qū)占據(jù)主導(dǎo)地位的、“老練”的制造商M根據(jù)F提供的回收策略分布，確定其最佳反應(yīng)函數(shù)，即提供相應(yīng)的廢品回收價格tj(j=1，2，…，m).在M的純策略空間T={t1，t2，…，tm}中，根據(jù)F采取不同策略構(gòu)成的比例分布θt(si)，確定其反應(yīng)函數(shù)為

為方便分析，將個體商販的廢品回收策略S分為:摻雜(N)、未處理(B)和分揀(S)三種類型，即S={sN，sB，sS}.在國內(nèi)廢品回收的逆向供應(yīng)鏈中，各環(huán)節(jié)的交易基本采取現(xiàn)金交易.但交易過程中往往遵守雙方約定俗成的非正式“口頭協(xié)議”:若F按照M的工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求，完成廢舊品的分揀、除雜和再加工等處理，則應(yīng)按照較高的品質(zhì)等級收購，該種回收策略記為P;若F沒有進(jìn)行這項預(yù)處理操作，M將壓低收購等級，該種回收策略記為D.M的策略空間簡化為T={tP，tD}.

在傳統(tǒng)Stackelberg博弈中，F(xiàn)處于信息不充分的“幼稚”的狀態(tài)，其根據(jù)自身利潤最大化原則選擇最佳的摻雜策略;然后，M根據(jù)F的策略選擇摻雜策略，使自身利潤最大化，即提供收購價為壓低品質(zhì)等級的策略D.雙方陷入經(jīng)典的“囚徒困境”博弈結(jié)局中.

考慮到我國從事逆向供應(yīng)鏈回收工作的個體商販數(shù)目較大，通常集中在某一地域，缺少規(guī)模化、專業(yè)化的廢品回收公司，傳統(tǒng)的Stackelberg博弈模型適用于分析個體的學(xué)習(xí)行為，而并不適用分析個體商販內(nèi)部的群體學(xué)習(xí)行為.本研究運用式(1)演化博弈理論復(fù)制動態(tài)方程，模擬F的群體學(xué)習(xí)過程，證明其穩(wěn)定的均衡狀態(tài)，探討“個體商販－制造商”構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)治理機制.

1.2 博弈均衡分析

第1種情況在多階段重復(fù)進(jìn)行的Stackelberg博弈中，若M追求長期利潤最大化，且“富有遠(yuǎn)見”，即滿足條件

其中，t*j為具有帕累托最優(yōu)的納什均衡策略.

第2種情況若M是“機會主義”，在每期重復(fù)博弈中都根據(jù)如下原則采取風(fēng)險占優(yōu)策略tr，則

當(dāng)t→∞時，F(xiàn)的群體復(fù)制動態(tài)將趨于穩(wěn)定的納什均衡s*i，此時其策略si的比例分布為

M采取風(fēng)險占優(yōu)策略tr的反應(yīng)函數(shù)為

將上述反應(yīng)函數(shù)代入式(4)，其風(fēng)險占優(yōu)策略滿足

由于式(6)中風(fēng)險占優(yōu)策略tr滿足嚴(yán)格均衡的定義，而嚴(yán)格均衡必定是純策略納什均衡，因此當(dāng)個體商販F的復(fù)制動態(tài)行為收斂到納什均衡s*i時，機會主義的M采取的風(fēng)險占優(yōu)策略也將收斂到純策略納什均衡.

結(jié)論1 在一定地域范圍內(nèi)由個體商販和制造商構(gòu)成的逆向供應(yīng)鏈中，由于分散化的個體商販的定價行為滿足有限理性假設(shè)，采用復(fù)制動態(tài)方程(1)反映行為特征，則逆向供應(yīng)鏈的Stackelberg博弈模型穩(wěn)定狀態(tài)為納什均衡.

2 逆向供應(yīng)鏈網(wǎng)絡(luò)的機會主義行為

2.1 個體商販的演化博弈均衡分析

假設(shè)個體商販F以收購價c向周邊居民等消費者收購廢品，然后經(jīng)過分揀、再加工等工序，制造商M，根據(jù)廢品處理情況提供回收價格t，且t＞c.M通過回收利用后加工成新的產(chǎn)品，市場收益率為f，且f＞t.若F對廢舊品進(jìn)行嚴(yán)格分揀、除雜和再加工，需付出較多的時間和體力，且需剔除許多不符合回收要求的廢舊品，該項成本簡記為cF.由于目前我國的廢品回收行業(yè)大多采取勞動密集型的產(chǎn)業(yè)組織模式，通過分揀、除雜、清洗和包裝等預(yù)處理環(huán)節(jié)高度分解，因而F盡可能提高廢舊品的回收等級，即0.1t＞cF.

M回收廢品時，一般根據(jù)材質(zhì)、銹蝕、油污等情況，從完全保留價值的十成新品，逐次減低質(zhì)量為九成、八成，直至基本報廢，沒有回收利用價值.當(dāng)F沒有按照M的工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求對廢舊品進(jìn)行分揀和再加工等工作時，盡管F節(jié)省了成本，但M將根據(jù)經(jīng)驗和檢測結(jié)果，會對該批次的廢舊鋼材壓低一個等級，即提供回收價格降為0.9t.類似的，對于F摻雜后的廢品，其數(shù)量將增加l倍，l＞1.M將提供的回收價格至0.8t.為不失一般性，假設(shè)摻雜比例不能過高，即1.1＞l＞1.0.M屬于資本密集型產(chǎn)業(yè)部門，其單位產(chǎn)品所需投資較多，機械化、自動化程度和技術(shù)構(gòu)成較高.假設(shè)M從事附屬操作工人的工資水平，相對于主要由進(jìn)城的農(nóng)民和城市無業(yè)人員組成的個體商販?zhǔn)杖胨礁遦倍.當(dāng)F沒有對廢舊品進(jìn)行分揀、除雜、簡單再加工等工序時，M不得不抽調(diào)相關(guān)人員進(jìn)行相應(yīng)工序，其將付出較高的勞動力工資成本，即0.1t＜kcF.因此，得到制造商和個體商販構(gòu)成的逆向供應(yīng)鏈網(wǎng)絡(luò)重復(fù)博弈收益矩陣，如表1.

表1 逆向供應(yīng)鏈網(wǎng)絡(luò)的策略式博弈模型Table 1 Strategy game model of adverse supply chain network

廢品回收逆向供應(yīng)鏈中，常遵守M提出“按質(zhì)論價”的策略:若F按照M工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求，對廢舊品進(jìn)行了分揀、除雜和再加工等處理，則提供較高的回收價格;否則，將依次壓低廢品品質(zhì).

考慮單位廢品收購量，F(xiàn)各種回收策略的平均利潤為

將式 (7)代入式 (1)，得F采取S的演化方程為

考慮約束條件:個體商販勞動力成本低廉，即0.1t＞cF，且摻雜比例1.1＞l＞1.0，則

同理，F(xiàn)摻雜策略N的演化方程為

F采取未處理策略B的演化方程為

在式(11)中考慮約束條件，則F采取B的演化方向不確定.比較式(8)和式(11)，得因此，F(xiàn)在回收策略空間S={sN，sB，sS}中，最終的演化穩(wěn)定均衡為分揀策略.

結(jié)論2 一定地域范圍內(nèi)，由個體商販和制造商構(gòu)成的逆向供應(yīng)鏈中，當(dāng)制造商采取“按質(zhì)論價”策略，即若個體商販按工藝生產(chǎn)流程和產(chǎn)品生產(chǎn)操作規(guī)范等要求，對廢舊品進(jìn)行分揀、除雜和再加工等處理后，則提供較高的回收價格;否則，依次壓低廢品品質(zhì).個體商販在分揀、未加處理和摻雜回收策略空間中，演化穩(wěn)定均衡為分揀策略.

2.2 制造商的機會主義行為分析

威廉姆森定義“機會主義行為”為“自我利益的狡詐追尋行為”［13］.當(dāng) F面對“機會主義”M時，根據(jù)式 (5)對制造商采取機會主義行為類型的定義，即M在T時期重復(fù)博弈中的任意階段博弈，均采取風(fēng)險占優(yōu)策略tr，分析個體商販的策略空間演化過程.

第1階段假設(shè)F的初始策略分布狀態(tài)為θFt=0={θ0N，θ0S，(1 － θ0N－ θ0S)}.

第2階段當(dāng)F的策略分布處于混合狀態(tài)時，M提供P的預(yù)期利潤為

M提供D的預(yù)期利潤為

當(dāng)F選擇S的分布狀態(tài)θS滿足條件

此時，M提供D為風(fēng)險占優(yōu)均衡.反之，M提供P為風(fēng)險占優(yōu)均衡.

第3階段當(dāng)“機會主義”行為的M采取風(fēng)險占優(yōu)策略后，根據(jù)結(jié)論1，此時逆向供應(yīng)鏈的演化穩(wěn)定均衡結(jié)果仍將是納什均衡.

根據(jù)演化博弈均衡穩(wěn)定性分析單純形方法，得到F的群體模仿行為策略空間演化相圖，如圖1.F的群體行為策略空間S={sN，sB，sS}的動態(tài)演化過程，即為三種回收策略在群體中的比例分布變化過程.由于θN+θB+θS=1，將其表示為正三角形△ABD，其中，內(nèi)部任一狀態(tài)點向三條邊作高，分別為 x= θN，y= θB，z= θS.

第1種情況下，當(dāng)F分揀策略S的比例較低，機會主義的M將壓低回收價格，圖中分界線CE左上方的演化穩(wěn)定狀態(tài)為囚徒困境的純納什均衡策略組合 (N，D)，x= θN=1，y= θB=0，z= θS=0，即為圖1的點A.

第2種情況下，當(dāng)F采取S的比例較高，機會主義的M將提供較高回收價格，圖中CE右下方區(qū)域的演化穩(wěn)定狀態(tài)為帕累托最優(yōu)的純策略組合 (S，P)，x= θN=0，y= θB=0，z= θS=1，即圖1的點B.

圖1 面對“機會主義的”制造商時個體商販策略空間演化相圖Fig.1 Space evolutionary phase diagram of family workshop facing opportunist manufacturer

結(jié)論3 當(dāng)逆向供應(yīng)鏈中制造商為“機會主義”類型時，分散化的個體商販策略空間 {分揀，未處理，摻雜}的演化穩(wěn)定狀態(tài)，取決于分揀策略所占比例大小:當(dāng)分揀策略所占比例為 θS＜0.1t(θN+1)/(f－0.9t)時，演化穩(wěn)定狀態(tài)陷入囚徒困境 (N，D);當(dāng)分揀策略所占比例為 θS＞0.1t(θN+1)/(f－0.9t)時，演化穩(wěn)定狀態(tài)為帕累托最優(yōu)的 (S，P).

3 基于NetLogo平臺的仿真分析

假設(shè)廢品回收市場處于完全競爭狀態(tài)，市場需求隨機產(chǎn)生，回收商和上游制造商等主體在系統(tǒng)運行期初設(shè)定初始值，根據(jù)自身的實力相互競爭演化.逆向供應(yīng)鏈包含150位個體回收商販 (其中摻雜和分揀兩種行為各占50%)、機會主義制造商或回收廠.

博弈收益矩陣值設(shè)定為:2011年6月23日廣東地區(qū)廢舊鋼材均價為3 780元/噸.據(jù)2004-03-20《廣州日報》“披著廢鋼外衣賣偽劣鋼”一文報道，經(jīng)銷商從地下鋼廠進(jìn)貨后，往往以約低于市場價1 000元售出，即t=2 780元/噸.設(shè)廢舊品回收利潤率為5%，即回收成本為回收價格差的95%.2009年我國進(jìn)城務(wù)工的農(nóng)民工工資和城鎮(zhèn)職工工資比例差距為1.9，k=1.9.將上述設(shè)定值代入收益矩陣中，具體博弈收益矩陣值如表2所示.為了簡化分析，忽略個體商販的未處理策略.

表2 逆向供應(yīng)鏈的博弈收益矩陣Table 2 Payoff matrix of adverse supply chain game model

當(dāng)該仿真模型運行約200余次后的動態(tài)演化結(jié)果如圖2.制造商或鋼鐵廠采取壓低品質(zhì)等級策略獲得更高收益，uM(D)=－3 070(圖中粗實線);策略P收益較低，uM(P)=－4 750(圖中細(xì)實線).

根據(jù)結(jié)論3，考慮到個體商販群體θS=1－θN，公式(15)演變?yōu)棣萐＜0.2t/(f－0.8t).代入博弈收益矩陣，可得θS＜0.2t/(f－0.8t)=0.61，初始條件設(shè)定為θS=0.5.因此，模擬仿真的結(jié)果與理論分析結(jié)果一致，當(dāng)個體商販群體中采取分揀策略的比例較低時，機會主義的制造商或回收廠將違背雙方口頭協(xié)議，采取壓低品質(zhì)等級策略以獲得更高的收益，逆向供應(yīng)鏈陷入“囚徒困境”.

圖2 基于NetLogo逆向供應(yīng)鏈的動態(tài)演化界面Fig.2 NetLogo interface of multi-agent simulation software of adverse supply chain

結(jié) 語

基于傳統(tǒng)博弈Stackelberg模型，建立具有群體演化特征的逆向供應(yīng)鏈Stackelberg博弈模型.其中，個體商販率先行動的“幼稚”的群體參與者，制造商為后行動的“老練”的個體參與者，雙方進(jìn)行逆向供應(yīng)鏈的價格競爭.研究結(jié)果表明，① 當(dāng)采用復(fù)制動態(tài)方程刻畫個體商販的行為特征時，逆向供應(yīng)鏈的Stackelberg博弈模型穩(wěn)定狀態(tài)為納什均衡;②若制造商設(shè)計“按質(zhì)論價”的策略，則演化穩(wěn)定均衡為帕累托最優(yōu)的 (分揀，按較高品質(zhì)的回收價格);③當(dāng)逆向供應(yīng)鏈中制造商為“機會主義”行為類型時，分散化的個體商販在廢品回收策略空間 {分揀，未處理，摻雜}的演化穩(wěn)定狀態(tài)，取決于分揀策略所占比例.

本研究還存在以下問題有待深入研究.① 在少數(shù)沿海發(fā)達(dá)城市建立了專業(yè)化的廢品回收公司——廢舊家用電器回收利用示范項目，雇傭?qū)I(yè)化的人員從事廢品回收再利用的機器化生產(chǎn)流程.該種逆向供應(yīng)鏈有效治理結(jié)構(gòu)及其適應(yīng)性尚待進(jìn)一步研究;②本研究提出占據(jù)市場壟斷地位的制造商，可能違背回收價格口頭協(xié)議，而采取機會主義行為.該問題可以通過引入多家制造商進(jìn)行競爭和淘汰、在B2B等電子商務(wù)平臺上公開市場交易信息等途徑加以解決.后續(xù)研究中將進(jìn)一步闡述逆向供應(yīng)鏈機會主義行為的有效市場治理機制.

/References:

［1］ Prahinski C，Kocabasoglu C.Empirical research opportunities in reverse supply chains ［J］.Omega，2006，34(6):519-532.

［2］ Guide J V，Van Wassenhove L N.The reverse supply chain［J］.Harvard Business Review，2002，80(2):25-26.

［3］ Enslow B.Internet Fulfillment:The Next Supply Chain Frontier［EB/OL］.http://enslow.ASCET.com，2002.

［4］ Savaskan R C，Bhattacharya S，Van Wassenhove L N.Closed-loop supply chain models with product remanufacturing［J］.Management Science，2004，50(2):239-252.

［5］ Gu Qiaolun，Gao Tiegang，Shi Lianshuan.Price decision analysis for reverse supply chain based on game theory［J］.Systems Engineering-theory ＆ Practice，2005，25(3):20-25.(in Chinese)顧巧論，高鐵杠，石連栓.基于博弈論的逆向供應(yīng)鏈定價策略分析［J］.系統(tǒng)工程理論與實踐，2005，25(3):20-25.

［6］ Huang Zuqing，Da Qingli.Optimal strategies of inventory control based on two recovery modes［J］.Journal of Southeast University Natural Science Edition，2005，35(2):302-307.(in Chinese)黃祖慶，達(dá)慶利.基于逆向物流定期和定量處理的最優(yōu)庫存控制策略研究［J］.東南大學(xué)學(xué)報自然科學(xué)版，2005，35(2):302-307.

［7］ Wei Jie，Li Jun.The choice of different take-back models in reverse logistics with the restriction of EPR ［J］.Chinese Journal of Management Science，2005，13(6):18-22.(in Chinese)魏潔，李軍.ERP下的逆向物流回收模式選擇研究［J］.中國管理科學(xué)，2005，13(6):18-22.

［8］ Shen Liang，Wang Yuyan.Research on evolutionary game of reverse supply chain ［J］.Management Review，2009，21(1):124-128.(in Chinese)申亮，王玉燕.逆向供應(yīng)鏈的演化博弈研究［J］.管理評論，2009，21(1):124-128.

［9］ Liu Dehai，Wang Weiguo，WangXun. Information screening model of choosing VMI cooperator in incomplete information［J］.Operations Research and Management Science，2009，18(2):46-54.(in Chinese)劉德海，王維國，王迅.不完全信息下選擇供應(yīng)鏈VMI合作伙伴的信息甄別模型［J］.運籌與管理，2009，18(2):46-54.

［10］ Yi Jun，Wang Susheng.Evolutionary game model of multiple recycling modes of reverse supply chain ［J］.Journal of Shenzhen University Science and Engineering，2012，29(2):183-188.(in Chinese)易俊，王蘇生.多樣化逆向供應(yīng)鏈回收模式演化博弈模型［J］.深圳大學(xué)學(xué)報理工版，2012，29(2):183-188.

［11］ Liu Dehai，Xu Yinfeng，Li Chunqing.An analysis of a game problem analyze between individual and group ［J］.Systems Engineering，2004，22(12):6-9.(in Chinese)劉德海，徐寅峰，李純青.個體與群體之間的一類博弈問題分析［J］.系統(tǒng)工程，2004，22(12):6-9.

［12］ Maynard S J.Evolution and the Theory of Games［M］.Cambridge(UK):Cambridge University Press，1982:25-34.

［13］ Williamson O.The Economic Institutions of Capitalism［M］.New York:The Free Press，1985:45-53.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看