吳正稿,徐海燕,鄧 瀟
(南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211106)
沖突具有普遍性,在經(jīng)濟(jì)、貿(mào)易、醫(yī)療及軍事等各個(gè)領(lǐng)域都普遍存在著沖突。沖突的普遍性極大的促進(jìn)了沖突分析理論的發(fā)展,以便輔助決策者理解、分析沖突和做出較優(yōu)決策。沖突分析圖模型理論[1~3](Graph Model for Conflict Resolution,GMCR),為沖突的分析和解決提供了一種靈活、簡(jiǎn)單的方法。GMCR是在經(jīng)典博弈論的基礎(chǔ)上發(fā)展起來(lái)的,但經(jīng)典博弈模型需要精準(zhǔn)的偏好效用值。而GMCR只需要相對(duì)偏好信息,就能分析出沖突的均衡狀態(tài),是一種介于定性與定量分析之間的方法。GMCR可以最大限度地利用少量信息,為決策者提供科學(xué)的決策支持,因此被廣泛運(yùn)用于水污染沖突[4]、大氣環(huán)境沖突[5]、能源沖突[6]、企業(yè)勞資沖突[7]和醫(yī)療保險(xiǎn)沖突[8]等領(lǐng)域。而且GMCR有完善的建模和穩(wěn)定性分析流程,并開(kāi)發(fā)了成熟的決策支持系統(tǒng)[9,10],使決策者能更加高效的分析沖突。Xu等[11,12]給出了 GMCR相關(guān)穩(wěn)定性定義的矩陣表達(dá)式,用簡(jiǎn)潔的矩陣形式給出了GMCR穩(wěn)定性的代數(shù)表達(dá)式,來(lái)代替原有復(fù)雜的邏輯表達(dá),方便了沖突穩(wěn)定性的求解,也促進(jìn)了決策支持系統(tǒng)相關(guān)算法的實(shí)現(xiàn)。
GMCR能對(duì)不存在信息誤解的沖突進(jìn)行完善的分析,但對(duì)于存在信息誤解的沖突,GMCR需要和其他理論相結(jié)合。目前國(guó)內(nèi)外的學(xué)者一般運(yùn)用超對(duì)策理論[13](hypergame,又稱(chēng)誤對(duì)策)來(lái)研究存在信息誤解的沖突。Bennett與Dando[14]最先運(yùn)用超對(duì)策理論對(duì)二戰(zhàn)期間法國(guó)的戰(zhàn)敗進(jìn)行了分析。Fraser和Hipel[15]將沖突分析的F-H方法和超對(duì)策相結(jié)合,大大簡(jiǎn)化了超對(duì)策沖突的分析過(guò)程。Takahashi等[16]基于沖突分析理論,從狀態(tài)角度分析超對(duì)策的均衡解,并進(jìn)行了三階超對(duì)策的應(yīng)用研究。Wang等[17,18]將一般超對(duì)策理論拓展到高階超對(duì)策并給出相應(yīng)的解法。舒江等[19]提出“制約壘”概念,改進(jìn)了超對(duì)策理論不能將決策目標(biāo)和決策分析過(guò)程有機(jī)結(jié)合的缺點(diǎn)。郭文革和陳珽[20]將超對(duì)策模型拓展到最終報(bào)價(jià)仲裁領(lǐng)域。為了刻畫(huà)局中人對(duì)超對(duì)策結(jié)局偏好認(rèn)知的不確定性,宋業(yè)新等[21]構(gòu)建了超對(duì)策偏好認(rèn)知的信息溝通模型,并對(duì)均衡結(jié)局的魯棒性進(jìn)行了分析。Yasir等[22]基于超對(duì)策理論分析了沖突中的偏好誤解和策略誤解。劉德海和周婷婷[23]將誤對(duì)策運(yùn)用于恐怖襲擊事件中,分析了政府反恐力量和恐怖分子的博弈。從目前關(guān)于超對(duì)策理論的相關(guān)文獻(xiàn)中可以發(fā)現(xiàn),現(xiàn)有超對(duì)策理論主要從正向視角出發(fā),在已知所有決策者的誤解信息的前提下,包括偏好誤解和策略誤解,運(yùn)用超對(duì)策模型分析沖突中的個(gè)體穩(wěn)定信息和整體均衡狀態(tài)。雖然作為信息優(yōu)勢(shì)一方的決策者能比較容易的觀察或分析出超對(duì)策沖突中真實(shí)的均衡狀態(tài),但現(xiàn)實(shí)中由于自身?xiàng)l件和認(rèn)知能力的限制,很難獲取對(duì)手誤解的偏好信息。而沖突的反向視角能從均衡信息出發(fā),求取對(duì)手誤解的偏好信息,這是典型的沖突分析反問(wèn)題研究。
對(duì)于沖突分析反問(wèn)題的研究,Okada等[24]最早提出了不完全信息下的沖突分析反問(wèn)題,在保證某個(gè)狀態(tài)處于均衡的前提下,采用嘗試法檢驗(yàn)均衡狀態(tài)的魯棒性,但這種方法工作量大而且難以運(yùn)用。Kinsara等[25]基于GMCR運(yùn)用窮舉法來(lái)獲取使沖突方在某個(gè)狀態(tài)處于穩(wěn)定的所有偏好解,但這個(gè)方法的計(jì)算復(fù)雜度非常高。趙金帥和徐海燕[26]進(jìn)行了有序偏好下的沖突分析反問(wèn)題研究,在保證某一狀態(tài)處于穩(wěn)定的前提下,提出了最少約束條件下求取偏好解的方法,但依舊采用枚舉法求解。Wang等[27]進(jìn)行了基于矩陣形式的GMCR反問(wèn)題研究,優(yōu)化了原先的邏輯表達(dá),但是仍然沒(méi)有實(shí)現(xiàn)反問(wèn)題的求解算法。
對(duì)于一個(gè)包含兩個(gè)決策者的沖突,每個(gè)決策者不僅需要了解自身的偏好,還需要去獲取其他決策者(對(duì)手)的偏好信息,來(lái)達(dá)到知己知彼的目的。但在信息不對(duì)稱(chēng)且對(duì)手處于信息劣勢(shì)的沖突中,對(duì)手非常容易對(duì)決策者的偏好信息產(chǎn)生認(rèn)知錯(cuò)誤。當(dāng)這種情況發(fā)生時(shí),如果決策者能在談判中察覺(jué)到對(duì)手對(duì)自身的偏好存在誤解,更進(jìn)一步的,如果決策者能夠獲得對(duì)手誤解的偏好,那么決策者就可以在沖突談判中占據(jù)主動(dòng)優(yōu)勢(shì),并通過(guò)設(shè)計(jì)相應(yīng)的誘導(dǎo)機(jī)制來(lái)實(shí)現(xiàn)自身效益的最大化。實(shí)際上,盡管對(duì)手對(duì)決策者的偏好認(rèn)知存在誤差,但對(duì)手也是理性的,能正確推測(cè)決策者大部分的偏好信息。因此,可以認(rèn)定對(duì)手對(duì)決策者偏好的認(rèn)知誤差會(huì)很小?;谝陨戏治觯疚膶⒊瑢?duì)策理論和沖突分析反問(wèn)題相結(jié)合,在偏好誤解最小化的前提下,以誤解的偏好和真實(shí)偏好之間的差距為目標(biāo)函數(shù),求解滿足穩(wěn)定性約束的誤解偏好,從而為超對(duì)策沖突誘導(dǎo)機(jī)制設(shè)計(jì)提供重要的決策支持。
本文第一部分介紹了沖突分析圖模型和超對(duì)策的基本理論;第二部分針對(duì)兩個(gè)決策者的沖突,詳細(xì)介紹了在已知對(duì)手偏好的情況下,獲取對(duì)手對(duì)決策者誤解偏好的方法,即基于超對(duì)策理論的沖突分析反問(wèn)題建模,并給出模型的求解方法;第三部分以電子商務(wù)環(huán)境下供應(yīng)商和傳統(tǒng)零售商之間的雙渠道沖突為例,進(jìn)一步驗(yàn)證了模型的有效性;第四部分總結(jié)并給出未來(lái)的研究方向。
沖突分析圖模型理論(GMCR)可以通過(guò)W={N,S,A,{?i,~i:i∈N}}來(lái)表示。其中N={1,2,…,i,…,n}(n≥2)表示沖突中決策者的集合,n表示決策者的個(gè)數(shù)。S={s1,s2,…,sm}表示可行狀態(tài)的集合,在圖模型中表示頂點(diǎn)的集合,m表示可行狀態(tài)集合中可行狀態(tài)的個(gè)數(shù)。A={A1,A2,…,Ai,…Au}表示非空有向弧集合,其中Ai表示決策者i控制下的狀態(tài)之間的一步可行轉(zhuǎn)移,在圖模型中表示頂點(diǎn)間弧的集合。對(duì)于決策者i(i∈N)的兩個(gè)狀態(tài)sp,sq∈S,其中p和q的取值范圍為[1,m]內(nèi)的整數(shù),如果(sp,sq)∈Ai,就表示決策者i可以從狀態(tài)sp做一步移動(dòng)到狀態(tài)sq。{?i,~i:i∈N}表示決策者對(duì)于可行狀態(tài)之間的簡(jiǎn)單偏好,其中表示對(duì)決策者而言狀態(tài)sp優(yōu)于狀態(tài)sq,sp~isq或sq~isp表示對(duì)決策者而言狀態(tài)sp等價(jià)于狀態(tài)sq。偏好關(guān)系?i滿足不對(duì)稱(chēng)性,~i滿足自反性和對(duì)稱(chēng)性,{?i,~i:i∈K}滿足完備性[11]。
設(shè)矩陣U=(U(p,q))m×m和V=(V(p,q))m×m,有L=U。V=(U(p,q)·V(p,q))m×m,其中U(p,q)和V(p,q)分別表示矩陣U和矩陣V中第p行q列的元素,“°”表示Hadamard乘積。
如果矩陣Ji=(Ji(p,q))m×m滿足下列式子:
(1)
則稱(chēng)Ji為決策者i的可達(dá)矩陣。Ji中第p行q列的元素相當(dāng)于第p個(gè)狀態(tài)sp和第q個(gè)狀態(tài)sq之間的比較結(jié)果。
(2)
決策者i從初始狀態(tài)sp出發(fā)通過(guò)一步改良可達(dá)的狀態(tài)集合可以表示成:
(3)
(4)
在信息不對(duì)稱(chēng)的沖突中,處于信息優(yōu)勢(shì)的決策者掌握了對(duì)方比較全面的信息,不容易對(duì)對(duì)方產(chǎn)生誤解,而處于信息劣勢(shì)的決策者缺乏對(duì)對(duì)方全面的了解,非常容易對(duì)對(duì)方產(chǎn)生誤解。又因?yàn)樵诖蠖鄶?shù)沖突中,偏好信息非常難以掌握,常常存在誤解,而關(guān)于決策者策略的信息比較容易掌握,不容易存在誤解。因此,本文只考慮偏好誤解的情況。
對(duì)于兩個(gè)決策者N={i,j}的超對(duì)策沖突,把決策者i認(rèn)知到的沖突記為Gi,決策者j認(rèn)知到的沖突記為Gj。對(duì)于決策者i和決策者j,給出以下幾種偏好矩陣的解釋?zhuān)?/p>
在沖突分析圖模型中,當(dāng)決策者無(wú)法從某個(gè)狀態(tài)通過(guò)單邊移動(dòng)到達(dá)更好的狀態(tài),那么這個(gè)狀態(tài)就稱(chēng)為該決策者的Nash穩(wěn)定狀態(tài)[28]。具體定義如下:
使決策者i和決策者j都處于Nash穩(wěn)定的狀態(tài),稱(chēng)為沖突的Nash均衡解。
在沖突的初始階段,決策者i與決策者j都沒(méi)有意識(shí)到?jīng)Q策者j對(duì)決策者i存在偏好誤解。此時(shí),沖突雙方在進(jìn)行一階超對(duì)策沖突。通過(guò)談判,決策者i發(fā)現(xiàn)自己所認(rèn)知的某些真實(shí)的Nash均衡解并不是決策者j認(rèn)知的Nash均衡解,記這樣的Nash均衡解的狀態(tài)集合為SNash(對(duì)集合SNash進(jìn)一步的解釋是,該集合中的狀態(tài)對(duì)于決策者i而言是Nash穩(wěn)定的,但由于偏好誤解,決策者j錯(cuò)誤的認(rèn)為該集合中的狀態(tài)不是決策者i的Nash穩(wěn)定狀態(tài))。那么,決策者i可以推斷決策者j對(duì)自己的偏好產(chǎn)生了誤解。此時(shí),決策者i與決策者j之間的沖突就變成了二階超對(duì)策沖突,如表1所示。
為了更全面的分析沖突局勢(shì),決策者i還需要充分掌握決策者j的誤解偏好,以便做出有利的誘導(dǎo)或反擊來(lái)實(shí)現(xiàn)自身利益的最大化。下文給出了求解決策者j對(duì)決策者i的誤解偏好X的具體模型。
表1 信息優(yōu)勢(shì)方為決策者i的二階超對(duì)策沖突
模型1是一個(gè)隱性的0-1線性規(guī)劃問(wèn)題,可以通過(guò)引入輔助變量將模型1轉(zhuǎn)化成顯性的0-1線性規(guī)劃模型,以便于求解[29]。
命題1引入兩組輔助變量Y(p,q),a(p,q)∈{0,1}和無(wú)窮大的常數(shù)M,有模型1和模型2等價(jià)。
證明
綜上1)、2)、3)、4)可得模型1等價(jià)于0-1線性模型2,其中約束(10)表示變量的取值范圍。
模型2:
(10)
因?yàn)楸疚那蠼獾钠檬窍鄬?duì)偏好,所以使得某個(gè)決策者在某一狀態(tài)處于穩(wěn)定的解有很多個(gè)。一般的算法只能隨機(jī)的求出0-1規(guī)劃模型的某一個(gè)最優(yōu)解,卻無(wú)法求得所有的最優(yōu)解。而實(shí)際談判中決策者需要所有的最優(yōu)解來(lái)了解對(duì)方所有可能的誤解情況,以輔助自己作出較優(yōu)的決策。為此需要引入求取模型2所有最優(yōu)解的方法。不妨令Xα表示模型2一個(gè)既得的最優(yōu)解,Zα表示最優(yōu)解Xα對(duì)應(yīng)的最優(yōu)目標(biāo)值。為了求出模型2中其它可能的最優(yōu)解,需要在模型2中添加約束條件X≠Xα,來(lái)排除既得最優(yōu)解Xα。求解其它最優(yōu)解的模型如模型3所示。
模型3:
(11)
由于模型3中約束(11)是非線性的,使得整個(gè)模型變成非線性的。為了便于計(jì)算求解,需要將約束X≠Xα轉(zhuǎn)化成線性約束。Combinatorial Benders’(CB)cuts[30]是采用線性約束來(lái)排除0-1規(guī)劃模型中既得最優(yōu)解的經(jīng)典方法。借用該方法,可以將非線性約束(11)轉(zhuǎn)化成線性約束。
令Bα表示矩陣Xα中元素值為1的位置集合,Nα表示矩陣Xα中元素值為0的位置集合,則有Bα={(p,q)|Xα(p,q)=1}和Nα={(p,q)|Xα(p,q)=0}。
定義2令|Bα|表示集合Bα的基數(shù)(集合Bα里元素的個(gè)數(shù)),則稱(chēng)公式(12)為Xα對(duì)應(yīng)的CB cuts:
(12)
由定義2易得引理1:
引理1如果X≠Xα,則有
定理2揭示了公式(12)既排除了既得最優(yōu)解Xα,又保留了其他所有的可行解。根據(jù)定理2,模型2可以通過(guò)添加X(jué)α對(duì)應(yīng)的CB cuts線性約束來(lái)排除既得最優(yōu)解Xα,具體見(jiàn)模型4。
模型4:
(13)
為求解模型中所有最優(yōu)解,需要在每求出一個(gè)最優(yōu)解后,把該解對(duì)應(yīng)的CB cuts加入到模型2的約束條件中,不斷迭代,直到求得所有最優(yōu)解。下文用Xc(c=0,1,2,3,…)表示模型2的解。求解模型2中所有最優(yōu)解的具體算法為[31]:
步驟1令c=0,求解0-1線性規(guī)劃模型2,得到初始最優(yōu)解X0以及對(duì)應(yīng)的目標(biāo)函數(shù)值Z0。
步驟2令c=c+1,添加X(jué)c-1對(duì)應(yīng)的CB cuts到模型2的約束條件中,同時(shí)解出該模型的最優(yōu)解Xc以及目標(biāo)函數(shù)值Zc。
步驟3如果Zc=Z0,轉(zhuǎn)步驟 2,否則轉(zhuǎn)步驟4。
步驟4列出模型2的所有最優(yōu)解Xl(l=0,1,…,c-1)。
隨著電子商務(wù)技術(shù)的發(fā)展,越來(lái)越多的供應(yīng)商開(kāi)始擴(kuò)展網(wǎng)絡(luò)直銷(xiāo)渠道,極大提高了產(chǎn)品的市場(chǎng)份額和收益,但也引起了供應(yīng)商網(wǎng)絡(luò)直銷(xiāo)渠道與傳統(tǒng)零售渠道的沖突難題。針對(duì)這類(lèi)雙渠道供應(yīng)鏈沖突問(wèn)題,文獻(xiàn)[32]構(gòu)建了相應(yīng)的沖突圖模型。該沖突中有兩個(gè)決策者:供應(yīng)商(DM1)和傳統(tǒng)零售商(DM2)。供應(yīng)商有兩個(gè)策略:1)協(xié)商,2)放棄(網(wǎng)絡(luò)直銷(xiāo))。傳統(tǒng)零售商有三個(gè)策略:3)退出,4)協(xié)商,5)競(jìng)爭(zhēng)。該沖突可以構(gòu)成的狀態(tài)如表2所示,表中“N” 表示決策者不采取該策略,“Y” 表示決策者采取該策略,“-”表示既可以是“Y”,也可以是“N”。
表2 供應(yīng)商與傳統(tǒng)零售商雙渠道沖突可行狀態(tài)表
在沖突分析圖模型中,策略?xún)?yōu)先權(quán)排序法是一種根據(jù)決策者的策略聲明進(jìn)行偏好排序的方法,相比直接排序法和策略權(quán)重法更加便捷高效[9,33]。所以,本文采用策略?xún)?yōu)先權(quán)排序法來(lái)求取供應(yīng)商與傳統(tǒng)零售商的偏好。根據(jù)雙渠道沖突的實(shí)際背景,可以確定供應(yīng)商與傳統(tǒng)零售商的偏好聲明,如表3所示。
表3 雙渠道沖突中各決策者偏好聲明及其含義
根據(jù)表3給出的供應(yīng)商與傳統(tǒng)零售商的偏好聲明,采用策略?xún)?yōu)先權(quán)排序法可以求出對(duì)于各決策者每個(gè)狀態(tài)的分值大小,從而得到供應(yīng)商和傳統(tǒng)零售商相應(yīng)的偏好排序:
s2?1s5?1s1?1s3?1s4?1s6?1s7
(14)
s7?2s4?2s6?2s5?2s1?2s3?2s2
(15)
具體的排序計(jì)算過(guò)程請(qǐng)參考文獻(xiàn)[9]。
圖1 供應(yīng)商與傳統(tǒng)零售商之間的雙渠道沖突狀態(tài)轉(zhuǎn)移圖
圖1表示DM1和DM2的狀態(tài)轉(zhuǎn)移圖,黑色圓點(diǎn)表示可行狀態(tài),弧的箭頭方向表示由初始狀態(tài)通過(guò)轉(zhuǎn)移到另一個(gè)可行狀態(tài)。
根據(jù)狀態(tài)轉(zhuǎn)移圖,供應(yīng)商與傳統(tǒng)零售商相應(yīng)的可達(dá)矩陣可以構(gòu)造成:
根據(jù)上文中描述的偏好信息(14)和(15),供應(yīng)商和傳統(tǒng)零售商相應(yīng)的偏好矩陣可以構(gòu)造成:
表4 傳統(tǒng)零售商正確認(rèn)知下的沖突穩(wěn)定性結(jié)果
模型5:
(16)
(19)
運(yùn)用文中第二部分的線性轉(zhuǎn)換及算法求解,可得到模型5的所有最優(yōu)解(解一和解二)。
解一:供應(yīng)商把s1?2s2誤解成s2?2s1,把s1~2s3誤解成s1?2s3。
解二:供應(yīng)商把s1~2s3誤解成s3?2s1,把s3?2s2誤解成s2?2s3。
如果在誤解情況下,供應(yīng)商對(duì)傳統(tǒng)零售商的偏好誤解使沖突往不利于傳統(tǒng)零售商的方向發(fā)展,那么傳統(tǒng)零售商就可以向供應(yīng)商透露自己真實(shí)的偏好來(lái)消除誤解或改變自己的偏好來(lái)誘導(dǎo)供應(yīng)商,從而使沖突往有利于自己的方向發(fā)展。
歸納為一般形式有:DM1對(duì)DM2的偏好產(chǎn)生誤解,通過(guò)談判DM2發(fā)現(xiàn)了DM1對(duì)自己產(chǎn)生誤解,而DM1并未察覺(jué)自己對(duì)DM2產(chǎn)生了誤解。那么DM2就可以通過(guò)本文的沖突分析反問(wèn)題求解方法,確定DM1所誤解的偏好。與不存在誤解的沖突相比較,如果DM1對(duì)DM2的偏好誤解使得沖突最后的均衡更有利于DM2,則DM2會(huì)繼續(xù)讓DM1誤解下去;反之,如果DM1對(duì)DM2的偏好誤解使得沖突局勢(shì)往不利于DM2的方向發(fā)展,則DM2會(huì)通過(guò)消除DM1對(duì)自己的誤解或改變自身偏好的方式來(lái)誘導(dǎo)沖突的發(fā)展,以實(shí)現(xiàn)自己利益的最大化。
表5 傳統(tǒng)零售商為信息優(yōu)勢(shì)方的二階超對(duì)策沖突穩(wěn)定性分析結(jié)果
本文基于超對(duì)策理論,從沖突反向視角,建立了求取誤解偏好的數(shù)學(xué)模型,并給了模型的求解思路,輔助決策者獲取對(duì)手的誤解偏好。決策者在獲取這個(gè)偏好后便能制定相應(yīng)的策略來(lái)誘導(dǎo)或欺騙對(duì)手,以使自身利益最大化。最后,以供應(yīng)商與傳統(tǒng)零售商之間的雙渠道沖突案例進(jìn)行了模型的應(yīng)用研究,介紹了模型的構(gòu)造與求解步驟,并求出了該沖突中所有可能的誤解偏好。
本文方法與一般超對(duì)策方法和沖突分析反問(wèn)題的具體比較見(jiàn)表6。本文方法與一般超對(duì)策方法相比,能夠從沖突的反向視角出發(fā),根據(jù)談判中的均衡信息,構(gòu)建具體的數(shù)學(xué)模型來(lái)準(zhǔn)確求取誤解偏好,克服了以往超對(duì)策只能假設(shè)誤解偏好已知的缺點(diǎn)。本文方法與沖突分析反問(wèn)題相比,能進(jìn)一步分析存在偏好誤解的沖突,且能夠構(gòu)建具體的優(yōu)化模型并實(shí)現(xiàn)了求取偏好解的算法。至于如何根據(jù)本文方法求得的誤解偏好來(lái)誘導(dǎo)對(duì)手按照自己設(shè)計(jì)的機(jī)制行動(dòng),以使自己獲益最優(yōu),將是下一步研究的重點(diǎn)。
表6 本文方法與一般超對(duì)策方法和沖突分析反問(wèn)題的比較