• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于主從博弈的面向報童決策者的信息設(shè)計

      2021-04-01 03:04:40沈琦琦王長軍
      關(guān)鍵詞:報童決策者先驗

      沈琦琦, 王長軍

      (東華大學(xué) 旭日工商管理學(xué)院, 上海 200051)

      經(jīng)典報童模型具有普遍適用性,被廣泛應(yīng)用于工業(yè)生產(chǎn)[1]、供應(yīng)鏈協(xié)調(diào)[2]、拍賣競價[3]和金融管理[4]等領(lǐng)域。Qin等[5]對報童模型的各種擴(kuò)展和應(yīng)用進(jìn)行了詳盡的綜述?,F(xiàn)有的報童相關(guān)研究均只考慮決策者面臨不確定需求,而需求分布卻是外生給定的,在現(xiàn)實情況中,諸如決策者面臨的不確定需求等信息是可以被改變的。比如:Simchi-levi等[6]指出零售商可以通過釋放需求信號,改變制造商對市場的信念,從而促使其多備貨;Kamenica等[7]構(gòu)造了廣告設(shè)計的示例,由此影響消費者對產(chǎn)品質(zhì)量的判斷,促使其購買。此外,政府也可以通過各種宣傳,影響企業(yè)對投資前景的信念,吸引其入駐投資。有相當(dāng)?shù)难芯恐塾诋a(chǎn)品質(zhì)量[8],銷售商促銷的努力程度[9]以及市場需求[10-12]的認(rèn)知表明,決策者對于未知市場信息的信念都是可以被改變的。在這一過程中,信息設(shè)計者可以通過改變市場中決策者的信念,繼而影響其決策,使其做出有利于自己的行為。以改變需求認(rèn)知為例,Wang等[10]研究了一個包含零售商和供應(yīng)商的兩級供應(yīng)鏈,其中市場未來需求的狀態(tài)有正常和中斷兩種,所有成員都共享需求狀態(tài)的先驗。但是,更靠近終端市場的零售商可通過需求信息共享,來影響供應(yīng)商對市場需求的信念,繼而影響其批發(fā)價決策。Jiang等[11]研究了制造商比下游零售商具有更好的需求信息時的共享問題,其中,市場需求狀態(tài)分為高、低兩種,雙方共享需求先驗,制造商可以事先預(yù)測需求信號,并根據(jù)博弈前選擇的共享模式與零售商共享,以引導(dǎo)有利于自己的零售商價格決策。夏海洋[12]考慮供應(yīng)商與現(xiàn)有零售商、新進(jìn)入零售商締結(jié)不同類型合約時泄露信息的問題,研究假定現(xiàn)有零售商可以觀察到市場需求的真實值且據(jù)此向供應(yīng)商下訂單,而供應(yīng)商可決定是否將現(xiàn)有零售商的訂貨量泄露給新進(jìn)入零售商來改變后者的需求認(rèn)知以獲得更多收益。

      以上研究關(guān)注了信息設(shè)計者通過改變另一方對需求的信念而獲利,但在分析不確定市場需求時,如僅考慮極為有限的高、低需求狀態(tài),將難以充分描述現(xiàn)實中的復(fù)雜需求場景。此外,現(xiàn)有信息設(shè)計研究并未針對報童決策者展開[13-14],這也限制了報童模型進(jìn)一步在復(fù)雜信息環(huán)境下的應(yīng)用。

      本文考慮了一個具有信息優(yōu)勢的信息設(shè)計者,通過改變報童決策者對需求的認(rèn)知,從而改變報童決策者的決策來實現(xiàn)自身的收益,其中,不確定的需求用一組離散場景來描述。本研究將該問題描述成一個包含信息設(shè)計者和報童決策者的Stackelberg主從博弈模型。處于模型上層的信息設(shè)計者決定其信息策略組合,在貝葉斯更新機(jī)制下,以此策略組合改變報童決策者的需求信念;而下層的報童決策者則根據(jù)更新后的需求后驗分布制訂訂貨量決策,該決策反過來會影響信息設(shè)計者的效益??紤]到構(gòu)建的主從博弈模型在數(shù)學(xué)上是一個難以直接求解的雙層規(guī)劃問題,本文利用KKT(Karush-Kuhn-Tucker)條件將其轉(zhuǎn)化為易求解的單層線性混合整數(shù)規(guī)劃模型。本文不僅放寬了傳統(tǒng)報童模型需求分布給定的要求,還考慮了面向一組需求離散場景的信息設(shè)計。此外,本文研究了信息設(shè)計者通過組合策略的方式影響報童決策者,并考慮了不同策略可能具有的成本。

      1 模型建立

      1.1 問題描述

      本文研究由一個信息設(shè)計者L和一個報童決策者F組成的Stackelberg主從博弈問題。雙方共享關(guān)于市場需求分布的先驗。但是,處于信息優(yōu)勢的L可以在決策確定前,選擇發(fā)送某種信息組合來影響F的信念,得到對于需求分布的后驗,并由此影響F的報童決策結(jié)果。L要為發(fā)送信息組合付出相應(yīng)的成本,而F的報童決策結(jié)果反過來會影響L的效用。模型假設(shè)包括:(1) 雙方均為理性經(jīng)濟(jì)人;(2) 信念的更新遵循貝葉斯法則;(3) 不同信息對于F的信念的影響相互獨立;(4) F按照后驗分布做報童決策,而L收益由雙方的策略選擇共同決定。

      L有n條可供選擇的信息,且允許任意信息單獨發(fā)送或組合發(fā)送。設(shè)每條信息發(fā)送與否的狀態(tài)變量為a,當(dāng)a=1表示該條信息被發(fā)送,否則,a=0。設(shè)標(biāo)記n條信息全部發(fā)送狀態(tài)的集合空間為Z,Z={a1,a2, …,an},zj為其中第j組發(fā)送狀態(tài)集合,即第j種策略組合,zj={aj1,aj2, …,ajn},zj∈Z,j為信息狀態(tài)集合編號,j={1, …, 2n}。ct表示第t條信息的發(fā)送成本,t={1, …,n}。L的決策是選擇一個能使自己利益最大化的信息發(fā)送集合,因此,引入0或1變量xj,xj=1表示設(shè)計者選擇發(fā)送zj策略組合,xj=0表示不發(fā)送該策略組合。發(fā)送信息的成本約束記為W。

      具體博弈次序如下:首先,L和F共享市場隨機(jī)需求θi的先驗概率P(θi);其次,L根據(jù)真實狀態(tài),選擇發(fā)送給F的信息組合zj,并為此支付一定成本;最后,F(xiàn)依照貝葉斯法則更新對需求的后驗,并做出訂貨量決策y,雙方實現(xiàn)收益。

      1.2 模型建立

      根據(jù)上述變量,當(dāng)最終的市場需求為θ(θ∈Θ)時,報童決策者F的利潤函數(shù)為

      (1)

      考慮到市場需求θ不確定性,由上文對策略組合zj(zj∈Z)、策略發(fā)送狀態(tài)xj以及關(guān)于市場需求的后驗概率h(θi|zj)的定義,則F的期望利潤函數(shù)為

      UF=UF(x,y,θ)E(θ, x)[H(y)]=

      E(θ, x)[(q-d)y-(q-s)(y-θ)+]=

      (q-s)(y-θi)+]

      (2)

      L傳遞信息需要付出成本為

      (3)

      式中:cT={c1,c2, …,cn}T。因此,L的期望收益為

      (4)

      綜上,可得Stackelberg主從博弈模型:

      (5)

      (6)

      (7)

      xj∈{0, 1},j=1, 2, …, 2n

      (8)

      (9)

      (10)

      其中:式(5)代表L的效用最大化目標(biāo);式(6)代表信息發(fā)送預(yù)算約束;式(7)代表只能選擇一種策略方案;式(9)代表下層F的目標(biāo)是期望利潤最大化;式(8)和(10)限定了決策變量選取范圍。

      由于這一模型為雙層規(guī)劃,其在數(shù)學(xué)上難以直接求解[15],因此,需對模型進(jìn)行轉(zhuǎn)化。

      2 模型等價轉(zhuǎn)化與求解

      為簡化上文的Stackelberg主從博弈模型,引入輔助變量gi,其定義為gi=(y-θi)+。由式(2)可知,目標(biāo)函數(shù)式(9)可等價轉(zhuǎn)化為

      (11)

      s.t.gi≥y-θi,gi≥0,i=1, 2, …,m

      (12)

      故雙層規(guī)劃模型轉(zhuǎn)化為

      (13)

      式(6)~(8), (10), (12)

      在雙層規(guī)劃中,上層決策決定下層的解函數(shù)。由于整數(shù)變量的存在,這個解函數(shù)既不是線性的也不是可微的,求解非凸且不可微的雙層規(guī)劃問題是很難的,即便是最簡單的雙層線性規(guī)劃問題也是NP-hard(non-deterministic polynomial-hard)問題[15]。注意到本模型中,下層的報童決策被描述為一個形如式(11)和(12)的線性規(guī)劃。因此,可考慮利用KKT條件等價代替下層優(yōu)化問題,從而將雙層問題轉(zhuǎn)化為相對易求解的單層問題。為此,針對下層問題的目標(biāo)函數(shù)式(12)構(gòu)造相應(yīng)的拉格朗日函數(shù),引入拉格朗日乘子u、v、λi、ηi,有

      (14)

      對y和gi求一階偏導(dǎo),令導(dǎo)數(shù)為0,則有

      故原模型等價轉(zhuǎn)化為如下形式的單層規(guī)劃模型:

      (15)

      (16)

      λi(y-θi-gi)=0,i=1, 2, …,m

      (17)

      ηigi=0,i=1, 2, …,m

      (18)

      (19)

      (20)

      y,λi,ηi,u,v≥0,i=1, 2, …,m

      (21)

      式(6)~(8), (10), (12)

      通過引入一個充分大的常數(shù)M,以及ri、ki、t1、t2等輔助參數(shù),將上式中非線性互補條件變?yōu)榫€性約束,從而得到如下形式的混合整數(shù)線性規(guī)劃問題:

      (22)

      y-θi-gi≤M(1-ri),i=1, 2, …,m

      (23)

      ηi≤Mki,i=1, 2, …,m

      (24)

      gi≤M(1-ki),i=1, 2, …,m

      (25)

      u≤Mt1

      (26)

      (27)

      υ≤Mt2

      (28)

      (29)

      ri,ki,t1,t2∈{0, 1},i=1, 2, …,m

      (30)

      式(6)~(8), (10), (12), (15), (16), (21)

      在模型計算方面,求解器CPLEX已經(jīng)在諸多領(lǐng)域的混合整數(shù)線性規(guī)劃問題求解中得到了廣泛應(yīng)用[16-17]。因此,本文采用CPLEX計算轉(zhuǎn)化后模型。

      3 算例分析

      圖1 3種需求先驗Fig.1 Three kinds of prior information

      表1 給定貝葉斯條件概率

      基于以上數(shù)據(jù),通過CPLEX求解器計算可得3種先驗情況下的均衡解,如圖2所示。其中,允許考慮兩種信息發(fā)送成本c1和c2在[0, 15]離散變化。

      (a) 需求預(yù)期較差

      (b) 需求預(yù)期一般

      (c) 需求預(yù)期較好

      由圖2(a)可知,F(xiàn)需求先驗中對市場需求預(yù)期較差。當(dāng)信息發(fā)送成本c1和c2較大時,L選擇z1={0, 0}。此時,F(xiàn)的決策結(jié)果是基于需求先驗的報童決策結(jié)果(y=50;UF=104)。隨著c1和c2的減小,L會根據(jù)兩個信息發(fā)布成本變化,選擇單信息發(fā)布方式。發(fā)布信息修改了F對需求信息的后驗,導(dǎo)致其改變報童決策結(jié)果,做出更大的訂貨量y決策。當(dāng)信息發(fā)布成本足夠小時,L選擇組合策略z4={1, 1},此時,F(xiàn)的報童決策得到最大程度的修正。

      圖2(b)顯示F需求先驗對市場預(yù)期一般,此時L可通過信息設(shè)計將F的訂貨量y由60提升至80,但難有進(jìn)一步提升。圖2(c)顯示F需求先驗對市場預(yù)期較好,這與L試圖通過信息設(shè)計引導(dǎo)的結(jié)果是一致的。因此,L的最優(yōu)選擇是不進(jìn)行信息設(shè)計,除非信息設(shè)計的成本為0。

      觀察信息策略對報童決策者預(yù)期收益的影響,組合策略z4={1, 1}的優(yōu)化影響效果最佳,但成本也相對最高,只有在單位信息發(fā)送成本較低的情況下(圖2(a)、(c)),或者先驗與L偏差過大時(圖2(b)),才會使用該策略。在對F的期望收益UF的影響方面,單策略{0, 1}明顯強(qiáng)于{1, 0},這是由于在增加F對于較大需求的信念時,A2強(qiáng)于A1(見表1),因此在相同的成本下會優(yōu)先選擇發(fā)送A2。

      此外,進(jìn)一步觀察信息設(shè)計者L的收益UL隨信息發(fā)布成本的變化情況,如圖3所示。由圖3可知,UL隨信息發(fā)送成本c1、c2的增加呈現(xiàn)先減小后不變的狀態(tài)。這是因為信息發(fā)布的成本和F的報童決策共同支配著UL。具體來說:對于給定c1,隨著c2的增加,信息發(fā)布的成本增加,故UL隨之線性下降;當(dāng)c2增加至一定程度時,均衡解中的L信息策略變?yōu)閦2={1, 0},故隨后UL保持不變。

      (a) 需求預(yù)期較差

      (b)需求預(yù)期一般

      進(jìn)一步,觀察成本d的變化對結(jié)果的影響,如表2所示,其中售價q=10和殘值s=3不變。由表2可知,d的變化直接影響到邊際成本MC(MC=q-d)和邊際收益MP(MP=d-s)的大小。由報童模型基本原理可知,MP與MC比值變小會導(dǎo)致最優(yōu)訂貨量y*的下降。因此,要在不同的信息設(shè)計方式和成本下,通過對d的靈敏度分析,觀察并分析所得結(jié)論。

      此處,信息發(fā)送成本{c1,c2}分別選取[{0, 0}, {2, 2}, {4, 4}, {6, 6}, {8, 8} {10, 10}],在圖1所示3種需求先驗中選擇極端的2種,即需求預(yù)期較差和較好的先驗下展開仿真,計算所得的均衡結(jié)果如圖4所示。

      表2 隨d變化的邊際收益(MP)與邊際成本(MC)

      (a) 需求預(yù)期較差

      (b)需求預(yù)期較好

      圖4 不同需求預(yù)期下考慮不同d的最優(yōu)訂貨量Fig.4 Optimal order quantity under different d and different demand expectation

      由圖4可知,訂貨量y隨著定價d和{c1,c2}的增加而減少。比較d對y的影響,當(dāng)d≥7時,L會更多選擇信息策略z4={1, 1}。這是由于MP小于MC時,組合策略能夠帶來更好的優(yōu)化效果,特別是在發(fā)送成本也相對較低時。相反,當(dāng)MP/MC大于1時,訂貨量y已然處在較高的水平,信息設(shè)計所能帶來的改善有限,因此,發(fā)送單一策略或不發(fā)送信息的情況出現(xiàn)更多。比較不同需求預(yù)期對信息策略的選擇可發(fā)現(xiàn):在相同的{c1,c2}水平下,需求預(yù)期較差時L采用策略{1, 1}的情況(圖4(a))多于需求預(yù)期較好時(圖4(b))。這是由于需求預(yù)期較差時,y可優(yōu)化的空間更大,信息設(shè)計優(yōu)化效果更明顯。

      圖5給出了報童決策者的期望收益。由圖5可知,F(xiàn)的期望利潤UF與定價d變化呈負(fù)相關(guān),這是由報童模型性質(zhì)決定的。在相同的需求預(yù)期和d的前提下,由于組合策略{1, 1}比單一策略{1, 0}或{0, 1}對于UF的優(yōu)化效果更好,故在較低成本時,L優(yōu)先選擇{1, 1},隨著{c1,c2}的提高,L退而選擇單一策略以降低成本,UF隨之降低,直至L選擇策略{0, 0},UF下降到最低。

      (a) 需求預(yù)期較差

      (b)需求預(yù)期較好

      圖5 不同需求預(yù)期下考慮不同d的報童決策者期望收益Fig.5 Expected return of newsvendor decision maker under different d and different demand expectation

      信息設(shè)計收益UL與信息發(fā)送成本{c1,c2}、定價d和策略選擇zj之間的關(guān)系如圖6所示。由圖6可知,隨著d的遞增,UL遞減。d的遞增會導(dǎo)致邊際成本MP與邊際收益MC的比值逐漸變小,結(jié)合報童原理,形成y的減少,UL也會相應(yīng)減少。此外,隨著{c1,c2}的增加,成本過大將導(dǎo)致設(shè)計者不再發(fā)送信息,UL先遞減后不變。此時,UL完全由y決定。未來需求預(yù)期較好時的UL普遍比預(yù)期較差時的UL高,這是由報童模型機(jī)理所造成的。

      (a) 需求預(yù)期較差

      (b)需求預(yù)期較好

      圖6 不同需求預(yù)期下考慮不同d的信息設(shè)計者收益Fig.6 Information designer profit under different d and different demand expectation

      以上結(jié)果表明:(1) 當(dāng)信息設(shè)計者與報童決策者對于需求的先驗存在明顯偏差時,利用信息設(shè)計的方式能夠有效引導(dǎo)報童決策者的決策,使之有利于信息設(shè)計者;(2) 報童決策者的邊際收益和邊際成本關(guān)系會影響信息設(shè)計的選擇,當(dāng)邊際收益小于邊際成本時,信息設(shè)計可通過改變其需求信念而發(fā)揮作用;(3)信息發(fā)送成本的存在會弱化信息設(shè)計的效果,減弱信息設(shè)計的動力。為杜絕擁有信息優(yōu)勢的企業(yè)傳遞不實信息,市場監(jiān)管者可以通過影響成本,加大其信息設(shè)計代價,以實現(xiàn)市場的健康發(fā)展。

      4 總結(jié)與展望

      本文放寬了傳統(tǒng)報童模型需求分布給定的假設(shè),研究了面向報童決策者的組合信息設(shè)計問題,構(gòu)建了描述這一問題的主從博弈模型:主問題為信息設(shè)計者的策略選擇,從問題為報童決策。將這一雙層規(guī)劃問題轉(zhuǎn)化為單層的混合整數(shù)規(guī)劃。仿真表明:信息設(shè)計模型是否能有效改善報童決策解,取決于信息發(fā)送的成本和報童決策者自身先驗的性質(zhì)。當(dāng)報童決策者先驗具有較高期望時,信息設(shè)計模型優(yōu)化效果不顯著;當(dāng)先驗期望一般或較差時,信息設(shè)計模型優(yōu)化效果取決于信息發(fā)送成本的多少,成本越低,優(yōu)化效果越高;當(dāng)信息發(fā)送成本過大時,信息設(shè)計模型不發(fā)生作用。仿真結(jié)果揭示了如下啟示:具有信息優(yōu)勢的企業(yè)可以就市場預(yù)期情況決定是否發(fā)送信息以及發(fā)送何種信息,以給自己帶來更多收益;市場監(jiān)管者可以通過對信息發(fā)送成本的影響,限制虛假信息的傳播,穩(wěn)定市場預(yù)期,引導(dǎo)其健康發(fā)展。

      考慮到信息設(shè)計理論中的貝葉斯理性約束可以保證先驗與后驗均值的一致性,因此將其考慮在本文模型中是未來研究的方向之一。為求解的便利,本文考慮了離散的需求場景,將離散需求值連續(xù)化并展開對解析模型和結(jié)果研究是未來另一個重要的研究方向,將研究結(jié)果應(yīng)用于具體場景也是未來需要關(guān)注的問題。

      猜你喜歡
      報童決策者先驗
      一顆富有的心
      熱浪滾滾:新興市場決策者竭力應(yīng)對通脹升溫 精讀
      英語文摘(2021年12期)2021-12-31 03:26:20
      基于無噪圖像塊先驗的MRI低秩分解去噪算法研究
      “最關(guān)鍵”的施工力量——決策者、執(zhí)行者與實施者
      基于預(yù)期的報童問題研究
      基于自適應(yīng)塊組割先驗的噪聲圖像超分辨率重建
      我當(dāng)報童啦
      基于平滑先驗法的被動聲信號趨勢項消除
      先驗的廢話與功能的進(jìn)路
      決策者聲望尋求行為、團(tuán)隊努力與團(tuán)隊績效
      軟科學(xué)(2014年8期)2015-01-20 15:36:56
      嘉义县| 油尖旺区| 福海县| 汉沽区| 庄浪县| 共和县| 辰溪县| 平陆县| 新源县| 清新县| 蒙城县| 出国| 酉阳| 甘南县| 饶阳县| 东海县| 溧阳市| 增城市| 元江| 沙坪坝区| 朝阳市| 民和| 遂平县| 盐池县| 建瓯市| 克东县| 葵青区| 巨鹿县| 康乐县| 卢龙县| 镇宁| 巨野县| 精河县| 慈溪市| 屯门区| 天津市| 伽师县| 宾川县| 北流市| 会理县| 楚雄市|