王運志,胡耀光,張瑞君
(1. 北京理工大學 機械與車輛工程學院,北京 100081;2. 中國人民大學 商學院,北京100872)
基于博弈方法的產(chǎn)品組合資源配置決策研究
王運志1,胡耀光1,張瑞君2
(1. 北京理工大學 機械與車輛工程學院,北京 100081;2. 中國人民大學 商學院,北京100872)
在制造業(yè)全球化、集群化和信息化的發(fā)展趨勢下,制造企業(yè)信息化應用已從運營支持層轉(zhuǎn)而向管理和決策層的方向發(fā)展,我國制造業(yè)在全球市場競爭中也面臨著在快速變化的商務環(huán)境中合理配置企業(yè)資源、實現(xiàn)價值增值的敏捷反應與科學決策的需求。當前制造企業(yè)經(jīng)常需要面臨的制造決策問題是在產(chǎn)品制造過程中,通常需要在有限的資金、設備等資源條件下,使獲得的資源能夠得到最大限度利用以滿足制造要求,實現(xiàn)最優(yōu)的生產(chǎn)狀態(tài)。
產(chǎn)品組合生產(chǎn)中的制造資源優(yōu)化配置問題即是當企業(yè)在在不確定的技術(shù)、原材料和市場需求約束下進行多種產(chǎn)品制造時,需要選擇最優(yōu)的產(chǎn)品生產(chǎn)組合,使每一產(chǎn)品的生產(chǎn)都能達到最理想的資源配置。在傳統(tǒng)最優(yōu)化理論、遺傳算法等研究中通常以企業(yè)整體收益、運營指標、設備利用率、市場需求滿意度等作為優(yōu)化的目標。但在現(xiàn)代制造企業(yè)中,產(chǎn)品不僅需要滿足企業(yè)短期盈利的目標,在企業(yè)決策者對某種產(chǎn)品沒有偏好的情況下,決策應保證各產(chǎn)品在資源競爭中都能夠獲得最優(yōu)的資源配置和最大的收益,從企業(yè)的戰(zhàn)略決策角度更能滿足企業(yè)長期發(fā)展的需要。近來有很多研究采用新的方法來更好地解決產(chǎn)品組合資源配置決策問題,例如進化方法[1]和約束理論方法[2]等。本文采用完全信息下的靜態(tài)博弈的方法,建立多維決策模型,將產(chǎn)品作為資源競爭的主體,以每一產(chǎn)品都選擇最優(yōu)的資源配置,最大化本產(chǎn)品的收益為目標,選擇在給定的約束條件下資源分配的均衡解,達到每一產(chǎn)品的最優(yōu)生產(chǎn)狀態(tài)。
任何產(chǎn)品的生產(chǎn)行為都是在特定的生產(chǎn)條件(如技術(shù)、資源等)下進行的,這種特定的生產(chǎn)技術(shù)關(guān)系決定了一個生產(chǎn)過程的投入和產(chǎn)出的數(shù)量上的對應關(guān)系,描述這種對應關(guān)系的工具就是生產(chǎn)函數(shù)[3]。
生產(chǎn)函數(shù)是一種經(jīng)驗研究方法,是以數(shù)據(jù)為樣本,通過數(shù)學方法的擬合、檢驗和修正得到的。在決策研究中,可以采用生產(chǎn)函數(shù)作為決策效用函數(shù),以益損值為橫坐標,以效用值為縱坐標來表示兩者關(guān)系。同時,決策的預見性要求效用曲線能夠反映決策者的偏好和對風險態(tài)度,因此需要根據(jù)決策者對相同的益損問題(獲取收益或避免損失)的反應對生產(chǎn)函數(shù)進行修正,把決策戰(zhàn)略者對風險態(tài)度的變化在此坐標系中描點而擬合成一條曲線。效用曲線有保守型、激進型、中間型和混合型等類型,可以采用指數(shù)擬合、Cobb-Douglas生產(chǎn)函數(shù)或前沿生產(chǎn)函數(shù)等。
在組合產(chǎn)品生產(chǎn)函數(shù)的構(gòu)建過程中,首先要識別決策問題中的變量和這些變量與目標函數(shù)之間的定量關(guān)系。通常情況下,制造過程變量包括:資源變量、技術(shù)參數(shù)和決策要素等;變量關(guān)系主要分析決策變量與生產(chǎn)績效變量的可控制變量之間的關(guān)系。例如,Norden提出一套制造決策定量化分析的方法,將決策分析過程分為4類基本事件:計數(shù)、分類、連接和比較,然后通過測量、連接、比較、建模的過程建立一個可以描述問題的目標、約束和其他關(guān)系的模型[4]。
利用企業(yè)已有的制造信息化系統(tǒng),如ERP系統(tǒng)等,可以表述產(chǎn)品的費用-收益函數(shù)如下:
其中:物料成本:ΣC*Cq (C 為物料的標準價,Cq為該物料的定額用量)
資源消耗費用:ΣRr*Rq(Rr為資源標準費率,Rq為資源標準用量)
資源管理費用(制造費用):ROr (Ror為資源管理費用)
物料的管理費用:MOr (MOr 為采購件的管理費用)
外協(xié)費用:ΣRPr
對擬合后的產(chǎn)品收入(效用)和產(chǎn)品成本(資源投入)關(guān)系曲線,在預測的最大銷售量 和最小可行產(chǎn)量的決策空間范圍內(nèi),選擇合理區(qū)間離散處理后,作為一個有限博弈的策略空間和支付。
博弈論研究存在外部經(jīng)濟條件下的個人選擇問題,在應用博弈論方法進行混合產(chǎn)品選擇問題的研究中,產(chǎn)品本身作為資源競爭的決策主體,參與人主動選擇行動(或戰(zhàn)略)以最大化產(chǎn)品的效用,即產(chǎn)品的收益水平。博弈論的基本概念包括參與人、行動、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡。
假設博弈G有N個博弈方,第n個博弈方的可行戰(zhàn)略集為Kn(n =1,2,...,N)。記博弈方n 的戰(zhàn)略為kn∈Kn,則博弈G的支付向量u=(u1,u2,...,uN)T可以定義為笛卡兒乘積空間K=K1×K2×...×KN到N維實數(shù)空間RN上的映射,即u:K→RN,從而博弈方n 在戰(zhàn)略組合為k =(k1,k2,...,kn-1,kn,kn+1,...,kN) 時的支付為:
式中:[ . ]n表示支付向量的第n個分量。
在傳統(tǒng)(classic)的博弈描述方式中,博弈的戰(zhàn)略式表述在參與人較多時難以表示,而擴展式表述不適合用于計算。從表示形式上,博弈G的的支付向量u即為一個N維實數(shù)集合,因此可以采用多維數(shù)據(jù)庫來表示一個博弈結(jié)構(gòu)。
在博弈的多維結(jié)構(gòu)描述中,參與人、戰(zhàn)略和支付是描述一個博弈所需要的必須要素,因此一個博弈多維模型的基本維度可定義為:
其中:
1)N個參與人的策略空間維度:每個參與人作為一個維度,維度成員為該參與人的策略空間;
2)參與人維度:博弈的參與人集合作為一個維度,維度成員為每個參與人;
3)支付維度:表示參與人的效用水平,維度成員可以對應決策者在不同的偏好和對風險態(tài)度下的效用表示;
4)結(jié)果維度:博弈模型的求解結(jié)果,維度成員可以是不同種類型的博弈結(jié)果。
另外,在該模型上擴展其他博弈要素可以解決類型,例如增加行動要素維度,可以通過決策中的行動順序來解決動態(tài)決策問題;增加信息集要素維度,可以支持不完全信息決策問題的描述。
在應用多維博弈模型解決混合產(chǎn)品資源配置問題時,將每一競爭資源的產(chǎn)品作為博弈參與人,可選的資源投入作為每一產(chǎn)品的戰(zhàn)略空間,產(chǎn)品效用函數(shù)作為支付維度。在多維數(shù)據(jù)庫系統(tǒng),例如ESSBASE中建立博弈模型后,可利用多維數(shù)據(jù)庫的數(shù)據(jù)挖掘、搜索等技術(shù)對模型進行求解。
應用博弈論進行決策的核心問題是求解博弈模型,即尋找博弈的均衡。本文在基于多維數(shù)據(jù)模型描述的博弈決策問題基礎(chǔ)上,提出均衡結(jié)果的求解方法。
博弈的純策略納什均衡解,可以根據(jù)Nash均衡的存在性定理Ⅱ判定解的存在性:
在n人戰(zhàn)略式博弈中,如果每個參與人的純戰(zhàn)略空間Si是歐氏空間上一個非空的、閉的、有界的凸集,支付函數(shù)ui(s)是連續(xù)的且對si是擬凹的,那么這一對策中存在純策略納什均衡。
但是Debreu 等給出的純策略納什均衡存在性定理是在十分嚴格的條件下的充分性定理,對于制造資源的配置決策問題,參與人的支付函數(shù)可能是有限策略組合的離散點集,而且不是連續(xù)且擬凹的。唐小我等給出有限戰(zhàn)略博弈純戰(zhàn)略納什均衡解的搜索算法[5]:
定義函數(shù)fn為博弈方n采用戰(zhàn)略kn時的支付最大化判別函數(shù),即給定其他博弈方的戰(zhàn)略k-1= (k1,k2,...,kn-1,kn+1,...,kN),如果kn∈arg max{Un},則 fn=1 ,否則 fn=0。
戰(zhàn)略組合k=(k1,k2,...,kN)∈K是純戰(zhàn)略納什均衡的充分必要條件為F(k)=N,因此F(k)= N可以用來判斷一個博弈的純戰(zhàn)略納什均衡。如果知道博弈的支付組合,則可以通過博弈方支付最大化函數(shù)對可能成為納什均衡的戰(zhàn)略組合作標記,然后,檢查支付組合的標記次數(shù)是否等于參與博弈的博弈方的個數(shù)來判斷相應的戰(zhàn)略組合是否是一個納什均衡。
在基于ESSBASE構(gòu)造的多維數(shù)據(jù)庫模型中,使用該方法求解純戰(zhàn)略納什均衡的算法腳本可以表示為:
最后,通過對每一戰(zhàn)略組合在參與人維度上判斷所有參與人的標記次數(shù)F(k)=N,即可判定戰(zhàn)略組合是否為純戰(zhàn)略納什均衡。
假定某企業(yè)生產(chǎn)A、B、C3種產(chǎn)品,雖然產(chǎn)品的生產(chǎn)規(guī)模和收益不同,但每一種產(chǎn)品對企業(yè)都非常重要。企業(yè)決策者選擇將一部分資金分配到3中產(chǎn)品中,使每一種產(chǎn)品都盡可能得到達到最大收益所需的資金,并使企業(yè)有盡可能高的投資收益。
首先,分析企業(yè)現(xiàn)有制造信息系統(tǒng)中的制造數(shù)據(jù),得到該三種產(chǎn)品在過去8個月中的生產(chǎn)成本與收益如表1所示。
表1 過去8個月中的產(chǎn)品的費用-收益 (單位:百萬元)
并考慮未來市場需求和企業(yè)規(guī)模等因素,預計未來的資金投入量范圍如表2所示。
表2 計劃投入資金 (單位:百萬元)
然后,對每一產(chǎn)品的生產(chǎn)函數(shù)采用多項式擬合后,并考慮決策者的風險偏好等因素,修正后的產(chǎn)品效用曲線如圖1所示。
圖1 產(chǎn)品效用曲線
根據(jù)上述產(chǎn)品收益-成本關(guān)系曲線,在預測的每一產(chǎn)品最大和最小資源投入范圍內(nèi),選擇以1 個單位(百萬元)為區(qū)間做離散處理后,3個產(chǎn)品的資源配置戰(zhàn)略集合和支付如表3所示。
表3 產(chǎn)品戰(zhàn)略和支付(單位:百萬元)
建立多維博弈模型,并求解模型的均衡解。分析當企業(yè)最大投入資金分別為380和350時,博弈模型的均衡解及整體投資收益比率如表4所示。
表4 多維博弈模型的均衡解 (單位:百萬元)
根據(jù)以上計算結(jié)果,當企業(yè)最大投資為380時,三種均衡解都是戰(zhàn)略組合(105, 232, 35),是最優(yōu)資源配置決策;當企業(yè)最大投資為350時,不存在占優(yōu)戰(zhàn)略均衡和重復剔除的占優(yōu)戰(zhàn)略,存在多個純策略納什均衡,結(jié)合將整體投資收益比率作為資源配置效率指標,戰(zhàn)略組合(105,211,34)是最優(yōu)資源配置決策。
本文研究了使用非合作博弈理論進行產(chǎn)品組合資源配置決策研究的方法,將制造資源效用和戰(zhàn)略組合進行定量化描述,作為博弈分析的要素來構(gòu)建多維博弈模型。相比于其他以資源配置整體收益為優(yōu)化目標的算法,本文采用求解博弈模型的均衡解作為決策結(jié)果,避免了忽視單一產(chǎn)品收益的缺陷。應用示例說明了本算法的實用性。由于純戰(zhàn)略納什均衡解的不唯一性,本研究方法還需要進一步研究戰(zhàn)略的混合納什均衡解和非確定環(huán)境下的決策問題求解。
[1]Ioannis G.Tsoulos,Pandian Vasant,“Product mix selection using an evolutionary technique,”Power Control and Optimization,2009:240-247..
[2]RAINER SOUREN, HEINZ AHN and CHRISTIAN SCHMITZ,“Optimal product mix decisions based on the Theory of Constraints”,International Journal of Production Research,2005,43(2):361-374..
[3]孫巍.生產(chǎn)資源配置效率-生產(chǎn)前沿面理論及其應用[M].社會科學文獻出版社,北京:2000:83-93.
[4]Norden, P.V.,“Quantitative techniques in strategic alignment,”IBM Systems Journal,1993,32:180-197.
[5]唐小我,倪得兵.有限戰(zhàn)略式博弈純戰(zhàn)略均衡求解的新算法[J].管理工程學報,2006,20(2):137-140.
A game theoretic approach to product-mix resource allocation
WANG Yun-zhi1, HU Yao-guang1, ZHANG Rui-jun2
本文針對有限資源下的產(chǎn)品組合資源配置決策問題,提出了基于博弈理論的解決方法。應用定量化分析方法來表示制造資源效用和配置戰(zhàn)略,將產(chǎn)品作為資源競爭的主體,使用定量化的決策要素作為維度來構(gòu)造一個多維博弈模型,求解博弈模型得到資源配置決策的最優(yōu)解。
產(chǎn)品組合資源配置;多維博弈模型;定量化決策
王運志(1974 -),男,遼寧大連人,博士,研究方向為制造資源配置、商務智能。
TP274
A
1009-0134(2011)4(上)-0072-04
10.3969/j.issn.1009-0134.2011.4(上).23
2010-10-29
國防科技基礎(chǔ)研究基金項目(C172009C001)