武雯娟
摘要:將粗集-遺傳支持向量機模型運用到供應鏈績效評價中,首先利用粗集理論剔除影響供應鏈績效評價的冗余因素,獲得核心影響因素,再采用支持向量機對于提取得到的核心影響因素預測供應鏈績效所處的級別。在支持向量機分類過程中,利用遺傳算法對支持向量機算法的參數(shù)進行尋優(yōu),獲得最佳參數(shù)模型,而后預測得到供應鏈績效評價級別。最后,實例運用此模型進行了預測,并與只運用粗集-支持向量機進行預測的結(jié)果進行對比。結(jié)果表明,利用粗集-遺傳支持向量機方法對供應鏈績效評價級別的預測準確率更高,預測結(jié)果更符合實際,是一種科學可行的方法。
關(guān)鍵詞:供應鏈;績效評價;粗集理論;支持向量機;遺傳算法
中圖分類號:TP18 文獻標識碼:A 文章編號:0439-8114(2015)03-0733-05
DOI:10.14088/j.cnki.issn0439-8114.2015.03.059
Application of Rough Set GA-SVM Model in the Supply Chain Performance Evaluation
WU Wen-juan
(Department of Finance and Economics, Taian Vocational and Technical College, Taian 271000, Shandong, China)
Abstract: Rough set-genetic support vector machine(SVM) model was used for the performance evaluation of supply chain. Firstly, this paper used rough set theory to eliminate the redundant factors influencing the performance evaluation of supply chain, and got the core factors. Support vector machine(SVM) was then used to extract the core level of influing factors to predict the performance of the supply chain. In the process of support vector machine (SVM) classification, the genetic algorithm was used for the parameters optimization of support vector machine(SVM) algorithm. Optimal parameters of the model were obtained and then used to predict the level of supply chain performance evaluation. Finally, instances were forecasted by this model, and compared with the predic results by the only use of rough sets and support vector machine(SVM). The results showed that the use of rough set-genetic support vector machine(SVM) method can predict higher accuracy level of the supply chain performance evaluation, and the predicted results are more realistic, thus being a scientific and feasible method.
Key words: supply chain; performance evaluation; rough set theory; SVM; GA
隨著經(jīng)濟全球化,企業(yè)的經(jīng)營環(huán)境發(fā)生了巨大的變化。越來越多的企業(yè)管理者已經(jīng)意識到,未來的企業(yè)競爭將是供應鏈(Supply Chain,簡稱SC)與供應鏈之間的競爭,而不是企業(yè)之間的競爭。企業(yè)為了在市場競爭中始終處于有利地位,獲得長期競爭優(yōu)勢及利益,就必須建立高效、安全、可靠的供應鏈系統(tǒng),供應鏈系統(tǒng)可以各種輔助手段實現(xiàn)其一體化過程。
所謂供應鏈是指將產(chǎn)品和服務提供給最終消費者的所有環(huán)節(jié)的企業(yè)所構(gòu)成的上下游產(chǎn)業(yè)一體化的體系。供應鏈管理是從系統(tǒng)的觀點出發(fā),通過對采購、制造、分銷直至消費者的整個過程中的資金流、物流、信息流的協(xié)調(diào),通過此種管理模式來滿足消費者的要求及需求。然而只有對供應鏈系統(tǒng)中的各成員供應鏈績效評價理論及其重要性的認識統(tǒng)一,才能讓他們將對整個供應鏈系統(tǒng)的貢獻度作為自己的考核目標,并將這些具體指標達成情況作為利益分配及任務分配的依據(jù),如此才能使供應鏈的整體績效切實得到提高。目前,將粗集-遺傳支持向量機(GA-SVM)方法應用到供應鏈績效評價領域的研究并不多見,本研究主要利用粗糙集理論剔除供應鏈績效評價的冗余因素及指標,提取獲得影響供應鏈績效評價的核心因素,再運用對于小樣本具有良好泛化能力的支持向量機來進行評價,支持向量機的評價過程中通過遺傳算法來進行相關(guān)參數(shù)尋優(yōu)操作[1,2]。
1 粗集理論
波蘭學者Pawlak于1982年提出了粗糙集(RoughSet)理論,粗糙集理論就是在無需提供問題需要處理數(shù)據(jù)之外的任何其他先知信息,而是僅根據(jù)已知的數(shù)據(jù)剔除冗余信息,獲得本質(zhì)信息,分析得到知識的不完整程度,生成決策或分類的相關(guān)規(guī)則及準則,實現(xiàn)通過分類準則或規(guī)則對已知數(shù)據(jù)進行精簡或約減,對于處理未確知和模糊數(shù)據(jù)具有良好的效果[3-5]。
1.1 信息系統(tǒng)
一個信息系統(tǒng)S通過下式表示:S=(U,A,V,f),其中U為論域,(U={x1,x2,……,xn})由有限個研究對象組成;A=C∪D為屬性集,其中C是條件屬性集,D是決策屬性集;V是值域;f是映射,對?坌a∈A,x∈U,實現(xiàn)關(guān)于屬性a的值。
1.2 不可區(qū)分關(guān)系
粗糙集理論將知識和分類緊密聯(lián)系起來,知識是對客觀數(shù)據(jù)進行分類的能力,分類就是將差別的數(shù)據(jù)對象分析成為一類,它們之間的關(guān)系稱之為不可分辨關(guān)系或等價關(guān)系,其中知識庫可以用K=(U,R)表示,其中U是非空有限集,稱之為論域,R是U上的一族等價關(guān)系。UΠR為R的所有等價類族。[X]R表示包含元素x∈U的R的等價類。若yyP?哿R且P≠?椎,則P中全部等價關(guān)系的交集也是一種等價關(guān)系,稱為P上的不可區(qū)分關(guān)系,記為ind(p),[x]ind[]x=u■[x]R,P?哿R。
1.3 屬性約簡與核
定義1:假設S=(U,R)為信息系統(tǒng),R是U上的等價關(guān)系族,x∈R,若U/IND(R)=U/IND(R-r),則稱是R中可以被約簡掉的知識,否則不可被約簡掉。
定義2:對于任意r∈P(P?哿R),若其中的P都是不可被約簡的,則其等價關(guān)系族P是獨立的,否則認為P是相關(guān)的。
定義3:假定S=(U,R)為信息系統(tǒng),如果子族PR滿足下列條件:IND(P)=IND(R),而且P是獨立的,則稱P是R的一個約簡。
如果P是R的約簡,則P必須滿足以下條件:①P獨立;②P與R有相同的分類能力,即IND(P)=IND(R)。
定義4:假定S=(U,R)為信息系統(tǒng),如果其中R不可約去的屬性,則稱做R是核屬性,所有核屬性構(gòu)成的集合稱為核集,記作Core(R),稱Core(R)為R的核。
1.4 粗集的上、下近似及邊界
定義1:給定知識庫K=(U,R),X?哿U,稱y■(X)={x|[x]R?哿X,?坌x∈U}為集合X的下近似,也稱■(X)是X的R正域,記做POSR(X);顯然,X的R正域POSR(X)是由U中完全屬于X的元素構(gòu)成的集合?!觯╔)是一個確定性集合,它是由完全包含在X中的那些R的等價類(中的元素)構(gòu)成的集合。即X的R正域 POSR(X)中的元素可被正確分類。
定義2:稱BNR(X)=■(X)-■(X)為X的R邊界域,稱NEGR(X)=U-■(X)為X的負域。顯見,負域中的元素由不能確定是否屬于X的元素組成。
1.5 決策表的簡化
對于決策表的條件屬性進行化簡,也就是對決策表的簡化,簡化的決策表具有與之前的決策表相同的決策等功能,不影響其核心功能的體現(xiàn),只不過是簡化后的決策表具有更少的條件屬性,這樣會提高決策和評價效率。因此,決策表的簡化在實際應用領域中占有相當分量。換言之,在更少的條件下,獲得同樣的決策,使得利用一些相對之前更為簡單的手段或條件就可以獲得同樣的決策或結(jié)果。決策表的簡化步驟如下:(1)對決策表的條件屬性進行約簡,獲得核心因素,也就是消去決策表中的某些列;(2)約簡掉決策表中重復的某些行消去重復的行;(3)約簡掉屬性的冗余值。
本研究主要通過以上3個步驟對決策表進行屬性約簡,以期得到影響供應鏈績效評價的主要因素或指標,約簡掉冗余因素或指標,為下一步的供應鏈支持向量機評價奠定一個良好的基礎。
2 遺傳-支持向量機回歸模型
2.1 支持向量機基本原理
SVM是基于結(jié)構(gòu)風險最小化原則的方法,由于其是一個凸二次優(yōu)化問題,從而保證能找到一個全局最優(yōu)解,而且其能夠較好地解決小樣本、非線性、高維數(shù)等實際問題,問題的復雜程度不再簡單地取決于維數(shù)高低,并且具有良好的泛化能力[6-8]。對于其凸二次優(yōu)化問題,可以應用標準的拉格朗日乘子法進行優(yōu)化求解。
假設訓練樣本為{(x1,y1),……(xi,yi)},其中(xi∈Rm)是第i個學習樣本的輸入值,且為m維列向量,yi∈R為對應的目標值。可以建立如下形式的回歸函數(shù):
(y)i=fi(t)={wi,?漬i(t)}+bi (1)
式(1)中,{}表示內(nèi)積運算,wi描述了函數(shù)fi(t)的復雜度,bi為常數(shù)??紤]到函數(shù)的復雜度和擬合誤差,函數(shù)擬合問題等價于滿足如下約束條件時
xi-{wi,?漬i(tl)}-bi=(?孜i)l (l=1,2,……,j) (2)
最小化代價泛函
Ri=■{wi,wi}+■C■[(?孜i)l]2 (3)
式(3)中,C為懲罰因子,?孜i為松弛變量。對于這個尋優(yōu)問題,可以建立以下函數(shù)
Li(wi,bi,?孜i,αi)=■{wi,wi}+■C■[(?孜i)l]2+■(αi)l[{wi,?漬i(tl)}+bi+(?孜i)l-(xi)l] (4)
式(4)中,(αi)l為Lagrange乘子。考察式(2)所給函數(shù)極值存在條件,可以獲得求解所有參數(shù)的一個方程組,并最終得到回歸函數(shù)(1)的表達式為
fi(t)=■(αi)lKi(t,tl)+bi (5)
式(5)中,Ki(t,tl)為滿足Mercer條件的支持向量機核函數(shù)。廣泛應用一種核函數(shù)為徑向基核函數(shù)
Ki(t,tl)=exp[-■] (6)
式(6)中,?滓i為xi的標準偏差。
當每個訓練數(shù)據(jù)所對應的回歸函數(shù)fi(t)均被確定后,可以得到回歸函數(shù)為
Yt=■fi(t)=■[■(αi)lKi(t,tl)+bi] (7)
支持向量機回歸模型中具有多個參數(shù),易陷入局部最優(yōu),因此本研究利用具有全局尋優(yōu)能力的遺傳算法對其參數(shù)進行尋優(yōu)。
2.2 遺傳算法基本原理
遺傳算法和傳統(tǒng)搜索算法不同,它首先隨機產(chǎn)生一組初始解,即“種群(Population)”,種群中的每一個個體,即問題的一個解向量,稱為“染色體(Chromosome)”,開始搜索過程。這些染色體在后續(xù)迭代中不斷進化,生成的下一代染色體稱為“后代(Offspring)”。每一代中染色體的好壞可通過染色體的適應值(Fitness)來評價:適應值大的染色體被選擇的幾率高,相反,適應值小的染色體被選擇的可能性小,被選擇的染色體通過交叉(Crossover)和變異(Mutation)產(chǎn)生新的染色體,即后代;經(jīng)過若干代之后,算法收斂于最好的染色體,該染色體很可能就是問題的最優(yōu)解或近似最優(yōu)解。遺傳算法的運行步驟如下[9-15]:(1)隨機產(chǎn)生初始種群popk;(2)以適應度函數(shù)對染色體進行評價;(3)按適應值高低選擇染色體形成新種群newpopk;(4)通過交叉、變異操作產(chǎn)生新的染色體即后代offspring;(5)不斷重復步驟(2)-(4),直到獲得預定進化代數(shù)。
其迭代流程見圖1所示。由上述步驟可看出,遺傳算法主要由遺傳運算(交叉和變異)和進化運算(選擇)組成。
交叉運算是最主要的遺傳運算,遺傳算法的性能在很大程度上取決于所采用的交叉運算的性能。交叉運算同時對兩個染色體操作,組合兩者的特性產(chǎn)生新的后代。變異則是一種基本運算,它在染色體上自發(fā)產(chǎn)生隨機變化。變異可以提供初始種群中不含有的基因,或找回選擇過程中丟失的基因,為種群提供新的內(nèi)容。
3 實證分析
設計任何評價指標體系都應遵循一些基本原則,因此,本研究結(jié)合供應鏈績效評價的概念,根據(jù)目的性原則、科學性原則、系統(tǒng)性原則、經(jīng)濟性原則、定量與定性相結(jié)合的原則和通用性與發(fā)展性相結(jié)合原則這六個原則初步確定一個比較廣泛的供應鏈績效評價指標體系(表1)。同時,對評價指標代號及指標類型進行了標定。其中,極大型指標是指標值越大越好的指標,又稱正向指標;極小型指標是指標值越小越好的指標,又稱逆向指標。本研究應用這一指標體系對河北、山東、天津等地區(qū)的14條供應鏈進行調(diào)研,調(diào)查的實際數(shù)據(jù)請相關(guān)專家進行評分,其評分結(jié)果將作為支持向量機評價結(jié)果進行訓練和檢驗,同時也作為和只運用支持向量機所得出的訓練結(jié)果進行比較(表2)[1,2]。
3.1 粗集屬性約簡
把實測數(shù)據(jù)輸入,把這些指標作為條件屬性。對于供應鏈績效評價結(jié)果根據(jù)所處情況分為五類(很好,較好、一般、不好、很不好),作為決策屬性記為D{1,2,3,4,5},
對決策表進行屬性約簡,根據(jù)粗集理論可以求出哪些是核心屬性,哪些是冗余屬性,由于屬性約簡算法比較復雜,采用VB6.0編程進行屬性約簡。屬性約簡后的指標體系見表2。此指標體系由于約簡了冗余屬性,提取了核心屬性,為下一步利用支持向量機進行回歸識別提供了比較好的基礎。
把通過實際調(diào)研的數(shù)據(jù)輸入約簡后的決策表(表3)。
3.2 遺傳-支持向量機回歸模型的學習
支持向量機學習算法如下:
1)獲取學習樣本(xi,yi),i=1,2,……l,其中xi∈Rm,yi∈{1,-1}l對樣本進行預處理。
2)選擇進行非線性變換的核函數(shù)及對錯分(誤差)進行懲罰的懲罰因子C。
3)形成二次優(yōu)化問題用優(yōu)化方法。對于此優(yōu)化問題中參數(shù)尋優(yōu),通過遺傳算法獲得,具體步驟如下:①確定遺傳算法編碼方式。采用十進制整數(shù)編碼的遺傳算法的群體中模式的數(shù)目,低階并且適應度值在群體平均適應度值以上的模式在遺傳算法迭代過程中將按指數(shù)增長率被采樣。②生成初始種群。初始染色體的多少對遺傳算法的搜索有影響,對支持向量機算法具有顯著影響,為了優(yōu)化模型往往需要對染色體參數(shù)進行適當優(yōu)化。根據(jù)采集數(shù)據(jù)情況,確定初始種群染色體數(shù)目。③計算每個染色體的適應度值f(xi),xi為種群中第i個染色體;④累加所有染色體的適應度值sum=∑f(xi),同時記錄對于每一個染色體的中間累加值S-mid,其中S為總數(shù)目;⑤產(chǎn)生一個隨機數(shù)N,0 4)獲得αi以及b的值,代入方程中,獲得函數(shù)擬合的支持向量機。 5)將需預測或分類的數(shù)據(jù)代入支持向量機方程中獲得結(jié)果。 本研究中所選評價指標作為供應鏈評價因素集,供應鏈績效評價等級分為5級,目標輸出對應以下5類:1、2、3、4、5。 利用表2中的前10數(shù)據(jù)作為訓練樣本,對于數(shù)據(jù)采用以下公式進行歸一化處理,以減少各個因子不同量級對于回歸效果的影響,并利用Matlab軟件得出回歸結(jié)果(圖2)。 ■=■ (7) 由圖2可以看出擬合效果非常好,從而可以對剩下的4個進行識別,并與采用BP神經(jīng)網(wǎng)絡對10到14的樣本進行評判的結(jié)果進行對比(表4)。 通過表4可見,基于粗集的支持向量機識別等級與支持向量機識別的等級除了編號12之外都一樣,通過對編號12的數(shù)據(jù)進行進一步分析可以得出此供應鏈績效等級更趨近于一般等級。 4 結(jié)論 本研究首先利用粗集理論提取出影響供應鏈績效評價的核心因素,再使用支持向量機的方法進行模式識別,模式識別過程中,利用遺傳算法對相關(guān)參數(shù)進行尋優(yōu)操作,取得了良好的效果。由于支持向量機是基于小樣本的分類及預測的模型。所以,在本研究實例所給樣本極少的情況下做出了較好的預測。由于支持向量機方法是建立在有限樣本下進行機器學習的通用方法,因此它在供應鏈績效評價和分析中有廣泛的應用前景。
參考文獻:
[1] 王德財.基于支持向量機的供應鏈績效評價方法研究[D].長沙:長沙理工大學,2006.
[2] 蔡煒凌.企業(yè)供應鏈項目的綜合評價方法研究[D].河北保定:華北電力大學,2007.
[3] 曹慶奎,任向陽,劉 琛,等.基于粗集-未確知測度模型的企業(yè)技術(shù)創(chuàng)新能力評價研究[J].系統(tǒng)工程理論與實踐,2006,9(4):67-72.
[4] 張文修,吳偉志.粗糙集理論與方法[M].北京:科學出版社,2003.
[5] 柯孔林,馮宗憲.基于粗糙集與遺傳算法集成的企業(yè)短期貸款違約判別[J].系統(tǒng)工程理論與實踐,2008,9(4):27-34.
[6] BANERJEE M, CHAKRABORTY M K.A category for rough sets[J].Foundations of Computing and Decision Sciences,1993,18(3-4):167-180.
[7] 李順國,盧新元.基于粗糙集和SVM的工程項目投標風險研究[J].計算機工程與應用,2008,44(17):224-227.
[8] 蘇懷智,溫志萍,吳中如.基于SVM理論的大壩安全預警模型研究[J]. 應用基礎與工程科學學報,2009,17(1):40-47.
[9] 趙洪波,馮夏庭.非線性位移時間序列預測的進化——支持向量機方法及應用[J].巖土工程學報,2003,25(4):468-471.
[10] PETLEY D N, MANTOVANI F, BULMER M H, et al. The use of surface monitoring data for the interpretation of landslide movement patterns[J]. Geomorphology, 2005,66(1-4):133-147.
[11] VALLEJO L E, SHETTIMA M. Creep crack propagation and the progressive failure of slopes[A]. In: Deformation and progressive failure in geomechanics[C]. London: Pergmon Press, 1997.
[12] BETTEN J. Creep mechanics[M]. 2nd ed. Berlin: Springer, 2005.
[13] MANDIC D P, GOLZ M, KUH A, et al. Signal processing techniques for knowledge extraction and information fusion[M]. Berlin:Springer,2007.
[14] KLIONSKI D M, ORESHKO N I, GEPPENER V V, et al. Applications of empirical mode decomposition for processing nonstationary signals[J]. Pattern Recognition and Image Analysis,2008,18(3):390-399.
[15] LEE Y S, TSAKIRTZIS S, VAKAKIS A F, et al. Physics-based foundation for empirical mode decomposition[J]. AIAA Journal,2009,47(12):2938-2963.