(后勤工程學院,重慶 401311)
油料保障聯(lián)盟呈現(xiàn)地域分布特征,致使在整個油料保障鏈中,每個保障實體可能以局部最大利益來采取保障行動及其優(yōu)化各自區(qū)域的局部保障性能。這一現(xiàn)象不符合油料保障鏈總體目標要求[1]。應將保障鏈中的不同地域、不同環(huán)節(jié)的分布式油料保障決策集成,以便提供強勁的油料保障性能,而這卻常被保障鏈某些短期目標和局部視角缺陷所隱匿。
對于高度集中式油料保障鏈決策,以往使用分析方法,重點研究如何提高整個保障鏈中各保障實體的運作效率,而不是提高其綜合保障效能[2,3]。雖然,一般情況下,油料保障聯(lián)盟擁有全局性油料保障規(guī)劃總體方案,試圖考慮作為其成員的各保障實體的主要活動、目標、所觸發(fā)的行為復雜性,這使得難于集成其保障效能[4,5]。此外,即使油料保障鏈集中式規(guī)劃系統(tǒng)簡單得足于運作,但油料保障環(huán)境的頻繁和不可預見的變化,導致油料保障規(guī)劃方案滯后或過時,難于快速響應保障環(huán)境態(tài)勢。
油料保障鏈中各保障實體呈地域自然分布,但緊耦合為一個網(wǎng)絡。因此,分布式約束優(yōu)化方法適合用于解決油料保障鏈管理問題,它使得Agent的局域自利本性符合全局油料保障優(yōu)化要求。它允許Agent以異步和較有效方式來運行,使用與相鄰Agent的局域通信,對此,具有單個中央Agent的通信是難于做到的[6,7]。
本文應用約束網(wǎng)絡與Holonic Agent技術,對分布式優(yōu)化油料保障模型進行研究。將分布保障實體所考慮的涉及局部保障因素的算法內嵌到多角色Holon,調用分布式約束多目標最優(yōu)化智能算法,以便實現(xiàn)油料保障資源調度與配置。
對于油料保障鏈中分布式油料保障問題,Agent嘗試尋找對一組受到約束變量的分配。假設Agent子集具有每個給定約束的知識,Agent可以分布式異步方式,只與相鄰Agent通信,來優(yōu)化全局函數(shù)。這不同于涉及自益Agent的其它相關形式,它嘗試單個最大限度地發(fā)揮自己的效用。Agent通過所選擇最優(yōu)解決方案,最大限度地發(fā)揮其所累積的效應。
將分布式約束優(yōu)化油料保障鏈問題描述為5元組(A,X,D,C,F),其中:A=a1,a2,…,an是 Agent集;X=x1,x2,…,xn是油料保障變量集;D=d1,d2,…,dn是有限離散域集,每個域與對應變量相關聯(lián)。 C=cij:Di×Dj→N(i,j=1,2,…,n,i≠j)是用每對變量xi和xj的保障成本函數(shù)cij所表示的約束集。目標函數(shù)為:
只有Agent具有知識,控制和分配與其相關聯(lián)變量的值。Agent的目標是為所有變量選擇估值,以便最大化目標函數(shù)F,該目標被建模為一組值的約束。
油料保障鏈在給定時間域T演變,T被劃分為期間Γε,ε ∈ {1 ,...,T},通過其索引ε來表示。在每個周期的開始時,根據(jù)過去和將來決策知識來做出決策。時間域H中的一系列決策被稱為決策策略集Q。決策意味著向所有決策變量分配數(shù)值。油料保障鏈涉及不同層次眾多保障資源,根據(jù)全局保障目標和不同層次油料保障計劃puε來調配,從每個時期ε、每個保障實體u所產(chǎn)生的保障計劃離散集中,選擇確定相應保障計劃。
另一方面,對于每個時期t,每個油庫w,選擇最優(yōu)油品庫存量Qbest={Qmin,Qmax},Qmin表示安全庫存,Qmax表示庫存容量限制,來處理每種油品的庫存管理。通過補充或發(fā)放所需的油品數(shù)量,確保在時期ε結束時,相應的庫存水平等于Invwoε。
決策變量有:
(1)Puε:期間ε由保障實體u的保障計劃;
(2)Invwoε:期間ε結束時,在油庫(或加油站)w中,油品o的庫存水平。ε∈{1 ,...,T},e∈E(油料裝備集),o∈O(油品集),p∈P=E?O。
輸入?yún)?shù)有:
(1)In(e;o;puε):在期間ε,使用保障計劃puε,保障實體u所處理的油品o的數(shù)量;
(2)Out(u;e;put):在期間ε,使用保障計劃puε,保障實體u所處理的油料裝備e的數(shù)量;
(3)Dmweε:在期間ε,在油庫w所對應的保障區(qū)域,所預測的油料裝備e的需求量;
(4)preCostue:保障實體u調運油料裝備e的一個單位成本;
(5)ProCosto:油品o的單位價格;
(6)InvCostwo(Invwot):在期間ε,油庫w的庫存油品o,庫存水平的庫存成本函數(shù)Invwoε;
(7)RfRateRo:在油料保障區(qū)R,油品o的運價;
(8)WZfRateWZo:在戰(zhàn)區(qū)WZ,各油料保障區(qū)域之間的油品o的運價;
(9)SfRateo:供應商與戰(zhàn)區(qū)之間油品o的運價。
根據(jù)油料保障仿真約束、計算資源,對所仿真行為的復雜性和真實性進行調整。在角色和交互方面,使用油料保障實體組織模型來定義油料保障實體行為,采用holon對油料保障實體建模,構建油料保障實體holarchy結構如圖1所示。
圖1 油料保障實體holarchy結構
該結構描述油料保障實體行為,保障執(zhí)行器和保障感知器分別提供保障實體在油料保障環(huán)境中行為和感知的手段。油料保障實體角色,根據(jù)holon目標,將感知與行動計算、保障環(huán)境約束相集成。在holarchy的較低層次,超級holon的油料保障實體行為是相同成員,但感知和行為被匯總,然后使用聚合油料保障實體的行為。
內部油料保障人員在保障鏈的各個層次、各自holon中承擔head角色作用,負責保障鏈中保障任務的執(zhí)行,負責反饋相應保障區(qū)域油品及其裝備的消耗和需求信息,確保保障實體與被保障單位之間的供需資源平衡與匹配。上級油料保障人員,代表保障決策指揮角色,可由軟件或油料保障專家來扮演。承擔油料保障調運計劃制定、保障任務分配、保障資源配置等作用,還負責預測每種油品及其裝備的總需求。
油料保障鏈由許多用約束所連接的保障實體節(jié)點組成,屬于非結構化約束網(wǎng)絡,表示保障實體之間的關系。將Agent技術與約束網(wǎng)絡集成,每個Agent被分配來對保障實體進行建模,關系可被定義為這些Agent之間的約束,以便支持油料保障鏈的保障實體之間的信息協(xié)作和共享。
當Agent之間關系由約束來建模時,它們可以被集成為一個網(wǎng)絡,全局優(yōu)化成為可能。這些關系涉及油品如何從保障實體單位流動到被保障單位,如何用油品數(shù)量、成本或調度與運輸?shù)缺U闲袨閬肀硎具@些關系。油料保障環(huán)境對保障鏈施加約束限制,采用約束變量表示約束限制,約束變量值在有限域內被分配給定。因此,該約束模型考慮變量有限集,它們與有限域、約束集相關聯(lián)。
用決策變量和輸入?yún)?shù)表示模型的約束。為簡化起見,采用因變量,定義如下:
式中,Δuot為在期間ε對應于保障實體u,油品o的接收數(shù)量與發(fā)送數(shù)量之差。
將分布式油料保障問題域分為“部隊”、“保障區(qū)”和“戰(zhàn)區(qū)”3個層次,使用所有變量和參數(shù),表示每個層次的約束函數(shù)。
過去和未來油料保障規(guī)劃之間的約束關系,將出現(xiàn)在“保障區(qū)”和“戰(zhàn)區(qū)”層次(即全局),它來自于與保障鏈實體之間油品調運相關物理時間約束。在“部隊”層次,假設在單位時間周期內,一個相同區(qū)域的兩個不同油庫,足夠接近運送彼此之間的油品。因時間周期受到限制,即ε∈{1 ,...,T },應考慮邊界條件:
油料保障鏈管理涉及選擇保障決策策略Φ(puε,Invwpε),以便確保保障鏈績效指標最優(yōu)。油料保障鏈績效指標是在H期間整個保障鏈的效能。假設油品供應商可提供無限量的任何油品,向所有被保障單位需求提供保障。因此,優(yōu)化目標是最大化保障鏈總效能??傂躎E(Total effectiveness,縮寫為TE)表示為:
式中:ESendo:向被保障單位發(fā)送油品的效能;ESende:向被保障單位發(fā)送油料裝備的效能;PurCosto:油品采購成本;PurCoste:油料裝備采購成本;TraCostT:油品和油料裝備運輸總運費。由每個部隊內運輸油品和油料裝備的總運費;(Tra-CostMi_Tε):在不同地點之間,每個地點(Meuwε)內運輸油品和油料裝備的總運費;(TraCostMe_Tε):在保障區(qū)和供應商間每個區(qū)域(Me_Suwε)內運輸油品和油料裝備的總運費(TraCostMe_S_Tε)所獲得;InvCost:在期間H油品和油料裝備總庫存成本。
記油料保障人員為“POLstaff”,對于每個元組(o,ε),創(chuàng)建一個Agnet。在POLstaff角色的情形下,單個Agnet對應于一個保障實體。由于所有層次的POLstaff Agnet具有相同head角色,它們負責因變量的運算,根據(jù)保障決策變量分配更新因變量,從POLstaff Agnet向上發(fā)送到位于上一層次的其它POL-staff Agnet。此外,當在保障區(qū)中觀層次和戰(zhàn)區(qū)宏局層次,平衡油品及其裝備供應量與被保障單位需求時,正確時間段之間的適當匹配,也是相關POLstaff Agnet的責任。肩負油品及其裝備管理角色的Agnet,管理和控制決策變量puε,而庫存管理者角色的Agnet關注決策變量Invwoε。
式中,數(shù)值約束函數(shù)被定義為兩個相鄰Agnet之間的關系。在所關注的holonic模型,一對Agnet中,一個Agnet總是具有POLstaff角色(L),而另一個Agnet則扮演其它任一角色(α)。隨著一對相鄰Agnet、由它們以及參數(shù)之間所交換的變量,提出所有這些函數(shù),因為這些后面的參數(shù)可以根據(jù)油料保障環(huán)境動態(tài)地變化。
在holon的情形下,其后面跟隨著head Agnet(symbol≡),它表示在通信中的全部holon。所有變量直接作用于目標函數(shù)。內部層次約束表示為:
本文將約束網(wǎng)絡方法與Holonic Agent方法相結合,建立分布式約束優(yōu)化油料保障模型,用于支持油料保障鏈的協(xié)作和管理。分析分布式油料保障問題域特點,確定影響因素與決策變量。采用holon對油料保障實體建模,構建油料保障實體holarchy結構,將感知與保障行為響應、保障環(huán)境約束相集成。將油料保障鏈總效能作為優(yōu)化目標,建立相關約束函數(shù)。論述了基于Holonic Agent的優(yōu)化模型求解模式。該模型通過約束網(wǎng)絡將在空間和時間分布的油料保障實體緊密集成,并使其油料保障行為優(yōu)化,對于增強油料保障鏈整體效能具有重要意義。
[1]周慶忠.軍隊油料勤務學[M].北京:國防出版社,2015.
[2]Klusch M,Gerber A.Dynamic coalition formation among rational agents[J].IEEE Intelligent Systems,2002,17(1):42-47.
[3]McQuay W K.Distributed collaborative environments for systems engineering[J].IEEE Aerospace and Electronic Systems,2005,20(1):7-12.
[4]周慶忠,曾慧娥.基于多智能體的裝備動態(tài)優(yōu)化調撥系統(tǒng)研究[J].機械工程學報,2005,41(2):97-101.
[5]Montana D,J Herrero.A Multi-Agent Society for Military Transportation Scheduling[J].Journal of Scheduling,2000,13(4):324-341.
[6]李必鑫,李永紅.基于Agent的油料保障資源發(fā)現(xiàn)模型[J].物流技術,2011,30(11):129-131.
[7]周慶忠,王冰,陸思錫.面向油料保障的自治協(xié)同建模[J].四川兵工學報,2013,34(9):52-55.