李俊妮 歐陽昱 郭陽
摘 要:目前國網(wǎng)公司按照層層匯總物資需求的方式開展配網(wǎng)物資需求采購計劃,需求計劃生產(chǎn)周期較長,且采購準(zhǔn)確度較低,對生產(chǎn)物資的購置、供應(yīng)計劃、物資領(lǐng)用等環(huán)節(jié)產(chǎn)生不利影響,并增加了配網(wǎng)物資采購成本。文章關(guān)聯(lián)配網(wǎng)工程項目特征與物資品類需求,通過啞變量的形式構(gòu)建訓(xùn)練樣本,基于隨機森林算法對配網(wǎng)物資采購需求進(jìn)行預(yù)測,提升預(yù)測精度,有效指導(dǎo)工程建設(shè)及生產(chǎn)計劃的合理安排,降低采購成本。
關(guān)鍵詞:隨機森林;配網(wǎng)物資;需求預(yù)測
中圖分類號:TKl21 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-8937(2016)32-0136-02
1 研究背景
國網(wǎng)公司總部物資部自2013年以來開展配網(wǎng)項目物資集中框架招標(biāo)采購,實現(xiàn)協(xié)議庫存管控模式,目前每年在3月、9月開展兩次農(nóng)配網(wǎng)物資需求計劃安排工作,采用由下至上的工作模式,從生產(chǎn)一線開始對采購需求進(jìn)行統(tǒng)計、估算、上報,經(jīng)由地市公司、省公司層層匯總形成總體采購需求,由總部物資部和物資公司共同實施采購,涉及大量的審核、匯總工作。
因此,物資采購需求的產(chǎn)生周期較長,且省市公司物資部門普遍反映,根據(jù)預(yù)測結(jié)果框架招標(biāo)采購的物資與配網(wǎng)工程建設(shè)實際需要的物資在數(shù)量上有較大的偏差。同時,公司配網(wǎng)建設(shè)所需的物資體量較大,對物資需求預(yù)測工作主要基于經(jīng)驗,缺乏農(nóng)配網(wǎng)需求預(yù)測模型支持,導(dǎo)致項目建設(shè)所需物資不能按照工程要求準(zhǔn)確到位,為了防止項目建設(shè)延期,往往過量上報物資需求,然而物資數(shù)量過多又會占用公司資金、造成庫存物資積壓的風(fēng)險。因此,不準(zhǔn)確的采購計劃會對物資的采購、供應(yīng)、暫存和領(lǐng)用等產(chǎn)生影響,導(dǎo)致配網(wǎng)物資整體管理效率降低。
隨著國網(wǎng)公司信息系統(tǒng)的完善和業(yè)務(wù)數(shù)據(jù)的不斷積累,可以通過歷史數(shù)據(jù)構(gòu)建農(nóng)配網(wǎng)項目屬性及建設(shè)內(nèi)容與所需物資之間的映射關(guān)系,并基于下一年度的項目建設(shè)計劃,從總體角度,分品類預(yù)測需要采購的物資數(shù)量,提升配網(wǎng)物資需求預(yù)測準(zhǔn)確率,為企業(yè)物資采購批次計劃執(zhí)行提供科學(xué)依據(jù),有效指導(dǎo)物資供應(yīng)計劃的合理安排,降低采購和庫存成本、提高生產(chǎn)建設(shè)的精益化水平。
2 模型原理
為了依據(jù)農(nóng)配網(wǎng)項目的建設(shè)計劃預(yù)測物資采購需求,首先要提取農(nóng)配網(wǎng)工程項目的項目特征值,以標(biāo)記各工程項目的建設(shè)屬性和建設(shè)內(nèi)容,隨后需要在已投產(chǎn)的項目記錄基礎(chǔ)上,構(gòu)建工程建設(shè)特征和建設(shè)內(nèi)容與其領(lǐng)用物資品類、數(shù)量之間的映射關(guān)系,最后通過學(xué)習(xí)及模擬工程建設(shè)特征和建設(shè)內(nèi)容與物資領(lǐng)用品類、數(shù)量之間的函數(shù)關(guān)系來構(gòu)建隨機森林預(yù)測模型。具體的模型構(gòu)建原理,如圖1所示。
在提取項目特征值過程中,首先需要根據(jù)歷史投產(chǎn)的配網(wǎng)工程項目名稱創(chuàng)建配網(wǎng)專業(yè)詞典,然后使用文本挖掘工具對項目名稱中包含的重要特征值進(jìn)行分詞,隨后根據(jù)各工程項目的物資領(lǐng)用信息歸類合并具有相似性質(zhì)的工程項目,固化成44個工程類型。具體詞典創(chuàng)建原理和分詞過程參見項目組前期研究成果(參見文章《配網(wǎng)工程項目詞庫創(chuàng)建及分詞探索》)。在分詞之后,將項目特征結(jié)合地市信息、項目類型、下達(dá)預(yù)算和歷史項目中不同物料小類的物料領(lǐng)用總量共同作為隨機森林預(yù)測模型的輸入空間。
采用2013、2014年領(lǐng)料記錄完整的歷史項目物料小類采購數(shù)據(jù)作為訓(xùn)練集,2015年領(lǐng)料記錄完整的項目物料小類采購數(shù)據(jù)作為測試集。由于配網(wǎng)輸入數(shù)據(jù)具有標(biāo)簽復(fù)雜,類型眾多的特點,因此首先需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,排除不符合業(yè)務(wù)邏輯的異常值,將原始數(shù)據(jù)轉(zhuǎn)換成為采取啞變量方法進(jìn)行展示的形式并作為隨機森林模型的輸入,以便隨機森林模型可以更好地學(xué)習(xí)歷史項目的有效特征。
3 預(yù)測模型構(gòu)建
配網(wǎng)項目具有樣本數(shù)量多,項目類型、標(biāo)簽復(fù)雜的特征。因此,采用具備處理高維數(shù)據(jù)能力的隨機森林算法構(gòu)建配網(wǎng)物資需求預(yù)測模型,同時隨機森林模型在訓(xùn)練速度和避免過擬合方面也具有明顯的優(yōu)勢。簡單地說,隨機森林是利用多棵決策樹對樣本進(jìn)行預(yù)測的模型,它的結(jié)構(gòu),如圖2所示。給定決策樹的數(shù)量,每棵決策樹按既定方法選取輸入信息的子集作為樣例進(jìn)行學(xué)習(xí),不剪枝地生長,直到滿足停止生長規(guī)則并給出結(jié)果,最終集合所有單棵決策樹結(jié)果做出判斷并把信息傳遞給外界。
隨機森林通過自助法重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機抽取k個樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自助樣本集生成k個決策樹組成隨機森林。其實質(zhì)是對決策樹算法的一種改進(jìn),將多個決策樹合并在一起,每棵樹的建立依賴于一個獨立抽取的樣品,其輸出將會是所有決策樹輸出的平均值。
隨機森林中每一棵決策樹為二叉樹,其生成遵循自頂向下的遞歸分裂原則,即從根節(jié)點開始對訓(xùn)練集進(jìn)行劃分。分裂過程中,按照最大信息增益率的原則選取特征,并不斷分裂為左節(jié)點和右節(jié)點,直到滿足分枝停止規(guī)則方才停止生長。為了精確地定義信息增益,先定義一個度量標(biāo)準(zhǔn),稱為熵(entropy),它表示任意樣例的純度(purity):
構(gòu)建預(yù)測模型時,首先將預(yù)處理過的歷史數(shù)據(jù)作為輸入空間放在隨機森林預(yù)測模型中,模型會根據(jù)輸入空間學(xué)習(xí)歷史項目中不同項目工程特征的不同物料小類的領(lǐng)料特征,形成隨機森林網(wǎng)絡(luò),直到獲取最優(yōu)的分裂信息和信息增益率時模型訓(xùn)練停止。隨后根據(jù)下一年度新的建設(shè)計劃,包括工程屬性、電壓等級、下達(dá)預(yù)算等變量作為新的輸入空間,進(jìn)行分品類的物資需求預(yù)測。以國網(wǎng)某省公司的實際數(shù)據(jù)計算結(jié)果為例,對于采購金額最高的12個物料小類的預(yù)測精準(zhǔn)度都穩(wěn)定保持在95%以上。見表1。
4 研究結(jié)論
通過研究發(fā)現(xiàn)可以對配網(wǎng)工程項目名稱進(jìn)行特征值提取,結(jié)合投資規(guī)模、所屬單位、電壓等級等項目屬性信息,分物料小類構(gòu)建項目特征與物料領(lǐng)用信息之間的規(guī)律,通過隨機森林學(xué)習(xí)并模擬,訓(xùn)練得到相應(yīng)的映射函數(shù),以從物料小類匯總數(shù)量的層面上實現(xiàn)對物資采購需求的預(yù)測。
對于后期的實際工作而言,只要規(guī)劃配網(wǎng)建設(shè)計劃,即可評估出下一年度各物料小類的總體采購需求,大幅提升配網(wǎng)物資采購需求安排的準(zhǔn)確度及需求計劃的編制效率。
參考文獻(xiàn):
[1] 王學(xué)斌,馬士華. 庫存需求災(zāi)變灰預(yù)測模型[J].工業(yè)工程與管理,2002
(5):23-28.
[2] 曾艷.需求確定的多級庫存系統(tǒng)的庫存策略[J].集美大學(xué)學(xué)報,2004(3),
77-81.
[3] 張旭梅.面向供應(yīng)鏈的合作計劃預(yù)測與補給[J].工業(yè)工程,2000(4):
45-47.
[4] 王曉萍.庫存控制模型與算法[J].工業(yè)技術(shù)經(jīng)濟(jì),2000(5): 25-28.
[5] Yang P C,Wee H M. Economic ordering policy of deteriorated items
for Vendor and buyer an integrated approach[J]. Production Planing
and Conrtol, 2011, 11(5): 474-480.