李俊妮 歐陽昱 郭陽
摘 要:目前國網(wǎng)公司按照層層匯總物資需求的方式開展配網(wǎng)物資需求采購計(jì)劃,需求計(jì)劃生產(chǎn)周期較長,且采購準(zhǔn)確度較低,對生產(chǎn)物資的購置、供應(yīng)計(jì)劃、物資領(lǐng)用等環(huán)節(jié)產(chǎn)生不利影響,并增加了配網(wǎng)物資采購成本。文章關(guān)聯(lián)配網(wǎng)工程項(xiàng)目特征與物資品類需求,通過啞變量的形式構(gòu)建訓(xùn)練樣本,基于隨機(jī)森林算法對配網(wǎng)物資采購需求進(jìn)行預(yù)測,提升預(yù)測精度,有效指導(dǎo)工程建設(shè)及生產(chǎn)計(jì)劃的合理安排,降低采購成本。
關(guān)鍵詞:隨機(jī)森林;配網(wǎng)物資;需求預(yù)測
中圖分類號(hào):TKl21 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2016)32-0136-02
1 研究背景
國網(wǎng)公司總部物資部自2013年以來開展配網(wǎng)項(xiàng)目物資集中框架招標(biāo)采購,實(shí)現(xiàn)協(xié)議庫存管控模式,目前每年在3月、9月開展兩次農(nóng)配網(wǎng)物資需求計(jì)劃安排工作,采用由下至上的工作模式,從生產(chǎn)一線開始對采購需求進(jìn)行統(tǒng)計(jì)、估算、上報(bào),經(jīng)由地市公司、省公司層層匯總形成總體采購需求,由總部物資部和物資公司共同實(shí)施采購,涉及大量的審核、匯總工作。
因此,物資采購需求的產(chǎn)生周期較長,且省市公司物資部門普遍反映,根據(jù)預(yù)測結(jié)果框架招標(biāo)采購的物資與配網(wǎng)工程建設(shè)實(shí)際需要的物資在數(shù)量上有較大的偏差。同時(shí),公司配網(wǎng)建設(shè)所需的物資體量較大,對物資需求預(yù)測工作主要基于經(jīng)驗(yàn),缺乏農(nóng)配網(wǎng)需求預(yù)測模型支持,導(dǎo)致項(xiàng)目建設(shè)所需物資不能按照工程要求準(zhǔn)確到位,為了防止項(xiàng)目建設(shè)延期,往往過量上報(bào)物資需求,然而物資數(shù)量過多又會(huì)占用公司資金、造成庫存物資積壓的風(fēng)險(xiǎn)。因此,不準(zhǔn)確的采購計(jì)劃會(huì)對物資的采購、供應(yīng)、暫存和領(lǐng)用等產(chǎn)生影響,導(dǎo)致配網(wǎng)物資整體管理效率降低。
隨著國網(wǎng)公司信息系統(tǒng)的完善和業(yè)務(wù)數(shù)據(jù)的不斷積累,可以通過歷史數(shù)據(jù)構(gòu)建農(nóng)配網(wǎng)項(xiàng)目屬性及建設(shè)內(nèi)容與所需物資之間的映射關(guān)系,并基于下一年度的項(xiàng)目建設(shè)計(jì)劃,從總體角度,分品類預(yù)測需要采購的物資數(shù)量,提升配網(wǎng)物資需求預(yù)測準(zhǔn)確率,為企業(yè)物資采購批次計(jì)劃執(zhí)行提供科學(xué)依據(jù),有效指導(dǎo)物資供應(yīng)計(jì)劃的合理安排,降低采購和庫存成本、提高生產(chǎn)建設(shè)的精益化水平。
2 模型原理
為了依據(jù)農(nóng)配網(wǎng)項(xiàng)目的建設(shè)計(jì)劃預(yù)測物資采購需求,首先要提取農(nóng)配網(wǎng)工程項(xiàng)目的項(xiàng)目特征值,以標(biāo)記各工程項(xiàng)目的建設(shè)屬性和建設(shè)內(nèi)容,隨后需要在已投產(chǎn)的項(xiàng)目記錄基礎(chǔ)上,構(gòu)建工程建設(shè)特征和建設(shè)內(nèi)容與其領(lǐng)用物資品類、數(shù)量之間的映射關(guān)系,最后通過學(xué)習(xí)及模擬工程建設(shè)特征和建設(shè)內(nèi)容與物資領(lǐng)用品類、數(shù)量之間的函數(shù)關(guān)系來構(gòu)建隨機(jī)森林預(yù)測模型。具體的模型構(gòu)建原理,如圖1所示。
在提取項(xiàng)目特征值過程中,首先需要根據(jù)歷史投產(chǎn)的配網(wǎng)工程項(xiàng)目名稱創(chuàng)建配網(wǎng)專業(yè)詞典,然后使用文本挖掘工具對項(xiàng)目名稱中包含的重要特征值進(jìn)行分詞,隨后根據(jù)各工程項(xiàng)目的物資領(lǐng)用信息歸類合并具有相似性質(zhì)的工程項(xiàng)目,固化成44個(gè)工程類型。具體詞典創(chuàng)建原理和分詞過程參見項(xiàng)目組前期研究成果(參見文章《配網(wǎng)工程項(xiàng)目詞庫創(chuàng)建及分詞探索》)。在分詞之后,將項(xiàng)目特征結(jié)合地市信息、項(xiàng)目類型、下達(dá)預(yù)算和歷史項(xiàng)目中不同物料小類的物料領(lǐng)用總量共同作為隨機(jī)森林預(yù)測模型的輸入空間。
采用2013、2014年領(lǐng)料記錄完整的歷史項(xiàng)目物料小類采購數(shù)據(jù)作為訓(xùn)練集,2015年領(lǐng)料記錄完整的項(xiàng)目物料小類采購數(shù)據(jù)作為測試集。由于配網(wǎng)輸入數(shù)據(jù)具有標(biāo)簽復(fù)雜,類型眾多的特點(diǎn),因此首先需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,排除不符合業(yè)務(wù)邏輯的異常值,將原始數(shù)據(jù)轉(zhuǎn)換成為采取啞變量方法進(jìn)行展示的形式并作為隨機(jī)森林模型的輸入,以便隨機(jī)森林模型可以更好地學(xué)習(xí)歷史項(xiàng)目的有效特征。
3 預(yù)測模型構(gòu)建
配網(wǎng)項(xiàng)目具有樣本數(shù)量多,項(xiàng)目類型、標(biāo)簽復(fù)雜的特征。因此,采用具備處理高維數(shù)據(jù)能力的隨機(jī)森林算法構(gòu)建配網(wǎng)物資需求預(yù)測模型,同時(shí)隨機(jī)森林模型在訓(xùn)練速度和避免過擬合方面也具有明顯的優(yōu)勢。簡單地說,隨機(jī)森林是利用多棵決策樹對樣本進(jìn)行預(yù)測的模型,它的結(jié)構(gòu),如圖2所示。給定決策樹的數(shù)量,每棵決策樹按既定方法選取輸入信息的子集作為樣例進(jìn)行學(xué)習(xí),不剪枝地生長,直到滿足停止生長規(guī)則并給出結(jié)果,最終集合所有單棵決策樹結(jié)果做出判斷并把信息傳遞給外界。
隨機(jī)森林通過自助法重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機(jī)抽取k個(gè)樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自助樣本集生成k個(gè)決策樹組成隨機(jī)森林。其實(shí)質(zhì)是對決策樹算法的一種改進(jìn),將多個(gè)決策樹合并在一起,每棵樹的建立依賴于一個(gè)獨(dú)立抽取的樣品,其輸出將會(huì)是所有決策樹輸出的平均值。
隨機(jī)森林中每一棵決策樹為二叉樹,其生成遵循自頂向下的遞歸分裂原則,即從根節(jié)點(diǎn)開始對訓(xùn)練集進(jìn)行劃分。分裂過程中,按照最大信息增益率的原則選取特征,并不斷分裂為左節(jié)點(diǎn)和右節(jié)點(diǎn),直到滿足分枝停止規(guī)則方才停止生長。為了精確地定義信息增益,先定義一個(gè)度量標(biāo)準(zhǔn),稱為熵(entropy),它表示任意樣例的純度(purity):
構(gòu)建預(yù)測模型時(shí),首先將預(yù)處理過的歷史數(shù)據(jù)作為輸入空間放在隨機(jī)森林預(yù)測模型中,模型會(huì)根據(jù)輸入空間學(xué)習(xí)歷史項(xiàng)目中不同項(xiàng)目工程特征的不同物料小類的領(lǐng)料特征,形成隨機(jī)森林網(wǎng)絡(luò),直到獲取最優(yōu)的分裂信息和信息增益率時(shí)模型訓(xùn)練停止。隨后根據(jù)下一年度新的建設(shè)計(jì)劃,包括工程屬性、電壓等級、下達(dá)預(yù)算等變量作為新的輸入空間,進(jìn)行分品類的物資需求預(yù)測。以國網(wǎng)某省公司的實(shí)際數(shù)據(jù)計(jì)算結(jié)果為例,對于采購金額最高的12個(gè)物料小類的預(yù)測精準(zhǔn)度都穩(wěn)定保持在95%以上。見表1。
4 研究結(jié)論
通過研究發(fā)現(xiàn)可以對配網(wǎng)工程項(xiàng)目名稱進(jìn)行特征值提取,結(jié)合投資規(guī)模、所屬單位、電壓等級等項(xiàng)目屬性信息,分物料小類構(gòu)建項(xiàng)目特征與物料領(lǐng)用信息之間的規(guī)律,通過隨機(jī)森林學(xué)習(xí)并模擬,訓(xùn)練得到相應(yīng)的映射函數(shù),以從物料小類匯總數(shù)量的層面上實(shí)現(xiàn)對物資采購需求的預(yù)測。
對于后期的實(shí)際工作而言,只要規(guī)劃配網(wǎng)建設(shè)計(jì)劃,即可評估出下一年度各物料小類的總體采購需求,大幅提升配網(wǎng)物資采購需求安排的準(zhǔn)確度及需求計(jì)劃的編制效率。
參考文獻(xiàn):
[1] 王學(xué)斌,馬士華. 庫存需求災(zāi)變灰預(yù)測模型[J].工業(yè)工程與管理,2002
(5):23-28.
[2] 曾艷.需求確定的多級庫存系統(tǒng)的庫存策略[J].集美大學(xué)學(xué)報(bào),2004(3),
77-81.
[3] 張旭梅.面向供應(yīng)鏈的合作計(jì)劃預(yù)測與補(bǔ)給[J].工業(yè)工程,2000(4):
45-47.
[4] 王曉萍.庫存控制模型與算法[J].工業(yè)技術(shù)經(jīng)濟(jì),2000(5): 25-28.
[5] Yang P C,Wee H M. Economic ordering policy of deteriorated items
for Vendor and buyer an integrated approach[J]. Production Planing
and Conrtol, 2011, 11(5): 474-480.