高龍
摘? 要:在多品種小批量的物料生產(chǎn)中,企業(yè)往往無法事先確定物料的生產(chǎn)需求,導(dǎo)致出現(xiàn)過度生產(chǎn)或供應(yīng)不足的局面。文中以某電子企業(yè)小批量物料需求歷史數(shù)據(jù)為基礎(chǔ),采用優(yōu)劣解距離法(TOPSIS)從中選擇一種值得重點關(guān)注的物料作為研究對象,通過建立ARIMA時間序列模型對未來短期內(nèi)該物料的生產(chǎn)需求量進行預(yù)測。經(jīng)驗證,該模型對預(yù)測短期內(nèi)企業(yè)物料生產(chǎn)需求具有一定的指導(dǎo)性和參考價值,可以為企業(yè)物料生產(chǎn)計劃的制定提供決策依據(jù)。
關(guān)鍵詞:需求預(yù)測;小批量物料;TOPSIS;ARIMA
中圖分類號:TP311;TP39 文獻標識碼:A 文章編號:2096-4706(2023)15-0097-05
Research on the Small Batch Material Production Demand Prediction Model Based on ARIMA
GAO Long
(Lanzhou Petrochemical University of Vocational Technology, Lanzhou? 730060, China)
Abstract: In the production of multiple-variety and small-batch materials, enterprises often cannot determine the production demand of materials in advance, leading to overproduction or insufficient supply. Based on the historical data of small batch material demand in a certain electronic enterprise, the TOPSIS method is used to select a material that deserves special attention as the research object. By establishing an ARIMA time series model, the production demand for this material in the short term in the future is predicted. After verification, this model has certain guidance and reference value for predicting the short-term material production demand of enterprises, and can provide decision-making basis for the formulation of enterprise material production plans.
Keywords: demand prediction; small-batch material; TOPSIS; ARIMA
0? 引? 言
隨著市場競爭的加劇,企業(yè)競爭越來越強調(diào)基于客戶需求的競爭,生產(chǎn)類型也從大量流水生產(chǎn)轉(zhuǎn)為多品種小批量的模式。而多品種小批量的生產(chǎn)方式強調(diào)根據(jù)客戶需求進行生產(chǎn),避免過度生產(chǎn)和庫存積壓,從而降低庫存成本,提高產(chǎn)品市場競爭力。但在多品種小批量的物料生產(chǎn)中,由于物料實際需求變化多樣,企業(yè)往往無法事先確定物料的實際需求量,導(dǎo)致不能合理地安排物料生產(chǎn)[1]。因此通過分析企業(yè)已有的小批量物料生產(chǎn)需求歷史時序數(shù)據(jù),建立需求預(yù)測模型,幫助企業(yè)有效掌控物料生產(chǎn)規(guī)模,合理制定生產(chǎn)計劃就顯得十分必要了。目前國內(nèi)外對于基于時間序列數(shù)據(jù)的需求預(yù)測研究已經(jīng)有了較為詳細的理論體系,但圍繞企業(yè)小批量物料生產(chǎn)需求預(yù)測的研究偏少,本文以某電子企業(yè)小批量物料需求歷史數(shù)據(jù)為研究數(shù)據(jù),應(yīng)用優(yōu)劣解距離法(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)從中選擇一種物料作為研究對象,利用時間序列的特點,建立基于時間序列的差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average Model, ARIMA),以周為單位對小批量物料生產(chǎn)的需求進行預(yù)測。實驗結(jié)果表明,利用ARIMA模型預(yù)測短期內(nèi)企業(yè)小批量物料生產(chǎn)需求具有一定的指導(dǎo)性和參考價值。
1? 研究物料的選擇
1.1? 數(shù)據(jù)處理與特征構(gòu)建
原始數(shù)據(jù)集包含22 453條時間為2019年1月2日到2022年5月21日期間的物料需求信息數(shù)據(jù),共有284種物料,數(shù)據(jù)集中每種物料的基本信息格式及示例如表1所示。
分析原始數(shù)據(jù)可以發(fā)現(xiàn),小批量物料的生產(chǎn)需求往往具有周期性、變動性和復(fù)雜性,同一周期內(nèi),不同品種的物料需求不一樣,不同周期間,相同品種的物料需求也不一樣。在生產(chǎn)實際中,很多物料需求的發(fā)生頻次只有一兩次,如果工廠對每個物料都做一遍需求分析預(yù)測,不僅會浪費很多時間而且也不現(xiàn)實。因此,通過對原始數(shù)據(jù)提供的284種物料需求的歷史數(shù)據(jù)進行分析,本文從中選擇1種應(yīng)當重點關(guān)注的物料作為研究對象,并以周為基本時間單位,預(yù)測物料的周需求量。將原始數(shù)據(jù)中第1次出現(xiàn)的時間(2019年1月2日)所在的周設(shè)定為第1周,以后的每周從周一開始至周日結(jié)束,例如,2019年1月7日至13日為第2周,以此類推,共計177周次。以編碼為6004020918的物料為例,處理后的數(shù)據(jù)如表2所示。
要從284種物料中選出最值得重點關(guān)注的1種,就需要考慮每種物料的需求周數(shù)、需求發(fā)生頻次、需求量、銷售單價、銷售總價等因素進行綜合評價選擇。因此需要進一步做數(shù)據(jù)處理,構(gòu)建上述5種特征并聚合數(shù)據(jù),結(jié)果如表3所示。
原始數(shù)據(jù)中的284種物料的需求周數(shù),在需求周內(nèi)的需求發(fā)生總頻次、總需求量、銷售單價均值和銷售總價均值如上表所示,此數(shù)據(jù)表構(gòu)成了一個284×5的矩陣X,基于X構(gòu)建TOPSIS綜合評價模型,對284種物料進行綜合得分指數(shù)排序,選擇得分指數(shù)最高的物料。
1.2? TOPSIS模型
TOPSIS法是一種組內(nèi)綜合評價方法,基本過程為基于歸一化后的原始數(shù)據(jù)矩陣X,度量各評價對象與正理想解和負理想解間的距離,獲得各評價對象與正理想解的相對接近程度,以此作為評價優(yōu)劣的依據(jù)[2]。TOPSIS算法流程[3]如算法1所示。
算法1:
輸入:原始數(shù)據(jù)集X = {x1,x2,…,xn};各指標權(quán)重w = {w1,w2,…,wn}
輸出:各數(shù)據(jù)樣本的TOPSIS評價結(jié)果
1)對原始數(shù)據(jù)集X中的指標屬性同向化,得到X′
2)構(gòu)造向量歸一化后的標準化矩陣Z = {z1,z2,…,zn}
3)for Z的每一列Zi do
4)負理想解Z -的第i維度←Zi元素最小值
5)正理想解Z +的第i維度←Zi元素最大值
6)end for
7)for zi ∈ Z do
8)zi與正理想解的接近程度
11)end for
12)根據(jù)Ci大小排序
按照TOPSIS模型建立步驟,首先對284種物料按照需求周數(shù)、需求發(fā)生總頻次、總需求量、銷售單價均值和銷售總價均值5個指標組成的原始矩陣X284×5做同向化處理,由于構(gòu)建的5個指標均為極大型指標,所以此步驟可省略。對矩陣X284×5進行標準化處理以消除不同量綱之間的影響,將標準化后的矩陣記為Z,標準化處理按式(1)進行:
式(1)中,Zij為第i種物料的第j個指標歸一化后的值。
正理想解Z +和負理想解Z -分別由Z中每列元素的最大值和最小值構(gòu)成,經(jīng)過算法1中的步驟2)~6)的求解,得到284種物料中正理想解和負理想解,如表4所示。
算法1中,TOPSIS在計算各評價對象與Z +和Z -的接近程度時,需要確定每個指標的權(quán)重wj,wj的確定往往由決策者給出或基于信息論的熵值法,本文采用后者。熵值法通過各指標值的變異程度來確定指標權(quán)數(shù),僅依賴于數(shù)據(jù)本身的離散程度。指標的離散程度越大則熵值越大,表明指標值提供的信息量越多,則該指標的權(quán)重也應(yīng)越大[4]。計算過程如算法2所示。
算法2:
輸入:原始數(shù)據(jù)集X = {x1,x2,…,xn}
輸出:各指標的熵權(quán)系數(shù)
1)對原始數(shù)據(jù)矩陣X同向化,得到X′
2)通過正向化矩陣X′計算概率矩陣P,
按照算法2求得物料的周數(shù)、需求發(fā)生總頻次、總需求量、銷售單價均值及銷售總價均值的熵權(quán)系數(shù),如表5所示。
計算出正負理想解和物料各指標的熵權(quán)系數(shù)后,按照算法1步驟8)~12)計算可得284種物料的綜合得分指數(shù),排序后選出的物料編碼為6004020503。
2? ARIMA算法原理
ARIMA模型,即差分整合移動平均自回歸模型,其分為自回歸模型(Autoregressive model, AR)、移動平均模型(Moving Average model, MA)和自回歸移動平均模型(Autoregressive Moving Average model, ARMA)。
AR模型表現(xiàn)為觀測值Xt與其滯后p階觀測值的線性組合加上隨機誤差項,即:
Xt = φ1 Xt-1 + φ2 Xt-2 + … + φp Xt-p + αt? ? ? ?(2)
式(2)中,Xt為零均值平穩(wěn)序列,αt為隨機誤差項,φ為模型回歸系數(shù)。AR模型通常簡記為AR( p)。
MA模型表現(xiàn)為觀測值Xt與先前t-1、t-2、…、t-q個時刻進入系統(tǒng)的q個隨機誤差項αt、αt-1、…、αt-q的線性組合,即:
Xt = αt - θ1αt-1 - θ2αt-2 - … - θqαt-q? ? ? ? ?(3)
式(3)中,θ為模型回歸系數(shù)。MA模型簡記為MA(q)。
ARMA模型觀測值Xt不僅與其以前p個時刻的自身觀測值有關(guān),而且還與其以前時刻進入系統(tǒng)的q個隨機誤差存在一定的依存關(guān)系[5],即:
Xt = φ1Xt-1 + φ2Xt-2 +…+ φp Xt-p + αt - θ1αt-1 - θ2αt-2 -…- θqαt-q? (4)
由式(4)可知,ARMA (p,q)模型其實就是AR( p)模型與MA (q)模型的組合。
時間序列的平穩(wěn)性是合理進行時間序列分析和預(yù)測的重要保證,因此在進行ARMA建模之前,待分析的時間序列必須滿足平穩(wěn)性條件,非平穩(wěn)時間序列可通過差分法使之平穩(wěn)化并進行平穩(wěn)性檢驗。時間序列通過d階差分平穩(wěn)化后,建立ARMA模型進行分析,待模型進行參數(shù)估計之后,再通過數(shù)據(jù)變換的可逆性使得模型參數(shù)估計結(jié)果適應(yīng)平穩(wěn)化之前的數(shù)據(jù)[5]。通過此過程建立的模型稱為整合的ARMA模型,即ARIMA( p,d,q)模型。
3? 模型構(gòu)建及應(yīng)用
3.1? 時間序列的平穩(wěn)化檢驗
對選出的編碼為6004020503物料的周需求時間序列數(shù)據(jù)進行訓(xùn)練集測試集劃分,將1~170周的數(shù)據(jù)作為訓(xùn)練集,171~177周的數(shù)據(jù)作為測試集。對訓(xùn)練集原始時間序列進行可視化描述,如圖1所示。
從圖1可以看出,序列不是在某個均值上下波動,呈現(xiàn)出非平穩(wěn)性。但僅從圖形描述來判斷時間序列平穩(wěn)性的準確性往往有限,因此本文使用單位根檢驗的方法對6004020503物料的時序數(shù)據(jù)的平穩(wěn)性進行檢驗。一個時間序列如果能通過差分的方式平穩(wěn)化,則稱其具有單位根,即當一個時間序列具有單位根是非平穩(wěn)的。原假設(shè)H0和備擇假設(shè)H1:
H0:時間序列具有單位根
H1:時間序列沒有單位根(即是平穩(wěn)序列)
本文采用Python第三方的統(tǒng)計分析庫statsmodels中提供的adfuller函數(shù)對原始數(shù)據(jù)和原始數(shù)據(jù)的一階差分數(shù)據(jù)分別進行Dickey-Fuller[6]單位根檢驗,結(jié)果如表6所示。
從表6可以看出原始數(shù)據(jù)單位根檢驗并不顯著,沒有充分的理由拒絕H0,即原始序列具有單位根,是非平穩(wěn)序列。一階差分序列的單位根檢驗的P值非常顯著,因此拒絕H0,接受H1,即一階差分序列是平穩(wěn)序列。
3.2? ARIMA模型識別
ARIMA( p,d,q)模型的識別即確定參數(shù)p,d,q具體數(shù)值的過程,該過程也稱為ARIMA模型的定階。由于在前文所述的時間序列的平穩(wěn)化中,非平穩(wěn)的原始時間序列經(jīng)過一階差分后就平穩(wěn)化了,因此參數(shù)d = 1。ARIMA模型p、q參數(shù)的定階可通過自相關(guān)系數(shù)(Autocorrelation Function, ACF)圖和偏自相關(guān)系數(shù)(Partial Autocorrelation Function, PACF)圖來進行,圖2為原始時間序列數(shù)據(jù)一階差分后得到的ACF和PACF圖。
圖2中的ACF圖在滯后期q = 4之后截尾,而PACF圖在滯后期p = 4之后截尾,因此可以把模型初步設(shè)定為ARIMA(4,1,4)。但利用圖形定階只是一種模型識別的輔助手段,因此本文通過網(wǎng)格搜索計算ARIMA所有可能模型的貝葉斯信息準則BIC[7](Bayesian Information Criterion),根據(jù)計算出的BIC指數(shù)最小的模型作為識別依據(jù)。根據(jù)BIC準則繪制如圖3所示的熱力圖,從圖中可以看到BIC最小值對應(yīng)的參數(shù)分別為p = 1,q = 4,因此最終將模型設(shè)定為ARIMA(1,1,4)。
3.3? 模型參數(shù)估計及檢驗
確定ARIMA模型的具體形式后,利用樣本數(shù)據(jù)進行模型參數(shù)估計及檢驗。對于一個適當?shù)腁RIMA模型,其殘差項無自相關(guān)性,模型殘差項應(yīng)為白噪聲。表7為模型參數(shù)估計及參數(shù)顯著性檢驗結(jié)果。
對模型的殘差項進行白噪聲檢驗,將殘差項的ACF圖繪制出來,如圖4所示。
觀察圖4中各滯后期的殘差自相關(guān)系數(shù),可以看出它們在置信區(qū)間內(nèi)0附近波動,是一白噪聲序列,因此本文中所建立的ARIMA(1,1,4)模型是比較合適的。圖5是殘差序列的直方密度圖,從圖中可以看出模型殘差項基本服從正態(tài)分布,再次驗證本文ARIMA(1,1,4)模型是合理的。
3.4? 模型的預(yù)測
確定好模型的超參并進行模型參數(shù)估計和檢驗后,使用模型對后續(xù)一定時期的時序數(shù)據(jù)進行預(yù)測。利用現(xiàn)有樣本數(shù)據(jù)和模型參數(shù)估計結(jié)果,將差分處理后的數(shù)據(jù)還原成原始數(shù)據(jù)并對后續(xù)時間的時序數(shù)據(jù)進行預(yù)測,本文對物料6004020503在171~177周的需求量進行預(yù)測的結(jié)果如表8所示。
將需求量觀測值的一階差分數(shù)據(jù)和擬合得到的差分數(shù)據(jù)繪制在如圖6所示的時間序列圖中,從圖中可看到預(yù)測值與真實值之間相對是吻合的,二者的波動方向和幅度基本一致。
4? 結(jié)? 論
針對電子產(chǎn)品制造企業(yè)在多品種小批量的物料生產(chǎn)中面臨的生產(chǎn)需求不穩(wěn)定、生產(chǎn)周期不確定導(dǎo)致無法合理安排物料生產(chǎn)的問題,本文提出了一種基于ARIMA算法的短期物料生產(chǎn)需求預(yù)測模型。首先將以天為單位的物料生產(chǎn)需求歷史數(shù)據(jù)轉(zhuǎn)換成以周為單位的時序數(shù)據(jù),使用TOPSIS法選出值得關(guān)注的一種物料作為研究對象,然后基于ARIMA算法構(gòu)建該物料生產(chǎn)的周需求預(yù)測模型,并對未來短期內(nèi)的生產(chǎn)需求進行預(yù)測,為企業(yè)的物料生產(chǎn)計劃提供決策依據(jù)。本文建立的小批量物料生產(chǎn)周需求預(yù)測模型原理簡單,易于解釋,最終擬合結(jié)果顯示良好,模型預(yù)測結(jié)果在短期內(nèi)有一定的參考價值。但也存在以下不足:一是由于所研究物料的時序數(shù)據(jù)較少,模型的預(yù)測精度不足。二是ARIMA模型本身只適用于短期預(yù)測,長期預(yù)測準確度較低。下一步研究中將對上述存在的缺陷進行優(yōu)化升級,探索針對企業(yè)小批量物料生產(chǎn)需求預(yù)測的最佳方法。
參考文獻:
[1] 張浩.多品種小批量生產(chǎn)系統(tǒng)的排產(chǎn)優(yōu)化研究 [D].上海:上海交通大學(xué),2011.
[2] 閆海.我國智慧城市建設(shè)水平評價研究 [D].太原:太原科技大學(xué),2013.
[3] Suranyi.TOPSIS法(優(yōu)劣解距離法)介紹及python3 實現(xiàn) [EB/OL].(2021-02-01)[2023-03-26].https://zhuanlan.zhihu.com/p/37738503.
[4] 王亞俊.考慮屬性交互的氣象災(zāi)害治理能力評價建模研究 [D].南京:南京信息工程大學(xué),2021.
[5] 李婧.“陸態(tài)網(wǎng)絡(luò)”基準站坐標時間序列變化特性分析 [D].鄭州:解放軍信息工程大學(xué),2013.
[6] Dickey D A,F(xiàn)uller W A. Distribution of the Estimators for Autoregressive Time Series With a Unit Root [J].American Statistical Association,1979,74(366):427-431.
[7] 宋勇林. 拓展的貝葉斯信息準則的一些性質(zhì) [D].武漢:華中師范大學(xué),2014.