馮 晨,陳志德(福建師范大學(xué) 數(shù)學(xué)與信息學(xué)院,福州 350007)
2(福建省網(wǎng)絡(luò)安全與密碼技術(shù)重點(diǎn)實(shí)驗(yàn)室(福建師范大學(xué))福州 350007)
3(福建省網(wǎng)絡(luò)與信息安全行業(yè)技術(shù)開發(fā)基地,福州 350007)
隨著經(jīng)濟(jì)全球化的發(fā)展,企業(yè)面臨著生產(chǎn)成本不斷增加,市場(chǎng)銷售疲軟等考驗(yàn).企業(yè)要想贏得市場(chǎng)競(jìng)爭(zhēng)就需要對(duì)市場(chǎng)具有敏銳的嗅覺以及精準(zhǔn)的決策,從而控制成本,降低損耗.這使得企業(yè)借助精準(zhǔn)高效的銷售預(yù)測(cè),進(jìn)而做出可靠的決策,成為現(xiàn)代企業(yè)成功的重要手段[1].而對(duì)時(shí)變數(shù)據(jù)建模是數(shù)據(jù)科學(xué)中的一個(gè)基本問(wèn)題,應(yīng)用于醫(yī)學(xué),金融,經(jīng)濟(jì)學(xué),氣象學(xué)和客戶支持中心操作等各個(gè)領(lǐng)域.使用在時(shí)間序列數(shù)據(jù)上訓(xùn)練的模型來(lái)預(yù)測(cè)未來(lái)值是一個(gè)值得充分研究的領(lǐng)域,其中應(yīng)用了諸如ARIMA之類的傳統(tǒng)線性統(tǒng)計(jì)模型[2].最近較為流行的是RNN模型的應(yīng)用,特別是在處理時(shí)間序列預(yù)測(cè)的問(wèn)題上,LSTM模型的選擇記憶功能有著獨(dú)特的優(yōu)勢(shì)[3,4].Xgboost是“極端梯度上升”的簡(jiǎn)稱,該算法既具有線性模型求解器和樹學(xué)習(xí)算法的能力,同時(shí)也有著可以在單機(jī)上并行計(jì)算的能力,能夠自動(dòng)利用CPU的多線程進(jìn)行并行計(jì)算,同時(shí)精度也得到提升,相比于其他提升樹方法更為優(yōu)越[5].目前在商品銷售預(yù)測(cè)上的方法很多,如果只用傳統(tǒng)的線性回歸方法來(lái)預(yù)測(cè),就忽視了非線性因素的影響,近年來(lái),隨著深度學(xué)習(xí)的不斷研究與發(fā)展,深度學(xué)習(xí)的模型被用于時(shí)間序列的預(yù)測(cè),例如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)將時(shí)序的概念引入到網(wǎng)絡(luò)結(jié)構(gòu)中,但RNN模型也有著幾點(diǎn)關(guān)鍵性的不足,梯度的消失和梯度爆炸問(wèn)題,長(zhǎng)期記憶能力不足等問(wèn)題,進(jìn)而提出了長(zhǎng)短期記憶網(wǎng)絡(luò)模型[6],基于此,可以采用不同層次的模型進(jìn)行組合來(lái)提高模型的優(yōu)越性和泛化性[7].
本文針對(duì)商品銷售的預(yù)測(cè)進(jìn)行研究,銷售預(yù)測(cè)是一個(gè)分析和報(bào)告信息的過(guò)程,它能夠?yàn)楣芾碚咛峁┬畔⒎治龊褪袌?chǎng)研究數(shù)據(jù),在此基礎(chǔ)上進(jìn)行經(jīng)營(yíng)決策,用來(lái)解決一些特定的市場(chǎng)問(wèn)題,在當(dāng)代市場(chǎng)競(jìng)爭(zhēng)中發(fā)揮著重要的作用.中國(guó)市場(chǎng)野蠻生長(zhǎng)的紅利期已經(jīng)過(guò)去,經(jīng)濟(jì)已從速度向質(zhì)量轉(zhuǎn)變,企業(yè)競(jìng)爭(zhēng)回歸到成本、效率的問(wèn)題上來(lái).這更需要利用數(shù)據(jù)以實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng),然而銷售預(yù)測(cè)需以具體產(chǎn)品為預(yù)測(cè)對(duì)象,在實(shí)際場(chǎng)景中更存在著諸多重要的影響銷售的因素.因此,為提高預(yù)測(cè)精度,本文將銷售策略量,天氣,節(jié)假日等加入特征變量中,建立包含相關(guān)預(yù)測(cè)特征條件的多變量模型,結(jié)合ARIMA對(duì)平穩(wěn)序列的較好的預(yù)測(cè)能力以及LSTM對(duì)序列非線性部分的出色擬合性能,采用基于XGBoost和LSTM的加權(quán)組合模型進(jìn)行預(yù)測(cè),提高預(yù)測(cè)的精度.
ARMA模型,即差分自回歸移動(dòng)平均模型,如下結(jié)構(gòu)可以簡(jiǎn)記為ARMA(p,q):
當(dāng)p=0時(shí),是AR(p)模型:
當(dāng)q=0時(shí),是MA(q)模型:
本文中p,q的取值原則是采用最小信息準(zhǔn)則法.通過(guò)該方法來(lái)識(shí)別平穩(wěn)和可逆的ARMA過(guò)程[8].求解p,q在m以內(nèi)的BIC矩陣,尋找矩陣中BIC信息量最小的位置,從而確定合適的p,q的值,得到ARIMA (p,n,q).
XGBoost是一種在梯度提升決策樹算法的基礎(chǔ)上進(jìn)行改進(jìn)而來(lái)的集成學(xué)習(xí)算法[9-11].其預(yù)測(cè)原理如下:
預(yù)測(cè)值為各樣本與其權(quán)值乘積的累加和,即:
其中,為j樣本數(shù),wj為權(quán)值,xij為樣本數(shù)據(jù).XGBoost在做回歸時(shí),每棵樹是依次加入模型中,進(jìn)而提升模型的效果,這個(gè)集成可以表示為:
其中,γT為懲罰力度,為懲罰項(xiàng).γ為葉子節(jié)點(diǎn)數(shù)T的系數(shù).目標(biāo)函數(shù)由自身的損失函數(shù)和正則化懲罰項(xiàng)構(gòu)成,定義如下:
其中,obj為結(jié)構(gòu)分?jǐn)?shù),表示當(dāng)選定一個(gè)樹的結(jié)構(gòu)后,目標(biāo)減少量的最大值.
LSTM Networks是遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)的一種.后經(jīng)過(guò)不斷改進(jìn),在處理和預(yù)測(cè)時(shí)間序列相關(guān)的數(shù)據(jù)時(shí)會(huì)比一般的RNNs表現(xiàn)的更好[12].
對(duì)于原始的m×n維 數(shù)據(jù),記作:
對(duì)于多變量的數(shù)據(jù)需要轉(zhuǎn)化為監(jiān)督學(xué)習(xí)的序列,即新的數(shù)據(jù)表示為如下:
LSTM的模型中采用門的結(jié)構(gòu)來(lái)解決了長(zhǎng)期依賴問(wèn)題[13],其具體的神經(jīng)網(wǎng)絡(luò)的細(xì)胞結(jié)構(gòu)如圖1所示.
圖1 LSTM記憶細(xì)胞結(jié)構(gòu)
圖1中每個(gè)Sigmoid層產(chǎn)生的數(shù)字在0和1的范圍內(nèi).每個(gè)LSTM通過(guò)3種類型的門[14]來(lái)控制每個(gè)單元的狀態(tài):遺忘門決定了上一時(shí)刻的單元狀態(tài)ct?1有多少保留到當(dāng)前時(shí)刻ct;輸入門決定了當(dāng)前時(shí)刻網(wǎng)絡(luò)的輸入xt有多少保存到單元狀態(tài)ct.輸出門控制單元狀態(tài)ct有多少輸出到LSTM的當(dāng)前輸出值ht.每一步的狀態(tài)更新滿足以下的步驟:
這里 σ 是邏輯Sigmoid函數(shù),?表示按元素相乘;Wi,Wf,Wo,Wc是權(quán)重矩陣;bi,bf,bo,bc是偏移量.
對(duì)于實(shí)際銷售數(shù)據(jù)中,數(shù)據(jù)存在周期性,季節(jié)性的變化,通常為非平穩(wěn)的時(shí)間序列.通過(guò)差分平穩(wěn)化后,
雖然在ARIMA模型中表現(xiàn)的較好,但卻丟失了周期性和季節(jié)性特征,并且平穩(wěn)的數(shù)據(jù)無(wú)法表現(xiàn)出現(xiàn)實(shí)銷售增量變化,ARIMA模型只依靠?jī)?nèi)生變量,模型過(guò)于簡(jiǎn)單,無(wú)法捕捉序列中的非線性因素.神經(jīng)網(wǎng)絡(luò)算法在處理非線性問(wèn)題具有獨(dú)特的優(yōu)勢(shì),LSTM模型的加入可以解決以下幾個(gè)問(wèn)題,首先是銷售數(shù)據(jù)的連續(xù)性,通過(guò)特殊的數(shù)據(jù)輸入結(jié)構(gòu)使得模型在預(yù)測(cè)時(shí)結(jié)合了歷史的狀態(tài),其次對(duì)比與傳統(tǒng)的RNNs解決了輸入變長(zhǎng)的問(wèn)題,再者實(shí)際銷量的影響因素較多,而節(jié)假日,策略量的變化會(huì)帶來(lái)銷售量的異常變化,通過(guò)多變量的模型可以提升擬合的精度.此時(shí)特征較多,需要經(jīng)過(guò)處理再放入神經(jīng)網(wǎng)絡(luò)的模型中,本文中使用XGBoost算法進(jìn)行特征的抓取,充分利用多維變量中的潛在的特征.
在ARIMA,XGBoost,LST模型3種模型預(yù)測(cè)的傳遞過(guò)程會(huì)出現(xiàn)誤差累計(jì)的問(wèn)題,對(duì)此本文對(duì)3種模型的預(yù)測(cè)測(cè)結(jié)果進(jìn)行加權(quán)處理來(lái)減小誤差累計(jì)對(duì)預(yù)測(cè)結(jié)果精度的影響.具體實(shí)驗(yàn)過(guò)程如圖2所示.
圖2 XGBoost和LSTM加權(quán)組合模型預(yù)測(cè)結(jié)構(gòu)
對(duì)于收集的原始銷售序列A={x1,x2,···,xn}進(jìn)行可視化并觀察數(shù)據(jù)的基本趨勢(shì),然后采用增廣迪基-福勒檢驗(yàn)(Augmented Dickey-Fuller test,ADF),以及JUNG-BOX白噪聲檢驗(yàn)來(lái)檢驗(yàn)時(shí)間序列的平穩(wěn)性,對(duì)于線性趨勢(shì)的非平穩(wěn)時(shí)間序列,通過(guò)差分變換將其變?yōu)槠椒€(wěn)序列.收集影響銷售的特征值,特征值1,特征2···特征值n,分別記為T1,T2,···,Tn,假設(shè)A經(jīng) 過(guò)ARIMA模型后所得到的預(yù)測(cè)序列Tn+1,則有:
其中,Φ表示ARIAM模型,A(m)為前m個(gè)銷售數(shù)據(jù),A(k)為后d個(gè)數(shù)據(jù).
將由ARIAM模型所得的預(yù)測(cè)序列Tn+1加入到特征序列中構(gòu)建多維數(shù)組M={A,T1,···,Tn,Tn+1},經(jīng)過(guò)處理及標(biāo)準(zhǔn)化后放入到XGBoost模型中,得到銷量的預(yù)測(cè)序列Tn+2,則有:
其中,Θ表示XGBoost模型,Ti(m)表示第i個(gè)特征序列的前m行,Ti(k)表示第i個(gè)特征序列的后k行.
此時(shí)再將新的銷售預(yù)測(cè)序列Tn+2加入到多維數(shù)組M中得到新的數(shù)組M′={A,T1,···,Tn+1,Tn+2},然后加入到LSTM模型中得到銷量預(yù)測(cè)序列Tn+3,則有:
其中,Ψ表示LSTM模型.
最后結(jié)合3個(gè)模型的商品銷量預(yù)測(cè)量Tn+1(k),Tn+2(k),Tn+3(k),給予相對(duì)應(yīng)的權(quán)值,通過(guò)多次實(shí)驗(yàn)得出最佳的組合權(quán)值,進(jìn)而得到最終的預(yù)測(cè)值T,記為:
其中,di為各個(gè)模型的的預(yù)測(cè)值的權(quán)值.實(shí)驗(yàn)步驟如下:
步驟1.ARIAM預(yù)測(cè):單變量預(yù)測(cè)實(shí)驗(yàn),取出原數(shù)據(jù)中的實(shí)際銷售數(shù)據(jù)列X={X1,X2,···,Xn},將 {Xn}放入ARIMA的模型中,對(duì)數(shù)據(jù)列進(jìn)行ADF平穩(wěn)性檢驗(yàn)及JUNG-BOX白噪聲值檢測(cè),通過(guò)ADF檢驗(yàn)可以得到單位根檢驗(yàn)統(tǒng)計(jì)量對(duì)應(yīng)的p值,此值顯著小于0.05,則該序列平穩(wěn),通過(guò)不斷實(shí)驗(yàn)后發(fā)現(xiàn),p,q的取值通常在8以內(nèi),因此通過(guò)循環(huán)求解8以內(nèi)的BIC矩陣,找出矩陣中的最小信息量所對(duì)應(yīng)的p,q的值為1,0,得出預(yù)測(cè)模型ARIMA (1,0,0),為了使結(jié)果更加貼近現(xiàn)實(shí)情況,采滾動(dòng)預(yù)測(cè),每預(yù)測(cè)一周的銷售數(shù)據(jù)后,加入該周的實(shí)際的銷售數(shù)據(jù)來(lái)預(yù)測(cè)下一周的銷量,最后整理預(yù)測(cè)值序列,得到銷售值序列的樣本的預(yù)測(cè)序列T8.
步驟2.XGBoost預(yù)測(cè).將T8序列合并到特征序列中,分成訓(xùn)練集和測(cè)試集兩部分,然后放入到XGBoost模型中作預(yù)測(cè),將預(yù)測(cè)值記作T9.
步驟3.多維時(shí)間序列預(yù)處理.將T9合并到M中組成新的數(shù)組M1,接著對(duì)所有的特征歸一化處理,然后利用series_to_supervised函數(shù)對(duì)數(shù)據(jù)進(jìn)行處理,該函數(shù)將單變量或多變量時(shí)間序列轉(zhuǎn)換為監(jiān)督學(xué)習(xí)數(shù)據(jù)集,使用Pandas的Shift函數(shù),將原始列向后移動(dòng)k位后添加成新的列,同時(shí)將當(dāng)前時(shí)刻的除去銷售值的特征移除.
步驟4.LSTM神經(jīng)網(wǎng)搭建.LSTM模型中,搭建2個(gè)隱藏層,第一隱藏層有128個(gè)神經(jīng)元,第二隱藏層有256個(gè)神經(jīng)元,輸出層為1維的列向量,即銷售預(yù)測(cè)值,輸入變量是一個(gè)時(shí)間步(t-1)的特征,損失函數(shù)采用Mean Absolute Error (MAE),優(yōu)化算法采用Adam,激活函數(shù)采用Sigmoid,模型采用500個(gè)epochs并且每個(gè)batch的大小為15.
步驟5.數(shù)據(jù)預(yù)測(cè).經(jīng)過(guò)多次的實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)d1=0.2,d2=0.4,d3=0.4時(shí),即
其中,T為最終的銷量預(yù)測(cè)值,Tn+1為ARIMA模型的預(yù)測(cè)值,Tn+2為XGBoost模型的預(yù)測(cè)值,Tn+3為L(zhǎng)STM模型的預(yù)測(cè)值,最后將最終的加權(quán)預(yù)測(cè)值作為后13周的銷售預(yù)測(cè)值.
實(shí)驗(yàn)所使用計(jì)算機(jī)的配置如下:處理器為英特爾酷睿Duo CPU i5-6500,CPU頻率為2.20 GHz;內(nèi)存為8 GB;操作系統(tǒng)為Windows 10 (64位);基于Python 3.6編程;集成開發(fā)環(huán)境為PyCharm Community Edition 2016.LSTM的實(shí)驗(yàn)使用的是keras深度學(xué)習(xí)框架.
以某地的從2018年4月2號(hào)到11月4號(hào)的某商品銷量數(shù)據(jù)為研究對(duì)象,數(shù)據(jù)集中主要包含7個(gè)特征,分別是節(jié)假日因素,氣溫,主要策略規(guī)格的策略量以及實(shí)訂量等,如表1所示.
表1 數(shù)據(jù)特征
對(duì)于節(jié)假日因素,本文采用虛擬變量來(lái)進(jìn)行量化處理,記作T1,取每周最高氣溫的平均值及最低氣溫的平均值,分別記作T2,T3,主要策略量的實(shí)訂量記作T4,年月日分別記作T5,T6,T7,然后構(gòu)建多維數(shù)組M=(X,T1,T2,T3,T4,T5,T6,T7),劃分?jǐn)?shù)據(jù).將數(shù)據(jù)的前0.67作為訓(xùn)練集,后0.33作為測(cè)試集,對(duì)未來(lái)13周的銷售量進(jìn)行預(yù)測(cè).
在LSTM模型中,n_1為series_to_supervised函數(shù)中設(shè)置的滯后觀察數(shù)為1,即使用上一時(shí)刻的銷售量來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的銷售值,設(shè)置兩個(gè)隱藏層,第一層的神經(jīng)元個(gè)數(shù)設(shè)為128,第二層的神經(jīng)元個(gè)數(shù)設(shè)置為256,dropout隨機(jī)刪除一些隱層神經(jīng)元,通過(guò)不斷的調(diào)整這兩個(gè)參數(shù)來(lái)解決預(yù)測(cè)過(guò)程中的過(guò)擬合的問(wèn)題.具體參數(shù)設(shè)置見表2.
表2 神經(jīng)網(wǎng)絡(luò)參數(shù)
在XGBoost模型中,subsimple為訓(xùn)練的實(shí)例樣本占整體實(shí)例樣本的比例.max-depth為每棵樹的最大深度.booster為設(shè)置需要使用的上升模型.objective定義學(xué)習(xí)任務(wù)及相應(yīng)的學(xué)習(xí)目標(biāo),本文選的目標(biāo)函數(shù)為“reg:linear”-線性回歸.具體參數(shù)設(shè)置見表3.
表3 XGBoost參數(shù)
為了更好的體現(xiàn)模型的優(yōu)越性和實(shí)用性,本文主要采用兩個(gè)指標(biāo)來(lái)進(jìn)行模型的評(píng)估,第一個(gè)是均方根誤差(Root Mean Square Error,RMSE),以及一個(gè)平均準(zhǔn)確率(Mean Accuracy,MA),定義如下:
使用四種模型分別預(yù)測(cè)出后13周的銷售值,導(dǎo)出組合模型的預(yù)測(cè)值,圖3為組合模型預(yù)測(cè)值和實(shí)際銷售值的對(duì)比,銷量變化的趨勢(shì)得到較好的擬合,預(yù)測(cè)平均準(zhǔn)確率為0.968,預(yù)測(cè)誤差很好的控制在了0.05以內(nèi),預(yù)測(cè)相對(duì)準(zhǔn)確.
圖3 預(yù)測(cè)值與實(shí)際值對(duì)比
圖4反映的是單個(gè)模型及組合在每周的預(yù)測(cè)的精度對(duì)比,從圖中可以看出,不同模型預(yù)測(cè)時(shí)的表現(xiàn)的具有一定的差異性,也存在個(gè)別異常時(shí)間點(diǎn)在單個(gè)模型預(yù)測(cè)中效果不佳.首先對(duì)比3個(gè)模型的預(yù)測(cè)情況,ARIMA模型預(yù)測(cè)效果是較弱的,對(duì)于波動(dòng)的靈敏度較低,XGBoost和LSTM預(yù)測(cè)效果相對(duì)接近,因此本文主要采用簡(jiǎn)單平均法來(lái)分配權(quán)重.對(duì)比每周的預(yù)測(cè)結(jié)果,LSTM比XGBoost模型在預(yù)測(cè)精度表現(xiàn)較好,但穩(wěn)定性相對(duì)較差,因此在分配權(quán)重時(shí)既要保留XGBoost模型預(yù)測(cè)穩(wěn)定的特點(diǎn),同時(shí)也能提高模型的精度,因此對(duì)于這兩種方法賦予相同的權(quán)值.對(duì)于數(shù)據(jù)內(nèi)生變量的影響通過(guò)分配ARIAM模型相對(duì)較小的比重進(jìn)行模型的預(yù)測(cè)值的調(diào)整.基于該想法進(jìn)行預(yù)測(cè)結(jié)果的加權(quán)分析,通過(guò)計(jì)算不同比重下預(yù)測(cè)結(jié)果的平均精度和RMSE的值,發(fā)現(xiàn)在XGBoost和LSTM所占都為0.4時(shí),ARIMA占0.2時(shí),組合模型整體預(yù)測(cè)效果表現(xiàn)最佳,對(duì)于非線性部分?jǐn)M合的效果明顯的體現(xiàn)除了加權(quán)組合的優(yōu)勢(shì),對(duì)比單個(gè)模型出現(xiàn)準(zhǔn)確率在0.8附近的異常點(diǎn),組合模型的預(yù)測(cè)準(zhǔn)確率都在0.9以上,對(duì)比單獨(dú)模型預(yù)測(cè)良好的部分,組合模型保持了良好的預(yù)測(cè)精度,預(yù)測(cè)結(jié)果的精度對(duì)比單一模型有很大的提高,對(duì)于其他特征(策略量,溫度,節(jié)假日,日期)實(shí)行了一次復(fù)制,即這些變量會(huì)在每個(gè)模型行的訓(xùn)練中出現(xiàn)兩次,而結(jié)果證明訓(xùn)練集誤差幾乎一致,但是驗(yàn)證集誤差更小,表明通過(guò)特征的重復(fù)訓(xùn)練,能夠減小組合模型的過(guò)擬合程度,模型的泛化性得以提升,預(yù)測(cè)效果更佳.
圖4 不同模型預(yù)測(cè)精度對(duì)比
觀察不同模型的指標(biāo)數(shù)值,由導(dǎo)出的預(yù)測(cè)值和實(shí)際值求解出各個(gè)預(yù)測(cè)模型的RMSE指標(biāo)值和MA指標(biāo)值.通過(guò)對(duì)比不模型的RMSE和MA的值,來(lái)評(píng)估各個(gè)模型的整體的預(yù)測(cè)效果.通過(guò)表4不同模型參數(shù)的對(duì)比,組合模型的平均預(yù)測(cè)值達(dá)到了96.84%的水平,相比于ARIAM預(yù)測(cè)提高了3.28%,相比于XGBoost的預(yù)測(cè)提高了1.99%,相比于LSTM模型提高了2.28%,綜上所述,組合模型在商品銷售的預(yù)測(cè)中展現(xiàn)了優(yōu)于其他單一模型的預(yù)測(cè)效果,通過(guò)加權(quán)組合提高了模型的泛化性和有效性.
表4 不同模型預(yù)測(cè)結(jié)果對(duì)比
研究主要策略量對(duì)于模型的影響,在本文的實(shí)驗(yàn)中,結(jié)合了主要規(guī)格的策略實(shí)訂量這一特征值,而在實(shí)驗(yàn)前通過(guò)觀察不難發(fā)現(xiàn),這一主要策略量跟銷售序列有著較為緊密的聯(lián)系,首先策略量序列總是小于對(duì)應(yīng)的銷售值,其次,通過(guò)數(shù)據(jù)可視化可以發(fā)現(xiàn),當(dāng)銷售增大時(shí),策略量也增大,銷售量減少時(shí),策略量也明顯的減少,在此基礎(chǔ)上檢驗(yàn)策略量的實(shí)訂量的有無(wú)對(duì)預(yù)測(cè)的影響,通過(guò)設(shè)計(jì)對(duì)比實(shí)驗(yàn)來(lái)驗(yàn)證.實(shí)驗(yàn)結(jié)果如表5所示,在加入了策略量后,對(duì)比于未加入策略量實(shí)訂量的實(shí)驗(yàn)結(jié)果相比,預(yù)測(cè)的準(zhǔn)確率提高了4.05%,RMSE降低了0.64,說(shuō)明在其他條件不變的情況下,策略量對(duì)于銷售預(yù)測(cè)的影響較為顯著,可以通過(guò)加入該特征來(lái)輔助預(yù)測(cè).
表5 策略量對(duì)預(yù)測(cè)結(jié)果的影響對(duì)比
本文提出的基于XGBoost和LSTM加權(quán)多變量的加權(quán)組合預(yù)測(cè)模型,用來(lái)解決商品銷售的預(yù)測(cè),通過(guò)加入天氣,主策略量實(shí)訂量,節(jié)假日,日期(年月日)諸多因素來(lái)輔助預(yù)測(cè),提高預(yù)測(cè)的準(zhǔn)確率,提高模型的有效性,ARIMA在處理線性模型效果較好,LSTM神經(jīng)網(wǎng)絡(luò)可以通過(guò)學(xué)習(xí)來(lái)擬合非線性問(wèn)題,XGBoost模型則可以挖掘多維變量中不同維度的屬性,通過(guò)不同層面的模型的組合,大大的提高了模型的泛化能力,不僅針對(duì)商品銷售的預(yù)測(cè),還可以應(yīng)用于其他相關(guān)的多變量時(shí)間序列的預(yù)測(cè)領(lǐng)域,提高預(yù)測(cè)的精度,解決不同的實(shí)際問(wèn)題.但在對(duì)于該模型中的神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),過(guò)多的屬性存在過(guò)擬合的風(fēng)險(xiǎn),因此模型還可以在該方面優(yōu)化.