李釗慧 張康林
摘 要:汽車銷售過程中存在新車與二手車銷售不平均、放款受季節(jié)影響等問題。而人工神經(jīng)網(wǎng)絡(luò)適用于處理不規(guī)則、非線性的汽車銷量數(shù)據(jù),基于BP算法和LSTM算法建立15日的汽車銷售預(yù)測模型,比較二者的預(yù)測效果,可以幫助銷售商處理放款量及放款金額的不確定性問題。結(jié)果顯示,LSTM模型對于受季節(jié)因素影響的汽車銷售數(shù)據(jù)在銷售臺數(shù)和銷售金額趨勢預(yù)測方面更為有效合理,在模型預(yù)測的精度上比BP模型效果更優(yōu),可為汽車行業(yè)的銷售預(yù)測提供參考。
關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò);銷售預(yù)測;BP算法;LSTM算法
中圖分類號:F724.7 ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? ?文章編號:1673-291X(2020)20-0084-05
引言
隨著我國人們生活水平的提高,我國汽車銷售市場重心開始下沉,汽車行業(yè)痛點(diǎn)顯現(xiàn)。在此競爭局面下,以經(jīng)銷商的銷售能力為中心解決強(qiáng)壓庫存的難題,以節(jié)約汽車相關(guān)企業(yè)的經(jīng)營成本和經(jīng)營風(fēng)險(xiǎn)為目標(biāo)顯得尤為重要。通過建立汽車銷售預(yù)測模型,合理規(guī)劃產(chǎn)能安排放款金額,免掉不必要的多余費(fèi)用,是降低經(jīng)營成本的重要舉措。
BP算法是人工神經(jīng)網(wǎng)絡(luò)中重要的一個(gè)算法,在解決非線性系統(tǒng)問題時(shí)優(yōu)勢明顯,不少學(xué)者通過進(jìn)行持續(xù)改進(jìn)[1-3],在預(yù)測股價(jià)、電力、鋼鐵等方面應(yīng)用價(jià)值突出[4-6]。楊婷、楊根科、潘常春[7](2009)利用BP神經(jīng)網(wǎng)絡(luò)定性分析每個(gè)因素的權(quán)重,建立了汽車故障率預(yù)測模型。羅戎蕾、劉紹華、蘇晨[8](2014)將對服裝銷售影響因子分為季節(jié)、節(jié)假日和品類因素,建立3層BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)銷售預(yù)測網(wǎng)絡(luò)模型。王錦、趙德群[9](2018)將BP神經(jīng)網(wǎng)絡(luò)與遺傳算法相結(jié)合,發(fā)現(xiàn)可以更好地預(yù)測北京市某大型超市的大米日銷量。而LSTM算法是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種變體,在深度學(xué)習(xí)后能更好地處理序列化數(shù)據(jù),其在電力負(fù)荷、流量等預(yù)測具有良好的預(yù)測效果[10-13]。李鵬、何帥等[14](2018)使用自適應(yīng)矩估計(jì)算法進(jìn)行深度學(xué)習(xí)發(fā)現(xiàn)LSTM算法在預(yù)測中精度較高。李珍珍、吳群[15](2019)在Pytorch框架下搭建LSTM模型對上證、深證指數(shù)和國內(nèi)特定4支股票的最高價(jià)進(jìn)行預(yù)測,發(fā)現(xiàn)在短時(shí)間內(nèi)股票預(yù)測結(jié)果與真實(shí)值接近程度高,長時(shí)間則出現(xiàn)相差較大的問題。宋剛、張?jiān)品?、包芳勛和秦超[16](2019)通過自適應(yīng)學(xué)習(xí)策略的PSO優(yōu)化算法對LSTM模型的關(guān)鍵參數(shù)進(jìn)行尋優(yōu),提高股票價(jià)格預(yù)測精度。因此,本文選擇使用BP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)解決汽車銷售相關(guān)的預(yù)測問題。
一、BP算法和LSTM算法原理
(一)BP算法簡介
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)由Rumelhart和McClelland等科學(xué)家[17](1986)提出,用梯度下降法的基本理念和梯度搜索技術(shù),目標(biāo)是求得網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差為最小。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層三部分組成,結(jié)構(gòu)示意如圖1所示。
圖1中,Xi表示來自第i個(gè)神經(jīng)元的輸入,Wh表示從輸入層到隱藏層第i個(gè)神經(jīng)元的連接權(quán)重,ho表示偏置項(xiàng),f(x)表示激活函數(shù),O表示模型計(jì)算輸出值,y表示最終輸出值。本文選取的是Sigmoid+Adaline模型。
在上述模型的基礎(chǔ)上,又細(xì)分為4組。
由其特性,本文將收集到的汽車銷售數(shù)據(jù)分為15天為一周期,將對象分為二手車、新車,使得BP算法在應(yīng)用于解決本文中汽車銷售放款問題時(shí)可以一定程度上避免陷入局部極小值。
(二)LSTM算法簡介
LSTM(Long Short Term Mermory network)神經(jīng)網(wǎng)絡(luò)在1997年由Sepp Hochreiter[19]等人提出,主要改良了循環(huán)神經(jīng)網(wǎng)絡(luò)在處理距離較遠(yuǎn)的序列時(shí)的梯度消失問題。LSTM實(shí)現(xiàn)了3個(gè)門計(jì)算,即遺忘門、輸入門和輸出門。?滓表示sigmoid激活函數(shù),wf表示遺忘門的權(quán)重矩陣,wi表示輸入門的權(quán)重矩陣,w′c表示更新門的權(quán)重矩陣,wo表示輸出門的權(quán)重矩陣,bf表示遺忘門的偏置,bi表示輸入門的偏置,b′c表示更新門的偏置,bo表示輸出門的偏置,ht表示t時(shí)刻的輸出,C′t表示t時(shí)刻更新的細(xì)胞狀態(tài)。
二、某公司汽車銷售預(yù)測分析
(一)處理數(shù)據(jù)
1.日期整理
本文收集并整理了某公司汽車銷售數(shù)據(jù),并非傳統(tǒng)連續(xù)型數(shù)據(jù),時(shí)間范圍為2017年9月30日至2019年2月20日,共510個(gè)離散數(shù)據(jù),補(bǔ)全缺失的數(shù)據(jù)。
2.數(shù)據(jù)分類
按照汽車類別分為兩類:①新車;②二手車。按照汽車銷售屬性分為兩類:①銷售臺數(shù);②銷售金額。做預(yù)測時(shí)分別預(yù)測臺數(shù)和金額,給公司的庫存系統(tǒng)和業(yè)務(wù)員的業(yè)績重點(diǎn)提供參考。為了避免陷入局部極小值和梯度消失等問題,將510天的數(shù)據(jù)每隔15天為一周期進(jìn)行合計(jì),缺失值以0為記錄,構(gòu)建完整有效的數(shù)據(jù)集,預(yù)處理后得到:①15天新車臺數(shù);②15天新車銷售金額;③15天二手車臺數(shù);④15天二手車銷售金額。
(二)BP算法和LSTM算法參數(shù)設(shè)計(jì)
本文的硬件環(huán)境和軟件環(huán)境,具體如表1所示。
根據(jù)對數(shù)據(jù)的預(yù)處理分析,BP和LSTM訓(xùn)練模型的參數(shù)設(shè)置總結(jié)如表2所示。
本文選取均方誤差(MSE)以及決定系數(shù)(R2)作為兩個(gè)模型預(yù)測精準(zhǔn)度的評價(jià)指標(biāo)[21,22],其中,均方誤差是指參數(shù)估計(jì)值與參數(shù)真值之差平方的期望值,計(jì)算公式如(1);決定系數(shù)也稱擬合優(yōu)度,計(jì)算公式如(2)。
(三)預(yù)測結(jié)果對比分析
某公司2017年9月30日至2019年2月20日的日銷售數(shù)據(jù)共計(jì)510條,分別對15天新車臺數(shù)、15天新車銷售金額、15天二手車臺數(shù)和15天二手車銷售金額共4類需要進(jìn)行預(yù)測的數(shù)據(jù)進(jìn)行預(yù)測。左圖為BP模型的預(yù)測結(jié)果,右圖為LSTM模型的預(yù)測結(jié)果,藍(lán)色表示真實(shí)數(shù)據(jù),紅色表示預(yù)測數(shù)據(jù)。預(yù)測結(jié)果如下。