袁 遠(yuǎn),郭天添
(江蘇科技大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 鎮(zhèn)江 212100)
隨著人們消費(fèi)水平的提高,服裝行業(yè)的銷售量呈爆炸式增長(zhǎng),這些數(shù)據(jù)中往往隱藏了大量有價(jià)值的客戶信息。企業(yè)要想維系新老客戶的關(guān)系,掌握客戶需求,就要從這些數(shù)據(jù)中獲取用戶喜好,從而更有效地預(yù)測(cè)客戶期望并及時(shí)作出反應(yīng)。因此,從海量信息中獲取有價(jià)值的數(shù)據(jù)并加以利用成為企業(yè)提高核心競(jìng)爭(zhēng)力的必要手段之一[1]。
銷售預(yù)測(cè)研究具有一定的商業(yè)應(yīng)用價(jià)值和學(xué)術(shù)研究?jī)r(jià)值。銷售預(yù)測(cè)不僅能幫助企業(yè)合理制定銷售計(jì)劃、去除庫(kù)存,還能減少不必要的支出,提升利潤(rùn)空間。在為企業(yè)創(chuàng)造利潤(rùn)的同時(shí),可避免大量不必要的資源浪費(fèi)。因此,銷售預(yù)測(cè)一直都是研究熱點(diǎn),很多學(xué)者對(duì)銷售預(yù)測(cè)方法進(jìn)行了研究,并提出一系列改進(jìn)方法,以提高預(yù)測(cè)的準(zhǔn)確性,如文獻(xiàn)[2]通過(guò)時(shí)間序列模型ARMA 先進(jìn)行月預(yù)測(cè),然后通過(guò)PERT(計(jì)劃評(píng)審技術(shù))獲得月預(yù)測(cè)的期望值,再對(duì)兩者結(jié)果進(jìn)行加權(quán),得到最終預(yù)測(cè)結(jié)果;文獻(xiàn)[3]通過(guò)使用魯棒損失函數(shù)和小波核函數(shù)解決數(shù)據(jù)集呈正態(tài)高斯分布以及幅值波動(dòng)較大的問(wèn)題,以有效減少銷售時(shí)序中的噪音和奇異點(diǎn)問(wèn)題,并增強(qiáng)其魯棒性;文獻(xiàn)[4]通過(guò)對(duì)歷史銷售數(shù)據(jù)特征的觀察,發(fā)現(xiàn)其包括線性和非線性兩部分,結(jié)合AR?MA 模型預(yù)測(cè)數(shù)據(jù)集的線性部分和BP_AdaBoost 模型預(yù)測(cè)數(shù)據(jù)集的非線性部分,然后疊加兩者預(yù)測(cè)結(jié)果作為新的預(yù)測(cè)值,可避免ARMA 模型預(yù)測(cè)精度低的問(wèn)題,同時(shí)解決了神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致局部極小值的問(wèn)題。銷售預(yù)測(cè)的核心算法一直在改進(jìn),通過(guò)閱讀國(guó)內(nèi)外文獻(xiàn),發(fā)現(xiàn)相關(guān)算法在銷售預(yù)測(cè)方面存在的問(wèn)題,并對(duì)其進(jìn)行改進(jìn),對(duì)于提高銷售預(yù)測(cè)模型質(zhì)量與預(yù)測(cè)準(zhǔn)確性具有重要意義[5]。本文通過(guò)學(xué)習(xí)與借鑒國(guó)內(nèi)外文獻(xiàn),采用時(shí)間序列模型中預(yù)測(cè)效果較好的ARIMA 模型對(duì)線性信息進(jìn)行預(yù)測(cè),然后利用對(duì)非線性信息學(xué)習(xí)能力較強(qiáng)的隨機(jī)森林對(duì)ARIMA 模型預(yù)測(cè)殘差進(jìn)行矯正,通過(guò)構(gòu)建ARIMA-RF 組合模型對(duì)歷史銷售數(shù)據(jù)的線性和非線性特征進(jìn)行預(yù)測(cè)。
銷量預(yù)測(cè)方法通??煞譃槎ㄐ苑治龇ㄅc定量分析法,目前主流預(yù)測(cè)算法包括神經(jīng)網(wǎng)絡(luò)算法[6]、遺傳算法[7]、時(shí)間序列算法[8]、隨機(jī)森林算法等[9]。本文采用結(jié)合時(shí)間序列算法中自回歸綜合移動(dòng)平均模型與隨機(jī)森林模型的組合模型,根據(jù)歷史數(shù)據(jù)進(jìn)行銷售預(yù)測(cè)[10-11],利用隨機(jī)森林算法較強(qiáng)的線性學(xué)習(xí)能力優(yōu)化時(shí)間序列模型的預(yù)測(cè)結(jié)果殘差。通過(guò)構(gòu)建的組合模型與單個(gè)模型對(duì)比結(jié)果,發(fā)現(xiàn)組合模型的預(yù)測(cè)結(jié)果更加精確。
ARIMA(自回歸—滑動(dòng)平均混合模型)是一種時(shí)間序列方法[12]。ARIMA 是包括非平穩(wěn)情況的ARMA 模型,也是對(duì)ARMA 模型的擴(kuò)展。由于銷售數(shù)據(jù)受節(jié)假日、電商節(jié)等因素影響,歷史銷售數(shù)據(jù)并非相對(duì)平穩(wěn)的時(shí)間序列數(shù)據(jù),實(shí)際場(chǎng)景下很多序列因?yàn)榕c社會(huì)經(jīng)濟(jì)和商業(yè)有關(guān),從而表現(xiàn)出非平穩(wěn)行為,包含趨勢(shì)和季節(jié)模式的序列在本質(zhì)上也是非平穩(wěn)的,因此提出了ARIMA 模型,通過(guò)應(yīng)用數(shù)據(jù)點(diǎn)的有限差分處理使序列平穩(wěn)化,并把移動(dòng)平均模型、自回歸模型與差分法相結(jié)合,從而得到ARIMA 模型(p、d、q)。p、d和q 為整數(shù),分別為ARIMA 模型的自回歸、進(jìn)行差分的階數(shù)和移動(dòng)平均,具體公式如式(1)所示。
其中,L 是滯后算子,d∈?,d>0。
雖然ARIMA 模型可能在某些特殊情況下表現(xiàn)不佳,但其可在構(gòu)建過(guò)程中進(jìn)行優(yōu)化,以體現(xiàn)針對(duì)不同時(shí)間序列的靈活性,仍使其成為一種非常優(yōu)秀的預(yù)測(cè)方法[13]。ARIMA不僅考慮了數(shù)據(jù)特征在時(shí)間序列方面的規(guī)律性,而且減輕了其他影響因子對(duì)實(shí)驗(yàn)結(jié)果的影響,所以ARIMA 模型針對(duì)長(zhǎng)短期預(yù)測(cè)結(jié)果的準(zhǔn)確率都表現(xiàn)較為優(yōu)異[14]。其中心思想是把歷史數(shù)據(jù)集的時(shí)間序列作為變量,其取值隨著時(shí)間而變化,雖然某個(gè)時(shí)間序列的值具有不確定性,但從宏觀角度來(lái)看,完整的時(shí)間序列還是表現(xiàn)出一定規(guī)律性。因此,首先將不平穩(wěn)的時(shí)間序列轉(zhuǎn)換為平穩(wěn)的時(shí)間序列,然后通過(guò)因變量對(duì)模型的滯后值、隨機(jī)誤差項(xiàng)值和隨機(jī)誤差項(xiàng)的滯后值進(jìn)行回歸[15]。建模公式如式(2)所示。
其中,φ表示AR 的系數(shù),θ表示MA 的系數(shù),其建模流程如圖1 所示。
Fig.1 Time series ARIMA modeling process圖1 時(shí)間序列ARIMA 建模流程
首先進(jìn)行平穩(wěn)性檢驗(yàn),通過(guò)對(duì)時(shí)間序列散點(diǎn)圖的觀察初步進(jìn)行判斷;然后進(jìn)一步對(duì)單位根進(jìn)行檢驗(yàn),判斷其是否平穩(wěn),若不平穩(wěn)則需要利用差分等方式將其平穩(wěn)化;之后進(jìn)行模型識(shí)別與定階,確定滯后系數(shù)和模型。可通過(guò)檢驗(yàn)?zāi)P蜌埐钚蛄校?6]判斷其有效性,因?yàn)樵谀P蜆?gòu)建過(guò)程中,容易在滯后項(xiàng)階數(shù)選擇時(shí)出現(xiàn)偏差。模型構(gòu)建完成后,再根據(jù)歷史銷售數(shù)據(jù)預(yù)測(cè)未來(lái)一段時(shí)期的銷售量。此外,通常會(huì)利用一些固定指標(biāo)對(duì)模型進(jìn)行判斷。ARIMA(p,d,q)模型的判斷指標(biāo)為AIC,具體公式如式(3)所示。
式中,L 為極大似然估計(jì)值,懲罰函數(shù)為2k,如果模型中有截距或常數(shù)項(xiàng),k=p+q+1,否則k=p+q。
隨機(jī)森林模型通過(guò)訓(xùn)練多棵決策樹(shù),將每棵決策樹(shù)的投票結(jié)果匯總作為預(yù)測(cè)值,其中每棵樹(shù)都是基于一個(gè)獨(dú)立隨機(jī)向量的值產(chǎn)生的[17],森林中每棵樹(shù)的建立都涉及兩次隨機(jī)過(guò)程:第一次隨機(jī)過(guò)程是在訓(xùn)練集構(gòu)造過(guò)程中使用Bootstrap 方式從原始數(shù)據(jù)中進(jìn)行有放回的抽樣,這樣獲得訓(xùn)練集的最大特點(diǎn)在于有一部分?jǐn)?shù)據(jù)會(huì)重復(fù)出現(xiàn)在訓(xùn)練子集中,有一部分則不會(huì)出現(xiàn),不會(huì)出現(xiàn)的這部分?jǐn)?shù)據(jù)稱為袋外數(shù)據(jù)OOB(Out-of-Bag),大概占到原始數(shù)據(jù)的三分之一,也被用來(lái)估計(jì)森林的強(qiáng)度和相關(guān)度;第二次隨機(jī)過(guò)程在于特征選擇的隨機(jī)性,在基分類器決策樹(shù)構(gòu)建過(guò)程中不斷從所有屬性特征中選擇一部分按照一定衡量標(biāo)準(zhǔn)進(jìn)行排序,組成決策樹(shù)的每一個(gè)節(jié)點(diǎn),從而大大增加了決策樹(shù)構(gòu)建的隨機(jī)性。兩次隨機(jī)過(guò)程帶來(lái)的優(yōu)勢(shì)在于:第一次隨機(jī)過(guò)程使得構(gòu)建的決策樹(shù)對(duì)數(shù)據(jù)有了不同側(cè)重點(diǎn),保證樹(shù)與樹(shù)之間盡可能相對(duì)獨(dú)立;第二次隨機(jī)過(guò)程使得每棵樹(shù)的特征組合呈現(xiàn)多樣性,基分類決策樹(shù)對(duì)不同特征有了不同的關(guān)注度,更能作出準(zhǔn)確判斷[18]。兩次隨機(jī)性的加入,使得隨機(jī)森林能夠防止過(guò)擬合情況出現(xiàn),模型泛化能力更強(qiáng),對(duì)噪聲更具魯棒性,從而使整體預(yù)測(cè)精度得以提升。
隨機(jī)森林模型是對(duì)多棵決策樹(shù)的集成算法,模型利用Bootstrap 隨機(jī)抽樣以及節(jié)點(diǎn)隨機(jī)劃分完成對(duì)多棵決策樹(shù)的構(gòu)建,然后由這些決策樹(shù)進(jìn)行投票,以投票結(jié)果作為最終分類或回歸結(jié)果。主要流程如圖2 所示。
Fig.2 Random forest generation and decision process圖2 隨機(jī)森林生成及決策流程
Gini 系數(shù)是隨機(jī)森林的重要性度量指標(biāo)[19]。每棵決策樹(shù)投票結(jié)果都為其所對(duì)應(yīng)特征的投票結(jié)果,在解決分類問(wèn)題時(shí),以Gini 系數(shù)和信息增益劃分特征值,而處理回歸問(wèn)題時(shí),則采用最小二乘擬合法或計(jì)算方差法劃分?jǐn)?shù)據(jù)集中的特征。Gini 系數(shù)衡量樹(shù)節(jié)點(diǎn)的不純性公式如式(4)所示。
其中,t為決策樹(shù)節(jié)點(diǎn)特征,p2(j/t)表示j類目標(biāo)在其對(duì)應(yīng)節(jié)點(diǎn)的比例。最小二乘偏差法適合回歸樹(shù)構(gòu)建,誤差公式如式(5)所示。
式中,nt為節(jié)點(diǎn)數(shù)據(jù)實(shí)例數(shù),kt為實(shí)例數(shù)據(jù)目標(biāo)值,kt=(∑yi)/nt,節(jié)點(diǎn)t的最小二乘偏差標(biāo)準(zhǔn)為使式(6)最大。
對(duì)于現(xiàn)實(shí)背景下的問(wèn)題,組合模型通??商岣哳A(yù)測(cè)結(jié)果的準(zhǔn)確率[20]。常見(jiàn)組合模型方法有:①平均法。對(duì)于組合模型中的輸出值取平均值;②投票法。根據(jù)模型對(duì)應(yīng)的投票數(shù)決定是否采用該模型或?qū)Χ鄠€(gè)模型進(jìn)行組合等[21-22]。時(shí)間序列模型受非線性特征及隨機(jī)變量等影響因子影響較大,而對(duì)于商家地理位置、外部天氣情況、客流量等非線性信息無(wú)法很好地進(jìn)行處理,所以大部分時(shí)間序列預(yù)測(cè)模型都是根據(jù)歷史趨勢(shì)預(yù)測(cè)未來(lái)走向。機(jī)器學(xué)習(xí)模型對(duì)數(shù)據(jù)量較大、特征維度較高的歷史銷售數(shù)據(jù)能處理得更好,其中隨機(jī)森林更是經(jīng)典的機(jī)器學(xué)習(xí)模型,近年來(lái)在處理現(xiàn)實(shí)背景下的實(shí)際問(wèn)題中具有更好的效果。實(shí)驗(yàn)通過(guò)對(duì)隨機(jī)森林模型不斷調(diào)參,增強(qiáng)其學(xué)習(xí)能力。隨機(jī)森林模型是從分類拓展到回歸應(yīng)用的集成模型,其按照輸入的最小誤差進(jìn)行劃分,對(duì)于外部天氣情況、是否節(jié)假日、客流量等非線性特征的影響更為重視,而這些影響體現(xiàn)在時(shí)間序列預(yù)測(cè)模型殘差中,需要對(duì)ARIMA 預(yù)測(cè)模型殘差進(jìn)行優(yōu)化,以提高實(shí)驗(yàn)?zāi)P偷念A(yù)測(cè)準(zhǔn)確度。
ARIMA 模型對(duì)于特征維度多、需要預(yù)測(cè)未來(lái)較長(zhǎng)時(shí)間周期的情況相比其他時(shí)間序列模型表現(xiàn)更佳[23],因此本文選擇ARIMA 時(shí)間序列模型預(yù)測(cè)銷量,并對(duì)其品牌的歷史銷量數(shù)據(jù)進(jìn)行預(yù)測(cè)分析。隨機(jī)森林模型在機(jī)器學(xué)習(xí)模型中的表現(xiàn)也尤為出色,可綜合兩者優(yōu)勢(shì)組合成ARIMA-RF 模型以提高預(yù)測(cè)精度。
整個(gè)組合模型主要分為以下幾部分:數(shù)據(jù)預(yù)處理、ARIMA 模型預(yù)測(cè)、隨機(jī)森林訓(xùn)練和ARIMA 預(yù)測(cè)數(shù)據(jù)矯正。組合模型設(shè)計(jì)如圖3 所示。
Fig.3 Combinatorial model design圖3 組合模型設(shè)計(jì)
首先在數(shù)據(jù)預(yù)處理部分,對(duì)于銷售預(yù)測(cè)而言,一批干凈、完整的優(yōu)良數(shù)據(jù)是保證模型準(zhǔn)確、可靠的基石,而獲取的歷史數(shù)據(jù)通常不規(guī)則,且包含異常值和噪聲干擾,因此需要事先對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行一系列預(yù)處理。通過(guò)調(diào)研業(yè)務(wù),深入理解變量間的關(guān)系,清洗數(shù)據(jù)集并處理缺失值、離散值和分類變量,并根據(jù)數(shù)據(jù)特征選擇合適的模型作小范圍的數(shù)據(jù)驗(yàn)證,之后再針對(duì)性地對(duì)模型進(jìn)行優(yōu)化。首先針對(duì)實(shí)際業(yè)務(wù)場(chǎng)景,構(gòu)建合適的預(yù)測(cè)模型;然后觀察銷量突變現(xiàn)象,分析相關(guān)影響因子;最后處理異常離散值,降低不良影響。取數(shù)據(jù)集中2015 年一整年的測(cè)試數(shù)據(jù)觀察銷售量時(shí)序分布情況,如圖4 所示。
Fig.4 Time series distribution under day dimension圖4 以天為周期維度的時(shí)間序列分布
通過(guò)觀察發(fā)現(xiàn),以天為統(tǒng)計(jì)周期的歷史銷售數(shù)據(jù)過(guò)于分散,天與天之間并沒(méi)有明顯的周期性特征,難以捕捉相關(guān)規(guī)律。出于對(duì)業(yè)務(wù)數(shù)據(jù)的理解,考慮挖掘以周為循環(huán)周期的變化趨勢(shì)。對(duì)于周的劃分,在銷售時(shí)間上將銷售數(shù)據(jù)的日期換算成對(duì)應(yīng)農(nóng)歷周。這是由于服裝與其他快銷產(chǎn)品不同,其銷售情況受溫度季節(jié)影響較大。而農(nóng)歷24 節(jié)氣對(duì)應(yīng)地球公轉(zhuǎn)周期,農(nóng)歷周相比公歷的月份周更能準(zhǔn)確反映不同階段的氣溫變化,這在以年為周期維度擬合趨勢(shì)時(shí)能更明顯地體現(xiàn)出隱藏的溫度變化趨勢(shì)。因此,新建農(nóng)歷周換算表,映射具體date 對(duì)應(yīng)的農(nóng)歷周份。
ARIMA 模型預(yù)測(cè)則是將歷史銷售數(shù)據(jù)的n 個(gè)特征用時(shí)間序列表示,針對(duì)這些歷史時(shí)間序列進(jìn)行特征根校驗(yàn),在判斷平穩(wěn)性后構(gòu)建AIC 指標(biāo)最小時(shí)的ARIMA 模型,預(yù)測(cè)未來(lái)某一階段的時(shí)間序列集合,最后計(jì)算模型預(yù)測(cè)結(jié)果與實(shí)際值的誤差。之后,通過(guò)訓(xùn)練隨機(jī)森林模型對(duì)誤差值進(jìn)行矯正優(yōu)化,在隨機(jī)森林訓(xùn)練過(guò)程中,可發(fā)現(xiàn)特征之間的聯(lián)系,從而判斷哪些特征對(duì)預(yù)測(cè)結(jié)果的影響微乎其微,并將這些無(wú)關(guān)特征值去除。最后通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),一些重要特征對(duì)預(yù)測(cè)值影響較大,數(shù)據(jù)特征相關(guān)圖如圖5 所示,其中像素塊越紅,代表相關(guān)性越強(qiáng)。
實(shí)驗(yàn)最后通過(guò)訓(xùn)練完成的隨機(jī)森林模型提純ARIMA模型的誤差值,修正ARIMA 模型預(yù)測(cè)結(jié)果,得出新的預(yù)測(cè)值,根據(jù)本文設(shè)計(jì)好的評(píng)價(jià)指標(biāo)對(duì)比單個(gè)實(shí)驗(yàn)?zāi)P皖A(yù)測(cè)結(jié)果,以期達(dá)到更高的預(yù)測(cè)精度。
Fig.5 Data feature correlation graph圖5 數(shù)據(jù)特征相關(guān)圖
本文以某快銷服飾品牌上海門(mén)店2015 年1 月-2019 年12 月的實(shí)際銷售數(shù)據(jù)作為分析數(shù)據(jù),同時(shí)利用Python 通過(guò)網(wǎng)絡(luò)爬蟲(chóng)從國(guó)家氣象局網(wǎng)站抓取了上海市2015 年1 月-2019 年12 月的歷史天氣數(shù)據(jù)?;谏鲜鰯?shù)據(jù)建立預(yù)測(cè)模型,預(yù)測(cè)該品牌在上海市未來(lái)一年每日的銷售數(shù)據(jù)。企業(yè)可根據(jù)預(yù)測(cè)數(shù)據(jù)優(yōu)化運(yùn)營(yíng),降低庫(kù)存與成本,并提升流程效率。原始數(shù)據(jù)如表1 所示。每條數(shù)據(jù)都是一件服裝完整的銷售記錄,例如sku 標(biāo)識(shí)了服裝唯一id,color 標(biāo)識(shí)顏色,season 標(biāo)識(shí)服裝目標(biāo)售賣季節(jié),salenum 標(biāo)識(shí)服裝售賣件數(shù),tag_price 標(biāo)識(shí)吊牌銷售價(jià)格,saleprice 標(biāo)識(shí)實(shí)際銷售價(jià)格,以及產(chǎn)品庫(kù)存、是否節(jié)假日、是否為電商款等多種屬性。將2015-2018 年的數(shù)據(jù)作為訓(xùn)練集,2019 年全年的數(shù)據(jù)作為測(cè)試集。訓(xùn)練集用來(lái)對(duì)組合模型進(jìn)行訓(xùn)練,測(cè)試集的預(yù)測(cè)結(jié)果用來(lái)與真實(shí)銷售數(shù)據(jù)進(jìn)行銷量對(duì)比分析,從而計(jì)算組合模型的預(yù)測(cè)精度。
Table 1 Raw data overview表1 原始數(shù)據(jù)概覽
模型建立后需要通過(guò)一定方法進(jìn)行評(píng)估,以衡量該模型是否高效。在實(shí)際應(yīng)用中,通常將驗(yàn)證數(shù)據(jù)集代入模型中運(yùn)行,獲取實(shí)驗(yàn)結(jié)果并與實(shí)際值作比較,根據(jù)不同指標(biāo)衡量模型表現(xiàn),以此評(píng)估模型優(yōu)劣。通常采用如下指標(biāo):
(1)平均絕對(duì)誤差。MAE(平均絕對(duì)誤差)表示預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間差值絕對(duì)值的平均數(shù),該評(píng)價(jià)指標(biāo)是對(duì)絕對(duì)誤差損失的預(yù)期值。計(jì)算公式如式(7)所示,其中a代表預(yù)測(cè)值,b代表實(shí)際值。
(2)均方根誤差。RMSE(均方根誤差)表示預(yù)測(cè)結(jié)果與實(shí)際結(jié)果誤差的平方同序列長(zhǎng)度之比的平方根,該指標(biāo)對(duì)應(yīng)于平方誤差的期望。計(jì)算公式如式(8)所示。
其中,n 為預(yù)測(cè)序列長(zhǎng)度,a 為真實(shí)銷售數(shù)量,b 為預(yù)測(cè)值。雖然RMSE 可以評(píng)判模型預(yù)測(cè)結(jié)果平方誤差大小,為衡量模型優(yōu)劣提供一定的科學(xué)依據(jù),但其不能作為衡量模型優(yōu)劣的決定性指標(biāo),理應(yīng)同時(shí)考慮其他指標(biāo)情況,綜合比對(duì)模型,從而得到更具說(shuō)服力的結(jié)論。
Table 2 Comparison of prediction results of different experimental models表2 不同實(shí)驗(yàn)?zāi)P皖A(yù)測(cè)結(jié)果比較
從表2 中可以看出,ARIMA-RF 組合模型相比單一模型,平方絕對(duì)誤差與均方根誤差都有所下降,銷量預(yù)測(cè)精度總體上優(yōu)于單一模型。說(shuō)明ARIMA-RF 組合預(yù)測(cè)模型發(fā)揮了兩種模型的優(yōu)勢(shì),相較于單一模型預(yù)測(cè)效果更佳,更適用于本文的商業(yè)環(huán)境。
本文以某快銷服飾品牌上海門(mén)店近5 年的銷售數(shù)據(jù)為基礎(chǔ),依次構(gòu)建了RF 模型、ARIMA 模型以及優(yōu)化后的ARI?MA-RF 組合模型。在相同數(shù)據(jù)集的基礎(chǔ)上通過(guò)實(shí)驗(yàn)比較預(yù)測(cè)結(jié)果的各項(xiàng)評(píng)價(jià)指標(biāo),發(fā)現(xiàn)ARIMA-RF 組合模型的RMSE(均方根誤差)和MAE(平均絕對(duì)誤差)均優(yōu)于單一模型的實(shí)驗(yàn)結(jié)果,證明了ARIMA-RF 模型對(duì)于商業(yè)環(huán)境下的服飾銷售預(yù)測(cè)具有更高精度,同時(shí)分析其實(shí)用性,以期在更多領(lǐng)域加以應(yīng)用。由于實(shí)際銷售情況會(huì)受到很多其他外界情況影響,所以實(shí)驗(yàn)效果還存在進(jìn)一步提升的空間。