張建彬 霍佳震
摘 要: 在大數(shù)據時代背景下,如何利用大量的銷售數(shù)據精準預測顧客未來需求,成為企業(yè)制定客戶管理和庫存管理決策的一個重要問題。目前關于用戶購買行為預測的研究中很少能夠預測用戶具體的購買時間?;谝延械匿N售數(shù)據,提出了基于機器學習和Stacking集成的綜合預測模型預測用戶的購買行為,即未來是否購買及其購買時間。將模型應用在一家大型連鎖零售企業(yè)的需求預測中,并對方法的有效性進行評估。結果表明,基于Stacking集成的融合模型對預測用戶未來是否購買具有最佳性能,準確率達85%,AUC值達到0.928; LightGBM集成算法在預測用戶購買時間時具有最優(yōu)性能,相比于融合模型提升了5.5%的預測性能;融合模型+LightGBM算法的組合相比于均使用融合模型提升了9.4%的預測性能。
關鍵詞: 組合預測;機器學習;購買行為預測;LightGBM算法;Stacking集成
Abstract: In the era of the big data, how to use a large amount of sales data to accurately predict customers' future demand is an important issue for companies to make customer management and inventory management decisions. Currently,few studies on the prediction of consumers purchase behavior can predict the specific purchase time. Based on the existing sales data, this paper proposes a comprehensive prediction model based on the integration of machine learning and Stacking to predict future purchase behavior of consumers. We applied the model to the demand forecast of a large retail chain and evaluated the effectiveness of the method. The results show that the fusion model based on Stacking has the best performance for predicting whether consumers will purchase in the future, and the accuracy rate is 85%, the AUC value is 0.928; the LightGBM integrated algorithm has the best performance in predicting the consumer purchase time, which improves the prediction performance by 5.5% compared with the fusion model; the combination of the fusion model + LightGBM algorithm improves the prediction performance by 9.4% compared with that applying the fusion models in predicting both whether to buy and when to buy.
Key words: combination forecast; machine learning; purchase behavior prediction; LightGBM algorithm; Stacking integration
在企業(yè)客戶管理中,要求企業(yè)對投資支出的成本和收益進行評估,并在一段時間內為營銷和銷售活動確定最優(yōu)的資源配置。因此,了解顧客在未來一段時間內的購買行為是銷售和市場部門有效分配資源的關鍵驅動力之一(Allenby, Leone & Jen, 1999)。同時,這些信息在制定倉庫(或銷售點)的庫存計劃,以及制造商制定生產計劃時也至關重要。
目前預測用戶購買行為的研究主要集中在預測用戶是否購買(Martínez,et al., 2018;Liu et al., 2019),很少研究用戶具體的購買時間。本文提出一種使用Stacking方法融合多種決策樹模型的組合預測模型來預測用戶未來是否購買和其具體的購買時間。該模型采用Stacking模型融合的思想將LightGBM、XGBoost、隨機森林三種不同的集成決策樹模型的預測結果進行融合,然后基于融合的預測結果使用簡單的邏輯回歸分類模型和線性回歸模型分別預測用戶未來是否購買和具體的購買時間。此外,在本研究中,我們使用真實的零售企業(yè)銷售數(shù)據對所提出方法的預測性能進行了評估。
1 文獻綜述
用戶購買行為預測在很早的時候便引起學者們的關注(Herniter, 1973),但是由于過去歷史數(shù)據的缺乏導致這方面的研究長期停滯不前。用戶購買行為預測中最具挑戰(zhàn)的問題是當用戶的當前狀態(tài)無法直接觀察,同時可用的歷史記錄非常少的情況下,對用戶購買行為的預測(Platzer et al. 2016)。在過去的幾年中,信息技術的飛躍發(fā)展使得用戶交易數(shù)據的可用性極大增加(Wu et al., 2013)。這些用戶交易數(shù)據的初始分析通常以匯總統(tǒng)計的形式進行,例如平均訂單數(shù)量或訂單平均訂購量,以及與用戶行為有關的信息特征等。
在數(shù)據可用性極大增加的情況下,機器學習和數(shù)據挖掘技術經常被用于基于用戶的預測中,而用戶流失預測是該領域中的重要問題之一。近年來,用戶流失的概念和相關的預測分析已得到了很好的研究(Richter et al., 2010; Lin et al., 2011; Amin et al., 2017)。準確地預測用戶購買行為能夠為企業(yè)制定庫存和銷售計劃提供依據,從而減少銷售損失和不必要的庫存成本。因此,近年來有不少研究關注于預測用戶的未來購買行為。Martínez等(2018)提出了一個動態(tài)的、數(shù)據驅動的框架,用于預測非合同環(huán)境下用戶是否打算在不久的將來在公司內進行購買。Liu等(2019) 根據給定的用戶購買歷史記錄,通過非參數(shù)貝葉斯模型預測用戶的下一次購買。
上述對未來用戶購買行為預測的研究中,僅關注于未來一段時間內用戶是否會購買,而并沒有預測用戶具體的購買時間。因此,本文將在預測未來一段時間內用戶是否會購買的基礎上,進一步預測會購買用戶的具體購買時間。
可用于購買行為預測的方法有許多,具體包括時間序列分析、面板數(shù)據模型、基于機器學習的模型和隨機模型(例如BG/ NBD模型)。時間序列分析包括諸多不同的方法,例如指數(shù)平滑法(Hussain et al.,2012; Tratar et al.,2016)、移動平均法(Lee and Fambro,1999)、自回歸集成移動平均(ARIMA)模型(Ramos et al.,2015; Amini et al.,2016)等。對于這些方法的研究較為成熟,但是這些方法沒有納入足夠的因素,或者沒有考慮到個人的影響。面板數(shù)據(Ren et al.,2014)和隨機數(shù)據模型(Fader &Hardie,2002)比時間序列分析包含更多的因素,目前已成功應用在各種與預測有關的業(yè)務場景中。另一方面,基于機器學習的模型則可以考慮更多的因素,可考慮更多的變量(Choi et al., 2014)。
隨著數(shù)據可獲得性的提高,越來越多研究基于機器學習的預測模型來預測用戶的未來購買行為。這些基于機器學習的預測方法主要包括邏輯回歸(Martínez et al., 2018)、支持向量機(Lu et al., 2014; Candelieri, 2017)、人工神經網絡(Günay,2016; Chawla et al.,2019)、梯度提升決策樹(GBDT)(Martínez et al., 2018)等。Lu等(2014)基于特征變量選擇,采用支持向量機回歸的方法構建了針對計算機產品的混合預測模型,結果表明對于計算機這類具有高度可替代性的產品,該預測模型具有良好的預測性能,能夠為銷售管理提供更多有用的信息。另外,Martínez等(2018)提出了一個動態(tài)的、數(shù)據驅動的框架,比較了邏輯回歸、神經網絡、梯度提升決策樹(GBDT)三種機器學習算法的預測性能,結果表明梯度提升決策樹具有最佳的預測性能。這些研究大多使用單一的預測模型,通過將多種不同的單一模型進行比較,從而發(fā)現(xiàn)表現(xiàn)性能較好的一種或幾種預測方法。
采用單一的預測模型雖然研究方法相對成熟,但容易受到其他一些隨機因素的影響,導致預測準確率不太高,且模型一般僅適用于特定環(huán)境,泛化能力不夠強。因此,為了有效減少或者抵消單個模型中的隨機因素的影響、提高預測模型的預測精度和可信度,一些學者使用不同的組合模型來解決預測問題(汪同三與張濤,2008)。倪冬梅等(2013)基于對需求影響因素分析建立了基于ARIMA 的時間序列和多元回歸相結合的綜合需求預測模型,并將該綜合預測模型與庫存決策相結合,構建了需求預測與庫存決策集成模型。結果表明,綜合預測模型的預測精度高于單階段模型; 需求預測與庫存決策集成模型的成本遠低于非集成模型。Fan等(2017)利用汽車行業(yè)歷史銷售數(shù)據和在線評論數(shù)據,采用Bass模型和情感分析相結合的方法對汽車需求進行預測。結果表明,相比于標準的Bass模型和其他銷售預測模型,組合模型具有更高的預測精度。
由以上研究可以發(fā)現(xiàn),在大多數(shù)情況下組合預測模型相比于單一的預測模型具有更好的預測性能。因此,本文在上述研究的基礎上,將前沿機器學習技術XGBoost算法、LightGBM算法、隨機森林算法與Stacking集成學習方式有效結合,提出一種基于多個差異化模型的組合預測模型來預測用戶未來的購買行為。
2 研究方法
本文提出了基于Stacking融合模型的用戶購買行為預測方法。圖1描述了整個方法的總體框架。
首先,采用所有用戶的原始數(shù)據集來分別預測用戶是否購買和用戶的購買時間。使用完整的數(shù)據進行兩個方面內容的預測能夠保證數(shù)據的一致性,同時使得模型能夠最大可能地利用數(shù)據,從而提升模型整體的預測性能。
其中,用戶是否購買預測的目標為使用分類模型預測下一段時間內用戶是否購買目標商品,即得到會購買目標商品的用戶用戶集。具體如下:首先收集所需的數(shù)據,同時進行分析和處理,得到噪聲較少以及更加結構化的數(shù)據集。其次,根據用戶購買行為分析進行特征選擇和特征構建,得到較高維度的特征數(shù)據集。然后,將特征數(shù)據集輸入Stacking分類融合模型中進行有效的訓練。最后,即訓練得到的分類融合模型進行樣本外預測,得到預測結果1,即預測得到未來一段時間內將會購買目標商品的用戶集。
用戶購買時間預測的目標為使用回歸模型預測下一段時間內每個用戶具體的購買時間。這一步驟與用戶是否購買預測的步驟類似,即先進行數(shù)據收集和處理,接著進行特征選擇和特征構建,然后使用Stacking回歸融合模型進行訓練,最后對訓練得到的回歸融合模型進行樣本外預測,得到預測結果2,即預測得到未來一段時間內所有用戶的購買時間。
本文的最終目標是預測得到下一段時間內會購買目標商品用戶的具體購買時間。因此,將預測結果1和預測結果2進行整合,得到最終的預測結果,即預測得到未來一段時間內將會購買目標商品的用戶及其具體的購買時間。
2.1 數(shù)據收集和處理
在本研究中,我們主要收集了某個零售商的歷史銷售數(shù)據。我們?yōu)槊織l數(shù)據提取了以下屬性:會員編碼、訂單編碼、購買時間、購買數(shù)量、購買價格、花費、產品容量和產品品類。這些屬性如表1所示。
收集到的歷史銷售數(shù)據包括會員和非會員的購買記錄,會員具有唯一標識Vipcode,非會員Vipcode屬性值為空值,因此我們刪除了Vipcode屬性值為空值的所有記錄。同時,Number屬性值一般來說為正整數(shù),但在收集到的銷售數(shù)據中存在Number屬性值等于0或小于0的現(xiàn)象。經過分析得知小于0的為退貨數(shù)據,等于0的為進行促銷時的贈品數(shù)據。因此,為避免這些噪聲數(shù)據對預測結果產生影響,我們將Number屬性值小于0的數(shù)據與顧客對應的購買數(shù)據進行抵消,同時刪去所有Number屬性值為0的數(shù)據,從而保證所有Number屬性值大于0。最后,我們進行了空值和重復值的處理工作。
2.2 特征工程
在研究中,為了有效地擴大樣本數(shù)據量,使預測模型的訓練盡可能覆蓋所有歷史數(shù)據,我們使用了時間滑窗方法進行特征提取。時間滑窗如圖2所示。
如圖2所示,每組數(shù)據長度為5個月,其中最后一個月為標簽月,前四個月用于提取特征,每次滑動長度為一個月。特征時間窗又分為五個特征提取窗口,分別為距離標簽月首日7天、14天、1個月、2個月、4個月。然后,分別統(tǒng)計分析這五個窗口內的特征。
在用戶購買行為預測的研究中,影響預測準確性的主要因素包括用戶因素(徐琪等,2014;馬云高等,2012)和產品因素(Arunraj et al.,2015)。在對銷售數(shù)據進行充分分析之后,我們基于用戶購買行為習慣和產品屬性等因素從小的特征提取窗口中提取出了用戶特征和商品特征,如表2所示。
除此之外,考慮到數(shù)據的全局性以及產品的消耗率相對固定等特點,我們還在最大的時間窗口內提取出了以下用戶特征,如表3所示。
2.3 應用模型
本文采用多種機器學習分類和回歸算法,包括LightGBM算法(Ke, Meng & Finley, 2017)、XGBoost算法(Chen & Guestrin, 2016)、隨機森林算法(Liaw & Wiener, 2002)、邏輯回歸算法、Lasso回歸算法,其中前三種算法是集成模型,后兩種為簡單模型。前三種算法用于與融合模型比較預測性能,同時也是融合模型的基學習器,而后兩種算法僅作為融合模型的元學習器。
2.3.1 LightGBM算法
LightGBM(Light Gradient Boosting Machine)是一款基于決策樹算法的分布式梯度提升框架。它的優(yōu)點在于減少了數(shù)據對內存的使用,保證單個機器在不犧牲速度的情況下,盡可能地使用更多的數(shù)據;同時減少通信的代價,提升多機并行時的效率,實現(xiàn)在計算上的線性加速。
2.3.2 XGBoost算法
XGBoost(eXtreme Gradient Boosting)與LightGBM都是基于決策樹的算法。它的優(yōu)點在于使用許多策略去防止過度擬合,同時支持并行化,添加了對稀疏數(shù)據的處理,訓練速度快,訓練結果精度高。
2.3.3 隨機森林算法
隨機森林(Random Forest)是指利用多棵決策樹對樣本進行訓練并預測的一種算法。隨機森林算法是一個包含多個決策樹的算法,其輸出的類別是由個別決策樹輸出類別的眾樹來決定的。
它的優(yōu)點在于對于大部分的數(shù)據,它的分類效果比較好;它能處理高維特征,不容易產生過度擬合,模型訓練速度比較快,特別是對于大數(shù)據而言;在決定類別時,它可以評估變數(shù)的重要性;它對數(shù)據集的適應能力強,既能處理離散型數(shù)據,也能處理連續(xù)型數(shù)據,數(shù)據集無需特意規(guī)范化。
2.3.4 邏輯回歸算法
邏輯回歸(Logistic regression)是一種與線性回歸非常類似的算法。從本質上講,線型回歸處理的問題類型與邏輯回歸不一致。線性回歸處理的是數(shù)值問題,而邏輯回歸屬于分類算法。也就是說,邏輯回歸預測結果是離散的分類,例如判斷一封郵件是否是垃圾郵件等,所以邏輯回歸是一種經典的二分類算法。邏輯回歸是在線性回歸的計算結果加上了一個Sigmoid函數(shù),將數(shù)值結果轉化為0~1的概率,然后根據這個概率做預測,例如概率大于0.5,則這封郵件就是垃圾郵件。
2.3.5 Lasso回歸算法
Lasso回歸和嶺回歸(Ridge regression)都是廣義線性回歸模型的一種。Lasso回歸與嶺回歸都屬于后驗概率模型。
2.4 Stacking模型融合
Stacking模型融合方法(Ting & Witten,1997)首先將原始特征數(shù)據集劃分成若干子數(shù)據集,輸入第1層預測模型的各個基學習器中,每個基學習器輸出各自的預測結果。然后,第1層的輸出再作為第2層的輸入,對第2層預測模型的元學習器進行訓練,再由位于第2層的模型輸出最終預測結果。Stacking模型融合方法可以通過對多個模型的輸出結果進行泛化,提升整體預測精度。
在本研究中,我們使用LightGBM、XGBoost、隨機森林三種不同的集成模型算法作為基學習器得到三組預測結果,然后將三組預測結果應用在第二層使用元學習器,包括邏輯回歸或Lasso回歸進行訓練,從而得到最終的預測結果,如圖3和圖4所示。其中,用戶是否購買和用戶購買時間預測所用的Stacking模型融合方法步驟大致相同,不同的是用戶是否購買的基學習器使用的是三種集成算法中的分類算法,元學習器使用的是邏輯回歸分類算法,而用戶購買時間預測的基學習器使用的是三種集成算法中的回歸算法,元學習器使用的是Lasso回歸算法。
3 實證分析
3.1 數(shù)據
本文以一家連鎖零售企業(yè)洗衣用品的POS機銷售數(shù)據作為實證樣本,其中以品類105(洗衣皂)為目標商品進行用戶未來是否購買和具體購買時間的預測。
本文的數(shù)據集包括從2011年4月1日到10月31日的7個月內8種洗衣用品每天的銷售數(shù)量、價格、花費及產品容量等??紤]到數(shù)據集數(shù)據量比較小,為了有效擴大樣本數(shù)據量,使預測模型的訓練盡可能覆蓋所有歷史數(shù)據,我們使用了時間滑窗方法進行特征提取。進行原始數(shù)據處理后,我們設置最大時間窗口為120天,特征提取窗口分別為7天、14天、30天、60天和120天。由于用戶每次商品的購買時間間隔集中在15~30天,因此設置每隔15天滑動窗口一次,具體如圖5所示。確定時間窗口后,我們提取出了包括159個維度的特征向量。
圖5中,時間窗左側的25701等數(shù)字表示當前數(shù)據組滿足4個月內購買過產品的會員用戶數(shù),目的是保證用戶在前4個月的特征提取窗口內有過購買行為,即能提取出有效的用戶特征。其中,前四組作為訓練集,第五組(十月份組)作為測試集用于檢驗模型性能。
3.2 模型性能評估
本文進行了用戶未來是否購買和購買時間預測問題的研究,本節(jié)分別使用機器學習中常用的分類問題和回歸問題評估指標來評估預測模型的性能。為了使模型具有一定的可解釋性,我們還分析了預測性能較優(yōu)的若干個模型的特征重要性結果。
3.2.1 購買行為預測模型性能評估
預測用戶未來是否購買是一個典型的二分類問題,因此我們使用二分類問題中常用的評估指標,包括準確率、精確率、召回率、Auc值以及Roc曲線來評估模型性能。同時,我們將Stacking融合模型和單個的基學習器和元學習器模型結果進行了比較,在測試集上的評估結果如表4所示。
如表4所示,邏輯回歸算法的表現(xiàn)最差,原因是邏輯回歸這樣的線性分類模型不適用于本研究中的非線性問題,它無法處理復雜的非線性分類問題。在三個單一的集成模型中,隨機森林結果表現(xiàn)最差,所有評估指標結果均低于其他兩個模型。而LightGBM的評估指標中次優(yōu)結果有三個,說明其具有較好的預測性能。比較除邏輯回歸外的其他四個模型的結果,可以發(fā)現(xiàn)融合模型的準確率和精確率以及Auc值都達到最優(yōu),這說明使用Stacking模型融合的方法對于預測用戶購買行為具有很好的預測性能。
融合模型的Roc曲線如圖6所示,曲線非常靠近y軸以及y=1,同時曲線下方面積即auc值達到0.928以上。這也說明融合模型對于用戶購買行為具有很好的預測性能。
3.2.2 購買時間預測模型性能評估
預測用戶的購買時間是一個回歸問題,我們使用回歸問題常用的三個指標均方誤差(MSE)、平均絕對誤差(MAE)以及解釋方差(explained_variance_score,EVS)來評估模型性能。同時,我們將Stacking融合模型和單個的基學習器和元學習器模型結果進行了比較,在測試集上的評估結果如表5所示。
如表5所示,線性回歸模型Lasso回歸表現(xiàn)最差,同樣說明Lasso回歸這樣的線性回歸模型不適用于本研究中的非線性問題,它無法有效處理復雜的非線性回歸問題。在其他四個非線性模型中,LightGBM的預測性能最優(yōu),其中MSE和EVS值為最優(yōu),MAE值次優(yōu)。融合模型的三個評估指標結果有兩個為次優(yōu)且與最優(yōu)結果差距不大。這說明在解決購買時間的預測問題上,LightGBM模型是最優(yōu)的,其次是融合模型。
3.2.3 特征重要性分析
特征重要性分析可以用來評估構建的特征的預測能力或對預測模型的重要性。通過特征重要性分析,可以很直接地觀測到所構建的特征的預測能力,從而在一定程度上解釋模型或進一步調整模型結構。在這里我們主要考慮那些表現(xiàn)較好的模型的特征重要性,即用戶是否購買考慮融合模型,用戶購買時間預測考慮LightGBM模型。
用戶是否購買融合模型特征重要性前20名如圖7所示。
用戶購買時間預測 LightGBM模型重要性前20位的特征如圖8所示。
圖7和圖8中120day_105_Gap_max為特征名稱,120day表示特征提取窗口為120天;105表示目標商品,若無105則表示全部洗衣商品;Gap表示購買時間間隔;max為統(tǒng)計方式為最大值,包括max(最大值)、min(最小值)、mean(平均值)、median(中位數(shù))、std(標準差)。因此,120day_105_Gap_max表示目標商品(105)在120天內的最大購買時間間隔。
如圖7所示,用戶是否購買排名前20的特征中,購買時間間隔四個特征有三個排在前三位,另一個標準差特征也在前20中,同時前10中有7個特征與目標商品消耗率或購買時間間隔有關,這說明用戶購買目標商品具有一定的周期性。另外,前20特征中還出現(xiàn)了60天內的平均價格和最小價格特征,這說明商品的近期價格在一定程度上也會影響用戶的購買行為。此外,與目標商品相關的其他商品的一些特征也會影響購買行為,如所有商品總花費、所有商品的首次購買時間和最后一次購買時間等特征均在前20內。
如圖8所示,用戶購買時間預測 LightGBM模型特征重要性與圖7類似。前20中包括了購買時間間隔相關特征、價格相關特征、總花費相關特征等,這說明用戶購買具有一定的規(guī)律性,同時也會考慮用戶自身的支付能力以及商品的價格。
3.2.4 綜合預測性能評估
我們構造了如式(1)所示的綜合評估函數(shù),用來評估各種模型組合的綜合預測性能。
其中,Kr為實際購買目標商品的用戶集,Kp為預測的購買目標商品的用戶集,dk表示實際購買時間與預測購買時間之間的距離。
如前所述,LightGBM模型和融合模型都具有較好的預測性能,因此我們使用這兩個模型的四種組合來評估綜合預測性能,結果如表6所示。
如表6所示,用戶是否購買預測使用融合模型,用戶購買時間預測使用LightGBM模型的綜合預測性能最優(yōu)。此模型組合方式相比于兩個預測問題均使用融合模型提升了9.4%的預測性能。
4 結語
預測用戶未來購買行為和購買時間可以為企業(yè)的庫存決策和用戶營銷管理提供支持。盡管已有的研究已經從不同角度進行了研究,但大多研究僅關注于未來一段時間用戶是否會購買,而對于用戶具體購買時間的研究較少。本文提出一種使用Stacking方法融合多種決策樹模型的組合預測模型來預測用戶的購買行為及其具體的購買時間。為此,我們將LightGBM、XGBoost、隨機森林三種不同的集成決策樹模型的預測結果進行融合,然后基于融合的預測結果使用簡單的邏輯回歸分類模型和線性回歸模型分別預測用戶的購買行為和具體的購買時間。最后,我們使用了真實的零售企業(yè)銷售數(shù)據來驗證評估本文的模型。結果表明,融合模型在預測用戶是否購買時具有最高的準確率和AUC值,準確率達85%、AUC值達到0.928。另外,在預測用戶具體的購買時間時,我們還發(fā)現(xiàn)LightGBM算法相比于融合模型具有最優(yōu)預測性能。同時,如果在不同問題階段使用融合模型和LightGBM算法,則融合模型+LightGBM算法的組合相比于兩個預測問題均使用融合模型提升了9.4%的預測性能。
一條完整的用戶購買記錄包括購買時間、購買數(shù)量、購買花費等屬性值,因此未來可能的研究方向是對未來購買的實際數(shù)量或價值的預測?;谙嗤奶卣魈幚矸绞接柧氼A測模型,構建預測模型對用戶的購買數(shù)量和購買價值進行預測是未來一個重要的研究課題,可以為企業(yè)的運營和戰(zhàn)略決策提供更有利的支持。
參考文獻:
[1] ALLENBY G M, LEONE R P, JEN L. A dynamic model of purchase timing with application to direct marketing[J]. Journal of the American Statistical Association, 1999, 94(446): 365-374.
[2] MARTNEZ A, SCHMUCK C, PEREVERZYEV JR S, et al. A machine learning framework for customer purchase prediction in the non-contractual setting[J]. European Journal of Operational Research, 2018.
[3] LIU Y, ZHU T, JIANG Y. Purchase Prediction Based on a Non-parametric Bayesian Method[C] //Proceedings of the 52nd Hawaii International Conference on System Sciences. 2019.
[4] HERNITER J D. An entropy model of brand purchase behavior[J]. Journal of Marketing Research, 1973, 10(4): 361-375.
[5] PLATZER M, REUTTERER T. Ticking away the moments: timing regularity helps to better predict customer activity[J]. Marketing Science, 2016, 35(5): 779-799.
[6] WU X, ZHU X, WU G Q, et al. Data mining with big data[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 26(1): 97-107.
[7] RICHTER Y, YOM-TOV E, SLONIM N. Predicting customer churn in mobile networks through analysis of social groups[C]//Proceedings of the 2010 SIAM international conference on data mining. Society for Industrial and Applied Mathematics, 2010: 732-741.
[8] LIN C S, TZENG G H, CHIN Y C. Combined rough set theory and flow network graph to predict customer churn in credit card accounts[J]. Expert Systems with Applications, 2011, 38(1): 8-15.
[9] AMIN A, ANWAR S, ADNAN A, et al. Customer churn prediction in the tele communication sector using a rough set approach[J]. Neurocomputing, 2017(237): 242-254.
[10] HUSSAIN M, SHOME A, LEE D M. Impact of forecasting methods on variance ratio in order-up-to level policy[J]. The International Journal of Advanced Manufacturing Technology, 2012, 59(1/2/3/4): 413-420.
[11] TRATAR L F, MOJKERC B, TOMAN A. Demand forecasting with four-parameter exponential smoothing[J]. International Journal of Production Economics, 2016(181): 162-173.
[12] LEE S, FAMBRO D B. Application of subset autoregressive integrated moving average model for short-term freeway traffic volume forecasting[J]. Transportation Research Record, 1999, 1678(1): 179-188.
[13] RAMOS P, SANTOS N, REBELO R. Performance of state space and ARIMA models for consumer retail sales forecasting[J]. Robotics and Computer-integrated Manufacturing, 2015(34): 151-163.
[14] AMINI M H, KARGARIAN A, KARABASOGLU O. ARIMA-based decoupled time series forecasting of electric vehicle charging demand for stochastic power system operation[J]. Electric Power Systems Research, 2016(140): 378-390.
[15] REN S, CHOI T M, LIU N. Fashion sales forecasting with a panel data-based particle-filter model[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2014, 45(3): 411-421.
[16] FADER P S, HARDIE B G S. A note on an integrated model of customer buying behavior[J]. European Journal of Operational Research, 2002, 139(3): 682-687.
[17] CHOI T M, HUI C L, LIU N, et al. Fast fashion sales forecasting with limited data and time[J]. Decision Support Systems, 2014(59): 84-92.
[18] LU C J. Sales forecasting of computer products based on variable selection scheme and support vector regression[J]. Neurocomputing, 2014(128): 491-499.
[19] CANDELIERI A. Clustering and support vector regression for water demand forecasting and anomaly detection[J]. Water, 2017, 9(3): 224.
[20] GNAY M E. Forecasting annual gross electricity demand by artificial neural networks using predicted values of socio-economic indicators and climatic conditions: case of Turkey[J]. Energy Policy, 2016(90): 92-101.
[21] CHAWLA A, SINGH A, LAMBA A, et al. Demand forecasting using artificial neural networks: a case study of american retail corporation[M]//Applications of Artificial Intelligence Techniques in Engineering. Berlin: Springer, 2019: 79-89.
[22] 汪同三,張濤.組合預測:理論、方法及應用[M].北京:社會科學文獻出版社,2008.
[23] 倪冬梅, 趙秋紅, 李海濱. 需求預測綜合模型及其與庫存決策的集成研究[J]. 管理科學學報, 2013, 16(9): 44-52.