石濤,李根栓,李鵬飛,鄭飄*
1 河南中煙工業(yè)有限責任公司,河南省鄭州市榆林南路16號 450016;
2 河南省社會科學院,河南省鄭州市豐產(chǎn)路21號 450002
近年來,隨著煙草行業(yè)供給側(cè)結(jié)構(gòu)性改革和市場化取向改革的深入推進,卷煙銷售業(yè)務(wù)流程逐步由“工-商-零-消”向“消-零-商-工”轉(zhuǎn)變,消費者具有更大選擇權(quán)和主動權(quán),卷煙市場需求導向性日益凸顯。尤其是卷煙消費不斷向個性化、多元化升級,卷煙需求的不確定性明顯增加,給卷煙營銷工作帶來新的挑戰(zhàn),對卷煙消費需求預(yù)測的科學性和準確性提出了更高要求。從宏觀角度,需要通過精準科學需求預(yù)測,準確把握市場真實需求,敏銳感知消費需求變化趨勢。從微觀角度,需要通過精準科學的卷煙需求預(yù)測,切實加強工商協(xié)同和貨源銜接,提高貨源供給與市場需求吻合度,保證卷煙市場供給總量和結(jié)構(gòu)與需求變化相適應(yīng);暢通卷煙產(chǎn)業(yè)鏈,提升工商企業(yè)各環(huán)節(jié)的高效協(xié)同,提高工商企業(yè)運行效率和經(jīng)營效益,提高響應(yīng)市場的速度,精準滿足市場需求。因此,精準科學預(yù)測卷煙銷量對進一步提高響應(yīng)市場的速度、適應(yīng)市場的能力和服務(wù)市場的水平,進一步提高卷煙營銷水平具有十分重要的意義。
近年來,國內(nèi)學者圍繞我國卷煙銷量預(yù)測問題進行了諸多研究,鄒亮[1]、程幸福[2]分別構(gòu)建季節(jié)趨勢分解模型、ARIMA模型等時間序列模型預(yù)測月度、季度卷煙銷量;蔣興恒[3]采用BP神經(jīng)網(wǎng)絡(luò)對卷煙月度銷量進行預(yù)測;吳明山[4]等多位學者構(gòu)建組合預(yù)測模型對卷煙季度、月度銷量進行預(yù)測,以克服單一模型預(yù)測精度不高的缺陷,提高預(yù)測的精準性。上述學者構(gòu)建的預(yù)測模型均是基于卷煙銷量自身的時序數(shù)據(jù)進行預(yù)測,雖然取得了較好的預(yù)測效果,但忽略了某些影響卷煙消費的因素,例如國內(nèi)生產(chǎn)總值(GDP)、全社會消費品零售總額等宏觀經(jīng)濟指標和消費者特征。王運鴻[5]、汪世貴[6]、席昊[7]分別構(gòu)建回歸預(yù)測模型研究宏觀經(jīng)濟指標與卷煙銷量之間的關(guān)系,并基于宏觀經(jīng)濟數(shù)據(jù)對卷煙銷量進行預(yù)測。上述研究以年度數(shù)據(jù)和全國整體數(shù)據(jù)為主,數(shù)據(jù)的時間和空間粒度較粗,不能有效滿足季度和月度卷煙消費需求預(yù)測的需要;且研究以同頻數(shù)據(jù)的自回歸模型為主,不能有效捕捉宏觀經(jīng)濟環(huán)境等外部因素對卷煙銷量的影響。
國際學者的研究方法對克服上述問題具有一定啟發(fā)。Ghysels等[8]首先提出混頻數(shù)據(jù)抽樣(MIDAS)模型,提取不同頻率數(shù)據(jù)信息來進行分析預(yù)測。該模型的提出最初是為了運用混頻數(shù)據(jù)對股票市場的波動進行分析預(yù)測。由于 MIDAS 模型在預(yù)測方面具有較高的準確性,因此國內(nèi)外學者將該模型拓展應(yīng)用到宏觀經(jīng)濟、旅游、能源、環(huán)境等各個領(lǐng)域進行預(yù)測研究。Bai等[9]通過MIDAS模型與狀態(tài)空間模型對美國GDP預(yù)測精準度的對比,證明MIDAS模型預(yù)測效果更好。唐成千和莫旋[10]運用“三駕馬車”對中國宏觀經(jīng)濟進行分析和短期預(yù)測,指出投資增速的放緩和出口增速的下滑是引起當前中國宏觀經(jīng)濟下行的重要原因,證明MIDAS 模型在對中國宏觀經(jīng)濟的短期預(yù)測精確性方面具有一定的優(yōu)勢。劉漢和王永蓮[11]以美國來華游客人次為研究對象,開展入境旅游需求的混頻預(yù)測研究,并與傳統(tǒng)同低頻預(yù)測模型進行比較分析,結(jié)果表明,基于網(wǎng)絡(luò)搜索數(shù)據(jù)的混頻預(yù)測模型的預(yù)測精度相比傳統(tǒng)同低頻數(shù)據(jù)模型有近50%的提升,預(yù)測精度和方向上均有顯著提高。秦夢等[12]根據(jù)MIDAS 模型的建模理論,構(gòu)建基于季度GDP增長率數(shù)據(jù)和年度能源消費總量增長率數(shù)據(jù)的混頻模型,證明了混頻模型在預(yù)測能源消費總量方面的準確性與時效。秦華英和韓夢[13]將MIDAS模型用于碳排放量預(yù)測研究,分析高頻季度GDP滯后階數(shù)變化效應(yīng)及其對低頻二氧化碳排放量的影響效應(yīng),結(jié)果表明,MIDAS模型對二氧化碳排放量的預(yù)測合理,且在中國二氧化碳排放量的短期預(yù)測方面具有較高的預(yù)測精度,在實時預(yù)報方面具有顯著的可行性和時效性。
從上述學者的研究成果來看,目前國內(nèi)學者對卷煙銷量預(yù)測在數(shù)據(jù)上以低頻的同頻數(shù)據(jù)為主,預(yù)測模型以自回歸模型為主,鮮有學者基于高頻數(shù)據(jù),運用混頻模型來分析宏觀經(jīng)濟要素對卷煙銷量預(yù)測的適用性,這為本文的研究提供了一定的空間。為此,本文將基于2008—2019年的月度宏觀經(jīng)濟數(shù)據(jù)和季度卷煙銷量數(shù)據(jù),運用混頻MIDAS 模型分析飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率以及全社會消費品零售總額等宏觀經(jīng)濟要素作為先行指標來預(yù)測卷煙銷量,并運用樣本內(nèi)和樣本外數(shù)據(jù)進一步校驗?zāi)P偷木?,驗證混頻模型的合理性和可行性。
正如上文指出,現(xiàn)有學者對卷煙銷量的預(yù)測研究主要是基于時間序列數(shù)據(jù),多為低頻或者觀測長度較短的同頻數(shù)據(jù),難以有效分析被觀測對象的周期性,尤其是可能存在信息遺漏問題。同時,對卷煙銷量等趨勢性數(shù)據(jù)的預(yù)測需要構(gòu)建一個宏觀先行指數(shù)來預(yù)測其走向,即以高頻先行指數(shù)來預(yù)測低頻卷煙銷量數(shù)據(jù),而這是混頻數(shù)據(jù)模型相對其他方法的優(yōu)勢(Foroni C,Pierre G和Marcellino M,2015)[14]。類似于卷煙銷量等時間序列數(shù)據(jù),往往會存在自相關(guān)關(guān)系,需要分析變量自身存在的自相關(guān)關(guān)系。而傳統(tǒng)MIDAS模型的好處在于能夠運用月度高頻數(shù)據(jù)來估計低頻的季度數(shù)據(jù),但是并不能顯示宏觀經(jīng)濟變量可能存在的自相關(guān)關(guān)系,而向前h步預(yù)測的MIDAS(m,k,h)-AR(p)模型具有對預(yù)測對象實時預(yù)報和修正的特點,設(shè)定如下:
一般而言,當高頻數(shù)據(jù)與低頻數(shù)據(jù)之間的倍差較小時,無約束的MIDAS模型估計效果較好。
2.2.1 變量選取
為相對完整地捕捉高頻宏觀經(jīng)濟因素對卷煙銷量的影響,參考現(xiàn)有學者的研究成果[16-17],結(jié)合月度數(shù)據(jù)可得性,變量選取主要圍繞宏觀經(jīng)濟環(huán)境、消費者特征及價格水平等三個維度,其中宏觀經(jīng)濟環(huán)境由工業(yè)增加值增長率來表示,消費者特征由全社會消費品零售總額來表示,價格水平由飲料煙酒類商品零售價格指數(shù)來表示,具體詳見表1所示。
表1 變量選取及數(shù)據(jù)描述統(tǒng)計Tab. 1 Variable selection and data description statistics
2.2.2 數(shù)據(jù)來源
本文所用數(shù)據(jù)為中部某省宏觀經(jīng)濟月度數(shù)據(jù)和季度卷煙銷量的時間序列數(shù)據(jù),考慮數(shù)據(jù)可得性,時間范圍為2008—2019年。以上數(shù)據(jù)未經(jīng)特殊說明,宏觀經(jīng)濟指標數(shù)據(jù)來源于該省統(tǒng)計局以及國家統(tǒng)計局網(wǎng)站,卷煙銷量數(shù)據(jù)來源于煙草統(tǒng)計年鑒及統(tǒng)計報表,對于部分缺失數(shù)據(jù)采用移動自回歸平滑處理。為了更好地反映模型估計的有效性,參考機器學習的思路,將樣本數(shù)據(jù)劃分為兩個時間段:一是樣本內(nèi)訓練樣本,時間為2008.1—2018.12,用以學習訓練估計參數(shù);二是樣本外預(yù)測樣本,時間為2019.1—2019.12,用以驗證估計參數(shù)的有效性。
由于卷煙銷量與飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率以及全社會消費品零售總額等高頻數(shù)據(jù)不同頻率,樣本滯后期較多,形成多種混頻數(shù)據(jù)抽樣估計模型,因而主要以均方根誤差(RMSE)最小為主,AIC最小及擬合優(yōu)度為輔進行最佳模型選擇(丁黎黎等,2018)[18]。本文采用Matlab軟件的MIDAS2.3模塊進行相應(yīng)模型估計,分別以飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率以及全社會消費品零售總額變量作為自變量,相應(yīng)選擇U-AR(4)-MIDAS(3,6)模型、Almon-AR(4)-MIDAS(3,6)模型及U-AR(4)-MIDAS(3,9)模型為各自預(yù)測卷煙銷量的最佳混頻估計模型,模型均方根RMSE參數(shù)估計結(jié)果如表2~4所示。同時,U-AR(4)-MIDAS(3,6)模 型、Almon-AR(4)-MIDAS(3,6)模 型及U-AR(4)-MIDAS(3,9)模型的多項式權(quán)重分別在(-15,10)、(-1.5,1)及(-0.6,1)范圍內(nèi)波動,且不同時期內(nèi)的權(quán)重值均不相同,表明估計模型權(quán)重變動具有合理性,飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率及全社會消費品零售總額均對卷煙銷量具有持續(xù)12個月的正負效應(yīng)。同時,兩個模型的擬合值分別為0.914、0.9075、0.9181,表明U-AR(4)-MIDAS(3,6)模型、Almon-AR(4)-MIDAS(3,6)模型及U-AR(4)-MIDAS(3,9)模型在模擬宏觀經(jīng)濟變量與卷煙銷量之間關(guān)系時合理性強。
表2 不同混頻樣本內(nèi)的RMSE估計結(jié)果-基于飲料煙酒類商品零售價格指數(shù)Tab. 2 Estimation results of RMSE in different mixing samples - Based on retail price indices of beverage, tobacco and alcohol products
表3 不同混頻樣本內(nèi)的RMSE估計結(jié)果-基于工業(yè)增加值增長率Tab. 3 Estimation results of RMSE in different mixing samples- Based on growth rate of industrial added value
表4 不同混頻樣本內(nèi)的RMSE估計結(jié)果-基于全社會消費品零售總額Tab. 4 Estimation results of RMSE in different mixing samples - Based on total retail sales of consumer goods
表5顯示了U-AR(4)-MIDAS(3,6)模型、Almon-AR(4)-MIDAS(3,6)模型及U-AR(4)-MIDAS(3,6)模型的估計參數(shù),三種模型估計結(jié)果具有符號一致性。其中,飲料煙酒類商品零售價格指數(shù)系數(shù)與其他變量系數(shù)相反,與傳統(tǒng)經(jīng)濟學中價格與銷量之間呈現(xiàn)負相關(guān)關(guān)系一致。以U-AR(4)-MIDAS(3,9)模型估計參數(shù)為例,該省卷煙銷量受到自身4個季度變化的影響,影響系數(shù)分別為-0.2172、-0.0311、-0.1619、0.5651,表明隨著向前1季、2季度、3季度卷煙銷量增長率的放緩,當季卷煙銷量也會相應(yīng)增加;向前4季度卷煙銷量的增加,當季卷煙銷量也會增加,即向前4季度卷煙銷量絕對值的增加,會導致當季卷煙銷量絕對值的增加。
表5 基于不同變量的混頻模型的參數(shù)估計結(jié)果Tab. 5 Parameter estimation results by mixing models based on different variables
3.3.1 樣本內(nèi)預(yù)測值對比
圖1至圖3顯示了基于混頻模型的樣本內(nèi)預(yù)測值對比趨勢。從該圖中,我們可以看出:基于混頻模型,飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率及全社會消費品零售總額三個自變量的預(yù)測估計值方向均具有一致性。具體來看,飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率及全社會消費品零售總額的統(tǒng)計誤差率分別為2.4180%、2.4843%、2.2085%,總體控制在2.5%以內(nèi),且預(yù)測值整體較為平穩(wěn),尤其是1季度的數(shù)據(jù)預(yù)測未出現(xiàn)過于偏離該季度實際值的奇異點,表明樣本內(nèi)預(yù)測值相對較為精準。
圖1 基于飲料煙酒類商品零售價格指數(shù)的季度樣本內(nèi)卷煙銷量預(yù)測值Fig.1 Predicted value of quarterly in-sample cigarette sales based on retail price indices of beverage, tobacco and alcohol products
圖2 基于工業(yè)增加值增長率的季度樣本內(nèi)卷煙銷量預(yù)測值Fig.2 Predicted value of quarterly in-sample cigarette sales based on growth rate of industrial added value
圖3 基于全社會消費品零售總額的季度樣本內(nèi)卷煙銷量預(yù)測值Fig.3 Forecasted value of quarterly in-sample cigarette sales based on total retail sales of consumer goods
3.3.2 樣本外預(yù)測值
進一步地,利用混頻模型進行樣本外預(yù)測,預(yù)測結(jié)果如表6所示。該表中,飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率及全社會消費品零售總額三個自變量的樣本外預(yù)測值誤差率分別為2.2492%、1.4109%、1.7820%,略小于樣本內(nèi)預(yù)測值誤差率,均在2.25%左右。而當前卷煙銷量組合預(yù)測模型(ARIMA模型和回歸模型)、Levenberg-Marquardt算法改進BP神經(jīng)網(wǎng)絡(luò)模型、非線性組合預(yù)測模型(ARIMA模型、基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型和基于LM算法的BP神經(jīng)網(wǎng)絡(luò)模型)等模型預(yù)測值的誤差率分別在3%、5%、6%左右,高于MIDAS模型樣本外預(yù)測值的誤差率。由此可見,混頻MIDAS模型在預(yù)測精度上略好于現(xiàn)有預(yù)測模型,對該省卷煙銷量預(yù)測值的估計效果較好。
表6 2018—2019年樣本內(nèi)卷煙銷量預(yù)測值Tab. 6 Predicted value of in-sample cigarette sales in 2018~2019
基于中部某省2008—2019年宏觀經(jīng)濟先行月度數(shù)據(jù)和季度卷煙銷量數(shù)據(jù),本文利用混頻MIDAS模型對該省卷煙銷量進行預(yù)測。研究發(fā)現(xiàn):一是飲料煙酒類商品零售價格指數(shù)、工業(yè)增加值增長率及全社會消費品零售總額等三個月度宏觀經(jīng)濟變量對季度卷煙銷量都具有較好的預(yù)測性,可以作為判斷卷煙銷量的先行指數(shù)參考。二是U-AR(4)-MIDAS(3,6)模 型、Almon-AR(4)-MIDAS(3,6)模 型 及U-AR(4)-MIDAS(3,6)等三個模型在預(yù)測精度上相對較高,其中三個模型樣本內(nèi)預(yù)測值誤差率均值在2.5%以內(nèi),預(yù)測精度較高。三是基于混頻模型,對該省2019年四個季度的卷煙銷量進行樣本外預(yù)測,誤差率均值在2.25%以內(nèi),進一步說明混頻模型的預(yù)測值相對較為精準。
與傳統(tǒng)的ARIMA等自相關(guān)模型不同,本文的創(chuàng)新點在于:更多地考慮外部沖擊對卷煙銷量的影響,尤其是通過高頻數(shù)據(jù)來對卷煙銷量進行適時播報和混頻預(yù)測,且實證結(jié)果表明預(yù)測精度相對較高,為行業(yè)構(gòu)建卷煙銷量預(yù)測先行指數(shù),以及探索大數(shù)據(jù)預(yù)測工具、制定月度季度商業(yè)銷售政策提供了有益參考和實證依據(jù)。