鄢正綱
(中南財(cái)經(jīng)政法大學(xué)體育部,湖北武漢430064)
基于ARIMA SVM的體育彩票銷(xiāo)售量預(yù)測(cè)
鄢正綱
(中南財(cái)經(jīng)政法大學(xué)體育部,湖北武漢430064)
體育彩票銷(xiāo)售量受到多種綜合因素影響,呈現(xiàn)出復(fù)雜的、非線性的動(dòng)態(tài)變化特性.為了準(zhǔn)確刻畫(huà)體育彩票銷(xiāo)售量的變化特征,提出差分自回歸移動(dòng)平均和支持向量機(jī)相融合的體育彩票銷(xiāo)售量預(yù)測(cè)模型.首先根據(jù)體育彩票銷(xiāo)售量時(shí)間序列建立ARIMA模型,擬合體育彩票銷(xiāo)售量的線性變化部分,然后采用支持向量機(jī)對(duì)差分自回歸移動(dòng)平均的預(yù)測(cè)殘差進(jìn)行建模,擬合體育彩票銷(xiāo)售量的非線性變化部分,最后采用具體體育彩票銷(xiāo)售量數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn).仿真結(jié)果表明,相對(duì)于其它模型,該模型具有更高的預(yù)測(cè)精度,可以更準(zhǔn)確反映體育彩票銷(xiāo)售量的變化趨勢(shì).
體育彩票銷(xiāo)售量;差分自回歸移動(dòng)平均;支持向量機(jī);組合預(yù)測(cè)
隨著經(jīng)濟(jì)的迅速發(fā)展,體育彩票也隨之壯大,為國(guó)家和社會(huì)籌集了大量的公益金,并帶動(dòng)了相關(guān)產(chǎn)業(yè)發(fā)展.對(duì)體育彩票的未來(lái)銷(xiāo)量進(jìn)行準(zhǔn)確預(yù)測(cè),為體育彩票的營(yíng)銷(xiāo)推廣提供科學(xué)依據(jù),對(duì)體育彩票產(chǎn)業(yè)的健康發(fā)展具有十分重要的意義[1].
針對(duì)體育彩票銷(xiāo)售量問(wèn)題,國(guó)內(nèi)外學(xué)者進(jìn)行了大量而深入地研究,并取得許多研究成果.體育彩票銷(xiāo)售量與經(jīng)濟(jì)水平、市場(chǎng)規(guī)模、居民收入、節(jié)假日相關(guān),變化非常復(fù)雜,傳統(tǒng)體育彩票銷(xiāo)售量模型主要是差分自回歸移動(dòng)平均模型(autoregressive integrated moving average,ARIMA),其主要思想是利用體育彩票銷(xiāo)售量前m個(gè)數(shù)據(jù)量作為描述因子建立回歸模型,對(duì)未來(lái)體育彩票銷(xiāo)售量進(jìn)行預(yù)測(cè),然而ARIMA本質(zhì)上屬于線性模型,在描述時(shí)間序列的線性特征時(shí)有一定的優(yōu)越性,但在描述其非線性特征時(shí)卻具有局限性[2].隨著機(jī)器學(xué)習(xí)算法的不斷成熟,支持向量機(jī)(support vector machine,SVM)在體育彩票銷(xiāo)售量預(yù)測(cè)中取得了不錯(cuò)的應(yīng)用效果[3-6].然而體育彩票銷(xiāo)售量受到人的心理、體育賽事等影響,具有明顯整體趨勢(shì)變動(dòng)性和季節(jié)波動(dòng)性,以及隨機(jī)性,僅使用SVM無(wú)法對(duì)體育彩票銷(xiāo)售量進(jìn)行高精度地預(yù)測(cè)[7-9].近年來(lái),根據(jù)組合優(yōu)化理論,研究人員將不同模型組合在一起,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ),可以提高預(yù)測(cè)精度,因此組合預(yù)測(cè)模型為體育彩票銷(xiāo)售量預(yù)測(cè)問(wèn)題提供了一種新的研究思想.
為了提高體育彩票銷(xiāo)售量的預(yù)測(cè)精度,利用ARIMIA和SVM的優(yōu)點(diǎn),提出了一種ARIMA和SVM相融合的體育彩票銷(xiāo)售量預(yù)測(cè)模型(ARIMA -SVM),最后利用某地區(qū)體育彩票銷(xiāo)售量數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn).仿真結(jié)果表明,ARIMA-SVM獲得了較高的體育彩票銷(xiāo)售量預(yù)測(cè)精度,同時(shí)相對(duì)其它體育彩票銷(xiāo)售量預(yù)測(cè)模型,預(yù)測(cè)和建模效率更高,具有一定的優(yōu)勢(shì).
體育彩票銷(xiāo)售量是按照一定的時(shí)間間隔收集的數(shù)據(jù),是可以采用{x1,x2,…,xn}來(lái)表示,體育彩票銷(xiāo)售量受到多種綜合因素的影響,不僅具有線性、周期性變化特點(diǎn),同時(shí)也具有非線性變化特征,其預(yù)測(cè)的數(shù)學(xué)模型可描述為:
式中,y^表示體育彩票銷(xiāo)售量的預(yù)測(cè)值,f()表示預(yù)測(cè)模型.
ARIMA-SVM的建模與預(yù)測(cè)思想為:采用ARIMA對(duì)體育彩票銷(xiāo)售量時(shí)間序列進(jìn)行建模,對(duì)預(yù)測(cè)體育彩票銷(xiāo)售量序列的線性特點(diǎn)進(jìn)行描述,然后,根據(jù)殘差值包含了體育彩票銷(xiāo)售量時(shí)間序列的非線性特點(diǎn),利用支持向量機(jī)進(jìn)行建模,最后將兩者進(jìn)行相加,得到體育彩票銷(xiāo)售量的最終預(yù)測(cè)值.ARIMA-SVM的具體工作流程如圖1所示.
圖1 體育彩票銷(xiāo)售量預(yù)測(cè)模型的工作流程圖
2.1 ARIMA模型
ARIMA模型是Box等提出的一種時(shí)間序列建模方法,對(duì)原始序列Zt進(jìn)行d階差分,得到序列(1-B)dZt,設(shè)p和q為階數(shù),ARIMA(p,q)模型可以描述為:
式中,B為滯后算子;εt為白噪聲;φi(i=1,2,…,p)和θj(j=1,2,…,q)為參數(shù)[10].
2.2 支持向量機(jī)
支持向量機(jī)通過(guò)函數(shù)φ(x)對(duì)數(shù)據(jù)進(jìn)行非線性映射,將問(wèn)題轉(zhuǎn)化為凸二次規(guī)劃問(wèn)題:
式中,ξi2為訓(xùn)練誤差;參數(shù)C為懲罰因子[11-12].
引入對(duì)偶問(wèn)題的Lagrange約束規(guī)劃,具體如下:
式中,αi為L(zhǎng)agrange乘子.
對(duì)式(3)中的ω,b,ξi,αi進(jìn)行求偏導(dǎo)得到:
式中,i=1,2,…,l.
消去ω和ξi,得矩陣方程為:
式中,設(shè)Z=[φ(x1),φ(x2),…,φ(xl)]T,Y=[y1,y2,…,yl]T,ρ=[I1,I2,…,Il]T,α=[α1,α2,…,αl]T,ξ=[ξ1,ξ2,…,ξl]T,I為單元矩陣.
根據(jù)Mercer條件,可得:
解上述方程組得:
根據(jù)上述求解可得支持向量機(jī)的預(yù)測(cè)模型為:
2.3 ARIMA和支持向量機(jī)的體育彩票銷(xiāo)售量預(yù)測(cè)
體育彩票銷(xiāo)售量數(shù)據(jù)Zt可以描述為
式中,Lt和Nt分別代表線性和非線性變化規(guī)律.
體育彩票銷(xiāo)售量預(yù)測(cè)模型的工作步驟如下:
(1)利用ARIMA模型對(duì)Lt建模,有:
式中,L^t為ARIMA的估計(jì),et為估計(jì)殘差.
對(duì)(10)式進(jìn)行分析可以發(fā)現(xiàn),et隱含Zt的非線性變化特點(diǎn),因此,Nt可看作殘差序列和原體育彩票銷(xiāo)售量序列的非線性函數(shù),即:
式中,f1是非線性變化部分的擬合函數(shù);n,m均為正數(shù).
因此,由(3)~(5)式有:
(2)根據(jù)式(12),利用支持向量機(jī)進(jìn)行建模.將L^t,ei(i=t-1,t-2,…,t-n)和Zi(j=t-1,t-2,…,t-m)作為支持向量機(jī)的輸入變量,Zt為輸出變量,根據(jù)支持向量機(jī)進(jìn)行訓(xùn)練建立體育彩票銷(xiāo)售量預(yù)測(cè)模型.
(3)利用訓(xùn)練好的模型進(jìn)行體育彩票銷(xiāo)售量預(yù)測(cè).
3.1 仿真環(huán)境及對(duì)比模型
為了驗(yàn)證ARIMA-SVM的體育彩票銷(xiāo)售量預(yù)測(cè)性能,在Pentium(R)雙核2.8GHz、4G RAM、Windows 7的操作系統(tǒng)計(jì)算機(jī)上,采用VC++進(jìn)行仿真實(shí)驗(yàn).為了測(cè)試ARIMA-SVM的優(yōu)越性,選擇ARIMA和SVM在相同條件下進(jìn)行仿真實(shí)驗(yàn),其中支持向量機(jī)參數(shù)采用遺傳算法進(jìn)行優(yōu)化.采用均方根誤差(RMSE)和平均相對(duì)百分比誤差(MPAE)對(duì)體育彩票銷(xiāo)售量預(yù)測(cè)結(jié)果衡量.
3.2 數(shù)據(jù)來(lái)源
仿真數(shù)據(jù)資料來(lái)源于2010-2013年某地區(qū)的體育彩票月銷(xiāo)售量,共48個(gè)數(shù)據(jù),具體如圖2所示,其中以前24個(gè)月體育彩票銷(xiāo)售量作為訓(xùn)練樣本進(jìn)行建模,最后24個(gè)體育彩票銷(xiāo)售量作為測(cè)試樣本測(cè)試模型的泛化和推廣能力.
圖2 2010-2013年某地區(qū)的體育彩票銷(xiāo)售量圖
3.3 模型的實(shí)現(xiàn)
對(duì)體育彩票銷(xiāo)售量預(yù)處理,采用DPS 6.5軟件作為建模工具,通過(guò)ARIMA模塊建立體育彩票銷(xiāo)售量偏相關(guān)和自相關(guān)圖,如圖3所示.
圖3 原始體育彩票銷(xiāo)售量偏相關(guān)和自相關(guān)圖
從圖3可知,該體育彩票銷(xiāo)售量自我相關(guān)性極高,自相關(guān)性呈下降趨勢(shì),有拖尾現(xiàn)象,對(duì)其進(jìn)行差分處理,使其變成平穩(wěn)時(shí)間序列,在進(jìn)行一階差分后,1階偏相關(guān)和自相關(guān)圖如圖4所示,從圖4可知,體育彩票銷(xiāo)售量基的階數(shù)d=1,根據(jù)AIC準(zhǔn)則和SC準(zhǔn)則ARIMA模型為ARIMA(3,1,2).
圖4 體育彩票銷(xiāo)售量1階偏相關(guān)和自相關(guān)圖
3.4 結(jié)果與分析
3.4.1 單步預(yù)測(cè)結(jié)果
ARIMA、SVM以及ARIMA-SVM的體育彩票銷(xiāo)售量單步預(yù)測(cè)結(jié)果如圖5所示,可以明顯看出,相對(duì)于對(duì)比模型,ARIMA-SVM大幅度降低了體育彩票銷(xiāo)售量預(yù)測(cè)誤差,提高了體育彩票銷(xiāo)售量的預(yù)測(cè)精度.
圖5 ARIMA-SVM的體育彩票銷(xiāo)售量單步預(yù)測(cè)結(jié)果圖
表1 ARIMA-SVM與對(duì)比模型的單步預(yù)測(cè)誤差
3.4.2 多步預(yù)測(cè)結(jié)果
ARIMA-SVM提前2和4步預(yù)測(cè)結(jié)果及預(yù)測(cè)誤差的變化曲線如圖6~圖7所示.從圖5可以清楚看出,ARIMA-SVM的預(yù)測(cè)誤差率范圍均小于10%,預(yù)測(cè)結(jié)果符合要求,可用于體育彩票銷(xiāo)售量的預(yù)測(cè).
多步體育彩票銷(xiāo)售量預(yù)測(cè)誤差見(jiàn)表2,從表2可以得到結(jié)論為:
(1)預(yù)測(cè)步長(zhǎng)越大,ARIMA、SVM的預(yù)測(cè)誤差增加幅度相當(dāng),預(yù)測(cè)精度低,難以描述體育彩票銷(xiāo)售量變化趨勢(shì),預(yù)測(cè)結(jié)果沒(méi)有什么實(shí)際應(yīng)用價(jià)值.
(2)相對(duì)于ARIMA、SVM,ARIMA-SVM的預(yù)測(cè)精度得到相應(yīng)提高,預(yù)測(cè)誤差相對(duì)較小,這主要是由于ARIMA-SVM基于組合優(yōu)化理論,從不同的方面對(duì)體育彩票銷(xiāo)售量的變化趨勢(shì)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果更加可靠,可以獲得較理想的體育彩票銷(xiāo)售量預(yù)測(cè)結(jié)果.
圖6 ARIMA-SVM的體育彩票銷(xiāo)售量提前2步預(yù)測(cè)結(jié)果
圖7 ARIMA-SVM的體育彩票銷(xiāo)售量提前4步預(yù)測(cè)結(jié)果
表2 不同模型的體育彩票銷(xiāo)售量多步預(yù)測(cè)誤差對(duì)比
將ARIMA與SVM技術(shù)進(jìn)行融合,建立體育彩票銷(xiāo)售量組合預(yù)測(cè)模型,并采用具體體育彩票銷(xiāo)售量數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),仿真結(jié)果表明,ARIMASVM集成了ARIMA和SVM的優(yōu)勢(shì),可以描述體育彩票銷(xiāo)售量的變化特性,獲得了更理想的體育彩票銷(xiāo)售量預(yù)測(cè)結(jié)果,具有更高的實(shí)際應(yīng)用價(jià)值.
[1]Ariyabuddhiphongs V.Lottery gambling:a review[J].Journal of gambling Studies,2011,27(1):15-33.
[2]謝瓊桓.關(guān)于發(fā)行體育彩票的若干問(wèn)題[J].體育科學(xué),2000,20(3):7-9.
[3]劉煉,王斌.基于計(jì)劃行為理論的體育彩民購(gòu)彩行為研究[J].上海體育學(xué)院學(xué)報(bào),2014,38(4):42-46.
[4]李海,陶蕊,傅琪琪,等.上海市體育彩票問(wèn)題彩民現(xiàn)狀[J].體育科研,2011,32(3):43-49.
[5]史文文,王斌,劉煉,等.體育彩票消費(fèi)中問(wèn)題彩民判斷標(biāo)準(zhǔn)的研制[J].北京體育大學(xué)學(xué)報(bào),2013,36(6):22-26.
[6]楊亞莉,程林林,張永韜.體育彩票銷(xiāo)量的計(jì)量模型及促銷(xiāo)策略研究—以四川省為例[J].成都體育學(xué)院學(xué)報(bào),2012,38(9):1-7.
[7]李剛.彩票人均銷(xiāo)量的決定因素和我國(guó)彩票市場(chǎng)發(fā)展趨勢(shì)的預(yù)測(cè)[J].體育科學(xué),2006,26(12):38-45.
[8]史文文.問(wèn)題彩民的購(gòu)彩心理與行為特征[J].心理科學(xué)進(jìn)展,2012,20(4):592-597.
[9]李海.我國(guó)體育彩票問(wèn)題彩民現(xiàn)狀調(diào)查—以上海、廣州、鄭州、沈陽(yáng)、成都為例[J].成都體育學(xué)院學(xué)報(bào),2011,37(5):9-13.
[10]吳殷,李海.基于ARIMA模型的體育彩票銷(xiāo)量預(yù)測(cè)—以上海為例[J].體育科研,2013,34(5):23-26.
[11]羅赟騫,夏靖波,王渙彬.混沌-支持向量機(jī)回歸在流量預(yù)測(cè)中的應(yīng)用研究[J].計(jì)算機(jī)科學(xué),2009,6(7):244-246.
[12]張培林,錢(qián)林方.基于蟻群算法的支持向量機(jī)參數(shù)優(yōu)化[J].南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,33(4):464-468.
Sales volume prediction of sports lottery based on autoregressive integrated moving average and support vector machine
YAN Zhenggang
(P.E.Department,Zhongnan University of Economics and Law,Wuhan 430064,China)
Sales volume of sports lottery is comprehensively influenced by a variety of effects and has complex dynamic and nonlinear variation features,in order to accurately describe the sales volume of sports lottery,a sales volume prediction model of sports lottery based on autoregressive integrated moving average and support vector machine is proposed in this paper.Firstly,ARIMA model is used to predict linear structure of sports lottery sales volume,and then support vector machine is used to model the prediction residual of autoregressive integrated moving average,finally the specific sports lottery sales data is used to test the performance by simulation experiment.The simulation results showed that,compared with other models,the proposed model has higher prediction accuracy and can more accurately reflect the change trend of sports lottery sales volume.
sports lottery sales volume;autoregressive integrated moving average;support vector machine;combine prediction
TP183
A
1671-9476(2017)02-0123-04
10.13450/j.cnkij.zknu.2017.02.031
2016-07-18;
2016-11-25
湖北省高校省級(jí)教學(xué)改革研究項(xiàng)目(No.2013160)
鄢正綱(1978-),男,湖北武漢人,碩士,講師,研究方向:體育教育訓(xùn)練學(xué).
周口師范學(xué)院學(xué)報(bào)2017年2期