江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院 韓彥林
社會(huì)消費(fèi)品零售總額是指各種經(jīng)濟(jì)類型的批發(fā)和零售業(yè)、住宿和餐飲業(yè)及其他行業(yè)對(duì)城鄉(xiāng)居民和社會(huì)集團(tuán)的消費(fèi)品零售額總和。反映了一個(gè)地區(qū)消費(fèi)需求能力以及零售市場的規(guī)模,也體現(xiàn)出一定時(shí)期內(nèi)人們的物質(zhì)文化生活水平,是衡量一個(gè)地區(qū)經(jīng)濟(jì)發(fā)展水平的重要經(jīng)濟(jì)指標(biāo),所以對(duì)社會(huì)消費(fèi)品零售總額進(jìn)行預(yù)測研究有重要的理論意義和現(xiàn)實(shí)意義。本文在現(xiàn)有研究的基礎(chǔ)上,利用遺傳算法優(yōu)化支持向量回歸機(jī)中的參數(shù),建立GA-SVR模型對(duì)江蘇省社會(huì)消費(fèi)品零售總額進(jìn)行預(yù)測。
遺傳算法(GA)是由Holland教授最早提出的[1],是模擬生物在自然環(huán)境中遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化的搜索算法。該算法使用群體搜索技術(shù),它通過對(duì)當(dāng)前群體施加選擇、交叉、變異等一系列遺傳操作從而產(chǎn)生出新一代的群體并逐步使群體進(jìn)化到包含或接近最優(yōu)解的狀態(tài)。遺傳算法的基本操作步驟包括:編碼、初始化種群、計(jì)算適應(yīng)度函數(shù)、選擇、交叉和變異[2]。
支持向量機(jī)(SVM)是Vapnik等在1995年首先提出的,它是基于統(tǒng)計(jì)學(xué)理論,以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則,能夠很好地解決小樣本、非線性、高維數(shù)等問題。SVM廣泛地應(yīng)用于分類問題和回歸問題,用于回歸問題就是支持向量回歸機(jī)(SVR)。SVR是通過已知訓(xùn)練樣本點(diǎn)數(shù)據(jù)構(gòu)造一個(gè)回歸函數(shù)。對(duì)于非線性回歸問題是利用一個(gè)非線性映射將輸入數(shù)據(jù)映射到高維特征空間,并在這個(gè)高維空間進(jìn)行線性回歸。
約束條件為:
式中,為懲罰因子,為不敏感損失函數(shù)系數(shù),和 為松弛變量。
對(duì)上述最優(yōu)化問題直接求解比較復(fù)雜,而是通過它的對(duì)偶問題進(jìn)行求解,為此需引入拉格朗日函數(shù):
將上式結(jié)果代入拉格朗日函數(shù)計(jì)算可得:
從而可得原優(yōu)化問題的對(duì)偶問題為:
對(duì)上述問題進(jìn)行求解[3],可求得和,進(jìn)而得出和,于是支持向量機(jī)的回歸函數(shù):
常用到的核函數(shù)有:多項(xiàng)式函數(shù)、Gauss徑向基核函數(shù)(RBF)。本文選取Gauss徑向基核函數(shù)。
根據(jù)相關(guān)性分析研究[4,5],確定影響江蘇省社會(huì)消費(fèi)品零售總額的主要因素。將當(dāng)年地區(qū)GDP、城鎮(zhèn)居民家庭人均收入、農(nóng)村居民家庭人均收入、年末常住人口、商品零售價(jià)格指數(shù)數(shù)據(jù)作為支持向量回歸機(jī)的輸入向量,下一年度社會(huì)消費(fèi)品零售總額作為輸出。本文以江蘇省1990~2012年各年度社會(huì)消費(fèi)品零售總額以及影響因素?cái)?shù)據(jù)作為研究對(duì)象(數(shù)據(jù)來自《江蘇省統(tǒng)計(jì)年鑒》,見表1),其中前20個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),后3個(gè)數(shù)據(jù)作為測試數(shù)據(jù)。
表1 江蘇省社會(huì)消費(fèi)品零售總額相關(guān)數(shù)據(jù)
社會(huì)消費(fèi)品零售總額受到多種因素的影響,影響因素往往量綱不同、數(shù)據(jù)數(shù)量級(jí)不同,需對(duì)數(shù)據(jù)進(jìn)行無量綱化處理,提高預(yù)測精度。本文采用最大最小值歸一化法:
將樣本數(shù)據(jù)歸一化到[0,1]范圍內(nèi)。其中,表示歸一化后的數(shù)據(jù),表示原始數(shù)據(jù), , 表示原始數(shù)據(jù)的最大值與最小值。
由于本文采用Gauss徑向基核函數(shù),SVR模型中有3個(gè)參數(shù)需要確定,分別是懲罰因子 、核函數(shù)參數(shù) ,不敏感損失函數(shù)系數(shù)。它們的取值對(duì)模型的預(yù)測精度有著很大的影響,懲罰因子 越大,“過擬合”現(xiàn)象就越明顯,越小,“欠擬合”現(xiàn)象就越明顯。為了提高預(yù)測精度,本文利用GA算法對(duì)SVR模型中的3個(gè)參數(shù)進(jìn)行尋優(yōu),通過matlab軟件編程運(yùn)行得到SVR模型的3個(gè)參數(shù)分別為。
利用matlab軟件通過訓(xùn)練好的GA-SVR模型對(duì)江蘇省1991~2010年和2011~2013年的社會(huì)消費(fèi)品零售總額進(jìn)行擬合和預(yù)測,結(jié)果見圖1和表2。
圖1 1991~2013年江蘇省社會(huì)消費(fèi)品零售總額擬合和預(yù)測結(jié)果
表2 2011~2013年江蘇省社會(huì)消費(fèi)品零售總額預(yù)測值與實(shí)際值對(duì)比
從圖1和表2可以看出基于GA-SVR模型的預(yù)測值與實(shí)際值相當(dāng)吻合,相對(duì)誤差較小,結(jié)果表明GA-SVR模型能夠有效地對(duì)江蘇省社會(huì)消費(fèi)品零售總額進(jìn)行預(yù)測。最后,根據(jù)2013年各個(gè)影響因素?cái)?shù)據(jù),利用GA-SVR模型預(yù)測出江蘇省2014年社會(huì)消費(fèi)品零售總額為22637億元。
由于社會(huì)消費(fèi)品零售總額受多因素影響,以及非線性等特點(diǎn),本文提出GA-SVR模型進(jìn)行預(yù)測。利用遺傳算法的全局搜索功能,確定SVR模型中的參數(shù),構(gòu)建SVR模型對(duì)江蘇省社會(huì)消費(fèi)品零售總額進(jìn)行預(yù)測。結(jié)果表明,GA-SVR模型預(yù)測精度較高,為江蘇省社會(huì)消費(fèi)品零售總額預(yù)測提供了一種新的方法。
[1] 周明,孫樹棟.遺傳算法原理及應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[2] 楊淑瑩.模式識(shí)別與智能計(jì)算—Matlab技術(shù)實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2011.
[3] 鄧乃楊,田英杰.數(shù)據(jù)挖掘中的新方法—支持向量機(jī)[M].北京:科學(xué)出版社,2005.
[4] 郭慧敏,韓少將.浙江社會(huì)消費(fèi)品零售總額增長因素分析[J].浙江統(tǒng)計(jì),2009(8).
[5] 陳斌,張衛(wèi)華.我國社會(huì)消費(fèi)品零售總額的影響因素分析[J].廣西師范學(xué)院學(xué)報(bào)(哲社會(huì)科學(xué)版),2010(31).
[6] 查進(jìn)道.一種改進(jìn)的基于DE-SVR 的上證指數(shù)預(yù)測模型[J].統(tǒng)計(jì)與決策,2012(23).
[7] 唐山,張現(xiàn)剛.遺傳支持向量機(jī)在城市節(jié)假日電力負(fù)荷預(yù)測中的應(yīng)用[J].產(chǎn)業(yè)與科技?jí)?2012(11).
[8] 趙輝,成立芹.企業(yè)人力資源結(jié)構(gòu)的GA-SVM預(yù)測[J].統(tǒng)計(jì)與決策,2010(02).