余婷+黎放
摘要: 本文采取了一種基于支持向量機(jī)的預(yù)測方法對公共事業(yè)費(fèi)的支出情況進(jìn)行了預(yù)測。計算結(jié)果證明,這種方法與傳統(tǒng)的方法相比,具有更好的泛化能力,可以使神經(jīng)網(wǎng)絡(luò)方法出現(xiàn)的過擬合、網(wǎng)絡(luò)結(jié)構(gòu)難以確定等問題得到有效地解決,因而該方法可以作為一種新途徑用于研究此類問題。
Abstract: In this paper, a new forecasting method based on support vector machine is adopted to predict the expenditure of public utilities. The calculation results show that this method, compared with the traditional method, has better generalization ability, can effectively solve over-simulated problem, the network structure difficult to be determined and others which existing in the the neural network method,thus the method can be used as a new approach for the study of such problems.
關(guān)鍵詞: 支持向量機(jī);公共事業(yè)費(fèi);費(fèi)用預(yù)測
Key words: support vector machine;public utilities;cost forecast
中圖分類號:F299.24 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2016)29-0009-03
0 引言
目前,在公共事業(yè)費(fèi)預(yù)測過程中,人們一般選擇使用參數(shù)法、時間序列方法、灰色系統(tǒng)理論方法等對公務(wù)事業(yè)費(fèi)的支出情況進(jìn)行預(yù)測,事實(shí)證明這些方法都取得了良好的預(yù)測效果。但在外界環(huán)境中公共事業(yè)費(fèi)會受到許多復(fù)雜因素的影響,沒有一種預(yù)測方法可以做到面面俱到,一般只能側(cè)重于問題的某一個或幾個方面。因此,可以說一種能夠保證在所有情況下都可以得到完美的預(yù)測結(jié)果的預(yù)測方法是基本不存在的。
現(xiàn)行的公務(wù)事業(yè)費(fèi)預(yù)測過程一般是這樣的:分析人員首先選取幾種合適的候選模型,分別用這些模型對公務(wù)事業(yè)費(fèi)進(jìn)行初步預(yù)測;然后基于上述模型進(jìn)行預(yù)測,結(jié)合個人以往的工作經(jīng)驗(yàn)和通過模型所獲得的信息綜合分析預(yù)測結(jié)果的可行性,再在分析結(jié)果的基礎(chǔ)上優(yōu)選一個可預(yù)測公務(wù)事業(yè)費(fèi)的最佳模型進(jìn)行預(yù)測。但事實(shí)上,他們只是簡單地對幾種候選模型進(jìn)行了一個篩選工作,而沒有做到根據(jù)每個模型所具有的特點(diǎn)從而將多個模型進(jìn)行一個有效的組合,使預(yù)測結(jié)果更加科學(xué)可信。
有些專家認(rèn)為:為了使模型的擬合能力得到有效地改善,同時也使每個預(yù)測模型所獲得的有用信息能夠得到充分的利用,可以將兩種無偏的單項預(yù)測模型相結(jié)合,從而得到出一種新的組合方法,這種新的組合方法結(jié)合了兩個單項預(yù)測模型的特點(diǎn),提高了預(yù)測的精度,得到的結(jié)果更加科學(xué)可信。并在此基礎(chǔ)上提出了最優(yōu)組合預(yù)測方法[1]。目前組合預(yù)測方法的相關(guān)研究正處于一個火熱的狀態(tài)。
所以,與傳統(tǒng)方法相比較用組合預(yù)測模型對公共事業(yè)費(fèi)進(jìn)行預(yù)測得到的結(jié)果更加科學(xué)可信,該方法適合用于對公務(wù)事業(yè)費(fèi)的預(yù)測。
1 基于熵技術(shù)的最優(yōu)組合預(yù)測方法
用yt,t=(1,2,…,n) 表示某一預(yù)測問題中某一時段的實(shí)際值。就現(xiàn)階段而言,總共有m種預(yù)測該問題的方法,其中利用第i種方法對t時段的預(yù)測值為fit。
通過上述分析我們可以發(fā)現(xiàn),最優(yōu)組合預(yù)測方法預(yù)測的重點(diǎn)在于先要確定最優(yōu)組合權(quán)系數(shù)。對此,許多專家和學(xué)者提出了很多套優(yōu)化標(biāo)準(zhǔn)以及以最小方差法、時變加權(quán)最小二乘法、卡爾曼濾波法、目標(biāo)/多目標(biāo)規(guī)劃法、貝葉斯法、AIC準(zhǔn)則法、AHP法、小波神經(jīng)網(wǎng)絡(luò)法、無約束/有約束最小二乘法、模糊綜合評判法等為代表的確定權(quán)系數(shù)的方法[2]。這些預(yù)測方法可以很好地解決不同的問題。在具體應(yīng)用環(huán)節(jié),應(yīng)該具體問題具體分析從而選擇合適的確定權(quán)系數(shù)方法。
本文從公務(wù)事業(yè)費(fèi)消耗預(yù)測的實(shí)際情況出發(fā),并且綜合考慮對預(yù)測方法的評價指標(biāo),利用評價值所提供的有效信息,認(rèn)為可以引入熵的概念,提出采用熵技術(shù)對組合預(yù)測權(quán)系數(shù)進(jìn)行確定。
2 基于熵技術(shù)的組合權(quán)系數(shù)確定
2.1 熵
1865年,德國物理學(xué)家魯?shù)婪颉た藙谛匏梗≧udolf Clausius)在其提出的熱力學(xué)第二定理中第一次提出了熵的概念,他認(rèn)為熵是物質(zhì)的狀態(tài)函數(shù),即狀態(tài)一定時,物質(zhì)的熵值也一定。
也可以說熵變只和物質(zhì)的初末狀態(tài)有關(guān)。此后科學(xué)家為此進(jìn)行了大量的研究。1889年,玻爾茲曼將熵與系統(tǒng)的微觀狀態(tài)函數(shù)有機(jī)結(jié)合來定義熵的統(tǒng)計意義。在他的學(xué)說中,熵相當(dāng)于一個系統(tǒng)混亂度的量度,即玻爾茲曼熵。1948年,美國人Shannon又將玻爾茲曼熵視為隨機(jī)事件的不確定性或信息量的量度,提出“信息熵”的概念,經(jīng)典信息論由此應(yīng)運(yùn)而生[3]。
基于熵技術(shù)確定組合權(quán)系數(shù),實(shí)際相當(dāng)于一個針對各種預(yù)測方法的多指標(biāo)評價問題。假設(shè)多指標(biāo)評價問題的方案集是A={A1,A2,…,Am},評價指標(biāo)集是F={f1,f2,…,fn},X={xij}m×n評價矩陣,其中xij為第i個方案在第j個指標(biāo)下的屬性值。假設(shè)全部的決策方案中的指標(biāo)fj基本一致,說明在排序評價決策方案時指標(biāo)fj沒有任何參考作用,遇到此類情況可將fj指標(biāo)的權(quán)重設(shè)為0。
通常情況下,某一指標(biāo)的指標(biāo)值變異跨度越明顯,其信息熵越小,決策者通過該指標(biāo)所獲得的信息量越大,也就是說對于決策方案的排序,這項指標(biāo)所擁有的參考價值越大。反之,假設(shè)某一指標(biāo)的指標(biāo)值變異跨度越不明顯,其信息熵就越大,決策者通過這項指標(biāo)所獲得的信息量就越小,也就是說在方案排序時,這項指標(biāo)的參考價值越小,相應(yīng)的指標(biāo)權(quán)重也越小。這就是多指標(biāo)決策時熵指標(biāo)的應(yīng)用原理。
評價指標(biāo)的熵:假設(shè)一個評估項目中有n個被評價對象和m個評價指標(biāo),則可用下式表示第i個評價指標(biāo)的熵權(quán)wi:
2.2 預(yù)測方法權(quán)系數(shù)的確定
本文擬用熵與判斷矩陣相結(jié)合的方式來確定各預(yù)測方法的權(quán)重系數(shù)。以下是分析過程[4]:
①經(jīng)過綜合考慮各相關(guān)指標(biāo)等得出n個比較合理的方案,后續(xù)將對這n個方案進(jìn)行分析和評價。
④確定各預(yù)測方法的權(quán)重。
對規(guī)格化矩陣直接加權(quán),得到各預(yù)測方法的評價值,再通過歸一化處理所獲得的預(yù)測方法的權(quán)重。
1)評價指標(biāo)的合并。
主要是要綜合考慮對某一種方法的各項指標(biāo)評價值,以此獲得對于所研究的預(yù)測方法的綜合評價值。
具體方法有:直接加權(quán)法,理想點(diǎn)距離,與理想點(diǎn)貼近度等。
2)預(yù)測方法權(quán)重。
主要是依據(jù)對各種預(yù)測方法的綜合評價值,得出預(yù)測方法的權(quán)重系數(shù)。
基本方法有:直接歸一化,考慮幾種評價指標(biāo)的合并方法進(jìn)行綜合后再歸一化等。
3 應(yīng)用分析
本文以某單位某10年的公務(wù)事業(yè)費(fèi)開支標(biāo)準(zhǔn)為研究對象,通過上述步驟對該單位的公務(wù)事業(yè)費(fèi)開支進(jìn)行預(yù)測。
3.1 研究對象的選取
選取某10年的公共事業(yè)費(fèi)開支標(biāo)準(zhǔn)(單位:萬元)為研究對象,具體數(shù)據(jù)如表1所示。
3.2 基本預(yù)測方法選取
目前在公共事業(yè)費(fèi)實(shí)際預(yù)測過程中有許多的預(yù)測方法,其中應(yīng)用頻率比較高的是BP神經(jīng)網(wǎng)絡(luò)方法,此外還有指數(shù)函數(shù)方法、冪函數(shù)方法和GM(1,1)方法。在下文中,將對這幾種方法進(jìn)行重點(diǎn)分析。
3.3 評價指標(biāo)集
在指標(biāo)評價中,有許多預(yù)測方法可供選擇,并且每種預(yù)測方法的評價指標(biāo)也有一定差別,嚴(yán)格來講沒有一種預(yù)測評價方法是相對固定的,也不能說哪一種評價方法是絕對有效的。實(shí)際應(yīng)用時,大部分決策者擅長采用基于誤差平方和達(dá)到最小或誤差絕對值求和達(dá)到最小的評價準(zhǔn)則。但就本文來看,在預(yù)測評價時更應(yīng)該深入研究一下預(yù)測方法。嚴(yán)格來講,預(yù)測模型僅僅是關(guān)系預(yù)測效果好壞的重要因素之一,除此以外,決策者對預(yù)測方法的信賴程度、對預(yù)測結(jié)果的取舍,都有可能影響預(yù)測結(jié)果的準(zhǔn)確度。鑒于此,對預(yù)測方法的綜合評價是有必要的??梢雽︻A(yù)測效果的主觀評價指標(biāo),設(shè)定以下評價指標(biāo)集來評價所采用的預(yù)測方法是否準(zhǔn)確。
①模型對于預(yù)測問題的適用程度。預(yù)測模型對所分析問題的適應(yīng)性,即為模型的適用程度。譬如:選用的預(yù)測模型比較適用于短期預(yù)測而非中長期預(yù)測,但實(shí)際上是要對預(yù)測對象進(jìn)行中長期預(yù)測時,在該組合預(yù)測問題時就有可能出現(xiàn)明顯的誤差,誤差越大,其適應(yīng)性越差。而對平穩(wěn)過程的分析以及對非平穩(wěn)過程的分析也都如此。
②模型擬合值對參與建模數(shù)據(jù)的偏差。通常情況下評價一個預(yù)測模型最一般、最基本的標(biāo)準(zhǔn)就是與傳統(tǒng)的基于誤差平方和達(dá)到最小或誤差絕對值求和達(dá)到最小的評價準(zhǔn)則相一致[5]。
③模型對測試數(shù)據(jù)的偏差。與僅用參與建模數(shù)據(jù)的擬合情況來評價顯得更為科學(xué),在一定程度上更能體現(xiàn)了預(yù)測模型的推廣性能。
④決策者的信賴程度。該因素表示的是決策者對預(yù)測模型的喜好程度,雖然在一定程度上具有主觀性,但也能在一定程度上反映出決策者的實(shí)際工作經(jīng)驗(yàn),可以做到將專家知識融入預(yù)測過程中。
3.4 評價矩陣的確定
對于定量分析出的指標(biāo)評價值,可直接用其數(shù)值進(jìn)行分析。由于本文引入了定性分析指標(biāo),因此需要對定性評價值進(jìn)行量化處理,根據(jù)分析結(jié)果,給各方案賦定性評價值:“好”、“一般”等等。對所賦的定性指標(biāo)的量化方法可采用Bipolar尺度。選10點(diǎn)標(biāo)度,從終點(diǎn)開始,給最優(yōu)屬性賦10點(diǎn),給最差屬性值賦0點(diǎn)[6]。如圖1所示。
通過計算求取以及咨詢專家后給出的評價矩陣如表2所示。
3.5 專家意見的綜合
計算權(quán)重:
BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)模型的權(quán)重為0.1016,冪函數(shù)模型的權(quán)重為0.2167,指數(shù)函數(shù)模型的權(quán)重為0.4307,GM(1,1)模型的權(quán)重為0.2510.
3.6 預(yù)測結(jié)果
根據(jù)上述方法,對幾種預(yù)測方法的結(jié)果進(jìn)行加權(quán)后得到的結(jié)果為1214.8萬元。根據(jù)上述組合預(yù)測模型,計算出該單位下年的公務(wù)事業(yè)費(fèi)標(biāo)準(zhǔn)應(yīng)為1214.8萬元。
4 結(jié)論
利用基于熵權(quán)的最優(yōu)組合權(quán)系數(shù)的確定方法與一般的權(quán)系數(shù)確定方法相比這種方法更側(cè)重于實(shí)際的應(yīng)用效果,因?yàn)樗^具有能綜合考慮到預(yù)測過程中多個影響因素,能更加充分地利用每個預(yù)測模型所獲得的信息,能有效地改善模型的擬合能力并且提高預(yù)測的精度等特點(diǎn)。同時這種方法也考慮到了實(shí)際過程中預(yù)測人員的主觀因素的影響,能充分利用專家知識,所以這種利用基于熵權(quán)的最優(yōu)組合權(quán)系數(shù)的確定方法是較為符合公務(wù)事業(yè)費(fèi)費(fèi)用預(yù)測的實(shí)際情況的。
參考文獻(xiàn):
[1]韓冬梅,牛文清,楊榮.線性與非線性最優(yōu)組合預(yù)測方法的比較研究[J].情報科學(xué),2007(11):1672-1678.
[2]栗然,劉會蘭,盧云,韓彪.基于交叉熵理論的變壓器配電變壓器壽命組合預(yù)測方法[J].電力系統(tǒng)保護(hù)與控制,2014(2):97-103.
[3]尹世偉,郭慶偉,李鑫茹,潘龍.從熱機(jī)到熱寂—熵的起源與發(fā)展[J].大學(xué)化學(xué),2011(1):85-87.
[4]蔣鐵軍,張懷強(qiáng).基于信息熵的艦船裝備建造費(fèi)組合預(yù)測研究[J].艦船科學(xué)技術(shù),2011(1):127-130.
[5]何嬌嬌.組合預(yù)測模型及其在負(fù)荷預(yù)測中的應(yīng)用研究[D]. 三峽大學(xué),2013.
[6]任凱.基于設(shè)施投資決策系統(tǒng)理論與方法研究[D].天津大學(xué),2008.
[7]索瑞霞,王福林.組合預(yù)測模型在能源消費(fèi)預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2010(18):80-85.
[8]張學(xué)清,梁軍,張熙,張峰,張利,徐兵.基于樣本熵和極端學(xué)習(xí)機(jī)的超短期風(fēng)電功率組合預(yù)測模型[J].中國電機(jī)工程學(xué)報,2013(25):33-40.
[9]張棟梁,嚴(yán)健,李曉波.基于馬爾科夫鏈篩選組合預(yù)測模型的中長期負(fù)荷預(yù)測方法[J].電力系統(tǒng)保護(hù)與控制,2016(12):63-67.
[10]崔吉峰,乞建勛,楊尚東.基于粒子群改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型及其應(yīng)用[J].中南大學(xué)學(xué)報,2009(2):190-194.
[11]李志鵬,李薇,劉志杰.基于組合預(yù)測模型的產(chǎn)業(yè)總產(chǎn)值的預(yù)測研究[J].電腦與電信,2015(3):62-64.
[12]王應(yīng)明.基于相關(guān)性的組合預(yù)測方法研究[J].預(yù)測,2002(21):448-454.
[13]李景熹,蔣鐵軍.基于特征加權(quán)支持向量機(jī)的武器系統(tǒng)效能評定方法[J].2013(05).
[14]向昌盛.基于支持向量機(jī)的時間序列組合預(yù)測模型[D].湖南農(nóng)業(yè)大學(xué),2011.
[15]楊春波.基于灰色模型與人工神經(jīng)網(wǎng)絡(luò)的改進(jìn)組合預(yù)測模型及其應(yīng)用研究[D].山東師范大學(xué),2009.
[16]王莎莎,陳安,蘇靜,李碩.組合預(yù)測模型在中國GDP預(yù)測中的應(yīng)用[J].山東大學(xué)學(xué)報(理學(xué)版),2009(02).