何超,劉西林
西北工業(yè)大學管理學院,西安710129
預測精度不僅與所用數(shù)據(jù)有關,還與選用的模型有關。預測科學發(fā)展至今,已積累了許多行之有效的預測方法,據(jù)不完全統(tǒng)計,多達300種[1]。傳統(tǒng)的單個預測模型僅是從模型提前假設好的某一方面表示數(shù)據(jù)規(guī)律,通常丟失了大量隱藏在數(shù)據(jù)中的信息,具有片面性。組合預測(也稱綜合或復合預測)[2]是一種利用各單項預測得到的預測信息,計算給予不同的權數(shù)組合,以獲得組合預測值的預測方法。Bates和Granger[3]在1959年首次提出組合預測理論,1969年,Bates和Granger在“運籌學季報”發(fā)表“組合預測”[4],對僅僅是兩個預測結果的組合進行了系統(tǒng)研究。對于常見的時間序列,有研究表明,沒有哪一種方法能適用于所有的時間序列預測,而應根據(jù)實際情況,選擇適當?shù)哪P团c方法[5-6]。國內(nèi)在20世紀80年代中后期關于組合預測也有一些研究成果,而大部分組合預測[7-14]也都僅是兩種方法的組合。通過相關文獻檢索,發(fā)現(xiàn)現(xiàn)有組合預測模型還存在以下不足:(1)組合的兼容性與可增加性。已有的組合方法基本上都是將兩種預測方法組合起來,涵蓋的范圍較窄,一般不能夠在組合中再加入第三種預測方法。(2)預測方法與系統(tǒng)結合的不緊密。若能夠實現(xiàn)預測方法與系統(tǒng)的結合,將使得預測自動化,這有利于科研成果走進企業(yè)應用,實現(xiàn)科研成果的迅速推廣。
針對此,本文構建了一般的組合模型,并且從多元線性回歸的角度給出權系數(shù)的數(shù)學計算步驟,避免人工賦權、專家難尋的弊端,使得模型具有可添加性。在此基礎上,建立專門的投資預測系統(tǒng),實現(xiàn)預測的自動化,這使得科研成果能被實際企業(yè)應用。
本文構建的綜合預測模型試圖將多種預測方法得到的預測結果進行組合,使最終的預測結果具有更高的精度。預測精度衡量的標準是最小方差,即將多種預測方法得到的預測值進行加權組合后得到的綜合預測值與給出的原始數(shù)據(jù)之間誤差的平方和最小。轉化為數(shù)學模型為:
式中,x1,x2,…,xp表示p種不同的預測方法計算的預測結果;β1,β2,…,βp則表示p種預測方法各自的權系數(shù)。
同時,為了使結果能更加體現(xiàn)各個預測方法在綜合模型中的相對重要程度,還需滿足條件:
只有滿足上述兩個條件的β1,β2,…,βp即綜合模型所要求的權系數(shù)。
2.2.1 綜合預測模型目標函數(shù)的求解
函數(shù):
在形式上與p元線性回歸方程
相似,本文就是試圖利用多元線性回歸模型來求解權重β1,β2,…,βp。
從模型意義角度上講,多元線性回歸研究的是因變量與自變量間的因果關系,而綜合預測模型與所選取的典型模型方法之間也存在因果關系,典型預測方法的預測結果是影響綜合預測結果的因素。
基于此兩點,本文建模的求解過程利用了多元線性回歸模型的思路。
假設影響結果y的因素有p個:x1,x2,…,xp。假設它們之間有線性關系:
式中x1,x2,…,xp都是可精確測量或可控制的一般變量,y是可觀測的隨機變量,β1,β2,…,βp是未知參數(shù),ε是服從N(0,σ2)分布的隨機誤差。對于n組樣本
由式(1)可知,yi具有數(shù)據(jù)結構式:
其中各εi(i=1,2,…,n)相互獨立,且均服從N(0,σ2)。的估計分別記為那么得到一個p元線性方程:
將樣本點式(2)代入式(4),可求得相應的值
想要求出β1,β2,…,βp的估計值,使得由式(5)計算得的與yi之間的離差最小。
其解β1,β2,…,βp稱為最小二乘估計。
因而式(6)用矩陣形式可簡潔地表示為:
在回歸分析中通常(XTX)-1存在,從而最小二乘估計可表示為:
借助多元線性回歸的思路完成了β1,β2,…,βp的估計值,使得由式(5)計算得的與yi之間的離差最小。
2.2.2 綜合預測模型中約束求解的探索
建模中的第二步,使得權值之和為1,即滿足
窮舉法:借助MATLAB強大的計算能力,但在實際操作過程中會遇到很多問題。如:窮舉法的取值間隔不好把握,間隔不可能取到足夠小,而取得較大可能導致錯過極值點。實驗表明,當選取的間隔較小,達到小數(shù)點后4位時,窮舉法就會有非常大的計算量,導致MATLAB卡死;更重要的是,綜合預測模型是選取多種合適的預測方法進行組合,隨著更多合適的預測方法被發(fā)現(xiàn),加入到綜合模型中的方法越多,使用窮舉法的計算量就會大幅上升,用這種方法解決的缺陷就更加明顯。
同樣借助回歸分析思路,可求得權值。但是回歸分析的思路過程中,本身不涉及權值和為1這樣的條件,若要滿足權值和為1,只能通過外部加入。從這樣的指導思想出發(fā),設想在外部引入和為1這樣一個條件。已知β1,β2,…,βp,如果存在第βp+1種預測方法,則βp+1就應當滿足
通過這個方程,并經(jīng)過多次的實驗推理后,本文將該函數(shù)作為已知條件來解決。具體來講,已知線性關系:
等式約束為:
將式(9)代入到式(8)中,得到:
化簡得:
將(y-xp)記為z,將(xi-xp)記為mi,其中i=1,2,…,p-1。
則式(10)可寫為:這個式子與p-1元線性回歸方程很類似,這時運用上節(jié)提供的思路,由式(7)
同理推導出來式(11)最小二乘估計:
其中,M=[m1m2m3…mp-1],Z=[y-xp]n×1。
可知βi的估計值也滿足:
至此,滿足本文最初建模要求
的p種預測模型的權重β1,β2,…,βp完滿求得。
投資預測及決策是油田開發(fā)生產(chǎn)企業(yè)經(jīng)濟管理的首要環(huán)節(jié),合理安排投資規(guī)模是保證油田經(jīng)濟穩(wěn)定發(fā)展的基礎,投資增長過猛,規(guī)模過大,超過資金供給的可能,會給油田經(jīng)濟帶來嚴重的消極后果。一般油田企業(yè)在確定某油田有持續(xù)開采的經(jīng)濟價值后,需要連續(xù)投資。
現(xiàn)以某油田1998年—2007年勘探開發(fā)投資規(guī)模為例來驗證本文提出綜合預測模型的正確性。通過對多個單一模型各自使用條件與實際預測結果多次用MATLAB軟件仿真比較后,最終選用移動平均法(2階)、多項式擬合法(4階)、指數(shù)函數(shù)法、灰色預測模型作為四種獨立的方法對投資規(guī)模進行預測(這四種方法的理論在文獻[15]中)。在此基礎上,完成綜合預測模型。
綜合最優(yōu)模型所需要用到的是上一章中推導出的四個式子:
表1 單個模型及綜合模型預測結果
利用上一節(jié)的結論計算權重。
各單一預測方法及綜合預測模型預測結果如表1所示。其中:
y1表示移動平均法(二階)模型預測結果;
y2表示多項式擬合法(四階)模型預測結果;
y3表示指數(shù)函數(shù)模型預測結果;
y4表示灰色預測模型預測結果;
y5表示綜合模型預測結果。
從表1結果可看出,組合后的預測結果y5,其誤差平方和最小,達到了最初建立綜合模型的目的。
用MATLAB軟件仿真得各個預測結果趨勢圖,如圖1所示;將2003年—2008年的圖像進行放大觀察,如圖2所示。由圖可看出,綜合預測模型趨勢線對于數(shù)據(jù)點的擬合情況相比單一的四種預測結果都要好,由此可判斷組合后的預測結果精度有所提高,預測結果更可靠。
圖1 單個模型及綜合最優(yōu)模型趨勢圖
綜合預測結果可表示為:y5=a×y1+b×y2+c×y3+d×y4。
圖2 放大的單個模型及綜合模型趨勢圖
計算得到的各權重:a=-0.539 1,b=-0.997 5,c=2.039 1,d=0.497 6。
由表1還可看出四種單一預測模型中指數(shù)模型的誤差平法和最小,指數(shù)模型在綜合模型中所占的權重也的確是最大的。這符合常理,預測精度高的模型在綜合模型中的權重也會較大。而且從表中結果可以看出,綜合后的預測結果y5,其誤差平方和最小,達到建立綜合模型的目的。
初始數(shù)據(jù)不同,選用擬合方法的不同,都需要重新建模,重新仿真。為了避免重復建模與實現(xiàn)預測的自動化,本文針對上例建立了專門的預測系統(tǒng),使得預測簡單化、自動化,視圖直觀化。該系統(tǒng)的建立,使得對預測模型不懂的非專業(yè)人員也能利用此系統(tǒng)進行預測計算,方便決策者做出決策。此處為說明問題,只簡要展示了用戶認證模塊與數(shù)據(jù)綜合處理模塊,如圖3~圖5,在實際應用中,企業(yè)可以根據(jù)自身情況,建立更加完善的系統(tǒng),作為企業(yè)內(nèi)部使用。
3.2.1 登陸模塊
登陸模塊如圖3、圖4所示。
圖3 登錄界面
圖4 提示窗口
圖5 組合處理模塊界面
3.2.2 綜合處理模塊
各個單獨模型及綜合模型處理的結果如圖5所示,決策者可根據(jù)綜合預測結果為決策依據(jù),做出投資規(guī)模決策。
以往的組合預測僅僅是建模、計算,并且主觀的人工賦權會直接影響到預測的準確性,而本文建立的通用綜合預測模型,不僅從多元線性回歸的角度給出權系數(shù)的數(shù)學計算步驟,而且增加了組合預測模型的可添加性。通過實例驗證了本文模型及計算步驟的正確性,并建立了專門的投資預測系統(tǒng),將預測與系統(tǒng)緊密結合,使得預測自動化,有利于科研成果走進企業(yè)應用。
[1]馮文權,茅奇,周毓萍.經(jīng)濟預測與決策技術[M].4版.武漢:武漢大學出版社,2002.
[2]陳春光.組合預測在石油行業(yè)預算管理中的應用[D].天津:天津大學,2008:55.
[3]商勇,丁詠梅.最優(yōu)組合預測方法評述[J].統(tǒng)計與決策,2005(9).
[4]Bates JM,Granger CW J,The combination of forecasts[J].Operational Research Quarterly,1969,20:451-468.
[5]Dantzig G B,Ramser JH.The truck dispatching problem[J].M anagement Science,1959,10(6):80-91.
[6]Laporte G,Nobert Y.A branch and bound algorithm for the capacitated vehicle routing problem[J].Operations Research Spektrum,1983,5:77-85.
[7]石慧,王玉蘭,翁福利.BP神經(jīng)網(wǎng)絡和模糊時間序列組合預測模型及其應用[J].計算機應用,2011(A 02):90-91.
[8]戴榮,黃成.飛機飛行事故率預測建模與仿真研究[J].計算機仿真,2011,28(7):120-123.
[9]劉東君,鄒志紅.灰色和神經(jīng)網(wǎng)絡組合模型在水質預測中的應用[J].系統(tǒng)工程,2011-09.
[10]鮑單,吳艷萍,何勇.基于GM(1,1)模型和線性回歸的組合預測新方法[J].系統(tǒng)工程理論與實踐,2004(3):95-98.
[11]張倩,沈利,蔡煥杰,等.基于灰色理論和回歸分析的需水量組合預測研究[J].西北農(nóng)林科技大學學報:自然科學版,2010,38(8):223-227.
[12]侯麗敏,馬國鋒.基于灰色線性回歸組合模型鐵路客運量預測[J].計算機仿真,2011(7):1-3.
[13]甘健勝,陳國龍.線性組合預測模型及其應用[J].計算機科學,2006,33(9):191-194.
[14]許秀莉,羅健.一種新的組合灰色神經(jīng)網(wǎng)絡預測模型[J].廈門大學學報,2002(3):164-167.
[15]劉思峰,黨耀國.預測方法與技術[M].北京:高等教育出版社,2005-08.