魏 欣, 郝江鋒, 陳華友, 朱家明
(1.安徽大學 數(shù)學科學學院,安徽 合肥 230601; 2.巢湖學院 數(shù)學與統(tǒng)計學院,安徽 合肥 238000; 3.安徽大學 互聯(lián)網學院,安徽 合肥 230039)
由于傳統(tǒng)的單項預測方法所利用的信息較少,一旦單項預測方法選擇錯誤,就會給預測帶來較大誤差。因此文獻[1]在1969年首次提出了組合預測方法。所謂組合預測就是將不同的單項預測模型的預測結果,利用加權算術平均、加權幾何平均或加權調和平均等加權平均形式進行組合,在一定的優(yōu)化準則下構建相應的數(shù)學模型,其目的是綜合利用各種單項預測模型所提供的有效信息。組合預測方法逐漸得到學者們的關注,而前期對組合預測的研究大多是對單點值的研究,然而在現(xiàn)實世界中,會出現(xiàn)很多不確定的信息,此時若只考慮一個數(shù)值,則會引起較大的誤差。文獻[2]給出了區(qū)間數(shù)的運算法則;文獻[3]通過區(qū)間數(shù)的形式描述了組合預測模型,建立了相應的區(qū)間型組合預測模型,結果表明,該模型具有更好的預測效果。
一些傳統(tǒng)的組合預測方法往往對不同的單項預測方法賦予固定的權系數(shù),這種賦權方法是默認不同的單項預測方法在各個時刻的表現(xiàn)大體相同,實際上不同的單項預測方法在不同時刻的預測精度并不相同,因此傳統(tǒng)的固定權系數(shù)的組合預測模型存在賦權缺陷。
文獻[4]提出了誘導有序加權平均(induced ordered weighted averaging,IOWA)算子的概念;在此基礎上,文獻[5]對區(qū)間數(shù)的組合預測進行了初步的研究,建立了基于IOWA算子的區(qū)間預測模型,該模型考慮了不同時點的預測精度,將預測精度作為誘導變量對各種單項預測方法進行有序加權平均,提高了預測精度;文獻[6]則將誘導有序加權平均(IOWA)算子和連續(xù)有序加權平均(continuous ordered weighted averaging,COWA)算子結合,提出了誘導連續(xù)有序加權平均(induced continuous ordered weighted averaging,ICOWA)算子,并進行了相應的實例分析,提高了預測的精度。
現(xiàn)有的組合預測方法有關權系數(shù)的計算中,實際應用較多的是最小方差法,并且大部分是用絕對誤差作為準則來計算組合預測方法的權系數(shù),這些方法大多是為了改善某種擬合的誤差而建立起來的。文獻[7]詳細分析了組合預測模型權重的計算方法,實際上預測有效度也是反映預測精度的有效指標之一;文獻[8]提出基于預測有效度的組合預測模型。預測有效度分為一階預測有效度和二階預測有效度。一階預測有效度主要考慮預測模型的精度,但一個好的預測方法,不但要求在預測精度上有良好的表現(xiàn),而且要求在預測精度的穩(wěn)定性上表現(xiàn)良好,為此提出二階預測有效度的概念[7]。
本文是在不確定信息的背景下,將二階預測有效度指標和ICOWA算子相結合,以各模型的預測精度作為誘導值進行集結,建立了基于二階預測有效度的ICOWA算子的區(qū)間組合預測模型。該模型將二階預測有效度的極大化作為目標函數(shù),最后通過實例驗證了該模型的可行性。
定義1[9]設a=[aL,aU]={x|aL≤x≤aU},其中aL,aU為實數(shù),則稱a為一個區(qū)間數(shù)。
記m=(aL+aU)/2,r=(aU-aL)/2,則稱m為區(qū)間的中心r為區(qū)間的半徑,區(qū)間數(shù)可記為a=[aL,aU]=(m;r)。
若有2個區(qū)間數(shù):
a=[aL,aU]=(m1;r1),
b=[bL,bU]=(m2;r2),λ∈R,
則它們之間的運算法則如下。
加法運算:
a+b=[aL+bL,aU+bU]=
(m1+m2;r1+r2);
減法運算:
a-b=[aL-bU,aU-bL]=
(m1-m2;r1-r2);
數(shù)乘運算:
定義2[10]設[a,b]為區(qū)間數(shù),令
(1)
則稱FQ為連續(xù)有序加權平均(COWA)算子。其中函數(shù)Q: [0, 1]→[0, 1]為基本單位區(qū)間單調(basic unit monotonous,BUM)函數(shù),滿足Q(0)=0、Q(1)=1;且若x>y,則Q(x)≥Q(y)。
FQ([a,b])=λb+(1-λ)a。
定義3[9]設f:Ω+→R+,其中,Ω+={[a,b]|,a∈R+,b∈R+,a
f(〈u1,[a1,b1]〉,〈u2,[a2,b2]〉,…,
(2)
則稱[ai,bi](i=1,2,…,n)為誘導連續(xù)區(qū)間有序加權平均(ICOWA)算子。其中,l=(l1,l2,…,ln)是與[ai,bi](i=1,2,…,n)有關的加權向量,滿足非負性和歸一化;[ai,bi](i=1,2,…,n)稱為誘導變量;u-index(i)是u1,u2,…,un中第i大數(shù)所對應的下標。
ICOWA算子的基本特征是利用COWA算子對區(qū)間數(shù)據(jù)[ai,bi](i=1,2,…,n)進行集成之后,再對集成的結果利用IOWA算子進行誘導有序加權平均。
設某社會經濟現(xiàn)象的時間序列指標觀察值為{xt|t=1,2,…,N},其中xt=[at,bt]=(mt;rt),有m種單項預測方法對其進行預測。xit=[ait,bit]=(mit;rit)為第i種預測方法在第t時刻上的區(qū)間預測值,i=1,2,…,m;t=1,2,…,N。eit為第i種預測方法在第t時刻的預測相對誤差,Ait=1-|eit|為第i種預測方法在第t時刻的預測精度。
定義4[11]稱Mi=E(Ai)(1-σ(Ai))為第i種預測方法的二階預測有效度,i=1,2,…,m,其中
(3)
定義5[12]令
(4)
則稱uit為第i種單項預測方法在第t時刻的預測精度,i=1,2,…,m;t=1,2,…,N。
顯然uit∈[0,1],可以把uit當作預測值[ait,bit]的誘導值,即根據(jù)每一個uit與之相應的預測值[ait,bit],構成m個二維數(shù)組〈u1t,[a1t,b1t]〉, 〈u2t,[a2t,b2t]〉, …,〈umt,[amt,bmt]〉。
由定義2可以得到,由實際區(qū)間值及COWA算子生成的t時刻的實際集結值FQ(xt)=FQ([at,bt])和各單項預測方法在t時刻預測值的集結值FQ(xit)=FQ([ait,bit]);再由定義3,可以得到ICOWA算子生成的t時刻的組合預測值,計算公式為:
(5)
定義6[13]令
i=1,2,…,m;t=1,2,…,N
(6)
則稱eit為第i種單項預測方法在第t時刻基于連續(xù)有序加權平均(COWM)算子的區(qū)間預測的相對誤差。
i=1,2,…,m;t=1,2,…,N
(7)
則稱eu-index(it)為由區(qū)間預測精度序列u1t,u2t,…,umt作為誘導變量所產生的第i大的基于ICOWA算子的預測相對誤差。
由(5)~(7)式可得組合預測的相對誤差為:
(8)
設At為第t時刻的組合預測精度,則有:
At=1-|et|=
根據(jù)定義4,基于ICOWA算子的組合預測的二階預測有效度M為:
M=E(A)(1-σ(A))=
其中,E(A)為組合預測方法的預測精度序列的數(shù)學期望;σ(A)為預測精度序列的標準差。顯然,E(A)和σ(A)是各種單項預測方法加權系數(shù)l1,l2,…,lm的函數(shù),因此M也是l1,l2,…,lm的函數(shù),記為M(l1,l2,…,lm)。
一般地,M(l1,l2,…,lm)越大表示組合預測方法越有效,因此基于二階預測有效度的ICOWA算子的區(qū)間組合預測模型可表示為:
(9)
文獻[14]針對實數(shù)型預測有效度的組合預測模型探討了其近似求解算法。本文建立的模型(9) 式也是關于權系數(shù)的非線性規(guī)劃問題,且目標函數(shù)是非光滑的。在文獻[14]的基礎上,可以得到基于二階預測有效度的ICOWA算子的區(qū)間組合預測模型預測精度序列的一個性質。
定理1 模型(9)式組合預測方法的預測精度序列{At|t=1,2,…,N}的數(shù)學期望E(A)和標準差σ(A)滿足:
(10)
其中,Aa-index(it)=1-|ea-index(it)|為ICOWA算子在第t時刻的預測精度。
證明設ea-index(it)為ICOWA算子的預測相對誤差,i=1,2,…,m;t=1,2,…,N,則有:
因此
(11)
(12)
考慮到雙重求和符號的可交換性,則有:
(13)
從而由(12)式、(13)式得:
注意到(11)式,存在α0∈[0,1],使得:
因此有:
(14)
將(14)式代入到標準差σ(A),則有:
(15)
其中
[Aa-index(jt)-E(Aa-index(jt))]}
(16)
即pij為ICOWA算子預測精度序列的相關系數(shù)。因為pij∈[-1,1],所以有:
(17)
綜上,定理1證畢。
按照定理1,組合預測模型可以表示為如下新的非線性規(guī)劃模型:
(18)
其中,α0∈[0,1]為常數(shù)。模型(18)式比模型(9)式更加簡潔,易于求解。
為了說明本文提出的基于二階預測有效度的ICOWA算子的組合預測模型的有效性,引用文獻[9]中的數(shù)據(jù)進行實例分析,實例分析數(shù)據(jù)見表1所列。
表1 實際區(qū)間值和單項預測方法的預測區(qū)間值
以下就實例分析計算步驟進行簡要說明。
根據(jù)(4)式,計算出各單項預測方法在各個時刻點處的預測精度值序列,見表2所列。
表2 單項預測方法的預測精度值序列
根據(jù)各單項預測方法在某一時刻的預測精度,將預測精度按照從小到大排序,進而可以得到預測精度所對應的預測區(qū)間[au-index(it),bu-index(it)]的數(shù)據(jù),見表3所列。
根據(jù)(5)式,計算出各單項預測方法的預測相對誤差和預測精度序列,見表4所列,再根據(jù)所得到的預測區(qū)間的排序值,計算出預測相對誤差和預測精度序列的排序值,見表5所列。
表3 由預測精度排序所得到的預測區(qū)間值的排序
表4 各單項預測方法的相對誤差和預測精度序列
表5 由預測精度排序得到的相對誤差和預測精度序列
由(3)式和(16)式計算可得:
p12=p21=0.411 2;p13=p31=-0.265 5;
p23=p32=-0.256 6。
將上述值代入模型(18)式可得最優(yōu)模型如下:
2l1l2×1.28 86×10-3+2l1l3×
(-5.043×10-4)+
其中,l1+l2+l3=1;l1≥0,l2≥0,l3≥0。
取α0=0.1,利用lingo優(yōu)化軟件計算得到組合預測的權系數(shù)為:
l1=1,l2=0,l3=0,M=0.995 0。
由此可以發(fā)現(xiàn),l2=0,l3=0并不代表它是冗余預測模型,而是表明未來的組合預測是把這3種單項預測方法的預測值中精度高的作為其新的預測值。
為了更好地評定模型效果,根據(jù)預測的評價原則,分別計算模型1、模型2、模型3以及本文預測方法的各預測精度指標[15]。
平均區(qū)間位置誤差平方和:
平均區(qū)間長度誤差平方和:
平均區(qū)間誤差平方和:
MSEI=MSEP+MSEL=
平均區(qū)間相對誤差和:
計算結果見表6所列。
表6 各模型精度比較
從表6可以看出,本文所提出的組合預測方法預測誤差指標值除了MSEL均低于另外3種單項預測方法,說明本文提出的方法的預測效果更好。
為了進一步說明本文提出的組合預測模型的有效性,引用合肥市2018年12月空氣質量指數(shù)作為原始數(shù)據(jù),運用支持向量回歸(support vectaregression,SVR)、平滑轉移自回歸(smoothtransition autoregression,STAR)、Holt指數(shù)平滑法作為單項預測方法對原始數(shù)據(jù)進行預測,結果見表7所列。
按照上例所示方法進行同樣計算,可得組合預測結果,將各單項預測方法和組合預測方法的誤差進行比較分析,見表8所列。
表7 實際區(qū)間值和單項預測方法的預測區(qū)間值
表8 各模型精度比較
從表8可以看出,本文所提出的組合預測方法預測誤差指標值除了MSEL均明顯低于另外3種單項預測方法,進一步說明本文提出方法的預測效果更好。
本文將二階預測有效度和ICOWA算子相結合,構建了一個新的變權組合預測模型;將二階預測有效度引入到區(qū)間組合預測,并用實例進行了分析,驗證了本文提出的組合預測模型的有效性。實驗結果表明,本文方法能夠綜合利用各單項預測方法所提供的有效信息,是優(yōu)性組合預測模型。