劉宏利,高子鵬
(天津理工大學(xué) 電氣電子工程學(xué)院,天津300384)
近年來(lái),由于城市改造進(jìn)程加快,我國(guó)建筑、工程能耗同比增長(zhǎng)近30%,加強(qiáng)能源管理,提高能源利用效率,改善能源使用環(huán)境成為當(dāng)前首要任務(wù),因此各地有關(guān)部門對(duì)能源監(jiān)測(cè),能耗預(yù)測(cè)等方面開展深入研究.謝武明等[1]基于BP 神經(jīng)網(wǎng)絡(luò),利用遺傳算法優(yōu)化網(wǎng)絡(luò)對(duì)污水處理廠電耗進(jìn)行預(yù)測(cè);段冠囡[2]提出了一種基于GM-RBF 神經(jīng)網(wǎng)絡(luò)的超高層建筑暖通空調(diào)能耗預(yù)測(cè)方法.同時(shí),時(shí)間序列分析法作為一種成熟的統(tǒng)計(jì)學(xué)方法,能源消耗預(yù)測(cè)等領(lǐng)域有著廣泛的應(yīng)用.黃榮庚等[3]使用ARMA 算法對(duì)地鐵環(huán)控系統(tǒng)進(jìn)行能耗預(yù)測(cè);趙建忠等[4]將小波變化與ARMA 算法相結(jié)合預(yù)測(cè)導(dǎo)彈裝備備件需求;曾德明[5]使用BP神經(jīng)網(wǎng)絡(luò)與ARMA 相結(jié)合的方法預(yù)測(cè)電力負(fù)荷情況等等.在一些特殊研究領(lǐng)域ARMA 也是作為一種必要的預(yù)測(cè)方法有所應(yīng)用,如文獻(xiàn)[6]中,作者使用ARMA與Kriging 相結(jié)合的方式預(yù)測(cè)土壤鹽分變化情況.
由于時(shí)間序列分析法在短期、小樣本預(yù)測(cè)中的預(yù)測(cè)結(jié)果更好,實(shí)現(xiàn)更方便,所以本文使用時(shí)間序列分析法來(lái)實(shí)現(xiàn)耗能預(yù)測(cè),通過(guò)改進(jìn)EMD-ARMA 算法,進(jìn)而提高預(yù)測(cè)結(jié)果的準(zhǔn)確度.
能耗預(yù)測(cè)的服務(wù)對(duì)象是建筑群的能耗數(shù)據(jù),本文使用的數(shù)據(jù)樣本是某單位辦公樓2018 年8 月份的能耗數(shù)據(jù),樣本數(shù)據(jù)量31,樣本數(shù)據(jù)見表1.
表1 電能能耗數(shù)據(jù)樣本Tab.1 Sample of energy consumption data
由表1 可知,該數(shù)據(jù)樣本不符合平穩(wěn)時(shí)間序列特性,所以該數(shù)據(jù)樣本是不能直接使用ARMA 模型進(jìn)行建模的.故而要對(duì)數(shù)據(jù)樣本進(jìn)行一定的數(shù)據(jù)預(yù)處理,引入EMD 算法提取原始數(shù)據(jù)樣本的特征分量,進(jìn)而對(duì)特征分量進(jìn)行ARMA 建模. EMD 算法可將原始的數(shù)據(jù)樣本Q(t)分為有限個(gè)具有原始數(shù)據(jù)樣本特征的數(shù)據(jù)分量樣本Ci(t),分解得到的每個(gè)分量數(shù)據(jù)樣本都具有一定的原始數(shù)據(jù)樣本特征,分量數(shù)據(jù)樣本能在某方面更顯著的反應(yīng)出原始信號(hào)的數(shù)據(jù)特點(diǎn).EMD 算法的一般計(jì)算過(guò)程如以下四個(gè)步驟:
1)求取原始數(shù)據(jù)樣本Q(t)的所有極值點(diǎn)(一階導(dǎo)數(shù)為零).
2)利用三次樣條函數(shù),擬合極值點(diǎn)得到上包絡(luò)和下包絡(luò)函數(shù),求取上下包絡(luò)均值M(t).
3)取H(t),H(t)=Q(t)-M(t).此時(shí)H(t)一般不為平穩(wěn)數(shù)據(jù)序列,故此對(duì)H(t)重復(fù)步驟(1)和(2),直到新的SD(H′(T))的范圍在0.2 ~0.3 之間,得到第一個(gè)本征分量C1(t)=H′(t)[7].
4)取新的復(fù)雜信號(hào)R(t),R(t)=Q(t)-H(t).再對(duì)R(t)重復(fù)步驟(1)、(2)和(3),得到第二個(gè)本征分量C2(t).重復(fù)該過(guò)程,直到最后一個(gè)數(shù)據(jù)序列Cn(t)不可被分解,此時(shí)該Cn(t)則是代表數(shù)據(jù)序列的趨勢(shì)或均值.
原始數(shù)據(jù)樣本經(jīng)過(guò)EMD 分解之后會(huì)得到多個(gè)平穩(wěn)時(shí)間序列分量,以及一個(gè)趨勢(shì)分量,該趨勢(shì)分量相對(duì)于多個(gè)平穩(wěn)時(shí)間序列分量而言一定是一個(gè)低頻的分量.
回歸是對(duì)連續(xù)的實(shí)數(shù)值進(jìn)行預(yù)測(cè),需要回歸評(píng)估指標(biāo)來(lái)對(duì)回歸模型進(jìn)行評(píng)價(jià),顯示回歸模型的有效性與優(yōu)越性.選取其中使用最為普遍的兩個(gè)回歸評(píng)估指標(biāo),分別是平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)[8].假設(shè)h(i)是預(yù)測(cè)結(jié)果中的第i個(gè)預(yù)測(cè)值,y(i)是數(shù)據(jù)樣本中的第i個(gè)真實(shí)值,n為預(yù)測(cè)樣本數(shù).
均方根誤差是預(yù)測(cè)值與真實(shí)值偏差的平方和與預(yù)測(cè)次數(shù)比值的平方根,用于衡量預(yù)測(cè)值同真值之間的偏差.
平均絕對(duì)誤差是絕對(duì)誤差的平均值,同樣是用來(lái)衡量觀測(cè)值同真值之間的偏差.
在改進(jìn)模型構(gòu)建的過(guò)程中,主要用到兩個(gè)數(shù)學(xué)模型,即ARMA 模型和多項(xiàng)式模型. 在ARAM 模型構(gòu)建(即求參)的同時(shí)還要考慮到模型定階的問(wèn)題.改進(jìn)模型的總體流程如圖1 所示.
圖1 本文算法流程圖Fig.1 Algorithm flow chart
改進(jìn)模型首先要將原始數(shù)據(jù)樣本進(jìn)行EMD 分解,得到各IMF 分量;隨后通過(guò)對(duì)分量信號(hào)進(jìn)行幅值和頻率的判斷,劃分頻率閾值將其分為高頻特征分量和低頻特征分量,然后再利用ARMA 模型和多項(xiàng)式模型對(duì)兩類分量進(jìn)行擬合預(yù)測(cè),最終將分量預(yù)測(cè)值疊加,得到預(yù)測(cè)結(jié)果.
對(duì)于高頻的平穩(wěn)時(shí)間序列分量,選用ARMA 模型進(jìn)行分量預(yù)測(cè). ARMA 模型由AR 模型和MA 模型兩個(gè)部分組成,以ARMA(p,q)來(lái)說(shuō)明[9-12],模型表示為:
式中,p為自相關(guān)階數(shù);q為偏相關(guān)(移動(dòng)平均)階數(shù);φ 為自相關(guān)系數(shù);δ 為偏相關(guān)(移動(dòng)平均)系數(shù),Q為觀測(cè)值,Z為誤差項(xiàng).由于誤差項(xiàng)在不同時(shí)期與Q值具有依存關(guān)系,故而Z也可視作相關(guān)因素.建立該模型首要面對(duì)的問(wèn)題就是如何根據(jù)數(shù)據(jù)樣本求取相關(guān)系數(shù),相關(guān)系數(shù)度量的是同一事件在兩個(gè)不同時(shí)期之間的相關(guān)程度,故而φi是由Q(t)與Q(t-i)的協(xié)方差所得.
式中,Cov(Q(t)、Q(t-i))是Q(t)與Q(t-i)的協(xié)方差;Var(Q(t))是Q(t)序列的方差;Var(Q(t-i))是Q(t-i)序列的方差.偏相關(guān)系數(shù)與自相關(guān)系數(shù)求取方式類似.在建模之前,存在一個(gè)前置問(wèn)題即定階的問(wèn)題,本文使用的定階方法是計(jì)算AIC 值,利用遍歷方式計(jì)算AIC 數(shù)值,取最小值定階[8].定階流程如圖2所示.
圖2 ARMA 定階建模流程圖Fig.2 ARMA fixed-order modeling flow chart
因?yàn)锳IC 校驗(yàn)是建立在熵(用來(lái)衡量體系混亂程度的度量)的基礎(chǔ)上的,因而可以權(quán)衡所估計(jì)模型的復(fù)雜程度和模型擬合數(shù)據(jù)的優(yōu)良程度. BIC 考慮的懲罰項(xiàng)要比AIC 多,使用BIC 可以在樣本數(shù)量過(guò)多時(shí),有效防止模型精度過(guò)高造成的模型復(fù)雜度過(guò)高.因?yàn)楸疚牡念A(yù)測(cè)對(duì)象屬于小數(shù)據(jù)樣本,為了精簡(jiǎn)算法易于實(shí)現(xiàn),單純計(jì)算AIC 值用于定階.在一般情況下AIC 可以表示為:
式中,k值是參數(shù)數(shù)量;L為數(shù)據(jù)樣本的似然函數(shù).
對(duì)于低頻趨勢(shì)分量,選用高階多項(xiàng)式擬合的方式進(jìn)行預(yù)測(cè),求取擬合公式,計(jì)算其低頻分量的預(yù)測(cè)結(jié)果.低頻趨勢(shì)分量高階多項(xiàng)式擬合公式:
式中,IMF′為低頻分量;a為多項(xiàng)式系數(shù). 由式4 可知,高頻的平穩(wěn)時(shí)間序列ARMA 模型的擬合公式:
式中,φ 為自回歸系數(shù);δ 為偏回歸(移動(dòng)平均)系數(shù),IMF 為高頻分量,Z為誤差.將各IMF 分量作和,得本文模型的擬合公式:
式中,x為高頻分量個(gè)數(shù);y為低頻分量個(gè)數(shù).
通過(guò)實(shí)驗(yàn),這種預(yù)測(cè)方式,對(duì)于預(yù)測(cè)值的個(gè)數(shù)越少越好,因此如果需要進(jìn)行多天的電能能耗預(yù)測(cè),就需要利用預(yù)測(cè)值來(lái)更新數(shù)據(jù)樣本,重新預(yù)測(cè)新值. 總體預(yù)測(cè)流程如圖3 所示.
圖3 多值預(yù)測(cè)流程圖Fig.3 Flow chart of multi-value prediction
通過(guò)實(shí)驗(yàn)仿真發(fā)現(xiàn),以這種方式對(duì)連續(xù)一段時(shí)間內(nèi)數(shù)據(jù)預(yù)測(cè)效果更好,只是計(jì)算量相對(duì)較大,并不適合在控制器上直接實(shí)現(xiàn).
本文算法是首先將數(shù)據(jù)樣本進(jìn)行EMD 分解,最終得到了四個(gè)IMF 分量.對(duì)其中的高頻時(shí)間序列分量IMF1、IMF2 和IMF3 結(jié)合相關(guān)參量建立ARMA 模型,對(duì)低頻趨勢(shì)分量IMF4 建立高階多項(xiàng)式模型,分別計(jì)算擬合公式,求取分量預(yù)測(cè)值.再將分量預(yù)測(cè)結(jié)果合成得到需要的第一個(gè)預(yù)測(cè)結(jié)果;求取第一個(gè)預(yù)測(cè)值后,更新數(shù)據(jù)樣本,求取第二個(gè)預(yù)測(cè)值,以此類推,得多值預(yù)測(cè)結(jié)果.
高頻分量IMF1 與其ARMA 的預(yù)測(cè)結(jié)果見圖4,由圖4 可知IMF1 的數(shù)據(jù)起伏較大. 這是因?yàn)镋MD算法本身第一個(gè)分解出的特征分量是原始數(shù)據(jù)樣本極大值包絡(luò)和極小值包絡(luò)的均值線條,該分量的頻率相比于其他分量的頻率要高,等長(zhǎng)取點(diǎn)就意味著數(shù)據(jù)起伏較大. 低頻分量IMF4 與其ARMA 和高階擬合的預(yù)測(cè)結(jié)果見圖5,高階多項(xiàng)式的預(yù)測(cè)結(jié)果與IMF4 基本重合,要明顯優(yōu)于ARMA 的預(yù)測(cè)結(jié)果.
圖4 高頻分量IMF1 及擬合Fig.4 IMF1 and fitting
圖5 低頻分量IMF4 及擬合Fig.5 IMF4 and fitting
從IMF4 的縱坐標(biāo)處可以看出,盡管使用多項(xiàng)式擬合的方式確實(shí)比ARMA 要準(zhǔn)確,但是誤差很小只有0.1 左右的誤差.故而本文算法使用在多點(diǎn)數(shù)據(jù)預(yù)測(cè)上還使用2.3 節(jié)的多值預(yù)測(cè)方法,利用計(jì)算量換取數(shù)據(jù)預(yù)測(cè)精度. 將本文算法與EMD-ARMA 直接預(yù)測(cè)做比較,預(yù)測(cè)結(jié)果與實(shí)際結(jié)果見表2,折線圖見圖6.
在預(yù)測(cè)多點(diǎn)數(shù)據(jù)方面,EMD-ARMA 是利用擬合公式直接求取多點(diǎn)對(duì)應(yīng)的預(yù)測(cè)值,本文算法是更新擬合公式連續(xù)只求取下一點(diǎn)的預(yù)測(cè)值,由圖6 可以看出,在未來(lái)的時(shí)間里增長(zhǎng)或下降的幅度將會(huì)有所增強(qiáng).在模型搭建方面,EMD-ARMA 是將經(jīng)驗(yàn)?zāi)B(tài)分解算法和ARMA 模型結(jié)合,本文算法是將經(jīng)驗(yàn)?zāi)B(tài)分解算法、ARMA 模型和多項(xiàng)式模型三者相結(jié)合.
表2 數(shù)據(jù)樣本及各算法預(yù)測(cè)結(jié)果Tab.2 Data samples and prediction results of each algorithm
圖6 各種算法預(yù)測(cè)結(jié)果折線圖Fig.6 Line chart for the result of each algorithm
本文利用利用均方根誤差(RMSE)和平均絕對(duì)誤差(MAE),來(lái)分析預(yù)測(cè)結(jié)果的準(zhǔn)確性.
由表3 和圖6 可知,EMD-ARMA 算法與本文算法相比較相差不多,算法的主要不同之處在多值預(yù)測(cè)上的方式不同和處理低頻分量的方式不同,從而使得預(yù)測(cè)精度有所提高.在低頻分量上選擇不同的處理方式,其原因在于ARMA 模型在低頻信號(hào)的擬合上,不如高階多項(xiàng)式模型擬合更加平滑,故而EMDARMA 的預(yù)測(cè)結(jié)果不如本文算法的預(yù)測(cè)結(jié)果更加準(zhǔn)確. 當(dāng)然,根據(jù)數(shù)據(jù)樣本的不同,經(jīng)過(guò)EMD 分解之后,低頻信號(hào)也不完全是使用多項(xiàng)式模型擬合最好.有時(shí)經(jīng)EMD 分解后得到的最低頻信號(hào)也足夠“高頻”,使用ARMA 模型一樣擬合效果很好,甚至要超過(guò)高階多項(xiàng)式模型.故而要以IMF 分量的頻率進(jìn)行判斷、分類,從而確定隨后的擬合方式.
表3 各算法RMSE 和MAETab.3 RMSE and MAE for the each algorithm
本文算法利用EMD 分解算法,對(duì)數(shù)據(jù)樣本進(jìn)行二次處理,對(duì)分解得到IMF 分量進(jìn)行判別.對(duì)低頻趨勢(shì)型的IMF 分量進(jìn)行高階多項(xiàng)式擬合,對(duì)高頻平穩(wěn)時(shí)間序列型的IMF 分量進(jìn)行ARMA 擬合,綜合各IMF 分量得到預(yù)測(cè)結(jié)果. 該算法的優(yōu)點(diǎn)在對(duì)于歷史數(shù)據(jù)樣本容量的要求很低,由于具體問(wèn)題具體分析的原因,預(yù)測(cè)結(jié)果也更為準(zhǔn)確.