廖文強,王江宇,陳煥新*,丁新磊,尚鵬濤,魏文天,周鎮(zhèn)新
(1-華中科技大學中歐清潔與可再生能源學院,湖北武漢 430074; 2-華中科技大學能源與動力工程學院,湖北武漢430074)
近年來我國經(jīng)濟一直處于高速發(fā)展的狀態(tài),同時能源消耗量也在不斷地增長。2017年,我國能源消耗總量為 3,105 Mtoe(Million Tons of Oil Equivalent,百萬噸石油當量),超過美國成為全球頭號能源消耗巨頭,占據(jù)著世界能源消耗總量的22%,并且還在不斷地增長,2017年的能源消耗增長率達到2.3%,是2016年能源消耗增長率1.1%的兩倍以上[1]。其中,建筑能耗占據(jù)著很重要的一部分,比重可達30%~40%[2-3],在建筑能耗中,暖通空調(diào)系統(tǒng)對能源的消耗量會占據(jù)30%~55%不等甚至更高[4-5]。
對于如何降低暖通空調(diào)系統(tǒng)能耗的研究一直都在不斷地進行,其中很重要的一部分就是對暖通空調(diào)系統(tǒng)能耗的預測研究。周旋等[6]使用基于小波分解和支持向量機的方法對辦公建筑空調(diào)負荷進行預測。張夢成等[7]使用基于FCM優(yōu)化神經(jīng)網(wǎng)絡的方法對辦公樓空調(diào)負荷進行預測。通過對暖通空調(diào)系統(tǒng)能耗的預測,分析高低能耗原因,調(diào)整系統(tǒng)的運行策略達到節(jié)能目的。KAWASHIMA[8]用人工神經(jīng)網(wǎng)絡(Artificial Neural Network,ANN)將空調(diào)負荷預測和控制結(jié)合起來,實驗結(jié)果是ANN預測控制的耗電量比制冷機正常運行下的耗電量減少了6.9%,運行的費用也降低了13.5%,有顯著降低能耗的效果。CURTISS[9]用ANN預測控制管理中央暖通空調(diào)(Heating Ventilation Air Condition,HVAC)系統(tǒng)的能耗,得出結(jié)論為在保證舒適度下,ANN系統(tǒng)能夠明顯達到節(jié)能效果。`
目前,比較流行的暖通空調(diào)系統(tǒng)能耗預測方法主要有:參數(shù)回歸法、時間序列預測法、人工神經(jīng)網(wǎng)絡、支持向量機等[10]。其中參數(shù)回歸和時間序列預測法又被歸類為傳統(tǒng)方法,人工神經(jīng)網(wǎng)絡和支持向量機則被歸類為人工智能方法。周旋等[11]提出一種基于多元非線性回歸法的商場空調(diào)負荷預測,在提高預測精度的同時還大大縮短了建模時間。孫靖等[12]提出了一種基于季節(jié)性時間序列模型的空調(diào)負荷預測的方法,有效解決了冰蓄冷系統(tǒng)優(yōu)化控制問題。李帆等[13]提出了一種基于運行數(shù)據(jù)人工神經(jīng)網(wǎng)絡的空調(diào)系統(tǒng)逐時負荷預測方法,獲得了5.20%左右的預測誤差模型,能夠較精確地預測未來24 h內(nèi)的逐時負荷。王智銳等[14]提出了一種基于支持向量機的建筑物空調(diào)負荷預測模型,實現(xiàn)了反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡更佳的負荷預測結(jié)果。
由于傳統(tǒng)模型無法同時兼顧負荷數(shù)據(jù)時序性和非線性的特點,如時間序列法沒有考慮到非線性,一般只適用于空調(diào)負荷變化平穩(wěn)的短期預測,當負荷變化劇烈時,預測跟隨性很差。為了解決以上模型存在的問題,本文使用了一種基于長短期記憶神經(jīng)網(wǎng)絡(Long Short-term Memory,LSTM)的預測模型對暖通空調(diào)能耗進行預測。作為深度學習中非常重要的一種模型,LSTM在各個領(lǐng)域如語言模型[15]、圖像分析[16]、文檔摘要[17]、語音識別[18]、圖像識別[19]、手寫識別[20]、預測[21]等都廣泛關(guān)注及運用。LSTM這種模型不僅可以像普通神經(jīng)網(wǎng)絡一樣學習復雜數(shù)據(jù)之間的規(guī)律,最重要的是LSTM能夠同時兼顧時序性和非線性關(guān)系[22],能夠?qū)W習過去一段時間歷史數(shù)據(jù)中的信息,選擇性地保留有用信息,丟棄無用信息,然后運用于下一階段的預測,使得預測更加的可靠、精確。
本文采用LSTM 建模進行暖通空調(diào)系統(tǒng)能耗預測,先進行數(shù)據(jù)的預處理,這里面包括了對異常值處理,對輸入數(shù)據(jù)的歸一化,將數(shù)據(jù)分為訓練集和測試集等;然后是建立模型,調(diào)整參數(shù)、優(yōu)化模型等;最后運用模型進行能耗預測,得到了相比支持向量回歸、回歸樹模型更精確的預測結(jié)果。在考慮到了空調(diào)負荷數(shù)據(jù)的時序性關(guān)系后,得到了更好預測結(jié)果。
長短期記憶神經(jīng)網(wǎng)絡是循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)中的一種特殊類型,可以學習長期依賴信息。LSTM由HOCHREITER 和SCHMIDHUBER(1997)[23]提出,并被GRAVES[24]進行了改良和推廣。在很多問題上,LSTM都取得了相當大的成功,并得到廣泛運用。本文中LSTM模型都是基于Python 3.6中的Keras和TensorFlow庫實現(xiàn)的,使用的優(yōu)化器為RMSprop。
如圖1所示LSTM的神經(jīng)元結(jié)構(gòu),在這個神經(jīng)元結(jié)構(gòu)中有3個門結(jié)構(gòu),分別是輸入門(input gate)、輸出門(output gate)、遺忘門(forget gate)。在LSTM中,第一步通過遺忘門來決定我們會從細胞狀態(tài)中丟棄什么信息;第二步在輸入門中確定什么樣的新信息會被放在細胞狀態(tài)中;第三步在輸出門中確定要輸出的值。
在LSTM神經(jīng)元結(jié)構(gòu)中,令X = [x1,x2,x3,…,xt]作為輸入的時序信號值,xt表示t時刻的神經(jīng)元輸入;令H = [h1,h2,h3,…,ht]作為輸出的目標值,ht表示t時刻的輸出;令C = [c1,c2,c3,…,ct]表示神經(jīng)元的狀態(tài)信息,ct表示t時刻神經(jīng)元的狀態(tài)。
遺忘門:
輸入門:
輸出門:
公式(1)到(6)表示LSTM的全過程,xt為輸入,ht為輸出,it為輸入門的輸出,?t為遺忘門的輸出,ct為t時刻當前細胞的狀態(tài),ot為輸出門的輸出,W為權(quán)重矩陣,b為偏差矩陣,tanh、σ為激活函數(shù)。
輸入門、遺忘門、輸出門、激活函數(shù)之間相互配合工作,實現(xiàn)從歷史數(shù)據(jù)中篩選有用信息保留下來,丟棄掉無用信息,具有更強的時間序列學習能力,更強大的信息選擇能力,可以很好地應用于暖通空調(diào)系統(tǒng)能耗的預測工作。
圖1 LSTM 神經(jīng)元結(jié)構(gòu)
為了能夠與LSTM預測模型對比,本文還使用了其他兩種預測模型分別為:回歸決策樹、支持向量回歸。回歸決策樹(Regression Tree,RT)是時間序列預測模型的一種,它是以實際例子為基礎的歸納式的一種學習算法,通過將沒有次序、沒有任何規(guī)律的事例進行分類,將分類以“樹”的形式表示,自上而下進行遞歸分類,在決策樹的內(nèi)部節(jié)點上進行屬性的選擇,并對決策樹進行剪枝。支持向量回歸(Support Vector Regression,SVR)是在支持向量機(Support Vector Machine,SVM)的基礎上引入不敏感函數(shù)得到的,其思想為通過核函數(shù),將輸入變量映射到高維空間,這樣就可以將低維的非線性問題轉(zhuǎn)化成高維空間中的線性問題來處理、解決。
實驗數(shù)據(jù)來源于北方某地源熱泵系統(tǒng),時間是一整個供暖季節(jié),數(shù)據(jù)的采樣間隔為10 min,原始數(shù)據(jù)大約含有6,000個樣本,機組為2臺型號為HE1200B的渦旋機組,系統(tǒng)為兩臺循環(huán)泵運行,均采用定頻控制,運行數(shù)據(jù)變量如表1所示。采用該地區(qū)對應時間的氣象數(shù)據(jù)作為實驗數(shù)據(jù)的另一組成部分,氣象數(shù)據(jù)變量如表2所示。
表1 運行數(shù)據(jù)
表2 氣象數(shù)據(jù)
1)變量選取
本文選取原始數(shù)據(jù)中的室外溫度、露點溫度、相對濕度、風速、高區(qū)二次供水溫度、高區(qū)二次回水溫度、高區(qū)瞬時質(zhì)量流量、高區(qū)瞬時體積流量、指數(shù)加權(quán)移動平均(Exponential Weighted Moving Average,EWMA)歷史能耗指標,預測變量為2 h后的采樣間隔累計熱量。
式中:
μ1——采暖季開始時刻的能耗值;
EWMAi——第i時刻的歷史用能指標;
λ——衰減系數(shù),或影響系數(shù),用來衡量前一時刻用能對當前時刻用能的影響水平;
xi——當前時刻的區(qū)間累計熱量值。
2)異常值處理
在原始數(shù)據(jù)里面,能耗值有部分為負值,這是明顯的異常值,為了保護數(shù)據(jù)的時序性,本文采用零值填充的方法處理。
3)數(shù)據(jù)的歸一化處理
輸入的數(shù)據(jù)中,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數(shù)據(jù)分析的結(jié)果,為了消除指標之間的量綱影響,需要進行數(shù)據(jù)標準化處理,以解決數(shù)據(jù)指標之間的可比性。原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標準化處理后,各指標處于同一數(shù)量級,適合進行綜合對比評價。這里采用最大-最小標準化方法:
最大-最小標準化是對原始數(shù)據(jù)進行線性變換,設MinA和MaxA分別是屬性A的最小值和最大值,將A的每一個原始值x通過最大-最小標準化映射到區(qū)間[0,1]的值xnorm,公式如式(8):
4)訓練、測試集劃分
經(jīng)過前面的數(shù)據(jù)處理過程,數(shù)據(jù)總量為5,613個,取前4,500個作為訓練集,剩余的作為測試集。
5)預測結(jié)果誤差評價標準
采用平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Square Error,RMSE)兩種評價標準,數(shù)值越低表示預測值與真實值相差越小。
式中:
N——預測結(jié)果的總個數(shù);
yi——真實值;
1)選取原始數(shù)據(jù)中的9個變量為輸入變量,對異常值進行處理。
2)對每一個變量數(shù)據(jù)運用最大-最小標準化方法進行歸一化處理。
3)將輸入數(shù)據(jù)轉(zhuǎn)變換成[samples,time_steps,features]的三維形式,改變time_steps即歷史時間序列長度大小,預測未來4 h的能耗負荷值。
4)選取最優(yōu)的模型,對測試集數(shù)據(jù)進行預測。
圖2 流程圖
將測試集數(shù)據(jù)轉(zhuǎn)換成[samples, time_steps, features]三維形式,輸入得到LSTM預測模型和相應的能耗預測值,再對其進行反歸一化,與真實能耗值進行對比。
4.1.1 異常值的處理
異常值的處理包括去除穩(wěn)定不變的異常值和零值填充能耗負值,處理結(jié)果如圖2~圖3所示。
圖2 原始數(shù)據(jù)分析
圖3 異常值處理結(jié)果
在原始數(shù)據(jù)圖2中,灰色柱狀部分代表的是恒定能耗異常值區(qū)域,這一部分需要直接剔除。圖中在黑色水平線以下的能耗值表示的是負值,但是能耗值是不會為負值的,所以這些值是不可以使用的。為了不損害數(shù)據(jù)的時序性,本文對這些負值采取零值填充處理,處理結(jié)果如圖3所示。
將數(shù)據(jù)轉(zhuǎn)換成能夠輸入進LSTM中的形式也是非常重要的一步,文章以其中的一種形式為例,如圖4所示,LSTM模型的數(shù)據(jù)輸入形式為Batch_input_shape:(samples,steps,features),samples為一個訓練塊中樣本數(shù)量,steps為回溯的歷史時間長度,features為數(shù)據(jù)的變量數(shù)目加上一個訓練目標值,delay為預測未來的時間間隔長度。
4.1.2 數(shù)據(jù)轉(zhuǎn)換
圖5為LSTM模型能耗預測結(jié)果。
圖4 模型輸入數(shù)據(jù)轉(zhuǎn)換示例
圖5 LSTM模型能耗預測結(jié)果
圖6為SVR模型能耗預測結(jié)果。圖7為回歸樹模型能耗預測結(jié)果。
支持向量回歸、回歸樹的結(jié)果顯示,這兩種預測模型在預測的初期、前200個預測時刻點,都表現(xiàn)出較高的準確度,與原始數(shù)據(jù)的偏差較小。但是在之后,支持向量回歸模型開始整體向上偏移,準確度大幅度下降。回歸樹模型在第400個預測時刻點前后開始漂移,完全脫離原始數(shù)據(jù)的變化特點,基本失去了預測能力。相比之下,LSTM模型整體預測結(jié)果與原始數(shù)據(jù)都有著穩(wěn)定、準確的擬合,沒有明顯的漂移現(xiàn)象??梢钥闯?,在結(jié)合了數(shù)據(jù)的時序性和相關(guān)性之后,模型的預測沒有隨著時間的推移而出現(xiàn)預測精度下降的現(xiàn)象,表現(xiàn)出更加優(yōu)秀的預測能力。
用前4,500個數(shù)據(jù)訓練模型,其余數(shù)據(jù)測試模型,得到3種預測模型的預測誤差如表3所示。其中LSTM模型同時具有最小的MAE值為8.326和最小的RMSE值為11.835,相比傳統(tǒng)模型RT和SVR都有明顯的減小,LSTM模型的預測精度相比RT、SVR都有了很大的提高。在同時考慮數(shù)據(jù)的時序性和非線性時,LSTM模型可以從歷史數(shù)據(jù)中提取到更多有效的信息。
圖6 SVR模型能耗預測結(jié)果
圖7 回歸樹模型能耗預測結(jié)果
表3 負荷預測誤差對比
在對某暖通空調(diào)系統(tǒng)進行能耗預測中,本文使用改進的循環(huán)神經(jīng)網(wǎng)絡LSTM建立相應的預測模型,同時也采用了傳統(tǒng)模型SVR、RT進行了相同的預測,將3種預測模型結(jié)果進行對比。實驗結(jié)果證明,基于LSTM的預測模型預測值的平均方差、平均絕對偏差均優(yōu)于SVR、RT模型,并且隨著預測時間推移,LSTM模型具有良好的預測穩(wěn)定性。LSTM 模型在同時考慮數(shù)據(jù)的時序性和非線性前提下,確實可以從歷史數(shù)據(jù)中獲取到更多的有用的信息,有效地提高了模型預測能力。因此,將LSTM引入到暖通空調(diào)系統(tǒng)的能耗負荷預測中,具有顯著的理論意義和實際價值。