楊建軍 何利力
摘要:為了降低企業(yè)生產(chǎn)車間空調(diào)能耗,基于長短期記憶(LSTM)網(wǎng)絡(luò)構(gòu)建了一種工業(yè)空調(diào)啟動時間預(yù)測模型。使用該模型對車間空調(diào)提前啟動時間進行預(yù)測,并將預(yù)測結(jié)果應(yīng)用于車間空調(diào)系統(tǒng)的啟動控制,以達到節(jié)能目的;采用平均絕對百分誤差(MAPE)對預(yù)測模型進行整體誤差評估,實驗結(jié)果表明:LSTM較好地解決了生產(chǎn)車間空調(diào)系統(tǒng)啟動時間預(yù)測問題,相較于傳統(tǒng)預(yù)測方法有著更小的MAPE。優(yōu)化控制后的空調(diào)系統(tǒng)能夠在保證車間生產(chǎn)環(huán)境達標(biāo)的同時,降低空調(diào)系統(tǒng)約27.9%的能耗。
關(guān)鍵詞:長短期記憶神經(jīng)網(wǎng)絡(luò);空調(diào)啟動時間;平均絕對百分誤差;預(yù)測模型
DOI:10.11907/rjdk.192062 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
中圖分類號:TP301文獻標(biāo)識碼:A 文章編號:1672-7800(2020)006-0048-05
0 引言
我國能源消耗占據(jù)世界能源消耗總量的23%,并且還在不斷增長。國家對環(huán)境保護的要求愈來愈嚴格,能源價格的持續(xù)上漲導(dǎo)致生產(chǎn)成本不斷提高,節(jié)能問題成為企業(yè)生產(chǎn)首先要考慮的問題。
隨著人工智能浪潮的到來,許多學(xué)者將神經(jīng)網(wǎng)絡(luò)應(yīng)用在節(jié)能預(yù)測領(lǐng)域。如Akanit等使用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)預(yù)測基于自然災(zāi)害期間電能消耗的經(jīng)濟趨勢,通過交叉檢查的方法提高了預(yù)測模型的精度和性能;Rahman等提出以循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)預(yù)測商業(yè)和住宅建筑的電力消耗,證明RNN模型在能耗預(yù)測方面潛力很大。
空調(diào)節(jié)能的優(yōu)化控制問題一直是研究重點?,F(xiàn)階段比較流行的空調(diào)啟動時間預(yù)測方法有回歸分析預(yù)測法、時間序列預(yù)測法、神經(jīng)網(wǎng)絡(luò)預(yù)測法等。在這幾種方法中,時間序列預(yù)測法和回歸分析預(yù)測法被歸為傳統(tǒng)方法,神經(jīng)網(wǎng)絡(luò)預(yù)測法則被歸為人工智能方法。陸景等提出一種空調(diào)系統(tǒng)提前關(guān)機時間的多元線性回歸模型,對空調(diào)關(guān)機時間預(yù)測有著較高的精度;時斌等提出了一種空調(diào)器及其溫度調(diào)節(jié)時間預(yù)測系統(tǒng)和方法,可以準(zhǔn)確客觀地預(yù)測出室內(nèi)環(huán)境溫度達到預(yù)設(shè)溫度時空調(diào)的運行時間;范波等通過BPNN預(yù)測模型預(yù)測空調(diào)機組最佳啟動時間,實驗結(jié)果表明優(yōu)化策略可以減少空調(diào)系統(tǒng)運行能耗。
傳統(tǒng)預(yù)測方法在數(shù)據(jù)時序性和非線性方面不具備統(tǒng)籌兼顧能力,大多只應(yīng)用于數(shù)據(jù)較為平穩(wěn)的短期預(yù)測,如果數(shù)據(jù)波動性較大則模型預(yù)測性能很差。因此,本文采用長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory)建立預(yù)測模型,以解決隨著學(xué)習(xí)層數(shù)的增加而造成的長期依賴問題。長短期記憶神經(jīng)網(wǎng)絡(luò)屬于深度學(xué)習(xí)中的一種時間遞歸神經(jīng)網(wǎng)絡(luò),它在處理未知時長延遲的時間序列方面有著較優(yōu)秀的性能,適于分析和處理時間序列數(shù)據(jù)的內(nèi)在聯(lián)系。
1基于LsTn的空調(diào)啟動時間預(yù)測模型
1.1 LSTM模型基本結(jié)構(gòu)
LSTM是RNN中的一種特殊形式,1997年由Hochreiter&Schmidhuber等提出,目前在語言情感分類、圖像分割、文本分類等領(lǐng)域得到廣泛應(yīng)用。
如圖l所示,每一條帶箭頭的實線表示向量傳輸,實線的分合表示向量的復(fù)制與連接;加號和乘號表示Element-wise;σ和tanh分別表示Sigmoid函數(shù)與雙曲正切函數(shù)。
LSTM共有3種門結(jié)構(gòu),分別為忘記門(forget gate)、輸入門(input gate)和輸出門(output gate)。在LSTM神經(jīng)元結(jié)構(gòu)中,令Xt=[x1,x2,x3,…,xt],其中xt為t時刻的神經(jīng)元信號輸入值;令Ht=[h1,h2,h3,…,ht],其中ht為t時刻輸出值;令Ct=[c1,c2,c3,…,ct],其中ct為t時刻神經(jīng)元狀態(tài)。
如圖2所示,LSTM結(jié)構(gòu)頂部是一條記憶管道。在這條管道內(nèi),上個時刻神經(jīng)元的細胞狀態(tài)Ct-1與忘記門的輸出進行數(shù)組元素依次相乘(Element-wise multiplication),該運算控制了Ct-1忘記記憶的多少。若忘記門的輸出是一個接近于0的向量,則相乘后的結(jié)果會忘記部分以前的記憶。反之,若忘記門的輸出是接近1的向量,則會保留大部分記憶。Ct-1與輸入門的輸出進行數(shù)組元素依次相加(Element-wise Summation),此操作會將舊記憶和新記憶合并。上述兩步操作完成后,Ct-1會更新為新的細胞狀態(tài)Ct-1。
1.1.1 忘記門
忘記門由簡單的單層神經(jīng)網(wǎng)絡(luò)控制,決定了細胞狀態(tài)應(yīng)丟棄什么信息,圖3為忘記門結(jié)構(gòu)。此門的輸人數(shù)據(jù)J.為當(dāng)前LSTM塊的輸入,ht-1為上一個LSTM塊的輸出,b0為偏置向量。輸人參數(shù)通過激活函數(shù)σ將此層的輸出控制在[0,1]之間。
該過程計算公式如下:
ft=(Wf·[ht-1,xt]+b0)(1)
1.1.2 輸入門
1.1.3 輸出門
如圖6所示,輸出門同樣具有與前兩個門單元相似的輸人參數(shù)Xt和ht-1,這兩個參數(shù)經(jīng)過σ激活后的結(jié)果Ot,與經(jīng)過激活函數(shù)tanh的Ct進行乘運算,得到整個模型最終的輸出值丸ht。該過程計算公式如下:
LSTM在RNN的基礎(chǔ)上增加了忘記門、輸人門和輸出門,以保證記住長期的狀態(tài)。隨著數(shù)據(jù)的輸人,LSTM中的細胞會對輸人信息進行判斷,遺忘不符合規(guī)則的信息,保留符合規(guī)則的信息。依據(jù)此原理,LSTM可以解決長序列依賴問題,更好地對歷史數(shù)據(jù)進行篩選,丟棄干擾無用的信息,從而更好地應(yīng)用于工業(yè)空調(diào)的啟動時間預(yù)測。
1.2 LSTM模型訓(xùn)練算法
LSTM的輸人為:上一時刻網(wǎng)絡(luò)的輸出值Ht-1、前一時刻記憶細胞的狀態(tài)Ct-1、當(dāng)前時刻網(wǎng)絡(luò)的輸入值xt;LSTM的輸出為:當(dāng)前時刻網(wǎng)絡(luò)的輸出值ht、當(dāng)前時刻記憶細胞的狀態(tài)Ct。LSTM模型的訓(xùn)練采用基于時間展開的反向傳播算法進行。LSTM的反向傳播過程分為代價函數(shù)計算和誤差反傳兩部分。LSTM計算每次訓(xùn)練的結(jié)果代價函數(shù),并判斷代價函數(shù)是否滿足預(yù)先設(shè)定的要求,對于不滿足要求的訓(xùn)練結(jié)果進行誤差反傳更新。
1.3 對比模型選取
選取隨機森林(Random Forest,RF)和支持向量回歸(Support Vector Regression,SVR)比較LSTM與這兩種預(yù)測模型的差異。RF是決策樹的集成算法,它通過將每棵決策樹的結(jié)果集中起來決定最后預(yù)測的結(jié)果,在一定程度上減少了預(yù)測方差。在不進行降維的情況下,能夠進行高維特征的輸入樣本處理。SVR是支持向量機(Support Vector Machine,SVM)在非線性系統(tǒng)回歸估計問題上的應(yīng)用模型,SVR主要通過核函數(shù)在高維空間中構(gòu)造線性決策函數(shù)實現(xiàn)線性回歸。
2 實驗數(shù)據(jù)與預(yù)測性能指標(biāo)
2.1 數(shù)據(jù)獲取
本文實驗數(shù)據(jù)來源為某企業(yè)動力能源管理系統(tǒng),實驗收集了N工廠某車間2014年1月至2019年1月這段時間工作日內(nèi)的天氣數(shù)據(jù)和系統(tǒng)運行數(shù)據(jù),數(shù)據(jù)采集間隔為1日,原始數(shù)據(jù)約為1500條。以1300條樣本為訓(xùn)練集,另外200條樣本用作測試集,主要包含日期Td、生產(chǎn)任務(wù)量Np、每日預(yù)冷(熱)時間Tp、車間人員密度Pd、空調(diào)制冷量Wr、室外溫度Ot、相對濕度Oh、風(fēng)速Ow、露點Od、天氣情況Or等,數(shù)據(jù)樣例見表1。
2.2 數(shù)據(jù)預(yù)處理
2.2.1 輸入輸出量確定
本文選取日期Td空調(diào)制冷量Wr、當(dāng)日室外溫度Ot、相對濕度Oh、風(fēng)速Ow、露點Od、天氣Or作為輸入變量,以空調(diào)開機至溫度達標(biāo)所需時間(預(yù)冷/熱時間Tp)為模型計算最終輸出。
2.2.2 數(shù)據(jù)缺失處理
在數(shù)據(jù)采集過程中,由于存在許多不確定因素,數(shù)據(jù)缺失問題不可避免。如果采用不恰當(dāng)?shù)奶幚矸绞?,相?dāng)于引入了大量噪聲,會對數(shù)據(jù)造成污染。本文針對數(shù)據(jù)缺失的不同情形對應(yīng)不同的處理方式:對于數(shù)據(jù)在連續(xù)3次及3次以內(nèi)的缺失情況,采用3次樣條插值法(cubic spline interpolation)進行缺失數(shù)據(jù)插值;對于數(shù)據(jù)在連續(xù)3次以上的缺失情況,采用直接刪除這條數(shù)據(jù),以減少模型訓(xùn)練過程中的噪聲干擾。
3次樣條插值原理如下:
對于給定n+1個數(shù)據(jù)點(xi,yi)(i=0,1,2,…,n),其中a=x012<…n=b,共有n個子區(qū)間,樣條曲線S(x)在每段區(qū)間內(nèi)滿足下列條件:①在每段分區(qū)間[xi,xi+1](i=0,1,2,…,n-1),S(x)=S(x)都是一個3次多項式;②滿足S(xi)=y(i=0,1,2,…,n);③在整個區(qū)間[a,b]上,函數(shù)S(x)的一階導(dǎo)數(shù)S'(x)和二階導(dǎo)數(shù)S''(x)都必須連續(xù),也就是說S(x)曲線光滑。
例如在采集數(shù)據(jù)過程中,對于某一個時間片段xi=[9,10,14,15,16],獲取對應(yīng)的空調(diào)預(yù)冷時間yi=[28.2,31.10,39.21,33.12,43.14],在時間節(jié)點11,12,13處對應(yīng)的空調(diào)制冷量連續(xù)缺失,利于上述方法進行3次樣條插值。圖7表示3次樣條插值的插值效果。根據(jù)函數(shù)曲線便可獲得缺失的數(shù)據(jù),即圖7中虛線對應(yīng)的空調(diào)制冷量。
2.2.3 數(shù)據(jù)異常值處理
在數(shù)據(jù)收集過程中,發(fā)現(xiàn)某些傳感器采集的數(shù)據(jù)明顯存在問題,如預(yù)冷(熱)時間存在負值情況。通過現(xiàn)場調(diào)研發(fā)現(xiàn),這部分數(shù)據(jù)出現(xiàn)可能是個別溫度傳感器損壞所導(dǎo)致的。本文直接舍棄這部分數(shù)據(jù),避免其對整體預(yù)測結(jié)果產(chǎn)生影響。
2.2.4 數(shù)據(jù)規(guī)范化處理
由于不同變量有著不同的評價指標(biāo),導(dǎo)致數(shù)據(jù)經(jīng)常擁有不同的量綱和數(shù)量級,這種情況下,若直接采用原數(shù)據(jù)進行分析,則會放大高數(shù)值指標(biāo)在整體預(yù)測中的影響。將數(shù)據(jù)進行規(guī)范化處理以解決數(shù)據(jù)間因量綱不同產(chǎn)生的影響,去除數(shù)據(jù)的量綱限制,把數(shù)據(jù)轉(zhuǎn)化為無量綱的純數(shù)值,以便于不同量級的數(shù)據(jù)能夠進行比較。本文使用離差標(biāo)準(zhǔn)化(Min-max normalization又稱Min-Max標(biāo)準(zhǔn)化)對數(shù)據(jù)進行處理。
Min-Max標(biāo)準(zhǔn)化是對原始數(shù)據(jù)xi={x1,x2,…,xn}的線性變換,使結(jié)果少,落到[0,1]區(qū)間。公式如下:
新序列為y1,y2,…,yn∈[0,1]且無量綱。
2.3 預(yù)測性能評估
回歸預(yù)測評估指標(biāo)眾多,本文在模型訓(xùn)練階段選取平均絕對離差(Mean Absolute Error,MAE)和標(biāo)準(zhǔn)誤差(RootMean Squared Error,RMSE)兩種評價標(biāo)準(zhǔn),公式如下:
式中,m為樣本個數(shù),h(xi)為i時刻的實際值,yi為i時刻的預(yù)測值。
3 預(yù)測模型建立及空調(diào)啟動策略
3.1 預(yù)測模型建立
模型建立過程:①選取2.2.1節(jié)確定的輸入變量對數(shù)據(jù)進行預(yù)處理;②對經(jīng)過預(yù)處理后的數(shù)據(jù)進行劃分,構(gòu)造輸入樣本集;③初始化模型參數(shù),進行模型訓(xùn)練,判斷代價函數(shù)是否滿足要求,若不滿足則進行誤差反向傳播更新,反復(fù)迭代到滿足要求,輸出LSTM模型;④對步驟③中輸出的模型進行測試,輸出預(yù)測結(jié)果并對結(jié)果進行分析。
LSTM預(yù)測流程如圖8所示。
3.2 空調(diào)啟動控制策略
傳統(tǒng)空調(diào)啟動策略采用固定的預(yù)冷(熱)時間,各個班組依靠自身經(jīng)驗和當(dāng)日天氣環(huán)境設(shè)定空調(diào)提前啟動時間,沒有統(tǒng)一的標(biāo)準(zhǔn)。這樣雖然滿足了生產(chǎn)要求,但提前開啟空調(diào)時間過長會造成能源浪費。
結(jié)合空調(diào)啟動時間預(yù)測模型,提出一種基于LSTM的空調(diào)啟動策略。首先根據(jù)預(yù)冷(熱)時間Tp的歷史數(shù)據(jù)找出最長預(yù)冷(熱)時間ti,作為Z車間下一生產(chǎn)日空調(diào)提前開啟時間的初始值;其次將初始值ti與LSTM模型的預(yù)測值tp進行比較,若tp≤ti,則提前tp分鐘開啟Z車間空調(diào),否則再次進行迭代預(yù)測。
4 實驗結(jié)果與分析
4.1 實驗環(huán)境
本文實驗硬件環(huán)境為:CPU i5-8400@2.80GHz,RAM16G;軟件環(huán)境為:Microsoft Windows 10操作系統(tǒng),Python版本為v3.6,采用Pycharm編寫;選取ELU函數(shù)作為LSTM網(wǎng)絡(luò)激活函數(shù),選取Keras作為人工神經(jīng)網(wǎng)絡(luò)庫。
4.2 實驗結(jié)果與對比分析
選取1.3節(jié)兩種模型作為對比對象,以空調(diào)開機到溫度達標(biāo)所用時間為度量,選取測試集中連續(xù)7天數(shù)據(jù)作為測試數(shù)據(jù),對比3種模型的預(yù)測結(jié)果,如圖9所示。在圖9中,黑色點線為真實預(yù)冷時間;支持向量回歸SVR預(yù)測結(jié)果為三角形標(biāo)注的曲線;隨機森林回歸預(yù)測結(jié)果為正方形標(biāo)注曲線;LSTM預(yù)測結(jié)果為菱形標(biāo)注的曲線。
由圖9可以看出,SVR和RF兩種模型在前3個數(shù)據(jù)點的預(yù)測中都表現(xiàn)出較好的精度,與原始值相差較小。但隨著時間的推移,SVR預(yù)測模型開始出現(xiàn)預(yù)測數(shù)據(jù)整體大于真實數(shù)據(jù)的情況,預(yù)測準(zhǔn)確率下降。而RF預(yù)測模型相較于SVR有著更高的精度,但是在第6個數(shù)據(jù)點附近開始出現(xiàn)預(yù)測數(shù)據(jù)向下偏移的情況。相對于上述兩種模型,LSTM整體上和原始數(shù)據(jù)有著較高的擬合準(zhǔn)確度,沒有較大的數(shù)據(jù)偏差。通過對比可以發(fā)現(xiàn),隨著時間序列的推移,LSTM模型的預(yù)測精度明顯優(yōu)于其它兩種模型,預(yù)測能力較強,原因是因為LSTM預(yù)測模型引入了時間序列概念,在一定程度上解決了梯度消失問題。
分別計算3種模型的預(yù)測誤差,詳見表2。誤差分析表明,LSTM在3種誤差評測方式中都有最小的值,MAE為1.09、RMSE為1.88,MAPE為1.41,相交于傳統(tǒng)的RF和SVR明顯減小。
4.3 優(yōu)化控制前后能耗對比
針對上述模型預(yù)測結(jié)果,結(jié)合當(dāng)日空調(diào)運行數(shù)據(jù),計算出該日空調(diào)系統(tǒng)使用LSTM模型進行優(yōu)化控制后的各部分能耗值,并與傳統(tǒng)空調(diào)啟動控制策略下的能耗值進行對比,結(jié)果如圖10所示。
由圖10可以看出,采用LSTM預(yù)測模型預(yù)測空調(diào)啟動時間后,空調(diào)主要部分能耗都有顯著降低,優(yōu)化后的總能耗比之前減少了約27.9%。
5 結(jié)語
本文通過對某企業(yè)生產(chǎn)車間空調(diào)的運行數(shù)據(jù)進行采集,使用長短時記憶循環(huán)神經(jīng)網(wǎng)絡(luò)建立空調(diào)啟動時間預(yù)測模型,與隨機森林、支持向量回歸建立的預(yù)測模型進行比較分析,并對比使用預(yù)測算法控制前后的能耗情況。通過實驗可知,基于長短期記憶網(wǎng)絡(luò)建立的預(yù)測模型預(yù)測值在MAE、RMSE和MAPE三個方面都優(yōu)于隨機森林和支持向量回歸,隨著時間序列的增大,LSTM模型表現(xiàn)出明顯優(yōu)于另外兩者的穩(wěn)定性,并且經(jīng)過優(yōu)化控制的空調(diào)能耗顯著降低,LSTM模型相比于傳統(tǒng)模型有著更高的預(yù)測精度。將LSTM用于工業(yè)生產(chǎn)空調(diào)啟動時間預(yù)測,有助于企業(yè)完成能源智能管控,達成節(jié)能目標(biāo)。下一步將探尋LSTM網(wǎng)絡(luò)參數(shù)優(yōu)化,以進一步提升模型預(yù)測精度。