劉書(shū)含,孫文強(qiáng),2,范天驕,謝國(guó)威
(1.東北大學(xué) 冶金學(xué)院,沈陽(yáng) 110819;2.東北大學(xué) 國(guó)家環(huán)境保護(hù)生態(tài)工業(yè)重點(diǎn)實(shí)驗(yàn)室,沈陽(yáng) 110819;3.中鋼集團(tuán) 鞍山熱能研究院有限公司,遼寧 鞍山 114044)
在鋼鐵企業(yè)中,高爐煤氣、焦?fàn)t煤氣和轉(zhuǎn)爐煤氣作為重要的二次能源,約占總能耗的30%[1].然而,煤氣消耗量受影響因素較多,難以準(zhǔn)確預(yù)測(cè),不同設(shè)備的煤氣消耗量同樣具有差異性,給能源綜合管理帶來(lái)弊端.加熱爐作為典型的煤氣消耗用戶,其煤氣消耗量約占軋鋼生產(chǎn)能耗的76% ~80%[2].然而,由于受到前后生產(chǎn)環(huán)節(jié)的制約和煤氣管網(wǎng)壓力的影響,加熱爐生產(chǎn)波動(dòng)較大,其煤氣消耗量的精準(zhǔn)預(yù)測(cè)一直較為困難,嚴(yán)重制約了加熱爐的節(jié)能降耗及煤氣系統(tǒng)智能管控的發(fā)展.因此,建立一種高性能的加熱爐煤氣消耗預(yù)測(cè)模型對(duì)煤氣預(yù)測(cè)及智能化調(diào)度至關(guān)重要.
為了預(yù)測(cè)煤氣消耗量,較為常用的方法是以先驗(yàn)知識(shí)為基礎(chǔ)建立機(jī)理模型.郝曉靜等[3]開(kāi)發(fā)了高爐數(shù)據(jù)預(yù)處理軟件,為高爐煤氣消耗量的在線預(yù)測(cè)提供了有效方法.Sun等[4]考慮了煤氣產(chǎn)生系數(shù)和消耗系數(shù)隨產(chǎn)量非線性變化的情況,建立了鋼鐵企業(yè)副產(chǎn)煤氣的機(jī)理預(yù)測(cè)模型.梁青艷等[5]考慮生產(chǎn)過(guò)程中影響加熱爐煤氣流量波動(dòng)狀況的靜態(tài)及動(dòng)態(tài)因素,建立了基于生產(chǎn)狀態(tài)的分時(shí)段煤氣消耗動(dòng)態(tài)預(yù)測(cè)模型.雖然機(jī)理模型可以有效地分析影響煤氣消耗量的因素,但加熱爐的煤氣消耗量受多種生產(chǎn)因素的干擾而波動(dòng)較大,機(jī)理模型的預(yù)測(cè)結(jié)果難以滿足實(shí)際需求.
隨著計(jì)算機(jī)技術(shù)迅速發(fā)展,人工神經(jīng)網(wǎng)絡(luò)法、小波分析法等數(shù)據(jù)模型被應(yīng)用于煤氣消耗量預(yù)測(cè).徐化巖等[6]依據(jù)小波分析方法、BP神經(jīng)網(wǎng)絡(luò)法、最小二乘支持向量機(jī)的性質(zhì)建立了基于數(shù)據(jù)驅(qū)動(dòng)的高爐煤氣消耗量的復(fù)合預(yù)測(cè)模型.結(jié)果表明,數(shù)據(jù)模型在不同程度上存在滯后性.張琦等[7]采用灰色關(guān)聯(lián)度分析了影響高爐煤氣消耗量的因素,建立了高爐煤氣BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)高爐煤氣的消耗量進(jìn)行有效預(yù)測(cè).聶秋平[8]將灰色理論與徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行組合,建立了基于灰色神經(jīng)網(wǎng)絡(luò)的煤氣消耗預(yù)測(cè)模型.機(jī)理研究的不斷深入和數(shù)據(jù)模型的不斷發(fā)展為煤氣消耗量預(yù)測(cè)提供新的思路.王彥輝[9]將機(jī)理模型和數(shù)據(jù)模型結(jié)合,提出煤氣消耗量預(yù)測(cè)的理論構(gòu)想.這種混合模型在高爐煤氣產(chǎn)生量預(yù)測(cè)方面取得了較好的應(yīng)用效果.Sun等[10]利用機(jī)理、數(shù)據(jù)和事件混合驅(qū)動(dòng)的模型對(duì)高爐煤氣的產(chǎn)生量進(jìn)行了有效預(yù)測(cè).賴茜等[11]對(duì)比分析了不同工況下回歸分析法和人工神經(jīng)網(wǎng)絡(luò)法應(yīng)用于高爐煤氣產(chǎn)生量的預(yù)測(cè)效果.
為了更好地提高加熱爐煤氣消耗量的預(yù)測(cè)精度,本文對(duì)加熱爐的操作事件進(jìn)行了有效辨識(shí),根據(jù)各事件對(duì)應(yīng)的運(yùn)行狀態(tài)選擇最佳數(shù)據(jù)模型,同時(shí)依托某鋼鐵聯(lián)合企業(yè)加熱爐生產(chǎn)過(guò)程的實(shí)際數(shù)據(jù),建立融合事件和數(shù)據(jù)的混合預(yù)測(cè)模型,為鋼廠能源智能管控提供理論和技術(shù)支持.
差分自回歸移動(dòng)平均模型(ARIMA)[12]的模型本質(zhì)是一個(gè)組合模型,由自回歸項(xiàng)(AR)、差分項(xiàng)(Difference)和移動(dòng)平均項(xiàng)(MA)三部分構(gòu)成,如式(1)所示:
式中:VAR(p)為煤氣消耗量的自回歸項(xiàng),p為自回歸項(xiàng)數(shù),該模型描述煤氣消耗量當(dāng)前值與歷史值之間的關(guān)系,用煤氣歷史消耗數(shù)據(jù)對(duì)煤氣的未來(lái)消耗數(shù)據(jù)進(jìn)行預(yù)測(cè);d為煤氣消耗量的時(shí)間序列轉(zhuǎn)變?yōu)槠椒€(wěn)序列時(shí)所做的差分次數(shù),用于提高煤氣消耗數(shù)據(jù)的平穩(wěn)性;VMA(q)為煤氣消耗量的移動(dòng)平均項(xiàng),q為移動(dòng)平均項(xiàng)數(shù),該模型關(guān)注的是自回歸模型中煤氣消耗量誤差項(xiàng)的累加.
ARIMA模型精度的關(guān)鍵是參數(shù)p,d,q的選定,意義在于將煤氣消耗量數(shù)據(jù)的非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將煤氣消耗量對(duì)其自身的滯后值及對(duì)隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸,其預(yù)測(cè)方程可以表示為
式中:Vyt為煤氣消耗量的預(yù)測(cè)值,m3/min;Vμ為常數(shù)項(xiàng),m3/min;α為煤氣消耗量的自相關(guān)系數(shù);Vγt-1為自回歸過(guò)程中煤氣消耗量的前i階多元線性函數(shù)值,m3/min;V?t為煤氣消耗量的誤差值,m3/min;β為煤氣消耗量的誤差系數(shù);V?t-1為移動(dòng)平均過(guò)程中煤氣消耗量的前i階多元線性函數(shù)值,m3/min.
人工神經(jīng)網(wǎng)絡(luò)模型(ANN)[13-14]是近年來(lái)高速發(fā)展的一種深度學(xué)習(xí)方法,BP-ANN是一種多層的前饋神經(jīng)網(wǎng)絡(luò),也是一種應(yīng)用廣泛的人工神經(jīng)網(wǎng)絡(luò)[15],其結(jié)構(gòu)如圖1所示.ANN主要結(jié)構(gòu)包含輸入層、隱藏層和輸出層,神經(jīng)元只在相鄰層之間實(shí)現(xiàn)全連接.該模型的原理是:煤氣消耗信號(hào)由輸入層神經(jīng)元正向傳播,經(jīng)過(guò)網(wǎng)絡(luò)訓(xùn)練輸出預(yù)測(cè)值,得到的預(yù)測(cè)值由輸出層向輸入層反饋,將誤差進(jìn)行反向傳播,從而逐步調(diào)整各個(gè)權(quán)值.常規(guī)三層ANN權(quán)值修正公式如下所示:
圖1 煤氣消耗量ANN拓?fù)浣Y(jié)構(gòu)圖Fig.1 Topology of artificial neural network for predicting gas consumption
式中:E為網(wǎng)絡(luò)預(yù)測(cè)輸出的煤氣消耗數(shù)據(jù)與實(shí)際輸出煤氣消耗數(shù)據(jù)之間的誤差平方和;η為網(wǎng)絡(luò)學(xué)習(xí)速率;αij為t時(shí)刻預(yù)測(cè)煤氣消耗數(shù)據(jù)的輸入層第i個(gè)神經(jīng)元與隱含層第j個(gè)神經(jīng)元的連接權(quán)值;αjk為t時(shí)刻預(yù)測(cè)煤氣消耗數(shù)據(jù)的隱含層第j個(gè)神經(jīng)元與輸出層第k個(gè)神經(jīng)元的連接閾值;βij(t)為t時(shí)刻預(yù)測(cè)煤氣消耗數(shù)據(jù)的隱含層第i個(gè)神經(jīng)元與輸出層第j個(gè)神經(jīng)元的連接閾值;βjk(t)為t時(shí)刻預(yù)測(cè)煤氣消耗數(shù)據(jù)的隱含層第j個(gè)神經(jīng)元與輸出層第k個(gè)神經(jīng)元的連接閾值.
加熱爐的運(yùn)行狀態(tài)由標(biāo)志性的操作事件決定,包含加熱爐檢修事件、加熱爐待料事件.由此可將加熱爐分為正常運(yùn)行、停爐檢修、待料運(yùn)行三種運(yùn)行狀態(tài).在預(yù)測(cè)加熱爐的煤氣消耗量時(shí),首先應(yīng)采集加熱爐的操作事件,然后根據(jù)不同的操作事件確定加熱爐的運(yùn)行狀態(tài),選取與之相關(guān)的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)建模,完成對(duì)加熱爐煤氣消耗量的預(yù)測(cè).在確定各狀態(tài)對(duì)應(yīng)的預(yù)測(cè)方法時(shí),本文考慮了目前廣泛使用的ARIMA模型和ANN模型.與單一預(yù)測(cè)方法相比,混合驅(qū)動(dòng)模型預(yù)測(cè)效果更好.圖2為混合驅(qū)動(dòng)模型預(yù)測(cè)方法流程圖.
圖2 加熱爐煤氣消耗量混合預(yù)測(cè)方法流程圖Fig.2 Flowchart of hybrid method for predicting gas consumption of reheating furnaces
(1)平均絕對(duì)誤差.平均絕對(duì)誤差(MAE)表示煤氣消耗量的預(yù)測(cè)值和煤氣消耗量的真實(shí)值之間絕對(duì)誤差的平均值,反映預(yù)測(cè)值誤差的實(shí)際情況,表達(dá)式如下:
式中:VYt為t時(shí)刻煤氣消耗量的真實(shí)值,m3/min;Vyt為t時(shí)刻煤氣消耗量的預(yù)測(cè)值,m3/min.
(2)平均相對(duì)誤差.平均相對(duì)誤差(MAPE)表示煤氣消耗量的預(yù)測(cè)值與真實(shí)值相對(duì)誤差的絕對(duì)值的平均數(shù),它具有下限(0),無(wú)上限,表達(dá)式如下:
(3)對(duì)稱平均絕對(duì)誤差.對(duì)稱平均絕對(duì)誤差(SMAPE)可以有效彌補(bǔ)有關(guān)煤氣消耗量平均絕對(duì)誤差在觀測(cè)值為0時(shí)的缺陷,它具有下限(0)和上限(2),表達(dá)式如下:
本文采用某鋼鐵聯(lián)合企業(yè)的加熱爐高爐煤氣消耗量數(shù)據(jù),每5 min采樣一次,試驗(yàn)中的數(shù)據(jù)采用2020年8月2日00:00至8月5日11:15實(shí)測(cè)的現(xiàn)場(chǎng)數(shù)據(jù).時(shí)間序列包括1000 個(gè)樣本(5 000 min).ANN 模型中,第1~600個(gè)樣本(0~3 000 min)作為訓(xùn)練集,第601~700個(gè)樣本(3 005~3 500 min)作為驗(yàn)證集,第701~1 000個(gè)樣本(3 505~5 000 min)作為測(cè)試集.煤氣消耗量的時(shí)間序列如圖3所示,表1列出了已知運(yùn)行狀態(tài)時(shí)間段.
表1 加熱爐運(yùn)行狀態(tài)Table 1 Operational modes of the reheating furnace
圖3 加熱爐高爐煤氣消耗量時(shí)間序列圖Fig.3 Time series data of blast furnace gas consumption of the reheating furnace
不同的時(shí)間段內(nèi)ARIMA和ANN模型預(yù)測(cè)精度是未知的,因此有必要單獨(dú)討論加熱爐不同運(yùn)行狀態(tài)下各模型的預(yù)測(cè)性能.
某段正常運(yùn)行時(shí)期(4 700~4 840 min)的預(yù)測(cè)結(jié)果如圖4(a)所示.結(jié)合表2可知,正常運(yùn)行期加熱爐高爐煤氣的消耗量相對(duì)穩(wěn)定.ARIMA模型的MAE,MAPE和SMAPE分別為1 055.39 m3/min,0.010 2和0.010 2,比ANN模型的MAE(1 712.30 m3/min),MAPE(0.016 6),SMAPE(0.016 7)低.由此可見(jiàn),在正常運(yùn)行期,ARIMA模型的性能優(yōu)于ANN模型.
在加熱爐運(yùn)行過(guò)程中,由于自身故障或外部調(diào)試等因素,將出現(xiàn)停爐檢修期;或由于生產(chǎn)限制,需保持空燒保溫狀態(tài),將出現(xiàn)待料運(yùn)行期.前者表現(xiàn)為隨著時(shí)間的變化,煤氣的消耗量逐漸降為0;后者表現(xiàn)為煤氣消耗量逐漸降低(煤氣消耗量不為0)而后逐漸上升至正常運(yùn)行水平.停爐檢修期因事件信號(hào)的迅速輸入,可直接判斷出煤氣的消耗量;而在停爐檢修期結(jié)束,煤氣消耗量逐漸上升至正常運(yùn)行水平(恢復(fù)期)的過(guò)程中,ARIMA模型泛化能力更強(qiáng).在待料運(yùn)行期,ANN模型可以更好地適應(yīng)加熱爐高爐煤氣量的波動(dòng)情況,滯后性較小.當(dāng)預(yù)測(cè)數(shù)據(jù)在3 590~3 640 min時(shí),加熱爐處于停爐檢修期,預(yù)測(cè)效果如圖4(b)所示.此時(shí)ARIMA與ANN預(yù)測(cè)精度相同,均能夠準(zhǔn)確地預(yù)測(cè)煤氣消耗量.隨后在高爐煤氣消耗量由0增長(zhǎng)到120 000 m3/min的過(guò)程中,ANN與ARIMA預(yù)測(cè)都存在不同程度的滯后,但誤差基本控制在2 000 m3/min以內(nèi).從表2中可以看出,ARIMA模型在停爐檢修期(含恢復(fù)期)的MAE和SMAPE分別為441.23 m3/min和0.238 7,低于ANN模型的MAE(669.96 m3/min)和SMAPE(0.244 7).由此可見(jiàn),在停爐檢修期(含恢復(fù)期),ARIMA模型表現(xiàn)出比ANN模型更好的性能.
表2 各運(yùn)行狀態(tài)下ARIMA和ANN的預(yù)測(cè)性能Table 2 Prediction performance of ARIMA and ANN models at each operational mode
圖4 ARIMA和ANN模型在各運(yùn)行期的預(yù)測(cè)結(jié)果Fig.4 Prediction of ARIMA and ANN models for each operational operation
圖4(c)描述了待料運(yùn)行期(4 490~4 640 min)的預(yù)測(cè)結(jié)果.由圖可知,與ARIMA模型相比,ANN模型預(yù)測(cè)的效果更好.在4 500 min時(shí),ARIMA和ANN都出現(xiàn)了滯后現(xiàn)象,ANN的預(yù)測(cè)結(jié)果在4 535 min時(shí)便可將平均絕對(duì)誤差控制在4 000 m3/min以內(nèi),而ARIMA絕對(duì)誤差始終高于4 000 m3/min,因此ARIMA的滯后現(xiàn)象較ANN更 為 嚴(yán) 重. ARIMA 模 型 的 MAE 為5 016.91 m3/min, 約 為 ANN 模 型(3 722.83 m3/min)的1.5倍;MAPE為0.101 4,接近ANN 模型的2倍(0.069 7);SMAPE為0.100 4,比ANN模型高0.035 2.結(jié)果表明,在待料運(yùn)行期,ANN模型可以較好地適應(yīng)波動(dòng)情況,而ARIMA存在的滯后性,預(yù)測(cè)效果比ANN模型差.
根據(jù)加熱爐不同的操作事件選取不同的子模型建立混合預(yù)測(cè)模型.對(duì)圖4(a)~(c)進(jìn)行比較分析可知,在正常運(yùn)行期ARIMA模型預(yù)測(cè)精度更高,在停爐檢修期ARIMA模型依舊保持良好的性能,在待料運(yùn)行期ANN模型的泛化能力更強(qiáng).而混合驅(qū)動(dòng)預(yù)測(cè)模型集成了加熱爐不同運(yùn)行狀態(tài)下各模型的優(yōu)勢(shì),對(duì)煤氣消耗量進(jìn)行準(zhǔn)確預(yù)測(cè),預(yù)測(cè)結(jié)果如圖5所示.結(jié)果表明,該混合預(yù)測(cè)模型在加熱爐不同運(yùn)行期皆可表現(xiàn)出良好的預(yù)測(cè)性能.圖6比較了ARIMA,ANN和混合模型的預(yù)測(cè)誤差.由圖可知,混合預(yù)測(cè)模型可以有效地提高預(yù)測(cè)的精度.ARIMA,ANN模型和混合模型的預(yù)測(cè)性能如表3所示.
圖5 混合模型的預(yù)測(cè)結(jié)果Fig.5 Prediction of the hybrid model
圖6 各模型的預(yù)測(cè)誤差Fig.6 Prediction errors
表3 各模型的總體預(yù)測(cè)性能Table 3 Prediction performance of all models for the whole period
從表3中可以看出,混合模型根據(jù)設(shè)備不同的操作事件采用不同的預(yù)測(cè)模型對(duì)煤氣消耗量進(jìn)行預(yù)測(cè),因而較不區(qū)分事件的ARIMA和ANN模型更具有針對(duì)性.混合模型的MAE和SMAPE值分別為1 542.45 m3/min和0.066 5,模型優(yōu)越性顯著,這種差異得益于對(duì)運(yùn)行事件的精準(zhǔn)辨識(shí)以及與數(shù)據(jù)模型的高度融合,驗(yàn)證了事件和數(shù)據(jù)融合驅(qū)動(dòng)下的混合預(yù)測(cè)模型的準(zhǔn)確性及可行性.
(1)本文提出的融合事件和數(shù)據(jù)的加熱爐煤氣消耗量混合預(yù)測(cè)方法對(duì)加熱爐操作事件進(jìn)行了分類辨識(shí),結(jié)合生產(chǎn)大數(shù)據(jù)對(duì)加熱爐的高爐煤氣消耗量進(jìn)行了預(yù)測(cè).利用篩選并處理后的1 000組加熱爐高爐煤氣消耗量數(shù)據(jù),證實(shí)該方法預(yù)測(cè)性能好,滯后性小,實(shí)現(xiàn)了加熱爐高爐煤氣消耗量的精準(zhǔn)預(yù)測(cè).
(2)相比于ARIMA模型和ANN模型,混合預(yù)測(cè)模型的精確度更高.對(duì)于加熱爐高爐煤氣消耗量,混合預(yù)測(cè)方法的MAE為1 542.45 m3/min,小 于ARIMA (2 141.28 m3/min) 和ANN(2 068.27 m3/min)方法的MAE.混合預(yù)測(cè)方法的MAPE(0.065 4)和SMAPE(0.066 5)也分別低于ARIMA 方 法 的MAPE(0.081 9)和SMAPE(0.088 7),以及ANN方法的MAPE(0.083 5)和SMAPE(0.079 6).