基于時延分析和IMA-ELM的出口SO2濃度預(yù)測

2022-09-01 01:08:56尚星宇

電力科技與環(huán)保 2022年4期

李健，王東，王瑞，尚星宇

(國家能源集團科學(xué)技術(shù)研究院有限公司銀川分公司,寧夏銀川 75001)

1 引言

隨著經(jīng)濟社會的發(fā)展，火電行業(yè)面臨著增加供應(yīng)和減少碳排放的雙重挑戰(zhàn)，“雙碳”目標(biāo)下，煤電改造迫在眉睫[1-2]。煤在我國能源結(jié)構(gòu)中占據(jù)著主要地位，由于其燃燒時會釋放出大量的SO2氣體，對大氣環(huán)境造成污染，因此需要對燃煤產(chǎn)生的煙氣進行凈化處理[3]?！叭穆?lián)動”背景下，針對煤電排放改造提出更高要求，新型電力系統(tǒng)下燃煤機組脫硫方法仍然是研究熱點。

燃煤機組目前主要采用的煙氣脫硫方法為石灰石-石膏濕法脫硫，該方法具有脫硫效率高，使用成本低等優(yōu)點[4-5]。但在實際生產(chǎn)中，由于脫硫系統(tǒng)受機組負(fù)荷波動影響較大，其內(nèi)部反應(yīng)也較為復(fù)雜，因此很難實現(xiàn)對出口SO2濃度的穩(wěn)定控制[6-7]。建立關(guān)于出口SO2濃度的預(yù)測模型，不僅可以幫助運行人員及時調(diào)整脫硫系統(tǒng)相關(guān)參數(shù)，提高脫硫效率，還可以提高整個脫硫系統(tǒng)的控制水平，降低脫硫的成本。

隨著人工智能的快速發(fā)展，越來越多的機器學(xué)習(xí)算法被廣泛應(yīng)用于煙氣濃度預(yù)測。崔仕文等[8]利用最小二乘回歸對輸入變量進行分析，將影響較大的因素作為輸入變量，利用支持向量機(Support Vector Machines, SVM)建立了關(guān)于脫硫效率的預(yù)測模型，取得了良好的預(yù)測效果。蘇翔鵬等[9]利用徑向基函數(shù)(Radial Basis Function, RBF)神經(jīng)網(wǎng)絡(luò)對SO2排放量進行建模，通過與誤差反饋 (Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)進行對比，突出了RBF建模的優(yōu)勢。雖然淺層神經(jīng)網(wǎng)絡(luò)能夠部分對象進行建模預(yù)測，但受其結(jié)構(gòu)限制，模型預(yù)測精度難以進一步提升。深層神經(jīng)網(wǎng)絡(luò)由于其強大的學(xué)習(xí)能力和非線性擬合能力，近年來吸引了眾多學(xué)者的關(guān)注。金秀章等[10]利用套索(Least Absolute Shrinkage and Selection Operator, LASSO)算法對初始輔助變量進行了篩選，利用長短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)搭建了出口SO2濃度預(yù)測模型。馬雙忱等[11]將LSTM與線性整流函數(shù)層(Rectified Linear Unit, ReLU)相結(jié)合，搭建了關(guān)于脫硫系統(tǒng)漿液PH值、脫硫效率的深度神經(jīng)網(wǎng)絡(luò)預(yù)測模型，探究了濕法脫硫系統(tǒng)各個參數(shù)指標(biāo)對脫硫效果的影響。雖然深層神經(jīng)網(wǎng)絡(luò)模型具有很高的預(yù)測精度，但考慮到其計算量大，訓(xùn)練時間長等缺點，很難應(yīng)用于實際生產(chǎn)中。極限學(xué)習(xí)機(Extreme Learning Machine, ELM)是在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進而成的一種前饋神經(jīng)網(wǎng)絡(luò)，它具有擬合能力強，泛化精度高、訓(xùn)練速度快等優(yōu)點。Wang等[12]利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks，DNN)從數(shù)據(jù)中提取有效信息，利用ELM建立預(yù)測模型，實現(xiàn)對脫硫系統(tǒng)出口SO2濃度的有效預(yù)測。程琳等[13]利用遺傳算法對ELM相關(guān)參數(shù)進行優(yōu)化，建立了SCR脫硝系統(tǒng)預(yù)測模型，有效預(yù)測了SCR出口NOx質(zhì)量濃度變化。

由于濕法脫硫系統(tǒng)內(nèi)部反應(yīng)需要一定的時間，因此從DCS上采集的數(shù)據(jù)其輸入與輸出變量間存在著時間延遲，為了保證模型的合理性，需要對輸入變量進行時延補償。目前時延分析最常用的方法為滑動窗口法，即通過比較不同時刻內(nèi)輸入變量與當(dāng)前確定好的輸出變量之間的相關(guān)性，從而確定最佳的遲延時間，進而對輸入變量進行時序上的調(diào)整，實現(xiàn)時延補償。用于衡量兩組變量間相關(guān)性大小的指標(biāo)有：皮爾遜相關(guān)系數(shù)[14]( Pearson correlation coefficient)、互信息[15](Mutual Information，MI)、最大信息系數(shù)[16]等。但上述方法只考慮到了系統(tǒng)由于內(nèi)部自身原因?qū)е碌臅r間延遲，沒有考慮到不同工況下煙氣流速變化可能導(dǎo)致延遲時間產(chǎn)生變化。

綜上所述，提出了一種基于時延分析和蜉蝣算法優(yōu)化極限學(xué)習(xí)機的出口SO2濃度預(yù)測模型。首先利用互信息計算不同時刻內(nèi)輸入變量與輸出變量間的相關(guān)性大小，從而確定最佳延遲時間，考慮到工況變化可能會導(dǎo)致延遲時間發(fā)生變化，因此設(shè)計了一種可以實時更新的時延補償方法。利用蜉蝣算法對原始輸入變量進行尋優(yōu)，從而確定與ELM模型相匹配的最優(yōu)特征子集。最后利用蜉蝣算法優(yōu)化ELM模型的相關(guān)參數(shù)，通過與其他機器學(xué)習(xí)建模方法進行比較，證明了ELM模型預(yù)測精度最高，能夠?qū)Τ隹赟O2濃度進行準(zhǔn)確預(yù)測。

2 研究方法

2.1 極限學(xué)習(xí)機

極限學(xué)習(xí)機是2004年南洋理工大學(xué)黃廣斌提出的一種前饋神經(jīng)網(wǎng)絡(luò)[17]。

ELM的網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入層、隱含層和輸出層組成。輸入層的神經(jīng)元個數(shù)根據(jù)模型輸入變量的個數(shù)來確定，隱含層神經(jīng)元個數(shù)可由優(yōu)化算法得出。輸入層與輸出層的連接權(quán)值為w，隱含層節(jié)點上的偏差為b、w和b可以通過隨機產(chǎn)生獲得，也可以通過尋優(yōu)確定。隱含層與輸出層的連接權(quán)值為β，如果設(shè)隱藏層的輸出為H(x)，則可以得到H(x)的計算公式如下所示：

H(x)=[h1(x),…，hm(x)]

(1)

式中：hi(x)表示隱含層第i個結(jié)點的輸出，其計算公式如下；

hi(x)=g(wix+bi)

(2)

式中：g表示激活函數(shù)。

輸出層通過連接權(quán)值β最終得到整個ELM的輸出值f(x)：

(3)

輸出層的權(quán)值β可以通過求取最小化訓(xùn)練誤差得到，因此ELM的訓(xùn)練過程其實就是對輸出層權(quán)值β的求解過程，其目標(biāo)函數(shù)如下：

min||Hβ-T||2

(4)

式中：T為目標(biāo)矩陣。

2.2 蜉蝣算法原理及其改進

蜉蝣算法是2020年最新提出的一種群智能優(yōu)化算法，它通過模仿蜉蝣種群中的求偶和交配行為使得算法最終收斂于全局最優(yōu)值[18]。在原始蜉蝣算法中，初始種群個體主要通過隨機產(chǎn)生，但這種隨機得到的個體由于其自身的不確定性，使得算法在迭代的過程中種群的多樣性不斷下降，最終陷入局部收斂。針對這一問題，本文提出了一種基于反向?qū)W習(xí)的初始化種群策略[19]。具體流程如下：

(1)首先隨機產(chǎn)生一個初始種群，然后根據(jù)這個初始種群生成它的反向種群。

(2)計算兩個種群每個個體的適應(yīng)度并排序，分別從兩個種群中挑選一半適應(yīng)度較高的個體，組成新的種群。

(3)將得到的兩個新種群分別作為雄性蜉蝣和雌性蜉蝣的初始種群并應(yīng)用于尋優(yōu)算法中。

通過這種反向?qū)W習(xí)可以使得種群個體均勻地從全局產(chǎn)生，避免了算法在迭代過程中陷入局部收斂。同時通過選取適應(yīng)度較高的個體，減少了種群與最優(yōu)解之間的距離，加快了算法的收斂速度。

由于濕法脫硫系統(tǒng)內(nèi)部反應(yīng)需要一定時間，因此采集的數(shù)據(jù)中輸入變量與輸出變量間存在著時間延遲。通過時延分析可以對輸入變量進行時序上的調(diào)整，從而提高輸入變量與輸出變量間的對應(yīng)關(guān)系，保證所建模型的合理性。傳統(tǒng)時延分析方法主要通過計算不同時刻內(nèi)輸入變量與輸出變量間的相關(guān)性大小來確定延遲時間[20]，但由于濕法脫硫系統(tǒng)的特殊性，傳統(tǒng)方法存在以下兩個缺點：一是在濕法脫硫系統(tǒng)中單個輸入變量不僅與輸出變量相關(guān)，也會收到其他的輸入變量以及設(shè)備和人為控制等影響。二是不同工況下煙氣流速不同，可能會導(dǎo)致相關(guān)變量的延遲時間發(fā)生改變。針對上述缺點，提出了一種基于互信息的改進時延分析方法：

(1)首先選定一組輸入變量與輸出變量，計算兩組變量間的互信息。互信息可以反映兩組變量間非線性相關(guān)性的大小，對于描述兩組變量間整體變化趨勢是否一致也更加準(zhǔn)確可靠。

(2)由于脫硫塔內(nèi)最大反應(yīng)時間不超過十分鐘，因此設(shè)置時延上限為600s，分別計算輸入變量在前600s時刻內(nèi)與輸出變量互信息的最大值，以及此時所對應(yīng)的時刻。

(3)在確定延遲時間后，將輸入變量的時序向前調(diào)整，重構(gòu)輸入變量，實現(xiàn)與輸出變量的對應(yīng)。

(4)由于延遲時間可能隨工況發(fā)生改變，因此當(dāng)數(shù)據(jù)變化時需要對確定好的延遲時間前后一定范圍內(nèi)輸入變量與輸出變量的互信息進行計算，并從中選出最大值對延遲時間進行更新。

本文基于脫硫系統(tǒng)的工作原理[21]，從DCS測點上選取了與出口SO2濃度相關(guān)的八個初始輸入變量，通過上述時延分析方法對篩選好的初始輔助變量進行時延分析，得到結(jié)果如表1所示。

表1 各初始輸入變量時間延遲和最大互信息Tab.1 The time delay and maximum mutual information for each initial input variable

2.3 基于IMA的輸入變量選擇

上文通過機理分析得到了初始的輸入變量，但這些變量中可能存在著部分無用變量和冗余變量。本文提出了一種基于改進蜉蝣算法(IMA)的輸入變量選擇方法，將變量選擇與優(yōu)化算法、預(yù)測模型相結(jié)合，在簡化變量選擇流程的同時又能夠快速地尋找出與預(yù)測模型匹配的最優(yōu)特征子集?；贗MA的變量選擇方法流程如下：

(1)分別在各個變量前乘以0或者1的系數(shù)，并將處理后的變量用于模型預(yù)測，將預(yù)測誤差作為蜉蝣算法的適應(yīng)度函數(shù)；

(2)由于ELM隱含層神經(jīng)元需要尋優(yōu)確定，而最優(yōu)神經(jīng)元個數(shù)又與輸入變量的數(shù)目相關(guān)，因此在上述算法中再添加一個ELM隱含層神經(jīng)元個數(shù)，與各個變量前的系數(shù)共同進行尋優(yōu)；

(3)通過多次迭代，蜉蝣算法最終可以找出ELM模型的最低預(yù)測誤差，以及此時對應(yīng)的最優(yōu)特征子集、最佳隱含層神經(jīng)元個數(shù)和正則化系數(shù)C。

通過上述尋優(yōu)算法，最終確定模型的輸入變量分別為：吸收塔PH值、入口煙氣流量、入口SO2濃度、機組負(fù)荷和石灰石漿液量，ELM的最優(yōu)隱含層神經(jīng)元個數(shù)確定為6。

2.4 基于IMA-ELM的預(yù)測模型

將時延分析和變量選擇后的數(shù)據(jù)作為最終模型的輸入變量，利用ELM建立模型進行預(yù)測實驗，總結(jié)算法的流程如下。

圖1 實驗流程圖Fig.1 Experimental flowchart

3 結(jié)果與討論

本次研究采用的模型評價指標(biāo)為均方根誤差RMSE和平均相對誤差MAPE，其公式如下：

(5)

(6)

式中：yi為實際值，yi為預(yù)測值，n代表測試集樣本數(shù)量。RMSE反映了總體預(yù)測值與真實值之間的誤差，而MAPE則側(cè)重反映預(yù)測值偏離真實值的程度，兩者相互結(jié)合，從而對預(yù)測曲線進行合理有效的評估。

3.1 實驗結(jié)果分析

本次實驗采用山西某600MW燃煤電廠所提供的歷史數(shù)據(jù)。通過數(shù)據(jù)清洗和預(yù)處理，最終選取了2500組代表性數(shù)據(jù)，其中前1000組作為訓(xùn)練集對模型進行訓(xùn)練，后500組作為測試集檢驗?zāi)Ｐ偷姆夯芰Γ瑪?shù)據(jù)間的采用周期為10s。

3.1.1 不同預(yù)測模型對實驗結(jié)果的影響

本文在建立ELM預(yù)測模型時首先通過IMA算法對隱含層神經(jīng)元個數(shù)進行優(yōu)化，隱含層權(quán)值和偏差則通過隨機產(chǎn)生。經(jīng)文獻[22]證明，通過對ELM隱含層權(quán)值和偏差進行優(yōu)化，可以使得ELM模型的預(yù)測精度進一步提升。因此本文分別對隱含層權(quán)值和偏差優(yōu)化前后的ELM進行了預(yù)測實驗，最終得到的預(yù)測結(jié)果如表2所示。隱含層權(quán)值和偏差優(yōu)化前后ELM的預(yù)測曲線如圖2所示。

圖2 不同模型預(yù)測結(jié)果圖Fig.2 Plot of prediction results for different models

表2 隱含層權(quán)值和偏差優(yōu)化前后ELM預(yù)測結(jié)果Tab.2 ELM prediction results before and after implicit layer weight and bias optimization

上述結(jié)果表明對于ELM的隱含層權(quán)值和偏差進行優(yōu)化可以使得最終ELM的預(yù)測精度進一步提升，隱含層權(quán)值和偏差優(yōu)化后的ELM其RMSE降低了12%，MAPE降低了11%。

為了進一步探究ELM在預(yù)測建模方面所具有的優(yōu)勢，本文選取了兩種具有代表性的機器學(xué)習(xí)算法如LSSVM[23]和LSTM[24]建立對比模型。三種模型在測試集上的預(yù)測結(jié)果如表3所示。

表3 三種模型在測試集上預(yù)測結(jié)果Tab.3 Three models predict results on the test set

三種模型在測試集上的預(yù)測曲線如圖3所示。

圖3 三種模型在測試集上預(yù)測結(jié)果圖Fig.3 Three models predict the outcome graph on the test set

從三種模型的預(yù)測結(jié)果可以看出，LSSVM的預(yù)測誤差最高，模型的擬合能力最弱。LSTM具有較高的預(yù)測精度，但模型結(jié)構(gòu)較為復(fù)雜，訓(xùn)練過程計算量極大，難以應(yīng)用于實際生產(chǎn)中。ELM模型的預(yù)測誤差最低，并且由于其特殊的前饋網(wǎng)絡(luò)結(jié)構(gòu)，ELM的訓(xùn)練效率較快，模型的穩(wěn)定性很強。與其他兩種典型機器學(xué)習(xí)建模方法相比，ELM在建立關(guān)于出口SO2濃度預(yù)測模型上具有一定的優(yōu)勢。

3.1.2 時延分析對實驗結(jié)果的影響

為了體現(xiàn)改進時延分析方法對預(yù)測結(jié)果的影響，本文分別利用傳統(tǒng)時延分析方法和改進時延分析方法對輸入變量進行了時延補償。得到的結(jié)果如表4所示。不同時延分析方法在測試集上的預(yù)測曲線如圖4所示。

表4 不同時延分析方法預(yù)測結(jié)果比較Tab.4 Comparison of prediction results by different time-delay analysis methods set

3.1.3 不同優(yōu)化算法對實驗結(jié)果的影響

為了進一步體現(xiàn)改進蜉蝣算法在尋優(yōu)精度上的優(yōu)勢，本文分別選取了原蜉蝣算法(MA)和粒子群算法[25](PSO)進行了對比預(yù)測實驗：分別選取相同的訓(xùn)練集和測試集，設(shè)置各算法迭代次數(shù)為1000次，種群規(guī)模為30，分別對ELM模型的超參數(shù)進行優(yōu)化，最終得到各ELM模型在測試集上預(yù)測結(jié)果如表5所示。不同尋優(yōu)算法下ELM模型的預(yù)測結(jié)果如圖5所示。

圖5 不同尋優(yōu)算法下ELM預(yù)測結(jié)果圖Fig.5 Under different optimization algorithms ELM predicts the result graph

從表5可以看出，IMA-ELM在三種模型中的預(yù)測誤差最低，MA-ELM次之，PSO-ELM最高。與PSO算法相比，MA算法由于其獨特的聚集和交配行為，使得算法在收斂速度和尋優(yōu)精度上都有了進一步提升。

表5 不同尋優(yōu)算法下ELM預(yù)測結(jié)果比較Tab.5 Comparison of ELM prediction results under different optimization algorithms

4 結(jié)論

本文針對濕法脫硫系統(tǒng)受機組負(fù)荷波動影響較大，難以穩(wěn)定控制等問題，設(shè)計了一種基于時延分析和改進蜉蝣算法優(yōu)化極限學(xué)習(xí)機的出口SO2濃度預(yù)測模型?；贗MA的變量選擇方法，通過將尋優(yōu)算法與變量選擇相結(jié)合，從而能夠快速有效的找出與ELM模型最為匹配的特征子集。利用ELM建立了相關(guān)仿真模型，實驗結(jié)果表明，在對ELM隱含層權(quán)值和偏差進行優(yōu)化后，模型的均方根誤差從1.4775下降到1.3014，模型誤差下降了12%；利用互信息算法對輸入變量進行時延分析并補償，模型精度提升了5%；利用IMA算法對模型參數(shù)進行優(yōu)化，相比于PSO、MA優(yōu)化后的模型，IMA-ELM模型的預(yù)測誤差分別下降了0.0914和0.0396?；趯嶋H運行數(shù)據(jù)的仿真實驗表明，IMA-ELM預(yù)測模型可以對出口SO2濃度變化趨勢進行準(zhǔn)確預(yù)測，進而為運行人員控制脫硫系統(tǒng)平穩(wěn)運行提供參考，對于提高脫硫效率和節(jié)約脫硫成本具有重要意義[26]。