馬永濤,邢江寬,羅坤,樊建人
(浙江大學(xué) 能源高效清潔利用全國(guó)重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310027)
我國(guó)煤炭資源較為豐富,煤炭消費(fèi)占據(jù)重要地位。據(jù)國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì)[1],2020年,火力發(fā)電用煤約占煤炭消費(fèi)總量的52.3%,在源源不斷地輸送電力的同時(shí),產(chǎn)生了如SO2、NOX、PM2.5等大氣污染物。為控制大氣污染物排放,我國(guó)政府出臺(tái)了一系列的排放指標(biāo)要求。濕法煙氣脫硫系統(tǒng)能夠有效脫除燃煤煙氣中的SO2,因此,其被大部分燃煤電廠采用,作為主要的脫硫手段。在脫硫系統(tǒng)實(shí)際運(yùn)行時(shí),運(yùn)行人員多根據(jù)自身經(jīng)驗(yàn)調(diào)整優(yōu)化系統(tǒng)運(yùn)行參數(shù),這樣無(wú)法保證系統(tǒng)全時(shí)段實(shí)現(xiàn)經(jīng)濟(jì)穩(wěn)定運(yùn)行,因此,脫硫系統(tǒng)優(yōu)化一直是研究者們關(guān)心的重要問(wèn)題。
建立較為準(zhǔn)確的濕法煙氣脫硫系統(tǒng)(Wet Flue Gas Desulfurization,WFGD)排放預(yù)測(cè)模型是對(duì)其進(jìn)行進(jìn)一步優(yōu)化的基礎(chǔ)。第一性原理或機(jī)理模型,也被稱為“白箱”模型,通過(guò)聯(lián)立質(zhì)量和能量守恒方程、運(yùn)動(dòng)學(xué)方程、熱力學(xué)方程和輸運(yùn)方程等求解得到。這一類模型通常由有物理意義的相關(guān)參數(shù)來(lái)表征,并能在較大運(yùn)行參數(shù)變化范圍內(nèi)保持其有效性,但是其結(jié)構(gòu)較為復(fù)雜,建模的成本較高[2]。脫硫塔中的脫硫反應(yīng)是復(fù)雜、多變量、強(qiáng)耦合、非線性的過(guò)程[3],難以建立其機(jī)理模型。近年來(lái),隨著計(jì)算機(jī)和人工智能技術(shù)蓬勃發(fā)展,使用過(guò)程數(shù)據(jù)來(lái)訓(xùn)練機(jī)器學(xué)習(xí)等人工智能算法的數(shù)據(jù)驅(qū)動(dòng)模型或“黑箱模型”,因其建模成本低,被學(xué)者們用來(lái)建立多種復(fù)雜過(guò)程的模型。Chen等人[4]提出了一種寬深結(jié)構(gòu)的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型,用來(lái)預(yù)測(cè)循環(huán)流化床的二氧化硫排放。Li等人[3]使用動(dòng)態(tài)建模方法建立二氧化硫排放的預(yù)測(cè)模型,結(jié)果顯示動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型要優(yōu)于其它模型?;诿摿蛳到y(tǒng)歷史運(yùn)行和實(shí)時(shí)運(yùn)行數(shù)據(jù),建立SO2排放預(yù)測(cè)模型之后,可以在較短時(shí)間內(nèi)用較低的成本來(lái)優(yōu)化脫硫系統(tǒng)的部分運(yùn)行參數(shù)。Guo等人[5]基于組合數(shù)學(xué)模型和人工神經(jīng)網(wǎng)絡(luò)的SO2排放預(yù)測(cè)模型,使用粒子群算法優(yōu)化濕法煙氣脫硫系統(tǒng)。葛志輝等人[6]使用聚類算法挖掘得到脫硫系統(tǒng)可調(diào)運(yùn)行參數(shù)的目標(biāo)值,并建立了脫硫系統(tǒng)優(yōu)化運(yùn)行的目標(biāo)庫(kù)。但上述預(yù)測(cè)模型的建模準(zhǔn)確性仍有待提升,并且大多為單目標(biāo)優(yōu)化研究,數(shù)據(jù)驅(qū)動(dòng)的脫硫系統(tǒng)多目標(biāo)優(yōu)化需要進(jìn)一步研究。
本文的研究目的是建立適用于濕法煙氣脫硫系統(tǒng)的SO2排放預(yù)測(cè)模型,然后基于該模型對(duì)濕法煙氣脫硫系統(tǒng)進(jìn)行多目標(biāo)優(yōu)化。首先,本文基于某1000 MW燃煤電廠的運(yùn)行數(shù)據(jù),采用靜態(tài)建模和動(dòng)態(tài)建模兩種建模策略,并對(duì)比建模效果;然后結(jié)合動(dòng)態(tài)建模和一階差分預(yù)測(cè)(Differential Prediction,DP)方法,對(duì)比隨機(jī)森林(Random Forest,RF)、極致梯度提升(eXtreme Gradient Boosting,XGBoost)、支持向量回歸(Support Vector Regression,SVR)、深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)、長(zhǎng)短時(shí)記憶(Long Short-Term Memory,LSTM )神經(jīng)網(wǎng)絡(luò)五種機(jī)器學(xué)習(xí)算法的建模效果,用決定系數(shù)(coefficient of determination,R2)和均方誤差(Mean Squared Error, MSE)作為算法的評(píng)價(jià)標(biāo)準(zhǔn)。最后本文選取準(zhǔn)確性較好的基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練的模型作為SO2排放預(yù)測(cè)模型,使用多目標(biāo)粒子群優(yōu)化(Multi-objective particle swarm optimization,MOPSO)算法優(yōu)化脫硫系統(tǒng)運(yùn)行參數(shù),將優(yōu)化結(jié)果用來(lái)指導(dǎo)實(shí)際操作,實(shí)現(xiàn)脫硫系統(tǒng)穩(wěn)定經(jīng)濟(jì)運(yùn)行。
在電廠機(jī)組實(shí)際運(yùn)行時(shí),由于設(shè)備故障等原因會(huì)產(chǎn)生明顯偏離數(shù)據(jù)正常分布的值,即異常值[7]。如果將這些異常值作為訓(xùn)練數(shù)據(jù)的一部分,就會(huì)嚴(yán)重影響建模精度。如圖1所示,煙氣脫硫系統(tǒng)(Flue Gas Desulfurization,F(xiàn)GD)入口煙氣SO2濃度數(shù)據(jù)中有一些異常值,因此有必要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,剔除異常值。本文采用箱形圖中使用的四分位距(Inter-Quartile Range,IQR)法來(lái)識(shí)別出原始數(shù)據(jù)中的異常值。找到任一維度數(shù)據(jù)的四分之一位數(shù)Q1,四分之三位數(shù)Q3,定義四分位間距QR為:
圖1 部分樣本的FGD入口煙氣SO2濃度值
數(shù)據(jù)的上邊緣Qup和下邊緣Qlow分別定義為:
其中scale為尺度,通常取值為3或1.5,超過(guò)上邊緣Qup或者低于下邊緣Qlow的點(diǎn)被認(rèn)為是數(shù)據(jù)中的異常點(diǎn)。當(dāng)scale取3時(shí),剔除的值為極端異常值;當(dāng)scale取1.5時(shí),剔除的值為溫和異常值和極端異常值。
本文采用動(dòng)態(tài)建模方法[3],如圖2所示,Xt(p×1)為當(dāng)前采樣時(shí)間維度為p的輸入變量,Yt+1(l×1)為下一采樣時(shí)間維度為l的輸出變量。k為時(shí)間步,是一個(gè)超參數(shù),可以根據(jù)實(shí)驗(yàn)和經(jīng)驗(yàn)人工選取。若k值較小,可能無(wú)法包含足夠的遲滯信息;若k值較大,就會(huì)導(dǎo)致輸入變量的維度過(guò)大,從而延長(zhǎng)訓(xùn)練時(shí)間。使用動(dòng)態(tài)建模方法可以將輸入變量重整如下:
圖2 靜態(tài)建模和動(dòng)態(tài)建模示意圖
這樣,輸入變量就從p維擴(kuò)展成了(k+1)×p維,總時(shí)間步為(k+1)。輸出變量則保持不變,維度仍為l維。
一階差分預(yù)測(cè)能減小預(yù)測(cè)數(shù)據(jù)的自相關(guān)性對(duì)預(yù)測(cè)結(jié)果的影響[4]。脫硫系統(tǒng)的數(shù)據(jù)具有明顯的自相關(guān)性,因此一階差分預(yù)測(cè)方法非常適用于對(duì)脫硫過(guò)程建模。本文結(jié)合動(dòng)態(tài)建模和一階差分預(yù)測(cè),采用公式如下:
其中yt+1為t+1時(shí)刻預(yù)測(cè)目標(biāo)變量值;yt則為t時(shí)刻預(yù)測(cè)目標(biāo)變量值;Δy即為兩個(gè)時(shí)刻預(yù)測(cè)目標(biāo)變量的差值。本文所用模型通過(guò)預(yù)測(cè)Δy,再與yt相加,從而得到y(tǒng)t+1。
根據(jù)所使用算法不同,可以將機(jī)器學(xué)習(xí)模型分為集成學(xué)習(xí)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等。下面對(duì)本文所使用的算法原理進(jìn)行介紹。
1.4.1 隨機(jī)森林
由L. Breiman于2001年提出的隨機(jī)森林算法已經(jīng)成為一個(gè)極度成功的算法,被應(yīng)用于各種一般性分類和回歸問(wèn)題上[8,9]。該算法是一種集成學(xué)習(xí)算法,通過(guò)訓(xùn)練多個(gè)不同的隨機(jī)決策樹(shù),并對(duì)每棵樹(shù)的預(yù)測(cè)結(jié)果取平均從而融合得到最終的預(yù)測(cè)結(jié)果。
1.4.2 極致梯度提升
極致梯度提升是由Chen和Guestrin于2016年提出的基于梯度提升且可擴(kuò)展性較強(qiáng)的決策樹(shù)集成算法[10,11]。由于其在多種機(jī)器學(xué)習(xí)任務(wù)中能有較好的表現(xiàn)和較高的準(zhǔn)確性,它被廣泛地應(yīng)用在數(shù)據(jù)科學(xué)競(jìng)賽和實(shí)際生活中。該算法通過(guò)整合樹(shù)模型和線性模型,最終做出預(yù)測(cè),并使用正則化技術(shù)來(lái)防止過(guò)擬合。
1.4.3 支持向量回歸
支持向量回歸是一種有效的回歸分析方法,其用數(shù)據(jù)集的子集來(lái)構(gòu)建一個(gè)函數(shù)估計(jì)[12],數(shù)學(xué)形式如下:
其中W∈Rn,為權(quán)重特征矢量;b為偏置。代表估計(jì)出的映射關(guān)系;W∈Rn,為輸入矢量。
支持向量回歸使用核函數(shù)將輸入數(shù)據(jù)映射到高維特征空間,將非線性問(wèn)題轉(zhuǎn)換為線性問(wèn)題來(lái)求解。徑向基函數(shù)(Radius Basis Function,RBF)是較為常用的核函數(shù),它將輸入數(shù)據(jù)投射到無(wú)限維特征空間,描述如下:
1.4.4 深度神經(jīng)網(wǎng)絡(luò)
深度神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的基礎(chǔ)。而模仿人類大腦行為的人工神經(jīng)元?jiǎng)t是構(gòu)建深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)[13]。這個(gè)基礎(chǔ)的計(jì)算元稱為節(jié)點(diǎn),它接收外部輸入,通過(guò)學(xué)習(xí)獲得內(nèi)部權(quán)重和偏置參數(shù),并利用這些參數(shù)產(chǎn)生輸出。深度神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層、輸出層組成,每一層都由多個(gè)人工神經(jīng)元組成,層與層之間通過(guò)權(quán)重連接。
1.4.5 長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
長(zhǎng)短時(shí)記憶(以下簡(jiǎn)稱LSTM)神經(jīng)網(wǎng)絡(luò)算法是一種善于處理非線性時(shí)序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法[14]。與深度神經(jīng)網(wǎng)絡(luò)不同,LSTM網(wǎng)絡(luò)層內(nèi)也建立了連接。這就使得LSTM能反映出序列中的相關(guān)信息,模型有了記憶能力,其記憶用細(xì)胞狀態(tài)表示。LSTM的記憶細(xì)胞由一個(gè)輸入門、一個(gè)輸出門和一個(gè)遺忘門組成[15]。這一結(jié)構(gòu)使LSTM能夠基于先前狀態(tài)、當(dāng)前記憶和當(dāng)前輸入,從而決定哪些細(xì)胞受到抑制、哪些細(xì)胞得到激活。
LSTM的結(jié)構(gòu)如圖3所示,其中xt表示當(dāng)前輸入;Ct-1表示上一時(shí)刻的細(xì)胞狀態(tài);ht-1表示上一時(shí)刻的隱狀態(tài);ft表示遺忘門的狀態(tài);it表示輸入門的狀態(tài);Ct為候選細(xì)胞狀態(tài);ot表示輸出門的狀態(tài);Ct表示當(dāng)前細(xì)胞狀態(tài);ht-1表示當(dāng)前隱狀態(tài);yt表示當(dāng)前輸出。σ(·)為sigmoid函數(shù),作為門激活函數(shù);tanh(·)是雙曲正切函數(shù),作為輸入和輸出模塊的激活函數(shù),數(shù)學(xué)描述如下所示:
圖3 LSTM的結(jié)構(gòu)
粒子群優(yōu)化算法是一個(gè)經(jīng)典的群體智能算法,它被廣泛應(yīng)用于單目標(biāo)優(yōu)化問(wèn)題的求解上[16]。由于其收斂速度快和實(shí)施簡(jiǎn)單,后來(lái)也被應(yīng)用到多目標(biāo)優(yōu)化問(wèn)題上。
第一個(gè)基于粒子群優(yōu)化的多目標(biāo)算法由Coello Coello等人提出[17]。在該算法中,帕累托(Pareto)支配被用來(lái)確定群體最優(yōu)粒子和個(gè)體最優(yōu)粒子,通過(guò)不斷更新最優(yōu)解集(Archive)將非支配粒子保存作為群體最優(yōu)粒子。本文所使用的算法流程如圖4所示:
圖4 多目標(biāo)粒子群優(yōu)化算法的流程圖
對(duì)回歸問(wèn)題的評(píng)價(jià)標(biāo)準(zhǔn)主要有決定系數(shù)R2和均方誤差MSE,具體計(jì)算方法如公式(10)和公式(11)所示:
其中n為樣本總數(shù);yi表示樣本i目標(biāo)變量的測(cè)量值;為樣本i目標(biāo)變量的預(yù)測(cè)值;為所有樣本目標(biāo)變量的測(cè)量值的平均。R2的取值范圍為0~1,R2值越大,說(shuō)明模型的預(yù)測(cè)能力越好;MSE越小,目標(biāo)變量真實(shí)值和預(yù)測(cè)值之間的誤差越小,模型的預(yù)測(cè)能力越好。
以某1000 MW燃煤發(fā)電機(jī)組的濕法煙氣脫硫系統(tǒng)作為研究對(duì)象,收集到2022年10月至2022年11月間隔為54 s的系統(tǒng)相關(guān)運(yùn)行數(shù)據(jù),由文獻(xiàn)[18]、[19]可知,該采樣間隔是合適的,樣本數(shù)量為50000,這些數(shù)據(jù)中可能存在異常值或者被記錄下的非真實(shí)值,因此需要對(duì)其進(jìn)行預(yù)處理,剔除異常值。
在獲得數(shù)據(jù)后,選取合適的參數(shù)作為機(jī)器學(xué)習(xí)模型輸入變量,將54 s后脫硫系統(tǒng)出口SO2濃度作為被預(yù)測(cè)量。隨后基于該預(yù)測(cè)模型,對(duì)脫硫系統(tǒng)開(kāi)展多目標(biāo)優(yōu)化。
本文在選取模型輸入?yún)?shù)時(shí),參考了相關(guān)文獻(xiàn)[3,5]。需要說(shuō)明的是,煤的工業(yè)分析和元素分析作為影響SO2排放的重要參數(shù),但在采樣數(shù)據(jù)所處的時(shí)間段內(nèi),煤質(zhì)未發(fā)生顯著變化,因此為簡(jiǎn)化模型,煤質(zhì)信息未被選入輸入?yún)?shù)。
為了衡量不同輸入?yún)?shù)和被預(yù)測(cè)量之間的關(guān)系,本文首先計(jì)算異常值處理前各變量的皮爾遜相關(guān)系數(shù)rxy,計(jì)算方法如公式(12)所示,通常來(lái)說(shuō),rxy的絕對(duì)值越接近于1,兩個(gè)變量之間存在線性相關(guān)的可能性越大。將得到的結(jié)果用熱力圖表示,如圖5所示。隨后用1.1中所描述的四分位距法剔除異常值,本文scale取1.5,再次計(jì)算各變量的皮爾遜相關(guān)系數(shù),將得到的結(jié)果用熱力圖表示,如圖6所示。最后使用處理后的70%的數(shù)據(jù)集去訓(xùn)練得到隨機(jī)森林模型,運(yùn)用模型特征重要度這一屬性得出各輸入?yún)?shù)的重要度,并記錄在表1中。
表1 不同輸入?yún)?shù)對(duì)模型的輸入重要性
圖5 數(shù)據(jù)預(yù)處理前模型輸入輸出變量彼此相關(guān)系數(shù)的熱力圖
圖6 數(shù)據(jù)預(yù)處理后模型輸入輸出變量彼此相關(guān)系數(shù)的熱力圖
其中rxy表示樣本x和樣本y之間的皮爾遜相關(guān)系數(shù);xi和yi分別代表樣本x和樣本y中的第i個(gè)樣本;n為樣本總數(shù)。
對(duì)比圖5、圖6可得,雖然數(shù)據(jù)預(yù)處理后#1脫硫原煙氣SO2濃度和預(yù)測(cè)變量之間的rxy為-0.00019,但數(shù)據(jù)預(yù)處理前#1脫硫原煙氣SO2濃度和預(yù)測(cè)變量之間的rxy為0.24,并考慮其特征重要度為0.06985887,因此保留這一參數(shù)。同時(shí),從圖6可以看出發(fā)電機(jī)功率、總?cè)剂狭俊?1脫硫原煙氣流量和#1FGD入口煙氣壓力1這四個(gè)輸入?yún)?shù)存在一定程度的相關(guān)性,但為提高模型的預(yù)測(cè)能力,本文選擇全部保留。最終選為模型輸入?yún)?shù)的變量如表1所示。
為確定動(dòng)態(tài)建模時(shí)所需總時(shí)間步,本文使用隨機(jī)森林和LSTM兩種機(jī)器學(xué)習(xí)算法,對(duì)比在不同時(shí)間步下模型的預(yù)測(cè)效果。不同時(shí)間步下數(shù)據(jù)預(yù)處理后總量不同,每個(gè)時(shí)間步下70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)。其中使用LSTM建模時(shí)結(jié)合了一階差分預(yù)測(cè)方法,而隨機(jī)森林未使用。結(jié)果如表2和表3所示:
表2 不同總時(shí)間步下隨機(jī)森林模型預(yù)測(cè)能力
表3 不同總時(shí)間步下LSTM模型預(yù)測(cè)能力
由表2和表3可得,不同總時(shí)間步下兩種模型的預(yù)測(cè)能力稍有差別。對(duì)隨機(jī)森林模型來(lái)說(shuō),總時(shí)間步為8小時(shí),預(yù)測(cè)能力最好;對(duì)LSTM模型來(lái)說(shuō),總時(shí)間步為10小時(shí),MSE最小,而總時(shí)間步為3小時(shí),R2最大。這種情況是由總時(shí)間步不同和各總時(shí)間步下用于訓(xùn)練和驗(yàn)證的數(shù)據(jù)總量不同兩種因素共同造成的。因此結(jié)合文獻(xiàn)[3],同時(shí)為降低模型復(fù)雜度,本文將總時(shí)間步確定為5。
為使機(jī)器學(xué)習(xí)模型獲得較好的預(yù)測(cè)效果,通常需要對(duì)其參數(shù)進(jìn)行調(diào)優(yōu),由2.3節(jié)可知,結(jié)合一階差分預(yù)測(cè)時(shí)模型的預(yù)測(cè)效果較好,因此本文對(duì)結(jié)合了一階差分預(yù)測(cè)的模型調(diào)整參數(shù),同時(shí)總時(shí)間步設(shè)置為5小時(shí),結(jié)果如下:
2.4.1 隨機(jī)森林模型參數(shù)確定
影響隨機(jī)森林模型預(yù)測(cè)效果主要參數(shù)為估計(jì)器數(shù)量,即nestimators,為確定其數(shù)值,采用五折交叉驗(yàn)證,用MSE作為衡量標(biāo)準(zhǔn),根據(jù)結(jié)果本文將nestimators設(shè)置為200,模型其它參數(shù)為默認(rèn)值。該參數(shù)下模型的建模效果如表4所示。
表4 隨機(jī)森林模型的預(yù)測(cè)性能對(duì)比
表5 極致梯度提升模型的預(yù)測(cè)性能對(duì)比
2.4.2 極致梯度提升模型參數(shù)確定
影響極致梯度提升模型預(yù)測(cè)效果主要參數(shù)為估計(jì)器數(shù)量nestimators和學(xué)習(xí)率learningrate,為確定這兩個(gè)參數(shù)的取值,分別采用五折交叉驗(yàn)證,用MSE作為衡量標(biāo)準(zhǔn),根據(jù)結(jié)果本文將nestimators設(shè)置為100,learningrate設(shè)置為0.04,模型其它參數(shù)為默認(rèn)值。當(dāng)前參數(shù)下模型的建模效果如表五所示。
2.4.3 深度神經(jīng)網(wǎng)絡(luò)模型參數(shù)確定
影響深度神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果主要參數(shù)為隱藏層神經(jīng)元數(shù)量和隱藏層層數(shù),為確定這兩個(gè)參數(shù)的取值,基于Pytorch架構(gòu),70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,參數(shù)batchsize設(shè)置為256,初始學(xué)習(xí)率為0.001,并逐漸減小,進(jìn)行L2正則化,最終用MSE作為衡量標(biāo)準(zhǔn),結(jié)果如表6所示:
表6 不同隱藏層神經(jīng)元數(shù)量和層數(shù)下DNN預(yù)測(cè)能力
結(jié)合表6數(shù)據(jù),同時(shí)為降低模型復(fù)雜度,本文將隱藏層神經(jīng)元數(shù)量設(shè)置為256,層數(shù)設(shè)置為2,其它參數(shù)為默認(rèn)值。值得說(shuō)明的是,除層數(shù)為1的模型外,為緩解過(guò)擬合,其它模型均使用了批標(biāo)準(zhǔn)化和丟棄,其中丟棄概率為0.1。
2.4.4 LSTM模型參數(shù)確定
影響LSTM模型預(yù)測(cè)效果的主要參數(shù)為隱藏層神經(jīng)元數(shù)量和LSTM層層數(shù),為確定這兩個(gè)參數(shù)的取值,基于Pytorch架構(gòu),70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,參數(shù)batchsize設(shè)置為256,初始學(xué)習(xí)率為0.001,并逐漸減小,進(jìn)行L2正則化,最終用MSE作為衡量標(biāo)準(zhǔn),結(jié)果如表7所示:
表7 不同隱藏層神經(jīng)元數(shù)量和LSTM層層數(shù)下LSTM預(yù)測(cè)能力
結(jié)合表7數(shù)據(jù),同時(shí)為降低模型復(fù)雜度,本文將隱藏層神經(jīng)元數(shù)量設(shè)置為256,LSTM層數(shù)設(shè)置為2,模型其它參數(shù)為默認(rèn)值。值得說(shuō)明的是,為提升模型預(yù)測(cè)效果,在LSTM層后添加一層線性層,同時(shí)為緩解過(guò)擬合,使用了批標(biāo)準(zhǔn)化和丟棄,其中丟棄概率為0.1。
綜上所述,本文確定了除支持向量回歸外的四個(gè)模型的參數(shù),在此處需要說(shuō)明的是,對(duì)支持向量回歸,本文選擇默認(rèn)參數(shù)。
由2.4節(jié)可知,針對(duì)五種模型,本文確定了相關(guān)參數(shù),通過(guò)比較可以獲得較好的SO2排放預(yù)測(cè)模型,隨后可以基于該模型,并結(jié)合多目標(biāo)粒子群優(yōu)化算法,對(duì)脫硫系統(tǒng)相關(guān)參數(shù)進(jìn)行優(yōu)化。本文選擇的待優(yōu)化參數(shù)分別為#1FGD入口煙氣溫度1、#1吸收塔修正液位1、#1吸收塔漿液pH值、泵臺(tái)數(shù)。本文所研究的問(wèn)題為多目標(biāo)優(yōu)化問(wèn)題,目標(biāo)函數(shù)為SO2排放預(yù)測(cè)函數(shù)和脫硫成本函數(shù),該問(wèn)題數(shù)學(xué)描述如下:
其中f1(DV,MV)為前面訓(xùn)練好SO2排放預(yù)測(cè)函數(shù);MV為操縱變量,即待優(yōu)化參數(shù),在給定范圍內(nèi)變化;DV為干擾變量,即其它輸入?yún)?shù);為脫硫效率;為脫硫塔出口SO2濃度;costWFGD為脫硫成本函數(shù),即f2(DV,MV, ),以元/(kW·h)衡量,如公式(14)所示:
其中循環(huán)泵的運(yùn)行成本Cpump和增壓風(fēng)機(jī)的運(yùn)行成本Cfan分別用公式(15)、(16)計(jì)算:
其中Ui,Ii,φi分別為第i個(gè)循環(huán)泵的電壓,電流和功率因子;Pelec是電價(jià);load為發(fā)電機(jī)功率;Npump為漿液循環(huán)泵開(kāi)啟臺(tái)數(shù);G為煙氣流量;ΔPtower為脫硫塔的壓降;ηfan為增壓風(fēng)機(jī)的效率。
在消耗石灰石的同時(shí),會(huì)生成石膏,其能帶來(lái)一定的經(jīng)濟(jì)回報(bào)。從石膏得來(lái)的收益可以用公式(18)表示:
由文獻(xiàn)[20]可知,離心式漿液循環(huán)泵始終在額定功率下運(yùn)行,這樣可簡(jiǎn)化循環(huán)泵運(yùn)行成本的計(jì)算。
對(duì)多目標(biāo)粒子群優(yōu)化算法來(lái)說(shuō),本文將種群規(guī)模設(shè)置為100,代數(shù)為100,選擇方法為輪盤賭方法。在一次次迭代中獲得非劣解集,選取優(yōu)化后參數(shù)值。
以上是數(shù)據(jù)驅(qū)動(dòng)的脫硫系統(tǒng)多目標(biāo)優(yōu)化模型,下面第 3 節(jié)對(duì)該模型的效果進(jìn)行比較分析和討論。
為驗(yàn)證動(dòng)態(tài)建模方法的有效性,本文使用SVR模型,對(duì)比其在靜態(tài)建模(即總時(shí)間步為1)和動(dòng)態(tài)建模(即總時(shí)間步為5)情況下各自數(shù)據(jù)集上的預(yù)測(cè)性能,結(jié)果如表8所示:
表8 支持向量回歸在靜態(tài)建模和動(dòng)態(tài)建模下預(yù)測(cè)性能對(duì)比
由表8可知,動(dòng)態(tài)建模情況下SVR模型的預(yù)測(cè)性能要優(yōu)于靜態(tài)建模,說(shuō)明考慮了系統(tǒng)遲滯性的動(dòng)態(tài)建模方法適用于對(duì)濕法煙氣脫硫系統(tǒng)建模。
為驗(yàn)證一階差分預(yù)測(cè)方法的有效性,本文使用隨機(jī)森林模型,對(duì)比其在結(jié)合一階差分預(yù)測(cè)和未結(jié)合一階差分預(yù)測(cè)情況下各自數(shù)據(jù)集上的預(yù)測(cè)性能,結(jié)果如表9、圖7、圖8所示:
表9 隨機(jī)森林在結(jié)合一階差分和未結(jié)合一階差分下預(yù)測(cè)性能對(duì)比
圖7 結(jié)合一階差分預(yù)測(cè)下隨機(jī)森林模型在驗(yàn)證集上預(yù)測(cè)性能
圖8 未結(jié)合一階差分預(yù)測(cè)下隨機(jī)森林模型在驗(yàn)證集上的預(yù)測(cè)性能
結(jié)合表9、圖7和圖8可知,結(jié)合一階差分預(yù)測(cè)情況下RF模型的預(yù)測(cè)性能要優(yōu)于未結(jié)合一階差分的情況,說(shuō)明一階差分預(yù)測(cè)方法減小了脫硫系統(tǒng)數(shù)據(jù)具有的自相關(guān)性對(duì)建模的影響。
為確定預(yù)測(cè)性能最佳的機(jī)器學(xué)習(xí)模型,本文對(duì)比五種機(jī)器學(xué)習(xí)模型在結(jié)合動(dòng)態(tài)建模和一階差分預(yù)測(cè)方法情況下各自數(shù)據(jù)集上的預(yù)測(cè)性能,各模型參數(shù)設(shè)置參照2.4節(jié),結(jié)果如表10所示。
表10 五種機(jī)器學(xué)習(xí)模型的預(yù)測(cè)性能對(duì)比
由表10可知,DNN和LSTM模型的預(yù)測(cè)性能要優(yōu)于其它三種模型,說(shuō)明這兩種模型能較好地對(duì)濕法煙氣脫硫系統(tǒng)中的非線性過(guò)程建模。考慮到LSTM模型更適用于時(shí)序數(shù)據(jù),且LSTM模型在驗(yàn)證數(shù)據(jù)上MSE與訓(xùn)練數(shù)據(jù)上MSE之差小于DNN模型,因此本文選取LSTM模型為最優(yōu)模型,其建模效果如圖9、圖10所示,相對(duì)誤差在6%以內(nèi)的數(shù)據(jù)占驗(yàn)證集總量的70%以上,值得說(shuō)明的是,在驗(yàn)證集上,濃度在0~10 mg/m3之間的數(shù)據(jù)量?jī)H為1,在其它濃度范圍內(nèi)相對(duì)誤差小于5%的數(shù)據(jù)占比超過(guò)了50%。
圖9 LSTM在驗(yàn)證集上的不同相對(duì)誤差范圍數(shù)據(jù)百分比
圖10 LSTM在驗(yàn)證集上的不同濃度范圍內(nèi)相對(duì)誤差小于5%數(shù)據(jù)百分比
在獲得最優(yōu)SO2排放預(yù)測(cè)模型后,本文利用多目標(biāo)粒子群優(yōu)化算法,對(duì)濕法脫硫系統(tǒng)的部分運(yùn)行參數(shù)進(jìn)行優(yōu)化,部分工況下優(yōu)化結(jié)果表11所示。由表11可知,發(fā)電機(jī)功率較低時(shí),脫硫成本一般較高。為降低脫硫成本,可嘗試減小循環(huán)泵開(kāi)啟臺(tái)數(shù)。為進(jìn)一步說(shuō)明各參數(shù)對(duì)濕法煙氣脫硫系統(tǒng)的影響,本文分析了在發(fā)電機(jī)功率為380.442 MW情況下分別改變四個(gè)參數(shù)時(shí)WFGD出口SO2預(yù)測(cè)值和脫硫成本的變化情況,結(jié)果見(jiàn)圖11―圖14,豎虛線表示該參數(shù)的初始值。
表11 部分工況下脫硫系統(tǒng)優(yōu)化前后效果對(duì)比
圖11 WFGD出口SO2預(yù)測(cè)值和脫硫成本隨#1FGD入口煙氣溫度1變化
圖12 WFGD出口SO2預(yù)測(cè)值和脫硫成本隨#1吸收塔修正液位1變化
圖13 WFGD出口SO2預(yù)測(cè)值和脫硫成本隨#1吸收塔漿液pH值變化
圖14 WFGD出口SO2預(yù)測(cè)值和脫硫成本隨泵臺(tái)數(shù)變化
由圖11―圖14可知,在給定工況下,濕法煙氣脫硫系統(tǒng)中#1吸收塔漿液pH值對(duì)脫硫過(guò)程影響較大,但并不是越大越好,實(shí)際運(yùn)行時(shí)通常控制漿液pH值在一個(gè)合理范圍內(nèi),一般認(rèn)為選擇在5.2~6.2為宜;從出口SO2濃度的視角看,另外三個(gè)參數(shù)的變化對(duì)其影響不大;但從脫硫成本的視角看,泵臺(tái)數(shù)的變化對(duì)其影響較大,泵臺(tái)數(shù)越多,脫硫成本越高,出口SO2濃度卻沒(méi)有明顯下降,另外三個(gè)參數(shù)對(duì)脫硫成本則影響較小。權(quán)衡出口SO2濃度和脫硫成本,#1FGD入口煙氣溫度1的選擇在98.281 ℃,#1吸收塔修正液位1選擇在9.667 m,#1吸收塔漿液pH值選擇為5.397,泵臺(tái)數(shù)選為2臺(tái),此時(shí)脫硫成本下降了18.44%,出口SO2濃度則由于#1吸收塔漿液pH值的提升有一定程度的下降。
綜上所述,本文提出的方法可以用來(lái)對(duì)濕法煙氣脫硫系統(tǒng)開(kāi)展優(yōu)化。
本文針對(duì)燃煤電廠濕法煙氣脫硫系統(tǒng)脫硫過(guò)程建模存在的模型準(zhǔn)確性不足的情況,采用數(shù)據(jù)驅(qū)動(dòng)建模方法,通過(guò)箱形圖對(duì)異常值進(jìn)行識(shí)別刪除,使用動(dòng)態(tài)建模和一階差分預(yù)測(cè)方法,用機(jī)器學(xué)習(xí)算法對(duì)濕法脫硫系統(tǒng)進(jìn)行建模,對(duì)下一采樣時(shí)間的脫硫系統(tǒng)出口二氧化硫濃度進(jìn)行了預(yù)測(cè),用決定系數(shù)和均方誤差判斷所建立模型的優(yōu)劣,并對(duì)比不同機(jī)器學(xué)習(xí)算法的預(yù)測(cè)效果,選出效果較好的模型;并進(jìn)一步基于數(shù)據(jù)驅(qū)動(dòng)的脫硫過(guò)程模型,根據(jù)多目標(biāo)粒子群優(yōu)化算法,得到優(yōu)化后的帕累托最優(yōu)解集,在脫硫成本和出口SO2濃度之間權(quán)衡,在最優(yōu)解集中選擇優(yōu)化的脫硫系統(tǒng)運(yùn)行參數(shù)值。主要有以下幾點(diǎn)結(jié)論:
1)由訓(xùn)練結(jié)果可以得出,動(dòng)態(tài)建模加一階差分預(yù)測(cè)的方法顯著優(yōu)于靜態(tài)建模方法,說(shuō)明動(dòng)態(tài)建模加一階差分預(yù)測(cè)的方法能較為準(zhǔn)確地表征復(fù)雜的脫硫過(guò)程。
2)通過(guò)對(duì)比不同機(jī)器學(xué)習(xí)算法的結(jié)果,得出LSTM神經(jīng)網(wǎng)絡(luò)的建模能力略優(yōu)于其它算法,說(shuō)明LSTM神經(jīng)網(wǎng)絡(luò)能更好地處理時(shí)間序列數(shù)據(jù)。
3)根據(jù)多目標(biāo)優(yōu)化結(jié)果,隨著脫硫成本的上升,出口SO2濃度逐漸下降;在實(shí)際運(yùn)行時(shí),運(yùn)行人員可以根據(jù)優(yōu)化結(jié)果,在脫硫成本和出口SO2濃度兩者之間權(quán)衡,實(shí)現(xiàn)經(jīng)濟(jì)穩(wěn)定運(yùn)行。