基于極端學(xué)習(xí)機(jī)的NOx預(yù)測(cè)模型樣本特性研究

2020-11-17 05:49:14申志文李慶偉

上海電力大學(xué)學(xué)報(bào) 2020年5期

申志文, 李慶偉

(上海電力大學(xué) 能源與機(jī)械工程學(xué)院, 上海 200090)

燃煤發(fā)電在我國(guó)乃至世界范圍內(nèi)仍然是一種重要的發(fā)電形式,而煤炭燃燒是NOx的主要來(lái)源之一[1-2]。為實(shí)現(xiàn)火力發(fā)電廠的超低排放,我國(guó)環(huán)保部門(mén)制定了嚴(yán)格的NOx排放標(biāo)準(zhǔn)[3]。燃燒優(yōu)化技術(shù)是一種簡(jiǎn)單、高效、廉價(jià)的燃煤電廠NOx減排技術(shù),精準(zhǔn)的NOx排放模型是燃燒優(yōu)化技術(shù)的基礎(chǔ)[4]。

鍋爐燃燒系統(tǒng)具有非線性和強(qiáng)耦合的性質(zhì),難以用機(jī)理建模的方法建立準(zhǔn)確的NOx排放預(yù)測(cè)模型。隨著人工智能的興起,許多學(xué)者開(kāi)始利用機(jī)器學(xué)習(xí)建立NOx排放預(yù)測(cè)模型,常用方法有人工神經(jīng)網(wǎng)絡(luò)[5-6]和支持向量機(jī)[7-8]。

HUANG G B等人[9]提出的極端學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種重要的NOx排放預(yù)測(cè)建模方法。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,ELM具有泛化性能好、學(xué)習(xí)速度快、精度高等優(yōu)點(diǎn)[10]。目前,針對(duì)輸入權(quán)值和隱藏層閾值優(yōu)化的研究較多,常用的優(yōu)化方法有風(fēng)驅(qū)動(dòng)算法[11]、混沌分組教與學(xué)優(yōu)化算法[12]、量子粒子群算法[13]。

朱志華等人[14]對(duì)非小細(xì)胞肺癌病人術(shù)后生存時(shí)間進(jìn)行了預(yù)測(cè)分析,訓(xùn)練樣本數(shù)目分別為110,130,150。范宇辰[15]針對(duì)一種Benchmark分類(lèi)問(wèn)題,利用仿真實(shí)驗(yàn)探討了訓(xùn)練樣本個(gè)數(shù)、隱藏層節(jié)點(diǎn)數(shù)、輸入層權(quán)值以及隱藏層節(jié)點(diǎn)偏置量4個(gè)重要參數(shù)對(duì)ELM分類(lèi)器性能的影響程度。為了解決分類(lèi)學(xué)習(xí)缺乏足夠的缺陷樣本的問(wèn)題,MA L Y等人[16]提出了高斯混合模型密度估計(jì)的ELM,以檢測(cè)鋰離子聚合物電池的電池片中的氣泡缺陷,能夠在不同的訓(xùn)練樣本數(shù)量下保持優(yōu)異的精度性能。

火電廠NOx排放預(yù)測(cè)建模屬于多維、強(qiáng)耦合的復(fù)雜問(wèn)題,目前尚未有ELM樣本特性分析的相關(guān)工作。本文在總樣本一定的前提下,研究了測(cè)試樣本數(shù)對(duì)NOx預(yù)測(cè)性能的影響,并尋找最佳的測(cè)試樣本數(shù)。

1 極端學(xué)習(xí)機(jī)

ELM通過(guò)隨機(jī)產(chǎn)生的輸入權(quán)值和隱藏層閾值,利用最小二乘法和M-P廣義逆矩陣求解輸出權(quán)值。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)示意

對(duì)ELM的描述如下。

k=1,2,3,…,N

(1)

b——隱藏層各節(jié)點(diǎn)的閾值矩陣,b=[b1,b2,…,bl]T。

式(1)可以簡(jiǎn)化為

Hβ=T

(2)

(3)

β=H+T

(4)

式中:H——隱藏層輸出矩陣;

β——輸出權(quán)值矩陣,β=[β1,β2,…,βl]T;

T——N×1維的目標(biāo)輸出據(jù)陣,T=[t1,t2,…,tN]T。

ELM的學(xué)習(xí)步驟可總結(jié)如下:首先,設(shè)置激活函數(shù)和隱藏層節(jié)點(diǎn)數(shù);其次,隨機(jī)生成輸入權(quán)值和隱藏層閾值;再次,利用式(3)計(jì)算隱藏層輸出矩陣H;最后,利用式(4)計(jì)算輸出權(quán)值矩陣。

2 基于ELM的NOx預(yù)測(cè)樣本特性研究

訓(xùn)練樣本數(shù)過(guò)多會(huì)影響預(yù)測(cè)模型的訓(xùn)練速度,數(shù)量過(guò)少則會(huì)影響預(yù)測(cè)模型的性能。本文基于ELM建立預(yù)測(cè)模型,研究在總樣本數(shù)目一定的條件下,測(cè)試樣本數(shù)目對(duì)預(yù)測(cè)性能的影響。選擇測(cè)試集均方根誤差(Root Mean Squared Error,RMSE),即預(yù)測(cè)樣本RMSE作為性能指標(biāo),公式為

(5)

預(yù)測(cè)樣本的特性研究具體步驟如下:

(1) 設(shè)置隱藏層節(jié)點(diǎn)數(shù)和激活函數(shù)類(lèi)型等神經(jīng)網(wǎng)絡(luò)參數(shù);

(2) 根據(jù)不同測(cè)試樣本數(shù)劃分訓(xùn)練集和測(cè)試集;

(3) 利用訓(xùn)練集訓(xùn)練ELM模型;

(4) 利用訓(xùn)練好的ELM模型對(duì)訓(xùn)練集和測(cè)試集樣本進(jìn)行預(yù)測(cè);

(5) 計(jì)算訓(xùn)練集和測(cè)試集樣本的RMSE;

(6) 返回步驟3,直到實(shí)驗(yàn)次數(shù)達(dá)到31次;

(7) 計(jì)算當(dāng)前測(cè)試集樣本數(shù)下測(cè)試樣本中位數(shù)RMSE;

(8) 返回步驟2,直到測(cè)試樣本數(shù)達(dá)到最大值;

(9) 根據(jù)不同測(cè)試集樣本數(shù)下測(cè)試樣本中位數(shù)RMSE,選出最優(yōu)測(cè)試樣本數(shù)。

上述研究方法的流程如圖2所示。

圖2 基于ELM的預(yù)測(cè)樣本特性研究流程

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)與參數(shù)設(shè)置

采用文獻(xiàn)[17]中的數(shù)據(jù),對(duì)330 MW電站鍋爐進(jìn)行實(shí)驗(yàn)。選取負(fù)荷、給煤機(jī)轉(zhuǎn)速、一次風(fēng)速、二次風(fēng)速、排煙氧量、燃盡風(fēng)擋板開(kāi)度和煤質(zhì)等26個(gè)參數(shù)進(jìn)行變工況實(shí)驗(yàn),工況1～工況3、工況4、工況5～工況6,工況7～工況14和工況15～工況20分別燃用不同的煤種。

ELM的隱藏層激活函數(shù)為sig函數(shù),隱藏層節(jié)點(diǎn)的數(shù)量設(shè)置為30,分別選取不同數(shù)目的測(cè)試樣本重復(fù)實(shí)驗(yàn)31次。

3.2 結(jié)果與分析

測(cè)試樣本中位數(shù)RMSE隨樣本個(gè)數(shù)的變化趨勢(shì)如圖3所示。由圖3可以看出,隨著測(cè)試樣本數(shù)的增加,測(cè)試樣本中位數(shù)RMSE整體呈現(xiàn)增長(zhǎng)的趨勢(shì),當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),測(cè)試樣本中位數(shù)RMSE最小,此時(shí),訓(xùn)練樣本數(shù)為18個(gè)。

圖3 測(cè)試樣本中位數(shù)RMSE隨樣本數(shù)的變化趨勢(shì)

為進(jìn)一步研究樣本數(shù)目對(duì)預(yù)測(cè)性能的影響,對(duì)31次預(yù)測(cè)樣本RMSE進(jìn)行觀察。預(yù)測(cè)樣本RMSE隨測(cè)試樣本數(shù)目變化趨勢(shì)如圖4所示。對(duì)于訓(xùn)練集,測(cè)試樣本數(shù)目的影響較小,均能達(dá)到較好的預(yù)測(cè)效果;而對(duì)于測(cè)試集,隨著測(cè)試樣本數(shù)的增加,訓(xùn)練樣本數(shù)減少,RMSE呈明顯增大的趨勢(shì)。當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),預(yù)測(cè)樣本RMSE整體較小,且波動(dòng)范圍相對(duì)較小。

圖4 31次實(shí)驗(yàn)預(yù)測(cè)樣本RMSE隨測(cè)試樣本數(shù)的變化趨勢(shì)

當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),對(duì)訓(xùn)練樣本和測(cè)試樣本進(jìn)行預(yù)測(cè),其預(yù)測(cè)絕對(duì)誤差結(jié)果如圖5所示。其中,樣本編號(hào)1和2的樣本為測(cè)試樣本。由圖5可以看出,模型在訓(xùn)練樣本上的預(yù)測(cè)性能較好,在測(cè)試樣本上的誤差也較為理想,但泛化性能還存在進(jìn)一步提升的空間。

圖5 測(cè)試樣本數(shù)為2個(gè)的31次實(shí)驗(yàn)預(yù)測(cè)絕對(duì)誤差分布

4 結(jié) 語(yǔ)

電廠鍋爐燃燒優(yōu)化的關(guān)鍵是建立準(zhǔn)確的預(yù)測(cè)模型。本文建立了基于ELM的NOx排放預(yù)測(cè)模型,并研究了不同測(cè)試樣本數(shù)對(duì)該模型性能的影響。實(shí)驗(yàn)結(jié)果表明,隨著測(cè)試樣本數(shù)的增加,測(cè)試樣本中位數(shù)RMSE整體呈現(xiàn)增長(zhǎng)的趨勢(shì)。當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),預(yù)測(cè)的測(cè)試樣本中位數(shù)RMSE最佳,預(yù)測(cè)樣本RMSE整體較小,且波動(dòng)范圍相對(duì)較小,但模型的泛化性能還存在進(jìn)一步提升的空間。