申志文, 李慶偉
(上海電力大學(xué) 能源與機(jī)械工程學(xué)院, 上海 200090)
燃煤發(fā)電在我國(guó)乃至世界范圍內(nèi)仍然是一種重要的發(fā)電形式,而煤炭燃燒是NOx的主要來(lái)源之一[1-2]。為實(shí)現(xiàn)火力發(fā)電廠的超低排放,我國(guó)環(huán)保部門(mén)制定了嚴(yán)格的NOx排放標(biāo)準(zhǔn)[3]。燃燒優(yōu)化技術(shù)是一種簡(jiǎn)單、高效、廉價(jià)的燃煤電廠NOx減排技術(shù),精準(zhǔn)的NOx排放模型是燃燒優(yōu)化技術(shù)的基礎(chǔ)[4]。
鍋爐燃燒系統(tǒng)具有非線性和強(qiáng)耦合的性質(zhì),難以用機(jī)理建模的方法建立準(zhǔn)確的NOx排放預(yù)測(cè)模型。隨著人工智能的興起,許多學(xué)者開(kāi)始利用機(jī)器學(xué)習(xí)建立NOx排放預(yù)測(cè)模型,常用方法有人工神經(jīng)網(wǎng)絡(luò)[5-6]和支持向量機(jī)[7-8]。
HUANG G B等人[9]提出的極端學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種重要的NOx排放預(yù)測(cè)建模方法。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,ELM具有泛化性能好、學(xué)習(xí)速度快、精度高等優(yōu)點(diǎn)[10]。目前,針對(duì)輸入權(quán)值和隱藏層閾值優(yōu)化的研究較多,常用的優(yōu)化方法有風(fēng)驅(qū)動(dòng)算法[11]、混沌分組教與學(xué)優(yōu)化算法[12]、量子粒子群算法[13]。
朱志華等人[14]對(duì)非小細(xì)胞肺癌病人術(shù)后生存時(shí)間進(jìn)行了預(yù)測(cè)分析,訓(xùn)練樣本數(shù)目分別為110,130,150。范宇辰[15]針對(duì)一種Benchmark分類(lèi)問(wèn)題,利用仿真實(shí)驗(yàn)探討了訓(xùn)練樣本個(gè)數(shù)、隱藏層節(jié)點(diǎn)數(shù)、輸入層權(quán)值以及隱藏層節(jié)點(diǎn)偏置量4個(gè)重要參數(shù)對(duì)ELM分類(lèi)器性能的影響程度。為了解決分類(lèi)學(xué)習(xí)缺乏足夠的缺陷樣本的問(wèn)題,MA L Y等人[16]提出了高斯混合模型密度估計(jì)的ELM,以檢測(cè)鋰離子聚合物電池的電池片中的氣泡缺陷,能夠在不同的訓(xùn)練樣本數(shù)量下保持優(yōu)異的精度性能。
火電廠NOx排放預(yù)測(cè)建模屬于多維、強(qiáng)耦合的復(fù)雜問(wèn)題,目前尚未有ELM樣本特性分析的相關(guān)工作。本文在總樣本一定的前提下,研究了測(cè)試樣本數(shù)對(duì)NOx預(yù)測(cè)性能的影響,并尋找最佳的測(cè)試樣本數(shù)。
ELM通過(guò)隨機(jī)產(chǎn)生的輸入權(quán)值和隱藏層閾值,利用最小二乘法和M-P廣義逆矩陣求解輸出權(quán)值。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)示意
對(duì)ELM的描述如下。
k=1,2,3,…,N
(1)
b——隱藏層各節(jié)點(diǎn)的閾值矩陣,b=[b1,b2,…,bl]T。
式(1)可以簡(jiǎn)化為
Hβ=T
(2)
(3)
β=H+T
(4)
式中:H——隱藏層輸出矩陣;
β——輸出權(quán)值矩陣,β=[β1,β2,…,βl]T;
T——N×1維的目標(biāo)輸出據(jù)陣,T=[t1,t2,…,tN]T。
ELM的學(xué)習(xí)步驟可總結(jié)如下:首先,設(shè)置激活函數(shù)和隱藏層節(jié)點(diǎn)數(shù);其次,隨機(jī)生成輸入權(quán)值和隱藏層閾值;再次,利用式(3)計(jì)算隱藏層輸出矩陣H;最后,利用式(4)計(jì)算輸出權(quán)值矩陣。
訓(xùn)練樣本數(shù)過(guò)多會(huì)影響預(yù)測(cè)模型的訓(xùn)練速度,數(shù)量過(guò)少則會(huì)影響預(yù)測(cè)模型的性能。本文基于ELM建立預(yù)測(cè)模型,研究在總樣本數(shù)目一定的條件下,測(cè)試樣本數(shù)目對(duì)預(yù)測(cè)性能的影響。選擇測(cè)試集均方根誤差(Root Mean Squared Error,RMSE),即預(yù)測(cè)樣本RMSE作為性能指標(biāo),公式為
(5)
預(yù)測(cè)樣本的特性研究具體步驟如下:
(1) 設(shè)置隱藏層節(jié)點(diǎn)數(shù)和激活函數(shù)類(lèi)型等神經(jīng)網(wǎng)絡(luò)參數(shù);
(2) 根據(jù)不同測(cè)試樣本數(shù)劃分訓(xùn)練集和測(cè)試集;
(3) 利用訓(xùn)練集訓(xùn)練ELM模型;
(4) 利用訓(xùn)練好的ELM模型對(duì)訓(xùn)練集和測(cè)試集樣本進(jìn)行預(yù)測(cè);
(5) 計(jì)算訓(xùn)練集和測(cè)試集樣本的RMSE;
(6) 返回步驟3,直到實(shí)驗(yàn)次數(shù)達(dá)到31次;
(7) 計(jì)算當(dāng)前測(cè)試集樣本數(shù)下測(cè)試樣本中位數(shù)RMSE;
(8) 返回步驟2,直到測(cè)試樣本數(shù)達(dá)到最大值;
(9) 根據(jù)不同測(cè)試集樣本數(shù)下測(cè)試樣本中位數(shù)RMSE,選出最優(yōu)測(cè)試樣本數(shù)。
上述研究方法的流程如圖2所示。
圖2 基于ELM的預(yù)測(cè)樣本特性研究流程
采用文獻(xiàn)[17]中的數(shù)據(jù),對(duì)330 MW電站鍋爐進(jìn)行實(shí)驗(yàn)。選取負(fù)荷、給煤機(jī)轉(zhuǎn)速、一次風(fēng)速、二次風(fēng)速、排煙氧量、燃盡風(fēng)擋板開(kāi)度和煤質(zhì)等26個(gè)參數(shù)進(jìn)行變工況實(shí)驗(yàn),工況1~工況3、工況4、工況5~工況6,工況7~工況14和工況15~工況20分別燃用不同的煤種。
ELM的隱藏層激活函數(shù)為sig函數(shù),隱藏層節(jié)點(diǎn)的數(shù)量設(shè)置為30,分別選取不同數(shù)目的測(cè)試樣本重復(fù)實(shí)驗(yàn)31次。
測(cè)試樣本中位數(shù)RMSE隨樣本個(gè)數(shù)的變化趨勢(shì)如圖3所示。由圖3可以看出,隨著測(cè)試樣本數(shù)的增加,測(cè)試樣本中位數(shù)RMSE整體呈現(xiàn)增長(zhǎng)的趨勢(shì),當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),測(cè)試樣本中位數(shù)RMSE最小,此時(shí),訓(xùn)練樣本數(shù)為18個(gè)。
圖3 測(cè)試樣本中位數(shù)RMSE隨樣本數(shù)的變化趨勢(shì)
為進(jìn)一步研究樣本數(shù)目對(duì)預(yù)測(cè)性能的影響,對(duì)31次預(yù)測(cè)樣本RMSE進(jìn)行觀察。預(yù)測(cè)樣本RMSE隨測(cè)試樣本數(shù)目變化趨勢(shì)如圖4所示。對(duì)于訓(xùn)練集,測(cè)試樣本數(shù)目的影響較小,均能達(dá)到較好的預(yù)測(cè)效果;而對(duì)于測(cè)試集,隨著測(cè)試樣本數(shù)的增加,訓(xùn)練樣本數(shù)減少,RMSE呈明顯增大的趨勢(shì)。當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),預(yù)測(cè)樣本RMSE整體較小,且波動(dòng)范圍相對(duì)較小。
圖4 31次實(shí)驗(yàn)預(yù)測(cè)樣本RMSE隨測(cè)試樣本數(shù)的變化趨勢(shì)
當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),對(duì)訓(xùn)練樣本和測(cè)試樣本進(jìn)行預(yù)測(cè),其預(yù)測(cè)絕對(duì)誤差結(jié)果如圖5所示。其中,樣本編號(hào)1和2的樣本為測(cè)試樣本。由圖5可以看出,模型在訓(xùn)練樣本上的預(yù)測(cè)性能較好,在測(cè)試樣本上的誤差也較為理想,但泛化性能還存在進(jìn)一步提升的空間。
圖5 測(cè)試樣本數(shù)為2個(gè)的31次實(shí)驗(yàn)預(yù)測(cè)絕對(duì)誤差分布
電廠鍋爐燃燒優(yōu)化的關(guān)鍵是建立準(zhǔn)確的預(yù)測(cè)模型。本文建立了基于ELM的NOx排放預(yù)測(cè)模型,并研究了不同測(cè)試樣本數(shù)對(duì)該模型性能的影響。實(shí)驗(yàn)結(jié)果表明,隨著測(cè)試樣本數(shù)的增加,測(cè)試樣本中位數(shù)RMSE整體呈現(xiàn)增長(zhǎng)的趨勢(shì)。當(dāng)測(cè)試樣本數(shù)為2個(gè)時(shí),預(yù)測(cè)的測(cè)試樣本中位數(shù)RMSE最佳,預(yù)測(cè)樣本RMSE整體較小,且波動(dòng)范圍相對(duì)較小,但模型的泛化性能還存在進(jìn)一步提升的空間。