俎魏鋒
(廣東大唐國際雷州發(fā)電有限責任公司,廣東 湛江 524255)
煙氣含氧量是評價燃煤電廠的一個重要指標。煙氣含氧量過高表明總風量過大,進而導致排煙熱損失增加,鍋爐效率降低;煙氣含氧量過低則表明爐內(nèi)空氣量不充分,煤粉燃燒可能處于缺氧狀態(tài),進而增加CO含量,導致水冷壁高腐蝕。煙氣含氧量涉及多種影響因素,包括負荷、總風量、一次風溫度以及二次風溫度等因素。鍋爐的大遲滯特性會在操作條件發(fā)生變化時導致煙氣含氧量不能及時發(fā)生變化。除此之外,傳統(tǒng)煙氣含氧量測量工具包括氧化鋯煙氣傳感器和磁式氧氣傳感器等,這些傳感器成本較高,且測量環(huán)境灰含量較高,容易造成測量原件的腐蝕,導致測量不準確。
為實現(xiàn)煙氣含氧量的準確、及時測量,已有研究人員利用鍋爐歷史數(shù)據(jù),使用最小二乘支持向量機模型、人工神經(jīng)網(wǎng)絡和支持向量機建立了煙氣含氧量預測模型,并且有較高的預測精度。高斯過程回歸同樣是一種數(shù)據(jù)驅動的機器學習回歸模型,以往研究表明具有良好的預測能力。該文利用歷史運行數(shù)據(jù),對1000 MW超超臨界雙切圓煤粉鍋爐建立高斯過程回歸煙氣含氧量預測模型。
高斯過程回歸是使用高斯過程對輸入?yún)?shù)進行先驗回歸分析的預測模型。相較于其他回歸模型,高斯過程回歸嚴格依照概率統(tǒng)計理論,可對預測值輸出置信區(qū)間。當樣本數(shù)量較少時,高斯過程回歸相比于其他預測模型有更好的預測精度,高斯過程回歸模型的解釋性更好,而且整體模型較為簡單。高斯過程可由均值函數(shù)()和協(xié)方差函數(shù)(,')共同來定義,如公式(1)所示。
式中:()為高斯過程潛在函數(shù);()為均值函數(shù);(,')為協(xié)方差函數(shù)。
設觀測值為,則觀測值和潛在函數(shù)()之間的關系如公式(2)所示。
式中:為噪聲,且滿足如公式(3)所示的正態(tài)分布。
式中:為方差。
()滿足如公式(4)所示的聯(lián)合高斯分布。
一般情況取均值為0,∑為的協(xié)方差函數(shù)。因此觀測值的先驗分布如公式(5)所示。
式中:為單位矩陣。
輸出和預測輸出的聯(lián)合分布,服從如公式(6)所示的高斯分布。
式中:(,)為輸入樣本x的×協(xié)方差矩陣;(,)=(x,)為輸入值和新輸入值之間的×1階協(xié)方差矩陣。
預測值的均值如公式(7)所示。
預測值的方差為公式(8)所示。
使用過濾方法進行數(shù)據(jù)特征選擇,確定訓練樣本的輸入向量個數(shù),建立預測模型的訓練樣本(,)。進行數(shù)據(jù)清洗,刪除或修補數(shù)據(jù)集中的空值,使數(shù)據(jù)集完整。然后進行數(shù)據(jù)標準化處理。當數(shù)據(jù)數(shù)量級相差較大時或離散性較大時,需要對輸入、輸出數(shù)據(jù)進行標準化處理:各訓練樣本的輸入值除以所有樣本在各維度上的標準差;對輸出進行標準化處理,推薦的標準化方法是對各樣本輸出減去所有樣本輸出的平均值。高斯過程回歸核函數(shù)主要包括平方指數(shù)核函數(shù)、有理二次核函數(shù)和matern核等,因為平方指數(shù)核函數(shù)可應用于絕大多數(shù)場景,并且無限可微,所以可以無限次求導并始終連續(xù),該研究采用平方指數(shù)核函數(shù)。數(shù)據(jù)選取并預處理。根據(jù)機組常用負荷,選取穩(wěn)定負荷區(qū)間運行數(shù)據(jù)。對數(shù)據(jù)各參數(shù)進行相關性分析,根據(jù)氧量的相關性系數(shù),選取元素作為輸入?yún)?shù),氧量作為輸出標簽參數(shù),并使用程序語言框架對訓練樣本進行訓練。對基于高斯回歸模型的訓練的數(shù)據(jù)進行預測并得出結果,進一步驗證所建立模型的精度情況,并對所建預測模型的魯棒性進行檢驗。
該文的研究對象為某1000 MW二次再熱鍋爐超超臨界鍋爐,采用雙切圓燃燒方式。二次再熱、平衡通風、露天布置、固態(tài)排渣、全鋼構架以及全懸吊結構Π型鍋爐。鍋爐中速末正壓直吹式制粉系統(tǒng),配備6臺磨煤機,主燃燒器布置在水冷壁前后墻上,每層8只燃燒器對應一臺磨煤機。
鍋爐常規(guī)運行工況負荷在450 MW以上,試驗數(shù)據(jù)選取負荷為450 MW~1000 MW。同時因鍋爐變負荷工況鍋爐調(diào)節(jié)存在滯后性,氧量波動較大,該研究以鍋爐穩(wěn)態(tài)工況作為研究對象。鍋爐穩(wěn)態(tài)判斷依據(jù)為機組負荷最大允許波動范圍±1.0%;鍋爐蒸發(fā)量最大允許范圍±1.0%,鍋爐主蒸汽壓力最大允許波動范圍±1.0%。
由于鍋爐燃燒過程是一個強耦合過程,煙氣含氧量涉及多種因素,包括負荷、配風方式、配煤方式和配風溫度等,因此要選擇和煙氣含氧量相關程度最大的變量作為模型的輸入變量。
為降低運算復雜程度,對變量進行相關性分析。相關系數(shù)是能反應變量之間相關性的重要指標。該文采用皮爾遜(pearson)相關性系數(shù)檢驗系數(shù)相關性。皮爾遜相關性系數(shù)又稱皮爾遜積矩相關性系數(shù),表示2個變量和的相關性。相關性系數(shù)的取值為[-1,1]。其計算公式如公式(9)所示。
式中:cov(,)為和的協(xié)方差;var[]為的方差;var[]為的方差。
部分相關性系數(shù)計算結果見表1。
表1 煙氣含氧量相關性系數(shù)
根據(jù)相關性系數(shù),該文選擇煙氣再循環(huán)風量、一次風風量、一次風溫度、二次風風量、二次風溫度、總煤量和機組負荷作為高斯過程回歸的輸入?yún)?shù),煙氣含氧量作為輸出參數(shù),建立的高斯過程回歸模型如圖1所示。
圖1 高斯過程回歸模型
部分機組參數(shù)見表2。從302組樣本中隨機選擇272組作為訓練集,30組組為測試集。利用R2評估預測的準確性。由于不同輸入?yún)?shù)的量綱差異較大,因此對輸入?yún)?shù)進行歸一化處理,歸一化公式如公式(10)所示。
表2 部分樣本參數(shù)
式中:x為第組元素值;為該元素最大值;為該元素最小值。
以1 min為間隔選取302組歷史數(shù)據(jù),劃分為訓練集和測試集,訓練集完成對高斯過程回歸模型的創(chuàng)建,測試集對模型進行驗證。
利用建立好的高斯過程回歸模型,對測試集的30組結果進行預測。驗證建立的模型的精度,測試集預測結果如圖2所示,預測的相對誤差如圖3所示。
測試集的機組負荷變化為450.5 MW~990.2 MW,煙氣含氧量在3%到7%之間變化。從圖2、圖3可以看出,盡管煙氣含氧量變化范圍較大,建立的高斯過程回歸模型內(nèi)能夠對煙氣含氧量進行較為準確的預測,大部分樣本的訓練誤差都在3%以內(nèi),且圍繞0均勻分布。最大的預測誤差對應于11號測試集樣本,最大誤差為3.74%。訓練集的R2為0.977012。
圖2 測試集預測結果
圖3 測試集相對誤差
建立的高斯過程回歸模型涉及較多的輸入變量,而且爐內(nèi)燃燒較為劇烈,在鍋爐實際運行過程中很有可能測量某個變量的傳感器發(fā)生故障導致測量結果不準確,尤其一次風量、二次風量和煙氣再循環(huán)風量等參數(shù)時常波動,容易導致煙氣含氧量預測值出現(xiàn)偏差。為了避免這種情況發(fā)生,建立的高斯過程回歸模型需有良好的魯棒性,即在部分輸入變量發(fā)生微小波動時,預測的煙氣含氧量仍有較高的預測精度。對建立的預測模型的魯棒性進行檢驗,對測試集每個樣本的22個變量中的任意11個變量施加1%到10%的隨機擾動,驗證增加了隨機擾動后的預測精度。結果如圖4和圖5所示。
從圖4、圖5可以看出,對輸入變量增加隨機擾動后,煙氣含氧量預測的相對誤差相比未施加擾動時有所增加,預測的相對誤差的最大值6.69%,證明增加擾動會對高斯過程回歸煙氣含氧量預測精度產(chǎn)生一定的影響。盡管如此,預測相對誤差的絕對值的平均值為3.70%,仍然有較高的預測精度。且對22個輸入變量中的11個變量施加了擾動,在電場實際運行中出現(xiàn)大量傳感器測量誤差較高情況的概率很小,因此可以證明建立的高斯過程回歸模型的魯棒性較好。
圖4 增加擾動后測試集預測結果
圖5 增加擾動后測試集相對誤差
針對燃煤電廠煙氣含氧量測量成本高且難以測量準確的問題,該文建立了高斯過程回歸模型,以煙氣再循環(huán)風量、一次風風量、一次風溫度、二次風風量、二次風溫度、總煤量和機組負荷作為模型的輸入,煙氣含氧量作為模型的輸出。對測試樣本的準確性進行了驗證,結果表明建立的模型預測精度較高。然后對模型的3魯棒性進行研究,對部分輸入?yún)?shù)施加隨機擾動,評估增加擾動后預測的準確性,結果表明預測誤差有一定增大,但準確性仍然較高。建立的預測模型可以為現(xiàn)場工作人員提供有效的參考,并需要與現(xiàn)場煙氣含氧量測量結果進行對比,及時判斷現(xiàn)場傳感器是否發(fā)生故障。