王 仲,顧煜炯,韓旭東,朱俊杰,黃元平
(1.華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院,北京 102206;2.廣東粵電中山熱電廠有限公司,廣東 中山 528445)
燃?xì)廨啓C(jī)因其啟停靈活、污染物排放水平低等優(yōu)勢,近年來在我國得到飛速發(fā)展,裝機(jī)容量有了顯著提升[1]。目前,為了保證燃?xì)廨啓C(jī)運(yùn)行的安全性,常參照制造廠商給出的等效運(yùn)行小時(shí)數(shù)安排維修計(jì)劃。這種維修方式?jīng)]有考慮機(jī)組的實(shí)際運(yùn)行狀態(tài),設(shè)備既有可能提早發(fā)生故障,也有可能在運(yùn)行狀態(tài)良好的情況下維修部件,增加了電廠的運(yùn)維成本[2]。因此,燃?xì)廨啓C(jī)運(yùn)行調(diào)整與維修決策方案的制定依據(jù)機(jī)組的實(shí)際運(yùn)行狀態(tài),其中的關(guān)鍵在于機(jī)組基準(zhǔn)值的確定。
傳統(tǒng)的基準(zhǔn)值確定方法一般有兩種:一種是以設(shè)計(jì)值作為基準(zhǔn)值,另一種是以最近一次的性能試驗(yàn)值作為基準(zhǔn)值。這兩種方法普遍存在的問題是燃?xì)廨啓C(jī)在設(shè)計(jì)與性能試驗(yàn)時(shí)的工況與實(shí)際工況存在一定的偏差[3]。隨著信息技術(shù)、數(shù)據(jù)庫技術(shù)和先進(jìn)測量技術(shù)的飛速發(fā)展,工業(yè)過程積累了海量的運(yùn)行數(shù)據(jù)。近年來,國內(nèi)外不少學(xué)者嘗試用數(shù)據(jù)驅(qū)動(dòng)方法進(jìn)行發(fā)電機(jī)組能耗分析與運(yùn)行優(yōu)化研究。趙歡等利用模糊C均值聚類方法確定典型負(fù)荷鄰域區(qū)間內(nèi)火電機(jī)組特征參數(shù)的基準(zhǔn)值[4]。Andrew Kusiak等利用聚類算法解決了火電機(jī)組歷史運(yùn)行狀態(tài)模式分類問題,建立了不同工況下參數(shù)之間的關(guān)系[5]。其直接從歷史數(shù)據(jù)中獲取信息,避免了復(fù)雜數(shù)學(xué)模型的建立,并且能夠全面、真實(shí)地反映機(jī)組的實(shí)際運(yùn)行水平。然而,由于燃?xì)廨啓C(jī)參與調(diào)峰運(yùn)行,所以其工況復(fù)雜多變,運(yùn)行數(shù)據(jù)的模式多樣?,F(xiàn)有的文獻(xiàn)在進(jìn)行數(shù)據(jù)挖掘前,沒有考慮燃?xì)廨啓C(jī)數(shù)據(jù)的特點(diǎn)。
針對(duì)燃?xì)廨啓C(jī)多工況下基準(zhǔn)值確定的問題,本文提出了一套基于數(shù)據(jù)驅(qū)動(dòng)確定全工況下燃?xì)廨啓C(jī)基準(zhǔn)值模型的方法。首先,對(duì)歷史數(shù)據(jù)樣本進(jìn)行穩(wěn)態(tài)篩選;其次,根據(jù)邊界條件對(duì)燃?xì)廨啓C(jī)進(jìn)行工況劃分,確定典型工況下參數(shù)的基準(zhǔn)值;最后,選用某實(shí)際燃?xì)廨啓C(jī)的實(shí)際運(yùn)行數(shù)據(jù),驗(yàn)證模型的有效性。
燃?xì)廨啓C(jī)的歷史運(yùn)行數(shù)據(jù)反映了真實(shí)的運(yùn)行狀態(tài)。燃?xì)廨啓C(jī)在實(shí)際運(yùn)行過程中工況多樣,涉及穩(wěn)定狀態(tài)與非穩(wěn)定狀態(tài)、不同邊界條件下的運(yùn)行狀態(tài)以及自身健康狀態(tài)的好壞差異等。因此,在通過歷史數(shù)據(jù)挖掘燃?xì)廨啓C(jī)基準(zhǔn)值之前,需要對(duì)數(shù)據(jù)進(jìn)行有序的梳理。首先,以功率為特征變量,利用區(qū)間估計(jì)的方法,篩選歷史運(yùn)行數(shù)據(jù)中的穩(wěn)態(tài)工況;然后,以功率、環(huán)境變量為特征邊界條件,利用K-均值聚類算法,劃分穩(wěn)態(tài)工況;最后,在此基礎(chǔ)上,對(duì)每個(gè)工況下變量的樣本建立多元高斯混合模型,以熱耗率最低為目標(biāo)選擇該工況下的基準(zhǔn)值。
基于數(shù)據(jù)驅(qū)動(dòng)的燃?xì)廨啓C(jī)基準(zhǔn)值模型如圖1所示。
圖1 基于數(shù)據(jù)驅(qū)動(dòng)的燃?xì)廨啓C(jī)基準(zhǔn)值模型
為了滿足電網(wǎng)負(fù)荷調(diào)度的需求,燃?xì)廨啓C(jī)快速地調(diào)整燃料供給與其他運(yùn)行參數(shù)。在此過程中,產(chǎn)生了非穩(wěn)態(tài)工況。燃?xì)廨啓C(jī)參數(shù)的測量值可以視為真實(shí)值和噪聲值的疊加。當(dāng)燃?xì)廨啓C(jī)處于穩(wěn)態(tài)工況下,參數(shù)的真實(shí)值保持不變。測量值的變化主要是由隨機(jī)誤差引起的。當(dāng)燃?xì)廨啓C(jī)處于非穩(wěn)態(tài)工況下,參數(shù)的真實(shí)值發(fā)生急劇變化,甚至在短時(shí)間內(nèi)產(chǎn)生很大偏移量。機(jī)組的非穩(wěn)態(tài)工況直觀地反映在輸出功率的變化上,輸出功率隨時(shí)間呈單調(diào)遞增或遞減的特點(diǎn)[6]。因此,選用輸出功率作為穩(wěn)態(tài)判別的特征變量,其表達(dá)式為:
(1)
式中:pt為t時(shí)刻功率的測量值;μ為功率的真實(shí)值;m為功率的變化速率;ε為功率的隨機(jī)誤差,服從正態(tài)分布。
由式(1)可以看出,穩(wěn)態(tài)與非穩(wěn)態(tài)工況的區(qū)別在于功率變化速率是否等于0。為了便于對(duì)m值大小進(jìn)行估計(jì),計(jì)算相鄰兩個(gè)時(shí)刻功率的差值Δp,如式(2)所示。
Δp=pt-pt-1=m+(εt-εt-1)
(2)
因?yàn)殡S機(jī)誤差ε服從正態(tài)分布,因此統(tǒng)計(jì)量Δp的期望等于m。根據(jù)時(shí)間序列的性質(zhì),m可以用時(shí)間窗口內(nèi)樣本統(tǒng)計(jì)量的均值估計(jì),如式(3)所示。
(3)
式中:h為采樣時(shí)間窗口內(nèi)的樣本數(shù)目。
為了保證估計(jì)的可靠性,采用區(qū)間估計(jì)的方法,確定樣本功率差值的期望值m。如果估計(jì)的區(qū)間范圍包括0,則認(rèn)為機(jī)組有很大可能在該時(shí)間段內(nèi)處于穩(wěn)態(tài)工況;否則,認(rèn)為機(jī)組處于非穩(wěn)態(tài)工況。
燃?xì)廨啓C(jī)運(yùn)行參數(shù)變化的原因可以歸結(jié)為兩類:一是運(yùn)維可控類,包括運(yùn)行調(diào)整不當(dāng)、可維護(hù)類故障以及傳感器故障;二是不可控制類,包括邊界條件變化等。在確定參數(shù)基準(zhǔn)值之前,需要對(duì)歷史數(shù)據(jù)進(jìn)行工況劃分,隔離邊界條件變化對(duì)參數(shù)的干擾。對(duì)于發(fā)電用燃?xì)廨啓C(jī)而言,機(jī)組的輸出功率由電網(wǎng)控制。因此,選用大氣溫度、大氣壓力、大氣濕度、燃機(jī)功率4個(gè)變量作為邊界條件,對(duì)穩(wěn)態(tài)篩選后的歷史數(shù)據(jù)進(jìn)行工況劃分。
聚類算法本身不需要建立復(fù)雜的函數(shù)模型,依據(jù)相似性對(duì)數(shù)據(jù)分類。作為聚類算法的典型代表,K-均值算法具有高效、快速的特點(diǎn),被廣泛應(yīng)用于大規(guī)模數(shù)據(jù)進(jìn)行聚類[7]。K-均值算法的基本原理是:首先,從數(shù)據(jù)樣本中隨機(jī)選取K個(gè)點(diǎn)作為初始的聚類中心;其次,計(jì)算并比較其他數(shù)據(jù)點(diǎn)到K個(gè)聚類中心點(diǎn)的距離,并對(duì)距離大小進(jìn)行排序,將樣本點(diǎn)劃分到距離最近的聚類中心所在簇;待所有點(diǎn)分類結(jié)束后,重新計(jì)算每簇樣本數(shù)據(jù)的平均值,將其作為新的聚類中心。不斷重復(fù)上述過程,直至準(zhǔn)則函數(shù)收斂,如式(4)所示。
(4)
式中:E為所有樣本點(diǎn)的平方誤差的總和;xj為第i類的第j個(gè)樣本點(diǎn);mi為第i個(gè)聚類子集的聚類中心。
K-均值聚類算法的聚類效果依賴于聚類數(shù)的選擇。聚類數(shù)目過少,樣本的特征不能夠全面表征;聚類數(shù)目過多,又會(huì)將異常噪聲數(shù)據(jù)當(dāng)作正常類別進(jìn)行處理,從而導(dǎo)致誤分類。因此,采用silhouette準(zhǔn)則確定K-均值聚類算法的最佳聚類數(shù),將樣本點(diǎn)silhouette準(zhǔn)則系數(shù)平均值最大時(shí)所對(duì)應(yīng)的K值作為最佳聚類數(shù)[8]。
多元高斯混合模型(multivariate Gaussian mixture model,MGMM)是一種半?yún)?shù)的概率密度估計(jì)方法。它融合了參數(shù)估計(jì)法與非參數(shù)估計(jì)法的優(yōu)點(diǎn),不局限于特定的概率密度函數(shù)形式[9]。
如果模型中子模型足夠多,則其能夠以任意精度逼近任意的連續(xù)分布。MGMM的概率分布形式如式(5)所示。
(5)
(6)
式中:X為參數(shù)變量;q為子模型個(gè)數(shù);ωq為第q個(gè)子模型模型的權(quán)重系數(shù);φq(X|θq)為第q個(gè)子模型的概率密度函數(shù)。
MGMM的參數(shù)估計(jì)采用經(jīng)典的最大期望值(expectation maximum,EM)算法。EM算法是一種迭代算法,適用于含有隱含變量概率模型的參數(shù)估計(jì)[10]。
MGMM的子模型個(gè)數(shù)會(huì)影響模型的回歸效果,故選用赤池信息評(píng)價(jià)準(zhǔn)則(Akaike information criterion,AIC),確定最佳子模型個(gè)數(shù)[11]。AIC建立在熵的概念上,提供了一種權(quán)衡模型復(fù)雜度與擬合數(shù)據(jù)優(yōu)良的評(píng)價(jià)辦法,其定義如式(7)所示。
AIC=2q-2ln(L)
(7)
式中:q為子模型個(gè)數(shù);ln(L)為模型的對(duì)數(shù)似然函數(shù)。
2q作為懲罰模型復(fù)雜度的引入,有助于降低模型過擬合的風(fēng)險(xiǎn)。隨著子模型個(gè)數(shù)的增加,AIC的值會(huì)先減小再增大。綜合考慮模型的回歸精度與復(fù)雜度,選擇AIC最小時(shí)對(duì)應(yīng)的子模型個(gè)數(shù)作為最佳子模型個(gè)數(shù)。
選用某實(shí)際發(fā)電用燃?xì)廨啓C(jī)進(jìn)行基準(zhǔn)值模型的驗(yàn)證。從電廠的廠級(jí)實(shí)時(shí)監(jiān)控信息系統(tǒng)(supervisory information system,SIS)中采集燃?xì)廨啓C(jī)10天的歷史運(yùn)行數(shù)據(jù),測點(diǎn)變量如表1所示。設(shè)置采樣間隔為1 min,共計(jì)14 400組樣本點(diǎn)。
表1 SIS中采集的測點(diǎn)變量
首先,利用功率變化速率m區(qū)間估計(jì)的方法,對(duì)14 400組歷史數(shù)據(jù)進(jìn)行穩(wěn)態(tài)篩選。其中,設(shè)置采樣時(shí)間窗口長度h=20,區(qū)間估計(jì)的顯著性水平α取0.05。穩(wěn)態(tài)篩選后,共有13 541組樣本被劃分成穩(wěn)態(tài)。穩(wěn)態(tài)篩選前后燃機(jī)功率對(duì)比如圖2所示。
圖2 穩(wěn)態(tài)篩選前后燃機(jī)功率對(duì)比圖
針對(duì)穩(wěn)態(tài)工況樣本,利用K-均值聚類算法劃分工況。為了確定最佳聚類數(shù),依次計(jì)算不同聚類數(shù)目(2~30)下樣本silhouette的平均值。當(dāng)聚類數(shù)目是24時(shí),silhouette值最大,等于0.62。因此,劃分后24類工況對(duì)應(yīng)的邊界條件如表2所示。
表2 24類工況邊界條件
利用MGMM確定每個(gè)工況下的參數(shù)基準(zhǔn)值。以表2中第1類工況條件為例(即功率為279.7 MW,環(huán)境溫度為31.5 ℃,環(huán)境壓力為100.3 kPa,環(huán)境濕度為29%)進(jìn)行具體說明。計(jì)算2~30個(gè)不同子模型數(shù)目下MGMM的AIC值,如圖3所示。當(dāng)MGMM子模型數(shù)目是8時(shí),對(duì)應(yīng)的AIC最小,用五角星表示。綜合考慮MGMM復(fù)雜度和擬合精度,第1類工況條件下MGMM的子模型個(gè)數(shù)為8。
圖3 不同MGMM子模型個(gè)數(shù)的AIC值
第1類工況條件下的MGMM擬合結(jié)果,即 MGMM回歸的概率密度如圖4所示。圖4中,以壓氣機(jī)出口壓力和透平排氣溫度作為特征變量,縱坐標(biāo)為參數(shù)對(duì)應(yīng)的概率密度。其中,坐標(biāo)軸數(shù)值是歸一化之后的值。比較不同子模型的期望,選擇熱耗率最低時(shí)對(duì)應(yīng)的子模型參數(shù)期望值作為基準(zhǔn)值,即9 554.57 kJ/kWh。同理,依次確定其他23類工況下參數(shù)的基準(zhǔn)值。
圖4 MGMM回歸的概率密度
24類工況條件下熱耗率的基準(zhǔn)值如表3所示。
表3 24類工況條件下熱耗率的基準(zhǔn)值
本文提出了一種基于數(shù)據(jù)驅(qū)動(dòng)確定燃?xì)廨啓C(jī)基準(zhǔn)值的模型方法。通過對(duì)歷史運(yùn)行數(shù)據(jù)進(jìn)行分析、建模,建立全工況下參數(shù)的基準(zhǔn)值模型。該研究方法的優(yōu)勢主要有以下幾點(diǎn)。
①對(duì)燃?xì)廨啓C(jī)的歷史運(yùn)行數(shù)據(jù)進(jìn)行信息挖掘,使得參數(shù)的基準(zhǔn)值符合機(jī)組的實(shí)際運(yùn)行水平,有利于指導(dǎo)機(jī)組運(yùn)行優(yōu)化和故障診斷。
②在模型建立前,對(duì)歷史數(shù)據(jù)進(jìn)行穩(wěn)態(tài)篩選和工況劃分,有效排除了燃?xì)廨啓C(jī)在非穩(wěn)態(tài)工況以及邊界條件的影響。
③在基準(zhǔn)值求解過程中,考慮了隨機(jī)誤差以及參數(shù)之間的耦合特性的影響,建立多元高斯混合模型,以熱耗率最低對(duì)應(yīng)的子模型期望為基準(zhǔn)值,保證了基準(zhǔn)值的可達(dá)性。
在今后的工作中,將進(jìn)一步研究燃?xì)廨啓C(jī)基準(zhǔn)值的動(dòng)態(tài)模型,并積極拓展基準(zhǔn)值在優(yōu)化調(diào)整以及故障診斷中的應(yīng)用。