張國斌 劉永江 董竹林 趙煒 霍紅巖 殷建華
摘要:汽輪機在進行改造或長期運行以后,其閥門實際流量特性會偏離DEH系統中設置的流量特性參數,這將對機組的安全、穩(wěn)定、經濟運行帶來不利影響。因此,本文基于歷史運行數據,提出了一種數據挖掘算法來獲取汽輪機在混合閥模式下調節(jié)閥組的實際流量特性曲線,并對其進行了線性度分析,對非線性區(qū)域進行了線性優(yōu)化,最終實現對閥門管理曲線的優(yōu)化調整。該方法效率高,耗時少,克服了傳統試驗法的缺點。
關鍵詞:汽輪機;閥門流量特性;數據挖掘;參數辨識;線性優(yōu)化
中圖分類號:TP3 文獻標識碼:A
文章編號:1009-3044(2019)30-0233-04
汽輪機調節(jié)閥的流量特性是指總閥位指令與機組進汽量的一一對應關系,它是由DEH系統中的配汽函數來進行數值表征,只有當兩者相一致時汽輪機才具備良好的控制性能和運行穩(wěn)定性,而其配汽函數的原始參數一般是由汽輪機廠家設計而來。在實際應用中,由于設備安裝偏差、通流部分改造、DEH改造、運行老化等原因,會使調節(jié)閥組的實際流量特性偏離控制系統中設置的閥門流量特性參數,以至于引發(fā)諸如單閥順序閥切換時負荷波動大、機組變負荷和一次調頻期間機組協調能力不足的問題,造成機組控制困難,影響機組的安全穩(wěn)定運行。因此,在機組進行改造或長期運行后,對其進行閥門流量特性參數的優(yōu)化就具有非常重要的意義。目前,最常用的優(yōu)化方法是進行汽輪機閥門流量特性試驗,對試驗數據進行分析和計算得到機組的實際流量特性曲線。但傳統的試驗法過程復雜、工作量大、試驗條件苛刻,不僅耗時還消耗大量的人力、物力,而且試驗過程還可能對機組的安全穩(wěn)定運行帶來不利影響。因此文獻[5]運用機組歷史數據建立單個閥門的實際流量特性曲線,對調節(jié)閥配汽過程進行仿真,通過改變重疊度對閥門流量特性曲線進行線性優(yōu)化。優(yōu)化后的閥門管理曲線提高了負荷的控制精度,改善了機組的一次調頻能力。文獻[7][8]采用數據挖掘算法求出順序閥運行方式下調節(jié)閥組的實際流量特性曲線,基于給定的目標曲線得到優(yōu)化后的閥門管理曲線。這種基于大數據分析的閥門流量特性優(yōu)化方法效率高,耗時少,計算過程簡便。
因此,本文基于機組運行的歷史數據,采用數據挖掘算法求取汽輪機在混合閥模式下調節(jié)閥組的實際流量特性曲線,并對高壓調節(jié)閥門管理曲線進行優(yōu)化。
1汽輪機調節(jié)閥實際流量特性辨識方法
1.1模型參數選取
在DCS系統中選取與閥門流量特性相關的參數,如表1所示。
1.2穩(wěn)定工況選取
機組DCS系統中不僅包括穩(wěn)定工況運行的數據,還存在大量動態(tài)過程以及異常情況的數據,在運用歷史數據進行調節(jié)閥組流量特性曲線辨識之前應對數據進行預處理,篩選出穩(wěn)定工況的數據,確保獲取的數據能反映機組的實際特性。判斷機組是否處于熱力穩(wěn)定的原則是將數據嚴格按照采樣時間的先后順序,若重要參數至少穩(wěn)定3~4個采樣周期(即10s)則認為處于熱力穩(wěn)定。因此,采用下式的邏輯語句進行穩(wěn)定工況的判定:
其中,yi(k)表示第i個歷史數據;k表示采樣時刻;yi,max和yi.min表示yi(k)在獲得的歷史數據中的最大值和最小值;a表示穩(wěn)定時間;占一般取0.05%-0.25%。重要參數主要選取總閥位指令、機組負荷和主蒸汽壓力。
1.3異常數據剔除
文獻【7】【8】[9】均采用格拉布斯法來剔除同一工況的異常數據,該方法需對每個工況下的所有數據進行偏離值計算,并與臨界值進行比較以此來判斷是否為異常值。本文數據量大,若采用格拉布斯方法則計算量大,效率較低。而孤立森林算法fIsolation Forestl是一種非監(jiān)督異常數據檢測方法,算法效率高,效果好,使用簡便,能有效處理高維數據和海量數據。算法的基本思想是用一個隨機超平面來切割數據空間,切一次可以產生兩個子空間,然后繼續(xù)用一個隨機超平面來切割每個子空間,循環(huán)以上操作直到每個子空間里只有一個數據點為止。直觀上來看,那些異常點因為密度低很快就會從整體中被分割出來,而正常點即密度高的簇要切割多次才能停止。
孤立森林由iTree組成,采用多次迭代方式構建二叉搜索樹,并將這些二叉樹組成森林。其構建過程如下:首先,從n個數據空間中隨機抽取m個樣本,隨機選取一個特征作為起始節(jié)點,并在該特征的值域里隨機選擇一個值,對m個樣本進行二叉劃分,將樣本中小于該值的數據劃分到左分支,剩余的值劃分到右分支。然后對左右兩個分支分別重復進行以上二叉劃分操作,直到節(jié)點上只有一個樣本點或者樹的高度達到了限制值。當二叉森林構建完成后,記錄每個數據從根節(jié)點到葉子節(jié)點的路徑長度h(x),以此來計算該數據的異常指數s(x,n)。
經過上述方法計算,可獲得某主蒸汽壓力下機組總閥位指令與實際進汽量之間的關系,也就是汽輪機調節(jié)閥組的實際流量特性曲線。
1.5聚類分析
聚類算法是根據數據集之間的相似程度進行合理歸類的一種方法,在同一類別中的數據比不在同一類別中的數據具有更多的相似性。現有文獻均采用k-means算法,它是基于距離來衡量數據之間的相似程度,適用于類球形的數據集,而且算法需要預先估計聚類數量,初始中心點的選取不同會直接導致結果的不同。因此本文采用密度峰值(Density Peak)的聚類算法,該算法將距離和密度巧妙地結合起來,假設聚類中心周圍都是密度比其低的點,同時這些點與該聚類中心的距離相比于其他聚類中心是最近的,以此來克服基于距離的算法只能發(fā)現類圓形聚類的缺點,并且Density peak算法無須提前設定聚類中心數目,算法通用性更強。算法流程如下:
(1)計算每個點的局部密度p;:本文采用高斯核函數來表征點的局部密度:
其中,dij表示點i與點j之間的距離;dc表示鄰域半徑,需人工設定,可選擇為平均每個點的局部密度為數據總數的1-2%。
(2)計算每個點的聚類中心聚類δi:將每個點的局部密度值降序排列,密度最大點的聚類中心距離等于與該點距離最遠的點之間的距離;而其他點的聚類中心距離等于在密度大于該點的點集合中,與該點距離最近的點之間的距離。我們可以認為,局部密度和聚類中心距離值都較大的點極有可能是聚類的核心點,而周圍密度小且距離其他點遠的點就屬于噪聲點。
(3)確定聚類中心:定義ri=pi*δi,由(2)可知,ri越大,該點就是聚類中心,因此對ri進行降序排列并對其求導,變化最明顯處就作為選取聚類中心的分界點。
(4)確定其他點所屬類別:聚類中心確定后,當前點的類別標簽與高于當前點密度且距離最近的點的標簽一致。
2汽輪機混合閥模式下調節(jié)閥組流量特性辨識結果
按照表1的相關參數,以3s為采樣周期選取600MW機組2019年6月連續(xù)一周的歷史數據。
首先,按照式(1)篩選出穩(wěn)定工況的數據,然后采用孤立森林算法剔除異常數據,進一步減少數據量。數據初篩結果如圖1所示,機組各參數曲線的走向趨勢以及曲線形狀未出現失真情況,基本得到了重現,證明本文采用的數據篩選方法科學可行、可靠有效。
其次,按照公式(3)(4)計算汽輪機的實際進汽量和修正后的進汽量,得到調節(jié)閥組實際流量特性曲線,如圖2所示,對其進行DensiIy peak聚類,結果如圖3所示。
對比圖2、圖3可知,聚類后曲線完全復現了原有曲線的特征形態(tài),在減小數據量的同時有效去掉了噪聲數據,提取了最能反映機組實際特性的目標數據,提高了辨識結果的精確度,驗證了本文聚類方法的可行性。圖3中藍色直線是依據最小方差原則擬合出的線段以分析實際流量特性曲線的線性度。從圖中可知,曲線在總閥位指令80%-100%之間總體線性度較好,只有在88%-90%之間時曲線局部線性度較差且曲線斜率過小,這將導致一次調頻調節(jié)時負荷響應不足的問題。
為了使AGC響應速率以及一次調頻品質滿足要求,調節(jié)閥組流量特性曲線必須為線性。因此,將圖4中直線作為流量特性曲線的優(yōu)化目標曲線,通過計算得到圖5所示的閥門管理曲線。
從圖5可知,四個高壓調節(jié)閥門管理曲線在總閥位指令88%-90%之間進行了一定的調整,而在其他總閥位指令下基本保持不變,以解決流量特性曲線在此區(qū)間斜率過小的問題。
3總結
本文基于機組運行的歷史數據,提出了一種數據挖掘算法來獲取汽輪機混合閥模式下調節(jié)閥組的實際流量特性曲線。數據挖掘過程利用無監(jiān)督異常值檢測算法、Density Peak聚類算法以及變工況流量計算來獲取調節(jié)閥組的實際流量特性曲線,最終實現對閥門管理曲線的優(yōu)化。
該方法克服了傳統試驗法的缺點,減輕了工作量。但該方法依賴于歷史數據,機組在實際運行過程中基本無法實現全工況運行,因此部分工況的數據會存在缺失,無法得到全工況范圍內的調節(jié)閥實際流量特性曲線。