王惠杰, 陳林霄, 李 洋, 孫美琪, 楊新健
(1.華北電力大學 電站設備狀態(tài)監(jiān)測與控制教育部重點實驗室,保定071003;2.廣東惠州天然氣發(fā)電有限公司,惠州516082)
熱耗率一直作為研究和衡量電廠熱經濟性的重要指標[1],如今很多電廠都可以對其進行實時監(jiān)測,但是電廠運行人員對可控邊界參數(shù)的調節(jié)往往只能依賴于運行經驗和常規(guī)技術手冊,難以通過對可控邊界參數(shù)優(yōu)化得到最佳的運行狀態(tài)參數(shù)[2].由于傳統(tǒng)的計算方法應用的參數(shù)眾多,涉及一系列相變和能量轉換等過程,很難定性得出某些參數(shù)與重要經濟性指標間的直接關系,往往需要依靠細致的數(shù)據(jù)挖掘手段[3].文獻[4]闡述了應用支持向量機建立強關聯(lián)性參數(shù)與熱耗率的回歸模型.由于機組能耗與運行工況、環(huán)境條件、機組功率和設備狀態(tài)等存在強烈的耦合以及可控邊界參數(shù)決定內部參數(shù)的特性,可通過調節(jié)可控邊界條件來實現(xiàn)針對熱耗率的參數(shù)優(yōu)化.因此,可以選取可控邊界參數(shù)建立熱耗率回歸模型,通過可控參數(shù)的調節(jié)可以更清楚地反映熱耗率的變化,從而得出最佳運行工況.筆者基于υ-SVM建立了可控邊界參數(shù)與熱耗率的回歸模型,為進行機組耗差分析和可控邊界參數(shù)優(yōu)化工作開辟了新的途徑.
支持向量機又稱SVM,是Vapnik等人根據(jù)統(tǒng)計學習理論中結構風險化最小原則提出的.SVM的基本思想是從線性可分情況下的最優(yōu)分類超平面(見圖1)發(fā)展而來的.機器學習算法的實際風險由經驗風險和置信范圍2部分組成,經驗風險與學習機器的復雜程度(即VC維數(shù)h)成反比,而置信范圍與h成正比.因此,只有選擇一個合適的VC維數(shù)h,使兩者之和最小才能得到最小的實際風險.將函數(shù)集構造成一個函數(shù)子集序列,使各子集按照VC維的大小排列,即H1?H2?…?Hn?…,每個Hi的VC維數(shù)hi為有限值,于是有h1≤h2≤ …≤hn≤…,兼顧考慮經驗風險和置信范圍,從而取出最小實際風險,這就是結構風險最小化的思想[5-7],其示意圖見圖2.在hx處取得經驗風險和置信范圍的平均最小值,不會出現(xiàn)過學習和欠學習現(xiàn)象,泛化能力很強.
圖1 最優(yōu)分類超平面示意圖Fig.1 Schematic diagram of optimal separating hyperplane
圖2 結構風險最小化示意圖Fig.2 Schematic diagram of structural risk minimization
考慮應用線性回歸函數(shù)[8]:
擬合數(shù)據(jù){xi,yi},其中i=1,2,…,l,xi∈Rn,yi∈R,為了使式(1)平坦,解下面的凸優(yōu)化問題[9]:
滿足約束:
在二次型優(yōu)化函數(shù)的非線性約束條件中引入拉格朗日乘子αi、、ηi和η*i,將線性可分問題轉化為其對偶問題,通過非線性映射Ψ(x)映射到高維特征空間F,在F中求解最優(yōu)回歸函數(shù).在最優(yōu)回歸函數(shù)中選取合適的核函數(shù)K(x,xi)代替高維空間的向量內積Ψ(xi)·Ψ(x),從而實現(xiàn)非線性變換后的線性擬合.此優(yōu)化問題轉化為[10]
為了在高維特征空間中構造最優(yōu)分類超平面,只需計算支持向量和特征空間中向量的內積,也就是以核函數(shù)的方式來計算.應用核函數(shù)的最大好處是將非線性分類平面轉化為高維特征空間里的線性平面來處理[11],如圖3所示.
目前主要應用的核函數(shù)有:(1)多項式函數(shù),K(x,xi)=[(x·xi)+1]d,d 代表多項式分類器的階數(shù).(2)徑向基函數(shù)(RBF),K(x,xi)=exp{-|xxi|2/σ2},每個基函數(shù)的中心對應著一個支持向量,算法 自 動 確 定.(3)Sigmoid 函 數(shù),K(x,xi)=tanh[v(x·xi)+c],該算法自動確定隱層節(jié)點數(shù),不存在神經網(wǎng)絡的局部極小點問題.
圖3 輸入空間的非線性分類映射到特征空間的線性分類Fig.3 Mapping from nonlinear classification in input space to linear classification in feature space
基于數(shù)據(jù)挖掘的火電機組歷史運行數(shù)據(jù)既包括穩(wěn)定工況下的運行數(shù)據(jù),也包括機組啟停和變負荷時的瞬態(tài)數(shù)據(jù).考慮到測量手段和精度的影響,采集到的數(shù)據(jù)中不免存在失真數(shù)據(jù).因此,要對采集的歷史數(shù)據(jù)進行預處理[12].
由于“穩(wěn)定工況”沒有統(tǒng)一的界定,穩(wěn)態(tài)檢測根據(jù)ASME機組性能試驗規(guī)程進行,采樣周期為10~15min時,規(guī)定各主要參數(shù)在穩(wěn)定工況下的波動范圍如表1所示.
表1 性能試驗規(guī)程定義的穩(wěn)定工況[13]Tab.1 Steady-state range specified in performance test code
在處理采樣數(shù)據(jù)中有誤差、失真和不完整的數(shù)據(jù)時,采用模糊粗糙集[13]的方法,具體內容參考文獻[14].
輸入?yún)?shù)的選擇原則是選擇與輸出參數(shù)具有強關聯(lián)度的參數(shù),而與輸出參數(shù)關聯(lián)度小的參數(shù)應盡可能不選[15].汽輪機組額定工況下熱耗率的計算公式[16]為
式中:qm,0為主蒸汽質量流量,kg/s;h0為主蒸汽焓,kJ/kg;hfw為鍋爐給水焓,kJ/kg;qm,rh為再熱蒸汽管道熱端質量流量,kg/s;hrh為再熱蒸汽熱端焓,kJ/kg;qm,rc為再熱蒸汽管道冷端質量流量,kg/s;hrc為再熱蒸汽冷端焓,kJ/kg;Pcl為發(fā)電機輸出功率(即機組功率),kW.
由卡諾循環(huán)效率η=1-T2/T1可知,平均吸熱溫度T1降低,平均放熱溫度T2不變,卡諾循環(huán)效率降低,熱耗率升高.由此可知,主蒸汽溫度t0和再熱蒸汽溫度t1是影響熱耗率的重要因素.從式(5)也可以看出,h0是直接影響熱耗率的參數(shù)之一,又因h0=u0+p0v,其中u0為熱力學能,可推知主蒸汽壓力p0和主蒸汽溫度t0影響熱耗率.再熱減溫水能防止再熱器超溫,但是降低了吸熱段的吸熱量,卡諾循環(huán)效率降低,熱耗率升高.提高凝汽器的真空,可以盡可能多地使蒸汽中的熱能轉換為機械能,減少冷源損失,提高循環(huán)熱效率.凝汽器真空是關系到汽輪機組安全性和經濟性的重要指標,循環(huán)水流量和循環(huán)水溫度又是影響凝汽器真空的重要參數(shù),因此循環(huán)水溫度和循環(huán)水流量是與熱耗率有密切關系的可控邊界參數(shù).從式(5)可知,主蒸汽質量流量和再熱蒸汽質量流量也與熱耗率密切相關,但是由于現(xiàn)有儀器很難準確測量暫且不考慮.
通過以上分析可知,機組功率、主蒸汽壓力、主蒸汽溫度、再熱蒸汽溫度、循環(huán)水入口溫度、循環(huán)水質量流量和再熱減溫水質量流量等7個參數(shù)與熱耗率有直接或間接的強關聯(lián)性,因此將這7個參數(shù)作為模型的輸入?yún)?shù),熱耗率作為模型的輸出參數(shù).
以上述輸入?yún)?shù)作為子序列,熱耗率作為母序列建立灰色關聯(lián)度模型進行驗證.已知機組負荷與熱耗率具有強關聯(lián)性,將其作為子序列進行參照,以增強對比性[17].
灰色關聯(lián)度分析的基本原理是對動態(tài)過程發(fā)展態(tài)勢的量化分析,通過對系統(tǒng)內時間序列有關統(tǒng)計數(shù)據(jù)幾何關系的比較,確定參考數(shù)列和若干個比較數(shù)列的幾何形狀相似程度來判斷其聯(lián)系是否緊密,它反映了曲線間的關聯(lián)程度.與參考數(shù)列關聯(lián)度越大的比較數(shù)列,其發(fā)展方向和速率與參考數(shù)列越接近,與參考數(shù)列的關系越緊密.關聯(lián)度分析的基本步驟參考文獻[18].計算結果見表2.
從計算結果可以看出,所選參數(shù)均與熱耗率具有很強的關聯(lián)性,可以作為回歸模型的輸入?yún)?shù).
在使用SVM進行回歸運算時,只有ε-SVM和υ-SVM兩類算法,取某600MW火電廠680組歷史數(shù)據(jù),一半數(shù)據(jù)為訓練數(shù)據(jù),另一半數(shù)據(jù)為測試數(shù)據(jù).其他參數(shù)取默認值,求出模型輸出熱耗率的相對誤差,選取相對誤差較小的SVM類型.本文相對誤差定義為
式中:x1為真實值;x2為計算值.
回歸預測結果如表3所示,υ-SVM的相對誤差較小,因此選擇υ-SVM進行回歸運算.
表2 參數(shù)關聯(lián)度計算數(shù)據(jù)匯總Tab.2 Calculation results of relevance degree for various parameters
表3 不同類別SVM的回歸預測結果Tab.3 Comparison of regression accuracy between ε-SVM andυ-SVM model
核函數(shù)的選取對模型的準確性起著決定性的作用,由于邊界參數(shù)與熱耗率之間復雜的非線性關系,很難推算出分布函數(shù),這給核函數(shù)的選擇帶來一些困難.分別采用前文提到的3種核函數(shù)來建立支持向量回歸模型,比較這些模型輸出熱耗率的回歸精度,其他參數(shù)均為默認值,采用擇優(yōu)選取的方法.不同核函數(shù)的SVM回歸結果見表4.
表4 不同核函數(shù)的SVM回歸結果Tab.4 SVM regression results with different kernel functions
從表4可以看出,Sigmoid函數(shù)不適合作為回歸模型的核函數(shù),多項式函數(shù)回歸的相對誤差大于徑向基函數(shù),因此選取徑向基函數(shù)作為本次模型的核函數(shù).
在Libsvm平臺上,對于核函數(shù)為徑向基函數(shù)的υ-SVM,可設定的參數(shù)為c和g,如式(2)所示,c值的大小對模型的影響很大,g為核函數(shù)中的γ函數(shù)設置.參數(shù)的選取通過預測的相對誤差決定,測試結果見圖4和圖5.由圖4和圖5可知,當c=87、g=2.7時,回歸相對誤差最小.
圖4 參數(shù)c回歸相對誤差Fig.4 Relative error of parameter c regression
圖5 參數(shù)g回歸相對誤差Fig.5 Relative error of parameter gregression
通過以上對比分析,在Libsvm工具箱里選取υ-SVM類支持向量機,徑向基函數(shù)作為核函數(shù),核函數(shù)中的γ取2.8,c值取90,取340組數(shù)據(jù)為訓練數(shù)據(jù)建立回歸模型,另外340組數(shù)據(jù)為測試數(shù)據(jù),部分參數(shù)見表5.由于數(shù)值較大,為避免溢出,在數(shù)據(jù)應用時都要進行歸一化處理,再對回歸結果進行反歸一化處理.回歸值的相對誤差如圖6所示.
圖6 熱耗率回歸值相對誤差Fig.6 Relative error of heat rate regression
在理論優(yōu)化原則方面,SVM采用結構最小化原則,而BP神經網(wǎng)絡則采用經驗最小化原則.雖然SVM和BP神經網(wǎng)絡都能夠逼近非線性函數(shù),但是仍有很大不同.陳林霄等[19]建立了BP神經網(wǎng)絡模型,并與υ-SVM模型進行對比,在不同訓練樣本數(shù)目的情況下,兩者回歸相對誤差如表6所示.從表6可以看出,BP神經網(wǎng)絡的訓練相對誤差較小,但是測試相對誤差隨著訓練樣本數(shù)的減少而逐漸增大;υ-SVM模型的訓練相對誤差和測試相對誤差基本維持穩(wěn)定,分別保持在0.15%和0.22%左右.通過比較發(fā)現(xiàn)SVM具有小樣本學習能力強、高維非線性數(shù)據(jù)處理性好、泛化能力強的特點.
表5 部分參數(shù)列表Tab.5 List of main parameters
表6 υ-SVM模型與BP神經網(wǎng)絡模型回歸相對誤差的比較Tab.6 Comparison of regression relative error betweenυ-SVM and BP neural network model
由式(5)可知,熱耗率是由許多參數(shù)共同決定的,每一個參數(shù)的變化都將影響計算的精確性.尤其是在主蒸汽質量流量和再熱蒸汽質量流量的測量上存在很大誤差,因此,實時計算出的熱耗率誤差也將很大.在對υ-SVM的魯棒性分析上,采用對輸入?yún)?shù)增加隨機變量的方法,對比熱耗率的變化情況.總共輸入350組數(shù)據(jù),對每一組數(shù)據(jù)里的一個隨機參數(shù)附加5%的隨機變量,回歸結果如圖7和圖8所示.
圖8 熱耗率回歸值絕對誤差Fig.8 Absolute error of heat rate regression
在增加了5%隨機變量的情況下,通過式(5)計算所得熱耗率的絕對誤差基本在400kJ/(kW·h)左右.由圖8可以看出,支持向量機模型的回歸值與真實值的絕對誤差基本在50kJ/(kW·h)左右,最大相對誤差也未能超過190kJ/(kW·h),說明參數(shù)的小幅波動對回歸模型的影響很小.在實際連續(xù)數(shù)據(jù)的采集下,采用υ-SVM回歸模型是十分有利的.
選取關聯(lián)度較強的機組負荷和循環(huán)水質量流量做規(guī)律性分析,其余各輸入?yún)?shù)取定值,帶入建立好的υ-SVM回歸模型,回歸結果如圖9和圖10所示.
由圖9和圖10可以看出,熱耗率隨著機組負荷和循環(huán)水質量流量的增大均為遞減趨勢,符合實際規(guī)律.但是局部規(guī)律性有些變化,這些變化可能是由于樣本數(shù)據(jù)中的噪聲和失真數(shù)據(jù),也有可能是因為在變化單一參數(shù)的過程中,其他參數(shù)不符合定值規(guī)律造成的.
圖9 機組負荷-熱耗率圖Fig.9 Load vs.heat rate
圖10 循環(huán)水質量流量-熱耗率圖Fig.1 0 Circulating water flow vs.heat rate
(1)基于結構風險最小化的支持向量機建立回歸模型時,泛化能力優(yōu)于BP神經網(wǎng)絡,尤其是在小樣本情況下,效果更加突出.
(2)υ-SVM模型只應用了包括熱耗率在內的7個參數(shù),與傳統(tǒng)計算模型相比,大大降低了對已知參數(shù)的要求.
(3)在輸入?yún)?shù)增加5%隨機變量的情況下,υ-SVM模型的輸出值保持穩(wěn)定,具有很好的魯棒性.在測試連續(xù)實際數(shù)據(jù)的情況下,相對于傳統(tǒng)的熱耗率計算模型具有明顯的優(yōu)勢.
(4)υ-SVM模型的整體規(guī)律性較強,符合實際規(guī)律,但是局部規(guī)律性較差,主要與樣本數(shù)據(jù)(噪聲、失真等)有關或者是因為在變化單一參數(shù)的過程中,其他參數(shù)不符合定值規(guī)律.
[1]鄭體寬.熱力發(fā)電廠[M].北京:中國電力出版社,2008.
[2]張春發(fā),王惠杰,宋之平,等.火電廠單元機組最優(yōu)運行初壓的定量研究[J].中國電機工程學報,2006,26(4):36-40.ZHANG Chunfa,WANG Huijie,SONG Zhiping,et al.Quantitative research of optimal initial operation pressure for the coal-fired power unit plant[J].Proceedings of the CSEE,2006,26(4):36-40.
[3]王寧玲.基于數(shù)據(jù)挖掘的大型燃煤發(fā)電機組節(jié)能診斷優(yōu)化理論與方法研究[D].北京:華北電力大學,2011.
[4]王雷,張欣剛,王洪躍,等.基于支持向量回歸算法的汽輪機熱耗率模型[J].動力工程,2007,27(1):19-23.WANG Lei,ZHANG Xingang,WANG Hongyue,et al.Model for the turbine heat rate based on the support vector regression[J].Journal of Power Engineering,2007,27(1):19-23.
[5]VAPNIK V.統(tǒng)計學習理論的本質[M].張學工,譯.北京:清華大學出版社,2000.
[6]沈曙光,王廣軍,陳紅,等.最小支持向量機在系統(tǒng)逆動力學辨識與控制中的應用[J].中國電機工程學報,2008,28(5):85-89.SHEN Shuguang,WANG Guangjun,CHEN Hong,et al.Application of RLS-SVM in identification and control for inverse dynamics of system[J].Proceedings of the CSEE,2008,28(5):85-89.
[7]MARC G.Classes of kernels for machine learning:a statistics perspective[J].The Journal of Machine Learning Research,2002,2:299-312.
[8]鄧乃揚,田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機[M].北京:科學出版社,2004.
[9]王春林,周昊,周樟華,等.基于支持向量機的大型電廠鍋爐飛灰含碳量建模[J].中國電機工程學報,2005,25(20):72-76.WANG Chunlin,ZHOU Hao,ZHOU Zhanghua,et al.Support vector machine modeling on the unburned carbon in fly ash[J].Proceedings of the CSEE,2005,25(20):72-76.
[10]CRISTIANINI N,SHAWE-TAYLOR J.支持向量機導論[M].李國正,王猛,曾華軍,譯.北京:電子工業(yè)出版社,2004.
[11]SCHOLKOPF B,MIKA S,BURGES C J C,et al.Input space versus feature space in kernel-based methods[J].IEEE Transactions on Neural Networks,1999,10(5):1000-1017.
[12]李蔚,仁浩仁,盛德仁,等.300MW火電機組在線能耗分析系統(tǒng)的研制[J].中國電機工程學報,2002,22(11):85-89.LI Wei,REN Haoren,SHENG Deren,et al.Developing a software for analyzing on-line the energy-loss for 300MW unit[J].Proceedings of the CSEE,2002,22(11):85-89.
[13]中華人民共和國機械電子工業(yè)部.GB 10184—1988電站鍋爐性能試驗規(guī)程[S].北京:國家技術監(jiān)督局,1989.
[14]TSANG Eric,ZHAO S Y.Decision table reduction in KDD:fuzzy rough approach[J].Transactions on Rough Sets XI,2010,5946:177-188.
[15]王惠杰,張春發(fā),宋之平,等.火電機組運行參數(shù)能耗敏感性分析[J].中國電機工程學報,2008,28(29):6-10.WANG Huijie,ZHANG Chunfa,SONG Zhiping,et al.Sensitive analysis of energy consumption of operating parameters for coal-fired unit[J].Proceedings of the CSEE,2008,28(29):6-10.
[16]沈士一,莊賀慶,康松,等.汽輪機原理[M].北京:中國電力出版社,1992.
[17]郭江龍 ,張樹芳,姚力強,等.汽輪機性能預測BP神經網(wǎng)絡輸入層神經元篩選方法[J].汽輪機技術,2010,52(2):147-149.GUO Jianglong,ZHANG Shufang,YAO Liqiang,et al.A method for screening input nodes in BP artificial neural network on performance forecasting of steam turbine[J].Turbine Technology,2010,52(2):147-149.
[18]劉思峰.灰色系統(tǒng)理論及其應用[M].3版.北京:科學出版社,2004.
[19]陳林霄,王惠杰,楊新健.基于改進型BP神經網(wǎng)絡的火電機組初壓優(yōu)化[J].節(jié)能,2013,32(11):53-56.CHEN Linxiao,WANG Huijie,YANG Xinjian.Initial pressure to optimize BP neural network based on improved thermal power[J].Energy Conservation,2013,32(11):53-56.