魏書榮,閆夢飛,任子旭,符 楊,王 毅,王棟悅,潘 捷
(1. 上海電力大學(xué)電氣工程學(xué)院,上海市 200090;2. 上海綠色環(huán)保能源有限公司,上海市 200433;3. 國網(wǎng)上海市電力公司電纜分公司,上海市 200072)
目前,海上風(fēng)電是中國東南沿海電網(wǎng)重要的本地電源,也是實現(xiàn)中國“碳達峰·碳中和”目標的關(guān)鍵技術(shù)路徑之一。海上風(fēng)電近年來發(fā)展迅猛,呈現(xiàn)出深遠?;⒋笠?guī)?;厔荩?]。與陸上風(fēng)電相比,海上風(fēng)電年利用小時數(shù)多、平均風(fēng)速高、單機容量大,但海上環(huán)境惡劣,風(fēng)電機組故障率高[2]、維護困難[3]、停運損失大。因此,迫切需要及時精準地識別風(fēng)電機組早期故障,防止故障迅速惡化帶來巨大損失。
現(xiàn)有的海上風(fēng)電機組狀態(tài)判別方法大都沿用陸上風(fēng)電機組的判別方法,主要基于數(shù)據(jù)采集與監(jiān)控(SCADA)系統(tǒng),采用經(jīng)典方法[4-5]、數(shù)據(jù)方法[6-7]和智能學(xué)習(xí)[8-9]等技術(shù)。目前,已有相當數(shù)量的研究通過風(fēng)電機組風(fēng)速和功率的數(shù)據(jù)分析,實現(xiàn)風(fēng)電機組的狀態(tài)判別。文獻[10]提出了一種自動功率曲線的監(jiān)測方法,該方法已成功應(yīng)用于韓國YeongHeung風(fēng)電場。文獻[11]構(gòu)建了風(fēng)速和功率的Copula 函數(shù)曲線圖,進一步分析了葉片故障和偏航故障時對應(yīng)的不同曲線特性。文獻[12-13]均從功率預(yù)測殘差的角度進行風(fēng)電機組狀態(tài)監(jiān)測。
但上述研究都未考慮運行環(huán)境因素的影響。實際工程運行經(jīng)驗表明,海洋諸多環(huán)境因素對海上風(fēng)電機組故障影響巨大,不可忽略。文獻[14-15]指出,海上風(fēng)電機組故障率相比陸上提高了61%,海上風(fēng)速驟變是其中的主要問題之一。文獻[14]證實了齒輪箱、發(fā)電機和輪轂這些部件更易在多變的風(fēng)速條件下故障,同時,較高的風(fēng)速制約著風(fēng)電機組維護的可及性[16]。溫度和濕度也是重要的影響因素,文獻[17]對德國Fehmarn、Krummh?rn 和Ormont 這3 個地點的風(fēng)電機組故障率及其天氣數(shù)據(jù)進行了相關(guān)性分析。統(tǒng)計發(fā)現(xiàn),海上運行環(huán)境參數(shù)與風(fēng)電機組故障的互相關(guān)率最高達到31%,其中,溫度會產(chǎn)生季節(jié)性影響,秋季或早春的互相關(guān)率最高,濕度對電氣部件的影響比機械部件更嚴重。但是,相關(guān)研究采用的是年平均和月平均天氣參數(shù),數(shù)據(jù)精度不高,且僅針對額定功率為300 kW 的小容量風(fēng)電機組進行分析。以上針對各種環(huán)境因素對風(fēng)電機組故障率的影響研究均為單獨建模,即每次只考慮單一環(huán)境參數(shù)條件,忽略了因素之間的并存性和相關(guān)性[15]。
針對上述問題,本文提出了一種風(fēng)電機組狀態(tài)判別方法,該方法同時考慮了風(fēng)電機組狀態(tài)變量和運行環(huán)境影響。首先,分析海上風(fēng)電機組風(fēng)速、功率、溫度、湍流之間的相關(guān)性,基于上述變量間的相關(guān)度,通過非參數(shù)核密度估計得到單一變量的核密度函數(shù)和邊緣分布函數(shù)。然后,將其用于構(gòu)建風(fēng)電機組正常和故障狀態(tài)下的多元Copula 函數(shù)模型,并進行模型優(yōu)選,以表征多維數(shù)據(jù)間的聯(lián)合概率。最后,基于貝葉斯決策理論進行風(fēng)電機組狀態(tài)判別,用海上風(fēng)電場的實際算例驗證所提方法的可行性和有效性,分析不同運行環(huán)境因素對風(fēng)電機組狀態(tài)判別結(jié)果的影響。
Kendall 秩相關(guān)系數(shù)可用于表征兩個特征間的相關(guān)緊密程度。以海上風(fēng)速、功率、溫度、湍流為研究對象,設(shè)x1和x2為其中任意兩個變量,則兩變量間的Kendall 秩相關(guān)系數(shù)τ為:
式中:x1a、x2a和x1b、x2b分別為兩個變量的第a和b個觀測值;N為樣本容量;sign(·)為符號函數(shù),當(x1ax1b)(x2a-x2b)>0 時sign=1;當(x1a-x1b)(x2ax2b)=0 時sign=0,當(x1a-x1b)(x2a-x2b)<0 時sign=-1。
當τ值為1 時,說明兩個變量間具有正相關(guān)特征;為-1 時,具有負相關(guān)特征;為0 時,兩個變量完全獨立,以此定量描述變量間的相關(guān)性強弱。
1.2.1 核密度函數(shù)
非參數(shù)核密度估計直接利用歷史數(shù)據(jù)計算每個變量的概率密度函數(shù),無須預(yù)先假設(shè)分布,具有較好的擬合效果。假設(shè)有N個樣本x1,x2,…,xN,對于一個新樣本x,其概率密度函數(shù)的非參數(shù)核密度估計f?h(x)為:
式中:xi為在第i個采樣點的樣本數(shù)據(jù);h為窗寬;K(·)為核函數(shù)。
1.2.2 核密度函數(shù)的參數(shù)設(shè)定
核函數(shù)的形式有多種選擇,常用的有高斯核、Epanechnikov 核、四次方核等。研究表明[18],當窗寬h一定時,不同的核函數(shù)對于概率密度函數(shù)建模的精確性影響不大。高斯核函數(shù)具有良好的光滑度和可微性,故本文選用高斯核函數(shù)作為核密度估計的核函數(shù),對于變量m,其核函數(shù)表達式K(m)滿足:
將上式代入式(2)可得:
窗寬h的大小與擬合的平滑度有關(guān),窗寬過小導(dǎo)致的欠平滑與窗寬過大導(dǎo)致的過平滑都將直接影響擬合精度,因此通常采用經(jīng)驗窗寬。然而,當變量的真實分布與正態(tài)分布偏離較大時,采用經(jīng)驗窗寬所得的核密度估計的效果并不理想,故本文采用文獻[19]提出的方法求取最優(yōu)窗寬,具體步驟如下。
1)選取兩個分別服從N(0,1)和N(0,4)的高斯核函數(shù)K1(m)和K2(m),即
將式(5)和式(6)代入式(2)得到兩個核密度函數(shù)f?1(x)和f?2(x)。
2)基于兩個核密度函數(shù)的積分方差(integral square error,ISE)最小原則確定最優(yōu)窗寬,ISE 值IISE的表達式如下:
式中:xi1和xi2表示核密度函數(shù)相應(yīng)位置的樣本值。
將式(8)所示模型取最小值時可得最優(yōu)窗寬h,將其代回式(4)可求得此時每個變量的核密度函數(shù)。
基于上述非參數(shù)核密度估計流程可分別求得海上風(fēng)速、功率、溫度、湍流樣本的核密度函數(shù)f(x),并對其積分求取相應(yīng)的邊緣分布函數(shù)F(x)。
本文提出聯(lián)合貝葉斯決策理論和Copula 函數(shù)的海上風(fēng)電機組狀態(tài)判別方法(用BCDM 表示)。利用Copula 函數(shù)刻畫不同因素間的相關(guān)性,融入貝葉斯決策理論并代替其原始獨立假設(shè),實現(xiàn)風(fēng)電機組狀態(tài)的有效判別,是一種有監(jiān)督學(xué)習(xí)的判別方法。
貝葉斯決策理論是一種解決模式識別問題的統(tǒng)計方法。風(fēng)電場SCADA 系統(tǒng)通常以一定的時間間隔采集風(fēng)電機組各部件的狀態(tài)變量和運行環(huán)境參數(shù),此時每臺風(fēng)電機組的運行狀態(tài)可由一個屬性向量x=[x1,x2,…,xp]表 示,其 中x1,x2,…,xp代 表每臺風(fēng)電機組各監(jiān)測變量,令
此時X共有p個監(jiān)測變量,每個監(jiān)測變量具有T個觀測值。矩陣中的每行參數(shù)對應(yīng)風(fēng)電機組現(xiàn)場工況記錄中的一種狀態(tài),相應(yīng)的類標簽設(shè)為Ck(k=1,2),本文僅考慮風(fēng)電機組處于正常(C1)和故障(C2)兩種狀態(tài)。
當給定某時刻一個新的觀測值x,通過貝葉斯公式可以分別計算風(fēng)電機組屬于正常狀態(tài)和故障狀態(tài)的概率,從而實現(xiàn)風(fēng)電機組的狀態(tài)判別。貝葉斯公式如下所示:
先驗概率P(Ck)可通過在樣本數(shù)據(jù)中計算屬于某一類別的數(shù)據(jù)個數(shù)除以樣本數(shù)據(jù)總數(shù)得到。計算p(x|Ck)時為了簡便考慮,通常假定屬性變量相互獨立[20],但實際情況中,變量間可能存在一定的相關(guān)性,故本文考慮采用Copula 函數(shù)進行變量間的相關(guān)性量度代替原始獨立假設(shè)。
Copula 函數(shù)最早由Sklar 提出[21],可用于描述變量間的復(fù)雜相關(guān)關(guān)系。該理論表明,任何多維變量的聯(lián)合分布函數(shù)都可以通過單一變量的邊緣分布函數(shù)和一個Copula 連接函數(shù)組合而成。
令H為隨機變量x1,x2,…,xp的聯(lián)合分布函數(shù),F(xiàn)1(x1),F(xiàn)2(x2),…,F(xiàn)p(xp)為隨機變量的邊緣分布函數(shù),如果所有的邊緣分布函數(shù)都是連續(xù)的,那么存在一個唯一的Copula 函數(shù)C滿足:
由式(12)推導(dǎo)可得隨機變量的聯(lián)合密度函數(shù)g為:
式中:c(F1(x1),F(xiàn)2(x2),???,F(xiàn)p(xp))為p維隨機變量的Copula 密度函數(shù);fj(xj)為每個隨機變量xj的核密度函數(shù)。
結(jié)合貝葉斯決策理論和Copula 函數(shù),聯(lián)立式(11)和式(13)可得:
式 中:c(F1(x1),F(xiàn)2(x2),???,F(xiàn)p(xp);Ck)表 示 屬 于類別Ck的Copula 密度函數(shù);fj(xj|Ck)表示屬于類別Ck的核密度函數(shù)。
Copula 理論解決了多元隨機變量邊緣分布函數(shù)已知而聯(lián)合概率密度難以求解的問題,更好地刻畫了風(fēng)電機組狀態(tài)變量和運行環(huán)境參數(shù)間的相關(guān)特性。
2.2.1 風(fēng)速、功率、溫度、湍流的4 維Copula 函數(shù)模型
常 用 的Copula 函 數(shù) 有Gaussian Copula、t-Copula、Gumbel Copula、Clayton Copula、Frank Copula 這5 種。不同的Copula 函數(shù)描述了數(shù)據(jù)間不同的對稱特性和尾部特性,故對風(fēng)速、功率、溫度和湍流數(shù)據(jù)進行相關(guān)結(jié)構(gòu)建模時需要選擇合適的Copula 函數(shù)。目前,應(yīng)用Copula 函數(shù)的研究大多基于二元變量,本文在文獻[22]的基礎(chǔ)上推導(dǎo)了面向多元變量的Copula 密度函數(shù),得到了考慮運行環(huán)境影響的風(fēng)速、功率、溫度和湍流的4 維Copula 密度函數(shù)的表達式如下所示。
1)Gaussian Copula 函數(shù)
式中:u1、u2、u3、u4分別為風(fēng)速、功率、溫度、湍流的分布 函 數(shù) 值 ;Σ為 相 關(guān) 系 數(shù) 矩 陣 ;ζ1=[?-1(u1),?-1(u2),?-1(u3),?-1(u4)]T,其 中,?-1(·)為標準正態(tài)分布的逆函數(shù)。
式 中:θ為 需 要 估 計 的 未 知 參 數(shù);ω=(-lnu1)θ+(-lnu2)θ+(-lnu3)θ+(-lnu4)θ。
4)Clayton Copula 函數(shù)
式中:θ''為需要估計的未知參數(shù)。
2.2.2 Copula 函數(shù)的參數(shù)估計
常用的參數(shù)估計方法包括點估計法、矩估計法和區(qū)間估計法等。本文采用極大似然估計方法進行參數(shù)估計,需要估計的函數(shù)模型參數(shù)為Gaussian Copula 函數(shù)的相關(guān)系數(shù)矩陣,t-Copula 函數(shù)的相關(guān)系數(shù)矩陣和自由度以及Gumbel Copula 函數(shù)、Clayton Copula 函 數(shù)、Frank Copula 函 數(shù) 的 未 知 參數(shù)。如式(20)所示,其中參數(shù)θ*代表了各Copula 函數(shù)需要估計的參數(shù)。
式中:Fi1(xi1)、Fi2(xi2)、Fi3(xi3)、Fi4(xi4)分別表示風(fēng)速、功率、溫度、湍流相應(yīng)的核密度函數(shù)值。
2.2.3 Copula 函數(shù)模型優(yōu)選
Copula 密度函數(shù)描述了變量間的相關(guān)性特點,不同函數(shù)的選擇對應(yīng)了數(shù)據(jù)間不同的分布特性。為了評估Copula 密度函數(shù)的擬合優(yōu)度,本文采用赤池信息準則(Akaike information criterion,AIC)和貝葉斯信息準則(Bayesian information criterion,BIC)來評價,AIC 值IAIC和BIC 值IBIC的表達式如下:
式中:θ?表示θ的最大似然估計;o為模型參數(shù)個數(shù);mind為獨立參數(shù)的數(shù)目;L(·)為似然函數(shù)。
AIC 建立在熵的概念上,提供了權(quán)衡估計模型復(fù)雜度和擬合數(shù)據(jù)優(yōu)良性的標準,但當樣本數(shù)量過多時,容易出現(xiàn)過擬合的情況。故在此基礎(chǔ)上引入了具有相對更大懲罰項的BIC,可有效防止模型精度過高造成的模型復(fù)雜度過高問題。綜上,AIC 和BIC 值較小的Copula 密度函數(shù)因其具有較好的擬合優(yōu)度將被用于構(gòu)建類條件概率密度函數(shù)。
以風(fēng)電機組SCADA 系統(tǒng)數(shù)據(jù)中記錄的風(fēng)速、功率、溫度、湍流4 種狀態(tài)參數(shù)為研究對象,考慮了這4 種參數(shù)不同的組合情況,組合1 為風(fēng)速、功率;組合2 為風(fēng)速、功率、湍流;組合3 為風(fēng)速、功率、溫度;組合4 為風(fēng)速、功率、溫度、湍流,以研究不同運行環(huán)境因素對風(fēng)電機組狀態(tài)判別結(jié)果的影響。
聯(lián)合貝葉斯決策理論和Copula 函數(shù)的風(fēng)電機組狀態(tài)判別過程大致分為以下幾步,具體流程如圖1 所示。
圖1 狀態(tài)判別流程圖Fig.1 Flow chart of state discrimination
步驟1:對風(fēng)速、功率、溫度、湍流變量進行歸一化處理,消除不同量綱的影響,同時減小異常數(shù)據(jù)干擾。進一步,繪制訓(xùn)練數(shù)據(jù)的頻率直方圖和數(shù)據(jù)散點圖,求取成對的Kendall 秩相關(guān)系數(shù),挖掘數(shù)據(jù)間的相關(guān)特性。
步驟2:選擇具有良好光滑度和可微性的高斯核函數(shù),計算最佳窗寬大小,通過非參數(shù)核密度估計擬合各個變量的概率密度曲線,求取訓(xùn)練數(shù)據(jù)的邊緣分布值。
步驟3:根據(jù)各個變量的邊緣分布值,采用極大似然估計法計算4 種參數(shù)組合分別在風(fēng)電機組處于正常和故障狀態(tài)下,5 種Copula 函數(shù)的相關(guān)參數(shù),并利用AIC 和BIC 進行Copula 函數(shù)的優(yōu)選。
步驟4:求取測試數(shù)據(jù)的密度函數(shù)值和分布函數(shù)值,代入步驟3 中優(yōu)選的Copula 函數(shù)模型,聯(lián)合貝葉斯決策理論進行風(fēng)電機組狀態(tài)判別。與現(xiàn)場實際工況記錄進行比對,計算所提方法判別結(jié)果的準確度,并比較4 種參數(shù)組合的判別結(jié)果。
本文使用中國某海上風(fēng)電場的數(shù)據(jù)進行案例研究,該風(fēng)電場安裝了34 臺3 MW 雙饋異步風(fēng)電機組,配置有SCADA 系統(tǒng)進行遠程監(jiān)控與數(shù)據(jù)采集,如附錄A 圖A1 所示。選取5 號風(fēng)電機組兩年的運行狀態(tài)數(shù)據(jù)和海洋天氣參數(shù)作為研究對象。先對風(fēng)速、功率、溫度和湍流數(shù)據(jù)進行篩選,篩除了因通信故障、傳感器故障、人為停機和棄風(fēng)等原因所導(dǎo)致的異常數(shù)據(jù),以減少對后續(xù)研究產(chǎn)生的干擾。
3.2.1 海洋天氣與風(fēng)電機組故障率互相關(guān)性分析
根據(jù)德國Krummh?rn 海上風(fēng)電場的天氣與風(fēng)電機組故障率的互相關(guān)系數(shù)的求解公式[17]可得Krummh?rn 海上風(fēng)電場最大風(fēng)速、湍流與風(fēng)電機組故障率的互相關(guān)系數(shù)均為0.31,溫度與故障率的互相關(guān)系數(shù)為0.28。
本文參考該互相關(guān)系數(shù)求解過程,計算中國某海上風(fēng)電場5 號風(fēng)電機組連續(xù)兩年的月故障率,風(fēng)速、溫度和湍流數(shù)據(jù)的月平均值,求得該機組的月故障率與其運行環(huán)境之間的互相關(guān)系數(shù)。其中,風(fēng)速與故障率的互相關(guān)系數(shù)最高,其值為0.48;溫度、湍流與故障率的互相關(guān)系數(shù)分別為0.22 和0.36,與文獻[17]中的結(jié)果相近,表明海洋環(huán)境與風(fēng)電機組故障間的確存在一定的相關(guān)關(guān)系,在進行海上風(fēng)電機組狀態(tài)判別時有必要考慮天氣因素的影響。
3.2.2 風(fēng)速、功率、溫度、湍流間相關(guān)性分析
通過對風(fēng)速、功率、溫度、湍流樣本的分析處理,挖掘了單一變量的分布特點以及兩特征變量間的依賴性和相關(guān)性,結(jié)果如附錄A 圖A2 所示。
附錄A 圖A2 中對角線位置所示為風(fēng)速、功率、溫度、湍流樣本的頻率直方圖,右上部分表示的則是參數(shù)之間的相關(guān)性數(shù)據(jù)。由圖A2 可知,風(fēng)電機組狀態(tài)參數(shù)和運行環(huán)境參數(shù)不符合常規(guī)分布,而核密度估計無須假設(shè)預(yù)先分布,故利用第1 章優(yōu)化窗寬后的核密度函數(shù)直接擬合密度函數(shù)曲線,結(jié)果顯示了較好的擬合效果。圖A2 中右上角的數(shù)值為對應(yīng)行列參數(shù)間求取的成對Kendall 秩相關(guān)系數(shù),由數(shù)值分析可得,變量間存在一定的相關(guān)性。其中,風(fēng)速和功率呈現(xiàn)很強的正相關(guān),其值為0.809,接近于1;風(fēng)速和湍流也呈現(xiàn)正相關(guān),其值為0.595 3;而溫度和其他參數(shù)間的相關(guān)性不強,其值接近于0,由此表明采用Copula 函數(shù)描述多元變量間相關(guān)關(guān)系的必要性。圖A2 中左下角表示的是對應(yīng)行列兩兩數(shù)據(jù)間的散點圖,進一步反映了成對變量間的關(guān)系特性,圖中多呈現(xiàn)寬帶分布,說明變量具有較大的動態(tài)變化范圍,但是從圖中無法直觀地確定數(shù)據(jù)間的特定關(guān)系。
3.2.3 結(jié)合運行環(huán)境影響的風(fēng)電機組狀態(tài)判別
為了進一步確定運行環(huán)境因素對風(fēng)電機組狀態(tài)判別的影響,首先,根據(jù)現(xiàn)場的狀態(tài)記錄將風(fēng)速、功率、溫度和湍流數(shù)據(jù)分為正常數(shù)據(jù)和故障數(shù)據(jù)兩類,分別提取其中的80%用于訓(xùn)練正常和故障兩種狀態(tài)下的Copula 密度函數(shù)模型。針對4 種參數(shù)的組合,分 別 建 立 基 于Gaussian Copula、t-Copula、Gumbel Copula、Clayton Copula、Frank Copula 的5 種Copula 密度函數(shù)。然后,采用AIC 和BIC 挑選出正常和故障狀態(tài)下的最優(yōu)Copula 函數(shù)模型??紤]不同氣象環(huán)境參數(shù)下的AIC 和BIC 值如表1 至表4 所示。
表1 風(fēng)速、功率的Copula 函數(shù)模型的AIC、BIC 值Table 1 AIC and BIC values of Copula function models for wind speed and power
表2 風(fēng)速、功率、溫度的Copula 函數(shù)模型的AIC、BIC 值Table 2 AIC and BIC values of Copula function models for wind speed,power and temperature
表3 風(fēng)速、功率、湍流的Copula 函數(shù)模型的AIC、BIC 值Table 3 AIC and BIC values of Copula function models for wind speed,power and turbulence
表4 風(fēng)速、功率、溫度、湍流的Copula 函數(shù)模型的AIC、BIC 值Table 4 AIC and BIC values of Copula function models for wind speed,power,temperature and turbulence
表1 至表4 中的紅色數(shù)字表明了不同變量組合下,AIC 和BIC 最 小 值 對 應(yīng) 的Copula 函 數(shù) 類 型,即所要挑選的最優(yōu)Copula 密度函數(shù)。由表中數(shù)值結(jié)果可得,輸入特征不同時,對應(yīng)的最優(yōu)Copula 函數(shù)類型不同。風(fēng)速和功率采用Gumbel Copula 函數(shù)模型;風(fēng)速、功率和溫度以及風(fēng)速、功率和湍流均采用t-Copula 函數(shù)模型;風(fēng)速、功率、溫度和湍流中,Clayton Copula 函數(shù)模型在正常與故障狀態(tài)均有良好表現(xiàn),而Frank Copula 函數(shù)模型雖然在故障時的AIC、BIC 值很高,但正常狀態(tài)的表現(xiàn)并不突出,因此采用Clayton Copula 函數(shù)模型。工程應(yīng)用中需要根據(jù)實際輸入變量進行計算,優(yōu)選Copula 函數(shù)類型。
分別完成4 種參數(shù)組合下的Copula 函數(shù)模型優(yōu)選后,將剩下的部分數(shù)據(jù)用作測試數(shù)據(jù),測試結(jié)果與現(xiàn)場實際情況比對后得到如圖2 所示的精確度。文獻[11]也采用Copula 理論擬合風(fēng)速和功率曲線,發(fā)現(xiàn)了不同故障時,風(fēng)速和功率的曲線表現(xiàn)不同。但是,從圖2 的判別結(jié)果精確度可以看出,僅考慮風(fēng)速和功率時,狀態(tài)判別效果較差,精確度僅為46%,存在很大程度的不確定。當增加湍流參數(shù)時,精確度達到了53%,這是因為湍流和風(fēng)速間的相關(guān)性為0.595 3,使得狀態(tài)判別精度有了小幅提高但不明顯。而當將湍流參數(shù)替換為溫度參數(shù)時,判別的結(jié)果卻出現(xiàn)了顯著提高,達到了70.25%。由此,證實了運行環(huán)境因素會對風(fēng)電機組狀態(tài)判別產(chǎn)生影響,而溫度是其中重要的影響參數(shù)。
圖2 4 種參數(shù)組合判別結(jié)果的精確度Fig.2 Accuracy of discrimination results of four parameter combinations
進一步,取精確度最高的組合4 的情況,即考慮了所有參數(shù)的狀態(tài)判別,將該算法的結(jié)果與高斯判別分析(GDA)方法和高斯核支持向量機(GSVM)方法進行比較。其中,前者是構(gòu)建多元變量聯(lián)合密度函數(shù)的常用方法,后者被認為是效果最好的分類器之一,判別結(jié)果對應(yīng)的混淆矩陣如表5 所示。
表5 不同方法的混淆矩陣Table 5 Confusion matrices of different methods
表5 中混淆矩陣的行和列代表了測試數(shù)據(jù)在不同判別方法下預(yù)測值與真實值對應(yīng)的數(shù)量,其中1代表風(fēng)電機組處于正常狀態(tài),0 代表故障狀態(tài),故行列對應(yīng)數(shù)值相同(同為0 或同為1)時的數(shù)量代表了正確分類的數(shù)量,行列對應(yīng)數(shù)值不同時的數(shù)量代表了錯誤分類的數(shù)量?;煜仃嚪从沉嗽诟弑孀R率和低誤報率之間的權(quán)衡。
表5 中的BCDM 對應(yīng)的是考慮4 種參數(shù)的情況,此時達到了最優(yōu)的判別效果,計算可得,精確度為79.75%,而GSVM 和GDA 方法對應(yīng)的精確度分別為70.25%和56.75%。GDA 方法的判別效果較差,這可能是因為原始參數(shù)的分布不接近假設(shè)的高斯分布。
進一步繪制操作特征曲線(ROC)評估各種方法的表現(xiàn),如圖3 所示。對應(yīng)的橫縱坐標分別為特異度(假陽率)和靈敏度(真陽率),特異度代表預(yù)測為正常但實際為故障的數(shù)量占所有實際為故障的數(shù)量的比例,靈敏度代表預(yù)測為正常實際也為正常的數(shù)量占所有實際為正常的數(shù)量的比例,故ROC 越靠近左上角,分類的效果越好。
圖3 GSVM 方法、BCDM、GDA 方法的ROCFig.3 ROC for GSVM method,BCDM and GDA method
從圖3 可以看出,BCDM 的判別效果最好。為了定量比較3 種方法的表現(xiàn),采用AUC(area under curve)即曲線下的面積來進行評估,得出BCDM、GSVM 方法和GDA 方法的AUC 值分別為0.803 8、0.738 5 和0.575 5,顯然BCDM 取得了最大的AUC值,驗證了本文所提方法的優(yōu)越性。
運行環(huán)境對風(fēng)電機組故障的影響較大,在狀態(tài)判別時不可忽略。本文針對現(xiàn)有狀態(tài)判別方法均未考慮海洋各天氣因素影響的問題,提出一種聯(lián)合貝葉斯決策理論和Copula 函數(shù)的風(fēng)電機組狀態(tài)判別方法。Copula 理論的應(yīng)用精確地描述了多元變量間的相關(guān)關(guān)系,針對正常和故障時的4 種變量組合,進行了Copula 函數(shù)優(yōu)選,再融合貝葉斯概率模型最終實現(xiàn)對風(fēng)電機組的狀態(tài)判別。結(jié)果表明,運行環(huán)境因素對風(fēng)電機組狀態(tài)判別的影響不可忽視,考慮運行環(huán)境影響的風(fēng)電機組狀態(tài)判別較僅考慮風(fēng)速、功率的判別結(jié)果準確率提高了33.75%。此外,相比其他狀態(tài)判別方法,BCDM 取得了更好的判別效果。
本文提出的方法對海上風(fēng)電機組的狀態(tài)判別具有明顯的指導(dǎo)意義,并可將其延伸應(yīng)用于風(fēng)電機組的早期狀態(tài)預(yù)測。另外,文中所選數(shù)據(jù)是基于海上風(fēng)電場近兩年的SCADA 系統(tǒng)數(shù)據(jù)得出的,但本文提出的方法同樣適用于陸上風(fēng)電機組,這可以作為后續(xù)研究繼續(xù)深入。
本文在撰寫過程中受到上海市人才發(fā)展基金項目(2020007)資助,特此感謝!
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。