趙昕迪
(重慶科技學院,重慶,401331)
近年來,XGBoost算法在電力系統(tǒng)領(lǐng)域得到了廣泛的應用,在換流站狀態(tài)評估、電網(wǎng)攻擊檢測和異常用電識別等方面均取得較好的效果,但在電力設(shè)備外絕緣狀態(tài)評估領(lǐng)域的應用研究仍有欠缺。考慮到單一的預測模型由于自身的局限性,并不能取得滿意的預測結(jié)果。而組合預測模型可以整合單一模型的優(yōu)點,通過模型之間的優(yōu)勢互補,增強預測效果,有效提高預測精度和計算速度。
泄漏電流隨絕緣子表面污穢程度的變化呈現(xiàn)出不同的發(fā)展趨勢,能綜合的反映絕緣子表面的各種參數(shù),是絕緣子最有效的在線監(jiān)測參數(shù)。基于泄漏電流特性對絕緣子表面污穢程度進行預測具有重要的實用價值。為充分通過泄漏電流分析絕緣子污穢程度,提取有效值Ie、最大值Im、標準差σ、偏斜度Sk及峭度Ku共五個參量。
1)泄漏電流有效值反映了絕緣子在相同氣候條件下的污穢程度,有效值越大,積污越為嚴重,表達式如下:
式中,T為采樣周期。在線監(jiān)測系統(tǒng)均以離散信號對泄漏電流進行采樣,故將(1)式變型為:
式中,N為采樣點數(shù)。Ii為i時刻泄漏電流值。
2)泄漏電流最大值反映的是絕緣子污穢表面干帶上電流脈沖的大小,其值隨干帶的厚度和寬度的變化而變化,表達式為:
3)泄漏電流標準差反映了脈沖的數(shù)量和泄漏電流畸變情況。脈沖數(shù)量越多,泄漏電流畸變越嚴重,則標準差越大,表達式為:
4)泄漏電流偏斜度Sk,反映以泄漏電流幅值期望值為中心的分布不對稱度:
5)泄漏電流峭度Ku,反映泄漏電流的變化陡度:
絕緣子長期暴露在自然環(huán)境下,會受到各種不良天氣的影響,空氣相對濕度、溫度、降雨、風速等氣象因素會直接影響絕緣子表面的積污程度。
空氣濕度對污穢形成的影響較為顯著。當相對濕度較小時,絕緣子表面的范德華力占據(jù)主導地位,此時污穢物不易粘附;而當濕度較大時,水膜對空氣中染污顆粒的粘附作用增強,絕緣子表面積污速率較快。
溫度對積污的影響較小,溫度常常與空氣相對濕度共同作用才會產(chǎn)生較大影響。當絕緣子處于溫差較大的環(huán)境中,其表面污穢更易受潮,形成冷凌現(xiàn)象,易發(fā)生污閃事故,即。
降雨對絕緣子表面污穢的影響較為復雜,連綿細雨與強降雨對絕緣子影響相反。連綿細雨會使得絕緣子表面形成的水膜對污穢顆粒有較強的吸附和粘附作用。但在強降雨時,絕緣子表面的可溶性污穢會顯著降低,但對難溶性污穢物沖刷較少。故文章對在考慮降雨對污穢的影響時,參考文獻[23]的數(shù)據(jù)觀測結(jié)果,將降雨天氣按照當日24小時降雨量是否超過10mm分為兩類。
風速對絕緣子積污作用是雙面性的,一方面,當風速達到一定強度時,迎風側(cè)積污速率加快;另一方面,當風速超過一定閾值時,強勁的風會吹離絕緣子表面的污穢,但強風會產(chǎn)生渦流效應,使絕緣子背風側(cè)積污加聚。
EFA算法的的核心是在最小化信息丟失的前提下,將多個研究變量整合為幾個易于解釋的因子變量,降低模型的復雜度。通過靈活的因子輪換,使每個因子都具有明確的現(xiàn)實意義。
假設(shè)n個樣本中有p個可觀測變量,X=(x1,x2,…,xp)是標準化后的可觀測變量。原始變量用m(m
模型的矩陣形式由等式(2)給出:
式中,F(xiàn)為原變量X的因子變量,ε為X的特殊因子,A為因子加載矩陣,aij(i=1,2,…,p; j=1,2,…,m)為因子系數(shù)。一般采用0.5原則對原始變量進行篩選,即當因子系數(shù)的絕對值大于0.5時,認為因子變量占原始變量的主導地位[32]。
EFA的具體建模步驟如下:
1)判斷原始變量是否滿足EFA原則。一般采用KMO檢驗和Bartlett球面進行判斷。當采樣充分的KMO測量值大于0.5時,且Bartlett球形檢驗的顯著性水平小于0.05時,所研究變量適用于EFA原則。對原始數(shù)據(jù)進行標準化處理,消除變量間的維數(shù)和數(shù)量級差異對判斷的影響。標準化公式如下:
式中,xi為標準化后的變量,為原始變量的平均值,為原始數(shù)據(jù)的標準差。
2)構(gòu)造因子變量。首先選擇合適的因子個數(shù),通常采用特征值法來確定因子個數(shù)。特征值法用來計算相關(guān)系數(shù)矩陣的特征值,選取大于1的特征值個數(shù)作為因子個數(shù)。然后求解因子矩陣。本研究采用主因子法求解問題。具體公式的特征如下:
3)旋轉(zhuǎn)因子以更好地解釋因子變量。因子旋轉(zhuǎn)分為正交旋轉(zhuǎn)和斜向旋轉(zhuǎn)。前者使因子變量不相關(guān),而后者允許因子變量相關(guān)。本研究采用最大旋轉(zhuǎn)方法對因子變量進行旋轉(zhuǎn),以保證因子變量之間的不相關(guān)性。
4)計算因子得分。計算各因子變量在各樣本上的因子得分,將各因子變量的因子得分作為后續(xù)預測模型中輸入變量的數(shù)據(jù)。EFA模型通過減少原始變量的維數(shù)來簡化問題。
本文提出了基于探索性因子分析的GA-XGBoost組合預測模型。所提模型的詳細步驟如下。
1)通過EFA方法,對p維的原始變量進行降維,得到m個因子變量和每個因子變量在n個樣本上的因子得分。
圖1 EFA-GA-XGBoost組合模型算法流程圖
3)建立XGBoost 預測模型,進行預訓練,并采用GA優(yōu)化模型參數(shù)。
4)判斷是否滿足的終止條件,若滿足,則此時的訓練值作為最優(yōu)參數(shù),否則繼續(xù)優(yōu)化模型參數(shù)。
5)將測試集數(shù)據(jù)輸入探索性因子分析的GA-XGBoost模型,得到預測結(jié)果。