摘 要:為了準(zhǔn)確識(shí)別電力營(yíng)銷(xiāo)管理信息平臺(tái)中的線(xiàn)損異常,本文對(duì)其進(jìn)行了相關(guān)研究。從電力營(yíng)銷(xiāo)管理信息平臺(tái)中收集線(xiàn)損相關(guān)數(shù)據(jù),提取線(xiàn)損特征。將改進(jìn)K-medoids聚類(lèi)算法與LOF算法相結(jié)合,計(jì)算2個(gè)線(xiàn)損特征量的歐幾里得距離,并針對(duì)異常線(xiàn)損特征量計(jì)算日線(xiàn)損率,明確具體異常類(lèi)型。實(shí)例證明,本文方法能夠判定對(duì)線(xiàn)損異常,并給出明確的異常類(lèi)型。
關(guān)鍵詞:電力營(yíng)銷(xiāo)管理;線(xiàn)損異常;K-medoids
中圖分類(lèi)號(hào):TP 31" " " 文獻(xiàn)標(biāo)志碼:A
在電力系統(tǒng)中,電力營(yíng)銷(xiāo)管理信息平臺(tái)是保障電網(wǎng)安全,并保證其高效運(yùn)行的重要工具。其中,線(xiàn)損異常識(shí)別是電力營(yíng)銷(xiāo)管理信息平臺(tái)的核心功能之一,對(duì)提高電力資源利用效率、降低運(yùn)營(yíng)成本具有至關(guān)重要的作用。目前,電力營(yíng)銷(xiāo)管理信息平臺(tái)中的線(xiàn)損異常識(shí)別方法主要包括文獻(xiàn)[1]提出的基于K-medoids聚類(lèi)算法的異常低壓臺(tái)區(qū)線(xiàn)損識(shí)別方法研究、文獻(xiàn)[2]提出的基于孤立森林算法的10kV配電網(wǎng)線(xiàn)損異常智能識(shí)別技術(shù)和文獻(xiàn)[3]提出的基于多維特征的電網(wǎng)臺(tái)區(qū)線(xiàn)損數(shù)據(jù)異常識(shí)別方法。文獻(xiàn)[1]方法通?;诖罅康臍v史數(shù)據(jù),對(duì)數(shù)據(jù)的質(zhì)量和完整性要求較高。然而,在實(shí)際電力系統(tǒng)中,各種原因?qū)е碌臄?shù)據(jù)缺失、異常等問(wèn)題使基于統(tǒng)計(jì)學(xué)的分析方法難以準(zhǔn)確識(shí)別線(xiàn)損異常。文獻(xiàn)[2]方法雖然能夠處理復(fù)雜的數(shù)據(jù)模式,但是其模型訓(xùn)練需要大量的標(biāo)注數(shù)據(jù),模型的泛化能力也受到一定限制。此外,該算法的計(jì)算復(fù)雜度較高,對(duì)實(shí)時(shí)性要求較高的線(xiàn)損異常識(shí)別任務(wù)來(lái)說(shuō),難以滿(mǎn)足其快速響應(yīng)的需求。文獻(xiàn)[3]方法雖然能夠處理海量數(shù)據(jù),但是其數(shù)據(jù)預(yù)處理和特征提取過(guò)程較復(fù)雜,對(duì)數(shù)據(jù)的質(zhì)量和多樣性要求較高。此外,數(shù)據(jù)挖掘技術(shù)的結(jié)果解釋性較差,難以直接用于指導(dǎo)電網(wǎng)的運(yùn)維和管理。針對(duì)以上方法的不足,本文探索了一種更高效、準(zhǔn)確的電力營(yíng)銷(xiāo)管理信息平臺(tái)線(xiàn)損異常識(shí)別方法。
1 電力營(yíng)銷(xiāo)管理信息平臺(tái)中的線(xiàn)損特征提取
從電力營(yíng)銷(xiāo)管理信息平臺(tái)中收集與線(xiàn)損相關(guān)的數(shù)據(jù)。登錄電力營(yíng)銷(xiāo)管理信息平臺(tái),找到數(shù)據(jù)導(dǎo)出功能。導(dǎo)出的數(shù)據(jù)類(lèi)型包括供電量、售電量(或用電量)、電壓、電流、功率因數(shù)、線(xiàn)路長(zhǎng)度和設(shè)備參數(shù)(例如變壓器容量、電阻值等),以Excel格式導(dǎo)出[4]。
在電力營(yíng)銷(xiāo)管理信息平臺(tái)上獲取電網(wǎng)分段線(xiàn)損數(shù)據(jù)包后,需要進(jìn)行數(shù)據(jù)清洗,以糾正錯(cuò)誤并填充缺失和不一致數(shù)據(jù),保證分析的準(zhǔn)確性。K近鄰填充基于相似性來(lái)預(yù)測(cè)缺失值,具有一定的準(zhǔn)確性和可靠性,如公式(1)所示。
(1)
式中:y表示填充后的數(shù)值;xi表示與缺失值相似的k個(gè)已知數(shù)值;k表示近鄰數(shù)。
數(shù)據(jù)填充后對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將電壓、電流等物理量轉(zhuǎn)換為統(tǒng)一單位。數(shù)據(jù)標(biāo)準(zhǔn)化是將數(shù)據(jù)轉(zhuǎn)換為均值為0、標(biāo)準(zhǔn)差為1的分布。數(shù)據(jù)y的標(biāo)準(zhǔn)化數(shù)學(xué)表達(dá)式如公式(2)所示。
(2)
式中:μ表示數(shù)據(jù)y的均值;σ表示數(shù)據(jù)y的標(biāo)準(zhǔn)差。
針對(duì)上述預(yù)處理后的線(xiàn)損數(shù)據(jù),利用小波變換進(jìn)行線(xiàn)損數(shù)據(jù)特征提取。小波變換具有時(shí)頻局部化特性,能夠在時(shí)間和頻率上提供較好的分辨率,即小波變換可以準(zhǔn)確地描述數(shù)據(jù)的瞬態(tài)特征和局部變化。在此基礎(chǔ)上,提取各個(gè)頻段中的線(xiàn)損特征,重構(gòu)第三層節(jié)點(diǎn),此時(shí)其電流可以表示為公式(3)。
S={S1+S2+…+Sn} (3)
式中:S表示線(xiàn)損數(shù)據(jù)包中的電流數(shù)據(jù)集合;S1、S2、…、Sn表示各個(gè)頻段的電流。
進(jìn)而計(jì)算各個(gè)頻帶數(shù)據(jù)的總能量,如公式(4)所示。
(4)
式中:E1j表示總能量;S1j(t)表示各頻帶電流數(shù)據(jù);xj表示信號(hào)頻率;n表示離散數(shù)據(jù)數(shù)量;k表示離散點(diǎn)幅值。
出現(xiàn)異常情況后,電網(wǎng)會(huì)受到影響,需要利用能量數(shù)據(jù)創(chuàng)建線(xiàn)損數(shù)據(jù)特征量,即T={T1+T2+…+Tn}。對(duì)線(xiàn)損數(shù)據(jù)特征量進(jìn)行歸一化處理,如公式(5)所示。
(5)
式中:E表示特征量總和。
計(jì)算上述公式,得到后續(xù)線(xiàn)損異常識(shí)別所需線(xiàn)損特征。這些特征量直觀地描述了電網(wǎng)的線(xiàn)損情況,可以直接用于后續(xù)的異常識(shí)別算法中。
2 異常線(xiàn)損識(shí)別
在電力營(yíng)銷(xiāo)管理信息平臺(tái)中,線(xiàn)損異常識(shí)別需要明確目標(biāo)和原因,進(jìn)行快速、準(zhǔn)確識(shí)別。結(jié)合業(yè)務(wù)需求和數(shù)據(jù)特性,本文以改進(jìn)的K-medoids聚類(lèi)算法為核心,對(duì)線(xiàn)損特征進(jìn)行聚類(lèi)分析,并利用LOF算法優(yōu)化日線(xiàn)損率數(shù)據(jù),以提高識(shí)別效率和準(zhǔn)確性[5]。假設(shè)2個(gè)線(xiàn)損特征量分別為E1和E2,那么其歐幾里得距離可表示為公式(6)。
(6)
式中:d(E1,E2)表示2個(gè)線(xiàn)損特征量歐幾里得距離;E1n…E1m表示線(xiàn)損特征量E1的分量;E2n…E2m表示線(xiàn)損特征量E2的分量。
根據(jù)上述內(nèi)容,計(jì)算每2個(gè)數(shù)據(jù)特征間的歐幾里得距離,并設(shè)置距離閾值。如果超過(guò)閾值距離,那么說(shuō)明存在線(xiàn)損異常;如果不超過(guò)閾值距離,那么說(shuō)明不存在線(xiàn)損異常。計(jì)算線(xiàn)損異常的日線(xiàn)損率,如公式(7)所示。
R=(X/W)×100% (7)
式中:R表示日線(xiàn)損率;X表示日線(xiàn)損電量;W表示日供電量。
在臺(tái)區(qū)電力管理過(guò)程中,為了精確識(shí)別和分析線(xiàn)損情況,本文將線(xiàn)損狀態(tài)分為正常(0%~10%)、高損(gt;10%)和負(fù)損(lt;0%)3種類(lèi)型[6]。電力故障、管理問(wèn)題或數(shù)據(jù)錯(cuò)誤可能會(huì)導(dǎo)致出現(xiàn)高損和負(fù)損狀態(tài),需要及時(shí)排查。為了高精度劃分線(xiàn)損狀態(tài)并減少異常值影響,本文采用K-medoids聚類(lèi)和LOF算法,并利用分布式計(jì)算技術(shù)處理數(shù)據(jù),以實(shí)現(xiàn)高效的離群點(diǎn)檢測(cè)與分類(lèi)。具體步驟如下所示。
為了優(yōu)化日線(xiàn)損率數(shù)據(jù),引入LOF算法,可達(dá)距離reachdist(a,b)考慮了數(shù)據(jù)點(diǎn)與其近鄰間的歐氏距離和最近鄰距離,有助于區(qū)分?jǐn)?shù)據(jù)點(diǎn)是否與其鄰近點(diǎn)緊密相關(guān),也是離群點(diǎn)檢測(cè)的基礎(chǔ),如公式(8)所示。
Ra,b=max{d(a,b),d(b,Nb)} (8)
式中:Ra,b表示可達(dá)距離;d(a,b)表示點(diǎn)a、b間的歐氏距離;Nb表示b的最近鄰。
局部可達(dá)密度lrd(a)反映了數(shù)據(jù)點(diǎn)周?chē)鷧^(qū)域的密度情況。區(qū)域的密度越高,數(shù)據(jù)點(diǎn)越可能是正常點(diǎn);相反,區(qū)域密度越低,數(shù)據(jù)點(diǎn)越可能是離群點(diǎn),如公式(9)所示。
lrd(a)=1/(1/k×∑Rd) (9)
式中:lrd(a)表示數(shù)據(jù)點(diǎn)a的局部可達(dá)密度;k表示近鄰數(shù)目;Rd表示數(shù)據(jù)點(diǎn)b的可達(dá)距離。
數(shù)據(jù)點(diǎn)a的近鄰平均局部可達(dá)密度A(Nka)可表示為公式(10)。
A(Nka)=1/k×lrd(a) (10)
上述步驟能夠比較數(shù)據(jù)點(diǎn)的局部可達(dá)密度及其近鄰的平均密度,有效識(shí)別離群點(diǎn),從而清晰劃分日線(xiàn)損率數(shù)據(jù),揭示臺(tái)區(qū)電力損失情況,有助于及時(shí)發(fā)現(xiàn)問(wèn)題并優(yōu)化電力管理。
3 實(shí)例應(yīng)用分析
3.1 參數(shù)設(shè)置
為了驗(yàn)證本文識(shí)別方法的應(yīng)用有效性,以某地區(qū)某臺(tái)區(qū)為例,采集電力營(yíng)銷(xiāo)管理信息平臺(tái)在運(yùn)行過(guò)程中產(chǎn)生的數(shù)據(jù),對(duì)線(xiàn)損異常情況進(jìn)行識(shí)別。運(yùn)行環(huán)境中包括Oracle數(shù)據(jù)庫(kù)、Tomcat服務(wù)器和Windows XP/7客戶(hù)端操作系統(tǒng)。該臺(tái)區(qū)為期16d的日線(xiàn)損率數(shù)據(jù)見(jiàn)表1。
將表1中的數(shù)據(jù)作為本文方法的識(shí)別樣本,根據(jù)上述數(shù)據(jù)中的線(xiàn)損異常識(shí)別比較情況,對(duì)本文方法進(jìn)行初步訓(xùn)練。
3.2 線(xiàn)損率情況記錄與分析
利用訓(xùn)練后的方法對(duì)臺(tái)區(qū)運(yùn)行30d內(nèi)的線(xiàn)損率情況進(jìn)行識(shí)別與監(jiān)測(cè)。平臺(tái)運(yùn)行30d內(nèi)每天線(xiàn)損率情況如圖1所示。
分析圖1可知,在連續(xù)30d的監(jiān)測(cè)周期內(nèi),前4天出現(xiàn)了顯著的線(xiàn)損率異常波動(dòng)現(xiàn)象。為了深入探究該現(xiàn)象背后的原因,本文分析了臺(tái)區(qū)電力數(shù)據(jù)的處理流程,發(fā)現(xiàn)偶發(fā)的大電量用戶(hù)數(shù)據(jù)采集問(wèn)題可能是導(dǎo)致這種異常波動(dòng)的關(guān)鍵因素。具體來(lái)說(shuō),如果某個(gè)大電量用戶(hù)在某一天因某種原因(例如設(shè)備故障、通信中斷等)未能成功采集電量數(shù)據(jù),次日數(shù)據(jù)采集恢復(fù)正常,但是系統(tǒng)可能基于某種機(jī)制同時(shí)采集了前一日和當(dāng)日的電量數(shù)據(jù),就會(huì)對(duì)線(xiàn)損率的計(jì)算結(jié)果產(chǎn)生顯著影響。
3.3 試驗(yàn)指標(biāo)
在電力營(yíng)銷(xiāo)管理信息平臺(tái)中線(xiàn)損異常識(shí)別方法的研究中,AUC(Area Under the Curve)評(píng)價(jià)指標(biāo)具有重要作用。AUC是ROC曲線(xiàn)(Receiver Operating Characteristic Curve)下的面積,ROC曲線(xiàn)是一種描述分類(lèi)模型性能的圖形,其橫軸代表假陽(yáng)性率FPR(False Positive Rate,F(xiàn)PR),縱軸代表真陽(yáng)性率TPR(True Positive Rate)。AUC值能夠直觀反映模型在識(shí)別異常數(shù)據(jù)方面的能力,如公式(11)所示。
(11)
式中:FP為假陽(yáng)性,被錯(cuò)誤地預(yù)測(cè)為正例的樣本數(shù);TN為真陰性,被正確地預(yù)測(cè)為負(fù)例的樣本數(shù);TP為真陽(yáng)性,被正確地預(yù)測(cè)為正例的樣本數(shù);FN為假陰性,被錯(cuò)誤地預(yù)測(cè)為負(fù)例的樣本數(shù)。
3.4 線(xiàn)損異常識(shí)別結(jié)果分析
在本例中,剔除前4天的異常數(shù)據(jù)點(diǎn),使用剩余的數(shù)據(jù)作為訓(xùn)練集來(lái)訓(xùn)練本文的識(shí)別方法。訓(xùn)練完畢后,記錄了接下來(lái)5天的線(xiàn)損情況,結(jié)果見(jiàn)表2。
分析表1可知,在連續(xù)5d的監(jiān)測(cè)期內(nèi),前2天出現(xiàn)了明顯的線(xiàn)損異常情況。具體來(lái)說(shuō),第一天的線(xiàn)損率低于0%,根據(jù)上述線(xiàn)損狀態(tài)劃分標(biāo)準(zhǔn),該狀態(tài)為負(fù)損狀態(tài)。負(fù)損狀態(tài)通常反映了可能存在的數(shù)據(jù)采集錯(cuò)誤、電表計(jì)量異?;螂娏芾聿呗圆划?dāng)?shù)葐?wèn)題,需要引起臺(tái)區(qū)管理者的高度重視。在第二天的數(shù)據(jù)中,線(xiàn)損率超過(guò)10%的閾值,為高損狀態(tài)。由此可見(jiàn),本文方法不僅能夠?qū)€(xiàn)損異常情況進(jìn)行有效識(shí)別,而且能夠準(zhǔn)確判斷線(xiàn)損的具體異常狀態(tài),提高了臺(tái)區(qū)電力管理的效率和準(zhǔn)確性,也為臺(tái)區(qū)管理提供了有力的數(shù)據(jù)支持,有助于管理者更好地掌握臺(tái)區(qū)內(nèi)的電力損失情況,從而制定更科學(xué)、合理的電力管理策略。
利用ROC曲線(xiàn)對(duì)本文算法、文獻(xiàn)[1]算法和文獻(xiàn)[2]算法的電力營(yíng)銷(xiāo)管理信息平臺(tái)中線(xiàn)損異常識(shí)別精度進(jìn)行測(cè)試,結(jié)果如圖2所示。
ROC曲線(xiàn)與橫坐標(biāo)圍成的面積為AUC,AUC越大,表明特征提取精度越高。由圖2可知,本文算法的AUC面積最大,文獻(xiàn)[1]算法的AUC值小于所提算法,但是仍然處于一個(gè)相對(duì)較高的水平,文獻(xiàn)[2]算法的AUC值最小,說(shuō)明在3種算法中,其識(shí)別精度相對(duì)較低??梢?jiàn)本文算法在試驗(yàn)中具有較高的識(shí)別精度,因此具有廣闊的應(yīng)用前景。電力營(yíng)銷(xiāo)管理信息平臺(tái)可以利用該算法對(duì)線(xiàn)損異常進(jìn)行實(shí)時(shí)監(jiān)測(cè)和預(yù)警,從而幫助電力企業(yè)及時(shí)發(fā)現(xiàn)并解決問(wèn)題,提高電力供應(yīng)的可靠性和穩(wěn)定性。
為驗(yàn)證本文設(shè)計(jì)方法的時(shí)效性,進(jìn)行識(shí)別時(shí)間預(yù)測(cè),3種方法的預(yù)測(cè)結(jié)果見(jiàn)表3。
由表3可以看出,隨著迭代次數(shù)增加,本文方法的識(shí)別時(shí)間普遍較低,穩(wěn)定在較低水平(5s~9s)。文獻(xiàn)[1]方法的識(shí)別時(shí)間相對(duì)較長(zhǎng),隨著迭代次數(shù)增加,雖然其識(shí)別時(shí)間有波動(dòng),但是總體保持在較高水平(22s~25s)。文獻(xiàn)[2]方法的識(shí)別時(shí)間最長(zhǎng),在不同迭代次數(shù)下波動(dòng)較大(30s~36s)。結(jié)果表明本文方法具有較高的計(jì)算效率和穩(wěn)定性。該結(jié)果驗(yàn)證了本文設(shè)計(jì)方法在時(shí)效性方面的優(yōu)越性,為實(shí)際應(yīng)用提供了有力支持。
4 結(jié)語(yǔ)
本文圍繞電力營(yíng)銷(xiāo)管理信息平臺(tái)中線(xiàn)損異常識(shí)別方法進(jìn)行了深入研究,對(duì)現(xiàn)有方法進(jìn)行了梳理和分析,指出了現(xiàn)有方法的不足之處,并提出了基于機(jī)器學(xué)習(xí)和大數(shù)據(jù)技術(shù)的線(xiàn)損異常識(shí)別方法。該方法不僅具有較高的識(shí)別準(zhǔn)確率和實(shí)時(shí)性,而且能夠處理多源異構(gòu)數(shù)據(jù),為電網(wǎng)的運(yùn)維和管理提供了有力支持。展望未來(lái),隨著智能電網(wǎng)技術(shù)不斷發(fā)展,電力營(yíng)銷(xiāo)管理信息平臺(tái)中的線(xiàn)損異常識(shí)別方法將不斷優(yōu)化和完善。同時(shí),隨著新型電力系統(tǒng)建設(shè)推進(jìn),電力營(yíng)銷(xiāo)管理信息平臺(tái)將發(fā)揮更重要的作用。因此,本文的研究成果不僅具有重要的理論價(jià)值,而且具有廣泛的實(shí)際應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]呂家慧.基于K-medoids聚類(lèi)算法的異常低壓臺(tái)區(qū)線(xiàn)損識(shí)別方法研究[J].信息與電腦(理論版),2023,35(24):61-63.
[2]李卉祥.基于孤立森林算法的10kV配電網(wǎng)線(xiàn)損異常智能識(shí)別技術(shù)[J].裝備維修技術(shù),2023(6):53-56.
[3]林寶德,楊錚宇.基于多維特征的電網(wǎng)臺(tái)區(qū)線(xiàn)損數(shù)據(jù)異常識(shí)別研究[J].電力系統(tǒng)保護(hù)與控制,2022,50(9):172-178.
[4]錢(qián)利宏,彭穗,郭曉燕,等.基于數(shù)據(jù)驅(qū)動(dòng)的低壓配電臺(tái)區(qū)線(xiàn)損分層統(tǒng)計(jì)與異常診斷方法[J].自動(dòng)化與儀器儀表,2023(8):232-235,239.
[5]郭飛,吳佳靜,周怡,等.考慮氣象因素的臺(tái)區(qū)線(xiàn)損異常智能識(shí)別模型及應(yīng)用[J].寧夏電力,2022(6):26-32.
[6]胡壯麗,羅毅初,陳雪.考慮分布式新能源接入的智能配電網(wǎng)線(xiàn)損異常定位系統(tǒng)[J].環(huán)境技術(shù),2023,41(9):111-115.