詹昕 姚奔 金誠(chéng) 劉燁 沈星汝
摘要:針對(duì)探索線損率真實(shí)成因,進(jìn)而指導(dǎo)配電網(wǎng)儲(chǔ)備項(xiàng)目開發(fā)的問題,提出了基于K-means和主成分回歸的線損率影響因素分析模型。首先,通過K-means將數(shù)據(jù)集中具有相似特征的數(shù)據(jù)聚為同類,進(jìn)而對(duì)每一類數(shù)據(jù)進(jìn)行線損率影響因素分析;接著,選取影響線損率的指標(biāo),完成數(shù)據(jù)歸一化處理后,使用主成分分析法對(duì)指標(biāo)進(jìn)行降維處理;最后,通過線性回歸的方法得到各指標(biāo)對(duì)線損率的影響系數(shù)?;趪?guó)網(wǎng)同期線損系統(tǒng)采集的Y市B區(qū)35 kV電壓等級(jí)用戶數(shù)據(jù),仿真驗(yàn)證了所提基于K-means和主成分回歸的線損率影響因素分析方法的有效性。
關(guān)鍵詞:K-means;主成分分析;線性回歸;線損率;影響因素
0? ? 引言
為緊跟大數(shù)據(jù)時(shí)代的步伐,國(guó)家電網(wǎng)公司已建設(shè)的同期線損管理系統(tǒng)為智能電網(wǎng)的發(fā)展提供了數(shù)據(jù)支撐。線損指的是電能在電網(wǎng)運(yùn)輸過程中以熱能形式散發(fā)的能量損耗[1]。線損率是電力企業(yè)的一項(xiàng)重要綜合性技術(shù)經(jīng)濟(jì)指標(biāo),它能反映出供電企業(yè)的規(guī)劃設(shè)計(jì)、生產(chǎn)技術(shù)和運(yùn)行管理水平。為有效挖掘同期線損管理系統(tǒng)中數(shù)據(jù)的價(jià)值,電力公司需要從戰(zhàn)略高度著眼、戰(zhàn)術(shù)角度入手,將先進(jìn)的數(shù)據(jù)挖掘技術(shù)手段和科學(xué)的系統(tǒng)采集數(shù)據(jù)手段有機(jī)地結(jié)合起來[2]。
1? ? 基于K-means聚類算法的日線損分析
K-means的核心就是將一堆數(shù)據(jù)聚集為K個(gè)簇,每個(gè)簇中都有一個(gè)中心點(diǎn)稱為“均值點(diǎn)”,簇中所有點(diǎn)到該簇的均值點(diǎn)的距離都較到其他簇的均值點(diǎn)更近[3]。
在同期線損管理系統(tǒng)中,選取了Y市B區(qū)35 kV電壓等級(jí)2018年4月—2019年4月的日線損率數(shù)據(jù)。對(duì)完成初步數(shù)據(jù)清洗后的樣本進(jìn)行聚類分析后,數(shù)據(jù)集被聚類為3類,降維后的聚類可視化圖如圖1所示。觀察可視化圖,可認(rèn)為對(duì)數(shù)據(jù)集的聚類效果較好,能將具有相似特征的數(shù)據(jù)劃分為一類。
2? ? 主成分回歸分析
2.1? ? 原理
主成分分析法是通過恰當(dāng)?shù)目臻g變換,使新變量主成分成為原變量的線性組合,并選取少數(shù)幾個(gè)在原始總信息量中占比較大的主成分來分析事物的一種方法[4]。其分析流程如下:
(1)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。假設(shè)原始數(shù)據(jù)具有p個(gè)指標(biāo),且每個(gè)指標(biāo)有n個(gè)觀測(cè)樣本,可得原始觀測(cè)矩陣:
由于主成分是從協(xié)方差矩陣求得的,而協(xié)方差受評(píng)價(jià)指標(biāo)量綱和數(shù)量級(jí)的影響,因此,為克服這一缺陷,需要對(duì)原始指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理:
(2)計(jì)算標(biāo)準(zhǔn)化后的p個(gè)指標(biāo)的協(xié)方差矩陣,即:
(3)計(jì)算相關(guān)矩陣R的特征根和特征向量。首先,求出相關(guān)矩陣R的特征值λi(i=1,2,…,p),并降序排列,即λ1≥λ2≥…≥λp≥0;然后,分別求出各個(gè)特征值所對(duì)應(yīng)的特征向量ei(i=1,2,…,p)。
(4)計(jì)算方差貢獻(xiàn)率ai及累計(jì)方差貢獻(xiàn)率a(k),第i個(gè)主成分yi的方差貢獻(xiàn)率為:
最后,線性回歸的數(shù)學(xué)模型如下所示:
2.2? ? 仿真結(jié)果
基于本文段落1中的聚類分析方法,對(duì)Y市B區(qū)35 kV電壓等級(jí)各類用戶的日線損率數(shù)據(jù)進(jìn)行主成分回歸分析。各類中各指標(biāo)對(duì)線損率的影響系數(shù)如表1所示。
因此可認(rèn)為:在第0類樣本中,對(duì)線損率產(chǎn)生主要影響的是指標(biāo)“其他公司轉(zhuǎn)入”電量,并且呈負(fù)相關(guān)。在第1、2類樣本中,對(duì)線損率產(chǎn)生主要影響的是指標(biāo)“其他電壓等級(jí)輸出”,并呈正相關(guān)[5]。
3? ? 結(jié)語
電力公司已建設(shè)的同期線損管理系統(tǒng)為智能電網(wǎng)的快速發(fā)展提供了海量的數(shù)據(jù)支持。為了挖掘用戶數(shù)據(jù)價(jià)值從而為電力公司提供建設(shè)性的指導(dǎo),本文提出了基于K-means聚類算法、主成分回歸分析方法的線損影響因素分析模型;基于Y市B區(qū)35 kV用戶2018年4月—2019年4月的日線損數(shù)據(jù),仿真分析了影響線損率的主要因素,為電量的有效調(diào)度提供了指導(dǎo)性建議。本文所提的數(shù)據(jù)挖掘方法,對(duì)提升線損管理水平、指導(dǎo)電量調(diào)配等實(shí)際工程問題具有現(xiàn)實(shí)意義,能及時(shí)調(diào)整電網(wǎng)公司降損措施,降低企業(yè)成本,提高企業(yè)效益。
[參考文獻(xiàn)]
[1] 蔣利民,霍大偉,閆華光,等.配電網(wǎng)理論線損計(jì)算方法的數(shù)值分析[J].電測(cè)與儀表,2012,49(9):47-51.
[2] 李超英.基于電網(wǎng)智能化的中低壓線損管理研究[D].天津:天津大學(xué),2011.
[3] 姚勁松,安立進(jìn),黃文思,等.基于KPCA-SVM的同期線損數(shù)據(jù)治理研究[J].計(jì)算機(jī)與數(shù)字工程,2018,46(12):2534-2538.
[4] 陳靜,陶加貴,周前,等.主成分分析在省級(jí)電網(wǎng)線損管理綜合評(píng)價(jià)中的應(yīng)用[J].電力科學(xué)與工程,2016,32(4):36-40.
[5] 袁慧梅,郭喜慶.用遺傳算法輔助設(shè)計(jì)的人工神經(jīng)網(wǎng)絡(luò)計(jì)算配電網(wǎng)線損[J].電網(wǎng)技術(shù),1998,22(12):17-19.
收稿日期:2020-05-06
作者簡(jiǎn)介:詹昕(1987—),男,江蘇揚(yáng)州人,高級(jí)工程師,研究方向:電力系統(tǒng)自動(dòng)化。