韓明沖,鐘建偉,陳 靜,黃 明,張繼學,鄢 蓓
(1.湖北民族大學 信息工程學院,湖北 恩施 445000;2.國網(wǎng)湖北省電力有限公司恩施供電公司,湖北 恩施 445000)
近年來,“智能配用電網(wǎng)絡”一詞在電氣領域較為熱門,它是為實現(xiàn)電力網(wǎng)的精細智能化管理而誕生的一種網(wǎng)絡。因其優(yōu)點較多,故近年來我國一直在大力推進智能配用電網(wǎng)絡的建設。而對于近年來同樣較為火熱的智能電網(wǎng)而言,智能配用電是其發(fā)展中不可缺少的一個環(huán)節(jié),通過分析用戶的用電行為,可對用戶側進行智能優(yōu)化,以提高供電側電能的質(zhì)量以及供電的可靠性,使得供電方和用電方實現(xiàn)雙贏。配用電的對象是用戶,屬于智能電網(wǎng)的末端,其網(wǎng)絡體積龐大、結構復雜。另外,配用電的業(yè)務類型也較多,這就造成用戶用電行為分析難度較大。但由于前些年智能小區(qū)的流行,既提高了用戶參與智能用電環(huán)節(jié)的積極性,又方便了電網(wǎng)對于用戶側的精細智能管理。又因近年來大數(shù)據(jù)技術發(fā)展迅速,為用戶用電行為的分析提供了一條新的途徑。由于不同家用電器的用電特性有差異,所以即便小區(qū)家庭中用電設備的種類繁多,也為其功能的實現(xiàn)提供了可能。對用戶而言,實現(xiàn)智能用電可以合理控制家庭電器的使用,進而節(jié)省用電開支。對電網(wǎng)來說,通過對用戶用電行為的分析,可以了解到用戶的用電規(guī)律,做到對用電負荷的預測,進而制定合理的送電策略;還能方便進行能效的管理、客戶分類、異常用電檢測以及電力營銷等,這對電網(wǎng)側經(jīng)濟性的提高有著重大意義。另外,用戶用電情況分析也為政府做出產(chǎn)業(yè)調(diào)整、經(jīng)濟調(diào)控等宏觀決策提供了依據(jù)。
隨著聚類技術的蓬勃發(fā)展,電氣領域涌現(xiàn)出了較多基于聚類的機器學習研究。例如,張斌等人使用降維聚類技術分析電力負荷曲線;趙明等人把聚類技術應用于用電負荷峰谷平時段的劃分;黃文思以氣象因素為依據(jù)進行負荷預測。有待解決的問題主要包括電力用戶細分和電力用戶負荷預測。
綜上所述,為了深度挖掘用戶用電行為特性,提升居民在用電行為上的用電效率和電力企業(yè)在電力市場上的份額,本文采用了基于改進K均值聚類算法的用戶用電行為分析方法,對用戶用電數(shù)據(jù)進行預處理后再進行聚類;根據(jù)聚類結果對用戶用電行為進行分析,為供電公司的營銷策略提出改進意見。
K-means算法是聚類算法的一種。所謂聚類,就是根據(jù)某一標準(如距離準則)將研究對象中相似的部分劃分成多個類的過程。每個類中對象的差異性和相似性要盡可能大。對于一個特征矩陣(樣本數(shù)為N),該算法可以將其分割成K個簇(需要人為設定),且這些簇之間沒有交集。同一簇中樣本數(shù)歸為一類,不同簇為不同類別的分類結果。
設定K值,算出聚類中心和簇中數(shù)據(jù)點間的間距并進行多次迭代,以得到最優(yōu)聚類中心,其數(shù)量為K。算法距離的定義采用歐式距離。如圖1中直線OB的長度即為O、B兩點在三維空間中的歐氏距離,其計算公式為:
圖1 三維空間的歐氏距離
簇內(nèi)的所有樣本點到質(zhì)點(聚類中心)距離的平方和的計算公式為:
其中:為一個簇內(nèi)樣本數(shù)量;為每個樣本點的特征數(shù)量;為某一簇內(nèi)的樣本點;為某一簇內(nèi)的聚類中心;為組成點的每個特征;為每個樣本的符號。
整體平方和(Inertia)為數(shù)據(jù)中所有簇內(nèi)平方和之和,如式(3)所示。整體平方和值越小,表示每個簇中樣本差異性越小,即聚類處理效果越佳。
結合以上計算過程及圖2的算法流程可以看出,均值算法在選取聚類中心時,因具有隨機性,故可能出現(xiàn)每次聚類結果差異較大的情況。針對此問題,需要對該算法進行一些改進。
圖2 K-means算法流程
因-means算法隨機選擇聚類中心,故可能使得最終聚類結果不理想,比如初始點都選在一個簇內(nèi)。針對這一缺點,-means++算法誕生,主要是對初始聚類中心的選擇做了改進。首先把值,即初始聚類中心數(shù)確定,然后進行聚類中心的選擇。設算法已完成個中心的選取,在選擇下一個中心時,若此點距離當前個中心點越遠,則其被選概率越大。但如果為1,則此算法與未改進前一樣,即聚類中心隨機選取。換句話說,算法改進前后的區(qū)別在于對初始點的處理,確定好初始點之后,其余步驟都同未改進前一樣。
首先隨機選擇初始聚類中心,然后計算出聚類中心與每個樣本的距離,取其最小值并記為()。根據(jù)式(4)計算每個樣本點被選中的概率(為樣本數(shù)),并不斷計算聚類中心與每個樣本點的距離,直至個中心選取完成。接下來的步驟與原始-means算法相同。
對于用戶用電行為分析,其整個模型功能的實現(xiàn)主要分為以下五步:第一步,導入必要的模塊,從數(shù)據(jù)庫文件中讀取歷史電力負荷數(shù)據(jù);第二步,進行數(shù)據(jù)清洗,即查詢當前數(shù)據(jù)中的空缺值,并把空缺值刪除;第三步,為更好地避免用電行為的差異,過濾掉周末的用電數(shù)據(jù),并將不同的時間分列;第四步,通過聚類模型完成可視化類的構建,以便對數(shù)據(jù)進行分析;第五步,調(diào)用模型得到最終結果。模塊功能實現(xiàn)流程如圖3所示。
圖3 模型功能實現(xiàn)流程
算法試驗在Python3.7環(huán)境下開展,采用Python語言編寫程序,數(shù)據(jù)源自某能源數(shù)據(jù)庫。首先導入從數(shù)據(jù)庫中下載的數(shù)據(jù),然后進行數(shù)據(jù)清洗,即查詢當前數(shù)據(jù)中的空缺值,并把空缺值刪除。本文隨機選取某地區(qū)2015年7月20日的電力負荷數(shù)據(jù),該數(shù)據(jù)中共有213戶用電用戶。假設工作日每天的用電情況相似,過濾掉周末的用電數(shù)據(jù),再隨機選取某一天,得到一組用戶用電負荷數(shù)據(jù);導入得到的數(shù)據(jù),得到該日不同時間不同用戶的用電特征曲線,如圖4所示。圖中顯示的結果規(guī)律性并不明顯,不利于下一步的分析。因此,應對當前得到的數(shù)據(jù)進行聚類處理。
圖4 用戶用電特征曲線
當前數(shù)據(jù)經(jīng)過聚類處理后,聚類數(shù)量與距離的關系曲線如圖5所示。從圖中可以看出,值增加,樣本點與中心點的距離反而較小,反之則增加。
圖5 聚類數(shù)量-距離關系曲線
由聚類數(shù)量-距離關系曲線可知,取值為4或5均可。本文值取5,構建了一個聚類數(shù)量為5的模型。利用模型對數(shù)據(jù)進行分組,各組用電數(shù)據(jù)曲線的對比如圖6所示,圖中黑色粗線為每個聚類的平均值。
圖6 數(shù)據(jù)進行5分類后的結果
為方便觀察和分析,本文把5個聚類結果的平均值曲線放到一張圖中進行對比,繪制出如圖7所示的不同類型用戶用電行為曲線。
圖7 不同類型用戶用電行為曲線
聚類模型根據(jù)用戶用電量的梯度,將213戶用戶分成了5類。
第1類用戶的數(shù)量為77戶。該類用戶的用電量從10:00開始上升,18:00左右用電量達到峰值后開始逐漸下降。該類用戶數(shù)量是五類用戶中最多的,但其整體用電量不算大。此類用戶屬于供電公司的基礎客戶,供電公司應該保持住這類用戶的用電活躍度。
第2類用戶的數(shù)量為15戶,數(shù)量較少。該類用戶的用電量從8:00左右開始增加,且整體來看用電量較多,所以此類用戶可能是某些公司或工廠。
第3類用戶的數(shù)量為56戶,數(shù)量較多,但其全日的用電量一直較低,且一整天波動不大。用戶可能當日出門不在家或是獨居的退休老人。供電公司可以考慮如何提升該類用戶的用電活躍度。
第4類用戶的數(shù)量為63戶,用戶數(shù)量較多,且其全日的用電量變化與第1類用戶類似,可以與第1類用戶歸為一類。區(qū)別就是第4類用戶的日平均用電量較高,但其也是供電公司的基礎客戶。從曲線可以看出,此類用戶的用電峰谷平時段分界明確,供電公司可以此為依據(jù),為其制定更加精確的供電方案和收費策略。
第5類用戶的數(shù)量為2戶,用戶數(shù)量最少。此類用戶的夜間用電量很大,用電曲線起伏也較大,考慮到晚上電價便宜,此類用戶可能是某些大型生產(chǎn)商。
各類用戶具體行為有待結合實際情況做進一步分析。
本文隨機選取了數(shù)據(jù)庫中某一天的數(shù)據(jù)進行了分析,提出了基于聚類算法的用戶用電行為分析方法。經(jīng)過數(shù)據(jù)預處理、聚類個數(shù)的選取,最終采用-means++算法對213戶用戶某工作日的日負荷曲線進行聚類,并對用戶進行用電行為的分析。因大多數(shù)用戶的用電行為是習慣性的,即在一周或者更長時間內(nèi),用戶的電能消耗行為可能一直保持不變,故也可以按此方法確定用戶一周甚至更長時間的功耗習慣和類型。此外,考慮到用戶主要是夜間用戶,供電公司可以考慮降低電價,鼓勵用戶在夜間使用更多的電力,這對電網(wǎng)的健康更有利。通過基于分類模式的用戶日用電量分析,可以更好地了解用戶的用電行為。本文針對每種類型的電力負荷展開用戶用電行為分析,以方便供電公司給用戶提供更合理的套餐服務;同時根據(jù)不同類型的電力消費用戶,收取不同的稅費,并提高系統(tǒng)的電能利用效率,為今后的工作提供可靠的依據(jù)。