● 湖南·國網(wǎng)永州供電公司 蔣 濤 湯新華 李 娟
線變關(guān)系是指供電企業(yè)線路與變壓器之間的對應(yīng)關(guān)系,通常每臺變壓器都連接到固定的線路上,線變關(guān)系正確與否將直接影響到配電搶修效率和優(yōu)質(zhì)服務(wù)質(zhì)量的好壞,同時也決定著線損計算正確與否。目前核對線變關(guān)系的主要方法是現(xiàn)場核對,通過現(xiàn)場與圖紙、系統(tǒng)對比,發(fā)現(xiàn)差異并整改問題,實現(xiàn)三者的統(tǒng)一。對配電變壓器新增、改接、銷戶引起的線變關(guān)系變動要加強管理,確保系統(tǒng)檔案與現(xiàn)場一致,避免前清后亂。實際工作中,受多種因素影響,線變關(guān)系在系統(tǒng)檔案中會出現(xiàn)與現(xiàn)場不一致的情況,管理人員難以及時發(fā)現(xiàn)檔案中存在的問題。
基于“同一線路終端停電時間一致”原理,永州供電公司利用數(shù)據(jù)挖掘技術(shù)建立識別模型,為識別檔案中線變關(guān)系正確與否提供一種新的手段,可以極大地提高線變關(guān)系核對效率,減少大量的人工操作。
隨著電力采集終端在現(xiàn)場安裝率和運行穩(wěn)定性的不斷提高,利用其對現(xiàn)場臺區(qū)運行狀況進行監(jiān)測已成為現(xiàn)實?,F(xiàn)場運行的終端根據(jù)自身供電情況產(chǎn)生對停/上電的判斷,并將判斷結(jié)果主動上報形成停/上電記錄,記錄僅局限于對單個終端的運行工況。
停電事件的生成包括終端停/上電和電能表掉電事件的生成。本文僅分析與線路有關(guān)的臺區(qū)停電數(shù)據(jù),因此重點研究終端停/上電數(shù)據(jù)的生成。
根據(jù)《智能電能表及采集終端事件記錄采集規(guī)則》,終端停/上電事件為1級緊急事件,終端生成事件后,采集終端采用光纖、手機網(wǎng)絡(luò)等方式主動上報事件數(shù)據(jù)到主站,而后主站向終端下發(fā)確認命令。
由于用電現(xiàn)場環(huán)境復(fù)雜、情況多變,采集終端可能由于供電回路異常、軟件設(shè)計差異、通道通信、終端時鐘等原因,出現(xiàn)現(xiàn)場未停電情況下生成停電事件并主動上報主站,或是發(fā)生了一次停電卻多次上報停電事件等情況。因此,在利用停電數(shù)據(jù)進行數(shù)據(jù)分析時,要充分研究停電事件生成原理,掌握終端停/上電數(shù)據(jù)質(zhì)量的影響因素,對誤報干擾信息進行清理,保留有價值的數(shù)據(jù)。
終端停/上電數(shù)據(jù)來源為“電力用戶用電信息采集系統(tǒng)”中的主站停/上電事件查詢,由縣供電公司分月導出。整個實現(xiàn)過程分成5個步驟,分別是數(shù)據(jù)可視化、數(shù)據(jù)清洗、數(shù)圖轉(zhuǎn)換、聚類分析和結(jié)果可視化,其中數(shù)據(jù)清洗、數(shù)圖轉(zhuǎn)換、聚類分析3個步驟重點在于對數(shù)據(jù)進行處理,由于涉及到大數(shù)據(jù)量的計算,可以通過Python編程形成一個可執(zhí)行文件自動完成;數(shù)據(jù)可視化和結(jié)果可視化使用Tableau工具完成,最終結(jié)果是形成停電圖紋PDF文件和異動臺區(qū)Excel文件。
根據(jù)電力用戶用電信息采集系統(tǒng)主站停/上電查詢界面,其數(shù)據(jù)是以停電事件為記錄,即每一個記錄代表每一個終端上報的停/上電事件,對終端一次完整的停/上電事件進行記錄,數(shù)據(jù)包括用戶編號、線路名稱、停電發(fā)生時間和停電結(jié)束時間。
停電數(shù)據(jù)可視化有助于了解、發(fā)現(xiàn)數(shù)據(jù)的特點。利用Tableau工具可以對終端停/上電數(shù)據(jù)進行可視化分析并得到結(jié)果??梢暬Y(jié)果以單個臺區(qū)為記錄,反映單個臺區(qū)在一段時間(本文取1個月)內(nèi)的停電時間和停電時長,每一個條紋代表一次停電,每個條紋位置對應(yīng)停電時間點,條紋的寬度代表停電時長。由此可以發(fā)現(xiàn)每個臺區(qū)的停電圖形有其自身的獨特性,類似于人類的“指紋”,為此,筆者提出了“停電圖紋”的概念,通過特定停電圖紋可以快速地識別一個臺區(qū)。據(jù)此可以利用停電圖紋的相似性來聚類臺區(qū),將停電圖紋相似度極高(即多次停電相同)的臺區(qū)歸成一類,然后將聚類結(jié)果與檔案數(shù)據(jù)比對,把有差異的情況視為異動。
通過對業(yè)務(wù)數(shù)據(jù)形成的理解和停電數(shù)據(jù)的分析,發(fā)現(xiàn)停/上電數(shù)據(jù)質(zhì)量上存在問題,主要表現(xiàn)在:停電時間不規(guī)范,標準停電時間格式為yyyy/m/d h:mm,不規(guī)范停電缺失時間格式為yyyy/m/d,經(jīng)過分析,缺失時間以0點0分為主,解決辦法是按標準格式補齊數(shù)據(jù)。
另外,為提高聚類分析的準確度,聚類分析使用的停電圖紋要基于多次停/上電的數(shù)據(jù),因此要清洗掉分析數(shù)據(jù)中停電次數(shù)僅為一次的臺區(qū)數(shù)據(jù)。
通過數(shù)據(jù)分析,發(fā)現(xiàn)即使是同一時間同一線路的臺區(qū)數(shù)據(jù)中的停電時間也存在不一致的情況,時間偏差集中在1~5分鐘,最大偏差可達30分鐘,存在這種現(xiàn)象的原因是終端時鐘不一致所致。鑒于停電偏差的問題,直接使用時間點來聚類的效果會很差,通過使用停電圖紋可以有效避免時間偏差的問題,提高數(shù)據(jù)分析成效。
以2月份國網(wǎng)道縣供電公司道萬線三角街臺區(qū)(采集點)為例,該臺區(qū)共停電4次,總停電時長598分鐘。經(jīng)過數(shù)據(jù)可視化,轉(zhuǎn)換成4個條紋,對應(yīng)相應(yīng)的時間點、時長等停電特征,形成了該臺區(qū)2月份的停電圖紋,如圖1所示。
圖1 停電圖紋數(shù)圖轉(zhuǎn)換過程
把可視化的停電圖紋以數(shù)字的方法存儲,首先建立以分鐘為顆粒度的時間序列,以一個月30天計算,時間序列長度為30×24×60=43200個單元,每一個單元表示該臺區(qū)在這一分鐘是否停電,未停電為0,停電為1,最終形成該臺區(qū)停電圖紋序列。將當月所有臺區(qū)停電序列放在一起,就形成了當月的停電圖紋矩陣,在此數(shù)據(jù)基礎(chǔ)上再開展圖紋相似度的計算。
2.4.1 聚類算法選擇
聚類是將物理對象或抽象對象的集合分成由類似的對象組成的多個類的過程,聚類是一種無監(jiān)督學習。本文使用的聚類算法是DBSCAN算法,它是一個有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。DBSCAN算法不需要事先知道要形成的簇類的數(shù)量,可以發(fā)現(xiàn)任意形狀的簇類,并能夠識別出噪聲點,且對于數(shù)據(jù)庫中樣本的順序不敏感。正是基于以上特點,本文選擇了DBSCAN算法作為實現(xiàn)過程中的聚類算法。
2.4.2 聚類算法實現(xiàn)
利用Python編程對停電圖紋進行聚類,在結(jié)果數(shù)據(jù)中增加3個字段:歸類、問題歸類、異常點。歸類是聚類算法計算的直接結(jié)果,算法以圖紋相似大于90%為條件,將臺區(qū)自動聚類,聚類結(jié)果以自然數(shù)(0、1、2 ...)標記歸類,每一個歸類將停電特征相近的臺區(qū)進行統(tǒng)一標記編號。
問題歸類是指同一歸類中,當出現(xiàn)多個不唯一的線路名稱時視為問題,將同一歸類中線路名稱種類不為1的歸類標記為問題歸類。
異常點是在問題歸類中查找線變關(guān)系有可能出錯的臺區(qū),按同線路臺區(qū)出現(xiàn)數(shù)量的多少為判斷,數(shù)量少的線路名稱上的臺區(qū)為異常點,算法默認線變關(guān)系中多數(shù)臺區(qū)的線變關(guān)系是正確的。
聚類算法的結(jié)果利用Tableau工具進行可視化處理成停電圖紋。通過停電圖紋,可以發(fā)現(xiàn)檔案在道萬線上的三角街臺區(qū)與道上線的其它臺區(qū)停電圖紋非常相似。對于停電時間和時長如此相似的臺區(qū),筆者初步判定道萬線三角街臺區(qū)、道縣上關(guān)鄉(xiāng)石門村油茶基地臺區(qū)位于道上線上,這2個臺區(qū)檔案可能存在問題,將此異動下發(fā)到基層單位進行核對,結(jié)果證明判斷正確。
整個實現(xiàn)過程將數(shù)據(jù)可視化技術(shù)和數(shù)據(jù)挖掘技術(shù)緊密結(jié)合,通過編程方法進行封裝,操作人員只需要按要求提供有效的終端停/上電數(shù)據(jù),一個程序、一張圖即可通過停電圖紋識別線變關(guān)系。
在實現(xiàn)工作中,模型能發(fā)現(xiàn)和解決很多問題,但同時仍存在一些問題,比如單個母線多次停電導致多條不同線路停電圖紋一致,臺區(qū)單次停電較長會影響相似度的對比,程序界面不友好,分析數(shù)據(jù)基于離線數(shù)據(jù),這些都是下一步需要改進的地方。
停電圖紋識別線變關(guān)系是對停電數(shù)據(jù)的挖掘和應(yīng)用,充分挖掘停電數(shù)據(jù)的價值。通過數(shù)據(jù)分析,可以大大降低業(yè)務(wù)部門現(xiàn)場核查的工作量,同時形成有效的監(jiān)督手段,充分利用數(shù)據(jù)來督辦現(xiàn)場工作。