張國賓,王曉蓉,鄧春宇
中國電力科學(xué)研究院,北京 100192
配變臺區(qū)作為面向低壓用戶的最末一級供電單位,臺區(qū)供電設(shè)備的運行狀態(tài)直接影響臺區(qū)內(nèi)的供電質(zhì)量。設(shè)備的重過載運行是引起故障停電的主要原因之一,而重過載現(xiàn)象通常也伴隨著三相不平衡、電壓偏移等其他問題,嚴(yán)重影響用戶安全可靠用電。此外,設(shè)備長時間處于重過載狀態(tài)會加快元件的非正常損耗,降低設(shè)備使用壽命,給電網(wǎng)帶來故障隱患和運行風(fēng)險。因此,臺區(qū)重過載治理一直是配網(wǎng)運維檢修工作的重要內(nèi)容。
目前,對于配變臺區(qū)的重過載治理通常分為事中監(jiān)測和事后處理兩個階段,即實時監(jiān)測配變運行情況,在發(fā)現(xiàn)重過載事件后,向運維人員發(fā)出告警信息,然后由現(xiàn)場專工根據(jù)具體情況采取相應(yīng)措施進行處理。在大部分情況下,考慮到實際工況中允許設(shè)備短時間重過載運行,為保證持續(xù)供電,對一般的重過載事件只進行監(jiān)測,對頻繁出現(xiàn)重過載的配變進行報備,并列入周期性技術(shù)改造大修計劃。而對于可能或已經(jīng)造成停電的重過載事件,可以通過切改用戶線路或臨時替換大容量變壓器消除重過載現(xiàn)象,但臨時停電依然不可避免。
在現(xiàn)有設(shè)備水平和電網(wǎng)運行技術(shù)條件下,較為理想的重過載治理方式仍是通過合理地安排技術(shù)改造大修計劃,及時進行調(diào)整用戶線路和配變增容,減少非計劃停電。因此開展重過載影響因素分析并實現(xiàn)事前預(yù)測,對于及時發(fā)現(xiàn)重過載隱患、優(yōu)化設(shè)備升級改造計劃具有重要作用[1]。
在理論研究方面,參考文獻[2,3]分析了氣象指標(biāo)、用電類別、行業(yè)類別與配變重過載發(fā)生概率的變化關(guān)系,并就可能的重過載成因進行了初步探討,最后利用基于隨機森林理論改進的決策樹模型對配變重過載狀態(tài)進行預(yù)測。參考文獻[4]面向負荷增長較快的高速發(fā)展區(qū)域,從用戶、氣象和歷史負荷出發(fā),提出基于邏輯回歸的重過載中長期預(yù)測方法,但未給出邏輯回歸模型中各項參數(shù)的選擇過程,方法中對重過載的定義也與參考文獻[2]中不同。參考文獻[5]針對春節(jié)期間的重過載現(xiàn)象,提出基于BP神經(jīng)網(wǎng)絡(luò)與灰色模型的重過載預(yù)測方法。將春節(jié)前后配電變壓器的負荷變化作為模型輸入對負載率進行預(yù)測,進而判斷設(shè)備重過載情況。通過該方法獲取的重過載預(yù)測模型不具備泛化能力,也不能適應(yīng)大規(guī)模配電網(wǎng)的快速分析。參考文獻[6]以一周為周期,對6 000個居民用戶臺區(qū)每周同一天共7類負荷曲線進行了研究,并加入氣象和經(jīng)濟數(shù)據(jù),采用不同的機器學(xué)習(xí)方法對負荷曲線進行了預(yù)測。但該方法忽略了負荷的季度年度規(guī)律,且對異常值較為敏感,預(yù)測效果受到了影響。參考文獻[7]基于線性回歸模型討論了在聚合和分解兩種模型處理下預(yù)測效果的差異,通過算例說明了通過對訓(xùn)練節(jié)點進行分解能夠有效提高負荷預(yù)測精度,但算例只采用了天氣和時間數(shù)據(jù)用于模型訓(xùn)練,對配變負荷影響因素分析不足。參考文獻[8]提出了一種趨勢分析與指數(shù)加權(quán)模型的超短期負荷預(yù)測方法,該方法能夠提高對負荷峰谷的預(yù)測精度,且對負荷缺失值和異常值有較好的適應(yīng)性。參考文獻[9]在基本的氣象指標(biāo)之外,研究了風(fēng)寒指數(shù)、空氣污染指數(shù)、人體舒適指數(shù)等氣象指數(shù)與配變重過載的關(guān)系,在此基礎(chǔ)上運用小波神經(jīng)網(wǎng)絡(luò)(wavelet neural network,WNN)模型對配變負荷進行預(yù)測。
在應(yīng)用實踐方面,國網(wǎng)黑龍江省電力有限公司哈爾濱供電公司[10]依托運監(jiān)中心數(shù)據(jù)開展重過載監(jiān)測,同時利用配電變壓器型號、設(shè)備容量、運行年限等設(shè)備臺賬信。國網(wǎng)福建省電力有限公司福州供電公司[11]針對城網(wǎng)公變開展重過載預(yù)測研究,從風(fēng)險角度對重過載配電變壓器進行多方面綜合評估,能夠在一定程度上指導(dǎo)運維工作,但模型效果仍有提升空間。
由上可見,目前的研究大多數(shù)仍然以配變負荷預(yù)測為切入點,包括利用歷史負荷數(shù)據(jù)外推負荷的典型變化規(guī)律,加入氣象條件、經(jīng)濟指標(biāo)等外部間接因素分析與負荷的關(guān)聯(lián)程度,嘗試采用各類機器學(xué)習(xí)方法構(gòu)建負荷預(yù)測模型,最后基于負荷預(yù)測結(jié)果對重過載進行判斷。但目前各類負荷預(yù)測方法在預(yù)測精度上的局限性導(dǎo)致基于負荷預(yù)測結(jié)果的重過載預(yù)測不能適應(yīng)業(yè)務(wù)實際情況。對于短期負荷預(yù)測,考慮到目前消除重過載的手段以實施周期較長的線路切改和設(shè)備改造為主,短期的預(yù)測結(jié)果不足以提供足夠的時間裕度消除重過載隱患;對于中長期負荷預(yù)測,考慮到臺區(qū)負荷的突變性和波動性,負荷預(yù)測結(jié)果本身不能滿足對重過載進行判斷的基本精度。
本文直接以重過載事件為目標(biāo),從歷史運行數(shù)據(jù)中抽取重過載記錄,融合設(shè)備臺賬數(shù)據(jù)、臺區(qū)用戶數(shù)據(jù)以及供電環(huán)境屬性,利用多維關(guān)聯(lián)分析方法挖掘可能與重過載相關(guān)的影響因素組合,利用歷史數(shù)據(jù)訓(xùn)練機器學(xué)習(xí)模型,建立配電臺區(qū)重過載預(yù)測模型。最后,利用某地市供電公司實際數(shù)據(jù),對方法分析過程和模型效果進行了驗證。
配電臺區(qū)重過載預(yù)測研究大致分為以下3個階段。
● 數(shù)據(jù)收集與預(yù)處理:從各個業(yè)務(wù)系統(tǒng)中獲得原始數(shù)據(jù)后,對重過載相關(guān)數(shù)據(jù)項進行初步篩選和清洗,量化分析目標(biāo)和樣本規(guī)模。
● 重過載影響因素分析:從原始數(shù)據(jù)中抽取或設(shè)計特征變量,通過多變量多層關(guān)聯(lián)找到單個變量或變量組合與重過載事件之間的強弱關(guān)聯(lián)。
● 重過載預(yù)測模型訓(xùn)練:結(jié)合上一階段中獲得的相關(guān)特征構(gòu)造機器學(xué)習(xí)模型,通過歷史數(shù)據(jù)樣本對重過載模型參數(shù)進行訓(xùn)練及效果評估。
上述研究思路可以進一步分解為以下步驟,如圖1所示。
圖1 整體研究思路
● 明確業(yè)務(wù)定義與模型目標(biāo)。長期以來重過載管理水平不高導(dǎo)致業(yè)務(wù)上對于重過載的判定過于簡單模糊,沒有統(tǒng)一的標(biāo)準(zhǔn)。因此,必須對重過載定義做出清晰、可執(zhí)行的限定。此外,需要結(jié)合業(yè)務(wù)需求明確模型的技術(shù)目標(biāo),包括模型的預(yù)測精度、預(yù)測效率、預(yù)測時間跨度等,模型的目標(biāo)一定程度上決定了特征變量和模型架構(gòu)的選擇。
● 數(shù)據(jù)獲取與預(yù)處理。隨著電力系統(tǒng)信息化程度的不斷加深,目前在電力企業(yè)的各業(yè)務(wù)環(huán)節(jié)中都具備信息化系統(tǒng)支撐,系統(tǒng)之間的數(shù)據(jù)貫通和融合不在本文討論范圍內(nèi),但數(shù)據(jù)的獲取是開展任何大數(shù)據(jù)應(yīng)用研究的前提,本文涉及的業(yè)務(wù)系統(tǒng)及數(shù)據(jù)規(guī)模會在下文中說明。數(shù)據(jù)質(zhì)量決定了模型效果的上限,因此從業(yè)務(wù)系統(tǒng)中獲取原始數(shù)據(jù)后需要對數(shù)據(jù)質(zhì)量進行評估,必要時通過清洗、補齊等技術(shù)手段對原始數(shù)據(jù)進行預(yù)處理。
● 設(shè)計并提取特征變量。特征變量是進行關(guān)聯(lián)分析的直接輸入,特征變量可以來自原始數(shù)據(jù)字段,也可以通過對原始數(shù)據(jù)字段進行加工獲得。特征變量的設(shè)計可以依靠業(yè)務(wù)經(jīng)驗,也可以依據(jù)某些標(biāo)準(zhǔn)原則。特征變量的提取是指在從原始數(shù)據(jù)到特征變量數(shù)據(jù)的實現(xiàn)過程中,通過提取形成用于關(guān)聯(lián)分析的特征變量數(shù)據(jù)集。
● 特征變量關(guān)聯(lián)分析。通過關(guān)聯(lián)分析方法對特征變量數(shù)據(jù)集進行操作,得到與重過載相關(guān)的關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則中的特征變量集合代表了重過載影響因素。關(guān)聯(lián)規(guī)則中的特征變量大多不唯一。關(guān)聯(lián)分析方法的選擇需要根據(jù)數(shù)據(jù)類型和分析目標(biāo)綜合確定。
● 模型選擇與參數(shù)訓(xùn)練。重過載預(yù)測屬于數(shù)據(jù)挖掘中的預(yù)測問題范疇。從傳統(tǒng)的回歸方法到ANN、支持向量機(support vector machine,SVM)等人工智能方法,各類預(yù)測模型在具體問題上的表現(xiàn)都有所差異。而從實際應(yīng)用情況來看,機器學(xué)習(xí)在非線性擬合問題上具有天然優(yōu)勢,同時對于輸入特征的自學(xué)習(xí)性也是本文選擇機器學(xué)習(xí)的重要原因。需要注意的是,成為影響因素的特征變量一般需要進行一定的數(shù)據(jù)變換才能成為預(yù)測模型的輸入變量。
● 模型效果驗證與優(yōu)化。通過一部分歷史數(shù)據(jù)對模型效果進行驗證,除了準(zhǔn)確率、命中率等模型性能指標(biāo)外,業(yè)務(wù)層面對模型的認可程度也是評價模型效果的重要依據(jù)。
目前實際業(yè)務(wù)中使用較多的配變重過載的定義通常為:每天00:00配變功率曲線中,連續(xù)3個點負載率為80%~100%,視為重載;連續(xù)3個點負載率超過100%,視為過載。但從實際數(shù)據(jù)和業(yè)務(wù)需求來看,上述定義存在3方面問題:
● 配變重過載中,負載率經(jīng)常頻繁波動,存在大量重載與過載混雜存在的情況,無法按照現(xiàn)有定義進行識別;
● 相當(dāng)一部分重過載現(xiàn)象在持續(xù)時間上不足2 h,這類重過載對設(shè)備和電網(wǎng)的影響理論上雖然小于長時間重過載,但對于分析重過載成因具有很高的價值;
● 大部分重過載發(fā)生于單相,還有部分重過載會同時發(fā)生在多相,如果能夠?qū)ο鄤e進行識別,則對于重過載治理措施的選擇至關(guān)重要。
針對上述3方面問題,本文對重過載定義做出調(diào)整:每天00:00配變功率曲線中,連續(xù)兩個或以上點三相負載率中的最大值超過80%,視為重過載。連續(xù)3個點負載率超過100%,視為過載。針對上述3方面問題,本文對重過載定義做出調(diào)整:每天00:00配變功率曲線中,連續(xù)兩個或以上點三相負載率中的最大值超過80%,視為重載;連續(xù)3個點負載率超過100%,視為過載。
重過載定義優(yōu)化如圖2所示。
在模型目標(biāo)方面,模型結(jié)果必須能夠與業(yè)務(wù)環(huán)節(jié)形成銜接,才能實現(xiàn)模型的應(yīng)用價值。這就要求模型預(yù)測結(jié)果必須與目前配變重過載治理方法和周期匹配。針對重過載現(xiàn)象,目前電網(wǎng)側(cè)的治理手段包括以下兩方面:
● 對用戶進行臨時線路切改,這種調(diào)整方式相對便捷,處理周期短,但由于臺區(qū)用戶情況復(fù)雜,部分重過載臺區(qū)可能不具備調(diào)相條件;
● 通過設(shè)備升級改造,永久性解決重過載問題,但該途徑周期較長,不適用于突發(fā)情況。
結(jié)合數(shù)據(jù)支撐情況和業(yè)務(wù)流程,對重過載預(yù)測的目標(biāo)確定為:預(yù)測精度以天為單位,預(yù)測時間跨度不低于3天。
圖2 重過載定義優(yōu)化
重過載現(xiàn)象本質(zhì)上反映了相對靜態(tài)的電源容量不能滿足某些條件下的用戶用電需求。臺區(qū)內(nèi)的用戶類型、用戶數(shù)量、用電行為等不同程度上決定了用戶的用電負荷特征。進一步擴展來看,用戶方面的各項變化又受到天氣、時節(jié)、群體活動、經(jīng)濟波動等眾多自然環(huán)境與社會環(huán)境的影響。此外,設(shè)備自身的缺陷以及臺區(qū)內(nèi)拓撲的不合理同樣會導(dǎo)致重過載的發(fā)生。惡劣的運行環(huán)境引起的設(shè)備非正常損耗也會增加重過載風(fēng)險。
通過數(shù)據(jù)調(diào)研,在充分考慮數(shù)據(jù)獲取途徑和難度后,確定用于本項研究的數(shù)據(jù)規(guī)模,如圖3所示。內(nèi)部數(shù)據(jù)包括某地市公司所屬的所有配變設(shè)備臺賬、臺區(qū)用戶的部分檔案信息以及變更記錄、配變負荷曲線、配變改造記錄,覆蓋近3萬個配電臺區(qū)。同時受數(shù)據(jù)粒度所限,外部數(shù)據(jù)選擇了時間數(shù)據(jù)、節(jié)假日信息、各類氣象指標(biāo)等數(shù)據(jù)。數(shù)據(jù)時間跨度為2014—2015年底??倲?shù)據(jù)量超過3億條。
圖3 數(shù)據(jù)分析范圍與規(guī)模
數(shù)據(jù)的獲取通過系統(tǒng)間接口完成。通過大數(shù)據(jù)平臺與業(yè)務(wù)數(shù)據(jù)中心進行數(shù)據(jù)集成,不直接與各源業(yè)務(wù)系統(tǒng)(調(diào)度、運檢、營銷等業(yè)務(wù)信息系統(tǒng),如EMS/配網(wǎng)自動化/PMS/營銷/95598/用電信息采集系統(tǒng)等)對接。業(yè)務(wù)數(shù)據(jù)中心直接將相關(guān)數(shù)據(jù)庫表提供給大數(shù)據(jù)平臺及應(yīng)用直接訪問,以供大數(shù)據(jù)平臺及應(yīng)用接入數(shù)據(jù),創(chuàng)建中間庫,用戶在中間庫下創(chuàng)建接口視圖,源數(shù)據(jù)根據(jù)中間庫抽取數(shù)據(jù)到大數(shù)據(jù)平臺基礎(chǔ)庫(Hive),或從Hive推送數(shù)據(jù)到應(yīng)用業(yè)務(wù)庫(MySQL)。
重過載現(xiàn)象受到臺區(qū)下用戶數(shù)量和用電行為的直接影響。但用戶數(shù)量和用電行為會隨著外界環(huán)境動態(tài)變化。而各項環(huán)境因素之間常常存在內(nèi)部橫向關(guān)聯(lián)。因此在設(shè)計特征變量時,要保證特征變量之間的獨立性?;跀?shù)據(jù)現(xiàn)狀和特征獨立性,選擇部分原始數(shù)據(jù)字段設(shè)計以下三大類特征。
● 靜態(tài)特征:額定容量、設(shè)備型號、臺區(qū)類型、用戶構(gòu)成比例。主要用于分析以上各維度下的重過載配變分布規(guī)律。
● 時序特征:重要節(jié)假日標(biāo)志、溫度、濕度、空氣質(zhì)量指數(shù)等氣象指標(biāo)。主要用于分析期間各項指標(biāo)下的重過載臺區(qū)隨時間變化的趨勢。
● 衍生特征:從負荷曲線中提取的短期用電特征,用于分析短期用電特征與重過載的相關(guān)性。
具體的特征定義見表1。
表1 關(guān)聯(lián)特征含義
即包含頻繁模式p的樣本數(shù)目在整個關(guān)聯(lián)樣本集中的百分比。頻繁模式要滿足最小支持度min:surpport的要求。
頻繁模式體現(xiàn)了某些關(guān)聯(lián)特征在特定的取值范圍下出現(xiàn)在重過載事件中的頻率。但這些特征與重過載事件的關(guān)聯(lián)關(guān)系需要進一步通過計算置信度和相關(guān)度確定。
置信度為:
按照上述特征定義,每一次重過載事件都可以形成一條關(guān)聯(lián)特征向量。關(guān)聯(lián)分析的操作對象是由關(guān)聯(lián)特征向量構(gòu)成的關(guān)聯(lián)樣本集。由于關(guān)聯(lián)特征中同時存在離散型和連續(xù)型變量,為了盡量降低數(shù)據(jù)泛化對分析結(jié)果的影響,選擇HotSpot算法對關(guān)聯(lián)樣本集進行頻繁模式挖掘。
頻繁模式p形式如下:
相關(guān)度為:
在滿足支持度閾值的前提下,同時滿足最小置信度min:confidence和最小相關(guān)度min:co的頻繁模式稱為關(guān)聯(lián)規(guī)則。
其中,ai∈Ri為謂詞,表示特征項ai的取值屬于某一取值空間Ri;b表示某重過載事件類型標(biāo)號。surpport表示支持度,定義如下:
通過關(guān)聯(lián)規(guī)則確定影響重過載發(fā)生的主要因素后,對重過載事件的預(yù)測就可以看作數(shù)據(jù)挖掘中的預(yù)測問題,即通過若干條件綜合判斷某一類型重過載事件是否發(fā)生。為了降低關(guān)聯(lián)規(guī)則中各特征之間可能存在的共線性對模型預(yù)測效果的影響,同時防止對數(shù)據(jù)的過度擬合,選用深度邏輯網(wǎng)絡(luò)(deep logical network,DLN)模型。模型結(jié)構(gòu)如下:
k1,k2,…,ki各項系數(shù)反映了該項特征對預(yù)測目標(biāo)的影響程度,通過樣本數(shù)據(jù)對模型進行訓(xùn)練自動獲得。f(y)為對數(shù)函數(shù),取值范圍為(0,1),表示該樣本發(fā)生重過載的概率。
對于DLN模型,最大化似然函數(shù)和最小化損失函數(shù)實際上是等價的。因此在參數(shù)訓(xùn)練方法上,為了進一步降低邏輯項之間可能存在的共線性影響,采用了基于不完全數(shù)據(jù)的混合最大似然估計(maximum likelihood estimation,MLE)方法。
在模型驗證方面,采用柯爾莫可洛夫—斯米洛夫(Kolmogorov-Smirnov,K-S)校驗方法,比較樣本數(shù)據(jù)的累計頻數(shù)分布與理論分布,若兩者間的差距很小,則推論該樣本取自某該類重過載樣本集。
方法整體流程如圖4所示。
圖4 重過載預(yù)測方法整體流程
以某地市供電公司實際數(shù)據(jù)為例,對本文提出的關(guān)聯(lián)分析以及預(yù)測方法進行驗證。
本文運用的數(shù)據(jù)覆蓋近14 000臺配變近3年每天00:00的負荷曲線數(shù)據(jù)、相應(yīng)的配變設(shè)備臺賬(型號、容量、運行年限、升級改造記錄)、臺區(qū)類型以及用戶數(shù)量、每日最高氣溫、每日最低氣溫、每日濕度、每日降雨量、當(dāng)日星期類型、節(jié)假日標(biāo)簽等。
4.1.1 臺賬數(shù)據(jù)
設(shè)備臺賬方面,共收集配變設(shè)備臺賬記錄14 904條,數(shù)據(jù)情況見表2。
● 設(shè)備型號字段中存在包含中文字符的無效記錄共246條,其中222條記錄可通過自動修正處理為有效數(shù)據(jù);另外,在共計1 342種型號中,保留其中166種主要型號,對應(yīng)設(shè)備數(shù)量占總數(shù)的99.5%。
● 額定容量字段中有464條記錄不符合標(biāo)準(zhǔn)容量,占設(shè)備總數(shù)量的3%;生產(chǎn)廠商字段存在552條無效記錄,另外保留其中239個主要廠商,對應(yīng)設(shè)備數(shù)量占總數(shù)的91.3%;區(qū)域特征字段存在306條空值記錄。以上各項字段中的空值記錄和無效記錄不納入本次分析范圍。
● 其他字段數(shù)據(jù)情況良好可用。
表2 臺賬數(shù)據(jù)情況
4.1.2 負荷數(shù)據(jù)
歷史負荷數(shù)據(jù)方面,獲得2014—2016年共3年的每天00:00的負荷曲線數(shù)據(jù),數(shù)據(jù)情況見表3。
表3 負荷曲線數(shù)據(jù)情況
從負荷曲線中對重過載事件進行識別,需要盡量確保數(shù)據(jù)的連續(xù)性,按照以下規(guī)則對負荷曲線數(shù)據(jù)進行插補。
● 數(shù)據(jù)連續(xù)缺失在兩個點(包括兩個點)以內(nèi)的按照插值法進行補齊。
● 在數(shù)據(jù)連續(xù)缺失2個點以上、6個點以下的情況,若缺失區(qū)間兩端時刻的負載率為重過載,則節(jié)假日在該端采用移動平均法進行補齊,時期數(shù)N=3;非節(jié)假日,按照前5日(相同類型)同一時刻的負載率均值計算。對于僅有一個端點負載率在重過載區(qū)間(節(jié)假日)的情況,在該端采用移動平均法進行補齊,時期數(shù)N=3。
● 其他情況一律不做補齊處理。
4.1.3 用戶信息數(shù)據(jù)
用戶信息數(shù)據(jù)方面,共獲得低壓用戶檔案記錄4 947 519條,數(shù)據(jù)情況見表4。
● 13 697條用戶檔案記錄無法與相應(yīng)臺區(qū)進行匹配,屬于無效數(shù)據(jù)。
● 戶均容量方面,由于存在多臺配變器劃歸同一臺區(qū)的情況,因此戶均容量記錄條數(shù)少于配變設(shè)備數(shù)量。臺區(qū)戶均容量為空的記錄共6 453條,其中存在無法與相應(yīng)用戶進行匹配的臺區(qū)3個,其他空值可以根據(jù)現(xiàn)有臺區(qū)域用戶匹配關(guān)系進行補充。
● 原始數(shù)據(jù)中包含410個行業(yè)類別,按照《2015年行業(yè)用電分類標(biāo)準(zhǔn)》進行泛化處理后,共保留47類。
4.1.4 氣象指標(biāo)數(shù)據(jù)
對氣象類信息進行排查,選用了溫度、濕度、降水量和風(fēng)速信息,數(shù)據(jù)粒度為小時。在進行后續(xù)分析之前,需要對壞數(shù)據(jù)進行處理,剔除無效數(shù)據(jù)。
表4 用戶信息數(shù)據(jù)情況
為了保證能夠獲得足夠多的頻繁模式,同時基于頻繁模式產(chǎn)生的關(guān)聯(lián)規(guī)則能夠反映樣本整體規(guī)律,一方面可以嘗試多組支持度、置信度和相關(guān)度閾值,另一方面,也可以對部分關(guān)聯(lián)特征進行適當(dāng)?shù)念A(yù)處理。根據(jù)特征數(shù)值類型,相應(yīng)的預(yù)處理方式見表5。
表5 數(shù)據(jù)預(yù)處理方式
共155 768個重過載事件生成重過載事件樣本。采用R語言中的Hotspot包對樣本集進行分類。支持度support、置信度confidence和相關(guān)度co閾值分別設(shè)置為0.3、0.7、0.4。關(guān)聯(lián)分析結(jié)果見表6。
表6中每條關(guān)聯(lián)規(guī)則的謂詞都表示了一種影響重過載事件最主要的條件組合,分別如下:
● 臺區(qū)屬于城網(wǎng)類型,當(dāng)日平均溫度低于6℃,近5日內(nèi)每天00:00負載率超過80%的次數(shù)大于20次且小于45次;
● 當(dāng)日平均溫度大于26℃,平均濕度小于60%;
● 近5日內(nèi)00:00負載率平均值大于45%;
表6 關(guān)聯(lián)規(guī)則
● 近5日內(nèi)每天00:00負載率平均值大于30%且小于45%,近5日內(nèi)每天最大負載率連續(xù)上升天數(shù)為0,日期為周一或周二;
● 近5日內(nèi)每天最大負載率連續(xù)上升天數(shù)大于1天且小于4天,近5日內(nèi)每天00:00負載率超過80%的次數(shù)大于45次。
整體上看,外部氣象和配變的短期負載特征與重過載事件具有較強的相關(guān)性。從指標(biāo)上看,關(guān)聯(lián)規(guī)則2、關(guān)聯(lián)規(guī)則3具有較高的確定性,其中關(guān)聯(lián)規(guī)則2中的關(guān)聯(lián)因素與重過載事件相關(guān)度最高。而用戶特征和設(shè)備臺賬特征對重過載事件無明顯影響。
根據(jù)第4.2節(jié)獲得的關(guān)聯(lián)規(guī)則,模型涉及當(dāng)日平均溫度、濕度、臺區(qū)類型、日期類型以及短期負載特征等共7項指標(biāo),采用11項關(guān)聯(lián)規(guī)則中的謂詞作為模型參數(shù),其結(jié)構(gòu)如式(7)所示。
其中,y=k0+k1×ldrate_aver_d5_1+k2×ldrate_aver_d5_2+k3×cnt80_d5_1+k4×cnt80_d5_2+k5×tf_loadrate_1+k6×tf_loadrate_3+k7×mean_humidity_1+k8×min_tem_1+k9×min_tem_3+k10×trans_type+k11×weektype_1。
模型中各項參數(shù)意義見表7。
表7 參數(shù)描述
每組訓(xùn)練集的樣本總量為2 000,按照正負3:1的比例共分割訓(xùn)練集103組,對參數(shù)權(quán)值進行多次訓(xùn)練,最終結(jié)果見表8。
模型的最終輸出需要給出對重過載事件是否發(fā)生的邏輯判斷。在確定模型參數(shù)和權(quán)重取值后,按照K-S準(zhǔn)則對y值進行區(qū)間劃分,結(jié)果如圖5所示。在y值為3%時,K-S值達到最大值95%,以此作為判斷重過載事件是否發(fā)生的分界點。
在剩余的1 268個重過載樣本中抽取20%樣本(256條重過載樣本),并加入150條非重過載樣本作為檢測集,對模型效果進行驗證,結(jié)果見表9。
根據(jù)表9可以得到該模型準(zhǔn)確率(ac_rate)和命中率(tar_rate)分別為:
預(yù)測結(jié)果中實際發(fā)生重過載的臺區(qū)數(shù)量決定了準(zhǔn)確率,預(yù)測結(jié)果中沒有包含但實際發(fā)生重過載的臺區(qū)數(shù)量決定了命中率。實際業(yè)務(wù)中考慮到運維和搶修資源配置,當(dāng)兩項指標(biāo)不能達到業(yè)務(wù)要求時,需要對以上兩項指標(biāo)進行取舍。在模型訓(xùn)練過程中,通常采取“優(yōu)先保證準(zhǔn)確率,盡量提高命中率”的策略保證預(yù)測結(jié)果。
對于業(yè)務(wù)人員感興趣的其他類型過載事件,同樣可以按照上述過程建立相應(yīng)的重過載預(yù)測模型。所有的重過載模型構(gòu)成完整的重過載模型庫,能夠?qū)崿F(xiàn)對重過載事件的綜合判斷。
特別地,對于同一個臺區(qū)預(yù)測出現(xiàn)多類重過載事件的情況,可以通過對各預(yù)測模型給出的y值進行統(tǒng)一標(biāo)準(zhǔn)化后,取其中最大值代表的重過載類型作為對該臺區(qū)的最終預(yù)測結(jié)果。
表8 參數(shù)權(quán)重
圖5 K-S檢驗
表9 模型效果驗證結(jié)果
本文針對配網(wǎng)重過載管理中存在的難題和業(yè)務(wù)空白,結(jié)合大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù)提出了重過載分類、重過載關(guān)聯(lián)分析以及重過載預(yù)測方法,基于實際數(shù)據(jù)對方法進行驗證,效果達到了預(yù)期目標(biāo)。
隨著智能配電網(wǎng)的深化推進,未來電網(wǎng)的大數(shù)據(jù)特征必將更加明顯,大數(shù)據(jù)技術(shù)在處理海量數(shù)據(jù)、揭示事物間隱藏關(guān)聯(lián)等方面的天然優(yōu)勢,能夠成為解決電網(wǎng)業(yè)務(wù)問題、提升電網(wǎng)運營水平的重要技術(shù)手段。
[1] 王繼業(yè). 智能電網(wǎng)大數(shù)據(jù)[M]. 北京: 中國電力出版社, 2017.WANG J Y. Big data in smart grid[M].Beijing: China Electric Power Press, 2017.
[2] 賀建章, 王海波, 季知祥, 等. 面向智能電網(wǎng)的配電變壓器重過載影響因素分析[J]. 電網(wǎng)技術(shù), 2017, 41(1): 279-284.H E J Z, WA N G H B, J I Z X, e t a l.Analysis of factors affecting distribution transformer overload in smart grid[J].Power System Technology, 2017, 41(1):279-284.
[3] 賀建章, 王海波, 季知祥, 等. 基于隨機森林理論的配電變壓器重過載預(yù)測[J]. 電網(wǎng)技術(shù),2017, 41(8): 2594-2597.HE J Z, WANG H B, JI Z X, et al. Heavy overload forecasting of distribution transformers based on random forest theory[J]. Power System Technology,2017, 41(8): 2594-2597.
[4] LI M, ZHOU Q. Distribution transformer mid-term heavy and over load pre-warning based on logistic regression[C]//2015 IEEE Eindhoven Powertech, June 29-July 2,2015, Eindhoven, Netherlands. [S.l.:s.n.],2015: 1-5.
[5] 史常凱, 閆文棋, 張筱慧, 等. 基于BP網(wǎng)絡(luò)和灰色模型的春節(jié)配變重過載預(yù)測[J]. 電力科學(xué)與技術(shù)學(xué)報, 2016, 31(1): 140-145.SHI C K, YAN W Q, ZHANG X H, et al.Heavy overload forecasting of distribution transformer during the spring festival based on BP network and grey model[J].Journal of Electric Power Science and Technology, 2016, 31(1): 140-145.
[6] P A D M A N A B H K, S I N G H M J.Load forecasting at distribution transformer using IoT based smart meter data[C]//2016 IEEE International Conference on Contemporary Computing and Informatics, December 14-17, 2016,Noida, India. New York: IEEE Press,2016: 758-763.
[7] C A M P E Z I D O U S I, G R I J A L V A S.Dsitribution transformer short-term load forecasting models[J]. IEEE Transactions on Power System, 2016(19): 267-273.
[8] N G O V C, W U W C, Z H A N G B M.Ultra-short-term load forecasting using robust exponentially weighted method in distribution networks[J]. Journal of Information, Control and Management Systems, 2015(9): 301-308.
[9] SU N X R, LU H P B, CH EU N G K W.Efficient approach to short-term load forecasting[J]. IEEE Transactions on Power Systems, 2016(3): 301-307.
[10] 趙宇, 董莉麗. 基于運監(jiān)大數(shù)據(jù)挖掘的公變臺區(qū)重過載監(jiān)測分析[J]. 企業(yè)管理, 2016 S(2):276-277.ZHAO Y, DONG L L. Heavy and over load analysis on distribution transformer using operative and monitoring data[J]. Enterprise Management, 2016(S2): 276-277.
[11] 王山林, 林正祥. 國網(wǎng)福建電力應(yīng)用大數(shù)據(jù)預(yù)測重過載臺區(qū)[N]. 國家電網(wǎng)報, 2016-08-19.WANG S L, LIN Z X. Practise of big data on heavy and over load forecasting[N].State Grid News, 2016-08-19.