唐 捷,蔡永智,李其霖,劉斯亮,張勇軍,羿應(yīng)棋,黃向敏
(1. 廣東電網(wǎng)有限責(zé)任公司,廣東省 廣州市 510060;2. 廣東電網(wǎng)有限責(zé)任公司計量中心,廣東省 廣州市 510080;3. 智慧能源工程技術(shù)研究中心,華南理工大學(xué)電力學(xué)院,廣東省 廣州市 510641)
低壓配電臺區(qū)作為直面用戶供電的最后環(huán)節(jié),其運(yùn)維管理的智能化、精益化水平將直接影響客戶用電滿意度[1-2]。由于低壓臺區(qū)面廣、量大、變動多,供電企業(yè)難以準(zhǔn)確掌握低壓用戶的供電相序信息,導(dǎo)致臺區(qū)線損異常、三相不平衡、低電壓等運(yùn)維管理問題難以有效解決[3-5],成為客戶投訴的焦點(diǎn)。因此,開展低壓用戶相序識別方法研究具有重要的工程意義和社會價值[6-7]。
針對此問題的解決方法主要包括人工排查法、信號辨識法與數(shù)據(jù)挖掘法。其中,人工排查法是指依靠電力員工現(xiàn)場使用相關(guān)識別設(shè)備進(jìn)行勘察,是目前電網(wǎng)公司獲取低壓用戶相序信息的主要方法,但其效率低下,且需要消耗大量的人力物力,經(jīng)濟(jì)效益極低。信號辨識法通過注入脈沖電流或載波電壓信號,根據(jù)信號的收發(fā)情況辨識用戶供電相序[8-10]。其原理簡單、識別準(zhǔn)確,但需要額外加裝監(jiān)測終端或模塊,投資高、運(yùn)維壓力大,且信號發(fā)生電路可靠性差,在雷擊、浪涌環(huán)境下易損壞。
隨著高級量測體系逐漸建成與完善,智能電表多類型、高頻次、準(zhǔn)同步數(shù)據(jù)得以自動采集獲?。?1]。由于電表電氣量是臺區(qū)潮流分布的關(guān)鍵狀態(tài)量,具備反映臺區(qū)網(wǎng)絡(luò)拓?fù)潢P(guān)系的特征。為此,大量學(xué)者開展數(shù)據(jù)挖掘法研究,主要可分為關(guān)聯(lián)分析法、模型擬合法和特征學(xué)習(xí)法三大類。
關(guān)聯(lián)分析法利用同相用戶電壓時序變化具有相關(guān)性的機(jī)理特征,通過設(shè)置相關(guān)系數(shù)閾值判據(jù),實(shí)現(xiàn)臺區(qū)相序關(guān)系自動識別。文獻(xiàn)[12-13]通過比較電表與配電變壓器電壓時序的相關(guān)性,確定用戶相序關(guān)系。一般來說,關(guān)聯(lián)分析法依賴相關(guān)系數(shù)閾值設(shè)置,在不同臺區(qū)應(yīng)用時適應(yīng)性較弱。
模型擬合法通過最小化實(shí)際量測值與系統(tǒng)狀態(tài)誤差,擬合用戶相序關(guān)系。文獻(xiàn)[14-15]通過最小化臺區(qū)各相總功率及其下屬電表功率總和的偏差值,擬合各電表的相序歸屬關(guān)系。但是,除了線損外,實(shí)際臺區(qū)中還存在竊漏電等情況,導(dǎo)致臺區(qū)首末端功率偏差較大,將顯著影響識別準(zhǔn)確率。
特征學(xué)習(xí)法從數(shù)據(jù)本身出發(fā),通過挖掘臺區(qū)運(yùn)行數(shù)據(jù)與其拓?fù)浣Y(jié)構(gòu)的內(nèi)在關(guān)系,實(shí)現(xiàn)用戶相序關(guān)系自動識別,其主要包括監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)算法。其中,以聚類為典型代表的無監(jiān)督學(xué)習(xí)算法不依賴正確的數(shù)據(jù)標(biāo)簽,實(shí)用性強(qiáng),近年來被廣泛應(yīng)用到相序識別問題中。文獻(xiàn)[16]提出了以皮爾遜相關(guān)系數(shù)、L1/L2范數(shù)為相似性量度指標(biāo)的K-means 聚類算法對用戶電壓曲線進(jìn)行分類,進(jìn)而實(shí)現(xiàn)用戶相序識別。文獻(xiàn)[17]提出了一種帶約束的K-means 聚類算法進(jìn)行用戶相序識別。
在相序識別問題中,盡管三相表在數(shù)據(jù)采集過程中已標(biāo)定了相序,但由于接線不規(guī)范等問題廣泛存在標(biāo)定相序與真實(shí)相序不一致情況。若在相序識別過程中忽略三相表,將影響單相表相序識別的準(zhǔn)確率,進(jìn)而影響線損精益化管理、三相不平衡或低電壓等問題的精確治理。此外,當(dāng)三相表位于配變分支出線首端時,由于其與配變母線電氣距離較近,在母線三相電壓不平衡度較小的情況下將導(dǎo)致三相表的三相電壓變化具有較高相似性,直接采用基于相似性量度的聚類方法會將其識別為同相電表,進(jìn)而影響識別準(zhǔn)確率。
針對當(dāng)前相序識別研究中較少考慮三相表的問題,本文提出了基于三相表特征約束聚類的低壓臺區(qū)用戶相序識別方法。首先,理論推導(dǎo)了用戶電壓的時序變化特性與關(guān)聯(lián)機(jī)理,為后續(xù)相序識別分析提供先驗(yàn)知識;然后,對用戶電壓時序進(jìn)行特征標(biāo)準(zhǔn)化與降維處理,提出基于背景知識的嵌有快速收斂機(jī)制且考慮三相表特征約束的K-Medoids 半監(jiān)督聚類算法(CFK-Medoids)開展臺區(qū)相序識別。最后,通過實(shí)際數(shù)據(jù)計算分析,驗(yàn)證了所提方法的有效性與適用性。
本章通過推導(dǎo)低壓臺區(qū)節(jié)點(diǎn)電壓的計算公式,從理論上分析用戶電壓的時序特性。為了更好地掌握用戶電壓的時序特性,本文根據(jù)實(shí)際情況,在理論推導(dǎo)過程中進(jìn)行了相關(guān)簡化,包括:1)用戶下戶線一般較短,忽略其電壓損耗;2)臺區(qū)無功負(fù)荷較低,忽略電壓降落中的無功分量。圖1 給出了低壓臺區(qū)某一相線示意圖。
圖1 低壓臺區(qū)某一相線示意圖Fig.1 Schematic diagram of a certain phase line in lowvoltage distribution-station area
通過分析式(1)和式(2)可知,可總結(jié)用戶電壓時序特性及其與相序關(guān)聯(lián)關(guān)系:電表電壓受所在相配電變壓器低壓母線電壓、所在相線上游各支路傳輸功率總和以及上游各支路阻抗共同影響。對于同相電表而言,其電壓差異主要受后兩者影響。當(dāng)2 個同相電表處于同一出線,且兩者間的距離短、阻抗小、傳送功率較低時(即電氣距離較近),兩者電壓變化具有相似性。但隨著兩者電氣距離逐漸增大,其電壓變化相似性逐漸減弱。而對于異相電表而言,其電壓差異還受臺區(qū)三相電壓不平衡度影響,則異相電表電壓變化相似性明顯較低?;谏鲜龇治?可總結(jié)以下先驗(yàn)知識,為后續(xù)相序識別提供支撐。
先驗(yàn)知識1:同相且電氣距離相近的電表電壓變化相似性高,同相且電氣距離較遠(yuǎn)或異相電表電壓變化相似性低。因此,基于電壓相似性量度的聚類算法將有助于區(qū)分電表相序。
先驗(yàn)知識2:受負(fù)荷、線徑、線路長度等因素影響,同相電表電壓變化亦存在相似性較低情況。因此,聚類時應(yīng)充分考慮各聚類簇的簇內(nèi)緊湊度與簇間分離度。
先驗(yàn)知識3:在單相表相序識別時若不考慮三相表,由于三相表數(shù)據(jù)缺失,將導(dǎo)致同相電表群的電壓關(guān)聯(lián)性下降,進(jìn)而影響單相表識別準(zhǔn)確率。因此,相序識別時應(yīng)考慮三相表的影響。
為了有效挖掘不同用戶電壓時序變化特征的差異,進(jìn)而提高聚類效果,本章采用Z-Score 與t分布的隨機(jī)近鄰嵌入(t-SNE)算法對用戶電壓時序特征進(jìn)行標(biāo)準(zhǔn)化與降維處理。
特征降維指的是在保留原始數(shù)據(jù)主特征的前提下,將原始高維數(shù)據(jù)集壓縮至低維數(shù)據(jù)集的過程,其通過主特征提取,能夠減少原始序列噪聲對后續(xù)聚類準(zhǔn)確性的影響。特征降維方法主要可分為線性降維與非線性降維兩大類。其中,非線性降維對原始序列分布特性保真能力較好。t-SNE算法是一種基于概率分布嵌入的非線性降維算法,降維效果好,應(yīng)用較為廣泛[18-19]。
t-SNE 算法的基本思想為:基于高斯分布函數(shù)將高維數(shù)據(jù)點(diǎn)之間的歐氏距離轉(zhuǎn)化為聯(lián)合概率,構(gòu)建高維空間的概率分布;再基于t分布函數(shù)計算低維空間數(shù)據(jù)點(diǎn)之間的歐氏距離,并將其轉(zhuǎn)化為聯(lián)合概率,構(gòu)建低維空間的概率分布;最后計算高、低維概率分布之間的Kullback-Leibler(KL)散度,其值越低,表明高、低維空間的概率分布越相似,將其作為目標(biāo)函數(shù),使用梯度下降法進(jìn)行迭代求解,直至尋找到使KL 散度最小的原始數(shù)據(jù)集的低維表示,即可得到降維后的數(shù)據(jù)集。
t-SNE 算法的具體步驟如下。
基于高斯分布函數(shù)計算高維空間數(shù)據(jù)之間的相似性概率pi|j與pj|i:
式中:xi和xj分別為高維空間中的任意2 個向量;δi和δj分別為以xi和xj為高斯分布中心的高斯模型方差。
聚類分析是指基于某種相似性量度,將具有相似特征的樣本聚為一簇,使得簇內(nèi)樣本的特征差異較小,而類間樣本的特征差異較大。常用的聚類算法包括劃分、層次、網(wǎng)格、密度、模型聚類等。
劃分聚類計算復(fù)雜度低,對高維數(shù)據(jù)集的運(yùn)算相對高效,但需預(yù)設(shè)聚類數(shù);層次聚類采用樹狀結(jié)構(gòu)進(jìn)行逐層聚合,無須預(yù)設(shè)聚類數(shù)即可發(fā)現(xiàn)類的層次關(guān)系,但計算復(fù)雜度高,離群值點(diǎn)影響較大;網(wǎng)格聚類利用屬性空間的多維網(wǎng)格數(shù)據(jù)結(jié)構(gòu),將空間進(jìn)行塊劃分,其聚類的質(zhì)量和準(zhǔn)確性較低;密度聚類基于數(shù)據(jù)的分布密度,通過連接高密度區(qū)域?qū)崿F(xiàn)聚類,其無須預(yù)設(shè)聚類數(shù),但對參數(shù)的設(shè)置敏感且數(shù)據(jù)樣本越大收斂時間越長;模型聚類通過模型假定,尋找數(shù)據(jù)對假定模型的最佳擬合來實(shí)現(xiàn)聚類,當(dāng)數(shù)據(jù)的概率分布數(shù)較多且數(shù)據(jù)量較少時執(zhí)行效率不高。
基于先驗(yàn)知識1,采用基于電壓相似性量度的聚類算法有助于區(qū)分電表相序。結(jié)合3.1 節(jié)分析,由于本文研究問題的聚類場景數(shù)相對固定,可考慮采用對數(shù)據(jù)具有高效處理能力的劃分聚類算法進(jìn)行分析[20-22]。
基于先驗(yàn)知識2,聚類分析時應(yīng)充分考慮各聚類簇的簇內(nèi)緊湊度與簇間分離度,不能簡單地將聚類數(shù)設(shè)定為臺區(qū)相序數(shù)。因此,通過特定指標(biāo)評估聚類結(jié)果的優(yōu)劣,進(jìn)而判斷聚類數(shù)的設(shè)定是否合理。聚類有效性評估指標(biāo)包括2 類:一類是外部評價指標(biāo),其將聚類結(jié)果與參考模型進(jìn)行比對,判斷聚類效果的優(yōu)劣;另一類是內(nèi)部評價指標(biāo),針對聚類結(jié)果的數(shù)據(jù)分布情況,從緊致性、分離性和連通性等方面對聚類結(jié)果進(jìn)行評價。內(nèi)部評價指標(biāo)不依賴于參考模型,更適合本文研究的問題,因此本文選取內(nèi)部評價指標(biāo)作為聚類有效性評價指標(biāo)。戴維森堡丁指數(shù)(Davies-Bouldin index,DBI)是最為常用的聚類有效性內(nèi)部評價指標(biāo)[23],其計算公式如下:
式中:mi和mj分別為聚類簇Ci和Cj的電表個數(shù);μi和μj分別為聚類收斂后聚類簇Ci和Cj的聚類中心電壓特征向量;d(·)為距離函數(shù),一般采用歐氏距離作為距離量度。
基于先驗(yàn)知識3,相序識別時應(yīng)充分考慮三相表影響。目前大多數(shù)文獻(xiàn)主要針對單相表開展相序識別,尚未考慮三相表對相序識別的影響[14-17]。在實(shí)際情況中,臺區(qū)既包含單相表也包含三相表。盡管目前三相表相序可直接獲取,但由于現(xiàn)場施工、管理不規(guī)范等問題,導(dǎo)致三相表存在錯相接線,即其相序信息并非對應(yīng)系統(tǒng)真實(shí)的供電相序。因此,在對臺區(qū)用戶開展相序識別時,若僅考慮單相表相序識別,一方面無法辨識三相表錯相接線問題,進(jìn)而導(dǎo)致臺區(qū)三相不平衡,影響線損分析的準(zhǔn)確性;另一方面,當(dāng)臺區(qū)三相表比例較高時,將影響單相表相序識別的準(zhǔn)確性。
當(dāng)考慮三相表開展相序識別時,還需引入描述三相表特征的背景知識,即同一塊三相表所等效的三塊單相表應(yīng)歸屬于不同相序。因此,本節(jié)在聚類算法中引入了Cannot-link 成對約束,其規(guī)定了成對實(shí)例必須在不同簇中,符合三相表特征。文獻(xiàn)[24-25]將Must-link 和Cannot-link 成對約束引入Kmeans 聚類算法中,提出帶約束的K-means 聚類算法,在三相電表數(shù)量占比較高的臺區(qū)上展現(xiàn)出了一定效果。然而,K-means 算法對數(shù)據(jù)噪聲和離群點(diǎn)較為敏感,這類異常數(shù)據(jù)易使聚類中心偏離理想位置,導(dǎo)致算法準(zhǔn)確率下降。
綜上所述,本文采用K-Medoids 算法替代Kmeans 算法,并引入快速收斂機(jī)制,提出了CFKMedoids 聚類算法開展低壓臺區(qū)用戶相序識別。其中,快速收斂機(jī)制將聚類中心點(diǎn)的替換范圍限制在簇內(nèi)部,即在每個簇中尋找到一個新的中心點(diǎn),這個中心點(diǎn)與簇中其他對象之間的距離總和最小。該方法只需要計算一次簇內(nèi)的距離矩陣,避免了傳統(tǒng)KMedoids 算法每次迭代中的全局最優(yōu)搜索過程,顯著提升了算法收斂速度,并且其與傳統(tǒng)算法計算所得的聚類中心偏差不大,在精度范圍內(nèi)能夠有效提升算法計算效率[26]。算法計算流程圖如附錄A 圖A1 所示,具體步驟可描述如下:
步驟1:輸入目標(biāo)臺區(qū)用戶原始電壓時序X=[X1,X2,…,Xi,…,Xn],其中Xi=[xi1,xi2,…,xiT]T,對X進(jìn)行Z-Score 標(biāo)準(zhǔn)化和t-SNE 降維,得到用戶電壓特征向量Y。
步驟2:依次設(shè)定聚類數(shù)K=1,2,…,M,采用CFK-Medoids 進(jìn)行聚類計算。
步驟3:根據(jù)式(11)計算各用戶電表電壓特征向量在特征空間中的相對距離系數(shù)vj,升序排列并選擇前K個用戶電表的電壓特征向量作為初始聚類中心η1(1),η2(1),…,ηK(1),也稱為代表對象,其余數(shù)據(jù)稱為非代表對象。
步驟4:基于歐氏距離分別計算各電表電壓特征向量到K個聚類中心的距離,基于最小距離原則,將各電表分配給距離其最近的聚類中心所屬的簇。
步驟5:檢驗(yàn)各聚類簇中的電表元素是否違反Cannot-link 約束。若是,則將該電表分配到其次近的簇中,并再次檢驗(yàn)直至滿足約束。
步驟8:若S′i(N)小于Si(N),則令Si(N)=S′i(N),且令yi為新的聚類中心。
步驟9:重復(fù)步驟6、7,直至遍歷所有的非代表對象。
步驟10:重復(fù)步驟3 至步驟8,直至K個聚類中心不再發(fā)生變化。
步驟11:基于當(dāng)前聚類結(jié)果計算DBI,重復(fù)步驟2 至步驟11,直至完成各聚類數(shù)設(shè)定情況下的聚類分析。
步驟12:選取λDBI最小值對應(yīng)K作為最佳聚類數(shù),分別計算K個聚類簇的聚類中心與配電變壓器低壓側(cè)母線三相電壓時序的歐氏距離,歐氏距離最小的即為當(dāng)前聚類的相序。
本文選取中國廣東省某地市3 個臺區(qū)實(shí)際數(shù)據(jù)作為分析樣本,對所提方法的有效性進(jìn)行驗(yàn)證。3 個實(shí)際臺區(qū)的基礎(chǔ)參數(shù)如表1 所示。
表1 實(shí)際臺區(qū)基礎(chǔ)參數(shù)Table 1 Basic parameter of real distribution-station area
各臺區(qū)數(shù)據(jù)集均由配電變壓器低壓側(cè)母線及所有用戶智能電表電壓時序數(shù)據(jù)組成。其中,臺區(qū)1電壓時序數(shù)據(jù)長度為3 d,頻次為15 min/次,共計288 個時刻;臺區(qū)2 電壓時序數(shù)據(jù)長度為2 d,頻次為15 min/次,共計192 個時刻;臺區(qū)3 電壓時序數(shù)據(jù)長度為12 d,頻次為60 min/次,共計288 個時刻。
本文算例中3 個臺區(qū)的所有電表均已通過人工現(xiàn)場勘察結(jié)合相關(guān)識別設(shè)備檢測獲取其正確相位標(biāo)簽,本文所提算法的識別準(zhǔn)確率均是以人工現(xiàn)場識別結(jié)果為基準(zhǔn)計算得出的。
為驗(yàn)證所提方法的準(zhǔn)確性,本文設(shè)置了多種方法對照:1)方法1 為基于主成分分析(principal component analysis,PCA)降維的CFK-Medoids 聚類方法;2)方法2 為基于t-SNE 降維的平衡迭代規(guī)約 層 次 聚 類(balanced iterative reducing and clustering using hierarchies,BIRCH)方法[27];3)方法3 為基于t-SNE 降維的快速K 中心點(diǎn)聚類(fast KMedoids,FK-Medoids)方法,其考慮聚類的快速收斂機(jī)制,但不考慮三相表特征約束;4)方法4 為本文所提方法;5)方法5 為基于t-SNE 降維的約束K 中心點(diǎn)聚類(constrained K-Medoids,CK-Medoids)方法,其考慮三相表特征約束,但不考慮聚類的快速收斂機(jī)制。
為體現(xiàn)t-SNE 降維的有效性,本節(jié)分別采用方法1與方法4在臺區(qū)1至3中進(jìn)行了仿真計算。附錄A圖A2 至圖A4 給出了方法1 在臺區(qū)1 至3 中的可視化識別結(jié)果,圖2 至圖4 給出了方法4 在臺區(qū)1 至3中的可視化識別結(jié)果。表2 給出了方法1、方法4 在臺區(qū)1 至3 中的相序識別準(zhǔn)確率。
表2 方法1 和方法4 的相序識別準(zhǔn)確率對比Table 2 Comparison of phase sequence identification accuracy between method 1 and method 4
圖2 方法4 在臺區(qū)1 中的可視化識別結(jié)果Fig.2 Visual identification result of method 4 in distribution-station area 1
對比圖2 至圖4 與附錄A 圖A2 至圖A4 可知,方法4 下各聚類簇在低維特征空間中的分布差異度更為顯著,即相較于PCA 降維方法,t-SNE 算法能夠更為有效地保留原始序列的主要特征,更好地將高維空間中的數(shù)據(jù)分布特性在低維空間中表示,進(jìn)而有助于提高相序識別的準(zhǔn)確率。
圖4 方法4 在臺區(qū)3 中的可視化識別結(jié)果Fig.4 Visual identification result of method 4 in distribution-station area 3
為體現(xiàn)考慮三相表特征約束的必要性,本節(jié)分別采用方法2、3 與4 在臺區(qū)1、2 中進(jìn)行仿真計算。其中,方法2、3 均未考慮三相表特征約束。附錄A圖A5 和圖A6 給出了方法2 在臺區(qū)1、2 中的可視化識別結(jié)果,附錄A 圖A7 和圖A8 給出了方法3 在臺區(qū)1、2 中的可視化識別結(jié)果。表3 給出了方法2 至4在臺區(qū)1、2 中的識別準(zhǔn)確率。
表3 方法2 至4 的相序識別準(zhǔn)確率對比Table 3 Comparison of phase sequence identification accuracy of methods 2-4
分析表3 可知,在臺區(qū)1 中,相較于方法4,方法2、3 的識別準(zhǔn)確率較低。其中相序識別錯誤的電表均為三相表,具體表現(xiàn)為A、C 相電表被錯誤識別為B 相,違反了來自同一三相表中的3 個單相表不能連接到同一相序的背景知識。這是由于臺區(qū)1 中三相表分布在靠近配電變壓器低壓側(cè)分支出線首端,其電氣距離相近,導(dǎo)致其等效三塊單相表的電壓時序變化較為相似,進(jìn)而聚類時會將其聚為一類。而方法4 通過引入三相表特征約束,識別準(zhǔn)確率均可達(dá)100%。此外,在臺區(qū)2 中,由圖3 和表3 結(jié)果可知,方法4 通過添加Cannot-link 約束,識別準(zhǔn)確率較方法2、3 分別提升了11.49%、9.77%,說明三相表特征約束的考慮能夠有效提升識別準(zhǔn)確率。
從水的實(shí)際用途進(jìn)行歸類,水的使用大致可以分為自然使用和人為使用,自然使用主要包括生活飲用水、家禽用水和家庭用水,相關(guān)用水權(quán)利是一種絕對權(quán)利。人為使用主要體現(xiàn)為水用來進(jìn)行發(fā)電、生產(chǎn)和休閑,相關(guān)用水權(quán)利通常不是絕對權(quán)利。如果自然使用和人為使用存在沖突,如何合理分配水權(quán)呢?通常,人們認(rèn)為自然使用優(yōu)于人為使用。問題是,當(dāng)水資源能夠滿足自然使用需求,但是無法滿足各種人為使用需求時,如何在用水需求相互競爭的用水人之間分配有限的水資源?
圖3 方法4 在臺區(qū)2 中的可視化識別結(jié)果Fig.3 Visual identification result of method 4 in distribution-station area 2
為進(jìn)一步說明考慮三相表的必要性,采用方法2、4 在臺區(qū)3 進(jìn)行仿真計算。其中,方法2 假定三相表相序標(biāo)定,僅考慮單相表相序識別。附錄A 圖A9給出了三相表未參與情況下方法2 在臺區(qū)3 上的可視化識別結(jié)果。通過統(tǒng)計可知,未考慮三相表時,方法2 在臺區(qū)3 上的單相表相序識別準(zhǔn)確率僅有57.14%,相較于方法4,相序識別準(zhǔn)確率下降了42.86%。結(jié)合附錄A 圖A9 可知,由于臺區(qū)3 屬于城鄉(xiāng)結(jié)合部類型臺區(qū),其三相表報裝占比高,若因三相表相序標(biāo)定而不考慮參與相序識別,則會顯著降低同相電表群的電壓關(guān)聯(lián)特性,導(dǎo)致特征空間中聚類可行性差,易導(dǎo)致聚類錯誤,進(jìn)而劣化識別準(zhǔn)確率。
此外,通過考慮三相表及其特征約束,本文所提方法能夠有效辨識三相表不規(guī)范接線問題,如附錄A 表A1 至表A3 所示。三相表不規(guī)范接線的有效辨識能夠?yàn)榕_區(qū)線損精益化管理、三相不平衡與低電壓問題精準(zhǔn)治理提供支撐。
為驗(yàn)證本文所提CFK-Medoids 聚類算法中初始聚類中心選取方法以及快速收斂機(jī)制的有效性,采用方法4、5 在臺區(qū)1 至3 中進(jìn)行了仿真計算。其中方法5 采用隨機(jī)初始化聚類中心點(diǎn)、全局尋優(yōu)更新中心點(diǎn)的方式。表4 給出了方法4、5 的計算時間。
表4 方法4、5 的計算時間對比Table 4 Comparison of calculation time between methods 4,5
分析表4 可知,相較于方法5,方法4 在臺區(qū)1 至3 的計算時間分別減少了約53.3%、53%與90.2%,說明了聚類快速收斂機(jī)制的引入能夠顯著提升計算時效,且隨著臺區(qū)用戶規(guī)模增加,提升效果更為顯著。附錄A 圖A10 給出了方法4 在各臺區(qū)應(yīng)用的迭代收斂過程,其中縱坐標(biāo)表示前后兩輪迭代各聚類中心點(diǎn)的歐氏距離,當(dāng)該值為0 時,說明各中心點(diǎn)不再變化,算法收斂,從圖中可以看到在各臺區(qū)中算法的收斂次數(shù)均不高于5 次,收斂速度快。需要說明的是,方法4、5 在臺區(qū)1 至3 中的相序識別準(zhǔn)確率均為100%。因此,聚類快速收斂機(jī)制能夠有效兼顧相序識別的準(zhǔn)確性與時效性。
針對當(dāng)前低壓臺區(qū)用戶供電相序識別因缺乏考慮三相表導(dǎo)致識別不準(zhǔn)確問題,本文提出了基于三相表特征約束聚類的低壓臺區(qū)用戶相序識別方法,得到以下結(jié)論。
1)所提方法能夠保留原始數(shù)據(jù)在低維空間中的差異特征,有效提高了相序識別準(zhǔn)確率。
2)當(dāng)臺區(qū)三相表占比較高時,若不考慮三相表及其特征約束,將顯著降低相序識別準(zhǔn)確率。通過引入三相表特征約束,能夠顯著提升相序識別準(zhǔn)確率,且能夠有效辨識三相表不規(guī)范接線問題,進(jìn)而為臺區(qū)線損精益化管理、三相不平衡與低電壓等問題的精準(zhǔn)治理提供支撐。
3)當(dāng)臺區(qū)三相表占比較高、用戶規(guī)模較大時,采用聚類快速收斂機(jī)制能夠在保證識別準(zhǔn)確率的前提下,顯著提升相序識別的時效性。
本文所提相序識別方法依賴實(shí)際臺區(qū)數(shù)據(jù)質(zhì)量,下一階段將針對計及數(shù)據(jù)質(zhì)量問題的魯棒相序識別方法展開研究。
本文受到廣東電網(wǎng)有限責(zé)任公司科技項(xiàng)目(GDKJXM20190385)支持,特此感謝!
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。