趙俊煒 黎鳴 梅傲琪
摘 要:電網(wǎng)線路、變壓器等設(shè)備已更新,而主站系統(tǒng)中的對應(yīng)參數(shù)未及時更新和不同設(shè)備的量測數(shù)據(jù)的同步存在延遲,導(dǎo)致電廠、變電站端送到主站的電壓、電流、功率等數(shù)據(jù)與主站本地對應(yīng)端的量測數(shù)據(jù)之間存在嚴(yán)重的不平衡,本文通過聚類算法實(shí)現(xiàn)主站與電廠、變電站的數(shù)據(jù)同步問題,從而提高了數(shù)據(jù)質(zhì)量。
關(guān)鍵詞:聚類算法;變電站;數(shù)據(jù)同步;質(zhì)量檢查
0 引言
電網(wǎng)發(fā)現(xiàn)電壓、電流、功率等不平衡時,主站調(diào)度員首先確認(rèn)主站數(shù)據(jù)庫中變比、拓?fù)涞仁欠窦皶r更新,相關(guān)通知報文是否處理。若主站數(shù)據(jù)庫正常則調(diào)度員會聯(lián)絡(luò)電廠、變電站值班人員根據(jù)現(xiàn)場設(shè)備排查問題,查看是否是數(shù)據(jù)源問題或通訊問題。整個排查過程無自動化解決方案,需要多方協(xié)同手工實(shí)時聯(lián)絡(luò)排查,過程費(fèi)時費(fèi)力,急需自動化排查方案。具體表現(xiàn)為電廠、變電站端送到主站的電壓、電流、功率等數(shù)據(jù)與主站本地對應(yīng)端的量測數(shù)據(jù)之間存在嚴(yán)重的不平衡。有兩個原因:線路、變壓器等設(shè)備已更新,而主站系統(tǒng)中的對應(yīng)參數(shù)未及時更新和不同設(shè)備的量測數(shù)據(jù)的同步存在延遲,本文通過聚類算法實(shí)現(xiàn)主站與電廠、變電站的數(shù)據(jù)同步,實(shí)現(xiàn)了數(shù)據(jù)質(zhì)量的提高。
1 算法模型
1.1 算法原理
線路功率平衡計(jì)算:一條母線所有端流入流出的功率與損耗功率應(yīng)當(dāng)平衡。若發(fā)現(xiàn)功率平衡誤差過大,結(jié)合報警信息,初步判斷數(shù)據(jù)同步出現(xiàn)問題。以圖1所示B2母線為例:
其中,PG2為發(fā)電機(jī)G2的有功功率輸出,PT2為變壓器T2的一次側(cè)有功功率輸入,PB2為母線B2的線路損耗。PB2一般遠(yuǎn)小于PG2與PT2,因此當(dāng)PG2與PT2差距過大時,可能是數(shù)據(jù)同步出現(xiàn)問題。其它參數(shù)說明如下PLi為負(fù)荷,Bi為母線,Gi為發(fā)電機(jī)和Ti為變壓器。
1.2 聚類算法
K-means[1,2]聚類算法是一種無監(jiān)督機(jī)器學(xué)習(xí)算法,其過程首先隨機(jī)選取K個對象目標(biāo)定為初始的聚類中心,接著計(jì)算每一個對象和其它所有種子聚類中心相隔的距離,隨后,每個對象分配給離它距離最近的聚類中心。聚類中心以及被分配的對象就代表一個聚類。如果每分配一個樣本,聚類的中心位置會按照聚類中現(xiàn)有的對象進(jìn)行重新計(jì)算。此過程將不斷重復(fù)直到滿足某個條件為止。終止條件設(shè)定為:沒有對象被重新分配給不同的聚類,找不到聚類中心再發(fā)生變化,得出的誤差平方和局部最小,具體步驟如下:
(1)首先確定一個k值,數(shù)據(jù)集將經(jīng)過聚類得到k個集合。(2)從待選數(shù)據(jù)集中隨機(jī)選擇k個數(shù)據(jù)點(diǎn)作為質(zhì)心。(3)針對數(shù)據(jù)集中每個點(diǎn),算出其與每個質(zhì)心的長度(如歐式距離),劃分的原則遵循就近原則,離那個質(zhì)心近,就劃分到質(zhì)心所屬的集合。(4)如果所有數(shù)據(jù)被歸好集合后,合計(jì)有k個集合,接著重新算出每個集合的質(zhì)心。(5)如果剛剛計(jì)算出來的質(zhì)心和已有質(zhì)心之間的長度小于預(yù)先設(shè)置的閾值,就可以得出初步結(jié)論,聚類已經(jīng)達(dá)到期望的結(jié)果,算法終止。(6)假如新質(zhì)心和原質(zhì)心長度范圍變化很大,需要迭代第3、第4和第5步驟。
2 整體流程
首先開始主網(wǎng)本地數(shù)據(jù)稽核,并檢查主網(wǎng)數(shù)據(jù)設(shè)備、臺帳、表記資產(chǎn)等信息的完整性(包含設(shè)備編號、臺帳類信息、表資產(chǎn)編號信息和設(shè)備最后修改時間戳信息),檢查主網(wǎng)未處理的消息報文,提取未處理消息報文信息(時間信息、設(shè)備信息和參數(shù)修改信息),檢查設(shè)備編號與修改信息真實(shí)性,參數(shù)修改信息是否真實(shí),如果不真實(shí),記錄報文數(shù)據(jù),數(shù)據(jù)駁回,要求發(fā)送設(shè)備編號更多信息以檢驗(yàn)數(shù)據(jù)真實(shí)性,如果數(shù)據(jù)真實(shí)修改參數(shù)信息、記錄修改報告;接著根據(jù)主網(wǎng)不平衡報警信息檢查主網(wǎng)線路平衡問題,通過有功平衡、無功平衡、電壓平衡和電流平衡四個指標(biāo)篩選檢查真實(shí)存在不平衡設(shè)備,并記錄不平衡設(shè)備報警信息,使用K-Means聚類異常不平衡數(shù)據(jù),隨機(jī)生成聚類樣本中心,修正聚類中心,計(jì)算樣本間歐式距離重新聚類,如果樣本簇發(fā)生改變,分析聚類中心樣本異常數(shù)據(jù)特征,據(jù)此分類提升效率,根據(jù)變比錯誤、拓?fù)涓虏患皶r和數(shù)據(jù)源問題判斷是否完成,主網(wǎng)數(shù)據(jù)同步機(jī)制校驗(yàn),如果完成校驗(yàn)[3,4]。記錄不同步設(shè)備編號,出具主網(wǎng)數(shù)據(jù)不同步報告。
2.1 數(shù)據(jù)質(zhì)量檢查
設(shè)備臺帳表資產(chǎn)信息檢查是否完整,如果信息檢查不完整,就判斷是否多次不完整,如果不是多次信息檢查不完整,就重新下載設(shè)備臺帳表計(jì)資產(chǎn)信息檢查;如果多次信息檢查不完整,將數(shù)據(jù)駁回出具報告并要求整改。如果信息完整,出現(xiàn)不平衡告警,并判斷是否有報文未處理、數(shù)據(jù)是否有時間戳、所有現(xiàn)場設(shè)備數(shù)據(jù)是否已經(jīng)獲得,如果沒有獲得,就判斷是否多次無法獲取完整數(shù)據(jù),要求現(xiàn)場發(fā)送所有設(shè)備數(shù)據(jù);如果上述3個條件都滿足,就可以結(jié)束質(zhì)量檢查,進(jìn)行數(shù)據(jù)真實(shí)性校驗(yàn)[5],數(shù)據(jù)質(zhì)量檢查關(guān)鍵步驟如下:
(1)檢查臺賬信息是否完整;(2)出現(xiàn)不平衡告警時,檢查是否有未處理的報文;(3)檢查量測數(shù)據(jù)是否有時間戳;(4)檢查現(xiàn)場發(fā)送的顯示設(shè)備等設(shè)備的實(shí)時數(shù)據(jù)是否已完整。
2.2 數(shù)據(jù)校驗(yàn)
使用k-均值聚類方法將所有已知的告警點(diǎn)的數(shù)據(jù)分類,并依據(jù)電網(wǎng)經(jīng)驗(yàn),將每類異常數(shù)控(不平衡的有功數(shù)據(jù))與實(shí)際錯誤數(shù)據(jù)(變比)建立對應(yīng)關(guān)系,流程圖2如下。
詢問電網(wǎng)公司應(yīng)將數(shù)據(jù)集劃分為多少個簇,并隨機(jī)分配k個異常數(shù)據(jù)向量作為初始簇質(zhì)心位置[6],輸入一條異常數(shù)據(jù)向量,并找到離其最近的簇質(zhì)心,如果所有異常數(shù)據(jù)的中心已找到,輸入一個簇,并找到簇的質(zhì)心并更新;如果異常數(shù)據(jù)的中心沒有找到,則返回初始簇質(zhì)心位置。如果所有簇的質(zhì)心已更新,則判斷是否滿足終止準(zhǔn)則;如果所有簇的質(zhì)心沒有更新,則返回到異常數(shù)據(jù)中心。如果數(shù)值不滿足終止準(zhǔn)則,則返回到初始簇質(zhì)心位置;如果滿足終止條件,則輸出所有簇質(zhì)心,接著再輸入一個簇質(zhì)心,并依據(jù)電網(wǎng)公司經(jīng)驗(yàn)賦值給一個對應(yīng)的錯誤數(shù)據(jù)點(diǎn);并判斷所有簇與錯誤點(diǎn)的對應(yīng)關(guān)系是否建立,如果沒有建立,返回輸出所有質(zhì)心,如果建立,輸出所有簇和對應(yīng)關(guān)系。異常數(shù)據(jù)向量的構(gòu)建方式如下:
2.3 數(shù)據(jù)修正和駁回
當(dāng)告警出現(xiàn)時,尋找本條告警數(shù)據(jù)的最近簇中心,對應(yīng)錯誤類別即可判別為此告警的錯誤類別,當(dāng)數(shù)據(jù)不完整時或要求修改參數(shù)不匹配時將數(shù)據(jù)駁回,要求電廠與變電站發(fā)送更多參數(shù)已檢查數(shù)據(jù)完整性與真實(shí)性。
3 結(jié)語
本文提出基于基于聚類算法對主站與電廠、變電站的數(shù)據(jù)同步問題的解決辦法,從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)校驗(yàn)、數(shù)據(jù)修正和數(shù)據(jù)駁回三個個步驟解決了主站與電廠、變電站的數(shù)據(jù)同步問題,使數(shù)據(jù)質(zhì)量大大得到很大的改善。
參考文獻(xiàn)
[1] 楊俊闖,趙超.K-Means聚類算法研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2019(23):7-14+63.
[2] 曾俊.基于劃分的數(shù)據(jù)挖掘K-means聚類算法分析[J].現(xiàn)代電子技術(shù),2020(3):14-17.
[3] 崔浩,許軍,張小康,等.智能變電站的電子式互感器數(shù)據(jù)同步算法研究綜述[J].電工電氣,2018(7):1-9.
[4] 國網(wǎng)福建省電力有限公司檢修分公司.變電站監(jiān)控后臺數(shù)據(jù)庫、SCD及RCD的同步系統(tǒng)及方法:CN201910932554.8[P].2020-01-31.
[5] 張俊偉,沈祥.變電站自動化數(shù)據(jù)采樣數(shù)字化同步技術(shù)的方法綜述[J].數(shù)字化用戶,2017(49):241.
[6] 殷培峰,張婧瑜.基于智能變電站數(shù)字化保護(hù)的采樣數(shù)據(jù)同步技術(shù)應(yīng)用[J].工業(yè)儀表與自動化裝置,2017(5):63-66.