• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      企業(yè)電力征信大數(shù)據(jù)價值挖掘與應用

      2021-11-22 02:01:10辛保江李德文王蘭蘭
      大數(shù)據(jù) 2021年6期
      關鍵詞:誤碼率準確性用電

      辛保江,李德文,王蘭蘭

      國網(wǎng)山東省電力公司濰坊供電公司,山東 濰坊 261000

      1 引言

      中國是全世界唯一實現(xiàn)全民通電的國家[1-5]。在電力技術高速發(fā)展的今天,電力成為一種不可或缺的資源,我國的電力消費一直秉承著“先使用后付款”的收費方式,但在用戶拖欠電費、違約用電方面沒有一個很好的解決方案[3]。電力征信的應用能夠有效約束信用不良的用戶,減少違約用戶的產(chǎn)生,提升供電公司的管理水平。

      參考文獻[1]設計了基于9項指標的電力征信檢測平臺,根據(jù)用戶的用電量、用電繳費情況和違約用電記錄等指標對用戶進行分類,增強管理的條理性,但數(shù)據(jù)采集方式過于老舊,沒有正確建立用戶的用電模型。參考文獻[2]提出利用大數(shù)據(jù)平臺對電力征信用戶數(shù)據(jù)進行提取與處理,這一做法能保證數(shù)據(jù)分析的客觀性與準確性,但系統(tǒng)穩(wěn)定性卻沒有得到保證。本研究針對電力征信平臺進行創(chuàng)新,設計電力征信大數(shù)據(jù)平臺,基于平臺穩(wěn)定性與測試準確性進行優(yōu)化。

      2 電力征信關鍵技術

      2.1 用戶用電模型構建

      在大數(shù)據(jù)模型技術中,聯(lián)機分析法是數(shù)據(jù)分析的主要方法,通過聯(lián)機分析法,大數(shù)據(jù)信息能夠在信息平臺上進行多維傳播[6]。將聯(lián)機分析法運用到電力征信領域,對電力用戶的用電行為進行收集與分析,從而為電力企業(yè)供電計劃的制訂提供便利[7-10]。用電數(shù)據(jù)處理流程如圖1所示。

      圖1 用電數(shù)據(jù)處理流程

      如圖1所示,首先對用電用戶的數(shù)據(jù)進行提取,將用戶的用電行為進行分類,然后記錄分類數(shù)據(jù),同時對用戶數(shù)據(jù)進行行為分析,最終審核數(shù)據(jù)是否有遺漏或者錯誤的地方,如果有,則需要對數(shù)據(jù)進行再次提取。傳統(tǒng)記錄主要提取用戶的9類數(shù)據(jù),本研究針對用戶的數(shù)據(jù)分析,將數(shù)據(jù)提取分為四大類、八小類,使得數(shù)據(jù)處理更加條理化,同時加快數(shù)據(jù)采集工作的開展與完成。數(shù)據(jù)分類如圖2所示。

      圖2 數(shù)據(jù)分類

      如圖2所示,將數(shù)據(jù)分為用戶行為、費用細則、用戶價值與個人信用四大類。此外,還可以將上述數(shù)據(jù)信息分為用電情況、費用情況、信用情況與用戶評價,為了表達方便,本文使用“用戶行為、費用細則、用戶價值、個人信用”進行說明。然后將用戶行為細分為該用戶的月度、季度、年度用電量與用電規(guī)律,將費用細則細分為用戶的繳費情況和預付費用情況;將用戶價值細分為對未來用戶用電情況的預估;針對個人信用方向,記錄用戶欠費情況與繳費及時率,通過對此4項數(shù)據(jù)的采集,能夠完整地構建用戶的用電模型,有利于對未來電力分布、企業(yè)管理和用戶信用進行綜合分析。

      對以上幾類數(shù)據(jù)進行分析處理時,還可根據(jù)分析結果將用戶群分為尊貴用戶、普通用戶、風險用戶和失信用戶,針對不同的用戶提供不同的處理方式,從而加強電力企業(yè)對用戶的管理力度,對電力企業(yè)的績效分析起到促進作用[11]。

      2.2 模塊化設計優(yōu)化

      傳統(tǒng)電力征信平臺通過模塊化的設計將硬件進行組合,但這種模塊化設計在數(shù)據(jù)處理過程中出現(xiàn)錯誤數(shù)據(jù)的概率大于需求的概率閾值[12]。因此,在傳統(tǒng)數(shù)據(jù)采集過程中需要分配人力資源對數(shù)據(jù)進行預先審查,這一過程中人力與時間耗費巨大,且人工審核的準確率也無法達到預期[13]。因此針對這一缺點,本研究在傳統(tǒng)模塊化的基礎上進行優(yōu)化創(chuàng)新,主要將數(shù)據(jù)采集模塊與網(wǎng)絡模塊進行交互,使得網(wǎng)絡數(shù)據(jù)能夠對采集到的數(shù)據(jù)進行校正;將設備管理模塊中的硬件檢測部分應用于數(shù)據(jù)分析模塊,提高數(shù)據(jù)分析的速度,提升數(shù)據(jù)分析的效率[14];在用戶交互模塊中,添加軟件后門進行二次開發(fā),便于及時應對電力資源需求變化過快的情況,提高平臺穩(wěn)定性[15]。平臺模塊化設計如圖3所示。

      圖3 平臺模塊化設計

      本研究所提電力征信大數(shù)據(jù)平臺的創(chuàng)新點為針對硬件方面的模塊化創(chuàng)新,其中數(shù)據(jù)存儲方面為固定存儲,當網(wǎng)絡模塊檢測到錯誤數(shù)據(jù)時,可將數(shù)據(jù)存儲模塊中存儲的同類數(shù)據(jù)進行替代,針對替代數(shù)據(jù)進行分類。在實驗中可以明顯發(fā)現(xiàn),此方法雖然會在一定程度上產(chǎn)生誤差,但是其對結果的影響遠沒有輸入錯誤數(shù)據(jù)造成的誤差大,因此本研究針對模塊化設計的創(chuàng)新具有技術優(yōu)越性。

      面對傳統(tǒng)電力征信平臺的功能與優(yōu)缺點,本研究對電力征信平臺進行改進。下面將從網(wǎng)絡架構設計與算法設計兩部分對本研究平臺的創(chuàng)新點進行分析。

      3 電力征信大數(shù)據(jù)平臺設計

      3.1 網(wǎng)絡架構設計

      本文設計的平臺從電力行業(yè)的基礎出發(fā),與目前主流的大數(shù)據(jù)技術框架相吻合。針對傳統(tǒng)電力征信平臺計算準確性不足、電力征信大數(shù)據(jù)分析系統(tǒng)對數(shù)據(jù)分析的客觀性不夠的缺點,本研究通過對電力征信平臺的網(wǎng)絡架構進行重新整合,將數(shù)據(jù)監(jiān)測與營銷分析、運行管理等作為服務層,面向電力企業(yè)提供真實的業(yè)務服務[11-17]。同時在數(shù)據(jù)計算方面采用專門針對電力信息分析的綜合型算法,通過綜合型算法得到用戶的用電模型,將此模型通過數(shù)據(jù)接口應用于用電用戶(即與用電相關的企業(yè)用戶),為他們提供良好的用電方案與維護方案。本研究設計的平臺整合了電力信息接入、用戶數(shù)據(jù)分類治理、用戶模型搭建與模型分析展示等功能,集成了多圖形的可視化建模界面與二次開發(fā)接口拓展[18]。整體網(wǎng)絡架構如圖4所示。

      圖4 整體網(wǎng)絡架構

      在網(wǎng)絡架構中,對數(shù)據(jù)進行過濾,主要通過對數(shù)據(jù)的篩選與對關聯(lián)數(shù)據(jù)的整合,將用電數(shù)據(jù)通過表格和餅狀圖等可視化視圖直觀地展現(xiàn)出來。數(shù)據(jù)過濾流程如圖5所示。

      圖5 數(shù)據(jù)過濾流程

      如圖5所示,針對源表,即用戶表的信息,可以選擇將用戶表作為基礎,將用戶表分解為區(qū)域表和設備表,區(qū)域表記錄一個區(qū)域間的用電數(shù)據(jù),將不同區(qū)域進行對比,能夠很直觀地看出區(qū)域與區(qū)域之間的用電差距;設備表主要記錄電流與電壓的監(jiān)測值,根據(jù)電流與電壓的變化預測用電量的變化趨勢,具體如圖6所示。

      圖6 源表數(shù)據(jù)

      3.2 算法設計

      針對本研究設計的電力征信大數(shù)據(jù)平臺的網(wǎng)絡架構,設計一種將數(shù)據(jù)進行分類、聚類、回歸與集成的算法,即創(chuàng)新的綜合型算法[19]。給定一個電力征信平臺的用戶信息集,首先使用分類聚類算法將此信息集分為用戶行為、費用細則、用戶價值與個人信用四大類,這里采用K近鄰(K-nearest neighbor,KNN)算法[20-24]。K值根據(jù)電力信息數(shù)據(jù)集規(guī)模的不同進行選取,比如一個區(qū)域內(nèi)的用電度數(shù)與用電時間不同,K值也會隨其不同而發(fā)生變化,在K值的選擇上使用交叉驗證的方式,即將不同的樣本集交叉起來驗證K值的方差,從而求得最佳的K值,K值交叉驗證如圖7所示。

      從圖7可以明顯看出,開始時隨著K值的增大,誤碼率由高向低變化;當K值大于10之后,誤碼率開始變大,因此要選擇樣本能承受的最佳K值。此算法除了要注意K值的選擇,還要考慮點與點之間的距離的計算,給定兩個電力信息的數(shù)據(jù)點(x1,y1)與(x2,y2),則這兩點之間的距離ρ的計算式為:

      圖7 K值交叉驗證

      通過式(1)可以計算出二維平面內(nèi)點與點之間的距離,但電力信息一般為多維度的數(shù)據(jù),因此需要將距離計算式拓展到多維空間,即:

      確定好K值并計算完成電力數(shù)據(jù)集的點間距離后,就能進行數(shù)據(jù)的分類,將數(shù)據(jù)分為前文所述四大類后,下一步進行數(shù)據(jù)的決策,通過數(shù)據(jù)的決策將分類后的信息進行處理。這里給定電力征信數(shù)據(jù)集為D,計算電力征信數(shù)據(jù)集D的Gini系數(shù),對于電力征信數(shù)據(jù)集中的每一個用電用戶數(shù)據(jù)A,用戶數(shù)據(jù)A中包含a1、a2、a3這3種分組數(shù)據(jù)信息,然后對這3種分組進行處理和計算,得到該電力征信數(shù)據(jù)集的不同集合。

      在式(3)中,Gini系數(shù)Gini(D,A)指不同分組情況下電力征信用戶數(shù)據(jù)A在整個電力征信數(shù)據(jù)集合D中的關聯(lián)集合。假定將電力征信用戶數(shù)據(jù)分為N個類別,測試用戶數(shù)據(jù)中的任一隨機數(shù)據(jù)屬于第n類的概率為Pn,則針對電力征信用戶模型分類概率因素的Gini系數(shù)為:

      在式(4)中,將給定區(qū)域內(nèi)的電力征信用戶數(shù)據(jù),按照用戶行為、費用細則、用戶價值與個人信用4個方面展開,根據(jù)Gini系數(shù)對用戶未來一段時間的用電情況進行判定,通過對電力征信大數(shù)據(jù)的分類與決策,得出區(qū)域的用電規(guī)律,通過此用電規(guī)律可以調(diào)整整個電力企業(yè)服務覆蓋區(qū)域的配電方案。通過這一設定,在區(qū)域內(nèi)進行雷電預警測試,可根據(jù)配電決策樹來演化雷電預警概率[19-24],如圖8所示。

      圖8 配電決策樹

      4 實驗設計與分析

      4.1 實驗環(huán)境及數(shù)據(jù)

      本研究采用的硬件計算機操作系統(tǒng)為64位的Microsoft Windows 10,CPU為Inter(R)Core(TM)i7,主頻為2.59 GHz,內(nèi)存為16 GB。

      X市常住人口約1035萬人,用電量在230萬kW·h左右,因此本研究采用X市中心區(qū)域的用電情況作為模擬對象。在實驗過程中將X市中心區(qū)域作為測試區(qū)域,通過對市中心區(qū)域的用電情況進行模擬,比較本研究所用電力征信大數(shù)據(jù)平臺與傳統(tǒng)電力征信平臺的優(yōu)缺點,驗證本文平臺的技術優(yōu)越性。

      4.2 實驗設計與實驗過程

      為了驗證本文所設計的平臺的技術優(yōu)越性,設置對照實驗,先對平臺搭建進行仿真,主要通過對電力征信大數(shù)據(jù)平臺中的網(wǎng)絡架構與數(shù)據(jù)分類模型進行搭建,對比參考文獻[1]提出的基于9項指標的電力征信檢測平臺(后文稱為一號平臺)與參考文獻[2]提出的利用大數(shù)據(jù)平臺對電力征信用戶數(shù)據(jù)進行提取與處理的平臺(后文稱為二號平臺),判斷三者在電力征信大數(shù)據(jù)信息處理過程中的穩(wěn)定性與準確性。

      設計兩種實驗分別驗證本文平臺與一號平臺、二號平臺之間的平臺穩(wěn)定性和測試準確性。針對平臺穩(wěn)定性的測試,本文選用高壓測試,使用X市某地停電事故的錯誤數(shù)據(jù)集(該數(shù)據(jù)集為造成停電的各種數(shù)據(jù)信息集合,比如負荷停電、電力加載、異物等數(shù)據(jù)信息)對平臺分別進行測試,記錄平臺結果的誤碼率,對平臺測試的穩(wěn)定性進行分析,同時標定應急用戶、重要用戶與普通用戶,觀察系統(tǒng)給出的3種用戶的處理方式是否合理。針對準確性的測試,將X市近3年的用電情況輸入平臺,再將各個平臺預測的未來一周用電情況與現(xiàn)實生活中的用電情況進行對比,比較三者的準確性。

      4.3 實驗結果

      為了測試平臺穩(wěn)定性,將測試數(shù)據(jù)輸入平臺中,觀察3個平臺給出的反應。將平臺的誤碼率繪制成折線圖,如圖9所示。

      誤碼率在本文中是衡量平臺測試數(shù)據(jù)在一定的時間范圍內(nèi)實現(xiàn)數(shù)據(jù)傳輸?shù)木_性指標,計算式為:誤碼率=傳輸中的誤碼/傳輸?shù)目偞a數(shù)×100%。從圖9可看出,一號平臺誤碼率較高,在6.5 h的測試結束后,一號平臺誤碼率達到8%,這是因為一號平臺沒有將錯誤的處理結果及時篩選出來,導致錯誤的結果繼續(xù)向下游運算,進而產(chǎn)生更大的錯誤;二號平臺在1.1 h之前與本研究平臺誤碼率相同,但在1.1 h以后,由于算法處理等問題無法及時更新錯誤運算,導致誤碼率逐步提升,在6.5 h時達到4.5%;本文平臺由于更新了大數(shù)據(jù)分類機制,能夠有效地控制誤碼率增長,因此在6.5 h時,誤碼率仍在1.5%左右,且上升趨勢穩(wěn)定,這表明本文的數(shù)據(jù)分類方法穩(wěn)定性較高。

      圖9 平臺誤碼率測試

      針對準確性的設計,本文將近3年的用電數(shù)據(jù)作為訓練集,先對3個平臺進行訓練,再對未來一周X市的用電情況進行,將預測結果與真實結果進行對比,引入準確性(在一定實驗條件下,經(jīng)過多次測定后的平均值與真實值相符合的程度),然后對準確性進行分析。具體用電分析情況見表1。

      由表1可知,本文所用方案在用電量與繳費預測中都明顯優(yōu)于一號平臺與二號平臺。在用電預測中,本文平臺的預測值與真實值僅相差0.2萬kW·h;在繳費預測中,本文平臺的預測值與真實值僅相差0.02萬元,準確率高達98.9%。該數(shù)據(jù)信息是經(jīng)過多次測定后計算出的平均值。

      表1 用電分析情況

      經(jīng)過上述兩種實驗的分析,本文平臺在穩(wěn)定性與測試準確性上都明顯優(yōu)于參考文獻[1]與參考文獻[2]設計的平臺,驗證了本文平臺的技術優(yōu)越性。

      5 結束語

      本文基于大數(shù)據(jù)挖掘進行數(shù)據(jù)研究,對傳統(tǒng)電力征信平臺進行改良。利用模塊化結構技術,構建電力征信大數(shù)據(jù)平臺的網(wǎng)絡架構,以此構建出用戶用電模型與區(qū)域用電模型,再通過綜合型大數(shù)據(jù)分類決策算法對用電用戶的用電情況進行分類判斷,進一步改進了傳統(tǒng)電力資源管理平臺穩(wěn)定性不足與準確性低的缺點,同時為電力征信行業(yè)的大數(shù)據(jù)分析提供了理論與實踐依據(jù)。

      猜你喜歡
      誤碼率準確性用電
      用電安全
      面向通信系統(tǒng)的誤碼率計算方法
      雷達與對抗(2022年1期)2022-03-31 05:18:20
      淺談如何提高建筑安裝工程預算的準確性
      用煤用電用氣保障工作的通知
      安全用電知識多
      用電安全要注意
      美劇翻譯中的“神翻譯”:準確性和趣味性的平衡
      論股票價格準確性的社會效益
      泰克推出BERTScope誤碼率測試儀
      超聲引導在腎組織活檢中的準確性和安全性分析
      闽清县| 曲阳县| 仙居县| 松阳县| 谷城县| 娱乐| 珲春市| 新巴尔虎右旗| 水城县| 临安市| 历史| 江安县| 南汇区| 银川市| 勃利县| 开原市| 寻乌县| 信宜市| 五莲县| 分宜县| 南充市| 临夏县| 灵丘县| 砚山县| 姜堰市| 闵行区| 沙湾县| 锦州市| 瑞安市| 通城县| 蒙阴县| 沽源县| 双牌县| 望谟县| 宁强县| 永善县| 贵定县| 泽普县| 格尔木市| 蒙阴县| 苍梧县|