李囈瑾
(云南電網(wǎng)信息中心,云南 昆明 650000)
信息技術(shù)飛速發(fā)展背景下,數(shù)據(jù)規(guī)模持續(xù)擴大。大數(shù)據(jù)時代的到來,增加了數(shù)據(jù)分析和數(shù)據(jù)處理的難度。數(shù)據(jù)挖掘技術(shù)是以現(xiàn)代計算機信息技術(shù)為支撐,通過構(gòu)建數(shù)據(jù)庫的方式實現(xiàn)數(shù)據(jù)信息的處理。從海量數(shù)據(jù)中挖掘有價值的信息,能更好地適應(yīng)大數(shù)據(jù)的發(fā)展要求。為提升數(shù)據(jù)的精準度和利用率,必須對不完全模糊數(shù)據(jù)進行信息篩除[1]。數(shù)據(jù)挖掘系統(tǒng)基礎(chǔ)模型如圖1所示。
圖1 數(shù)據(jù)挖掘基礎(chǔ)模型
現(xiàn)階段的電網(wǎng)運營監(jiān)控中,電力企業(yè)經(jīng)常遇到一些問題,影響電網(wǎng)的穩(wěn)定發(fā)展。為實現(xiàn)電網(wǎng)開放模式的過渡,必須合理運用數(shù)據(jù)挖掘技術(shù)。為加強對電網(wǎng)運營狀況的實時控制,必須使原本復(fù)雜的電網(wǎng)運行監(jiān)控系統(tǒng)更加簡潔、科學(xué)。運用數(shù)據(jù)挖掘技術(shù)的過程中,需調(diào)整好大數(shù)據(jù)環(huán)境,以保障疏忽信息的質(zhì)量,實現(xiàn)數(shù)據(jù)處理的系統(tǒng)化、精確化及高效化。
目前,數(shù)據(jù)挖掘技術(shù)大致可分為三種類型。第一,統(tǒng)計分析型。該類型強調(diào)依照一定規(guī)律來挖掘數(shù)據(jù),是最成熟的一種數(shù)據(jù)挖掘技術(shù)。實際應(yīng)用的數(shù)據(jù)挖掘工具有變量分析、聚類分析及時間序列分析等。先通過數(shù)據(jù)分析找出存在的規(guī)律,然后運用不同模型完成數(shù)據(jù)挖掘。第二,知識發(fā)現(xiàn)型,該類型的基本原理是從數(shù)據(jù)倉庫中過濾有用信息,然后對其中隱含的位置信息進行挖掘。知識發(fā)現(xiàn)型數(shù)據(jù)挖掘技術(shù)的典型應(yīng)用包括人工智能神經(jīng)網(wǎng)絡(luò)和DNA遺傳序列組等。第三,其他數(shù)據(jù)挖掘。該類型包括文本數(shù)據(jù)挖掘、空間數(shù)據(jù)挖掘、分布式數(shù)據(jù)挖掘以及萬維網(wǎng)數(shù)據(jù)挖掘等。對于文本等非機構(gòu)數(shù)據(jù),采用文本數(shù)據(jù)挖掘;對于地理影像數(shù)據(jù),采用空間數(shù)據(jù)挖掘;對于網(wǎng)絡(luò)數(shù)據(jù),采用萬維網(wǎng)數(shù)據(jù)挖掘[2]。
電網(wǎng)運營監(jiān)控平臺建設(shè)中,應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的高效混輸,然后配合專業(yè)的計算機軟件,實現(xiàn)數(shù)據(jù)信息的篩選和分析工作,進而判斷數(shù)據(jù)的準確性和價值性,以保證電網(wǎng)的正常運營監(jiān)控。相關(guān)結(jié)果可直接顯示在數(shù)據(jù)顯示終端。電網(wǎng)運營監(jiān)控平臺包括了數(shù)據(jù)倉庫、挖掘模型及顯示終端等,其核心部分是源數(shù)據(jù)、數(shù)據(jù)倉庫及顯示終端。核心部分構(gòu)成了電網(wǎng)運營監(jiān)控平臺的系統(tǒng)框架,使原本復(fù)雜的系統(tǒng)區(qū)域簡單化和規(guī)范化。系統(tǒng)中,源數(shù)據(jù)能通過相應(yīng)的數(shù)據(jù)通道實現(xiàn)高效傳輸,經(jīng)由數(shù)據(jù)處理中心進行處理后,顯示在顯示終端。數(shù)據(jù)處理環(huán)節(jié)的核心部分是數(shù)據(jù)挖掘,不僅可從海量數(shù)據(jù)中剔除虛假信息,而且可挖掘出數(shù)據(jù)的潛在價值。最終結(jié)果顯示階段,要求相關(guān)人員做好顯示終端的選擇工作,確保檢測到的各種數(shù)據(jù)信息能清晰準確地顯示出來,如全面監(jiān)測、協(xié)調(diào)控制、綜合管理及運營分析等[3]。
電網(wǎng)運營監(jiān)控平臺中,數(shù)據(jù)倉庫主要體現(xiàn)系統(tǒng)的非功能性需求,包含兩個組成部分。第一,DW/DM,即數(shù)據(jù)倉庫本身結(jié)構(gòu)的多維度性。電力企業(yè)可根據(jù)實際需求,利用電網(wǎng)運營監(jiān)控平臺合理設(shè)置數(shù)據(jù)的不同要求,配合有效的分類標準逐步完成繁雜數(shù)據(jù)的整理規(guī)劃,便于數(shù)據(jù)的綜合處理,也方便了電力企業(yè)進行數(shù)據(jù)更新和利用。第二,ODS。它是強調(diào)將業(yè)務(wù)邏輯作為前提,配合E-R模型來反映操作流程,其組成部分包括主數(shù)據(jù)和交易數(shù)據(jù)。建設(shè)ODS應(yīng)用部分的過程中,需結(jié)合相關(guān)要求進行表格設(shè)計,以確保ODS表結(jié)構(gòu)能與原系統(tǒng)表結(jié)構(gòu)合并,為后續(xù)的數(shù)據(jù)統(tǒng)計分析提供便利[4]。
完成電網(wǎng)運營監(jiān)控平臺系統(tǒng)框架的架設(shè)后,需配合有效算法挖掘數(shù)據(jù)倉庫中的數(shù)據(jù)信息。為提升電網(wǎng)運營監(jiān)控工作水平,技術(shù)人員必須根據(jù)實際情況做好算法的設(shè)計選擇。數(shù)據(jù)計算過程中,需用到相應(yīng)的ETL工具,經(jīng)由OSD完成源數(shù)據(jù)的統(tǒng)計分析工作,然后再利用DW/DM實現(xiàn)數(shù)據(jù)的分類匯總整理。分析數(shù)據(jù)處理的總體流程發(fā)現(xiàn),基本原理是運用映射關(guān)系、數(shù)據(jù)目標以及數(shù)據(jù)源來實現(xiàn)數(shù)據(jù)計算,其中,映射關(guān)系指數(shù)據(jù)源和數(shù)據(jù)目標實現(xiàn)的過程,數(shù)據(jù)源代表原始數(shù)據(jù)或者所有數(shù)據(jù)的輸入端;數(shù)據(jù)目標多表現(xiàn)為數(shù)據(jù)表和經(jīng)過統(tǒng)計分析后的數(shù)據(jù),本身存在一定規(guī)律性。
電網(wǎng)運營監(jiān)控平臺能為電力企業(yè)開展電網(wǎng)運行監(jiān)控工作提供可靠的數(shù)據(jù)挖掘環(huán)境,提升監(jiān)控效果。因此,構(gòu)建數(shù)據(jù)倉庫時,應(yīng)依照電網(wǎng)運行監(jiān)控主體的現(xiàn)實需求,做好合理地規(guī)劃設(shè)計,盡可能減少冗余數(shù)據(jù)和無用數(shù)據(jù)[5],以降低大數(shù)據(jù)對電網(wǎng)運營監(jiān)控工作的負面影響。同時,合理使用數(shù)據(jù)挖掘技術(shù),以便高效地完成數(shù)據(jù)源的篩選分析。構(gòu)建數(shù)據(jù)倉庫時,應(yīng)明確主題,并進一步細化主題內(nèi)容。條件允許時,可分為多個子主題,使所有子主題中的數(shù)據(jù)挖掘都可與主題相互對應(yīng)。電力企業(yè)在開展電網(wǎng)運營監(jiān)控平臺建設(shè)的過程中,需確保子主題能與企業(yè)自身的業(yè)務(wù)數(shù)據(jù)相互對應(yīng)。此外,考慮到實踐中可能需要通過維表實現(xiàn)數(shù)據(jù)庫不同區(qū)域數(shù)據(jù)的連接,應(yīng)將數(shù)據(jù)庫建設(shè)成多維數(shù)據(jù)集,確保使用價值最大化。
信息化技術(shù)的飛速發(fā)展使數(shù)據(jù)挖掘技術(shù)的功能越來越完善。電網(wǎng)運營監(jiān)控平臺在卡站監(jiān)控展示的過程中,可供選擇的展示形式包括柱狀圖、餅狀圖、維恩圖以及折線圖等。不同的展示形式適用于不同的需求,確保了技術(shù)人員和管理人員能對數(shù)據(jù)變化進行動態(tài)分析,為電網(wǎng)運營監(jiān)控管理工作提供參考。如果需表達電網(wǎng)運營監(jiān)控的工作量,可選擇條形圖或者柱狀圖;如果需表達數(shù)據(jù)的變化趨勢,可選擇折線圖;如果需表達數(shù)據(jù)之間的交叉關(guān)系,可采用維恩圖(見圖2)。
圖2 監(jiān)控展示圖表類組件
經(jīng)濟的發(fā)展使社會對電能的需求持續(xù)增長,電網(wǎng)規(guī)模迅速擴大。運營監(jiān)控工作直接影響電網(wǎng)的穩(wěn)定、可靠運行。電力企業(yè)面對新的發(fā)展環(huán)境,應(yīng)積極探索新的方法來保證電網(wǎng)運營監(jiān)控工作效果。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到電網(wǎng)運營監(jiān)控平臺建設(shè),可實現(xiàn)海量數(shù)據(jù)的高效處理和深入挖掘,方便工作人員掌控和使用數(shù)據(jù)信息,保障電網(wǎng)的穩(wěn)定、可靠運行。