田園++楊東寧++李少龍++楊廣文++劉星++余其超
[摘 要] 電網(wǎng)資產(chǎn)管理貫穿了供電企業(yè)的諸多生產(chǎn)業(yè)務(wù)范圍,其覆蓋范圍廣、體系種類龐雜、數(shù)量龐大等特點(diǎn)。在電網(wǎng)資產(chǎn)信息化管理建設(shè)進(jìn)程中,針對電網(wǎng)“數(shù)據(jù)豐富,信息缺乏”的現(xiàn)狀,提倡應(yīng)大力研究數(shù)據(jù)挖掘技術(shù),將數(shù)據(jù)挖掘技術(shù)應(yīng)用于電網(wǎng)建設(shè)、運(yùn)行生產(chǎn),為電網(wǎng)的建設(shè)和運(yùn)行提供更科學(xué)、更可靠的支撐。文章探討了數(shù)據(jù)挖掘技術(shù)在電網(wǎng)企業(yè)中的應(yīng)用,并提出了相關(guān)建議。
[關(guān)鍵詞] 數(shù)據(jù)挖掘;信息系統(tǒng);資產(chǎn)管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 15. 079
[中圖分類號] TP311;V242.3 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2017)15- 0177- 03
0 引 言
隨著信息技術(shù)的不斷發(fā)展,各行業(yè)大量數(shù)據(jù)隨之產(chǎn)生,為從大量的數(shù)據(jù)中挖掘出潛在的價(jià)值,為生產(chǎn)生活提供支撐,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來,已在電網(wǎng)信息化管理業(yè)務(wù)中得以應(yīng)用。
云南電網(wǎng)信息化建設(shè)工作經(jīng)過多年的實(shí)施開展,取得了巨大的成果。2015年,云南電網(wǎng)有限責(zé)任公司集中資源,以人資數(shù)據(jù)先行,協(xié)同推進(jìn)營銷、資產(chǎn)、財(cái)務(wù)和GIS平臺業(yè)務(wù)強(qiáng)關(guān)聯(lián)系統(tǒng),而由于互聯(lián)網(wǎng)通信等技術(shù)的發(fā)展,營銷、資產(chǎn)等業(yè)務(wù)系統(tǒng)的全面實(shí)施推廣實(shí)現(xiàn)了對業(yè)務(wù)應(yīng)用有效支撐的同時(shí)。這些系統(tǒng)采集、處理、積累的數(shù)據(jù)越來越多,數(shù)據(jù)量增速越來越快,以至用“海量、爆炸性增長”等詞匯已無法形容數(shù)據(jù)的增長速度。海量數(shù)據(jù)需要且已得到存儲,如電網(wǎng)設(shè)備的狀態(tài)數(shù)據(jù)、運(yùn)行數(shù)據(jù)、電費(fèi)計(jì)量數(shù)據(jù)、用戶數(shù)據(jù)、電量數(shù)據(jù)以及各部分運(yùn)行參數(shù)指標(biāo)數(shù)據(jù)等。
同時(shí),因?qū)嵤┩茝V涉及單位眾多、業(yè)務(wù)廣,而各應(yīng)用單位管控點(diǎn)及方式存在一定差異,如何從多源大數(shù)據(jù)中及時(shí)挖掘出隱藏信息和有效數(shù)據(jù),如何及時(shí)掌握各業(yè)務(wù)系統(tǒng)在各單位的應(yīng)用情況問題,給數(shù)據(jù)分析處理帶來了巨大的挑戰(zhàn),因此,借用數(shù)據(jù)挖掘技術(shù)對各業(yè)務(wù)數(shù)據(jù)信息進(jìn)行分析,實(shí)時(shí)掌握資產(chǎn)設(shè)備情況,提升資產(chǎn)管理水平變得尤為迫切。
1 數(shù)據(jù)挖掘技術(shù)在電網(wǎng)資產(chǎn)管理應(yīng)用中的必要性
電網(wǎng)資產(chǎn)數(shù)據(jù)自身存在特點(diǎn):一是電網(wǎng)企業(yè)是一個(gè)規(guī)模相當(dāng)龐大的企業(yè),電網(wǎng)資產(chǎn)更是覆蓋社會的各個(gè)角落及各行各業(yè),電網(wǎng)資產(chǎn)管理的數(shù)據(jù)不僅多,而且緯度高,數(shù)據(jù)列多,很難整理;二是在電力資產(chǎn)管理系統(tǒng)中,采集到的數(shù)據(jù)中包含著諸如設(shè)備型號、功能位置、生產(chǎn)廠家、生產(chǎn)日期、投運(yùn)日期等諸多參數(shù),又兼有專業(yè)覆蓋層次廣等特點(diǎn),因此,資產(chǎn)數(shù)據(jù)質(zhì)量管理較差,嚴(yán)重影響企業(yè)資產(chǎn)管理水平;三是電網(wǎng)資產(chǎn)管理企業(yè)較多,涉及專業(yè)教廣,對電網(wǎng)資產(chǎn)屬性層級的管理較為混亂,上級企業(yè)無法對下屬公司資產(chǎn)透徹了解掌握,無法掌握自身家底,數(shù)據(jù)管理模式比較單一,不同部門的數(shù)據(jù)信息由各個(gè)部門自行處理,只進(jìn)行簡單參考或統(tǒng)計(jì)工作,沒有匯總到一起進(jìn)行系統(tǒng)、全面的分析挖掘,導(dǎo)致大量有價(jià)值的信息被埋沒。因此電網(wǎng)企業(yè)迫切需要能夠充分合理地進(jìn)行數(shù)據(jù)處理的數(shù)據(jù)挖掘平臺。
同時(shí),電網(wǎng)企業(yè)產(chǎn)生的數(shù)據(jù)量大、質(zhì)量不高,但又對數(shù)據(jù)要求較高,這就意味著電網(wǎng)企業(yè)迫切需要數(shù)據(jù)挖掘技術(shù)來處理海量數(shù)據(jù),并發(fā)現(xiàn)數(shù)據(jù)間的潛在聯(lián)系。
2 數(shù)據(jù)挖掘技術(shù)在電網(wǎng)資產(chǎn)管理中的應(yīng)用
2.1 數(shù)據(jù)挖掘的流程及方法
數(shù)據(jù)挖掘(Data Mining,簡稱DM)可以應(yīng)用在各個(gè)不同的領(lǐng)域。數(shù)據(jù)挖掘是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程,使用這些模型和關(guān)系可以進(jìn)行預(yù)測,尋找數(shù)據(jù)間的潛在關(guān)聯(lián),發(fā)現(xiàn)忽略因素。
2.1.1 數(shù)據(jù)挖掘流程
CRISP-DM為跨行業(yè)的數(shù)據(jù)挖掘提供了一個(gè)完整周期的綜合展示,形成閉合環(huán),是不斷反饋不斷完善的動態(tài)過程,具體包括6個(gè)階段:商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、模型評估和模型部署。
(1)商業(yè)理解。從商業(yè)的角度上了解項(xiàng)目的要求和最終目的,從目的為切入點(diǎn),并將這些目的與數(shù)據(jù)挖掘的定義以及結(jié)果結(jié)合起來。
(2)數(shù)據(jù)理解。對可用的數(shù)據(jù)進(jìn)行評估和數(shù)據(jù)標(biāo)準(zhǔn)的選取。(3)數(shù)據(jù)準(zhǔn)備。對可用的原始數(shù)據(jù)進(jìn)行一系列的組織以及清洗,使之達(dá)到建模需求。
(4)建立模型。在這個(gè)階段可能需要選擇和應(yīng)用不同的建模技術(shù),同時(shí)校準(zhǔn)模型參數(shù)。該階段主要建立的模型包括關(guān)聯(lián)規(guī)則、分類與預(yù)測、聚類、異常檢測等。
(5)模型評估。該階段重點(diǎn)挖掘結(jié)果與商業(yè)目的的吻合度。(6)模型部署。模型部署可以是生成一份報(bào)告,或者是一個(gè)可重復(fù)的數(shù)據(jù)挖掘過程。
2.1.2 數(shù)據(jù)挖掘方法
數(shù)據(jù)挖掘涉及的學(xué)科領(lǐng)域和方法很多,以下是幾種常用方法。
統(tǒng)計(jì)分析:統(tǒng)計(jì)分析提供了一種基于多維度、大量歷史數(shù)據(jù)的判別方法,有回歸分析、方差分析等。統(tǒng)計(jì)分析是根據(jù)已有數(shù)據(jù)對事件運(yùn)行規(guī)律的探索,推斷出因果線性關(guān)系,計(jì)算出線性回歸方程。統(tǒng)計(jì)分析的優(yōu)勢在與對有確定影響因素的事件,有相對準(zhǔn)確的影響因子效力分析。
神經(jīng)網(wǎng)絡(luò):神經(jīng)網(wǎng)絡(luò)是模仿人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和工作機(jī)制而建立的一種計(jì)算模型,包括前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)的優(yōu)勢是其具有良好的自組織、自適應(yīng)、并行處理、分布存儲和高度容錯(cuò)等特性。
決策樹:決策樹一般都是自上而下的來生成的。每個(gè)決策或事件都可能引出兩個(gè)或多個(gè)事件,導(dǎo)致不同的結(jié)果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。決策樹對比神經(jīng)元網(wǎng)絡(luò)的優(yōu)點(diǎn)在于可以生成一些規(guī)則,對解決多維數(shù)據(jù)的分類問題很有效,但也會隨著分支數(shù)的增多,管理難度加大。
粗糙集:粗糙集理論認(rèn)為知識是有粒度的,利用相對核的概念進(jìn)行知識關(guān)聯(lián)性分析。該理論能夠在缺少相關(guān)數(shù)據(jù)的先驗(yàn)知識的情況下,基于數(shù)據(jù)的分類能力,解決模糊或不確定性數(shù)據(jù)的分析處理。
可視化:可視化提供給用戶一個(gè)人機(jī)交互的平臺,使數(shù)據(jù)展示更加清晰、簡潔。endprint
2.2 數(shù)據(jù)挖掘在電網(wǎng)資產(chǎn)管理中的應(yīng)用
隨著云南電網(wǎng)有限責(zé)任公司資產(chǎn)管理系統(tǒng)的不斷深入應(yīng)用,可獲取的電網(wǎng)資產(chǎn)數(shù)據(jù)包括電力基礎(chǔ)類數(shù)據(jù)和生產(chǎn)營銷類數(shù)據(jù)?;A(chǔ)類數(shù)據(jù)包括GIS、用戶基礎(chǔ)信息、電網(wǎng)資產(chǎn)設(shè)備信息、基建管理信息、物資管理信息、生產(chǎn)管理信息等;生產(chǎn)營銷類數(shù)據(jù)包括輸、變、配三個(gè)維度設(shè)備全生命周期數(shù)據(jù)及過程管控中的各類業(yè)務(wù)管理數(shù)據(jù)。充分利用這些基于電網(wǎng)資產(chǎn)管理的實(shí)時(shí)和歷史數(shù)據(jù),可提供大量高附加值的服務(wù),實(shí)現(xiàn)更科學(xué)的需求側(cè)管理。在電網(wǎng)內(nèi)部,不僅能夠從生產(chǎn)、營銷、管理等領(lǐng)域提高服務(wù)質(zhì)量,還能確保電網(wǎng)的安全可靠運(yùn)行;在電網(wǎng)之外,無處不在的電網(wǎng)數(shù)據(jù)與行業(yè)外數(shù)據(jù)整合,為企業(yè)管理、客戶服務(wù)、安全生產(chǎn)產(chǎn)業(yè)發(fā)展等方面提供決策支撐。
隨著數(shù)據(jù)挖掘和決策支持系統(tǒng)技術(shù)的不斷完善,為管理決策者提供各種參考價(jià)值的生產(chǎn)安全運(yùn)行方案。如將生產(chǎn)管理和地理信息GIS系統(tǒng)中分散的大量數(shù)據(jù),以及外部環(huán)境數(shù)據(jù)(氣象信息)等資源進(jìn)行組合、聚類、排序、抽取等加工,提煉升華為有價(jià)值的、支持決策的電力生產(chǎn)智能大廈。可以通過變電站、線路、設(shè)備、高壓用戶、氣象等不同角度來分析關(guān)鍵業(yè)務(wù)和生產(chǎn)技術(shù)指標(biāo),掌握設(shè)備的運(yùn)行狀態(tài)和特性,了解設(shè)備的缺陷;對發(fā)生的事故、故障及停電進(jìn)行分析跟蹤,挖掘深層原因,從而控制電力生產(chǎn)的風(fēng)險(xiǎn);指導(dǎo)基層保證設(shè)備完好率,支持和輔助基層做好設(shè)備更新技術(shù),提高運(yùn)行水平,降低事故發(fā)生率,提高供電可靠率和無故障運(yùn)行時(shí)間;輔助支持負(fù)荷轉(zhuǎn)移決策、設(shè)備檢修或更新決策,讓業(yè)務(wù)專責(zé)、生產(chǎn)主管、企業(yè)決策者做出準(zhǔn)確的判斷,使得電力企業(yè)取得最佳的社會效益和經(jīng)濟(jì)效益。
通過數(shù)據(jù)挖掘,對云南電網(wǎng)資產(chǎn)管理信息系統(tǒng)中的各類業(yè)務(wù)數(shù)據(jù)(如:設(shè)備管理、檢修管理、運(yùn)行管理、缺陷管理、停電管理、基建項(xiàng)目管理、其他項(xiàng)目管理)等信息進(jìn)行分析,提取滿足各管理階層的業(yè)務(wù)數(shù)據(jù)及關(guān)聯(lián)數(shù)據(jù),從大量的數(shù)據(jù)中挖掘出潛在的價(jià)值,為電網(wǎng)且生產(chǎn)生活提供決策支撐。
2.3 電網(wǎng)資產(chǎn)管理在數(shù)據(jù)挖掘中的跨行業(yè)應(yīng)用
電網(wǎng)資產(chǎn)管理數(shù)據(jù)除對電力內(nèi)部業(yè)務(wù)作支撐以外,在其他領(lǐng)域也能發(fā)揮巨大的作用,涉及到城市的多業(yè)務(wù)多領(lǐng)域,從基礎(chǔ)設(shè)施、公共服務(wù)、城市管理、能源使用以及產(chǎn)業(yè)發(fā)展等方面全方位的支撐著智慧城市的發(fā)展,電力通信網(wǎng)搭建起城市的“神經(jīng)網(wǎng)絡(luò)”,使城市運(yùn)行更高效、居民生活更便捷、產(chǎn)業(yè)發(fā)展可持續(xù)。
2.3.1 城市基礎(chǔ)設(shè)施智能化
城市建設(shè)規(guī)劃管理:在城市規(guī)劃領(lǐng)域,分布式能源、應(yīng)急災(zāi)害指揮系統(tǒng)及輸變電設(shè)備狀態(tài)監(jiān)測裝置可以提供空氣溫度、濕度、風(fēng)速、氣壓、噪聲等環(huán)境監(jiān)測指標(biāo),結(jié)合電網(wǎng)GIS數(shù)據(jù),可對一定區(qū)域環(huán)境展開多角度監(jiān)測,并根據(jù)區(qū)域地理環(huán)境,為具體區(qū)域全方位提供數(shù)據(jù)監(jiān)測指標(biāo),配合城市環(huán)境對標(biāo)數(shù)據(jù),對某一區(qū)域?qū)傩宰龀雒鞔_標(biāo)識,為城市規(guī)劃提供數(shù)據(jù)支持,通過數(shù)據(jù)指標(biāo)可反映出某一區(qū)域是否宜居,是否適合建立工業(yè)園區(qū),或者應(yīng)側(cè)重綠化建設(shè)公園等。
2.3.2 城市管理精細(xì)化
區(qū)域群體行為分析:美國加州大學(xué)洛杉磯分校的研究者就根據(jù)“大數(shù)據(jù)”理論設(shè)計(jì)了一款“電力地圖”,將人口調(diào)查信息、電力企業(yè)提供的用戶實(shí)時(shí)用電信息和地理、氣象等信息全部集合在一起,制作了一款加州地圖。該圖以街區(qū)為單位,展示每個(gè)街區(qū)在當(dāng)下時(shí)刻的用電量,甚至還可以將這個(gè)街區(qū)的用電量與該街區(qū)人的平均收入和建筑物類型等相比照,從而得出更為準(zhǔn)確的社會各群體的用電習(xí)慣信息。
3 結(jié) 論
本文介紹了數(shù)據(jù)挖掘技術(shù),以及各種技術(shù)在電網(wǎng)資產(chǎn)管理中的應(yīng)用。與傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)相比,數(shù)據(jù)挖掘具有對潛在問題和規(guī)律更高的預(yù)見性、計(jì)算能力和管控能力。電力系統(tǒng)的數(shù)據(jù)挖掘除了對系統(tǒng)內(nèi)發(fā)、輸、變、配、用、調(diào)度等各個(gè)環(huán)節(jié)進(jìn)行有效的支撐和輔助決策以外,與系統(tǒng)外部數(shù)據(jù)的整合和挖掘是智能電網(wǎng)對智慧城市支撐的重要體現(xiàn),從數(shù)據(jù)層面輔助城市實(shí)現(xiàn)智慧和綠色的特點(diǎn),數(shù)據(jù)挖掘不僅能夠?yàn)檎芾?、人們生活和產(chǎn)業(yè)發(fā)展決策作支撐,也可通過反饋機(jī)制不斷收集數(shù)據(jù),更新數(shù)據(jù)庫,提升數(shù)據(jù)挖掘的可用性、確定性,進(jìn)一步為城市發(fā)展提供支撐和助力。
主要參考文獻(xiàn)
[1]Jiawei Han,Micheline Kamber,Jian Pei.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2012.
[2]黃杰晟,曹永鋒.挖掘類改進(jìn)決策樹[J].現(xiàn)代計(jì)算機(jī):專業(yè)版,2010(1).
[3]陳星鶯,張曉花,瞿峰,等.數(shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用綜述[J].電力科學(xué)與技術(shù)學(xué)報(bào),2007(9):22.
[4]曾碧波,黃小紅,趙健伍,等.TPS SCADA系統(tǒng)中基于電能分析的數(shù)據(jù)倉庫模型設(shè)計(jì)[J].工業(yè)控制計(jì)算機(jī),2009(9).
[5]周廣惠.對企業(yè)用電量分析與預(yù)測的數(shù)據(jù)挖掘[J].裝備制造技術(shù),2009(9).
[6]Sforna M. Data Mining in a Power Company Customer Database[J].Electric Power Systems Research,2000,55(3):201-209.
[7]荀挺,張珂珩,薛浩然,等.電網(wǎng)調(diào)控?cái)?shù)據(jù)綜合智能分析決策架構(gòu)設(shè)計(jì)[J].電力系統(tǒng)保護(hù)與控制,2015(11):121-127.
[8]牛東曉,邢棉,孟明.基于聯(lián)合數(shù)據(jù)挖掘技術(shù)的神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測模型研究[J].電工技術(shù)學(xué)報(bào),2004,19(9):62-68.
[9]柴立和.多尺度科學(xué)的研究進(jìn)展[J].化學(xué)進(jìn)展,2005,17(2):186-196.endprint