劉春
(陜西北元集團錦源化工有限公司,陜西 榆林 719319)
近年來,我國已迎來了大數據時代,無論是哪種類型的企業(yè),在企業(yè)生產及發(fā)展過程中都會產生大量的數據及信息,這些數據及信息對企業(yè)的發(fā)展具有重要意義,對于電力企業(yè)來說也同樣如此,只有采取相應的技術手段來充分挖掘這些價值數據,才能保障企業(yè)在未來發(fā)展過程中的決策科學性,以下便對數據挖掘技術在電力企業(yè)中的運用進行探討。
對于大數據來說,其具備的最明顯的特點便是高增長性和多樣性,大數據是無時無刻不在增長的,這也使大數據變得非常龐大,人們可以將大數據看作是一種信息資產,正是由于大數據非常龐大,使得人們需要通過一種全新的方法來對其進行處理,這樣才能使大數據的價值得到充分利用。大數據可以用高速、價值、多樣、大量這四個詞匯來描述其主要特征。
電力企業(yè)在經營發(fā)展過程中無時無刻不在產生著數據,這些數據是非常龐大的,并且涉及到電力企業(yè)經營生產的各個方面。在電力資源生產方面,利用大數據可以實時記錄電力企業(yè)自投入使用以來各種設備的故障情況、運行狀態(tài)等數據;而在電力供應與傳輸方面,需要由監(jiān)測系統(tǒng)對設備運行狀態(tài)進行海量數據的監(jiān)測與記錄;在電力使用方面,用戶用電、智能電網、工業(yè)用電等同樣要進行大量數據的監(jiān)測。當然,大數據在給企業(yè)經營生產帶來便利的同時,也給其帶來了一些新的挑戰(zhàn),雖然電力企業(yè)在經營發(fā)展過程中產生龐大的數據,但絕大多數的電力企業(yè)所采用的數據庫卻只能對這些數據進行存儲、統(tǒng)計與查詢,大數據在其他方面所具有的潛在價值還有待進一步挖掘。因此,電力企業(yè)要想得以穩(wěn)定發(fā)展,就必須要對大數據所具有的潛在價值進行積極把握。對于電力企業(yè)來說,需要充分做好數據收集工作,通過對數據進行不同角度、不同方位的收集,以使更多的價值數據得到匯總,將無效或無用數據進行剔除,能夠使數據變得更加可靠、真實。并且,在電力企業(yè)中所涉及到的各類數據往往是具有很大關聯性的,電力企業(yè)相關人員需要依據這些數據間的參數關系來進行深度的關聯剖析,這也是電力企業(yè)所需面臨的又一挑戰(zhàn)。
對于數據挖掘技術來說,該技術是通過相應的數理模型來分析關于企業(yè)的各種模糊數據,以此從海量模糊數據中找出具有價值性的潛在信息??紤]到電力企業(yè)在生產經營過程中所涉及的數據量是非常龐大的,因此是不適宜采用傳統(tǒng)方法來處理數據的,因此需要采用數據挖掘技術來對龐大數據進行快速、高效地解決。
對于電力企業(yè)來說,在應用數據挖掘技術過程中,要想確保挖掘到的信息是具有價值的,就必須要保證數據具有較高的質量,因此需要解決數據質量問題,而這就需要通過首席數據官來開展數據管理,以使企業(yè)能夠利用數據挖掘技術來進行價值信息的挖掘,以便于企業(yè)管理人員依據這些信息做出科學的決策。
考慮到從龐大的數據量中開展價值信息的挖掘,可以將數據挖掘看作是一種價值自發(fā)現的過程,應盡可能地從不同途徑來對數據進行搜集與處理,通過模糊識別來分析數據。對于數據挖掘技術來說,可按照五大層次來對其進行劃分。
在數據來源層中,其用來存儲各種外部性數據與事務性數據,這些數據來自于互聯網、自動記錄工具、移動設備等,其重要價值體現在能夠直接影響到電力企業(yè)的生產經營與決策。
考慮到數據來自于不同途徑,但卻存在一定的內同性,因此可根據互動性來劃分數據類別,同時還考慮到挖掘的數據完整性問題,因此還需通過解析、重構等手段來處理數據,以使數據質量得到進一步提高。在分類過程中,可將數據劃分成非結構、半結構與結構化數據,過濾結構化數據的同時,將無效數據予以有效剔除,同時按照相應的標準來轉化半結構化和非結構化數據,使其成為機器語言或索引等,這也是數據整理層所具備的重要功能。
在數據挖掘技術中,信息在經過整理與轉化以后,會統(tǒng)一存儲到電力數據倉庫之中。電力企業(yè)可以依據對應主題來對不同的屬性集進行設計,以使數據處理規(guī)模得以有效降低。如果數據庫分屬于不同的主題,則需通過粗糙集屬性歸約法來對其中存在的冗余數據進行剔除,同時按照IFTHEN 分類規(guī)則知識來表示決策樹數據集,并利用規(guī)則知識庫進行存儲,這樣在處理新數據時便可依據規(guī)則識別來進行匹配與評價。
在數據挖掘技術中,需要按照數據的實時性與非實時性來處理電力企業(yè)數據。如果數據具有實時性,如電力負荷數據,需要由系統(tǒng)來對該類數據實施內存計算分析。如果數據具有非實時性,則可通過Map Reduce 云計算以及分布式文件系統(tǒng)來進行對應處理。
電力企業(yè)可以通過營銷決策系統(tǒng)的支持來對數據進行設計,以使其進行可視化呈現,數據挖掘成果可利用圖形進行展示,這樣可幫助員工對電力企業(yè)做出的評價決策及發(fā)展戰(zhàn)略有一個更加直觀、深入的了解。
總而言之,在大數據時代下,電力企業(yè)需要不斷深化和研究數據挖掘技術,以確保該技術的應用價值得到充分展現,幫助電力企業(yè)挖掘更多的價值信息,使電力企業(yè)能夠在大數據的帶動下得以繁榮、穩(wěn)定的發(fā)展。