莫琦+李矛+李翔+付龍明+王立娜+盧穎浩
摘 要:從電網(wǎng)安全檢查標準化和動態(tài)更新安全檢查標準庫兩個方面構(gòu)建電網(wǎng)安全檢查機制,提出了安全檢查標準化的重要性及安全檢查標準庫的動態(tài)更新機制,采用數(shù)據(jù)挖掘技術(shù)建立了安全檢查動態(tài)更新機制。做到了安全檢查標準庫中檢查項的動態(tài)更新,間接地減少了電網(wǎng)的安全隱患,為電網(wǎng)安全穩(wěn)定運行提供重要保障。
關(guān)鍵詞:數(shù)據(jù)挖掘 安全檢查 標準化 動態(tài)更新 電網(wǎng)安全
中圖分類號:TP311 文獻標識碼:A 文章編號:1674-098X(2017)07(a)-0209-03
在當今的大數(shù)據(jù)時代,數(shù)據(jù)挖掘技術(shù)是這個時代快速發(fā)展的關(guān)鍵所在,該技術(shù)是通過大量的數(shù)據(jù)分析,從中提取有利用價值的信息的過程。電網(wǎng)企業(yè)在安全檢查過程中,如果能夠合理地運用數(shù)據(jù)挖掘技術(shù),那么對于提高電網(wǎng)的管理水平、提高電網(wǎng)穩(wěn)定性有重要意義。本文主要介紹電網(wǎng)安全檢查標準化的重要性,以及如何利用數(shù)據(jù)挖掘技術(shù)進行有用信息挖掘,并提出了安全檢查標準庫的動態(tài)更新機制。
1 數(shù)據(jù)挖掘技術(shù)簡介
數(shù)據(jù)挖掘(Data Mining)是一種知識發(fā)現(xiàn)的過程,它主要基于統(tǒng)計學、人工智能、機器學習等技術(shù),高度自動化地分析數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,并對未來情況進行分析、預(yù)測,以輔助管理者、決策者評估風險、做出正確的決策。利用數(shù)據(jù)挖掘進行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等,它們分別從不同的角度對數(shù)據(jù)進行挖掘。
1.1 聚類分析
數(shù)據(jù)庫中的記錄可被劃分為一系列有意義的子集,即聚類。對這些子集的識別,對用戶來說有直接意義。它們常常為其它的規(guī)則抽取算法提供有用的信息。聚類增強了人們對于客觀現(xiàn)實的認識,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學分類學。聚類技術(shù)的要點是,在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。聚類有時能直接滿足用戶的要求,有時是其它發(fā)現(xiàn)過程的“預(yù)處理”。例如,聚類所產(chǎn)生的類可以作為決策樹生成算法的目標概念,也可以做偏差分析的基礎(chǔ)。
1.1.1 K-Means算法
K-means算法是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù)據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整規(guī)則。K-means算法以歐式距離作為相似度測度,它是求對應(yīng)某一初始聚類中心向量V最優(yōu)分類,使得評價指標J最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。其算法的優(yōu)點算法快速、簡單;對大數(shù)據(jù)集有較高的效率并且是可伸縮性的;時間復(fù)雜度近于線性,而且適合挖掘大規(guī)模數(shù)據(jù)集。
1.1.2 Canopy算法
Canopy算法的主要思想是把聚類分為兩個階段:階段一,通過使用一個簡單、快捷的距離計算方法把數(shù)據(jù)分為可重疊的子集,稱為“canopy”;階段二,通過使用一個精準、嚴密的距離計算方法來計算出現(xiàn)在階段一中同一個canopy的所有數(shù)據(jù)向量的距離。這種方式和之前的聚類方式不同的地方在于使用了兩種距離計算方式,同時因為只計算了重疊部分的數(shù)據(jù)向量,所以達到了減少計算量的目的。
2 電網(wǎng)安全檢查管理現(xiàn)狀及標準化的重要性
2.1 安全檢查存在的問題
隨著電網(wǎng)建設(shè)規(guī)模的不斷擴大,電網(wǎng)結(jié)構(gòu)越來越復(fù)雜,對應(yīng)的相關(guān)安全檢查工作大量增加。但就目前電網(wǎng)公司情況來看,相關(guān)檢查工作,還是按照紙質(zhì)文件進行檢查,其中檢查標準也很模糊,主要憑借檢查人員的工作經(jīng)驗來斷定檢查項目和結(jié)果,這樣情況下就提高安全隱患的存在。
2.2 安全檢查標準化的重要性
電力生產(chǎn)過程最重要的是確保安全,電網(wǎng)企業(yè)歷來特別重視電力的安全生產(chǎn),但是在實際電力生產(chǎn)過程中,由于作業(yè)人員安全意識不足和受到人員生理條件的限制,難免出現(xiàn)工作的隨意和疏漏而造成人身安全身故。當實現(xiàn)對某一項生產(chǎn)的安全操作規(guī)范進行整理,讓安全監(jiān)督人員知道安全的內(nèi)容、如何進行監(jiān)督、明確監(jiān)督標準;明確不同崗位安全監(jiān)督的重點,讓安全監(jiān)督人員熟悉安全監(jiān)督的依據(jù),并在日常工作中加強安全監(jiān)督工作的主要監(jiān)督指標學習,這樣就能大大降低外部因素對電網(wǎng)檢查工作造成的影響,減少電網(wǎng)運行中的安全隱患。
3 數(shù)據(jù)挖掘技術(shù)在安全檢查管理中的應(yīng)用
3.1 數(shù)據(jù)挖掘技術(shù)在安全檢查管理中的應(yīng)用
隨著社會經(jīng)濟的快速發(fā)展,電網(wǎng)建設(shè)也步入高速發(fā)展的時期,電網(wǎng)規(guī)模已經(jīng)達到較高水平,電網(wǎng)結(jié)構(gòu)日趨復(fù)雜。電力設(shè)備數(shù)量快速增長,電力系統(tǒng)中運行的設(shè)備產(chǎn)生的數(shù)據(jù)信息量急劇增加。在此情況下保證電網(wǎng)安全穩(wěn)定的運行是電網(wǎng)動作的重中之重,而安全檢查是保證電網(wǎng)安全運行的重要環(huán)節(jié)之一;傳統(tǒng)的安全檢查是相關(guān)工作人員根據(jù)安全檢查標準庫中的內(nèi)容逐項對各檢查項定期或者不定期進行檢查或抽查,然而隨著電網(wǎng)規(guī)模的增大傳統(tǒng)的安全檢查標準庫已經(jīng)跟不上電網(wǎng)系統(tǒng)運行安全生產(chǎn)檢查項的更新速度及結(jié)構(gòu)的復(fù)雜程度,難免會產(chǎn)生疏漏之處,或者檢查項長期不更新就會造成工作效率低或者重復(fù)勞動。通過數(shù)據(jù)挖掘技術(shù)實時把安全檢查結(jié)果庫和安全檢查標準庫中的內(nèi)容進行分析,實時更新安全檢查標準庫中的內(nèi)容,保證安全檢查標準庫中的內(nèi)容項是當下進行安全檢查最重要且最全面的標準項。通過這種方法來提高檢查效率、調(diào)整檢查重點、以及保證檢查的全面性。電網(wǎng)系統(tǒng)安全檢查的全面落實是保證電網(wǎng)安全穩(wěn)定運行的重要組成部分,隨著電網(wǎng)規(guī)模和結(jié)構(gòu)的發(fā)展,對系統(tǒng)運行安全生產(chǎn)的可靠性要求越來越高,需要在電網(wǎng)運行中,及時發(fā)現(xiàn)系統(tǒng)運行安全生產(chǎn)過程中不安全因素及是否對電網(wǎng)安全運行產(chǎn)生風險,所以利用數(shù)據(jù)挖掘技術(shù)做到安全檢查標準庫的動態(tài)更新是非常有必要的,檢查人員要根據(jù)安全檢查標準庫中的內(nèi)容進行詳細檢查,要把安全隱患消滅在萌芽之中,以免對電網(wǎng)造成更大的損失。endprint
3.2 運用數(shù)據(jù)挖掘技術(shù)的安全檢查標準庫的動態(tài)更新機制
安全檢查標準庫的實時更新對安全檢查的進行及電網(wǎng)安全穩(wěn)定的運行尤其重要。分析安全檢查標準庫和安全檢查結(jié)果庫,根據(jù)檢查人員實時上傳安全檢查結(jié)果庫的設(shè)備檢查信息,根據(jù)聚類算法實時更新安全檢查標準庫中的內(nèi)容。其技術(shù)實施方案如下。
(1)從安全檢查結(jié)果庫中提出N中特征,將多種特征合成N維向量,其中N為自然數(shù)。
(2)對N維向量進行歸一化處理得到數(shù)據(jù)集合。
(3)使用Canopy算法對所述數(shù)據(jù)集合進行聚合得到第一聚類,根據(jù)第一聚類得出K值。
(4)根據(jù)K值使用K-Means算法對數(shù)據(jù)集合進行聚類知道中心點收斂或達到預(yù)設(shè)要求,得到多個類簇。
(5)根據(jù)預(yù)設(shè)向量相似度閾值確定每個類簇中的關(guān)鍵元素,根據(jù)關(guān)鍵元素提煉出導(dǎo)致系統(tǒng)運行安全隱患的關(guān)鍵屬性,當安全檢查結(jié)果庫中新檢查項的關(guān)鍵屬性的數(shù)量大于預(yù)設(shè)關(guān)鍵屬性數(shù)量閾值時,將新檢查項加入到所述安全檢查標準庫中。
根據(jù)以上步驟就能實現(xiàn)安全檢查標準庫的動態(tài)更新機制,此機制保證了安全檢查標準項的動態(tài)更新,保證了檢查項的覆蓋廣、內(nèi)容細等內(nèi)容,為安全檢查工作的實施更智能更全面的支持,間接的保障了電網(wǎng)安全穩(wěn)定的運行。
3.3 安全檢查標準庫動態(tài)更新實施方案具體步驟
(1)從安全檢查結(jié)果庫與安全檢查標準庫中提取N種特征,完成從原始數(shù)據(jù)集合到N維向量(x1,x2,x3.....,xn)的映射。
(2)將數(shù)據(jù)歸一化;樣本數(shù)據(jù)集合每一個維度都具有均值和單位方差。計算每一個維度上數(shù)據(jù)的均值和標準差,首先在每一個維度上與該均值求差,然后在數(shù)據(jù)的每個維度上與該維度上數(shù)據(jù)的標準差相除。具體如下:(其中ui為xi這個維度上的均值,為xi該維度上的標準差)
(3)將新的安全檢查項數(shù)據(jù)向量化得到一個結(jié)果集list后放入內(nèi)存中,選擇兩個距離閾值:T1和T2,其中T1>T2。
(4)從結(jié)果集list中任取一個數(shù)據(jù)向量=(x1,x2,x3……,xn),用低計算成本方法快速計算與所有Canopy之間的距離(如果當前不存在Canopy,則把作為一個Canopy),如果與某個Canopy距離在T1以內(nèi),則將加入到這個Canopy。
(5)如果曾經(jīng)與某個Canopy的距離在T2以內(nèi),則需要把從list中刪除,此時認為與這個Canopy已經(jīng)足夠接近,它不可以在做其他Canopy的中心。
(6)重復(fù)步驟2、3,直到list為空結(jié)束。進而得出一個“粗”聚類,進而得到K值。
(7)遍歷數(shù)據(jù)集合list,將每個數(shù)據(jù)劃分到最近的中心點中;計算每個聚類的平均值,并作為新的中心點,每個點到中心點的距離公式如下:其中xi為當前數(shù)據(jù)向量第i個向量分量,ki為聚類中心點地i個分量;重復(fù)6~7,直到這k個中心點收斂或達到要求。
(8)如果對每一個類簇中的對象向量剔除其中的某幾個向量分量(xj…xK…xm),計算類簇內(nèi)的向量相似度,如果依然有很高的相似度,說明踢出去的向量分量不是關(guān)鍵元素,如果相似度明顯降低,說明此向量分量為關(guān)鍵元素,進而提煉出導(dǎo)致系統(tǒng)運行安全隱患的關(guān)鍵屬性,當所述安全檢查結(jié)果庫中新檢查項的所述關(guān)鍵屬性的數(shù)量大于預(yù)設(shè)關(guān)鍵屬性數(shù)量閾值時,將所述新檢查項加入到所述安全檢查標準庫中。
具體實施流程圖如圖1所示。
3.4 安全檢查標準庫動態(tài)更新方法應(yīng)用
安全檢查動態(tài)更新方法的實施中,我們能將新獲取的檢查項根據(jù)已有的信息進行數(shù)據(jù)分析,從而判定該檢查項是否應(yīng)該進入安全檢查標準庫,以及如何對檢查項進行規(guī)范化處理。此方法不僅縮短了安全檢查標準庫的更新時間,同時自動對新的檢查項判斷是否加入安全檢查標準庫。實現(xiàn)了安全檢查標準化、自動化、規(guī)范化,將為安全檢查活動提供可靠、準確和及時的信息參考,為系統(tǒng)安全生產(chǎn)穩(wěn)定運行提供科學高效的支持。
4 結(jié)語
隨著電網(wǎng)信息化的不斷發(fā)展,電網(wǎng)機構(gòu)及規(guī)模數(shù)據(jù)量日益龐大,如何提取各安全檢查數(shù)據(jù)間的關(guān)聯(lián),發(fā)現(xiàn)其規(guī)律,從繁雜的數(shù)據(jù)中提供對安全檢查工作有用的數(shù)據(jù),是當今電網(wǎng)企業(yè)發(fā)展的一個重要研究方向。隨著電網(wǎng)數(shù)據(jù)挖掘技術(shù)不斷深入,在電網(wǎng)企業(yè)安全檢查工作中的應(yīng)用越將來越廣泛,對電網(wǎng)安全檢查工作做出明智決策,對安全檢查工作的檢查項和檢查流程,檢查方式等合理化管理,保障電網(wǎng)安全穩(wěn)定的運行,減少電網(wǎng)風險都起著極為重要的作用。
參考文獻
[1] 盧建昌,樊圍國.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用[J].廣東電力,2014,27(9):89-94.
[2] 樓巍.面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[D].上海:上海大學,2013.
[3] 宮宇,呂金壯.大數(shù)據(jù)挖掘分析在電力設(shè)備狀態(tài)評估中的應(yīng)用[J].南方電網(wǎng)技術(shù),2014,8(6):75-77.endprint