• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于聚類的電網(wǎng)運(yùn)行監(jiān)控信息辨識(shí)分類方法研究

      2016-06-28 15:32:36余振華楊世勇舒征宇李黃強(qiáng)張偉奇
      湖北電力 2016年4期
      關(guān)鍵詞:告警信號(hào)詞條信息熵

      余振華,楊世勇,舒征宇,李黃強(qiáng),張偉奇

      (國網(wǎng)湖北省電力公司宜昌供電公司,湖北 宜昌 443000)

      基于聚類的電網(wǎng)運(yùn)行監(jiān)控信息辨識(shí)分類方法研究

      余振華,楊世勇,舒征宇,李黃強(qiáng),張偉奇

      (國網(wǎng)湖北省電力公司宜昌供電公司,湖北 宜昌 443000)

      針對(duì)電網(wǎng)告警信息的分類與整理完全依賴監(jiān)控員人工完成的弊端,為輔助監(jiān)控人員辨識(shí)告警信號(hào),提高電網(wǎng)調(diào)度響應(yīng)效率,提出了一種基于聚類的電網(wǎng)運(yùn)行監(jiān)控信息辨識(shí)分類方法。本方法以大量的電網(wǎng)運(yùn)行監(jiān)控信息為基礎(chǔ),采用聚類分析算法,提取電網(wǎng)運(yùn)行監(jiān)控信息的聚類規(guī)則,從而實(shí)現(xiàn)對(duì)電網(wǎng)運(yùn)行監(jiān)控信息的自動(dòng)篩選和分類。進(jìn)而輔助監(jiān)控人員及時(shí)發(fā)現(xiàn)電網(wǎng)設(shè)備發(fā)出的高危信號(hào),保持電網(wǎng)的安全穩(wěn)定運(yùn)行。

      監(jiān)控信息;聚類分析;信息熵;智能辨識(shí)

      0 引言

      隨著我國電力行業(yè)的發(fā)展,變電和輸電設(shè)備的自動(dòng)化改造不斷深入,以往有人值守的運(yùn)維模式逐漸在向無人值守、集中監(jiān)控的模式進(jìn)行轉(zhuǎn)化。目前全國絕大部分110 kV及以上電壓等級(jí)的變電站都采用集中監(jiān)控的模式進(jìn)行管理[1],現(xiàn)場(chǎng)電力設(shè)備的異常和告警信號(hào)都通過通信設(shè)施直接傳輸?shù)秸{(diào)控中心已文本的形式展示給電網(wǎng)監(jiān)控人員。

      目前,我國關(guān)于電網(wǎng)異常信號(hào)的監(jiān)視主要采用人工監(jiān)屏的方式[2]。然而人工監(jiān)屏受到外部影響因素較多,當(dāng)電網(wǎng)正常操作和電網(wǎng)設(shè)備異常時(shí)都會(huì)發(fā)出大量的電氣量信號(hào)、物理量信號(hào),這些異常信號(hào)的篩選和辨識(shí)會(huì)耗費(fèi)監(jiān)控人員大量時(shí)間,若不能及時(shí)判斷故障發(fā)生情況則會(huì)影響事故處理的及時(shí)性。而一旦發(fā)生信號(hào)漏看或辨識(shí)錯(cuò)誤的現(xiàn)象,則會(huì)對(duì)電網(wǎng)設(shè)備造成不可估量的損失。因此,研究一種適用于電網(wǎng)監(jiān)控的自動(dòng)辨識(shí)方法,獨(dú)立于人工辨識(shí)之外提供輔助功能,是當(dāng)前亟需解決的熱點(diǎn)問題。

      鑒于此,本文提出一種基于聚類的電網(wǎng)運(yùn)行監(jiān)控信息智能辨識(shí)分類方法,以調(diào)度監(jiān)控收到的告警信號(hào)為樣本,通過聚類分析的方法形成典型告警信號(hào)的特征向量,從而實(shí)現(xiàn)對(duì)告警信號(hào)的自動(dòng)辨識(shí)。最終達(dá)到提高電網(wǎng)設(shè)備告警信號(hào)的辨識(shí)效率,保障電網(wǎng)安全穩(wěn)定運(yùn)行的目的。

      1 數(shù)據(jù)樣本的預(yù)處理

      1.1 建立電網(wǎng)監(jiān)控的信息熵模型

      電網(wǎng)設(shè)備的告警信息是典型的觸發(fā)式告警信息,即當(dāng)有設(shè)備出現(xiàn)異常時(shí)發(fā)出告警信息。傳遞到電網(wǎng)監(jiān)控后臺(tái)機(jī)上的信息都是帶有時(shí)間標(biāo)簽的離散信息,例如:2015-10-30 21:56:21 110 kV某某線某某開關(guān)斷開。并且,當(dāng)電網(wǎng)發(fā)生跳閘時(shí),短期之內(nèi)會(huì)伴隨大量的信號(hào),例如XX保護(hù)動(dòng)作、XX開關(guān)分閘等。因此,電網(wǎng)正常運(yùn)行時(shí)刻與故障時(shí)刻接收到的信號(hào)頻次存在較大差異。

      為在大量信號(hào)中快速辨別故障信息,本文以時(shí)間尺度為標(biāo)準(zhǔn)搜集監(jiān)控信息,并整理成可以計(jì)算信息熵的數(shù)據(jù)樣本,其具體方法為每隔3 s統(tǒng)計(jì)一次最近3 s內(nèi)發(fā)出的監(jiān)控信息個(gè)數(shù)。將電網(wǎng)監(jiān)控告警信息表征為下式形式

      式中:S為按時(shí)段劃分后得到的監(jiān)控信息文檔;t為時(shí)長為3 s的時(shí)段;cn為3 s以內(nèi)的告警文本內(nèi)容;m為對(duì)應(yīng)時(shí)段中出現(xiàn)的告警信號(hào)個(gè)數(shù)。其中(tn,mn,cn)被稱為一個(gè)數(shù)據(jù)項(xiàng),表示tn時(shí)間段內(nèi)接收到的告警信息條數(shù)mn以及告警文本內(nèi)容cn。

      1.2 告警信號(hào)的信息熵計(jì)算

      電網(wǎng)事故發(fā)生時(shí),與事故相關(guān)的告警信號(hào)一般在10 s以內(nèi)都會(huì)發(fā)出。為避免漏掉有效信號(hào),本文以30 s為時(shí)間跨度形成對(duì)應(yīng)的告警信號(hào)文檔S,并計(jì)算警信息文檔S的信息熵。其計(jì)算公式如下

      式中:?為常數(shù);n為預(yù)先劃分的狀態(tài)數(shù),其數(shù)值大小為監(jiān)控系統(tǒng)在3 s內(nèi)接收到告警信號(hào)條數(shù)的最大值;P(k)為該種狀態(tài)在文檔S中出現(xiàn)的概率,

      式(3)中Xk為30 s內(nèi)的10個(gè)數(shù)據(jù)項(xiàng)中告警信號(hào)條數(shù)為k的個(gè)數(shù),為總的樣本個(gè)數(shù)。該集合的監(jiān)控信息熵越大,其無序程度越高,在該時(shí)段內(nèi)有設(shè)備故障的幾率也越大。

      1.3 基于信息熵的文本處理

      本文以30 s為時(shí)間跨度,每隔10 s進(jìn)行一次采樣,計(jì)算對(duì)應(yīng)的監(jiān)控信息文檔S的熵。將信息熵H(S)<0.3的監(jiān)控信息文檔篩選掉,即排除監(jiān)控告警信號(hào)發(fā)出特別規(guī)律的時(shí)段。自此,信息熵大于0.3的監(jiān)控信息文檔都涵蓋有30 s內(nèi)的告警信息。然而電網(wǎng)故障發(fā)生后相關(guān)聯(lián)的監(jiān)控信息一般在10 s以內(nèi)傳達(dá)到監(jiān)控系統(tǒng),即有效信息的時(shí)間跨度遠(yuǎn)沒有30 s,因此需要對(duì)得到的監(jiān)控信息文檔S內(nèi)的文本進(jìn)行二次篩選。為此本方法給出文本的篩選方法:1)逐項(xiàng)刪除文檔S中的數(shù)據(jù)項(xiàng),即(ti,mi,ci),并計(jì)算刪除時(shí)間段后的信息熵H'(S);2)將刪除前后監(jiān)控信息熵變化最大的數(shù)據(jù)項(xiàng)作為中心,從邊緣起逐步刪除數(shù)據(jù)項(xiàng),直至H(S')<H(S),如圖1所示。

      圖1 信息篩選過程Fig.1 The process of Information screening

      由以上步驟可以得到任意監(jiān)控系統(tǒng)在任意時(shí)段得到的監(jiān)控信息文檔集合{} Si。其中Si=[(t1,m1,c1), (t2,m2,c2)(tn,mn,cn)]為含有有效告警信息的文檔。

      2 文本的空間特征向量表示

      2.1 文本特征項(xiàng)提取

      由于電網(wǎng)告警信息是由一次、二次設(shè)備發(fā)出的標(biāo)準(zhǔn)化信息,信息集合中文本對(duì)同一事物的描述方式都相對(duì)固定,因此可以采用基于統(tǒng)計(jì)的分詞方法對(duì)文本進(jìn)行分詞處理和統(tǒng)計(jì)。按照下式統(tǒng)計(jì)兩個(gè)漢字的互現(xiàn)信息系數(shù)

      式中:M(X,Y)為漢字 X和Y的互現(xiàn)信息系數(shù);P(X,Y)為 X,Y相鄰出現(xiàn)在文本中的幾率;P(X)和 P(Y)分別為漢字 X,Y在文本中出現(xiàn)的幾率。相鄰的兩個(gè)字同時(shí)出現(xiàn)的次數(shù)越多,其可信度越高,由漢字X,Y組成的詞組也越有可能成為關(guān)鍵詞。將互相系數(shù)M(X,Y)>0的詞條計(jì)入文本特征相集合。

      去除平凡詞。電網(wǎng)監(jiān)控告警信息中會(huì)存在大量諸如“的”、“了”的平凡詞。該類漢字對(duì)于文本描述的內(nèi)容無貢獻(xiàn),因此將這類詞排除在外,最終形成文本的特征項(xiàng)集合,其中 δ為篩選后得到的關(guān)鍵詞。

      2.2 計(jì)算文本特征項(xiàng)權(quán)重

      采用TF-IDF公式計(jì)算詞條在文本中的權(quán)重大小[3-4],其計(jì)算公式為

      式中:f(δ1,d)為詞條δ1在文檔中出現(xiàn)頻率;N為所有文檔的個(gè)數(shù);ni為含有詞條δi的文檔個(gè)數(shù)。由TF-IDF公式計(jì)算得到的權(quán)重系數(shù)表征了詞條的特異性,若wi越大則表明詞條δi的特異性越高,在不同文檔中出現(xiàn)的比率越低,但在單個(gè)文檔中出現(xiàn)的頻次越高,那么詞條δi用于表征文檔d的可信度越高。

      由此,可以計(jì)算得到不同詞條在文檔中的權(quán)重,歸一化處理后的權(quán)重為

      因此任意文檔可以表征為一個(gè)二維向量,其形式如下式所示,

      如果將不同的詞條看作一個(gè)坐標(biāo)軸,那么該二維向量可以看作是該空間中的一個(gè)向量[5]。

      3 基于K-means算法的聚類分析

      隨機(jī)選擇k個(gè)本文,形成包含k個(gè)本文簇的初始簇集合,即{Si…Si+k}。這k個(gè)對(duì)象均可以表示成 {[δ1,W1],[δ2,W2],…[δn,Wn]},一個(gè)二維的特征向量集合。采用夾角余弦公式計(jì)算新文本與各個(gè)簇空間特征向量的“距離”(即相似度),夾角余弦公式為

      根據(jù)計(jì)算得到的相似度,將新文本歸類到最為相似的簇中,并重新計(jì)算該簇的平均值,其計(jì)算公式為

      式中:a為原簇中文本的個(gè)數(shù);[Wj,1,Wj,2…Wj,n]為原簇的特征向量;[Wi,1,Wi,2…Wi,n]為新增文本的特征向量。通過式(9)計(jì)算將結(jié)果作為該簇新的空間特征向量。

      在得到簇的空間特征向量后,還需要進(jìn)行通過“評(píng)價(jià)”的方式對(duì)空間特征向量進(jìn)行“訓(xùn)練”,從而使得不同空間向量之間有較高的識(shí)別度[6-7],評(píng)價(jià)函數(shù)的計(jì)算公式為式中:J為評(píng)價(jià)函數(shù),其大小為任意對(duì)象(即文本S)與各個(gè)簇特征向量的均方差之和;xn為文本文檔Sn對(duì)應(yīng)的特征向量;為第 k 個(gè)簇的特征向量;d(,xn)為文檔Sn與第k個(gè)簇的相似度;Zk為第k個(gè)簇中含有的元素個(gè)數(shù);K為所有簇的個(gè)數(shù)。

      4 基于聚類分析的告警信號(hào)辨識(shí)

      基于聚類分析的告警信號(hào)辨識(shí)方法,其具體流程如下。

      步驟1每隔10 s統(tǒng)計(jì)一次最近30 s的告警信號(hào),形成新增文本S。

      步驟2計(jì)算文本S的信息熵,對(duì)其進(jìn)行預(yù)處理。

      步驟3計(jì)算經(jīng)過預(yù)處理文本的漢字的互現(xiàn)系數(shù)、對(duì)本文進(jìn)行分詞處理。

      步驟4根據(jù)聚類分析得到的特征詞,采用TF-IDF公式計(jì)算權(quán)重,形成空間特征向量。

      步驟5采用K-means算法對(duì)空間特征向量的樣本集進(jìn)行聚類分析。

      步驟6采用評(píng)價(jià)函數(shù)整合空間特征向量簇。

      步驟7人工干預(yù),對(duì)分類完成的簇進(jìn)行識(shí)別。通過查看不同簇中的文本文檔人工識(shí)別該簇代表的告警信號(hào)的現(xiàn)實(shí)意義。從而最終得出聚類分析結(jié)果,既不同類型電網(wǎng)故障信號(hào)的典型空間特征向量。

      步驟8當(dāng)電網(wǎng)監(jiān)控后臺(tái)機(jī)收到新的告警信號(hào)時(shí),通過步驟1~3計(jì)算其空間特征向量。

      步驟9通過計(jì)算新接收告警信號(hào)空間特征向量與典型告警信號(hào)的空間特征向量的相似度對(duì)告警信號(hào)進(jìn)行分類和辨識(shí)。

      上述步驟中,步驟1~7是對(duì)歷史告警信號(hào)的聚類分析階段,用以捕捉典型的電網(wǎng)事故告警信號(hào),步驟8~9是對(duì)事實(shí)告警信號(hào)的處理過程。

      5 結(jié)語

      本文將聚類分析引入到電網(wǎng)監(jiān)控信息辨識(shí)的研究中,在對(duì)歷史存檔的電網(wǎng)監(jiān)控告警信號(hào)進(jìn)行預(yù)處理的前提下,將其轉(zhuǎn)化為有效的告警信號(hào)文檔集合。并采用聚類分析的方法建立對(duì)應(yīng)的空間特征向量,結(jié)合K-means算法計(jì)算得出典型的告警信號(hào)空間特征向量。當(dāng)監(jiān)控后臺(tái)機(jī)有新的告警信息出現(xiàn)時(shí),可通過計(jì)算新增告警信息與典型告警信號(hào)空間特征向量的相似度對(duì)新增告警信號(hào)進(jìn)行分類。從而實(shí)現(xiàn)電網(wǎng)監(jiān)控信息自動(dòng)分類,達(dá)到提高電網(wǎng)設(shè)備告警信號(hào)的辨識(shí)效率,防止信號(hào)的漏看和錯(cuò)誤辨識(shí),保障電網(wǎng)安全穩(wěn)定運(yùn)行的目的。

      (References)

      [1]王晶晶,劉巍,張勇平,等.華北電網(wǎng)無人值班站和集控中心管理模式的探討[J].華東電力,2011(10):23-24.

      WANG Jingjing,LIU Wei,ZHANG Yongping,et al. Unattended station and control center management mode in north china powergrid[J].EastChina Electric Power,2011(10):23-24.

      [2]黃煒,張杰明,綦孝文,等.調(diào)度集控一體化系統(tǒng)責(zé)任區(qū)管理和告警解決方案[J].電網(wǎng)技術(shù),2007,31(S2):264-267.

      HUANG Wei,ZHANG Jieming,QI Xiaowen,et al.So?lution to Alarming and Management of Duty Region in Integrated System of Dispatching and Centralized Control[J].Power System Technology,2007,31(S2): 264-267.

      [3]羅欣,夏德麟,晏蒲柳.基于詞頻差異的特征選取及改進(jìn)的TF-IDF公式[J].計(jì)算機(jī)應(yīng)用,2012(9):43-47.

      LUO Xin,XIA Delin,YAN Puliu.Feature selection based on word frequency difference and improvement of TF-IDF formula[J].Computer Application,2012(9): 43-47.

      [4]李鎮(zhèn)君,周竹榮.基于Document Triage的TF-IDF算法的改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2015(12):56-60.

      LIZhenjun,ZHOU Zhurong.Theimprovementof TF-IDF algorithm based on documenttriage[J]. Computer Application,2015(12):56-60.

      [5]陸媛,楊慧中.基于代表熵的基因表達(dá)數(shù)據(jù)聚類分析方法[J].計(jì)算機(jī)工程與應(yīng)用,2008(27):77-81.

      LU Yuan,YANG Huizhong.The research of clustering analysis method based on entropy of gene expression data[J].Computer Engineering and Application,2008 (27):77-81.

      [6]李小梅,郭紅.基因表達(dá)數(shù)據(jù)的模糊聚類技術(shù)研究[J].信息系統(tǒng)工程,2013(11):36-41.

      LI Xiaomei,GUO Hong.The research of fuzzy clus?tering gene expression data technology[J].Informa?tion Systems Engineering,2013(11):36-41.

      [7]柴寶杰,劉大為.基于粒子群優(yōu)化的蟻群算法在TSP中的應(yīng)用[J].計(jì)算機(jī)仿真,2014(8):16-18.

      CHAI Baojie,LIU Dawei.The application of ant col?ony algorithm in TSP based on particle swarm opti?mization[J].The Computer Simulation,2014(8):16-18.

      The Research of Smart Identification of Power Grid Monitoring Information Based on Cluster Analysis

      YU Zhenhua,YANG Shiyong,SHU Zhengyu,LI Huangqiang,ZHANG Weiqi
      (State Grid Hubei Electric Power Company Yichang Power Supply Company,Yichang Hubei 443000,China)

      The classification and arrangement of the alarm information of the power network is completely dependent on the manual completion of the monitor,in view of the disadvantages,a cluster-based method is put forward in order to help monitor the alarm signal,improve the efficiency of power grid dispatching.Based on a large number of network operation monitoring information,this method uses clustering analysis algorithm to extract the power grid operation monitoring information clustering rules,so as to realize the automatic screening and classification of network operation monitoring information,and then assist monitoring personnel to detect high-risk network equipment, to maintain safe and stable operation of the grid.

      monitoring information;cluster analysis;information entropy;intelligent identification

      TM762

      A

      1006-3986(2016)04-0017-04

      10.19308/j.hep.2016.04.004

      2016-03-05

      余振華(1982),男,湖北宜昌人,工程師。

      猜你喜歡
      告警信號(hào)詞條信息熵
      基于告警信號(hào)文本挖掘的電力調(diào)控智能分析和故障診斷技術(shù)
      基于tesseract 訓(xùn)練的電力告警信號(hào)特征識(shí)別方法
      基于信息熵可信度的測(cè)試點(diǎn)選擇方法研究
      供暖大搶修
      基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
      一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
      2016年4月中國直銷網(wǎng)絡(luò)熱門詞條榜
      2016年3月中國直銷網(wǎng)絡(luò)熱門詞條榜
      2016年9月中國直銷網(wǎng)絡(luò)熱門詞條榜
      基于信息熵的IITFN多屬性決策方法
      平昌县| 江阴市| 望奎县| 教育| 巨鹿县| 独山县| 全椒县| 彩票| 察隅县| 黄梅县| 安龙县| 榆中县| 进贤县| 扶沟县| 彰化县| 刚察县| 彭山县| 思茅市| 彰武县| 福鼎市| 北碚区| 温泉县| 广西| 图木舒克市| 霍邱县| 精河县| 铁岭县| 大理市| 诸暨市| 剑川县| 友谊县| 西丰县| 镇坪县| 大理市| 肇东市| 安达市| 潍坊市| 恩平市| 晋州市| 藁城市| 滨州市|