• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      配電網(wǎng)電力設(shè)備缺陷文本智能辨識運維綜述

      2022-05-09 03:01:40張磐鄭悅李海龍劉航旭李國棟葛磊蛟
      電力建設(shè) 2022年5期
      關(guān)鍵詞:電力設(shè)備圖譜錯誤

      張磐, 鄭悅,李海龍,劉航旭,李國棟,葛磊蛟

      (1.國網(wǎng)天津市電力公司電力科學(xué)研究院, 天津市 300384;2.國網(wǎng)天津市電力公司,天津市 300010;3.國網(wǎng)天津市電力公司濱海供電分公司,天津市 300450;4.天津大學(xué)電氣自動化與信息工程學(xué)院,天津市 300072)

      0 引 言

      智能配電網(wǎng)電力設(shè)備具有種類繁雜、數(shù)量多、運維難等特點[1],隨著電力系統(tǒng)的不斷發(fā)展以及智能電網(wǎng)建設(shè)的深化推進,電網(wǎng)企業(yè)數(shù)據(jù)庫中存儲的電力數(shù)據(jù)隨著智能電網(wǎng)的運維呈現(xiàn)爆發(fā)式增長[2]。這些數(shù)據(jù)通常以非機構(gòu)化數(shù)據(jù)如圖像、文本等形式存儲[3],蘊含大量關(guān)于電網(wǎng)設(shè)備運行狀態(tài)的信息[4]。通過對電力設(shè)備缺陷文本的深度挖掘,能夠?qū)崿F(xiàn)電網(wǎng)運行狀態(tài)的實時監(jiān)測、故障定位及設(shè)備維修,為電網(wǎng)的可靠運行提供指導(dǎo)[5]。

      近年來,電力數(shù)據(jù)挖掘雖然已成為研究熱點,但真正得到挖掘并利用的數(shù)據(jù)卻很少[6],如何深度挖掘電力設(shè)備缺陷文本內(nèi)部信息,是電力設(shè)備精細化管理未來發(fā)展面臨的主要問題。我國在電力設(shè)備缺陷文本挖掘方面的成果較少,面臨巨大挑戰(zhàn)。首先,電力設(shè)備相關(guān)信息以文本形式表示,往往含義模糊、計算機難以辨別;其次,電力領(lǐng)域具有專業(yè)性,無法直接應(yīng)用其他領(lǐng)域的文本挖掘方法;最后,隨著智能電網(wǎng)的高速發(fā)展,電力設(shè)備相關(guān)文本會變得更加復(fù)雜,當前電力設(shè)備缺陷文本挖掘技術(shù)將不再適用。

      本文基于現(xiàn)有研究成果,對該領(lǐng)域的發(fā)展方向以及主要方法進行分析,并指出面臨的關(guān)鍵難題。首先,面向電力設(shè)備缺陷文本挖掘從4個方面進行剖析:1) 電力設(shè)備缺陷文本錯誤識別與質(zhì)量提升;2) 電力設(shè)備缺陷嚴重等級自動分類;3) 電力設(shè)備缺陷細節(jié)提?。?) 電力設(shè)備健康狀態(tài)自動評價。其次,結(jié)合相關(guān)文獻中的算例結(jié)果,對不同方法實現(xiàn)的效果進行分析。最后,分析電力設(shè)備缺陷文本挖掘技術(shù)未來發(fā)展方向,以期為該領(lǐng)域的進一步研究提供參考與借鑒。

      1 電力設(shè)備缺陷文本深度挖掘技術(shù)

      電力設(shè)備缺陷文本深度挖掘技術(shù)包含缺陷文本錯誤識別與質(zhì)量提升、缺陷嚴重等級自動分類、缺陷細節(jié)提取和健康狀態(tài)自動評價4個方面,如圖1所示。

      圖1 電力設(shè)備缺陷文本深度挖掘技術(shù)示意圖Fig.1 Schematic diagram of text deep mining technology for power equipment defects

      首先對缺陷文本進行錯誤識別與質(zhì)量提升,剔除文本記錄錯誤、混雜等數(shù)據(jù),得到高質(zhì)量的缺陷文本數(shù)據(jù);進而對設(shè)備缺陷嚴重等級進行自動分類,并提取缺陷細節(jié),進行電力設(shè)備的全面態(tài)勢獲?。蛔詈筮M行健康狀態(tài)自動評價,實現(xiàn)電力設(shè)備未來態(tài)勢的預(yù)測。

      2 缺陷文本錯誤識別與質(zhì)量提升

      隨著電力設(shè)備的日常運維,電力設(shè)備缺陷文本在電力設(shè)備文本系統(tǒng)中大量累積[7],但由于電力設(shè)備數(shù)量龐大,缺陷種類復(fù)雜,現(xiàn)有的規(guī)范[8]無法實現(xiàn)全面總結(jié);此外,由于缺陷文本的人為記錄特征,時常會出現(xiàn)由于記錄人員經(jīng)驗不足導(dǎo)致的文本殘缺甚至錯誤等現(xiàn)象[9],造成了缺陷文本挖掘的復(fù)雜性。因此,錯誤識別與質(zhì)量提升是電力設(shè)備缺陷文本挖掘的關(guān)鍵技術(shù)之一。首先對電力設(shè)備缺陷文本進行錯誤識別,找到因錄入不規(guī)范、語病等原因?qū)е碌奈谋惧e誤,進而針對識別結(jié)果對其進行矯正,實現(xiàn)質(zhì)量提升。

      2.1 缺陷文本錯誤識別

      通過對電力設(shè)備缺陷文本的挖掘,識別電力設(shè)備缺陷文本的錯誤,從而更加完整地記錄電力設(shè)備相關(guān)缺陷,為電力設(shè)備缺陷文本的質(zhì)量提升奠定基礎(chǔ)。我國對于文本錯誤識別的研究開始于20世紀90年代,起步較晚,對于電力設(shè)備缺陷文本領(lǐng)域的錯誤識別相關(guān)研究較少。文獻[10]面向卷宗文本錯誤識別構(gòu)建了查錯模塊,對錄入的文本進行搜索,找出語病、錯別字等文本錯誤并記錄位置。文中為了充分考慮語料庫不能完全涵蓋自然語言的局限性,將語料庫中的詞與識別文本進行比對,找出未登錄的疑似語病的詞字。進而將疑似錯誤與上下文的詞串結(jié)合,利用Kenlm模塊計算置信度值判斷正誤。然而針對電力設(shè)備缺陷記錄領(lǐng)域,文獻[10]所提方法并不適用。

      現(xiàn)有針對電力設(shè)備缺陷文本的研究主要聚焦于電網(wǎng)公司中質(zhì)量欠佳的歷史缺陷文本,主要結(jié)合電力設(shè)備缺陷文本分類規(guī)范,研究電網(wǎng)中各設(shè)備的缺陷矯正方法,以改善設(shè)備缺陷。對于新錄入信息管理系統(tǒng)中的缺陷文本,采用文本質(zhì)量評價方法對其存在的問題進行分析,通過缺陷文本質(zhì)量評價方法,對修正前后的缺陷文本記錄數(shù)據(jù)進行打分,根據(jù)評分結(jié)果得到缺陷文本錯誤識別結(jié)果。

      為對大規(guī)模文本信息進行深度分析,可借助知識圖譜(knowledge graph,KG)顯示知識之間相關(guān)聯(lián)系的能力[11],構(gòu)建電力設(shè)備缺陷文本知識圖譜實現(xiàn)檢索、查錯等功能。知識圖譜是一種新型的圖型數(shù)據(jù)庫,它通過“結(jié)點-關(guān)系-結(jié)點”的基本三元結(jié)構(gòu)表示知識之間的關(guān)系[12]。知識圖譜技術(shù)的發(fā)展有賴于人工智能的普及,它可以通過可視化的方式顯示人工智能的決策過程。在知識圖譜的分類中,縱向知識圖譜指的是某一特定領(lǐng)域的知識圖譜。電力知識圖譜作為一種典型的縱向知識圖譜,已在電力工業(yè)的數(shù)據(jù)分析與決策環(huán)節(jié)得到了應(yīng)用。使用結(jié)構(gòu)化數(shù)據(jù)形式的電力設(shè)備缺陷文本構(gòu)造知識圖譜,便可實現(xiàn)輔助錄入系統(tǒng)所需要的數(shù)據(jù)檢索與可視化功能[13]。針對電力設(shè)備缺陷文本錯誤識別,文獻[14]采用基于知識圖譜的缺陷文本錯誤識別方法,提出了一種基于圖搜索的缺陷記錄檢索過程,通過深度優(yōu)先搜索算法實現(xiàn)對知識圖譜中完整樹的搜索,從而構(gòu)成完整的缺陷記錄,大大簡化了工作人員分析文本的過程。該文獻最后以電網(wǎng)公司變壓器缺陷文本為例,將所提方法與基于機器學(xué)習(xí)的模型進行對比,結(jié)合相關(guān)評價標準例如精確率、召回率等,證明了所提方法在提升缺陷文本錯誤識別效果方面的有效性和優(yōu)越性。

      上述圖搜索算法對于錯誤識別具有良好的效果,但是容易因為臨近搜索而陷入死循環(huán)。樹搜索算法在搜索問題復(fù)雜度不高的情況下可以在不明顯犧牲搜索靈活度的前提下解決陷入死循環(huán)的問題。因此樹搜索算法也可以用于解決缺陷文本錯誤識別的難題。文獻[15]為提高缺陷分類等級的準確度,對缺陷文本中的錯誤識別進行了研究。首先輸入歷史記錄的設(shè)備缺陷文本,并根據(jù)國家電網(wǎng)有限公司給出的缺陷分類標準構(gòu)建了樹路徑匹配框架。進而按照樹路徑匹配算法找到對應(yīng)的最相似路徑,從而識別到文本錯誤并給出錯誤程度。這種基于樹搜索的識別模式與圖搜索類似,但是區(qū)別在于前者允許經(jīng)過重復(fù)的節(jié)點而后者不允許。

      由于關(guān)系提取的準確性將直接影響知識圖譜[14]和樹結(jié)構(gòu)的準確性和完整性,且現(xiàn)有的知識圖譜與樹結(jié)構(gòu)的表示主要是依賴電網(wǎng)公司的分類標準,隨著設(shè)備的多樣化以及運行場景的復(fù)雜化,缺陷文本的錯誤可能會被誤識別[15]。如果使用更多的語法解析等自然語言處理技術(shù)提取更多的語義特征,缺陷文本的錯誤識別效果可進一步提高。這也是未來缺陷文本錯誤識別研究的一個可能方向。

      2.2 缺陷文本質(zhì)量評價與提升

      缺陷文本的質(zhì)量會影響深度挖掘的效果,因此高質(zhì)量的缺陷文本庫是對其深度挖掘的基礎(chǔ)。設(shè)備缺陷文本很大一部分由人工錄入,存在錄入不規(guī)范、語病等問題,對缺陷文本進行錯誤識別后需要對其進行質(zhì)量評價和提升。

      機器學(xué)習(xí)與自然語言處理技術(shù)可以實現(xiàn)缺陷文本質(zhì)量的智能評價與提升[16]。文獻[17]將文本錯誤的糾正問題看作輸入數(shù)據(jù)的規(guī)范化翻譯過程,改變了傳統(tǒng)的文本錯誤識別-質(zhì)量提升的二階段策略,運用帶注意力機制的序列到序列學(xué)習(xí)模型對常規(guī)中文文本進行了錯誤糾正。這種文本提升方法需要大量的帶標簽數(shù)據(jù)對深度學(xué)習(xí)模型進行訓(xùn)練,對于電力設(shè)備缺陷文本專業(yè)領(lǐng)域的適用性不足,目前對電力設(shè)備缺陷文本質(zhì)量提升方面的研究較少。文獻[18]提出了一種缺陷文本質(zhì)量評價和提升方法,以電網(wǎng)中不同設(shè)備產(chǎn)生的25 000多條歷史缺陷文本為例,通過缺陷文本質(zhì)量評價方法,對修正前后的缺陷文本記錄數(shù)據(jù)進行打分,根據(jù)打分評價結(jié)果,準確識別新錄入文本存在的問題并給出修改建議,完成新錄入缺陷文本質(zhì)量的提升,從而驗證了所提方法在同時實現(xiàn)歷史缺陷文本與新錄入文本質(zhì)量評價與提升方面的有效性。

      電力設(shè)備缺陷文本質(zhì)量提升過程主要有以下幾個步驟:首先,以電網(wǎng)公司缺陷文本為樣本,分析獲知電網(wǎng)公司缺陷文本存在的問題,如格式殘缺、語義模糊、冗雜等問題;然后,針對這些問題,提出缺陷文本質(zhì)量評價指標,并以此構(gòu)建相關(guān)評分體系對缺陷文本進行評價;基于文本質(zhì)量評價結(jié)果,聚焦于電網(wǎng)公司中質(zhì)量欠佳的歷史缺陷文本,采用潛在多元Beta分布等方法,結(jié)合電力設(shè)備缺陷文本分類規(guī)范,對文本內(nèi)容予以矯正;最后,針對新錄入信息管理系統(tǒng)中的缺陷文本,采用上述文本質(zhì)量評價方法對其存在的問題進行分析,從而給出修正建議。

      然而,目前的缺陷文本質(zhì)量評價方法存在很強的主觀性[18],隨著缺陷文本數(shù)據(jù)量的增加可能出現(xiàn)評價與實際質(zhì)量偏差過大的情況影響質(zhì)量提升效果。因此,基于客觀評價結(jié)果建立缺陷文本質(zhì)量量化模型是未來缺陷文本質(zhì)量提升的重要方向。

      3 缺陷文本缺陷嚴重等級自動分類

      在電力系統(tǒng)巡檢過程中,往往會累積大量缺陷文本,這些缺陷文本中記錄著大量關(guān)于設(shè)備缺陷嚴重等級的相關(guān)信息,對設(shè)備缺陷等級的分類至關(guān)重要。通過分類設(shè)備缺陷嚴重等級,工作人員可以更好地實現(xiàn)對電力系統(tǒng)中缺陷設(shè)備的管理。然而傳統(tǒng)的設(shè)備缺陷嚴重等級分類方法往往需要人工完成,其分類效率低下;且針對模糊性較強的亞健康缺陷,往往會出現(xiàn)由于巡檢人員經(jīng)驗不足而分類不精確的情況,對電力設(shè)備運行狀態(tài)的評估產(chǎn)生不利影響。

      隨著人工智能及模式識別的深度開發(fā),多種機器學(xué)習(xí)模型與電力設(shè)備缺陷嚴重等級分類相結(jié)合[19],既能夠提高電力設(shè)備缺陷嚴重等級分類的效率[20],又能夠避免因信息模糊造成的分類精確率降低。文獻[21]針對缺陷文本分類,首先通過one-hot詞袋模型對缺陷文本進行預(yù)處理,實現(xiàn)了向量空間的構(gòu)建及缺陷嚴重等級的分類與量化;接著采用K最近鄰算法對電力設(shè)備缺陷記錄數(shù)據(jù)完成類別辨識。仿真部分以斷路器缺陷文本為例,對缺陷文本進行重新分類,與初始結(jié)果進行對比可得,該方法準確率更高,驗證了所提方法的可行性。

      機器學(xué)習(xí)與智能識別的應(yīng)用,使得分類效率大大提高。但這類分類方法往往需要依靠特征函數(shù),從而導(dǎo)致特征項模糊甚至丟失[22];此外,傳統(tǒng)機器學(xué)習(xí)分類方法的泛化能力以及數(shù)據(jù)挖掘能力有限,從而大大限制了缺陷文本的分類效果。

      為解決上述問題,基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的電力設(shè)備缺陷文本挖掘算法被提出,通過卷積運算實現(xiàn)特征壓縮降維、減小運算量[23]。文獻[19]通過與多種傳統(tǒng)機器學(xué)習(xí)分類模型對比得出:基于CNN的缺陷文本分類模型在耗費一定時間的前提下,顯著降低了缺陷文本分類的錯誤率;此外,與以往的機器學(xué)習(xí)分類法相比,基于CNN的缺陷文本分類模型分類時間較短,提高了分類效率。但是該方法僅對文本進行了一次串行淺層特征提取,不能很好地挖掘長文本深層語義信息。針對CNN無法對長序列信息建模的問題,應(yīng)用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(recurrent convolutional neural network,RCNN)是解決該問題的可行思路。RCNN是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的改進算法,克服了傳統(tǒng)RNN長期依賴、梯度爆炸的問題[24]。文獻[25]以變壓器為研究對象,運用RCNN模型完成對缺陷文本的自動分類。仿真部分基于變壓器運維文本,將RCNN方法分別與傳統(tǒng)文本分類模型、RNN以及CNN方法進行對比。與傳統(tǒng)中文文本分類方法相比,RCNN同時實現(xiàn)了特征提取與分類評估,可直接面向底層進行語義分析,分類性能提升了3.49%~21.0%;相比于CNN、RNN,RCNN 模型網(wǎng)絡(luò)框架更加優(yōu)秀,可更好地融合上下文信息并最大可能保留關(guān)鍵語義。

      文獻[26]采用基于雙向長短期記憶網(wǎng)絡(luò)(bi-long short term memory, BiLSTM)的分類模型實現(xiàn)對缺陷文本缺陷嚴重等級高效自動分類。選取經(jīng)過人工分類的某電網(wǎng)公司2010—2015年的529個故障文本中的900條句子作為輸入數(shù)據(jù),輸出為設(shè)備故障嚴重等級。仿真部分通過分類準確率、召回率以及F1值3個指標對BiLSTM方法與LSTM及CNN方法進行比較,驗證了BiLSTM方法的優(yōu)越性。文獻[27]在BiLSTM的基礎(chǔ)上引入了注意力機制,提出了基于注意力機制的雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM based on attention mechanism, BiLSTM-Attention)缺陷文本分類方法。相比于傳統(tǒng)文本分類模型、BiLSTM模型以及CNN模型,BiLSTM-Attention模型在電力設(shè)備缺陷文本分類中具有更好的分類性能,提高了對含有混淆信息長文本的特征提取能力和分類能力。關(guān)于電力設(shè)備缺陷文本缺陷嚴重等級自動分類的方法如圖2和表1所示。

      表1 現(xiàn)有缺陷文本缺陷嚴重等級自動分類方法特點對比Table 1 Comparison of characteristics of existing automatic classification methods for defect severity level of defect text

      圖2 缺陷文本缺陷嚴重等級自動分類方法Fig.2 Automatic classification method for defect severity level in defect text

      4 缺陷文本缺陷細節(jié)提取

      電力公司在電力設(shè)備的日常運營巡檢中,通常以非結(jié)構(gòu)化數(shù)據(jù)形式將電力設(shè)備的異常和維護等信息錄入管理系統(tǒng),數(shù)據(jù)形式以文本形式為主。這些信息中存在著大量的設(shè)備相關(guān)運行狀態(tài)信息,同時還表征了其他同類設(shè)備的運行可靠性信息[28]。然而通過對大量缺陷文本信息的研究能夠發(fā)現(xiàn),同一設(shè)備多個零件的缺陷情況經(jīng)常存在于一條缺陷文本信息中,過度且復(fù)雜的描述導(dǎo)致信息記錄錯亂無序。通過對缺陷記錄中缺陷細節(jié)的提取,可以實現(xiàn)缺陷情況的精確統(tǒng)計、高效分析與有效評價。因此,缺陷文本中缺陷細節(jié)的提取是確保電力系統(tǒng)安全運行的關(guān)鍵環(huán)節(jié)[29]。自然語言處理(nature language processing, NLP)技術(shù)是一門融合語言學(xué)、計算機科學(xué)、數(shù)學(xué)于一體的科學(xué),可以實現(xiàn)人與計算機之間用自然語言進行有效通信,在一定程度實現(xiàn)人機交互。為此,基于NLP領(lǐng)域中的多種方法被廣泛應(yīng)用到中文電力設(shè)備缺陷文本細節(jié)提取中。目前電力設(shè)備缺陷文本細節(jié)提取按自然語言不同主要可分為英文電力設(shè)備缺陷文本細節(jié)提取和中文電力設(shè)備缺陷文本細節(jié)提取2個方向。

      文獻[30]以紐約市電力系統(tǒng)相關(guān)信息作為參考,提出了一種基于機器學(xué)習(xí)的海量缺陷歷史數(shù)據(jù)挖掘方法,電力公司通過該模型可以確定維護和維修工作的優(yōu)先級,例如:1)對饋線故障維修的優(yōu)先等級;2)對電纜、接頭、終端以及變壓器等故障維修的優(yōu)先等級。該方法為電網(wǎng)公司提供了電力設(shè)備故障預(yù)測以及預(yù)防性維修的依據(jù),從而實現(xiàn)對電網(wǎng)更好的維護。國外的缺陷文本細節(jié)提取研究主要聚焦于英文文本,然而與之相比,中文文本在構(gòu)詞、詞性等方面存在著較大差異,因此英文文本挖掘的相關(guān)算法研究在中文文本中是不適用的。文獻[31]提出一種基于語義框架的電力設(shè)備缺陷文本缺陷細節(jié)提取方法,為電力設(shè)備缺陷的進一步記錄、管理奠定了基礎(chǔ)。首先,建立本體字典庫;接著通過對電力設(shè)備缺陷記錄數(shù)據(jù)的總結(jié)分析,結(jié)合其固有特點實現(xiàn)了電力語義框架與語義槽的建立;采用槽填充并構(gòu)建語義框架,構(gòu)建流程如圖3所示。通過對大量變壓器缺陷文本的處理,驗證了該方法能夠精確提取電力設(shè)備缺陷文本中的缺陷信息,因此也能夠應(yīng)用于電力設(shè)備缺陷統(tǒng)計與分類中。文獻[32]結(jié)合依存句法分析技術(shù)對電力設(shè)備缺陷文本信息的精確辨識方法進行了改進。首先,基于依存句法分析技術(shù),構(gòu)建了電力設(shè)備缺陷文本與電力設(shè)備標準文本的依存句法樹,依存句法樹生成流程如圖4所示。接著運用依存句法的樹匹配算法實現(xiàn)了電力設(shè)備缺陷細節(jié)數(shù)據(jù)的準確分析與分類。最后以主變壓器為研究對象,通過分析其歷史缺陷文本記錄,證明了該方法的優(yōu)越性和實用性,相比于其他方法,該方法的計算速度與精確度更具有優(yōu)越性。

      圖3 構(gòu)建語義框架流程Fig.3 Semantic for framework construction

      圖4 電力設(shè)備文本依存句法樹生成流程Fig.4 Flowchart of constructing dependency syntax tree based on equipment defect text

      5 缺陷文本健康狀態(tài)自動評價

      在電力設(shè)備日常運行巡檢中,產(chǎn)生的缺陷文本除了包含電力設(shè)備當前的缺陷情況外,還蘊藏著豐富的電力設(shè)備健康狀態(tài)歷史記錄,通過對健康狀態(tài)的歷史記錄進行分析,能夠更好地評價設(shè)備運行狀態(tài),從而實現(xiàn)對電力設(shè)備未來態(tài)勢的預(yù)測。

      當前健康狀態(tài)主要評價方法如下所述:1) 基于評價導(dǎo)則與專家系統(tǒng)的方法,這種方法成本高、耗時長,當面對大量設(shè)備健康狀態(tài)評價時,難以滿足需求[33];2) 基于人工智能技術(shù)構(gòu)建神經(jīng)網(wǎng)絡(luò)等模型的方法,這種方法是目前的主流方法,能夠?qū)崿F(xiàn)大量設(shè)備健康狀態(tài)的評價[34-37]。

      文獻[34]提出了一種比率型斷路器全壽命周期運行狀況評價模型。首先,根據(jù)斷路器缺陷等級,結(jié)合文本挖掘技術(shù)和相關(guān)評價規(guī)范[35]得到缺陷等級評價結(jié)果,將評價結(jié)果量化為健康狀態(tài)指數(shù);接著運用比率型狀態(tài)信息融合模型得到單位健康周期健康狀態(tài)指數(shù),將其與之前得到的健康狀態(tài)指數(shù)結(jié)合,得到了全壽命周期數(shù)據(jù)流,從而得到斷路器全壽命周期運行狀況評價模型。文獻[36]表明,結(jié)合全壽命狀態(tài)評價模型,可從電力設(shè)備缺陷文本中的語句結(jié)構(gòu)和語義對電力設(shè)備缺陷文本進行深層次挖掘,通過對比缺陷文本與電力設(shè)備缺陷評價規(guī)范,給出當時情景下的電力設(shè)備健康評價結(jié)果,從而極大改善了電力設(shè)備健康狀態(tài)評估的客觀性與準確性。文獻[37]以電力系統(tǒng)故障的告警信號為研究對象,提出了一種電力調(diào)度故障自動判斷模型。首先,結(jié)合隱馬爾可夫模型及向量空間模型對調(diào)度故障信息進行預(yù)處理;接著基于對故障信息文本的辨識結(jié)果,實現(xiàn)對故障情況的精確診斷,并通過k-means聚類法獲取高概率故障為運維人員提供運維檢修依據(jù)。

      現(xiàn)有的基于缺陷詞庫的電力設(shè)備健康狀態(tài)評估方法[30],普遍存在以下缺陷:由于樣本較少,經(jīng)過模型訓(xùn)練所得到的結(jié)果往往并不精確,難以覆蓋所有缺陷,缺陷文本錄入不規(guī)范也會限制電力設(shè)備健康狀態(tài)評估方法的準確性。因此,通過對電力設(shè)備缺陷文本深度挖掘來提高缺陷類型評估準確性的方法[36]存在固有局限性,需要先對缺陷文本進行質(zhì)量提升。此外,基于機器學(xué)習(xí)的健康狀態(tài)評估方法的核心是實際需要故障類型對訓(xùn)練的故障樣本具有高度依賴性,對于故障樣本未包含的故障類型,難以進行精準識別,通過生成對抗網(wǎng)絡(luò)來生成原本故障樣本未包含的數(shù)據(jù)是一種數(shù)據(jù)增強的有效手段。此外,深度學(xué)習(xí)等機器學(xué)習(xí)算法需要大量的有標簽數(shù)據(jù)作為數(shù)據(jù)支撐,當訓(xùn)練數(shù)據(jù)匱乏時,訓(xùn)練出的模型極易出現(xiàn)過擬合的現(xiàn)象,這種現(xiàn)象在小規(guī)模數(shù)據(jù)集上尤為明顯。未來,通過人工智能技術(shù)提高訓(xùn)練樣本集完備性以加強故障類型識別精度值得深入研究。

      6 電力設(shè)備缺陷文本信息挖掘前景展望

      目前電力設(shè)備缺陷文本挖掘領(lǐng)域仍然處于初級階段,對文本挖掘技術(shù)有待進一步研究。本文基于目前的研究成果,對電力設(shè)備缺陷文本挖掘技術(shù)進行了總結(jié),其未來關(guān)鍵技術(shù)發(fā)展前景展望如下:

      1) 高質(zhì)量電力本體詞典的構(gòu)建。電力本體詞典是電力設(shè)備缺陷文本挖掘技術(shù)的基礎(chǔ)[36],其質(zhì)量決定了電力設(shè)備缺陷文本挖掘的效果。受制于電力領(lǐng)域方向眾多、詞匯復(fù)雜等因素,構(gòu)建高質(zhì)量電力本體詞典困難,如何通過相關(guān)方法構(gòu)建高質(zhì)量電力本體詞典,是今后研究的關(guān)鍵問題。目前電力本體詞典的構(gòu)建主要針對非結(jié)構(gòu)化的文本數(shù)據(jù),如果能與結(jié)構(gòu)化的多源數(shù)據(jù)進行融合,結(jié)合專家系統(tǒng)對電力本體詞典進行實時在線擴充,將會極大消除電力設(shè)備缺陷文本挖掘?qū)τ谖粗毕莸奶卣魑谋咎崛±щy的現(xiàn)狀。

      2) 知識圖譜在電力設(shè)備缺陷文本信息提取中的深層次應(yīng)用。當前電力知識圖譜的研究不夠深入,在其內(nèi)部架構(gòu)設(shè)計方面有待進一步研究[38]。文獻[39]所提出的電力知識圖譜主要采用三元組的形式進行表示,難以表示更加復(fù)雜的電力設(shè)備缺陷文本信息。因此,如何進一步開發(fā)知識圖譜,使其能夠更加詳細地表達復(fù)雜信息,是電力知識圖譜在電力設(shè)備缺陷文本挖掘中的重要研究方向;此外,電力知識圖譜構(gòu)建過程中,如何更加準確地獲取大量有效知識以及如何更好對知識進行有效融合,是電力知識圖譜應(yīng)用的另一關(guān)鍵問題。知識圖譜具有良好的解釋性,而基于深度學(xué)習(xí)的特征提取方法具有精準度高解釋性差的特點,因此可以將二者結(jié)合,構(gòu)建基于深度學(xué)習(xí)的新型知識圖譜,將深度學(xué)習(xí)的輸出結(jié)果轉(zhuǎn)化為知識圖譜可以理解的三元組進行推理,在保證缺陷文本提取合理性的基礎(chǔ)上提高提取精度與效率。

      3) 電力設(shè)備缺陷文本細節(jié)提取方法的深度開發(fā)[40]。當前電力設(shè)備缺陷文本細節(jié)提取方法仍較為簡單,可以通過篩選進一步完善。如利用神經(jīng)網(wǎng)絡(luò)的分類功能對不同數(shù)據(jù)進行篩選,有效降低非強關(guān)聯(lián)數(shù)據(jù)對提取結(jié)果的影響,改善細節(jié)提取原始數(shù)據(jù)集的質(zhì)量。

      4)多源數(shù)據(jù)融合在電力設(shè)備缺陷文本挖掘方法中的應(yīng)用。當前依靠缺陷文本挖掘與自動診斷技術(shù)的應(yīng)用對電力設(shè)備健康狀態(tài)自動評價的方法只是基于歷史缺陷記錄數(shù)據(jù)對設(shè)備當前運行態(tài)勢進行評價,如何將設(shè)備運行實時監(jiān)測數(shù)據(jù)與健康狀態(tài)評價模型相結(jié)合,實現(xiàn)電力設(shè)備健康狀態(tài)完整評價,仍需要進一步研究。例如針對多源數(shù)據(jù)融合接入進行綜合分析處理,實時融合機器人等站端各類智能裝備在線數(shù)據(jù)和離線監(jiān)測數(shù)據(jù)等信息;進而依托設(shè)備健康狀態(tài)評價算法模型進行設(shè)備運行狀態(tài)評估;最后結(jié)合專家系統(tǒng)中的知識庫、規(guī)則庫實現(xiàn)智能預(yù)警,并與智能裝備調(diào)度平臺進行聯(lián)動控制,實現(xiàn)一體化、全方位的數(shù)字化和智能化設(shè)備健康狀態(tài)評估。

      7 結(jié) 論

      本文主要從技術(shù)角度探討了電力設(shè)備缺陷文本錯誤識別與質(zhì)量提升、嚴重等級自動分類、缺陷細節(jié)提取、健康狀態(tài)自動評價等關(guān)鍵技術(shù)。本文研究的內(nèi)容,是基于該領(lǐng)域已有科研成果所作的總結(jié)和展望,以期對電力設(shè)備缺陷文本挖掘技術(shù)的進一步發(fā)展及應(yīng)用提供一些思路和借鑒。然而配電網(wǎng)作為輸電端與負荷端連接的關(guān)鍵系統(tǒng),具有設(shè)備復(fù)雜、傳感器種類多樣、新舊程度不一等特點。在應(yīng)用層面,由于運行環(huán)境惡劣、電磁干擾,許多設(shè)備狀態(tài)監(jiān)測裝置現(xiàn)場應(yīng)用性能不穩(wěn)定,監(jiān)測裝置本身存在故障率、誤報率高及數(shù)據(jù)可信度存疑等問題,電力設(shè)備缺陷文本智能辨識技術(shù)在配電設(shè)備智能高效運維的實際工程應(yīng)用面臨嚴峻挑戰(zhàn)。通過建立基于人工智能的電力設(shè)備缺陷文本分類模型,對現(xiàn)場巡視人員錄入的缺陷文本數(shù)據(jù)進行等級分類并給出相關(guān)分類依據(jù)可有效提升電力設(shè)備運維效率。此外,電力設(shè)備缺陷文本挖掘技術(shù)的發(fā)展仍然需要相當長的過程,在當前研究的基礎(chǔ)上,應(yīng)融合多種方法實現(xiàn)電力設(shè)備缺陷文本挖掘,以期實現(xiàn)更加智能的效果。

      猜你喜歡
      電力設(shè)備圖譜錯誤
      在錯誤中成長
      繪一張成長圖譜
      加強電力設(shè)備運維云平臺安全性管理
      補腎強身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      電力設(shè)備運維管理及安全運行探析
      主動對接你思維的知識圖譜
      基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
      不犯同樣錯誤
      基于改進Canny算子的電力設(shè)備圖像檢測研究
      《錯誤》:怎一個“美”字了得
      短篇小說(2014年11期)2014-02-27 08:32:41
      诏安县| 华容县| 赣榆县| 延边| 安新县| 左权县| 丰都县| 淮北市| 吐鲁番市| 郯城县| 温泉县| 嘉鱼县| 离岛区| 阿拉善右旗| 巴东县| 恭城| 澜沧| 洪洞县| 吉安县| 沂南县| 正定县| 威海市| 邹平县| 凤山市| 财经| 深泽县| 张家口市| 大庆市| 偏关县| 宝鸡市| 甘洛县| 澄江县| 曲松县| 阳江市| 明光市| 临城县| 岳西县| 贵阳市| 漳州市| 巫山县| 青河县|