• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      電力設(shè)備健康管理知識圖譜:基本概念、關(guān)鍵技術(shù)及研究進(jìn)展

      2022-02-17 09:40:40李銀強(qiáng)王洪濤黃文琦侯佳萱
      電力系統(tǒng)自動(dòng)化 2022年3期
      關(guān)鍵詞:電力設(shè)備圖譜運(yùn)維

      李 剛,李銀強(qiáng),王洪濤,謝 慶,黃文琦,侯佳萱

      (1. 華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院,河北省保定市 071003;2. 復(fù)雜能源系統(tǒng)智能計(jì)算教育部工程研究中心(華北電力大學(xué)),河北省保定市 071003;3. 華北電力大學(xué)電氣與電子工程學(xué)院,河北省保定市 071003;4.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣東省廣州市 510670)

      0 引言

      電力設(shè)備(如發(fā)電機(jī)、變壓器、繼電保護(hù)裝置等)狀態(tài)評估(如風(fēng)電機(jī)組狀態(tài)預(yù)測、變壓器剩余壽命、輸電線路狀態(tài)監(jiān)測等)對保障電力系統(tǒng)安全穩(wěn)定運(yùn)行有著重要的理論意義[1]。隨著智能電網(wǎng)體系的不斷完善,電力設(shè)備的類型、數(shù)量、工況復(fù)雜性大幅增加。以變壓器為例,國家電網(wǎng)有限公司在運(yùn)110 kV及以上電壓等級變壓器已達(dá)30 000 余臺[2]。隨著投運(yùn)設(shè)備的增加,存在于電力設(shè)備健康管理全生命周期各環(huán)節(jié)中的大量相關(guān)知識也大幅增加,如何有效管理和利用這些知識,是電力設(shè)備精細(xì)化運(yùn)維與健康管理的重要內(nèi)容之一。已有研究將計(jì)算機(jī)領(lǐng)域中近年來廣泛應(yīng)用的知識圖譜(knowledge graph)技術(shù)引入電力系統(tǒng)領(lǐng)域[3]。

      知識圖譜的概念最初由Google 公司于2012 年提出[4],Google 知識圖譜通過三元組對“概念實(shí)體”、“屬性”和“關(guān)系”等核心要素進(jìn)行形式化描述,以最小的代價(jià)將大規(guī)模網(wǎng)絡(luò)信息有效組織起來,實(shí)現(xiàn)了互聯(lián)網(wǎng)領(lǐng)域的數(shù)億實(shí)體、屬性和關(guān)聯(lián)關(guān)系的可視化存儲(chǔ)、組織和管理[5]。知識圖譜可定義為形如(h,r,t)的三元組,其中h為頭實(shí)體,r為關(guān)系,t為尾實(shí)體。知識圖譜本質(zhì)上是一個(gè)有向圖。通過網(wǎng)狀拓?fù)浣Y(jié)構(gòu)對知識進(jìn)行更好的串聯(lián)和呈現(xiàn),它可以對多源異構(gòu)數(shù)據(jù)進(jìn)行整合和知識提取,包含了實(shí)體之間更豐富的語義關(guān)聯(lián),并且可以結(jié)合推理得到的隱含信息為用戶提供個(gè)性化服務(wù),被廣泛應(yīng)用于智能搜索、智能問答、文本分類等領(lǐng)域[6]。國外在知識圖譜構(gòu)建方面 起 步 較 早,較 為 知 名 的 有YAGO[7]、Wikidata[8]。國內(nèi)已有不少互聯(lián)網(wǎng)和研究機(jī)構(gòu)在知識圖譜構(gòu)建方面做了相應(yīng)工作,比如上海交通大學(xué)最早構(gòu)建的中文知識圖譜平臺zhishi.me;百度推出的中文知識圖譜搜索;復(fù)旦大學(xué)GDM 實(shí)驗(yàn)室推出的中文知識圖譜展示平臺等[9]。

      知識圖譜作為人工智能領(lǐng)域的一個(gè)重要分支,目前在各個(gè)領(lǐng)域均開始有一些初步的研究,在電力領(lǐng)域尚屬起步階段。例如,文獻(xiàn)[10]根據(jù)調(diào)度自動(dòng)化系統(tǒng)的源碼、配置文件、數(shù)據(jù)庫和專家經(jīng)驗(yàn)整理出離散的調(diào)度知識,構(gòu)建了調(diào)度自動(dòng)化系統(tǒng)知識圖譜,用于業(yè)務(wù)知識的動(dòng)態(tài)搜索;文獻(xiàn)[11]采用電力詞典抽取缺陷信息實(shí)體,構(gòu)建了電力設(shè)備缺陷知識圖譜,用于故障缺陷信息的檢索;文獻(xiàn)[12]利用知識圖譜建立了面向智能變電站的搜索引擎,開發(fā)了安全措施自動(dòng)生成系統(tǒng),對二次檢修的效率以及安全措施的準(zhǔn)確性有一定提高;文獻(xiàn)[13]基于知識圖譜技術(shù)構(gòu)建了以Neo4j 圖數(shù)據(jù)庫為支撐的電網(wǎng)信息搜索引擎,較之于傳統(tǒng)的搜索引擎可更便捷、快速、準(zhǔn)確地獲取信息;文獻(xiàn)[14]針對電網(wǎng)業(yè)務(wù)數(shù)據(jù)無法跨專業(yè)貫通、數(shù)據(jù)資源無法被智能分析與管理等問題,提出基于全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心的知識圖譜構(gòu)建方法,實(shí)現(xiàn)了運(yùn)檢數(shù)據(jù)的自動(dòng)匹配;文獻(xiàn)[15]從電網(wǎng)調(diào)度規(guī)則、故障預(yù)案以及人工經(jīng)驗(yàn)知識中進(jìn)行知識抽取,構(gòu)建了電網(wǎng)故障調(diào)度知識圖譜,用于輔助配電網(wǎng)故障決策診斷。當(dāng)前,知識圖譜在電力系統(tǒng)中的應(yīng)用尚屬起步階段,應(yīng)用場景并不明確,并且缺乏對關(guān)鍵技術(shù)的深入研究,如知識圖譜的構(gòu)建、知識推理、圖譜補(bǔ)全等。文獻(xiàn)[10,12,14]采用基于模板的方法進(jìn)行圖譜構(gòu)建,靈活性較低,難以應(yīng)對時(shí)變的數(shù)據(jù),而文獻(xiàn)[11,15]則是采用了機(jī)器學(xué)習(xí)的方法和針對文本處理特定的方法進(jìn)行圖譜構(gòu)建,需要在特征工程上耗費(fèi)大量精力。

      綜上,知識圖譜在電力系統(tǒng)的各業(yè)務(wù)環(huán)節(jié)均有所研究,但并未形成一套有效的知識圖譜構(gòu)建方法,對知識圖譜的應(yīng)用也處于起步階段。在電力設(shè)備健康管理中存在著大量的專業(yè)業(yè)務(wù)知識,如何構(gòu)建完備的知識圖譜,并在此基礎(chǔ)上挖掘其應(yīng)用價(jià)值,實(shí)現(xiàn)設(shè)備的精細(xì)化運(yùn)維以及知識和健康管理的良性互動(dòng),是當(dāng)前及今后一段時(shí)間內(nèi),能源電力系統(tǒng)推動(dòng)數(shù)字化轉(zhuǎn)型的重要方向之一。

      1 知識圖譜技術(shù)體系

      1.1 知識圖譜構(gòu)建方法

      知識圖譜可以分為不限領(lǐng)域知識圖譜(通用知識圖譜)和限定領(lǐng)域知識圖譜(領(lǐng)域知識圖譜)[16]。通用知識圖譜涵蓋面廣,其知識來自各行各業(yè),而領(lǐng)域知識圖譜則是面向特定行業(yè)進(jìn)行知識抽取,需要有豐富的領(lǐng)域背景知識。本節(jié)將對知識圖譜的構(gòu)建方法及其關(guān)鍵技術(shù)進(jìn)行詳細(xì)介紹,如圖1 所示。由于當(dāng)前不同文獻(xiàn)對知識圖譜中所出現(xiàn)的部分術(shù)語表述有差異,本文嘗試做了梳理,如附錄A 表A1所示[17-21]。

      圖1 知識圖譜構(gòu)建過程Fig.1 Construction process of knowledge graph

      1.1.1 自頂向下

      自頂向下(top down)的構(gòu)建方法可分為本體學(xué)習(xí)(ontology learning)、實(shí)體學(xué)習(xí)(entity learning)?!氨倔w”是對知識圖譜在概念層面的定義,定義了知識圖譜構(gòu)建的規(guī)則、概念,本體較為抽象。例如,在構(gòu)建電力設(shè)備健康管理知識圖譜時(shí),首先需要對電力設(shè)備進(jìn)行分類,這個(gè)分類就是本體。而本體中的具體對象就是實(shí)體,如變壓器、氣體絕緣金屬封閉開關(guān)設(shè)備(GIS)等。本體學(xué)習(xí)的目的是從當(dāng)前語料、文本中提取行業(yè)術(shù)語,習(xí)得本體的概念,抽取本體之間的關(guān)系完成本體層的構(gòu)建,制定數(shù)據(jù)層實(shí)體、關(guān)系抽取規(guī)則。實(shí)體學(xué)習(xí)則是在本體學(xué)習(xí)的基礎(chǔ)上對數(shù)據(jù)進(jìn)行實(shí)體、關(guān)系抽取,并完成實(shí)體對齊任務(wù),獲得實(shí)體的統(tǒng)一描述,如“局放”、“局部放電”、“局部放電故障”,均可歸納為“局部放電故障”,然后進(jìn)行實(shí)體填充獲得完備的實(shí)體表述。

      1.1.2 自底向上

      自底向上(bottom up)的構(gòu)建方法可分為知識抽?。╧nowledge extraction)、知識融合(knowledge fusion)、知識加工。知識抽取包含:1)實(shí)體抽取(entity extraction);2)關(guān) 系 抽 ?。╮elationship extraction);3)屬性抽取,從數(shù)據(jù)源中抽取實(shí)體,獲取實(shí)體之間的關(guān)聯(lián)關(guān)系,通過關(guān)系將實(shí)體連接起來構(gòu)成知識網(wǎng),最后進(jìn)行實(shí)體信息抽取。知識融合包括:1)實(shí)體對齊(entity alignment),自底向上的實(shí)體對齊同自頂向下實(shí)體對齊,都是對同一實(shí)體的不同表達(dá)去噪得到統(tǒng)一描述;2)實(shí)體消歧(entity disambiguation),是對知識圖譜中存在多種含義的實(shí)體進(jìn)行區(qū)分,如“變壓器”,可指代“110 kV 變壓器”,也可指代“220 kV 變壓器”,通過實(shí)體消歧可將具有同樣名稱的實(shí)體進(jìn)行區(qū)分;3)屬性值填充,目的是將抽取的屬性按照實(shí)體進(jìn)行匹配,以完善實(shí)體。知識加工包括:本體構(gòu)建、質(zhì)量評估、知識推理(knowledge reasoning),通過計(jì)算實(shí)體相似度形成本體層與數(shù)據(jù)層結(jié)合形成知識圖譜,通過人工或者自動(dòng)化的方式對知識圖譜質(zhì)量進(jìn)行評估,最后對知識圖譜進(jìn)行推理,發(fā)現(xiàn)其中包含的錯(cuò)誤實(shí)體關(guān)系對或者隱性知識。

      1.2 知識圖譜構(gòu)建中的關(guān)鍵技術(shù)

      構(gòu)建知識圖譜所涉及的關(guān)鍵技術(shù)可分為2 種:一是構(gòu)建知識圖譜本身所需的關(guān)鍵技術(shù),如實(shí)體抽取、實(shí)體關(guān)系抽取、實(shí)體-關(guān)系聯(lián)合抽?。╦oint extraction of entity relations)等,屬于自然語言處理的范疇;二是知識圖譜的本源技術(shù),如圖譜完善,旨在通過現(xiàn)有的知識挖掘出新的知識、不斷完善知識圖譜。本文接下來將從實(shí)體抽取、關(guān)系抽取、知識推理等幾個(gè)關(guān)鍵環(huán)節(jié)做詳細(xì)介紹。

      1.2.1 實(shí)體抽取

      實(shí)體抽取又稱命名實(shí)體識別,其任務(wù)包括識別文中提及的命名實(shí)體,消除實(shí)體的歧義,并將抽取的實(shí)體與知識庫中的對象連接起來[22]。實(shí)體抽取方法可分為傳統(tǒng)實(shí)體抽取方法、基于機(jī)器學(xué)習(xí)的抽取方法和基于神經(jīng)網(wǎng)絡(luò)的抽取方法[23]。傳統(tǒng)方法多依靠領(lǐng)域?qū)<抑贫ǔ槿∫?guī)則和模板完成實(shí)體抽取,自動(dòng)化程度較低,適用于小數(shù)據(jù)集?;谝?guī)則的方法往往需要大量的語言學(xué)知識,且費(fèi)時(shí)費(fèi)力、可移植性不好。目前,部分實(shí)體抽取任務(wù)被機(jī)器學(xué)習(xí)算法解決[24]?;诮y(tǒng)計(jì)機(jī)器學(xué)習(xí)的實(shí)體抽取方法通常需要進(jìn)行特征工程如數(shù)據(jù)升維、降維、量化等,對特征選擇要求較高,同時(shí)需要大規(guī)模語料集。而深度學(xué)習(xí)方法可以實(shí)現(xiàn)特征的自動(dòng)學(xué)習(xí),采用低維、稠密的實(shí)值向量表示數(shù)據(jù),避免對人工和專家知識的嚴(yán)重依賴。近年來,基于深度學(xué)習(xí)的實(shí)體抽取方法受到關(guān)注[25]。通常采用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的方法能夠較為靈活地抽取實(shí)體。例如,文獻(xiàn)[26]提出一種基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BiLSTM)與條件隨機(jī)場(CRF)的神經(jīng)網(wǎng)絡(luò)模型,用于序列標(biāo)注與實(shí)體抽取任務(wù),較之于隱馬爾可夫模型(HMM)和CRF 實(shí)驗(yàn)效果更好;文獻(xiàn)[27]采用BiLSTM+CRF 構(gòu)建了二次設(shè)備功能缺陷知識圖譜;在復(fù)雜的電力實(shí)體抽取任務(wù)中傳統(tǒng)方式以及基于監(jiān)督學(xué)習(xí)的方式難以應(yīng)對,因此,文獻(xiàn)[28]分別使用了BiLSTM 與CRF 模型進(jìn)行電力實(shí)體抽取,同樣獲得了不錯(cuò)的表現(xiàn)。

      1.2.2 關(guān)系抽取

      關(guān)系抽取又稱實(shí)體關(guān)系抽取,通過從文本中抽取未知的實(shí)體關(guān)系并加入知識圖譜中,它是知識圖譜構(gòu)建的關(guān)鍵任務(wù)[29]。同樣,關(guān)系抽取可分為基于模式匹配的關(guān)系抽取、基于機(jī)器學(xué)習(xí)的關(guān)系抽取、基于深度學(xué)習(xí)的關(guān)系抽?。?0-31]。關(guān)系抽取和實(shí)體抽取密不可分,通常進(jìn)行實(shí)體抽取的模型和方法對關(guān)系抽取同樣適用。早期采用的方法大多基于模式匹配的關(guān)系抽取,即通過領(lǐng)域?qū)<抑贫P(guān)系抽取規(guī)則,然后與數(shù)據(jù)進(jìn)行匹配完成關(guān)系抽取任務(wù)?;谝?guī)則的關(guān)系抽取方法的缺點(diǎn)是對跨領(lǐng)域的可移植性較差、人工標(biāo)注成本較高以及召回率較低[30]。目前,關(guān)系抽取任務(wù)逐漸被機(jī)器學(xué)習(xí)替代,基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法首先需要大量人工標(biāo)注的語料庫,然后再進(jìn)行特征抽取和選擇,利用不同的機(jī)器學(xué)習(xí)算法訓(xùn)練分類模型,自動(dòng)抽取、發(fā)現(xiàn)新的實(shí)體對及其關(guān)系[32]?;趥鹘y(tǒng)機(jī)器學(xué)習(xí)的關(guān)系抽取方法在特征提取過程中存在誤差傳播問題,而深度學(xué)習(xí)因其能夠自動(dòng)學(xué)習(xí)更高階語義特征并具有較高的精確度,逐漸成為實(shí)體關(guān)系抽取領(lǐng)域新的研究熱點(diǎn)[33]。文獻(xiàn)[34]就采用了基于注意力機(jī)制的門控循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行電力實(shí)體關(guān)系抽取,與傳統(tǒng)方法相比可獲得更高的準(zhǔn)確度。

      1.2.3 實(shí)體-關(guān)系聯(lián)合抽取

      實(shí)體抽取和關(guān)系抽取作為構(gòu)建知識圖譜中最重要的2 個(gè)任務(wù),其抽取質(zhì)量直接關(guān)系著最終知識圖譜的質(zhì)量,通常它們是2 個(gè)分離的任務(wù),但存在以下問題:傳統(tǒng)的關(guān)系抽取劃分為2 個(gè)流水線式的子任務(wù),即命名實(shí)體識別和關(guān)系分類,實(shí)體抽取的誤差會(huì)傳播至關(guān)系分類,即前一個(gè)子任務(wù)的錯(cuò)誤會(huì)累積到下一個(gè)子任務(wù),導(dǎo)致性能較差;同時(shí)流水線式模式還忽略了2 個(gè)任務(wù)之間的相關(guān)性,尤其是在實(shí)體抽取時(shí)沒有利用到關(guān)系信息[35-36]。針對此情況,越來越多的研究集中在單個(gè)模式中同時(shí)抽取實(shí)體和關(guān)系,通常稱之為“實(shí)體-關(guān)系聯(lián)合抽取”,因充分利用了上下文信息,在抽取的結(jié)果上往往有更好的表現(xiàn)。但在目前電力系統(tǒng)相關(guān)知識圖譜構(gòu)建中尚無應(yīng)用。

      1.2.4 圖譜完善

      圖譜完善又稱圖譜補(bǔ)全,即通過挖掘缺失實(shí)體、關(guān)系或者發(fā)現(xiàn)新的知識,對知識圖譜進(jìn)行完善,被廣泛應(yīng)用到知識圖譜上游應(yīng)用中,是提高知識圖譜質(zhì)量的重要方法[37]。例如,目前規(guī)模較大的開放知識圖譜Freebase 中,有75% 的人沒有國籍信息,Dbpedia 中有60%的人物實(shí)體沒有相關(guān)的出生地信息等。這時(shí)使用圖譜完善技術(shù)對其中缺失或者錯(cuò)誤的實(shí)體、關(guān)系進(jìn)行補(bǔ)全或糾正就顯得尤為重要,尤其是對領(lǐng)域知識圖譜進(jìn)行補(bǔ)全工作,能夠幫助人們更好地理解潛在的專業(yè)知識。與圖譜完善對應(yīng)的是知識推理,即從現(xiàn)有數(shù)據(jù)中推斷出新的實(shí)體關(guān)系,并對圖譜進(jìn)行反饋、豐富[38]。圖譜完善和知識推理都可以對當(dāng)前圖譜中存在的錯(cuò)誤或缺失信息進(jìn)行糾正,但圖譜完善僅對圖譜進(jìn)行完善補(bǔ)全工作,而知識推理則更注重在完善圖譜的同時(shí)發(fā)現(xiàn)隱性知識,幫助人們獲得更高階的知識表示,因此,圖譜完善可以看作是知識推理的子任務(wù)。

      當(dāng)前電力領(lǐng)域知識圖譜的構(gòu)建工作大部分是沒有進(jìn)行質(zhì)量評估的,不能形成對知識圖譜質(zhì)量的全局把控,在圖譜完善和知識推理方面還有待完善。

      2 知識圖譜在電力設(shè)備健康管理中的應(yīng)用

      當(dāng)前電力設(shè)備健康管理工作所使用的數(shù)據(jù)多為一段時(shí)間連續(xù)的在線監(jiān)測數(shù)據(jù),如電壓、電流、油色譜,或者采用紅外、紫外、設(shè)備外觀圖像進(jìn)行故障分類與診斷,忽略了日常巡檢累積的大量電力文本語料,同時(shí)大量使用數(shù)據(jù)驅(qū)動(dòng)的方法進(jìn)行健康管理工作,最直接的問題便是結(jié)果的可解釋性,基于符號主義的知識圖譜在文本數(shù)據(jù)挖掘和可解釋性方面有較好的優(yōu)勢。隨著知識圖譜技術(shù)的發(fā)展,研究者提出了諸多知識圖譜驅(qū)動(dòng)的智能問答、商品推薦、數(shù)據(jù)挖掘范式,展現(xiàn)了知識圖譜廣闊的應(yīng)用前景[39],其在電力領(lǐng)域的應(yīng)用也逐漸開始。因此,本章首先分析電力設(shè)備健康管理知識圖譜的特點(diǎn),然后給出知識圖譜在電力設(shè)備健康管理中的應(yīng)用場景。

      2.1 電力設(shè)備健康管理知識圖譜的特點(diǎn)

      電力系統(tǒng)數(shù)據(jù)已呈現(xiàn)海量化、多樣化和快速化的大數(shù)據(jù)特征[40],包含文本、圖像、音頻等這樣的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),這些多樣性的數(shù)據(jù)導(dǎo)致了在構(gòu)建電力設(shè)備健康管理知識圖譜時(shí),在知識和信息的表示上呈現(xiàn)多模態(tài)的特點(diǎn)。

      從所構(gòu)建的圖譜來看,電力設(shè)備健康管理知識圖譜涵蓋如下3 個(gè)方面:1)最基本的知識圖譜,其知識來源為關(guān)系型數(shù)據(jù)庫、文本、文檔等結(jié)構(gòu)化數(shù)據(jù),用途為管理結(jié)構(gòu)化知識和圖譜可視化;2)多模態(tài)圖譜,多模態(tài)知識圖譜將多模態(tài)知識(文本、視頻、圖片)進(jìn)行整合,可為用戶提供多個(gè)不同維度的知識,還可以實(shí)現(xiàn)不同模態(tài)數(shù)據(jù)之間的跨模態(tài)交互[41]。例如,電力設(shè)備故障診斷和健康管理中通常有基于紅外光譜數(shù)據(jù)[42]、紫外光譜數(shù)據(jù)[43]、振動(dòng)信號[44]等方法。通過神經(jīng)網(wǎng)絡(luò)提取這些非結(jié)構(gòu)化數(shù)據(jù)特征進(jìn)行分類,可得到設(shè)備故障類型的文本描述,有助于圖譜構(gòu)建,常見的方法有卷積神經(jīng)網(wǎng)絡(luò)、目標(biāo)檢測,通過預(yù)先標(biāo)注的故障類型和設(shè)備類型進(jìn)行模型訓(xùn)練,從而得到圖片中設(shè)備或者故障類型的文本描述;3)事理圖譜,又稱事件圖譜,以事件為節(jié)點(diǎn),以事件關(guān)系為邊,能夠較好地表現(xiàn)事件之間的耦合關(guān)系,實(shí)現(xiàn)事件因果關(guān)系的預(yù)測[45]。例如,當(dāng)設(shè)備發(fā)生故障時(shí),由于設(shè)備故障具有較強(qiáng)的耦合性和因果關(guān)系,構(gòu)建電力設(shè)備事理圖譜可有效進(jìn)行故障溯源,明晰故障原因、部位,極大提高運(yùn)維的靈活程度。

      電力設(shè)備健康管理知識圖譜應(yīng)具有更好的知識表達(dá)能力,涵蓋豐富的電力設(shè)備信息,因其應(yīng)用場景特定,加之電力行業(yè)積累的海量數(shù)據(jù),能對電力設(shè)備知識做到較完備的表示。另外,無論是從保證用電安全的角度,還是確保巡檢人員安全的角度,所構(gòu)建的圖譜在參與輔助決策時(shí)應(yīng)具有良好的知識表達(dá)能力,這就要求所構(gòu)建的知識圖譜較之于通用知識圖譜應(yīng)擁有更細(xì)粒度的知識。

      2.2 電力設(shè)備健康管理知識圖譜構(gòu)建分析

      通常在完成本體構(gòu)造、實(shí)體和關(guān)系抽取任務(wù)后便可得到知識圖譜的大體框架,但正如前文所述,實(shí)體和關(guān)系抽取的質(zhì)量將影響最終知識圖譜的質(zhì)量,所以在構(gòu)建知識圖譜之前須確保抽取的實(shí)體及關(guān)系有著較高的準(zhǔn)確率。當(dāng)前不少工作是將實(shí)體抽取和關(guān)系抽取視為2 個(gè)分離的任務(wù),故本文對實(shí)體-關(guān)系聯(lián)合抽取做了相應(yīng)回顧。實(shí)體、關(guān)系分離抽取存在的最大問題就是忽視了誤差傳播因素,隨著自然語言處理(NLP)的快速發(fā)展,必將涌現(xiàn)出一系列實(shí)體-關(guān)系聯(lián)合抽取方法,以獲得高質(zhì)量的實(shí)體及關(guān)系。在知識圖譜構(gòu)建完成之后須進(jìn)行圖譜完善以及知識推理工作,并對現(xiàn)有的知識圖譜進(jìn)行反饋得到更為全面的知識圖譜。同時(shí),數(shù)據(jù)的不斷累積將導(dǎo)致關(guān)鍵數(shù)據(jù)稀疏情況的出現(xiàn),所以,如何從海量數(shù)據(jù)中獲取目標(biāo)數(shù)據(jù)也是知識圖譜構(gòu)建過程中的一大難題。因此,本節(jié)將從數(shù)據(jù)準(zhǔn)備、圖譜構(gòu)建、圖譜完善等方面展開論述,詳細(xì)介紹電力設(shè)備健康管理知識圖譜的構(gòu)建過程,總體框架如圖2 所示。

      圖2 電力設(shè)備健康管理知識圖譜構(gòu)建過程Fig.2 Construction process of health management knowledge graph of power equipment

      2.2.1 數(shù)據(jù)準(zhǔn)備

      電力系統(tǒng)運(yùn)行、檢修和管理過程中產(chǎn)生的海量全景狀態(tài)數(shù)據(jù)通常存儲(chǔ)在生產(chǎn)管理系統(tǒng)(PMS)、管控平臺、文件系統(tǒng)、數(shù)據(jù)中臺等,并夾雜著大量的噪聲[46],這就需要研究如何從高噪聲、價(jià)值密度稀疏的數(shù)據(jù)中有效挖掘目標(biāo)數(shù)據(jù)及其潛在價(jià)值。通常通用知識圖譜可以通過網(wǎng)絡(luò)爬蟲的形式增加數(shù)據(jù)集以獲得更多數(shù)據(jù),但對于電力知識圖譜來說,該方法具有一定的局限性;此外,在知識抽取環(huán)節(jié),通常開放領(lǐng)域知識圖譜可采用開放眾包的方式來加快知識抽取過程,但是電力數(shù)據(jù)通常有保密性要求,文本標(biāo)注環(huán)節(jié)只能在電力行業(yè)內(nèi)部進(jìn)行,進(jìn)一步加大了知識圖譜構(gòu)建的難度,可在開源第三方工具(如Jieba 分詞)的基礎(chǔ)上增加電力設(shè)備數(shù)據(jù)模板(如借助行業(yè)內(nèi)規(guī)范、白皮書等),進(jìn)一步加快抽取過程,并形成標(biāo)簽供使用。

      其中,電力設(shè)備數(shù)據(jù)的稀疏性主要表現(xiàn)為:設(shè)備故障存在偶然性,歷史數(shù)據(jù)及在線監(jiān)測數(shù)據(jù)中故障樣本偏少,導(dǎo)致現(xiàn)有故障診斷算法由于數(shù)據(jù)分布不均使得診斷效果低下。針對此種情況,需選取合適的方法對故障樣本進(jìn)行擴(kuò)充。例如,文獻(xiàn)[47]提出一種基于注意力機(jī)制的對抗生成網(wǎng)絡(luò),可實(shí)現(xiàn)輸電線路中螺栓缺陷樣本的生成,有效擴(kuò)充了可用于訓(xùn)練的樣本集。

      2.2.2 圖譜構(gòu)建

      知識圖譜的構(gòu)建方式通??煞譃樽皂斚蛳隆⒆缘紫蛏虾突旌戏绞? 種[29],電力設(shè)備健康管理知識圖譜屬于領(lǐng)域知識圖譜,通常采用自頂向下和自底向上相結(jié)合的混合構(gòu)建方式,即先定義本體層,然后在數(shù)據(jù)層進(jìn)行知識抽取,同時(shí)反復(fù)更新本體層,再將新得的知識添加至本體中完成圖譜構(gòu)建,靈活性較高。

      普通圖譜只由實(shí)體和關(guān)系組成,而多模態(tài)圖譜需對數(shù)據(jù)做出意圖理解,然后將所識別的意圖加入實(shí)體或者關(guān)系中;事件圖譜則是將事件和事件關(guān)系作為圖譜的實(shí)體和關(guān)系。依靠傳統(tǒng)的基于模板的方法較難處理海量電力數(shù)據(jù),缺點(diǎn)在于處理速度較慢,且實(shí)體和關(guān)系抽取精度不高。因此,針對多模態(tài)圖譜和事件圖譜,可考慮使用自動(dòng)化方法進(jìn)行實(shí)體和關(guān)系抽取、意圖理解、事件抽取等,其中深度學(xué)習(xí)方法前景較好。

      屬性在知識圖譜中起到的作用是描述實(shí)體,然而,實(shí)體屬性填充面臨著如下的困境:1)由于電力設(shè)備健康管理中的實(shí)體多為電力設(shè)備或器件,而在線監(jiān)測系統(tǒng)會(huì)大量采集其相關(guān)屬性和指標(biāo),如果全部加入知識圖譜中會(huì)導(dǎo)致圖譜規(guī)模過于龐大影響上層應(yīng)用;2)所采集的數(shù)據(jù)具有一定的不完備性,可能存在指標(biāo)缺失的情況,因此,將何種指標(biāo)作為屬性還有待進(jìn)一步研究。

      2.2.3 圖譜完善

      圖譜完善可看作是知識推理的子任務(wù),因此,可使用相同的模型及算法來簡化完善流程以及知識推理過程。常用的方法有基于規(guī)則的推理、基于分布式表示的推理和基于神經(jīng)網(wǎng)絡(luò)的推理[38]。其中,基于分布式表示的推理在應(yīng)對大規(guī)模知識圖譜推理時(shí)表現(xiàn)了良好的伸縮性和效率,能更為有效地推斷出新的知識[48]。而電力設(shè)備在線監(jiān)測數(shù)據(jù)、巡檢數(shù)據(jù)、維修記錄等源源不斷的信息,導(dǎo)致知識圖譜的規(guī)模也會(huì)不斷增大,基于規(guī)則的推理靈活性較低,難以應(yīng)對時(shí)變數(shù)據(jù),泛化力較差。基于神經(jīng)網(wǎng)絡(luò)的推理模型復(fù)雜度高且可解釋性差。因此,在需要進(jìn)行知識的快速推理、明晰故障原因的場景下,知識推理和圖譜完善可選擇基于分布式表示的推理,主要以多關(guān)系嵌入模型(TransE)[49]為主,后續(xù)衍生出了超平面知識圖譜嵌入(TransH)[50]、自適應(yīng)稀疏矩陣圖譜完善(TranSparse)[51]等模型,其思想是將實(shí)體和關(guān)系映射到低維空間向量,利用語義表達(dá)式進(jìn)行推理,充分利用了知識圖譜中的結(jié)構(gòu)信息,方法簡單,適用于大規(guī)模知識圖譜,但基于分布式表示的推理方法在建立推理模型時(shí)沒有考慮先驗(yàn)知識,只考慮滿足知識圖譜中事實(shí)三元組的約束條件,缺乏更深層次的成分信息,限制了推理能力。由于電力設(shè)備運(yùn)行的特殊性,可考慮犧牲計(jì)算時(shí)間,采用基于神經(jīng)網(wǎng)絡(luò)的推理方法以獲得更準(zhǔn)確的結(jié)果。該推理方法依靠深度學(xué)習(xí)模型的自學(xué)習(xí)能力抽取特征,然后利用其記憶推理能力建立實(shí)體關(guān)系預(yù)測模型。

      綜上所述,選取何種方式進(jìn)行知識推理以獲得隱性知識,依賴于具體的應(yīng)用場景。

      2.3 電力設(shè)備健康管理知識圖譜的典型應(yīng)用場景

      目前,知識圖譜在電力領(lǐng)域尚處于起步階段,在電力設(shè)備健康管理的應(yīng)用和落地方面,可參考其他領(lǐng)域應(yīng)用的成功經(jīng)驗(yàn)并結(jié)合行業(yè)特點(diǎn)進(jìn)行分析。文獻(xiàn)[52]指出,知識圖譜可用于電力調(diào)度故障處理、電力巡檢工單處理、電力客服智能問答,未來在智能搜索、智能推薦、智能問答、智能決策等應(yīng)用上也有較好潛力。因此,本節(jié)在現(xiàn)有工作的基礎(chǔ)上,詳細(xì)闡述電力設(shè)備健康管理知識圖譜的應(yīng)用場景,總體如附錄A 圖A1 所示。

      2.3.1 電力設(shè)備知識管理

      電力設(shè)備知識來源于2 個(gè)方面:1)設(shè)備固有特性所組成的知識,如電力變壓器是由銅、鐵、紙等材料組成的復(fù)雜設(shè)備;2)人為經(jīng)驗(yàn)知識,如檢測變壓器套管故障可依據(jù)其測量溫度。前者是設(shè)備固有的屬性和知識,可直接進(jìn)行知識抽取;后者的知識卻是動(dòng)態(tài)變化的,并受限于科技發(fā)展程度、從業(yè)者經(jīng)驗(yàn)等。早期健康管理工作可借助專家經(jīng)驗(yàn)展開,但是隨著電力設(shè)備投運(yùn)數(shù)量的大幅增加,其所蘊(yùn)含的知識也快速增長,這些知識零散地分布在在線監(jiān)測系統(tǒng)、設(shè)備運(yùn)行日志、電力巡檢工單中,僅依靠專家經(jīng)驗(yàn)難以應(yīng)對快速增長的業(yè)務(wù)需求。因此,對這些海量多源異構(gòu)數(shù)據(jù)進(jìn)行處理并提取有用知識,形成電力設(shè)備知識管理系統(tǒng),用于指導(dǎo)健康管理工作將是未來的應(yīng)用場景之一,運(yùn)用知識圖譜可更快捷、高效地抽取和管理知識,為其他需要知識圖譜的場景提供數(shù)據(jù)保證。

      2.3.2 健康管理輔助決策

      設(shè)備健康管理輔助決策包含3 個(gè)階段:問答生成、搜索匹配和決策策略生成及推薦。問答生成面向的是機(jī)對機(jī)和人-機(jī)問答。機(jī)對機(jī)是由故障診斷系統(tǒng)評判后交由知識圖譜進(jìn)行處理,診斷結(jié)果一般比較規(guī)范,便于機(jī)器處理和理解。但人-機(jī)問答則需先理解人為意圖,并將得到的數(shù)據(jù)處理成知識圖譜可計(jì)算的三元組數(shù)據(jù),然后送至知識圖譜進(jìn)行匹配操作,得到歷史類似應(yīng)對方案。例如,文獻(xiàn)[53]就將用戶意圖轉(zhuǎn)化為了訴求子圖并與知識圖譜中的故障描述匹配得到運(yùn)維方案。在進(jìn)行匹配時(shí)往往會(huì)得到多個(gè)結(jié)果,但是選取何種方案需要考慮運(yùn)維方案給電力系統(tǒng)帶來的影響,在此種情況下需要對生成的運(yùn)維方案進(jìn)行評分,并借助專家經(jīng)驗(yàn)綜合評定得到最優(yōu)解。較之于傳統(tǒng)的決策方式,更加全面地考慮了輔助決策會(huì)給電力系統(tǒng)帶來的影響,并且可以為每個(gè)電力設(shè)備制定獨(dú)特的巡檢和運(yùn)維方式。

      2.3.3 數(shù)據(jù)+知識驅(qū)動(dòng)的計(jì)算引擎

      目前,電力行業(yè)正在積極部署數(shù)字化轉(zhuǎn)型戰(zhàn)略,數(shù)據(jù)中臺的建設(shè)就是內(nèi)涵之一,通過有效整合數(shù)據(jù)、發(fā)揮數(shù)據(jù)價(jià)值,可為電力設(shè)備數(shù)字化轉(zhuǎn)型提供良好的數(shù)據(jù)基礎(chǔ)。電力設(shè)備故障預(yù)測與健康管理目前主要分為數(shù)據(jù)驅(qū)動(dòng)、模型驅(qū)動(dòng)及混合方法3 類[2]。在電力數(shù)字化轉(zhuǎn)型的背景下,基于數(shù)據(jù)驅(qū)動(dòng)的電力設(shè)備狀態(tài)評估和健康管理也必將邁上新的臺階。知識驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)策略各有優(yōu)劣,前者過于依靠知識的質(zhì)量、準(zhǔn)則、專家意見以及其他可提供支撐的數(shù)據(jù),后者僅依賴數(shù)據(jù)質(zhì)量[54]。數(shù)據(jù)驅(qū)動(dòng)的方法多基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí),數(shù)據(jù)稀疏性嚴(yán)重制約了該方法在設(shè)備健康管理中的發(fā)展。知識驅(qū)動(dòng)的方法多依賴專家經(jīng)驗(yàn),此類方法具有較強(qiáng)的主觀性,并且需要大量的人為經(jīng)驗(yàn)積累,如何整合存在于其中的知識是個(gè)難點(diǎn)。人類所能理解的知識對計(jì)算機(jī)而言較難計(jì)算和理解,而知識圖譜的出現(xiàn)就很好地解決了這個(gè)問題,它能從多模態(tài)數(shù)據(jù)和多源異構(gòu)數(shù)據(jù)中提取知識,更好地對知識進(jìn)行建模,將其轉(zhuǎn)變?yōu)橛?jì)算機(jī)可計(jì)算的數(shù)據(jù)或者程序。例如,文獻(xiàn)[55]提出了一種基于數(shù)據(jù)和知識聯(lián)合驅(qū)動(dòng)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。單一依靠數(shù)據(jù)驅(qū)動(dòng)或知識驅(qū)動(dòng)具有很大的局限性,數(shù)據(jù)驅(qū)動(dòng)表現(xiàn)為不可解釋性,知識驅(qū)動(dòng)表現(xiàn)為主觀性,二者結(jié)合后在消除不可解釋性帶來的影響的同時(shí)也減少了知識的主觀性。

      2.3.4 自動(dòng)化運(yùn)維問答機(jī)器人

      知識圖譜廣泛應(yīng)用的另一個(gè)場景就是自動(dòng)問答系統(tǒng),旨在利用知識圖譜中的事實(shí)來回答自然語言問題。它使普通用戶能夠通過自然語言方便地訪問大型知識圖譜中有價(jià)值但復(fù)雜的信息,這也是一個(gè)具有挑戰(zhàn)性的問題[56]。自動(dòng)化運(yùn)維問答機(jī)器人屬于知識推理的高階應(yīng)用,對比傳統(tǒng)的巡檢運(yùn)維方式,運(yùn)維人員需查閱大量的操作手冊和處置規(guī)范,自動(dòng)問答機(jī)器人通過理解問答,在知識圖譜中進(jìn)行搜索、推理得到答案,可幫助巡檢運(yùn)維人員快速查找問題,得到故障應(yīng)急處置方案和巡檢方案,明晰故障原因等,達(dá)到隨時(shí)隨地、所問即所得的目標(biāo),在最大程度上提高運(yùn)維的靈活性。隨著智能終端在電力系統(tǒng)中的廣泛應(yīng)用,自動(dòng)問答機(jī)器人可有效與智能設(shè)備集成,形成嵌入運(yùn)管系統(tǒng)中的中間件,而問題答案的質(zhì)量則依賴于所構(gòu)建知識圖譜或者知識庫的質(zhì)量。例如,文獻(xiàn)[57]詳細(xì)總結(jié)了自動(dòng)問答中的關(guān)鍵技術(shù)、評價(jià)標(biāo)準(zhǔn)、潛在挑戰(zhàn)等問題,可為運(yùn)維問答機(jī)器人的構(gòu)建提供參考。

      2.3.5 設(shè)備家族缺陷故障分析

      電力設(shè)備的采購?fù)ǔJ谴笈?、集中采購,往往同一廠商生產(chǎn)的同一批次設(shè)備存在類似的缺陷和故障,不同廠家的產(chǎn)品質(zhì)量也不盡相同。當(dāng)某一電力設(shè)備發(fā)生故障時(shí),就要進(jìn)行設(shè)備家族缺陷跟蹤,對同一批在運(yùn)電力設(shè)備安排巡檢,可有效避免由于家族缺陷帶來的故障,也能為設(shè)備狀態(tài)的多維度和差異化評價(jià)提供支撐,形成電力設(shè)備多維度狀態(tài)評價(jià)的指標(biāo)體系[58]。

      傳統(tǒng)的故障溯源工作涉及的設(shè)備數(shù)量較多,并且設(shè)備數(shù)據(jù)離散地存儲(chǔ)在電力系統(tǒng)中,實(shí)現(xiàn)故障溯源是不小的挑戰(zhàn)。在原有電力設(shè)備家族缺陷分析方法上應(yīng)用知識圖譜、知識推理及圖分析技術(shù),可實(shí)現(xiàn)知識的多跳推理和知識發(fā)現(xiàn),挖掘隱含的實(shí)體關(guān)系對,可為健康管理工作提供新的思路。例如,文獻(xiàn)[59]使用知識圖譜對設(shè)備家族缺陷進(jìn)行分析,構(gòu)建了電力設(shè)備質(zhì)量綜合管理系統(tǒng),可得到設(shè)備疑似家族性缺陷的概率并排序,便于用戶判斷其他相關(guān)設(shè)備發(fā)生潛在缺陷故障的可能性。

      2.3.6 設(shè)備知識智能搜索引擎

      谷歌最初提出知識圖譜的目的是為了構(gòu)建下一代搜索引擎,它可實(shí)現(xiàn)語義搜索,將用戶意圖轉(zhuǎn)變?yōu)橹R圖譜能夠理解的三元組進(jìn)行匹配得到結(jié)果,在語義搜索的基礎(chǔ)上還可以將搜索結(jié)果進(jìn)行可視化展示。在知識圖譜上也可以進(jìn)行關(guān)系搜索,獲得實(shí)體之間的關(guān)系。例如,搜索套管,可能會(huì)得到(套管,屬于,變壓器)、(套管,產(chǎn)生,過熱故障)這樣的三元組事實(shí),便于對結(jié)果的理解。區(qū)別于傳統(tǒng)的搜索方式,基于知識圖譜的搜索引擎能在知識推理的基礎(chǔ)上進(jìn)行多跳搜索,獲得更多的潛在知識。

      隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,投運(yùn)的電力設(shè)備越來越多,積累的設(shè)備運(yùn)維日志、在線監(jiān)測數(shù)據(jù)、行業(yè)標(biāo)準(zhǔn)文件等也呈現(xiàn)上升趨勢,日常設(shè)備健康管理工作都需在這些文件中進(jìn)行搜索獲得想要的答案,而目標(biāo)內(nèi)容通常零散存在于各類文件和系統(tǒng)中,不能僅僅依靠單一文檔制定相應(yīng)的維護(hù)方案,通常是結(jié)合多個(gè)文件使結(jié)果更加精確、全面。而不同的巡檢人員在面對同樣的情況時(shí)可能會(huì)有不同的意見,如何使用較少的描述得到完備的搜索結(jié)果也是需要考慮的問題,知識圖譜的出現(xiàn)就為設(shè)備知識的檢索提供了全新的思路,可將圖譜中相關(guān)聯(lián)知識以及隱藏知識經(jīng)過整合以后反饋給用戶。

      3 電力設(shè)備健康管理對知識圖譜技術(shù)的需求

      3.1 融合促進(jìn)電網(wǎng)一張圖業(yè)務(wù)

      能源互聯(lián)網(wǎng)的技術(shù)內(nèi)涵是運(yùn)用新一代信息通信技術(shù),將電力用戶及其設(shè)備、電網(wǎng)企業(yè)及其設(shè)備、發(fā)電企業(yè)及其設(shè)備、電工裝備企業(yè)及其設(shè)備有機(jī)連接起來,通過信息廣泛交互和充分共享,通過數(shù)字化管理手段大幅提升能源生產(chǎn)、消費(fèi)和相關(guān)領(lǐng)域的安全、質(zhì)量和效率[60]。能源互聯(lián)網(wǎng)的構(gòu)建離不開“電網(wǎng)一張圖”業(yè)務(wù)的推進(jìn),其內(nèi)涵是將電力系統(tǒng)中存在的各個(gè)子系統(tǒng)通過融合方式形成圖拓?fù)浣Y(jié)構(gòu),這也是能源電力系統(tǒng)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的途徑之一。此外,電力系統(tǒng)輸、變、配環(huán)節(jié)連通的各類電力設(shè)備天然形成了物理拓?fù)浣Y(jié)構(gòu),也為電網(wǎng)一張圖的構(gòu)建提供了支撐。目前,電網(wǎng)一張圖的構(gòu)建還處于初步階段,受限于數(shù)據(jù)及構(gòu)建方法,一定時(shí)間內(nèi)建立完整大規(guī)模的圖結(jié)構(gòu)還較為困難,可在單獨(dú)的領(lǐng)域開展先試工作,再將各個(gè)分散的圖進(jìn)行融合。

      電力設(shè)備健康管理知識圖譜在數(shù)據(jù)的計(jì)算和存儲(chǔ)上與電網(wǎng)一張圖所使用的技術(shù)路線基本一致,都需要將數(shù)據(jù)存放在圖數(shù)據(jù)庫,這就確保了數(shù)據(jù)來源的一致性。知識圖譜本質(zhì)是由實(shí)體和關(guān)系構(gòu)成的圖結(jié)構(gòu),在空間結(jié)構(gòu)上與電網(wǎng)一張圖相同,從可計(jì)算性上保證了一致性。例如,文獻(xiàn)[61]就提出一種電力圖計(jì)算平臺用于取代傳統(tǒng)關(guān)系型數(shù)據(jù)庫的計(jì)算方法,展示了圖計(jì)算在電力系統(tǒng)中應(yīng)用的可行性。

      建立電力設(shè)備健康管理知識圖譜可有效感知電力設(shè)備運(yùn)行質(zhì)量,而該過程需要解決數(shù)據(jù)-知識融合問題。長期以來,大數(shù)據(jù)融合主要集中在多源數(shù)據(jù)的統(tǒng)一訪問上,缺乏對知識的理解,數(shù)據(jù)結(jié)構(gòu)松散,沒有解釋數(shù)據(jù)背后的含義。因此,數(shù)據(jù)融合應(yīng)與知識理解并行,盡可能形成機(jī)理模型,發(fā)現(xiàn)數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系[62]。

      因此,健康管理知識圖譜可視作電網(wǎng)一張圖的一部分,知識圖譜完成知識計(jì)算后再融入電網(wǎng)一張圖中,通過打通數(shù)據(jù)壁壘,從設(shè)備健康管理環(huán)節(jié),延伸至輸、變、配環(huán)節(jié),最終延伸至整個(gè)能源互聯(lián)網(wǎng)領(lǐng)域,實(shí)現(xiàn)多圖譜融合計(jì)算,如附錄A 圖A2 所示,其中,附錄A 圖A2 左側(cè)部分是本文在已有數(shù)據(jù)的基礎(chǔ)上構(gòu)建的一個(gè)電力設(shè)備健康管理知識圖譜(示例)。本文給出一個(gè)變壓器運(yùn)維知識圖譜,見本文支撐數(shù)據(jù),供感興趣的讀者參考閱讀。附錄B 表B1 與B2 為變壓器實(shí)體信息及實(shí)體關(guān)系三元組舉例。

      3.2 全生命周期健康管理的多知識圖譜融合

      一般情況下,為了契合各業(yè)務(wù)場景的需要,構(gòu)建圖譜時(shí)會(huì)為每個(gè)業(yè)務(wù)方單獨(dú)開發(fā)知識圖譜,方便與業(yè)務(wù)方共同管理數(shù)據(jù)。然而,隨著業(yè)務(wù)及管理層級的深入,就會(huì)發(fā)現(xiàn)單個(gè)業(yè)務(wù)知識圖譜因?yàn)橐?guī)模較小,在文本語義理解類任務(wù)上非常受限,此時(shí)就需要將多個(gè)知識圖譜進(jìn)行融合,打通知識邊界。例如,針對某電力設(shè)備可以構(gòu)建其知識圖譜,針對電力設(shè)備的某類故障也可以構(gòu)建其知識圖譜。由于不同的知識圖譜信息來源不同,其知識描述體系也是不同的,多知識圖譜融合不是簡單地把知識圖譜合并,而是要發(fā)現(xiàn)圖譜中的等價(jià)實(shí)例,如何對知識圖譜進(jìn)行融合表示,對于建立統(tǒng)一的大規(guī)模知識圖譜意義重大[63]。知識圖譜融合涉及多種技術(shù),這里就不展開介紹,讀者可參閱文獻(xiàn)[64]。

      多知識圖譜融合后的電力設(shè)備健康管理,在知識表示上會(huì)更為豐富,在事實(shí)呈現(xiàn)上會(huì)更加精確,在跨度上囊括了設(shè)備出廠、投運(yùn)、檢修、報(bào)廢等環(huán)節(jié)的知識,對上層應(yīng)用的支撐效果更好,進(jìn)行知識推理能獲得更多潛在知識,明晰數(shù)據(jù)之間的聯(lián)系,為健康管理工作提供新的思路,讓傳統(tǒng)的運(yùn)維巡檢方式由感知變?yōu)檎J(rèn)知。

      3.3 促進(jìn)健康管理數(shù)字化轉(zhuǎn)型

      電力系統(tǒng)數(shù)字化轉(zhuǎn)型方興未艾,傳感技術(shù)、通信技術(shù)、智能電力裝備以及電力系統(tǒng)集成化、智能化技術(shù)快速發(fā)展,為電網(wǎng)可觀性、可控性以及智能化的提升帶來巨大機(jī)遇[65]。電力設(shè)備健康管理作為電力系統(tǒng)中的關(guān)鍵一環(huán),保障著設(shè)備安全和用電安全,在能源轉(zhuǎn)型與碳中和背景下,借助知識圖譜技術(shù)促進(jìn)健康管理數(shù)字化轉(zhuǎn)型迫在眉睫。

      “數(shù)據(jù)先行”是數(shù)字化轉(zhuǎn)型過程中的基礎(chǔ)工作,通過挖掘企業(yè)積累的數(shù)據(jù)中的價(jià)值,有助于改變傳統(tǒng)業(yè)務(wù)架構(gòu)。例如,文獻(xiàn)[66]將數(shù)字化轉(zhuǎn)型的共性歸結(jié)為技術(shù)、價(jià)值、結(jié)構(gòu)和財(cái)務(wù)方面的變化。電力設(shè)備健康管理數(shù)字化轉(zhuǎn)型中,同樣需要引入新的技術(shù),一方面是新型傳感技術(shù)和在線監(jiān)測技術(shù)的更新迭代,另一方面則是更為有效的數(shù)據(jù)管理方法、電力設(shè)備狀態(tài)評估算法、更加智能的設(shè)備健康管理方案推薦算法。知識圖譜技術(shù)的引入可滿足數(shù)據(jù)知識管理的需求,而基于知識圖譜的推薦算法也能較好地契合智能運(yùn)維的推薦場景,將基于經(jīng)驗(yàn)的運(yùn)維方式轉(zhuǎn)變?yōu)橹R導(dǎo)向的運(yùn)維,提前發(fā)現(xiàn)設(shè)備存在的運(yùn)行風(fēng)險(xiǎn),將事后維修轉(zhuǎn)變?yōu)轭A(yù)防性維修,在評估結(jié)構(gòu)上改變了傳統(tǒng)模式,加入知識的解釋之后更能闡釋數(shù)據(jù)和故障的因果關(guān)系,做到定點(diǎn)、定向精準(zhǔn)運(yùn)維服務(wù)。從2020 年發(fā)布的《中國知識圖譜應(yīng)用趨勢報(bào)告》[67]來看,能源電力領(lǐng)域作為勞動(dòng)密集型企業(yè),吸收了大量的勞動(dòng)資源,業(yè)務(wù)復(fù)雜,面臨著知識難以積累、人員培訓(xùn)難度大等痛點(diǎn),在數(shù)字化轉(zhuǎn)型過程中需要加快推進(jìn)領(lǐng)域知識庫的建立。利用知識圖譜,可打通底層數(shù)據(jù),將數(shù)據(jù)形成知識,整合行業(yè)知識形成知識中臺,賦能上層應(yīng)用。

      4 對未來發(fā)展的展望

      4.1 知識圖譜賦能智能運(yùn)維

      電力設(shè)備智能運(yùn)維強(qiáng)調(diào)2 個(gè)方面:一是設(shè)備具有智能性,二是對設(shè)備的運(yùn)維管理方案具有智能性。設(shè)備的智能性是指基于對自身的智能感知、狀態(tài)分析與健康管理而具備自主思維,可通過在電力設(shè)備本體(或邊緣側(cè))配置嵌入式傳感器與人工智能模塊,完成本體信息采集、就近計(jì)算與信息交互,使電力設(shè)備本身具備“智慧”功能[68]。運(yùn)維管理方案的智能性體現(xiàn)在系統(tǒng)能夠根據(jù)當(dāng)前設(shè)備運(yùn)行的狀態(tài)、風(fēng)險(xiǎn)給出最佳的巡檢方案,將設(shè)備風(fēng)險(xiǎn)降到最低。由于故障的發(fā)生具有不確定性,定期巡檢仍難以應(yīng)對突發(fā)情況,智能運(yùn)維就需要增加靈活性來應(yīng)對電力設(shè)備故障的不確定性。傳感設(shè)備的大量投入緩解了數(shù)據(jù)瓶頸問題,但是運(yùn)維方案的生成、故障的推理溯源卻是當(dāng)前電力設(shè)備健康管理有待深入的問題,知識圖譜技術(shù)的出現(xiàn)可有效解決智能運(yùn)維方案生成及故障推理溯源。

      開放領(lǐng)域中知識圖譜技術(shù)最為廣泛的應(yīng)用場景就是推薦系統(tǒng),通過對知識圖譜中的節(jié)點(diǎn)進(jìn)行聚類和分布式表示,以獲得特征;對原有節(jié)點(diǎn)和新增節(jié)點(diǎn)進(jìn)行分類,實(shí)現(xiàn)個(gè)性化推薦。同理,在電力設(shè)備健康管理知識圖譜中也可實(shí)現(xiàn)對故障的分類和個(gè)性化運(yùn)維方案推薦。通過設(shè)備運(yùn)維日志、巡檢手冊、行業(yè)標(biāo)準(zhǔn)等電力文本語料所構(gòu)建的電力設(shè)備健康管理知識圖譜,涵蓋了電力設(shè)備歷史故障信息以及應(yīng)急處理方案、運(yùn)檢方案等,為電力設(shè)備個(gè)性化運(yùn)維提供了數(shù)據(jù)上的支撐。近年來,隨著圖神經(jīng)網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)、深度學(xué)習(xí)在知識圖譜實(shí)體分類、關(guān)系預(yù)測等任務(wù)中的應(yīng)用,也為研究者提供了對于非歐氏空間數(shù)據(jù)處理的思路,為智能運(yùn)維方案推薦提供了模型及算法上的保障。

      4.2 多學(xué)科交叉融合研究的新范式

      電力設(shè)備健康管理知識圖譜的構(gòu)建是多學(xué)科融合的典型場景,不僅需要利用計(jì)算機(jī)技術(shù)從復(fù)雜的電力文本、語料中挖掘?qū)嶓w、關(guān)系、本體等構(gòu)建知識圖譜所需的關(guān)鍵成分,更需要電力系統(tǒng)良好的先驗(yàn)知識作為支撐。優(yōu)質(zhì)的數(shù)據(jù)和使用方法決定了圖譜質(zhì)量的下限,而對電力設(shè)備的深入理解則決定了知識圖譜質(zhì)量的上限。對本體層和數(shù)據(jù)層定義的不一致最終也會(huì)導(dǎo)致所構(gòu)建的知識圖譜有本源差別。所以,對計(jì)算機(jī)知識和電力系統(tǒng)知識的充分了解可使得構(gòu)建的知識圖譜具有良好的魯棒性。

      電力設(shè)備健康管理需要加強(qiáng)故障診斷方法、狀態(tài)評估方法、故障機(jī)理、圖譜構(gòu)建方法、推理算法等的研究。完備的故障機(jī)理模型能夠有效刻畫現(xiàn)實(shí)物理模型,從設(shè)備機(jī)理出發(fā),研究新型傳感器獲得能表征設(shè)備運(yùn)行狀態(tài)的關(guān)鍵數(shù)據(jù),為故障診斷方法、評估方法提供理論上的支撐,這就需要電力系統(tǒng)從業(yè)人員加深對電力設(shè)備全生命周期的理解。為應(yīng)對電力數(shù)據(jù)分布不均的問題,使用小樣本學(xué)習(xí)、生成對抗網(wǎng)絡(luò)等方法在現(xiàn)有數(shù)據(jù)上學(xué)習(xí)獲得特征或者直接進(jìn)行數(shù)據(jù)擴(kuò)充,為知識圖譜的構(gòu)建提供方法上的保障也是研究的重點(diǎn)。

      因此,在構(gòu)建電力設(shè)備健康管理知識圖譜的過程中,不同學(xué)科之間相互獨(dú)立,卻又互相聯(lián)系,電力學(xué)科和計(jì)算機(jī)學(xué)科表現(xiàn)最為明顯,而針對特定電力設(shè)備的一些部件,如變壓器絕緣紙、GIS 絕緣氣體等,甚至還需要材料學(xué)的介入。在能源電力系統(tǒng)轉(zhuǎn)型的背景下,需要各個(gè)學(xué)科深入研究各領(lǐng)域中存在的難點(diǎn)和痛點(diǎn)問題,最終形成多學(xué)科交叉融合研究的新范式。

      4.3 電力人工智能的可解釋性

      當(dāng)前人工智能分為符號主義、連接主義、行為主義三大流派。符號主義的代表是知識圖譜和專家系統(tǒng),連接主義的代表是深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò),行為主義的代表是強(qiáng)化學(xué)習(xí)和機(jī)器人。符號主義擁有良好的解釋性,而連接主義預(yù)測精度高但缺乏可解釋性,行為主義不需要標(biāo)注樣本,可在復(fù)雜的環(huán)境中自行學(xué)習(xí)樣本特征。在智能電網(wǎng)階段,基于連接主義的人工智能方法在電力設(shè)備故障診斷、狀態(tài)評估中獲得了重要的應(yīng)用,卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)在各類電力設(shè)備故障診斷、故障預(yù)測、故障樣本生成任務(wù)中取得了優(yōu)異的表現(xiàn),為健康管理工作提供了良好的算法模型支持。端到端的深度學(xué)習(xí)故障診斷和狀態(tài)評估算法,接受大樣本作為訓(xùn)練輸入,所獲得的模型本質(zhì)上是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù),而預(yù)測的過程則是參數(shù)計(jì)算的過程,計(jì)算和預(yù)測的過程不是透明的,過程缺乏可解釋性。深度學(xué)習(xí)模型實(shí)質(zhì)為黑箱模型,學(xué)習(xí)器對輸入輸出的映射往往不具可解釋性,因而對電力系統(tǒng)生產(chǎn)實(shí)踐的指導(dǎo)效果有限[69]。而根據(jù)深度學(xué)習(xí)模型得到的結(jié)果在參與電力設(shè)備健康管理輔助決策時(shí)通常是缺乏證據(jù)支撐的,且不能給出合理的解釋[70],導(dǎo)致電力系統(tǒng)從業(yè)人員對機(jī)器產(chǎn)生的結(jié)果無法全部相信,還需借助專家經(jīng)驗(yàn)。因此,需要加強(qiáng)對電力人工智能可解釋性的研究,增強(qiáng)其可信度和可解釋性。

      知識圖譜技術(shù)的出現(xiàn)打破了上述僵局,知識圖譜的可解釋性在于它是一種語義網(wǎng)絡(luò)結(jié)構(gòu),包含了豐富的實(shí)體、關(guān)系、屬性、概念等信息,更符合人類邏輯思維,這便使得解釋成為可能。2017 年,國務(wù)院印發(fā)了關(guān)于新一代人工智能發(fā)展規(guī)劃的通知,將關(guān)聯(lián)理解與知識挖掘、知識圖譜構(gòu)建與學(xué)習(xí)、知識演化與推理等技術(shù)作為新一代人工智能關(guān)鍵共性技術(shù)體系的重點(diǎn)突破領(lǐng)域。而知識圖譜所帶來的解釋性可分為2 個(gè)方面:1)在所構(gòu)建的知識圖譜中應(yīng)用知識推理技術(shù),可獲得故障原因并按需生成可解釋的運(yùn)維方案;2)與深度學(xué)習(xí)相融合,將深度學(xué)習(xí)診斷的結(jié)果轉(zhuǎn)化為知識圖譜可以理解的三元組進(jìn)行推理,理解數(shù)據(jù)驅(qū)動(dòng)方法的黑箱模型。

      因此,雖然針對知識圖譜本身的研究正在逐步展開,但是對于知識圖譜與深度學(xué)習(xí)融合的可解釋性研究目前尚處在探索階段。這也是“人工智能2.0”時(shí)代最大的瓶頸問題——可解釋性,這是因?yàn)楝F(xiàn)有人工智能過于依賴訓(xùn)練數(shù)據(jù),缺乏深層次數(shù)據(jù)語義挖掘,導(dǎo)致可解釋性差。未來的弱人工智能、可解釋性和可理解性人工智能、強(qiáng)人工智能等在理論研究方面仍將任重道遠(yuǎn)[71]。這同樣是今后研究中需要通過知識圖譜增強(qiáng)電力人工智能可解釋性的重點(diǎn)之一。

      5 結(jié)語

      由于知識圖譜技術(shù)具有良好的結(jié)構(gòu)化知識表示方式和推理能力,近幾年得到快速發(fā)展,并開始逐漸被引入電力系統(tǒng)調(diào)度、電網(wǎng)故障診斷、電力問答等領(lǐng)域,而在電力設(shè)備健康管理中還鮮有研究。在對電力設(shè)備進(jìn)行狀態(tài)評估、故障診斷、故障預(yù)測時(shí),可在歷史運(yùn)維日志數(shù)據(jù)的基礎(chǔ)上,構(gòu)建電力設(shè)備健康管理知識圖譜,可有效進(jìn)行知識管理,并進(jìn)一步采用數(shù)據(jù)+知識聯(lián)合驅(qū)動(dòng)的方法形成上層應(yīng)用,可對數(shù)據(jù)驅(qū)動(dòng)的黑箱模型進(jìn)行解釋,為輔助決策提供證據(jù)支撐,有助于理解電力設(shè)備故障機(jī)理,達(dá)到精準(zhǔn)運(yùn)維的目標(biāo)。而在“電網(wǎng)一張圖”、數(shù)字化轉(zhuǎn)型等背景下,知識圖譜的出現(xiàn)更是為“電力設(shè)備一張圖”提供了良好的支撐。

      隨著知識圖譜在電力設(shè)備健康管理工作中研究的深入,相信在未來會(huì)形成以知識為主體的“電力設(shè)備健康管理大腦”,賦予設(shè)備自我感知、自我認(rèn)知的能力,更好地與業(yè)務(wù)場景相融合,最終提升電力設(shè)備健康管理的水平。

      支撐數(shù)據(jù)和附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。

      猜你喜歡
      電力設(shè)備圖譜運(yùn)維
      繪一張成長圖譜
      加強(qiáng)電力設(shè)備運(yùn)維云平臺安全性管理
      運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
      風(fēng)電運(yùn)維困局
      能源(2018年8期)2018-09-21 07:57:24
      雜亂無章的光伏運(yùn)維 百億市場如何成長
      能源(2017年11期)2017-12-13 08:12:25
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      電力設(shè)備運(yùn)維管理及安全運(yùn)行探析
      主動(dòng)對接你思維的知識圖譜
      基于ITIL的運(yùn)維管理創(chuàng)新實(shí)踐淺析
      基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
      云林县| 深水埗区| 霞浦县| 施秉县| 沙河市| 延川县| 金沙县| 紫金县| 鹿泉市| 叶城县| 四子王旗| 吉安县| 永安市| 繁峙县| 淮安市| 阳朔县| 星座| 灯塔市| 宜春市| 深泽县| 黔西县| 墨竹工卡县| 麦盖提县| 久治县| 申扎县| 吉木萨尔县| 泗水县| 东光县| 松桃| 虞城县| 理塘县| 鹿泉市| 邵阳市| 榆中县| 广丰县| 无极县| 汨罗市| 远安县| 濮阳市| 宜都市| 米泉市|