林冠強(qiáng) 李惠松
[摘? ? 要]面向越來越復(fù)雜的電網(wǎng)領(lǐng)域,采用智能化技術(shù)構(gòu)建了新型電網(wǎng)知識(shí)圖譜(Knowledge Graph—KG),結(jié)合大數(shù)據(jù)和云計(jì)算的多元化服務(wù)需求,分析知識(shí)圖譜在電網(wǎng)中的應(yīng)用。針對(duì)知識(shí)圖譜共建、共享需求,設(shè)計(jì)出知識(shí)圖譜框架與本體庫,提出切實(shí)的知識(shí)識(shí)別與關(guān)系抽取的實(shí)用化方法,為大規(guī)模知識(shí)圖譜構(gòu)建提供實(shí)用化技術(shù)支持,改善電網(wǎng)業(yè)務(wù)文件數(shù)字化自動(dòng)提取水平和電網(wǎng)知識(shí)檢索技術(shù),降低專業(yè)要求,同時(shí)提升電網(wǎng)知識(shí)圖譜構(gòu)建效率。
[關(guān)鍵詞]電網(wǎng)領(lǐng)域;智能化技術(shù);知識(shí)圖譜;知識(shí)識(shí)別;關(guān)系抽取
[中圖分類號(hào)]TP18 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]2095–6487(2021)04–00–02
Construction and Application of Power Grid Knowledge Graph
Lin Guan-qiang,Li Hui-song
[Abstract]Facing the increasingly complex power grid field, intelligent technology is adopted to construct a new power grid knowledge graph (KG—Knowledge Graph), combining the diversified service requirements of big data and cloud computing, and analyzing the application of knowledge graph in the power grid. In response to the requirements of co-construction and sharing of knowledge graphs, a knowledge graph framework and ontology library are designed, and practical methods of knowledge identification and relationship extraction are proposed, which provide practical technical support for large-scale knowledge graph construction. Improve the digital automatic extraction level of power grid business documents and power grid knowledge retrieval technology, reduce professional requirements, and improve the efficiency of power grid knowledge map construction.
[Keywords]power grid field; intelligent technology; knowledge graph; knowledge recognition; relation extraction
2012年,為了進(jìn)一步改善網(wǎng)絡(luò)搜索的質(zhì)量與速度,美國(guó)Google公司首次提出了知識(shí)圖譜(Knowledge Graph—KG)這一說法,其中涉及三個(gè)方面:實(shí)體、屬性和關(guān)系。實(shí)體通常為客觀存在的事物,屬性通常用來表達(dá)事物的特征,關(guān)系通常用來實(shí)現(xiàn)實(shí)體之間或者實(shí)體與屬性之間的互聯(lián)。實(shí)際上,KG為語義網(wǎng)絡(luò),KG中前兩個(gè)方面對(duì)應(yīng)語義網(wǎng)絡(luò)的節(jié)點(diǎn),而后一個(gè)方面對(duì)應(yīng)語義網(wǎng)絡(luò)的邊。針對(duì)各種數(shù)據(jù)形式,KG構(gòu)建方法為:抽取,融合,表示,驗(yàn)證與推理(圖1)。數(shù)據(jù)來源有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),抽取方法有三類,屬性抽取、關(guān)系抽取和實(shí)體抽取。依據(jù)不同的領(lǐng)域,KG主要分為兩大類:通用領(lǐng)域和專業(yè)領(lǐng)域。前者涵蓋面廣,包含的信息量豐富,然而專業(yè)性不高;后者具有一定的針對(duì)性,從而實(shí)現(xiàn)數(shù)據(jù)的深度挖掘。
隨著電網(wǎng)的不斷發(fā)展和完善,產(chǎn)生了大量的電網(wǎng)數(shù)據(jù),通過利用這些數(shù)據(jù),有利于提高電網(wǎng)的智能化水平。目前,電網(wǎng)提出能源物聯(lián)網(wǎng)的概念,關(guān)鍵是建立滿足電網(wǎng)需要的智能化電力知識(shí)平臺(tái)。本文基于知識(shí)圖譜技術(shù),結(jié)合KG技術(shù)和電網(wǎng)知識(shí),形成電網(wǎng)專業(yè)KG,抽取電網(wǎng)裝置的運(yùn)行信息、管理數(shù)據(jù)和文獻(xiàn)信息等數(shù)據(jù),構(gòu)建電網(wǎng)KG。把電網(wǎng)中各方面的知識(shí)進(jìn)行深度的融合,智能挖掘電網(wǎng)中的有用信息,引導(dǎo)和拓展新的電網(wǎng)發(fā)展方向。
1 電網(wǎng)KG構(gòu)建
由于電網(wǎng)沒有建立統(tǒng)一的知識(shí)平臺(tái),甚至每個(gè)部門設(shè)置了不同的信息庫,使得電網(wǎng)生產(chǎn)、運(yùn)行和服務(wù)等各個(gè)環(huán)節(jié)均形成了大量的信息,例如,電流、電壓和頻率的變化,開關(guān)狀態(tài)的改變,電表信息。電網(wǎng)信息化的持續(xù)發(fā)展,產(chǎn)生的電網(wǎng)數(shù)據(jù)量越來越多,所需時(shí)間越來越短。然而,這些數(shù)據(jù)輸出沒有統(tǒng)一的格式,不僅含有結(jié)構(gòu)化數(shù)據(jù),也存在各類非結(jié)構(gòu)化數(shù)據(jù),包括文本、音視頻。KG中針對(duì)多源數(shù)據(jù)來說,結(jié)構(gòu)化數(shù)據(jù)通常能夠直接進(jìn)行知識(shí)融合;半結(jié)構(gòu)化數(shù)據(jù)需要采用篩選的辦法,消除干擾數(shù)據(jù),進(jìn)行知識(shí)抽取,從而規(guī)范數(shù)據(jù),形成結(jié)構(gòu)化數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)通常為文本信息,知識(shí)抽取過程比較復(fù)雜,包括實(shí)體識(shí)別、屬性抽取和關(guān)系抽取三個(gè)方面。
電網(wǎng)KG構(gòu)建,能夠把電網(wǎng)各種數(shù)據(jù)重新進(jìn)行整合,從而方便數(shù)據(jù)的管理與查找,形成真正意義的電網(wǎng)智能化。為了構(gòu)建電網(wǎng)KG,首先需要全面獲取電網(wǎng)術(shù)語,通過這些術(shù)語形成電網(wǎng)專業(yè)KG基礎(chǔ)。術(shù)語抽取采用形式化方法,根據(jù)電力相關(guān)的置信度,分析該術(shù)語的可靠性。然而,如果該術(shù)語使用的概率比較小,會(huì)降低術(shù)語的重要性,增加該術(shù)語的統(tǒng)計(jì)難度。進(jìn)一步設(shè)置電網(wǎng)專業(yè)詞典,有利于理解相關(guān)專業(yè)術(shù)語,增進(jìn)電網(wǎng)知識(shí)學(xué)習(xí),促進(jìn)電網(wǎng)發(fā)展,如圖2所示。
通過電網(wǎng)專業(yè)詞典能夠查找相關(guān)信息,有助于理解這些專業(yè)術(shù)語,降低KG的構(gòu)建難度。這些術(shù)語來源包括論文數(shù)據(jù)、百科數(shù)據(jù)和其他數(shù)據(jù),然后初步構(gòu)建術(shù)語語義圖,依據(jù)置信度進(jìn)行排序,基于語義相似度的詞條進(jìn)行匹配,最后基于隸屬度的定義抽取。電網(wǎng)專業(yè)詞典是KG基本數(shù)據(jù),對(duì)于詞典中數(shù)據(jù)的量和質(zhì)要求非常高,量不足使得覆蓋面不廣,質(zhì)不高使得定義不準(zhǔn)確,均難以達(dá)到實(shí)際效果。然而,整個(gè)電網(wǎng)存在的設(shè)備儀器眾多,專業(yè)術(shù)語龐雜,同一設(shè)備可能存在多個(gè)定義名稱,提高了專業(yè)詞典的抽取難度。因此,專業(yè)詞典確定過程中,需要進(jìn)行人工確認(rèn),進(jìn)一步限制了詞典中數(shù)據(jù)的量和質(zhì)。目前,隨著電力物聯(lián)網(wǎng)的建設(shè),采用大數(shù)據(jù)和云計(jì)算等先進(jìn)技術(shù),以及人工智能的普及,使得電網(wǎng)KG的構(gòu)建成為可能,基本涵蓋了電網(wǎng)的各個(gè)領(lǐng)域,包括變壓器本體、輸電線路、配電物聯(lián)網(wǎng)、柔性交流系統(tǒng)、網(wǎng)絡(luò)控制、信息安全等。
2 電網(wǎng)KG應(yīng)用分析
近些年,電網(wǎng)得到大力發(fā)展,信息化普及程度較高,積累了大量運(yùn)行數(shù)據(jù),具有非常高的資源與需求價(jià)值,為電網(wǎng)KG的構(gòu)建提供了前提條件。電網(wǎng)KG的應(yīng)用領(lǐng)域涉及多個(gè)學(xué)科,主要分為應(yīng)用層和感知層,應(yīng)用層分為配電物聯(lián)網(wǎng)和新一代智能電表,配電物聯(lián)網(wǎng)的應(yīng)用組件分為停電管理、電能質(zhì)量監(jiān)測(cè)和自動(dòng)無功補(bǔ)償,其中停電管理含有網(wǎng)絡(luò)發(fā)令和一體化電網(wǎng)平臺(tái);電能質(zhì)量監(jiān)測(cè)含有電能監(jiān)控和電力參數(shù)測(cè)量;自動(dòng)無功補(bǔ)償含有環(huán)網(wǎng)接線和配電網(wǎng)無功補(bǔ)償系統(tǒng)。新一代智能電表支撐技術(shù)分為即插即用、邊緣計(jì)算和非介入式電荷分解,其中即插即用含有實(shí)時(shí)性測(cè)試和模塊化測(cè)試;邊緣計(jì)算含有流數(shù)據(jù)處理和計(jì)算遷移;非介入式電荷分解含有數(shù)據(jù)處理、事件檢測(cè)、特征提取和負(fù)荷識(shí)別。感知層可以分為智能終端和能源路由器,智能終端的支撐技術(shù)分為輸電類終端和配電類終端,前者主要為交換機(jī),后者主要為網(wǎng)絡(luò)設(shè)備;能源路由器的支撐技術(shù)為路由器,包括交換機(jī)設(shè)備、背板總線、信息外網(wǎng)和局域網(wǎng)交換機(jī)。
通過這些學(xué)科的知識(shí)挖掘發(fā)現(xiàn),未來電網(wǎng)發(fā)展的熱點(diǎn)領(lǐng)域有人工智能、網(wǎng)絡(luò)安全、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈和芯片,因此,該KG的建立,能夠有效指導(dǎo)電網(wǎng)的發(fā)展。電網(wǎng)專業(yè)詞典和KG的構(gòu)建,以及和現(xiàn)代科技的強(qiáng)力結(jié)合,給電網(wǎng)研究指明了方向。這種智能化信息化方式,極大提高了電網(wǎng)的運(yùn)維水平和管理效率,節(jié)約了大量的人力物力和財(cái)力成本,使得電網(wǎng)決策更加科學(xué)合理。未來電網(wǎng)在配電物聯(lián)網(wǎng)、新一代智能電表、輸電物聯(lián)網(wǎng)、電力金融、負(fù)荷分解、電能質(zhì)量監(jiān)測(cè)、線路監(jiān)測(cè)、配電終端、電能計(jì)量、停電管理和用電安全等方面,將更多地融合可視化、虛擬現(xiàn)實(shí)、語音識(shí)別、安全性和隱私、機(jī)器人、推薦系統(tǒng)、自然語言處理、多媒體、機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)、信息檢索、人機(jī)交互、數(shù)據(jù)庫、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和人工智能等技術(shù)。
采用人工智能技術(shù),形成電網(wǎng)KG,結(jié)合電網(wǎng)的應(yīng)用領(lǐng)域與人工智能的應(yīng)用領(lǐng)域進(jìn)行分析,深入數(shù)據(jù)挖掘,得到以往的數(shù)據(jù)研究情況,判斷以后的研究方向。目前采用的技術(shù)有:循環(huán)神經(jīng)網(wǎng)絡(luò)技術(shù)、交叉創(chuàng)新笛卡爾智能分析技術(shù)和長(zhǎng)短期記憶網(wǎng)絡(luò)技術(shù)等。依照數(shù)據(jù)采集數(shù)量,建立某個(gè)領(lǐng)域的研究模型。
3 結(jié)束語
電網(wǎng)KG的構(gòu)建和應(yīng)用,有利于解決電網(wǎng)專業(yè)知識(shí)碎片化的問題,聚焦現(xiàn)代智能技術(shù),從各類數(shù)據(jù)庫出發(fā),開展電網(wǎng)KG構(gòu)建,研發(fā)云數(shù)據(jù)中心KG管理平臺(tái)。在此基礎(chǔ)上,開發(fā)基于知識(shí)圖譜智能分析模塊,為電網(wǎng)建立大規(guī)模、共享型的KG資源,提供知識(shí)計(jì)算服務(wù),從而充分發(fā)揮大數(shù)據(jù)和KG的價(jià)值。
參考文獻(xiàn)
[1] 俞陽.基于知識(shí)圖譜的電力知識(shí)平臺(tái)關(guān)鍵技術(shù)研究[D].南京:東南大學(xué),2018.
[2] BIZER C,LEHMANN J,KOBILAROV G,et al.DBpedia-a crystallization point for the web of data[J].Web Semantics:Science,Services and Agents on the World Wide Web,2019,7(3):154-165.
[3] 郭云峰,韓龍,皮立華,等.知識(shí)圖譜在大數(shù)據(jù)中的應(yīng)用[J].電信技術(shù),2015,1(6):25-29.
[4] WANG J Z,DU Z,PAYATTAKOOL R,et al.A new method to measure the semantic similarity of GO terms[J].Bioinformatics,2017,23(10):1274-1281.
[5] 傅質(zhì)馨,李瀟逸,袁越.泛在電力物聯(lián)網(wǎng)關(guān)鍵技術(shù)探討[J].電力建設(shè),2019,40(5):5-16.
[6] ZHAO L,ZHANG Q.Mapping knowledge domains of Chinese digital library research output,2014–2019[J].Scientometrics,2020,9(1):51-87.
[7] 蔣瑋,周穎,陳舒淇,等.電網(wǎng)基建工程數(shù)據(jù)挖掘及知識(shí)圖譜構(gòu)建技術(shù)研究[J].電力信息與通信技術(shù),2021,19(2):15-22.
[8] 武斌,張賓,周晶,孫博,等.知識(shí)圖譜在電力領(lǐng)域的應(yīng)用與思考[J].科技經(jīng)濟(jì)導(dǎo)刊,2020,28(16):33.