李卓 顏少偉 符樹雄 余加喜 黎值源
摘 要:針對傳統(tǒng)搜索引擎在電力專業(yè)領(lǐng)域中對查詢條件搜索耗時較長的問題,開展對電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)研究。通過基于自然語言處理的電力調(diào)控語言處理和智能搜索引擎推理控制策略,設(shè)計一種基于自然語言處理的電力調(diào)控智能搜索引擎。通過實驗證明,該引擎與傳統(tǒng)引擎相比可有效縮短搜索耗時,進(jìn)一步提高搜索引擎的效率。
關(guān)鍵詞:自然語言處理;電力調(diào)控;智能搜索引擎;關(guān)鍵技術(shù)
中圖分類號:TP391.3 文獻(xiàn)標(biāo)識碼:A 文章編號:1001-5922(2021)05-0085-03
Research on Key Technologies of Power Control Intelligent Search Engine Based on Natural Language Processing
Li Zhuo,Yan Shaowei,F(xiàn)u Shuxiong,Yu Jiaxi,Li Zhiyuan
(Power Dispatching Control Center of Hainan Power Grid Co., Ltd., Haikou 570000, China)
Abstract:Aiming at the problem that traditional search engines take a long time to search for query conditions in the field of electric power, the research on key technologies of electric search and control intelligent search engines is conducted. Through the power control language processing based on natural language processing and intelligent search engine reasoning control strategy, a power control intelligent search engine based on natural language processing is designed. Experiments have proved that this engine can effectively reduce the search time and improve the efficiency of search engines compared with traditional engines.
Key words:natural language processing; power control; intelligent search engine; key technologies;
0 引言
現(xiàn)代化科技的快速發(fā)展促進(jìn)著搜索引擎技術(shù)的不斷進(jìn)步,針對各種問題類型的搜索引擎層出不窮,但目前針對電力企業(yè)中的相關(guān)專業(yè)性質(zhì)更強的搜索引擎較少,造成了電力知識的利用率被嚴(yán)重制約。目前傳統(tǒng)搜索引擎的構(gòu)成主要包括上位機中的人機交互界面、全球廣域網(wǎng)服務(wù)器以及網(wǎng)絡(luò)瀏覽器[1]。當(dāng)用戶在人機交互界面中,通過瀏覽器輸入相應(yīng)的檢索內(nèi)容,再通過全球廣域網(wǎng)服務(wù)器在數(shù)據(jù)庫中搜索相應(yīng)的內(nèi)容,最后將搜索結(jié)果返回給用戶。這種搜索引擎應(yīng)用到電力領(lǐng)域中,一方面會造成搜索結(jié)果與用戶所需存在較大差異,主要原因是由于搜索結(jié)果的數(shù)量過多,且結(jié)果精準(zhǔn)度不高,冗余結(jié)果信息過多;另一方面,會出現(xiàn)電力知識量少、效率低等問題。當(dāng)前,自然語言的處理是人工智能領(lǐng)域研究學(xué)者們重點研究的內(nèi)容之一,利用自然語言處理可以有效地實現(xiàn)人與計算機之間利用自然語言進(jìn)行通信。自然語言處理涉及計算機科學(xué)領(lǐng)域、人工智能領(lǐng)域、語言學(xué)領(lǐng)域等多個學(xué)科領(lǐng)域的綜合處理方法。對此,本文利用自然語言處理的優(yōu)勢,開展基于自然語言處理的電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)研究。
1 基于自然語言處理的電力調(diào)控智能搜索引擎
1.1 自然語言處理
在文章中提出的電力調(diào)控智能搜索引擎總體框架結(jié)構(gòu)中,對電力調(diào)控語言的處理主要包括查詢內(nèi)容概念提取、查詢擴展以及自動文摘。概念提取主要是利用自然語言處理技術(shù)中的漢語分詞實現(xiàn),查詢擴展主要利用自然語言處理技術(shù)中的短語識別及同義詞處理實現(xiàn)。
漢語分詞是將由用戶端發(fā)送的初始查詢條件劃分為多個不同的關(guān)鍵詞,對于英文而言,一個單獨的詞語即可作為一個關(guān)鍵詞。而對于漢語而言大量電力調(diào)控語言存在著不同的含義,對于某些特殊的漢字,分詞可能存在較多的結(jié)果差異。例如,用戶端發(fā)送的初始查詢?yōu)椤半娏ο到y(tǒng)”,則通過分詞處理后,可能產(chǎn)生“電力系統(tǒng)”、“電力”、“系統(tǒng)”三種不同的關(guān)鍵詞分詞結(jié)果。因此在用戶搜索時會產(chǎn)生與上述三種關(guān)鍵詞相關(guān)的大量與用戶主觀搜索內(nèi)容不相關(guān)冗余結(jié)果。對于上述這一問題的產(chǎn)生,可通過在知識庫中對上述類似漢字進(jìn)行總結(jié)、分析,并計算出每個漢字組成出現(xiàn)的概率以及相關(guān)詞語之間的關(guān)聯(lián)信息,從而在最大程度上排除容易產(chǎn)生歧義的搜索結(jié)果,準(zhǔn)確地表達(dá)出用戶所需的查詢請求及相應(yīng)的文檔信息。
查詢擴展中的短語識別是將用戶輸入的初始查詢內(nèi)容概念提取后,根據(jù)相應(yīng)的語法結(jié)構(gòu)從知識庫中搜索相應(yīng)的知識。由于漢語語法存在一定的復(fù)雜性,因此當(dāng)用戶使用漢語在電力調(diào)控智能搜索引擎中查詢時,需要對漢語短語中的語法結(jié)構(gòu)進(jìn)行適當(dāng)?shù)姆纸M。例如,當(dāng)查詢內(nèi)容為“電力的運營”時,短語中的“電力”與“運營”是存在一定的關(guān)聯(lián)性的,因此,若不將二者聯(lián)系在一起則會出現(xiàn)分別與“電力”和“運營”相關(guān)的冗余知識,降低搜索結(jié)果的精準(zhǔn)度。
查詢擴展中的同義詞處理是將用戶輸入的初始查詢內(nèi)容概念提取后,電力調(diào)控智能搜索引擎自動根據(jù)概念中的內(nèi)容去查詢同義詞典,并加入新的概念。擴展出的概念是整個概念集中各個概念的同義詞,因此,用戶端發(fā)出的最終的查詢請求是由概念集中各個概念以及其相互之間的同義詞構(gòu)成。假設(shè)概念集為A={a1,a2,a3,…,an},經(jīng)過同義詞處理后將得到:B={A(a1),A(a2),A(a3),…,A(an)},其中A(a1)表示為同義詞典中與a1有相同語義的概念集。同義詞處理的一種方法是通過人工構(gòu)造同義詞表。由于本文設(shè)計的電力調(diào)控智能搜索引擎是針對電力企業(yè)這一專業(yè)領(lǐng)域而提出的,因此利用人工構(gòu)造的方式可以有效提高構(gòu)建同義詞表的效率。
自動文摘是在搜索引擎將搜索知識返回到文檔中的簡要概述,是語言理解和語言生成的綜合結(jié)果。語言理解是對文檔中的每個語句進(jìn)行語義及語法上的分析,當(dāng)完成對全篇所有內(nèi)容分析后,準(zhǔn)確地將文章所要表達(dá)的意思理解。語言生成則是利用符合文章語義的恰當(dāng)詞匯及語句表達(dá)文章的總體內(nèi)容。本文提出一種更加有效的文摘構(gòu)建方法,將被提取出的搜索結(jié)果文檔中權(quán)值最高的概念作為返回到用戶端的文摘,用戶可通過各個獨立的概念推理出文章的中心現(xiàn)象,以及找出自己所需的知識。
1.2 電力調(diào)控智能搜索引擎及引擎推理控制策略
基于自然語言處理的優(yōu)勢,該搜索引擎的總體框架結(jié)構(gòu)是由知識庫、用戶端、自然語言處理以及相關(guān)的推理控制策略構(gòu)成,如圖1所示。
由于在電力調(diào)控智能搜索引擎中用戶端的用戶具備一定的語言知識以及對現(xiàn)實世界的認(rèn)知,因此選用自然語言處理實現(xiàn)人機交互對于用戶端而言十分簡單,而智能搜索引擎內(nèi)部的知識庫結(jié)構(gòu)應(yīng)當(dāng)根據(jù)自然語言習(xí)慣,將電力調(diào)控語言進(jìn)行相應(yīng)的推理組成[2]。下面將針對本文提出的智能搜索引擎中基于自然語言處理的電力調(diào)控語言處理及智能搜索引擎推理控制策略進(jìn)行詳細(xì)的設(shè)計說明。
智能搜索引擎推理控制策略主要可分為沖突消除策略和推理方向策略。沖突消除策略主要針對,在推理過程中,智能搜索引擎會根據(jù)當(dāng)前用戶端所有的搜索內(nèi)容,對知識[3]庫中的知識進(jìn)行檢索。從而找到與實際內(nèi)容匹配的知識。當(dāng)找到的匹配知識為多條時,需要根據(jù)沖突消除策略從眾多知識中進(jìn)行推理,從而將最貼近初始查詢的知識返回到用戶端。將沖突消除策略中的排序方式分為:優(yōu)先度排序、詳細(xì)度排序以及電力專業(yè)領(lǐng)域特點排序3種。優(yōu)先度排序是將存儲在知識庫中的每項知識設(shè)定對應(yīng)的優(yōu)先度參數(shù),優(yōu)先度更高的知識首先進(jìn)行執(zhí)行;詳細(xì)度排序是針對初始查詢內(nèi)容中條件較多、較為詳細(xì)的搜索內(nèi)容制定的排序規(guī)則,將與用戶搜索的內(nèi)容更接近、更詳細(xì)的結(jié)果返回到用戶端;電力專業(yè)領(lǐng)域特點排序是根據(jù)電力專業(yè)的特點,在這眾多檢索結(jié)果中挑選出與電力專業(yè)相關(guān)的內(nèi)容返回到用戶端。
推理方向策略可分為正向推理控制策略和反向推理控制策略。正向推理控制策略的具體流程為:用戶端發(fā)出初始查詢;電力調(diào)控智能搜索引擎根據(jù)搜索內(nèi)容在知識庫中找到相應(yīng)匹配可用的知識;利用沖突消除策略選出最優(yōu)化的搜索目標(biāo);在對應(yīng)數(shù)據(jù)庫中檢索;獲取檢索結(jié)果;判斷結(jié)果是否符合查詢要求,符合則將查詢結(jié)果顯示在用戶端界面中。反省推理控制策略的具體流程為:用戶端發(fā)出初始查詢;電力調(diào)控智能搜索引擎根據(jù)搜索內(nèi)容在知識庫中找到較多匹配可用的信息;再次檢索可用信息當(dāng)中的相關(guān)知識,并判斷相關(guān)知識中所包含的條件是否完全滿足用戶會話,若滿足則將該知識的搜索目標(biāo)發(fā)送到當(dāng)前的數(shù)據(jù)庫中進(jìn)行檢索,若不滿足則將該知識作為條件,重新檢索目標(biāo),直到各個子搜索目標(biāo)全部出現(xiàn)為止,得到搜索結(jié)果;最后將搜索結(jié)果顯示在用戶端界面中。
2 實驗論證分析
為了驗證本文設(shè)計的基于自然語言處理的電力調(diào)控智能搜索引擎對電力調(diào)控語言查詢的有效性,設(shè)計了如下對比實驗:
為了保證實驗結(jié)果的客觀性,將電力專業(yè)領(lǐng)域的相關(guān)內(nèi)容構(gòu)建兩種引擎統(tǒng)一的知識庫,在用戶端提出5個與電力專業(yè)相關(guān)的查詢內(nèi)容,并對應(yīng)查詢內(nèi)容設(shè)置標(biāo)準(zhǔn)的5個查詢結(jié)果,在查詢的過程中分別利用本文設(shè)計的引擎和傳統(tǒng)引擎對初始查詢條件進(jìn)行查詢設(shè)置本文引擎搜索為實驗組,傳統(tǒng)引擎搜索為對照組,記錄兩種方法獲取到最終標(biāo)準(zhǔn)搜索結(jié)果的用時,如表1所示。
根據(jù)表1中的實驗結(jié)果可以看出,實驗組在對5個不同的初始查詢條件搜索時消耗的時間明顯小于對照組的消耗時間。其主要原因是在兩種引擎搜索的過程中,本文引擎可利用自然語言處理及推理控制策略,在知識庫中眾多的知識內(nèi)容中篩選出更加符合初始查詢條件的知識內(nèi)容,而傳統(tǒng)引擎則是將與初始查詢條件相關(guān)的所有知識全部檢索,造成了大量冗余知識產(chǎn)生,嚴(yán)重制約著其搜索速度。因此,通過對比實驗證明,本文設(shè)計的基于自然語言處理的電力調(diào)控智能搜索引擎可有效提高傳統(tǒng)搜索引擎的搜索速度,進(jìn)一步提高引擎整體運行的效率。
3 結(jié)語
智能搜索引擎也將不斷地完善和提高。文章在對電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)進(jìn)行研究的同時,利用自然語言處理提出了一種全新的基于自然語言處理的電力調(diào)控智能搜索引擎,將自然語言處理中的漢語分詞、語句識別和同義詞處理等技術(shù)應(yīng)用到搜索引擎中,是實現(xiàn)電力專業(yè)領(lǐng)域信息時代對搜索引擎智能化挑戰(zhàn)的有效手段。
參考文獻(xiàn)
[1] 閃鑫,陸曉,翟明玉,等.人工智能應(yīng)用于電網(wǎng)調(diào)控的關(guān)鍵技術(shù)分析[J].電力系統(tǒng)自動化,2019,43(01):49-57.
[2]薛蕾,井天軍,陳義,等.基于相似搜索與多開端重組的配電網(wǎng)兩時間尺度無功協(xié)調(diào)控制[J].電網(wǎng)與清潔能源,2019,35(05):10-19.
[3]蘇適,李康平,嚴(yán)玉廷,等.基于密度空間聚類和引力搜索算法的居民負(fù)荷用電模式分類模型[J].電力自動化設(shè)備,2018,38(01):129-136.
[4]李功新.基于可拓推演方法的調(diào)控一體防誤操作系統(tǒng)研究與應(yīng)用[D].武漢:武漢大學(xué),2014.
[5]辛耀中,米為民,蔣國棟,等.基于CIM/E的電網(wǎng)調(diào)度中心應(yīng)用模型信息共享方案[J].電力系統(tǒng)自動化,2013,37(08):1-5.
[6]蔣宏圖,袁越,程偉.智能變電站站控層在線防誤的設(shè)計與實現(xiàn)[J].電力自動化設(shè)備,2013,33(08):147-151.
[7]盧君波,李小敏.基于人工智能的電網(wǎng)調(diào)控技術(shù)研究與分析[J].粘接,2019(11):178-181.
[8] 郝杰.智能電網(wǎng)調(diào)度控制系統(tǒng)安全技術(shù)基本框架研究[J].粘接,2020(07):104-107.
[9] 李陽,朱伯濤,胡志亮,等.物聯(lián)網(wǎng)技術(shù)在電力智能監(jiān)控系統(tǒng)中的應(yīng)用探究[J].微型電腦應(yīng)用,2020(11):154-156+167